Aplicație 01

Folosind datele din baza de date Biomaize 2008 să se studieze dacă soiurile de porumb din județul Suceava și cele din județul Cluj au același conținut de proteine.

În primul rând vom extrage datele din baza de date și le vom pune pe o foaie de Excel.

fig01_20121228

 

Pentru a afla răspunsul la problema pusă ar trebui să vedem dacă există diferențe semnificative între mediile celor două județe. Pentru început vom calcula aceste medii și vom studia omogenitatea datelor. Pentru a studia omogenitatea datelor vom calcula coeficientul de variație (vezi slide-uri cursul 3). În urma calculării acestui coeficient vom obține următoarele rezultate:

fig02_20121228

 

Deoarece coeficentul de omogenitate este < 20% putem considera că avem o variație moderată a datelor pentru județul Suceava și variație mica pentru județul Cluj. Deci mediile sunt reprezentative.

Având în vedere modul în care a fost pusă problema trebuie să studiem dacă se validează ipoteza H0 (mediile sunt egale). Deci la opiunea Tails de la testul t din excel vom alege varianta 2.  Pentru afla ce vom completa la opițiunea Type vom studia dacă între avem diferențe semnificative între dispersiile celor două grupuri de date. Pentru aceasta vom folosi funcția FTEST din excel.

fig03_20121228

Deoarece am obținut p = 0,53 > 0,05 înseamnă că diferențele între dispersii sunt nesemnificative. Deci la opțiunea Type vom pune valoarea 2. După aplicarea funcției TTEST vom obține:

fig04_20121228

 

Deoarece pentru testul t am obținut p = 0,03 < 0,05 putem spune că ipoteza H0 nu se validează, adică avem diferențe semnificative între mediile conținutului de proteine obtinute pentru soiurile din cele două județe.