Sunteți pe pagina 1din 3

Compararea mediilor a mai mult de dou grupuri (analiza varianei = ANOVA) n paginile anterioare am vorbit despre compararea mediilor

a dou grupuri (exemplul cu TA ale studenilor la medicina i ASE), artnd c testele statistice (Student = t) compar att mediile, ct i varianele, i c ele pot fi aplicate numai dac distribuia variabilei numerice (n cazul acela TA) este normal (Gaussian). Sunt cazuri n care avem, nsa, de comparat ntre ele mai mult de dou grupuri - s presupunem ca vrem s vedem dac difer TA ale studenilor tuturor institutelor din Bucureti, i atunci avem tot attea grupuri cte institute de nvmnt superior exist. Anul trecut am predat metodologia cercetrii tiinifice la patru serii de studeni, iar notele de la testul scris au fost cele din Figura 1 (reprezentare sub form de boxplot).

Figura 1. Notele a 4 serii de studeni la testul scris. V aduc aminte dintr-un articol anterior c, la reprezentarea sub form de boxplot, linia central reprezint mediana, marginile orizontale ale dreptunghiului reprezint cvartilele 25 (inferioar), respectiv 75% (superioar), iar T-urile reprezint limitele. Se observ c boxplot-urile sunt relativ simetrice, aadar distribuia este probabil gaussian, deci putem aplica teste statistice parametrice, respectiv ANOVA. Baza de date rezultat va arta ca n Figurile 2 (n programul InStat), sau 3 (n programul SPSS).

Figura 2. Baza de date n InStat. Pe orizontal avem seriile de studeni (variabila nominal), iar n tabel vor fi trecute notele fiecruia dintre studeni (variabila numeric, ale crei medii sunt subiectul comparaiei). Nu are importan ordinea n care le scriem pe vertical. Figura 3. Baza de date n SPSS. n acest program, pe orizontal avem variabilele, n cazul nostru 2: nota (variabila numeric) i seria (n coloana a doua, care poate lua doar patru valori, fiind vorba de patru serii de studeni de anul IV). n ANOVA, testm ipoteza nul c ntre seriile de studeni nu exist o diferen n privina pregtirii la aceast materie; ipoteza alternativ este aceea c exist, totui, diferene ntre serii, i la o privire sumar a graficului din figura 1, se pare c seria 11 are note ceva mai bune, iar seria 12 are note mai slabe. Rmne s vedem dac diferenele aparente sunt semnificative statistic. Dac testul Student (t) compara mediile i varianele a dou grupuri, testul ANOVA compar media i variana totale a studenilor celor 4 serii pui la un loc, cu mediile i varianele fiecrei serii. Dac p rezultat n urma testului (care se mai numete i testul F) este semnificativ statistic, nseamn c seriile de studeni nu sunt omogene, i ntre ele exist diferene, fr s ne spun unde se afl aceste diferene (chiar dac noi intuim, pe baza graficului din Figura 1). Pentru a vedea unde sunt exact aceste diferene i dac sunt semnificative statistic, trebuie s facem comparaii utiliznd testul t ntre seriile de studeni, luate dou cte dou, deci vom face un numr de combinri de 4 serii luate cte 2 comparaii, adic 6. Problema care apare aici este c noi vom face cam multe comparaii (problema comparaiilor multiple), i se tie c, cu ct faci mai multe comparaii, cu att este un risc mai mare de a obine valori semnificative

statistic numai din ntmplare (ca s obii un p=0,05, la fiecare 100 de comparaii, se obin n medie 5 rezultate semnificative din ntmplare, iar la fiecare 20 de comparaii, se obine un rezultat semnificativ din ntmplare, fr s existe o diferen real; aadar, la 6 comparaii, cte vom face noi, este foarte probabil s obinem o diferen ntre dou serii fals pozitiv). Pentru a evita ca rezultatele noastre s fie fals pozitive, trebuie s fim mai severi n privina p ului; corecia Bonferroni seteaz pragul de semnificaie la p = 0,05/nr. de comparaii 0,01. Stabilind acest nou prag de semnificaie statistic i comparnd seriile dou cte dou, obinem p<0,01 (adic diferene semnificative statistic) numai ntre seria 11 i fiecare dintre celelalte serii, deci putem spune numai c seria 11 a fost semnificativ mai bun dect celelalte, nu i c seria 12 a fost semnificativ mai slab, cum am fi putut bnui din figur. Seria a 11-a a dat testul ultima, iar observaia noastr empiric (nainte de a aplica orice test statistic) a fost aceea c studenii ei au aflat, ntr-un mod oarecare, ntrebrile din test nainte de examen! NB. Testul t (Student) nu este dect un test F, particularizat pentru numai dou grupuri.

S-ar putea să vă placă și