Sunteți pe pagina 1din 15

9 ANALIZA DE VARIAN Pagina 1 din 15

ANALIZA DE VARIAN (ANOVA)

Am expus pn acum proceduri pentru testarea ipotezelor privind o populaie sau dou populaii. n acest capitol se prezint o procedur de testare a ipotezei conform creia mediile aritmetice ale k populaii (k 2) sunt egale. Aceast procedur este numit analiza de varian (ANOVA1). Ipoteza de nul testat n ANOVA are urmtoarea form: H0: 1 = 2 = = k Conform ipotezei alternative, Ha, cel puin o medie aritmetic difer de celelalte.

9.1 ANOVA PENTRU O VARIABIL INDEPENDENT


nainte de a trece la expunerea testului ANOVA pentru o variabil independent s notm c ntr-un experiment psihologic, cercettorul manipuleaz cel puin o variabil i nregistreaz rspunsurile subiecilor n privina unei alte variabile, cu scopul de a constata eventualul efect al primei variabile asupra celei de-a doua. De pild, cercettorul poate expune un grup de subieci unor condiii de stres i un alt grup unor condiii normale, pentru a constata dac stresul influeneaz ndeplinirea unei anumite sarcini. Variabila manipulat este numit variabil independent, iar variabila care este observat i msurat este numit variabil dependent. Un cercettor presupune c subiecii supui unui interviu vor furniza cu att mai multe informaii cu caracter personal, cu ct se afl mai aproape de intervievator. Pentru a verifica aceast presupunere, cercettorul monteaz un experiment la care particip 15 subieci. Fiecare subiect primete aceleai ntrebri de la acelai intervievator. Variabila independent (A) este distana fa de intervievator, cu urmtoarele categorii: mic (0,5 metri), medie (1,5 metri), mare (2 metri). Pentru a fi intervievai, subiecii sunt repartizai aleatoriu ntr-una dintre cele trei categorii ale variabilei independente. Variabila dependent (B) este numrul de rspunsuri cu caracter personal date de subiect. Datele obinute, mpreun cu mrimile necesare pentru ANOVA sunt prezentate n urmtorul tabel:

Prescurtarea uzual de la denumirea procedurii n limba englez: Analysis of Variance.

9 ANALIZA DE VARIAN Pagina 2 din 15

Tabelul 9.1 Calcule iniiale pentru ANOVA, o variabil independent


Mic 33 24 31 29 34 T1 = 151 n1 = 5 X 1 = 30,20 Distana fa de intervievator Medie 21 25 19 27 26 T2 = 118 n2 = 5 X 2 = 23,60
2 X2 = 2832 2 T2 = 13294

X 12 = 4623 T12 = 22801

Mare 20 13 15 10 14 T3 = 72 n3 = 5 X 3 = 14,40 2 X3 = 1090

T32 = 5184

Pentru fiecare grup i, Ti este totalul scorurilor individuale, ni este numrul de subieci, X i este media aritmetic a scorurilor, X i2 este suma ptratelor scorurilor 2 individuale, iar Ti este ptratul totalului scorurilor. De notat c grupurile obinute sunt independente, precum i c formulele de calcul care urmeaz sunt aplicabile i n cazul n care este vorba despre un numr diferit de subieci n fiecare grup. n ANOVA pentru o variabil independent se consider dou surse de variaie: (i) variaia mediilor aritmetice ale grupurilor i (ii) variaia datorat diferenelor dintre subiecii din fiecare grup, care poate fi atribuit procesului de eantionare. Pentru nceput, se calculeaz trei sume de ptrate ale abaterilor fa de medie sau, pe scurt, sume de ptrate. Vom desemna generic prin SS aceste sume de ptrate2: (1) SSTOTAL suma ptratelor abaterilor fiecrui scor individual fa de media aritmetic a tuturor scorurilor, numit i marea medie; (2) SSA suma ptratelor abaterilor fiecrei medii de grup fa de marea medie; (3) SSEROARE suma ptratelor abaterilor fiecrui scor individual fa de media aritmetic a grupului respectiv. Litera A din SSA arat c lucrm cu variana sistematic a variabilei independente A. SSA reflect prima surs de variaie, iar SSEROARE pe cea de-a doua. Putem calcula aceste abateri direct pe baza datelor din tabel. ntruct astfel de calcule sunt greoaie, vom utiliza formule simplificate. Formula 9.1
SS TOTAL = X 2 G2 N

n care X 2 = suma ptratelor scorurilor individuale ale tuturor subiecilor din 2 2 experiment = X 12 + X 2 + X3 2 G 2 = ptratul totalului tuturor scorurilor = (T1 + T2 + T3 ) N = numrul total de subieci din experiment. Dac se efectueaz calculele pe hrtie sau cu un calculator de buzunar, este convenabil s se afle mai nti X 2 pentru scorurile din fiecare grup, aa cum am fcut n tabelul de mai sus, dup care s se adune aceste sume. Aplicm formula 9.1:

Prescurtarea uzual de la denumirea din limba englez Sum of squares.

9 ANALIZA DE VARIAN Pagina 3 din 15


SS TOTAL = X 2 (151 + 118 + 72) 2 G2 = ( 4623 + 2823 + 1090) = N 15
= 8545 7752,07 = 792,93

Atunci cnd calculm SSTOTAL este recomandabil s reinem termenii diferenei, 8545 i 7752,07, pe care i vom folosi pentru simplificarea calculelor ulterioare. Odat de am calculat SSTOTAL, putem calcula SSA dup urmtoarea formul: Formula 9.2
SS A = Ti 2 G 2 ni n

n aceast formul, Ti este un simbol general pentru T1, T2 i T3, iar ni este un simbol 2 general pentru n1, n2 i n3. Astfel, odat ce cantitatea Ti ni este calculat pentru fiecare grup, cantitile sunt adunate, dup cum arat simbolul . S notm c a doua parte a formulei 2, G2/N, a fost deja calculat, atunci cnd am obinut SSTOTAL, aa nct vom prelua direct rezultatul respectiv n calculul SSA:

SS A =

Ti 2 G 2 T12 T22 T32 G 2 1512 118 2 72 2 7752,07 = + + = + + N = 5 5 5 ni n n n n 1 2 3


=8381,80 7752,07 = 629,73

i aici vom reine unul dintre termenii diferenei, i anume 8381,80, pe care l vom folosi pentru calculul SSEROARE, dup urmtoarea formul: Formula 9.3
SS EROARE = X 2 Ti 2 ni

Ambele cantiti cerute de aceast formul au fost calculate anterior, cnd am obinut SSTOTAL i, respectiv, SSA, aa nct vom prelua direct rezultatele respective n calculul SSEROARE:
SS EROARE Ti 2 =X = 8545 8381,80 = 163,20 ni
2

De notat c SSTOTAL = SSA + SSEROARE. Aceast relaie poate fi utilizat pentru a controla corectitudinea calculelor. Pasul urmtor n calculul ANOVA const n calcularea a dou medii aritmetice ale sumelor de ptrate ale abaterilor fa de medie sau, pe scurt, medii aritmetice ale sumelor de ptrate. Vom desemna generic prin MS aceste medii3: (1) MSA media aritmetic pentru SSA, numit variana sistematic i (2) MSEROARE media aritmetic pentru SSEROARE, numit variana de eroare. Formula 9.4
MS A = SS A k 1

Prescurtarea uzual de la denumirea din limba englez Mean squares.

9 ANALIZA DE VARIAN Pagina 4 din 15 n aceast formul, k este numrul de grupuri, k 1 fiind numrul de grade de libertate asociate SSA, pe care l vom nota n continuare cu glA.
MS A = SS A 629,73 629,73 = = = 314,87 k 1 3 1 2 MS EROARE = SS EROARE N k

Formula 9.5

Aici, N k reprezint numrul de grade de libertate asociate SSEROARE, pe care l vom nota n continuare cu glEROARE.
MS EROARE = SS EROARE 163,20 163,20 = = = 13,60 N k 15 3 12

Distribuia de eantionare n ANOVA este distribuia F (numit astfel n onoarea britanicului Ronald Fisher (1890-1962), biolog i statistician, inventatorul ANOVA). Forma aproximativ a unei curbe F este urmtoarea: Figura 9.1 Un exemplu de curb F

Valori ale lui F

Grade de libertate

Forma exact a unei curbe F depinde de valorile pentru glA i, respectiv, pentru glEROARE. De notat c folosirea distribuiei F cere ca variabila dependent s fie normal distribuit n cele k populaii i ca aceste populaii s fie egal dispersate 4. n tabelul distribuiei F (vezi Anexa D) n prima coloan din stnga sunt trecute gradele de libertate pentru MSEROARE (glEROARE = N k), de la 1 la 120 i . Pe cea de-a doua coloan din stnga apar nivelele . Pe primul rnd al tabelului apar gradele de libertate pentru MSA (glA = k 1), de la 1 la 120 i .

Supoziia omogenitii dispersiei i cea a normalitii distribuiei, mpreun cu ipoteza de nul, spun c distribuiile la nivelul populaiilor au aceeai form, aceeai medie aritmetic i aceeai abatere standard sau, cu alte cuvinte, c este vorba despre una i aceeai populaie.

9 ANALIZA DE VARIAN Pagina 5 din 15

Figura 9.2 Schema tabelului valorilor critice ale distribuiei F


glEROARE (gl2) 1 2 . . 120 0,25 0,10 0,05 . . . . . . . glA (gl1) 1 2 .120 .. .. .... .. .. .. .. ..

La intersecia rndului pentru N k grade de libertate i nivelul ales cu coloana pentru k 1 grade de libertate se gsete F (critic), adic valoarea care marcheaz nceputul zonei critice n distribuia F. n exemplul nostru, pentru N k = 12 i k 1 = 2, alegnd un nivel = 0,05, F (critic) = 3,8853 sau, rotunjit, 3,89. Valoarea pentru F (obinut) se calculeaz cu formula urmtoare: MS A F= Formula 9.6 MS EROARE Dac intervin doar factori ntmpltori, valoarea ateptat pentru F (obinut) este 1,0. Cu ct este mai mare valoarea pentru F (obinut), cu att este mai mic probabilitatea ca rezultatele experimentului s se datoreze ntmplrii. Regula de decizie este urmtoarea: Se respinge H0, dac F (obinut) > F (critic) n exemplul nostru,
F= MS A 314,87 = = 23,15 MS EROARE 13,60

ntruct F (obinut) cade n zona critic (23,15 > 3,89), vom conchide c rezultatele experimentului sunt semnificative i vom respinge ipoteza c mediile aritmetice sunt egale la nivelul populaiei. n termenii modelului n patru pai, testul ANOVA pentru o variabil independent, n exemplul nostru, decurge dup cum urmeaz: Pasul 1. Enunarea ipotezelor H0: 1 = 2 = 3 Ha: Cel puin o medie aritmetic difer de celelalte

9 ANALIZA DE VARIAN Pagina 6 din 15

Pasul 2. Selectarea distribuiei de eantionare i stabilirea zonei critice Distribuia de eantionare = Distribuia F = 0,05 glEROARE = N k = 12 glA = k 1 = 2 F(critic) = 3,89 Pasul 3. Calcularea statisticii testului Organizarea calculului ANOVA se face cu ajutorul unui tabel de calcule iniiale (v. tabelul 9.1), precum i al unui tabel ANOVA rezumativ, numit tabel al surselor de variaie. Forma general a unui astfel de tabel este urmtoarea:
Sursa de variaie A EROARE TOTAL Sume de ptrate SSA SSEROARE SSTOTAL Grade de libertate k1 Nk N1 Medii ale sumelor MSA MSEROARE F (obinut) MSA/MSEROARE

n exemplul nostru, avem urmtorul tabel: Tabelul 9.2 ANOVA rezumativ, o variabil independent
Sursa de variaie A EROARE TOTAL Sume de ptrate 629,73 163,20 792,93 Grade de libertate 2 12 14 Medii ale sumelor 314,87 13,60 F (obinut) 23,15

Pasul 4. Luarea deciziei ntruct, F (obinut) cade n zona critic (23,15 > 3,89), ipoteza de nul este respins. La nivelul populaiei, mediile aritmetice ale scorurilor corespunztoare celor trei distane difer semnificativ. Enunul de probabilitate asociat acestei concluzii este urmtorul: probabilitatea ca diferena observat ntre mediile aritmetice ale grupurilor s apar din ntmplare, dac H0 ar fi n realitate adevrat, este mai mic de 0,05. De notat c n cazul n care se consider mai mult de dou categorii ale variabilei independente (ca n exemplul nostru n care avem trei grupuri), F (obinut) nu arat care este grupul care difer semnificativ de celelalte. O modalitate de a examina diferena dintre dou grupuri este de a utiliza formula SSA pentru a calcula suma ptratelor i media sumei de ptrate pentru cele dou grupuri (numrul de grade de libertate n acest caz fiind 2 1) i de a utiliza cantitatea MSEROARE, calculat anterior, ca eroare de varian pentru calcularea F (obinut). Au fost dezvoltate i metode mai sofisticate pentru a evalua diferena dintre dou grupuri, dup ce s-a determinat un F (obinut) semnificativ, numite teste de comparare multipl post hoc, precum i metode

9 ANALIZA DE VARIAN Pagina 7 din 15 de testare a unor ipoteze specifice privind diferenele dintre medii, numite comparaii a priori sau comparaii planificate5.

9.2 ANOVA INDEPENDENTE

PENTRU

DOU

VARIABILE

Testul ANOVA pentru dou variabile independente este o extindere a testului


ANOVA pentru o singur variabil independent, cu excepia faptului c formulele testului expus n aceast seciune sunt aplicabile doar n cazul grupurilor independente cu acelai numr de subieci n fiecare grup. Vom folosi aceeai manier de expunere ca mai sus: vom prezenta un exemplu ipotetic, un tabel de calcule iniiale, formulele de calcul ale testului ANOVA pentru dou variabile independente, precum i modelul n patru pai specific acestui test. 20 de elevi sunt supui unui experiment privind metodele de instruire n matematic. Variabila independent, A, este, deci, metoda de instruire. Elevii sunt repartizai aleatoriu n dou clase: o clas la care se utilizeaz metoda tradiional ( A1) i o clas la care se utilizeaz o metod modern ( A2). Variabila independent, B, este nivelul IQ, cu categoriile : B1 (< 90) i B2 ( 90). Informaia prezentat la cele dou clase este aceeai. La sfritul perioadei de instruire elevii dau acelai test. Rezultatul (scorul) obinut la acest test este variabila dependent. Experimentul permite evaluarea a trei efecte: (i) efectul principal al variabilei A (dac una dintre metode conduce la rezultate diferite fa de cealalt), (ii) efectul principal al variabilei B (dac elevii cu un IQ superior obin rezultate diferite fa de ceilali), (iii) interaciunea A B (dac efectul unei variabile independente difer n funcie de un anumit nivel al celeilalte variabile independente). Dup cum reiese i din cele de mai sus, un astfel de experiment are mai multe avantaje. Mai nti, prin analiza simultan a dou variabile independente se realizeaz, de fapt, dou cercetri altfel distincte. Pe lng investigarea modului n care diferitele categorii ale celor dou variabile independente afecteaz variabila dependent, se poate verifica dac nivelele uneia dintre variabilele independente afecteaz variabila dependent n acelai fel ca i nivelele celeilalte variabile independente. Apoi, este vorba despre investigarea interaciunii dintre dou variabile independente. ntruct, n situaiile reale, efectul unei variabile independente este adesea afectat de una sau mai multe variabile independente, studiul interaciunii dintre variabilele independente poate fi un obiectiv foarte important al cercetrii. Revenind la exemplul nostru ipotetic, datele obinute, mpreun cu mrimile necesare pentru ANOVA sunt prezentate n urmtorul tabel:

Vezi Hinkle, Wiersma i Jurs, 1988, capitolul 16.

9 ANALIZA DE VARIAN Pagina 8 din 15

Tabelul 9.3 Calcule iniiale pentru ANOVA, dou variabile independente


Metoda (A) Nivelul IQ (B) B1 B2 75 90 70 95 69 89 72 85 68 91 TA1B1 = 354 TA1B2 = 450 nA1B1 = 5 nA1B2 = 5 X A1B1 = 70,80 X A1B2 = 90,00 2 X A1B1 = 25094 X 2 A1B2 = 40552 85 87 87 94 83 93 90 89 89 92 TA2B1 = 434 TA2B2 = 455 nA2B1 = 5 nA2B2 = 5 X A2B1 = 86,80 X A2B2 = 91,00 X 2 A2B1 = 37704 X 2 A2B2 = 41439 TB1 = 788 TB2 = 905 nB1 = 10 nB2= 10 X B1 = 78,80 X B2 = 90,50

Tradiional (A1)

TA1 = 804 nA1 = 10 X A1 = 80,40

Modern (A2)

TA2 = 788 nA2 = 10 X A2 = 88,90

n ANOVA pentru dou variabile independente se testeaz trei ipoteze de nul, fiecare corespunznd unei surse de variaie: H01: La nivelul populaiei nu exist nici o diferen ntre mediile aritmetice ale rezultatelor obinute prin cele dou metode. H02: La nivelul populaiei nu exist nici o diferen ntre mediile aritmetice ale rezultatelor obinute de elevii cu nivele IQ diferite. H03: La nivelul populaiei nu exist interaciune ntre cele dou variabile. H01 corespunde variaiei mediilor aritmetice ale scorurilor variabilei dependente din fiecare categorie a variabilei A. H02 corespunde variaiei mediilor aritmetice ale scorurilor variabilei dependente din fiecare categorie a variabilei B. H03 corespunde variaiei mediilor aritmetice ale scorurilor variabilei dependente din categoriile combinate A B. n acest caz, se calculeaz cinci sume de ptrate: (1) SSTOTAL, (2) SSA, (3) SSB, (4) SSA B i (5)SSEROARE. SSTOTAL se calculeaz cu ajutorul formulei 9.1:

9 ANALIZA DE VARIAN Pagina 9 din 15

G2 2 2 2 2 = X A 1B1 + X A1B 2 + X A 2 B1 + A 2 B 2 N (T A1B1 + T A1B 2 + T A 2 B1 + T A 2 B 2 ) 2 = (25094 + 40552 + 37704 + 41439) N (354 + 450 + 434 + 455) 2 = 144789 143312,45 = 1476,55 20 SS TOTAL = X 2

i aici, atunci cnd calculm SSTOTAL, este recomandabil s reinem termenii diferenei, 144789 i 143312,45, pe care i vom folosi pentru simplificarea calculelor ulterioare. Formula 9.2 este modificat corespunztor pentru calculul SSA i SSB. Astfel, SSA se calculeaz cu ajutorul urmtoarei formule: Formula 9.7
SS A = Ta2 G 2 na n

n aceast formul, Ta este un simbol general pentru TA1 i TA2, iar na este un simbol general pentru nA1 i nA2. Prin urmare, atunci cnd calculm SSA, lum n considerare doar grupurile variabilei independente A.

SS A =

Ta2 G 2 T A21 T A22 G 2 804 2 889 2 143312,45 = = + = + na n 10 n A1 n A2 N 10


=143673,70 143312,45 =361,25

SSB se calculeaz cu ajutorul urmtoarei formule: Formula 9.8


SS B = Tb2 G 2 nb n

n aceast formul, Tb este un simbol general pentru TB1 i TB2, iar nb este un simbol general pentru nB1 i nB2. Prin urmare, atunci cnd calculm SSB, lum n considerare doar grupurile variabilei independente B.

SS B =

TB2 G 2 TB21 TB22 G 2 788 2 905 2 143312,45 = = + = + nB n 10 n B1 n B 2 N 10


=143996,90 143312,45 = 684,45

Calculm acum SSA B, cu ajutorul urmtoarei formule: Formula 9.9


SS A B
2 Tab G2 = SS A SS B n ab N

n aceast formul, Tab este un simbol general pentru TA1B1, TA1B2, TA2B1 i TA2B2, iar nab este un simbol general pentru nA1B1, nA1B2, nA2B1 i nA2B2. Prin urmare, atunci cnd calculm SSA B, lum n considerare grupurile constituite dup categoriile combinate A B.

9 ANALIZA DE VARIAN Pagina 10 din 15

T A21B1 T A21B 2 T A22 B1 T A22 B 2 SS A B = + + + n A1B1 n A1B 2 n A 2 B1 n A2 B 2


354 2 450 2 434 2 455 2 + + + = 5 5 5 5

G2 N SS A SS B =

=144639,40 143312,45 361,25 684,45 = 281,25

143312,45 361,25 684,25 =

i aici vom reine unul dintre termenii diferenei, i anume 144639,40, pe care l vom folosi pentru calculul SSEROARE, dup urmtoarea formul: Formula 9.10
SS EROARE = X 2
2 Tab n ab

Ambele cantiti cerute de aceast formul au fost calculate anterior, cnd am obinut SSTOTAL i, respectiv, SSA B, aa nct vom prelua direct rezultatele respective n calculul SSEROARE:
SS EROARE = X 2
2 Tab = 144789 144639,40 = 149,60 n ab

De notat c SSTOTAL = SSA + SSB + SSA B + SSEROARE. Aceast relaie poate fi utilizat pentru a controla corectitudinea calculelor. Mediile aritmetice ale sumelor de ptrate pentru fiecare surs de varian se calculeaz prin mprirea sumei de ptrate respectiv la numrul corespunztor de grade de libertate. Formula 9.11
MS A = SS A k A 1

n aceast formul, kA este numrul de grupuri constituite dup categoriile variabilei A, iar kA 1 este numrul de grade de libertate asociate SSA, notat cu glA. n exemplul nostru,
MS A = SS A 361,25 = = 361,25 k A 1 2 1 MS B = SS B kB 1

Formula 9.12

n formula 12, kB 1 este numrul de grupuri constituite dup categoriile variabilei B, iar kB 1 este numrul de grade de libertate asociate SSB, notat cu glB. n exemplul nostru, SS B 684,45 MS B = = = 684,45 k B 1 2 1

9 ANALIZA DE VARIAN Pagina 11 din 15 Formula 9.13


MS AB = SS A B (k A 1)(k B 1)

n formula 13, (kA 1)(kB 1) este numrul de grade de libertate asociat SSA B, notat cu glA B. n exemplul nostru,
MS AB = SS A B 281,25 = = 281,25 ( k A 1)(k B 1) ( 2 1)(2 1)
MS EROARE = SS EROARE N k AkB

Formula 9.14

n formula 14, N kAkB este numrul de grade de libertate asociat SSEROARE, notat cu glEROARE.
MS EROARE = SS EROARE 149,60 149,60 = = = 9,35 N k AkB 20 4 16

Valoarea pentru F (obinut) se calculeaz pentru fiecare surs de varian sistematic (efectele principale pentru A, pentru B i pentru interaciunea A B). Prezentm n continuare formulele de calcul pentru FA (obinut), FB (obinut) i FAB (obinut), mpreun cu calculele respective, corespunztoare exemplului nostru. Formula 9.15
FA = MS A MS EROARE

FA =

MS A 361,25 = = 38,64 MS EROARE 9,35 FB = MS B MS EROARE

Formula 9.16

FB =

MS B 684,45 = = 30,08 MS EROARE 9,35 F AB = MS AB MS EROARE

Formula 9.17

FAB =

MS AB 281,25 = = 30,08 MS EROARE 9,35

Pentru luarea deciziei, fiecare valoare pentru F (obinut) se compar cu F (critic). ntruct n fiecare caz din exemplul nostru, glEROARE = 16, iar numrul de grade de libertate din numrtor pentru media aritmetic este egal cu 1 (glA = glB = glAB = 1),

9 ANALIZA DE VARIAN Pagina 12 din 15 pentru = 0,05, F (critic) = 4,4940 sau, rotunjit, 4,496. Deoarece fiecare F (obinut) este mai mare dect F (critic), toate cele trei ipoteze de nul pot fi respinse. De notat c toate cele trei ipoteze de nul pot fi respinse (rezultatele experimentului sunt semnificative) i pentru = 0,01, pentru care F (critic) = 8,53. n termenii modelului n patru pai, testul ANOVA pentru dou variabile independente decurge astfel: Pasul 1 Enunarea ipotezelor H01: La nivelul populaiei nu exist nici o diferen ntre mediile aritmetice ale rezultatelor obinute prin cele dou metode. Ha1: La nivelul populaiei mediile aritmetice ale rezultatelor obinute prin cele dou metode difer. H02: La nivelul populaiei nu exist nici o diferen ntre mediile aritmetice ale rezultatelor obinute de elevii cu nivele IQ diferite. Ha2: La nivelul populaiei mediile aritmetice ale rezultatelor obinute de elevii cu nivele IQ diferite difer. H03: La nivelul populaiei nu exist interaciune ntre cele dou variabile. Ha3: La nivelul populaiei exist interaciune ntre cele dou variabile. Pasul 2 Selectarea distribuiei de eantionare i stabilirea zonelor critice. Distribuia de eantionare = distribuia F = 0,05 glEROARE = 16 glA = glB = glAB = 1 F (critic) = 4,49 Pasul 4 Calcularea statisticii testului Organizarea calculului ANOVA pentru dou variabile independente se face cu ajutorul unui tabel de calcule iniiale (v. tabelul 9.3), precum i al unui tabel ANOVA rezumativ (tabel al surselor de variaie). n acest caz, forma general a unui astfel de tabel este urmtoarea:
Sursa de variaie A B AB EROARE TOTAL Sume de ptrate SSA SSB SSAB SSEROARE SSTOTAL Grade de libertate kA 1 kB 1 (kA 1)(kB 1) N kAkB N1 Medii ale sumelor MSA MSB MSAB MSEROARE F (obinut) MSA/MSEROARE MSB/MSEROARE MSAB/MSEROARE

Evident, dac cele trei grade de libertate ar fi fost diferite, am fi avut trei valori pentru F (critic).

9 ANALIZA DE VARIAN Pagina 13 din 15

n exemplul nostru, avem urmtorul tabel: Tabelul 9.4 ANOVA rezumativ, dou variabile independente
Sursa de variaie A B AB EROARE TOTAL Sume de ptrate 361,25 684,45 281,25 149,60 1476,55 Grade de libertate 1 1 1 16 19 Medii ale sumelor 361,25 684,45 281,25 9,35 F (obinut) 38,64 73,20 30,08

Pasul 4 Luarea deciziei ntruct fiecare valoare pentru F (obinut) este mai mare dect valoarea pentru F (critic), se resping cele trei ipoteze de nul. Pentru efectul principal al variabilei A, concluzia este c la nivelul populaiei, mediile aritmetice ale rezultatelor obinute prin cele dou metode difer semnificativ. Pentru efectul principal al variabilei B, concluzia este c la nivelul populaiei, mediile aritmetice ale rezultatelor obinute de elevii cu nivele IQ diferite difer semnificativ. Enunul de probabilitate asociat ambelor concluzii este urmtorul: probabilitatea ca diferenele observate ntre mediile aritmetice ale grupurilor constituite dup categoriile unei variabile independente s apar din ntmplare, dac H0 respectiv ar fi n realitate adevrat, este mai mic de 0,05 (i dup cum am vzut, chiar dect 0,01). Pentru interaciune, concluzia este c la nivelul populaiei exist o interaciune ntre metoda de instruire i nivelul IQ al subiecilor. Enunul de probabilitate asociat acestei concluzii este urmtorul: probabilitatea ca diferenele observate ntre mediile aritmetice ale scorurilor din categoriile combinate ale celor dou variabile s apar din ntmplare, dac H03 ar fi n realitate adevrat, este mai mic de 0,05 (i dect 0,01).

9.3 ANOVA PENTRU EANTIOANE DEPENDENTE


Calculele ANOVA considerate pn acum sunt aplicabile doar n cazul eantioanelor independente. n aceast seciune se prezint calculele ANOVA pentru cazul eantioanelor dependente. Amintim c n acest caz este vorba fie despre alctuirea unor eantioane astfel nct selectarea cazurilor pentru un eantion influeneaz selectarea cazurilor pentru un alt eantion, fie despre situaiile experimentale n care aceeai subieci sunt testai repetat. Un cercettor presupune c atractivitatea fizic a candidailor la obinerea unei slujbe influeneaz judecata asupra competenei profesionale a candidailor. Variabila independent este deci atractivitatea fizic a candidailor, variabila dependent fiind judecata asupra competenei profesionale, msurat pe o scal cu zece puncte. Cercettorul alctuiete un eantion aleatoriu cu opt subieci i le prezint dou filme, n fiecare film aprnd o femeie care rspunde la un test de aptitudini mecanice (mbinarea unor piese). Cele dou femei ndeplinesc sarcinile testului la fel de bine, dar una dintre ele este atractiv fizic, n timp ce cealalt nu este atractiv fizic. Filmele sunt prezentate de mai multe ori, pentru a se controla efectul ordonrii. Datele obinute, mpreun cu mrimile necesare pentru ANOVA sunt prezentate n urmtorul tabel:

9 ANALIZA DE VARIAN Pagina 14 din 15

Tabelul 9.5 Calcule iniiale pentru ANOVA, eantioane dependente


Subieci 1 2 3 4 5 6 7 8 Atractivitatea fizic (A) Neatractive (A1) Atractive (A2) 6 5 5 7 4 3 5 4 TA1 = 39 2A1 = 201 nA1 = 8 X A1 = 4,88 8 6 9 6 6 5 5 7 TA2 = 52 2A2 = 352 nA2 = 8 X A2 = 6,50
Ts

14 11 14 13 10 8 10 11

Ts2 196 121 196 169 100 64 100 121 2 T s = 1067

n acest tabel, Ts se refer la totalul scorurilor acordate de fiecare subiect pentru cele 2 2 dou femei, Ts este ptratul acestui total, iar Ts este suma acestor ptrate pentru toi subiecii. Principala diferen dintre ANOVA pentru eantioane dependente i ANOVA pentru o variabil independent const n aceea c efectul diferenelor dintre subieci devine o surs de varian. n ANOVA pentru eantioane dependente apar patru surse de varian i deci se calculeaz patru sume de ptrate: (1) SSTOTAL, (2) SSA, (3) SSSUBIECI i (4)SSEROARE. SSTOTAL se calculeaz cu ajutorul formulei 9.1:
SS TOTAL = X 2

(39 + 52) 2 G2 = (201 + 352) = 553 517,56 = 35,44 N 16

SSA se calculeaz cu ajutorul formulei 97:


SS A = Ta2 G 2 39 2 + 52 2 = 517,56 = 10,57 na n 8

SSSUBIECI se calculeaz cu ajutorul urmtoarei formule:


TS2 G 2 SS SUBIECTI = Formula 9.18 nS n Termenul nS se refer la numrul de eantioane dependente din experiment sau la numrul de scoruri pe care le d fiecare subiect, astfel c n exemplul nostru, nS = 2. SS SUBIECTI TS2 G 2 1067 = = 517,56 = 15,94 nS n 2

n fine, SSEROARE se calculeaz cu ajutorul urmtoarei formule: Formula 9.19


SS EROARE = SS TOTAL SS A SS SUBIECTI

9 ANALIZA DE VARIAN Pagina 15 din 15

SS EROARE = 35,44 10,57 15,94 = 8,93

Conform ipotezei de nul, atractivitatea fizic nu influeneaz judecata asupra competenei profesionale. Forma general a unui tabel ANOVA rezumativ pentru eantioane dependente este urmtoarea:
Sursa de variaie A SUBIECI EROARE TOTAL Sume de ptrate SSA SSSUBIECI SSEROARE SSTOTAL Grade de libertate k1 s1 (k 1)(s 1) N1 Medii ale sumelor MSA MSEROARE F (obinut) MSA/MSEROARE

Procedurile de calcul pentru mediile sumelor de ptrate i pentru F (obinut) sunt similare cu cele deja cunoscute. De notat c, n acest caz, media sumei de ptrate i F (obinut) pentru SSSUBIECI nu se calculeaz. n mod obinuit, nu este necesar s cunoatem dac exist diferene semnificative ntre subieci. Aflarea cantitii corespunztoare sursei de varian SSSUBIECI contribuie, ns, la reducerea sursei de variaie SSEROARE (formula 9.19). n exemplul nostru, avem urmtorul tabel: Tabelul 9.6 ANOVA rezumativ, eantioane dependente
Sursa de variaie A SUBIECI EROARE TOTAL Sume de ptrate 10,57 15,94 8,93 35,44 Grade de libertate 1 7 7 15 Medii ale sumelor 10,57 1,28 F (obinut)

8,26

Lsm ca exerciiu pentru cititor formularea n termenii modelului n patru pai a testului ANOVA aplicat aici, n principal a deciziei pentru = 0,05, precum i a enunului de probabilitate asociat concluziei7.

GLOSAR

Vezi exerciiul 9.1.