Sunteți pe pagina 1din 15

9 ANALIZA DE VARIAN Pagina 1 din 15

ANALIZA DE VARIAN (ANOVA)

Am expus pn acum proceduri pentru testarea ipotezelor privind o populaie


sau dou populaii. n acest capitol se prezint o procedur de testare a ipotezei conform
creia mediile aritmetice ale k populaii (k 2) sunt egale. Aceast procedur este
numit analiza de varian (ANOVA1). Ipoteza de nul testat n ANOVA are
urmtoarea form:
H0: 1 = 2 = = k
Conform ipotezei alternative, Ha, cel puin o medie aritmetic difer de celelalte.

9.1 ANOVA PENTRU O VARIABIL INDEPENDENT


nainte de a trece la expunerea testului ANOVA pentru o variabil independent
s notm c ntr-un experiment psihologic, cercettorul manipuleaz cel puin o
variabil i nregistreaz rspunsurile subiecilor n privina unei alte variabile, cu
scopul de a constata eventualul efect al primei variabile asupra celei de-a doua. De
pild, cercettorul poate expune un grup de subieci unor condiii de stres i un alt grup
unor condiii normale, pentru a constata dac stresul influeneaz ndeplinirea unei
anumite sarcini. Variabila manipulat este numit variabil independent, iar variabila
care este observat i msurat este numit variabil dependent.
Un cercettor presupune c subiecii supui unui interviu vor furniza cu att mai
multe informaii cu caracter personal, cu ct se afl mai aproape de intervievator. Pentru
a verifica aceast presupunere, cercettorul monteaz un experiment la care particip 15
subieci. Fiecare subiect primete aceleai ntrebri de la acelai intervievator. Variabila
independent (A) este distana fa de intervievator, cu urmtoarele categorii: mic (0,5
metri), medie (1,5 metri), mare (2 metri). Pentru a fi intervievai, subiecii sunt
repartizai aleatoriu ntr-una dintre cele trei categorii ale variabilei independente.
Variabila dependent (B) este numrul de rspunsuri cu caracter personal date de
subiect. Datele obinute, mpreun cu mrimile necesare pentru ANOVA sunt prezentate
n urmtorul tabel:

Prescurtarea uzual de la denumirea procedurii n limba englez: Analysis of Variance.

9 ANALIZA DE VARIAN Pagina 2 din 15

Tabelul 9.1 Calcule iniiale pentru ANOVA, o variabil independent


Mic
33
24
31
29
34
T1 = 151
n1 = 5
X 1 = 30,20

Distana fa de intervievator
Medie
21
25
19
27
26
T2 = 118
n2 = 5
X 2 = 23,60

X 12 = 4623
T12 = 22801

X 22 = 2832
T22 = 13294

Mare
20
13
15
10
14
T3 = 72
n3 = 5
X 3 = 14,40
2
X 3 = 1090

T32 = 5184

Pentru fiecare grup i, Ti este totalul scorurilor individuale, ni este numrul de subieci,
X i este media aritmetic a scorurilor, X i2 este suma ptratelor scorurilor individuale,
iar Ti 2 este ptratul totalului scorurilor. De notat c grupurile obinute sunt
independente, precum i c formulele de calcul care urmeaz sunt aplicabile i n cazul
n care este vorba despre un numr diferit de subieci n fiecare grup.
n ANOVA pentru o variabil independent se consider dou surse de variaie:
(i) variaia mediilor aritmetice ale grupurilor i (ii) variaia datorat diferenelor dintre
subiecii din fiecare grup, care poate fi atribuit procesului de eantionare. Pentru
nceput, se calculeaz trei sume de ptrate ale abaterilor fa de medie sau, pe scurt,
sume de ptrate. Vom desemna generic prin SS aceste sume de ptrate2: (1) SSTOTAL
suma ptratelor abaterilor fiecrui scor individual fa de media aritmetic a tuturor
scorurilor, numit i marea medie; (2) SSA suma ptratelor abaterilor fiecrei medii de
grup fa de marea medie; (3) SSEROARE suma ptratelor abaterilor fiecrui scor
individual fa de media aritmetic a grupului respectiv. Litera A din SSA arat c
lucrm cu variana sistematic a variabilei independente A. SSA reflect prima surs de
variaie, iar SSEROARE pe cea de-a doua.
Putem calcula aceste abateri direct pe baza datelor din tabel. ntruct astfel de
calcule sunt greoaie, vom utiliza formule simplificate.
Formula 9.1

SS TOTAL X 2

G2
N

n care X 2 = suma ptratelor scorurilor individuale ale tuturor subiecilor din


2
experiment = X 12 + X 22 + X 3
2
G 2 = ptratul totalului tuturor scorurilor = (T1 T2 T3 )
N = numrul total de subieci din experiment.
Dac se efectueaz calculele pe hrtie sau cu un calculator de buzunar, este convenabil
s se afle mai nti X 2 pentru scorurile din fiecare grup, aa cum am fcut n tabelul
de mai sus, dup care s se adune aceste sume. Aplicm formula 9.1:

Prescurtarea uzual de la denumirea din limba englez Sum of squares.

9 ANALIZA DE VARIAN Pagina 3 din 15


SS TOTAL X 2

(151 118 72) 2


G2
(4623 2823 1090)

N
15
8545 7752,07 792,93

Atunci cnd calculm SSTOTAL este recomandabil s reinem termenii diferenei, 8545 i
7752,07, pe care i vom folosi pentru simplificarea calculelor ulterioare.
Odat de am calculat SSTOTAL, putem calcula SSA dup urmtoarea formul:
Formula 9.2

SS A

Ti 2 G 2

ni
n

n aceast formul, Ti este un simbol general pentru T1, T2 i T3, iar ni este un simbol
2
general pentru n1, n2 i n3. Astfel, odat ce cantitatea Ti ni este calculat pentru fiecare
grup, cantitile sunt adunate, dup cum arat simbolul . S notm c a doua parte a
formulei 2, G2/N, a fost deja calculat, atunci cnd am obinut SSTOTAL, aa nct vom
prelua direct rezultatul respectiv n calculul SSA:

SS A

Ti 2 G 2 T12 T22 T32 G 2 1512 118 2 72 2


7752,07

5
5
ni
n n1 n 2 n3
N 5
8381,80 7752,07 629,73

i aici vom reine unul dintre termenii diferenei, i anume 8381,80, pe care l vom
folosi pentru calculul SSEROARE, dup urmtoarea formul:
Formula 9.3

SS EROARE X 2

Ti 2
ni

Ambele cantiti cerute de aceast formul au fost calculate anterior, cnd am obinut
SSTOTAL i, respectiv, SSA, aa nct vom prelua direct rezultatele respective n calculul
SSEROARE:
SS EROARE X 2

Ti 2
8545 8381,80 163,20
ni

De notat c SSTOTAL = SSA + SSEROARE. Aceast relaie poate fi utilizat pentru a


controla corectitudinea calculelor.
Pasul urmtor n calculul ANOVA const n calcularea a dou medii aritmetice
ale sumelor de ptrate ale abaterilor fa de medie sau, pe scurt, medii aritmetice
ale sumelor de ptrate. Vom desemna generic prin MS aceste medii3: (1) MSA media
aritmetic pentru SSA, numit variana sistematic i (2) MSEROARE media aritmetic
pentru SSEROARE, numit variana de eroare.
Formula 9.4

MS A

SS A
k 1

Prescurtarea uzual de la denumirea din limba englez Mean squares.

9 ANALIZA DE VARIAN Pagina 4 din 15


n aceast formul, k este numrul de grupuri, k 1 fiind numrul de grade de libertate
asociate SSA, pe care l vom nota n continuare cu glA.
MS A

SS A 629,73 629,73

314,87
k 1
3 1
2
MS EROARE

Formula 9.5

SS EROARE
N k

Aici, N k reprezint numrul de grade de libertate asociate SSEROARE, pe care l vom


nota n continuare cu glEROARE.
MS EROARE

SS EROARE 163,20 163,20

13,60
N k
15 3
12

Distribuia de eantionare n ANOVA este distribuia F (numit astfel n onoarea


britanicului Ronald Fisher (1890-1962), biolog i statistician, inventatorul ANOVA).
Forma aproximativ a unei curbe F este urmtoarea:

Valori ale lui F

Figura 9.1 Un exemplu de curb F

Grade de libertate

Forma exact a unei curbe F depinde de valorile pentru glA i, respectiv, pentru glEROARE.
De notat c folosirea distribuiei F cere ca variabila dependent s fie normal distribuit
n cele k populaii i ca aceste populaii s fie egal dispersate 4. n tabelul distribuiei F
(vezi Anexa D) n prima coloan din stnga sunt trecute gradele de libertate pentru
MSEROARE (glEROARE = N k), de la 1 la 120 i . Pe cea de-a doua coloan din stnga apar
nivelele . Pe primul rnd al tabelului apar gradele de libertate pentru MSA (glA = k 1),
de la 1 la 120 i .

Supoziia omogenitii dispersiei i cea a normalitii distribuiei, mpreun cu ipoteza de nul, spun c
distribuiile la nivelul populaiilor au aceeai form, aceeai medie aritmetic i aceeai abatere standard
sau, cu alte cuvinte, c este vorba despre una i aceeai populaie.

9 ANALIZA DE VARIAN Pagina 5 din 15

Figura 9.2 Schema tabelului valorilor critice ale distribuiei F


glEROARE
(gl2)
1
2
.
.
120

glA (gl1)
1 2 .120

0,25
0,10
0,05
.
.
.
.
.
.
.

..
..
....
..
..
..
..
..

La intersecia rndului pentru N k grade de libertate i nivelul ales cu coloana pentru


k 1 grade de libertate se gsete F (critic), adic valoarea care marcheaz nceputul
zonei critice n distribuia F. n exemplul nostru, pentru N k = 12 i k 1 = 2, alegnd
un nivel = 0,05, F (critic) = 3,8853 sau, rotunjit, 3,89. Valoarea pentru F (obinut) se
calculeaz cu formula urmtoare:
MS A
F
Formula 9.6
MS EROARE
Dac intervin doar factori ntmpltori, valoarea ateptat pentru F (obinut) este 1,0.
Cu ct este mai mare valoarea pentru F (obinut), cu att este mai mic probabilitatea ca
rezultatele experimentului s se datoreze ntmplrii. Regula de decizie este urmtoarea:
Se respinge H0, dac F (obinut) F (critic)
n exemplul nostru,
F

MS A
314,87

23,15
MS EROARE
13,60

ntruct F (obinut) cade n zona critic (23,15 3,89), vom conchide c rezultatele
experimentului sunt semnificative i vom respinge ipoteza c mediile aritmetice sunt
egale la nivelul populaiei.
n termenii modelului n patru pai, testul ANOVA pentru o variabil
independent, n exemplul nostru, decurge dup cum urmeaz:
Pasul 1. Enunarea ipotezelor
H0: 1 = 2 = 3
Ha: Cel puin o medie aritmetic difer de celelalte

9 ANALIZA DE VARIAN Pagina 6 din 15

Pasul 2. Selectarea distribuiei de eantionare i stabilirea


zonei critice
Distribuia de eantionare = Distribuia F
= 0,05
glEROARE = N k = 12
glA = k 1 = 2
F(critic) = 3,89
Pasul 3. Calcularea statisticii testului
Organizarea calculului ANOVA se face cu ajutorul unui tabel de calcule iniiale (v.
tabelul 9.1), precum i al unui tabel ANOVA rezumativ, numit tabel al surselor de
variaie. Forma general a unui astfel de tabel este urmtoarea:
Sursa de
variaie
A
EROARE
TOTAL

Sume de
ptrate
SSA
SSEROARE
SSTOTAL

Grade de
libertate
k1
Nk
N1

Medii ale
sumelor
MSA
MSEROARE

F (obinut)
MSA/MSEROARE

n exemplul nostru, avem urmtorul tabel:


Tabelul 9.2 ANOVA rezumativ, o variabil independent
Sursa de
variaie
A
EROARE
TOTAL

Sume de
ptrate
629,73
163,20
792,93

Grade de
libertate
2
12
14

Medii ale
sumelor
314,87
13,60

F (obinut)
23,15

Pasul 4. Luarea deciziei


ntruct, F (obinut) cade n zona critic (23,15 3,89), ipoteza de nul este
respins. La nivelul populaiei, mediile aritmetice ale scorurilor corespunztoare celor
trei distane difer semnificativ. Enunul de probabilitate asociat acestei concluzii este
urmtorul: probabilitatea ca diferena observat ntre mediile aritmetice ale grupurilor s
apar din ntmplare, dac H0 ar fi n realitate adevrat, este mai mic de 0,05.
De notat c n cazul n care se consider mai mult de dou categorii ale
variabilei independente (ca n exemplul nostru n care avem trei grupuri), F (obinut) nu
arat care este grupul care difer semnificativ de celelalte. O modalitate de a examina
diferena dintre dou grupuri este de a utiliza formula SSA pentru a calcula suma
ptratelor i media sumei de ptrate pentru cele dou grupuri (numrul de grade de
libertate n acest caz fiind 2 1) i de a utiliza cantitatea MSEROARE, calculat anterior, ca
eroare de varian pentru calcularea F (obinut). Au fost dezvoltate i metode mai
sofisticate pentru a evalua diferena dintre dou grupuri, dup ce s-a determinat un F
(obinut) semnificativ, numite teste de comparare multipl post hoc, precum i metode

9 ANALIZA DE VARIAN Pagina 7 din 15


de testare a unor ipoteze specifice privind diferenele dintre medii, numite comparaii a
priori sau comparaii planificate5.

9.2
ANOVA
INDEPENDENTE

PENTRU

DOU

VARIABILE

Testul ANOVA pentru dou variabile independente este o extindere a testului


ANOVA pentru o singur variabil independent, cu excepia faptului c formulele
testului expus n aceast seciune sunt aplicabile doar n cazul grupurilor independente
cu acelai numr de subieci n fiecare grup. Vom folosi aceeai manier de expunere ca
mai sus: vom prezenta un exemplu ipotetic, un tabel de calcule iniiale, formulele de
calcul ale testului ANOVA pentru dou variabile independente, precum i modelul n
patru pai specific acestui test.
20 de elevi sunt supui unui experiment privind metodele de instruire n
matematic. Variabila independent, A, este, deci, metoda de instruire. Elevii sunt
repartizai aleatoriu n dou clase: o clas la care se utilizeaz metoda tradiional (A1)
i o clas la care se utilizeaz o metod modern (A2). Variabila independent, B, este
nivelul IQ, cu categoriile : B1 ( 90) i B2 ( 90). Informaia prezentat la cele dou
clase este aceeai. La sfritul perioadei de instruire elevii dau acelai test. Rezultatul
(scorul) obinut la acest test este variabila dependent. Experimentul permite evaluarea a
trei efecte: (i) efectul principal al variabilei A (dac una dintre metode conduce la
rezultate diferite fa de cealalt), (ii) efectul principal al variabilei B (dac elevii cu un
IQ superior obin rezultate diferite fa de ceilali), (iii) interaciunea A B (dac efectul
unei variabile independente difer n funcie de un anumit nivel al celeilalte variabile
independente).
Dup cum reiese i din cele de mai sus, un astfel de experiment are mai multe
avantaje. Mai nti, prin analiza simultan a dou variabile independente se realizeaz,
de fapt, dou cercetri altfel distincte. Pe lng investigarea modului n care diferitele
categorii ale celor dou variabile independente afecteaz variabila dependent, se poate
verifica dac nivelele uneia dintre variabilele independente afecteaz variabila
dependent n acelai fel ca i nivelele celeilalte variabile independente. Apoi, este
vorba despre investigarea interaciunii dintre dou variabile independente. ntruct, n
situaiile reale, efectul unei variabile independente este adesea afectat de una sau mai
multe variabile independente, studiul interaciunii dintre variabilele independente poate
fi un obiectiv foarte important al cercetrii.
Revenind la exemplul nostru ipotetic, datele obinute, mpreun cu mrimile
necesare pentru ANOVA sunt prezentate n urmtorul tabel:

Vezi Hinkle, Wiersma i Jurs, 1988, capitolul 16.

9 ANALIZA DE VARIAN Pagina 8 din 15

Tabelul 9.3 Calcule iniiale pentru ANOVA, dou variabile independente


Metoda (A)

Tradiional (A1)

Modern (A2)

Nivelul IQ (B)
B1
B2
75
90
70
95
69
89
72
85
68
91
TA1B1 = 354
TA1B2 = 450
nA1B1 = 5
nA1B2 = 5
X A1B1 = 70,80
X A1B2 = 90,00
X 2 A1B1 = 25094
X 2 A1B2 = 40552
85
87
87
94
83
93
90
89
89
92
TA2B1 = 434
TA2B2 = 455
nA2B1 = 5
nA2B2 = 5
X A2B1 = 86,80
X A2B2 = 91,00
X 2 A2B1 = 37704
X 2 A2B2 = 41439
TB1 = 788
TB2 = 905
nB1 = 10
nB2= 10
X B1 = 78,80
X B2 = 90,50

TA1 = 804
nA1 = 10
X A1 = 80,40

TA2 = 788
nA2 = 10
X A2 = 88,90

n ANOVA pentru dou variabile independente se testeaz trei ipoteze de nul,


fiecare corespunznd unei surse de variaie:
H01: La nivelul populaiei nu exist nici o diferen ntre mediile aritmetice ale
rezultatelor obinute prin cele dou metode.
H02: La nivelul populaiei nu exist nici o diferen ntre mediile aritmetice ale
rezultatelor obinute de elevii cu nivele IQ diferite.
H03: La nivelul populaiei nu exist interaciune ntre cele dou variabile.
H01 corespunde variaiei mediilor aritmetice ale scorurilor variabilei dependente din
fiecare categorie a variabilei A. H02 corespunde variaiei mediilor aritmetice ale
scorurilor variabilei dependente din fiecare categorie a variabilei B. H03 corespunde
variaiei mediilor aritmetice ale scorurilor variabilei dependente din categoriile
combinate A B.
n acest caz, se calculeaz cinci sume de ptrate: (1) SSTOTAL, (2) SSA, (3) SSB,
(4) SSA B i (5)SSEROARE.
SSTOTAL se calculeaz cu ajutorul formulei 9.1:

9 ANALIZA DE VARIAN Pagina 9 din 15

G2
X A21B1 X A21B 2 X A2 2 B1 2A 2 B 2
N
(T A1B1 T A1B 2 T A 2 B1 T A 2 B 2 ) 2

( 25094 40552 37704 41439)


N
(354 450 434 455) 2

144789 143312,45 1476,55


20
SS TOTAL X 2

i aici, atunci cnd calculm SSTOTAL, este recomandabil s reinem termenii diferenei,
144789 i 143312,45, pe care i vom folosi pentru simplificarea calculelor ulterioare.
Formula 9.2 este modificat corespunztor pentru calculul SSA i SSB. Astfel, SSA
se calculeaz cu ajutorul urmtoarei formule:
Formula 9.7

SS A

Ta2 G 2

na
n

n aceast formul, Ta este un simbol general pentru TA1 i TA2, iar na este un simbol
general pentru nA1 i nA2. Prin urmare, atunci cnd calculm SSA, lum n considerare
doar grupurile variabilei independente A.

SS A

Ta2 G 2 T A21 T A22 G 2 804 2 889 2



143312,45

na
n n A1 n A 2
N 10
10
143673,70 143312,45 361,25

SSB se calculeaz cu ajutorul urmtoarei formule:


Formula 9.8

SS B

Tb2 G 2

nb
n

n aceast formul, Tb este un simbol general pentru TB1 i TB2, iar nb este un simbol
general pentru nB1 i nB2. Prin urmare, atunci cnd calculm SSB, lum n considerare
doar grupurile variabilei independente B.

SS B

TB2 G 2 TB21 TB22 G 2 788 2 905 2



143312,45

nB
n n B1 n B 2
N 10
10
143996,90 143312,45 684,45

Calculm acum SSA B, cu ajutorul urmtoarei formule:


Formula 9.9

SS A B

Tab2 G 2

SS A SS B
n ab
N

n aceast formul, Tab este un simbol general pentru TA1B1, TA1B2, TA2B1 i TA2B2, iar nab
este un simbol general pentru nA1B1, nA1B2, nA2B1 i nA2B2. Prin urmare, atunci cnd
calculm SSA B, lum n considerare grupurile constituite dup categoriile combinate
A B.

9 ANALIZA DE VARIAN Pagina 10 din 15

T2
T2
T2
T2
SS A B A1B1 A1B 2 A 2 B1 A 2 B 2
n A1B1 n A1B 2 n A 2 B1 n A 2 B 2

G2
SS A SS B
N

354
450
434
455
143312,45 361,25 684,25

5
5
5
5
2

144639,40 143312,45 361,25 684,45 281,25

i aici vom reine unul dintre termenii diferenei, i anume 144639,40, pe care l vom
folosi pentru calculul SSEROARE, dup urmtoarea formul:
SS EROARE X 2

Formula 9.10

Tab2
n ab

Ambele cantiti cerute de aceast formul au fost calculate anterior, cnd am obinut
SSTOTAL i, respectiv, SSA B, aa nct vom prelua direct rezultatele respective n calculul
SSEROARE:
SS EROARE

Tab2
X
144789 144639,40 149,60
n ab
2

De notat c SSTOTAL = SSA + SSB + SSA B + SSEROARE. Aceast relaie poate fi utilizat
pentru a controla corectitudinea calculelor.
Mediile aritmetice ale sumelor de ptrate pentru fiecare surs de varian se
calculeaz prin mprirea sumei de ptrate respectiv la numrul corespunztor de
grade de libertate.
MS A

Formula 9.11

SS A
kA 1

n aceast formul, kA este numrul de grupuri constituite dup categoriile variabilei A,


iar kA 1 este numrul de grade de libertate asociate SSA, notat cu glA. n exemplul
nostru,
MS A

Formula 9.12

SS A
361,25

361,25
kA 1
2 1
MS B

SS B
kB 1

n formula 12, kB 1 este numrul de grupuri constituite dup categoriile variabilei B,


iar kB 1 este numrul de grade de libertate asociate SSB, notat cu glB. n exemplul
nostru,
SS B
684,45
MS B

684,45
kB 1
2 1

9 ANALIZA DE VARIAN Pagina 11 din 15


MS A B

Formula 9.13

SS A B
(k A 1)(k B 1)

n formula 13, (kA 1)(kB 1) este numrul de grade de libertate asociat SSA B, notat cu
glA B. n exemplul nostru,
MS A B

SS A B
281,25

281,25
(k A 1)(k B 1) (2 1)(2 1)
MS EROARE

Formula 9.14

SS EROARE
N k AkB

n formula 14, N kAkB este numrul de grade de libertate asociat SSEROARE, notat cu
glEROARE.
MS EROARE

SS EROARE
149,60 149,60

9,35
N k AkB
20 4
16

Valoarea pentru F (obinut) se calculeaz pentru fiecare surs de varian


sistematic (efectele principale pentru A, pentru B i pentru interaciunea A B).
Prezentm n continuare formulele de calcul pentru FA (obinut), FB (obinut) i FAB
(obinut), mpreun cu calculele respective, corespunztoare exemplului nostru.
FA

Formula 9.15

FA

MS A
361,25

38,64
MS EROARE
9,35
FB

Formula 9.16

FB

MS A
MS EROARE

MS B
MS EROARE

MS B
684,45

30,08
MS EROARE
9,35
F A B

Formula 9.17

F A B

MS A B
MS EROARE

MS A B
281,25

30,08
MS EROARE
9,35

Pentru luarea deciziei, fiecare valoare pentru F (obinut) se compar cu F (critic).


ntruct n fiecare caz din exemplul nostru, glEROARE = 16, iar numrul de grade de
libertate din numrtor pentru media aritmetic este egal cu 1 (glA = glB = glAB = 1),

9 ANALIZA DE VARIAN Pagina 12 din 15


pentru = 0,05, F (critic) = 4,4940 sau, rotunjit, 4,496. Deoarece fiecare F (obinut) este
mai mare dect F (critic), toate cele trei ipoteze de nul pot fi respinse. De notat c toate
cele trei ipoteze de nul pot fi respinse (rezultatele experimentului sunt semnificative) i
pentru = 0,01, pentru care F (critic) = 8,53.
n termenii modelului n patru pai, testul ANOVA pentru dou variabile
independente decurge astfel:
Pasul 1 Enunarea ipotezelor
H01: La nivelul populaiei nu exist nici o diferen ntre mediile aritmetice ale
rezultatelor obinute prin cele dou metode.
Ha1: La nivelul populaiei mediile aritmetice ale rezultatelor obinute prin cele
dou metode difer.
H02: La nivelul populaiei nu exist nici o diferen ntre mediile aritmetice ale
rezultatelor obinute de elevii cu nivele IQ diferite.
Ha2: La nivelul populaiei mediile aritmetice ale rezultatelor obinute de elevii cu
nivele IQ diferite difer.
H03: La nivelul populaiei nu exist interaciune ntre cele dou variabile.
Ha3: La nivelul populaiei exist interaciune ntre cele dou variabile.
Pasul 2 Selectarea distribuiei de eantionare i stabilirea
zonelor critice.
Distribuia de eantionare = distribuia F
= 0,05
glEROARE = 16
glA = glB = glAB = 1
F (critic) = 4,49
Pasul 4 Calcularea statisticii testului
Organizarea calculului ANOVA pentru dou variabile independente se face cu ajutorul
unui tabel de calcule iniiale (v. tabelul 9.3), precum i al unui tabel ANOVA rezumativ
(tabel al surselor de variaie). n acest caz, forma general a unui astfel de tabel este
urmtoarea:
Sursa de
variaie
A
B
AB
EROARE
TOTAL

Sume de
ptrate
SSA
SSB
SSAB
SSEROARE
SSTOTAL

Grade de
libertate
kA 1
kB 1
(kA 1)(kB 1)
N kAkB
N1

Medii ale
sumelor
MSA
MSB
MSAB
MSEROARE

F (obinut)
MSA/MSEROARE
MSB/MSEROARE
MSAB/MSEROARE

Evident, dac cele trei grade de libertate ar fi fost diferite, am fi avut trei valori pentru F (critic).

9 ANALIZA DE VARIAN Pagina 13 din 15

n exemplul nostru, avem urmtorul tabel:


Tabelul 9.4 ANOVA rezumativ, dou variabile independente
Sursa de
variaie
A
B
AB
EROARE
TOTAL

Sume de
ptrate
361,25
684,45
281,25
149,60
1476,55

Grade de
libertate
1
1
1
16
19

Medii ale
sumelor
361,25
684,45
281,25
9,35

F (obinut)
38,64
73,20
30,08

Pasul 4 Luarea deciziei


ntruct fiecare valoare pentru F (obinut) este mai mare dect valoarea pentru F
(critic), se resping cele trei ipoteze de nul. Pentru efectul principal al variabilei A,
concluzia este c la nivelul populaiei, mediile aritmetice ale rezultatelor obinute prin
cele dou metode difer semnificativ. Pentru efectul principal al variabilei B, concluzia
este c la nivelul populaiei, mediile aritmetice ale rezultatelor obinute de elevii cu
nivele IQ diferite difer semnificativ. Enunul de probabilitate asociat ambelor concluzii
este urmtorul: probabilitatea ca diferenele observate ntre mediile aritmetice ale
grupurilor constituite dup categoriile unei variabile independente s apar din
ntmplare, dac H0 respectiv ar fi n realitate adevrat, este mai mic de 0,05 (i dup
cum am vzut, chiar dect 0,01).
Pentru interaciune, concluzia este c la nivelul populaiei exist o interaciune
ntre metoda de instruire i nivelul IQ al subiecilor. Enunul de probabilitate asociat
acestei concluzii este urmtorul: probabilitatea ca diferenele observate ntre mediile
aritmetice ale scorurilor din categoriile combinate ale celor dou variabile s apar din
ntmplare, dac H03 ar fi n realitate adevrat, este mai mic de 0,05 (i dect 0,01).

9.3 ANOVA PENTRU EANTIOANE DEPENDENTE


Calculele ANOVA considerate pn acum sunt aplicabile doar n cazul
eantioanelor independente. n aceast seciune se prezint calculele ANOVA pentru
cazul eantioanelor dependente. Amintim c n acest caz este vorba fie despre alctuirea
unor eantioane astfel nct selectarea cazurilor pentru un eantion influeneaz
selectarea cazurilor pentru un alt eantion, fie despre situaiile experimentale n care
aceeai subieci sunt testai repetat.
Un cercettor presupune c atractivitatea fizic a candidailor la obinerea unei
slujbe influeneaz judecata asupra competenei profesionale a candidailor. Variabila
independent este deci atractivitatea fizic a candidailor, variabila dependent fiind
judecata asupra competenei profesionale, msurat pe o scal cu zece puncte.
Cercettorul alctuiete un eantion aleatoriu cu opt subieci i le prezint dou filme, n
fiecare film aprnd o femeie care rspunde la un test de aptitudini mecanice (mbinarea
unor piese). Cele dou femei ndeplinesc sarcinile testului la fel de bine, dar una dintre
ele este atractiv fizic, n timp ce cealalt nu este atractiv fizic. Filmele sunt prezentate
de mai multe ori, pentru a se controla efectul ordonrii. Datele obinute, mpreun cu
mrimile necesare pentru ANOVA sunt prezentate n urmtorul tabel:

9 ANALIZA DE VARIAN Pagina 14 din 15

Tabelul 9.5 Calcule iniiale pentru ANOVA, eantioane dependente


Subieci

Atractivitatea fizic (A)


Neatractive (A1)
Atractive (A2)

1
2
3
4
5
6
7
8

6
5
5
7
4
3
5
4
TA1 = 39
2A1 = 201
nA1 = 8
X A1 = 4,88

8
6
9
6
6
5
5
7
TA2 = 52
2A2 = 352
nA2 = 8
X A2 = 6,50

Ts

14
11
14
13
10
8
10
11

Ts2
196
121
196
169
100
64
100
121
2
Ts = 1067

n acest tabel, Ts se refer la totalul scorurilor acordate de fiecare subiect pentru cele
dou femei, Ts2 este ptratul acestui total, iar Ts2 este suma acestor ptrate pentru toi
subiecii.
Principala diferen dintre ANOVA pentru eantioane dependente i ANOVA
pentru o variabil independent const n aceea c efectul diferenelor dintre subieci
devine o surs de varian. n ANOVA pentru eantioane dependente apar patru surse de
varian i deci se calculeaz patru sume de ptrate: (1) SSTOTAL, (2) SSA, (3) SSSUBIECI i
(4)SSEROARE. SSTOTAL se calculeaz cu ajutorul formulei 9.1:
SS TOTAL X 2

(39 52) 2
G2
= (201 + 352)
= 553 517,56 = 35,44
N
16

SSA se calculeaz cu ajutorul formulei 97:


SS A

Ta2 G 2
39 2 52 2

=
517,56 = 10,57
na
n
8

SSSUBIECI se calculeaz cu ajutorul urmtoarei formule:


TS2 G 2
SS SUBIECTI

Formula 9.18
nS
n
Termenul nS se refer la numrul de eantioane dependente din experiment sau la
numrul de scoruri pe care le d fiecare subiect, astfel c n exemplul nostru, nS = 2.
SS SUBIECTI

TS2 G 2 1067

517,56 15,94
nS
n
2

n fine, SSEROARE se calculeaz cu ajutorul urmtoarei formule:


Formula 9.19

SS EROARE SS TOTAL SS A SS SUBIECTI

9 ANALIZA DE VARIAN Pagina 15 din 15

SS EROARE 35,44 10,57 15,94 8,93

Conform ipotezei de nul, atractivitatea fizic nu influeneaz judecata asupra


competenei profesionale. Forma general a unui tabel ANOVA rezumativ pentru
eantioane dependente este urmtoarea:
Sursa de
variaie
A
SUBIECI
EROARE
TOTAL

Sume de
ptrate
SSA
SSSUBIECI
SSEROARE
SSTOTAL

Grade de
libertate
k1
s1
(k 1)(s 1)
N1

Medii ale
sumelor
MSA
MSEROARE

F (obinut)
MSA/MSEROARE

Procedurile de calcul pentru mediile sumelor de ptrate i pentru F (obinut) sunt


similare cu cele deja cunoscute. De notat c, n acest caz, media sumei de ptrate i F
(obinut) pentru SSSUBIECI nu se calculeaz. n mod obinuit, nu este necesar s
cunoatem dac exist diferene semnificative ntre subieci. Aflarea cantitii
corespunztoare sursei de varian SSSUBIECI contribuie, ns, la reducerea sursei de
variaie SSEROARE (formula 9.19). n exemplul nostru, avem urmtorul tabel:
Tabelul 9.6 ANOVA rezumativ, eantioane dependente
Sursa de
variaie
A
SUBIECI
EROARE
TOTAL

Sume de
ptrate
10,57
15,94
8,93
35,44

Grade de
libertate
1
7
7
15

Medii ale
sumelor
10,57
1,28

F (obinut)

8,26

Lsm ca exerciiu pentru cititor formularea n termenii modelului n patru pai a


testului ANOVA aplicat aici, n principal a deciziei pentru = 0,05, precum i a
enunului de probabilitate asociat concluziei7.

GLOSAR
analiza de varian (ANOVA): procedur
de testare a ipotezei conform creia
mediile aritmetice ale k populaii (k 2)
sunt egale. Testul ANOVA poate fi
considerat drept o extensie a testului

Vezi exerciiul 9.1.

privind diferena dintre dou medii


aritmetice.
curbe F: grafic al distribuiei F.
Distribuia F: distribuia de eantionare n
testul ANOVA.

S-ar putea să vă placă și