Sunteți pe pagina 1din 18

ANOVA

Metodologia cercetarii
Curs 5
Definitie
ANOVA sau analiza de varianţă este o generalizare a
testului t pentru mai mult de două medii.

• ANOVA combină şi extinde testele t şi χ2, prin


testarea egalităţii dintre trei sau mai multe medii
(pentru trei sau mai multe grupuri). Se testează
aşadar legătura dintre o variabilă metrică (pentru
care se calculează media) şi o variabilă
calitativă (a cărei valori sau categorii sunt
considerate grupuri independente).
• De asemenea, ANOVA face o introducere clară
în analiza cauzală: variabila cauză
(independentă) este cea calitativă iar variabila
efect (dependentă) este cea metrică.
• Clasificarea tehnicilor ANOVA

• Cele mai întâlnite design-uri de cercetare experimentală


utilizează una dintre următoarele patru forme:

• 1. ANOVA simplă sau unifactorială: este modelul cel mai


simplu dintre tehnicile ANOVA, fiind un corespondent al
testului t pentru două eşantioane independente ((n
>30);
• 2. ANOVA cu măsurători repetate: este un model
corespondent al testului t pentru două eşantioane
perechi(n >30);
• 3. ANOVA factorială testează efectele mai multor
variabile independente (factori) asupra unei variabile
dependente.
• 4. mixtă este o combinaţie între ANOVA simplă şi
ANOVA cu măsurători repetate.
• 1. Varianta de ANOVA uni-factorială, cu
un singur factor (în engl. one-way
ANOVA), foloseşte o singură variabilă
categorială (denumită în limba engleză
“factor”) pentru a testa diferenţele între
mediile grupurilor definite de categoriile
acesteia (denumite în engleză “levels”
• niveluri sau “treatments” - tratamente).
Condiţii necesare pentru aplicarea tehnicii ANOVA

• (1) Eşantionul a fost selectat aleator din


populaţie,
• (2) Variabila dependentă prezintă
distribuţie normală.
• (3) Dispersia subiecţilor împărţiţi pe grupe
experimentale să fie egală.
• (4) Pentru ANOVA pe măsurări repetate
apare o condiţie suplimentară denumită
condiţia de sfericitate.
Analiza de varianţă se efectuează în trei paşi:

• 1. Calcularea primei estimări a varianţei în


populaţie: varianţa dintre mediile grupurilor
• 2. Calcularea celei de a doua estimări a
varianţei în populaţie: varianţa din interiorul
grupurilor
• 3. Se compară cele două estimări cu ajutorul
statisticii test F. Dacă sunt aproximativ egale
(raportul dintre cele două este aproape de
valoarea 1), atunci nu respingem ipoteza nulă
(Ho).
Testul ANOVA: compararea mediilor a mai multe
eşantioane

• H0 = toate mediile sunt egale.


• H1 = nu toate mediile sunt egale.

Condiţii de aplicare:
1. Datele sunt independente unele faţă de
celelalte.
2. Datele fiecărui grup sunt normal distribuite.
3. Deviaţia standard este aceeaşi pentru toate
grupurile.
Testul ANOVA: compararea mediilor a mai multe
eşantioane

Id Medicament m=(7+8+9+11+6+7)/6
A B C D E F
m=8
1 5 6 7 10 5 9
(7-8)2+ (8-8)2+ (9-8)2+
2 6 8 8 11 8 8
(11-8)2+ (6-8)2+ (7-8)2 =
3 7 7 9 13 6 7 (-1)2+ 02+ 12+ 32+ (-2)2+
4 8 9 11 12 4 5 (-1)2 = 1 + 0 + 1 + 9 + 4 =
5 9 10 10 9 7 6 16
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
Testul ANOVA: compararea mediilor a mai multe
eşantioane

• m=(7+8+9+11+6+7)/6
• m=8
• (7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9
+ 4 = 16
• Suma pătratelor (între) = ∑(media grupului –
media generală)2×N(numărul de grupuri)
• Suma pătratelor (în) = ∑(valoarea individuală
– media grupului)2
• F = (suma pătratelor(între))/(suma
pătratelor(în))
Testul ANOVA: compararea mediilor a mai multe
eşantioane

• Suma pătratelor (între) = 16×5 = 80


• Suma pătratelor (în) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2+....+(9-
7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
• Cu cât diferenţa dintre suma pătratelor între grupuri este mai
mare comparativ cu suma pătratelor în interiorul fiecărui grup
cu atât diferenţa între grupurile investigate e mai mare.

SP df Media pătratelor F = MPîntre/MPîn


Între 80 5 = 80/5 = 16 = 16/2,5 = 6,4
În 60 24 = 60/24 = 2,5
Total 140 29 -
Testul Student (t) de comparare a unei medii
cu o medie cunoscută/teoretica
• Numărul de grade de libertate
(df): df = n-1 • Parametrul testului:
• Pragul de semnificaţie: α = 0,05. X − µ0
t=
• Regiunea critică pentru testul σ
bilateral este: n

(−∞;−t α ] ∪ [t α ;+∞) • n = volumul eşantionului


n −1, n −1, • µ0 = media standard
2 2
• X = media eşantionului
σ = deviaţia standard a
(−∞;− t n −1;0, 025 ] ∪ [ t n −1;0, 025 ;+∞) eşantionului. n
∑ i
( x − X ) 2

σ = σ2 = i =1
n −1
Testul Student (t) de comparare a unei medii
cu o medie cunoscută (variaţii necunoscute)
• Scopul testului: investigarea semnificaţiei diferenţei dintre
media unui eşantion şi o medie standard cunoscută.
• Ipoteza nulă H0: nu există diferenţă semnificativă între media
eşantionului şi media standard.
• Ipoteza alternativă H1: există diferenţă semnificativă între media
eşantionului şi media standard.
• Condiţii de aplicare
– Testul se poate aplica atunci când variaţia σ2 nu este
cunoscută iar estimarea s2 a acesteia se realizează pentru
un eşantion mic (n < 30) care respectă o distribuţie normală.
Dacă această condiţie de normalitate nu este satisfăcută
atunci testul îşi pierde validitatea.
– Dacă se cunoaşte variaţia populaţiei σ2, şi n ≥ 30 se aplică
testul Z care este un test mult mai puternic.
Testul Student (t) de comparare a unei medii
cu o medie cunoscută/teoretica
• Numărul de grade de libertate
(df): df = n-1 • Parametrul testului:
• Pragul de semnificaţie: α = 0,05. X − µ0
t=
• Regiunea critică pentru testul σ
bilateral este: n

(−∞;−t α ] ∪ [t α ;+∞) • n = volumul eşantionului


n −1, n −1, • µ0 = media standard
2 2
• X = media eşantionului
σ = deviaţia standard a
(−∞;− t n −1;0, 025 ] ∪ [ t n −1;0, 025 ;+∞) eşantionului. n
∑ i
( x − X ) 2

σ = σ2 = i =1
n −1
Testul Student de comparare a unei medii cu o medie
cunoscuta/teoretica

• Uneori cunoastem din literatura de specialitate care este media populatiei din care
presupunem ca este extras un lot si dorim sa verificam ipoteza ca esantionul apartine
într-adevar populatiei respective.
• Variabila aleatoare tc, se calculeaza dupa formula:

• si are o repartitie Student cu n-1 grade de libertate.

Din tabelele statistice pentru t se cauta valoarea lui t95%


pentru n-1 grade de libertate si se compara cu valoarea lui tc.

Interpretarea testului:
Daca atunci nu avem motive suficiente pentru a afirma ca exista o diferenta
semnificativa intre media de esantionare si media teoretica.

Daca putem afirma ca exista o diferenta semnificativa intre media de


esantionare si media teoretica.
Testul Student (t) de comparare a două
medii (variaţii necunoscute şi egale)
• Ipoteza nulă: Diferenţa mediilor celor două populaţii
este egală cu zero.
• Ipoteza alternativă pentru testul bilateral: Diferenţa
mediilor celor două populaţii este diferită de zero.
• Condiţii de aplicare
– Variabila de analizat în cele două populaţii este normal
distribuită şi variaţiile celor două populaţii sunt egale.
– Dacă aceste condiţii nu sunt satisfăcute atunci testul
îşi pierde validitatea.
– Dacă se cunoaşte variaţia populaţiei σ2, se aplică
testul Z care este un test mult mai puternic.
Testul Student (t) de comparare a două
medii (variaţii necunoscute şi egale)
• Numărul de grade de Parametrul statistic al testului
libertate (df):
– df = n1 + n2 - 2 X1 − X 2
t=
• Pragul de semnificaţie:
1 1
α = 0,05. σ  + 
• Regiunea critică pentru  n1 n2 
testul bilateral:
(n1 − 1) s12 + (n2 − 1) s22
s=
(−∞;−t α ] ∪ [t α ;+∞) n1 + n2 − 2
n1 + n2 − 2; n1 + n2 − 2;
2 2
Testul Student (t) de comparare a mediilor a două
eşantioane perechi

• Scopul testului: compararea pentru o variabilă cantitativă


continuă media ei aritmetică pentru două eşantioane perechi
(observaţii ale aceleiaşi variabile cantitative realizate pe
elementele unui eşantion înainte şi după acţiunea unui factor ).

• Condiţii de aplicare: fiecărei observaţii din primul eşantion îi


corespunde o observaţie pereche din al doilea eşantion iar
diferenţele dintre valorile perechi sunt normal distribuite.
• Ipoteza nulă: Media diferenţei valorilor perechi din eşantioanele
perechi nu este semnificativ diferită de zero.

• Ipoteza alternativă pentru testul bilateral: Media diferenţei


valorilor perechi din eşantioanele perechi este semnificativ
diferită de zero.
Testul Student (t) de comparare a mediilor a două
eşantioane perechi
• Numărul de grade de
libertate (df): df = n – 1. • Parametrul statistic al
testului
• Pragul de semnificaţie
este: α = 0,05. t=
d (d + d 2 + ... + d n )
d= 1
s
• Regiunea critică: n
n
(−∞;− t α ] ∪ [t α ;+∞)
n −1; n −1;
2 2

• s = deviaţia standard a
diferenţelor
• n = volumul eşantionului

S-ar putea să vă placă și