Documente Academic
Documente Profesional
Documente Cultură
ANOVA
ANALIZA VARIANEI
I
S
T
O
R
I
C
TIPURI DE VARIABILE
Tipul de variabile indica ce estimatori se pot calcula si tipul de test ce
poate fi utilizat
Variabile continue
Intotdeauna numerice
Calculeaza
in
general
media, media si deviatia
standard
Variabile absolute
Informatia este grupata pe
categorii
Nu se poate calcula media
sau mediana, dar se poate
calcula riscul
TERMINOLOGIE
Variabila dependent (variabil rspuns )
variabila studiat
Variabila independent/explicativ (factor)
o variabil care influeneaz variabila dependent
Nivelul factorului (tratament) o valoare particular (sau o
grup de valori) a factorului
Variatia
explicata
(VE)
Variatia
reziduala
(VR)
VARIATIA TOTALA
Variata datorata
unui factor cauza
Variata datorata
factorilor aleatori
UNIFACTORIALA
TIPURI DE ANOVA
BIFACTORIALA
VARIATIA TOTALA
Variata datorata
factorului cauza A
Variata datorata
interactiunii dintre
factorii cauza
Variata datorata
factorilor aleatori
Variata datorata
factorului cauza B
ANOVA
CONDITII
NORMALITATE
INDEPENDENTA
HOMOSCEDASCITATE
Distributiile populatiilor
din care se extrag
esantioanele
sunt
normale
Esantioanele aleatoare
de
efective
sunt
prelevate din populatii
intr-o
maniera
independenta
ANOVA
Formularea problemei de rezolvat
UNIFACTORIALA
f(X)
H0: 1 = 2 = 3 = ... = p
1 = 2 = 3
f(X)
1 = 2 3
Populaia de nul
Populaia 1
(metoda 1)
eantion1
(1, s12)
Populaia 2
Populaia 3
(metoda 2)
(metoda 3)
eantion2
(2 s22)
eantion3
(3 , s32)
1= 2 = 3
m1
m2
m3
VARIANTA INTERGRUPE
4 Decizia statistic
dispersiaintergrup
F=
dispersiaintragrup
IPOTEZE STATISTICE
Sunt o presupunere cu privire la
legea de probabilitate a unei
populatii studiate sau cu privire la
un parametru al unei distributii
date.
Ho ipoteza nula
H1 ipoteza alternativa
Ho:=o
H1:o
Test bilateral
Ho:=o
H1:< o
Ho:=o
H1:>o
Test unilateral
Variatia
Grade de
libertate
Intergrupe
1=k-1
Intragrupe
2=n-k
TOTALA
SURSA
VARIATIEI
Estimatori ai
variantei
ESTIMATORI
n-1
VARIATIA
GRADE DE
LIBERTATE
VARIANTA INTRAGRUPE
Ce cauzeaza variatia din interiorul grupei?
Variatia intragrupe este cauzata de factori care nu pot fi
tinuti sub control
VARIANTA INTERGRUPE
Ce cauzeaza variatia dintre grupe?
Variatia intergrupe este influentata de efectul
(componenta explicata) pe care tratamentul il are asupra
variabilei dependente
Nu exista
diferente
semnificative
DISTRIBUTIA FISHER
asimetrie pozitiva
poate lua valori oricat de mari
dispersiaintergrup
F=
dispersiaintragrup
ANOVA BIFACTORIALA
Variatia
explicata
(VE)
Variatia
reziduala
(VR)
VARIATIA TOTALA
Variata datorata
unui factor cauza
Variata datorata
factorilor aleatori
UNIFACTORIALA
TIPURI DE ANOVA
BIFACTORIALA
VARIATIA TOTALA
Variata datorata
factorului cauza A
Variata datorata
interactiunii dintre
factorii cauza
Variata datorata
factorilor aleatori
Variata datorata
factorului cauza B
IPOTEZE
IPOTEZA 1
H0: 1 = 2 == i = ... = a
H1: cel putin o mediei este diferita
IPOTEZA 2
H0: 1 = 2 == j= ... = b
H1: cel putin o mediej este diferita
IPOTEZA 3
Variatia
Grade de
libertate
Factorul A
a-1
Factorul B
b-1
Interactiunea
AB
(a-1) (b-1)
Reziduu
ab(r-1)
Total
abr-1
Estimatori ai
variantei
EXEMPLU 1
Un cercetator doreste sa testeze eficienta a trei noi arome pentru a
dezvolta o noua bautura. Pentru aceasta selecteaza un numar de 10
degustatori. Fiecare degustator a primit un chestionar pentru a evalua
cat de placute au fost bauturile analizate. Scorurile primite au fost
urmatoarele:
Degustator
Proba X
Proba Y
Proba Z
13
12
17
19
19
15
11
16
14
20
12
10
15
14
16
18
10
18
18
11
12
14
10
16
11
11
Ipoteza nula
Nu
exista
diferente
semnificative intre aromele
folosite
la
fabricarea
bauturii.
Ipoteza alternativa
ANOVA pentru
=0.05
Grade de
Sursa de variatie Variatia libertate
Intergrupe
77.4
2
Intragrupe
415.4
27
Total
492.8
Varianta
38.7
15.38
F
2.511
P
0.099
F crit
3.3541
29
CONCLUZIE
EXEMPLU 2
Se realizeaza un studiu pentru a testa influenta pe care tipul de cheag si tipul
de enzima utilizata o au asupra aciditatii branzeturilor tip telemea. Pentru
aceasta s-au utilizat trei tipuri de cheag si patru tipuri de enzima. Valorile
obtinute pentru aciditate au fost urmatoarele:
Tip de cheag
tip de enzima
A1
A2
A3
B1
130
120
127
B2
150
140
160
B3
120
136
150
B4
115
120
110
Ipoteze statistice
Enzime
Cheag
Interactiune
H0: 1 = 2 = 3 =
ANOVA
Sursa de
variatie
Enzima
=0.05
Variatia
Grade de
libertate
Varianta
P-value
F crit
1989.667
663.2222
6.769492
0.023617
4.757063
Cheag
165.5
82.75
0.844627
0.475118
5.143253
Eroare
587.8333
97.97222
2743
11
Total
CONCLUZIE
Testul t ?
Testul Tukey
NU
Eroare de tip I
Testul Dunett
Testul Scheffe
SOLUTIA
Testul Bonferroni
Covarianta
n
cov ( x , y )
( x X )( y Y )
i 1
n 1
Interpretare
cov(X,Y) > 0
X si Y corelatie pozitiva
cov(X,Y) < 0
X si Y corelatie negativa
cov(X,Y) = 0
X si sunt independente
Coeficient de corelatie
cov ariance( x, y )
r
var x var y
Corelatia
Adimensional
Ia valori intre 1 si 1
Corelatie liniara
Relatii liniare
Relatii curbliniare
X
Y
X
Y
Corelatie liniara
puternica
slaba
X
Y
X
Y
Corelatie liniara
Nicio relatie
Y
X
Y
Regresia liniara
In corelatie cele doua variabile sunt tratate ca fiind
egale.
Variabila dependenta
Regresia
Ce inseamna Liniar?
Y=mX+B?
m
y = b0 + b1X
b0 (y interceptul)
b1 = panta
= y/ x
Ce este panta?
O panta de 2 inseamna ca fiecare unitate modificata
in x va modifica cu 2 unitati variabila y
Variabila dependenta
Zero
Variabila independenta (x)
Eroare previzionata:
Observata: y
Previzionata : y^
Zero
y=^
y+
Actuala = Explicata + Eroare
Variabila dependenta
Regresia
Regresia celor mai mici patrate selecteaza linia cu cea mai mica suma
totala a erorilor patratice previzionate
Aceasta valoare poarta denumirea de Suma patratelor erorii (Sum of
Squares of Error), sau SSE.
Variabila dependenta
Calcul SSR
Medie populatie : y
Matematic
SSR = ( ^y y ) 2 (masoara variatia explicata)
^)
SSE = ( y y
Coeficientul de corelatie
SSR
=
SST
SSR
SSR + SSE
R= 0 si 1
Cu cat R este mai mare cu atat modelul de regresie este mai precis.
Eroarea standard =
SSE
n-k
y
x