Sunteți pe pagina 1din 13

Curs 4 1

CURS IV






ANOVA












Curs 4 2
Metode statistice de analiza factorilor de variabilitate n experimentul biologic
(ANOVA)
S cercetm, n continuare, problema comparrii mai multor selecii provenite din
populaii pe care le tim ca fiind normal repartizate, de exemplu concentraiile plasmatice
realizate de tablete care conin diferii excipieni, dar care au aceeai substan activ, n
aceeai doz.
Vrem s verificm ipoteza compus c acestea provin de fapt din aceiai
populaie, avnd media i dispersia , deci c excipienii folosii nu influeneaz
semnificativ cedarea i absorbia substanei active:
= = =
3 2 1 0
: H
4

fa de ipoteza alternativ c cel puin dou medii nu sunt egale.
O variant de rezolvare a problemei ar fi compararea mediilor de selecie dou
cte dou prin metodele prezentate anterior.
Fie, de exemplu, relaia ntre mediile de selecie
4 3 2 1
x x x x . Este evident greit
a aplica o relaie de tranzitivitate i a spune c

2 1
= i
3 2
= i
4 3 2 1 4 3
= = = = .
Motivul acestei erori este legat n primul rnd de violarea unui principiu de baz
al teoriei seleciei: alegerea la ntmplare a seleciilor. Ori compararea loturilor dup
criteriul a posteriori, al mrimii mediilor de selecie este ntr-adevr o abatere de la
acest principiu.
Mai mult, nici mcar
4 1
= nu implic n acest caz
3 2
= din cauza
dependenei rezultatului testelor de relaiile ntre dispersiile populaiilor din care provin
seleciile.
Ca urmare, problema comparrii mai multor selecii (loturi) trebuie abordat prin
alte metode care s fac compararea tuturor seleciilor n acelasi timp. O astfel de
abordare se bazeaz pe compararea dispersiilor de selecie i se numete analiz
dispersional.
Analiza dispersional este o alt metod fundamental a statisticii care, n plus
fa de mijloacele de calcul a tendinei centrale a rezultatelor experimentelor repetate,
caracterizeaz mai ales variabilitatea acestora i factorii ce o determin.
Curs 4 3
Variabilitatea se poate datora existenei unor factori cu influene sistematice, a
unor factori aleatori de fluctuaie mai pronunat i, n final, factori locali, inevitabili,
determinnd o fluctuaie mai mic, definita ca fluctuaie experimental. Analiza
dispersional i propune separarea variabilitii totale n: variabilitatea datorat
factorilor sistematici, variabilitatea factorilor cu efecte aleatoare, plus o variabilitate
rezidual (diferena pn la variabilitatea total), care reprezint de fapt variabilitatea
experimental. Din aceste variabiliti se evalueaz dispersiile pariale corespunztoare
diferiilor factori, calculndu-se semnificaia rapoartelor lor prin aplicarea testului F.
Principial datele experimentale se grupeaz n funcie de diferite criterii i se
urmresc efectele asupra variabilitatii n funcie de aceste criterii, efecte care se cuantific
n raport cu variablitatea rezidual.
Analiza dispersional este cunoscut n aplicaiile de biofarmacie i
farmacocinetic sub denumirea de ANOVA (de la Analysis of Variance).
Analiza funcional unifactorial
Cea mai simpl analiz dispersional, numit analiz dispersional
unidimensional sau unifactorial (numit n literatura englez i one-way ANOVA)
sau experiment complet aleator, experiment cu grupuri paralele, corespunde testului t
de analiz a dou eantioane independente i compar dou sau mai multe grupuri.
De exemplu, n pacieni sunt grupai n k scheme de tratament. Putem s
comparm efectele a dou medicamente administrate la mai multe grupuri de voluntari, la
care se poate adauga i un grup placebo. Voluntarii se distribuie aleator n toate
grupurile. Dup msurarea unui parametru dat, se testeaz ipoteza nul c toate valorile
parametrului testat sunt egale n populaia corespunztoare diferitelor tratamente testate,
deci tratamentele sunt echivalente ntre ele.
In ipoteza c toate grupurile aparin aceleiai populaii, ideea testului este aceea
c variabilitatea n interiorul grupurilor trebuie s fie de acelai ordin cu variabilitatea
ntre mediile grupurilor.
n consecin, dispersia total, evaluat ca suma a ptratelor diferenelor ntre
valorile individuale i media ntregii populaii selectate SS
T
, este separat ntr-o parte
datorit variaiei ntre grupuri (within), sau variabilitii interioare i o parte datorit
variabilitii dintre (between) grupuri:
B W T
SS SS SS + = .
Curs 4 4
Dac numrul de grupuri este k i numrul de subieci n grupul i este
i
n aceast
egalitate poate fi explicitat dup cum urmeaz:
( )
2
1

=
=
n
i
n
j
ij T
i
X x SS (1)
unde = X media mare
N
x
n
X n
n
x
k
i
k
i i
i
i j
ij

= = =
1
1
i
i
X este media grupului i.
Fixnd grupul i putem scrie
( ) ( ) ( ) [ ] ( ) ( ) ( )( )

+ + = + =
=
i i i i i
n
j
i i ij
n
j
i
n
j
i ij
n
j
i i ij
n
j
ij
X X X x X X X x X X X x X x 2
2 2
1
2 2
Ultimul termen este egal cu
( ) ( )( ) 0 2 2 = =
|
|

\
|

i i i i i
n
j
i ij i
X n X n X X X x X X
i

i (1) devine
( ) ( )
W B
k
i
n
j
i ij
k
i
i i T
SS SS X x X X n SS
i
+ = + =

2 2
(2)
relaie cunoscut ca identitatea analizei dispersionale.
Considerm variabilele aleatoare:

1 1
2

N
SS
n
SS
s
T
i
T
T
,
2
1
B
B
SS
s
k
=

i
k N
SS
k n
SS
s
W
i
W
W

2
.
innd cont de regula general demonstrat mai nainte c,
( ) ( ) 1 1
2 2 2
n n
x
avem,
( )
( )
( )
( )
2
.
2
2
.
,
1 1
1
ij i
j
W ij i i i i
i j i i
i
x x
SS x x n n s
n

= = =



Deci,
( )
( ) ( ) ( ) k N n
n
SS
s
i
i
W
W
=

2 2 2 2 2
1
1


Curs 4 5
Analog, ( ) 1
2 2 2
k s
B
i deci raportul
2
2
1
E
B
W
W
SS
S
k
F
SS
S
N k

= =

este distribuit
( ) 1, F k N k .
Se observ c de fapt
( )
2
2
1 1
x
k
i
i i
B
s
k
X X n
k
SS
=

reprezint dispersia de selecie


ponderat a mediilor de grup fa de marea medie.
Abaterile mediilor grupurilor fa de media general depind att de hazardul
msuratorilor ct i de factori ce in de nssi natura grupurilor. Abaterile n interiorul
grupurilor sunt independente de aceti factori, deoarece fiecare valoare msurat este
raportat la nsi media grupului respectiv. Ele reprezint fluctuaii aleatoare.
Variabilitatea n interiorul grupurilor reprezint diferena ntre variabilitatea total
i variabilitatea ntre grupuri.
Pentru simplificarea calculelor n aplicaiile practice s-au introdus notaiile

= x x
k
i
n
j
ij
i
i

=
2 2
x x
k
i
n
j
ij
i
i formulele precedente se aduc la forme echivalente
ce presupun un volum mai mic de calcule, dup cum urmeaz:
( )
( ) ( )
( ) ( )
N
x
x
N
x
x
N
x
N
N
x
x X N x X x X x SS
ij
ij
ij ij
ij ij ij ij T
2
2
2
2
2
2 2
2 2 2
2
2 2



= =
= + = + = =

( )
( )

|
|

\
|
=
|
|

\
|

|
|

\
|
= =
= =
k
i
k
i
n
j
ij
k
i
i j
ij
k k
i
n
j
ij
i i B
n
x
n
x
n
x
n
x
X X n SS
i i
1
2
1
2
1
1
2
1 1
2
1
2

Exemplu: Compararea parametrilor farmacocinetici ai unui medicament dup
administrarea pe mai multe ci
S considerm constanta de eliminare (Tabelul 1) pentru un medicament
administrat ntr-o singur doz oral i i.v., iar i.m. timp de trei zile la diferite grupuri. Este
de ateptat ca eliminarea s fie independent de calea de administrare.
Curs 4 6
Vom compara constantele de eliminare dup administrarea oral i i.m.
Tabelul 1 Constanta de eliminare
1 4
min 10

e
k
Oral prima doza i.m. o doza i.m. a-5-doza
106 55 84
109 40 105
160 109 174
ij
x
375 204 363

= 942 x

2
ij
x
48717 16506 48357
113580
2
=

x
i
n
3 3 3 N=9
1
i
n
2 2 2
( ) 6 1 =
i
n
i
x
125 68 121
( )
( )

= = = = 14984
9
942
113580
2
2
2
2
N
x
x X x SS
ij T
( )
6074 98596 43923 13872 46875
9
942
3
363
3
204
3
375
2 2 2 2
1
2
1
2
1
1
2
= + +
= + + =
|
|

\
|

|
|

\
|
= =

=
=
k
i
i j
ij
k
i
n
j
ij
k
i
i i B
n
x
n
x
X X n SS
i
8910 6074 14984 = = =
B T W
SS SS SS
1485
6
8910
2
= =

=
k N
SS
s
W
W
, 3037
2
6074
1
2
= =

=
k
SS
s
B
B

( ) ( ) 07 , 2
1485
3037
6 , 2 , 1
2
2
= = = =

W
B
i
s
s
F k n k F valoare aflat n zona de acceptare
( 26 , 7
5 , 97 ; 6 , 2
= f si 92 , 10
99 ; 6 , 2
= f )
Aplicm n continuare acelai procedeu, introducnd i administrarea i.v.
Tabelul 2. Constanta de eliminare
1 4
min 10

e
k
i.m. o doza i.m. a-5-doza i.v.
106 55 84 63
109 40 105 70
160 109 174
ij
x
375 204 363 133
1075 =

2
ij
x
48717 16506 48357 8869
122449
2
=

x
i
n
3 3 3 2 N=11
1
i
n
2 2 2 1
( ) 7 1 =
i
n
i
x
125 68 121 66
Curs 4 7
( )
( )

= = = = 17392
11
1075
122449
2
2
2
2
N
x
x X x SS
ij T
( )
8428 105056 8844 43923 13872 46875
11
1075
2
133
3
363
3
204
3
375
2 2 2 2 2
1
2
1
2
1
1
2
= + + +
= + + + =
|
|

\
|

|
|

\
|
= =

=
=
k
i
i j
ij
k
i
n
j
ij
k
i
i i B
n
x
n
x
X X n SS
i
8964 8428 17392 = = =
B T W
SS SS SS
1280
7
8964
2
= =

=
k N
SS
s
W
W
, 2809
3
8428
1
2
= =

=
k
SS
s
B
B

( ) ( ) 19 , 2
1280
2809
6 , 2 , 1
2
2
= = = =

W
B
i
s
s
F k n k F valoare aflat n zona de acceptare
( 26 , 7
5 , 97 ; 6 , 2
= f i 92 , 10
99 ; 6 , 2
= f )

Condiii necesare pentru aplicarea analizei dispersionale.
a) Modelul variabilei aleatoare supus msuratorilor
Subliniem ceea ce am spus sau am presupus ca i condiii prealabile pentru a putea
aplica testul prezentat:
1) Pentru ca sumele calculate s fie repartizate
2
este obligatoriu ca seleciile s
provin din populaii repartizate normal. Dac acest lucru nu se ntmpl, rmne s fie
aplicate teste neparametrice, dup cum s-a prezentat anterior.
2) Analiza dispersional compar dispersia ntre grupuri cu dispersia total din
interiorul grupurilor pentru punerea n eviden a efectelor sistemice. Dispersiile n
populaiile din care provin grupurile s-au presupus egale. Pentru verificarea acestei
ipoteze se poate aplica testul F dispersiilor de selecie luate dou cte dou, sau se poate
aplica testul Bartlett.
3) Aditivitatea efectelor de intra i intervariabilitate, fenomen care depinde de natura
intim a fenomenului msurat.
Ca urmare rezultatul masuratorilor este o variabila aleatoare care se poate scrie:
ij i ij
x + + = cu ( ) 0 =
ij
E i ( )
2
e ij
D = unde este media general a populaiei,
Curs 4 8
( )
2

= D ,
i
este un factor fix ce variaz de la un grup la altul i este egal cu diferena
ntre i media grupului
i i
= + , iar
ij
este eroarea de msurare.
Media a n determinri n interiorul unui grup este
i i
ij
i i
n
X

+ + = + + =


deoarece
i
i sunt constante.
Media general va fi:

+ + = + + =

kn k
M
ij i
deoarece
i
variaz de
la un grup la altul iar este acelai pentru ntreaga populaie.
Mai departe
( ) ( )
ij i i ij i i ij i
x X = + + + + = i dispersia n interiorul
grupului va fi:
( ) ( )
1 1
2 2
2

=

i
i ij
i
i ij
i
n n
X x
s

iar media ei este
( )
( ) ( )
2
2 2
2
1 1
e
i
i ij
i
i ij
i
n
E
n
X x
E s E

=
|
|

\
|

=
|
|

\
|

=

(din faptul c aa cum s-a artat mai
nainte ( )
2 2
=
x
s E ,
2
x
s fiind un estimator nedeplasat al dispersiei).
Sumnd pentru toate grupurile se obine
( )
( )
( ) ( )
2
2
2 2 2
1
1
i i
i i
w e
n E S
n S
N k
E s E
N k N k N i

| |

= = = =
|
|

\


Deci
2
w
s este un estimator nedeplasat al lui
2
indiferent dac ipoteza
0
H este
adevrat sau nu.
Dac n n n n
k
= = = = ...
2 1

( )
(

\
|
+

= |

\
|

=

2
2
2
2
1 1
1
1

i i i i
B
B
k
n
X X n
k k
SS
s
( )
2
2
1
i
ns
k
n
i

i
( )
2
2 2 e
e
E ns n
n

= =
n ceea ce privete avem dou cazuri n funcie de cum a fost ales:
a) este o variabila aleatoare ( )
2
, 0

N , atunci
2 2 2
e B
s ns s + =

si ( )
2 2 2
e B
n s E

+ =
Curs 4 9
b)
i
factori fici , 0 = =
i i i
i 0 = , atunci
( )
2
2
2
1
0
e
i
B
s
k
n s +

=


i ( )
2
2
2
1
e
i
B
k
n s E

=


Deci ne referim la grupe oarecare, alese ntmplator din toate seleciile posibile din
ntreaga populaie, este o variabil aleatoare care aparine ( )
2
, 0

N , dar nu mai avem
0 =
i
pentru o grup de selecie oarecare. Este cazul cnd concluziile ce ne
intereseaz se refer, n principal, la ntreaga producie i nu la arjele cercetate.
Calcule similare arat c, atunci cnd n n n n
k
= = = = ...
2 1
,
2 2 2
e B
s ns s + =

i
( )
2 2 2

n s E
e B
+ = .
Ca urmare,
1
2

=
k
SS
s
B
B
este o estimatie nedeplasat a lui
2
e
numai atunci cnd
ipoteza
0
H este adevrat.
b) Clasificarea ierarhic n trepte. Scindarea dispersiei totale n dispersii
pariale ale treptelor.
Dac vom considera eroarea unei metode de analiz, este de ateptat ca aceasta s
fie egal cu suma erorilor pariale ale fazelor analizei.
Scindarea erorii totale n erorile pariale ale fazelor ofer posibilitatea punerii n
eviden a fazelor ce determin diminuarea reproductibilitii i a locului unde trebuie
intervenit pentru mbuntirea metodei.
Analiza dispersional multifactorial
n analiza anterioar criteriul de mprire n grupuri a fost unul singur calea de
administrare sau perioada de administrare. n continuare ne vom ocupa de cazul cnd
vrem s determinm ponderea a doi factori n acelai timp, folosind datele obinute ntr-
un singur experiment.
Pentru simplificarea scrierii prezentm pentru nceput cazul cnd testm k
medicamente continnd aceeai substan activ, administrate n n perioade diferite.
Se consider c efectele determinate de cei doi factori analizai sunt variabile
aleatoare independente. Avnd doi factori, se testeaz dou ipoteze de nul. Dac vom
aeza datele ntr-o matrice, liniile i coloanele corespunznd respectiv pentru valori date
ale primului i ale celui de al doilea factor, o prim ipotez se refer la egalitatea mediilor
Curs 4 10
liniilor, iar a doua la egalitatea mediilor coloanelor. Ipoteza alternativ presupune
existena unor diferene ntre linii sau respectiv ntre coloane.
Medicament

1 2 k
1 X
11
X
12
X
1k
. 1
x
2 X
21
X
22
X
2k
. 2
x
.
.
.

P
e
r
i
o
a
d
a

T
r
a
t
a
m
e
n
t

n X
n1
X
n2
x
nk
. n
x

1 .
x
2 .
x

k
x
.


unde
j
x
.
reprezint media valorilor din coloana i, iar
. i
x reprezint media valorilor din
linia j.
Modelul variabilei aleatoare.
Valorile experimentale le considerm ca rezultanta unor efecte aditive
corespunztor liniilor, coloanelor i erorilor ntmpltoare:

ij j i ij
x + + + =
unde
i
este partea lui
ij
x datorat liniei (schemei de administrare),
j
reprezint
contribuia coloanei (forma medicamentoas), iar
ij
este eroarea experimental.
Scindarea sumei ptratelor abaterilor.
Suma ptratelor abaterilor valorilor individuale fa de media generala M este:
( )

=
2
M x SS
ij T
, expresie ce se poate scrie i n forma:
( ) ( ) ( ) ( ) [ ]
( ) ( ) ( )
R C L C L C L
C L C L ij T
SS SS SS M x x x M x M x
M x x x M x M x M x SS
+ + = + + +
= + + + = =


2 2 2
2
2

Produsele mixte nu s-au mai trecut deoarece sunt nule.
Am scindat aadar variabilitatea total ntr-o component dat de linii, o
component dat de coloane i o component rezidual.
Corespunztor rezultatelor prezentate la analiza unifactorial, aici se poate arta
c:
( ) ( )

+ + =
2 2 2
1
j C i L L C T
n n n n SS E
( ) ( )

+ =
2 2
1
i L C L
n n SS E
Curs 4 11
( ) ( )

+ =
2 2
1
j C L C
n n SS E
( ) ( )( )
2
1 1 =
L C R
n n SS E
In cazul analizei bifactoriale apar dou ipoteze de nul pe care vrem s le testm:
( )
:
1
0
H toate formele de tratament (liniile) sunt echivalente, adica 0 =
i
;
( )
:
2
0
H toate medicamentele (coloanele) sunt echivalente, adica 0 =
j
.
Indiferent dac ipotezele sunt adevrate sau nu, ( )
2 2
=
R
s E .
Dac cele dou ipoteze sunt adevrate:
2 2
R e
s s = ,
2
C
s si
2
L
s sunt estimaiile
nedeplasate ale lui
2
.
Pentru a testa ipoteza
( ) 1
H este natural s considerm raportul
2
2
e
L
s
s
, iar pentru
ipoteza
( ) 2
H raportul
2
2
e
C
s
s
.
n cazul n care pentru fiecare combinaie de cauze se fac mai multe determinri
folosind mai muli voluntari, variabilitatea se poate scinda n patru componente:
R W C L T
SS SS SS SS SS + + + =
Exemplul 2: Variaia unui parametru farmacocinetic att n funcie de calea de
administrare ct i n funcie de numrul de administrare
Constanta de eliminare
1 4
min 10

e
k
Oral prima doza i.m. o doza i.m. a-5-doza i.v.
106 55 84 63
109 40 105 70
160 109 174
i
x
375 204 363 133
1075 =

2
i
x
48717 16506 48357 8869
122449
2
=

x
i
n
3 3 3 2 N=11
1
i
n
2 2 2 1
( ) 7 1 =
i
n
i
x
125 68 121 66
( )
17392
2
2
= =

N
x
x SS
T

Mai departe considerm dou grupuri: voluntarii crora medicamentul li s-a administrat o
dat i voluntarii care au primit 5 doze.
Curs 4 12
( )
( )
2235 105056
8
133 204 375
3
363
.
2 2
=
+ +
+ = doze nr SS
B

( ) 15157 2235 17392 . = = = doze nr SS SS SS
T W

1684
9
15157
= =
k N
SS
W
, 15157
1
15157
1
= =
k
SS
B

( ) ( ) 9
1684
15157
9 , 1 , 1 = = =

F k n k F
i
care aparine zonei de acceptare pentru riscul
01 , 0 ( ) 56 , 10
99 ; 9 , 1
= f dar nu aparine zonei de acceptare pentru 05 , 0 ( ) 12 , 5
95 ; 9 , 1
= f .
( )
( )
17392
11
1075
122449
2
2
2
2
= = = =


N
x
x x x SS
i T

Un alt factor care poate influena concentraia n snge este calea de administrare.
( ) ( )
8428 105056 8844 43923 13872 46875
11
1075
2
133
3
204
3
375
2 2 2 2
1
2
1
2
1
1
2
= + + +
= + + =
|
|

\
|

|
|

\
|
= =

=
=
k
i
i j
ij
k
i
n
j
ij
k
i
i i B
n
x
n
x
X x n cale SS
i
( )
( )
2235 105056
8
133 204 375
3
363
.
2 2
=
+ +
+ = doze nr SS
B

( ) ( ) 6792 2235 8428 17392 . = = = doze nr SS cale SS SS SS
B B T W

n acest fel am obinut urmtoarele rezultate:
Sursa de variaie GL SS Rapotul F
ntre cile de administrare 3 8428 f(3,6)=1,24
ntre numarul de doze 1 2235 f(1,6)=0,32
Variaia intragrupuri 6 6792
Variaia total 10 17392
i comparnd cu valorile din tabelele de repartiie Fisher se constat c poate fi acceptat
ipoteza c toate grupurile cercetate aparin aceleiai populaii statistice. Deci, nici calea
de administrare i nici numrul de doze nu influeneaz rata eliminrii.

Exemplul 3: Compararea biodisponibilitii unei substane active administrate n
preparate diferite i n perioade diferite de tratament.
Trei medicamente au fost administrate la nou subieci ntr-un studiu de
biodisponibilitate obinndu-se ariile de sub curb prezentate n tabelulde mai jos:
Curs 4 13
Perioada 1 2 3 Suma
Pacient 1 B=107 C=102 A=99 308
Pacient 2 A=100 C=106 B=89 295
Pacient 3 B=98 A=90 C=128 316
Pacient 4 C=71 B=54 A=63 188
Pacient 5 A=92 B=111 C=107 310
Pacient 6 C=113 A=115 B=91 319
Pacient 7 B=169 A=107 C=195 551
Pacient 8 C=88 B=95 A=77 260
Pacient 9 A=122 C=168 B=155 445
Suma pe perioad I: 160 II: 1028 III: 1004
2992 =

x
Suma pe
medicament
A: 945 B: 969 C: 1078
364720
2
=

x
Media pe
medicament
105 107,7 119,8
Separm acum varianta n patru componente: pacieni, perioad, medicament i
eroarea n interiorul tuturor grupurilor.
( )
1 , 33162
2
2
= =

N
x
x SS
T

( )
( ) ( )
1 , 29834
3
9
1
2 2
= =


= i
B
N
x linie
pacienti SS
( )
( ) ( )
5 , 1116
9
3
1
2 2
= =


= i
B
N
x medicament
medicament SS
( )
( )
3 , 264
9
2
2 2 2
=
+ +
=

N
x III II I
perioada SS
B

( ) ( ) ( ) 2 , 1947 = = perioada SS medicament SS pacienti SS SS SS
B B B T W

Pe aceasta cale obinem:
Sursa de variaie DF Suma ptratelor Media Raportul F
ntre pacieni 8 29834,1 3729,3
ntre medicamente 2 116,1 558,3 3,15
ntre perioade 2 264,3 132,1 0,75
Variaia intragrupuri 14 1947,2 177
Total 26 33162,1

Deoarece 74 , 3
99 , 0 ; 14 , 2
= f nu exist diferene semnificative ntre cele dou
medicamente dup administrare unic sau administrri multiple.

S-ar putea să vă placă și