Sunteți pe pagina 1din 226

CUPRINS

219
I. ELEMENTE DE TEORIA PROBABILITATILOR
1.1. Campuri de probabilitate 1
1.1.1. Corp borelian 2
1.1.2. Spatii masurabile 3
1.1.3. Probabilitate 4
1.1.4. Probabilitate conditionata 6
1.1.5. Formula probabilitatii cauzelor (Bayes) 7
1.2. Variabile aleatoare 10
1.2.1. Definitie 10
1.2.2. Observatie 10
1.2.3. Functia de repartitie 11
1.2.4. Densitatea de repartitie 12
1.2.5. Valoarea medie 12
1.2.6. Dispersia 14
1.2.7. Teorema lui Bernoulli 17
1.3. Distributii de probabilitate 18
1.3.1. Distributia normala 18
1.3.2. Distributia binomiala 20
1.3.3. Distributia Poisson 20
1.3.4. Aproximarea normala a distributiei binomiale 21
1.3.5. Repartitia
2
Helmert - Pearson 22
1.3.6. Repartitia STUDENT 23
1.3.7. Repartiia F (Behrens - Fisher Snedecor) sau distribuia raportului a dou
dispersii
24

II. STATISTICA MATEMATICA SI BIOSTATISTICA
2.1. Teorema limita centrala (A.M.Leapunov) 25
2.2. Teorema lui Cebev 26
2.3. Teoria selectiei 27
2.3.1. Populatii si selectii. Inferenta statistica 27
2.3.2. Media de selectie 30
2.3.3. Dispersia de selectie 30
2.3.4. Covarianta de selectie 31
2.3.5. Coeficientul de corelatie de selectie 31
2.4. Estimatii 32
2.4.1. Estimarea intervalului de incredere pentru medii 36
2.4.2. Estimarea intervalului de ncredere 1 pentru diferenei a dou medii 38
2.4.3. Estimarea intervalelor de ncredere pentru dispersie 40
2.4.4. Estimarea intervalului de ncredere raportul a dou dispersii 41
2.4.5. Aplicaie: Utilizarea intervalelor de ncredere n studiile de comparare a
biodisponibilitii medicamentelor
1

41
2.5. Verificarea ipotezelor statistice 43
2.5.1. Ipoteze asupra mediei 44
2.5.2. Ipoteze asupra diferenelor a dou medii 45
2.5.3. Estimarea dispersiei 47
2.5.3.1. Estimarea raportului a doua dispersii 47
CUPRINS

220
2.5.3.2. Compararea mai multor dispersii: testul Bartlett, testul rapid Cochran, testul
Hartley
48
2.6. Teste neparametrice 52
2.6.1. Media si dispersia unui esantion dintr-o populatie finita 52
2.6.2. Testul de rang Wilcoxon 55
2.6.3. Ajustarea pentru valori egale in testul Wilcoxon 58
2.6.4. Teste referitoare la perechi de observatii 58
Testul semnelor 58
Testul Wilcoxon pentru observatii perechi 60
Testul H 62
2.6.5. Alegerea intre testele laplaciene si testele neparametrice 64
2.6.6. Analiza de variatie pe doua cai a rangurilor. Testul Friedman 65
2.7. Regresia liniara 66
2.7.1. Estimatii si ipoteze asupra coeficientului b 70
2.7.2. Estimarea dispersiei dreptei de regresie 72
2.7.3. Regresia ponderata 74
2.7.4. Analiza reziduala 75
2.7.5. Stabilirea dreptei de regresie 76
2.8. Metode statistice de analiza factorilor de variabilitate in experimentul biologic
(ANOVA)
78
2.8.1. Analiza functionala unifactoriala 79
2.8.1.1. Compararea parametrilor farmacocinetici ai unui medicament dupa
administrarea pe mai multe cai
81
2.8.1.2. Conditii necesare pentru aplicarea analizei dispersionale 84
2.8.2. Analiza dispersionala multifactoriala 86
2.8.2.1. Modelul variabilei aleatoare 86
2.8.2.2. Scindarea sumei patratelor abaterilor 87
2.8.2.3. Variatia unui parametru farmacocinetic atat in functie de calea de
administrare cat si in functie de numarul de administrari
88
2.8.2.4. Compararea biodisponibilitatii unei substante active administrate in preparate
diferite si in perioade diferite de antrenament
89
2.9. Inferenta statistica pentru efecte intr-un experiment standard cross over 91
2.9.1. Modelul statistic 91
2.9.2. Testarea efectului secventei de administrare 92
2.9.3. Efectul direct al medicamentului 94
2.9.4. Efectul perioadei 98
2.10. Analiza dispersionala bifactoriala cu interactiune intre factori 100
2.10.1. Metoda intervalului de incredere 103
2.10.2. Metod celui mai mic interval 104
2.10.3. Metoda testarii ipotezei despre intervale 106
2.10.4. Metoda celor doua testari unilaterale Schuirmann 107
2.10.5. Metoda Anderson si Hauck 107
2.11. Legatura intre ANOVA si testul t inbioechivalenta. Testarea bioechivalentei 110
2.11.1. Modelul statistic general 110
2.11.2. Analiza dispersionala in cazul unui studiu privind bioechivalenta a doua
medicamente, incrucisat, cu 2 perioade si 2 secvente
113
CUPRINS

221
2.11.3. Calculul variabilitatii interindividuale 116
2.11.4. Calculul efectelor de secventa 117
2.11.5. Analiza efectelor fixe cu ajutorul dispersiilor 118
2.11.6. Testarea efectelor folosind ANOVA 120
2.11.6.1. Testarea efectului secventei de administrare folosind metoda ANOVA 120
2.11.6.2. Testarea efectului perioadei folosind ANOVA 121
2.11.7. Compararea intre modelul statistic general si modelul statistic specific cross
over
122
2.11.8. Concluzii generale 123
2.12. Teste statistice de discordanta 124
2.12.1. Constructia testelor de discordanta 126
2.12.2. Criteriul Dixon de respingere a outliers 132
2.12.3. Valori discordante fata de corelatia liniara 133
2.12.3.1. Drepte si puncte discordante 136
2.12.3.2. Voluntari discordanti in studii de bioechivalenta 138
2.13. Puterea testului. Calculul numarului de voluntari 143
2.13.1. Calculul esantionului minim in functie de o precizie fixata 143
2.13.2. Calculul numarului de voluntari in functie de probabilitatile erorilor de tipul I
si tipul II fixate in prealabil
144
2.13.3. Testarea ipotezei privind media unui lot 144
2.13.4. Testarea pentru compararea mediilor a doua populatii 147
2.13.5. Marimea esantionului pentru comparari de mai multe medii prin analiza
dispersionala (ANOVA)
150
2.13.6. Modelul cross over. Ipoteze punctuale privind egalitati 151
2.14. Planificarea experimentului. Patratul latin





















CUPRINS

222









I. ELEMENTE DE TEORIA PROBABILITATILOR
CAMPURI DE PROBABILITATE

1
1.1. CMPURI DE PROBABILITATE

Teoria matematic a probabilitilor pornete de la faptul c fiecrui
rezultat posibil al unui experiment aleator, rezultat pe care l vom denumi
eveniment, i se asociaz o valoare numeric, numit probabilitatea
evenimentului respectiv. Aceast valoare este o caracteristic obiectiv a
evenimentului n condiiile experimentului dat.
S efectum, de exemplu, un experiment de m ori. Dac n cele m
experiene un eveniment A s-a produs de k ori, atunci 0 k m, de unde
rezult pentru frecvena relativ:
0
m
k
1,
adic frecvena relativ a unui eveniment este ntotdeauna un numr cuprins
ntre 0 i 1.
innd cont c frecvena relativ oscileaz n jurul probabilitii
evenimentului considerat i c probabilitate este acea caracteristic a
evenimentului care ne indic n ce proporii se produce evenimentul n cazul
repetrii experimentului de un numr foarte mare de ori, rezult c i
probalitatea este tot un numr ntre 0 i 1.
Din definiia probabilitii ca generalizare a conceptului de frecven
relativ, rezult c probabilitatea unui eveniment imposibil este 0, iar
probabilitatea unui eveniment sigur este 1.
Evenimentele pot fi simple, n sensul c nu se pot descompune mai
departe, sau compuse din alte evenimente ce se petrec simultan. n acest
context putem considera dou operaii ntre evenimente.
Scriem AB i nelegem prin aceasta un eveniment care const n
producerea evenimentelor A i B, simultan. Scriem AB pentru cazul cnd
se produce cel puin unul din cele dou evenimente.
Fiind date dou rezultate A i B ale unui experiment efectuat de n
ori, s presupunem c A s-a obinut de
1
k ori i B de
2
k ori. Evenimentul
AB, deci obinerea unui eveniment din cele dou rezultate, s-a obinut ca
atare, de
n
k k 2 1+
=
n
k1
+
n
k 2
ori, ceea ce sugereaz o regul de tipul

Probabilitate (AB) = Probabilitate (A) + Probabilitate (B)

n cele ce urmeaz vom introduce o prezentare axiomatic a
conceptului de probabilitate, dup Kolmogorov
1
.


I. ELEMENTE DE TEORIA PROBABILITATILOR
CAMPURI DE PROBABILITATE

2
1.1.1. Corp borelian
1.1.1.1. Definiie:
Fie E o mulime i K o familie nevid de pri ale lui E, K (E) cu
proprietile:
1. A K CA K
2. ( )
N i
i A K
U

1
i A K
3. E K
Deci, este nchis la operaiile de complementare i reuniune.
Se spune, n acest caz, c familia K, mpreun cu operaiile
menionate, formeaz un corp bolerian. Denumirea de borelian vine de la
matematicianul Emil Borel, unul dintre fondatorii teoriei probabilitilor.

1.1.1.2. Consecin:
Un corp borelian este o familie nchis fa de operaiunea de
intersecie, indiferent de numrul elementelor sale pe care le intersectm:
( )
N i
i A K
i
A I K
Demonstraia se face imediat folosind faptul c
i i
i i
A C A
| |
=
|
\
I U
i
proprietile 1 i 2.

1.1.1.3. Propoziie:
Fiind dat o familie de corpuri boreliene ( ) I i i K , intersecia lor este
tot un corp borelian.
Demonstratia se face imediat, folosind proprietile corpului borelian i ale
operaiilor de intersecie, reuniune i complementare.

1.1.1.4. Definiie:
Fie H o familie oarecare de pri ale unei mulimi E . H poate fi
completat la un corp borelian, numit corpul generat de , dac i se adaug
E i toate mulimile ce se formeaz prin reuniune, intersecie i
complementare pornind de la elementele H .
Dac lum pe dreapt, mulimea intervalelor deschise de forma
( ) , a , a R , corpul borelian generat se numete simplu borelianul pe
dreapta i constituie baza teoriei probabilitilor, aa cum va fi ea abordat
n prezenta lucrare. Deoarece orice interval nchis se poate obine prin
operaiile meionate din intervale deschise i invers, orice interval deschis
I. ELEMENTE DE TEORIA PROBABILITATILOR
CAMPURI DE PROBABILITATE

3
poate fi generat pornind de la intervale nchise, borelianul pe dreapta este n
acelai timp generat de mulimea intervalelor nchise.
ntr-adevr, se poate scrie:
[ ] b a, =
I

=
|

\
|
+
1
1
,
1
n
n
b
n
a i ( )
U

= (

+ =
1
1
,
1
,
n
n
b
n
a b a

1.1.1.5. Definiie:
O familie ( ) I i i A se numete desfacere a lui E dac:
1. I este cel mult numrabil;
2. = j i A A j i,
3. E Ai =



























I. ELEMENTE DE TEORIA PROBABILITATILOR
CAMPURI DE PROBABILITATE

4
1.1.2. Spaii msurabile

1.1.2.1.1. Definiie
O mulime E mpreun cu un corp borelian K formeaz un spaiu
msurabil (E,K). Elementele lui K se numesc mulimi msurabile.

1.1.2.2. Definiie
Fiind date (E,K) si (F,L) spaii msurabile, o funcie f: (E,K) (F,L)
se numete funcie msurabil dac ndeplinete condiia:
A, ALf
-1
(A)K sau, altfel spus: f
-1
(L) K

1.1.2.3. Proprieti
a) Dac f i g sunt msurabile, atunci f o g, f +g i f*g sunt msurabile.
b) Dac f este continu, atunci f este borelian msurabil.

1.1.2.4. Observaie
Se poate face un paralelism ntre spaiile topologice i spaiile
msurabile, ntre funciile continue i funciile msurabile. Astfel, o funcie
este continu dac preimaginea oricrei mulimi deschise este o mulime
deschis iar msurabil este atunci cnd preimaginea oricrei mulimi
msurabile este msurabil. Deasemenea, dac f i g sunt dou funcii
continue, atunci f + g i f*g sunt continue.

1.1.2.5. Definiie
Se numete msur orice funcie pozitiv definit pe corpul mulimilor
msurabile, : KR
+
, aditiv pe orice familie ( ) I i i A numrabil de
mulimi msurabile disjuncte:
( ) ( )


= =
1 1
, , n n m n A A A A m n
U


1.1.2.6. Consecine
a) ( ) 0 =
ntr-adevr, dac lum A A = 1 , = 2 A
( ) ( ) ( ) ( ) 0 2 = = =
b) Fie un ir de mulimi ... 2 1 A A i fie n A A U = , atunci ( ) ( ) A An
Demonstraie:
Fie 1 + = n n A B \ n A . Mulimile n B sunt disjuncte i n n B B B A U U U ... 2 1 = .
I. ELEMENTE DE TEORIA PROBABILITATILOR
CAMPURI DE PROBABILITATE

5
Din aditivitatea lui rezult ( ) ( ) n
n
i
i
n
i
i n s B B A = =
|
|

\
|
=

= = 1 1

U

( ) ( ) ( ) A A B s s
n
n
i
i n = = =

=

=
U U
1 1

n A A U = i ( ) i A < ( ) n A < ( ) A
Altfel, { } ,... 1 , + = n n An ,
I
= n A dar ( ) = n A

1.1.2.7. Exemple
a) Fie definit dup cum urmeaz:
( ) = A dac Aeste infinit i
( ) = A numrul elementelor din A, dac A este finit.
Aceast msur se numete n mod natural msura de numrare.
b) Fie un punct exterior E x
0
fixat. Definim:
( ) 1
0
= A
x
dac A x 0 i
( ) A
x
0
= 0 dac 0 x A
Msura este utilizat n mecanica cuantic i se numete msura lui Dirac.




















I. ELEMENTE DE TEORIA PROBABILITATILOR
CAMPURI DE PROBABILITATE

6
1.1.3. Probabilitate
Vom defini probabilitatea ca o msur particular.

1.1.3.1. Definiie:
Fiind dat un spaiu msurbil ( ) K E, . O funcie P: [ ] 1 , 0 K cu
proprietile:
a) P msur i
b) P( ) E =1
se numete probabilitate.
Deci, probabilitatea ar fi o msur normat.

1.1.3.2. Proprieti:
Pe baza proprietilor msurii i a faptului c P( ) E =1, se pot
demonstra cu uurin urmtoarele proprieti:
1. ( ) ( ) ( ) B P A P B A P B A = /
2. ( ) n , ( ) = + n n n A P A A U 1 ( ) n n A P lim
3. ( ) n , ( ) ( ) n n n n n A P A P A A + = lim 1 I
4. ( ) ( ) ( ) ( ) B A P B P A P B A P I U + =
5. ( ) ( )

n n A P A P
U
, numit subaditivitate numrabil
6. ( ) 0 = P
7. ( ) ( ) A P CA P =1
n contextul teoriei probabilitilor, mulimile msurabile devin
evenimente, spaiul msurabil devine cmp de evenimente, iar E devine
evenimentul total.

1.1.3.3. Definiie:
Un cmp de evenimente ( ) K E, nzestrat cu probabilitatea P, se
numete cmp de probabilitate.

1.1.3.4. Definiie:
Un eveniment care nu mai poate fi inclus n alt eveniment
B A K B K A , , sau = B AI
se numete eveniment elementar sau atom.



I. ELEMENTE DE TEORIA PROBABILITATILOR
CAMPURI DE PROBABILITATE

7
1.1.3.5. Observaii
Prezentarea axiomelor teoriei probabilitilor n contexul mai larg al
teoriei msurii, dincolo de formalismul simplu i rigoare, ofer i avantajul
unor interpretri fenomenologice i picturale pentru unele formule.
Astfel, dac probabilitatea este o msur, la fel ca aria pentru figurile plane,
formula:
( ) ( ) ( ) ( ) B A P B P A P B A P I U + =
se poate citi ca:
aria ( ) B AU = aria ( ) A + aria ( ) B - aria ( ) B AI
ceea ce pare ca evident.

Fig. 1.
A AB B
Definiia clasic elementar a probabilitii deriv n mod natural din
noiunea de frecven, despre care am vorbit mai sus.
Dac un eveniment A se poate realiza n m feluri diferite dintr-un
numr total n de evoluii posibile ( )
n j
j
e
, 1 =
, egal probabile, atunci :
a) ( )
n j
e P
1
= i
b) ( )
n
m
A P =



1.1.3.5.Exemplu

Exemplul clasic de cmp de probabilitate finit l constituie
evenimentele ce pot aprea atunci cnd, dintr-o urn n care se afl bile albe
i negre se extrag n bile. Dac proporia bilelor albe n urn este p, i deci a
celor negre este q = 1 - p, probabilitatea evenimentului A, ca din n bile
extrase, k s fie albe, conform definiiei clasice definite mai sus, se
calculeaz imediat i este:
( ) q p
C
A P
k n k
k
n

=
De exemplu, evenimentul ca din trei bile extrase, dou s fie albe - a
- i una s fie neagr - n- se poate descompune n felul urmtor :
A = (a a n) U (a n a) U (n a a)
I. ELEMENTE DE TEORIA PROBABILITATILOR
CAMPURI DE PROBABILITATE

8
i
P(A) = P(a a n) + P(a n a) + P(n a a) = p
2
q + p
2
q + p
2
q = 3 p
2
q =
2
3
C p
2
q
3-2

1.1.4. Probabilitate condiionat

Fie B un eveniment a crei probabilitate este diferit de 0.
Probabilitatea unui eveniment A, reprezint proporia n care ne ateptm s
se realizeze A n cadrul tuturor evenimentelor cmpului de probabilitate la
care aparine A
Probabilitatea lui A se mai poate analiza ns i n contextul n care
tim c s-a produs anterior evenimentul B. Probabilitatea evenimentului A
condiionat de B se noteaz, n acest caz, cu: P(A/B) sau P
B
(A).
Dac s-a constatat experimental o frecven de apariie k
A
i,
respectiv k
B
, pentru A i B, frecvena relativ de apariie a lui A, cnd deja
a aprut B, va fi:
( )
( )
B P
B A P
n
k
n
k
k
k
B
AB
B
AB
I
=
n acest context apare natural definiia probabilitii evenimentului
A, condiionat de B, prin formula:
( )
( )
( )
B P
B A P
A P
B
I
=
Un caz special l constituie acela n care probabilitatea de apariie a
evenimentului A este aceiai, indiferent dac s-a produs sau nu evenimentul
B:
P(A) = P
B
(A)
Spunem, n acest caz, c evenimentele A i B sunt evenimente
independente.
Observm c, rescriind formula anterioar
( )
( )
( )
B P
B A P
A PB
I
= ( ) ( ) ( ) ( ) ( ) B P A P B P A P B A P B * * = = I
se poate lua ca definiie c dou evenimente sunt independente atunci cnd:
( ) ( ) ( ) B P A P B A P * = I




I. ELEMENTE DE TEORIA PROBABILITATILOR
CAMPURI DE PROBABILITATE

9
1.1.5. Formula probabilitii cauzelor (Bayes)

Fie A
1
, A
2
,, A
n
o desfacere a lui E pe care, n contextul teoriei
probabilitilor, o numim sistem complet de evenimente. Ea reprezint n
acelai timp o desfacere pentru E ct i pentru orice eveniment E X .

U
j A E =
( )
U
I X A X i =
Dat fiind c evenimentele X Ai I sunt disjuncte,
avem ( ) ( )

= X A P X P i I .
S presupunem c ( ) 0 , i A P i . n aceste condiii avem urmtoarea
teorem:


1.1.5.1. Teorema probabilitii cauzelor

Probabilitatea producerii oricrui eveniment X, este egal cu suma
probabilitilor de producere a lui X, condiionate de evenimentele complete
ale sistemului ( ) n i i A , 1 = i
( )
( ) ( )
( ) ( )

=
X P A P
X P A P
A P
i
j
A i
A j
j X
Demonstraie:

Din definiie avem P
X
(A
j
) =
( )
( )
X P
A X P j I

deci, P
X
(A
j
) =
( )
( )

i
i
j
X A P
A X P
I
I
=
( )
( )
( )
( )
( )
( )

i
i
i
i
j
j
j
A P
A P
X A P
A P
A P
A X P
I
I
=
( ) ( )
( ) ( )

X P A P
X P A P
I
j
A i
A j


P
X
(A
j
) poate fi interpretat ca fiind probabilitatea ca X s aib cauza
A
j
. n acest caz, formula calculeaz probabilitatea lui X n funcie de
probabilitile cauzelor care ar fi putut determina evenimentul X.
Probabilitile P(A
k
) se numesc apriorice, pentru c ele se cunosc nainte de
eveniment. Probabilitile P
X
(A
j
) sunt probabilitile acelorai cauze, dar
I. ELEMENTE DE TEORIA PROBABILITATILOR
CAMPURI DE PROBABILITATE

10
dup ce s-a ntmplat evenimentul X, i se numesc din acest motiv,
probabiliti aposteriorice.
Exemplu, cnd un pacient intoxicat este adus la urgen el prezint
anumite simptome i medicul, folosind experiena sa, rezultatele
determinrilor n snge i un sistem computerizat elaboreaz o list cu
probabilitile ca intoxicaia s se fi fcut cu o anumit substan.
n fizica statistic parametrii termodinamici sau cuantici ai unui
sistem rezult din nsumarea unui numr foarte mare de evenimente.
Probabilitatea de trecere de la o stare iniial la o stare final este dat de
suma probabilitilor de trecere pe anumite ci A
i
ponderate fiecare cu
probabilitatea, sau altfel spus ponderea lor, p(A
i
). Deoarece numrul cilor
poate fi de puterea continuului, n locul sumelor apar integrale.
Sau, dac s-ar produce o crim, aposteriori, ne punem problema
ierarhizrii suspiciunilor privind potenialii criminali.
Problema nu este de loc teoretic dac suntem de exemplu o
societate de asigurri sau dac testul este un test de malignitate.
Bayer a fost un episcop care s-a preocupat de cauzele evenimentelor
din lumea aceasta i legtura lor cu cauza final Dumnezeu.
Formula probabilitii cauzelor ne arat cum se transform
probabilitile apriorice n probabiliti aposteriorice, dup apariia
evenimentului X.
De exemplu, tiind c un medicament se absoarbe n, i se elimin
din snge pe mai mult ci, cu diferite probabiliti date de considerente
fizico-chimice i fiziologice, n funcie de rezultatul unor determinri a
concentraiei ale acestora n sngele unui pacient, ne putem pune problema
stabilirii ponderilor efective ale acestor ci, n scopul individualizrii
tratamentului.


1.1.5.2. Observaie:

Putem deasemenea s considerm cazul particular al desfacerii
evenimentului total n dou evenimente A i complementul su CA.
Formula lui Bayes devine n acest caz:
P
X
(A) =
( ) ( )
( ) ( ) ( ) ( ) CA P X P A P X P
A P X P
CA A
A
+



I. ELEMENTE DE TEORIA PROBABILITATILOR
CAMPURI DE PROBABILITATE

11
1.1.5.3. Aplicaie:

Dac, de exemplu, P(B) este proporia (probabilitatea) unei boli n
populaie i cunoscnd proporia n care un test diagnostic este pozitiv la
bolnavi P
B
(+) i la sntoi P
NB
(+) putem calcula probabilitatea ca un
pacient la care rezultatul testului este pozitiv s fie bolnav:
P
+
(B)=
( (( ( ) )) ) ( (( ( ) )) )
( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) ) NB P P B P P
B P P
NB B
B
+ ++ + + ++ + + ++ +
+ ++ +

unde:
P
B
(+) este probabilitatea ca un bolnav s fie catalogat pozitiv de
ctre test i se numete sensibilitatea testului.
P
NB
(-) este probabilitatea ca un sntos s fie catalogat negativ de
ctre test i se numete specificitatea testului.
Problema devine teribil de important dac, de exemplu, este vorba
de un test de depistare a cancerului.
















1
Andrei Nicolaevici Kolmogorov (1903-1987), fost profesor la
Universitatea din Moscova, a avut contribuii deosebite n analiza
matematic, analiza funcional i teoria probabilitilor. Cartea sa
Grundbegriffe der Wahrscheinlichketetsrechnung, Berlin, 1933, a
nsemnat o revoluie n teoria probabilitilor, artnd c, formal, aceast
teorie se poate trata ca un caz particular de teorie a integralei (sau teoria
msurii).






































I. ELEMENTE DE TEORIA PROBABILITATILOR
VARIABILE ALEATOARE

13
1.2.VARIABILE ALEATOARE

1.2.1. Definiii:

a) Se numete variabil aleatoare (ntmpltoare sau statistic) o
funcie real f definit pe mulimea K a evenimentelor, cu proprietatea c,
oricare ar fi numrul real a, mulimea x K pentru care ( ) f x a este un
eveniment din K .
n termeni de teoria msurii, o variabil aleatoare este o funcie
( ) ( ) : , , , f E K P R B , msurabil.
Practic vorbind avem definit probabilitatea ca variabila s aib valori
mai mici dect orice numr dat a.

b) O variabil aleatoare se numete variabil aleatoare simpl dac ia
un numr finit de valori:
: f E R , ( ) f E finit i ( ) ( ) ( ) ( )
1
i i i
P f x x P f x p

= = =

c) Vom lucra, n cele ce urmeaz, ca regul, cu variabile aleatoare
independente, adic variabile ce iau valori independente una de cealalt:
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
j i j i
y y g P x x f P y y g x x f P = = = = = * ,
j i
y x ,

















I. ELEMENTE DE TEORIA PROBABILITATILOR
VARIABILE ALEATOARE

14
1.2.2. Operatii cu variabile aleatoare:
Se poate verifica uor c variabilele aleatoare formeaz o algebr, adic
suma, i produsul a dou variabile aleatoare este tot o variabil aleatoare;
mai mult compunerea a dou variabile aleatoare este tot o variabil
aleatoare.
Trebuie n acest context s fim ateni la independena sau
nonindependena variabilelor aleatoare implicate n operaie.
De exemplu putem citi X+X unde X este o variabil aleatoare n dou
feluri. Putem, de exemplu, s considerm un experiment repetat de dou ori
rezultatele fiind independente

4
1
2
1
4 3
4
1
2
2
1
2
1
2 1
2
1
2
1
2 1
,

n timp ce, dac considerm c X i X nu iau valori independent, atunci
X+X =2X =

2
1
2
1
4 2

Putem reprezenta grafic aceste probabiliti.
De exemplu, X=

4
1
2
1
3 2
4
1
1
apare sub forma

p
i

1/2
1/4
0 1 2 3 x
i

Dar putem reprezenta curba cumulativ a distribuiei
P(x<x
i
)
1
3/4
1/2
1/4
0 1 2 3 x
i

Fig. 2

I. ELEMENTE DE TEORIA PROBABILITATILOR
VARIABILE ALEATOARE

15
1.2.3. Functia de repartitie
Funcia de repartiie asociat lui f este funcia F(x), F:R [ ] 1 , 0
definit de formula:
F(x) = P( f < x ) = P( f
-1
(- ,x) )
Importana acestei funcii const n faptul c, dac F(x) este dat se
poate determina probabilitatea ca f s ia valori ntr-un interval I R, oricare
ar fi acel interval.
n cazul n care f ia un numr finit de valori, de exemplu { } 3 , 2 , 1 , cnd
cunoatem ( ) 3 , 2 , 1 = k k f P , cunoatem practic i ( ) 3 , 2 , 1 = = k k f P .
ntr-adevr, ( ) ( ) 2 1 = = f P f P
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 2 1 * 3 2 * 3 2 3 2 = = = = f P f P f P f P f f P f P
( ) ( ) ( ) 2 1 1 3 = = = = f P f P f P
Ca regul general: ( ) ( ) ( ) k f P k f P k f P + = = 1 1
Deci am determinat o distribuie de probabilitate care poate fi
reprezentat sub forma unei matrici:
( )

= =
3 2 1
3 2 1
p p p
k f P

1.2.3.1.Proprieti
Funcia de repartiie are urmtoarele proprieti:
a) a b F(a) F(b)
b) a lim F(a) = 0
c) + a lim F(a) = 1
d) F este continu la stnga.

1.2.3.2. Dac F este continu spunem c f este variabil aleatoare
continu. n acest caz, probabilitatea ca f s ia orice valoare particular este
0.
, P( f(x) = ) = 0

1.2.3.3. Exemplu :
Dac ne punem problema probabilitii ca temperatura n camer s fie t
=20,347562 aceasta ste evident zero i de fapt problema nici nu are sens n
msura n care temperatura este o valoare medie n jurul creia avem
fluctuaii continue. Dac ne punem problema ca temperatura s fie ntr-un
anumit interval noiunea de funcie de repartiie capt un coninut concret.
I. ELEMENTE DE TEORIA PROBABILITATILOR
VARIABILE ALEATOARE

16
1.2.4. Densitatea de repartitie
Fie F(x) funcia de repartiie a unei variabile aleatoare . Dac exist o
funcie (x), integrabil pe intervalul ( ) + , , cu proprietatea c pentru
orice xR este verificat egalitatea:
(x) =
x
F


atunci, (x) se numete densitatea de repartiie sau densitatea de
probabilitate a variabilei aleatoare ,
n acest caz, probabilitatea ca variabila aleatoare s ia valori ntr-un
interval (- ,a) este dat de formula:
P((x) < a) = F(a) = ( )dt t
a



i respectiv:
P(b (x) < a) = F(a)-F(b) = ( )dt t
a


- ( )dt t
b


= ( )dt t
a
b



1.2.5. Valoarea medie
Se numete valoare medie (sau speran matematic) a unei valori
aleatoare f, numrul
M(f) =

i ip x , atunci cnd este o variabil aleatoare simpl i,


respectiv
M(f) = ( )dx x x

+

, atunci cnd este o variabil aleatoare continu, cu
densitatea de probabilitate .
n literatur, operatorul de medie se mai noteaz i cu E, de la
expectation speran n englez.
n cazul variabilelor simple se observ c valoarea medie a variabilei f
este media ponderat a valorilor sale x
i
, cu ponderile p
i
, care reprezint
frecvenele de apariie ale valorilor respective.

1.2.5.1.Proprieti ale mediei:
Dac f i g sunt independente, atunci avem:
a) M(af) = aM(f)
b) M(f+g) = M(f) + M(g)
c) M(fg) = M(f)M(g)
Vom schia o demonstraie a proprietii b):
I. ELEMENTE DE TEORIA PROBABILITATILOR
VARIABILE ALEATOARE

17
M(f+g) = ( )( ) l k
l k
l k x x G F P +

,
I = ( ) ( )

k
k
l
l k x G F P I +
( ) ( )

l
l
k
l k x G F P I
Dar, pe de alt parte, folosind proprietile interseciilor i
reuniunilor de mulimi, respectiv distributivitatea interseciei fa de
reuniune i a interseciei fa de reuniune, i faptul c
U
l
l G = E avem
( )

l
l k G F P I = P(F
k ( )
U
I
l
l G
) = P(F
k
)
i similar,
( )

k
l k G F P I = P(G
l
).
Deci,
M(f+g) = ( ) k
k
k x F P

+ ( ) l
l
l x G P

= M(f) + M(g)


1.2.5.2. Definitie:
a) Noiunea de medie se generalizeaz, definindu-se momentul de ordin k al
unei variabile aleatoare:
( )
k
k i i
M f x p =

, atunci cnd este o variabil aleatoare simpl
i respectiv,
M
k
(f) =

+

x
k
(x)dx , atunci cnd este o variabil aleatoare
continu.
b) Se numete moment centrat de ordin k al variabilei aleatoare f momentul
de ordinul k al abaterii sale fa de medie.
( ) ( )
i
k
f i
c
k
p x f M

=
i respectiv, ( ) [ ] ( )dx x f M x
k
c
k

+

= ,n cazul unei variabile aleatoare
continue.
Dispersia de selecie, sau varianta unui ir de rezultate numerice ale
unui experiment este media aritmetic a ptratelor abaterilor acestor valori
fa de media lor aritmetic X .
Dac x
1
, x
2
, , x
n
sunt cele n valori ale seriei, dispersia de selecie a
acestora,
2
X
s este:
2
X
s =
( )
n
X x
i

2

I. ELEMENTE DE TEORIA PROBABILITATILOR
VARIABILE ALEATOARE

18
Dup cum vom vedea mai departe la statistic, o formul mai util
pentru dispersia de selecie este:
2
X
s =
( )
1
2

n
X x
i

Dispersia de selectie este indicatorul principal al mprtierii datelor
unui experiment.
Dispersia unei variabile aleatoare este conceptul ce generalizeaz
dispersia de selecie.































I. ELEMENTE DE TEORIA PROBABILITATILOR
VARIABILE ALEATOARE

19
1.2.6. Dispersia
Dispersia variabilei aleatoare X de noteaz D(X) sau
2
i este, n
particular, momentul centrat de ordinul doi.
D(X) =
2
= M[(X-M(X))
2
] = ( ) ( ) ( )dx x X M x
2

+


i respectiv

2
= M[(X-M(X))
2
] = ( )
i X i
p x
2

, atunci cnd variabila aleatoare


este discret.
Rdcina ptrat a dispersiei, , se numete abaterea medie ptratic a
variabilei X, iar s
x
abaterea standard.

1.2.6.1.Proprieti
a) Pentru orice variabil aleatoare X i orice constante a i b
D(aX+b) = a
2
D(X)

b) Dac X, Y sunt dou variabile aleatoare independente
D(X+Y) = D(X) + D(Y)
Demonstraie:
Pentru orice dou variabile aleatoare X i Y, cu mediile
X
i respectiv

Y
, avem
D(X+Y)=M(X+Y-
X
-
Y
)
2
=M(X-
X
)
2
+M(Y-
Y
)
2
+ 2 M[(X-
X
) (Y-

Y
)]=D(X)+D(Y)+ 2 M[(X-
X
) (Y-
Y
)]
Dar, atunci cnd X i Y sunt independente M(XY) =
X

Y
,
M[(X-
X
) (Y-
Y
)] = M(XY-X
Y
-Y
X
+
X

Y
)=
X

Y-

X

Y-

X

Y+

X

Y
=0
M[(X-
X
) (Y-
Y
)] = 0
i deci D(X+Y) = D(X) + D(Y)

c) ntre dispersie, valoarea medie i momentul de ordinul doi exist
relaia:
D(f) = M(f
2
) (M(f))
2

Demonstraie:
D(X) = ( )
i X i
p x
2

=
i i
p x

2
-2
i X i
p x

+
i X
p

2
= M(f
2
) -
2
2
X
+
2
X
=
= M(f
2
) (M(f))
2


I. ELEMENTE DE TEORIA PROBABILITATILOR
VARIABILE ALEATOARE

20
1.2.6.2.Observaie
Dac numim M(f
2
) media ptratului si (M(f))
2
ptratul mediei
formula capt o formulare uor de reinut:Dispersia este egal cu media
ptratului, minus ptratul mediei.
Relaia se mai poate scrie sub forma
( )
2 2 2
X X
M X = + i am putea
s-o numim teorema lui Pitagora n probabilitate.

1.2.6.3.Exemplu
n modelul clasic al urnei cu bile pe care l-am prezentat mai sus,
probabilitatea evenimentului din n bile extrase, k sunt albe era
k n k k
n k
q p C p

= .
Media variabilei aleatore X care da numrul de bile albe din n bile
extrase va fi, prin definiie,
M(X) =
k n k k
n
q p kC


Pentru a calcula aceast sum considerm urmtoarea identitate
(pt + q)
n
=
k n k k k
n
q t p C

, pe care o derivm n raport cu t


((pt + q)
n
)

= (
k n k k k
n
q t p C


np(pt + q)
n-1
=
k n k k k
n
q kt p C

1
i apoi facem
t = 1 np =

k n k k
n
kq p C
Am obinut, deci, M(X) = np
Folosind aceiai identitate, dar derivnd de dou ori se arat c:
D(X) = npq
Cunoaterea mediei i dispersiei unei variabile aleatoare d o
indicaie asupra intervalului n care se afl valorile variabilei, cu cea mai
mare probabilitate. Mai exact, dup cum arat teorema urmtoare, cu ct ne
ndeprtm mai mult de valoarea medie, cu att valorile respective sunt mai
puin probabile ca valori ale variabilei date.








I. ELEMENTE DE TEORIA PROBABILITATILOR
VARIABILE ALEATOARE

21
1.2.7. Inegalitatea lui Cebev

Dac
2
este dispersia variabilei aleatoare X, probabilitatea ca
modulul abaterii sale de la valoarea medie s ia valori mai mari dect un
numr > 0 este mai mic dect
2
2

.
( )
2
2

m x P
i


Demonstraie:
Pornim de la definiia dispersiei ( ) [ ] ( )
i i i
p m x m x M
2
2 2

= =
i mprim suma n doi termeni: unul corespunztor valorilor
i
x pentru care
m x
i
i unul corespunztor valorilor lui
i
x pentru care m x
i
< .
( )
i i
p m x
2
2

= = ( )
i
m x
i
p m x
i
2

+ ( )
i
m x
i
p m x
i
2


Dac neglijm primul termen al sumei i minorm m x
i
nlocuindu-l cu
n al doilea termen, se obine
( )
n
i
k k k
m x
i
p p p p + + + =


...
2 1
2 2 2

,
cu
n
k k k
p p p + + + ...
2 1
suma probabilitilor valorilor
i
k
x pentru care
m x
i
k
.
Dar
n
k k k
p p p + + + ...
2 1
= ( ) m x P i deci am obinut
( )
2 2
P x m ceea ce implic urmtoarea relaie:
( ) m x P
2
2

.
Deoarece suma ntre probabilitatea unui eveniment A i
probabilitatea evenimentului contrar CA este 1, avem P(CA) = 1-P(A) i
inegalitatea se mai poate scrie sub forma
( )
2
2
1

m x P
i




I. ELEMENTE DE TEORIA PROBABILITATILOR
VARIABILE ALEATOARE

22
1.2.7.1.Exemplu:
Fie 3 = , atunci inegalitatea Cebev d: ( ) 88 . 0
9
8
9
1
1 3 = = = m x P
i

Exprimat n cuvinte, aceast inegalitate aparent banal, spune din
punct de vedere fenomenologic, enorm de mult:
Probabilitatea ca orice variabil aleatoare s ia valori mai
ndeprtate de valoarea sa medie dect de trei valori standard, este mai
mic dect 0,12.
Vom vedea mai departe c, n cazul n care variabila aleatoare are
suplimentar unele proprieti de regularitate, aceast probabilitate este chiar
mult mai mic.
Aceiai inegalitate ne permite nelegerea legturii ntre frecvena i
probabilitate, legtura care exprim nsi fundamentarea statisticii pe teoria
probabilitilor.
S considerm variabila aleatoare care d numrul de bile albe ntr-o
extracie de n bile din urn. Pentru aceast variabil avem urmtoarea
teorem, care se generalizeaz n teoria probabilitilor n forme care
depesc ns cadrul acestei lucrri.




















I. ELEMENTE DE TEORIA PROBABILITATILOR
VARIABILE ALEATOARE

23
1.2.8. Teorema lui Bernoulli:
Dac se noteaz cu p probabilitatea ca un eveniment A (de exemplu
apariia bilei albe) s se realizeze ntr-un experiment i
n
k
f
n
= este
frecvena cu care se realizeaz evenimentul A n n experimente identice
consecutive, irul (f
n
) converge ctre p n probabilitate. Altfel spus:
Frecvena tinde n probabilitate la probabilitatea teoretic.
Demonstraie:

( ) ( ) ( ) n k M k P n np k P p
n
k
P
n n n
= =



lim lim lim
Dar, aplicnd inegalitatea lui Cebev: ( ) ( )
2 2
2

n
n k M k P i deci
0 lim lim
2 2
2
=

n
p
n
k
P
n n

Teorema lui Bernoulli afirm numai c inegalitatea p f
n
nu
are ansa s fie realizat sau c inegalitatea p f
n
are anse mari s fie
ndeplinit dac n este suficient de mare.


























I. ELEMENTE DE TEORIA PROBABILITATILOR
DISTRIBUTII DE PROBABILITATE

25
1.3. DISTRIBUII DE PROBABILITATE

1.3.1. Distribuia normal
Spunem c o variabil aleatoare este normal repartizat ( )
2
, m N ,
atunci cnd densitatea sa de probabilitate este data de formula:
( )
( )
2
2
2
2
1
, ,



m x
e m x

=
O prim condiie ca ( ) x s fie distribuie de probabilitate este aceea
c
( ) ( ) ( ) 1 = + =

+

t f P dx x
Pentru a verifica aceast condiie, plecm de la un rezultat care s-a
obinut la cursul de matematic folosind integrala dubl, i anume :
2
2
2
=

dx e
x

n cazul nostru, dac facem schimbarea de variabil

m x
u

= avem
( )
( )
1
2
1
2
1
2 2
2
2
2
= = =

+

+

+

du e dx e dx x
u m x



Vom arta n continuare c o variabil aleatoare normal repartizat
are media m i dispersia
2
.
S calculm mai nti media:
[ ]
( )
( )
( )
( )
m m m du ue m dx e
m x
dx e m m x dx xe X M
u
m x
m x m x
= + = + = +

=
= + = =


+

+

|

\
|

0
2
1
2
1
2
1
2
1
2
2
2
1
2 2
2
2
2
2
2
2



Integrala este nul deoarece funcia de integrat este impar.
Pentru calculul dispersiei ne folosim de identitatea:
( ) ( ) ( ) ( )
2 2
2
D X M X M X M X M X = = ( (


( )
( )
( ) = + = =
+

+


du e u m dx e x X M
u m x


2
2
2
2 2
2
2
2
2
1
2
1

I. ELEMENTE DE TEORIA PROBABILITATILOR
DISTRIBUTII DE PROBABILITATE

26
=
|
|

\
|
+ + =

+


du e u e u m e m
u u u
2
2 2
2 2
2
2 2 2
2
2
1


2
2 2 2
2
1
2
2
u
m u e du

| |
= + |
|
\



Calculm separat integrala rmas i obinem:
2 2 2 2
2
2 2 2 2
1* 2
u u u u
u e du u ue du ue e du
+

+ + +

| | | |
= = = | |
| |
\ \


unde am integrat prin pri, lund = u i =

2
2
u
ue
Deci am obinut ( ) ( )

2 2
2
1
2 2 2
+ = m X M i nlocuind n
expresia lui ( ) X D obinem:
( ) ( )
2 2 2 2
2 2
2
1

= + = m m X D
Pornind de la proprietile operatorilor de medie i dispersie
( ) ( ) m X M m X M =
( ) ( ) X D m X D = i
( ) X D
a a
X
D
2
1
= |

\
|

se obine c, dac o variabil aleatoare este normal repartizat ( ) , m N ,
variabila aleatoare redus

m X
este repartizat ( ) 1 , 0 N , deci cu distribuia
de probabilitate
( )
2
2
x
e x

=
Funcia de repartiie asociat este funcia ( ) dx e t
t
x

=
2
2
numit
funcia lui Laplace i ale crei valori se gsesc n tabelele din practic toate
crile de statistic i probabiliti.


I. ELEMENTE DE TEORIA PROBABILITATILOR
DISTRIBUTII DE PROBABILITATE

27
1.3.2. Distribuie binomial
Distribuia binomial apare, aa cum s-a artat mai sus, la descrierea
evenimentelor asociate extraciilor dintr-o urn cu bile albe i bile negre.
Distribuia variabilei aleatoare numrul de bile albe din n bile
extrase se poate reprezenta i sub form matricial:
|
|

\
|
=
0 1 1 1 0 0
... ...
1 0
q p C
n
q p C
k
q p C q p C
X
n k
n
k n k k
n
n
n
n
n

Dup cum am artat media i dispersia unei variabile aleatoare
repartizate binomial sunt np M = si npq D =
Repartiia binomial apare ntotdeauna atunci cnd un experiment cu
numai dou rspunsuri posibile se repet de n ori. Un caz particular l
prezint experimentele care se repet de un numr foarte mare de ori, iar
evenimentul n a crui apariie suntem interesai are o probabilitate foarte
mic, categorisit uzual ca eveniment rar.
La limit, cnd n , 0 p , dar np rmne constant, = np ,
se obine distribuia Poisson.

1.3.3. Distribuia POISSON
Considerm deci c = np i trecem la limit dup n

( ) ( )
= |

\
|

+
=


k n
k
k
n
k n k k
n n
n n k
k n n n
q p C

1
!
1 ... 1
lim lim
( ) ( ) 1 ... 1
1
*lim lim 1
!
n k
k
n n k
n n n k
k n n


+
| |
=
|
\

dar
( ) ( )
1
1 ... 1
lim =
+

k
n
n
k n n n
i
( )


=
(
(

\
|
= |

\
|
e
n n
n
k n
n
n
k n
n
1 lim 1 lim i deci,



= e
k
q p C
k
k n k k
n n
!
lim
Deci, distribuia Poisson este dat de matricea

|
|

\
|
=


e
n
n
e
k
k
e e
X
n k
!
...
!
...
! 1
1 0

I. ELEMENTE DE TEORIA PROBABILITATILOR
DISTRIBUTII DE PROBABILITATE

28
Calculnd, dup definiie, media i dispersia unei variabile aleatoare
distribuite Poisson i innd cont c

e
k
k
k
=

0
!
,

e
k
k
k
k
=

0
!
, ( )

e
k
k k
k
k
2
2
!
1 =

e
k
k
k
k
=

1
!

se obine

( )
( ) ( )

= =

= =

1
1
1 0
! 1 ! 1 !
k
k
k
k
k
k
e e
k
e
k
e
k
e
k X M

( )
( )
( ) [ ] ( )
( )





= + =
=
(

+ =
|
|

\
|
+ =
=
|
|

\
|
+ =



2 2
2
2 1 1
2
0 0 0
2
2
0
2
! !
1
!
1
! !
2
! !
e e e
k
k
k
k k e e
k
k k k e
k k
k
k
k
e
k
k
e X D
k k
k k
k
k
k k k
k k k
k
k


1.3.3.1. Exemplu:
Numrul evenimentelor adverse la un medicament dat este repartizat
Poisson.
Cel mai mult este utilizat distribuia Poisson n fizica statistic.

1.3.4. Aproximarea normal a distribuiei binomiale
Ca o regul general, dac np i nq sunt mai mari sau egale cu 5,
poate fi folosit aproximarea normal. Pentru distribuiile binomiale n care
p<0,5 aproximarea este bun pentru valori ale lui np i nq mai mici dect 5.
n aceste condiii,
n
pq
p
n
k
npq
np k

=

este aproximativ normal distribuit cu


media 0 i deviaia standard 1.
Aceast transformare nlesnete de obicei calculul probabilitilor
binomiale.

I. ELEMENTE DE TEORIA PROBABILITATILOR
DISTRIBUTII DE PROBABILITATE

29
1.3.5. Repartitia
2
Helmert - Pearson
Se consider n observaii independente x
1
, x
2
, , x
n
(variabile
aleatoare independente) normal distribuite ( )
2
, N .

Variabilele standard


=
i
i
x
u , n i , 1 = sunt de asemenea
independente, iar suma ptratelor lor va avea o distributie ce poate fi
determinat.
Se definete

=
n
i
u X
1
2
.
Distribuia variabilei X rezultate se noteaz
2
(n) i este diferit
pentru fiecare valoare a lui n, iar parametru n se definete ca numrul de
gradelor de libertate.
Vom determina n continuare parametrii (media i dispersia) unei
variabile distribuite
2
.
Pentru a afla media distributiei
2
este necesar aflarea lui [ ]
2
i
u M .
Deoarece [ ] 0 =
i
u M , [ ] [ ] ( ) [ ] [ ] 1
2 2
= = =
i i i i
u D u M u M u M
Ca urmare M[
2
(n)] = [ ] [ ] n n u M u M
n
i
n
i
= = =

1 *
1
2
1
2

Dispersia va fi:
D[
2
(n)]
= [ ] [ ] [ ] ( ) ( ) ( ) [ ] ( ) [ ] 1
4
2
2 4 2
1
2
1
2
= = = =
i i i i
n
i
n
i
u M n u M u M n u nD u D u D
Pentru a obine [ ]
4
i
u M se folosete regula integrrii prin pri:
( ) ( ) ( ) ( ) ( ) ( )dx x g x f x g x f dx x g x f

=
n acest caz se va identific:
( ) ( )
( ) ( )
2 2
2 3
2 2
3
u u
ue x g e x g
u x f u x f

= =
= =
, deci se va obine:
( )
2 2
2 2 2
4 4 4 3
2 2
3 2 2 2
2 2 2
1 1
2 2
1 1 1
3 3 3 3
2 2 2
u u
i
u u u
M u u u du u e du u ue du
u e u e du u e du M u



+ + +

+
+ +

( = = = =

| | | |
( = = = | |

| |
\ \



Atunci,
[ ] [ ] [ ] ( ) ( ) 2 1 3
2 2 4 2
= = =
i i i
u M u M u D
I. ELEMENTE DE TEORIA PROBABILITATILOR
DISTRIBUTII DE PROBABILITATE

30
i substituind n relaia de mai sus se va obine
D[
2
(n)] = [ ] n u nD
i
2
2
=
Deci variabila
2 2
2
2
1
2
...
n
x x x x + + + = este repartizat
2
(n), cu n
grade de libertate, avnd media E(
2
) = n, respectiv dispersia D(
2
) = 2n.
Se poate arta c densitatea de probabilitate este dat de funcia
f(
2
) = ( )
1
2
2
2
2
2
2
2
1

\
|

n
n
e
n

,
unde este funcia Euler de spea I-a studiat la cursul de matematic i
anume : ( )
1
0
t
e t dt

+

=

.
Repartitia
2
se folosete foarte mult n statistica matematic n
verificarea ipotezelor asupra egalitii dispersiilor.
























I. ELEMENTE DE TEORIA PROBABILITATILOR
DISTRIBUTII DE PROBABILITATE

31
1.3.6. Repatiia STUDENT
Analog cu distribuia
2
, repartiia t a fost propus de Student
(pseudonimul lui W.S.Gosset, chimist statistician englez), pentru statistica
seleciilor mici i exprim deviaiile mediilor de selecie x , fa de media
ntregii populaii , msurate n
n
s
(abaterea standard a mediilor de
selecie).
Dac sunt date dou variabile aleatoare ( ) 1 , 0 N Z si ( ) n V
2

independente, se spune c variabila ( ) n t
n
V
Z
t = este repartizat Student
cu n grade de libertate.
Mrimea t nu depinde dect de numrul gradelor de libertate.
Distribuia de probabilitate a unei variabile aleatoare repartizate
Student tinde pentru n , la distribuia normal ( )
2
2
2
1
t
e t


Densitatea de probabilitate este dat de funcia:
( )
1
2
2
1
1 2
* * 1
2
n
n
x
f x
n n n
+

+ | |

|
| |
\
= +
|
| |
\

|
\
unde x R i n N .














I. ELEMENTE DE TEORIA PROBABILITATILOR
DISTRIBUTII DE PROBABILITATE

32
1.3.7. Repartiia F (Behrens - Fisher Snedecor) a raportului a
dou dispersii
Se consider frecvent n statistic raportul a dou dispersii care
estimeaz aceeai dispersie general a unei colectiviti. Dintr-o
colectivitate general se extrag dou selecii ( )
1
2
n U , ( )
2
2
n V .
Raportul lor este o variabil aleatoare repartizat F
( )
2 1
2
1
, n n F
n
V
n
U
F =
Examinnd acest raport se observ c el nu conine dispersia
colectivitii generale
2
, de unde rezult c distribuia acestui raport nu
depinde dect de numrul gradelor de libertate n
1
si n
2
ale celor dou
dispersii.
Densitatea de probabilitate este dat de funcia:
( )
1 1 2
1
2
1 2
2 2 1
1 1
1 2 2 2
2
* * * 1 *
*
2 2
n n n
n
n
n n
n n
f x x x
n n n n
+

+ | |

|
| | | |
\
= +
| |
| | | |
\ \

| |
\ \
,cnd 0 x .
II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

33
II. STATISTIC MATEMATIC I BIOSTATISTIC


Statistica matematic este principala aplicaie a teoriei
probabilitilor. Procedeele statistice constau, n esen, n elaborarea unor
concluzii plauzibile privitoare la colectiviti mari de fenomene, pe baza
cunoaterii unui numr restrns dintre acestea i extrapolrii rezultatelor.
Legile care stau la baza statisticii i care permit aceste generalizri
sunt teorema limit central i legea numerelor mari.
ntr-o exprimare intuitiv, avem rezultatul c, dac o variabil
aleatoare este suma unui numr mare de variabile aleatoare
independente, fiecare variabil aleatoare avnd o pondere mic n sum,
atunci funcia de repartiie a variabilei aleatoare este foarte apropiat de o
funcie de repartiie normal.
Exprimat mai riguros i mai general, avem urmtoarea teorem:


2.1. Teorema limit central (A.M.Leapunov)

Fie
n
,..., ,
2 1
variabile aleatoare independente.
Fie ( ) ( )
2
,
k k k k
M a D = = i ( )
3
3
k k k
a M = cnd n k , 1 =
Notm
( )
=
n
i n
1
2 2
,
( )
=
n
i n
1
3 3

Dac
( )
( )
0 lim =

n
n
n

, atunci funcia de repartiie a variabilei



( )
( ) n
n n
a a a

+ + + + + + ... ...
2 1 2 1

tinde, cnd n , ctre funcia ( ) x a lui Laplace.
( ) dt e x
x t

=
2
2
2
1


Teorema limit central este teorema fundamental a teoriei erorilor.
Laplace, Gauss i ali matematicieni, studiind repartiia erorilor, au ajuns la
concluzia c funcia de repartiie normal poate fi luat drept model teoretic
pentru cercetarea probabilistic a aproape tuturor fenomenelor naturii.

II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

34
2.2. Teorema lui Cebev
Dac
n
,..., ,
2 1
sunt variabile aleatoare (discrete sau continue)
independente ale cror dispersii sunt mai mici dect o constant C, atunci
oricare ar fi numrul pozitiv , probabilitatea inegalitii

( ) ( ) ( )
1 2 1 2
... ...
n n
M M M
n n

+ + + + + +

tinde ctre 1, atunci cnd numrul variabilelor aleatoare tinde ctre infinit.
Demonstraie:
S considerm variabila aleatoare
n
n

+ + +
=
...
2 1
. Avnd n
vedere liniaritatea operatorului de calcul a mediei avem
( )
( ) ( ) ( )
1 2
...
n
M M M
M
n

+ + +
= .
Aplicnd inegalitatea lui Cebev variabilei aleatoare se obine:
( ) ( ) ( )
1 2
1 2 1 2
2
...
... ...
1
n
n n
D
M M M
n
P
n n

+ + +

+ + + + + +






Mai departe, din proprietile operatorului D
( ) ( ) ( )
n
C
n
nC
n
C C C
n
D D D
n
D
n n
= =
+ + +

+ + +
=

+ + +
2 2 2
2 1 2 1
... ... ...

Deci

( ) ( ) ( )
1 2 1 2
2
... ...
1
n n
M M M
C
P
n n n

+ + + + + +





Trecnd la limita pentru n obinem
( ) ( ) ( )
1 2 1 2
... ...
lim 1
n n
n
M M M
P
n n

+ + + + + +





i cum probabilitatea nu poate depi 1,
( ) ( ) ( )
1 2 1 2
... ...
lim 1
n n
n
M M M
P
n n

+ + + + + +
=




II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

35
Cel mai frecvent, n practic, variabilele aleatoare
i
au aceiai medie i
concluzia teoremei devine
1
...
lim
2 1
=


+ + +



n
P
n
n

n esen, teorema lui Cebev stabilete c, dei variabilele
aleatoare independente pot lua valori ndeprtate fa de mediile lor, media
aritmetic a unui numr suficient de mare de astfel de variabile aleatoare ia
cel mai probabil valori apropiate de un numr constant
( ) ( ) ( )
1 2
...
n
M M M
n
+ + +
(sau atunci cnd mediile variabilelor sunt
egale ntre ele).
Ca urmare, ntre comportarea fiecrei variabile aleatoare i
comportarea mediilor lor exist diferen esenial. Putem spune foarte
precis ce valoare va lua media aritmetic a acestor variabile aleatoare.
Explicaia acestui fapt const n aceea c abaterile diverselor variabile
aleatoare sunt de semne diferite i, ca urmare, se compenseaz ntre ele.





















II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

36
2.3. TEORIA SELECIEI

2.3.1. Populaii i selecii. Inferena statistic

n practic avem adesea nevoie s facem judeci asupra unor mari
colecii de rezultate posibile experimental ori a altor cantiti, dar nu putem
sau este extrem de scump, s examinm toate aceste date. n astfel de cazuri,
n loc s examinm ntregul set de date pe care l numim n cele ce urmeaz
populaie, tragem concluziile dup examinarea a o parte din ele, alese la
ntmplare, parte pe care o numim selecie.
Procedeul de obinere a probelor este numit tot selecie, iar
procedeul de extrapolare a concluziilor la ntreaga populaie este cunoscut
ca inferena statistic.
Vom considera c o caracteristic dat a populaiei este o variabil
aleatoare pe un cmp de probabilitate ( ) P K, , n care elementele lui
sunt chiar elementele populaiei, iar P este o probabilitate cunoscut sau nu.
Enumerarea valorilor observate ale caracteristicii urmrite i a
frecvenelor lor relative definete repartiia statistic a seleciei.
Teorema lui Leapunov, numit i teorema fundamental a statisticii
matematice, care justific utilizarea metodei seleciei stabilete c funcia de
repartiie statistic a caracteristicilor seleciilor tinde la funcia teoretic de
repartiie a caracteristicii studiate cnd volmul seleciei tinde la .

2.3.1.1. Exemplu
Putem dori s tragem concluzii despre evoluia rezistentei unei
tulpini de germeni patologeni la un medicament dat i, n acest scop,
examinm rezultatele antibiogramelor fcute ntr-un eantion de spitale ntr-
o perioad recent (luniile de iarn), comparat cu aceeai perioad a anului
precedent. Dei rezultatele obinute se refer la spitale i mai precis numai
la o parte din ele, concluziile le extindem la scara ntregii populaii.

2.3.1.2. Exemplu
Rezultatele privind absorbia unui medicament dup administrarea
oral prin determinarea nivelurilor din plasma ale medicamentului la un lot
de voluntari sntoi le considerm ca rezultate probabile pentru ntreaga
populaie ce include i poteniali pacieni.
Populaia poate fi infinit sau finit, n ultimul caz, numrul
indivizilor populaiei N- se mai numete i volumul populaiei. n mod
II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

37
similar, numrul de indivizi sau valori din cadrul unei probe este denumit
volumul probei sau volumul eantionului.
Valabilitatea concluziilor despre populaie depinde de
reprezentativitatea probei. Pentru populaii finite aceasta nseamn c
fiecare membru al populaiei are aceeai ans s fie selectat, cnd spunem
c selecia este o selecie la ntmplare sau selecie aleatoare. Desigur c
selecia unor voluntari sntoi pentru determinarea parametrilor
farmacocinetici ai unui medicament nu este din acest punct de vedere o
selecie reprezentativ. n cazurile n care avem motive s credem c
patologia creia se adreseaz medicamentul nu afecteaz funciile
metabolice i de excreie, aceast aproximare este acceptat pentru motivul
c o selecie corect ar implica loturi mult mai mari cu cheltuieli i timp de
lucru mult crescute.
n practic, n studiile de bioechivalen, pentru reducerea volumului
loturilor pe care se fac testrile, se administreaz amndou medicamentele
la toi membri lotului, n dou perioade diferite. Fiecare component al
lotului primete unul din medicamente n prima perioad i cellalt n a
doua perioad.
Deoarece perioada de administrare poate influena i ea rezultatul
experimentului, alegerea indivizilor care vor primi n prima perioad primul
medicament se face n mod aleator. n cazul cnd sunt mai multe perioade,
de exemplu I-IV, i mai multe medicamente A, B, C, D se alctuiete un
tabel de felul urmator

Tabelul nr. 1:
I II III IV
A B D C
B C A D
C D B A
D A C B

aa zisul ptrat latin, unde observm c fiecare liter apare o singur dat
n fiecare linie i n fiecare coloan. Se numete ptrat latin deoarece, cum
se va arata mai departe, n cazul n care mai intervine i o alt variabil, de
exemplu doza din fiecare medicament, se folosesc i litere grecesti,
alctuindu-se ptrate greco-latine.
Deasemenea, studiile de bioechivalen se fac tot pe voluntari
sntoi, pornind de la ipoteza c modificrile de biodisponibilitate asociate
II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

38
strilor patologice sunt aceleai pentru cele dou medicamente testate, ceea
ce, evident, este numai n parte adevrat.
n toate experimentele biologice, planificarea experimentului trebuie
fcut n aa fel nct diferenele n tratament s nu coincid cu diferene n
vrst, sex, sau ali parametri. Dac, de exemplu, femeile din lot primesc
primul medicament i brbaii al doilea, se spune ca diferenele de sex sunt
confundate cu diferenele de tratament. n acest caz nu se poate spune
dac diferenele obinute se datoreaz tratamentului sau diferenei de sex.


2.3.1.3. Parametrii de selecie ai unei variabile aleatoare :
Dac printr-un procedeu oarecare cuantificm rspunsul culturilor
microbiene la antibioticele din exemplul 1, sau dac lum n consideraie
concentraiile de medicament n snge, din al doilea exemplu, i
probabilitile ca valorile s aparin unor intervale diferite, obinem o
variabil aleatoare X asociat cu rezultatul experimentului corespunztor.
Parametrii acestei variabile aletoare sunt denumii, prin abuz de
limbaj, parametri ai populaiei.
Dac n exemplul al doilea X
i
este concentraia de medicament n
sngele bolnavului i, la o or de la administrare, la primul voluntar putem
obine o valoare x
1
, pentru al doilea voluntar o valoare x
2
, etc. n acest fel
gsim valorile
n
x x x ,..., ,
2 1
ale varibilelor aleatoare independente
n
X X X ,..., ,
2 1
.















II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

39
2.3.2. Media de selecie este o variabil aleatoare:
n
X X X
X
n
+ + +
=
...
2 1

Dac distribuia lui X este normal - ( ) , N , aceiai pentru fiecare
i, datorit linearitii operatorului M care definete media, obinem
( )
X
M X = = adic valoarea pentru media mediei de selecie este media
populaiei.
Dac la datele experimentale se adaug o constant, a x x
i i
+ =

,
media de selecie crete cu aceeai constant:
( )
a X
n
a X
W
n
i
+ =
+
=

1

Similar, dac fiecare valoare se nmulete cu o constanta
i i
kX Z = ,
media de selecie Z se nmulete cu aceeai contant: X k
n
kX
Z
n
i
= =

1


2.3.3. Dispersia de selecie
Ca o msur a abaterii datelor fa de media de selecie, se introduce
noiunea de dispersie de selecie ( )
2
1
2
1
1

=
n
i X
X x
n
S .
n aplicaiile practice, pentru reducerea numrului de calcule,
formula se aduce la o alt form i anume:
( )
( )
( )

= +

=
=


n
n
i
i
n
i
n
i
n n
i i
n
i X
n
x
x
n
X n x
n
X n X n x
n
X n x X x
n
X x
n
s
1
2
1 2
2
1
2
1
2 2
2
1
2
1
2
1
2
2
1
1
1
1
2
1
1
2
1
1
1
1

Dac
2 2 2
x z i i
s k s a kx z = + = .
ntr-adevr
( ) ( )
2 2
2
1 1
2
2
1
1
1
1
x
n
i
n
i Z
s k a X k a kx
n
Z z
n
s = +

=


II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

40
x
s se numete abaterea standard de selecie sau deviaie standard, cnd nu
este pericol de confutie privind variabila aleatoare la care se refer
folosindu-se i notaia
d
s .
Se mai utilizeaz n practic i noiunile:
Dispersiapopulaiei = ( )
2
1
1
1

n
i
X x
n
i respectiv
Deviaia standard a populaiei, precum i abaterea standard a
mediei (prescurtarea SEM standard error of mean) definit prin
raportul
n
s
SEM
x
=
precum i coeficientul de variatie *100
x
s
v
X
= .


2.3.4. Covarianta de selecie
Covarianta de selecie se definete prin formula
( )( ) Y y X x
n
s
i
n
i XY

=

1
1
1

Se observ c aceasta se mai poate scrie i sub alt form, mai util
n sensul simplificrilor de calcul n anumite aplicaii.
( )
( )
( )

= +

=
= +


n
n n
i i
i i
n
i i
n
i i
n n n
i i i i XY
n
y x
y x
n
Y X n y x
n
Y X n Y X n Y X n y x
n
Y X n x Y y X y x
n
s
1
1 1
1
1
1 1 1
1
1
1
1
1
1
1
1









II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

41
2.3.5. Coeficientul de corelaie de selecie
Coeficientul de corelaie de selecie se definete prin formula
( )
( ) ( )
( ) ( )
( )( )
( ) ( )
1
2 2
1 1
1
2 2
1 1
1
1
,
1 1
1 1
n
i i
XY
n n
X Y
i i
n
i i
n n
i i
x X y Y
s
n
x y
s s
x X y Y
n n
x X y Y
x X y Y

= = =



=



2.3.6. Proprieti ale caracteristicilor de selecie
Considerm n continuare o selecie de volum n dintr-o populaie cu
media si dispersia
2



2.3.6.1. Propoziie
Media mediei de selecie este egal cu media populaiei.
( )
M X =
Demonstraie:
( )
( ) ( )
i i
M x M x
n
M X
n n n

= = = =


2.3.6.2. Propoziie
Media dispersiei de selecie este egal cu dispersia populaiei
( )
2 2
X
M s =
Demonstraie:
( ) ( )
( )
( ) ( )
( )
2 2
2 2
1 1 1 1
2
2 2
2 2
1 1
2
1
2
1
1 1
2
1 1
1 1
2
1 1
1
1
n n n n
X i i i
n n
i i
n
i
n
i
M s M x X M x X x x
n n
M x nX nX M x nX
n n
x
M x
n n

= = + =



+ = =



=


Dar, mai departe
( )
( )
2 2 2
1
n
i
M x n = +


II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

42

( )
( )
( )
( ) ( )
( ) ( )
2
2
1
1 1
2
1
2 2 2 2 2 2
2
1
2
2
1
n n n
i i i j
i j
n
i i j
M x M x x x
n n
M x M x M x
n n n n n


= + =

= + =
= + + = +


i nlocuind n expresia lui
( )
2
X
M s obinem
( )
( )
2 2 2 2
2 2
1
X
n n
M s
n

+
= =



2.3.6.3. Propoziie
Variabila aleatoare
n
x
Z


= tinde , cnd n ctre o variabil
( ) 1 , 0 N
Aceasta este o consecin a teoremei limit central i este aplicabil att
variabilelor continue ct i celor discrete.
ntr-adevr aplicnd teorema lui Leapunov pentru variabilele
aleatoare
n
x x x ,..., ,
2 ,
obinem c:
( )
n
X
n
n X n x x x
n n

=
+ + +
+ + + + + +
2 2 2 2
2 1 2 1
...
... ...

tinde ctre o variabil aleatoare ( ) 1 , 0 N .

2.3.6.4. Propoziie
Dac variabila aleatoare X este normal distribuit, atunci variabila
aleatoare ( )
2
2
1

X
s
n V = este repartizat ( ) 1
2
n
Demonstraie:
II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

43
( )
( ) ( ) ( ) [ ]
( ) ( )( ) ( )
( ) ( )( ) ( )
( ) ( )
2
2
1 2
1
2
1
2
2
2
1 1 1
2
2
2
1
2
2
1
2
2
2
2
1


=

=
=
+
=
=
+
=
=

=

= =



n
X x
X n x
X n X n X n x
X X x x
X x X x
s
n V
n
i
n
i
n
i
n n n
i i
n
i
n
i
X




Dar variabila aleatoare


i
x
este repartizat ( ) 1 , 0 N deoarece
( )
i i
M x x
M



=


i
( )
1
2
= =

i i
x D x
D , iar
( )
n
X


este
repatizat tot ( ) 1 , 0 N n conformitate cu teorema limit central.
Deci, V este o sum de n-1 ptrate de variabile de tip ( ) 1 , 0 N .

2.3.6.5. Propoziie
Dac
n
x x x ,..., ,
2 1
este o selecie dintr-o populaie normal distribuit,
atunci variabila aleatoare
n
s
X
T

= este repartizat Student cu n grade de libertate.
Demonstraie:
( )
( )
1
1
2
1
2

n
V
Z
n
X x
n
X
s
n
X
n
s
X
n
i


II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

44
unde
n
X
Z


= este repartizat ( ) 1 , 0 N , iar
( )
2
1
2


=
n
i
X x
V este
repartizat ( ) 1
2
n .
Deci, T este repartizat Student cu n-1 grade de libertate.


2.3.6.6. Propoziie
Date fiind dou selecii aleatoare independente
1
1 12 11
,..., ,
n
x x x si
2
,..., ,
22 21 n
x x x din populaii normal distribuite ( )
1 1
, N i ( )
2 2
, N ,
variabila aleatoare
2
2
2
2
2
1
2
1

S
S
F = este repartizat Fisher Snedecor
( ) 1 , 1
2 1
n n F
Demonstraie:
Avem ntr-adevar
( )
( )
( )
( )
2
2 2
1
2
2 2
2
1 1
1
2
1 1
2
2
2
2
2
1
2
1
1
1
2
1

= =

n
X x
n
X x
S
S
F
n
i
n
i
iar numratorul i numitorul sunt repartizate,
conform propozitiei 2.3.5.4., respectiv
( )
1
1
1
1
2

n
n
i
( )
1
1
2
2
2

n
n
.










II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

45
2.4. Estimaii
Teoria estimaiei urmrete evaluarea parametrilor unei repartiii n
general cunoscute. Valorile numerice obinute se numesc estimaii sau
estimatori. Se obin estimaii punctuale n cazul n care se folosesc datele
seleciei pentru a obine valorile parametrilor i estimaii ale intervalelor de
ncredere n cazul n care se determin un interval n care se afl, cu o
anumit probabilitate valoarea estimat.
Un estimator al parametrului se va nota cu

. O estimaie este
nedeplasat dac
( )

M = , adic media estimaiei este egal chiar cu


valoarea teoretic a parametrului estimat.
Conform proprietii 2.3.5.1,
( )
M X = adic media de selecie
este un estimator nedeplasat al mediei, iar conform proprietii 2.3.5.2.,
( )
2 2
M s = adic dispersia de selecie este un estimator nedeplasat al
dispersiei.
Problema estimrii intervalelor se reduce la gsirea unui interval de
ncredere ( )
U L
, cu un coeficient de ncredere 1 astfel nct
( ) = 1
U L
P .
Este de dorit ca 1 s fie ct mai mare (de obicei este cuprins
ntre 0,9 i 0,99) iar intervalul ( )
U L
, s fie ct mai mic. n stabilirea
intervalelor se utilizeaz caracteristicile numerice cuantile. Se numesc
cuantile de ordin valoarea

x a variabilei aleatoare x pentru care


( ) ( )

= = x x P x F adic valoarea variabilei aleatoare care are la stnga
ei aria sub curba densitii de probabilitate. Evident:
2
2

x x P
2
1
2
1



x x P

= =



1
2 2
1
2
1
2
x x x P
Pentru a estima un interval se alege 1 , se citesc din tabelele
cuantilele, de exemplu
2
1

x i
2

x i se precizeaz intervalul. n prealabil, n


funcie de mrimea pentru care se caut intervalul se precizeaz cu care din
repartiiile cunoscute trebuie lucrat.

II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

46
2.4.1. Estimarea intervalelor de ncredere pentru medii

2.4.1.1.Cazul cnd se cunoaste dispersia.
Se consider o populaie repartizat normal ( )
2
, N . Dac se cunoate
dispersia se poate folosi faptul c
n
X
z


= este repartizat ( ) 1 , 0 N . Se
noteaz cu

z cuantila de ordinul pentru repartiia ( ) 1 , 0 N . Evident



= =



1
2 2
1
2 2
1
2
1
2
z F z F z z z P
Aadar intervalul

2
1
2
,

z z este un interval de estimare cu coeficientul
de ncredere 1 . Din anumite puncte de vedere este recomandabil s se
utilizeze acele intervale care las att la dreapta ct i la stnga lor aceeai
arie, egal cu
2

.
Deoarece repartiia ( ) 1 , 0 N este simetric fa de axa Oy avem relaia
2
1
2

= z z
Din relaiile
1 1 1 1
2 2 2 2
1 1
2 2
1 1
2 2
* *
* *
x
z z z z z
n
z x z
n n
x z x z
n n




+

rezult
1 1
2 2
X z X z
n n


+
Aadar intervalul cutat este
II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

47
( )

+ =

n
z X
n
z X
U L



2
1
2
1
, ,
Mrimea
n
z E

2
1
= poart numele de eroare i servete la calculul
numrului de experiene
2
2
1

=

E
z
n

atunci cnd este impus eroarea i se


alege un coeficient 1
Metoda descris mai poate fi aplicat i n cazul n care x nu este
repartizat normal deoarece z este repartizat ( ) 1 , 0 N indiferent de repartiia
variabilelor
n
x x x ,..., ,
2 1
(teorema limit central).
























II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

48
2.4.1.2.Cazul cnd dispersia este necunoscut
Dac nu se cunoaste dispersia n estimarea intervalelor se utilizeaz
dispersia de selecie care este un estimator nedeplasat al dispersiei deoarece
( )
2 2
= s E
Se consider
n
x x x ,..., ,
2 1
o selecie dintr-o populaie de tipul ( )
2
, N .
Conform celor artate anterior mrimea
n
s
X
T

= este repartizat
( ) 1 n T i, ca urmare



= =



1
2 2
1
2
, 1
2
1 , 1
2
1 , 1
2
, 1 n n n n
t F t F t T t P
Deoarece repartitia Student este simetric fa de
origine
2
1 , 1
2
1 , 1


=
n n
t t i nlocuindu-l pe T n relaia anterioar, se obine
1, 1,1 1, 1,1
2 2 2 2
1
n n n n
X
P t T t P t t
s
n






= =






i
1,1 1,1
2 2
n n
s s
X t X t
n n


+
Ca urmare intervalul cutat este
( )

+ =

n
s
t X
n
s
t X
n n
U L
2
1 , 1
2
1 , 1
, ,


n acest caz eroarea este
n
s
t E
n
2
1 , 1


=
Dac numrul de experiene este 30 n , se poate folosi aproximaia

2
1
2
1 , 1


= z t
n





II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

49
2.4.2.Estimarea intervalului de ncredere 1 pentru diferena a dou
medii
Se consider dou selecii din populaii normal repartizate ( )
2
1 1
, N i
( )
2
2 2
, N .


2.4.2.1. Cazul dispersiilor
2
2
2
1
, cunoscute.
Considerm o selecie aleatoare
1
1 12 11
,..., ,
n
x x x din populaia ( )
2
1 1
, N i o
selecie
2
2 22 21
,..., ,
n
x x x dintr-o populaie ( )
2
2 2
, N .
Estimatorii nedeplasai ai mediilor
1
i
2
sunt:
1
1
1
1
1
n
x
X
n
i
= si
2
1
2
2
2
n
x
X
n
i
=
Considernd variabila aleatoare
2 1
X X , ea este normal repartizat iar
estimaia i dispersia ei vor fi
( ) ( ) ( )
1 2 1 2 1 2
M X X M X M X = = i
( ) ( ) ( )
2
2
2
1
2
1
2 1 2 1
n n
X D X D X X D

+ = + = unde am inut cont c
i
x
1
i
i
x
2

sunt independente.
Mai departe, variabila aleatoare
( ) ( )
( )
( ) ( )
2
2
2
1
2
1
2 1 2 1
2 1
2 1 2 1
n n
X X
X X D
X X
z


+

=


= este repartizat N(0,1).
Deoarece,

=



1
2
1
2
z z z P i
2
1
2

= z z rezulta
( ) ( )
2 2 2 2
1 2 1 2
1 2 1 2 1 2
1 1
1 2 1 2 2 2
X X z X X z
n n n n




+ + +
Aadar, intervalul de estimaie pentru diferena mediilor este
( ) ( ) ( )

+ + + =

2
2
2
1
2
1
2
1
2 1
2
2
2
1
2
1
2
1
2 1 2 1
, ,
n n
z X X
n n
z X X



II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

50
n acest caz, eroarea este
2
2
2
1
2
1
2
1
n n
z E

+ =

.


2.4.2.2. Dispersii necunoscute dar presupuse egale
n cazul n care nu cunoatem dispersiile dar tim c sunt egale
2 2
2
2
1
= = utilizm dispersia ponderat de selecie
( ) ( )
( ) ( )
1 2
2 2
2 2
1 1 2 2
1 1 1 1 2 2 2
1 2 1 2
1 1
2 2
n n
i i
p
x X x X
n s n s
s
n n n n
+
+
= =
+ +


ca un estimator nedeplasat pentru
2
.
Avem ntr-adevr,
( )
( ) ( ) ( ) ( ) ( ) ( )
2 2
2 2
1 1 2 2
1 1 2 2 2 2
1 2 1 2
1 1
1 1
2 2
p
n M s n M s
n n
M s
n n n n

+
+
= = =
+ +

n continuare vom arta c mrimea
( ) ( )
2 1
2 1 2 1
1 1
n n
s
X X
T
p
+

=

este
repartizat ( ) 2
2 1
+ n n T
Se observ c
( ) ( )
2 1
2 1 2 1
1 1
2 1
2 1
n n
s
X X
T
X X
p
X X
+

=


este raportul ntre o variabila
aleatoare repartizat N(0,1) i deoarece
( ) ( )
( ) 2 2
1 1
1 1
1 1
2 1
1 1
2
2 2
2
1 1
2
2 1
1 1
2
2 2
2
1 1
2
2
2 1
2 1
2 1
1 2
1 2
2 1
+


=
+
+
= = = +
+
= +

n n
X x X x
n n
X x X x
s s
n n
n n
s
n n
s
n n
i i
n n
i i
p p p
X X
p


II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

51
variabila
2 1
1 1
2 1
n n
s
X X
p
+

este de tipul
( )
2
2
2 1
2 1
2
+
+
n n
n n

Dar
2
1
1 1
1

n
i
X x

este repartizat ( ) 1
1
2
n iar


2
1
2
2 2
n
i
X x

este
repartizat ( ) 1
2
2
n , deci T este repartizat ( ) 2
2 1
+ n n T i



= =


+ +
1
2 2
1
2
1 , 2
2
, 2
2 1 2 1
n n n n
t T t P
Deoarece repartiia Student este simetric
2
1 , 2
2
, 2
2 1 2 1

+ +
=
n n n n
t t rezult c
2 1 2
1 , 2
2 1 2 1
2 1 2
1 , 2
2 1
1 1 1 1
2 1 2 1 n n
s t X X
n n
s t X X
p
n n
p
n n
+ +
+ +



Deci,
( )

+ + + =
+ +
2 1 2
1 , 2
2 1
2 1 2
1 , 2
2 1 2 1
1 1
,
1 1
,
1
2 2 1 n n
s t X X
n n
s t X X
p
n n
p
n n

cu eroarea
2 1 2
1 , 2
1 1
2 1 n n
s t E
p
n n
+ =
+

.
















II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

52
2.4.3. Estimarea intervalelor de ncredere pentru dispersie
Considerm o selecie de volum n dintr-o populaie normal ( )
2
, N .
Conform celor artate anterior variabila aleatoare
( )
2
2
1

s n
v

= este
repartizat ( ) 1
2
n i ca urmare




= =



1
2 2
1
2
2
1 , 1
2
2
, 1 n n
v P
Deci, ( )
2
2
1 , 1
2
2
2
2
, 1
1



n n
s
n si
( ) ( )
2
2
, 1
2
2
2
2
1 , 1
2
1 1

n n
s n s n
.




2.4.4. Estimarea intervalului de ncredere pentru raportul a dou
dispersii
Se consider selecia aleatoare
1
1 12 11
,..., ,
n
x x x dintr-o populaie ( )
2
1 ,
, N i
o selecie
2
2 22 21
,..., ,
n
x x x dintr-o populaie ( )
2
2 2
, N .
Conform cu cele artate anterior, raportul
2
2
2
2
2
1
2
1

s
s
F = este repartizat
( ) 1 , 1
2 1
n n F i deci


= =



1
2 2
1
2
1 , 1 , 1
2
, 1 , 1
2 1 2 1
n n n n
f F f P
Rezult c
2
1 , 1 , 1
2
1
2
2
2
1
2
2
2
, 1 , 1
2
1
2
2
2 1 2 1



n n n n
f
s
s
f
s
s
, iar intervalul de
estimaie pentru raportul dispersiilor este:
( )

=

2
1 , 1 , 1
2
1
2
2
2
, 1 , 1
2
1
2
2
2 1 2 1
, ,

n n n n
U L
f
s
s
f
s
s




II. STATISTIC MATEMATIC I BIOSTATISTIC
TEOREMA LIMITA CENTRALA

53
2.4.5. Aplicaie: Utilizarea intervalelor de ncredere n studiile de
comparare a biodisponibilitii medicamentelor
1

La introducerea n terapie de ctre un productor a unui medicament
ce reprezint o reproducere a altui medicament deja n uz, se pune problema
comparrii biodisponibilitii acestora. n practic se cere ca raportul ariilor
de sub curbele concentraiilor plasmatice ale celor dou medicamente s se
afle in intervalul 0,8 - 1,25.
0, 8 1, 25
T
AUC
R
AUC


unde indicele T se refer la medicamentul testat i R desemneaz
medicamentul referin.
Atunci ns cnd ariile de sub curb prezint variabiliti intra i
interindividuale considerabile (determinrile de biodisponiblitate se fac pe
loturi de circa 10 20 de voluntari sntoi) este de preferat a se determina
un interval de ncredere pentru media ariei realizat de medicamentul nou.
Pornind de la faptul ca
( )
( )
1 1
R T R T
p
R T
X X
T
s
n n

=
+
este repartizat
( ) 2
R T
T n n + se deduce un interval de ncredere cu probabilitatea 1
pentru
T R

1 1
2 2
T R T R
T R
X X t X X t



+
unde am notat
1 1
p
R T
s s
n n
= + .
Dup cum se va arta mai departe, aceast estimare este puin util
n caz c
p
s reprezint practic intervariabilitatea, iar interschimbabilitatea
care necesit bioechivalen trebuie s se bazeze pe intravariabilitatea.





1.
W.J.Westlake: Use of confidence intervals in analysis of comparative
biovalability trials, J. Pharm. Sci. , 61 (8), 1340 1, 1972.



II. STATISTIC MATEMATIC I BIOSTATISTIC
VERIFICAREA IPOTEZELOR STATISTICE

55
2.5. Verificarea ipotezelor statistice

Ipoteze statistice
Ipotezele statistice sunt ipoteze asupra repartiiei unor variabile
aleatoare. Ele se refer fie la parametrii repartiiei, fie la legea propriu zisa
de repartiie.
Teste statistice
Metodele de verificare a ipotezelor se bazeaz pe teste statistice care
constau n examinarea seleciilor obinute pentru o variabil aleatoare i a
unor funcii de elementele seleciilor.
Notaii conventionale
Ipoteza testat, presupus adevarat, se numete ipoteza nul i se
noteaz H
0
. Testarea necesit i formularea unei ipoteze complementare,
numit ipotez alternativ i notat H
A
. Dac se accept H
0
, n mod normal
se respinge H
A
i invers.
Din acest motiv, ipotezele H
0
si H
A
se aleg s fie complementare.
Dac testul privete valoarea unui parametru , de exemplu
0 0
: = H i
1
: =
A
H se poate ntmpla ca toi ceilali parametri ce
caracterizeaz distribuiile s fie cunoscui i, dup acceptarea uneia din cele
dou ipoteze, distribuiile ( )
0
, x i ( )
1
, x devin complet definite. n
acest caz, ipotezele sunt numite simple. Dac ns ceilali parametric nu
sunt cunoscui complet, ipotezele se numesc ipoteze compuse. De
exemplu, dac distribuia este normal i parametrul cautat este , iar
dispersia este necunoscut, suntem n cazul unei ipoteze compuse.

Probabilitatea unei decizii gresite
La verificarea ipotezelor se pot comite dou feluri de erori:
1. Erorile de tipul 1 constau n respingerea ipotezei H
0
atunci cnd
aceasta este adevrat.
2. Erorile de tipul 2 constau n acceptarea ipotezei H
0
atunci cnd
aceasta este fals.
Probabilitatile celor dou tipuri de erori se noteaz de obicei cu respectiv
:
= P (respinge H
0
/ H
0
adevrat)
= P (accept H
0
/ H
0
fals) = P (respinge H
A
/ H
A
adevrat)
Deci, este riscul de a respinge n mod greit H
0
i este riscul de a
respinge n mod greit H
A.

II. STATISTIC MATEMATIC I BIOSTATISTIC
VERIFICAREA IPOTEZELOR STATISTICE

56
Probabilitatea de a respinge ipoteza H
0
atunci cnd aceasta este fals
=1 se numete puterea testului. Coeficientul este numit i nivel de
semnificaie. Desigur c este de dorit ca valorile i s fie ct mai mici.
Valoarea lui se alege i n funcie de importana implicaiilor acceptrii
sau respingerii ipotezelor testate. De exemplu, un coeficient de 0,05 este
considerat ca bun pentru majoritatea problemelor din practic. Dac ns
este vorba de un medicament foarte activ cum ar fi digoxina, este de preferat
a alege ntre 0,01 si 0,05.
Pentru a verifica o ipotez se folosesc datele de selecie pentru
calcularea unui test statistic. Domeniul de valori ale testului care corespunde
respingerii ipotezei H
0
cu probabilitatea se numete regiune critic.
Metodologia de verificare cuprinde n principiu urmtoarele etape:
1. se presupune, pe baza unor teste anterioare sau pe baza structurii
fenomenului studiat, o repartiie pentru populaia statistic din care
se face selectia;
2. se formuleaz ipoteza;
3. se calculeaz valoarea testului ales i se compar cu limitele de
acceptare, respectiv respingere;
4. se accept sau se respinge, n funcie de rezultat, ipoteza H
0
.



















II. STATISTIC MATEMATIC I BIOSTATISTIC
VERIFICAREA IPOTEZELOR STATISTICE

57
2.5.1. Ipoteze asupra mediei

2.5.1.1.Dispersia cunoscut
Se consider o selecia dintr-o populaie normal ( )
2
, N . Considerm
variabila aleatoare X . Datorit linearitii operatorului de mediere avem:
( )
( )

= =

=

n
n
n
x M
n
x
M X M
n
i
n
i
1 1

Pentru dispersia lui X inem cont c ( ) ( ) x D a b ax D
2 2 2
= + i c
rezultatele x
i
reprezint variabile aleatoare independente
( ) ( ) ( )
j i j i
x D x D x x D
2 2 2
+ = + .
n aceste condiii se obine
( )
n n
n
n
x D
n
x
D
n
i
n
i
2
2
2
2
1
2
1 2

= = =



Ca urmare a teoremei limit central, variabila aleatoare
( )
( )
n
X
X D
X E X

este repartizata ( ) 1 , 0 N .
Avem n acest caz, dac vom alege un risc , ipotezele i criteriile de
acceptare sau respingere conform cu tabelul de mai jos:

Tabelul nr. 2:
H
0
H
A
Regiunea critic
2
1

z z
0
=
0

2
1

z z
0
=
0

1
z z
0
=
0

1
z z






II. STATISTIC MATEMATIC I BIOSTATISTIC
VERIFICAREA IPOTEZELOR STATISTICE

58
2.5.1.2.Dispersia necunoscut
n acest caz se nlocuiete n formula anterioar cu estimaia sa
x
s i se ine cont c variabila aleatoare
n
s
X
T

= este repartizat Student
cu n-1 grade de libertate.
































II. STATISTIC MATEMATIC I BIOSTATISTIC
VERIFICAREA IPOTEZELOR STATISTICE

59
2.5.2. Ipoteze asupra diferenelor a dou medii

2.5.2.1.Cazul cnd se cunosc dispersiile
Se consider dou populaii normale ( )
2
1 1
, N i ( )
2
2 2
, N , o selecie
aleatoare din
1
1 12 11
,..., ,
n
x x x din populaia ( )
2
1 1
, N i o selecie aleatoare
2
2 22 21
,..., ,
n
x x x din populaia ( )
2
2 2
, N .
Variabila aleatoare
( ) ( )
( )
( ) ( )
2
2
2
1
2
1
2 1 2 1
2 1
2 1 1
n n
X X
X X D
X X
z


+

=


= este, dupa cum s-a
aratat anterior, repartizat N(0,1).

2.5.2.2.Cazul dispersiilor necunoscute, dar presupuse egale
n cazul n care nu cunoatem dispersiile dar tim c sunt egale
2 2
2
2
1
= = utilizm dispersia ponderat de selecie

( ) ( )
( ) ( )
2 2
1 1
2 1
1 1
2
2
2
1 1
2 1
2
2 2
2
1 1 2
1 2
+
+
=
+
+
=

n n
X x X x
n n
s n s n
s
n n
i i
p

ca un estimator nedeplasat pentru
2
.
Dup cum s-a artat anterior, mrimea
( ) ( )
2 1
2 1 2 1
1 1
n n
s
X X
T
p
+

=

este
repartizat ( ) 2
2 1
+ n n T

2.5.2.3.Cazul observaiilor perechi
In cazul cnd observaiile formeaz n mod natural perechi, cum ar fi de
exemplu cnd se msoar concentraiile n n probe, fiecare din ele cu dou
metode diferite sau cazul cnd dou medicamente se administreaz unui
aceluiai lot de voluntari, n dou perioade diferite.
Considerm n acest caz variabila aleatoare
2 1
X X d = .
n cazul n care seleciile aparin la aceiai populaie, media lui d va fi
zero: ( ) 0 = d E .
II. STATISTIC MATEMATIC I BIOSTATISTIC
VERIFICAREA IPOTEZELOR STATISTICE

60
Cnd se cunosc dispersiile avem ( )
n n
d D
d
2
2
2
1 2

+ = = i variabila
aleatoare
d
d

este repartizat ( ) 1 , 0 N .
Cnd nu se cunosc dispersiile se folosesc dispersiile de selecie i se ine
cont c variabila aleatoare
n
s
d
d
dup cum se poate arta uor, este
repartizat Student cu n-1 grade de libertate.

2.5.2.4. Compararea proporiilor
Dac vom considera un experiment n care rspunsul este de tip da sau
nu, de exemplu vindecare sau nevindecare, supravieuire sau moarte, etc.,
numrul de rezultate k de un anumit tip n n repetri ale experimentului este
o variabil aleatoare repartizat binomial.
Deoarece avem, dup cum s-a calculat anterior ( ) np k E = i
( ) npq k D = , variabila aleatoare standardizat
( )
( )
n
pq
p
n
k
npq
np k
k D
k E k
z

= se aproximeaz ca fiind normal repartizat.


Fie dou populaii de tip urna Poisson cu bile albe i bile negre, cu
parametrii (probabilitatea bilei albe)
1
p i respectiv
2
p . n dou selecii din
cele dou populaii, de volum
1
n i respectiv
2
n presupunem c s-a obinut
rspuns pozitiv de
1
k i respectiv
2
k ori.
Fie 2 , 1 , = = i
n
k
h
i
i
i
. n cazul ipotezei nule p p p H = =
2 1 0
: , variabila
aleatoare
2 1
h h va fi distribuit cu media 0 i dispersia
( )
( ) ( )
( )

=
2 1 2
2 2
1
1 1
2 1
1 1
1
1 1
n n
p p
n
p p
n
p p
h h D
II. STATISTIC MATEMATIC I BIOSTATISTIC
VERIFICAREA IPOTEZELOR STATISTICE

61
n aceste condiii se aproximeaz c variabila aleatoare
( )

2 1
2 1
1 1
1
n n
p p
h h
va fi repartizat ( ) 1 , 0 N .
O estimare natural a lui p este
2 1
2 1
n n
k k
p
+
+
= .
O mbuntire a aproximrii se poate obine prin introducerea unor
corecii de continuitate pentru
1
h i
2
h :
( )

=
2 1
2
2
1
1
1 1
1
2
1
2
1
n n
p p
n
h
n
h
z
























II. STATISTIC MATEMATIC I BIOSTATISTIC
VERIFICAREA IPOTEZELOR STATISTICE

62
2.5.3. Estimarea dispersiei
Considerm o selecie de volum n dintr-o populaie normal ( )
2
, N .
Conform celor artate anterior variabila aleatoare
( )
2
2
1

s n
v

= este
repartizat ( ) 1
2
n .

2.5.3.1.Estimarea raportului a dou dispersii
Se consider selecia aleatoare
1
1 12 11
,..., ,
n
x x x dintr-o populaie
( )
2
1 1
, N i o selecie aleatoare
2
2 22 21
,..., ,
n
x x x dintr-o populaie
( )
2
2 2
, N .
Conform cu cele artate anterior, raportul
2
2
2
2
2
1
2
1

s
s
F = este repartizat
( ) 1 , 1
2 1
n n F .
Se calculeaz
2
2
2
1
s
s
F = lundu-se
2
2
2
1
s s .
( )
( ) ( ) ( ) [ ]
( ) ( )( ) ( )
( ) ( )
2
1
2
2
1
2
2
1
2
2
2
1
2
2
1
2
2
2
2
1


=

=
=
+
=
=

=


n
X x
X n x
X n n X n X x
X x X x
s n
v
n
i
n
i
n
i
n
i
n
i




Dar


i
x
este repartizat N(0,1) cci
( )
0 =

i i
x E x
E i
1
2
=

i
x
D
Deci v este o sum de n-1 ptrate de variabile de tip N(0,1).
II. STATISTIC MATEMATIC I BIOSTATISTIC
VERIFICAREA IPOTEZELOR STATISTICE

63
2.5.3.2.Compararea mai multor dispersii.
a) Testul Bartlett pentru verificarea omogenitii dispersiilor
Fie m estimri independente
m
s s s ,..., ,
2 1
pentru dispersiile
m
,..., ,
2 1

pe baza unor selecii de volume
m
n n n ,..., ,
2 1
.
Se pune problema verificrii ipotezei privind egalitatea acestor dispersii
2 2
2
2
1 0
... :
m
H = = =
n acest caz Bartlet a artat c variabila aleatoare
( )
( )
( )

=
m k
i
k
i i
i
s
s
s k s k
1
2
2
2 2
ln ln ln 303 , 2
unde 1 =
i i
n k ,

=
i
k k i s dispersia ponderat a ntregului set de date,
este repartizat ( ) 1
2
m .

b) Testul rapid Cochran pentru selecii de acelai volum
Daca selectiile considerate au acelasi volum n n n n
k
= = = = ...
2 1
,
atunci se calculeaza valoarea

=
k
i
s
s
G
1
2
2
max
max
care se compar cu o valoare
maxim admis pentru acceptarea ipotezei nule.
In formula de mai sus avem:
( )

=
n
j
i ij i
x x
n
s
1
2
2
1
1
si
2
1
2
max
max
i k i
s s

=
Ipoteza
0
H se respinge daca ( ) c G
max
unde ( ) c se gaseste din
tabelele Cochran la perechea ( ) 1 , n k grade de libertate si la
probabilitatea ( ) ( ) = 1
max
c G P .

c) Testul Hartley
Daca selectiile au acelasi volum se poate aplica pentru 12 k testul
2
2
min
max
i
i
calc
s
s
H =
iar ipoteza
0
H se respinge daca ( ) H H
calc
unde ( ) H se gaseste din
tabelele Hartley la probabilitatea ( ) ( ) = 1
max
H H P .

II. STATISTIC MATEMATIC I BIOSTATISTIC
VERIFICAREA IPOTEZELOR STATISTICE

64
2.5.4. Aplicaie: Utilizarea testului t n analiza comparativ a
medicamentelor
n compararea mediilor am utilizat testul t, numit i testul Student.
Deoarece acesta este poate cel mai utilizat n analiza medicamentelor, vom
face cteva consideraii asupra aplicrii practice a acestuia.
La compararea efectului a dou medicamente, la compararea
rezultatului determinrilor analitice cu valoare impus de standardul de
control asupra medicamentului precum i n multe alte situaii, apar
rezultate diferite acolo unde ne ateptm ca acestea s fie egale. Ne punem
ntotdeauna problema dac, diferenele constatate n practic sunt
semnificative sau nu. Deoarece rezultatele provin din testarea unor
eantioane reduse, nu putem fi niciodat siguri n ceea ce privete parametrii
ntregii populaii. Totui, asumndu-ne un risc mai mare sau mai mic,
trebuie s lum decizii.
Dac, de exemplu, dozm cantitatea de substan activ din 10
comprimate care provin dintr-o arj de 1.000.000 de comprimate, alegerea
celor 10 comprimate se presupune c s-a fcut aleator i ele reprezint un
eantion reprezentativ pentru ntreaga arj. Problema este dac, n funcie
de valoarea medie a coninutului pentru cele 10 comprimate i variabilitatea
celor 10 valori, putem spune, asumndu-ne un anumit risc, c valoarea
medie a concentraiei n substana activ pentru tot lotul este cea declarat.
n acest caz aplicarea testului t n verificarea ipotezei asupra mediei, aa
cum s-a artat mai sus, este imediat.
La compararea mediilor a dou selecii independente, numite n
experimentele cu medicamente grupuri paralele, o atenia deosebit
trebuie acordat verificrii independenei efective a acestora. De exemplu la
testarea efectelor unui medicament asupra unui grup de pacieni n
comparaie cu un alt grup ce se numete placebo, trebuie avut n vedere c
pacienii s nu se influenteze ca urmare a discuiilor ntre ei. Dac loturile
sunt de animale ce triesc n aceiai cuc, medicamentul poate favoriza sau
din contra, defavoriza un grup n lupta animalelor pentru hran i adaug
efecte suplimentare asupra rezultatelor finale ale testului.
n sfrit, un caz foarte frecvent n testrile comparative ale efectelor
sau nivelelor plasmatice ale medicamentelor, este acela al observaiilor
pereche, cnd lotul de subieci tratai se constituie ca propriul martor.
Acestea ofer unele avantaje asupra experimentului pe grupuri paralele.
n primul rnd, n experimentul pe grupe paralele, variabilitatea
rezult din diferenele de rspuns la medicament ntre cele dou grupuri, aa
numita intervariabilitate. n experimentul pereche apare
II. STATISTIC MATEMATIC I BIOSTATISTIC
VERIFICAREA IPOTEZELOR STATISTICE

65
intravariabilitatea, variabilitatea n rspunsul aceluiai subiect la dou
tratamente diferite i avem motive s presupunem c aceasta este mai mic,
de regul dect intervariabilitatea. Teoretic, intervariabilitatea include i
intravariabilitatea i deci nu poate fi mai mic dect aceasta. Din aceste
motive, testul pereche ofer avantajul unei variabiliti mai mici.
Testul pereche ofer apoi avantajul c lotul poate fi mai mic. n
experimentul pe grupe paralele, de exemplu dou loturi de 10 subieci
primesc dou medicamente diferite. n experimentul pereche numai 10
subieci pot primi n prima administrare un medicament i n a doua
perioad al doilea medicament.
Desigur c acest cuplare nu este ntotdeauna posibil. Cnd dozm
cantitatea de substan activ din comprimate sau determinm timpul de
dizolvare, acestea sunt consumate n timpul testrii.
Trebuie menionat c testul pereche prezint dezavantajul c ntre
cele dou tratamente trebuie s existe o perioada destul de lung pentru ca
primul medicament administrat s se elimine din organism care, n cazul
medicamentelor cu timp de njumtire mare cum ar fi de exemplu
piroxicamul, depete 30 de zile, in cazul clomifenului sau al penicilinei
retard fiind nevoie de perioada intre cele doua administrari, de mai multe
luni. n aceste situaii se prelungete destul de mult timpul pentru
definitivarea studiului.
Deasemenea, efectul primului medicament, n cazul c
experimentele se fac pe pacieni, poate duce la o mbuntire a strii de
sntate a acestora i la o modificare considerabil a rspunsului la al doilea
tratament.

















II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE NEPARAMETRICE

67
2.6. Teste neparametrice

Testul t pentru compararea mediilor depinde, n special pentru
seleciile de volum mic, de ipoteza c cele dou populaii sunt distribuite
aproximativ normal i c dispersiile sunt practic egale.

De regul, tehnicile statistice care se ocup de variabilele continue
se bazeaz pe ipoteza c variabila aleatoare are o distribuie normal de
baz. Ipoteza nu este att de restrictiv, deoarece de multe ori este posibil s
o modificm astfel nct s obinem alta, aproximativ normal distribuit.
Suplimentar, dac vom considera mediile, n concordan cu teorema limit
central, distribuia mediei probelor se aproprie cu att mai mult de
distribuia normal, cu ct crete volumul probelor.

i astfel, ca o concluzie practic, erorile se datoreaz mai curnd
lipsei de constan a dispersiei sau lipsei de independen a variabilelor
dect deviaiilor de la normalitate.

Pentru cazurile cnd nu stim distribuia variabilei, o cale alternativ
este s aplicm teste care nu necesit ipoteze despre tipul de distributie.

Testele independente de distributie, numite i teste de rang,
nlocuiesc valorile variabilei cantitative observate cu rangurile lor. Testele
neparametrice sunt valabile i pentru variabile normal distribuite, dar sunt
mai puin eficiente, pentru acelai prag de semnificaie fiind necesare
eantioane mai mari dect pentru testele parametrice.

In acelasi timp este de retinut ca testele neparametrice nu sunt un
paraceu universal: aplicarea lor este posibila atunci cand sunt continue si
independente.









II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE NEPARAMETRICE

68
2.6.1. Media i dispersia eantioanelor dintr-o populaie finit.

S considerm o populaie finit de N elemente, la care asociem
numerele
N
x x x ,..., ,
2 1
. Dac presupunem c toate elementele au aceeai
probabilitate
N
1
, putem calcula media i dispersia populaiei:
(1) ( )

= = =
N
i i
N
i
x
N
p x X E
1 1
1

i
(2)
( ) ( ) ( ) ( ) ( )
( )



= |

\
|
=
= =
= = = =
j i
j i
N
i
j i
j i
N
i
N
i
N
i
N
i i i
N
i
x x
N
x
N
N
x x
N
x
N N
x
N
x
N
p x p x X E X E X D
2 1
2
2 2 1
2
2
2
1 2 1
2
2
1 1
2 2 2 2
2 1 2 1 1
1 1



Multimea tuturor seleciilor posibile de mrimea n din populaie va include:
( )
n n
x x x x , ,..., ,
1 2 1

( )
1 1 2 1
, ,..., ,
+ n n
x x x x
.
.
.
( )
N n N n N
x x x ,..., ,
2 1 + +

Aceste probe sunt formate prin alegerea a n elemente din N. Exist
n
N
C ci de a alege o astfel de prob. nc o dat, presupunem c fiecare
prob are aceeai probabilitate de a fi selectat,
n
N
C
1
.
S considerm media seleciei j:

=
=
n
i
ji j
x
n
X
1
1
i s considerm
variabila aleatoare ( )
n
N
C j
j
X X
, 1 =
=



II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE NEPARAMETRICE

69
Valoarea medie a variabilei X este
( )
( ) ( )
( )
(
(
(
(

+ + +
+ + + + + + + + + +
=
= = =
+ +
+
= =

N n N n N
n n n n
n
N
C
j
j
n
N
j
C
j
j
x x x
n
x x x x
n
x x x x
n
C
X
C
p X X E
n
N
n
N
...
1
...
1
...
1
1
1
2 1
1 1 2 1 1 2 1
1 1

Acum s considerm de cte ori intr n sum orice
i
x particular, s
spunem
1
x . Probele care conin
1
x se obin prin selectarea a (n-1) alte
elemente din populaia disponibil de (N-1) elemente i, aceasta se poate
face n
1
1

n
N
C moduri. Vor fi deci
1
1

n
N
C probe coninnd
1
x i la fel se aplic
pentru fiecare
i
x .
( )
( )
( ) ( )
1
1
! ! 1
! 1
! !
!

=
n
N
n
N
C
n
N
n N n
N
n
N
n N n
N
C
n consecin
(3) ( ) = = |

\
|
=

N
i
N
i
n
N
n
N
x
N
x C
n C
X E
1 1
1
1
1 1 1

ceea ce nseamn c media mediei probei este egal cu media populaiei.
Pentru calcularea dispersiei folosim identitatea
(4) ( ) ( ) ( )
2
2
X E X E X D |

\
|
=
S considerm ( )

= =
= =
n
N
n
N
C
j
j
n
N
j
C
j
j X
C
p X X E
1
2
1
2
2
1

Mai departe
( ) ( )
2
2 1
2
1 2 1
1
2
...
1
... ...
1
(

+ + + + +
(

+ + + + =
+ +
=
N n N n N n n
C
j
j x x x
n
x x x x
n
X
n
N

Cnd ridicm la ptrat fiecare termen, fiecare
i
x va deveni
2
i
x i,
dup cum vedem, fiecare
i
x apare de
1
1

n
N
C ori. Astfel
(5) ( )
2 2
2
2
1
1
1
2
1
2
...
1
N
n
N
C
j
j x x x C
n
X
n
N
+ + + =


II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE NEPARAMETRICE

70
Ridicarea la ptrat a sumei d deasemenea termeni de forma
j i
x x i
fiecare termen va apare de
2
2

n
N
C .
n consecin, putem scrie
(6)
( ) ( )
(

+ + + + + + =

=
N N
n
N N
n
N
n
N
C
j
j
n
N
x x x x C
n
x x x C
n C
X
C
n
N
1 2 1
2
2
2
2 2
2
2
1
1
1
2
1
2
...
2
...
1 1 1

Pentru a nlocui n (4) punem ( ) ( )
2
X E n forma:
(7)
( ) ( ) ( )
( )
2
1 2 1
2
2 2
2
2
1
2
1 2 1
2
... 2 ...
...
1
N
x x x x
N
x x x
x x x x
N
X E
N N n
N N

+ +
+
+ + +
=
=
(

+ + + + =

Substituind (6) i (7) n (4) , obinem:
(8)
( ) ( )
( )
N N
n
N
n
N
N
n
N
n
N
x x x x
N
C
n C
x x x
N
C
n C
X D
1 2 1
2
2
2
2
2 2
2
2
1
2
1
1
2
...
2 2 1
...
1 1 1

+ +
|
|

\
|
+
+ + + +
|
|

\
|
=

Coeficientul lui ( )
2 2
2
2
1
...
N
x x x + + + se poate scrie ca
( )
1 1
1 1 2 2 2 2 2 2
1
1
2
1 1 1 1 1 1 1 1
1
1
n n
N N n
n
N
N
N n
C C
N
C n N n N nN N nN
C
n
N n N
n N N

= = = =

=


i coeficientul lui ( )
N N
x x x x
1 2 1
...

+ + este
( )
( )
( )
( ) ( ) 1
2 2
1
1 2 2 2
1
1
1
2 2 2
2
2
2
2
2

N n
n N
N N N nN
n
N
C
n
n n
N N
C
n
N
n
N

Apoi substituind aceste rezultate n (8), obinem:

(9) ( )
( )
( )
( ) ( )
)
`

+ + + + +

=
N N N
x x x x
N
x x x
N
N
N n
n N
X D
1 2 1
2
2 2
2
2
1
2
...
2
...
1
1

II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE NEPARAMETRICE

71
Partea din { } este exact
2
, astfel nct

(10)
( )
2 2
1
1
1 1
N n n
D X
n N n N
| |
= =
|

\

Observam ca avem aparent o contradictie cu regula:
( )
( )
2 2
2 2
1
i
i
x
n
D X D D x
n n n n

| |
= = = =
|
|
\



In fapt, in aceasta regula X este media unui experiment repetat de n
ori, de exemplu, extragerea consecutive, una cate una a n bile, pe cand X
de mai sus semnifica extragerea a n bile dintr-odata.
Este de notat c dac N , atunci dispersia lui
n
X
2

, forma
ei obinuit pentru o populaie infinit, sau pentru experimentul de tip
extracie din urn cu ntoarcerea bilelor extrase n urn.






















II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE NEPARAMETRICE

72
2.6.2. Testul de rang Wilcoxon

Testul de rang Wilcoxon
1
este un test cu ipoteza nul c dou
populaii sunt identice, fat de ipoteza alternativ c ele difer printr-o
translaie linear. Testul nlocuiete observaiile prin rangurile lor. Rangurile
sunt repartizate la valorile din selecii n ordinea creterii mrimii fr s
in cont de probele crora le aparin.
S presupunem c o prob este de mrime n i alta de mrime N-n.
Testul presupune c orice combinaie de ranguri n aceste dou grupuri este
egal probabil. Numrul total de moduri de grupare a rangurilor este
n
N
C .
Consideram urmatorul exemplu
Nivelele plasmatice maxime ale ionului
4
EDTA dup administrare
i.m.
Tabelul 3.
Voluntar CE IA BL PM MC DP SL
Prima zi 33,3 25,1 22,8 32,4 23,7 48,33 33,04
rangurile 9 3 1 7 2 11 8
a-3-a zi 25,4 31,2 28,4 39,2
rangurile 4 6 5 10


Privind rezultatele n a treia zi de tratament la proba de mrime n,
suma rangurilor este 4+6+5+10=25. Combinaiile de ranguri pentru care
putem obine o sum a rangurilor mai mic dect aceasta, pentru un n = 4
dat sunt
1+2+3+4=10, 1+2+3+5=11, 1+2+3+6=13, 1+2+3+7=14,
1+2+3+8=15 etc.
Dup cum se poate vedea nu este uor s calculm toate
posibilitile, astfel nct vom folosi faptul c media rangurilor unei probe
este distribuit aproximativ normal cu parametri care sunt calculati n
continuare.
Sunt disponibile tabelele care dau limitele de acceptare a ipotezei
0
H pentru suma obinut, ca o funcie de n, N i riscul asumat. Pentru
exemplul nostru gsim n tabele, pentru 05 , 0 = , 4
1
= n i 7
2
= n
intervalul 11 25.
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE NEPARAMETRICE

73
Fie R suma rangurilor i R media rangurilor probei de mrime n.
Conform (1), valoarea medie a lui R este ( )

=
N
i
x
N
R E
1
1
.In cazul nostru
i
x sunt rangurile de N valori nsemnnd numerele 1,2,.,N. n consecin
( ) ( )
( )
( )
2
1
2
1 1
... 2 1
1 1
1
+
=
+
= + + + = =

N
R E
N N
N
N
N
x
N
R E
N
i

Calculul lui
2
d:
( ) ( ) ( ) ( ) ( )
( )
( )( ) ( )
12
1
2
1 1
6
1 2 1 1 1 1
1 1
2
2
2
2
1 2 1
2
2
1 2 1
2 2 2 2

= |

\
| +

+ +
= =
= = = =


N N N
N
N N N
N
i
N
i
N
x
N
x
N
X E X E X D
N N
N
i
N
i


Dispersia lui R se obine prin nlocuirea lui n (10)
(11) ( )
( )( )
n
n N N
N
n N
n
N
N
n
n
R D
12
1
1 12
1
1
1
1
2 2
+
=


= |

\
|

=


n concluzie, variabila aleatoare
( )
( )
( )( )
n
n N N
N
R
R D
R E R
12
1
2
1
+
+

va fi
repartizat aproximativ ( ) 1 , 0 N .
Intr o notatie alternativa N poate fi notat cu
1 2
n n + , n cu
1
n si Nn
cu
2
n obtinandu-se:
( )
1 2
1 2 2
1
1
2
1
12
n n
R
z
n n n
n
+ +

=
+ +

Se mai utilizeaza si alta forma a formulei. Se amplifica cu
1
n , se
obtine
1
Rn R = si
( )
( )
1 1 2
1 2 1 2
1
2
1
12
n n n
R
z
n n n n
+ +

=
+ +

II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE NEPARAMETRICE

74
Kruskal si Wallis
2
au observat ca aproximaia este mbuntit cnd
valoarea este mai mare de 0,02 prin aducerea lui R mai aproape de media
lui cu
n 2
1
.
n literatura medical i biologic testul se mai numete Mann
Whitney i se utilizeaz notaiile
1
n n = i
2
n n N = (
2 1
n n ).
Cnd cel puin unul din numerele
1
n i
2
n sunt mai mici dect 10,
distribuia de probabilitate a sumei rangurilor positive R se poate calcula
direct. Intervalele de ncredere cu diverse probabiliti (0,95; 0,99; etc.)
pentru R se gsesc n tabele.
In exemplul nostru n = 4, N = 11, R = 25, 25 , 6
4
25
= = R i
( )( ) ( )( )
19 , 0
4
7
25 , 0
4 * 12
4 11 1 11
2
1 11
25 , 6
12
1
2
1
= =
+
+

=
+
+

=
n
n N N
N
R
z
Valoarea obinut ne asigur c nu apare o acumulare a EDTA la
orice nivel de risc din cele uzual utilizate.
Dac facem corecia pentru continuitate
( )( ) ( )( )
285 , 0
4
7
375 , 0
4 * 12
4 11 1 11
8
1
2
1 11
25 , 6
12
1
2
1
2
1
= =
+
+
+

=
+
+
+

=
n
n N N
n
N
R
z
concluzia nu se schimba.












II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE NEPARAMETRICE

75
2.6.3. Ajustarea pentru valori egale n testul Wilcoxon

Dac apar egaliti, o alternativ pentru neglijarea lor este de a
repartiza la aceste observaii media rangurilor pe care le-ar fi primit dac nu
erau egale.
S considerm un grup de k egaliti. Numerele ntregi m+1, m+2,
, m+k sunt nlocuite cu media lor.
( ) ( ) ( )
( )
2
1
2
1
... 2 1 +
+ =
+
+
=
+ + + + + + k
m
k
k k
km
k
k m m m

Suma ptratelor ( )
2 2
2
2
1
...
N
x x x + + + este astfel redus prin
( ) ( ) ( )
( )
( ) ( ) ( )
( )
( ) ( )( )
( )
( )
( )
( )
( ) ( )
12 12
1 1
3 3 2 4
12
1
4
1
1
6
1 2 1
2
1
2
4
1
1 ... 2 1 ... 2 1 2
2
1
... 2 1
2
2
2 2 2 2 2
2
2 2 2
T k k k
k k
k k
k k
m k k
k k k
m
k k
k k
k km km k m k km
k
m k k m m m
=
+
= +
+
==
+
+
+ +
+
+
=
=
+
+ + + + + + + + +
=
(

+
+ + + + + + +
Suma rangurilor rmne neschimbat.
Astfel
( )
( )( ) ( )
( )( ) ( )
( )( ) ( )
N
T N N
N
T N N N N
N
N N T N N N
N N
N
T N N N
N
x
N
x
N
N
i
N
i
12
1
12
3 3 2 4 1
12
1 3 1 2 1 2
2
1 1
12 6
1 2 1 1 1 1
2
2
2
2
2
1 2 1
2 2

=
+ +
=
=
+ + +
=
=
(

+
|

\
|

+ +
= =


i
( )
( )
1 12
1
2


=
n
n N
nN
T N N
R D



II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE NEPARAMETRICE

76
2.6.4. Teste referitoare la perechi de observaii

a) Testul semnelor

S considerm nivelele plasmatice maxime
i
x ale unui medicament
dup o prim administrare la un numr de n voluntari sntoi i
i
y nivelele
plasmatice maxime dup trei zile de tratament. Fie ( ) y x, probabilitatea de
apariie a valorilor x i y. Dac medicamentul nu se acumuleaz n
organism, cele dou seturi de concentraii sunt selecii ale aceleiai populaii
i ( ) ( )
i i i i
x y y x , , = pentru toate perechile.

Aceasta implic simetria lui ( ) y x, fa de linia 0 = x y .
S definim variabila aleatoare x y z = .
Avem c ( ) ( )
2
1
= = x y P x y P sau ( ) ( )
2
1
0 0 = = x y P x y P care
este mai departe echivalent cu ( ) ( )
2
1
0 0 = = z P z P . Astfel z va avea o
median zero.
Mai departe definim variabilele
i
z dup cum urmeaz
1 =
i
z pentru 0
i
z
i 0 =
i
z pentru 0
i
z .
Presupunem continuitatea distribuiei de grup original ( ) y x, , z va fi
deasemenea continu, i interseciile (cazurile
i i
y x = ) vor avea
probabilitatea zero.
i
z sunt independente, astfel nct suntem n situaia binomial de a face
n ncercri independente, probabilitatea de success 1 =
i
z fiind
2
1
la fiecare
ncercare. Astfel,

n
i
z
1
are o distribuie binomial cu parametrii
2
1
= p i
n.
Distribuia de grup ( ) y x, poate fi diferit n fiecare ncercare, ns de
fiecare dat ( )
2
1
1 = =
i
z P i astfel distribuia lui

n
i
z
1
va fi neschimbat.
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE NEPARAMETRICE

77
Alternativa ipotezei nule este ca n locul lui
i
x s avem
i i i
d x x =

,
ceea ce nseamn c fiecare
i
x descrete cu o cantitate
i
d , unde 0
i
d . n
acest caz ( ) y x , nu va mai fi simetric, ci deplasat spre stnga i
( )
2
1
0 0 |

\
|

= |

\
|

=
i i i i i
x y P x y P z P .
Astfel, ( ) 0
i
z P nu va mai fi n mod necesar constant i distribuia lui

n
i
z
1
nu va mai fi o distribuie binomial.
Testul semnelor, d pentru probabilitatea a k diferene pozitive

= =

=
= =
= = |

\
|
|

\
|
= |

\
|
=
k n
j
j
n
n
n
k i
i n
n
n
n
k i
i
n
n
i n i
i
n
n
k i
i
n
i
C C
C C z p
n
k
z P
0
1
2
1
2
1
2
1
2
1
1
2
1
2
1
,

n cazurile simple, pentru k i n mici, aceast probabilitate se poate
calcula direct.
Pentru valori mai mari, se poate folosi aproximaia normal.
Sa lum n considerare valorile nivelelor plasmatice ale ionului
4
EDTA
(Tabelul3) dup administrarea i.m. la patru voluntari sntoi.

Tabelul nr. 4:

Voluntar CE IA BL PM
Prima zi 33,3 25,1 22,8 32,4
a-3-a zi 25,4 31,2 28,4 39,2
i
z
-7,9 +6,1 +5,6 +6,8
i
z
0 1 1 1

Avem
06 , 0
2
1
2
1
2
1
2
1
,
4
3
4
0
4
4
4 4
0
4
4
4
1
= = = = |

\
|
=


=
C C p z P
j
j
i

ceea ce nseamn c putem accepta ipoteza nul privind egalitatea
constantei de eliminare n prima zi cu cea din ziua a treia.
Pentru esantioane mai mari de 20 se poate folosi aproximarea formala a
distributiei binomiale:
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE NEPARAMETRICE

78
1 1
2 2
1 1
* *
2 2
P
n
z
n

= unde z este proportia diferentelor pozitive.


































II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE NEPARAMETRICE

79
b) Testul Wilcoxon pentru observaii perechi
Wilcoxon a propus deasemenea un test pentru determinri pare n care
rangurile sunt atribuite mrimii absolute a diferenelor i apoi se d
rangurilor semnul diferenelor.
Ipoteza nul este c distribuia diferenelor este simetric fa de zero,
astfel orice rang este pozitiv sau negativ cu aceiai probabilitate. Valorile
egale primesc ca rang media rangurilor grupului.
Numrul total de moduri de sume de ranguri ce se pot obine este
N
2 .
S atam rangurilor i variabilele aleatoare d
i
ce iau valorile d
i
=1 cnd i
este pozitiv i d
i
=0 cnd i este negativ, se foloseste insa cea mai mica
valoare dintre suma rangurilor pozitive si a celor negative.
S considerm suma rangurilor positive i d s
i
= .
Media ei va fi ( ) ( ) ( )

= =
N
i
N
i
d iE i d E s E
1 1

Dar ( )
2
1
2
1
0
2
1
1 = + =
i
d E i ( )
( )
4
1
2
1
1
+
= =

N N
i s E
N

( )
( )
( ) ( )
2
2 2 2
1 1
2 2
1
2
2
N N
i i i j
i j
N
i i j
i j
E s E id E i d ijd d
i E d ijE d d

| |
= = + =
|
\
= +



ns ( )
2
1
2
1
0
2
1
1
2 2 2
= + =
i
d E si
( ) 1 0
4
1
0 0 + =
j i
d d E *
4
1
4
1
* 1 * 1
4
1
* 0 * 1
4
1
= + +
n consecin
( ) ( )
(

+ = + =


N N N
j i
N
i i i ij i s E
1
2
2
1 1
2
1
2 2
4
1
2
1
2
4
1
2
1

Acum putem calcula dispersia lui s
( ) ( ) ( ) ( )
( )( )
24
1 2 1
4
1
4
1
4
1
2
1
1
2
2
1 1
2
2
1
1
2 2 2
+ +
= =
= |

\
|

(
(

\
|
+ = =


N N N
i
i i i i s E s E s D
N
N N N
N

II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE NEPARAMETRICE

80
n cazul n care apar egaliti,
( ) ( )
48
1 1 + k k k
trebuie s fie sczut pentru
fiecare grup de egalitati. O alternativ este de a scoate toate valorile egale
din prob.
S considerm acum observaiile pare din experimentul ce a dus la datele
din tabelul 5.

Tabelul 5. Nivelele plasmatice maxime ale
4
EDTA dup
administrarea i.m.

Voluntar CE IA BL PM
Prima zi 33,3 25,1 22,8 32,4
a-3-a zi 25,4 31,2 28,4 39,2
Diferena -7,9 +6,1 +5,6 +6,8
d
i
0 1 1 1
Rangul -4 2 1 3 S=3+2+1=6

n acest caz avem N=4 si
( )
( )
( )
( )( )
27 , 0
24
9 * 5 * 4
5 6
24
1 2 1
4
1
=

=
+ +
+

=
N N N
N N
s
s D
s E s
z care este foarte
apropiat de valorile obinute anterior.













II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE NEPARAMETRICE

81
c) Testul H, Krusskal Wallis, de analiza a variatiei pe o cale
aplicata rangurilor
Testul H, sau testul Kruskal Wallis
3
este o generalizare a testului
Wilcoxon n cazul a k probe, 2 k . La fel ca i n testul Wilcoxon,
observaiile primesc ranguri, i media rangurilor R
i
se calculeaz pentru
fiecare grup.
( )
2
1 +
=
N
R E
i
i ( )
( )( )
i
i
i
n
n N N
R D
12
1
2
+
=
Raportul
( )
( )
i
i i
R D
R E R
2

va fi repartizat ( ) 1 , 0 N , conform teoremei limita


centrala.

Kruskal i Wallis au artat c suma ptratelor lor, cu un factor de
ponderare
|
|

\
|

N
n
i
1 are aproximativ distribuia ( ) 1
2
k
( )( )
( )
( )
( )( )
( )
( )
( )
2
2
1
2 2
1
2
1 1
1
12
12 12
1 1
R
i
i
i
i
i
i i
i i
i
i
N
R
n
H k
N
N N n
n
n R R n R R
N n
N N n N N N

=
(
+
(

| | (
= =
|
(
\ +
(
(

= =
+ +



deci, deoarece sumam suma patratelor diferentelor intre mediile testul
este in esenta un fel de ANOVA pe o cale si se aplica si atunci cand
coloanelor si media totala, datele nu sunt normal repartizate, cu dispersii
egale.
Am folosit,
( )
( )
2
2 2 2 2
2
2
2
1
4
i
i i i
i i i
i
i
i
R
n R R n R R R n NR NR
n
N R
N
n
= + = =
+
=

ur

In final H se mai poate scrie :
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE NEPARAMETRICE

82
( )
( )
2
12
3 1
1
i
i
R
H N
N N n
= +
+


Dac apar valori egale, H trebuie s fie mprit la factorul
N N
T


3
1
unde ( ) ( )
3
1 1 T k k k k k = + = este calculat pentru fiecare grup de
legturi.
Pentru probe mici aproximaia nu este prea bun i Kruskal i Wallis au
dat tabele pentru k=3 i n
i
5.
S aplicm testul pentru acelai experiment, considernd dou grupuri
de observaii dup prima administrare i un grup de observaii dup a 5- a
administrare:
Nivelele plasmatice maxime ale ionului
4
EDTA dup administrarea i.m.
sunt n tabelul3.
5
4
7 1 3 9
1
=
+ + +
= R , 7
3
8 11 2
2
=
+ +
= R si 25 , 6
4
10 5 6 4
3
=
+ + +
= R
( )( ) ( )( )
( )( ) ( )( )
86 , 0
11
5 , 9
11
7
7
4 * 25 , 6
11
8
8
3
11
7
7
4
11
4
1
4 * 12
4 11 1 11
2
1 11
25 , 6
11
3
1
3 * 12
3 11 1 11
2
1 11
7
11
4
1
4 * 12
4 11 1 11
2
1 11
5
1
12
1
2
1
2 2
2 2
= = + + =
= |

\
|

(
(
(
(

+
+

+ |

\
|

(
(
(
(

+
+

+
+
|

\
|

(
(
(
(

+
+

= |

\
|

(
(
(
(

+
+

=

N
n
n
n N N
N
R
H
i
i
i


Dat fiindc 103 , 0
2
05 , 0 ; 2
= valoarea obinut pentru test aparine
zonei de acceptare, ipoteza ca grupurile sunt selectate din aceiai populaie
este acceptat.




II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE NEPARAMETRICE

83
2.6.5. Alegerea ntre testele laplaciene i testele neparametrice

Testele nonparametrice au o putere mai mic dect cele clasice,
deoarece nlocuirea valorilor cu rangurile lor semnific pierderea a o parte
din informaie. De exemplu am spune ca doi boxeri sunt de aceiasi valoare
deoarece fiecare a ctigat cte 5 meciuri din 10 ntlniri dintre ei. n
condiia n care n ultima ntlnire A l-a omort pe B, concluzia trebuie
schimbat, deoarece diferena de valoare ntre ei la ultimul meci a fost cu
mult mai mare dect celelate diferene.
Aceast pierdere de informaie este real n cazul testelor
neparametrice atunci cnd efectiv variabilele aleatoare sunt repartizate
normal i au dispersiile egale. n caz contrar se poate ntmpla ca un test
neparametric s fie chiar mai eficient dect cele parametrice.
In alt ordine de idei, aplicarea testelor neparametrice n cazul
seleciilor de volume mari, este foarte laborioas. Ca urmare, conduita de
urmat n alegerea unui tip sau altul de test ar fi dup cum urmeaz:
1. n cazul eantioanelor mici sunt de preferat testele neparametrice
deoarece calculele sunt mai rapide i eficiena este comparabil cu cea a
testelor clasice.
2. Cnd se tie c seleciile aparin la populaii repartizate normal i cu
dispersii egale, testele clasice sunt mai eficiente.
3. Cnd nu se cunosc repartiiile variabilelor, alegerea i concluziile se
vor face n funcie de alte informatii privitoare la experiment.
4. Cnd se tie c variabilele aleatoare testate nu sunt repartizate
normal sau este vorba de variabile care se bazeaz pe o scal arbitrar
(scoruri) sau clasificri pe criterii preponderant calitative (de exemplu
ameliorarea strii subiecilor tratai) se apeleaz la testele neparametrice.












II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE NEPARAMETRICE

84
2.6.6. Analiza de variatie pe doua cai a rangurilor. Testul Friedman

Consideram compararea a k esantioane de aceeasi marime,
i
n k = .
In acest caz datele se inscriu intr- o matrice. Daca rangurile le
stabilim pe fiecare linie, de exemplu,

Tabelul nr. 6
Valoarea masurata a dozei subiect
A B C
1 1 2 3
2 2 1 3
3 1 2 3
4 1 3 2
5 1 3 2
i
R
6 11 13

Putem testa daca se produce o crestere semnificativa a valorilor
masurate (de exemplu
max
c ) o data cu cresterea dozei, aplicam testul
Friedman
( )
( )
2 2
1
12
3 1
1
c i
R l c
lc c


= +
+


unde l este numarul de linii si c este numarul de coloane.







1
F.Wilcoxon: Individual comparisons by ranking methods,
Biometrics Bul.,180-83,1947
2
W.H.Kruskal, W.Allen Wallis: Use of ranks in one-criterion
analysis of variance, J. Am. Stat. Assoc.,47,583-621,1952
3
W.H.Kruskal, W.A.Wallis; Use of ranks in the one criterion
analysis of variance, J.Am.Stat.Assoc.,47,583-621,1952
4
Hollander, Wolfe DA; Non parametric statistical methods, J.Wiley,
New York, 1973
II. STATISTIC MATEMATIC I BIOSTATISTIC
REGRESIA LINIARA

85
2.7. Regresia liniar

Dac reprezentarea grafic a dou mrimi ce sunt observate simultan
sugereaz o dependen liniar, ajungem la problema determinrii dreptei ce
descrie cel mai bine aceast dependen. Cazurile din farmacie cele mai
frecvente in acest sens privesc chimia analitica, unde semnalul este
proportional, intre anumite limite, cu concentratia, legea Lambert-Beer
fiind cel mai cunoscut exemplu. In acelasi timp, se incearca sa se simplifice
lucrurile prin liniarizare in studiile de stabilitate ale medicamentelor. In
terapie, o intrebare obligatorie la care trebuie sa raspunda prezentarea
oricarui medicamente se refera la liniaritatea farmacocineticii.
Dup cum s-a discutat la capitolul privind extremele funciilor de
mai multe variabile, o soluie a acestei probleme o constituie dreapta prin
cele mai mici ptrate, dreapta pentru care suma ptratelor distantelor de la
ea la punctele experimentale este minim. Aceast soluie consider
punctele ca fiind exacte. Problema capt cu totul alt nfiare atunci
cnd punctele experimentale sunt considerate valori ale unor variabile
aleatoare, devenind o problem de statistic matematic i analiz numeric
n acelai timp.

dependent a semnal ului masur at de concent r at i e
0
5
10
15
20
25
0 5 10 15

fitare liniara, dar dependenta non-liniara
-20
0
20
40
60
80
100
120
0 5 10 15


Fig. 2 Dreapta prin cele mai mici patrate care aproximeaza dependenta intre
variabile.
a. dependenta este efectiv liniara dar datele sunt afectate de erori,
II. STATISTIC MATEMATIC I BIOSTATISTIC
REGRESIA LINIARA

86
b. Datele sunt afectate de erori si dependenta este mai mult parabolica decat
liniara
In general, chiar daca nu constientizam acest fapt, de fiecare data cand
incercam sa gasim o dependenta liniara intre doua variabile, facem implicit
urmatoarele ipoteze:

1. Variabila X este masurata fara eroare. Desi nu este totdeauna
adevarat, cel mai adesea X este masurat cu erori relativ mici, si in aceste
conditii presupunerea poate fi considerata adevarata. In cazul unor teste
privind un medicament administrat in mai multe doze, X este doza
nominala care se considera ca a fost administrata. Eroarea in dozare
este foarte mica.Un alt exemplu de variabila X care este adesea folosit
este timpul care poate fi masurat cu suficienta precizie si acuratete.
2. Pentru fiecare X, y ete independent si normal distribuit. Adesea vom
folosi notatia Y.x pentru arata ca valoarea lui Y este o functie de X.
3. Variatia lui y se presupune a fi aceeasi pentru fiecare X. Daca
variatia lui y nu este constanta, dar este fie cunoscuta, fie asemanatoare cu
cea a lui X intr-un anume fel, sunt alte metode pentru a estima panta si
ordonata dreaptei .
4. Intre X si Y exista o relatie de liniaritate. Y= A+BX, unde A si B
sunt parametri adevarati. Bazandu-ne pe teorie sau experiente, avem motive
sa credem ca X si Y sunt corelate liniar. In fig. 2b se vede ca dreapta care
aproximeaza cel mai bine dependenta intre cele doua variabile nu
corespunde legii reale care guverneaza fenomenul, cel mai bine nefiind
de fapt bine.

In cazul studiilor de stabilitate, dependenta concentratiei substantei
active de timp este, in cel mai bun caz o exponentiala
kt
e c t c

=
0
) (
Dar , pentru valori mici ale lui t exponentiala este aproximata de o
dreapta
) 1 ( ) (
0 0
kt c e c t c
kt
=


Ca parametri esentiali ai cineticii de degradare se folosesc, in locul
constantei de viteza k , timpul de injumatatire si timpul de siguranta sau
timpul la care concentratia scade la 90 % din valoare sa initiala.
Examinm n continuare aspectele matematice pentru cazul cel mai
simplu cnd valorile variabilei x (care n cele mai multe cazuri corespunde
timpului) nu sunt afectate de erori i, pentru fiecare valoare a lui x
II. STATISTIC MATEMATIC I BIOSTATISTIC
REGRESIA LINIARA

87
corespund un numr de valori y, determinate ntr-un singur experiment
printr-o metod afectat de erori ntmpltoare:
1
1 12 11
,..., ,
n
y y y , pentru
1
x
.
.
i
in i i
y y y ,..., ,
2 1
, pentru
i
x , i=1,2,,k
Cazul cnd pentru orice i avem 1 =
i
n este relativ mai simplu, dar
este de subliniat c i n cazul cnd acetia sunt diferii de 1 poate fi tratat n
aceiai manier admitnd c ntre perechile ( )
i i
y x , s fie i perechi cu
acelai
i
x .
S admitem c pentru un x fixat, valoarea msurat y este o variabil
aleatoare cu urmatoarea structur:
(1) y x = + = + +
distribuit normal cu dispersia
2
i media x + =
Problema care ne-o punem este aceea ca, din datele
experimentale
i
y , s obinem nite estimri a, b i s
2
pentru , si
2
, i s
determinm distribuiile acestor estimaii.
Estimarea ecuaiei de regresie o notam :
(2) bx a y + =
Metoda celor mai mici ptrate d valorile a i b care minimizeaz
suma ptratelor deviaiilor (erorilor) ntre valorile observate
i
y i cele
prezise de ecuaia de regresie (2):
(3) ( ) ( )
2 2

= =
i i i i E
bx a Y y Y SS
Metoda este n principal datorat lui Gauss. Pentru aflarea
parametrilor a i b, nu este necesar ipoteza privind distribuia normal a
erorilor, dar aceasta este necesar pentru construirea unor intervale de
ncredere i pentru testarea unor ipoteze privind aceiai estimatori. Metoda
celor mai mici ptrate ofer avantajul c estimatorii pe care i d sunt
deplasai i au o dispersie minim n clasa estimatorilor nedeplasai.
Valorile lui a i b care minimizeaz suma ptratelor erorilor sunt
soluiile sistemului
0 =

a
SS
i 0 =

b
SS

II. STATISTIC MATEMATIC I BIOSTATISTIC
REGRESIA LINIARA

88
( ) 0 2 = =

i i
bx a Y
a
SS
i ( ) 0 2 = =

i i i
x bx a Y
b
SS

ceea ce este echivalent cu
(4)

= +
i i
Y x b na i

i i i i
Y x x b x a

= +
2

Rezolvnd sistemul prin regula lui Cramer se obin ca estimatori pentru i
:
( )

=
2
2
2
i i
i i i i i
x x n
Y x x x Y
a i
( )

=
2
2
i i
i
i i i
x x n
Y x Y x n
b
Numrtorul expresiei lui b poate fi scris i n forma
( )
i i i
i
i i i i i i
y X x n y
n
x
y x n y x y x n

= |

\
|
=
Deoarece ( ) 0 =

X x
i
i ( ) 0 =

X x Y
i
, mai putem scrie
( ) ( ) ( ) ( )( ) Y y X x X x Y y X x y X x
i i i i i i i
= =


Similar, dup cum se poate uor verifica, avem:
( ) ( )
2
2
2

= X x n x x n
i i i

n consecin, o form alternativ pentru b este
( )( )
( )


=
2
X x
Y y X x
b
i
i i
.
Putem verifica uor c b este un estimator nedeplasat pentru .
Presupunem valoarea ateptat
i
y dat de ecuaia
i
x + , pentru un
i
x x = .
Atunci:
( )
( ) ( )
( )
( )( )
( )
( )
( )
( )
( )
( )
( )



=

+ =
=

=
=

+
=

2
2
2
2 2
2 2
1
0
X x
x
n
x
X x
x X x
X x
X x
X x
x X x
X x
y E X x
b E
i
i i
i
i i
i
i
i
i i
i
i i

II. STATISTIC MATEMATIC I BIOSTATISTIC
REGRESIA LINIARA

89
Dispersiile lui a i b pot fi obinute direct, deoarece sunt funcii
liniare de
i
y , care valori sunt presupuse independente i distribuite normal,
cu dispersia
2
:
( )
( )
( )
( ) ( )
( )
( )

=
|

\
|

=
(
(

=
2
2
2
2
2
2
X x
X x
y D X x
X x
y X x
D b D
i
i
i i
i
i i


Din prima ecuaie a sistemului (4) avem: X b Y a = .
( ) ( ) ( )
( )
( )
( ) ( )
( )
( )
( ) b D
n
x
X x
n
x
X x n
n
x
n
x
x
X x
X
n
X x
X y D
n
b D X
n
y
D a D
i
i
i
i
i i
i
i
i
i
i

=
=

+
=
|
|

\
|

+ =
=

+ = +
|
|

\
|
=
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
1
1


Deci,
2
2
b
i
a
S
n
x
S

=
















II. STATISTIC MATEMATIC I BIOSTATISTIC
REGRESIA LINIARA

90
2.7.1. Estimaii i ipoteze asupra coeficientului b
Coeficientul b are o importan deosebit i prin aceea c el
reprezint o msur a corelrii ntre x i y.
1. Coeficientul b este, dup cum s-a artat, repartizat normal cu media
i dispersia
( )


2
2
X x
i



2. Dac
i
y sunt punctele experimentale, iar
i
Y estimrile lor teoretice,
i i
bx a Y + = , suma ptratelor erorilor va fi ( )

=
2
i i E
Y y SS . Vom
arta c:
2
2
= |

\
|
n
SS
E
E

Pentru a demonstra aceasta relaie plecm de la definiia sumei erorilor
( ) [ ]
( ) ( ) [ ] ( ) ( ) [ ]
( ) ( ) [ ] ( ) ( )( ) ( )
2
2
2 2
2
2
2
2

+ = =
= + + = + =
= + =
X x b Y y X x b Y y X x b Y y
bx a X b a Y y bx a Y Y y
bx a y SS
i i i i i i
i i i i
i i E
Dar
( )( )
( )


=
2
X x
Y y X x
b
i
i i

i putem nlocui ( )( ) ( )

=
2
X x b Y y X x
i i i
.
Deci avem ( ) ( ) B A X x b Y y SS
i i E
= =

2
2
2

Calculm separat ( ) A E i ( ) B E .
( ) ( ) [ ] ( ) ( ) ( )
2
2
2
2
2
Y nE y E Y n y E Y y E A E
i i i
= = =



n continuare, folosind identitatea ( ) ( ) ( ) ( )
2 2
Y E Y E Y D + = i faptul c
( ) X Y E + = i ( )
n
Y D
2

= obinem
II. STATISTIC MATEMATIC I BIOSTATISTIC
REGRESIA LINIARA

91
( ) ( ) [ ] ( )
( ) ( ) ( )
2
2 2
2
2
2
2
2
2
2 2
1

+ = + =
=
(

+ + + + =
X x n X x
n
n
n
n
X n x A E
i i
i



Mai departe,
( ) ( ) ( ) ( ) ( ) ( ) ( ) [ ]
( )
( )



|
|

\
|
+

=
= + = =
2
2
2
2
2
2
2
2

X x
X x
b E b D X x b E X x B E
i
i
i i

i deci,

( ) ( ) ( ) ( ) ( )
2 2
2
2
2
2 2
2 1 = + =

n X x X x n SS E
i i E



3. Variabila aleatoare
2

E
SS
este repatizat ( ) 2
2
n .




















II. STATISTIC MATEMATIC I BIOSTATISTIC
REGRESIA LINIARA

92
Pe baza acestor trei proprieti putem estima intervalele de ncredere pentru
i verifica ipoteze asupra valorilor sale.


a) Cazul dispersiilor cunoscute
n cazul n care se cunoate dispersia erorilor de msurare
( ) ( )
2
= =
i i
y D D se folosete faptul c variabila
aleatoare
( )
( )
2
1
2
2
(
(

X x
b
b D
b
z
i


este repartizat ( ) 1 , 0 N .


b) Cazul dispersiilor necunoscute
n acest caz se nlocuiete dispersia lui b:
( )


=
2
2
X x
i
b

cu estimatorul
numit dispersia de selecie:
( )
( ) ( )

=
2 2
2
2 2
X x
n
SS
X x
n
Y y
S
i
E
i
i i
b
.
Variabila aleatoare

( ) ( )
( )
2
2
2
2
2
2
1
2
2
1
2

=
(

=
(
(

n
Z
n
SS
b
X x n
SS
b
T
n
E
b
i
E


este repartizat Student cu n-2 grade de libertate.
Ca urmare putem determina intervalele n care se afl cu diverse
probabiliti sau verifica ipoteze privind valoarea lui, exact cum este utilizat
testul t pentru testarea ipotezei privind media necunoscut.
Intervalul de ncredere pentru este
b
n
b
n
S t b S t b
2
1 , 2
2
1 , 2



+



II. STATISTIC MATEMATIC I BIOSTATISTIC
REGRESIA LINIARA

93
2.7.2. Estimarea dispersiei punctelor dreptei de regresie
Considerm un punct
0
x fixat i punctul corespunztor lui:
0
y , pe
dreapta de regresie y
bx a x y + = + + =
X b a Y + =

0 0 0
bx X b Y bx a y + = + =
( ) X x b Y y + =
0 0
estimatia lui
0
y este o variabil aleatoare distribuit
normal.
Avem ( )
0 0 0
x Y Y E + = = i
( ) ( )
( )
( )
2
0 2
2 2
2
0
2 2 2
0
0
X x
X x
n
X x y D
i
b y y

+ = + = =



Estimnd valoarea lui
2
prin
2
=
n
SS
s
E
avem
( )
( )
(
(

+ =

2
2
0 2
1
0
X x
X x
n
s s
i
y
.
Variabila aleatoare
( )
0
0 0
y
s
x y
T
+
= este repartizat Student cu n-
2 grade de libertate i permite calculul intervalelor de ncredere pentru
0
x + .

( ) ( )
|
|
|
|
|

\
|
|

\
|

|

\
|

+ +
|

\
|

|

\
|

+

2
2
. 2 , 0
2
2
. 2 , 0
1
,
1
X X
X X
N
S t y
X X
X X
N
S t y
x Y n x Y n

Dispersia
0
Y
s depinde de distana ntre
0
x i X , iar limitele de
incredere ale lui Y pentru valori specifice ale lui X depind de dispersie,
numarul gradelor de libertate, numarul de puncte utilizate pentru
determinarea dreptei si valoarea sa este minim atunci cnd X x =
0
. n
acest caz, Y y =
0
i
y y
s s =
0
.
Facem observaia c dispersia determinat n punctul
0
y este
dispersia datorat regresiei. Valorile experimentale nu sunt ns valori ale
II. STATISTIC MATEMATIC I BIOSTATISTIC
REGRESIA LINIARA

94
regresiei ( ) x x b Y y + =
0 0
, estimate de drepta de regresie. n acest caz,
valoarea individual determinat difer fa de valoarea
0
Y printr-o eroare ,
a crei dispersie este egal cu
2
, variabilitatea datelor individuale fa de
valorile corespunztoare regresie Y.
Ca urmare, valorile individuale vor avea
dispersia
( )
( )

+ + =
2
2
0 2
2
2 2
0
X x
X x
n
i
y


ceea ce , pentru valorile de selecie devine
( )
( )
(
(

+ + =

2
2
0 2 2
1
1
0
X x
X x
n
s s
i
y
.
Fig. 3










In cazul studiilor de stabilitate observam in fig.2 ca avem doua
tipuri de probleme. Pentru o concentratie data, de exemplu 90 % din cea
initiala, in afara timpul de pe dreapta de regresie cand se atinge acest prag,
ne intereseaza si marginea inferioara a intervalului de timp , deci timpul
pentru care suntem siguri ca nu a scazut concentratia sub 90 % . Din punct
de vedere al sigurantei pacientilor , este mai bine sa contam pe acest timp.
FDA sugereaza ca ar fi mult mai potrivita abordarea folosind un
interval de incredere unilateral decat unul bilateral pentru a estima data de
expirare. Pentru cele mai multe produse, continutul in substanta activa poate
doar sa descreasca in timp, si numai marginea inferioara a intervalului de
incredere vs. curba timpului pot fi considerata relevanta. (o exceptie poate
fi in cazul produselor lichide unde evaporarea solventului duce la cresterea
concentratiei substantei active).
Pentru a obtine acest domeniu de valori pentru X (timpul pentru
continutul de minim 90%) folosind metoda estimatiei grafice asa cum
II. STATISTIC MATEMATIC I BIOSTATISTIC
REGRESIA LINIARA

95
este descrisa mai sus, presupune calcularea bandei de incredere pentru un
domeniu sufucuent de intins pentru X. Estimarea grafica este relative
incorecta. Intervalul de incredere pentru X cand se da Y poate fi calculat
direct desi formula este mai complexa decat cea folosita pentru calcularea
intervalului de incredere pentru Y . Raportul are o distributie mai
complicata decat cea a combinatiei liniare de variabile cum ar fi in cazul Y
= a + bX.
Calcularea intervalului de incredere pentru un X la o valoare
specifica lui Y este
g
X X X X N g b S t X g X
y

(
(

\
|

|

\
|
+

1
/ / ) 1 ( ] / ) ( [ ) (
2 2

unde
( )

\
|

=

2
2
2 2
X X b
S t
g
y






















II. STATISTIC MATEMATIC I BIOSTATISTIC
REGRESIA LINIARA

96
2.7.3. Regresia ponderata
Una din presupunerile implicite in aplicarea inferentei statistice este
acela ca variatia lui y este aceeasi la fiecare valoare a lui X. Apar multe
situatii in practica atunci cand aceasta presupunere nu este respectata. Un
caz frecvent este acela cand variatia lui y este proportionala cu X. Aceasta
apare cand y are un coeficient constant al variatiei (CV) si y este
proportional cu X (y = BX), observat de obicei in metodele de analiza
instrumentala in chimia analitica.
Doua din abordarile posibile in rezolvarea acestei probleme sunt:
a) O transformare a lui y pentru a face variatia omogena, cum ar fi
transformarea logaritmica .
b) O analiza de regresie ponderata.
O pondere uzuala in chimia analitica pentru valoarea la concentratia Xi
este inversul patratutului acesteia
2
1
i
X
. Deci, in formulele pentru calculul
coeficientilor A si B valorile y
i
se vor inlocui cu valorile
2
i
i
i i
X
y
y w =

2.7.4. Analiza reziduala
Se numesc reziduuri diferentele intre valorile calculate prin regresie si
cele experimentale ( ceea ce , in alt context, numeam ca erori)
Examinarea reziduurilor poate dezvalui variatia heterogenitatii sau
nonlinieritatea.
Daca modelul liniar si presupunerile in analiza prin cele mai mici patrate
sunt valabile, reziduurile ar trebui sa fie aproximativ normal distribuite si n-
ar trebui sa apara nici o tendinta.
Figura 4 arata un grafic al reziduurilor ca functie de X. Faptul ca
reziduurile prezinta o forma de palnie, marindu-se pe masura ce X creste,
sugereaza folosirea unei transformari logaritmice sau utilizarea unor
ponderi pentru a reduce heterogeneitatea variatiei.
II. STATISTIC MATEMATIC I BIOSTATISTIC
REGRESIA LINIARA

97
Valori reziduale
0
1
2
3
4
5
6
7
8
9
10
0 50 100
Concentratia
V
a
l
o
a
r
e

r
e
z
i
d
u
a
l
a

Valori reziduale logaritmate
0
1
2
3
4
5
6
7
8
9
10
1 2 3 4 5
Concentratia (ln)
V
a
l
o
r
i

r
e
z
i
d
u
a
l
e

a b
Fig. 4
Figura 4b arata reziduurile dupa logaritmarea (ln) lui X si a lui Y. Mare
parte din heterogenitatea variatiei a fost inlaturata.

2.7.5. Stabilitatea dreptei de regresie

In bioanalitica si in chimia analitica in general, pentru fiecare
concentratie, la stabilirea dreptei de etalonare se fac mai multe
determinari. Se calculeaza apoi acuratetea sau exactitatea acestor
determinari, cuantificata prin distanta valorii calculate prin regresie
Fig. 5
Piroxi cam
Li near Regression
Y = B*X + A
Parameter Val ue Error
A -0.0029 0.0079
B 0.3294 0.0019
R 0.9999
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
0 2 4 6 8 10 12
Conc (g/mL)
A
r
e
a

A
n
a
l
i
t
/
A
r
e
a

S
I


II. STATISTIC MATEMATIC I BIOSTATISTIC
REGRESIA LINIARA

98
Fata de concentratia nominala, concentratia care s-a preparat
efectiv ( pe care o consideram ca nu este afectata de erori). In momentul in
care media determinarilor efective la una din aceste concentratii se
modifica, si dreapta de regresie se va modifica si deasemena si distantele
tuturor punctelor experimentale la aceasta dreapta.

Este de dorit o dependenta stabila a acuratetei punctelor de
acuratetea datelor de intrare, in sensul ca o eroare mica in preparare sau in
masurare, sa afecteze putin acuratetea dreptei.

In mod concret , consideram datele experimentale de la determinarea
dreptei de etalonare a piroxicamului in probe de plasma (fig. 5). Orice
eroare in preparare sau masurare schimba dreapta.

Sa evaluam ce efect are asupra acuratetei punctelor o eroare de 10 %
la limita de cuantificare (LLOQ) si o eroare de 10 % la limita superioara de
cuantificare.

Acuratetea punctelor dupa o schimbare de 10% a conc.
experimentale la diferite limite de cuantificare

Tabelul nr. 7

Limita inferioara de cuantificare Limita superioara de cuantificare
Conc A/SI
Conc
exp Acc
Acc
initial Conc A/SI
Conc
exp Acc
Acc
initial
0.1 0.0240 0.083 83.3 90.014 0.1 0.0267 0.164 164.1 90.01
0.25 0.0818 0.259 103.4 102.841 0.25 0.0818 0.318 127.1 102.84
0.5 0.1570 0.487 97.4 97.070 0.5 0.1570 0.527 105.5 97.07
1 0.3396 1.041 104.1 103.991 1 0.3396 1.037 103.7 103.99
2.5 0.7903 2.409 96.4 96.321 2.5 0.7903 2.294 91.8 96.32
5 1.6711 5.083 101.7 101.643 5 1.6711 4.752 95.0 101.643
10 3.2840 9.978 99.8 99.786 10 3.6124 10.168 101.7 99.786

Se observa ca efectul erorilor la concentratii mici asupra celorlalte
concentratii este neglijabil, in timp ce efectul erorilor la valori mari asupra
acuratetei concentratiilor mici este critic , transformandu-le pe acestea in
valori discordante.

II. STATISTIC MATEMATIC I BIOSTATISTIC
ANOVA

99
2.8. Metode statistice de analiza factorilor de variabilitate n
experimentul biologic (ANOVA)

S cercetm, n continuare, problema comparrii mai multor selecii
provenite din populaii pe care le tim ca fiind normal repartizate, de
exemplu concentraiile plasmatice realizate de tablete care conin diferii
excipieni, dar care au aceeai substan activ, n aceeai doz.
Vrem s verificm ipoteza compus c acestea provin de fapt din
aceiai populaie, avnd media i dispersia , deci c excipienii folosii
nu influeneaz semnificativ cedarea i absorbia substanei active:

= = =
3 2 1 0
: H
4

fa de ipoteza alternativ c cel puin dou medii nu sunt egale.
O variant de rezolvare a problemei ar fi compararea mediilor de
selecie dou cte dou prin metodele prezentate anterior.

Fie, de exemplu, relaia ntre mediile de selecie
4 3 2 1
x x x x .
Este evident greit a aplica o relaie de tranzitivitate i a spune c

2 1
= i
3 2
= i
4 3 2 1 4 3
= = = = .
Motivul acestei erori este legat n primul rnd de violarea unui
principiu de baz al teoriei seleciei: alegerea la ntmplare a seleciilor. Ori
compararea loturilor dup criteriul a posteriori, al mrimii mediilor de
selecie este ntr-adevr o abatere de la acest principiu.
Mai mult, nici mcar
4 1
= nu implic n acest caz
3 2
= din
cauza dependenei rezultatului testelor de relaiile ntre dispersiile
populaiilor din care provin seleciile.
Ca urmare, problema comparrii mai multor selecii (loturi) trebuie
abordat prin alte metode care s fac compararea tuturor seleciilor n
acelasi timp. O astfel de abordare se bazeaz pe compararea dispersiilor de
selecie i se numete analiz dispersional.
Analiza dispersional este o alt metod fundamental a statisticii
care, n plus fa de mijloacele de calcul a tendinei centrale a rezultatelor
experimentelor repetate, caracterizeaz mai ales variabilitatea acestora i
factorii ce o determin.
Variabilitatea se poate datora existenei unor factori cu influene
sistematice, a unor factori aleatori de fluctuaie mai pronunat i, n final,
II. STATISTIC MATEMATIC I BIOSTATISTIC
ANOVA

100
factori locali, inevitabili, determinnd o fluctuaie mai mic, definita ca
fluctuaie experimental. Analiza dispersional i propune separarea
variabilitii totale n: variabilitatea datorat factorilor sistematici,
variabilitatea factorilor cu efecte aleatoare, plus o variabilitate rezidual
(diferena pn la variabilitatea total), care reprezint de fapt variabilitatea
experimental. Din aceste variabiliti se evalueaz dispersiile pariale
corespunztoare diferiilor factori, calculndu-se semnificaia rapoartelor lor
prin aplicarea testului F.
Principial datele experimentale se grupeaz n funcie de diferite
criterii i se urmresc efectele asupra variabilitatii n funcie de aceste
criterii, efecte care se cuantific n raport cu variablitatea rezidual.
Analiza dispersional este cunoscut n aplicaiile de biofarmacie i
farmacocinetic sub denumirea de ANOVA (de la Analysis of Variance).


























II. STATISTIC MATEMATIC I BIOSTATISTIC
ANOVA

101
2.8.1. Analiza funcional unifactorial

Cea mai simpl analiz dispersional, numit analiz dispersional
unidimensional sau unifactorial (numit n literatura englez i one-way
ANOVA) sau experiment complet aleator, experiment cu grupuri
paralele, corespunde testului t de analiz a dou eantioane independente i
compar dou sau mai multe grupuri.
De exemplu, n pacieni sunt grupai n k scheme de tratament. Putem
s comparm efectele a dou medicamente administrate la mai multe
grupuri de voluntari, la care se poate adauga i un grup placebo.
Voluntarii se distribuie aleator n toate grupurile. Dup msurarea unui
parametru dat, se testeaz ipoteza nul c toate valorile parametrului testat
sunt egale n populaia corespunztoare diferitelor tratamente testate, deci
tratamentele sunt echivalente ntre ele.
In ipoteza c toate grupurile aparin aceleiai populaii, ideea
testului este aceea c variabilitatea n interiorul grupurilor trebuie s fie de
acelai ordin cu variabilitatea ntre mediile grupurilor.
n consecin, dispersia total, evaluat ca suma a ptratelor
diferenelor ntre valorile individuale i media ntregii populaii selectate
SS
T
, este separat ntr-o parte datorit variaiei ntre grupuri (within), sau
variabilitii interioare i o parte datorit variabilitii dintre (between)
grupuri:
B W T
SS SS SS + = .
Dac numrul de grupuri este k i numrul de subieci n grupul i
este
i
n aceast egalitate poate fi explicitat dup cum urmeaz:
( )
2
1

=
=
n
i
n
j
ij T
i
X x SS (1)
unde = X media mare
N
x
n
X n
n
x
k
i
k
i i
i
i j
ij

= = =
1
1
i
i
X este media
grupului i.
Fixnd grupul i putem scrie
( ) ( ) ( ) [ ]
( ) ( ) ( )( )


+ + =
= + =
=
i i i
i i
n
j
i i ij
n
j
i
n
j
i ij
n
j
i i ij
n
j
ij
X X X x X X X x
X X X x X x
2
2 2
1
2 2

II. STATISTIC MATEMATIC I BIOSTATISTIC
ANOVA

102
Ultimul termen este egal cu
( ) ( )( ) 0 2 2 = =
|
|

\
|

i i i i i
n
j
i ij i
X n X n X X X x X X
i

i (1) devine
( ) ( )
W B
k
i
n
j
i ij
k
i
i i T
SS SS X x X X n SS
i
+ = + =

2 2
(2)
relaie cunoscut ca identitatea analizei dispersionale.
Considerm variabilele aleatoare:

1 1
2

N
SS
n
SS
s
T
i
T
T
,
2
1
B
B
SS
s
k
=

i
k N
SS
k n
SS
s
W
i
W
W

2
.
innd cont de regula general demonstrat mai nainte c,
( ) ( ) 1 1
2 2 2
n n
x
avem,
( )
( )
( )
( )
2
.
2
2
.
,
1 1
1
ij i
j
W ij i i i i
i j i i
i
x x
SS x x n n s
n

= = =



Deci,
( )
( ) ( ) ( ) k N n
n
SS
s
i
i
W
W
=

2 2 2 2 2
1
1


Analog, ( ) 1
2 2 2
k s
B
i deci raportul
2
2
1
W
B
W
B
S
S
k N
SS
k
SS
F =

= este
distribuit ( ) 1, F k N k .
Se observ c de fapt
( )
2
2
1 1
x
k
i
i i
B
s
k
X X n
k
SS
=

reprezint
dispersia de selecie ponderat a mediilor de grup fa de marea medie.
Abaterile mediilor grupurilor fa de media general depind att de
hazardul msuratorilor ct i de factori ce in de nssi natura grupurilor.
Abaterile n interiorul grupurilor sunt independente de aceti factori,
deoarece fiecare valoare msurat este raportat la nsi media grupului
respectiv. Ele reprezint fluctuaii aleatoare.
Variabilitatea n interiorul grupurilor reprezint diferena ntre
variabilitatea total i variabilitatea ntre grupuri.
II. STATISTIC MATEMATIC I BIOSTATISTIC
ANOVA

103
Pentru simplificarea calculelor n aplicaiile practice s-au introdus
notaiile

= x x
k
i
n
j
ij
i
i

=
2 2
x x
k
i
n
j
ij
i
i formulele precedente se
aduc la forme echivalente ce presupun un volum mai mic de calcule, dup
cum urmeaz:

( )
( ) ( )
( ) ( )
N
x
x
N
x
x
N
x
N
N
x
x X N x X x X x SS
ij
ij
ij ij
ij ij ij ij T
2
2
2
2
2
2 2
2 2 2
2
2 2



= =
= + = + = =
( )
( )

|
|

\
|
=
|
|

\
|

|
|

\
|
= =
= =
k
i
k
i
n
j
ij
k
i
i j
ij
k k
i
n
j
ij
i i B
n
x
n
x
n
x
n
x
X X n SS
i i
1
2
1
2
1
1
2
1 1
2
1
2





















II. STATISTIC MATEMATIC I BIOSTATISTIC
ANOVA

104
2.8.1.1. Exemplu: Compararea parametrilor farmacocinetici ai unui
medicament dup administrarea pe mai multe ci

S considerm constanta de eliminare (Tabelul 8) pentru un
medicament administrat ntr-o singur doz oral i i.v., iar i.m. timp de trei
zile la diferite grupuri. Este de ateptat ca eliminarea s fie independent de
calea de administrare.
Vom compara constantele de eliminare dup administrarea oral i
i.m.
Tabelul nr. 8: Constanta de eliminare
1 4
min 10

e
k

Oral prima
doza
i.m. o doza i.m. a-5-
doza

106 55 84
109 40 105
160 109 174
ij
x
375 204 363

= 942 x

2
ij
x
48717 16506 48357
113580
2
=

x
i
n
3 3 3 N=9
1
i
n
2 2 2
( ) 6 1 =
i
n
i
x
125 68 121

( )
( )

= = = = 14984
9
942
113580
2
2
2
2
N
x
x X x SS
ij T


( )
6074 98596 43923 13872 46875
9
942
3
363
3
204
3
375
2 2 2 2
1
2
1
2
1
1
2
= + + = + + =
=
|
|

\
|

|
|

\
|
= =

=
=
k
i
i j
ij
k
i
n
j
ij
k
i
i i B
n
x
n
x
X X n SS
i


8910 6074 14984 = = =
B T W
SS SS SS
II. STATISTIC MATEMATIC I BIOSTATISTIC
ANOVA

105

1485
6
8910
2
= =

=
k N
SS
s
W
W
, 3037
2
6074
1
2
= =

=
k
SS
s
B
B

( ) ( ) 07 , 2
1485
3037
6 , 2 , 1
2
2
= = = =

W
B
i
s
s
F k n k F valoare aflat n zona de
acceptare ( 26 , 7
5 , 97 ; 6 , 2
= f si 92 , 10
99 ; 6 , 2
= f )

Aplicm n continuare acelai procedeu, introducnd i administrarea i.v.

Tabelul nr. 9: Constanta de eliminare
1 4
min 10

e
k
i.m. o doza i.m. a-5-doza i.v.
106 55 84 63
109 40 105 70
160 109 174
ij
x
375 204 363 133
1075 =

2
ij
x
48717 16506 48357 8869
122449
2
=

x
i
n
3 3 3 2 N=11
1
i
n
2 2 2 1
( ) 7 1 =
i
n
i
x
125 68 121 66

( )
( )

= = = = 17392
11
1075
122449
2
2
2
2
N
x
x X x SS
ij T


( )
8428 105056 8844 43923 13872 46875
11
1075
2
133
3
363
3
204
3
375
2 2 2 2 2
1
2
1
2
1
1
2
= + + + =
= + + + =
=
|
|

\
|

|
|

\
|
= =

=
=
k
i
i j
ij
k
i
n
j
ij
k
i
i i B
n
x
n
x
X X n SS
i



II. STATISTIC MATEMATIC I BIOSTATISTIC
ANOVA

106
8964 8428 17392 = = =
B T W
SS SS SS

1280
7
8964
2
= =

=
k N
SS
s
W
W
, 2809
3
8428
1
2
= =

=
k
SS
s
B
B


( ) ( ) 19 , 2
1280
2809
6 , 2 , 1
2
2
= = = =

W
B
i
s
s
F k n k F valoare aflat n zona de
acceptare ( 26 , 7
5 , 97 ; 6 , 2
= f i 92 , 10
99 ; 6 , 2
= f )





























II. STATISTIC MATEMATIC I BIOSTATISTIC
ANOVA

107
2.8.1.2. Condiii necesare pentru aplicarea analizei dispersionale.

a) Modelul variabilei aleatoare supus msuratorilor

Subliniem ceea ce am spus sau am presupus ca i condiii prealabile
pentru a putea aplica testul prezentat:
1) Pentru ca sumele calculate s fie repartizate
2
este obligatoriu ca
seleciile s provin din populaii repartizate normal. Dac acest lucru nu se
ntmpl, rmne s fie aplicate teste neparametrice, dup cum s-a prezentat
anterior.
2) Analiza dispersional compar dispersia ntre grupuri cu dispersia
total din interiorul grupurilor pentru punerea n eviden a efectelor
sistemice. Dispersiile n populaiile din care provin grupurile s-au presupus
egale. Pentru verificarea acestei ipoteze se poate aplica testul F dispersiilor
de selecie luate dou cte dou, sau se poate aplica testul Bartlett.
3) Aditivitatea efectelor de intra i intervariabilitate, fenomen care
depinde de natura intim a fenomenului msurat.
Ca urmare rezultatul masuratorilor este o variabila aleatoare care se
poate scrie:
ij i ij
x + + = cu ( ) 0 =
ij
E i ( )
2
e ij
D = unde este
media general a populaiei, ( )
2

= D ,
i
este un factor fix ce variaz de
la un grup la altul i este egal cu diferena ntre i media grupului
i i
= + , iar
ij
este eroarea de msurare.
Media a n determinri n interiorul unui grup este
i i
ij
i i
n
X

+ + = + + =

deoarece
i
i sunt constante.
Media general va fi:

+ + = + + =

kn k
M
ij i
deoarece
i
variaz de la un grup la altul iar este acelai pentru ntreaga populaie.
Mai departe
( ) ( )
ij i i ij i i ij i
x X = + + + + = i dispersia n
interiorul grupului va fi:
( ) ( )
1 1
2 2
2

=

i
i ij
i
i ij
i
n n
X x
s

iar media ei este
II. STATISTIC MATEMATIC I BIOSTATISTIC
ANOVA

108
( )
( ) ( )
2
2 2
2
1 1
e
i
i ij
i
i ij
i
n
E
n
X x
E s E

=
|
|

\
|

=
|
|

\
|

=

(din faptul c aa cum s-a
artat mai nainte ( )
2 2
=
x
s E ,
2
x
s fiind un estimator nedeplasat al
dispersiei).
Sumnd pentru toate grupurile se obine
( )
( )
( ) ( )
2
2
2 2 2
1
1
i i
i i
w e
n E S
n S
N k
E s E
N k N k N i

| |

= = = =
|
|

\


Deci
2
w
s este un estimator nedeplasat al lui
2
indiferent dac ipoteza
0
H este adevrat sau nu.
Dac n n n n
k
= = = = ...
2 1

( )
(

\
|
+

= |

\
|

=

2
2
2
2
1 1
1
1

i i i i
B
B
k
n
X X n
k k
SS
s
( )
2
2
1
i
ns
k
n
i

i
( )
2
2 2 e
e
E ns n
n

= =
n ceea ce privete avem dou cazuri n funcie de cum a fost ales:
a) este o variabila aleatoare ( )
2
, 0

N , atunci
2 2 2
e B
s ns s + =

si
( )
2 2 2
e B
n s E

+ =
b)
i
factori fici , 0 = =
i i i
i 0 = , atunci
( )
2
2
2
1
0
e
i
B
s
k
n s +

=


i ( )
2
2
2
1
e
i
B
k
n s E

=


Deci ne referim la grupe oarecare, alese ntmplator din toate seleciile
posibile din ntreaga populaie, este o variabil aleatoare care aparine
( )
2
, 0

N , dar nu mai avem 0 =
i
pentru o grup de selecie oarecare.
Este cazul cnd concluziile ce ne intereseaz se refer, n principal, la
ntreaga producie i nu la arjele cercetate.
Calcule similare arat c, atunci cnd n n n n
k
= = = = ...
2 1
,
2 2 2
e B
s ns s + =

i ( )
2 2 2

n s E
e B
+ = .
II. STATISTIC MATEMATIC I BIOSTATISTIC
ANOVA

109
Ca urmare,
1
2

=
k
SS
s
B
B
este o estimatie nedeplasat a lui
2
e
numai
atunci cnd ipoteza
0
H este adevrat.


b) Clasificarea ierarhic n trepte. Scindarea dispersiei totale n
dispersii pariale ale treptelor.

Dac vom considera eroarea unei metode de analiz, este de ateptat
ca aceasta s fie egal cu suma erorilor pariale ale fazelor analizei.
Scindarea erorii totale n erorile pariale ale fazelor ofer
posibilitatea punerii n eviden a fazelor ce determin diminuarea
reproductibilitii i a locului unde trebuie intervenit pentru mbuntirea
metodei.
























II. STATISTIC MATEMATIC I BIOSTATISTIC
ANOVA

110
2.8. 2. Analiza dispersional multifactorial
n analiza anterioar criteriul de mprire n grupuri a fost unul
singur calea de administrare sau perioada de administrare. n continuare
ne vom ocupa de cazul cnd vrem s determinm ponderea a doi factori n
acelai timp, folosind datele obinute ntr-un singur experiment.
Pentru simplificarea scrierii prezentm pentru nceput cazul cnd
testm k medicamente continnd aceeai substan activ, administrate n n
perioade diferite.
Se consider c efectele determinate de cei doi factori analizai sunt
variabile aleatoare independente. Avnd doi factori, se testeaz dou ipoteze
de nul. Dac vom aeza datele ntr-o matrice, liniile i coloanele
corespunznd respectiv pentru valori date ale primului i ale celui de al
doilea factor, o prim ipotez se refer la egalitatea mediilor liniilor, iar a
doua la egalitatea mediilor coloanelor. Ipoteza alternativ presupune
existena unor diferene ntre linii sau respectiv ntre coloane.

Tabelul nr. 10 :

Medicament

1 2 k
1 X
11
X
12
X
1k
. 1
x
2 X
21
X
22
X
2k
. 2
x
.
.
.

P
e
r
i
o
a
d
a

n X
n1
X
n2
x
nk
. n
x

1 .
x
2 .
x

k
x
.



unde
j
x
.
reprezint media valorilor din coloana i, iar
. i
x reprezint media
valorilor din linia j.






II. STATISTIC MATEMATIC I BIOSTATISTIC
ANOVA

111
2.8.2.1. Modelul variabilei aleatoare.
Valorile experimentale le considerm ca rezultanta unor efecte
aditive corespunztor liniilor, coloanelor i erorilor ntmpltoare:

ij j i ij
x + + + =
unde
i
este partea lui
ij
x datorat liniei (schemei de administrare),
j

reprezint contribuia coloanei (forma medicamentoas), iar
ij
este eroarea
experimental.


2.8.2.2. Scindarea sumei ptratelor abaterilor.
Suma ptratelor abaterilor valorilor individuale fa de media
generala M este:
( )

=
2
M x SS
ij T
, expresie ce se poate scrie i n forma:
( ) ( ) ( ) ( ) [ ]
( ) ( ) ( )
R C L C L C L
C L C L ij T
SS SS SS M x x x M x M x
M x x x M x M x M x SS
+ + = + + +
= + + + = =


2 2 2
2
2

Produsele mixte nu s-au mai trecut deoarece sunt nule.
Am scindat aadar variabilitatea total ntr-o component dat de
linii, o component dat de coloane i o component rezidual.
Corespunztor rezultatelor prezentate la analiza unifactorial, aici se
poate arta c:
( ) ( )

+ + =
2 2 2
1
j C i L L C T
n n n n SS E
( ) ( )

+ =
2 2
1
i L C L
n n SS E
( ) ( )

+ =
2 2
1
j C L C
n n SS E
( ) ( )( )
2
1 1 =
L C R
n n SS E
In cazul analizei bifactoriale apar dou ipoteze de nul pe care vrem
s le testm:
( )
:
1
0
H toate formele de tratament (liniile) sunt echivalente, adica 0 =
i
;
( )
:
2
0
H toate medicamentele (coloanele) sunt echivalente, adica 0 =
j
.
Indiferent dac ipotezele sunt adevrate sau nu, ( )
2 2
=
R
s E .
Dac cele dou ipoteze sunt adevrate:
2 2
R e
s s = ,
2
C
s si
2
L
s sunt
estimaiile nedeplasate ale lui
2
.
II. STATISTIC MATEMATIC I BIOSTATISTIC
ANOVA

112
Pentru a testa ipoteza
( ) 1
H este natural s considerm raportul
2
2
e
L
s
s
,
iar pentru ipoteza
( ) 2
H raportul
2
2
e
C
s
s
.
n cazul n care pentru fiecare combinaie de cauze se fac mai multe
determinri folosind mai muli voluntari, variabilitatea se poate scinda n
patru componente:
R W C L T
SS SS SS SS SS + + + =





























II. STATISTIC MATEMATIC I BIOSTATISTIC
ANOVA

113
2.8.2.3. Exemplul: Variaia unui parametru farmacocinetic att n
funcie de calea de administrare ct i n funcie de numrul de
administrare

Constanta de eliminare
1 4
min 10

e
k
Tabelul nr. 11:
Oral prima
doza
i.m. o
doza
i.m. a-5-
doza
i.v.
106 55 84 63
109 40 105 70
160 109 174
i
x
375 204 363 133
1075 =

2
i
x
48717 16506 48357 8869
122449
2
=

x
i
n
3 3 3 2 N=11
1
i
n
2 2 2 1
( ) 7 1 =
i
n
i
x
125 68 121 66
( )
17392
2
2
= =

N
x
x SS
T

Mai departe considerm dou grupuri: voluntarii crora medicamentul li s-a
administrat o dat i voluntarii care au primit 5 doze.
( )
( )
2235 105056
8
133 204 375
3
363
.
2 2
=
+ +
+ = doze nr SS
B

( ) 15157 2235 17392 . = = = doze nr SS SS SS
T W

1684
9
15157
= =
k N
SS
W
, 15157
1
15157
1
= =
k
SS
B

( ) ( ) 9
1684
15157
9 , 1 , 1 = = =

F k n k F
i
care aparine zonei de acceptare
pentru riscul 01 , 0 ( ) 56 , 10
99 ; 9 , 1
= f dar nu aparine zonei de acceptare
pentru 05 , 0 ( ) 12 , 5
95 ; 9 , 1
= f .
( )
( )
17392
11
1075
122449
2
2
2
2
= = = =


N
x
x x x SS
i T

II. STATISTIC MATEMATIC I BIOSTATISTIC
ANOVA

114
Un alt factor care poate influena concentraia n snge este calea de
administrare.
( ) ( )
8428 105056 8844 43923 13872 46875
11
1075
2
133
3
204
3
375
2 2 2 2
1
2
1
2
1
1
2
= + + +
= + + =
=
|
|

\
|

|
|

\
|
= =

=
=
k
i
i j
ij
k
i
n
j
ij
k
i
i i B
n
x
n
x
X x n cale SS
i
( )
( )
2235 105056
8
133 204 375
3
363
.
2 2
=
+ +
+ = doze nr SS
B

( ) ( ) 6792 2235 8428 17392 . = = = doze nr SS cale SS SS SS
B B T W

n acest fel am obinut urmtoarele rezultate:
Tabelul nr. 12
Sursa de variaie GL SS Rapotul F
ntre cile de administrare 3 8428 f(3,6)=1,24
ntre numarul de doze 1 2235 f(1,6)=0,32
Variaia intragrupuri 6 6792
Variaia total 10 17392

i comparnd cu valorile din tabelele de repartiie Fisher se constat c
poate fi acceptat ipoteza c toate grupurile cercetate aparin aceleiai
populaii statistice. Deci, nici calea de administrare i nici numrul de doze
nu influeneaz rata eliminrii.












II. STATISTIC MATEMATIC I BIOSTATISTIC
ANOVA

115
2.8.2.4. Exemplul: Compararea biodisponibilitii unei substane active
administrate n preparate diferite i n perioade diferite de tratament.

Trei medicamente au fost administrate la nou subieci ntr-un studiu
de biodisponibilitate obinndu-se ariile de sub curb prezentate n Tabelul
urmator

Tabelul nr. 13 :


Separm acum varianta n patru componente: pacieni, perioad,
medicament i eroarea n interiorul tuturor grupurilor.
( )
1 , 33162
2
2
= =

N
x
x SS
T

( )
( ) ( )
1 , 29834
3
9
1
2 2
= =


= i
B
N
x linie
pacienti SS
( )
( ) ( )
5 , 1116
9
3
1
2 2
= =


= i
B
N
x medicament
medicament SS
( )
( )
3 , 264
9
2
2 2 2
=
+ +
=

N
x III II I
perioada SS
B

Perioada 1 2 3 Suma
Pacient 1 B=107 C=102 A=99 308
Pacient 2 A=100 C=106 B=89 295
Pacient 3 B=98 A=90 C=128 316
Pacient 4 C=71 B=54 A=63 188
Pacient 5 A=92 B=111 C=107 310
Pacient 6 C=113 A=115 B=91 319
Pacient 7 B=169 A=107 C=195 551
Pacient 8 C=88 B=95 A=77 260
Pacient 9 A=122 C=168 B=155 445
Suma pe perioad I: 160 II: 1028 III: 1004
2992 =

x
Suma pe medicament A: 945 B: 969 C: 1078
364720
2
=

x
Media pe medicament 105 107,7 119,8
II. STATISTIC MATEMATIC I BIOSTATISTIC
ANOVA

116
( ) ( ) ( ) 2 , 1947 = = perioada SS medicament SS pacienti SS SS SS
B B B T W

Pe aceasta cale obinem:

Tabelul nr. 14:
Sursa de variaie DF Suma ptratelor Media Raportul F
ntre pacieni 8 29834,1 3729,3
ntre medicamente 2 116,1 558,3 3,15
ntre perioade 2 264,3 132,1 0,75
Variaia
intragrupuri
14 1947,2 177
Total 26 33162,1

Deoarece 74 , 3
99 , 0 ; 14 , 2
= f nu exist diferene semnificative ntre cele
dou medicamente dup administrare unic sau administrri multiple.

II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTAREA EFECTELOR

117
2.9. Inferenta statistic pentru efecte ntr-un experiment standard 2*2
cross over

2.9.1. Modelul statistic

Considerm dou medicamente, unul de testat (T) i altul de
referin (R), administrate n dou perioade (I i II). Raiunea principal a
experimentului cross over, eveniment n care o parte din subieci primesc
cele dou medicamente n secvena RT, iar cealalt parte n secvena TR,
este aceea c, analiza datelor obinute poate pune n eviden efectele
reziduale, sau carry over, cum mai sunt numite, ale administrrii n
prima perioad, asupra rezultatelor obinute n perioada a doua. n cazul
existenei unor astfel de efecte este necesar s se poat face distincia ntre
efectele directei efectele reziduale. Efectul direct este efectul ce l are
medicamentul n perioada n care este administrat, pe cnd efectul carry
over este efectul pe care acesta l are n perioada urmtoare administrrii
sale. Spunem c un medicament are un efect carry over de ordin k, dac
efectul primei administrri se manifesta i dup k perioade de administrare.
Rezultatele experimentului sunt variabile aleatoare
ijk
Y pe care le
considerm avnd urmtoarea structur:

Y
( ) ( ) ijk k j k j j ik ijk
e C F P S + + + + + =
, 1 ,


unde este media totala, i este indicele pentru subiect,
k
n i , 1 = , j este
indicele pentru perioad i k este indicele pentru secvena.
( ) k j
F
,
este efectul
direct, fix, al medicamentului (formulrii) administrat n perioada j, n
secvena k (Observaie: efectul este de fapt cantitatea de medicament
msurat).
Schema de administrare fiind
|
|

\
|
TR
RT
avem c
( )
( )
|
|

\
|
=
R T
T R
k j
F F
F F
F
,
i,
din faptul c este media lui
ijk
Y avem
( )
0
,
=
k j
F si
( )
0
, 1
=
k j
C .
( ) k j
C
, 1
este efectul carry over (fix) al medicamentului administrat n
perioada j-1 (considerm c, datorit existenei unui interval de timp de
splare, efectul carry over nu depete o perioad).
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTAREA EFECTELOR

118
ijk
e reprezint eroarea aleatoare n msurarea valorilor individuale pentru
fiecare subiect.
Considerm ca variabilele
ik
S sunt repartizate identic, cu media 0 i
dispersia
2
s
, iar variabilele
ijk
e sunt repartizate ( )
2
, 0
e
N . n fapt,
dispersiile erorilor pot diferi de la un medicament la altul.

































II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTAREA EFECTELOR

119
2.9.2. Testarea efectului secvenei de administrare

Pentru efectul secvenei de administrare sau a efectelor carry over,
considernd urmtoarele totaluri pe subieci n cadrul unei secvene date:
k i k i ik
Y Y U
2 1
+ = ,
k
n i , 1 = , 2 , 1 = k (R+T si respective T+R)
Valoarea medie i dispersia variabilelor
ik
U vor fi:
( )
)
`

+
+
=
2 sec , 2
1 sec , 2
venta in subiectii pentru C
venta in subiectii pentru C
U E
T
R
ik


( ) ( )
2 2
2 4 2
2 1
e s k i k i ik ik
D U D + = + + =
( ) ( )
2 2 2
2 2
e s ik u
U D + = = pentru toi subiecii.
Fie
R T
C C C = . C poate fi folosit pentru determinarea efectelor
carry over. Datorit restriciei 0 =
R T
C C efectele carry over sunt
egale pentru cele dou formulri, adic 0 = C , dac i numai dac
0 = =
R T
C C . Ca urmare, testarea absenei efectelor carry over este
echivalent cu testarea egalitii acestora. Cnd efectele carry over sunt
absente, efectul direct al medicamentului ( )
R T
F F F = poate fi estimat pe
baza datelor din amndou perioadele. Dac efectele carry over nu sunt
egale, nu exist un estimator nedeplasat pentru efectul direct al
medicamentului, din acest motiv fiind necesar testarea prealabil a
existenei efectelor carry over.
Consideram de exemplu ca efectul medicamentului R este 9 si cel al
medicamentului T este tot 9, efectul de perioada este 0 si efectul rezidual
este 1 pentru R si 2 pentru T.
Vom avea rezultatele:

P
I
P
II

Secv. RT 9 9+1
Secv. TR 9 9+2

Diferenta aparenta R-T va fi:
( ) ( ) [ ] ( ) [ ]
2
1
2 1
2
1
2
1
2 sec 1 sec
= + = +
v I II v II I
P P P P

II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTAREA EFECTELOR

120
Daca insa efectele de secventa sunt 10 pentru R si 9,5 pentru T,
atunci efectul de perioada este tot 0, iar efectele carry over egale
amandoua cu 1, vom gasi:

P
I
P
II

Secv. RT 10 9,5+1
Secv. TR 9,5 10+1

Ceea ce inseamna ca diferenta aparenta R-T va fi:
( ) ( ) [ ] ( ) [ ]
2
1
5 , 1 5 , 0
2
1
2
1
2 sec 1 sec
= + = +
v I II v II I
P P P P
Deci, daca apar efecte reziduale inegale ele vor fi luate drept efecte
de formulare.
Din acest motiv, pentru a ne asigura ca estimarea diferentei de
formulare este corecta, trebuie sa testam in prealabil faptul ca nu avem
efecte reziduale inegale.

Existena efectelor carry over inegale poate fi determinat prin
testarea urmtoarelor ipoteze:
R T
C C C H = = 0 :
0

R T
C C C H 0 :
1

Respingerea ipotezei nule duce la concluzia prezenei efectelor carry
over inegale. Pentru testarea ipotezelor asupra lui C se folosesc
urmtoarele medii de selecie corespunznd fiecrei secvene:

=
=
k
n
i
ik
k
k
U
n
U
1
.
1
, 2 , 1 = k
1 .
U i
2 .
U sunt mediile de selecie pentru eantioane aleatoare
independente din populaii normale cu dispersii egale. Ca urmare testarea se
poate face utiliznd testul t pereche.
C poate fi estimat prin diferena ntre mediile subiecilor pentru cele
dou secvene:
( ) ( )
22 . 12 . 21 . 11 . 1 . 2 .

Y Y Y Y U U C + + = =
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTAREA EFECTELOR

121
innd cont de presupunerile asupra variabilelor
ik
S prezentate
anterior, C

este normal distribuit cu media C i dispersia


( ) ( )
|
|

\
|
+ =
|
|

\
|
+ + =
2 1
2
2 1
2 2
1 1 1 1
2 2

n n n n
C D
u e s
.
Dispersia ( ) C D

poate fi estimat prin nlocuirea lui


2
u
cu
2 2

u u
S =
dispersia de selecie total pentru subiecii din cele dou secvene:
( )
|
|

\
|
+ =
2 1
2
1 1

n n
C D
u
unde ( )

= =

+
=
2
1 1
2
.
2 1
2
2
1

k
n
i
k ik u
k
U U
n n

Mai departe, ( )
2
2 1
2
u
n n + este distribuit ( ) 2
2 1
2 2
+ n n
u
unde
( ) 2
2 1
2
+ n n este o variabil distribuit
2
cu 2
2 1
+ n n grade de
libertate, independent de C

. Astfel, n ipoteza
0
H ,
2 1 2 1
1 1

1 1

n n
X X
n n
C
T
u
R T T R
u
c
+

=
+
=
+ +

are o repartiie Student cu 2
2 1
+ n n
grade de libertate. Ca urmare, vom respinge ipoteza nul
R T
C C H = :
0
n favoarea ipotezei alternative
R T a
C C H : la un nivel
de semnificaie, dac
|

\
|
+

2 ,
2
2 1
n n
c
t T

.
Deoarece variabila testat
c
T conine estimarea ( )
2 2 2
2 2
e s u
+ =
care se refer att la variabilitile ntre i intra subieci, puterea testului
va fi mai mic n cazul n care variabilitatea ntre subieci este mai mare
dect intravariabilitatea. n studiile de biodisponibilitate / bioechivalen, ca
regul, mrimea lotului de testat se alege pe baza calculelor privind puterea
pornind de la efectul direct al medicamentului, efect ce implic
intravariabilitatea. Pentru a crete puterea testului, Grizzle a sugerat testarea
ipotezei nule la un nivel de semnificaie % 10 = n loc de 5%.
Pe baza statisticii t, se poate calcula un interval de ncredere
( ) % 100 * 1 pentru C:
2 1
2 ,
2
1 1

2 1 n n
t C
u
n n
+
|

\
|
+

.
Dac intervalul conine pe 0, atunci suntem n favoarea (sau de fapt
nu putem respinge) ipotezei nule c nu exist efecte carry over sau c
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTAREA EFECTELOR

122
acestea sunt egale. Dac intervalul nu conine pe 0, tragem concluzia c
exist efecte carry over diferite pentru cele dou formulri.





































II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTAREA EFECTELOR

123
2.9.3. Efectul direct al medicamentului

n vederea testrii efectului direct al medicamentului se pot folosi
diferenele ntre perioade n interiorul fiecrei secvene, dup cum urmeaz:
( )
k i k i ik
Y Y d
1 2
2
1
= ,
k
n i , 1 = , 2 , 1 = k .
Valoarea medie i dispersia pentru diferenele din cadrul perioadelor
sunt:
( )
( ) ( ) [ ]
( ) ( ) [ ]

)

+ +
+ +
=
2 sec ,
2
1
1 sec ,
2
1
1 2
1 2
venta in subiectii pentru C F F P P
venta in subiectii pentru C F F P P
d E
T T R
R R T
ik
( )
2
2
2 e
d ik
d D

= =
Se vede c dispersia diferenelor ntre perioade include numai
intravariabilitatea, ceea ce reprezint de fapt avantajul experimentului de tip
cross over. n ceea ce privete media diferenelor, aceasta include att
efectul direct al medicamentului ct i efectul rezidual (carry over).
Sa notm efectul perioadei i efectul direct (efectul formulrii) prin
1 2
P P P = i
R T
F F F = .
Pentru a verifica ipotezele statistice asupra lui F, s considerm
mediile diferenelor ntre perioade n interiorul fiecrei secvene:

=
=
k
n
i
ik
k
k
d
n
d
1
.
1
, 2 , 1 = k .
Diferena ntre secvene (
2 . 1 .
d d ) este un estimator nedeplasat al
lui F atunci cnd nu avem efecte carry over inegale (
T R
C C = )
( ) ( )
( )
2 2
2 . 1 .
C
F
C C
F F d d E
T R
R T
=

+ = unde
R T
C C C = .
Ca urmare, dac
R T
C C nu avem un estimator nedeplasat pentru F
din datele pentru amndou perioadele. Dac ns
R T
C C = , atunci
( ) ( ) [ ]
R T
Y Y Y Y Y Y d d F = = =
12 . 22 . 11 . 21 . 2 . 1 .
2
1


II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTAREA EFECTELOR

124
este un estimator nedeplasat cu dispersia minim pentru f (unde
( )
12 . 21 .
2
1
Y Y Y
T
+ = i ( )
22 . 11 .
2
1
Y Y Y
R
+ = ). Schema de administrare fiind
|
|

\
|
TR
RT
rezult c ( )
2 1
2
1
R R Y
R
+ = .
Observm c
R
Y si
T
Y sunt aa numitele least squares (LS) cele
mai mici ptrate pentru produsul de referin i cel testat.
n practic, F este estimat prin diferena direct ntre mediile celor
dou formulri
* * *

R T
Y Y F = ,
unde
|
|

\
|
+
+
=

= =
1 2
1 1
22 11
2 1
*
1
n
i
n
i
i i R
Y Y
n n
Y i
|
|

\
|
+
+
=

= =
1 2
1 1
12 21
2 1
*
1
n
i
n
i
i i T
Y Y
n n
Y
Cnd
T R
C C = , se obine
( ) ( ) ( ) [ ]
2 2 1 1 2 1 2 1
2 1
*
1
P n P n F n n n n
n n
Y E
R R
+ + + + +
+
= i
( ) ( ) ( ) [ ]
1 2 2 1 2 1 2 1
2 1
*
1
P n P n F n n n n
n n
Y E
T T
+ + + + +
+
= .
Deci, ( ) ( ) ( ) ( ) [ ]
2 2 1 1 1 2
2 1
* *
1
P n n P n n
n n
F F Y Y E
R T R T
+
+
+ =
Ca urmare, diferena ntre mediile celor dou formulri
*

F , nu este
un estimator nedeplasat pentru F dect atunci cnd
2 1
n n = .
Remarcam faptul ca in practica, din auza ca o parte din subiecti
parasesc experimentul clinic inainte ca acesta sa se termina, cazul
2 1
n n = este foarte rar. In ciuda acestui fapt unele softuri uzuale ignora
aceste fapte ceea ce, dupa cum se va arata mai departe, poate duce la alterari
semnificative ale rezultatelor.
Diferena ntre mediile least square pentru cele dou
formulari, F

, este normal distribuit, cu media F i dispersia


( )
|
|

\
|
+ =
2 1
2
1 1

n n
F D
d
.
Deoarece{ }
1 i
d ,
1
, 1 n i = si { }
2 i
d ,
2
, 1 n i = sunt dou selecii
independente din populaii normale cu dispersii egale (atunci cnd nu avem
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTAREA EFECTELOR

125
efecte carry over inegale) un test pentru efectul direct poate fi obinut pe
baza statisticii t pereche.
2 1
2
1 1

n n
F
T
d
d
+
=


unde
2

d
este dispersia de selecie pentru diferena ntre perioade, i este un
estimator nedeplasat al lui
2
d

( )

= =

+
=
2
1 1
2
.
2 1
2
2
1

k
n
i
k ik d
k
d d
n n

Deoarece ( )
2
2 1
2
d
n n + este distribuit ( ) 2
2 1
2 2
+ n n
d
,
d
T este
distribuit t cu 2
2 1
+ n n grade de libertate. Un interval de ncredere
( ) % 100 * 1 pentru F este urmtorul:
2 1
2 1
1 1
2 ,
2

n n
n n t F
d
+ |

\
|
+


Prezena efectului direct al medicamentului poate fi examinat prin
testarea ipotezelor:
R T
F F H = :
0
si
R T
F F H :
1
. Respingem
0
H dac
|

\
|
+

2 ,
2
2 1
n n
d
t T

.
Trebuie s observm c aceast metod de testare se refer la
egalitatea efectelor celor dou medicamente i nu la bioechivalena lor,
care va fi discutat mai departe.
Dup cum s-a menionat mai sus, F

nu este un estimator nedeplasat


al lui F n prezena efectelor carry over inegale (
R T
C C ). Un estimator
nedeplasat al lui F poate fi obinut totui folosind numai datele din prima
perioad, dar cu o pierdere de informaie i, n consecin, de precizie. Dac
11 .
Y i
12 .
Y sunt mediile celor dou formulri n prima perioad, atunci:
( ) ( ) ( ) F F F F P F P Y Y E
R T R T
= = + + + + =
1 1 11 . 12 .

S notm
C
F
Y Y

11 . 12 .
= . Avem c
C
F

este un estimator
nedeplasat al lui F, chiar i n prezena efectelor carry over inegale.
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTAREA EFECTELOR

126
Dispersia lui
C
F

este ( ) ( )
|
|

\
|
+ + =
2 1
2 2
1 1
n n
D
e s
C
F
. Observm
deasemenea c ( ) ( )
|
|

\
|
+
|
|

\
|
+ =
2 1
2
2
1 1
2

n n
F D D
e
s
C
F

. Deci, pierderea de
precizie ca urmare a folosirii numai a datelor din prima perioad este de
minim 50% atunci cnd 0
2
=
s
.
Din acest motiv, n practic, este foarte important perioada de
splare pentru a disprea efectele reziduale pn la a dou administrare.
n prezena efectelor carry over inegale, se poate verifica ipoteza
privind inegalitatea efectelor i se poate construi i un interval de ncredere
( ) % 100 * 1 pentru F folosind datele din prima perioad.
Un estimator nedeplasat pentru ( )
C
F
D

este ( )
|
|

\
|
+ =
2 1
2
1 1
n n
S D
f
C
F

unde ( )

= =

+
=
2
1 1
2
1 . 1
2 1
2
2
1
k
n
i
k k i f
k
Y Y
n n
S .

Observm ca
2
f
S este un estimator nedeplasat pentru
2 2
e s
+ , dar
nu avem estimri individuale pentru
2
s
si
2
e
pornind numai de la datele
din prima perioad.

Intervalul de ncredere ( ) % 100 * 1 pentru F n prezena efectelor
carry over inegale va fi
2 1
2 ,
2
1 1
2 1 n n
S t
f
n n C
F
+
|

\
|
+

.

Ipoteza nul privind absena efectului direct este respins dac
|

\
|
+

+
2 ,
2
2 1

2 1 1 1
n n
f
C
F
t
n n
S

.



II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTAREA EFECTELOR

127
n practic, n prezena efectelor carry over inegale, datele din
prima perioad sunt folosite efectiv pentru a testa bioechivalena, dar nu
trebuie s uitm urmtoarele consecine ale acestei proceduri:

1) Puterea de detecie a diferenelor semnificative clinic este micorat
datorit creterii dispersiei i,

2) Pierderea de informaie anuleaz nsi avantajul experimentului
crossover i anume eliminarea variabilitii ntre subieci n compararea
formulrilor.





























II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTAREA EFECTELOR

128
2.9.4.Efectul perioadei

S definim urmtoarele diferente:
( )
( )
)
`

=
T R venta in subiectii pentru d
R T venta in subiectii pentru d
O
ik
ik
ik
2 sec . ,
1 sec . ,

Valoarea medie i dispersia acestor diferene cross over sunt:
( )
( ) ( ) [ ]
( ) ( ) [ ]

)

+
+ +
=
2 sec ,
2
1
1 sec ,
2
1
2 1
1 2
venta in subiectii pentru C F F P P
venta in subiectii pentru C F F P P
O E
T R T
R R T
ik

i
( )
2
2
2 e
d ik
O D

= =
Fie
1 .
O i
2 .
O mediile de selecie ale diferenelor n secvenele 1 i 2. Avem
)
`

=
=
=
2
1
2 .
1 .
.
k pentru d
k pentru d
O
k

Un estimator nedeplasat pentru efectul perioadei P poate fi obinut ca
( ) ( ) [ ]
22 . 12 . 11 . 21 . 2 . 1 .
2
1

Y Y Y Y O O P = =
Deoarece 0 = +
R T
C C , P

este un estimator de dispersie minim


pentru P, indiferent de prezena efectelor carry over inegale.
Un interval de ncredere ( ) % 100 * 1 pentru P este
2 1
2 ,
2
1 1

2 1 n n
t P
d
n n
+
|

\
|
+

.
Respingem ipoteza nul privind absena efectului de perioad:
2 1 0
: P P H = ,
2 1
: P P H
a
atunci cnd
|

\
|
+

2 ,
2
0
2 1
n n
t T

, unde
2 1
0
1 1

n n
p
T
d
+
=

.
Interferena statistic pentru efectele carry over, directe i de
perioada sunt prezentate, n rezumat, n tabelul urmator
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTAREA EFECTELOR

129

Tabel nr. 15: Teste statistice pentru efectele fixe ntr-un experiment 2*2
cross over.

Efect Efecte
carry
over
inegale
MVUE
*
( ) . . % 100 / 1 I C
Test statistic
C
a
r
r
y

-

o
v
e
r
-
( ) (
22 . 12 . 21 . 11 .
1 . 2 .
Y Y Y Y
U U C
+ +
= =

2 1
2 ,
2
1 1
2 1 n n
t C
u
n n
+
|

\
|
+


2 1
1 1
n n
C
T
u
c
+
=


E
f
e
c
t

d
i
r
e
c
t

Nu
( ) ( [
22 . 11 . 21 .
2 . 1 .
2
1
Y Y Y Y
d d F

= =

2 1
2 ,
2
1 1
2 1 n n
t F
d
n n
+
|

\
|
+


2 1
1 1
n n
F
T
d
d
+
=


E
f
e
c
t

i
n
d
i
r
e
c
t

Da
11 . 12 .
Y Y
C
F
=
2 1
2 ,
2
1 1
2 1 n n
S t
C
F
f
n n
+
|

\
|
+


2 1
1 1
n n
S
C
F
T
f
f
+
=

P
e
r
i
o
a
d
a


-
( ) ( [
12 . 11 . 21 .
2 . 1 .
2
1
Y Y Y Y
O O P
+
= =

2 1
2 ,
2
1 1
2 1 n n
t P
d
n n
+
|

\
|
+


2 1
1 1
n n
P
T
d
o
+
=







MVUE
*
minimum variance unbiased estimate estimare nedeplasata de
dispersie minima.




II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTAREA EFECTELOR

130

II. STATISTIC MATEMATIC I BIOSTATISTIC
LEGATURA ANOVA TESTUL T

131
2.10. Metoda ANOVA si legatura cu testul t in verificarea ipotezei
privind bioechivalenta

2.10.1. Modelul Statistic General

Analiza dispersional a datelor de bioechivalenta urmeaza un model
statistic de ANOVA pe doua cai cu interactiuni de tipul:
ijk jk j k ijk
Y + + + + =
S notm c prezena unui efect de interaciune este echivalent cu
ne-aditivitatea efectelor principale.
Suplimentar fata de conditiile puse la ANOVA pe doua cai, vom
avea
0

= =
k
jk
j
jk

Statisticienii vorbesc despre nivelele pe care le iau factorii.
Termenul se refer in fapt la valorile (numerice sau calitative) pe care le
poate lua factorul. De exemplu dac factorul este perioada ntr-un
experiment de bioechivalen nivelele sale sunt I, II, III dac experimentul
are trei perioade. n ceea ce privete factorul formulare nivelele acestea sunt
medicamentele experimentate (de exemplu referin, testat 1 i testat 2).
ntr-un experiment standard de bioechivalen secvena are dou nivele RT
i TR. Trebuie avut totui n vedere c aceati factori nu sunt toi
independeni unii din ei putndu-se obine prin combinaii liniare de ceilali.
Problema, la modul general, sufera o complicare majora atunci cand
numarul nivelelor luate de un factor, nu este acelasi in fiecare celula, caz in
care se spune ca experimentul nu mai este echilibrat (balansat). Ne vom
limita, pentru moment, la studiul cazului echilibrat asa cum se face, se pare,
in toate cartile si articolele publicate. Din pacate cazul mult mai frecvent in
experimentele clinice este acela neechilibrat. De exemplu, in experimentele
de bioechivalenta, datorita iesirii din experiment a unora dintre subiecti,
secventele raman inegale.
In chiar cazurile ca modelul se aplica experimentelor clinice, exista
posibilitatea unei confuzii de termeni. Astfel , in lucrarile de statistica
observm c repetiie semnific faptul c acelasi experiment se repet pe
mai multi voluntari sau pacieni, n timp ce, in experimentul de biostatistica,
repetiia nseamna administrarea aceluiai medicament de mai multe ori la
acelai subiect deci in mai multe perioade, ceea ce este cu totul alt model de
studiu.
II. STATISTIC MATEMATIC I BIOSTATISTIC
LEGATURA ANOVA TESTUL T

132
Ipoteza de verificat este aceea a lipsei efectelor factorilor si, ca
urmare si a interactiunii intre acestia.

0
: 0 1
: : 0 1
: 0 1 1
A k
B j
AB jk
H unde k K
H H unde j J
H unde j J si k K


: 0
alternativa
H cel putin un factor este diferit de
Se noteaz cu:

=

i j k
ijk
Y Y si cu

=

i j k
ijk
Y
IJK
Y
1


jk ijk
i
Y Y

i cu
1
jk
ijk I
i
Y Y =



j ijk
i k
Y Y

=

i cu
1
j
ijk IK
i k
Y Y =



k ijk
i j
Y Y

i cu
1
k
ijk IJ
i j
Y Y =


Atragem atentia ca, intr-un experiment neechilibrat, formulele
pentru calculul mediilor prezentate mai sus nu mai raman valabile. Mediile
de selectie de tipul celor de mai sus sunt estimatori nedeplasati ai efectului
celor doua formulari numai atunci cand secventele sunt egale.
In fapt experimentele sunt proiectate sa fie echilibrate dar pana la
sfarsit ele devin neechilibrate.
Se observ c:
( )=

Y Y
ijk
( ) +

Y Y
k
( )+

Y Y
j
( )+ +

Y Y Y Y
k j jk
( )

jk ijk
Y Y
Si, deoarece produsele mixte ale sumelor de mai sus sunt nule,
eroarea totala se poate descompune dupa cum urmeaza:
=
T
SS ( ) =

2
Y Y
ijk

= ( ) +

2
Y Y
k
( ) +

2
Y Y
j
( ) + +

2
Y Y Y Y
k j jk
( )

2
jk ijk
Y Y =
2 2 2 2
R AB B A
S S S S + + +
Termenii acestei diferene corespund respectiv efectelor principale,
interaciunilor i unei fluctuaii aleatoare.
Deoarece indicele i se refera la subiectii experimentului ( )
jk ijk
Y Y


,diferenta intre valoarea subiectului i si media subiectilor din perioada j si
II. STATISTIC MATEMATIC I BIOSTATISTIC
LEGATURA ANOVA TESTUL T

133
secventa k, reprezinta o intervariabilitate. In biologie aceasta este foarte
mare si ipoteza unor subiecti identici este departe de realitate sau se poate
lua in calcul in cazul unor studii pe populatii foarte mari.
Pentru modelul echilibrat, dat fiind modelul statistic, sumele
obtinute sunt estimari respectiv pentru parametrii cercetati de noi:
=
k
( )

Y Y
k

=
j

( )

Y Y
j

=
jk
( )

+ Y Y Y Y
k j jk

...
Y =
Statistica F pentru verificarea ipotezelor
A B AB
H , H , H are la
numrtor respectiv mediile sumelor de ptrate
2 2 2
A B AB
, , S S S , iar la numitor
ntotdeauna media sumei ptratelor rezidualelor
2
R
S . Gradele de libertate
sunt respectiv ( ) ( ) ( )
A R B R AB R
, , , , , unde:
1 = K
A
, 1 = J
B
, ( )( ) 1 1 = K J
AB
si ( ) 1 = I JK
R


Sinteza formulelor de calcul este dat n tabelul urmator.


















II. STATISTIC MATEMATIC I BIOSTATISTIC
LEGATURA ANOVA TESTUL T

134
Testarea ipotezelor privind actiunea factorilor asupra rezultatelor
studiului incrucisat.

Tabelul nr. 16:
Varia
-ia
Grade de libertate
(df)

Suma ptratelor
(SS)
Media sumei
ptratelor
(MS=SS/df)

Statistica F

A
A
1 K =
( )
2
2
A
k
k
S IJ Y Y =


A
A
A
S
MS

2
=
R
A
A
MS
MS
F =
B
B
1 J = ( )
2
2
B
j
j
S IK Y Y =


B
B
B
S
MS

2
=
R
B
B
MS
MS
F =

I
n
t
e
r
a
c

i
u
n
i
A
B
( )( ) 1 1
=
K J
AB

+
=
j k
k j jk
AB
Y Y Y Y I
S
2

AB
AB
AB
S
MS

2
=

R
AB
AB
MS
MS
F =

R
e
z
i
d
u
a
l

R

( ) 1
=
I JK
R


( )
2
2
R
jk
ijk
i j k
S Y Y =


R
R
R
S
MS

2
=

T
o
t
a
l

S
1 IJK = ( )
2
T ijk
i j k
SS Y Y =

















II. STATISTIC MATEMATIC I BIOSTATISTIC
LEGATURA ANOVA TESTUL T

135
2.10.2. Analiza dispersional in cazul unui studiu privind
bioechivalenta a doua medicamente, incrucisat, cu doua perioade si
doua secvente

Modelul Biostatistic
Se consider dou medicamente, unul de testat (T) i unul de
referin (R), administrate unui lot de voluntari sntoi n dou secvene
(RT) i (TR) i dou perioade (I i II). Fiecare subiect este asignat aleator fie
secvenei 1 (RT), fie secvenei 2 (TR). Subiecii n cadrul secvenei RT (TR)
primesc medicamentul R (T) n prima perioad i medicamentul T (R) n
cea de a doua perioad. Perioadele de administrare sunt, de obicei, separate
printr-o perioad de spalare de cel puin de trei ori timpul de njumtire
al substanei active din medicamentul administrat.
Scopul experimentului este de a stabili bioechivalena dintre cele
dou medicamente (formulations n literatura englez).
Pentru aceasta se aplica modelul de analiz statistica prezentat
anterior:
ijk jk j k ijk
Y + + + + =

Rezultatele experimentului sunt variabile aleatoare
ijk
Y pe care le
considerm avnd urmtoarea structur:
ik ijk jk j k j ijk
S F P C Y + + + + + =


, 1

unde este media totala, i este indicele pentru subiect,
k
n i , 1 = , j este
indicele pentru perioad i k este indicele pentru secvena.
jk
F este efectul
direct, fix, al medicamentului (formulrii) administrat n perioada j, n
secvena k (Observaie: efectul este de fapt cantitatea de medicament
msurat sau un parametrul farmacocinetic calculat pornind de la aceasta).

1, j k
C

este efectul carry over (fix) al medicamentului administrat n
perioada j-1, de exemplu concentratia medicamentului ramas in organism
in perioada II din administrarea in perioada I.
Considerm c, datorit existenei unui interval de timp de splare
suficient intre administrari, efectul carry over nu depete perioada
consecutiva celei in care a fost administrat medicamentul.
ijk
e reprezint eroarea aleatoare n msurarea valorilor individuale pentru
fiecare subiect.
II. STATISTIC MATEMATIC I BIOSTATISTIC
LEGATURA ANOVA TESTUL T

136
Considerm ca variabilele
ik
S (efectul de subiect) sunt repartizate
identic pentru toate formularile administrate, cu media 0 i dispersia
2
s
, iar
variabilele
ijk
e sunt repartizate ( )
2
, 0
e
N .
n fapt, dupa cum a prezentat FDA ca argument pentru introducerea
bioechivalentei individuale, dispersiile erorilor pot diferi de la un
medicament la altul.

Modelul se mai poate scrie si sub forma :
ijk ik jk ijk
S Y + + =

unde efectul fix
jk
este de forma prezentata in tabelul nr. 17

Tabelul nr. 17: Componenta nealeatoare a parametrilor farmacocinetici
Perioada (j=1,2) Secvena
(k=1,2) I II
1 (RT)
11 1 R
P F = + +
12 2 T R
P F C = + + +
2 (TR)
21 1 T
P F = + +
22 2 R T
P F C = + + +

unde
F
R
(F
T
) reprezint efectul direct al administrrii medicamentului R (T);
P
1
(P
2
) reprezint efectul administrrii n perioada I (II);
C
R
(C
T
) reprezint efectul rezidual (carry-over) al administrrii
medicamentului R (T).

i P
1
+P
2
= F
R
+F
T
= C
R
+C
T
= 0,

Procedand ca in cazul general prezentat mai sus, se descompune
suma totala a erorilor in sume cu ajutorul carora se pot estima efectele de
secventa (
carry
SS ), de perioada (
P
SS ), de formulare (
drug
SS ), precum si a
variabilitatilor intraindividuala (
ra
SS
int
) , interindividuala (
er
SS
int
).
Se folosesc notatiile

=
i
i
Y Y
.
si

=
i
i
Y
n
Y
1
.
( unde n este
numarul valorilor sumate).

II. STATISTIC MATEMATIC I BIOSTATISTIC
LEGATURA ANOVA TESTUL T
Descompunerea sumei patratelor erorilor in sume corespunzatoare factorilor fixi si interactiunile intre acestia

137
Tabelul nr. 18.




=
Total
SS
( ) =

2
Y Y
ijk

( ) +

2
Y Y
k

( ) +

2
Y Y
j

( ) + +

2
Y Y Y Y
k j jk

( )
2

jk ijk
Y Y





SS

SS

SS

=
within
SS

( ) =

2
k i ijk
Y Y


( ) +

2
Y Y
j

( ) + +

2
Y Y Y Y
k j jk
( ) ( ) ( )
2


k k i jk ijk
Y Y Y Y



P
SS
drug
SS
ra
SS
int

=
between
SS

( ) =

2
Y Y
k i

( ) +

2
Y Y
k


( )


k k i
Y Y






carry
SS

er
SS
int






II. STATISTIC MATEMATIC I BIOSTATISTIC
LEGATURA ANOVA TESTUL T

139
Deci, se vede ca avem:

Between
SS exprim variabilitatea dintre subieci,

within
SS exprim variabilitatea intra-subieci, si
=
within
SS
P
SS +
drug
SS +
ra
SS
int

Total
SS are ( )
T 1 2
2 1 n n = + grade de libertate. Cum sunt
1 2
n n + subieci n
ambele secvene
within
SS are
Within 1 2
n n = + grade de libertate, iar
Between
SS are
Between 1 2
1 n n = + grade de libertate.
In locul acestor formule se folosesc formule prescurtate.
Mentionam aceste formule prescurate deoarece ele apar practic in toate
cartile de farmacie sau de statistica aplicata in farmacie. Ele reprezinta avantajul
unor calcule mai rapide si dezavantajul ca nu sunt inteligibile, nefiind clara
legatura lor cu variabilitatile parametrilor studiati.



2.10.3. Calculul variabilitatii interindividuale

Vom deduce formula uzuala pentru ( )
2
int
2

=
k i
k k i
er
Y Y SS
Ridicand la patrat se obtine
( )
2 2 2 2
int
2 2 2 2
2 2
2
2 2 2 2
2
2 2 2 2 * *
2
2
2
2
i k
er i k k i k k k i k k k k
k i i k i i
k
i k k k k i k k k k k k
k i k i
i k k
k
k i k
k
Y
SS Y Y Y n Y Y Y n Y
Y
Y Y n Y Y Y n Y n Y
Y Y
n
n



| | | |
= + = + =
| |
\ \
| | | |
= + = + =
| |
\ \
=



Mai departe, deoarece prin definitie, ;
2 2
i k k
i k k
k
Y Y
Y Y
n

= = se obtine
formula farmaceutica a sumei patratelor intersubiecti:
er
SS
int
=


k k
k
i k
k i
n
Y Y
2 2
2
..
,
2
.

Facem observatia ca la descompunerea sumelor am folosit termenii in
engleza deoarece in aceasta limba exista cate doua cuvinte (provenind din latina si
din saxona) corespunzand cuvintelor romanesti inter si intra.
II. STATISTIC MATEMATIC I BIOSTATISTIC
LEGATURA ANOVA TESTUL T

140
2.10.4. Calculul efectelor de secventa

In ceea ce priveste
carry
SS , el se poate obtine din diferenta intre mediile
secventelor, care este egala cu diferenta efectelor reziduale din cele doua
secvente, motiv care justifica si utilizarea interschimbabil a celor doi termeni .
Intr-adevar, observnd c
1 2
1 2
1 2
n Y n Y
Y
n n

+
=
+
rezult

( ) ( )
( )
( )
( )
( ) ( )
( ) ( )
{ }
1
2 2
1 2
Carry 1 2
2
2
2 2 2
2
1 2 1 2
1 2 2 1 2 1
2 2
1 2
1 2 1 2
2
1 2 1
12 22 11 21
2
1 2
2 2
2
2 2
2
SS n Y Y n Y Y
n n
n n n n
Y Y Y Y Y Y
n n
n n n n
n n
Y Y Y Y
n n



= +
= + =
+
+ +
(
= + +

+

Media parantezei
( ) ( )
12 22 11 21
1
2
Y Y Y Y

(
+ +
`

)
este
2
T R
C C
conform
demonstratiei ce urmeaza:
1, ijk ik j jk j k ijk
Y S P F C

= + + + + +

Calculand mediile corespunzatoare lui
11
Y

,
12
Y

,
21
Y

si
22
Y

vom obtine:

( )
11 1 R
E Y P F

= + +
( )
21 2 T R
E Y P F C

= + + +
( )
12 1 T
E Y P F

= + +
( )
22 2 R T
E Y P F C

= + + +
( )
12 22
2
T
E Y Y C

+ = +
( )
11 21
2
R
E Y Y C

+ = +
De unde rezulta ca:
( ) ( )
12 22 11 21
1
2 2
T R
C C
E Y Y Y Y
| |
(
+ + =
`
|

) \


Deci, efectul ce apare din diferenta intre secvente este in fapt legat de
diferenta intre efectele rezidule din cele doua secvente.
Carry
SS i
Inter
SS au respectiv
Carry
1 = i
Inter 1 2
2 n n = + grade de
libertate.

II. STATISTIC MATEMATIC I BIOSTATISTIC
LEGATURA ANOVA TESTUL T

141

Calculul simplificat al erorii intraindividuale
Dupa cum s-a aratat in tabelul de mai sus,
within
SS poate fi descompusa in
trei componente: o componenta datorata efectului direct al medicamentului
(
drug
SS ), o componenta datorata perioadei (
P
SS ) si o componenta datorata
variabilitatii intra subiect (
ra
SS
int
):
ra drug P within
SS SS SS SS
int
+ + =
Dintre aceste trei componente,
int ra
SS este in fapt singurul termen legat de
variabilitatea biologica intraindividuala. Vom deduce in continuare o formula de
calcul rapid al acestui termen .
Aplicand succesiv formula ( )
( )
n
x
x x x
i
i i
2
2
2


= se obtine dupa
cum urmeaza.
( ) ( ) ( ) ( )
( )
=
(

= =





2
2
2 2
int
j
jk ijk
jk ijk k k i jk ijk ra
Y Y
Y Y Y Y Y Y SS

( )


+ =

\
|
=
k
k k i
k
jk
ijk
i k
k k i
k
i
ijk
ijk
n
Y Y
n
Y
Y
Y Y
n
Y
Y
2 2 2
2 2
2
2
,
2
2
2















II. STATISTIC MATEMATIC I BIOSTATISTIC
LEGATURA ANOVA TESTUL T

142
2. 10.5. Analiza efectelor fixe cu ajutorul dispersiilor
Descompunerea lui
within
SS permite testarea ipotezei privind prezena
variabilitii inter-subieci, adic:
2
0
H : 0
s
= versus
2
a
H : 0
s
> .
n acest sens se folosete statistica

Inter Inter
V
Intra Intra
SS
F
SS

= .
Similar, celelalte efecte se pot testa cu ajutorul raportului intre suma
erorilor corespunzatoare si
int ra
SS (pe post de
R
SS in modelul general).

Sinteza formulelor de calcul este dat n tabelul urmator.

Tabelul nr. 19: Analiza efectelor fixe cu ajutorul dispersiilor:

Sursa de
variatie
df SS MS F
Inter - subiecti
Secventa (carry
- over
1 =
Carry

Carry
SS
Carry
Carry
Carry
SS
MS

=
=

er
Carry
Carry
MS
MS
F
int
=
=

Reziduale
2
2 1
+ = n n
Inter

Inter
SS
Inter
Inter
er
SS
MS

=
=
int

ra
er
er
MS
MS
F
int
int
int
=
=

Intra - subiecti
Efectul direct al
medicamentului
1 =
F

F
SS
F
F
F
SS
MS

=
ra
F
F
MS
MS
F
int
=
=
*
Perioada
1 =
P

P
SS
P
P
P
SS
MS

=
ra
P
P
MS
MS
F
int
=
=

Reziduale
2
2 1
+ = n n
Intra

Intra
SS
Intra
Intra
Intra
SS
MS

=
=


Total
( ) 1 2
2 1
+ = n n
Total

Total
SS


*
Formula este valid doar dac efectul carry-over este nul.
II. STATISTIC MATEMATIC I BIOSTATISTIC
LEGATURA ANOVA TESTUL T

143
Observatii
Vom studia acum legtura dintre cele dou modele reprezentate in Tabelul
nr.1 si Tabelul nr.4
Dac factorul A este secvena de administrare a medicamentului si factorul
B este perioada, atunci este suma intre efectul carry-over si efectul subiectilor,
( )
1 2
P P = este efectul perioadei si
R T
T R
F F
F F

| |
=
|
\
este efectul interaciunii
secvenei de administrare a medicamentului cu perioada (adic efectul direct al
medicamentului formulation).
Se observ c sunt verificate conditiile specificate la prezentarea
modelului general:

1 2 R T
1 2 1 2
11 12 R T 21 22
11 21 T R 12 22
0 C C
0 P P
0 F F
0 F F




+ = = +
+ = = +
+ = = + = +
+ = = + = +

Facem observatia, altfel esentiala, ca prezentarea in foarte multe lucrari de
biostatistica si bioechivalenta a efectului medicamentului ca interactiune intre
secventa si perioada este de neinteles in lipsa identificarilor de mai sus.
In fapt, este vorba de combinatii intre variabile care sa permita separarea
efectelor. Aceste combinatii pot aparea ca efecte ai unor factori ce nu se regasesc
intr-un tablou farmacologic al determinantilor diferentelor intre formulari.
Efectul de secventa (carry) ramane o piatra de incercare in experimentele
de bioechivalenta si aparitia lui in studii efectuate pe baza de protocoale
concepute astfel incat sa se evite complet aparitia efectelor reziduale, este de
neexplicat.












II. STATISTIC MATEMATIC I BIOSTATISTIC
LEGATURA ANOVA TESTUL T

144
2.10.6. Compararea metodei ANOVA si testul t:

2.10.6.1. Testarea efectului secvenei de administrare folosind metoda
ANOVA:

= =
carry carry
SS MS ( )
2
1 1
2

Y Y n + ( )
2
2 2
2

Y Y n =
2
2 1
2 2 1 1
1 1
2
|
|

\
|
+
+



n n
Y n Y n
Y n

+
2
2 1
2 2 1 1
2 2
2
|
|

\
|
+
+



n n
Y n Y n
Y n =
( )
( )
2
2 1
2
2 1
2
2 1
2
n n
Y Y n n
+


+
( )
( )
2
2 1
2
1 2
2
1 2
2
n n
Y Y n n
+



=
( )
2
1 2
2 1
2 1
2


+
Y Y
n n
n n
=
( )
2 1
2
1 2
1 1
2
n n
Y Y
+


=
( )
2
2 1
1 2
1 1
2
|
|
|
|
|

\
|
+


n n
Y Y
=


( ) ( ) ( )
2
2
2
1 2 1 2 1 2
12 22 11 21 1 2
1 2 1 2
1 2
2 2 1
2
2 1 1
n n n n U U
Y Y Y Y U U
n n n n
n n


(
(

(
(
+ + = =
`
(
+ +
)
+
(
(



Deci,
2 2
1 2 1 2
2
int
1 2 1 2
1
2 *
2 1 1 1 1

carry
er u
u
MS
U U U U
MS
n n n n


| | | |
| |

| |
= =
| |
+ + | |
| |
\ \


Se observa ca decizia obtinuta prin ANOVA in ceea ce priveste efectul
rezidual este acelasi cu rezultatul obtinut prin testul t.
Incercam, in continuare, sa facem aceiasi comparatie intre cele doua
metode de evaluare a efectului de perioada.



II. STATISTIC MATEMATIC I BIOSTATISTIC
LEGATURA ANOVA TESTUL T

145
2.10.6.2. Testarea efectului perioadei folosind ANOVA

( ) ( )
( )
( ) ( )
( )
( ) ( )
{ }
( )
2 1
1 2 1 2
2 2
P
2 2
1 2
1 2
2 2
1 2 2 1
1 2
2 2
2
1 2
2 1
1 2
j j
k
k j i k j
n n
n n n n
SS Y Y n Y Y
n n Y Y Y Y
n n Y Y Y Y
n n
Y Y
n n



+ +

= =
(
= + +
(

( (
= + +

+
=
+



Observatie:
Observam ca
ra
MS
MS
int

nu mai duce la acelasi rezultat ca in testul t efectuat


pentru variabilele
1
O si
2
O .
Nepotrivirea apare din aceea ca nu stim exact cum sa calculam media
perioadei: media least square
2
2 1 j j
j
Y Y
Y


+
= sau media obisnuita
2 1
n n
Y
Y
j
j
+
=



In acelasi context, al secventelor inegale, mai avem si media totala cand
apare problema folosirii mediei mediilor secventelor (least square) sau media
obisnuita.
Mentionam ca in literatura formulele finale sunt date fara demonstratie, iar
in aplicatiile efective sunt luate intotdeauna variante pentru cazul particular
2 1
n n = (secvente egale).
Problema isi are importanta deoarece, de cele mai multe ori, la finalul
experimentului de bioechivalenta nu mai avem
2 1
n n = .

Concluzii:
n practic, n prezena efectelor carry over inegale, si deci a aparitiei
efectelor de secventa, se recomanda a se folosi pentru a testa bioechivalena,
datele din prima perioad. Nu trebuie s uitm insa urmtoarele consecine ale
acestei proceduri:
II. STATISTIC MATEMATIC I BIOSTATISTIC
LEGATURA ANOVA TESTUL T

146
1) puterea de detecie a diferenelor semnificative clinic este micorat
datorit creterii dispersiei ( se inlocuieste dispersia intraindividuaka cu cea
interindividuala) i,
2) pierderea de informaie prin acceptarea existentei unor efecte de secventa
si renuntarea la datele din perioada a 2 a.
In fond se anuleaz avantajul major al experimentului crossover i anume faptul
ca fiecare subiect este propriul sau martor.


2.10.7. Compararea intre modelul statistic general si modelul statistic specific
cross over
In esenta, diferenta intre cele doua modele se refera la alegerea termenului
rezidual;
modelul 1 nu descompune pe
2
R
S ;
modelul 2 distinge ntre reziduale intra-individuale i reziduale inter-
individuale.
Mai exact:
( ) ( )
total within between
ra drug P er carry
er ra drug P carry R AB B A T
SS SS SS
SS SS SS SS SS
SS SS SS SS SS S S S S SS
= + =
= + + + + =
= + + + + = + + + =
int int
int int
2 2 2 2

Aceast descompunere modific formulele statisticilor F . In modelul
biostatistic se imparte cu un numar mai mic (
int ra
MS ) ceea ce conduce la un
interval de incredere mai larg pentru efectele de formulare si deci la cresterea
probabilitatii de acceptare a egalitatii efectelor.













II. STATISTIC MATEMATIC I BIOSTATISTIC
LEGATURA ANOVA TESTUL T

147

2.10.8. CONCLUZII GENERALE

Analiza dispersionala (ANOVA) se aplica in toata lumea in evaluarea
studiilor de bioechivalenta, dar in final rezultatele sale nu influenteaza in nici un
fel decizia privind bioechivalenta.
Efectele de perioada nu influenteaza estimarea efectelor de formulare.
Aparitia efectelor de formulare nu semnifica nimic! Egalitatea nu implica
bioechivalenta si nici bioechivalenta nu implica egalitatea.
Aparitia efectelor de secventa invalideaza metoda de testare a efectelor de
formulare. Pe de alta parte insa, testarea egalitatii duce la o informatie
nesemnificativa.
In acelasi timp este de mentionat ca toate ghidurile referitoare la analiza
bioechivalentei recomanda utilizarea MSE mean square erorr in formula de
testare a bioechivalentei. Dar aceasta iarasi nu inseamna nimic. In fond
2
2
d
MSE = si nimic nu ne impiedica sa estimam direct
2
d
prin
2
d
S care este mai
usor calculat si rezultatul este acelasi.
Ramane totusi ca ANOVA in cazul in care pune in evidenta efectele de
secventa impune o examinare atenta a protocolului studiului si verificarea
masurilor de indepartare a efectelor reziduale.
Ca o concluzie finala, ANOVA nu este un instrument de decizie, rolul sau
fiind informativ.









1. Chow, S.C. & Liu, J.P. (1992) Design and analysis of bioavailability and
bioequivalence studies. New York, Marcel Dekker (cap. 3) [1].
2. Saporta, C. (1990) Probabilit, Analyse des donnes et statistique. Paris, Ed.
Technip (cap. 15) [2].
3. Vaduva, I. (1970) Analiz dispersional. Bucureti, Ed. Tehnic (cap. 4) [3].





II. STATISTIC MATEMATIC I BIOSTATISTIC
ANALIZA DISPERSIONALA BIFACTORIALA CU INTERACTIUNI INTRE
FACTORI

149
2.11. Testarea bioechivalentei medicamentelor

2.11.1. Metoda intervalului de incredere

Anterior a fost prezentata modalitatea de testare a ipotezei nule ca
doua produse sunt egale intre ele dupa efectuarea unui experiment 2*2
cross-over, metoda care a fost criticata de multi autori. In locul acesteia a
fost propusa de Westlake (1976) si de Metzler (1974) o metoda bazata pe
intervale de incredere.
Bazat pe aceasta metoda Westlake (1981) sugereaza ulmatorul
algoritm de lucru in luarea deciziei.
Daca intervalul de incredere ( ) % 100 * 2 1 pentru diferenta
R T
sau pentru raportul
R
T

se afla in limitele de acceptare impuse,


atunci se accepta ca medicamentul testat este bioechivalent cu cel de
referinta. Uzual se aplica regula % 20 , iar 05 . 0 = si, in acest caz, regula
de acceptare devine:
a) Produsele sunt bioechivalente daca intervalul de incredere 90%
pentru
R T
este in limitele % 20 din efectul produsului de referinta
sau daca,
b)
R
T

este intre 80% si 125% cu probabilitatea 90%.


Aici trebuie facuta observatia ca, in ambele cazuri, aplicarea regulii
presupune cunoasterea lui
R
, ceea ce nu este niciodata cazul, si se ia din
acest motiv
R
Y pe post de
R
.










II. STATISTIC MATEMATIC I BIOSTATISTIC
ANALIZA DISPERSIONALA BIFACTORIALA CU INTERACTIUNI INTRE
FACTORI

150
2.11.2.Metoda celui mai mic interval

Fie
T
Y si
R
Y mediile least square ale celor doua produse (adica
media produsului in prima perioada + media produsului in a doua perioada
si impartit la 2, ceea ce, atunci cand numarul de subiecti in cele doua
perioade nu este egal, difera de media totala).
Intervalul de incredere clasic (cel mai scurt) ( ) % 100 * 2 1 se
obtine din distributia variabilei aleatoare
( ) ( )
2 1
1 1

n n
Y Y
T
d
R T R T
+

=


unde
1
n
si
2
n reprezinta numarul de subiecti in secventa 1 si respectiv 2, iar
d
este
dispersia de selectie a diferentelor intre valorile masurate pentru cele doua
produse, dupa cum s-a prezentat anterior. In ipoteza ca
T
Y si
R
Y sunt
variabile aleatoare distribuite normal, T va fi distribuit Student cu
2
2 1
+ n n si intervalul de incredere ( ) % 100 * 2 1 pentru
R T
va fi:
( ) ( )
2 1
2 1 1
1 1
2 ,
n n
n n t Y Y L
d R T
+ + =
( ) ( )
2 1
2 1 1
1 1
2 ,
n n
n n t Y Y U
d R T
+ + + =
Intervalul de incredere de mai sus pentru
R T
poate fi convertit
intr-un interval de incredere pentru ( ) % 100 * 2 1 aproximativ pentru
R
T


prin impartire la
R
Y (acceptand
R
Y ca valoare pentru
R
).
Deci,
% 100 * 1
1
2

+ =
R
Y
L
L si % 100 * 1
1
2

+ =
R
Y
U
U
Fie
L
si
U
limitele inferioara si superioara pentru bioechivalenta
iar
L
si
U
limitele pentru raport. Produsele sunt considerate
bioechivalente daca ( ) ( )
U L
U L , ,
1 1
sau ( ) ( )
U L
U L , ,
2 2
unde
R L
* 2 . 0 = ,
R U
* 2 . 0 = , % 80 =
L
, % 125 =
U

II. STATISTIC MATEMATIC I BIOSTATISTIC
ANALIZA DISPERSIONALA BIFACTORIALA CU INTERACTIUNI INTRE
FACTORI

151
Utilizarea intervalelor de incredere in decizia privind bioechivalenta,
intuitiv pare ca rezolva problema, dar ar fi o greseala sa pierdem din vedere
ca limitele intervalului de incredere sunt si ele variabile aleatoare. Intervalul
de incredere ( ) % 100 * 2 1 pentru
R T
este intervalul in care, daca
vom repeta studiul de un numar mare de ori, de exemplu n, de
( ) % 100 * 2 1 ori
R T
va fi in cele n inervale aleatoare construite. Cu
alte cuvinte, intr-un experiment repetat de multe ori, diferenta (raportul)
mediilor se va afla cu probabilitatea de cel putin 2 1 in intervalul de
incredere ( ) % 100 * 2 1 deoarece, in ipoteza de normalitate,
( ) { } 2 1 ,
1 1
= U L P
R T
.
Totusi, nu exista o garantie in acest sens, practic probabilitatea
( ) ( ) { }
U L
U L P , ,
1 1
nefiind in mod obligatoriu mai mare sau egala cu
2 1 .























II. STATISTIC MATEMATIC I BIOSTATISTIC
ANALIZA DISPERSIONALA BIFACTORIALA CU INTERACTIUNI INTRE
FACTORI

152
2.11.3. Metoda testarii ipotezelor despre intervale

Ipoteze asupra intervalelor
Stabilirea bioechivalentei intre doua medicamente se bazeaza pe
compararea profilului concentratiei sanguine realizat de medicamentele
respective. Desigur ca, practic, niciodata profilurile obtinute experimental
pentru doua medicamente nu vor fi identice. Problema este de a decide daca
aceste diferente sunt sau nu semnificative statistic.
Daca diferentele intre mediile parametrilor testati (aria de sub curba,
concentratia maxima sau alte functii de acestia) sa afla, cu o probabilitate
data, intre limite considerate ca acceptabile, atunci se accepta ca produsele
sunt bioechivalente. Formal, daca notam mediile pentru produsul testat si
cel de referinta cu
T
si respectiv
R
, limita superioara pentru diferenta lor
S
, iar limita inferioara cu
I
, ipoteza de testat si ipoteza alternativa vor fi:
S R T
H :
0
sau
I R T

S R T I a
H :
Se considera ca formularea ipotezei bioechivalentei ca ipoteza nula
duce la o scadere a riscului consumatorului in defavoarea producatorului dar
aceasta depinde in mare masura de dispersia celor doua loturi si de diferenta
reala intre mediile lor. In ceea ce priveste limitele
L
si
U
ele se aleg de
obicei 20% din
R
, ceea ce aparent este foarte simplu si clar dar, in practica
ne izbim de dificultatea insurmontabila ca, de fapt nu stim niciodata
valoarea lui
R
si avem numai estimari ale intervalului in care se afla acesta
cu o probabilitate data.
Daca inlocuim datele experimentale cu logaritmul lor, ipotezele de
testat si alternativa devin
I R T
H :
0
sau
S R T

S R T I a
H :
unde ( )
I I
exp = si ( )
S S
exp =
Ipoteza nula este ipoteza compusa din doua ipoteze simple, testul de
bioechivalenta descompunandu-se de fapt in doua teste unilaterale:
I R T
H :
01
vs
S R T a
H :
1
si
S R T
H :
02
vs
S R T a
H :
2

II. STATISTIC MATEMATIC I BIOSTATISTIC
ANALIZA DISPERSIONALA BIFACTORIALA CU INTERACTIUNI INTRE
FACTORI

153
O biodisponibilitate mai mare a produsului testat decat cel de
referinta, implica posibilitatea unor efecte secundare sau toxice crescute si o
siguranta mai mica. Bioechivalenta implica o echivalenta atat in ceea ce
priveste efectul cat si in ceea ce priveste siguranta.


































II. STATISTIC MATEMATIC I BIOSTATISTIC
ANALIZA DISPERSIONALA BIFACTORIALA CU INTERACTIUNI INTRE
FACTORI

154


2.11.4. Metoda celor doua teste unilaterale, Schuirmann

Daca vrem sa testam ipotezele enuntate la un nivel de semnificatie
, in conditiile in care presupunem ca datele sunt normal repartizate, putem
aplica testul t. Echivalenta este stabilita atunci cand

( )
( ) 2 ,
1 1

2 1
2 1
+
+

= n n t
n n
Y Y
T
d
L R T
I



( )
( ) 2 ,
1 1

2 1
2 1
+
+

= n n t
n n
Y Y
T
d
L R T
S

2
2
d
MSE
= , deci

2
d
RMSE
=
Observam ca procedeul celor doua teste t unilaterale este echivalent
cu metoda clasica de testare a includerii intervalului de incredere pentru
R T
cu probabilitatea ( ) % 100 * 2 1 in ( )
S I
,














II. STATISTIC MATEMATIC I BIOSTATISTIC
ANALIZA DISPERSIONALA BIFACTORIALA CU INTERACTIUNI INTRE
FACTORI

155
2.11.5. Metoda Anderson si Hauck

In locul celor doua teste t unilaterale pentru testarea bioechivalentei,
Anderson si Hauck au propus in 1983 un singur test, bazat pe testarea
valorii variabilei
( )
2 1
1 1

2
n n
Y Y
T
d
S I
R T
AH
+
+

=



Atunci cand datele sunt normal repartizate, variabila
AH
T este
distribuita t, necentrat, avand ca parametru de necentralitate
( )
2 1
1 1
2
n n
d
S I
R T
+
+

=



unde
d
are semnificatia prezentata anterior.
Se respinge ipoteza
0
H si se accepta bioechivalenta atunci cand
2 1
C T C
AH
unde
1
C si
2
C sunt determinate de relatia
( )
( )

= = =
= =
d I R T AH
d S R T AH
C T C P
C T C P
,
,
2 1
2 1


In particular, daca alegem C C C =
2 1
, relatia de definitie devine
( ) ( ) = = = =
d I R T AH d S R T AH
C T P C T P , ,
O piedica in aplicarea testului deriva din aceea ca nu il cunoastem pe
. Se calculeaza, din acest motiv, o valoare empirica
( )
d U R T AH AH
t T P p , = =
unde
AH
t este valoarea observata a lui
AH
T .
0
H este respinsa cu nivelul de semnificatie , atunci cand p .
Pe de alta parte se poate face o evaluare a lui , bazat pe o
distributie t necentrata, pe o distributie t centrata sau pe o distributie
normala.
II. STATISTIC MATEMATIC I BIOSTATISTIC
ANALIZA DISPERSIONALA BIFACTORIALA CU INTERACTIUNI INTRE
FACTORI

156
Un estimator al lui , pe baza unei distributii t necentrate este
2 1
1 1
2

n n
d
L U
+



In acest caz formula anterioara devine:
( ) ( )
( ) ( )



=
= = = =
AH t AH t
AH AH AH S R T AH AH
t F t F
t T t P t T P p

unde
( )
2 1
1 1

n n
Y Y
T
d
U R T
AH
+

=

si F
t
este functia de repartitie t, cu
2
2 1
+ n n grade de libertate.
Sa observam in continuare ca aceasta aproximatie ne duce la un test
echivalent cu evaluarea variabilelor aleatoare
I
T si
S
T din metoda
Schuirmann. Astfel, presupunand ca 0
AH
t , avem
( )
( )
S
d
S R T
d
I S S I
R T
AH
T
n n
Y Y
n n
Y Y
t =
+

=
+

+

=
2 1 2 1
1 1

1 1

2 2



Similar,
L AH
T t =

deci

( ) ( ) ( ) ( )
S t I t AH t AH t
T F T F t F t F p = =














II. STATISTIC MATEMATIC I BIOSTATISTIC
ANALIZA DISPERSIONALA BIFACTORIALA CU INTERACTIUNI INTRE
FACTORI

157
2.11.6. Transformarea logaritmica a datelor

Ghidurile de testare a bioechivalentei recomanda transformarea
logaritmica a datelor.
Daca datele initiale sunt repartizate normal si coeficientul de variatie
este mic, atunci si datele transformate urmeaza aproximativ o distributie
normala.
Pentru a demonstra aceasta observam ca :
2
2
2
CV
X
D = =


Daca CV este suficient de mic

X
este aproximat de zero si :


+ =

=
X X X
X 1 log log log log
Deci,


+
X
X log log
( ) log log = X E si ( )
2
log CV X D =
Deci, ( )
2
, log log CV N X = , adica datele transformate sunt
distribuite normal cu media log si dispersia
2
CV .
Deci, coeficientul de variatie obtinut din datele netransformate este o
estimare a dispersiei datelor transformate.
De obicei insa transformarea logaritmica are rostul de a corecta
asimetria datelor initiale si a le restrange prin aceea ca
2
trece in
2
2

.
In cazul in care
2
CV nu este foarte mic lucrurile sunt cu mult mai
complicate.
Intervalul de incredere pentru diferenta mediilor datelor transformate

R T
sunt aproximativ egale cu cele pentru logaritmul raportului
mediilor netransformate

R
T

ln .
Intr-adevar, fie ( )

=
T T
X E ln si ( ) ( )
2
ln ln = =
R T
X D X D


II. STATISTIC MATEMATIC I BIOSTATISTIC
ANALIZA DISPERSIONALA BIFACTORIALA CU INTERACTIUNI INTRE
FACTORI

158
Avem:
( ) ( ) ( )
( ) ( )
2 2
1
1 ln
2
1
1
ln
2
1
ln 1
2
2 2
2 ln

+ = + + + = + + =
=

+ + = =


T
T
e X E
X X E e E X E
T T T T
T T
X
T T

Similar obtinem:
2
2


+ =

R
e
R

Ca urmare
2
2
ln ln
2
2

+
+
=

R
T
e
e
R
T
si cum
2
2

este de asteptat sa fie


foarte mic in raport cu

R
e

si

T
e

, avem :

=

R T
R
T
R
T
e
e

ln ln

II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

159
2.12. TESTE STATISTICE DE DISCORDANTA

In ceea ce priveste valorile anormale , se pun in principal trei
probleme:
- decizia privind respingerea sau omisia acestor valori,
- analiza efectului lor de distorsionare a rezultatelor estimarilor
parametrilor populatiei,
- existenta unor factori neluati in seama si necesitatea elaborarii unui
alt model statistic, corespunzator realitatii.
In vederea realizarii primului obiectiv se aplica testele de
discordanta , numite si teste de respingere , dar decizia de respingere sau
non-respingere nu poate fi luata fara examinarea si a celorlate doua
probleme enuntate.
n general exist o gam foarte larg de teste din care putem alege i
n mod natural ne punem problema care sunt criteriile de a alege un test sau
altul ntr-o situaie particular i cum putem defini performana testului ales.
Sunt patru aspecte principale care trebuiesc luate n considerare.
1. Modelul de baz i determinarea semnificaiei. n orice context un
test statistic poate fi construit pur i simplu pe baza intuiiei i s respingem
sau s acceptm valorile extreme. Totui avem nevoie de un criteriu de
respingere care s asigure o anumit semnificaie operaiei ceea ce impune
n mod esenial elaborarea unor ipoteze de lucru privind distribuia testului
statistic sau mcar s tim ceva despre distribuia de probabilitate pe coad.
2. Ipoteza alternativ care s ne permit definirea valorilor anormale.
3. Definirea performanei testului i a conceptului asociat de putere.
Alegerea dintre mai multe teste ar trebui s fie bazat pe performana lor
relativ. Evaluarea performanei relative, de exemplu calculul puterii trebuie
sau poate fi fcut cnd avem definit ipoteza alternativ i distribuia
testului statistic n condiiile ipotezei alternative. Probemele sunt foarte
complicate motiv pentru care pn n ultimii ani ele au fost comple ignorate.
4. Care sunt proprietile dorite pentru testul de discordan. Astfel ne
putem pune problema unui test uniform cel mai puternic sau mcar s ne
mulumim cu o optimalitate local sau cu certitudinea unei nedeplasri sau
cu satisfacerea unor proprieti de invarian.
Alternativ putem s construim teste folosind o metod larg acceptat
cum ar fi metoda verosimilii maxime a rapotului.



II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

160
2.12.1. Construcia testelor de discordan
Testele aplicabile au fost clasificate n apte clase.
1. Statistici bazate pe raportul exces / dispersie.
Acestea sunt rapoarte ale diferenelor ntre valoarea aberant i
vecinul su cel mai apropiat sau imediat dup acesta n ir i intervalul
valorilor sau alte msuri ale dispersiei seleciei.
Ca exemple avem



Propus de Dixon pentru examinarea unei valori aberante superioare i care
evit valoarea x
1
sau




unde este deviaia standard n modelul de baz.
Testul presupunea cunoscut i o repartiie normal a probelor.
Putem nlocui cu o estimare a sa dintr-o prob restrns din care s-au
eliminat valorile bnuite ca aberante.

2. Statistici bazate pe raportul dintre lungimea domeniul de valori /
dispersie.
Testele se obin din cele de mai sus prin nlocuirea numrtorului cu
lungimea domeniul valorilor. Ca exemplu avem



unde s poate fi obinut din ntreg setul de valori sau dintr-un set restrns prin
eliminarea valorilor bnuite a fi aberante sau poate fi cunoscut din alte
msurtori.
Dezavantajul acestor teste este acela c el nu face distincie ntre
cazurile cnd avem o valoare aberant superioar, una inferioar sau de
amndou tipurile.

3. Statistici bazate pe raportul deviaie / dispersie.
Aceste teste nltur dezavantajul celor anterioare prin aceia c se
nlocuiete lungimea domeniului de valori cu distaa dintre o valoare
2
1
x x
x x
n
n n

n n
x x
s
x x
n 1

II. STATISTIC MATEMATIC I BIOSTATISTIC


OUTLIERS

161
aberant i msur a tendinei centrale a datelor. De exemplu putem
considera raportul



La fel ca i s , x poate fi calculat din intregul set de date sau dintr-o
parte a acestuia.

4. Statistici bazate pe sume de ptrate.
Aceste statistici se bazeaz pe suma ptratelor restricionate i suma
ptratelor pentru ntregul set de valori.
De exemplu raportul






unde




poate fi folosit pentru testarea a dou valori aberante superioare x
n
i x
n-1

dintr-o populaie normal distribuit.

5. Statistici pe baza raportului ntre valorile extreme i valorile medii.
Aceste statistici s-au dovedit n particular relevante pentru datele cu
distribuie de tip Gamma.

6. Statistici bazate pe momente de ordin superior.
Statistici care msoar asimetria sau curbura pot fi folosite i pentru testarea
valorilor aberante.




i
s
x x
1

( )
( )

n
i
i
n
i
n n i
x x
x x
1
2
2
1
2
1 ,
2
2
1
1 ,

n
x
x
n
i
i
n n
( )
( ) [ ]
2
3
2
3

x x
x x n
i
i
II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

162






7. Statistici W.
Aceste teste se bazeaz pe rapotul dintre ptratul unei combinaii liniare a
tuturor datelor i suma ptratelor abaterilor fa de medie.
( )
( )
2
2

=
x x
x w
W
i
i i


(ponderile w , calculate in functie de parametrii selectiei , se gasesc in
tabele).

O situaie special apare atunci cnd avem un grup de valori
anormale superior sau inferior i cnd testele enumerate mai sus nu pot pune
n eviden aberaii datorit unui efect de mascare. De aceea s-au conceput
teste pentru evaluarea mai multor valori aberante simultan (proceduri bloc).
Alte teste examineaz valorile extreme secvenial. n fapt acestea
examineaz n principal valoarea aberant maxim pe baza unui test deviaie
/ dispersie i dac x
n
se devedete valoare aberant el se repet operaia
pentru x
n-1
pe proba redus. Procedura se continu pn cnd se gsete o
valoare neaberant.
Aplicarea unui test sau altul ne poate duce la concluzii in general
diferite, in final decizia privind declararea unei valori ca discordante tinand
de analiza fenomenului.
Exemplu: 1, 5, 11, 4, 2, 6, 3
O prima masura de precautie pe care trebuie sa o luam este aceea de
a verifica faptul ca distributia datelor nu se modifica radical prin
schimbarea unitatilor de masura, deci la schimbari liniare sau la schimbarea
de la o distributie normala la una exponentiala.

Prima operatiune, indiferent de testul aplicat, este aceea de asezare a
datelor in ordine crescatoare.
1, 2, 3 , 4, 5, 6 , 11
( )
( ) [ ]
2
2
4

x x
x x n
i
i
II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

163
Rezultatul este bine sa fie vizualizat printr-o asezare a punctelor pe o
dreapta.

Fig. nr. 6

1 2 3 4 5 6 11

Motivul pentru care o prima sau ultima valoare pot fi considerate ca
discordante este acela ca aceste valori apar a fi foarte separate de de restul
datelor , in raport cu imprastierea datelor din selectie.
Aceasta ne duce in mod natural la ideia unei statistici bazata pe
raportul A/D unde A este abaterea valorii extreme fata de restul datelor iar
D este o masura a dispersiei datelor .
Pe post de A putem lua de exemplu diferenta intre valoarea extrema
si urmatoarea valoare, cea mai apropiata de ea
6 7
x x , sau distanta intre
aceasta si restul datelor considerate ca un grup M x
7
, unde M este media
celorlalte 6 valori.
Pentru D putem considera fie lungimea intervalului de valori
1 6
x x , sau distanta intre urmatoarele doua valori
5 6
x x care este cu mult
mai mic decat
6 7
x x , sau dispersia primelor 6 valori
Consideraiile de mai sus sugereaz urmtoarele statistici pentru
testarea valorilor extreme:










Statisticile de forma



( )
7 6
6 1
5
6, 7;1, 6 1
5
x x
y
x x

= = =

( )
7 6
6 5
5
6, 7;5, 6 5
1
x x
y
x x

= = =

'
7
11 3.5
2.14
3.5
x x
T
s

= = =

( )
p q
r s
x x
x x
q p s r y

= . ; .
II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

164
Am putea lua de exemplu, la numitor n prima statistic ntregul
domeniu de variaie al valorilor




iar n loc de


s folosim



dar statisticile rmn n esen aceleai.

Consideram spre exemplu valorile concentratiilor maxime ale
MELUOL , un metabolit activ al nicergolinei la 24 de voluntari sanatosi.
Pentru a lua o decizie cat mai corecta, vom examina atat valorile
individuale, cat si raportul valorilor pentru un acelasi voluntar.

Mai mult decat atat, pentru a avea si o imagine a acestor valori si a
raportului dintre ele, considera reprezentarile valorilor pentru medicamentul
de referinta (R ) si pentru cel testat ( T ) precum si a raporturilor T/R si a
dependentei T ( R ) ( care, daca valorile s-ar corela perfect, ar trebui sa
fie o dreapta).














s
x x
T

=
'
5
s
x x
T

=
5
( )
7 6
7 1
5
6, 7;1, 6 0.5
10
x x
y
x x

= = =

II. STATISTIC MATEMATIC I BIOSTATISTIC


OUTLIERS

165
Tabelul nr. 21:

Subject
CMAX,T
(ng/ml)
CMAX,R
(ng/ml) T/R T/R
CMAX,T
(ng/ml)
CMAX,R
(ng/ml)
1 65.70 48.98 134 46 2 2
2 7.85 6.73 117 47 3 3
3 10.11 21.76 46 56 3 3
4 3.94 2.65 149 62 4 4
5 29.54 22.60 131 71 4 4
6 10.58 14.84 71 78 4 5
7 6.84 5.95 115 88 5 6
8 14.79 16.54 89 89 7 7
9 17.29 6.57 263 90 7 7
10 11.61 8.75 133 92 8 7
11 27.48 14.82 185 102 10 9
13 5.24 3.72 141 106 11 14
14 32.11 36.33 88 111 12 15
15 12.49 20.29 62 115 12 15
16 4.23 4.60 92 117 13 15
17 7.01 14.96 47 131 15 15
18 1.96 1.76 111 133 16 15
19 3.09 3.03 102 134 17 17
20 15.91 15.01 106 141 22 20
21 21.54 14.94 144 144 27 22
22 3.34 4.30 78 149 30 23
23 3.75 6.72 56 185 32 36
24 12.67 14.08 90 263 66 49
N 23 23 media 111 14 13
Mean 14.31 13.475 StDev 48.6 14.2 11.4











II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

166

Fig. nr. 7
0.00
10.00
20.00
30.00
40.00
50.00
60.00
70.00
0 5 10 15 20 25 30
CMAX,T (ng/ml)
CMAX,R (ng/ml)


Fig. nr. 8



Observam dupa ordonare, ca valorile concentratiilor maxime pentru
voluntarul 1 sunt cele mai mari si, cel putin pentru T, mult mai mari
(aparent discordante) decat pentru ceilalti voluntari.

Voluntarul 9 apare normal in contextul valorilor individuale pentru
T si R dar raportul lor este cel mai mare, si probabil destul de indepartat de
celelalte rapoarte.

In tabelul de mai jos sunt redate rezultatele aplicarii testelor Dixon si
Tn pentru R, T si T/R . Din punct de vedere al testului Dixon, toate
valorile sunt discordante.

T(R)
R
2
=0.7497
0.00
10.00
20.00
30.00
40.00
50.00
60.00
0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00
T
0
10
20
30
40
50
60
70
1 3 5 7 9 11 13 15 17 19 21 23
R
0
10
20
30
40
50
60
1 3 5 7 9 11 13 15 17 19 21 23
T/ R
0
50
100
150
200
250
300
1 3 5 7 9 11 13 15 17 19 21 23
II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

167
Aplicand testul Tn , voluntarul 9 este de eliminat dat fiind raportul
T/R discordant.

Tabelul nr. 22:

voluntar 9 T/R Dixon
(Xk-Xk-2)/(Xk-
X3)= 0.55 >0.41
voluntar 1 T/R = 134 valoare normala
voluntar 1 R Dixon
(Xk-Xk-2)/(Xk-
X3)= 0.57 >0.41
voluntar 1 T Dixon
(Xk-Xk-2)/(Xk-
X3)= 0.58 >0.41

voluntar 9 T/R Tn = ( Xk-Xmediu)/S= 3.14 >2.82
voluntar 1 T/R Tn = ( Xk-Xmediu)/S= 0.48 <2.82
voluntar 1 R Tn = ( Xk-Xmediu)/S= 3.12 >2.82
voluntar 1 T Tn = ( Xk-Xmediu)/S= 3.62 >2.82

Acelasi test arata insa ca voluntarul 1 este anormal din punct de
vedere al celor doua valori, dar nu si din punct de vedere al raportului T/R.

Dat fiind ca decizia privind bioechivalenta este influentata doar de
intravariabilitate si nu depinde de intravariabilitate, voluntarul 1 nu este de
eliminat.

In final, decizia privind clasificarea unei valori drept discordante,
depinde de analiza fenomenologica si mai putin de rezultatul testelor
statistice.










II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

168
2.12.2. Criteriul Dixon pentru respingerea outliers
Tabelul nr. 23
Nivel de semnificatie k
5% 1%
3
( )
( )
1
1 2
10
X X
X X
r
k

=
daca cea mai mica valoare este suspecta
0.941 0.988
4 0.765 0.889
5
( )
( )
1
1
10
X X
X X
r
k
k k

=


daca cea mai mare valoare este suspecta
0.642 0.780
6 0.560 0.698
7 0.507 0.637
8
( )
( )
1 1
1 2
11
X X
X X
r
k


daca cea mai mica valoare este suspecta
0.554 0.683
9 0.512 0.635
10
( )
( )
2
1
11
X X
X X
r
k
k k

=


daca cea mai mare valoare este suspecta
0.477 0.597
11
( )
( )
1 1
1 3
21
X X
X X
r
k
k


daca cea mai mica valoare este suspecta
0.576 0.679
12 0.546 0.642
13
( )
( )
2
2
21
X X
X X
r
k
k k

=


daca cea mai mare valoare este suspecta
0.521 0.615
14
( )
( )
1 2
1 3
22
X X
X X
r
k


daca cea mai mica valoare este suspecta
0.546 0.641
15 0.525 0.616
16
( )
( )
3
2
22
X X
X X
r
k
k k

=


daca cea mai mare valoare este suspecta
0.507 0.595
17 0.490 0.577
18 0.475 0.561
19 0.462 0.547
20 0.450 0.535
21 0.440 0.524
22 0.430 0.514
23 0.421 0.505
24 0.413 0.497
25 0.406 0.489
II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

169
Valorile critice pentru t ca test bilateral la nivelul de semnificatie 5
% pentru eliminarea valorilor discordante:

Tabelul nr. 24:
Valoare T Valoare T
3 1.155 15 2.549
4 1.481 16 2.585
5 1.715 17 2.620
6 1.887 18 2.651
7 2.020 19 2.681
8 2.126 20 2.709
9 2.215 25 2.822
10 2.290 30 2.908
11 2.355 35 2.979
12 2.412 40 3.036
13 2.462 50 3.128
14 2.507 100 3.383





















II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

170
2.12.3. Valori discordante fata de corelatia liniara

Un tip special de valoare discordanta este cazul cand un punct
experimental pare a nu se potrivi cu modelul corespunzator celorlalte date.
Acest lucru este prezentat in figura 9 in contextul simplu al regresiei liniare.
Punctele P din interiorul cercului punctat corespund unui model de
regresie liniara. De remarcat totusi faptul ca elipsa ce am desenat-o noi in
jurul dreptei de regresie este arbitrara , dar sa presupunem ca avem
considerente fenomenologice care sa ne permita definirea unui domeniu in
interiorul caruia punctele sa poata fi acceptate ca urmand modelul liniar.
Daca presupunem ca variabila x nu este o variabila aleatoare, si pentru un x
dat se determina experimental mai multe valori y, si daca acestea sunt
distribuite normal, se poate calcula un interval de incredere in afara caruia
sa putem eticheta valorile drept discordante



y
.
x
x x
x
x
x
x
x P

x







x

Fig. 9 Estimarea dreptei care descrie relatia intre variabilele y si x

II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

171
Putem, la fel de bine considera dreapta de regresie drept valoarea
adevarata si sa consideram un domeniu centrat pe aceasta. Aceasta este
echivalent cu inlocuirea dispersiei in fiecare punct x cu o singura dispersie,
a intregii multimi de puncte (fig.10) .
Dupa cum s-a prezentat la capitolul privind regresia liniara, dreapta
adevarata y = + x (in cazul cand datele urmeaza efectiv un model
liniar) este aproximata de dreapta care aproximeaza cel mai bine punctele
experimentale y = a + b x , in sensul ca suma patratelor distantelor de la
puncte la dreapta este minima (dreapta prin cele mai mici patrate).


Fig.10 Distributia normala a punctelor in jurul valorilor de pe
dreapta de regresie

Sa consideram in continuare cateva tipuri de puncte in afara
multimii de valori normale.
Fie de exemplu punctul A in fig. 11. El va fi o valoare discordanta
fata de multimea P sau in multimea P+A relativ la modelul regresiei liniare.
El este la o distanta mare de dreapta care fiteaza punctele, sau altfel spus,
includerea sa in multimea de date mareste semnificativ variatia reziduala.
Important este, in afara de considerarea efectului punctului asupra
erorii reziduale, sa evaluam si efectul asupra parametrilor dreptei de
regresie. Parametrii acesteia sunt dependenti de punctele pe care le fiteaza.
II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

172
Daca in loc de A consideram punctul experimental B obtinand
multimea de date P+B, B nu apare a fi o valoare discordanta (un punct
experimental discordant) relativ la estimarea regresiei liniare a modelului.
Dar punctul B are un efect considerabil asupra fitarii modelului,
intrucat includerea sa in multimea punctelor care determina dreapta prin
cele mai mici patrate creste substantial precizia cu care este estimata panta
dreptei de regresie.
Si aceasta deoarece x-ul sau este la o distanta considerabila fata de
x-ul celorlalte puncte din P. In fapt el este o valoare discordanta in ce
priveste coordonata x fata de complexul P+B. Spunem ca B este un punct cu
parghie mare. A se obseva ca punctul parghie este o componenta a
variabilei independente si nu a raspunsului. Astfel, daca in loc de B luam
punctul experimental discordant C (cu aceeeasi coordonata x ca a lui B),
obtinem multimea P+C si C are aceeasi parghie mare ca si B.
Totusi, in comparatie cu B, includerea lui C schimba substantial
estimarea liniei de regresie. Spunem ca C este un punct influential in
multimea P+C. Deasemenea C este o valoare discordanta (relativ la modelul
regresiei liniare ca in toate cazurile discutate). In multimea P+A valoarea
discordanta A are o parghie mai mica dar este influentiala pentru ordonata la
origine si mai putin pentru panta.
Pentru simplitate am introdus notiunile de valori discordante, puncte
parghie si date influentiale in termeni de puncte individuale. Dar, in
particular, aceste notiuni se aplica la fel de bine si grupurilor sau
submultimilor de puncte.
y
x B
.
x C

x

x P
x
x
x
x
x x A x

Fig. 11 Valori discordante fata de dreapta de regresie
II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

173
2.12.3.1.Drepte si puncte discordante
Problema discordantei se complica atunci cand in fapt datele nu se
inscriu pe o singura dreapta ci pe doua sau mai multe drepte in functie de
valorile lui x.
Exemplul cel mai sugestiv si cel mai important pentru
farmacocinetica in acest sens este acela al medicamentelor cu doua etape de
injumatatire, una initiala rapida (de exemplu distributia in compartimentul
profund) si una finala ( de exemplu eliminarea) , lenta , notate uzual cu
si .
Deci datele urmeaza un model biexponential si, dupa logaritmare, se
obtin doua domenii de dependenta liniara a logaritmului concentratiei de
timp , dupa cum se observa in fig.10 pentru concentratia plasmatica a
nicergolinei.

Concentration of nycergoline af ter oral administration
1
10
100
0 5 10 15 20 25 30
time ( hours)
c
o
n
c
.

(

n
g
/
m
l
)

Fig. 12

Datele de la 4 h la 8 h se inscriu pe o dreapta , iar datele de la 8 h la
24 h pe o alta dreapta. Deci avem un timp de injumatatire de distributie si un
timp de injumatatire de eliminare. O analiza pur si simplu statistica ar duce
la concluzia ca ultimele doua puncte reprezinta valori discordante.
Compararea datelor privind farmacocinetica nicergolinei la mai multi
voluntari duce la concluzia ca nu este vorba de o supraestimare a
concentratiilor la ultimele doua puncte ci efectiv avem doua faze de
eliminare din sange.
II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

174
Din alt unghi privind lucrurile, intr-un grup de subiecti caracterizati
printr-o eliminare monoexponentiala si deci, in reprezentarea logaritmica cu
inscrierea punctelor dincolo de t
max
pe o dreapta, pot aparea unul sau mai
multi voluntari cu eliminare biexponentiala. In fapt este posibil ca toti
subiectii sa aiba o eliminare bifazica, dar modelul aparent in functie de
intervalul de recoltare si evaluare a probelor de sange sa fie cand cel real,
cand unul simplificat.
Ca exemplu, prezentam cazul ibuprofenului. Ibuprofenul fiind cu
mult mai solubil in lipide urmeaza un model farmacocinetic cu cel putin
doua compartimente. Datele experimentale pot fi insa modelate la
majoritatea subiectilor cu un model monocompartimental. In fapt, apare o
degenerare a modelului prin compensarea unor procese ce afecteaza
concentratia plasmatica.
Suntem interesati in vederea predictiei, de modele cat mai simple.
Cand unul din subiecti apare efectiv cu o comportare mai complexa, poate fi
de preferat eliminarea lui ca outlier, desi in fond, el este mai aproape de
realitate decat ceilalti subiecti.
Si aici lucrurile sunt relative. Daca vom considera curba medie
pentru un lot de voluntari carora li s-a administrat oral omeprazol, vom
putea obtine o fitare corespunzatoare cu solutia unui model
monocompartimental. Unul dintre subiecti poate aparea discordant fata de
medie.
Introducerea unui time-lag ce corespunde unei intarzieri in
absorbtie (omeprazolul se administreaza, din cauza ca este instabil in mediu
acid, de regula sub forma de capsule enterosolubile) acesta revine si el in
rand cu ceilalti.













II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

175
2.12.3.2. Voluntari discordanti in studii de bioechivalenta.
Cazul cel mai reprezentativ este acela al medicamentelor al caror
metabolizare poate fi lenta la o mica parte din subiecti. Analiza curbelor din
figura 4 duce la ideea ca doi dintre voluntari sunt metabolizori lenti,
deoarece au concentratii mult mai mari decat restul voluntarilor
Plasma levels of propaf enone after repeted administration of RYTMONORM(KNOLL) TO 24 healthy volunteers
0
300
600
900
96 144
time (hour)
c
o
n
c
e
n
t
r
a
t
i
o
n

(
n
g
/
m
l
)
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII
XIII
XIV
XV
XVI
XVII
XVIII
XIX
XX
XXI
XXII
XXIII
XXIV

Figura 13.
Din punct de vedere statistic ei vor parea ca discordanti
indiferent de testul aplicat. Din punct de vedere al scopului urmarit, dupa
cum se vede din figura 14, ei nu ar trebui eliminati deoarece nu influenteaza
rezultatul final medicamentele apar a fi bioechivalente (fig.14)














Figura 14
Mean plasma levels of propaf enone after repeted administration of
PROPAFENON (..) and RYTMONORM (KNOLL) to 24 healthy volunteers
0
100
200
300
96 144
time (hour)
c
o
n
c
e
n
t
r
a
t
i
o
n

(
n
g
/
m
l
)
T
R
II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

176
De fapt, dupa cum este prezentat in capitolul privind evaluarea
statistica a bioechivalentei, ceea ce importa cu mult mai mult, este
intravariabilitatea, variabilitatea unui subiect fata de sine insusi, in cele doua
perioade ale experimentului.
Dupa cum se vede in figura 15, cei doi ouliers in ceea ce priveste
intravariabilitatea au si o variatie semnificativa intre cele doua perioade,
deci eliminarea lor poate fi luata in consideratie.
In acest caz insa, curbele din figura 14 vor deveni si mai apropiate si
nu se va schimba decizia privind bioechivalenta.

0
500
1000
c
o
n
c
e
n
t
r
a
t
i
o
n

(
n
g
/
m
l
)

Figura 15

Uneori, unele curbe pot parea discordante prin aceea ca prezinta
doua sau mai multe maxime, ceea ce este neuzual in farmacocinetica. Daca
este vorba insa de oxicami (piroxicam, meloxicam, tenoxicam etc.), acest
fenomen este normal datorita circulatiei enterohepatice a acestor
medicamente. Deci curbele de meloxicam din figura 16 nu pot fi considerate
curbe discordante.

II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

177
Mean plasma levels of meloxicam
0
0.8
1.6
0 12
time (h)
C
o
n
c
e
n
t
r
a
t
i
o
n

(
u
g
/
m
l
)
R
T

Figura 16.

In evaluarea bioechivalentei esentiala este compararea perechilor de
curbe apartinand aceluiasi voluntar.
Dupa cum se vede din figura 17, cele doua curbe difera foarte mult.
Medicamentele sunt foarte apropiate in ceea ce priveste mediile lor, dar
difera foarte mult la acelasi individ in perioade diferite, ceea ce reprezinta o
intravariabilitate mare, caracteristica clasei conazolilor (ketoconazol,
fluconazol, itraconazol etc.).
Voluntarul prezentat are un raport mult prea mare atat intre
concentratiile maxime, cat si intre ariile de sub curba si el este efectiv
outlier.
II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

178
Figura 17.

Aparent acelasi caz ar fi si in figura 18. Spunem ca aparent, deoarece in
cazul acidului mefenamic diferentele intre formularile farmaceutice sunt
foarte frecvente si este vorba efectiv de bio-inechivalenta.

Mean plasma levels of mefenamic acid
0
3.5
7
0 4 8 12 16 20 24
Time (hours)
R
T

Figura nr. 18


II. STATISTIC MATEMATIC I BIOSTATISTIC
OUTLIERS

179



In concluzie, problema eliminarii unor puncte, sau a unor curbe, sau
a multimii curbelor pentru un subiect dat, nu este in principal o problema
de statistica ci una tinand de analiza fenomenului studiat, de variabilele ce-l
determina si de modelul teoretic urmat.


































II. STATISTIC MATEMATIC I BIOSTATISTIC
CALCULUL NUMARULUI DE VOLUNTARI

181
2.13. Puterea testului. Calculul numarului de subiecti (voluntari sau
pacienti)

2.13.1. Calculul esantionului minim in functie de o precizie fixata
Pentru un interval de incredere (1- ), pentru media une populatii
precizia estimarii este in fapt definita de lungimea intervalului. Cu cat
intervalul este mai mic, cu atat mai precisa va fi estimarea. De aceea,
marimea esantionului se poate alege pornind de la lungimea intervalului de
incredere care sa asigure o precizie stabilita anterior E, sau altfel spus, o
limita a erorii.
Astfel cand datele urmeaza o distributie normala, marimea
esantionului necesar va fi data implicit de relatia:
2
E Y z
n

= = (1)
De exemplu, presupunem ca dorim sa avem 95% incredere si ca
eroarea in media estimata sa fie mai mica de 10% din deviatia standard (i.e.,
E 0.1 ).
Deci,

* 1 . 0
2
=
n
z si ca urmare
( )
385 2 . 384
* 1 . 0
2
2 2
2
= =

z
n
Procedeul se extinde imediat la cazul estimarii intervalelor de
incredere pentru diferenta intre mediiile a doua selectii dupa cum se arata in
tabelul urmator.

Tabelul 25 Determinarea marimii esantionului in functie de precizie:

Parametru Estimarea Intervalul de incredere Marimea esantionului

Y
n
z Y


2
2 2
2
E
z
n

=
2 1

2 1

Y Y
n n
z Y Y
2
2
2
1
2
2 1 ) (

+


2
2
2
2
1
2
2
) (
E
z
n

+
=

De retinut ca alegerea lui n astfel incat eroarea sa nu depaseasca un anumit
prag urmareste atingerea unei precizii date in estimarea lui cu
considerarea numai a erorii de tip I.
II. STATISTIC MATEMATIC I BIOSTATISTIC
CALCULUL NUMARULUI DE VOLUNTARI

182
O abordare independenta de distributie poate fi obtinuta folosind
inegalitatea lui Cebasev:
1- = P{ }
2
2
1
nE
E Y

(2)
Inlocuind inegalitatea cu egalitatea si luand, la fel ca mai sus E = 0.1 si
=0,05 obtinem :
2
2
nE

= si 2000
01 , 0 05 , 0
2
2
2
2
=

= =

E
n
Observam ca cifra asiguratoare este mult mai mare din aceea ca nu avem
nici o informatie despre distributie.

2.13.2. Calculul numarului de subiecti in functie de probabilitatile
erorilor de tipul I si tipul II fixate in prealabil
Pentru a calcula numarul de subiecti in functie si de puterea testului trebuie
specificata diferenta semnificativa clinic in cazul parametrului masurat. In
cele mai multe studii clinice obiectivul este demonstrarea eficientei si
sigurantei unui medicament comparat cu placebo sau cu un alt medicament.
Indiferent de comparator, este important sa se specifice ce diferenta este
importanta din punct de vedere clinic sau stiintific. Aceasta diferenta o vom
nota cu . Aceasta diferenta defineste grosismentul microscopului definit
de studiul clinic cu care comparam cele doua medicamente. Intuitia ne
soune ca daca se va alege o diferenta mare atunci va fi nevoie de un numar
mic de subiecti. Daca diferenta este relative mica, va fi nevoie de un grup de
subiecti mai mare.

2.13.3. Testarea ipotezelor privind media unui lot
Presupunem ca testam urmatoarele ipoteze:
H
0
:
0
=
vs.
0
: >
a
H (11.3.1)
cu riscul cand dispersia
2
este cunoscuta. Simplificam ipoteza
alternativa alternativa, luand
+ =
0
:
a
H
unde >0 este o diferenta pe care o consideram semnificativa clinic.
Deoarece, in ipoteza alternativa ca + =
0
, testul statistic
II. STATISTIC MATEMATIC I BIOSTATISTIC
CALCULUL NUMARULUI DE VOLUNTARI

183

n
Y
/
) (
0


urmeaza o distributie standard normala. Puterea testului este data de relatia
{ }
0
0
1 0
1 var
( )
/ /
a
P H respinsa H ade ata
Y
P z
n n

= =


+
= > = +
`

)
.
1
n n
P z z P z z




= > = <
` `

) )
,
de unde , din definitia cuantilelelor

1
n n
z z z


= =

si de aici

[ ]
2
2 2

+
=

z z
n
Acest rezultat este adevarat si pentru cazul cand ipoteza alternativa este
0
: <
a
H .
Pentru a testa ipoteza bilaterala
0
H :
0
=
vs. =
0
:
a
H sau + =
0
:
a
H
0
H este respinsa in zona critica, adica pentru
0
1
2
x
z
n

sau
0
1
2
x
z
n

.
Deci
0 0
1
1
2 2
1
x x
P z sau z
n n




| |
|

= = = |
|
|
\

II. STATISTIC MATEMATIC I BIOSTATISTIC
CALCULUL NUMARULUI DE VOLUNTARI

184
0 0 1
1
2 2
* * P x z sau x z
n n


| |
+ + = =
|
\

0 1 0 1 1 1
1
2 2
x x
P z sau z
n n n n



| |
|

= + + |
|
|
\

Deoarece media adevarata este
1
,
n
x

este repartizat ( ) 1 , 0 N . Prin


urmare
|
|
|
|

\
|
+

+
|
|
|
|

\
|
+

2
1
1 0
2
1 0
1 1


z
n
z
n

Pentru 5 . 0
1 0


se poate considera ca
0
2
1 0

|
|
|
|

\
|
+


z
n
, si deci
|
|
|
|

\
|
+

2
1
1 0


z
n

Conform definitiei avem ( )

= z ,
2 2
1

z z =

si ca urmare
2
1 0


z
n
z

= si


z z
n
+

=
2
1 0
.
Scotand pe n din ecuatie obtinem:
( )
2
1 0
2
2
2

|
|

\
|
+
=
z z
n


II. STATISTIC MATEMATIC I BIOSTATISTIC
CALCULUL NUMARULUI DE VOLUNTARI

185
Cazul distributiei binomiale

Fie Y variabila aleatoare Bernoulli cu probabilitatea de succes p si
probabiliatae de esec 1-p. Obiectivul studiului este de a alege intre
H
0
: p = p
0
si H
a
: p = p
1
(p
1
>p
0
)
din evaluarea unui esantion de marime n.
Proportia de selectie
1
1
n
i
i
P Y
n
=
=


urmeaza aproximativ o distributie normala cu media p si dispersia p(1-p)/n .
Pentru testarea ipotezelor enuntate ne folosim de aproximarea normala

0
0 0
( )
( )
P p P E P
Z
D P p q
n

=

=
=

= + =

=
1 1
0
1 1
1 0
1 1
1
1
0
0 1
0
0
q p
q p
z
n
q p
p p
n
q p
p p
p p
n
q p
z p p p p z
n
q p
p p
o
o
o


1 1
0 0
1 1
q p
q p
z
n
q p
z

=
n
q p
q p
q p
z z
1 1
1 1
0 0

= +


In concluzie rezulta pentru n :
n
q p z q p z
= == =
| || |
| || |

| || |


\ \\ \
| || |

+ ++ +
2
0 0 1 1

II. STATISTIC MATEMATIC I BIOSTATISTIC
CALCULUL NUMARULUI DE VOLUNTARI

186
2.13.4. Testul pentru compararea mediilor a doua populatii

O procedura asemanatoare ca mai sus poate fi aplicata pentru determinarea
marimii esantionului necesar pentru obtinerea unei puteri date in
compararea a doua metode de tratament. Fie
2 1
si mediile tratamentului
1 si, respectiv, tratamentului 2. Cele doua ipoteze sunt:

0
H :
2 1
= vs.
2 1
:
a
H
Presupunand ca
2
1
si
2
2
sunt cunoscute si considerand o ipoteza
alternativa specifica, simplificata =
2 1
:
a
H formula care da puterea
testului este prin definitie
{ }
0
1 1
2 2
1 2
1
2 2
1 var
a
d d
P H respinsa H ade ata
Y Y Y Y
P z sau z

= =



= > = +
`

)

unde
2
2
2
1
2
1
n n
d

+ =
Dar, in ipoteza alternativa, statistica
d
Y Y



) ( 2 1
este o variabila
normala standard, z
Facand aceleeasi operatii ca mai sus, de punere in evidenta a
variabilei normal repartizate, si neglijand
1
2
1 2
2 d
Y Y
P z

= +
`

)
se obtine:
2
1
1 2
2
( )
1
d d
Y Y
P z






= > = +
`

)
.
De aceea
2 d
z

| |

=
|
\
,
de unde,
II. STATISTIC MATEMATIC I BIOSTATISTIC
CALCULUL NUMARULUI DE VOLUNTARI

187

d
z z

=
2
.
Daca presupunem ca
2 1
n n n = = si
2 2
2
2
1
= = atunci
2
2 2
2 2
2
2
d
z z
n


(

+ = =
(

si deci

2
2
2
2
2
2
2
2
2
2
1
2 ) (

+
=

+ +
=

z z z z
n
Pentru un test unilateral, formula de mai sus pentru determinarea
marimii esantionului devine:
[ ]
2
2 2
2
2
1
) (

+ +
=

z z
n
De retinut ca atunci cand dispersia populatiei este necunoscuta,
alegerea marimii lotului nu este o problema usoara.
De exemplu, in testarea ipotezei nule in expresia
H
0
:
0
=
vs.
0
: >
a
H
cand valoarea adevarata este + =
0
, statistica
n s
Y
/
) (
0
+

urmeaza o
distributie t necentrata cu parametrul de ne-centrare / = .

Tabelul de mai jos contine marimea calculata a loturilor pentru
testul t privind meda si respectiv, diferenta dintre mediile tratamentelor
respective, pentru diferite valori ale lui - diferenta semnificativa









II. STATISTIC MATEMATIC I BIOSTATISTIC
CALCULUL NUMARULUI DE VOLUNTARI

188
Tabelul nr. 26:
Test unilateral Test bilateral
05 . 0 =
Riscul
1 . 0 =
=
0.01 0.05 0.1 0.2 0.5
=
0.01 0.05 0.1 0.2 0.5


2 1

=
0.15 122 0.20 137
0.20 70 0.25 88
0.25 139 101 45 0.30 61
0.30 122 97 71 32 0.35 102 45
0.35 90 72 52 24 0.40 108 78 35
0.40 101 70 55 40 19 0.45 108 86 62 28
0.45 80 55 44 33 15 0.50 88 70 51 23
0.50 65 45 36 27 13 0.55 112 73 58 42 19
0.55 54 38 30 22 11 0.60 89 61 49 36 16
0.60 46 32 26 19 9 0.65 76 52 42 30 14
0.65 39 28 22 17 8 0.70 66 45 36 26 12
0.70 34 24 19 15 8 0.75 57 40 32 23 11
0.75 30 21 17 13 7 0.80 50 35 28 21 10
0.80 27 19 15 12 6 0.85 45 31 25 18 9
0.85 24 17 14 11 6 0.90 40 28 22 16 8
0.90 21 15 13 10 5 0.95 36 25 20 15 7
0.95 19 14 11 9 5 1.00 33 23 18 14 7
1.00 18 13 11 8 5 1.1 27 19 15 12 6
1.1 15 11 9 7 1.2 23 16 13 10 5
1.2 13 10 8 6 1.3 20 14 11 9 5
1.3 11 8 7 6 1.4 17 12 10 8 4
1.4 10 8 7 5 1.5 15 11 9 7 4
1.5 9 7 6 1.6 14 10 8 6 4
1.6 8 6 6 1.7 12 9 7 6 3
1.7 8 6 5 1.8 11 8 7 5
1.8 7 6 1.9 10 7 6 5
1.9 7 5 2.0 9 7 6 4
2.0 6 2.1 8 6 5 4
2.1 6 2.2 8 6 5 4
2.2 6 2.3 7 5 5 4
2.3 5 2.4 7 5 4 4
2.4 2.5 6 5 4 3
2.5 3.0 5 4 3
3.0 3.5 4 3
3.5 4.0 4
II. STATISTIC MATEMATIC I BIOSTATISTIC
CALCULUL NUMARULUI DE VOLUNTARI

189
Cand variabilele rezultate sunt cu doua valori posibile (tratamentele
fie imbunatatesc, fie nu imbunatatesc starea pacientului) variabilele care ne
intereseaza mai mult sunt proportiile pacientilor a caror stare s-a ameliorat
si nu media unor masuratori date. Fie p
1
si p
2
proportia de succes (e.g.
vindecare sau imbunatatire) in grupul in care s-a facut tratamentul si,
respective in grupul de control. Marimea esantionului se poate determina
similar cu cazul testului t bilateral obtinandu-se pentru n :

2
2
2 1
2 2 1 1
2
) (
) 1 ( ) 1 ( ) 1 ( 2
p p
p p p p z p p z
n

+ +
=


unde
2
2 1
p p
p
+
= .

























II. STATISTIC MATEMATIC I BIOSTATISTIC
CALCULUL NUMARULUI DE VOLUNTARI

190
2.13.5. Marimea esantionului pentru comparari de mai multe medii prin
analiza dispersionala (ANOVA)

Pentru analiza dispersionala pe o singura cale cu n observatii pe
fiecare tratament, obiectivul principal este de a testa ipoteza
0
H privind
provenienta esantioanelor din aceiasi populatie. Folosind notatiile de la
capitolul privind analiza dispersionala avem:
0 :
2 1 0
= = = =
k
H K , si cu ipoteza alternativa
zero este nu un putin cel H
i a
:

Reamintim ca:

+ = |

\
|

=
k
i
i
k
n
k
SSA
E MSA E
1
2 2
1 1
) ( si
2
) 1 (
) ( =
|
|

\
|

=
n k
SSE
E MSE E

Astfel, pentru o deviatie data de la ipoteza nula
0
H , masurata prin

k
i
i
k n
1
2
) 1 /( , valori mari ale lui
2
micsoreaza sansele de obtinere a
valorii F
A
= MSA/MSE in zona critica a testului.
Sensibilitatea testului descrie puterea procedurii de a detecta
diferentele intre mediile grupurilor si reprezinta, in fapt, puterea testului.
Aceasta putere se interpreteaza ca probabilitatea ca F sa cada in zona critica
atunci cand ipoteza nula este falsa si mediile tratamentelor difera intre ele.
Conform ipotezei nule F
A
=MSA/MSE urmeaza o distributie F cu
(n
1
,n
2
)

grade de libertate, unde k N n k v si k v = = = ) 1 ( 1
2 1
.
Deci, pentru analiza dispersiei one-way, puterea este data de:
{ }
)
`

> =
= > =

=
0
1
) , , (
var ) , , ( 1
1
2
2 1
2 1
k
i
i A
a A
k
n
v v f F P
ata ade este H v v f F P


(3)
Pentru valori date pentru

k
i
i
k n
1
2
) 1 /( si
2
puterea poate fi
crescuta folosind esantioane mai mari. Problema revine la proiectarea unui
experiment cu o valoare a lui n astfel incat sa avem asigurata o putere data.
II. STATISTIC MATEMATIC I BIOSTATISTIC
CALCULUL NUMARULUI DE VOLUNTARI

191
In ipoteza alternativa ca
A
k
i
i
F , 0
1
2

=
urmeaza o distributie
noncentrata cu un parametru de noncentralitate unde
2
1
2
2
2

=
=
k
i
i
n
.
Asfel relatia (3) devine
{ } ) , , , ( 0
1
) , , ( 1
2 1
1
2
2 1
v v f F P
k
n
v v f F P
A
k
i
i A
> =
)
`

> =

=

relatie care defineste implicit numarul necesar de subiecti.




























II. STATISTIC MATEMATIC I BIOSTATISTIC
CALCULUL NUMARULUI DE VOLUNTARI

192
2.13.6. Modelul crossover
Ipoteze punctuale privind egalitati.
FieY
ijk
raspunsul voluntarului i in secventa k in perioada j.
Consideram un model care neglijeaza efectele carryover inegale:

ijk k j j ik ijk
e T P S Y + + + + =
) , (
,
(4)
unde i = 1,2, ,
k
n este numarul de voluntary, j este perioada, k = 1, 2 este
secventa.
In modelul de mai sus este media totala,
ik
S este efectul aleatoriu
al voluntarului i in secventa k,
j
P este efectul de perioada j,
) , ( k j
T este
efectul direct al tratamentului administrat in perioada j, secventa k, adica
Placebo pentru k = j
) , ( k j
T =
Medicamentul testat pentru k j, k = 1, 2; j = 1, 2
si
ijk
e eroarea in masuratori.
Pentru modelul (4) se presupune ca{ }
ik
S sunt distribuite
independent si identic cu media zero si dispersia
2
S
si { }
ijk
e sunt distribuite
independent cu media zero si dispersia
2
. Se presupune ca { }
ik
S si { }
ijk
e
sunt independente intre ele. Sa testam urmatoarele ipoteze:

0
:
T P
H =
vs :
a T P
H (5)
Consideram diferentele intre perioade pentru fiecare voluntar in
interiorul fiecarei secvente definite:
), (
2
1
1 2 k i k i ik
Y Y d =
unde i = 1,2, ,
k
n , k = 1, 2.
Un test pentru ipotezele (5) poate fi un test t bilateral dupa cum
urmeaza:

1 2
1 1

T
P
d
d
Y Y
T
n n

=
+
,
II. STATISTIC MATEMATIC I BIOSTATISTIC
CALCULUL NUMARULUI DE VOLUNTARI

193
unde ) (
2
1
12 . 21 .

+ = Y Y YT , . 11 . 22
1
( )
2
P Y Y Y

= + si

= =

+
=
2
1 1
2
.
2 1
) (
2
1

k
n
i
k ik d
k
d d
n n
,

=
k
n
i
ijk
k
jk
Y
n
Y
1
1
. ,

=
k
n
i
ik
k
k d
n
d
1
.
1

Conform ipotezei nule, T
d
are o distributie t cu 2
2 1
+ n n grade de
libertate.
Daca nu se accepta ipoteza nula, atunci
1 2
(1 / 2, 2).
d
T t n n > +
In ipoteza alternativa simplificata + =
p T
puterea testului T
d

poate fi evaluat similar.
In scop de echilibrare, presupunem ca n n n = =
2 1
; ceea ce inseamna
ca fiecare secventa va avea acelasi numar de voluntari.
Cele doua ipoteze de mai sus sunt de regula inlocuite cu doua
perechi de ipoteze (metoda Schuirmann)
01
:
T P L
H
vs.
1
:
a T P L
H >
si
02
:
T P U
H
vs.
U R T a
H :
2
,
unde
L
si
U
sunt limitele pentru echivalenta semnificative clinic.
Dupa cum se observa ipoteza nula este ca medicamentele nu sunt
bioechivalente. Cu aceasta prezumtie de vinovatie este micsorat riscul
pacientului. Daca studiul nu dezvinovateste medicamentul testt, acesta nu
poate fi introdus in terapie.
Putem sa nu acceptam ipoteza nula a inechivalentei daca:
1 2
1 2
( , 2)
(1/ ) (1/ )
T P
L
L
d
Y Y
T t n n
n n



= > +
+
si
1 2
1 2
( , 2)
(1/ ) (1/ )
T P
U
U
d
Y Y
T t n n
n n



= < +
+

Fie =
T P
si ) (
S
puterea testului bilateral Schuirmann
pentru un dat.
In cazul bioechivalentei observam ca, in contextul in care se doreste
minimalizarea riscului pacientului, avem particularitatea ca functioneaza
II. STATISTIC MATEMATIC I BIOSTATISTIC
CALCULUL NUMARULUI DE VOLUNTARI

194
intr-un fel prezumtia de vinovatie, in sensul ca
0
H

este ipoteza ca
medicamentele nu sunt bioechivalente iar puterea testului este probabilitatea
de a accepta ipoteza bioechivalentei in cazul cand acestea sunt echivalente
( ) i pacientulu riscul ata ade H H respinge P = = var
0 0

( )
0
var
a
P accepta H H ade ata riscul producatorului = =
( ) ata ade H H respinge P
a
var 1
0
=
In scopul calcularii puterii reformulam putin ipotezele
0
H in sensul
ca vom lua = =
u L

In acest context problema testului devine o problema de
probabilitate de a detecta o diferenta pe care o consideram ca
semnificativa clinic; in cazul bioechivalentei aceasta diferenta este de 20%.

Ipoteza complexa Ipoteza simplificata
L R T
H :
01

R T a
H = :
1

u R T
H :
02

R T a
H = :
2

=
R T
H :
01

R T a
H = :
1

=
R T
H :
02

R T a
H = :
2


Analizam in continuare cazul

=
R T
H :
01
vs. 0 :
1
=
R T a
H


( )
|
|
|

\
|
=

=
=
|
|
|

\
|
=
+
= =


R T n
R T n a
n
t
n
x
P
t
n
x
P ata ade H H respinge P


var 1
2 2 , 1
2 2 , 1 0

|
|
|

\
|
=

=
R T n
n
t
n
x
P

1 1
2 2 , 1

II. STATISTIC MATEMATIC I BIOSTATISTIC
CALCULUL NUMARULUI DE VOLUNTARI

195
n
t t
n n
2

2 2 , 1 2 2 ,

=


2 2 , 1 2 2 , 1 2 2 , 2 2 , 1
2


+ = =

n n n n
t t t t
n


( )
2
2
2
2 2 , 1 2 2 , 1

* 2

+ =

n n
t t n

Pornind de la grupul 2 de ipoteze se obtine
=
R T
H :
01

0 :
02
=
R T
H

( ) ata ade H H respinge P
a
var 1
0
=

2 2,
2 2,
1 0

2
0

2 2
n T R
n T R
X
P t
n
X
P t
n n

| |
|

|
= = =
|
|
\
| |
|

|
= + =
|
|
\


si asa mai departe.
Deoarece noi examinam practic amandoua ipotezele putem lua riscul
2


in
amandoua cozile distributiei normale, in care caz se obtine:
2
2
2
2 2 , 1
2 2 ,
2
1

* 2

|
|

\
|
+ =

n
n
t t n






II. STATISTIC MATEMATIC I BIOSTATISTIC
CALCULUL NUMARULUI DE VOLUNTARI

196
Cazul cand exista o diferenta intre medicamente

Consideram in continuare cazul cand diferenta intre cele doua medii
nu mai este zero ci are o valoare data
0
:

0 T R
=

De regula pentru produsele bioechivalente
0
este mai mic decat
7% din
R
.
Consideram din nou o ipoteza simplificata:
=
R T
H :
02
vs
0 :
2
=
R T a
H si notam

R T
X X X =
si vom folosi statistica
0
2 2
( )
1/ 1/ 2/
T R T R
n
d d
X X X
T
n n n


= =
+
) )

Calculam dupa acelasi procedeu ca mai sus numarul n de subiecti
necesari pantru a asigura o putere data :
( ) ( )
0
0
1 , 2 2
2
0 0
0
1 , 2 2
2
1 var
2
2 2
a
T R
n
T R
n
P respinge H H ade ata
X
P t
n
X
P t
n n






= = =
| |

= = =
|
|
\
| |

= + =
|
|
\

0
2 2 0
1 , 2 2
2
2
n T R
n
P T t
n


| |

= + =
|
|
\

Deci
0
, 2 2
1 , 2 2
2
2
n
n
t t
n

+ =

de unde
( )
2
2
,2 2 2
,2 2
2

2 *
n
n
n t t

| |
= +
|

\

Observam ca puterea depinde de , iar numarul de subiecti necesar
pentru detectarea unei diferente semnificative clinic data este cu atat mai
mare cu cat cele doua medicamente sunt mai apropiate.
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE PRIVIND DISTRIBUTIA BINOMIALA

197
2.14. TESTE PRIVIND DISTRIBUTIA BINOMIALA

2.14.1. Compararea proportiilor cu testul exact Fisher

Consideram toate rezultatele posibile a doua incercari independente,
1
n in primul caz si
2
n in al doilea caz, toate cu aceeasi probabilitate de
succes P. Notam numarul succeselor cu
1
k si
2
k .

Tabelul nr. 27





unde:
- A si B multimi
-
1
k
si
2
k
numarul succeselor
-
1 1
n k si
2 2
n k numarul esecurilor
-
1
n ,
2
n numarul de incercari si
1 2
k k + fixate

Consideram rezultatele particulare
1 1
x k = si
2 2
x k = . Calculam
probabilitatea obtinerii acestor rezultate
1
k si
2
k , cand se dau marimile
esantioanelor
1
n si
2
n si numarul total de succese obtinute (
1 2
k k + ), cu
presupunerea ca probabilitatea de succes P este aceeasi pentru fiecare din
cele doua incercari.
Definim
1
E si
2
E ca fiind evenimentele (
1 1
x k = ,
2 2
x k = )
respectiv(
1 2
x x + =
1 2
k k + ).
Probabilitatea ca sa se obtina datele din tabel este:
{ } { }
{ }
{ }
1 2
1 1 2 2 1 2 1 2 1 2
2
,
P E E
P x k x k x x k k P E E
P E
= = + = + = = (**)
unde ( )
1 2
E E reprezinta realizarea concomitenta a evenimentelor
1
E si
2
E .
1
k
1 1
n k
1
n
2
k
2 2
n k
2
n
1 2
k k +
1 2 1 2
( ) n n k k + +
1 2
n n +
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE PRIVIND DISTRIBUTIA BINOMIALA

198
Daca se realizeaza
1
E , adica (
1 1
x k = ,
2 2
x k = ), atunci automat se
intampla
2
E , deoarece nu putem avea
1 1
x k = si
2 2
x k = fara a avea simultan
(
1 2
x x + ) = (
1 2
k k + ).
De aceea probabilitatea evenimentului ( )
1 2
E E este aceeasi cu
probabilitatea evenimentului
1
E , adica { }
1 2
P E E = { }
1
P E . Inlocuind in
relatia (**) se obtine
{ }
{ }
{ }
1
1 1 2 2
1 1 2 2 1 2 1 2
2 1 2 1 2
( )
,
( )
P E
P x k x k
P x k x k x x k k
P E P x x k k
= =
= = + = + = =
+ = +

2
2 1
1
2
( )
( )
( )
E
P E E
P E
P E

=
Din definitia distributiei binomiale
1
( ) P E si
2
( ) P E vor fi date de
formulele:
1 1 1 1 2 2 2 2
1 2
1
( ) (1 ) (1 )
k n k k k n k k
n n
P E C p p C p p

=
2 1 2 1 2 1 2 1
1 2
)
2
(
( ) (1 )
n k k k k n k k
n n
P E C p p
+ + + +
+

=
( ) ( )
( )
1 2
1 2
2
1 2
1 2
1 2 1 2 1 2
1 2
1
1 2 1 1 2 2 1 2
! !
! !
( )
! !( )!( )! !
k k
n n
E k k
n n
C C
k k n n k k
n n
P E
k k n k n k n n
C
+
+
( + + +

= =
+

De obicei in tabelele de contingenta se foloseste notatia din tabelul
de mai jos. Cu aceasta notatie probabilitatea rezultatelor devine
Tabelul nr. 28

A a b a+b
B c d c+d
a+c b+d

( )
2
1
( )!( )!( )!( )!
( ) ,
! ! ! !( )!
( )!( )!( )!( )! 1 1
( )! ! ! ! ! ! ! ! !
E
a b c d a c b d
P E P a c a c
c d a b a b c d
a b c d a c b d
C
a b c d c d a b c d a b
+ + + +
= + = =
+ + +
+ + + +
= =
+ + +


II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE PRIVIND DISTRIBUTIA BINOMIALA

199
Regula de calcul se poate obtine mai usor daca observam ca la
numarator avem factorialele totalurilor marginale, iar la numitor numerele
din tabel si totalul general.

Exemplu.
Din studii anterioare se stia ca proportia de reactii adverse, in special
dureri de cap, la voluntarii sanatosi dupa administrarea isosorbit mononitrat
(ISMN) este de circa 30%.
S-a testat o noua formulare T comparativ cu formularea de referinta
in ceea ce priveste biodisponibilitatea. Protocolul experimentului clinic a
cerut, pe langa compararea biodisponibilitatii, si inregistrarea efectelor
adverse. Experimentul a fost de tip incrucisat, pe 24 voluntari din care, in
prima perioada 12 au primit medicamentul de referinta (R) si 12
medicamentul testat (T). Doi voluntari dintre cei care au primit referinta au
abandonat experimentul. In final numarul voluntarilor cu dureri de cap a
fost de 3 pentru R si 5 pentru T. Deci punand datele in tabelul 2x2 se obtine:

Medicament Reactii adverse (RA) Total
Da Nu
R 3 9 12
T 5 5 10
Total 8 14 22

Proportia de RA la ISMN a fost gasita mai mare medicamentul testat:
5 3
10 12
> .
Se poate afirma ca acest lucru este adevarat cu probabiliatatea 90%.
Verificam in acest scop ipotezele:
0
:
:
T R
A T R
H P P
H P P
=
>
cu = 0,10.
Aplicam testul Fisher. Sa calculam pentru inceput probabilitatea de a
se obtine exact rezultatul obtinut in experiment.. Conform cu cele
reprezentate mai sus, luand
1
n =12,
2
n =10 si
1 2
k k + = 8
3 9 12
8!14!12!10!
5 5 10 0,173
3!5!5!9!22!
8 14 22
P
| |
|
= =
|
|
\

II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE PRIVIND DISTRIBUTIA BINOMIALA

200
Mai departe trebuiau calculate si probabilitatile pentru combinatiile
mai putin probabile decat combinatia obtinuta experimental si cu proportii
mai mari pentru
T
P . Avem de exemplu:
2 10 12
8!14!12!10! 1
6 4 10 0, 04
22! 2!6!4!10!
8 14 22
P
| |
|
= =
|
|
\


1 11 12
1
7 3 10 0, 0045
1!7!11!3!
8 14 22
P c
| |
|
= =
|
|
\
si

0 12 12
1
8 2 10 0
0!8!12!2!
8 14 22
P c
| |
|
= =
|
|
\

Deci ( )
5
1,173 0, 04 0, 0041 0 0,10
10
P p
| |
= + + + >
|
\
. P = 0,213.
Deci, in ipoteza ca cele doua medicamente nu difera in ceea ce
priveste probabilitatea aparitiei efectelor adverse in proportie mai mare de
5
10
este 0,213.
Ca urmare nu putem respinge ipoteza ca minimul de efecte adverse
este mai mare in medicamentul testat decat in cel de referinta doar din
intamplare.
Este de mentionat o restrictie importanta a testului Fisher si anume
aceea ca numarul total de cazuri de un anumit tip este constant (in cazul
nostru am ales in consecinta numai combinatiile pentru care numarul total
de subiecti prezentand efecte adverse a fost egal cu 8 asa cum s-a obtinut in
experiment ). De altfel, raportat la un experiment anterior acesta ar fi trebuit
sa fie 6-7. Desi aceasta restrictie este bine cunoscuta ca incorecta, testul
Fisher se aplica in toata lumea fara precautii in ceea ce priveste
verosimilitatea asimilarii practic a tuturor sumelor marginale constante.
In continuare sa comparam rezultatul cu rezultatul obtinut din
compararea proportiilor experimentale folosind aproximarea normala.
Pentru a verifica ipotezele
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE PRIVIND DISTRIBUTIA BINOMIALA

201
0 1 2
1 2
:
:
A
H p p p
H p p
= =
>
cu = 0,10, calculam
( )
1 2
1 2
1 2
1 1
2 2
1 1
1
p p
n n
Z
p p
n n
| |
+
|
\
=
| |
+
|
\
, unde
1 2
1 2
3 5 4

12 10 11
k k
p
n n
+ +
= = =
+ +


5 3 1 1
10 12 20 24
0, 77
4 7 1 1
11 11 10 12
Z
| |
+
|
\
= =
| |
+
|
\


( ) ( ) 0, 77 0, 77 0, 22 P Z = = ceea ce este foarte apropiat de rezultatul
obtinut cu metoda Fisher. Mai departe comparam cele doua proportii de RA
folosind testul
2
. Revenim la tabel
3 9 12
5 5 10
8 14 22
si calculam valorile asteptate pornind de la estimarea combinata a
probabilitatii:
1 2
1 2
3 5 4

12 10 11
k k
p
n n
+ +
= = =
+ +


Valorile asteptate vor fi
1 1
2 2
4
( ) 12 4, 36
11
4
( ) 10 3, 64
11
E k n p
E k n p
= = =
= = =

Iar celelalte valori se obtin prin scadere din
1
n si
2
n . Deci, dupa scrierea
datelor asteptate, tabelul devine:
3 (4,36) 9 (7,64) 12
5 (3,64) 5 (6,36) 10
8 14 22
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE PRIVIND DISTRIBUTIA BINOMIALA

202
si mai departe:
( ) ( ) ( ) ( ) ( )
2 2 2 2 2
2
3 4, 36 9 7, 64 5 3, 64 5 6, 36
1, 46
4, 36 7, 64 3, 64 6, 36
i i
i
O E
E


= = + + + =

i
O = valorile observate
i
E = valorile asteptate (expectation)

Daca vom cauta in tabele, vom gasi ca valoarea de prag pentru
distributia
2
cu un singur grad de libertate pentru aria de 0,90este 2,71.
Deoarece 1,46 este mai mic decat 2,71, se accepta ipoteza ca cele
doua proportii sunt egale sau, mai exact spus, nu se poate respinge ipoteza
ca sunt egale.
Dupa cum s-a discutat la prezentarea testului
2
aplicat in
compararea proportiilor acesta este echivalent pentru un singur grad de
libertate cu aplicarea distributiei normale. Valoarea obtinuta la aplicarea
testului Z ridicata la patrat ar trebui sa dea valoarea obtinuta prin statistica
2
, dar
2
0, 77 1, 46 .

Daca insa, in calculul statisticii Z renuntam la aplicarea corectiei de
continuitate obtinem:
5 3
0
10 12
1, 21
4 7 1 1
11 11 10 12
Z

= =
| |
+
|
\

si
2
1, 21 1, 46 .
Deci, testul
2
este echivalent cu testul Z fara corectia de
continuitate.









II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE PRIVIND DISTRIBUTIA BINOMIALA

203
2.14.2. Tabele de contingenta R x C
Un tip special de experimente clinice este acela in care mai multe
grupuri de subiecti sunt comparate in ceea ce priveste un raspuns , numit si
marker ce nu iau valori numerice ci un numar finit de stari cum ar fi
agravat, neschimbat, vindecat, ameliorat.
Se poate intampla adesea ca si atunci cand raspunsul reprezinta o
variabila aleatoare continua, din punct de vedere clinic sa fim interesati in
incadrarea acestor valori in anumite intervale. Daca spre exemplu masuram
viteza de sedimentare a hematiilor ( VSH ), dat fiind nespecificitatea acestui
parametru sa ne fie mai util sa catgorisim valoare obtinuta ca normala ( de
exemplu intre 0 si 5 mm/h), crescuta moderat ( 5 40 mm/h ) sau foarte
mare ( peste 40 mm/h).
Uneori procesul este invers, de cuantificare a unor stari prin
asocierea unor numere pe o anumita scara, de exemplu o scara vizuala
privind durerea sau o scara de apreciere a eficientei unui tratament
antireumatic, cum este de exemplu indicele WOMAC, ce vine sa integreze o
serie mai mare de semne clinice mai mult sau mai putin subiective, mai
mult sau mai putin corelate intre ele.
In toate cazurile de mai sus putem fi interesati in frecventa diferitelor
raspunsuri in cadrul unor grupuri constituite ad-hoc in raport cu obiectivele
studiului , de exemplu barbati emei, lot tratat lot netratat etc.
La modul general, experimente de tipul celor de mai sus duc la niste
tabele pe care se numesc tabele R x C , unde R este numarul de grupuri (
row ) si C numarul de coloane. Cazul cel mai simplu si de altfel si cel
mai frecvent este cazul tabelelelor 2 x 2 , de exeplu vindecat, nevindecat sau
toxic, non toxic etc. Aceste tabele se mai numesc si tabele de
contingenta, termenul de contingenta fiind etimologic unul preluat din
geometrie ( tangent, cotangent etc).
De regula, in aceste tabele suntem interesati sa verificam ipoteze
privind proportiile privind prevalenta unor simpome sau efecte in aumite
grupe si, in acest caz problema se reduce la compararea unor frecvente, care
subiect a fost tratat la capitolul verificarea ipotezelor statistice.
O formulare echivalenta, in contextul aranjarii rezultatelor in tabele,
cu ipotezele privind frecventele , se refera la relatiile intre linii si coloane.
Consideram spre exemplu un tabel generic privind rezultatele comparative,
pe loturi paralele, obtinute cu doua medicamente, unul de referinta R, si
unul testat T (tabelul 29).


II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE PRIVIND DISTRIBUTIA BINOMIALA

204
Tabel 29. Exemplu de tabel de contingenta 2x3

lipsa efect efect moderat vindecat
R 20 30 40
T 15 30 50

Ipoteza nula ca tratamentele sunt echivalente se traduce in ipoteza
privind independenta liniilor , sau altfel spus, rezultatele nu implica
diferente intre tratamente.
Relatiile intre liniile si coloanele tabelelor de contingenta pot fi
testate cu ajutorul testului
2
cu (R-1)(C-1) grade de libertate.
( )
2
2
( 1)( 1)
i i
R C
i
O E
E


unde O sunt valorile observate iar E sunt valorile asteptate (Expected).
Pentru calculul valorilor asteptate va trebui sa completam tabelul cu totalul
pe fiecare linie si coloana. Consideram pentru inceput un tabel 2x2 obtinut
din tabelul29 prin considerarea numai a doua raspunsuri : lipsa efect si
vindecat

Tabel 30. Exemplu de tabel de contingenta 2x2

lipsa efect vindecat
R 20 40 60
T 15 50 65
total 35 90 125

Rescriem tabelul sub o forma generica ( tabelul 31)
Tabel 31. Tabel de contingenta 2x2 generic
lipsa efect vindecat
R
1 1
n k
1
k
1
n
T
2 2
n k
2
k
2
n
total
( )
1 2 1 2
( ) n n k k + +
1 2
k k +
1 2
n n +
Problema compararii celor doua tratamente o putem reduce la
compararea celor doua frecvente de pacienti vindecati
1
1
k
n
si
2
2
k
n
.
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE PRIVIND DISTRIBUTIA BINOMIALA

205
In acest scop presupunem ca cele doua variabile
1
k si
2
k sunt
distribuite binomial cu acelasi parametru p ( proportia celor care raspund la
tratament). Dupa cum s-a aratat la capitolul privind distributia binomiala
mediile si dispersiile sunt date de formulele
( )
1 1
E k n p = ; ( )
2 2
E k n p = ; ( )
1 1
D k n pq = ; ( )
2 2
D k n pq =
Dar, atunci cand p este mic
2
(1 ) npq np p np p np = = si deci
( ) ( )
i i
D k E k
Mai departe, cand
i
n este suficient de mare variabila aleatoare
standardizat
( )
( )
k E k
k np k np O E
z
npq np E D k


= = = se aproximeaz ca
fiind normal repartizat.
In aceste conditii
( )
2
i i
i
O E
E

este prin definitie repartizata


2

iar o estimare natural a lui p este
2 1
2 1
n n
k k
p
+
+
= si
respectiv
( ) ( )
1 2 1 2
1 2
n n k k
p
n n
+ +
=
+

In particular cu datele din tabelul 2 vom avea p = 90/125=0.72 si
35
0.28
125
=
E(k
1
)= 60x90/125=43.2
E(k
2
)= 65x90/125=46.8
E(
1 1
n k )=60x35/125=16.8
E(
2 2
n k )= 65x35/125=18.2
Formam acum un tabel completat cu valorile asteptate ( tabelul 32)

Tabelul 32 Valorile observate si valorile asteptate
lipsa efect vindecat
R 20 (16.8) 40 (43.2) 60
T 15 (18.2) 50 (46.8) 65
total 35 90 125
si calculam valoarea testului
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE PRIVIND DISTRIBUTIA BINOMIALA

206
( ) ( ) ( ) ( )
2 2 2 2
2
1
2
20 16.8 15 18.2 40 43.2 50 46.8
16.8 18.2 43.2 46.8
1 1 1 1
3.2 1.62
16.8 18.2 43.2 46.8


= + + + =
| |
+ + + =
|
\


Pentru o semnificatie de 95%, valoarea de prag a lui
2
1
este 3.84 .
Deci putem spune ca liniile sunt independente si deci tratamentele
sunt echivalente.





























II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE PRIVIND DISTRIBUTIA BINOMIALA

207
2.14.3.Teste de independenta la clasificarea dupa doua criterii

Problema tabelelor de contingenta este problema demonstrarii
faptului ca doua criterii de clasificare introduse pe aceiasi populatie sunt
independente.
Doua criterii se pot considera independente daca distributia dupa un
criteriu este aceiasi indiferent daca mai aplicam sau nu si al doilea criteriu
de clasificare.
De exemplu daca rezultatele obtinute prin aplizarea a doua
tratamente si gruparea dupa varsta sunt independente , ne asteptam sa avem
aceleasi proportii de ameliorari si/sau vindecari in toate grupele de varsta
cu cele doua medicamente. Ipoteza nula este aceea ca cele doua criteriide
clasificare sunt independente. Verificarea acestei ipoteze se face folosind
exact acelasi test ca mai sus
( )
2
2
( 1)( 1)
i i
R C
i
O E
E


dar interpretarile calculelor sunt diferite.
Consideram din nou tabelul 30 , unde cele doua criterii de clasificare
sunt medicamentul administrat si efectul obtinut.

Tabelul 33. Clasificarea pacientilor dupa tratament si efecte
lipsa efect efect moderat vindecat total
R 20 30 40 90
T 15 30 50 95
total 35 60 90 185

Sa estimam probabilitatile asteptate in fiecare celula in conditiile
incare cele doua criterii sunt independente ( ceea ce semnifica in fapt
echivalenta medicamentelor R si T).
Estimam la inceput probabilitatile marginale, pornind de la
totalurile marginale .
Probabilitatea ca un pacient luat la intamplare din lotul selectat sa nu
prezinte o ameliorare a starii sale este de 35/90=0.39 ; probabilitatea ca la
un subiect oarecare efectul sa fie moderat este 60/90=0.67 si probabilitatea
vindecarii este 90/185. Similar, probabilitatile caun subiect sa fi primit
medicamentul de referinta este 90/185 si respectiv 95/185 ca sa fi primit
medicamentul testat.
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE PRIVIND DISTRIBUTIA BINOMIALA

208
Una din definitiile independentei a doua evenimente A si B este
aceea ca ( ) ( ) ( ) P A B P A P B =
In conditiile ipotezei nule ca cele doua siteme de clasificare ( efectul
si medicamentul 0 sunt independente , pentru prima celula a tabelului
rezulta:

( ) ( ) ( )
092 . 0
185
90
*
185
35
*
= =
= = R medicament P efect lipsa P R medicament efect lipsa P

Probabilitatea ca un subiect sa simta o ameliorare la administrarea
medicamentului R va fi
60 90
185 185
si asa mai departe.
Valorile asteptate se obtin apoi prin inmultirea probabilitatii
clasificarii intr-o celula data cu numarul total de subiecti deci , pentru prima
celula avem 0.092*185=17 .
Observam ca aceasta valoare se poate calcula mai usor deoarece
35 90
185 185
185
35 90
185
=

deci valoarea asteptata pentru o celula data se poate
obtine ca produsul intre totalurile marginale impartit la totalul general.
Se observa ca am intrat deja in algoritmul prezentat anterior pentru
tabelele 2x2.
















II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE PRIVIND DISTRIBUTIA BINOMIALA

209
2.14.4. Tabelele 2x2 corelate

In experimentul anterior, in fapt am comparat numarul de reactii
adverse la doua grupuri paralele de subiecti. In evaluarea rezultatelor si in
concluziile obtinute desigur ca un rol important l-a avut si intervariabilitatea
subiectilor, care este in general destul de mare. Nu am avut nici o informatie
privitoare la omogenitatea celor doua loturi.
Dupa cum s-a prezentat de mai multe ori in paginile anterioare, in
experimentul biologic se recurge ori de cate ori este posibil la experimentul
incrucisat, in care fiecare subiect este propriul sau martor.
O evaluare mult mai relevanta in ceea ce priveste efectele adverse
comparative pentru cele doua medicamente o obtinem daca vom compara
frecventa acestora la acelasi lot, sa zicem lotul 1 (de 12 subiecti) in perioada
a 1
a
a primit T si in perioada a 2
a
a primit R. In perioada a 2
a
numai 4 din
acestia au prezentat reactii adverse.
De fapt, la o examinare mai amanuntita rezultatele sunt conform
tabelelor urmatoare:



Deci un subiect a avut RA la amandoua medicamentele si 5 nu au
avut la nici unul din cele doua medicamente, comportamentul lor nu ne da
informatii despre diferentele intre medicamente, ci numai despre toxicitatea
substantei active. Informatia despre o eventuala diferenta este cuprinsa in
intregime in celelalte doua cifre (2 si 4).
R T
1 ra -
2 - ra
3 - -
4 - ra
5 ra -
6 - -
7 - ra
8 - -
9 - -
10 ra ra
11 - -
12 - ra
R
ra n-ra Total
ra 1 4 5
n-ra 2 5 7

T
Total 3 9 12
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE PRIVIND DISTRIBUTIA BINOMIALA

210
Daca medicamentele ar fi complet echivalente ar fi de asteptat ca
numarul celor care au avut reactii adverse la R si nu au avut la T sa fie
aproximativ egal cu numarul celor care au avut reactii adverse la T si nu au
avut la R. Deci cei 6 subiecti ar trebui sa fie impartiti in medie la fel.
Deci avem in fapt de evaluat tabelul:

ra la R si n-ra la T 2
ra la T si n-ra la R 4
Total 6
ra = reactii adverse
n-ra = non-reactii adeverse
Folosind direct distributia binomiala cu
1
2
p = si n = 6, obtinem:
( )
2
0
2
k k n k
n
P x C p q

=

si deoarece p = q =
1
2

( ) ( )
2
0 1 2 6
6
0
6 5 1 22
2 1 6 0, 34
2 2 64
k n
n n n n
P X C p C C C p
| |
= = + + = + + = =
|
\



Sau folosind aproximarea normala:
( ) ( )
0
1 1
2 3
0, 5
2 2
2 0, 41 0, 34
1 1, 5
6
4
x np
P X
npq
| |
| |
+ + |
| | |

|
= = = = =
| |
|
|
\ |

|
\
\
Deci acelasi rezultat.
Concluzia este ca nu putem respinge ipoteza echivalentei celor 2
medicamente in ceea ce priveste reactiile adverse. Daca am fi aplicat un test
de comparare tabelului aparent, de exemplu folosind aproximarea normala a
datelor din tabel, am fi obtinut:
5 3 1 1 3
3
12 12 24 24 24
0, 61
1 24 4 7 1 1
24 2 2 12 12
Z

= = = =
| |
+
|
\
,
Concluzia este aceiasi ca nu se poate respinge ipoteza ca cele doua
medicamente au avut proportii de substante active diferite doar din
intamplare. In fapt, in esenta numarul de date este prea mic pentru a putea
asuma, la un risc acceptabil, ca cele doua medicamente au toxicitate diferita.
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE PRIVIND DISTRIBUTIA BINOMIALA

211
2.14.5. Teste de omogenitate
In unele situatii practice, numarul subiectilor pentru fiecare nivel al
unuia din criterii este fixat dinainte. De exemplu numarul de barbati si
numarul de femei inrolati in studiu sau numarul de subiecti pe diferite
categorii de varste. Daca vom testa nivelele efectului unui medicament
clasificarea dupa acest criteriu va fi o variabila aleatoare.
Problema pe care ne-o punem in acest caz este aceea a omogenitatii:
sunt esantioanele omogene in raport cu un criteriu dat?
Ipoteza nula in acest caz este aceea ca toate esantioanele provin
dintr-o populatie omogena si deci frecventele in interiorul celor doua grupe
nu difera semnificativ.

Exemplu
Consideram o clasificare a fumatorilor in ceea ce priveste numarul
de tigari fumate si varsta. Fixam in prealabil numarul de subiecti din grupele
de varsta 20-30, 30-40, 40-50, peste 50 ani si stabilim nivelele de fumatori
0-10, 10-20, peste 20 tigari/zi.
Presupunem ca am obtinut tabelul de mai jos:

Nr. tigari Varsta (ani)
20-30 30-40 40-50 > 50 total
0-10 20 30 40 50 140
10-20 30 40 30 30 130
> 20 50 50 50 20 170
total 100 120 120 100 440

Deci vom considera ipotezele:
H
0
: cele 4 categorii de varsta sunt omogene in ceea ce priveste consumul de
tigari.
H
A
: cele 4 categorii de varsta nu sunt omogene in ceea ce priveste consumul
de tigari.

Calculam ca mai sus valorile asteptate: valoarea asteptata va fi
produsul totalurilor marginale, impartit la numarul total de subiecti.

Exemplu: in prima celula
100 140
31, 8
440
etc

= .
II. STATISTIC MATEMATIC I BIOSTATISTIC
TESTE PRIVIND DISTRIBUTIA BINOMIALA

212
Intr-adevar, daca populatiile sunt omogene sau echivalente si toate
esantioanele provin din aceeasi populatie in ceea ce priveste consumul de
tigari, cea mai buna estimare a proportiei in totalul populatiei, a celor ce
consuma mai putin de 10 tigari/zi este 100/440 acelasi pentru celelalte
categorii de fumatori. Ne vom astepta in acest caz sa gasim de exemplu
(100/440) 140 fumatori 0-10 tigari in categoria de varsta 20-30 ani.



III. TABELE STATISTICE

213
Tabele pentru z



z 0 1 2 3 4 5 6 7 8 9
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0754
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2258 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2518 0,2549
0,7 0,2580 0,2612 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2996 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4639
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
III. TABELE STATISTICE

214
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

III. TABELE STATISTICE

215
Tabele pentru t


55 , 0
t
60 , 0
t
70 , 0
t
75 , 0
t
80 , 0
t
90 , 0
t
95 , 0
t
975 , 0
t
99 , 0
t
995 , 0
t
1 0,158 0,325 0,727 1,000 1,376 3,08 6,31 12,71 31,82 63,66
2 0,142 0,289 0,617 0,816 1,061 1,89 2,92 4,30 6,96 9,92
3 0,137 0,277 0,584 0,765 0,978 1,64 2,35 3,18 4,54 5,84
4 0,134 0,271 0,569 0,741 0,941 1,53 2,13 2,78 3,75 4,60
5 0,132 0,267 0,559 0,727 0,920 1,48 2,02 2,57 3,36 4,03
6 0,131 0,265 0,553 0,718 0,906 1,44 1,94 2,45 3,14 3,71
7 0,130 0,263 0,549 0,711 0,896 1,42 1,90 2,36 3,00 3,50
8 0,130 0,262 0,546 0,706 0,889 1,40 1,86 2,31 2,90 3,36
9 0,129 0,261 0,543 0,703 0,883 1,38 1,83 2,26 2,82 3,25
10 0,129 0,260 0,542 0,700 0,879 1,37 1,81 2,23 2,76 3,17
11 0,129 0,260 0,540 0,697 0,876 1,36 1,80 2,20 2,72 3,11
12 0,128 0,259 0,539 0,695 0,873 1,36 1,78 2,18 2,68 3,06
13 0,128 0,259 0,538 0,694 0,870 1,35 1,77 2,16 2,65 3,01
14 0,128 0,258 0,537 0,692 0,868 1,34 1,76 2,14 2,62 2,98
15 0,128 0,258 0,536 0,691 0,866 1,34 1,75 2,13 2,60 2,95
16 0,128 0,258 0,535 0,690 0,865 1,34 1,75 2,12 2,58 2,92
17 0,128 0,257 0,534 0,689 0,863 1,33 1,74 2,11 2,57 2,90
18 0,127 0,257 0,534 0,688 0,862 1,33 1,73 2,10 2,55 2,88
19 0,127 0,257 0,533 0,688 0,861 1,33 1,73 2,09 2,54 2,86
20 0,127 0,257 0,533 0,687 0,860 1,32 1,72 2,09 2,53 2,84
21 0,127 0,257 0,532 0,686 0,859 1,32 1,72 2,08 2,52 2,83
22 0,127 0,256 0,532 0,686 0,858 1,32 1,72 2,07 2,51 2,82
23 0,127 0,256 0,532 0,685 0,858 1,32 1,71 2,07 2,50 2,81
24 0,127 0,256 0,531 0,685 0,857 1,32 1,71 2,06 2,49 2,80
25 0,127 0,256 0,531 0,684 0,856 1,32 1,71 2,06 2,48 2,79
26 0,127 0,256 0,531 0,684 0,856 1,32 1,71 2,06 2,48 2,78
27 0,127 0,256 0,531 0,684 0,855 1,31 1,70 2,05 2,47 2,77
28 0,127 0,256 0,530 0,683 0,855 1,31 1,70 2,05 2,47 2,76
29 0,127 0,256 0,530 0,683 0,854 1,31 1,70 2,04 2,46 2,76
30 0,127 0,256 0,530 0,683 0,854 1,31 1,70 2,04 2,46 2,75
40 0,126 0,255 0,529 0,681 0,851 1,30 1,68 2,02 2,42 2,70
60 0,126 0,254 0,527 0,679 0,848 1,30 1,67 2,00 2,39 2,66
120 0,126 0,254 0,526 0,677 0,845 1,29 1,66 1,98 2,36 2,62
0,126 0,253 0,524 0,674 0,842 1,28 1,645 1,96 2,33 2,58
III. TABELE STATISTICE

216


III. TABELE STATISTICE

217
Tabele pentru
95 , 0
F


2
1


1 2 3 4 5 6 7 8 9 10
1 161 200 216 225 230 234 237 239 241 242
2 18,5 19,0 19,2 19,3 19,3 19,4 19,4 19,4 19,4 19,4
3 10,1 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20
28 4,20 3,43 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99
120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91
3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83



III. TABELE STATISTICE

218





2
1


12 15 20 24 30 40 60 120
1 244 246 248 249 250 251 252 253 254
2 19,4 19,4 19,5 19,5 19,5 19,5 19,5 19,5 19,5
3 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53
4 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63
5 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,37
6 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67
7 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
8 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93
9 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71
10 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54
11 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40
12 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30
13 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21
14 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13
15 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07
16 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01
17 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96
18 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92
19 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88
20 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84
21 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81
22 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78
23 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76
24 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73
25 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,71
26 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,75 1,69
27 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,73 1,67
28 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,71 1,65
29 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,70 1,64
30 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62
40 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51
60 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39
120 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25
1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00


III. TABELE STATISTICE

219
Tabele
2



Aria Numar grade
de libertate 0,025 0,950 0,975 0,990
1 0 3,842 5,024 6,635
2 0,0501 5,992 7,378 9,210
3 0,216 7,815 9,348 11,345
4 0,484 9,488 11,143 13,277
5 0,831 11,071 12,833 15,086
6 1,237 12,592 14,449 16,812
7 1,690 14,067 16,013 18,475
8 2,180 15,507 17,535 20,090
9 2,700 16,919 19,023 21,666
10 3.247 18,307 20,483 23,209
11 3,816 19,675 21,920 24,725
12 4,404 21,026 23,337 26,217
13 5,009 22,362 24,736 27,688
14 5,629 23,685 26,119 29,141
15 6,262 24,996 27,488 30,578
16 6,908 26,296 28,845 32,000
17 7,564 27,587 30,191 33,409
18 8,231 28,869 31,526 34,805
19 8,907 30,144 32,852 36,191
20 9,591 31,410 34,170 37,566
21 10,283 32,671 35,479 38,932
22 10,982 33,924 36,781 40,289
23 11,689 35,173 38,076 41,638
24 12,401 36,415 39,364 42,980
25 13,120 37,653 40,647 44,314
26 13,844 38,885 41,923 45,642
27 14,573 40,113 43,195 46,963
28 15,308 41,337 44,461 48,278
29 16,047 42,557 45,722 49,588
30 16,791 43,773 46,979 50,892

III. TABELE STATISTICE

220


IV. BIBLIOGRAFIE

217

1. W.J.Westlake: Use of confidence intervals in analysis of
comparative biovalability trials, J. Pharm. Sci. , 61 (8), 1340 1, 1972.
2. F.Wilcoxon: Individual comparisons by ranking methods, Biometrics
Bul.,180-83,1947
3. W.H.Kruskal, W.Allen Wallis: Use of ranks in one-criterion analysis
of variance, J. Am. Stat. Assoc.,47,583-621,1952
4. Hollander, Wolfe DA; Non parametric statistical methods, J.Wiley,
New York, 1973
5. Hollander, Wolfe DA; Non parametric statistical methods, J.Wiley,
New York, 1973
6. Chow, S.C. & Liu, J.P. (1992) Design and analysis of bioavailability
and bioequivalence studies. New York, Marcel Dekker (cap. 3) [1].
7. Saporta, C. (1990) Probabilit, Analyse des donnes et statistique.
Paris, Ed. Technip (cap. 15) [2].
8. Vaduva, I. (1970) Analiz dispersional. Bucureti, Ed. Tehnic
(cap. 4) [3].
9. K.A.Brownlee, Statistical Theory and metodology in Science and
Engineering, J. Wiley, New York, 1960
10. D. Ceausescu, Tratarea statstica a datelor chimico analitice, Ed.
Tehnica, Bucuresti, 1973
11. M. Tiron, teoria erorilor de masurare si metoda celor mai mici
patrate, Ed. Tehnica, Bucuresti, 1972
12. F. Gremy, D. Salmon, Bases statistiques pur la recherchemedicale et
biologique, Dunod, Paris, 1969
13. M. R. Spiegel, Probability and statistique, McGraw Hill, New
York, 1980
14. D. Ceausescu, Utilizarea statisticii matematice in chimia analitica,
Ed. Tehnica, Bucuresti, 1980
15. M. Iosifescu, T. Postelnicu, Curs de biomatematica, Univ.
Ecologica, Bucuresti, 1990
16. M. Iosifescu, Gh. Mihoc, R. Teodorescu, Teoria probabilitatilor si
statistica matematica, Ed. Tehnica, Bucuresti, 1966
17. S. Bolton, Statistics, in Remington: The Science and Practice of
Pharmacy, 9 th ed., Mark publ., Easton, Pennsylvania, 1995
18. United States Pharmacopoeia, ed. XXIII, cap. Statistical Procedures
for Bioequivalence Studies Using a Standard Two treatment Crossover
design, 1995
19. P. G. Welling, F.L.S. tse, S. Dighe, Pharmaceutical Bioequivalence,
cap. 3, C.M. Metzler: Statistical criteria, M. Dekker, New York, 1991
IV. BIBLIOGRAFIE

218
20. V.W.Steinijans, D. Hauschke, Update on the statistical analysis of
bioequivalence studies, Int. J.Clin.Pharmacol. Ther. Toxicol,. 28(3), 105
110, 1990
21. M. Rowland (ed), Variability and Drug Therapy: Description,
Estimation and Control, Raven Press, New York, 1985
22. S.C. Chow, J.P.Liu, Design and Analysis of Biovailability and
Bioequivalence Studies, M. Dekker, London, New York, 1992
23. A. Rescigno. A. Marzo, U. Thyroff Friesinger, A new measure of
bioequivalence, 1 st European Congress of Pharmacology, Milano, june
1995, poster nr. 19
24. A Marzo, Open questions in bioequivalence, 1 st European
Congress of Pharmacology, Milano, june 1995, poster nr. 18
25. E. Beyssac, C. Lauro. Marty, H-l Chabard, J-M Aiache, Study of
bioequivalence metrics, 6-th European Biopharmaceutics and
Pharmacokinetics, Atena, aprilie 1997
26. C. Mircioiu, V. Voicu: Degenerated, solutions of pharmacokinetics
models for some lipophilic drugs, Canad. J. Physiol, Pharmacol. 72
(suppl.1), 305, 1994
27. C. Mircioiu, V. Voicu, M. Jiquidi: Mathematical algoritms and
computer programs as source of variability in population drugs, 1-st
Congress of the European Association for Clinical Pharmacology and
Therapeutics, September, 27-30, 1995, Paris
28. C. Mircioiu: Mathematical variability in pharmacokinetics, 6-th
Europ. Congress of Biopharmaceutics and Pharmacokinetics, Atena, 22-24
April 1996, Europ. J. Drug Metab. Pharmacokin. (special issue), abstract
371