Sunteți pe pagina 1din 30

CURSUL II

STATISTICA INTERVALE DE INCREDERE VERIFICAREA IPOTEZELOR

II. STATISTIC MATEMATIC I BIOSTATISTIC Statistica matematic este principala aplicaie a teoriei probabilitilor. Procedeele statistice constau, n esen, n elaborarea unor concluzii plauzibile privitoare la colectiviti mari de fenomene, pe baza cunoaterii unui numr restrns dintre acestea i extrapolrii rezultatelor. Legile care stau la baza statisticii i care permit aceste generalizri sunt teorema limit central i legea numerelor mari. ntr!o exprimare intuitiv, avem rezultatul c, dac o variabil aleatoare este suma unui numr mare de variabile aleatoare independente, fiecare variabil aleatoare avnd o pondere mic n sum, atunci funcia de repartiie a variabilei aleatoare este foarte apropiat de o funcie de repartiie normal. "xprimat mai riguros i mai general, avem urmtoarea teorem# 2.1. Teorema l m !" #e$!ral" %A.M.Lea&'$o() $ie & , % ,..., n variabile aleatoare independente. ' % ' &, n = M ( k a k ) cnd k = $ie M ( k ) = ak , D ( k ) = k i k
% % ' ' (otm ( n ) = & i , ( n ) = & i n n

)ac lim n

& + % + ... + n ( a& + a% + ... + an ) ( n)


tinde, cnd

( n ) = * , atunci funcia de repartiie a variabilei ( n)

n , ctre funcia

( x ) a lui Laplace.

& ( x ) = %

t% %

dt

+eorema limit central este teorema fundamental a teoriei erorilor. Laplace, ,auss i ali matematicieni, studiind repartiia erorilor, au a-uns la concluzia c funcia de repartiie normal poate fi luat drept model teoretic pentru cercetarea probabilistic a aproape tuturor fenomenelor naturii. 2.2. Teorema l' Ce*+,e( )ac & , % ,..., n sunt variabile aleatoare .discrete sau continue/ independente ale cror dispersii sunt mai mici dect o constant 0, atunci oricare ar fi numrul pozitiv 1, probabilitatea inegalitii & + % + ... + n M ( & ) + M ( % ) + ... + M ( n ) n n

tinde ctre &, atunci cnd numrul variabilelor aleatoare tinde ctre infinit. Demonstraie: + % + ... + n S considerm variabila aleatoare = & . 2vnd n n vedere liniaritatea operatorului de calcul a mediei avem M ( & ) + M ( % ) + ... + M ( n ) . M = n 2plicnd inegalitatea lui 0ebev variabilei aleatoare se obine#

( )

+ % + ... + n D & & + % + ... + n M ( & ) + M ( % ) + ... + M ( n ) n P & % n n 3ai departe, din proprietile operatorului ) + + ... + n D( & ) + D( % ) + ... + D( n ) C + C + ... + C nC C D & % = % = = n n% n% n n )eci + % + ... + n M ( & ) + M ( % ) + ... + M ( n ) C P & & % n n n +recnd la limita pentru n obinem + % + ... + n M ( & ) + M ( % ) + ... + M ( n ) lim n P & & n n i cum probabilitatea nu poate depi &, + % + ... + n M ( & ) + M ( % ) + ... + M ( n ) lim n P & = & n n 0el mai frecvent, n practic, variabilele aleatoare i au aceiai medie i concluzia teoremei devine

& + % + . .+ n limn P = & n


n esen, teorema lui 0ebev stabilete c, dei variabilele aleatoare independente pot lua valori ndeprtate fa de mediile lor, media aritmetic a unui numr suficient de mare de astfel de variabile aleatoare ia cel mai probabil valori apropiate de un numr constant

M ( & ) + M ( % ) + ... + M ( n ) .sau atunci cnd mediile variabilelor sunt n egale ntre ele/. 0a urmare, ntre comportarea fiecrei variabile aleatoare i comportarea mediilor lor exist diferen esenial. Putem spune foarte precis ce valoare va lua media aritmetic a acestor variabile aleatoare. "xplicaia acestui fapt const n aceea c abaterile diverselor variabile aleatoare sunt de semne diferite i, ca urmare, se compenseaz ntre ele. 2.-. TEORIA SELEC.IEI 2.-.1. Po&'la/ , 0ele#/ . I$1ere$/a 0!a! 0! #" n practic avem adesea nevoie s facem -udeci asupra unor mari colecii de rezultate posibile experimental ori a altor cantiti, dar nu putem sau este extrem de scump, s examinm toate aceste date. n astfel de cazuri, n loc s examinm ntregul set de date pe care l numim n cele ce urmeaz populaie, tragem concluziile dup examinarea a o parte din ele, alese la ntmplare, parte pe care o numim selecie. Procedeul de obinere a probelor este numit tot selecie, iar procedeul de extrapolare a concluziilor la ntreaga populaie este cunoscut ca inferena statistic. 4om considera c o caracteristic dat a populaiei este o variabil , K , P ) n care elementele lui aleatoare pe un cmp de probabilitate ( sunt c5iar elementele populaiei, iar P este o probabilitate cunoscut sau nu. "numerarea valorilor observate ale caracteristicii urmrite i a frecvenelor lor relative definete repartiia statistic a seleciei. +eorema lui Leapunov, numit i teorema fundamental a statisticii matematice, care -ustific utilizarea metodei seleciei stabilete c funcia de repartiie statistic a caracteristicilor seleciilor tinde la funcia teoretic de repartiie a caracteristicii studiate cnd volmul seleciei tinde la 6. 2.3.1.1. Exemplu Putem dori s tragem concluzii despre evoluia rezistentei unei tulpini de germeni patologeni la un medicament dat i, n acest scop, examinm rezultatele antibiogramelor fcute ntr!un eantion de spitale ntr! o perioad recent .luniile de iarn/, comparat cu aceeai perioad a anului precedent. )ei rezultatele obinute se refer la spitale i mai precis numai la o parte din ele, concluziile le extindem la scara ntregii populaii. 2.3.1.2. Exemplu

7ezultatele privind absorbia unui medicament dup administrarea oral prin determinarea nivelurilor din plasma ale medicamentului la un lot de voluntari sntoi le considerm ca rezultate probabile pentru ntreaga populaie ce include i poteniali pacieni. Populaia poate fi infinit sau finit, n ultimul caz, numrul indivizilor populaiei 8 (! se mai numete i volumul populaiei. n mod similar, numrul de indivizi sau valori din cadrul unei probe este denumit volumul probei sau volumul eantionului. 4alabilitatea concluziilor despre populaie depinde de 9reprezentativitatea: probei. Pentru populaii finite aceasta nseamn c fiecare membru al populaiei are aceeai ans s fie selectat, cnd spunem c selecia este o selecie la ntmplare sau 9selecie aleatoare:. )esigur c selecia unor voluntari sntoi pentru determinarea parametrilor farmacocinetici ai unui medicament nu este din acest punct de vedere o selecie reprezentativ. n cazurile n care avem motive s credem c patologia creia se adreseaz medicamentul nu afecteaz funciile metabolice i de excreie, aceast aproximare este acceptat pentru motivul c o selecie corect ar implica loturi mult mai mari cu c5eltuieli i timp de lucru mult crescute. n practic, n studiile de bioec5ivalen, pentru reducerea volumului loturilor pe care se fac testrile, se administreaz amndou medicamentele la toi membri lotului, n dou perioade diferite. $iecare component al lotului primete unul din medicamente n prima perioad i cellalt n a doua perioad. )eoarece perioada de administrare poate influena i ea rezultatul experimentului, alegerea indivizilor care vor primi n prima perioad primul medicament se face n mod aleator. n cazul cnd sunt mai multe perioade, de exemplu ;!;4, i mai multe medicamente 2, <, 0, ) se alctuiete un tabel de felul urmator
+abelul nr. &# ; 2 < 0 ) ;; < 0 ) 2 ;;; ) 2 < 0 ;4 0 ) 2 <

aa zisul ptrat 9latin:, unde observm c fiecare liter apare o singur dat n fiecare linie i n fiecare coloan. Se numete ptrat latin deoarece, cum se va arata mai departe, n cazul n care mai intervine i o alt variabil, de exemplu doza din fiecare medicament, se folosesc i litere grecesti, alctuindu!se ptrate 9greco!latine:.

)easemenea, studiile de bioec5ivalen se fac tot pe voluntari sntoi, pornind de la ipoteza c modificrile de biodisponibilitate asociate strilor patologice sunt aceleai pentru cele dou medicamente testate, ceea ce, evident, este numai n parte adevrat. n toate experimentele biologice, planificarea experimentului trebuie fcut n aa fel nct diferenele n tratament s nu coincid cu diferene n vrst, sex, sau ali parametri. )ac, de exemplu, femeile din lot primesc primul medicament i brbaii al doilea, se spune ca diferenele de sex sunt 9confundate: cu diferenele de tratament. n acest caz nu se poate spune dac diferenele obinute se datoreaz tratamentului sau diferenei de sex. 2.3.1.3. Parametrii de selecie ai unei variabile aleatoare : )ac printr!un procedeu oarecare cuantificm rspunsul culturilor microbiene la antibioticele din exemplul &, sau dac lum n consideraie concentraiile de medicament n snge, din al doilea exemplu, i probabilitile ca valorile s aparin unor intervale diferite, obinem o variabil aleatoare = asociat cu rezultatul experimentului corespunztor. Parametrii acestei variabile aletoare sunt denumii, prin abuz de limba-, 9parametri ai populaiei:. )ac n exemplul al doilea =i este concentraia de medicament n sngele bolnavului i, la o or de la administrare, la primul voluntar putem obine o valoare x&, pentru al doilea voluntar o valoare x %, etc. n acest fel gsim valorile x& , x % ,..., x n ale varibilelor aleatoare independente X & , X % ,..., X n .
X & + X % + ... + X n n ( ) , )ac distribuia lui = este normal ! , aceiai pentru fiecare i, datorit linearitii operatorului 3 care definete media, obinem

2.-.2. Me2 a 2e 0ele#/ e este o variabil aleatoare# X =

M X = X = adic valoarea pentru media mediei de selecie este media populaiei. )ac la datele experimentale se adaug o constant, xi = xi + a ,

( )

(X media de selecie crete cu aceeai constant# ! =


n &

= X +a n Similar, dac fiecare valoare se nmulete cu o constanta " i = kX i ,

+ a)

media de selecie

kX " se nmulete cu aceeai contant# " =


n &

= kX

2.-.-. D 0&er0 a 2e 0ele#/ e 0a o msur a abaterii datelor fa de media de selecie, se introduce


% noiunea de dispersie de selecie # X =

n aplicaiile practice, pentru reducerea numrului de calcule, formula se aduce la o alt form i anume#
% sX =

& n xi X & n &

& n xi X n & &

& n &

( x
n &

% & n % n x %X x +nX = & i & i n & %

% i

%n X + n X

)=

% & n % & n % xi n X = & xi n & n & &


% )ac $ i = kxi + a s $% = k % s x . ntr!adevr
% s" =

( x )
n & i

& n $i " & n &

& n kxi + a k X a & n &

% = k % sx

s x se numete abaterea standard de selecie sau deviaie standard, cnd nu

este pericol de confutie privind variabila aleatoare la care se refer folosindu!se i notaia sd . Se mai utilizeaz n practic i noiunile# )ispersia:populaiei: >
& n xi X & n &

i respectiv

)eviaia standard a 9populaiei:, precum i 9abaterea standard a mediei: .prescurtarea S"3 8 standard error of mean/ definit prin raportul #%M =
sx n

precum i coeficientul de variatie v =

sx ?&** . X definete prin formula

2.-.3. Co(ar a$!a 2e 0ele#/ e 0ovarianta de selecie


s X& & n = xi X ' i & & n &

)(

se

Se observ c aceasta se mai poate scrie i sub alt form, mai util n sensul simplificrilor de calcul n anumite aplicaii.

( x ' X ' & x + n X & ) = & ( x ' n X & n X & + n X & ) = = n &
s X& = & n &
n n n & i i & i & i n & i i

& n &

x ' & nx ' & i & i x ' n X & = i i & i i & n & n
n

2.-.4. Coe1 # e$!'l 2e #orela/ e 2e 0ele#/ e 0oeficientul de corelaie de selecie se definete prin formula n & xi X 'i & & s X& n & ( x, ' ) = = = % % s X s& n n & & xi X n & & 'i & n & &

)(

( x X ) ( ' & ) ( x X ) ( ' & )


n & i i n % n & i & i

2.-.5. Pro&r e!"/ ale #ara#!er 0! # lor 2e 0ele#/ e 0onsiderm n continuare o selecie de volum n dintr!o populaie cu media si dispersia % 2.-.5.1. Pro&o6 / e 3edia mediei de selecie este egal cu media populaiei. M X = Demonstraie: M ( xi ) M ( xi ) n M X = = = = n n n 2.-.5.2. Pro&o6 / e 3edia dispersiei de selecie este egal cu dispersia populaiei % M ( sX ) = %

( )

( )

Demonstraie:

% & n & % M ( sX x X M ) =M i = & n & n & % % & n & M & xi% %n X + n X = M n & n & % n x & n % & i = M & xi n & n )ar, mai departe

( x nX ) =
n & % i %

& xi% % X & xi + & x


n n n

)=

n ( n &) M ( xi ) M ( x ( ) = % = n ( % + % ) + n ( n &) % = n % + n % % = & M ( xi% ) + %


n

( x ) = n( + ) M ( x ) = M x + %
M
n & % i % % n % n & i & % i

n & i (

xi x ( =

nlocuind n( +
% %

expresia
%

lui

% M ( sX )=

% M ( sX )

obinem

n &

=%

2.-.5.-. Pro&o6 / e 4ariabila aleatoare


" = x

tinde , cnd

n ctre o variabil

(*,&)

2ceasta este o consecin a teoremei limit central i este aplicabil att variabilelor continue ct i celor discrete. ntr!adevr aplicnd teorema lui Leapunov pentru variabilele aleatoare x, , x% ,..., xn obinem c# x& + x% + ... + xn ( & + % + ... + n ) nX n X = = % + % + ... + % n % n tinde ctre o variabil aleatoare (*,&) . 2.-.5.3. Pro&o6 / e

)ac variabila aleatoare = este normal distribuit, atunci variabila % sX aleatoare ) = ( n &) % este repartizat % ( n &) Demonstraie:
s% ) = ( n &) X% =

(x
n & n

) = [( x
n &

) X

)]

(x =
n &

) %& ( xi ) X + & X
% n

(x =
n & n

) % n X n X + n X
%

)(

) (

=
%

)ar variabila aleatoare

% ( ) x n X X n x i i & = = & % n xi

este repartizat

(*,&) deoarece

xi D ( x i ) x M ( xi ) = & , iar M i = i D = %

( X )

este

repatizat tot (*,&) n conformitate cu teorema limit central. )eci, 4 este o sum de n!& ptrate de variabile de tip (*,&) .

2.-.5.4. Pro&o6 / e )ac x& , x% ,..., xn este o selecie dintr!o populaie normal distribuit, atunci variabila aleatoare
* = X s este repartizat Student cu n grade de libertate. n

Demonstraie:
X X n = = s s n X n
n & i

(x

( n &) %

" ) n &

unde

" =

este repartizat

(*,&) , iar

n repartizat ( n &) .

(x X ) ) =
n & i

este

)eci, + este repartizat Student cu n!& grade de libertate. 2.-.5.5. Pro&o6 / e )ate fiind dou selecii aleatoare independente x&& , x&% ,..., x&n si x %& , x %% ,..., x n% din populaii normal distribuite ( & , & ) i ( % , % ) ,
&

variabila

aleatoare

+ ( n& &, n % &) Demonstraie: 2vem ntr!adevar

#&% % + = &% #% %%

este

repartizat

$is5er

Snedecor

#&% &% += % = #% %%

(x
n& & n% &

(x

( n& &) &%

&i

X&

( n% &) %%

%i X %

iar numratorul i numitorul sunt repartizate,

conform propozitiei %.'.@.A., respectiv

% ( n& &) % ( n% &) i . n& & n% &

2.3. E0! ma/ +eoria estimaiei urmrete evaluarea parametrilor unei repartiii n general cunoscute. 4alorile numerice obinute se numesc estimaii sau estimatori. Se obin estimaii punctuale n cazul n care se folosesc datele seleciei pentru a obine valorile parametrilor i estimaii ale intervalelor de ncredere n cazul n care se determin un interval n care se afl, cu o anumit probabilitate valoarea estimat. C . D estimaie este Bn estimator al parametrului se va nota cu C = , adic media estimaiei este egal c5iar cu nedeplasat dac M

( )

valoarea teoretic a parametrului estimat.

0onform proprietii %.'.@.&, M X = adic media de selecie este un estimator nedeplasat al mediei, iar conform proprietii %.'.@.%., M ( s % ) = % adic dispersia de selecie este un estimator nedeplasat al dispersiei. Problema estimrii intervalelor se reduce la gsirea unui interval de ncredere ( - ,, ) cu un coeficient de ncredere & astfel nct

( )

P( - , ) = &

"ste de dorit ca & s fie ct mai mare .de obicei ntre *,E i *,EE/ iar intervalul ( - ,, ) s fie ct mai mic. intervalelor se utilizeaz caracteristicile numerice cuantile. cuantile de ordin valoarea x a variabilei aleatoare x

+ ( x ) = P( x x ) =

este cuprins n stabilirea Se numesc pentru care

adic valoarea variabilei aleatoare care are la stnga ei aria

sub curba densitii de probabilitate. "vident#

P x x = % %

P x x = & & % %

P x x x& = & = & % % % %

Pentru a estima un interval se alege & , se citesc din tabelele cuantilele, de exemplu
x
& %

x
%

i se precizeaz intervalul. n prealabil,

n funcie de mrimea pentru care se caut intervalul se precizeaz cu care din repartiiile cunoscute trebuie lucrat.

2.3.1. E0! marea $!er(alelor 2e 7$#re2ere &e$!r' me2 2.3.1.1. 0azul cnd se cunoaste dispersia. Se consider o populaie repartizat normal dispersia se poate folosi faptul c noteaz cu $ cuantila de ordinul
$= X

( , ) . )ac se cunoate
%

este repartizat

(*,&) . Se

pentru repartiia

(*,&) . "vident

P $ $ $ = + $ + $ = & = & & & % % % % % %


2adar intervalul coeficientul de ncredere & . )in anumite puncte de vedere este recomandabil s se utilizeze acele intervale care las att la dreapta ct i la stnga lor aceeai arie, egal cu . )eoarece repartiia
$ = $
% &

$ , $ & % %

este un interval de estimare cu

(*,&) este simetric fa de axa DF avem relaia

)in relaiile

& %

x $ & % n $ ? x $ ? & & n n % % x $ ? x+ $ ? & & n n % % rezult X $ X +$ & & n n % % 2adar intervalul cutat este ( - ,, ) = ,X +$ X $ $ $
& %

& %

&

&

3rimea % = $&
%

poart numele de eroare i servete la calculul



%

numrului de experiene

alege un coeficient & 3etoda descris mai poate fi aplicat i n cazul n care x nu este (*,&) indiferent de repartizat normal deoarece z este repartizat x , x ,..., x repartiia variabilelor & % n .teorema limit central/. 2.3.1.2. 0azul cnd dispersia este necunoscut )ac nu se cunoaste dispersia n estimarea intervalelor se utilizeaz dispersia de selecie care este un estimator nedeplasat al dispersiei deoarece %(s % ) = % Se consider x& , x % ,..., x n o selecie dintr!o populaie de tipul ( , % ) . 0onform celor artate anterior mrimea
* ( n &) i, ca urmare * = X s este repartizat n

$ & % n = %

atunci cnd este impus eroarea i se

)eoarece repartitia Student este simetric fa de origine t = i nlocuindu!l pe + n relaia anterioar, se obine n &,& n &,&
% %

P t * t = + t + t = & = & n ,& n &,& n &,& n ,& % % % % % %

X Pt * t = P t t n &,& n &,& s n &, % n &, % % % n s s X +t i X tn &,& n &,& n n % % 0a urmare intervalul cutat este
s s , X +t n & , & n n % % s n acest caz eroarea este % = t n &,& n %

= &

(- ,, ) = X

n &,&

)ac numrul de experiene este


t
n &,&

n '*

, se poate folosi aproximaia

=$

&

2.3.2.E0! marea $!er(al'l' 2e 7$#re2ere & &e$!r' 2 1ere$/a a 2o'" me2 Se consider dou selecii din populaii normal repartizate & , &% i

% %

).

% 0azul dispersiilor &% , % cunoscute. 0onsiderm o selecie aleatoare x&& , x&% ,..., x&n& din populaia % i o selecie x %& , x %% ,..., x % n dintr!o populaie % , % .

2.3.2.1.

( , )
& % &

"stimatorii nedeplasai ai mediilor & i % sunt# X &


X%

n&

&

x&i

n&

si

n%

&

x%i

n%

0onsidernd variabila aleatoare X & X % , ea este normal repartizat iar

estimaia i dispersia ei vor fi M ( X & X % ) = M ( X & ) M ( X % ) = & % i


D X& X % = D X& + D X % =

( ) ( )

% &% % + unde am inut cont c x&i i x %i n& n%

sunt independente. 3ai departe, variabila aleatoare X X % ( & % ) X X % ( & % ) $= & = & % este repartizat (.*,&/. &% % D X& X % + n& n%

)eoarece,

P $ $ $ = & & % %
)

$ = $
%

&

rezulta

% &% % &% %% + X X + $ + & % & % & & n& n% n& n% % % 2adar, intervalul de estimaie pentru diferena mediilor este % % &% % &% % ( &, % ) = X & X % $& + , X& X % + $ + & n n n n & % & % % %

(X

& X% $

n acest caz, eroarea este % = $

&

% &% % + . n& n%

2.3.2.2. )ispersii necunoscute dar presupuse egale n cazul n care nu cunoatem dispersiile dar tim c sunt egale &% = %% = % utilizm dispersia ponderat de selecie

n& + n% % n& + n% % % ca un estimator nedeplasat pentru . 2vem ntr!adevr, ( n& &) M ( s&% ) + ( n% &) M ( s%% ) ( n& &) &% + ( n% &) %% % % M ( sp ) = = = n& + n% % n& + n% % n continuare vom arta c mrimea repartizat * ( n& + n% % )
* =

% p

% n& &) s&% + ( n% &) s% ( x&i X& ) ( = = & n&

+ & % x%i X %
n

(X

&

X % ( & % ) & & sp + n& n%

este

(X

&

Se observ c * =

X % ( & % ) X& X % sp
&X%

X
sp & & + = n& n%

& & + n& n%

este raportul ntre o variabila

aleatoare repartizat (.*,&/ i deoarece


sp

& X %

& & + n& n%


n

s s% & & p + = p = = n& n% % x&i X & x X% + n% %i & n& + n% %


% %

(x
n& &

&i

X & + & % x%i X %


%

( n& + n% %) %
& & + n& n%
%

n&

&

variabila )ar

sp

este de tipul
%

& X %

% ( n& + n % %) n& + n% %

&

n&

repartizat % ( n% &) , deci + este repartizat * ( n& + n% % ) i

x&i X &

este repartizat ( n& &) iar

n%

&

x% i X %

este

P t * t = & = & n& + n% %, n&+ n% %,& % % % %


)eoarece repartiia Student este simetric c
t
n& +n% % ,

= t

n& +n% % ,&

rezult

&& && X& X% t sp + & % X& X% t sp + n&+ n% %,& n n n&+ n% %,& n n % &% % &%
)eci,

( & , % ) = X X% t & n +n

&

% ,&

sp

& & & & + , X& X % + t + sp n + n % % ,& n& n% n n & % %&

cu eroarea % = t n +n
&

% % ,&

sp

& & + . n& n %

2.3.-. E0! marea $!er(alelor 2e 7$#re2ere &e$!r' 2 0&er0 e 0onsiderm o selecie de volum n dintr!o populaie normal ( , % ) . ( n &) s % este 0onform celor artate anterior variabila aleatoare v = % repartizat % ( n &) i ca urmare

% % P v = & = & n ,& n &,& % % % %


)eci,

( n &) % % % n ,& n &,& n & , & n ,& % %


% %
si

( n &) s % ( n &) s
% % %

%
.

2.3.3. E0! marea $!er(al'l' 2e 7$#re2ere &e$!r' ra&or!'l a 2o'" 2 0&er0 Se consider selecia aleatoare x&& , x&% ,..., x&n& dintr!o populaie ( , , &% ) i o selecie x%& , x%% ,..., x % n dintr!o populaie % , %% .
%

s&% &% 0onform cu cele artate anterior, raportul + = % este repartizat s% %%

+ ( n& &, n % &) i deci

P f + f = & = & n& &,n% &, n& &,n% &,& % % % %

7ezult c

s s f f s s
% % % n& &,n% &, & % % % % &

% % % n& &,n% &, & %

, iar intervalul de estimaie pentru

raportul dispersiilor este# % % s% s% ( - , , ) = f , s % n& &, n% &, s % f n& &, n% &,& & % % &

2.3.4. A&l #a/ e8 U! l 6area $!er(alelor 2e 7$#re2ere 7$ 0!'2 le 2e #om&arare a * o2 0&o$ * l !"/ me2 #ame$!elor1 La introducerea n terapie de ctre un productor a unui medicament ce reprezint o reproducere a altui medicament de-a n uz, se pune problema comparrii biodisponibilitii acestora. n practic se cere ca raportul ariilor de sub curbele concentraiilor plasmatice ale celor dou medicamente s se afle in intervalul *,G ! &,%@. * *,G .,C &, %@ / .,C unde indicele + se refer la medicamentul testat i 7 desemneaz medicamentul referin. 2tunci ns cnd ariile de sub curb prezint variabiliti intra i interindividuale considerabile .determinrile de biodisponiblitate se fac pe loturi de circa &* 8 %* de voluntari sntoi/ este de preferat a se determina un interval de ncredere pentru media ariei realizat de medicamentul nou.

&

H.I.HestlaJe# Bse of confidence intervals in analFsis of comparative biovalabilitF trials, I. P5arm. Sci. , K& .G/, &'A* 8 &, &EL%.

Pornind de la faptul ca

*=

(X

X * ( / * ) sp & & + n/ n* este repartizat

* ( n/ + n* % ) se deduce un interval de ncredere cu probabilitatea & pentru * / X* X / t


&

* / X * X / + t

&

& & + . n/ n* )up cum se va arta mai departe, aceast estimare este puin util n caz c s p reprezint practic intervariabilitatea, iar intersc5imbabilitatea care necesit bioec5ivalen trebuie s se bazeze pe intravariabilitatea. unde am notat s = s p

2.4. Ver 1 #area &o!e6elor 0!a! 0! #e Ipoteze statistice ;potezele statistice sunt ipoteze asupra repartiiei unor variabile aleatoare. "le se refer fie la parametrii repartiiei, fie la legea propriu zisa de repartiie. Teste statistice 3etodele de verificare a ipotezelor se bazeaz pe teste statistice care constau n examinarea seleciilor obinute pentru o variabil aleatoare i a unor funcii de elementele seleciilor. Notaii conventionale ;poteza testat, presupus adevarat, se numete ipoteza nul i se noteaz M*. +estarea necesit i formularea unei ipoteze complementare, numit ipotez alternativ i notat M2. )ac se accept M*, n mod normal se respinge M2 i invers. )in acest motiv, ipotezele M* si M2 se aleg s fie complementare. )ac testul privete valoarea unui parametru , de exemplu 0 * # = * i 0 . # = & se poate ntmpla ca toi ceilali parametri ce caracterizeaz distribuiile s fie cunoscui i, dup acceptarea uneia din cele dou ipoteze, distribuiile ( x,* ) i ( x,& ) devin complet definite. n acest caz, ipotezele sunt numite 9simple:. )ac ns ceilali parametric nu sunt cunoscui complet, ipotezele se numesc 9ipoteze compuse:. )e exemplu, dac distribuia este normal i parametrul cautat este , iar dispersia este necunoscut, suntem n cazul unei ipoteze compuse. Probabilitatea unei decizii gresite La verificarea ipotezelor se pot comite dou feluri de erori# &. "rorile de tipul & constau n respingerea ipotezei M * atunci cnd aceasta este adevrat. %. "rorile de tipul % constau n acceptarea ipotezei M* atunci cnd aceasta este fals. Probabilitatile celor dou tipuri de erori se noteaz de obicei cu N respectiv O# N > P .respinge M* P M* adevrat/ O > P .accept M* P M* fals/ > P .respinge M2 P M2 adevrat/ )eci, N este riscul de a respinge n mod greit M * i O este riscul de a respinge n mod greit M2. Probabilitatea de a respinge ipoteza M* atunci cnd aceasta este fals = & se numete puterea testului. 0oeficientul N este numit i nivel de semnificaie. )esigur c este de dorit ca valorile N i O s fie ct mai mici.

4aloarea lui N se alege i n funcie de importana implicaiilor acceptrii sau respingerii ipotezelor testate. )e exemplu, un coeficient de *,*@ este considerat ca bun pentru ma-oritatea problemelor din practic. )ac ns este vorba de un medicament foarte activ cum ar fi digoxina, este de preferat a alege N ntre *,*& si *,*@. Pentru a verifica o ipotez se folosesc datele de selecie pentru calcularea unui test statistic. )omeniul de valori ale testului care corespunde respingerii ipotezei M* cu probabilitatea N se numete regiune critic. 3etodologia de verificare cuprinde n principiu urmtoarele etape# &. se presupune, pe baza unor teste anterioare sau pe baza structurii fenomenului studiat, o repartiie pentru populaia statistic din care se face selectiaQ %. se formuleaz ipotezaQ '. se calculeaz valoarea testului ales i se compar cu limitele de acceptare, respectiv respingereQ A. se accept sau se respinge, n funcie de rezultat, ipoteza M*. 2.4.1. I&o!e6e a0'&ra me2 e 2.4.1.1. D 0&er0 a #'$o0#'!" ( , % ) . Se consider o selecia dintr!o populaie normal 0onsiderm variabila aleatoare X . )atorit linearitii operatorului de mediere avem#
n xi M X = M & n

( )

Pentru dispersia lui X inem cont c D % ( ax + b ) = a % D % ( x ) i c rezultatele xi reprezint variabile aleatoare independente % % % D ( xi + x ( ) = D ( x i ) + D ( x ( ) .
n xi n aceste condiii se obine D & n
%

n M ( xi ) n = & = = n n

D ( x ) = n
n % & i

n%

n%

% n

X % X

( ) = X este repartizata D( X )
n

0a

urmare

teoremei

limit

central,

variabila

aleatoare

(*,&) .

2vem n acest caz, dac vom alege un risc , ipotezele i criteriile de acceptare sau respingere conform cu tabelul de mai -os#
+abelul nr. %#

M*

= *

M2

7egiunea critic

$ $

&

$ $
& %
= *

$ $&

= *

$ $&
cu estimaia sa
* = X s este repartizat Student n

2.4.1.2. D 0&er0 a $e#'$o0#'!" n acest caz se nlocuiete n formula anterioar


s x i se ine cont c variabila aleatoare

cu n!& grade de libertate. 2.4.2. I&o!e6e a0'&ra 2 1ere$/elor a 2o'" me2 2.4.2.1. Ca6'l #+$2 0e #'$o0# 2 0&er0 le Se consider dou populaii normale & , &% i selecie aleatoare din x&& , x&% ,..., x&n din populaia

&

% selecie aleatoare x %& , x %% ,..., x % n% din populaia . % , % 4ariabila aleatoare X X ( & % ) X X % ( & % ) $= & = & % este, dupa cum s!a aratat &% % D X& X % + n& n% anterior, repartizat (.*,&/.

( , )
& % &

% , %

, o i o

2.4.2.2. Ca6'l 2 0&er0 lor $e#'$o0#'!e9 2ar &re0'&'0e e:ale n cazul n care nu cunoatem dispersiile dar tim c sunt egale % & = %% = % utilizm dispersia ponderat de selecie

n& + n% % ca un estimator nedeplasat pentru % .

% p

( n &) s&% + ( n% &) s%% = &

(x =
n& &

&i

X & + & % ( x%i X )


% n

n& + n% %

)up cum s!a artat anterior, mrimea repartizat * ( n& + n% % )

* =

(X

&

X % ( & % ) & & este sp + n& n%

2.4.2.-. Ca6'l o*0er(a/ lor &ere#; ;n cazul cnd observaiile formeaz n mod natural perec5i, cum ar fi de exemplu cnd se msoar concentraiile n n probe, fiecare din ele cu dou metode diferite sau cazul cnd dou medicamente se administreaz unui aceluiai lot de voluntari, n dou perioade diferite. 0onsiderm n acest caz variabila aleatoare d = X & X % . n cazul n care seleciile aparin la aceiai populaie, media lui d va fi zero# % (d ) = * . % % 0nd se cunosc dispersiile avem D d = d% = & + % i variabila n n

()

aleatoare

este repartizat

(*,&) .
d sd n

0nd nu se cunosc dispersiile se folosesc dispersiile de selecie i se ine cont c variabila aleatoare dup cum se poate arta uor, este

repartizat Student cu n!& grade de libertate. 2.4.2.3. Com&ararea &ro&or/ lor )ac vom considera un experiment n care rspunsul este de tip da sau nu, de exemplu vindecare sau nevindecare, supravieuire sau moarte, etc., numrul de rezultate J de un anumit tip n n repetri ale experimentului este o variabil aleatoare repartizat binomial. )eoarece avem, dup cum s!a calculat anterior % ( k ) = np i D( k ) = np1 , variabila aleatoare standardizat
$= k %( k ) D( k ) = k np k p n = se aproximeaz ca fiind normal repartizat. np1 p1 n

$ie dou populaii de tip 9urna Poisson cu bile albe i bile negre:, cu parametrii .probabilitatea bilei albe/ p& i respectiv p % . n dou selecii din cele dou populaii, de volum n& i respectiv n % presupunem c s!a obinut rspuns 9pozitiv: de k& i respectiv k % ori. ki $ie 2i = , i = &,% . n cazul ipotezei nule 0 * # p& = p % = p , variabila ni aleatoare 2& 2% va fi distribuit cu media * i dispersia & p (& p& ) p % (& p % ) & D( 2& 2% ) = & + = p (& p ) n& n% n& n % n aceste condiii se aproximeaz c variabila aleatoare
2& 2% & & va fi repartizat p (& p ) n + n % &

(*,&) .

k& + k % . n& + n % D mbuntire a aproximrii se poate obine prin introducerea unor & & 2& %n 2% %n & % $ = 9corecii de continuitate: pentru 2& i 2% # & & p (& p ) n + n % &

D estimare natural a lui p este p =

2.4.-. E0! marea 2 0&er0 e 0onsiderm o selecie de volum n dintr!o populaie normal ( , % ) . ( n &) s % este 0onform celor artate anterior variabila aleatoare v = % % repartizat ( n &) . 2.4.-.1. E0! marea ra&or!'l' a 2o'" 2 0&er0 Se consider selecia aleatoare x&& , x&% ,..., x&n& & , &% i o selecie aleatoare x %& , x %% ,..., x % n
% % , %

( (

) ).

dintr!o populaie
%

dintr!o populaie

s&% &% 0onform cu cele artate anterior, raportul + = % s% %% + ( n& &, n % &) . s&% % % Se calculeaz + = % lundu!se . s% & %

este repartizat

( n &) s % v=
%
i

(x =
n & %

(x =
n &

) % X n X n + n X

[( x =
n &

s s
i

) X

)]

)(

) (

%
) n X
%

=
%

(x
n &

)=


n &

xi

xi este repartizat (.*,&/ cci x D% i =& )eci v este o sum de n!& ptrate de variabile de tip (.*,&/.

)ar

X n x % ( xi ) % i = * i =

unde k i = ni & , k = k i i s dispersia ponderat a ntregului set de date, este repartizat % ( m &) . *) Te0!'l ra& 2 Co#;ra$ &e$!r' 0ele#/ 2e a#ela, (ol'm

2.4.-.2. Com&ararea ma m'l!or 2 0&er0 . a) Te0!'l Bar!le!! &e$!r' (er 1 #area omo:e$ !"/ 2 0&er0 lor $ie m estimri independente s& , s % ,..., s m pentru dispersiile & , % ,..., m pe baza unor selecii de volume n& , n % ,..., n m . Se pune problema verificrii ipotezei privind egalitatea acestor dispersii % % 0 * # &% = % = ... = m n acest caz <artlet a artat c variabila aleatoare k ( s% ) % % %,'*'( k ln s k i ln s i ) = ln m k & ( si% ) i

)aca selectiile considerate au acelasi volum n& = n% = ... = nk = n , atunci se calculeaza valoarea 3 max =

valoare maxim admis pentru acceptarea ipotezei nule. ;n formula de mai sus avem# % & n % si% = xi( xi si s max = max &i k si% n & ( =&

% s max k % & i

care se compar cu o

;poteza 0 * se respinge daca tabelele 0oc5ran la perec5ea probabilitatea .

P( 3max c( ) = &

( k , n &) grade de libertate si la

3max c( )

unde c() se gaseste din

#) Te0!'l <ar!le= )aca selectiile au acelasi volum se poate aplica pentru k &% testul max si% 0 calc = min si% iar ipoteza 0 * se respinge daca

tabelele MartleF la probabilitatea

P( 0max 0( ) = &

0 calc 0 ( )

unde 0 () se gaseste din

2.4.3. A&l #a/ e8 U! l 6area !e0!'l' ! 7$ a$al 6a #om&ara! (" a me2 #ame$!elor n compararea mediilor am utilizat testul t, numit i testul Student. )eoarece acesta este poate cel mai utilizat n analiza medicamentelor, vom face cteva consideraii asupra aplicrii practice a acestuia. La compararea efectului a dou medicamente, la compararea rezultatului determinrilor analitice cu valoare impus de standardul de control asupra medicamentului precum i n multe alte situaii, apar rezultate diferite acolo unde ne ateptm ca acestea s fie egale. (e punem ntotdeauna problema dac, diferenele constatate n practic sunt

9semnificative: sau nu. )eoarece rezultatele provin din testarea unor eantioane reduse, nu putem fi niciodat siguri n ceea ce privete parametrii ntregii populaii. +otui, asumndu!ne un risc mai mare sau mai mic, trebuie s lum decizii. )ac, de exemplu, dozm cantitatea de substan activ din &* comprimate care provin dintr!o ar- de &.***.*** de comprimate, alegerea celor &* comprimate se presupune c s!a fcut aleator i ele reprezint un eantion reprezentativ pentru ntreaga ar-. Problema este dac, n funcie de valoarea medie a coninutului pentru cele &* comprimate i variabilitatea celor &* valori, putem spune, asumndu!ne un anumit risc, c valoarea medie a concentraiei n substana activ pentru tot lotul este cea declarat. n acest caz aplicarea testului t n verificarea ipotezei asupra mediei, aa cum s!a artat mai sus, este imediat. La compararea mediilor a dou selecii independente, numite n experimentele cu medicamente 9grupuri paralele:, o atenia deosebit trebuie acordat verificrii independenei efective a acestora. )e exemplu la testarea efectelor unui medicament asupra unui grup de pacieni n comparaie cu un alt grup ce se numete placebo, trebuie avut n vedere c pacienii s nu se influenteze ca urmare a discuiilor ntre ei. )ac loturile sunt de animale ce triesc n aceiai cuc, medicamentul poate favoriza sau din contra, defavoriza un grup n lupta animalelor pentru 5ran i adaug efecte suplimentare asupra rezultatelor finale ale testului. n sfrit, un caz foarte frecvent n testrile comparative ale efectelor sau nivelelor plasmatice ale medicamentelor, este acela al observaiilor perec5e, cnd lotul de subieci tratai se constituie ca propriul martor. 2cestea ofer unele avanta-e asupra experimentului pe grupuri paralele. n primul rnd, n experimentul pe grupe paralele, variabilitatea rezult din diferenele de rspuns la medicament ntre cele dou grupuri, aa numita 9intervariabilitate:. n experimentul perec5e apare 9intravariabilitatea:, variabilitatea n rspunsul aceluiai subiect la dou tratamente diferite i avem motive s presupunem c aceasta este mai mic, de regul dect intervariabilitatea. +eoretic, intervariabilitatea include i intravariabilitatea i deci nu poate fi mai mic dect aceasta. )in aceste motive, testul perec5e ofer avanta-ul unei variabiliti mai mici. +estul perec5e ofer apoi avanta-ul c lotul poate fi mai mic. n experimentul pe grupe paralele, de exemplu dou loturi de &* subieci primesc dou medicamente diferite. n experimentul perec5e numai &* subieci pot primi n prima administrare un medicament i n a doua perioad al doilea medicament.

)esigur c acest cuplare nu este ntotdeauna posibil. 0nd dozm cantitatea de substan activ din comprimate sau determinm timpul de dizolvare, acestea sunt consumate n timpul testrii. +rebuie menionat c testul perec5e prezint dezavanta-ul c ntre cele dou tratamente trebuie s existe o perioada destul de lung pentru ca primul medicament administrat s se elimine din organism care, n cazul medicamentelor cu timp de n-umtire mare cum ar fi de exemplu piroxicamul, depete '* de zile, in cazul clomifenului sau al penicilinei retard fiind nevoie de perioada intre cele doua administrari, de mai multe luni. n aceste situaii se prelungete destul de mult timpul pentru definitivarea studiului. )easemenea, efectul primului medicament, n cazul c experimentele se fac pe pacieni, poate duce la o mbuntire a strii de sntate a acestora i la o modificare considerabil a rspunsului la al doilea tratament.

S-ar putea să vă placă și