Sunteți pe pagina 1din 11

Curs 4 Distribuia mediilor

Fie o populaie statistic N (N foarte mare), pe care o considerm ca avnd o distribuie normal. Vom extrage un eantion de efectiv n. Fie m1, m2, m3 mediile gsite pentru diverse eantioane. !e studia" fluctuaia statistic a mediilor eantioanelor extrase #ntre ele, i egal reparti"ate fa de media M a populaiei de origine. !e constat c mediile sunt mai puin dispersate fa de M, media global a populaiei, dect valorile individuale din populaie . $istribuia nou%obinut #n acest mod se numete distribuia mediilor. &baterea tip a acestei distribuii de medii se numete abaterea standard a mediei, i se notea" Sm.
(a) $istributia mediilor esantioanelor de cate n observatii !m (b) $istributia a N valori individuale

'
Distribuia mediilor n jurul mediei globale a populaiei, n comparaie cu distribuia valorilor individuale

$istribuia mediilor fiind mai puin dispersat, abaterea tip Sm este totdeauna mai mic dect abaterea tip S a populaiei de origine( #ntre cele dou mrimi exist relaia)
Sm = S n

Mulimea mediilor care se pot gsi pentru diverse eantioane avnd acelai numr de observaii, extrase la ntmplare dintr-o populaie de medie M i abatere standard S, formea aadar o distribuie gaussian de valoare medie M, i avnd abaterea tip !m" #ntervalul de ncredere al mediei *ntervalul corespun"tor distribuiei mediilor, (M 2Sm, M + 2Sm), cuprin nd $%"%& din valorile pe care le poate lua media m a eantionului din mulimea fluctuaiilor #ntmpltoare, se numete interval de confiden al mediei cu un coeficient de securitate de $%"%&

!m

!m

Intervalul de confiden al mediei cu un coeficient de securitate de !"#"$

&nalog se definete intervalul de confiden al mediei cu un coeficient de securitate de $$&ca fiind intervalul (M 2.6 Sm, M + 2.6 Sm) + ne spune c avem ,, anse din -.. ca media unui eantion ales s cad #n acel interval.

2 .6 ! m

+2 .6 ! m

Intervalul de confiden al mediei cu un coeficient de securitate de 99%

Determinarea intervalului de confiden al mediei $orim s studiem la un eantion intervalul de #ncredere al mediei observate, m%. Nu cunoatem nici media M, nici Sm , dar presupunem c tim abaterea tip S a populaiei de origine. /teodat, experiena ne arat c #n practic, orict de mic ar fi eantionul, dar suficient de important, distribuiile de eantiona0 sunt distribuii sensibil normale. 1n aceste condiii, valoarea m% gsit pentru m repre"int valoarea a crei probabilitate este cea mai mare. 1n consecin, este logic s considerm c cea mai bun estimare pe care o lum va fi media M, i s o substituim #n intervalul de confiden. $e altfel, abaterea a eantionului repre"int o estimare a abaterii tip S a populaiei de origine i se consider substituia

lui S cu Sm re"ultat din calcul. &baterea a eantionului va fi o estimare puin mai mic dect S. 2entru a estima corect S trebuie s lum o valoare puin mai mare dect al eantionului. /alculul arat efectiv c cea mai bun estimare a lui S, pe care o vom nota cu S, este puin mai mare dect , fiind definit de formula)
S = n n 1

!e poate deci utili"a aceast valoare pentru a calcula Sm , care va fi)


Sm = S n = 1 Sm = n n 1 n = n 1

n 1

2lecnd de la valorile estimate ale lui M i Sm, se va putea exprima intervalul de confiden al mediei, care va fi #n final) - m% 2Sm , cu un coeficient de securitate de ,34( - m% 2#&Sm , cu un coeficient de securitate de ,,4. cu.
Sm =

n 1

5x) 6 !e do"ea" corticoi"ii urinari #ntr%un grup de 736 femei cu greutate normal. !e gsete media m 8 9.3. mg:79; i abaterea tip 8-.3.. ! se gseasc intervalul de #ncredere. &vem)
Sm =

1.5 = = 0.1 n 1 252

*ntervalul de #ncredere al mediei este deci) m% 2Sm 8 9.3. 7 ..- 8 9.3. ..7 (9.6. , 9.<.) cu un coeficient de securitate de ,34( m% 2#&Sm 8 9.3. 7.= ..- 8 9.3. ..7= (9.79 , 9.<=) cu un coeficient de securitate de ,,4.

este statistice !entru anali"a dis!ersiei #i a mediei


Compararea a dou dispersii Notm raportul '1,2 al dispersiilor -7 i 77,

12 F1, 2 = 2 2

&cest raport, #n care se convine s se pun la numrtor dispersia cea mai mare, traduce divergena #ntre dou dispersii i va fi folosit pentru a testa semnificaia. $ac, #ntr%adevr, eantioanele sunt extrase din aceeai populaie de origine, dispersiile -7 i 77 repre"int o estimare a dispersiei S2 a acestei populaii. >eoretic, ar trebui s fie verificat relaia) -7 8 77 , i prin urmare '1,2 8 -. ?neori fluctuaiile fortuite nu sunt rspun"toare de mrirea raportului dect pn la o valoare limit, valoare pe care o putem calcula, i care varia" evident cu mrimea eantionului. &tunci cnd raportul ' depete aceast valoare limit, divergena este prea important pentru a fi atribuit numai fluctuaiei de eantiona0 pe care ;a"ardul o poate determina #n interiorul unei populaii unice. &ceast ipote" trebuie deci eliminat i divergena trebuie considerat semnificativ. !n@d@cor a stabilit tabelele raportului ' care ne permit s re"olvm problema din punct de vedere practic. &ceste tabele dau direct, pentru coeficienii de securitate obinuii, ,34 i ,,4 i #n funcie de mrimile eantioanelor n1 i n2 (mai precis, #n funcie de numrul gradelor de libertate - 8 n1 + - i 7 8 n2 + - ale fiecrui eantion) valorile limit ale lui ' sub care se poate considera c dispersiile studiate difer semnificativ. 5ste suficient s formm raportul celor dou dispersii,
F1, 2 =

12 2 2

, i s

cercetm dac este superior valorii limit dat de tabel. 5x) - $up administrarea unui somnifer #ntr%un grup de -subieci, se observ un timp mediu de somn de -..= ;, cu o abatere standard de 7.6 ;. Aa un alt grup de -6 subieci, s%a observat o durat de somn de B.- ;, cu o abatere de -., ;. Ne propunem s studiem dispersia #n aceste dou grupe. &vem) - 8 7.6 7 8 -., n1 8 -n2 8 -6 Formm raportul dispersiilor)
F1, 2 =

12 (2.3) 2 = = 1.46 2 2 (1.9) 2

Caportndu%l la tabelele !n@d@cor, pentru - 8 n1 + - 8 -. i 7 8 n2 + - 8 -7, se gsete valoarea limit pentru ', cu o probabilitate de ...3 (adic 3 anse din -.. de a fi depit datorit fluctuaiilor fortuite), ca fiind '%#%" 8 7.<=. Valoarea gsit pentru ', egal cu -.9=, este net inferioar. Nu exist deci diferen semnificativ #ntre cele dou dispersii observate. Compararea dispersiilor 'testul (is)er* /nd se efectuea" msurri #n condiii diferite, apare problema comparrii preci"iei msurrilor. 1n particular apare problema comparrii preci"iei de msurare a diferitor aparate. *mportana acestei probleme este subliniat #ndeosebi de faptul c intervalele de #ncredere ale abaterilor medii ptratice se dovedesc a fi mari. 2resupunem c #n dou serii de msurri s%au obinut dispersiile empirice ale datelor) - S12 ) pentru (1 grade de libertate( - S22 ) pentru (2 grade de libertate. (#n general, primul coeficient se refer la dispersia empiric cu valoarea cea mai mare). !e va calcula raportul)
S12 F = 2 >1 S2

!e alege un interval de siguran P 8 ..,3 sau P 8 ..,,, i se determin valoarea critic ', corespun"toare numerelor gradelor de libertate (1 i (2 . Valoarea calculat a lui ', 'calculat pentru seriile observate va fi comparat cu valorile extrase din tabel, corespun"toare intervalelor de #ncredere alese, '(P)tabel ( apar dou situaii posibile) - 'calculat ) '*P+tabel diferena #ntre medii nu este aleatoare( - 'calculat , '*P+tabel diferena #ntre medii este aleatoare, i nu are o semnificaie special.

Compararea valorilor medii 'testul t + !tudent*

2entru a lmuri problema dac divergena valorilor unui anumit parametru - este #ntmpltoare sau nu, se efectuea" dou serii de experimente i pentru fiecare serie de re"ultate se calculea" media aritmetic a parametrului, adic x i x .
1 2

2roblema care se pune este, deci, de a decide cnd socotim c diferena #ntre aceste medii este suficient de mare pentru ca practic s se poat afirma c deosebirile constatate #n calitatea parametrilor nu sunt #ntmpltoare. 'surtorile se presupun independente i, cel puin #n cadrul fiecrei serii, de egal preci"ie, iar funcia de repartiie a erorilor de msurare se presupune a fi normal. 2resupunem c s%au efectuat n1 msurri independente de egal preci"ie #ntr%o prim serie de msurri i n2 #n cea de a doua serie de msurri (cu dispersiile -7 i, respectiv, 77). Notm cu x i x mediile aritmetice ale re"ultatelor din prima i din cea de a doua serie. 2entru a rspunde la problema dac diferena dintre aceste medii aritmetice este #ntmpltoare sau nu, vom calcula raportul)
1 2

t=

x1 x2
2 12 2 + n1 n2

Fixm un interval de #ncredere P i corespun"tor determinm din tabelele pentru testul t, valoarea t . t(P). 5x) 2entru P 8 ..,, t 8 7.3<= $ac valoarea absolut a lui t calculat, tcalculat D t(P)tabel, urmea" c diferena mediilor aritmetice se poate considera ca nefiind #ntmpltoare. 1n ca" contrar, nu avem motive s considerm c diferena este semnificativ (adic ea poate fi considerat ca o abatere #ntmpltoare). 5x) 7 ! considerm dou serii, de cte 73 i 6. de msurtori.

1 = 2 = = 1.20
x1 = 23.56, t= x1 x 2 1 1 + n1 n2 x 2 = 22.80 = 23.56 22.80 1 1 1.20 + 25 80 = 2.59

t*%#!!+tabel 8 7.3<=, deci t*%#!!+tabel , tcalculat i re"ult cu o certitudine de ..,, c diferena #ntre medii este semnificativ. ,estul - 'pentru procente* >estul furni"ea" o estimare numeric a probabilitii ca diferena observat s survin sau nu datorit ;a"ardului. !e calculea" urmtorul coeficient, /, pentru compararea a dou procenta0e 01 i 02, cu erorile standard S11, S12.
Z= P1 P2 ( SE1 ) 2 + ( SE 2 ) 2

$ac / 1#!&, atunci se poate afirma cu un prag de semnificaie de 34 c cele dou procenta0e difer nu datorit ;a"ardului, ci datorit unei cau"e care trebuie determinat. $ac / 2#"&, atunci se poate afirma cu un prag de semnificaie de - 4 c cele dou procenta0e difer nu datorit ;a"ardului, ci datorit unei cau"e care trebuie determinat. $orelaia statistic Noiunile de"voltate anterior ne%au permis s studiem un caracter cantitativ dat) greutatea, #nlimea, tensiunea arterial, #ntr%o populaie statistic determinat, definind parametrii numerici care permit s caracteri"m variaiile acestor mrimi, s preci"m gradul de confiden pe care #l putem ataa re"ultatelor i s confruntm re"ultatele cu cele obinute pentru acelai caracter cantitativ #ntr%o populaie statistic. 1n tiinele experimentale i, #n particular, #n medicin i biologie, interesea" nu numai variaia unei singure mrimi, ci a

dou valori, adic a dou caractere cantitative, #ntr%o populaie statistic. $e exemplu, dorim s tim dac exist #ntr%o grup de subieci o relaie #ntre greutate i #nlime, #ntre tensiunea arterial i mrimea umoral a unei substane, etc. 2e plan matematic problema este re"olvat prin noiunea de funcie, care traduce relaia #ntre variaia celor dou mrimi. relaie materiali"at prin curba sa repre"entativ) 2 . f*-+. 1n acest ca", unei valori date a variabilei independente - #i corespunde o valoare i numai una a variabilei dependente 2, relaia 2 . f*-+ permind calcularea cu exactitate a acestei valori. E astfel de relaie fiind stabilit, cunoaterea unei valori ne este suficient pentru determinarea valorii corespondente. &cest tip de relaie, numit relaie funcional, este cea care se #ntlnete #n aa%"isele Ftiine exacteG. $ar problema se complic atunci cnd valorile care se studia" (cea dependent i cea independent) sunt supuse fluctuaiilor. Fluctuaiile se manifest nu numai pentru o singur valoare dat, ci pentru toate variabilele distribuiei. 5xemplu) 1ntr%un grup de subieci crora li s%a studiat #nlimea i greutatea, pentru o valoare dat a #nlimii (de exemplu -.<. m) se va gsi seria tuturor subiecilor avnd aceeai #nlime i diferind #ntre ei prin greutate. *nvers, pentru o valoare dat a greutii se va gsi seria subiecilor cu aceeai greutate, dar cu #nlimi diferite. Nu se tie, i se pune problema dac greutatea este funcie de #nlime, sau invers. !e constat c la o #nlime mic corespunde o greutate mai mic, i invers. 2rin urmare, exist o relaie sigur #ntre aceste dou mrimi, dar mai puin rigid dect relaia funcional propriu%"is. &ceast relaie, de o natur particular, constituie corelaia statistic, care 0oac un rol important #n tiinele vieii, i #n particular #n tiina medical, care este esenialmente o tiin a corelaiei.

2rocedee speciale ne permit s studiem corelaia statistic, s punem #n eviden legea general care stabilete o legtur reciproc #ntre variaiile mrimilor luate #n studiu i s apreciem cantitativ gradul, adic caracterul mai mult sau mai puin slab al acestei legturi. Ne vom limita la corelaia liniar, unde una dintre mrimi varia" proporional cu alta.

Diagrama de dispersie ?n prim model de a aborda problema const #n a merge la repre"entarea grafic. /a pentru a studia o funcie, se merge la un sistem de axe rectangulare 3- i 32, pe care se vor repre"enta valorile a dou mrimi) - (#nlimea) i 2 (greutatea). Fiecare individ este repre"entat printr%o perec;e *-, 2+# &nsamblul populaiei studiate va fi repre"entat printr%un nor de puncte, care va constitui dispersia populaiei studiate)
= 3 9
.6

7 . . 7 9
x

(x,H)

#Dispersia

unei populaii *norul de puncte+

E astfel de diagram, numit diagram de dispersie, permite de0a o aproximare a noiunii de corelaie) #ntr%adevr, dac exist o corelaie astfel #nct, de exemplu, greutile mai mari s fie asociate #nlimilor mai mari, norul de puncte va avea o form alungit oblic #n sus i la dreapta. $ac, dimpotriv, se corelea" valori mai mari ale uneia dintre mrimi cu valori mai mici ale celeilalte, norul de puncte va avea un aspect analog, dar diri0at #n 0os i la dreapta.

9,3 9 6,3 6 7,3 7 -,3 .,3 . . .,3 x -,3 7 7,3

#4orelaie po5itiv

&tunci cnd valorile nu se influenea" reciproc, deci nu exist corelaie, norul de puncte va avea un aspect uniform dispersat (de exemplu, #nlimea i glicemia #ntr%un lot de persoane) + &bsena corelaiei indic independena caracterelor studiate.
6,3 6 7,3 . 7 -,3 .,3 . . .,3 x -,3 7 7,3

4orelaie negativ

= 3 9 .6 7 . . 7 9 x = B

4orelaie 5ero

S-ar putea să vă placă și