Sunteți pe pagina 1din 41

ESTIMAREA

PARAMETRILOR
STATISTICI
1
PROBABILITĂŢI
= şansa ca un eveniment să aibă loc considerând toate rezultatele
posibile
Valoarea predictivă a probabilităţii:
 Reflectă ce “ar trebui” să se întâmple şi nu ce o să se întâmple efectiv
 Pentru un pacient supus unei operaţii cu o rată de succes de 75% rezultatul nu poate
fi 75% succes

Probabilitatea poate fi privită ca o măsură a capacităţii eşantionului


analizat de a estima caracteristica unei populaţii

2
EXEMPLU: DISTRIBUŢIA GREUTATII

Media = 69, s = 3
68,26% = 66-72 (168-183)
 p=0,68

Mai mare de 78 (198)


 P=0,0013

3
PRINCIPII GENERALE
In studiul într-o populaţie P a parametrilor a unei
caracteristici oarecare (cantitative sau calitative) adesea
este necesar să se urmeze procedeul:
1. Se extrage un eşantion reprezentativ al populaţiei.
2. Se descrie distribuţia caracteristicii pe eşantionul extras
a) frecvenţa observată (calitativă)
sau
a) media şi variaţia (cantitativă)
3. Prin mijloacele statisticii inferenţiale (inductive) se extind la
întreaga populaţie rezultatele observate pe eşantion.

4
PRINCIPII GENERALE
Eşantionare

Calculul
caracteristicii

Inferenţă

5
PRINCIPII GENERALE
Cazul unei variabile X calitative
Frecvenţa teoretică p a variabilei X în populaţia P este
necunoscută.

Din populaţia P se extrage la întâmplare eşantionul E reprezentativ.


In eşantionul E pentru variabila X se observă o frecvenţă f.
Se încearcă să se estimeze valoarea necunoscută a lui p cu ajutorul lui
f observat.

6
PRINCIPII GENERALE

Cazul unei variabile X cantitative


Media teoretică  a variabilei X ca şi variaţia sa
teoretică 2 în populaţia P sunt necunoscute.
 Din populaţia P se extrage la întâmplare eşantionul E
reprezentativ.
 In eşantionul E pentru variabila X se observă o medie m şi o
variaţie s2.
 Se încearcă să se estimeze valorile necunoscute ale lui  şi 2
cu ajutorul lui m şi s2 observate.

7
PRINCIPII GENERALE
Eşantionare
Variabile calitative

FRECVENŢA

Calculul
caracteristicii

Variabile cantitative

MEDIA
MEDIANA Inferenţă
MODULUL

8
DEFINIŢIA UNUI ESTIMATOR

Estimatorul unui parametru este o funcţie


depinzând de observaţiile efectuate pe un
eşantion extras la întâmplare care furnizează o
valoare aleatoare numită estimarea punctuală a
parametrului.
Dacă eşantionul E are valorile x1,...,xn pentru
caracteristica studiată, estimatorul mediei
aritmetice  a unei populaţii P este
m = (x1+x2+...+xn)/n

9
ESTIMAREA PUNCTUALĂ

Calităţile unui estimator:


•corectitudinea (confidenta) estimării obţinute,
•precizia acesteia.

10
PRINCIPII GENERALE
Eşantionare
Variabile calitative

FRECVENŢA

Calculul
caracteristicii

ESTIMATOR

Variabile cantitative

MEDIA
MEDIANA Inferenţă
MODULUL

11
ESTIMATOR FĂRĂ BIAS
Fie T estimarea punctuală a unui parametru teoretic  al
unei populaţii.
T este o variabila aleatoare valorile ei variînd
întâmplător odată cu eşantionul pe baza căruia se
calculează.
Estimatorul T se spune că este fără bias dacă speranţa
matematică a lui T este egală cu valoarea adevărată
(teoretică) a parametrului estimat adică M(T) = .
Se spune în acest caz că estimarea dată de T este
corectă.

12
ESTIMAREA PUNCTUALĂ
Proprietăţi ale estimatorilor medie si frecventa:
P1. Speranţa matematică a mediilor observate, m, pe eşantioane extrase
aleator este egală cu media teoretică  a populaţiei din care sau extras
eşantioanele, medie considerată pentru valorile unei variabile cantitative
luată în studiu: M(m) = .

P2. Speranţa matematică a frecvenţelor observate, f, pe eşantioane


extrase aleator este egală cu frecvenţa teoretică p a populaţiei din care
sau extras eşantioanele, frecvenţă considerată pentru valorile unei
variabile calitative luată în studiu: M(f) = p.

Din P1 şi P2 rezultă că m şi f sunt estimatori fără bias şi că estimările


realizate cu ajutorul lor sunt corecte.
13
ESTIMAREA PUNCTUALĂ
P3. Speranţa matematică a variaţiilor descriptive observate s2 pe
eşantioane de talie n, extrase aleator este diferită de variaţia
teoretică 2 a populaţiei din care sau extras eşantioanele, variaţie
considerată pentru valorile unei variabile cantitative luată în studiu:
n 1 2
M( s 2 )  
n

P4. Variaţia punctuală de eşantionare este un estimator fără bias


pentru 2:

n
S2  s2
n 1

14
CONCLUZIE

Media, frecvenţa şi variaţia de eşantionare


observate pe eşantioane corect extrase
(reprezentative) dintr-o populaţie P sunt
estimatori fără bias ale mediei, frecvenţei şi
respectiv variaţiei teoretice ale populaţiei P

15
ESTIMAREA CU INTERVALE DE INCREDERE

Un estimator este cu atât mai eficace cu cât variaţia


sa este mai mică.
Precizia estimatorului depinde de mărimea variaţiei
sale.
Estimarea punctuală a unui parametru teoretic
furnizează o valoare pentru parametrul teoretic
estimat.
Recomandare: estimarea parametru teoretic printr-un
interval (interval de încredere), în care să se poată
afirma că parametrul estimat se găseşte cu o
probabilitate ridicată.

16
ESTIMAREA CU AJUTORUL INTERVALULUI DE INCREDERE

Intervalul de încredere este un interval mărginit de valori


(limitele poartă numele de limite de încredere) care include
media caracteristicii studiate.
Cu cât intervalul este mai larg cu atât suntem mai siguri că
media caracteristicii studiate se va regăsi în acel interval.
Mărimea încrederii, corectitudinea sau confidenţa, este dată de
probabilitatea ca valoarea (valorile) studiate să se găsească în
acel interval.

17
ESTIMAREA UNEI MEDII
Fie P o populaţie în care variabila X are o media teoretică 
necunoscută. Din populaţia P se extrage la întâmplare eşantionul E
reprezentativ. In eşantionul E pentru variabila X se observă o medie m
şi se calculează o variaţie punctuală estimată

n
 ( x i  m)
2

s2  i  1
n
S 
2
n 1 n 1

Se încearcă să se determine pentru valoarea necunoscută a mediei


teoretice  un interval de încredere cu pragul , (cu ajutorul lui m şi S2
observate), adică să se determine un interval [a,b] în care
probabilitatea ca media teoretică  să se afle este 1-:
Pr(a  b) = 1 - .

18
ESTIMAREA UNEI MEDII: ESANTIOANE MARI
N>=30
media de eşantionare m este o variabilă aleatoare
normală
m
Z
N (  , n ) 
n

Pentru un prag de semnificaţie  se determină valoarea


Z pentru care probabilitatea ca variabila aleatoare Z
să fie în intervalul [-Z,Z] este 1-, adică:
Pr(-Z  Z  Z) = 1 - .

19
ESTIMAREA UNEI MEDII: ESANTIOANE MARI

Cu o probabilitate 1- se poate afirma că are loc:

m
 Z   Z

n
de unde rezultă că:

m  Z     m  Z 
n n

20
ESTIMAREA UNEI MEDII: ESANTIOANE MARI

Prin urmare, intervalul de încredere pentru media  cu pragul de


semnificaţie  este
   
 m  Z n , m  Z n 
 

Atunci când  nu se cunoaşte, ea poate fi estimata corect prin s şi în


acest caz intervalul de încredere cu pragul de semnificaţie  pentru
media  este

 s ,m  Z s 
 m  Z n 1
 
n 1

21
ESTIMAREA UNEI MEDII: ESANTIOANE MARI

Cel mai frecvent se utilizează un prag de semnificaţie  = 0.05.


Atunci Z=1.96 şi deci intervalul de încredere cel mai utilizat în cazul
eşantioanelor mari este

 s s 
   m  1,96 , m  1,96 
 n 1 n 1

22
EXEMPLU
Într-o populaţie de 50 cunoaştem media greutăţii la naştere a
noilor născuţi: 3400g şi abaterea standard: 142
Pe un eşantion aleator de 10 nou născuţi:
 media=3275g, abaterea standard=854

 Eşantionul este reprezentativ pentru populaţie?


 Esantion: 3275+/-1,96*854/3= 3275+/-558

 Populatie: 3400 +/-1,96*142/1000= 3400+/-39,36

Eşantionarea aleatoare implică “dreptul” fiecărui membru al


populaţiei de a fi ales dar nu garantează reprezentativitatea
proporţională a tuturor părţilor unei populaţii
Alt eşantion  altă medie, altă abatere

23
EXEMPLU
A – distribuţia de eşantionare a
mediei pentru n=10
B – distribuţia de eşantionare a
mediei pentru n=50
Pe măsură ce creşte n eroarea de
eşantionare scade şi eşantioanele
devin mai reprezentative, media lor
este mai apropiată de cea a populaţiei
Deviaţia standard a distribuţiei de
eşantionare este un indicator al erorii
de eşantionare
24
DEVIAŢIA STANDARD A DISTRIBUŢIEI DE EŞANTIONARE

În practică este imposibil să


construim distribuţia de s
eşantionare  estimarea sX 
deviaţiei standard a mediei
pe baza deviaţiei standard şi n 1
a dimensiunii eşantionului:

25
EXEMPLU (CONTINUARE)
A = media=115, abaterea
standard=30
 Sx=9,5
B = media=115, abaterea
standard=30
 Sx=4,2
Pe măsură ce creşte n scade
eroarea standard a mediei
Aproximarea distribuţiei
populaţiei
26
INTERVALE DE ÎNCREDERE
Formula de determinare a limitelor intervalului de
încredere:

II  X  ( z ) s X
Pentru intervale de încredere de 95% Z= ± 1,96

27
EXEMPLU
Studiul Fitzgerald al mobilităţii prin extensie a coloanei
lombare la indivizi de vârste cuprinse între 30 şi 39 de ani
n=42, media=40° şi s=8,8 °
Media populaţiei poate fi estimată la 40°
 Care este acurateţea acestei estimări?
 Cum estimăm intervalul de încredere?

28
EXEMPLU (CONTINUARE)
n=42, media=40°, s=8,8°  Sx=1,36
95,45% din distribuţie este cuprinsă între ±2Sx sau ±2Z

29
EXEMPLU (CONTINUARE)
Estimarea zonei de 95%
Este mărginită de un scor Z de ± 1,96
Interval de încredere de 95%

30
EXEMPLU (CONTINUARE)
95% II = 40,0± (1,96)(1,36)
95% II = 40,0±2,67
95% II: [37,33; 42,67]

31
EXEMPLU 99%
Z = ± 2,576
99% II = 40,0± (2,576)(1,36)
99% II = 40,0±3,50
99% II: [36,5; 43,5]

32
INTERVALE DE ÎNCREDERE CU EŞANTIOANE MICI

n<30
Cu cât eşantioanele sunt mai mici cu atât distribuţia de eşantionare
este mai dispersată faţă de distribuţia normală
Se foloseşte o altă distribuţie: distribuţia t sau Student
Diferenţa majoră dintre distribuţia t şi cea normală constă în faptul că
prima îşi schimbă forma odată cu schimbarea dimensiunii eşantionului

33
ESTIMAREA UNEI MEDII: ESANTIOANE MICI

se poate determina intervalul de încredere al mediei  doar dacă


variabila studiată X este o variabilă aleatoare normală.
Daca se cunoaste variatia:

   
 m  Z n , m  Z n 
 
Nu se cunosate variatia si n<30

 s ,m  t s 
 m  t n 1

n  1 

34
CALCULUL INTERVALULUI DE ÎNCREDERE

df = n-1
df = grade de
libertate

II  X  (t ) s X

35
GRADE DE LIBERTATE
df
Direcţiile disponibile pentru mişcare într-un spaţiu dat
Numărul de componente care pot varia într-un set de date
n-1

36
GRADE DE LIBERTATE - EXEMPLU
5 măsurători, avem o sumă de 30 şi o medie de 6
După ce face primele 4: 8,9,10,11 a cincea poate fi calculată şi setul
de date are numai 4 grade de libertate

37
CALCULUL INTERVALULUI DE ÎNCREDERE

n=6  df = 5
 II95%  t= ±2,571
n=10  df = 9
 II95%  t= ±2,262
n=30
 II95%  t= ±2,042
Creşterea lui n determină ca
valoarea lui t să se apropie
de 1,96  curba tinde spre
distribuţia normală

38
ESTIMAREA UNEI FRECVENTE

Esantioane mari np, nq>=10

 f(1-f) f(1-f) 
 f  Z n
, f  Z
n 
 

f este frecventa observata

39
DETERMINAREA TALIEI EŞANTIOANELOR
Dacă pentru un risc dat  se doreşte obţinerea unei precizii date k
pentru intervalul de încredere, adică acesta să aibă forma:
[f - k , f + k]
atunci ţinând seama de faptul că, pe de altă parte, intervalul de
încredere se exprimă prin:
 f (1  f ) f (1  f ) 
 f  Z  , f  Z  
 n n 

f (1  f ) Z 2  f (1  f )
k  Z  n
n k2

40
EXEMPLU
Se doreşte evaluarea prevalenţei unei maladii într-o anumită
populaţie. Se ştie că această prevalenţă este de ordinul a 30% (=h).
Dacă se doreşte o precizie a estimării prevalenţei de k=4% la un risc
 = 0.05 (căruia îi corespunde U = 1.96) trebuie realizată această
estimare utilizând un eşantion a cărei talie trebuie să fie superioară
sau egală cu

(1.96) 2 0.30.7
(0.04) 2

Luând 1.96  2 se găseşte n = 525.

41

S-ar putea să vă placă și