Sunteți pe pagina 1din 36

ESTIMAREA PARAMETRILOR

STATISTICI

Călinici Tudor

1
Obiective educaţionale

 Înţelegerea procesului de estimare


 Însuşirea limbajului specific pentru inferenţa
statistică
 Enumerarea estimatorilor fără bias
 Determinarea intervalului de încredere de o
precizie dată
 Calculul taliei unui eşantion reprezentativ în
diferite condiţii
2
Probabilităţi
 = şansa ca un eveniment să aibă loc
considerând toate rezultatele posibile
 Valoarea predictivă a probabilităţii:
 Reflectă ce “ar trebui” să se întâmple şi nu ce o să
se întâmple efectiv
 Pentru un pacient supus unei operaţii cu o rată de
succes de 75% rezultatul nu poate fi 75% succes
 Probabilitatea poate fi privită ca o măsură a
capacităţii eşantionului analizat de a estima
caracteristica unei populaţii
3
Exemplu: distribuţia greutăţii

 Media = 69, s = 3
 68,26% = 66-72

 p=0,68
 Mai mare de 78

 P=0,0013

4
Principii generale
 În studiul într-o populaţie P a parametrilor a unei
caracteristici oarecare (cantitative sau calitative)
adesea este necesar să se urmeze procedeul:
1. Se extrage un eşantion reprezentativ al acestei populaţii.
2. Prin mijloacele statisticii descriptive se descrie distribuţia
caracteristicii pe eşantionul extras la etapa 1, fiindcă talia
acestuia permite o investigare exhaustivă a sa. Astfel se
poate determina frecvenţa observată, dacă este vorba de
o caracteristică calitativă, sau se calculează media şi
variaţia, în cazul unei caracteristici cantitative.
3. Prin mijloacele statisticii inferenţiale sau inductive se
extind la întreaga populaţie rezultatele observate pe
eşantion. Adica, pornind de la parametrii observaţi
(frecvenţa, media, variaţia, etc) pe eşantion se încearcă
să se estimeze parametrii “teoretici” ai întregii populaţii.
5
Principii generale

Eşantionare

Calculul
caracteristicii

Inferenţă

6
Principii generale
Cazul unei variabile X calitative
Frecvenţa teoretică p a variabilei X în populaţia P este
necunoscută.

 Din populaţia P se extrage la întâmplare


eşantionul E reprezentativ.
 In eşantionul E pentru variabila X se observă o
frecvenţă f.
 Se încearcă să se estimeze valoarea
necunoscută a lui p cu ajutorul lui f observat.
7
8
Principii generale

Cazul unei variabile X cantitative


 Media teoretică  a variabilei X ca şi
variaţia sa teoretică 2 în populaţia P sunt
necunoscute.
 Din populaţia P se extrage la întâmplare
eşantionul E reprezentativ.
 In eşantionul E pentru variabila X se observă o
medie m şi o variaţie s2.
 Se încearcă să se estimeze valorile necunoscute
ale lui  şi 2 cu ajutorul lui m şi s2 observate.

9
10
Principii generale

Eşantionare
Variabile calitative

FRECVENŢA

Calculul
caracteristicii

Variabile cantitative

MEDIA
MEDIANA Inferenţă
MODULUL
11
Definiţia unui estimator
 Estimatorul unui parametru este o funcţie
depinzând de observaţiile efectuate pe un eşantion
extras la întâmplare care furnizează o valoare
aleatoare numită estimarea punctuală a
parametrului.

 Exemplu: Dacă eşantionul E are valorile x1,...,xn pentru


caracteristica studiată, estimatorul mediei aritmetice  a
unei populaţii P este m = (x1+x2+...+xn)/n

12
Principii generale

Eşantionare
Variabile calitative

FRECVENŢA

Calculul
caracteristicii

ESTIMATOR

Variabile cantitative

MEDIA
MEDIANA Inferenţă
MODULUL
13
ESTIMAREA PUNCTUALĂ

Calităţile unui estimator:


• corectitudinea estimării obţinute,
• precizia acesteia.

14
Estimator fără bias

Fie T estimarea punctuală a unui parametru teoretic  al


unei populaţii.
T este o variabila aleatoare , valorile fiind tributare
eşantionului pe baza căruia se calculează.
Estimatorul T se spune că este fără bias dacă speranţa
matematică a lui T este egală cu valoarea adevărată
(teoretică) a parametrului estimat adică M(T) = .
Se spune în acest caz că estimarea dată de T este corectă.

15
ESTIMAREA PUNCTUALĂ
Proprietăţi ale estimatorilor medie si frecventa:

P1. Speranţa matematică a mediilor observate, m, pe eşantioane


extrase aleator este egală cu media teoretică  a populaţiei din
care sau extras eşantioanele, medie considerată pentru valorile
unei variabile cantitative luată în studiu: M(m) = .

P2. Speranţa matematică a frecvenţelor observate, f, pe


eşantioane extrase aleator este egală cu frecvenţa teoretică p a
populaţiei din care sau extras eşantioanele, frecvenţă
considerată pentru valorile unei variabile calitative luată în
studiu: M(f) = p.

Din P1 şi P2 rezultă că m şi f sunt estimatori fără bias şi că


estimările realizate cu ajutorul lor sunt corecte. 16
ESTIMAREA PUNCTUALĂ
 P3. Speranţa matematică a variaţiilor
descriptive observate s2 pe eşantioane de talie
n, extrase aleator este diferită de variaţia
teoretică 2 a populaţiei din care sau extras
eşantioanele, variaţie considerată pentru
valorile unei variabile cantitative luată în studiu:
n 1 2
M( s 2 )  
n

 P4. Variaţia punctuală de eşantionare este un


estimator fără bias pentru 2: n
S2  s2
n 1
17
18
Concluzie
 Media, frecvenţa şi variaţia de eşantionare
observate pe eşantioane corect extrase
(reprezentative) dintr-o populaţie P sunt
estimatori fără bias ale mediei, frecvenţei şi
respectiv variaţiei teoretice ale populaţiei P

19
ESTIMAREA CU INTERVALE DE INCREDERE
 Un estimator că este cu atât mai eficace cu cât
variaţia sa este mai mică, sau precizia sa depinde de
mărimea variaţiei sale.
 Estimarea punctuală a unui parametru teoretic
furnizează o valoare pentru parametrul teoretic
estimat.
 Valoarea sa este tributară fluctuaţiilor de eşantionare
şi poate fi la o mare distanţă de valoarea reală a
parametrului estimat.
 Este recomandabil să se estimeze un parametru
teoretic nu printr-o singură valoare ci printr-un
interval, numit interval de încredere, în care să se
poată afirma că parametrul estimat se găseşte cu o
probabilitate ridicată. 20
ESTIMAREA CU AJUTORUL INTERVALULUI DE
INCREDERE
 Intervalul de încredere este un interval mărginit
de valori (limitele poartă numele de limite de
încredere) care include media caracteristicii
studiate.
 Cu cât intervalul este mai larg cu atât suntem
mai siguri că media caracteristicii studiate se
va regăsi în acel interval.
 Mărimea încrederii, confidenţa, este dată de
probabilitatea ca valoarea (valorile) studiate să
se găsească în acel interval.
21
ESTIMAREA UNEI MEDII
 Fie P o populaţie în care variabila X are o media teoretică 
necunoscută. Din populaţia P se extrage la întâmplare
eşantionul E reprezentativ. In eşantionul E pentru variabila X
se observă o medie m şi se calculează o variaţie punctuală
estimată
n
 ( x i  m)
2

s2  i  1
n
S 2 
n 1 n 1

 Se încearcă să se determine pentru valoarea necunoscută a


mediei teoretice  un interval de încredere cu pragul , (cu
ajutorul lui m şi S2 observate), adică să se determine un
interval [a,b] în care probabilitatea ca media teoretică  să se
afle este 1-:
 Pr(a  b) = 1 - . 22
ESTIMAREA UNEI MEDII: EŞANTIOANE MARI
 N>=30
 Intervalul de încredere pentru media  cu
pragul de semnificaţie  este
   
 m  Z n , m  Z n 
 

 Atunci când  nu se cunoaşte, ea poate fi


estimata corect prin s şi în acest caz intervalul
de încredere cu pragul de semnificaţie  pentru
media  este
 s ,m  Z s 
 m  Z n 1

n  1 
25


ESTIMAREA UNEI MEDII: EŞANTIOANE MARI
 Cel mai frecvent se utilizează un prag de
semnificaţie  = 0.05. Atunci Z=1.96 şi deci
intervalul de încredere cel mai utilizat în cazul
eşantioanelor mari este

 s s 
   m  1,96 , m  1,96 
 n 1 n 1

26
Întrebare
 Într-un eşantion de 101 de nou născuţi, cunoaştem
media greutăţii la naştere: 3400g şi abaterea
standard: 142

 Se ştie din literatură faptul că greutatea medie la


naştere la nou născuţi este de 3300g.

 Este eşantionul din acest exemplu caracteristic


pentru o populaţia la care se face referirea din
literatură?

3400 +/-1,96*142/10= 3400+/-27.83 27


Eroarea de eşantionare a mediei
 Sx= diferenţa dintre media valorilor
eşantionului şi media caracteristici populaţiei
din care a fost extras eşantionul
 Creşterea erorii de eşantionare =>
 Scăderea acurateţii mediei eşantionului de a
estima caracteristica unei populaţii
 Scăderea erorii de eşantionare =>
 Creşterea acurateţii mediei eşantionului de a
estima caracteristica unei populaţii

28
Intervale de încredere cu eşantioane mici
 n<30
 Cu cât eşantioanele sunt mai mici cu atât
distribuţia de eşantionare este mai dispersată
faţă de distribuţia normală
 Se foloseşte o altă distribuţie: distribuţia t sau
Student
 Diferenţa majoră dintre distribuţia t şi cea
normală constă în faptul că prima îşi schimbă
forma odată cu schimbarea dimensiunii
eşantionului
30
Grade de libertate
 df
 Direcţiile disponibile pentru mişcare într-un
spaţiu dat
 Numărul de componente care pot varia într-un
set de date
 n-1

 s ,m  t s 
 m  t n 1
 
n 1

31
Calculul intervalului de încredere
 s ,m  t s 
 m  t n 1

n  1 

 n=6  df = 5
 II95%  t= ±2,571
 n=10  df = 9
 II95%  t= ±2,262
 n=30
 II95%  t= ±2,042
 Creşterea lui n
determină ca valoarea
lui t să se apropie de
1,96  curba tinde spre
distribuţia normală
32
ESTIMAREA UNEI FRECVENTE
 Esantioane mari np, nq>=10

 f(1-f) f(1-f) 
 f  Z n
, f  Z
n 
 

 f este frecventa observata

33
Talia eşantionului reprezentativ
 Prevalenţa maladiei în populaţie este
cunoscută – f (exprimată în procente)
 Se stabileşte marja de eroare k – în procente
 Se stabileşte riscul asumat

 Talia esantionului este

𝑧𝛼2 × 𝑓 × (1 − 𝑓)
𝑁=
𝑘2
34
Exemplu
 Se cunoaşte din literatură faptul că o maladie
are în populaţie o prevalenţă de 25%

 Să se calculeze talia unui eşantion


reprezentativ legat de respectiva maladie, cu o
marjă de eroare de 3%, asumându-se un risc
de 5%

1,962 ×0,25×0,75
𝑁= ≅ 800
0,032
35
Talia eşantionului reprezentativ
 Se doreşte evaluarea unei variabile cantitative,
cu o anumită precizie E cu asumarea unui risc
1-α. Se cunoaşte din studii anterioare varianţa
respectivului parametru ca având valoarea σ.

 Talia eşantionului reprezentativ va fi

2
𝑍𝛼 × 𝜎
𝑁=
𝐸
36
Exemplu
 Se doreşte estimarea timpului mediu de
consultaţie pentru medicii de familie.
 Ştiindu-se din studii anterioare că durata unei
consultaţii poate varia cu aproximativ 5 minute
de la caz la caz şi că studiul doreşte estimarea
cu precizia de 1 minut, asumându-şi un risc de
5% de eroare, să se calculeze talia
eşantionului necesar în acest caz

2
1,96 × 5
𝑁= ≅ 96
1 37
SAU…
 http://www.gpower.hhu.de/en.html

38
Vă mulţumesc pentru atenţie

39

S-ar putea să vă placă și