Sunteți pe pagina 1din 24

BAZELE STATISTICII

- anul universitar 2012-2013 -


Programa analitică
1. Noţiuni introductive
2. Analiza unei serii statistice unidimensionale, folosind
metode grafice şi numerice (variabile cantitative:
indicatori ai tendinţei centrale, indicatori ai dispersiei şi
indicatori ai formei; variabile calitative).
3. Analiza unei serii statistice bidimensionale.
4. Indicatori ai seriilor de timp
Programa analitică
5. Probabilităţi şi distribuţii teoretice
6. Estimarea parametrilor unei populaţii
7. Testarea statistică
6. Estimarea parametrilor unei populaţii
6.1. Concepte fundamentale
a) Populaţie - Eşantion
 O populaţie statistică este definită prin precizarea naturii sale,
a caracteristicilor intrinseci, spaţiului şi timpului.

 Un eşantion reprezintă o sub-populaţie sau un sub-ansamblu


extras din populaţia de referinţă după o procedură anume.
6. Estimarea parametrilor unei populaţii
b) Sondajul aleator simplu repetat
 Sondajele aleatoare permit calcularea a priori a probabilităţii
fiecărei unităţi din populaţie de a aparţine eşantionului.
 Un sondaj aleator simplu repetat presupune ca fiecare unitate
din populaţie să aibă aceeaşi probabilitate de a fi inclusă în
eşantion.
n
 Aceasta este p = .
N
6. Estimarea parametrilor unei populaţii
c). Numărul de eşantioane care se pot extrage
- în cazul eşantionării aleatoare repetate:

K=Nn
6. Estimarea parametrilor unei populaţii
6.2. Parametru – Estimator – Estimaţie
Parametrul reprezintă o valoare fixă şi necunoscută, numită
şi valoare reală sau adevărată, a unei populaţii studiate după o
anumită variabilă.
Estimatorul este o statistică, adică o variabilă aleatoare care
este determinată de totalitatea eşantioanelor posibile de
volum n care se pot extrage din populaţia de referinţă.
Estimatorul este definit ca o funcţie a variabilelor de selecţie.
6. Estimarea parametrilor unei populaţii
 Estimaţia este o valoare realizată dintre valorile posibile ale
estimatorului.
 O estimaţie se obţine la nivelul unui eşantion extras, pe baza
datelor culese, şi este o funcţie a valorilor de sondaj.
6. Estimarea parametrilor unei populaţii
Proprietăţile estimatorilor
 De regulă, există o diferenţă între estimaţie şi parametru,
care reprezintă o eroare de estimare.
 Această eroare poate fi măsurată cu ajutorul proprietăţilor
estimatorilor:

1. Nedeplasarea

M (θˆ) = θ
6. Estimarea parametrilor unei populaţii
2. Convergenţa:

V (θˆ) → 0, când n → N
- convergenţa în probabilitate impune o condiţie de volum al
eşantionului: dacă acesta este suficient de mare, atunci orice
valoare posibilă a estimatorului (orice estimaţie) converge
către parametru.
Această proprietate este o expresie a legii numerelor mari.
6. Estimarea parametrilor unei populaţii
- convergenţa în repartiţie (teorema limită centrală) impune o condiţie
de volum pentru estimatorul transformat prin operaţia de standardizare:

~ θˆ − M ( θˆ )
θˆ = eşantionului creşte peste o anumită limită, atunci variabila
Dacă volumul
θˆ ) standardizarea estimatorului urmează o lege de
V (prin
aleatoare obţinută
repartiţie normală standard:

3. Eficienţa: ~
θˆ → Z ~ N ( 0 ,1 )

V ( θˆ ) = min .
6. Estimarea parametrilor unei populaţii
6.3. Statistici uzuale în inferenţa statistică

a) Media de selecţie µ̂
 Estimatorul numit medie de selecţie este obţinut ca o medie
aritmetică a variabilelor aleatoare de selecţie Xi.
 O valoare posibilă a estimatorului este media de sondaj.
 Variabila media de selecţie se caracterizează prin legea
normală - teorema limită centrală bazată pe legea numerelor
mari.
σ2
µˆ ~ N ( µ , )
n
6. Estimarea parametrilor unei populaţii
 Caracteristici ale estimatorului µ̂ :
- nedeplasat;
- convergent;
- eficient.

Dispersia de selecţie σ̂
2
b)
- Este un estimator deplasat.
- Ca o corecţie la acest estimator, se construieşte dispersia de
selecţie modificată sau corectată. O valoare posibilă a acestui
estimator este dispersia de sondaj modificată:
6. Estimarea parametrilor unei populaţii
1
s' 2 =
n −1
∑ ( xi − x )2

c) Proporţia de selecţie πˆ
- are aceleaşi proprietăţi cu media de selecţie.
π(1 − π )
πˆ ~ N ( π , )
n
6. Estimarea parametrilor unei populaţii
6.4 Estimarea punctuală a parametrilor unei populaţii

a) Definire
- presupune calculul unei estimaţii la nivelul unui eşantion, ca
o valoare a unui estimator convenabil ales, care respectă
proprietăţile de nedeplasare şi convergenţă.
b) Estimarea punctuală a mediei unei populaţii
c) Estimarea punctuală a varianţei unei populaţii
d) Estimarea punctuală a proporţiei unei populaţii
6. Estimarea parametrilor unei populaţii
6.5 Estimarea prin interval de încredere (IC) a parametrilor unei
populaţii

a) Definire
- a estima prin IC un parametru presupune a identifica două
variabile aleatoare, Li şi Ls , care, pentru o anumită probabilitate
, numită nivel
( 1 − αde) încredere, respectă condiţia:

-
, cu

P( Li ≤ θ ≤ Ls ) = ( 1 − α ) α ∈ ( 0 ,1 )
6. Estimarea parametrilor unei populaţii
- estimarea prin IC se bazează pe estimatori nedeplasaţi şi
convergenţi, cărora li se aplică Teorema limită centrală.

b) Estimarea prin IC a mediei unei populaţii


- când se cunoaşte parametrul σ :

σ2
µˆ ~ N ( µ , ) ⇒ Z ~ N (0,1)
n
µˆ − µ µˆ − µ
Z= =
σ µˆ σ/ n
6. Estimarea parametrilor unei populaţii

µˆ − µ
P( − zα / 2 ≤ ≤ + zα / 2 ) = ( 1 − α )
σ/ n

σ σ
P( µˆ − zα / 2 ≤ µ ≤ µˆ + zα / 2 ) = (1−α )
n n
6. Estimarea parametrilor unei populaţii
 la nivelul unui eşantion extras:

 σ σ 
 x − z α/2 , x + z α/2 
 n n 

- când nu se cunoaşte parametrul σ :


Variabila Z devine o variabilă Student:
µˆ − µ
t= ~ t( n − 1 )
σˆ '
n
6. Estimarea parametrilor unei populaţii
P( −tα / 2 ≤ t ≤ tα / 2 ) = ( 1 − α )
- valoarea tα / 2 se citeşte din tabelul Student pentru:

P( t ≥ tα / 2 ) = α / 2

 s' s' 
 x − tα / 2 , x + tα / 2 
 n n
6. Estimarea parametrilor unei populaţii
c) Estimarea prin IC a proporţiei unei populaţii

- când se cunoaşte varianţa variabilei alternative:


 σπ σπ 
π − zα / 2
ˆ , π + zα / 2
ˆ 
 n n 

- când nu se cunoaşte varianţa variabilei alternative:


 p( 1 − p ) p( 1 − p ) 
 p − tα / 2 , p + tα / 2 
 n n 
6. Estimarea parametrilor unei populaţii
6.6. Estimarea prin IC în SPSS
De scriptive s

S tatis tic S td. E rror


rata_s om _2010 M ean 7.7442 .32041
95% Confidenc e Lower B ound 7.0976
Interval for M ean Upper B ound
8.3908

5% Trim m ed M ean 7.8339


M edian 8.0000
V arianc e 4.414
S td. Deviation 2.10105
M inim um 2.30
M ax im um 11.80
Range 9.50
Interquartile Range 2.60
S k ewnes s -.605 .361
K urtos is .418 .709
6. Estimarea parametrilor unei populaţii
6.7. Calcularea volumului eşantionului (n)
 Pentru determinarea volumului eşantionului se foloseşte, de
regulă, ca variabilă de bază o variabilă alternativă pentru a
estima parametrul π , care, în cazul unui sondaj de opinie
electoral, poate fi proporţia de voturi obţinute de un
candidat.
 În practică, se fixează probabilitatea sau nivelul de încredere,
∆π rezultatul (de
(1-α), cu care dorim să garantăm ± 3regulă,
% 0,95)
şi eroarea maxim admisibilă (de exemplu, ). Având
aceste date, se poate calcula volumul eşantionuluiπ care
estimează, cu un anumit nivel de încredere, parametrul .
6. Estimarea parametrilor unei populaţii
 Ştiind că:
σπ
∆π = zα / 2
n , unde:
∆ π este eroarea maximă admisibilă, iar este
σ π abaterea standard a
variabilei alternative pentru care se estimează π
 Se află n: zα2 / 2 ⋅ σ π2
n=
∆π2
 Parametrul , care exprimă gradul de omogenitate al populaţiei, de
regulă nu se σcunoaşte,
2
π însă în calculul volumului eşantionului se
poate utiliza valoarea lui maximă, care este egală cu 0,25.

S-ar putea să vă placă și