Sunteți pe pagina 1din 6

US 5.

NOŢIUNI ŞI NOTAŢII
Cuprins
5.1 Populaţie şi eşantion
5.2 Parametri, estimatori, estimaţii
5.3 Distribuţii de selecţie

Obiective
- definirea conceptelor fundamentale specifice metodelor de analiză statistică inferenţială
- prezentarea de exemple pentru aprofundarea noţiunilor

Competenţe
- însuşirea noţiunilor fundamentale din analizei statistice inferenţiale
- înţelegerea diferenţelor între parametri, estimatori şii estimaţii
- capacitatea de a distinge între metodele descriptive şi cele inferenţiale

Termen mediu: 2 h

Bibliografie

1. Andrei, T. şi Stancu, S., Statistică - teorie şi aplicaţii , Editura All, Bucureşti, 1995
2. Biji, M.; Biji, El., Statistica teoretică, Editura Didactică şi Pedagogică, Bucureşti, 1979
3. Jaba, E., Statistica, Ediţia a treia, Editura Economica, Bucureşti, 2002
4. Jemna, D.V., Econometrie, Editura Sedcom Libris, Iaşi, 2009
5. Mills, Fr.G., Statistical Methods, 3rd ed., Henry Holt, New York, 1955.
6. McNabb, D., Research methods in public administration and nonprofit management : quantitative
and qualitative approaches, Armonk, M.E. Sharpe, 2002
7. Yule, U.G.; Kendall, M.C. - Introducere în teoria statisticii, Editura Ştiinţifică, Bucureşti, 1969.
8. Wonnacott, T.H., Wonnacott, R.J., Statistique, Economica, Paris, 1991.
Inferenţa statistică are ca obiectiv cunoaşterea unei populaţii în mod indirect, prin
prelucrarea datelor la nivelul unui eşantion reprezentativ extras din aceasta, după o metodă care
asigură proprietatea de reprezentativitate (aşa cum este metoda extragerii aleatoare). Inferenţa
statistică presupune estimarea parametrilor unei populaţii şi testarea ipotezelor statistice.

5.1. Populaţie şi eşantion

Observarea şi înregistrarea valorilor unei variabile pentru toate unităţile populaţiei


presupune o observare exhaustivă, totală. Acest procedeu se aplică, de exemplu, în cazul
recensământului unei populaţii, când sunt înregistrate mai multe caracteristici ale populaţiei (vârsta,
categoria socio-profesională, sexul persoanei etc.), la un moment de referinţă. Volumul unei
populaţii se notează cu N.
Observarea şi înregistrarea valorilor unei variabile pentru anumite unităţi statistice extrase
dintr-o populaţie presupune o observare parţială. În acest caz, se observă doar un eşantion
reprezentativ extras din populaţie. Inferenţa statistică are ca obiectiv cunoaşterea unei populaţii în
mod indirect, prin prelucrarea datelor la nivelul unui eşantion extras din aceasta. Volumul
eşantionului se notează cu n. Avantajele cercetării prin sondaj decurg, în principal, din costurile
reduse de obţinere a datelor statistice.

5.2. Parametri, estimatori, estimaţii

Parametrii reprezintă mărimi reale dar necunoscute prin care poate fi caracterizată o
populaţie. De exemplu, o populaţie poate fi caracterizată folosind un indicator al tendinţei centrale,
cum ar fi media populaţiei (  ), şi un indicator al dispersiei, cum ar fi abaterea medie pătratică (  ).
Aceste mărimi sunt estimate prin prelucrarea datelor înregistrate la nivelul unui eşantion,
proces în urma căruia se obţin estimaţii ale parametrilor populaţiei. De exemplu, prin înregistrarea
valorilor unei variabile la nivelul unui eşantion, pot fi calculate media eşantionului ( x ) şi abaterea
medie pătratică ( s ). Notaţiile folosite pentru definirea parametrilor şi estimaţiilor sunt prezentate
în tabelul de mai jos.

Estimaţii Parametri
(eşantion) (populaţie)
Media x 
Varianţa s2 2
Abaterea standard s 
Proporţia f p

Estimatorul este o variabilă aleatoare (o variabilă teoretică, construită matematic) care


permite realizarea procesului de estimare, în baza unor proprietăţi pe care le poartă. Un estimator
este o funcţie de variabile aleatoare de selecţie şi se notează, de regulă, cu semnul „^” deasupra
parametrului respectiv. De exemplu, estimatorul mediei se notează ̂ , al varianţei ̂ 2 , iar al
proporţiei p̂ .

5.3. Distribuţii de selecţie


O distribuţie de selecţie este distribuţia unui estimator. Pentru a forma distribuţia mediei de
selecţie, să considerăm cele k eşantioane de volum n care se pot extrage dintr-o populaţie de volum
N. Pentru fiecare din cele k eşantioane, se pot calcula mediile eşantioanelor şi se pot determina
frecvenţele de apariţie a fiecărei variante.
Distribuţia de selecţie a mediei

De exemplu, să considerăm o populaţie formată din 5 persoane pentru care se înregistrează


vârsta (ani) şi se obţin următoarele valori: 22, 25, 26, 24, 23.
Caracterizarea acestei populaţii se poate realiza prin calculul unui indicator al tendinţei
centrale, media, de exemplu, şi a unui indicator al dispersiei, cum este abaterea standard:
 X i 22  25  26  24  23
Media populaţiei este:   i   24 ani.
N 5
Abaterea standard este    2 . Varianţa se calculează astfel:
 ( X i   )2 ( 22  24 ) 2  ( 25  24 ) 2  ( 26  24 ) 2  ( 24  24 ) 2  ( 23  24 ) 2
2  i
 2
N 5
Înlocuind în relaţia de mai sus, se obţine:    2  2  1,41 ani.

Considerând această populaţie de volum N=5, se pot forma K  C Nn eşantioane de volum n,


extrase aleator nerepetat (o unitate extrasă şi înregistrată nu se mai reintroduce în populaţie). Dacă
5!
n=2, K  C Nn  C 52   10 eşantioane.
2!( 5  2 )!
Valorile unităţilor celor 10 eşantioane sunt:

Eş. 1 Eş.2 Eş.3 Eş.4 Eş.5 Eş.6 Eş.7 Eş.8 Eş.9 Eş.10
22 22 22 22 25 25 25 26 26 24
25 26 24 23 26 24 23 24 23 23

Pentru fiecare din cele 10 eşantioane, se calculează mediile eşantioanelor, astfel:

22  25 25  24
Eşantionul 1: x1   23,5 Eşantionul 6: x6   24,5
2 2
22  26 25  23
Eşantionul 2: x 2   24 Eşantionul 7: x7   24
2 2
22  24 26  24
Eşantionul 3: x3   23 Eşantionul 8: x8   25
2 2
22  23 26  23
Eşantionul 4: x4   22,5 Eşantionul 9: x9   24,5
2 2
25  26 24  23
Eşantionul 5: x5   25,5 Eşantionul 10: x10   23,5
2 2

Distribuţia mediei de selecţie, ̂ , se formează prin ordonarea mediilor eşantioanelor şi


determinarea probabilităţii (frecvenţei) de apariţie a fiecărei variante:
Tabelul 5.1. Distribuţia variabilei media de selecţie ̂
xi Frecvenţa de pi
apariţie
22,5 I 1/10=0,1
23,0 I 1/10=0,1
23,5 II 2/10=0,2
24,0 II 2/10=0,2
24,5 II 2/10=0,2
25,0 I 1/10=0,1
25,5 I 1/10=0,1
TOTAL - 1

Distribuţia mediei de selecţie este o distribuţie de probabilitate a mediilor tuturor


eşantioanelor de volum n care se pot extrage aleatoriu dintr-o populaţie de volum N.

Caracteristicile variabilei media de selecţie sunt:


- media mediei de selecţie este: M   xi  pi 24 . Media mediei de selecţie este, deci,
i
egală cu media populaţiei (  ).
- varianţa mediei de selecţie este:
V ( ˆ )   2ˆ   xi2  pi  (  xi  pi ) 2 576,75  24 2  0 ,75 . Varianţa mediei de
i i

2 N n
selecţie este egală cu  2ˆ   , în cazul unui sondaj aleator nerepetat. Se
n N
2
demonstrează că în cazul unui sondaj aleator repetat,  2ˆ  
n
- abaterea standard a mediei de selecţie este:
 ˆ   2ˆ   xi2  pi  (  xi  pi )2  0 ,75  0 ,866 .
i i

Tabelul 5.2. Elemente de calcul ale mediei şi varianţei variabilei ̂


xi pi xi  p i x i2 xi2  p i
22,5 0,1 2,25 506,25 50,63
23,0 0,1 2,30 529,00 52,90
23,5 0,2 4,70 552,25 110,45
24,0 0,2 4,80 576,00 115,20
24,5 0,2 4,90 600,25 120,05
25,0 0,1 2,50 625,00 62,50
25,5 0,1 2,55 650,25 65,03
TOTAL 1,0 24,00 - 576,75
Reprezentarea grafică a distribuţiei mediei de selecţie este realizată în figura de mai jos:

25

20

Frequency
15

10

Mean = 24,00
0 Std. Dev. =
0,87039
22,00 23,00 24,00 25,00 26,00 N = 100

VAR00001

Figura 26. Reprezentarea grafică a distribuţiei mediei de selecţie, ̂

După cum se observă, distribuţia mediei de selecţie urmează o lege normală, iar mediile
eşantioanelor „se grupează” în jurul mediei lor, adică a mediei populaţiei.

Variabila media de selecţie se caracterizează prin legea normală - teorema limită centrală,
bazată pe legea numerelor mari:
- dacă variabila aleatoare X urmează o lege normală, atunci ̂ urmează o lege normală
oricare ar fi n;
- dacă variabila aleatoare X nu urmează o lege normală, atunci ̂ urmează o lege normală
doar pentru valori mari ale lui n, de regulă mai mari decât 30.
2
Folosind notaţiile prezentate, putem scrie: ˆ ~ N (  ,  ̂ ) sau ˆ ~ N (  ,
2
).
n
Teste1

1) Într-o cercetare prin sondaj, eşantionul trebuie să respecte condiţia de:


a) omogenitate
b) varianţă minimă
c) reprezentativitate

2) Parametrul reprezintă
a) o valoare fixă şi necunoscută la nivelul unei populaţii
b) o statistică
c) o variabilă cunoscută f(x)

3) Estimatorul reprezintă
a) o valoare fixă şi cunoscută la nivelul unei populaţii
ˆ  f ( x1 , x2 ,...,xN )
b) o valoare de forma
c) o variabilă aleatoare

4) Estimatorul admite
a) o medie
b) o lege de distribuţie
c) un set de valori posibile
d) o valoare fixă cunoscută

5) Estimaţia este
a) o valoare fixă şi cunoscută la nivelul unei populaţii
b) o statistică
c) o valoare calculată pe baza datelor de sondaj
d) o variabilă realizată a estimatorului

1
Răspunsuri: 1 – c; 2 – a; 3 – c; 4 – a,b,c; 5 - c