Documente Academic
Documente Profesional
Documente Cultură
Estimarea parametrilor
unei populaţii (1)
1. Concepte fundamentale
Populaţie
Eşantion
Sondaj aleator simplu
2. Estimatori. Proprietăţile estimatorilor
Parametru. Estimator. Estimaţie
Media de selecţia
1
5.1. Populaţie. Eşantion
Populaţia
ansamblul tuturor elementelor
Volumul populaţiei se notează cu N
Variabila de distribuţie a populaţiei este variabila X
Eşantionul
subansamblu de elemente extrase, după principiile
selecţiei, din populaţia pe care vrem să o cunoaştem
Volumul eşantionului se notează cu n
Variabila X este observată la nivelul eşantionului extras
din populaţie.
2
5.1. Populaţie. Eşantion
Selecţia
selecţia (extragerea) unităţilor eşantionului din
populaţie se poate realiza:
• în mod aleator, după jocul hazardului (principiul
selecţiei aleatoare);
• după un criteriu prestabilit (principiul selecţiei
raţionate).
3
5.1. Populaţie. Eşantion
N=800
n=40
Selectăm:
003,364,720,
433,463,363,
109,592,470,
705, etc.
Nu selectăm:
884, 919, 941,
etc. deoarece
N=800.
5
5.1. Populaţie. Eşantion
Sondaje neprobabilistice
În sondajele neprobabilistice nu se cunoaşte
probabilitatea tuturor eşantioanelor posibil de extras.
6
5.1. Populaţie. Eşantion
N!
k C Nn
n!( N n)!
• în cazul eşantionării aleatoare repetate (schema urnei
cu revenire):
n
kN
7
Exemplu
8
5.2. Parametru. Estimator.
Estimaţie
Parametrul ( )
ex:
• - media variabilei X la nivelul populaţiei
2
• - dispersia variabilei X la nivelul populaţiei
• π - proporția unei categorii la nivelul populației
9
5.2. Parametru. Estimator.
Estimaţie
Estimatorul ( ˆ )
10
5.2. Parametru. Estimator.
Estimaţie
X1 X2 Xn
12
5.2. Parametru. Estimator.
Estimaţie
Estimatorul ( ˆ )
13
5.2. Parametru. Estimator.
Estimaţie
ˆ : ( x1 , x2 , , xk )
14
5.2. Parametru. Estimator.
Estimaţie
15
5.2. Parametru. Estimator.
Estimaţie
ˆ : ( p1 , p2 , , pk )
16
5.2. Parametru. Estimator.
Estimaţie
Estimaţia
Estimaţia
Media populaţiei:
N 4
x3 2 1 4 10
i
i 1
2,5
N 4 4
19
Exemplu: Distribuţia de selecţie
a mediei
i 1
N
Deci,
20
Exemplu: Distribuţia de selecţie
a mediei
k N n 42 16 esantioane
21
Exemplu: Distribuţia de selecţie
a mediei
Medile pemtru toate cele k=16 eşantioane de volum n=2
extrase din populaţia de volum N=4:
22
Exemplu: Distribuţia de selecţie
a mediei
Media Nr. eşantioane
eşantionului
1 1
1,5 2
2 3
2,5 4
3 3
3,5 2
4 1
Total 16
1. Nedeplasare
- un estimator este nedeplasat (fără biais) dacă media
sa este egală cu valoarea parametrului M (ˆ)
24
5.3. Proprietăţile estimatorilor
2. Convergenţă în probabilitate
Un estimator este convergent dacă varianţa
estimatorului tinde spre 0, atunci când volumul
eşantionului tinde spre
lim V (ˆ) 0
n
25
5.3. Proprietăţile estimatorilor
3. Eficienţa
- Estimatorul cu varianţa minimă este un estimator
eficient.
26
5.3. Proprietăţile estimatorilor
ˆ M (ˆ )
n n
rep
Z ~ N (0,1)
V (ˆ)
n nN
27
5.3. Proprietăţile estimatorului media
de selecţie
Proprietăţile estimatorului ̂
Daca
ˆ ~ N ( , 2ˆ ) Z ~ N ( 0 ,1)
X2
ˆ ~ N ( , )
n
ˆ ˆ
29 Z
ˆ X n
5.3. Proprietăţile estimatorului media
de selecţie
Proprietăţile estimatorului ̂
30
5.3. Proprietăţile estimatorului media
de selecţie
Distribuţia estimatorului ̂
31
32
5.3. Proprietăţile estimatorului media
de selecţie
Distribuţia estimatorului ̂
33
Exemplu - Distribuţia estimatorului ̂
Exemplul 11.1
Elisabeta JABA, Statistica, ediţia a 3-a, Ed.
Economică, Bucureşti, 2002, pp. 293-296.
34
5.3. Proprietăţile estimatorului
varianţa de selecţie
Proprietăţile estimatorului ̂ 2
Estimator deplasat:
M ˆ 2 2
(media estimatorului nu este egală cu parametrul)
2
n 1 2
M ( ˆ )
2 2
n n
35
5.3. Proprietăţile estimatorului
varianţa de selecţie
36
5.3. Proprietăţile estimatorului
proporţia de selecţie
Proprietăţile estimatorului ˆ
Estimator nedeplasat: M (ˆ )
(1 )
Estimator convergent: V (ˆ )
n
ˆ
Z ~ N ( 0 ,1 )
(1 )
n
37
5.3. Proprietăţile estimatorului media
de selecţie
Proprietăţile estimatorului ˆ
(1 )
ˆ ~ N ( , )
n
38
5. Estimarea parametrilor
unei populaţii (2)
1. Estimarea punctuală
Definiţie
2. Estimarea prin interval de încredere
Definire IC
IC pentru media unei populaţii
IC pentru proporţie
Calculul volumului eşantionului
39
5.4. Estimarea parametrilor unei
populaţii
40
5.4. Estimarea punctuală a unui
parametru
41
5.4. Estimarea parametrilor unei
populaţii
populatiei
populatiei
a populatiei
populatiei
42
Parametru – Estimator – Estimaţie
5.4. Estimarea prin interval de
încredere a unui parametru
P( Li Ls ) ( 1 ) , unde ( 0 ,1 )
ˆ
unde Z
/ n
45
5.4. Estimarea mediei prin interval de
încredere
x
Pe baza mediei determinate la nivelul eşantionului
trebuie să determinăm limitele intervalului de
încredere care, cu o probabilitate 1 , acoperă
valoarea adevărată a parametrului .
x
P( z / 2 z / 2 ) 1
/ n
46
5.4. Estimarea mediei prin interval de
încredere
47
5.4. Estimarea mediei prin interval de
încredere
x
P( z / 2 z / 2 ) 1
/ n
P( x z / 2 x z / 2 ) 1
n n
( Li x z / 2 ) ( Ls x z / 2 )
n n
Cu o probabilitate (1 ) , parametrul μ este “acoperit” de
intervalul [Li ; Ls]
48
5.4. Estimarea mediei prin interval de
încredere
• Se cunoaşte parametrul
( x z / 2 ) ( x z / 2 )
n n
49
5.4. Estimarea mediei prin interval de
încredere
(1 ) (1 0,05) 0,95
( z ) 0,475 Tabelul
z / 2 1,96
Laplace
2 2 2
z 0,06
1,9 0,475
50
5.4. Estimarea mediei prin interval de
încredere
(1 ) (1 0 ,10) 0 ,90
( z ) 0 ,450 z / 2 1,64
Tabelul Laplace
2 2 2
z 0,04
1,6 0,4495
-1,64 +1,64
51
52
5.4. Estimarea mediei prin interval de
încredere
• Νu se cunoaşte parametrul
• Se utilizează estimatorul nedeplasat ˆ '2 şi
variabila Student:
ˆ
t ~ t( n 1 )
ˆ
'
n
53
5.4. Estimarea mediei prin interval de
încredere
• Νu se cunoaşte parametrul
s' s'
( x t / 2;n 1 ) ( x t / 2;n 1 )
n n
2
( xi x )
s'
unde n 1 abaterea standard la
nivelul esantionului
54
5.4. Estimarea mediei prin interval de
încredere
Prob. 0,025
(n-1)
1
...
1,96
55
5.4. Estimarea mediei prin interval de
încredere
56
5.4. Estimarea mediei prin interval de
încredere
57
Exemplul 1a
La nivelul unui eşantion format din 20 de persoane,
extras aleator simplu repetat, s-au obţinut următoarele
rezultate privind vârsta (ani):
x 32 ani
Se stie ca la nivelul populatiei,
2 ani.
58
Estimarea prin IC a mediei μ
• Se cunoaşte parametrul
( x z / 2 ) ( x z / 2 )
n n
59
5.4. Estimarea mediei prin interval de
încredere
• Se cunoaşte parametrul
Cu o probabilitate de
( x 1,96 ) ( x 1,96 ) 95%, putem afirma ca
n n varsta medie la
2 2 nivelul populatiei
(32 1,96 ) (32 1,96 )
20 20 este acoperita de
2 intervalul [31,14;
(32 1,96 ) 32,86] ani.
20
(32 1,96 0 ,44)
(32 0 ,8624)
(32 0 ,8624) (32 0 ,8624)
60 31,1376 32 ,8624
Exemplul 1b
La nivelul unui eşantion format din 20 de persoane,
extras aleator simplu repetat, s-au obţinut următoarele
rezultate privind vârsta (ani):
x 32 ani
Se stie ca la nivelul populatiei,
2 ani.
61
5.4. Estimarea mediei prin interval de
încredere
• Se cunoaşte parametrul
Cu o probabilitate de
90%, putem afirma ca
( x 1,64 ) ( x 1,64 )
n n varsta medie la
2 2 nivelul populatiei
(32 1,64 ) (32 1,64 ) este acoperita de
20 20 intervalul [31,28;
(32 1,64
2
) 32,72] ani.
20
(32 1,64 0 ,44)
(32 0 ,7216)
(32 0 ,7216) (32 0 ,7216)
62
31,2784 32 ,7216
Exemplul 1c
La nivelul unui eşantion format din 100 de persoane,
extras aleator simplu repetat, s-au obţinut următoarele
rezultate privind vârsta (ani):
x 32 ani
Se stie ca la nivelul populatiei,
2 ani.
63
5.4. Estimarea mediei prin interval de
încredere
• Se cunoaşte parametrul
Cu o probabilitate de
95%, putem afirma ca
( x 1,96 ) ( x 1,96 )
n n varsta medie la
2 2 nivelul populatiei
(32 1,96 ) (32 1,96 ) este acoperita de
100 100
intervalul [31,61;
2 32,39] ani.
(32 1,96 )
100
(32 1,96 0 ,2)
(32 0 ,392)
(32 0 ,392) (32 0 ,392)
64 31,61 32 ,39
Exemplul 1d
La nivelul unui eşantion format din 20 de persoane,
extras aleator simplu repetat, s-au obţinut următoarele
rezultate privind vârsta (ani):
x 32 ani
Se stie ca la nivelul populatiei,
1 an.
65
5.4. Estimarea mediei prin interval de
încredere
• Se cunoaşte parametrul
Cu o probabilitate de
95%, putem afirma ca
( x 1,96 ) ( x 1,96 )
n n varsta medie la
1 1 nivelul populatiei
(32 1,96 ) (32 1,96 ) este acoperita de
20 20
intervalul [31,57;
1 32,43] ani.
(32 1,96 )
20
(32 1,96 0 ,22)
(32 0 ,4312)
(32 0 ,4312) (32 0 ,4312)
66 31,57 32 ,43
Exemplul 2
La nivelul unui eşantion format din 20 de persoane,
extras aleator simplu repetat, s-au obţinut următoarele
rezultate privind vârsta (ani):
x 32 ani; s' 2 ani.
67
Estimarea prin IC a mediei μ
• Νu se cunoaşte parametrul
s' s'
( x t / 2;n1 ) ( x t / 2;n1 )
n n
2
( xi x )
• unde s'
n 1
68
Exemplu
s'
IC este ( x t0.025;19 )
n
69
Valorile distribuţiei Student
19 2,093
∞ 1,96
70
Exemplu
IC devine:
s' 2
( x t0.025;19 ) (32 2,093 )
n 20
(32 2,093 0,4472) (32 0,936) (31,064; 32,936)
72
Estimarea mediei prin IC
- Exemplu Excel
educatie
X – Educatie (ani)
Mean 13.4916
Standard Error 0.1325
Median 12
x 13,49 ani Mode 12
Standard Deviation (s’) 2.8848
s' 2,88ani Sample Variance (s’2) 8.3223
Kurtosis -0.2650
n 474 angajati Skewness -0.1141
Range 13
2
( xi x ) Minimum 8
s' Maximum 21
n 1 Sum 6395
Count 474
Confidence Level (95.0%) 0.260372
73
Estimarea mediei prin IC
- Exemplu Excel
educatie
Eroarea de reprezentativitate (Std. Error)
s' 2,8848 Mean 13.4916
0,1325 Standard Error 0.1325
n 474 Median 12
Mode 12
Eroarea maxima admisibila Standard Deviation 2.8848
s' Sample Variance 8.3223
ˆ t / 2;n1 Kurtosis -0.2650
n Skewness -0.1141
s' Range 13
ˆ t0.025; 473 Minimum 8
n Maximum 21
Sum 6395
ˆ 1,96 0.1325 Count 474
Confidence Level
ˆ 0,26 (95.0%) 0.260372
74
Estimarea mediei prin IC
- Exemplu Excel
educatie
IC 95% al mediei
Mean 13.4916
Standard Error 0.1325
s' s' Median 12
( x t / 2;n1 ) ( x t / 2;n1 ) Mode 12
n n Standard Deviation 2.8848
Sample Variance 8.3223
(13,49 0,26) (13,49 0,26) Kurtosis -0.2650
13,23 13,75 Skewness -0.1141
Range 13
Se poate garanta cu o probabilitate de Minimum 8
95% că nivelul mediu de studii al populaţiei Maximum 21
din care a fost extras eşantionul este Sum 6395
acoperit de intervalul (13,23; 13,75) ani. Count 474
Confidence Level
(95.0%) 0.260372
75
Estimarea mediei prin IC
- Exemplu Excel
educ
IC 90% al mediei
Eroarea maxima admisibila Mean 13.492
Standard Error 0.133
s'
ˆ t / 2;n1 Median 12
n Mode 12
Standard Deviation 2.885
s'
ˆ t0.05; 473 Sample Variance
Kurtosis
8.322
-0.265
n
Skewness -0.114
2.885
ˆ 1,645
Range 13
Minimum 8
474 Maximum 21
ˆ 1,645 0.133 Sum 6395.000
Count 474.000
ˆ 0,22 Confidence
Level(90.0%) 0.22
76
Estimarea mediei prin IC
- Exemplu Excel
educ
IC 90% al mediei
Mean 13.492
Standard Error 0.133
( x ) Median 12
Mode 12
( x ) ( x ) Standard Deviation 2.885
Sample Variance 8.322
(13,49 0,22) (13,49 0,22) Kurtosis -0.265
13,27 13,71
Skewness -0.114
Range 13
Se poate garanta cu o probabilitate de Minimum 8
90% că nivelul mediu de studii al populaţiei Maximum 21
din care a fost extras eşantionul este Sum 6395.000
acoperit de intervalul (13,27; 13,71) ani. Count 474.000
Confidence
Level(90.0%) 0.22
77
Estimarea mediei prin IC
- Exemplu SPSS
Descriptives
X – Educatie (ani) Educational Level (years) Statistic
Std.
Error
Mean 13.49 0.133
Lower
13.23
95% Confidence Interval for Bound
Mean Upper
x 13 ,49 ani Bound
13.75
5% Trimmed Mean 13.48
s ' 2 ,885 ani Median 12.00
Variance 8.322
n 474 angajati Std. Deviation 2.885
Minimum 8
Maximum 21
Range 13
Interquartile Range 3
Skewness -.114 .112
Kurtosis -.265 .224
78
Estimarea mediei prin IC
- Exemplu SPSS
Descriptives
Std.
Educational Level (years) Statistic
Error
Mean 13.49 0.133
Eroarea de reprezentativitate Lower
13.23
95% Confidence Interval for Bound
(Std. Error) Mean Upper
13.75
Bound
s' 2,885
0,133
5% Trimmed Mean 13.48
Median 12.00
n 474 Variance 8.322
Std. Deviation 2.885
Minimum 8
Maximum 21
Range 13
Interquartile Range 3
Skewness -.114 .112
Kurtosis -.265 .224
79
Estimarea mediei prin IC
- Exemplu SPSS
Descriptives
IC 95% al mediei Educational Level (years) Statistic
Std.
Error
s' Mean 13.49 0.133
( x t / 2 ; n 1 ) Lower
13.23
n 95% Confidence Interval for Bound
Mean Upper
13.75
2 ,885 Bound
(13 ,49 t 0 ,025 ; 473 ) 5% Trimmed Mean 13.48
474 Median 12.00
(1 )
ˆ ~ N ( , )
n
I.C. pentru proporţia unei populaţii (parametrul )
este:
p (1 p ) p (1 p )
( p t / 2 ) ( p t / 2 )
n n
81
Estimarea prin IC a proporţiei
.
82
Exemplu:
În urma realizării unui sondaj electoral la nivelul unui
eşantion format din 1500 persoane, s-a constatat că
840 persoane au votat pentru candidatul A. Să se
estimeze prin interval de încredere proporţia
persoanelor care votează pentru candidatul A la nivelul
întregii populaţii, considerând un risc de 0,05.
83
Exemplu:
84
(1 ) 0 ,97
( z ) 0 ,485 z / 2 , 2 ,17
Tabelul Laplace
2 2
( x 2.17 ) ( x 2.17 )
x : n n
2
(8.5 2.17 )
900
2
(8.5 2.17 ) (8.5 0.145)
30
(8.5 0.145;8.5 0.145)
(8,355;8,645)
8,355 8,645
85
IC 97% : [8,355; 8,645]
10% / 2 5%
p (1 p ) 0 ,625 (1 0 ,625)
( p t / 2 ) 0 ,625 1,645
p : n 400
0.625 0.04 (0 ,58; 0 ,66)
t / 2;( n1) t0 ,05;399 1,645