Sunteți pe pagina 1din 16

Estimarea parametrilor populatiei.

Intervale de incredere
x
Populatie:
M(X) sau

2
p
Esantion

S2
w
Inferenta statistica
X
este o variabil aleatoare creia i se poate stabili legea de
distribuie.

dac volumul eantionului este suficient de mare media de
sondaj urmeaz o distribuie normal a crei medie este chiar
media populaiei totale.


Dispersia mediilor de sondaj n jurul mediei din populaia total
este egal cu raportul dintre dispersia din populaia total i
volumul eantioanelor de aceeai mrime n:

Se numeste eroare de reprezentativitate


Daca nu se cunoaste dispersia in populatie
X ) x M(
i
=
( ) 0 X x
n
1 i
i
=

=
n

2
2
x
i
=
n
S

i
x
=
n

i
x
=
i
x
0,025
X
x
o
x
o
1.96 1.96
x
1.96 1.96
x
o
x
o
Intervalul de incredere al unui parametru =un interval de valori care ne
asteptam sa includa si parametrul din populatie. Punctele limita ale
intervalului sunt calculate pe baza datelor din esantion
n practic ns nu procedm la extragerea tuturor eantioanelor posibile i ne mulumim cu un
singur eantion construit cu respectarea ct mai riguroas a unor anumite condiii. n acest caz, media
eantionului se poate abate mai mult sau mai puin de la media populaiei, fapt ce determin
necesitatea indicrii unui interval de ncredere despre care se poate afirma cu o probabilitate sau
siguran cunoscut c acoper valoarea mediei din colectivitatea total. Limitele intervalului de
ncredere, cea minim u
iinf
i cea maxim u
sup
se calculeaz n funcie de datele de sondaj x
1
, x
2
, , x
n

astfel nct, cu un grad mare de siguran, garantat de probabilitatea 1-o pentru parametrul populaiei,
se ndeplinete relaia: ( ) ( ) z X P o u u = = < < 1
sup inf

Intervalul ( )
sup inf
,u u reprezint intervalul de ncredere i definete precizia estimaiei.
Probabilitatea (1-o ) caracterizeaz sigurana cu care se afirm c intervalul de ncredere cuprinde
valoarea parametrului populaiei. Cu ct intervalul ( )
sup inf
,u u este mai mic i probabilitatea (1-o ) mai
mare cu att avem o estimaie mai precis cu privire la valoarea parametrului. Intervalul ( )
sup inf
,u u
este o mrime aleatoare, limitele sale fiind dependente de datele fiecrei selecii, motiv pentru care,
pentru o aceeai populaie, valorile limitelor variaz de la o selecie la alta att ca mrime ct i ca
poziie.
La construirea estimaiilor, un rol important, pe lng nivelul de siguran, l joac mrimea
intervalului de ncredere. Cele dou mrimi se afl ntr-o relaie de coresponden bine determinat.
Dac eroarea de sondaj se distribuie dup legea normal atunci erorile egale n valoare absolut cu
probabilitile de apariie i pentru acelai volum al eantionului probabilistic ce alctuiesc intervale
( )
sup inf
,u u
se pot separa n dou pri egale iar jumtatea intervalului este eroarea limit admis.
Precizia estimaiei, probabilitatea de ncredere i intervalul de ncredere se discut pe baza
inegalitii lui Cebev, prin care se demonstreaz c media de sondaj x pentru un volum mare al
eantionului converge n probabilitate ctre
0
X media populaiei, ceea ce semnific faptul c x este
un estimator corect al mediei populaiei (nedeplasat, consistent i eficient). Sigurana estimrii este
dat de probabilitatea cu care este ndeplinit inegalitatea:
( ) mic de suficient 0, unde z > = < o | o X x .
Aceast probabilitate este dat dinainte i este foarte apropiat de unitate.
( ) ( ) z | o = < X x P sau ( ) ( ) z | o o = + < < x X x P (4. 1.1.)
Intervalul ( ) o o + x x , care acoper parametrul X cu o probabilitate ( ) z | se numete
interval de ncredere . n vederea stabilirii expresiei intervalului de ncredere pentru media X trebuie
definit variabila de sondaj:
x
X x
z
o

= unde
x
o este eroarea medie de reprezentativitate. Din relaia 4.1.1 avem:
( ) ( )
|
|
.
|

\
|
=
|
|
.
|

\
|
<

<
< < = <
x x x x
X x
P
X x P X x P
o
o
|
o
o
o o
o
o o o
2


x x
x
z unde A = = = o o
o
o
z reprezint eroarea limit maxim admis.
Estimarea parametrilor populaiei totale pe baza valorilor de sondaj
Sondaj simplu aleator cu revenire
Pentru estimarea mediei populaiei se pornete de la estimatorul media de sondaj i eroarea limit
maxim admis calculat pe baza erorii de reprezentativitate n funcie de tipul sondajului
aplicat:
x x
x X x A + < < A unde
x x
o = A z ;
n

i
x
=
Uneori trebuie estimat pornind de la datele sondajului valoarea caracteristicii agregate pe ntreaga
populaie X N X
N
i
i
=

=1
. nmulind fiecare membru al inegalitii cu N obinem: ) ( ) (
x x
x N X N x N A < < A
Pentru estimarea unei proporii se pornete de la estimatorul w proporia celor din eantion ce
ndeplinesc caracteristica i eroarea limit maxim admis ce depinde de eroarea de reprezentativitate i
probabilitatea de garantare a rezultatelor.
w w
w p w A + < < A . Unde
w w
o = A z
n
w w
n
p p
w
) 1 ( ) 1 (
~

= o
Pentru estimarea dispersiei populaiei . se utilizeaz ca estimator al acesteia, dispersia de sondaj
calculat pe baza valorilor x
i
cu i= 1,,n.
n
x x
S
n
i
i
=

=
1
2
2
) (
estimatorul dispersiei

2
2 4
2
n
S

o

= eroarea de reprezentativitate
n
z z
S S
2
2 4
2 2

o

= = A eroarea limita
2 2
2 2 2
S S
S S A + < < A o intervalul de incredere
Estimarea parametrilor populaiei totale pe baza valorilor de sondaj
Sondaj simplu aleator cu fara revenire
Pentru estimarea mediei populaiei se pornete de la estimatorul media de sondaj i eroarea limit
maxim admis calculat pe baza erorii de reprezentativitate n funcie de tipul sondajului
aplicat:
x x
x X x A + < < A unde
x x
o = A z ; |
.
|

\
|
=
N
n
1
n

i
x

Uneori trebuie estimat pornind de la datele sondajului valoarea caracteristicii agregate pe ntreaga
populaie X N X
N
i
i
=

=1
. nmulind fiecare membru al inegalitii cu N obinem: ) ( ) (
x x
x N X N x N A < < A
Pentru estimarea unei proporii se pornete de la estimatorul w proporia celor din eantion ce
ndeplinesc caracteristica i eroarea limit maxim admis ce depinde de eroarea de reprezentativitate i
probabilitatea de garantare a rezultatelor.
w w
w p w A + < < A . Unde
w w
o = A z |
.
|

\
|

~ |
.
|

\
|

=
N
n
n
w w
N
n
n
p p
w
1
) 1 (
1
) 1 (
o
Pentru estimarea dispersiei populaiei . se utilizeaz ca estimator al acesteia, dispersia de sondaj
calculat pe baza valorilor x
i
cu i= 1,,n.
n
x x
S
n
i
i
=

=
1
2
2
) (
estimatorul dispersiei
1
2
2 4
2 |
.
|

\
|

=
N
n
n
S

o eroarea de reprezentativitate
n
z z
S S
2
2 4
2 2

o

= = A eroarea limita
2 2
2 2 2
S S
S S A + < < A o intervalul de incredere
Estimarea parametrilor populaiei totale pe baza valorilor de sondaj
Sondaj de volum redus
Pentru o variabil cantitativa relaiile folosite sunt:

n
2
x

=
1
S

2
x

=
n
.
Pentru o variabil calitativ relaiile folosite sunt:
1
) 1 ( ) 1 (

=
n
w w
n
p p
w
o

|
.
|

\
|

~
|
.
|

\
|
=
N
n
n
S
N
n
n
x
1
1
1
2
2
o
o i

|
.
|

\
|

~
|
.
|

\
|

=
N
n
n
w w
N
n
n
p p
w
1
1
) 1 (
1
) 1 (
o
Estimarea mediei din populaia total se realizeaz cu ajutorul relaiei:
x x
x X x A + < < A pentru variabil cantitativ i
w w
w p w A + < < A pentru variabil calitativ.
Sondajul in populatii neomogene.
Sondajul Stratificat
Populatii neomogene imposibilitatea aplicarii SSA esantionare stratificata
Avantajele stratificrii:
1. Stratificarea asigur un grad mai mare de reprezentativitate i de
precizie a rezultatelor.



2. Dac stratificarea se realizeaz pe criterii geografice culegerea datelor
se poate face cu specialiti locali, reducnd astfel costul. Mai mult, se
pot analiza i interpreta datele iniial pe fiecare strat i ulterior pe
ntreaga populaie.

2 2 2
o o o + =
Problemele organizatorice
A. Criteriile de delimitare a straturilor : calitative:
cantitative.
Alegerea caracteristicilor dup care se face stratificarea este foarte important.

B. Numrul straturilor

1. Fecare subeantion constituit trebuie s aib un numr suficient de mare de
uniti astfel nct s permit estimarea mediei i dispersiei fiecrui strat;
2. Populaia este deja mprit din punct de vedere administrativ n subpopulaii
pentru care putem obine cu uurin baze de sondaj pentru fiecare strat;
3. sporul preciziei adus de un numr mare de straturi s nu fie anihilat de
creterea cheltuielilor de resurse de timp, financiare i umane.
C. Repartizarea eantionului pe straturi
1. neproporional obinndu-se un sondaj stratificat neproporional sau
simplu;
2. proporional respectndu-se ponderea fiecrui strat n total populaie
obinndu-se un sondaj stratificat proporional;
3. innd cont att de proporia fiecrui strat n total ct i de gradul de variaie
al fiecrui strat obinndu-se un sondaj stratificat optim.
TIP SONDAJ
Tip variabil
SSAR SSAFR
cantitativ
2
2 2
2
2 2
x x
S z z
n
A
~
A
=
o

N
S z
S z
N
z
z
n
x x
2
2
2 2
2 2
2
2 2
+ A
~
+ A
=
o
o

alternativ
2
2 2
2
2 2
p
p
p
p
S z z
n
A
~
A
=
o

N
S z
S z
N
z
z
n
p
x
p
p
x
p
2
2
2 2
2 2
2
2 2
+ A
~
+ A
=
o
o


Volumul esantionului. Observatii
Volum mai mare de informatii (cunoaterea gradului de variaie pentru fiecare strat
pentru a putea calcula variaia determinat de factorii ntmpltori).
Dac nu avem informaii despre gradul de variaie al fiecrui strat putem organiza o
anchet pilot pe eantioane de volum redus pentru a estima valoarea dispersiilor.
2 2
o o <

n SSA > n SSTR
Sondaj stratificat simplu (neproporional)
A) pentru caracteristicile cantitative.
Considerm o populaie C de volum N mprit n k straturi.








unde k este numrul de straturi
N1, N2,.. Nk, reprezint volumul straturilor n populaia total i
n1, n2,.. nk, reprezint volumul straturilor n eantion i
Xij nivelurile caracteristicii cantitative.
C
1
(X
11
, X
21
,.., X
N11
) C
1
(x
11
, x
21
,.., x
n11
)
C
2
(X
12
, X
22
,.., X
N22
) C
1
(x
12
, x
22
,.., x
n22
)

C
k
(X
1k
, X
2k
,.., X
Nkk
) C
1
(x
1k
, x
2k
,.., x
nkk
)

Populaie
N
Eantion
n
S
T
R N
1
A
T

1

1

S
T
R N
2

A
T

2

1

S
T
R N
3

A
T

3

n
1

n
2
n
3

N
X
X
k
i
N
j
ij
j

= =
=
1 1
0

=
=

=
k
i
i
k
i
i i
N
N X
X
1
1
0
n
x
x
k
i
n
j
ij
j

= =
=
1 1
0

=
=

=
k
i
i
k
i
i i
n
n x
x
1
1
0

=
=

=
k
i
i
k
i
i i
N
N x
x
1
1
0
~
Calculul erorilor de reprezentativitate sondaj stratificat neproportional

= =

~ =
k
i
i
i i
k
i
i
i i
x
n
S
N
N
n N
N
1
2
2
2
1
2
2
2
~
1
o
o

= =
|
|
.
|

\
|

~
|
|
.
|

\
|

=
k
i
i
i i
i
i i
k
i
i
i i
i
i i
x
N
n N
n
S
N
N
N
n N
n N
N
1
2
2
2
1
2
2
2
~
1 1 1
o
o
Pentru simplificarea relaiilor de calcul n cazul n care subeantioanele sunt de volum normal
nu se justific mprirea la ni-1 fa de cea la ni. Totodat, dac volumul fiecrui strat Ni este
suficient de mare numitorul coeficientului de corecie poate rmne Ni n loc de Ni-1.
Dac prezint interes i analiza pe fiecare strat n parte
1
2 2

~ =
i
i
i
i
x
n
S
n
i
o
o
|
|
.
|

\
|

~
|
|
.
|

\
|

=
1 1 1
2 2
i
i i
i
i
i
i i
i
i
x
N
n N
n
S
N
n N
n
i
o
o

=
=
k
i
x
i
x
i
N
N
1
2
2
2
~
o o
Sondaj stratificat proportional

= =

~ =
k
i
i
i i
k
i
i
i i
x
n
S
n
n
n n
n
1
2
2
2
1
2
2
2
~
1
o
o

= =
|
|
.
|

\
|

~
|
|
.
|

\
|

=
k
i
i
i i
i
i i
k
i
i
i i
i
i i
x
N
n N
n
S
n
n
N
n N
n n
n
1
2
2
2
1
2
2
2
~
1 1 1
o
o
Dac prezint interes i analiza pe fiecare strat n parte
1
2 2

~ =
i
i
i
i
x
n
S
n
i
o
o
|
|
.
|

\
|

~
|
|
.
|

\
|

=
1 1 1
2 2
i
i i
i
i
i
i i
i
i
x
N
n N
n
S
N
n N
n
i
o
o

=
=
k
i
x
i
x
i
n
n
1
2
2
2
~ o o
N
n
N
n
N
n
N
n
N
n
N
n
k
i
i
k
i
i
k
k
i
i
= = = = =

=
=
1
1
2
2
1
1
.... ....

=
=

=
k
i
i
k
i
i i
n
n x
x
1
1
0
~
Avantajele sondajului stratificat proporional fa de cel neproporional

1. se evit riscul de a subevalua n eantion straturile mai mari;
2. se mrete gradul de precizie al estimaiei fa de stratificarea
neproporional.
Sondaj stratificat optim
Erorile de reprezentativitate vezi sondajului neproporional

=
=

= =

= =

k
i
i i
k
i
i
k k
k
i i
i
N
n
N
n
N
n
N
n
N
n
1
1
2 2
2
1 1
1
.... ...
o
o o o o
n
N
N
n
k
i
i i
i i
i
=

=1
o
o

S-ar putea să vă placă și