Sunteți pe pagina 1din 6

CAPITOLUL 7

CERCETAREA STATISTICĂ PRIN SONDAJ

7.1 SINTEZE TEORETICE

 Selecţia statistică reprezintă operaţia de extragere a unei părţi dintr-o colectivitate statistică, a unei
subcolectivităţi numită şi eşantion, mostră, colectivitate parţială sau colectivitate de selecţie.
 Evident, volumul eşantionului este întotdeauna mai mic decât cel al colectivităţii generale (totale).
Vom nota, atunci, volumul colectivităţii generale cu N şi volumul colectivităţii de selecţie cu n, 1  n 
N-1.
 Atunci când toate elementele unei colectivităţi sunt măsurate, orice indicator statistic ce caracterizează
repartiţia statistică este numit parametru; un indicator statistic calculat pentru datele provenite dintr-un
eşantion se numeşte estimator (statistică); estimatorul calculat pentru un eşantion oferă o estimaţie a
parametrului din populaţia generală.
 Media aritmetică, principalul indicator al tendinţei centrale, va fi notat cu  , în cazul în care este
parametrul colectivităţii totale, şi cu x , în cazul în care este un indicator obţinut printr-o cercetare
statistică prin sondaj.
 Dispersia se va nota cu  2 , dacă este parametru obţinut în colectivitatea generală, şi cu s2 dacă este
estimatorul parametrului, obţinut pe un eşantion.
 În cazul caracteristicilor binare (de tip alternativ), simbolurile perechi utilizate pentru parametrii
din populaţia generală şi pentru estimatorii obţinuţi în eşantion vor fi: pentru media aritmetică: parametrul
colectivităţii generale p; estimatorul obţinut în eşantion w; dispersia caracteristicii alternative se va nota
în populaţia generală cu:  2  p( 1  p ) , iar în eşantion (estimatorul dispersiei din colectivitatea
generală): s 2  w( 1  w ) .
 Metoda selecţiei aleatoare este modelul de bază utilizat pentru a asigura reprezentativitatea
eşantionului, ceea ce face ca această metodă să fie recomandată în mod deosebit în cercetarea statistică
parţială.
 Distribuţia de probabilitate a unui indicator statistic obţinut pe eşantion este numită distribuţie de
eşantionare, deoarece ea caracterizează distribuţia valorilor unei statistici, rezultată dintr-un număr mare de
eşantioane.
 Distribuţia de eşantionare a oricărui indicator statistic are o dispersie şi o abatere medie pă tratică; dacă
se cunoaşte această abatere medie pătratică, se poate şti variaţia aproximativă a indicatorului statistic din
eşantion faţă de valoarea sa medie (parametrul populaţiei).
 Estimatorul abaterii medii pătratice a unui indicator, bazat pe datele dintr-un eşantion, se numeşte
eroare standard a indicatorului (eroarea medie de reprezentativitate) şi se interpretează ca orice
abatere medie pătratică; ea este o eroare de reprezentativitate şi este specifică sondajului statistic.
 Cu cât volumul eşantionului n este mai mare, cu atât distribuţia de eşantionare a lui x va tinde către
distribuţia normală.
 La construirea estimaţiilor un rol important, pe lângă coeficientul de încredere (1-), îl joacă lungimea
intervalului de încredere (  , ); cele două mărimi se află într-o relaţie de corespondenţă bine determinată.
 Jumătatea intervalului de încredere se numeşte eroare limită admisibilă sau admisă şi se notează cu
  (  ) / 2 .
 Dispersia medie de sondaj se calculează după formula:
2
2  (7.1)
x n
 Eroarea standard a mediei de sondaj este  x , adică abaterea medie pătratică a mediei de selecţie
x de la parametrul :
2 
x   (7.2)
n n

 Estimatorul dispersiei mediei de sondaj ( s x2 ) este:


s2
s2  , (7.3)
x n

1
iar estimatorul erorii medii a mediei de sondaj (adică eroarea medie de reprezentativitate) este:
s
sx  (7.4)
n
 În cazul populaţiilor normal distribuite (cu distribuţii de probabilitate normală), distribuţia de
eşantionare a mediei de selecţie este normală, indiferent de numărul elementelor din eşantion (de
volumul eşantionului).
 Pentru a construi acest interval de încredere vom determina, întâi, eroarea limită maximă admisibilă.
Cum media de sondaj ( x ) este variabilă aleatoare normal distribuită, de medie  şi abatere medie
pătratică  x =/ n , înseamnă că variabila normală normată (redusă) corespunzătoare este:
x
z (7.5)
x
 Calculul variabilei normale reduse este aproximativ corect dacă se înlocuieşte abaterea medie pătratică
din relaţia generală  cu indicatorul disponibil din eşantion, adică cea mai bună informaţie pe care o
avem la îndemână:
x
z (7.6)
sx
 Pentru probabilitatea cu care garantăm rezultatele 100(1-)%, eroarea limită (maximă) admisibilă
este:
s
x  z / 2 s x  z / 2 (7.7)
n
 Intervalul de încredere calculat pe baza erorii limită maximă admisibilă:
s
x  z / 2 (7.8)
n
va conţine adevărata valoare a mediei din colectivitatea generală (  ), în 100(1-)% din cazuri.
 Intervalul de încredere ( x  x ) este garantat cu nivelul de încredere ales, ceea ce face ca această
estimare să fie preferabilă estimării punctuale.
Intervalul de încredere pentru nivelul total al caracteristicii este:
N
N ( x  x )   xi  N ( x  x )
i 1
(7.9)
 În scopul de a estima parametrul colectivităţii generale m, cu o eroare limită maximă admisibilă x
sau echivalent, pe un interval de încredere de lungime totală L, cu un nivel de încredere (1-), adică o
probabilitate de garantare a rezultatelor 100(1-)%, volumul necesar al eşantionului este:
( z / 2 )2  s 2 4( z / 2 )2  s 2
n  (7.10)
2 L2
x
 Calculul indicatorilor pentru eşantioane de volum redus (n<30) diferă de cel pentru eşantioane de
volum normal sau mare.
De aceea, dacă din calcule rezultă un eşantion de volum mic (n<30), o soluţie simplă este să se
aleagă, totuşi, un eşantion de volum n30. Desigur, costul eşantionării trebuie întotdeauna luat în
considerare atunci când se proiectează un sondaj. Bugetul avut la dispoziţie poate să constituie o restric-
ţie pentru volumul eşantionului şi, de aici, pentru precizia dorită ori pentru probabilitatea de
garantare a rezultatelor.
 Dacă eşantionul este de volum redus (n<30), iar abaterea medie pătratică din colectivitatea
(x)
generală () este necunoscută şi înlocuită cu cea din eşantion (s), statistica este o statistică t
s/ n
(x)
cu (n-1) grade de libertate. Distribuţia de eşantionare a statisticii este o distribuţie de
s/ n
probabilitate t cu condiţia ca populaţia generală să fie normal distribuită. Dacă populaţia generală nu
are o distribuţie normală (sau simetrică şi unimodală), atunci se va folosi o metodă statistică neparametrică.

2
 Abaterea medie pătratică a mediei de selecţie (măsurător al erorii medii de reprezentativitate) pentru
sondajul aleator simplu nerepetat este:
 N n
x   (7.11)
n N 1
estimată prin:
s N n s n
sx     1 (7.12)
n N 1 n N
 Eroarea medie de reprezentativitate este calculată pentru caracteristica alternativă, pe baza datelor
din eşantion:
w( 1  w )
s 2f  pentru selecţie repetată (7.13)
n
şi
w( 1  w )  n
s 2f    1   pentru selecţie nerepetată (7.14)
n  N
 Stratificarea constă în divizarea colectivităţii generale de studiat în „straturi“, clase tipice cât mai
omogene, cu caracteristici cât mai asemănătoare, astfel încât unităţile statistice din interiorul fiecărui strat
să prezinte, cel puţin din punct de vedere teoretic, caracteristici comune specifice fiecărei clase. Straturile pot
fi constituite din regiuni, judeţe, localităţi, medii, sexe, subdiviziuni economice, grupe de vârstă etc. Cel mai
frecvent, stratificarea se foloseşte în studiul populaţiei care se separă folosind clasificările oficiale sau, în
funcţie de scop, cercetătorul îşi va face propria sa grupare, ca de exemplu, după profesie sau vechimea în
producţie.
 În cazul sondajului tipic (stratificat) putem scrie eroarea medie de reprezentativitate:
2
 (7.15)
x 
st n
sau, pe baza datelor din eşantion (pentru că  2 , în general, este necunoscut):
2
si (7.16)
s x st 
n
 Eroarea limită (maximă admisibilă) este:
x st  z / 2 s x st (7.17)
pentru probabilitatea 100(1-)% de garantare a rezultatelor.
 Intervalul de încredere pentru media colectivităţii generale este:
x st  x st    x st  x st (7.18)
 În cazul selecţiei aleatoare stratificate fără revenire, se va ţine seama de coeficientul de corecţie în
populaţie finit.
 Alegerea numărului de straturi impune două remarci. Prima este de ordin teoretic: ideală este
stratificarea la maximum, adică alegerea unui număr cât mai mare de grupe. Cea de-a doua este de ordin
practic: rareori se pot depăşi 10 straturi şi, de obicei, limitele straturilor sunt impuse de infor maţiile
disponibile din baza de sondaj.
 Există două posibilităţi de repartizare a volumului eşantionului (n) pe straturi: o repartiţie
proporţională şi o repartiţie optimă.
 Pentru o selecţie tipică optimă, fracţiile de sondaj vor fi proporţionale cu abaterile medii pătratice.
Justificarea este imediată şi intuitivă: dacă împrăştierea datelor este crescută într-un strat, vom selecta un
număr relativ mai mare de unităţi statistice, pentru a imita şi reprezenta mai bine situaţia din acest strat. Din
contră, dacă un strat este omogen, un număr relativ mai mic de observaţii este suficient pentru a calcula cu
precizie crescută media stratului.
 Un sondaj în cuiburi constă în alegerea (întâmplătoare) a unui eşantion din unităţile colective, sau
cuiburi, pentru ca apoi să se studieze toţi indivizii pe care îi conţine fiecare dintre aceste cuiburi alese (fără
excepţie).
 Sondajul multifazic este un tip de schemă în care unele informaţii sunt colectate de la întregul eşantion,
iar un alt grup de informaţii (amănunte, informaţii mai puţin importante pentru scopul cercetarii sau
informaţii care vizează un studiu colateral) sunt strânse de la un subeşantion al aceluiaşi eşantion.

3
 În eşantionarea pe cote (spre deosebire de celelalte tipuri de scheme de eşantionare caracterizate prin
a fi aleatoare şi în care se garantează fiecărei unităţi statistice şansa calculabilă de a fi inclusă in eşantion),
alegerea unităţilor statistice reale ce urmează a fi incluse este lăsată pe seama operatorilor.
 În sondajele pseudo-aleatoare trebuie să se dispună de o bază de sondaj, după care se decide alegerea
persoanelor (unităţilor statistice) ce se afla într-o situaţie dată privind un criteriu care nu este aleator, dar
care se consideră a fi independent de fenomenul studiat.
 Metoda de sondaj pe bază de eşantioane fixe este destul de utilizată în cadrul cercetării statistice;
ideea de bază a acestei metode este aceea că se obţin informaţii repetate de pe acelaşi eşantion; informaţiile
care se obţin se pot referi la aceleaşi unitaţi statistice sau la unităţi mai mult sau mai puţin diferite.

7.2 Cuvinte cheie

criteriu de semnificaţie. parametru


distribuţie de eşantionare selecţie statică
eroare de estimaţie sondaj aleator simplu
eroare limită admisibilă sondaj aleator tipic
eroare medie de reprezentativitate sondaj cu revenire
eşantion sondaj fără revenire
estimaţie sondaj în cuiburi

4
estimator test statistic
interval de încredere volum al eşantionului

7.3 ÎNTREBĂRI TEORETICE

1. Definiţi conceptul de selecţie statistică.


2. Arătaţi avantajele utilizării selecţiei statistice.
3. Ce este eşantionul?
4. Ce reprezintă noţiunea de „eroare de estimaţie“?
5. Arătaţi principalele noţiuni perechi specifice selecţiei statistice.
6. Care sunt principalele etape ale realizării unui sondaj statistic?
7. Enumeraţi procedeele de eşantionare.

5
8. Prezentaţi principalele procedee de selecţie utilizate în alcătuirea eşantioanelor aleatoare.
9. În ce constă procedeul urnei cu bile?
10. Prin ce se caracterizează o distribuţie de eşantionare?
11. Sondajul aleator simplu repetat: caracteristici, eroare de reprezentativitate, eroare limită admisibilă,
interval de încredere.
12. Cum se determină volumul eşantionului în cazul sondajului aleator simplu repetat şi nerepetat. De ce
factori depinde?
13. Determinarea erorii de reprezentativitate, a erorii maxim admisibile şi a intervalului de încredere în
cazul utilizării sondajului simplu aleator nerepetat.
14. Cum se determină probabilitatea de garantare a rezultatelor în cazul sondajului aleator simplu repetat şi
nerepetat?
15. Determinarea intervalului de încredere în cazul sondajului aleator simplu de volum redus.
16. Determinaţi indicatorii de sondaj, erorile şi intervalul de încredere pentru caracteristica alternativă în
cazul sondajului simplu aleator.
17. Volumul eşantionului şi probabilitatea de garantare a rezultatelor pentru caracteristica alternativă –
sondaj simplu aleator.
18. Ce particularităţi prezintă sondajul stratificat?
19. În ce condiţii se foloseşte şi care sunt avantajele utilizării sondajului tipic în cercetarea statistică?
20. Calculul indicatorilor de sondaj pentru o caracteristică cantitativă, în cazul sondajului tipic.
21. Cum se alege numărul de straturi şi cum se repartizează volumul eşantionului pe straturi?
22. Calculul indicatorilor de sondaj pentru o caracteristică alternativă în cazul sondajului stratificat.
23. Sondajul de serii – concept, utilizare, particularităţi, avantaje.
24. Prezentaţi principalele tipuri de sondaje cu extracţie nealeatoare.

S-ar putea să vă placă și