Sunteți pe pagina 1din 18

Sondajul statistic

suport
Cursurile 6 si 7
Introducere

• Datoria operativităţii si economicităţii obţinerii datelor,


metoda sondajului se află printre procedeele preferate în
obţinerea datelor.
• Sondajul este forma predominanta de obţinere a datelor
statistice.
• Rezultatele obţinute pe baza datelor de sondaj se
extrapolează la dimensiunea întregii populaţii. Extinderea
rezultatelor de la "parte" la "întreg" nu are caracter
determinist, ci probabilist, deci sunt supuse unui risc de a fi
eronate.

2
Erorile de sondaj

• erorile de reprezentativitate sistematice - având drept sursă


încălcarea principiilor alcătuirii corecte a eşantioanelor
• erorile întâmplătoare - ce îşi au sursa în însăşi natura
sondajului ca cercetare parţială, erori ce nu pot fi eliminate,
dar pot fi predimensionate, deci distorsiunile de apreciere
realizate prin cercetarea unui eşantion pot fi "prevăzute"
statistic
Observatie
Sursa principală a erorii o constituie nereprezentativitatea, iar erorile
ce provin din aceasta se numesc "de reprezentativitate" şi sunt
provocate de faptul că eşantionul nu reproduce, la scara redusa,
structura populaţiei în ansamblu.

3
Erorile de sondaj

Măsurarea erorii de reprezentativitate se poate efectua:


• absolut - ca dimensiune a deplasării indicatorului
(parametrului) de sondaj (𝑥)ҧ de la mărimea "adevărată" a
parametrului în populaţia generală (m), respectiv 𝑥ҧ − 𝑚
• relativ - caz în care indicatorul "eroare de eşantionare"
ҧ
𝑥−𝑚
se poate exprima: ∙ 100 ≤ 5%
𝑚
O eroare relativă situată sub 5% permite a se aprecia că
sondajul este reprezentativ şi oferă o imagine aproximativ
"fidelă" a realităţii. Dimensionarea erorii este o chestiune a
proiectării unui sondaj şi ţine de gasirea unui "compromis"
acceptabil între nivelul erorii şi costul măririi eşantionului.

4
Modalitati culegere date
Principalele tipuri de sondaj:
• A. Sondaje aleatoare: a. sondajul simplu; b. sondajul tipic (stratificat); c.
sondajul de serii; d. sondajul secvenţial; e. sondajul în trepte.
• B. Sondaje dirijate
• C. Sondaje sistematice
Fiecare din tipurile de sondaje enumerate se poate efectua în două
variante:
• - repetat - când o unitate prelevată este restituită populaţiei de
origine şi deci are şanse să mai reintre în eşantion;
• - nerepetat - când unităţile nu sunt (sau nu pot fi) restituite în
populaţia generală.
Modelul teoretic al acestor două variante de prelucrare se află în urna
lui Bernoulli cu bilă revenită şi nerevenită.

5

x
2

Sondajul aleator simpu


• Reprezinta varianta aleatoare elementară de sondaj, celelalte tipuri putând fi
înţelese ca soluţii obţinute prin particularizarea unor elemente ale acestui tip de
sondaj.
• El se poate realiza, din punct de vedere al prelevării unităţilor - repetat şi
nerepetat.
• Simbolurile utilizate: Numărul Media aritmetică pentru Dispersia caracteristicii
Indicatori de unităţi caracteristici
(volumul)
măsurabile binare măsurabile binare
În populaţia N m p p(1-p)
generală
2

În eşantion n w(1-w)
x w s2

• Prelevând n unităţi din cele N ale populaţiei şi înregistrând pentru fiecare unitate
din eşantion valoarea caracteristicii urmărite se obţine şirul valorilor: x1, x2, ...,
σ𝑥
xi, ..., xn pe baza căruia se calculează media 𝑥ҧ = 𝑖
𝑛
• Această medie va fi diferita, mai mult sau mai puţin, de media reală dar
necunoscută m din populaţia generală.

6
Sondajul aleator simplu
• Intr-o altă eşantionare, unităţile prelevate ar fi fost foarte probabil altele,
astfel încât tot altele ar fi fost valorile caracteristicii, respectiv media de
sondaj. Faptul că indicatorii statisticii calculaţi pe baza datelor de sondaj
diferă de la eşantion la eşantion, rezultă că ei pot fi interpretaţi ca
variabile aleatoare.
• Astfel, indicatorii estimaţi pe baza sondajului, fiind variabilă aleatoare,
pot fi extinşi la întreaga populaţie, daca sunt: estimaţii nedeplasate,
consistente si eficiente.
• Rezultatele obţinute pe baza datelor de sondaj constituie estimari ale
adevăratelor valori ale parametrilor necunoscuţi din populaţia generală.
Deci, rezultatele obţinute printr-un sondaj sunt afectate de erori. Ce se
poate obţine prin sondaj este nu valoarea exacta a parametrului căutat ci
un interval de încredere care, cu o probabilitate fixată de către
cercetător, acoperă valoarea adevărată dar necunoscută a parametrului
din populaţia generală - interval de estimaţie sau interval de încredere
(confidence interval).

7
Sondajul aleator simplu

Cele 2 limite de interval (𝜃𝑖𝑛𝑓 , 𝜃𝑠𝑢𝑝 ) se determina pe baza datelor de


sondaj 𝑥1 , 𝑥2 , 𝑥3 … 𝑥𝑖 … 𝑥𝑛 astfel incat, cu o probabilitate 𝑝 = 1 − 𝛼, sa
fie indeplinita relatia 𝑃 𝜃𝑖𝑛𝑓 < 𝜃 < 𝜃𝑠𝑢𝑝 = 1 − α.
• Probabilitatea 𝑝 = 1 − 𝛼 se numeste nivel de incredere (confidence
level) si caracterizeaza siguranta afirmatilor.
• Valoarea α se numeste nivel sau prag de semnificatie (significance
level), e valoare complementara a nivelului de incredere p
Observatie: frecvent, α se considera 99%, 95% sau 90% (respectiv p
este 0.01, 0.05 sau 0.10)

8
Sondajul aleator simplu

În statistica, abaterea standard este o măsură a cantității de variație


sau dispersie a unui set de valori. O abatere standard scăzută indică
faptul că valorile tind să fie apropiate de media setului, în timp ce o
abatere standard înaltă indică faptul că valorile sunt distribuite pe o
gamă mai largă.
𝑥ҧ ± 𝜎 ≈ 68.27%
𝑥ҧ ± 2𝜎 ≈ 95.45%
𝑥ҧ ± 3𝜎 ≈ 99.73%
9
Indicatorii sondajului aleator simplu
1. Eroarea medie de sondaj (standard error of the mean - SEM) 𝜎𝑥ҧ
a) cazul sondajului repetat
Observatiile inregistrate pe baza datelor esantionului 𝑥1 , 𝑥2 , 𝑥3 … 𝑥𝑖 … 𝑥𝑛 pot fi considerate
variabile aleatoare iar, folosind independenţa valorilor variabilei, se arată că media de sondaj
σ𝑥
𝑥ҧ = 𝑖 poate fi un estimator nedeplasat al mediei m a colectivităţii generale, dacă se
𝑛
îndeplineşte condiţia ca media de sondaj să fie egală cu media generală.
𝜎
Eroarea standard a mediei se exprima ca 𝜎𝑥ҧ =
𝑛
unde: 𝜎 – abaterea standard a populatiei
n – volumul esantionului
Deoarece abaterea standard a populației este foarte rar cunoscută, eroarea standard a
mediei este de obicei estimată ca abaterea standard a eșantionului divizată la rădăcina
pătrată a mărimii eșantionului (presupunând independența statistică a valorilor din eșantion).
𝑠
𝜎𝑥ҧ ≈
𝑛
unde:
s - abaterea standard a eșantionului (adică, estimarea pe bază de eșantion a abaterii
standard a populației)

10
Indicatorii sondajului aleator simplu
b) cazul sondajului nerepetat
La acest tip de sondaj, unitatile extrase din populatia generala nu mai sunt restituite
acesteia, deci nu mai au sansa sa reintre in esantion.
In acest caz, eroarea standard a mediei este:
𝜎 𝑛 𝑠 𝑛
𝜎𝑥ҧ = 1− ≈ 1−
𝑛 𝑁 𝑛 𝑁
unde:
𝜎 – abaterea standard a populatiei
n – volumul esantionului
s - abaterea standard a eșantionului (adică, estimarea pe bază de eșantion a abaterii standard a
populației)
N – volumul populatiei generale
Observatie:
Cand n volumul esantionului creste, precizia creste de aproximativ 𝑛, dupa cum
in acelasi raport se micsoreaza abaterea standard. Acest fapt permite să se
utilizeze în practică sondaje de volum nu prea ridicat, căci sporirea volumului
acestora nu se regăseşte proporţional în ridicarea preciziei sondajului.

11
Indicatorii sondajului aleator simplu

2. Eroarea limita sau eroarea maxim admisa Δ𝑥ҧ

• Se defineste ca fiind siguranta estimarii mediei m prin aproximarea


mediei de sondaj 𝑥ҧ .
• Se determina pornind de la variabila 𝑍𝛼 (functia Gauss-Laplace) care
are o repartiti normal, fiind valoarea tabelata, care satisface relatia
2Φ 𝑍𝛼 = 𝑝 1 − 𝛼
Astfel
ҧ
𝑥−𝑚 𝑠
a) Sondaj repetat: 𝑍𝛼 = 𝜎 de unde: 𝑥ҧ − 𝑚 ≈ 𝑍𝛼 = Δ𝑥ҧ
𝑛
𝑛

𝑠 𝑛
b) Sondaj nerepetat: 𝑍𝛼 1− = Δ𝑥ҧ
𝑛 𝑁

12
Indicatorii sondajului aleator simplu

3. Determinarea volumului esantionului n

• Marirea volumului n al esantionului sporeste precizia sondajului si


reduce eroarea medie.
• Un avantaj al sondajului, ca cercetare partiala, este costul redus.
Luand in considerare ambele aspect, se determina numarul minim de
unitati statistice, care sa satisfaca ambele atat exigentele de precizie,
cat si cele de economicitate.

Observatie: Calculul volumului esantionului se realizeaza pornind de la


eroarea limita.

13
Indicatorii sondajului aleator simplu
Astfel:
𝑠
a) Sondaj repetat: Δ𝑥ҧ = 𝑍𝛼 de unde
𝑛

𝑍𝛼2 𝑠 2
𝑛= 2
Δ𝑥ҧ

𝑠 𝑛
b) Sondaj nerepetat: Δ𝑥ҧ = 𝑍𝛼 1− de unde
𝑛 𝑁

𝑍𝛼2 𝑠 2
𝑛=
2 𝑍𝛼2 𝑠 2
Δ𝑥ҧ +
𝑁

Observatie: in cazul sondajului fara revenire este necesar volumul


colectivitatii generale N.

14
Indicatorii sondajului aleator simplu
4. Determinarea intervalului de incredere

• Acesta reprezinta zona probabila in interiorul careia se va plasa


media necunoscuta a colectivitatii generale m.
• Se determina pornind de la media cunoscuta a esantionului 𝑥,ҧ
corectata cu nivelul erorii maxim admise Δ𝑥ҧ

𝑥ҧ − 𝛥𝑥ҧ ≤ 𝑚 ≤ 𝑥ҧ + 𝛥𝑥ҧ
Observatie: In unele situatii prezinta interes determinarea intervalului
de incredere in care se plaseaza nivelul agregat al variabilei in
colectivitatea generala.
! Acest lucru se poate realiza doar in cazul in care are sens si se
cunoaste volumul colectivitatii generale N.

N 𝑥ҧ − 𝛥𝑥ҧ ≤ 𝑁 ∙ 𝑚 ≤ 𝑁 𝑥ҧ + 𝛥𝑥ҧ

15
Indicatorii sondajului aleator simplu
Pentru caracteristica alternativa:

• Eroarea medie de sondaj


𝑤(1−𝑤)
a) Sondaj repetat: 𝜎𝑥ҧ =
𝑛

𝑤(1−𝑤) 𝑛
b) Sondaj nerepetat: 𝜎𝑥ҧ = (1 − )
𝑛 𝑁

• Eroarea maxim admisa: 𝛥𝑥ҧ = 𝑍𝛼 𝜎𝑥ҧ

• Interval de incredere: 𝑤 − 𝛥𝑥ҧ ≤ 𝑝 ≤ 𝑤 + 𝛥𝑥ҧ

16
Sondajul tipic (stratificat)
Stratificarea consta in divizarea colectivitatii generale in clase sau grupe
cat mai omogene.
In cazul acestui sondaj:
• Eroarea medie de sondaj 𝜎𝑥ҧ
𝜎2 𝑠2
a) cazul sondajului repetat 𝜎𝑥ҧ = ≈
𝑛 𝑛
𝜎2 𝑛 𝑠2 𝑛
b) cazul sondajului nerepetat 𝜎𝑥ҧ = 1− ≈ 1−
𝑛 𝑁 𝑛 𝑁
• Eroarea maxim admisa: 𝛥𝑥ҧ = 𝑍𝛼 𝜎𝑥ҧ
• Volumul esantionului
𝑍𝛼2 𝑠 2
a) sondaj repetat 𝑛 = Δ2𝑥ഥ
𝑍𝛼2 𝑠 2
b) sondaj nerepetat 𝑛 = 𝑍 𝑠22
Δ2𝑥ഥ + 𝛼𝑁
• Interval de incredere: 𝑥ҧ − 𝛥𝑥ҧ ≤ 𝑚 ≤ 𝑥ҧ + 𝛥𝑥ҧ

17
Sondajul tipic (stratificat)
In vederea repartizarii esantionului pe subesantioane se pot aplica 3
metode:
• 1) repartizarea in mod egal a esantionului n pe k subesantioane
𝑛
𝑛𝑖 =
𝑘
• 2) esantionul se separa pe subesantioane in functie de poderea
fiecarei grupe in colectivitatea generala
𝑁𝑖
𝑛𝑖 = 𝑛
σ 𝑁𝑖
• 3) la formarea subesantioanelor se ia in considerare atat ponderea
fiecarui strat, cat si gradul de omogenitate al grupelor
𝑁𝑖 𝜎𝑖
𝑛𝑖 = 𝑛
σ 𝑁𝑖 𝜎𝑖

18

S-ar putea să vă placă și