Sunteți pe pagina 1din 29

STATISTICĂ

CURS 7

Sondajul statistic
(Cercetarea selectivă)

1
Sondajul statistic

Sondajul statistic (cercetarea selectivă) este cercetarea parţială în urma căreia, pe


baza rezultatelor obţinute prin prelucrarea datelor din eşantion se estimează, folosind
principiile teoriei probabilităţilor, parametrii corespunzători ai populaţiei totale.

Concepte utilizate:
Populaţia (colectivitatea generală) reprezintă totalitatea unităţilor statistice care
formează obiectul cercetării.
Eşantionul reprezintă o parte a populaţiei pentru care se înregistrează caracteristicile
în conformitate cu obiectivele propuse.
Etapele cercetării selective:
Etapa descriptivă-se culeg și se prelucrează datele la nivelul eșantionului
Inferența statistică-se extind rezultatele de la nivelul eșantionului la nivelul
populației în anumite condiții de probabilitate

2
Sondajul statistic

Sursa datelor
Consistenţa şi acurateţea datelor influenţează corectitudinea rezultatelor unei
analize statistice.
Consistenţa şi acurateţea datelor depind de metoda de colectare.

Trei dintre cele mai utilizate surse de date statistice sunt:


Date publicate
Rezultate ale anchetelor şi sondajelor
Studii experimentale – se utilizează atunci când nu sunt disponibile date publicate

3
Sondajul statistic
Studii de observare și experimentale

Studiul de observare este studiul în cadrul căruia mărimile reprezentând o variabilă de


determinare sunt observate și înregistrate fără a se controla niciun factor care ar putea
influența valorile acesteia.

Studiul experimental este studiul în cadrul căruia mărimile reprezentând o variabilă


de determinare sunt observate și înregistrate în același timp controlându-se factorii
care ar putea influența valorile acesteia.

4
Sondajul statistic

Avantajele sondajului statistic:

este ieftin și rapid


erorile sunt mai puține ca număr și mai ușor de înlăturat decât în cazul cercetării
totale
poate fi utilizat ca mijloc de verificare în cazul unei cercetări totale
poate fi utilizat în cazul în care cercetarea totală ar fi imposibil de realizat
( studiul calității produselor fără distrugerea întregului lot)

5
Sondajul statistic
Eroare de sondaj – de eşantionare (Sampling error)
Diferenţa dintre valoarea reală şi cea estimată a unui parametru al populaţiei
originare
Considerând toate eşantioanele de acelaşi volum eroarea de sondaj apare ca o
variabilă aleatoare.
Aceste erori apar din cauza greşelilor făcute pe parcursul procesului de obţinere a
datelor. 
Creşterea volumului eşantionului nu va reduce aceste tipuri de erori.

Există trei tipuri de erori de sondaj:


Erori de obținere a datelor
Erori de non-răspuns
Erori de reprezentativitate

6
Sondajul statistic
Eroare de reprezentativitate(Reprezentativity error)

Diferenţa dintre valoarea unui indicator sintetic calculată pe baza informaţiei


cuprinse în eşantion şi valoarea indicatorului de acelaşi tip din populaţia originară.

Eroarea de reprezentativitate sistematică este determinată de nerespectarea


tehnicilor de sondaj care face astfel posibilă deplasarea eşantionului ales în raport cu
eşantionul care se intenţiona a fi obţinut.Afectează calitatea rezultatelor obținute.
Eroarea de reprezentativitate întâmplătoare derivă din însăşi natura cercetării
pe bază de sondaj aceasta având drept obiect numai o parte a populaţiei originare.

7
Sondajul statistic

Erorile de reprezentativitate întâmplătoare se clasifică în:

Erori efective se pot calcula pentru caracteristicile pentru care s-au obţinut date şi
dintr-o observare totală.

Erori probabile:
 eroarea limită maximă admisă (limit sampling error) este eroarea
maximă care se poate admite în cercetarea pe bază de sondaj şi care se
stabileşte anticipat în funcţie de gradul de variaţie a caracteristicii
cercetate, de volumul necesar al eşantionului şi de probabilitatea cu care se
garantează rezultatele.

 eroarea medie de reprezentativitate.

8
Sondajul statistic

Tipuri de eșantionare:
Eşantionare aleatorie simplă
Eşantionare stratificată
Eşantionare aleatorie simplă (Simple Random Sampling) - eşantionul din n unităţi
de eşantionare extras dintr-o colectivitate de N unităţi astfel că toate combinaţiile
posibile de n unităţi de eşantionare au aceeaşi probabilitate de a fi prelevate.

9
Sondajul statistic

Eşantionare stratifcată (Stratifed sampling) –într-o populaţie care poate fi


divizată în diferite subpopulaţii separate numite straturi, eşantionarea este efectuată
astfel încât proporţiile specificate ale eşantionului sunt extrase din diferitele straturi
şi din fiecare strat este extrasă cel puţin o unitate de eşantionare.

10
Sondajul statistic
Urna lui Bernoulli
Fiecare din tipurile de sondaj poate fi efectuat în 2 variante:
Sondaj repetat - o unitate prelevată din populaţia generală este restituită şi astfel are şansa de a
reintra în eşantion ( probabilitatea de a extrage o bilă din urnă rămâne constantă pe parcursul
formării eșantionului)

Sondaj nerepetat (sampling without replacement) - unitatea prelevată nu mai este


reintrodusă în populaţia generală ( probabilitatea de a extrage o bilă din urnă crește pe parcursul
formării eșantionului)

11
Sondajul statistic
Sondajul aleatoriu simplu

12
Sondajul statistic

Estimare (Estimation)

Operaţie de stabilire pe baza datelor unui eşantion a valorilor parametrilor repartiţiei


colectivităţii din care a fost extras eşantionul. Rezultatul se poate exprima printr-o
valoare unică estimator punctual sau printr-un interval.

Spre deosebire de statistica descriptivă, inferenţa statistică foloseşte procedee specifice


bazate pe modele matematice, în esenţă probabiliste , pentru analiza materialului
statistic rezultat în urma analizei descriptive.

13
Sondajul statistic
Estimarea mediei și al nivelului totalizat al caracteristicii
 estimarea mediei la nivelul populaţiei:
- pentru selecţia simplă:
x  Δx    x  Δx
- pentru selecţia stratificată:
y  Δy    y  Δy
 estimarea nivelului totalizat al caracteristicii la nivelul populaţiei:
- pentru selecţia simplă:
N
N (x  Δx )   xi  N (x  Δx )
i 1
- pentru selecţia stratificată:
N
N ( y  Δ y )   yi  N ( y  Δ y )
i 1

Lungimea intervalului de încredere scade dacă:


- se măreşte volumul eşantionului;
- se diminuează probabilitatea de garantare a rezultatelor;
- datele au o variabilitate redusă (omogenitate ridicată).
14
Sondajul statistic

Sondajul aleatoriu simplu

15
Sondajul statistic

Sondajul stratificat

16
Sondajul statistic

17
Sondajul statistic
Determinarea volumului eșantionului

Între eroarea limită maximă admisă şi volumul eşantionului există relaţie de inversă
proporţionalitate. Între probabilitatea cu care se garantează rezultatele şi volumul eşantionului
există relaţie de directă proporţionalitate

18
Sondajul statistic

19
Sondajul statistic-Aplicatie sondaj simplu

20
Sondajul statistic-Aplicatie sondaj simplu

21
Sondajul statistic-Aplicatie sondaj stratificat
In scopul adaptării pachetelor de servicii turistice, o agenţie din domeniu realizează o cercetare
statistică pe un eşantion aleator de volum 5,4% din cei 4800 de clienţi ce au apelat la
serviciile agenţiei în anul anterior. Din analize anterioare se cunoaşte că există un grad ridicat
de eterogenitate a clienţilor în funcţie de vârstă. Pentru obţinerea unui eşantion cât mai
reprezentativ şi îmbunătăţirea calităţii estimatorilor obţinuţi s-a recurs la eşantionare
stratificată, clienţii fiind împărţiţi în patru grupe omogene astfel: sub 30 ani; 30-40 ani; 40-60
ani; 60 ani şi peste. Subeşantioanele corespunzătoare fiecărui strat sunt direct proporţionale cu
ponderea stratului respectiv în populaţia statistică. După obţinerea şi prelucrarea datelor
utilizând indicatorii statistici descriptivi au fost obţinute următoarele rezultate sintetice:
Venit mediu lunar Abaterea standard a venitului
Grupe de vârstă (ani) Nr. clienţi
(Eur) (Eur)
sub 30 32 525 144
30 - 40 48 1320 387
40 - 60 120 2110 695
60 şi peste 59 630 85
a)Estimaţi pentru o probabilitate de 95% (z=1,96) venitul mediu lunar al clienţilor agenţiei de
turism.

22
Sondajul statistic-Aplicatie sondaj stratificat

23
Sondajul statistic-Aplicatie sondaj stratificat

24
Sondajul statistic-Aplicatie sondaj stratificat

25
Sondajul statistic-Aplicatie sondaj stratificat

26
Sondajul statistic-Aplicatie sondaj stratificat

27
Sondajul statistic-Aplicatie sondaj stratificat

Repartizarea noului eşantion pe subeşantioane prin procedeele proporţional şi optim


este prezentată în tabelul următor:
Dimensiunea repartiţie repartiţie
stratului în proporţională optimă
Nr. Ponderea
Grupe de clienţi populaţia si  N i si  N i
stratului
vârstă (ani) n statistică n 4 ni  n ' 
''
ni n ni'  n '  i si  N i 4
i n
Ni  i  N n s  N i i s i  Ni
n i 1 i 1
sub 30 32 0,12 576 60 82944 0,04 20
30 - 40 48 0,19 912 95 352944 0,17 85
40 - 60 120 0,46 2208 230 1534560 0,74 371
60 şi peste 59 0,23 1104 114 93840 0,05 23
Total 259 1 4800 499 2064288 1 499

28
29

S-ar putea să vă placă și