Sunteți pe pagina 1din 22

CURS STATISTICĂ - Unitatea de învăţare nr.

INTRODUCERE IN TEORIA SONDAJULUI

Cuprins:

1. Importanţa sondajului.
2. Avantajele şi dezavantajele utilizării sondajului.
3. Tipuri de sondaj.
4. Principii de bază ale inferenţei statistice. Eşantionarea.
5. Procedee de eşantionare.
6. Erori întâlnite în sondaj.
7. Conceptele estimaţiei. Construcţia intervalelor de încredere.
8. Test de autoevaluare. Determinarea indicatorilor de sondaj in cazul unei selecţii nerepetate.
9. Rezultatele testului de autoevaluare.
10. Teme de autocontrol.
11. Rezumatul unităţii de învăţare.
12. Bibliografia unităţii de învăţare.

1. Importanţa sondajului

Metodele statistice pot fi descrise printr-un ansamblu de procedee de selectare,


colectare şi organizare a datelor, urmate de sistematizarea, prezentarea şi analiza acestora, în
scopul obţinerii cantităţii de informaţie necesară luării deciziilor în timp util. În general
managerii solicită valori centralizatoare, tipice, cu o largă reprez Succesul sau falimentul în
afaceri depinde de nevoile şi preferinţele clienţilor. De exemplu, organizatorii de cursuri de
perfecţionare, care îşi orientează prezentările făcute cursanţilor utilizând calculatoare mari,
voluminoase, timp în care cererea pe piaţă este orientată spre calculatoare din ce în ce mai
mici, multitasking, uşor de transportat, chiar miniaturale, se vor afla cu câteva decenii în
urmă. Dacă un post de radio, transmite programe radiofonice pentru studiul limbii engleze, în
timp ce majoritatea audienţei este interesată de telenovelele de limbă spaniolă, va găsi foarte
puţine companii dispuse să plătească spaţiu publicitar în timpul acelei emisiuni. Sau care ar
putea fi soluţia pentru o companie comercială care îşi propune să identifice şi să estimeze

1
cererea potenţială de cursuri din altă localitate sau altă regiune şi cum ar putea să decidă
extinderea reţelei sale ?
Răspunsul la acest tip de întrebări poate fi găsit prin aplicarea unei tehnici de cercetare
şi studiu al pieţei denumită sondaj.
Sondajul reprezintă o cercetare parţială, al cărei scop este de estimare a
caracteristicilor populaţiei generale pe baza rezultatelor obţinute de la un eşantion riguros
prelevat. Acestă metodă de investigaţie statistică parţială se bazează pe principiile teoriei
probabilităţilor, statisticii matematice şi legii numerelor mari. Teoria sondajului are ca obiect
principal elaborarea metodelor ştiinţifice de modelare a problemelor legate de culegerea şi
analiza datelor., reprezentativitate, preferând informaţii sintetice în locul detaliilor ce pot
descrie situaţii netipice.
Sondajul se utilizeaza frecvent pentru luarea deciziilor in mediul economic si social
nefiind doar un concept promovat de statisticieni. Scopul sondajului este sa ofere suficiente
informatii despre esantion astfel incat sa permita inferenta cu un nivel de incredere acceptat.
Mijlocul prin care realizeaza scopul este selectia unei parti reprezentative din populatia mama
(“normally representative”), parte denumita ESANTION.

2. Avantajele şi dezavantajele utilizării sondajului

Avantajele utilizării sondajului

În mod cert calea optimă de obţinere a informaţiilor complete şi exacte referitoare la


o populaţie este de a organiza o cercetare totală. Atunci când acest lucru nu este posibil sau
nu există resurse suficiente pentru o astfel de investigaţie, se recurge la sondaj. Principalele
avantaje ale sondajului sunt faptul că necesită costuri mai reduse comparativ cu cercetarea
totală şi calitatea deosebită a rezultatelor obţinute dintr-o cercetare parţială ştiinţific
organizată, uneori superioare celor obţinute în urma unei cercetări totale.
Deşi datele de sondaj sunt afectate de erori de eşantionare şi de observare, acestea din
urmă pot fi mult reduse datorită pregătirii specifice a personalului ce lucrează la realizarea
sondajelor. Prin utilizarea sondajului există posibilitatea de a cuprinde în programul observării
un număr mai mare de caracteristici decât în programul unei cercetări totale. De asemenea
cercetarea selectivă se utilizează pentru testarea rezultatelor unei cercetări exhaustive cât şi la
verificarea unor ipoteze statistice.

2
Principalele avantaje ale utilizarii sondajului sunt costul redus, timp mai mic decat in
cazul efectuarii unui recensamant si obtinerea unei acurateti scorite a rezultatelor. Alte
avantaje sunt:
 Posibilitatea aplicării sondajului şi în cazul efectuării de teste distructive.
 Utilizarea în situaţii în care natura populaţiei nu permite enumerarea unităţilor
statistice: mulţimea consumatorilor vs. mulţimea clienţilor permanenţi.
Dezavantajul principal este posibilitatea obţinerii de date nereprezentative, datele
statistice culese prin sondaj inducând în mod inevitabil erori. Un alt dezavantaj al acestei
metode îl constituie imposibilitatea de a urmări fenomenele în dinamică, sondajul surprinde
static caracteristicile unităţilor observate, ceea ce poate fi corectat prin organizarea de
observări selective periodice, cu periodicitate constantă.

3. Tipuri de sondaje

Exista mai multe criterii de clasificarea sondajelor. După procedeul de selecţie,


aleatoare sau nealeatoare, eşantioanele sunt:
- Eşantioane bazate pe judecata cercetătorului – orice eşantion care este format pe baza
experienţei şi expertizei cercetătorului, ca de exemplu sondajul pe cote.
- Eşantioane aleatoare - realizate după scheme probabilistice.
Tipurile de sondaje aleatoare sunt:

 Sondaj simplu aleator: sanse egale acordate unitatilor de fi cuprinse in


esantion
 Sondaj stratificat – pe GRUPE, straturi formate dupa anumite variabile
independente (de forma M/F de exemplu)
 Sondajul sistematic – alegerea se face dupa un pas de numarare
 Sondaj “cluster” – pe GRUPURI

SONDAJ SIMPLU ALEATOR


 Fiecare unitate din populaţia mamă are aceeaşi probabilitate de a face
parte din eşantion
 Fiecare unitate din eşantion are aceeaşi şansă de apariţie
 Foloseşte numere aleatoare după schema cu bila revenită (sondaj cu
ÎNLOCUIRE) sau cu bila nerevenită (sondaj FĂRĂ ÎNLOCUIRE)

3
SONDAJUL STRATIFICAT

Eşantionul aleator stratificat este obţinut prin separarea populaţiei pe straturi, grupe, ce
se exclud reciproc, doar după această operaţiune se extrage un eşantion aleator din fiecare
strat.
Criterii de separe a populaţiei pe straturi, variabile independente sunt de exemplu:
 Gen
 Varsta
 Ocupatie
 Venitul gospodariei
 Religie
 Numar de copii sub 18 ani din gospodarie
 Locatia
 Brand-ul

SONDAJUL CLUSTER

Eşantionul cluster eşantion aleator de grupuri sau elemente


Se utilizează când nu se poate produce lista membrilor populatiei datorita
necunoasterii tutror sau a dispersiei teritoriale, de exemplu se formeaza clustere de
ACTIONARI

4. Principii de baza ale inferenţei statistice. Eşantionarea

Principiile de bază ale inferenţei statistice, efectuată în urma analizei datelor de


sondaj, implică şi în studiul pieţei serviciilor de consultanţă în resurse umane, noţiunile de
experiment, rezultat, spaţiul eşantionului, eveniment şi probabilitate.
Ideea unui experiment include exemple precum aruncarea unei monede, măsurarea
numărului de angajaţi sau chestionarea managerului unei firme în legătură cu obţinerea de
profit sau pierdere. Asemenea experimente au posibile răspunsuri, finite sau infinite ca număr,
ce formează spaţiul de sondaj. De exemplu o firmă poate obţine profit negativ , deci
pierdere, profit zero, sau proft pozitiv, deci beneficiu, categorii ce reprezintă rezultate.

4
Seturile formate din aceleaşi categorii formează evenimente. Posibilitatea ca firmele să fie
solvabile deci să obţină profit zero sau pozitiv, reprezintă un eveniment.
În teoria sondajului rezultatele unui număr mare de experimente sunt datele primare.
În anumite cazuri putem presupune că fiecare rezultat este independent de cel precedent, aşa
cum un număr al zarului este independent de celelalte aruncări. În condiţiile în care
cunoaştem mecanismul de probabilitate, putem calcula probabilitatea de apariţie a fiecărui
rezultat. Teoria sondajului se preocupă cu aplicarea teoriei probabiltăţilor pentru seturi de date
primare.
Dacă în urma unei cercetări se înregistrează doar informaţii parţiale, este posibil ca
datele înregistrate să fie utilizate pentru obţinerea intervalelor de încredere cu o anumită
probabilitate dacă setul de date respectă condiţiile de reprezentativitate pentru populaţia din
care a fost extras.
Pentru a se putea estima corect parametrii colectivităţii de selecţie pe baza rezultatelor
prelucrării datelor de sondaj, estimaţie garantată cu o anumită probabilitate, este necesar ca
eşantionul pe baza căruia se culeg datele primare să fie reprezentativ.
Un eşantion este reprezentativ dacă structura sa reproduce cât mai exact structura
populaţiei de referinţă din care a fost prelevat.
Pentru asigurarea reprezentativităţii eşantionului este necesar să se respecte anumite
reguli dintre amintim:
a. includerea unităţilor în eşantion să se realizeze în manieră cât mai obiectivă, toate
unităţile trebuie să aibe acceaşi şansă de a participa la formarea eşantionului -
extragerea unităţilor să se realizeze conform principiilor hazardului cu o probabilitate
egală şi diferită de zero.
b. mărimea eşantionului să fie suficientă pentru a reda caracteristicile esenţiale ale
populaţiei generale
c. includerea fiecărei unităţi în eşantion trebuie să se facă independent de cuprinderea
altor unităţi
Determinarea gradului de reprezentativitate a populaţiei studiate la un moment dat
ridică probleme deosebit de dificile în calea evaluării cercetărilor, aceasta deoarece, de cele
mai multe ori, nu pot fi cunoscute în prealabil caracteristicile relevante ale populaţiei ce
urmează a fi cercetată şi se procedează la estimări mai mult sau mai puţin corecte; se ajunge la
identificarea acestor caracteristici numai în urma studiului, când de fapt nu se mai poate
interveni pentru alegerea “populaţiei adecvate”.

5
Cu excepţia cazurilor, rare dealtfel, în care ne pot ajuta evidenţele, numai efectuarea
unor înregistrări prealabile cercetării propriu-zise ne permite să ne fixăm, în cunoştinţă de
cauză, la o anumită populaţie relevantă pentru tema şi obiectivele cercetării.
Studiile statistice exhaustive prealabile, deşi necesare, sunt puţin practicate totuşi
datorită împovărării costurilor de cercetare, a creşterii timpului afectat şi a muncii depuse.
Determinarea cu maximă precizie a caracteristicilor economice, de piaţă, politice şi de altă
natură ale colectivităţii studiate, ca şi dispunerea ei spaţială se înscriu drept cerinţe
elementare, obligatorii pentru o cercetare concretă.

5. Procedee de eşantionare

Eşantionul este un segment al populaţiei studiate ales să o reprezinte în ansamblu.


Reprezentativitatea acestuia asigură corectitudinea estimărilor efectuate baza calculului
indicatorilor de sondaj şi a inferenţei statistice realizate. Atunci când alege eşantionul
cercetătorul trebuie să răspundă la mai multe categorii de întrebări : i) CINE urmează să fie
studiat (care este unitatea de sondaj?); ii) CÂTE unităţi va cuprinde eşantionul (volumul
eşantionului desigur influenţează siguranţa rezultatelor, dar, dacă este bine ales, şi un eşantion
de sub 1% din populaţia totală poate furniza rezultate cu o probabilitate ridicată); iii) care sunt
CRITERIILE de alegere a unităţilor în eşantion (care este procedeul de eşantionare folosit?).

Folosind eşantionarea aleatoare, probabilistică, fiecare unitate componentă a populaţiei


studiate are o anumită probabilitate, cunoscută de a fi inclusă în eşantion, putându-se estima
eroarea de eşantionare. Atunci când procedeele aleatoare sunt prea costisitoare sau durează
prea mult, studiile de piaţă apelează şi la eşantionare neprobabilistică sau mixtă, caz în care nu
pot fi estimate erorile de eşantionare.

Eşantionare aleatoare

Pentru a respecta caracterul aleator al formării eşantionului, procedeul de eşantionare


nu trebuie să fie influenţat de analist. Un eşantion este aleator dacă toate unităţile extrase din
colectivitatea generală au avut aceeaşi şansă (probabilitate egală şi diferită de zero) de a
participa la eşantion. Rezultatele unui sondaj efectuat pe baza unui eşantion aleator pot fi
interpretate probabilistic.

6
Eşantionarea aleatoare se realizează după planuri de sondaje simple (pentru sondaje
în populaţii omogene putându-se aplica şi pentru populaţii neomogene, după planuri de sondaj
în mai multe etape (stratificarea, sondajul multistadial, multifazic, de serii, secvenţial).
Această metodă de eşantionare este indicată a se folosi în cazul în care unităţile din populaţie
sunt de dimensiuni mici şi nu există diferenţe semnificative între mărimea unităţilor
populaţiei.

Această condiţie este rar îndeplinită în totalitate, în practica de piaţă economică. De


aceea se recomandă aplicarea de metode de eşantionare cu probabilităţi inegale, în ipoteza că
unităţile au şanse diferite de a face parte din eşantion. Pentru aplicarea acestei metode este
necesară cunoaşterea unor date auxiliare despre populaţie. În unele cazuri eşantionarea cu
probabilităţi inegale poate fi mai avantajoasă decât cea cu probabilităţi egale.

De exemplu, dacă estimăm numărul angajaţilor dintr-o regiune, cu scopul de a


planifica cifra de şcolarizare la o firmă de instruire, vom folosi datele dintr-un eşantion de
judeţe, extrase aleator, pentru care se cunoaşte populaţia fiecarui judeţ (în urma ultimului
recensământ). Dacă notăm cu Xi numărul firmelor din judeţul i cuprins în eşantion, cu N
numărul judeţelor tării şi cu n numărul judeţelor cuprinse în eşantion, sum(Xi) estimează
numărul firmelor la nivel naţional. Judeţele, indiferent de mărimea lor au avut şanse egale de
a participa la eşantion. Dar, numărul firmelor depinde în mod evident de populaţia judeţului şi
deci estimatorul poate fi afectat de o eroare semnificativă.
Pornind de la ipoteza existenţei unei legături directe, pozitive între populaţia unui
judeţ şi numărul de firme comerciale, se poate acorda judeţelor mai mari o şansă mai mare de
a face parte din eşantion. Probabilitatea ce i se va atribui fiecărui judeţ va fi proporţională cu
populaţia sa. Procedeul de extracţie va fi nerepetat. Estimatorul devine: (P/n)*sum(Xi/pi),
unde P este populaţia întregii ţări, pi populaţia judeţului i din eşantion.
Din procedee de extracţie cu probabilităţi egale amintim procedee absolut aleatoare
,procedeul loteriei şi al tabelului cu numere întamplatoare şi procedeul mecanic, eşantionare
sistematică.

Eşantionare dirijată şi mixtă

Eşantionarea dirijată apare în cadrul sondajului efectuat de un expert sau un


observator bun cunoscător al caracteristicilor populaţiei din care se va extrage eşantionul, care
va include în eşantion, în mod conştient, unităţile alese după părerea sa subiectivă. Acest

7
procedeu de eşantionare este mult mai ieftin decât cele probabilistice şi se poate aplica dacă
eşantioanele sunt atât de mici încât inferenţele efectuate pe baza lor nu ar reprezenta decât o
simplă ipoteză ce nu ar putea fi testată, indiferent de metoda de prelevare utilizată.

Datele disponibile pot prezenta un grad ridicat de nesiguranţă, ceea ce va face ca


opinia unui expert să ducă la obţinerea de rezultate mai bune. Selecţia dirijată nu permite
stabilirea gradului de precizie a unei estimaţii făcute pe baza ei, precizia depinde direct de
numeroase circumstanţe. În practică se aplică aceasta metodă de eşantionare datorită
imposibilităţii respectării condiţiilor de efectuare a unei eşantionări aleatoare (baza de sondaj
completă şi fără omisiuni, cunoaşterea unor informaţii suplimentare despre unităţile cuprinse
în eşantion).

Cea mai utilizată metodă de eşantionare dirijată în cercetările de piaţa şi anchetele


economico - de piaţă este cea pe cote. În acest caz se cunoaşte structura populaţiei studiate
după sex, vârstă, categorie socio-profesională. În cadrul fiecărei grupe se cuprinde un număr
de persoane alese de către operator. Acestuia i se comunică doar caracteristicile persoanelor
ce trebuie intervievate, numărul lor pe fiecare grupă în parte şi structura populaţiei studiate.
Se presupune că eşantionul este reprezentativ dacă el redă structura populaţiei generale
studiate.
Metoda se bazează pe o alegere raţională a unităţilor din eşantion. Prin modul de
constituire a eşantionului apare ca o metodă mixtă, combinând metodele probabilistice cu cele
nealeatoare de eşantionare. Asimilarea cu metodele probabilistice se face în măsura în care
putem defini ca probabilităţi frecvenţele relative definite în cadrul populaţiei. Putem face
această echivalenţă dacă volumul populaţiei de referinţă este suficient de mare pentru a da
posibilitatea aplicării legii numerelor mari.
De aceea, se poate afirma că sondajul pe cote apare ca un sondaj stratificat, selecţia în
cadrul grupelor fiind conştienţa şi nu este aleatoare. Caracterul voluntar al metodei constituie
principalul său dezavantaj, operatorul putând influenţa în mod voit sau nu rezultatele
sondajului. Asemănarea dintre eşantionarea stratificată aleatoare şi cea pe cote constă în
stratificarea iniţială a populaţiei de referinţă pe straturi omogene.
Diferenţa dintre stratificarea aleatoare şi eşantionarea pe cote constă în procedeul de
selecţie al unităţilor din fiecare strat, selecţia în cazul eşantionarii pe cote fiind lăsată pe
seama operatorilor. Deci metoda se bazează pe definirea caracteristicilor de structurare a
populaţiei de referinţă. Astfel pentru fiecare caracteristică, structura eşantionului trebuie să fie
identică cu cea a populaţiei din care este prelevat. Se definesc variabilele de control , că

8
ansamblul caracteristicilor reţinute pentru a asigura identitatea între eşantion şi populaţia de
referinţă. Stabilirea variabilelor de control are în vedere obiectivul studiului şi tipul populaţiei
de referinţă.
Pentru alegerea criteriilor de cotă, de structurare este recomandabil să se ţină seama de
următoarele îndrumări : definirea varibilelor pe baza întrebărilor cuprinse în eşantion,
folosirea ca variabile de control doar acelea pentru care se poate defini o distribuţie statistică
pentru populatia de referinţă, limitarea numărului de criterii de cotă, ce trebuie să fie
independente, fără să cuprindă conotaţii psihologice şi formate din unităţi statistice cu un grad
cât mai mare de omogenitate. Dacă se respectă aceste condiţii se poate obţine un eşantion
sensibil apropiat de un eşantion extras pe baza procedeelor aleatoare.
De exemplu, într-un sondaj statistic organizat la nivelul Municipiului Bucureşti, cu
scopul identificării preferinţelor cursanţilor pentru calculatoarelor personale şi produse
program, pentru identificarea segmentelor ţintă pe diferite tipuri şi categorii de cursanţi pot fi
alese ca variabile de control categoria - socio profesională, vârsta, gradul de educaţie,
structura populaţiei după aceste variabile de segmentare fiind publicate în urma ultimului
recensământ.

Această metodă este de departe cea mai utilizată metodă în studiile de piaţă, deoarece
necesită un buget redus de cheltuieli, fiind mai puţin costisitoare decât orice metodă de
eşantionare aleatoare, proiectarea nu este laborioasă, rezultatele se obţin operativ, într-un timp
scurt şi de fapt este singura metodă posibilă dacă nu există bază de sondaj.

O alta metodă de formare dirijată a eşantionului este metoda voluntariatului extrem


de utilizată în trecut în cercetările medicale şi psihologice. A început să fie din ce în ce mai
des utilizată în studiile de marketing. Includerea în eşantion se realizează pe baza opţiunii
voluntare a persoanelor de a participa la eşantion.
Anchetele desfăşurate pe baza metodei voluntariatului se aplică studiului opiniilor
ascultătorilor radioului, cititorilor ziarelor, ”navigatorilor” pe INTERNET. Metoda constă în
publicarea chestionarului în presă, sau afişarea sa într-o pagina de Web, însoţită de
rugămintea de a răspunde. Deşi aceste anchete furnizează un volum mare de date se pune
problema posibilităţii extrapolării rezulatelor, imposibil de realizat datorită necunoaşterii
reprezentativităţii eşantionului celor ce au răspuns.

O a treia metodă de eşantionare dirijată este metoda de eşantionare bazată pe


accesibilitate, cercetătorul alegând acei membrii ai populaţiei de la care se pot obţine cel mai
uşor informaţiile.

9
Deşi metodele prezentate mai sus nu respectă principiile eşantionarii aleatoare, sunt
folosite destul de des în sondajele de piaţă, fiind efectuate de specialişti în domeniul
marketing-ului, ce contribuie prin cunoştinţele şi experienţa acumulată la atenuarea
dezavantajelor acestor metode de eşantionare.
În practică, se pot combina metodele de eşantionare aleatoare cu cele dirijate,
obţinându-se o combinaţie de avantaje şi atenuarea dezavantajelor fiecăreia. Un exemplu îl
constituie selecţia stratificată. În selecţia stratificată se împarte întreaga populaţie în straturi
(grupe) după criterii de stratificare corespunzătoare scopului sondajului, şi se alege din fiecare
strat cate un subeşantion folosind procedeul aleator de selecţie.
Eşantionarea stratificată se recomandă a se utiliza în studiul fenomenelor economico-
sociale de masă şi în mod special în studierea fenomenelor de piaţă, caracterizate printr-un
grad mare de eterogenitate. Pentru a creşte gradul de omogenitate populaţia de referinţă se
împarte mai întâi pe grupe omogene. Aplicând în continuare selecţia aleatoare în fiecare
grupă, subeşantionul obţinut va fi omogen. Erorile de sondaj rezultate vor fi mai mici decât în
cazul extragerii eşantionului din populaţia totală neîmpărţită pe clase omogene.

6. Erori întâlnite în sondaj

Orice măsurare statistică conţine erori. O posibilă clasificare a erorilor, din mulţimea
posibilităţilor de grupare şi clasificare existente poate fi: erori sistematice, grosolane şi
aleatoare Erorile sistematice sunt determinate de acţiunea unor factori ale căror cauze de
apariţie pot fi stabilite, iar apoi eliminate. Apariţia erorilor grosolane este legată de încălcarea
condiţiilor de efectuare a experimentului sau a observaţiei. În teoria erorilor se dau criterii de
depistare a erorilor grosolane. Obiectul teoriei erorilor îl constituie numai erorile aleatoare,
care sunt determinate de acţiunea unor factori greu de depistat, din care cauză efectul acţiunii
lor este inevitabil. Erorile de sondaj mai sunt clasificate în erori de înregistrare, comune
tuturor tipurilor de observare, şi erori de reprezentativitate, specifice sondajului. Erorile de
reprezentativitate sunt la rândul lor: sistematice şi întâmplătoare.
Din punctul de vedere al posibilităţii controlului erorilor, în literatura americană de
studiu al pieţei, erorile mai sunt clasificate în două mari grupe:
1. Erori ce pot fi previzionate: acestea sunt controlabile şi au drept cauze măsurările
statistice ale datelor continue şi rotunjirile efectuate pentru a obţine rezultate discrete conform
conţinutului caracteristicii statistice, deci ele sunt probabile - sau de sondaj şi de calcul -

10
ambele tipuri putând fi estimate şi efectele lor controlate. Prin operaţiunea matematică de
rotunjire a valorilor înregistrate se induc erori ce se amplifică dacă rotunjirea continuă în faza
de analiză.
Drept urmare putem afirma că datele sunt rotunjite din următoarele motive:
 Dacă caracteristica observată este continuă în anumite cazuri este necesară rotunjirea
pentru a putea exprima magnitudinea datei (de obicei se păstrează doar două zecimale)
 Pentru caracteristicle discrete rotunjirea are drept scop respectarea caracterului întreg
al acestora.
2. Erori ce nu pot fi previzionate: acestea sunt necontrolabile şi se datorează:
înregistrărilor incomplete sau incorecte, definirii ambigue a caracteristiclor sau unităţilor
statistice ce sunt studiate.
Identificam doua tipuri de erori de sondaj din punctul de vedere al utilizarii tehnicilor
de esantionare:

1. Erori de sondaj, datorate procedurii probabilistice de selectie


 Diferentele dintre valorile estimatorilor si patrametrilor
 Apar cu o anumita probabilitate

2. Erori care nu sunt datorate procedurii de sondaj


 Greseli
 Non-raspunsuri
 Imposibilitatea selectarii unor elemente ale populatiei mama
 Inducerea/influentarea raspunsurilor
 Necunoasterea raspunsurilor

Principalele cauze ale erorilor sistematice sunt alegerea deliberată a unor date
considerate în mod greşit ca fiind reprezentative, alegerea la “întâmplare” ce diferă esenţial de
alegerea după principiile probabilistice, dorinţa voită a cercetătorului de a demonstra o
anumită concluzie, substituirea unei unităţi de cercetare cu altă unitate, în mod voit şi
cuprinderea incompletă în sondaj a unităţilor de cercetare.
Spre deosebire, erorile aleatoare de selecţie apar din procesul de sondaj. Aceste erori
se produc chiar dacă se respectă principiile probabilistice, deoarece eşantionul nu reproduce
perfect distribuţia populaţiei generale. Dacă sondajul este probabilistic, aceste erori pot fi
calculate cu anticipaţie. Estimarea parametrilor din populaţia generală se va efectua pe baza

11
indicatorilor de sondaj, corectaţi cu o eroare de reprezentativitate ce se găseşte într-un anumit
interval probabilistic. Aceste analize de perspectivă şi aceste proiecţii ale rezultatelor
sondajului asupra populaţiei de referinţă, fac din metoda sondajului un puternic instrument în
procesul luării deciziilor în mediul economico-de piaţă.

7. Conceptele estimaţiei. Construcţia intervalelor de încredere

Obiectivul estimaţiei este caracterizarea nivelului parametrului populaţiei


(indicatorului populaţiei, de exemplu media aritmetică din populaţie) pe baza valorii
estimatorului (indicatorul pentru eşantion, media de sondaj)
Sarcinile fundamentale ale teoriei erorilor sunt definirea legilor de repartiţie a
erorilor aleatoare, obţinerea estimaţiilor mărimilor măsurabile necunoscute, pe baza datelor
unor măsurări repetate şi calculul acestor estimaţii.
Apar 2 tipuri de estimări:
- Estimarea punctuală, printr-o singură valoare
- Estimarea printr-un interval.
Estimarea punctuala caracterizeaza parametrul populatiei prin estimarea unei singure
valori sau a unui PUNCT.
Intervalul de estimare denumit şi intervalul de încredere realizează inferenţa
despre populaţie prin estimarea valorii parametrului într-un interval determinat pentru un
anumit nivel de incredere (probabilitate)
Conceptul estimării punctuale trebuie lărgit cu cel al estimării unui interval de variaţie
pentru parametrul populaţiei totale, garantat cu o anumită probabilitate. Într-o viziune mai
largă, dacă parametrul ar fi fost un vector, prin estimarea intervalului s-ar stabili regiunea
critică a acestuia. Un exemplu îl constituie intervalele de încredere.
În cazul unui eşantion de volum n, extras dintr-o populaţie normal distribuită cu media
necunoscută şi deviaţia standard cunoscută, probabilitatea 1 – α este probabilitatea ca media
de sondaj să varieze cu o mărime denumită eroare limită, ±z α/2 .σ √n, utilizată pentru a estima
intervalul de variaţie a mediei, şi zα/2este parametrul corespunzător punctului procentual α/2 al
distribuţiei normale standard.

x
Dacă z este: Z
 n

Putem stabili următoarea declaraţie de probabilitate:


 
P(   z 2  x    z 2 )  1
n n
12
Astfel încât, rescriind obţinem:
 
P( x  z 2    x  z 2 )  1
n n

unde nivelul de semnificaţie este 1-α este de regulă 5 % pentru o probabilitate de garantare a
rezultatelor de 95%.
Argumentul funcţiei Laplace pentru diverse niveluri de încredere sunt prezentate în tabelul de
mai jos:

Niveluride
Niveluri de
incredere
incredere  /22
/ z/2
0.90
0.90 0.10
0.10 0.05
0.05 1.645
1.645
0.95
0.95 0.05
0.05 0.025
0.025 1.96
1.96
0.98
0.98 0.02
0.02 0.01
0.01 2.33
2.33
0.99
0.99 0.01
0.01 0.005
0.005 2.575
2.575
.

Construcţia intervalelor de încredere pentru media aritmetică

Intervalul de încredere pentru medie se construieşte prin procedeul extinderii directe.


Acest procedeu constă în estimarea indicatorilor colectivităţii generale, fără ca să se fi
înregistrat în prealabil unităţile ei, cu ajutorul indicatorilor calculaţi din datele obţinute în
urma organizării culegerii datelor de sondaj.

a. Interval de incredere pentru media populaţiei ( σ cunoscut)


Estimarea indicatorilor colectivităţii totale cu ajutorul indicatorilor calculaţi la nivel de
eşantion, face ca aceştia să nu aibă o valoare determinată, ci datorită erorilor inerente
preocedurii probabilistice de sondaj, erorile de reprezentativitate, ei să se abată de la cei reali.
Vom putea spune, cu o anumită probabilitate vom pute spune că ei sunt plasaţi într-un interval
dat de media de sondaj plus (minus) eroarea limită (inegalitatea lui Cebîşev):
x populaþie  x sondaj   x , adica

 
x  z 2  x  1.96
n n

Unde
n = volumul eşantionului

13
σ = dispersia variabilei în populaţia mama din care a fost extras eşantionul.

Intervalul de încredere este afectat de:

• deviaţia standard a populaţiei (s)

• nivelul de încredere, probabilitatea de garantare (1-a)

• dimensiunea esantionului (n).

Dimensiunea intervalui de încredere şi implicit acurateţea estimării va creşte prin creşterea


volumului eşantionului. Practic se stabileşte cât se doreşte să fie eroarea de sondaj şi apoi se
determină volumul eşantionului.

Intervalul de încredere este, practic, util auditoriului, utilizatorilor de date secundare.


Afirmatia “estimarea mediei cu ± e unitati”, înseamnă estimarea intervalului de încredere de
forma generală:

parametru = valoarea estimatorului ± eroarea de sondaj,

adică:
x e
Dimensiunea eşantionului – sondaj simplu aleator, s cunoscut, procedeul de selecţie cu
bila revenită este:
 z 2 
2

n 
 e 

b. Interval de încredere pentru media populaţiei ( σ necunoscut)

Dacă nu se cunoaşte deviaţia standard din populaţie, s, se va înlocui cu valoarea


estimatorului acesteia, deviaţia standard din eşantion, s.

Inferenţa asupra unei proporţii

Se aplică datelor nominale şi frecvenţelor relative. Estimatorul folosit pentru inferenţă este
indicatorul de sondaj, p, proporţia calculată pentru eşantion.

x
p unde
n
x  numarul _ cazurilor _ de _ succes.
n  volumul _ esantionul ui.

14
În anumite condiţii, proporţia în eşantion este normal distribuită cu media m = π
(proporţia din populaţie) şi dispersia = p(1 - p). Dacă procentul din populaţie este π, valoarea
z va fi:

p  procent _ din _ populatie


Z
p(1  p) / n

Greutatea specifică a unităţilor din cadrul colectivităţii totale, care posedă o anumită
caracteristică (luată în considerare în momentul formării eşantionului) poate fi estimată, cu o
precizie antecalculată, astfel încât ea poate lua valori într-un interval de forma:
p  w   w , adica

p  eroarea _ de _ sondaj  p  e  p  z / 2 p(1  p) / n

În acest caz, dispersia din populaţie nu este cunoscută, fiind π (1 - π). Pentru
caracteristica alternativă se va putea estima nivelul lor absolut în carul colectivităţii totale, ca
un produs între limitele intervalului de încredere şi volumul întregului fenomen, adică:
N (w   w ) . In acest caz volumul esantionului va fi:

2
z p(1  p) 
n    /2 
 e 

8. Testul de autoevaluare . Determinarea indicatorilor de sondaj in cazul


unei selecţii nerepetate.
1. Alegeţi una din variantele următoare:
a) Adevărat întotdeauna: A
b) Adevărat în anumite condiţii: B
c) Fals: C
d) Nu au sens: E,
pentru a aprecia caracterul afirmaţiilor:
1.1 Volumul eşantionului nu poate să scadă, situaţie ce determină o evoluţie constantă a erorii
limită

15
1.2 Volumul eşantionului poate să scadă, ceea ce determină creşterea cheltuielilor de
înregistrare şi creşterea erorii limită
1.3 Volumul eşantionului poate să crească, determinând scăderea erorii limită şi a costului de
înregistrare
1.4 Volumul eşantionului poate să se modifice, determinând o mişcare în acelaşi sens a
costului de înregistrare şi în sens contrar a erorii limită
2. Un eşantion de volum normal corespunde:
a) repartiţiei Gauss-Laplace
b) repartiţiei Student
c) repartiţiei binomiale
d) Repartiţiei t
e) altei repartiţii, precizaţi care anume ...
3. Nu constituie un avantaj al sondajului:
a) operativitatea
b) costul diminuat comparativ cu cel al unei cercetări totale
c) complexitatea informaţiilor culese
d) erorile de înregistrare reduse
e) prezentarea prin sondaj a unei situaţii existente la un moment dat, fără a evidenţia
dinamica fenomenului
4. În ce domeniu se pot folosi doar cercetările selective şi nu cele totale:
a) cunoaşterea veniturilor populaţiei
b) controlul calităţii produselor prin metode distructive
c) cunoaşterea preferinţelor clienţilor
d) cunoaşterea structurii populaţiei unui oraş
e) cunoaşterea structurii efectivelor de animale
5. Raportul dintre eroarea limită şi eroarea medie de selecţie, într-un sondaj repetat, în care
rezultatele sunt garantate cu o probabilitate de 95%, este:
a) supraunitar
b) subunitar
c) negativ
d) pozitiv

16
e) mărimile nu se pot compara
6. Erorile probabile de sondaj sunt în raport cu erorile de înregistrare:
a) mai mici cu cât volumul eşantionului creşte
b) constante, indiferent de volumul eşantionului
c) întotdeauna egale
d) din ce în ce mai mici pe măsură ce volumul eşantionului scade
e) ocupă întotdeauna ponderea cea mai mare din totalul erorilor
7. Se cunosc datele despre distribuţia a 50 de candidaţi admişi la o facultate din Bucureşti
după media la examenul de admitere (candidaţii au fost aleşi din listele de admitere) aleatoriu
si nerepetat:
Grupe de candidaţi după media la examenul
Număr candidaţi
de admitere
7,75-8,07 5
8,07-8,39 12
8,39-8,71 11
8,71-9,03 9
9,03-9,35 4
9,35-9,67 9
Total 50
Se cere:
1) Să se verifice reprezentativitatea eşantionului candidaţilor după media la examenul de
admitere ştiind că media la admitere pe total colectivitate ( X 0 = 8,02).
2) Să se calculeze eroarea medie probabilă de selecţie.
3) Eroarea maximă admisă dacă rezultatele se garantează cu o probabilitate de 95,45%
pentru care z = 2 ştiind că volumul colectivităţii totale a fost de 655 candidaţi.
4) Să se estimeze limitele între care se va încadra media la admitere a tuturor candidaţilor.
5) Să se determine noul volum de selecţii care va fi necesar, dacă eroarea limită admisă se
reduce de 1,5 ori, iar probabilitatea cu care se garantează rezultatele rămâne
neschimbată (respectiv
z = 2).
6) Să se determine dacă argumentul funcţiei Gauss Laplace va rămâne neschimbat prin
micşorarea erorii limită admisă de la punctul anterior.

9. Răspunsuri şi comentarii la testele de autoevaluare

1.1 C
1.2 C
1.3 B
1.4 A
2. a
3. e

17
4. b
5. a
6. a
7. Rezolvare:

Notaţii:
N = volumul colectivităţii generale
n = volumul eşantionului
X 0 = media colectivităţii generale
X = media de selecţie a eşantionului
i2 = dispersia de selecţii a eşantionului.

1) Pentru verificarea reprezentativităţii eşantionului este necesar să determinăm media


de selecţie şi apoi coeficientul de reprezentativitate al eşantionului.
 Media ( X ):
m x a
 i 
i 1  k  72
- prin calcul simplificat: X = m
 k + a =  0,32 + 8,23 =
 ni 50
i 1
= 8,69 puncte/candidat

unde: a = 8,23 (centrul de interval căruia îi corespunde frecvenţa maximă)


k = 0,32 (pasul de numărare indică mărimea intervalului de grupare)
Algoritmul de calcul necesar determinării indicatorilor de selecţie este prezentat în
tabelul următor:
 xi  a 
2
Media de Număr Centrul xi  a  xi  a 
   ni    ni
admitere candidaţi interval k  k   k 
7,75-8,07 5 7,91 -1 -5 5
8,07-8,39 12 8,23 0 0 0
8,39-8,71 11 8,55 1 11 11
8,71-9,03 9 8,87 2 18 36
9,03-9,35 4 9,19 3 12 36
9,35-9,67 9 9,51 4 36 144
Total 50 - - 72 232
 Coeficientul de verificare a reprezentativităţii

X  X0 8,69  8,62
dc/0 =  100 =  100 = 0,81%
X0 8,62

Deoarece dc/0  +5% se consideră că eşantionul este reprezentativ. Din punct de vedere
al semnului coeficientul e pozitiv deci putem afirma că media eşantionului este mai mare
decât media tuturor candidaţilor cu 0,06 puncte.

2) Eroarea medie probabilă de selecţie

18
 i2  n 0,2635  50 
X  1    1   = 0,069 puncte/candidat.
n  N 50  655 
3) Eroarea maximă admisă (limită):
X = z X = 2  0,069 = 0,138 puncte/candidat.
4) Estimarea intervalului de încredere a mediei la admitere a tuturor candidaţilor se
determină după relaţia:
X - X  X 0  ( X + X)
0,69 – 0,139  X 0  8,69 + 0,19
8,55 puncte  8,62  8,82 puncte
În cazul selecţiei aleatoare simple fără revenire erorile sunt mai mici decât în cazul
selecţiei cu revenire, deci estimarea medie la admitere a tuturor candidaţilor este corectă.
Media tuturor candidaţilor se va încadra între nota cea mai mică 8,55 puncte şi nota cea mai
mare d e8,82 puncte.
5) Volumul noului eşantion este dat de relaţia:
z 2   i2 2 2  0,2635
n’ =  = 105,4  105 candidaţi
z 2   i2 2 2  0,2635
' X 
2
(0,092) 
2

N 655
 X 0,139
unde: ’X =  = 0,092 puncte/candidat
1,5 1,5
Dacă eroarea limită admisă se micşorează de 1,5 ori, atunci volumul eşantionului va
trebui să crească cu (105 – 50 = 55 candidaţi).
Se observă că volumul noului eşantion în cazul selecţiei aleatoare simple fără revenire
este mai mic decât volumul noului eşantion în cazul selecţiei aleatoare simple cu revenire
deoarece însăşi procedeul de formare a eşantionului conduce la erori mai mici decât procedeul
selecţiei aleatoare cu revenire.
' X 0,092
6) z’ =  = 1,31  (z’) = (1,31) = 0,8098 sau 80,98%  rezultat din
 X 0,069
tabelele funcţiei Gauss Laplace.

10. Teme de autocontrol

1. O şarjă de 100 de bucăţi este supusă controlului de calitate, prin testarea unui eşantion de
10% din totalul şarjei. Şarja este respinsă dacă se găsesc mai mult de două produse
defecte. Pe termen lung, procentul de şarje respinse va fi:
a) 10%
b) 5%
c) 2%

19
d) nu se poate preciza
e) răspunsurile anterioare sunt false, varianta corectă este ...

2. Erorile de sondaj (probabile) pot fi evitate:


a) întotdeauna
b) nu se pune această problemă deoarece acestea nu există
c) niciodată
d) câteodată
e) uneori
3. Erorile sistematice de înregistrare pot fi evitate:
a) în măsura în care sunt evitate şi cele de reprezentativitate
b) nu se pune această problemă deoarece acestea nu există
c) niciodată
d) prin respectarea indicaţiilor de culegere a datelor
e) datorită rutinei
4. Colectivitatea de selecţie mai poate fi denumită:
a) mostră
b) eşantion
c) probă
d) colectivitate statistică
e) parte
Combinaţia corectă este.
A = a, b, c; B = b, c, d; C = c, d, e; D = b, d; E = d.

11. Rezumatul Unităţii de învăţare

Sondajul reprezintă o cercetare parţială, al cărei scop este de estimare a caracteristicilor


populaţiei generale pe baza rezultatelor obţinute de la un eşantion riguros prelevat. Acestă metodă de
investigaţie statistică parţială se bazează pe principiile teoriei probabilităţilor, statisticii matematice
şi legii numerelor mari. Tipurile de sondaje aleatoare sunt:
 Sondaj simplu aleator: sanse egale acordate unitatilor de fi cuprinse in esantion
 Sondaj stratificat – pe GRUPE, straturi formate dupa anumite variabile independente (de
forma M/F de exemplu)
 Sondajul sistematic – alegerea se face dupa un pas de numarare
 Sondaj “cluster” – pe GRUPURI
Intervalul de încredere este, practic, util auditoriului, utilizatorilor de date secundare.
Afirmaţia “estimarea mediei cu ± e unităţi”, înseamnă estimarea intervalului de încredere de forma
generală:

20
parametru = valoarea estimatorului ± eroarea de sondaj,
adică: x e
Dimensiunea esantionului – sondaj simplu aleator, s cunoscut, procedeul de selectie cu bila
revenita este:
 z 2 
2

n 
 e 

b. Interval de încredere pentru media populaţiei ( σ necunoscut)


Dacă nu se cunoaşte deviaţia standard din populaţie, s, se va înlocui cu valoarea estimatorului
acesteia, deviaţia standard din eşantion, s.
Inferenta asupra unei proportii
Se aplică datelor nominale şi frecvenţelor relative. Estimatorul folosit pentru inferenţă este
indicatorul de sondaj, p, proporţia calculată pentru eşantion.
x
p unde
n
x  numarul _ cazurilor _ de _ succes.
n  volumul _ esantionul ui.

În anumite condiţii, proporţia în eşantion este normal distribuită cu media m = π (proporţia


din populaţie) şi dispersia = p(1 - p). Dacă procentul din populaţie este π, valoarea z va fi:

p  procent _ din _ populatie


Z
p(1  p) / n

Greutatea specifică a unităţilor din cadrul colectivităţii totale, care posedă o anumită
caracteristică (luată în considerare în momentul formării eşantionului) poate fi estimată, cu o precizie
antecalculată, astfel încât ea poate lua valori într-un interval de forma:
p  w   w , adica

p  eroarea _ de _ sondaj  p  e  p  z / 2 p(1  p) / n

In acest caz, dispersia din populatie nu este cunoscuta, fiind π (1 - π). Pentru caracteristica
alternativă se va putea estima nivelul lor absolut în carul colectivităţii totale, ca un produs între
limitele intervalului de încredere şi volumul întregului fenomen, adică: N (w   w ) . In acest caz
volumul

2
z p(1  p) 
n    /2 
 e 

21
12. Bibliografia Unităţii de învăţare

1. Bădiţă, M., Cristache S. E., Şerban, D., Teste grilă de statistică , ed. Amalteea, , 81 pg.,
Bucureşti, 1998.
2. Cristache, S.E., Şerban, D., Lucrări aplicative de Statistică şi Econometrie, Ed. ASE,
Bucureşti, 2007, 433 pg.
3. Isaic Maniu, Al., Voineagu, V., Mitruţ, C., Baron, T., Ţiţan, E., Matache S., Şerban D.,
Voineagu, M., Statistică teoretică. Studii de caz şi aplicaţii, Ed. Economică, 255 pg.,
Bucureşti, 1998.
4. Şerban, D., „Statistica pentru studii de marketing si administrarea afacerilor”, ed. ASE,
2004.

22

S-ar putea să vă placă și