Sunteți pe pagina 1din 81

II.

MODULUL EXCELENTA
1.INTRODUCERE
1.1 Scurt istoric
Cu toate ca recensamantul populatiei si al bunurilor este semnalat din cele mai vechi
timpuri de exemplu in Egipt sunt organizate recensamine cu caracter fiscal intre 2700 si 2500
inaintea erei noastre, primele incercari de extrapolare a unor date partiale sunt mult mai recente.
Utilizarea acestora este legata, de exemplu in Anglia, de progresele asa-numitei aritmetici
politice practicata in special de John Graunt (1620-1674) si William Petty (1623-1687).
Tot in aceeasi perioada procedurile de extrapolare au inceput sa fie utilizate si in Franta. In 1664
ministrul Colbert solicita administratorilor realizarea unei anchete privind situatia zonelor din
subordinea lor, aceasta fiind precedata de o ancheta pilot in rasaritul tarii.
Tehnica extrapolarii a intregistrat o mare popularitate in special in secolul al XIX-lea, cand a
aparut si o prima incercare de realizare a stratificarii (Jurnal of Economic Literature, decembrie
1971).
O data cu cresterea numarului extrapolarilor empirice privind studierea aprofundata a unei
parti a populatiei, se inregistreaza progrese si in plan teoretic prin aparitia primelor lucrari in
domeniul teoriei probabilitatilor ale unor matematicieni de renume precum Pascal, Fermat,
Bernoulli.
Intre timp au inceput sa se realizeze din ce in ce mai multe sondaje de opinie, in special in SUA. In
1936, cu ocazia alegerilor prezidentiale, metoda esantionarii a inregistrat o mare victorie prin
verificarea in practica a rezultatelor sondajului efectuat de George Gallup, care indicau victoria lui
Roosevelt. Astfel ca, in 1938 au fost organizate institute de cercetare a opiniei si in Franta si
Anglia.
Remarcabila este contributia lui Neyman a carui prezentare sustinuta in 1934 in fata membrilor
Royal Statistical Society poate fi considerata drept actul de nastere a teoriei moderne a
sondajului (Jurnal of the Royal Statistical Society, 22, Seria B).
Astfel, fiind realizate bazele teoriei sondajului, eforturile au fost orientate in doua directii:
problemele practice cum ar fi: metodele de esantionare, de estimare, de realizare a
chestionarelor, formarea a operatorilor de interviu, extrapolarea rezultatelor sondajelor,
analizarea rezultatelor;
fundamentarea metodelor de esantionare prin aplicarea statisticii inferentiale.
Au fost inregistrate progrese in ambele directii, cu rezultate remarcabile, dar care nu pot fi
considerate definitive. Prin urmare, si la ora actuala literatura de specialitate continua sa trateze
atat aspectele practice cat si cele teoretice ale sondajelor.
In Romania nu se poate vorbi de o statistica organizata inainte de secolele XVIIIXIX.
Prima scriere sau recensamant al locuitorilor pare sa fi fost realizat in timpul lui Constantin
Mavrocordat, cu ocazia reformelor din Muntenia si Moldova.
Cercetarea selectiva in tara noastra a fost realizata, la inceputurile ei, in stransa colaborare cu
scoala sociologica din Bucuresti infiintata si condusa de Dimitrie Gusti.
In anul 1948 Anton Golopentia si echipa sa au pregatit metodologia necesara pentru anchetele
bugetelor de familie. Aceasta ancheta a fost sursa principala de informatii privind nivelul de trai al
populatiei in perioada 1949 1989.
1
1.2 Tendinte actuale
Sondajul este o tehnica de producere a informatiei, care face parte din domeniul informatiei
statistice, la randul sau inclus in unversul informatiei generale (J. Antoine, 1999).
La nivel mondial, cresterea gradului de informare este dependenta de cresterea PNB global si, asa
cum se stie, ritmul acestui indicator va fi diferit, in functie de regiuni.
In tarile dezvoltate fluxul si cerintele privind gradul de informare vor converge spre
cresterea volumului de informatie la nivel international, in special cu caracter economic, politic si
social si spre informatii rapide. Ideal este accesul on-line si in timp real la informatii instantanee
privind situatiile de moment. Aceste exigente vor fi realizabile ca urmare a imbunatatirii
performantelor la nivel tehnologic: cresterea vitezei de prelucrare si a capacitatii de stocare insotite
de scaderea costului echipamentelor.
Un alt aspect important este existenta unei tensiuni ( deja prezenta si in continua crestere, care se
va generaliza la nivel mondial) intre, pe de o parte, cerintele de informatii detaliate la nivel de
entitate sociala, iar pe de alta parte, respectul vietii private si protectia datelor strategice ale
firmelor.
Jaqueus Antoine (2001) apreciaza ca domeniul sondajelor este confruntat cu urmatoarele probleme
majore:
a) ponderea non-raspunsurilor si sarcina respondentilor;
b) erorile datorate modalitatilor de realizare a anchetelor;
c) tendinta de exhaustivitate si pastrarea anonimatului;
d) reculul frontierei dintre calitativ si cantitativ;
e) cerinta intotdeauna mai mult.
a) Ponderea non-raspunsurilor si sarcina respondentilor
Sondajele care utilizeaza esantionarea aleatoare (in principal fisiere exhaustive) au cunoscut
in cursul timpului ponderi din ce in ce mai mari privind non-raspunsurile.
In cazul sondajelor realizate la nivel de firme, institutii, preocuparea majora este de a se limita
cat mai mult sarcina respondentilor, preocupare care este acceptata de firmele ce comanda si
initiaza studiul. Acest aspect reprezinta o motivatie puternica pentru dezvoltarea sistemelor EDI
Electronic Data Interchange.
Prin urmare, statisticienii pot considera ca o provocare dezvoltarea tehnicilor care permit
evitarea interogarii oamenilor, cum ar fi:
interogarea bazelor de date deja existente;
utilizarea scanarii pentru identificarea obiectelor si caracteristicilor acestora;
fuzionarea fisierelor, ceea ce permite simularea non-raspunsurilor;
utilizarea informatiilor auxiliare in vederea imbunatatirii estimatorilor.
In ceeea ce priveste informatiile calitative si in special opiniile oamenilor, pentru moment nu
exista solutii care sa nu implice cooperarea lor.
In acest sens au fost realizate cercetari pentru reperarea si corectarea erorii datorate
volontariatului participarii la sondajul desfasurat. Dar chiar daca este vorba de sondaj pe cote, de
sondaj aleator simplu sau de panel, ca regula generala, sondajele sunt realizabile doar cu acordul
2
voluntar al persoanelor, firmelor sau institutiilor solicitate sa raspunda. Insa cresterea ponderii non-
raspunsurilor antreneaza cresterea erorii datorate voluntariatului.
b) Erorile datorate modalitatilor de realizare a anchetelor
Groves (1994) prezinta urmatoarele tipuri de erori:
erori datorate dificultatilor conceptuale;
erori de reprezentativitate;
erori de observare si de masurare;
erori datorate prelucrarii si disponibilitatii rezultatelor;
pertinenta informatiilor in diferite domenii.
Autorul precizeaza ca, pentru solutionarea acestei probleme este necesara o colaborare
interdisciplinara.
c) Tendinta de exhaustivitate si pastrarea anonimatului
Asa cum am mai precizat, tendinta este de a fuziona, prelucra si utiliza megabazele de date. Este
insa important sa se stie in ce masura aceste instrumente utilizate pentru operatii de marketing
direct pot contribui la realizarea studiilor, in pofida lipsei de reprezentativitate stiind ca, in acest
domeniu, cantitatea nu poate inlocui niciodata calitatea.
De exemplu, tehnica de fuzionare a fisierelor permite completarea informatiilor absente pentru a
realiza o simulare a datelor pentru intregul fisier. Aceste tehnici sunt dezvoltate inca din anii 80 in
domeniul audientei media, in cursul ultimilor ani fiind utilizate si in domeniul geomarketingului.
Tinand cont de aceste aspecte, se poate realiza o clasificare a anchetelor in trei categorii principale
(J. Antoine, 2001):
anchete statistice fondate pe metodele de esantionare reprezentativa care vizeaza numai
stabilirea de date globale, pentru care anonimatul este regula;
anchetele de gestiune comerciala care vizeaza in special constituirea si calificarea fisierelor
nominative si pentru domenii cat mai exhaustive; cea mai mare parte a megabazelor de date
recente se afla in acest univers promovare comeciala si marketing direct.
anchetele de comunicare sociala care nu vizeaza nici reprezentativitatea statistica, nici
prelucrarea individuala a raspunsurilor si care se plaseaza in domeniul consultarii
cetatenilor, consumatorilor, utilizatorilor de servicii publice.
Pentru tipurile de ancheta mentionate, regulile privind confidentialitatea si pastrarea anonimatului,
nu sunt aceleasi. Deontologia presupune ca prestigiul stiintific al sondajului sa nu fie utilizat
pentru operatii care nu fac parte din acest domeniu.
d) Reculul frontierei dintre calitativ si cantitativ
Tendinta generala care se manifesta este de a realiza cuantificarea calitativului in scopul
obtinerii de analize obiective si imbunatatirii deciziilor in domeniile considerate calitative. In
aceasta situatie, statisticienii au numeroase perspective, atat prin diversitatea domeniilor
analizarea mediului, culturii, resurselor umane, comportamentului consumatorului.....cat si prin
natura activitatii realizate: definirea si/sau clarificarea conceptelor, transpunerea acestora in
instrumente de observare si masurare, mergand de la culegerea datelor pana la calculul
indicatorilor statistici.
3
Reculul frontierei dintre cantitativ si calitativ si realizarea unei legaturi mai bune intre aceste
domenii sunt obtinute cu ajutorul analizei lexicale. Potentialul de aplicare si dezvoltare a acestei
tehnici este considerabil, avandu-se in vedere nu numai prelucrarea raspunsurilor la intrebarile
deschise ci si a tuturor textelor existente, in special a celor care fac parte din domeniul comunicarii
sociale.
e) Cerinta intotdeauna mai mult
Dupa cum se stie, in anii 50 60 efectivul unui esantion considerat ca minim era de 2000, in
prezent este de 1000. In ceea ce priveste termenul de realizare a sondajului, in sectorul public se
numara in luni, iar in sectorul privat a progresat de la cateva saptamani la cateva zile, sondajele
preelectorale fiind realizate intr-o singura zi.
Toate aceste progrese, care sunt in special rezultatul presiunii beneficiarilor si concurentei, sunt
remarcabile, dar trebuie sa se analizeze daca nu au drept consecinta o diminuare a calitatii. In cazul
in care un sondaj este realizat in mai putin de 24 de ore si uneori in week end sau in vacante,
esantionul obtinut are un bias datorat absentelor de la domiciliu si care nu pot fi intotdeauna
compensate convenabil cu ajutorul tehnicilor de redresare.
Sondajul poate fi considerat ca un proces de productie industrial, cu un lant de fabricatie,
calitatea sa depinzand de toate verigile intermediare o anomalie inregistrata intr-una din verigi
afecteaza calitatea intregului ansamblu. Imbunatatirea calitatii va depinde de vigilenta tuturor
persoanelor antrenate. In consecinta, este vorba de continuarea diminuarii costurilor si
imbunatatirii performantelor fara a afecta calitatea.
La ora actuala se apreciaza ca veriga principala in care trebuie sa se actioneze este colectarea
informatiilor avandu-se in vedere atat problemele legate de distorsionarea esantionului cat si
valoarea informatiilor obtinute de la fiecare respondent. Restul verigilor functioneaza in
general bine si se va continua imbunatatirea lor.
1.3 Domenii de utilizare a sondajelor
Sfera de aplicabilitate a sondajelor este foarte variata, insa cele mai intalnite sunt sondajele
politice si sondajele privind stilul de viata (J. Antoine, 1991).
Chiar daca ponderea acestora este ridicata, sondajele sunt utilizate si in domenii precum :
marketing: in special pentru segmentarea pietei, pozitionarea in raport cu concurenta, studii
privind produsele si serviciile oferite, studii de comunicare (studii de imagine, testarea
audientei), studii privind pretul, distributia, forta de vanzare;
cercetarea calitatii produselor;
determinarea productivitatii muncii;
in agricultura, de exemplu pentru determinarea recoltei probabile;
chiar si in sport, pentru controlul antidoping, etc.
Studiile si cercetarile de marketing au ca scop principal de a furniza responsabilului de
marketing informatiile necesare in vederea solutionarii problemelor specifice, controlarii
performantelor sale si planificarii.
Conceperea lor se bazeaza pe doua aspecte esentiale:
obiectivele urmarite;
capacitatea de culegere si analiza de care se dispune.
4
In ceea ce priveste stabilirea obiectivelor, aceasta se realizeaza prin dialogul sincer
beneficiar - statistician, acesta din urma va trebui sa colaboreze cu primul pentru realizarea cat mai
precisa a proiectului propus, pentru delimitarea populatiei care va fi studiata.
In functie de problemele de cercetare definite, studiile de piata pot fi:
exploratorii;
descriptive;
explicative, predictive si cauzale;
decizionale.
Studiile exploratorii pot fi utile in urmatoarele situatii:
a) explorarea unei probleme vagi in scopul gasirii ipotezelor specifice (in acest caz,
analiza exploratorie este utilizata pentru a avea o viziune cat mai completa asupra
problemei analizate);
b) intelegerea unui fenomen si analiza detaliata a acestuia.
Intre obiectivele acestui tip de studiu pot fi mentionate:
o mai buna formulare a problemei si realizarea ulterioara a unei investigari precise;
formularea ipotezelor in ceea ce priveste relatiile intre variabile;
familiarizarea cercetatorului cu domeniul studiat;
eliminarea anumitor ambiguitati;
elaborarea chestionarelor.
Cercetatorul poate folosi atat datele secundare rapoartele si studiile documentare existente, cat si
cele primare obtinute in urma consultarii expertilor.
Studiile descriptive permit observarea, descrierea unui fenomen si se bazeaza pe metodele de
analiza statistica, permitand clasificarea variabilelor sau observatiilor. In acest caz sunt utilizate
atat datele calitative cat si cele cantitative.
Studiile explicative, predictive si cauzale sunt utilizate in scopul explicarii sau previzionarii
fenomenelor analizate. Printre principalele caracteristici ale acestei categorii de studii mentionam:
alegerea tehnicii va depinde in mod decisiv de obiectivul fixat: pentru a explica si a
previziona un anumit fenomen se va folosi, de exemplu, analiza discriminanta, regresia;
structura si dimensiunea datelor sunt fundamentale in ceea ce priveste calitatea
rezultatelor.
Control, decizie - sisteme inteligente - in cazul in care conceptele sunt cunoscute, operationale,
masurabile si relatiile intre variabile au fost testate este posibil sa se structureze aceste informatii
sub forma sistemelor inteligente decizionale.
Schematic, etapele necesare realizarii unui studiu (sondaj) sunt:
Proiectarea Culegerea Masurarea Analizarea si Luarea
datelor variabilelor interpretarea deciziilor
rezultatelor
5
Prima etapa proiectarea sondajului - depinde de fenomenul studiat care se transpune in
obiective (explorare, descriere, verificare, cunoastere) si procedee de cercetare culegere date,
prelucrare, analiza, luarea deciziilor.
In cadrul oricarui tip de sondaj trebuie sa se realizeze delimitarea stricta, in timp si spatiu a
populatiei.
Esenta sondajului consta in alegerea dintr-o populatie totala ce constituie obiectul studiului, a unui
esantion care poate sa reprezinte intreaga populatie.
Notiunea de populatie nu se refera la indivizi, la obiecte sau evenimente, ci la observatiile ce pot fi
facute cu privire la acestea.
O populatie este definita de actiunea conjugata a urmatorilor factori:
natura sa poate fi vorba de un subiect, o locuinta, o firma etc.;
caracteristicile sale intrinseci sex, tip de locuinta, sector de activitate;
localizarea sa intr-un anumit oras, judet, regiune;
data la care este studiata.
Pentru a descrie o populatie exista doua modalitati:
sub forma unei liste complete de subiecti (este identificat fiecare subiect astfel incat, din
punct de vedere al factorilor citati mai sus, sa nu existe nici o ambiguitate);
realizarea unei descrieri efective, pentru fiecare din cei patru factori precizandu-se
modalitatile pe care le poate avea.
In aceasta etapa intervine problema gasirii unei baze de sondaj, adica a unei liste exhausive de
indivizi. Frecvent insa, aceasta lista este fie imperfecta (adica nu acopera in mod corespunzator
populatia, ceea ce constituie o sursa de eroare), fie nu exista (de exemplu consumatorii unui anumit
produs).
Existenta unei asemenea liste conditioneaza insa alegerea metodei de sondaj.
1.4 Situatie privind piata studiilor
La nivel mondial, conform cifrelor publicate de ESOMAR piata studiilor a avut urmatoarea
evolutie:
An
Cifra de
afaceri
(milioane $)
Cifra de
afaceri
(milioane E)
(%) fata de anul
precedent
$ Euro
2001 15890 17756 2,8 5,8
2002 16600 17600 4,5 -0,6
2003 18800 16700 14 -5
In a doua jumatate a anului 2003, global GDP inregistreaza o crestere de aproximativ 6%
fata de rata anuala, ceea ce reprezinta cea mai mare crestere din 1999.
Si in 2003 piata studiilor (market research) continua sa se comporte mai bine decat
Advertising expenditure:
6
Growth rates in 2003:
GDP: +3.0%
Advertising expenditure:
+3.4% in +13.6% in $
+3.2% at constant $ to parity
Market research:
-5.0% in +14.0% in $
+4.0% at constant $ to parity
La nivel de regiuni, conform graficului de mai jos, se poate constata ca in 2003, ponderea
inregistrata de marketing research este aceeasi pentru Europa si America de Nord:
Sursa: The market in 2003, Prezentare realizata de Ipsos France, 2004
In ciuda tulburarilor internationale, in 2003 se constata o situatie mai buna fata de anul
precedent:
cu exceptia Germaniei, piata europeana a avut performante mai bune decat in 2002, rata
cresterii fiind de 3%;
in SUA rata cresterii a fost mai mare de 5%;
pentru Asia, cu exceptia Japoniei se inregistreaza o crestere de 5%;
in America Latina, de asemenea se constata o situatie mai buna: stabilizare dupa criza
din Argentina si inflatia din Brazilia, performante bune in Mexic: rata cresterii a fost de
5%.
Insa asa cum reiese din tabelul de mai jos marketing research este concentrata la nivelul a numai
10 tari care realizeaza o pondere de 82,1% din total:
7
Latin America
4%
ME & Africa
1%
Asia Pacific
13%
North
America
41%
Europe
41%
Countries Size Top 10 Top 20 Top 30 Top 40 Top 50
Total MR 82.1% 91.5% 95.5% 98.0% 99.0%
USA Netherlands Norway GCC Malaysia
UK Mexico Austria Ireland Venezuela
Germany Sweden South Africa Colombia Philippines
France Brazil Russia Turkey Puerto Rico
Japan Belgium New Zealand Czech Rep. Argentina
Italy Switzerland Finland Chile Peru
Canada South Korea Hong Kong Hungary Indonesia
Spain Denmark Greece Singapore Egypt
China Taiwan Portugal Israel Romania
Australia Poland India Thailand Ecuador
Sursa: The market in 2003, Prezentare realizata de Ipsos France, 2004
La nivelul principalelor institute, pentru anul 2003 clasamentul este prezentat in tabelul de mai
jos:
Rank Total Market Research
Organic
Growth
Revenues
(euros millions)
1 VNU 5.6 2694
2 IMS Health 6.0 1222
3 TNS / NFO* 1.7 1164
4 Kantar (WPP) 1.0 1017
5 GfK 3.6 595
6 Ipsos 9.4 570
7 IRI -3.1 491
8 Synovate (Aegis) 5.9 361
9 Weststat 6.0 300
10 NOP World (UBM) 0.5 295
NFO since July 2003, full year 1,395 million
Sursa: The market in 2003, Prezentare realizata de Ipsos France, 2004
Rank Survey-based research
Country
of origin
Revenues
(euros m)
1 Kantar (WPP) UK 1017
2 TNS / NFO* UK 689
3 Ipsos France 570
4 VNU NL 390
5 Synovate (Aegis) UK 316
6 Westat* USA 300
7 NOP World (UBM) UK 295
8 GfK Group Ger. 280
9 The Arbitron Co. USA 242
10 Maritz Research USA 172
*NFO consolidated since July 2003, full year: 920 million
8
Sursa: The market in 2003, Prezentare realizata de Ipsos France, 2004
In Franta, ancheta realizata de Syntec Etudes Marketing et Opinion privind activitatea
membrilor sai din anul 2001 arata o crestere a ciferei de afaceri a acestora de 8,5%, volumul de
activitate fiind de 0,654 miliarde . In medie, din 1996-2000 cresterea a atins 9,6%.
Sursa: Syntec Etudes Marketing et Opinion
2001 poate fi considerat un an cu o crestere semnificativa; a existat o conjunctura favorabila
datorata inovarii si lansarii de noi produse.
Tipul populatiei interogate a evoluat puternic in raport cu anul 2000: partea globala a studiilor
privind marile public este in recul, in timp ce cea a studiilor B to B si a celor interne realizate
in cadrul firmelor a progresat. Alte tipuri de studii se dezvolta, in special anchetele de satisfactie
care au cunoscut un veritabil boom. Ponderea acestora in cadrul cifrei de afaceri totale
progreseaza de la 4,5% in 2000 la 8% in 2001.
In figura de mai jos este prezentata situatia privind sectoarele de activitate carora apartin
firmele cliente:
Sursa: Syntec Etudes Marketing et Opinion
9
Asa cum se poate constata, sectorul care a solicitat cele mai mult studii este bunurile de larg
consum care ramane aproximativ la acelasi nivel ca in 2000. Situatia detaliata privind cifra de
afaceri care provine din acest sector este prezentata in figura de mai jos:
Sursa: Syntec Etudes Marketing et Opinion
Chiar daca ponderea alimentatiei a inregistrat o usoara diminuare fata de anul 2000, aceasta
ramane predominanta in cadrul sectorului.
Situatie ROMANIA
Alimentatie
42%
Cosmetica
19%
Echipamente
11%
Tutun
2%
Alte produse
5%
Bauturi
alcoolice 10%
Produse de
intretinere
11%
-5.9
+17.8
-11.6
+20.1
+2.2
-12.3
-2.6
10
2. TIPURI DE SONDARE
2.1. SONDAJE ALEATOARE
2.1.1 Sondajul aleator simplu
Sondajul aleator simplu consta in a extrage, fara revenire, dintr-o populatie de marime N,
un esantion de marime fixa n, astfel incat fiecare unitate sa aibe aceeasi probabilitate de includere
in esantion (fara nici o manipulare prealabila in cadrul populatiei).
Sondajul aleator simplu atribuie fiecarui esantion care poate fi format -s aceeasi probabilitate de
iesire p(s), egala cu inversul numarului de esantioane distincte care poate fi constituit in cadrul
populatiei.
Acest tip de sondaj se realizeaza in cadrul populatiei brute, fara nici un fel de stratificare in
prealabil si nu necesita nici o informatie auxiliara la nivel de individ.
Observatie: trebuie facuta distinctia intre conceptul de esantionare aleatoare si cel de esantionare
simpla aleatoare. Acesta din urma presupune ca fiecare esantion posibil de n unitati (indivizi)
dintr-o populatie N are o sansa egala de a fi selectionat in vederea unui sondaj.
Calculul probabilitatii de includere in esantion
In orice sondaj de marime fixa n, daca notam P
i
probabilitatea pe care o are individul i de a
fi prezent in esantion (este probabilitatea de includere sau probabilitatea de selectie) si cu N
marimea populatiei studiate, atunci:
cu exceptia cazului in care n = 1; P
i
nu este deci o veritabila probabilitate (pentru ca aceasta
suma difera de 1) (P. Ardilly, 1994).
Daca p(s) este probabilitatea de extragere a esantionului s, P
i
este obtinuta cu ajutorul relatiei:
In cazul sondajului aleator simplu, P
i
este constanta si este egala cu:
i
n
P
N
.
Raportul n/N se numeste procent (pondere) de esantionare.
Deoarece toate esantioanele, in numar de
n
N
C au, cel putin teoretic, probabilitati de extragere
identice,
1
( )
n
N
p s
C

.
De altfel, numarul total de esantioane de marime n care contin unitatea i este
1
1
n
N
C

.
In final,
1
1
1
( )
n
N n i
i s
N
n
p s C
C N
P


.
Oricare ar fi familia de probabilitati P
i
, singurul estimator liniar nedeplasat pentru totalul T este:
$ i
i s
i
Y
P

11
( )
i
i s
p s
P

N
i
i
P n

1
Daca notam cu y media pentru Y
i
calculata la nivelul esantionului s, atunci se poate scrie ca
estimatorul nedeplasat pentru T, in cazul acestui tip de sondaj este:
$ $
i
i i s
i s
Y
Y
N N y
n
n
N

Cum
T
Y
N

rezulta ca estimatorul pentru medie este:


T
Y y
N
.
Acest estimator este nedeplasat pentru ca:

( )
( )
E T
T
E y Y
N N

.
O eroare nula este o conditie importanta pentru derularea anchetei, insa nu este un criteriu infailibil
de calitate; ceea ce conteaza in ultima instanta, este abaterea medie patratica.
Dispersia variabilei Y in ansamblul populatiei este:
( )
2
2
1
1
1
N
i
i
S Y Y
N


.
Cu cat populatia este mai eterogena in raport cu Y (adica cu cat indivizii sunt mai diferiti in raport
cu variabila Y), cu atat valoarea dispersiei va fi mai mare.
Se stie ca:
2
2
2
1
1
1 1
N
i
i
N
S Y Y
N N

_




,

; daca N este mare:


2
2
2
1
1
N
i
i
S Y Y
N

.
Estimarea dispersiei principalilor indicatori
Cazul mediei
Pentru a realiza un sondaj aleator simplu care sa furnizeze rezultate precise, conform
formulei: ( ) ( )
S
V y f
n

2
1
trebuie sa se aibe in vedere ca (P. Ardilly, 1994):
marimea esantionului n sa fie suficient de mare;
valoarea ponderii de sondaj (frecventei relative) - f, sa fie apropiata de 1;
dispersia S
2
sa fie redusa.
In ceea ce priveste a doua conditie, ponderea de sondaj este intotdeauna cuprinsa intre 0 si 1.
Daca aceasta valoare se apropie de 1, atunci n se apropie de N si sondajul devine aproape un
recensamant. In practica nu se poate actiona decat in cazuri rare asupra acestei conditii, in mod
curent ponderile f utilizate fiind neglijabile.
Factorul 1-f care intervine in formula dispersiei se numeste corectia populatiei.
Observatie: Nu este analizat si cazul sondajului aleator simplu repetat (cu revenire) deoarece
acesta este mai putin precis posibilitatea de a extrage de mai multe ori aceeasi unitate implica
riscul de a colecta de mai multe ori aceeasi informatie (si eventual o aceeasi valoare aberanta).
Este demonstrat ca in cazul sondajului aleator simplu repetat (cu revenire), media simpla y este un
estimator nedeplasat pentru
Y
si ca ( )
N
V y S
n N


2
1 1
.
In consecinta, raportul dintre dispersia sondajului aleator simplu nerepetat (fara revenire) si
dispersia sondajului aleator simplu repetat (cu revenire), de aceeasi marime, este egal cu 1-f in
cazul in care marimea populatiei N este mare, de fapt acest raport este ( ) 1
1
N
f
N

.
12
Deci daca f tinde catre 0, adica marimea esantionului este foarte mica in raport cu N, atunci
sondajul aleator simplu repetat (cu revenire) se confunda practic cu sondajul aleator simplu
nerepetat (fara revenire).
A treia conditie (dispersia S
2
sa fie redusa) precizeaza ca, cu cat subiectii din cadrul
populatiei sunt mai omogeni intre ei in ceea ce priveste variabila Y, cu atat valorile estimatorilor
vor fi mai precise. Daca, la limita, toti subiectii sunt identici, adica
i
Y Const Y , atunci S
2
=0 si
( ) V y 0 ; este deci suficient sa fie interogat un singur subiect pentru a obtine informatiile
necesare.
Daca S
2
are valoare ridicata, populatia este foarte eterogena, in acest caz este indicat sa se stratifice
populatia (si deci si esantionul).
Cazul populatiei totale
Dispersia pentru estimatorul populatiei totale este:

( ) ( )
( )
2
2 2
1
S
V T N V y N f
n
.
In acest caz, marimea populatiei N are o importanta capitala pentru valoarea numerica a
dispersiei, in schimb, nu are influnta asupra coeficientului de variatie (CV) deoarece:

( ) ( )
T y
CV
T Y


Marimea populatiei totale (N) este estimata cu ajutorul relatiei:
1
N
i
i
N Y

cu Yi = 1 pentru orice i, S
2
=0.
Estimarea dispersiei
In formula pentru ( ) V y cu exceptia dispersiei S
2
, toate celelalte valori sunt cunoscute sau
calculabile; deci S
2
este parametrul care trebuie estimat.
Este demonstrat ca, un estimator nedeplasat pentru S
2
este:
( )
i
i s
s Y y
n


2 2
1
1
.
Utilizand proprietatile sperantei matematice (mediei) se obtine ca estimator nedeplasat pentru
( ) V y este:

( )
( )
2
1
S
V y f
n
.
Se poate observa ca s
2
nu este calculabil decat daca n 2.
Estimarea intervalului de incredere
Intervalele de incredere nu pot fi determinate decat daca se cunoaste legea pentru y .
In aceste conditii, pentru o probabilitate de 95%, adevaratul interval de incredere, deci cel
probabil, este:
( ) ; ( )
S S
IC y f y f
n n
1
+ 1
1
]
2 2
2 1 2 1
.
Interpretarea acestui interval de incredere este urmatoarea: daca se realizeaza 100 de
sondaje independente unele de altele, dar in aceleasi conditii, se vor obtine 100 de valori estimate
y si deci 100 de intervale de incredere. In medie, din aceste 100 intervale, 95 vor contine
adevarata valoare
Y
care este necunoscuta (P. Ardilly, 1994). In relatia adevaratului interval de
incredere intervine insa dispersia S
2
si deci in practica este inlocuit printr-un interval estimat:
13

( ) ; ( )
s s
IC y f y f
n n
1
+ 1
1
]
2 2
2 1 2 1
Concluzii:
Sondajul aleator simplu este in realitate destul de rar utilizat.
Daca populatia este foarte eterogena in raport cu variabila analizata, rezultatele obtinute cu
ajutorul acestui tip de sondaj au un grad de precizie redus. In masura in care exista
informatii despre indivizii care compun populatia se poate realiza o grupare a acestora in
clase sau sub-populatii si deci se va putea utiliza sondajul stratificat.
In cazul in care nu exista o baza de sondaj sau din dorinta de a reduce costurile anchetei, se
poate utiliza sondajul pe grupe sau sondajul in trepte.
Cu toate acestea, sondajul aleator simplu este foarte important deoarece poate fi considerat
ca baza pentru metodele de sondaj aleatoare complexe. Pe de alta parte, precizia
rezultatelor obtinute in urma realizarii acestui sondaj se poate calcula cu usurinta si poate fi
utilizata, de exemplu, pentru a aproxima rezultatele unui sondaj empiric, in cazul caruia,
teoretic, nu se poate calcula precizia rezultatelor.
Cazul utilizarii proportiilor
In practica, in mod frecvent trebuie estimata o proportie P sau un procentaj din populatia
totala. Populatia considerata din cadrul caruia se vrea sa se estimeze procentajul dorit se numeste
domeniu. Pentru fiecare individ i din cadrul populatiei se construieste variabila Y
i
care ia valoarea
1 daca i este in domeniul D sau 0 in caz contrar.
In acest caz media este:
1
N
i D
i
Y N
Y P
N N

.
N
D
= numarul de indivizi care apartin domeniului D;
P = ponderea care trebuie estimata.
P se poate scrie ca o medie si poate fi estimata fara eroare prin

P y .
Notam

y p P
.
Precizia estimarii este data de:
( ) ( )
2
1
S
V p f
n
.
In cazul variabilei Y, dispersia S
2
se simplifica considerabil:
( )
2
1
1
N
S P P
N

.
Daca se presupune ca N este mare, atunci ( )
2
1 S P P
.
In final,
( ) ( )
( ) 1
1
P P
V p f
n

.
Cum ( )
2
1
1
n
s p p
n

, estimatorul nedeplasat pentru V(p) este:

( ) ( )
( ) 1
1
1
p p
V p f
n

.
p = proportia subiectilor din cadrul domeniului, calculata pentru esantionul considerat.
Spre deosebire de P, probabilitatea p este calculabila.
Daca n este mare, precizia estimarii se realizeaza utilizand relatia:

( )
( ) 1 p p
V p
n

.
In ceea ce priveste intervalul de incredere, acesta este identic cu intervalul de incredere pentru
medie. Cu o probabilitate de 95%, daca f este neglijabil si n este mare:
14
( ) ( ) 1 1
2 ; 2
p p p p
P p p
n n
1

+ 1
1
]
.
Se poate deduce estimatorul pentru N
D
, deoarece, pornind de la definitia lui P:

D
D
N N P N N p
Deci,

( )
( )
( )
2
1
1 D
P P
V N N f
n



( )
( )
( )
2
1
1
1
D
p p
V N N f
n

Stabilirea marimii esantionului


Avand in vedere formula dispersiei, este evident ca, cu cat marimea esantionului este mai
mare, cu atat rezultatele sondajului sunt mai precise. Insa in practica, nu se dispune de un buget
nelimitat si deci costul sondajului reprezinta o restrictie importanta.
In general se considera 2 cazuri (P. Ardilly, 1994):
1. costul sondajului este principala restrictie;
Daca C este bugetul total alocat pentru realizarea anchetei si c costul unitar total pentru a realiza un
interviu, atunci marimea esantionului este:
C
n
c
.
2. costul sondajului nu reprezinta o restrictie importanta;
In acest caz se calculeaza marimea esantionului fara a se tine seama de cost si se verifica ca aceasta
marime poate fi suportata de bugetul alocat.
( )
2 L V y
( )
2 2
1
1 / 4
n N
NL S

+
Dar S
2
este un parametru necunoscut; in acest caz, pentru a se determina marimea esantionului
trebuie sa se estimeze S
2
in prealabil, fie utilizand o ancheta realizata pentru o variabila Z care este
corelata cu variabila Y, fie utilizand rezultatele aceleasi anchete realizate in trecut, fie apeland la
sfaturile expertilor.
Daca trebuie estimata o proportie P, se stie ca, ( )
2
1 S P P
si deci, S
2
este estimabil in functie de
P.
15
0.01
0.25
0.16
P(1-P)
0 20% 50% 80% 1 P
Sursa: Les techniques de sondage, P. Ardilly, Editions Technip, Paris, 1994
Figura de mai sus prezinta evolutia valorii P(1-P) in functie de P si are un optim pentru P=50%.
Deci daca P variaza, de exemplu, intre 20 si 80%, S
2
nu poate varia decat intre 0.16 si 0.25, care
este un interval de amplitudine redusa.
Atitudinea cea mai pesimista consta in a considera dispersia maxima, adica P=50% si S
2
=0.25.
In acest caz,
0.25
2 1 f L
n

2
2
1 1 1
1
L n N
n N NL

+
.
Daca valoarea lui L este mica, atunci marimea esantionului se apropie de N si se realizeaza de fapt
un recensamant.
In cele mai multe cazuri marimea lui N este foarte mare si se utilizeaza formula aproximativa:
2
1
n
L

Sondajul cu probabilitati inegale


Alaturi de clasa de sondaje cu probabilitati egale, exista planuri de sondaj in care unitatile
au probabilitati inegale de includere in esantion.
In general, sondajul stratificat si sondajul in mai multe faze sunt sondaje in cadrul carora subiectii
din baza de sondaj nu au aceeasi probabilitate de a fi selectionati.
Estimarea principalilor indicatori
Se noteaza cu P
i
probabilitatea de includere in esantion a unitatii i, P
i
fiind un numar real care ia
valori intre 0 si 1, astfel incat sa fie respectata conditia:
1
n
i
i
P n

pentru o extragere de marime n.


Pentru a se estima totalul T se poate utiliza estimatorul:
i
i s
i
Y
T
P

.
Pentru a estima media
Y
este suficient sa se calculeze raportul intre

T
si N.

T
este singurul estimator nedeplasat pentru T, ponderile nedepinzand de esantionul extras s, adica
se verifica
( )
i i
W s W
. Acest estimator se numeste estimatorul lui Horvitz-Thompson.
Precizia estimatorului

T
este masurata cu ajutorul dispersiei, care este egala cu eroarea medie
patratica. In acest caz apare un nou termen P
i,j
, care reprezinta, pentru fiecare cuplu (i, j),
probabilitatea pe care o au indivizii i si j de a fi in esantionul final s ( care se mai numeste si
probabilitate de includere dubla) si care este definita prin:
,
( )
i j
s i
s j
P p s

.
Oricare ar fi metoda de extragere utilizata, daca marimea esantionului - n este fixata dinainte,
atunci:
( )
,
1 1
1
N N
i j
i j
j i
P n n

.
Prin urmare, probabilitatea P
i,j
este puternic dependenta de metoda de extragere utilizata. De
exemplu, pentru un sondaj aleator simplu:
( )
( )
,
1
1
i j
n n
P
N N

.
16
In ceea ce priveste precizia estimarii, in cazul esantioanelor de marime fixa n, pentru care
extragerea se realizeaza intr-o singura faza si fara stratificare avem:

, 2
1 1 1
1
( )
N N N
i j i j
i
i i j
i i j
i i j
j i
P PP
P
V T Y YY
P PP

+

2
,
1 1
1
( )
2
N N
j
i
i j i j
i j
i j
j i
Y
Y
PP P
P P

_



,

A doua formula arata ca, pentru a avea o dispersie nula este suficient ca termenul
j
i
i j
Y
Y
P P
_



,
sa fie
egal cu 0, pentru orice cuplu (i, j) din cadrul populatiei. Pentru aceasta este suficient ca raportul
Y
i
/P
i
sa fie constant, adica P
i
sa fie proportionala cu Y
i
.
In cazul sondajului aleator simplu (pentru care P
i
= n/N) avem:
i
i s
Y
T N y
n
N

care este un estimator nedeplasat pentru totalul T.


In cazul in care pentru orice cuplu (i, j) din cadrul populatiei, probabilitatea P
i,j
nu este nula, atunci
estimatorul nedeplasat pentru

( ) V T este:

, 2
1
2
,
1
( )
i j i j
i
i i j
i s i s j s
i i j i j
j i
P PP
P
V T Y YY
P PP P

+

Pentru a alege intre un sondaj cu probabilitati inegale si un sondaj aleator simplu trebuie sa
se compare dispersiile. Din pacate acest lucru este destul de dificil de realizat si deci se va apela la
o analiza de tip calitativ: daca se cunoaste o variabila cantitativa X
i
pentru fiecare subiect din
cadrul populatiei, X
i
fiind aproximativ proportionala cu Y
i
si daca X
i
variaza sensibil de la un
individ la altul, este preferabil sa se utilizeze un sondaj cu probabilitati inegale. In cazul in care X
i
variaza putin de la un individ la altul, este preferabil sondajul aleator simplu (P. Ardilly, 1994).
2.1.3 Sondajul stratificat
Stratificarea consta in a utiliza o informatie suplimentara (numita variabila de control sau
variabila de stratificare) in vederea realizarii impartirii populatiei in clase numite straturi.
Stratificarea va fi cu atat mai eficace cu cat straturile sunt mai omogene in raport cu variabila
studiata.
Din fiecare strat se va extrage un esantion aleator, de marime fixata. Estimarea finala este obtinuta
prin agregarea rezultatelor obtinute in diferite straturi si tinand cont de marimea populatiei din care
sunt alcatuite straturile.
Populatia initiala de marime N este divizata in H straturi, G
1
, G
2
,.....G
H
de marime N
1
, N
2
.....N
H
,
astfel incat:
1
H
h
h
N N

Fie:
S
1
2
, S
2
2
, ............., S
H
2
= dispersiile adevarate (dar necunoscute) din cadrul fiecarei grupe;
S
2
= dispersia totala.
( )
2
2 2
1 1
1
1
H H
h h h
h h
h h
h
N N N N
S S Y Y
N N N N

1
_
+
1

, ]

unde:
( )
2
2
1
1
h
h
h i
i G
h
S Y Y
N

;
1
h
h
i
i G
h
Y Y
N


Pentru simplificare presupunem ca N
h
este mare, rezulta deci:
17
( )
2
2 2
1 1
H H
h h
h
h
h h
N N
S S Y Y
N N

+

Cum
1
1
H
h
h
N
N

se poate spune ca S
2
este suma a doua medii ponderate:
2
1
H
h
h
h
N
S
N

= dispersia in cadrul straturilor (intra-straturi);


( )
2
1
H
h
h
h
N
Y Y
N

= dispersia intre straturi (inter-straturi).


Scopul stratificarii este de a obtine valori reduse pentru S
h
. Cum S
2
este o marime fixa,
trebuie sa se constituie straturi (grupe) astfel incat dispersia inter-straturi sa fie cat mai mare, caz in
care dispersia intra-straturi va fi redusa.
Trebuie deci ca Y
h
sa fie cat mai dispersate.
O buna stratificare conduce la constituirea de straturi asa incat, in raport cu variabila Y studiata,
mediile din cadrul fiecarui strat sa fie cat mai diferite intre ele sau, altfel spus, comportamentele
indivizilor din cadrul unui strat sa fie cat mai asemanatoare cu putinta.
Sondajul stratificat nu antreneaza costuri suplimentare in raport cu sondajul aleator simplu, cu
exceptia costurilor privind analizele necesare (constituirea straturilor.....) care in general nu sunt
foarte ridicate (P. Ardilly, 1994).
Estimarea principalilor indicatori
Estimarea mediei
Pentru a estima media generala
Y
, este necesar sa se estimeze mediile fiecarui strat
h Y
, deoarece:
1
H
h
h
h
N
Y Y
N

Daca se realizeaza un sondaj aleator simplu in fiecare strat, un estimator nedeplasat pentru
h Y
este
h
y , media esantionului s
h
.
Utilizand proprietatile sperantei matematice, rezulta ca estimatorul nedeplasat pentru
Y
este:

H
h
ST
h
h
N
Y y
N

1
, estimatorul

ST Y
este liniar si se poate scrie

h
H
h
ST
i
h i s
h
N
Y Y
N n

1
s
h
= esantionul extras din stratul h;
n
h
= marimea esantionului extras.
Fiecarei unitati (subiect) din stratul h i se atribuie deci o pondere de sondaj:
h
i
h
N
W
N n

.
Aceasta pondere depinde de strat, deci se poate afirma ca acest tip de sondaj este un sondaj cu
probabilitati inegale.
Estimarea dispersiei
Conform formulei dispersiei, putem scrie ca:

( ) ( )
H
h h
ST
h
h
h
N S
V Y f
N n

_


,

2
2
1
1 .
f
h
= ponderea de sondaj corespunzatoare stratului h;
n
h
= marimea esantionului extras din stratul h;
S
h
2
= dispersia adevarata in stratul h.
18
In cazul in care se utilizeaza o proportie P, atunci, ( )
2
1
h h h
S P P
.
P
h
= proportia necunoscuta in cadru stratului h.
Pentru a obtine un estimator precis pentru

ST Y
, adica dispersia

( ) ST V Y
sa fie cat mai mica, trebuie
ca stratificarea sa se realizeze astfel incat dispersiile S
h
2
sa fie cat mai mici.
Daca s-ar cunoaste Y
i
pentru fiecare individ s-ar putea constitui toate configuratiile posibile de
straturi si s-ar alege cele pentru care dispersiile S
h
2
au cele mai mici valori.
Deoarece acest lucru nu este posibil, trebuie sa se utilizeze o variabila X
i
cunoscuta si corelata cu
Y
i
. In functie de aceasta variabila - X
i
(numita si variabila de stratificare ) se vor realiza straturi
astfel incat dispersia intra-straturi sa fie redusa (A. M. Dussaix J.M Grosbras, 1994).
Estimatorul nedeplasat pentru dispersia

( ) ST V Y
este:


( ) ( )
H
h h
ST
h
h
h
N s
V Y f
N n

_


,

2
2
1
1 .
s
h
2
= dispersia calculata in cadrul esantionului din stratul h.
Marimea esantionului in cadrul straturilor
Cazul sondajului stratificat proportional
Trebuie sa se tina seama de faptul ca estimatorul

ST Y
nu este egal cu media y ;
H
h
h
h
n
y y
n

1
,
ponderile reflectand importanta esantionului provenit din stratul h si nu importanta populatiei in
stratul h.

ST Y y
daca si numai daca
h h
n N
n N
.
Un sondaj stratificat care verifica aceste conditii se numeste sondaj stratificat proportional.
Acest tip de sondaj este foarte utilizat deoarece (P. Ardilly, 1994):


ST Y y
si deci se poate calcula cu usurinta acest estimator deoarece calcularea mediei y
este cea mai simpla operatie. In acest caz, sondajul stratificat devine un sondaj cu
probabilitai inegale, deoarece probabilitatea de selectie a unei unitati oarecare din stratul h
este:
h
h
n n
Const f
N N

In toate cazurile, sondajul stratificat proportional care estimeaza
Y
prin y este mult mai
precis decat sondajul aleator simplu care setimeaza
Y
prin y .
Daca se noteaza cu ( )
PROP
V y dispersia in cadrul sondajului stratificat proportional si cu
( )
SAS
V y dispersia in cadrul sondajului aleator simplu, atunci:
( )
H
h
PROP h
h
N f
V y S
n N


2
1
1
( )
( )
H
h
h
PROP
h
N f
V y S Y Y
n N

_


,

2
2
1
1
( )
( )
H
h
h
SAS
h
N f
V y Y Y
n N

2
1
1
Prin urmare,

( ) ( ) ST
PROP SAS
V Y V y
, termenul ( )
H
h
h
h
N f
Y Y
n N

2
1
1
fiind cu atat mai mare cu cat
dispersia inter-straturi este mai mare.
19
Sondajul stratificat proportional nu depinde de Y
i
, ci numai de marimea N
h
. Precizia care se
obtine in raport cu sondajul aleator simplu este asigurata oricare ar fi variabila Y, ceea ce
este foarte important, in special cand exista mai multe variabile Y.
Cazul sondajului stratificat optim
Daca pentru realizarea unei anchete se dispune de un buget C si s-a stabilit un numar de H
straturi, costul unitar al anchetei in cadrul unui strat fiind c
h
(cheltuielile cu materialul utilizat,
cheltuielile cu expedierea chestionarelor sau costul conversatiilor telefonice, cheltuielile cu
prelucrarea informatiilor, etc.), trebuie sa se determine marimea esantionului in cadrul stratului:
1
H
h h
h
C n c

n
h
= marimea esantionului care trebuie determinata in stratul h.
1
1
H
h
h H
h h
h
h
N C
C n c n
N N
n c
N

1
1
h
h H
h
h
h
N
n C
N N
c
N

O alta posibilitate de a determina marimea lui n


h
consta in a minimiza dispersia. Optimul este atins
cand
h
h h
h
S
n N
c

, adica in cazul in care:


1
h
h h H
h
h h h
h
S C
n N
c
N S c

- repartitia lui Neyman.


Aceasta formula arata ca trebuie sa se intervina in mod special in (A. M. Dussaix J.M Grosbras,
1994):
straturile in care populatia N
h
este importanta;
straturile in care dispersia S
h
este mare;
straturile in care colectarea datelor nu este costisitoare.
In cazul in care c
h
= 1, oricare ar fi stratul h si daca marimea totala a esantionului este notata cu n,
1
h h
h H
h h
h
N S
n n
N S

.
Pentru acest tip de sondaj dispersia

( ) ST
OPTI
V Y
este data de:

2
2
1 1
1 1
( )
H H
h h
ST
OPTI h h
h h
N N
V Y S S
n N N N

_ _


, ,

In final, cand este considerata restrictia de buget, rezulta ca:

( ) ( )
( ) ST
OPTI PROP SAS
V Y V y V y .
Dispersia S
h
este insa necunoscuta si deci, pentru a utiliza o marime a esantionului apropiata de
marimea optima, aceasta dispersie trebuie sa fie estimata in prealabil.
In acest sens, exista mai multe posibilitati (A. M. Dussaix J.M Grosbras, 1994):
se utilizeaza estimarile din anchete asemanatoare, realizate in trecut;
se apeleaza la un expert care comunica o valoare aproximativa;
20
se utilizeaza faptul ca ( ) 1
h h h
S P P
;
se efectueaza sondajul in 2 etape, prima ancheta furnizand o estimare pentru S
h
.
se utilizeaza dispersia maxima.
Constituirea straturilor
Pentru a se realiza o stratificare corespunzatoare, trebuie sa se cunoasca (A. M. Dussaix J.M
Grosbras, 1994):
variabila de stratificare;
numarul de straturi care trebuie realizat;
limitele de straturi.
Variabila de stratificare:
Cea mai buna variabila de stratificare este cea care permite constituirea de straturi omogene
intra si deci eterogene inter. In practica, se cauta o variabila X care trebuie sa fie puternic
corelata cu variabila Y. Din aceasta cauza, stratificarea este o metoda care necesita informatii
auxiliare: informatii care permit asocierea unui subiect la un strat (A. M. Dussaix Deroo M.,
1980).
Alegerea variabilei de stratificare este considerata foarte calitativa, dar se pot utiliza cu succes si
metodele cantitative de analiza de date (exista metode statistice al caror obiectiv este fabricarea
grupelor de subiecti care sa fie cat mai asemanatoare posibil; aceste grupe formand, ceea ce se
numeste tipologia populatiei).
Numarul de straturi
Conform teoriei, numarul de straturi trebuie sa fie cat mai mare posibil, deoarece cu cat
acesta este mai mare, cu atat este mai usor sa se constituie grupuri omogene intra.
In practica, insa, cresterea numarului de straturi conduce la crestera costului anchetei.
In ceea ce priveste dispersia, tipul de sondaj ales (proportional sau optim) limiteaza numarul de
strturi: daca exista prea multe straturi, marimea esantionului din cadrul fiecarui strat va fi redusa si
deci estimarile s
h
2
pentru S
h
2
vor avea un grad de precizie redus, deteriorandu-se astfel calitatea
estimatorului V

( ) ST Y
(P. Ardilly, 1994).
Numarul limita de straturi
In cazul in care se utilizeaza repartitia lui Neyman, se poate utiliza regula lui Dalenius,
conform careia trebuie sa se actioneze astfel incat produsele N
h
S
h
sa fie constante de la un strat h
la altul; S
h
fiind calculata in functie de o variabila X corelata cu variabila Y (Dalanius T. The
problem of optimum stratification, Scandinavisk Aktuarietidskrift).
In aceste conditii, sondajul optim (cost identic in fiecare strat) conduce la esantioane (n
h
) egale in
toate straturile. O stratificare performanta se realizeaza in functie de variabila de stratificare si
pentru variabila de stratificare. Daca se schimba variabila, stratificarea optimala, din punct de
vedere teoretic, trebuie sa se schimbe.
2.1.4 Sondajul in mai multe faze (sondajul de serii)
21
Oricare ar fi estimatorul utilizat, sondajul aleator simplu prezinta doua inconveniente majore:
in cazul in care pentru fiecare subiect extras este asociat un cost cu deplasarea operatorului
in vederea realizarii interviului, acest tip de sondaj poate dispersa suficient esantionul,
astfel incat costul total datorat numarului de deplasari sa fie prohibitiv;
pentru a realiza un sondaj aleator simplu trebuie ca, inaintea esantionarii, sa se dispuna de o
baza de sondaj completa.
In vederea contracararii acestor inconveniente se poate utiliza sondajul in mai multe faze,
conform caruia se incepe prin a construi grupe disjuncte de subiecti, reuniunea acestora
reprezentand deci intreaga populatie. Din baza de sondaj care a fost constituita se poate extrage,
utilizand de exemplu un sondaj aleator simplu, un anumit numar de grupe. Fiecare grupa reprezinta
deci un subiect, la acest stadiu numindu-se unitate primara de esantionare - UP. Dupa ce s-a
obtinut esantionul constituit din UP, se extrag subiecti din fiecare UP, prin sondaj aleator simplu
(de exemplu) la acest stadiu subiectii extrasi din unitatile primare se numesc unitati secundare si
sunt notati cu US. In acest mod se realizeaza sondajul in doua faze (P. Ardilly, 1994).
Sondajul in mai multe faze, presupune ca, de exemplu, dintr-o regiune data, sa se aleaga un
esantion de universitati, apoi un esantion de facultati, un esantion de grupe si din acestea un
esantion de studenti.
Pentru stabilirea unui plan de sondaj in doua faze trebuie sa se dispuna de o variabila
auxiliara.
Prin urmare se va stabili o lista cu unitatile secundare prezente in unitatile primare.
Variabila auxiliara are rolul de a identifica apartenenta unui individ la o anumita UP.
Sondajul in mai multe faze este singurul sondaj in care informatia auxiliara este utilizata in alt scop
decat cel al ameliorarii preciziei estimatorilor.
Estimarea principalilor indicatori
Estimarea valorii totalizate (agregate)
Consideram un sondaj in doua faze si presupunem ca in fiecare faza extragerea de unitati se
face cu ajutorul unui sondaj aleator simplu.
Se construieste un estimtor nedeplasat pentru totalul T care este necunoscut.
Notatii:
M = numarul total de unitati primare constituite;
N
i
= marimea unitatii primare i (numarul de unitati secundare din unitatea primara i);
N = marimea populatiei totale:
1
M
i
i
N N M N

.
Y
i,j
= valoarea variabilei analizate pentru subiectul i din cadrul unitatii primare j.
m = marimea esantionului pentru unitatile primare;
n
i
= marimea esantionului pentru unitatile secundare in cadrul unitatii primare i.
Presupunem ca toate marimile N
i
sunt cunoscute. Daca T
i
este valoarea adevarata dar necunoscuta
pentru totalul din cadrul UP
i
, atunci:
,
1
i
N
i i j
j
T Y

valoarea reala pentru total este:


1
M
i
i
T T

.
22

, ,
i i
i j i j
i
i
i j s j s
i
i
Y Y
T N
n
n
N



este estimatorul nedeplasat pentru T
i
.
s
i
= unitatile secundare esantionate in cadrul unitatii primare i.

i
i i
T N y ,
i
y = media pentru Y
i,j
din cadrul unitatilor secundare esantionate in cadrul UP
i
.
Daca se ancheteaza toate unitatile primare, atunci estimatorul nedeplasat pentru T este

1
M
i
i
T



i
i
i s
i s
T
T
T M
m
m
M

s = unitatile primare esantionate.


Obtinandu-se un estimator nedeplasat la fiecare faza, combinarea a doi estimatori nedeplasati
formeaza un estimator nedeplasat:

,
i
i
i j
i s j s
i
N M
T Y
m n

_


,

.
Spre deosebire de sondajul aleator simplu, in cadrul acestui tip de sondaj nu este nevoie sa se
cunoasca marimea totala a populatiei (N) pentru a estima totalul T. Sondajul in doua faze permite
in schimb sa se estimeze N, dar aceasta estimare nu este satisfacatoare din momentul in care
marimile N
i
difera sensibil de la o unitate primara la alta (A. M. Dussaix J.M Grosbras, 1994).
Estimarea dispersiei
Se poate demonstra ca dispersia este:

2
2
2, 2 2 1
1
( ) 1 1
M
i
i
i
i
i i
A
B
S
n S m M
V T M N
M m m N n

_
_
+

,
,

1 4 42 4 43
1 4 4 442 4 4 4 43
unde:
( )
2
2
1
1
1
1
M
i
i
S T T
M


;
1
1
M
i
i
T T
M


;
( )
2
2
2, ,
1
1
1
i
N
i i j i
j
i
S Y Y
N


;
,
1
1
i
N
i i j
j
i
Y Y
N


.
Termenul A reprezinta dispersia inter UP si are aceeasi forma ca dispersia lui y din
cadrul sondajului aleator simplu. UP trebuie sa fie de marime apropiata, cat mai mici posibil si sa
aiba un comportament asemanator.
Pentru a se realiza acest lucru, trebuie ca in cadrul fiecarei unitati primare sa se grupeze subiecti
diferiti unii de altii.
Termenul B reprezinta dispersia intra UP.
Din formula dispersiei rezulta ca:
termenul A este de ordin de marime 1/m;
termenul B este de ordin de marime ( )
1/ m n
, unde n este marimea medie a esantionului
pentru US din cadrul unitatilor primare UP:
1
1
M
i
i
n n
M


.
23
Daca se mareste numai marimea lui m, fara a actiona asupra lui n
i
, se constata ca se va diminua in
acelasi timp si A si B. Daca se mareste numai n
i
, fara a se actiona asupra lui m, se va diminua
numai B.
Regula este ca la o marime medie a esantionului fixata la
m n
, este aproape intotdeauna
preferabil sa se aleaga m maxim si deci
n
minim.
Sondajul de grupe
In multe cazuri, populatia poate fi considerata ca un ansamblu de grupe de subiecti care de
exemplu, in cazul sondajului in doua faze se numesc unitati primare.
Daca in cadrul grupurilor selectionate sunt intervievati toti indivizii, atunci se poate spune ca s-a
folosit esantionarea de grup. Daca in cadrul grupurilor extrase sunt intervievati numai un esantion
de subiecti, atunci suntem in cazul sondajului in doua faze.
Costul sondajului de grupe este mai redus fata de costul sondajului aleator simplu de aceeasi
marime. In cazul in care indivizii din interiorul aceluiasi grup se aseamana intre ei in ceea ce
priveste tema anchetei, precizia rezultatelor obtinute poate fi mai redusa in comparatie cu un
sondaj aleator simplu de aceeasi marime.
Estimarea principalilor indicatori
Estimatorul mediei in cazul unei extrageri de m grupuri de marime N
0
dintr-un total M cu
ajutorul sondajului aleator simplu este:

,
N
i j
i s j
Y Y y
m N


0
1
0
1
( )
( )
m S
V y N
M m N

_
+ 1
]

,
2
0
0
1 1 1
,
= efectul de grup,
( ) ( )
( )
, ,
1 1 1
2
,
1 1
1
1
i i
i
N N M
i j i k
i j k
k j
N M
i j
i j
Y Y Y Y
N
Y Y

N
= marimea medie a unitatilor primare (
N
=N/M).
S
2
= dispersia adevatata a variabilelor individuale Y
i
.
Daca grupurile nu sunt de marime egala, atunci:

,
i
N
i j
i s j
M
Y Y
N m


1
1
.

( )
( ) ( )
m S
V Y N
M m N

_
+ +

,
2
1 1 1
unde
N
=N/M (marimea medie a grupului in cadrul populatiei).
( )
( )
2
CV N
N
CV Y
_



,
CV(N) = coeficientul de variatie pentru N
i
;
CV(Y) = coeficientul de variatie pentru Y
i,j
.
( )
N
S
CV N
N

( )
Y
S
CV Y
Y

24
Sondajul pe grupe poate fi asimilat cu un sondaj aleator simplu in care unitatea de esantionare este
grupul, deci rezulta ca:
i i
i s i s
T T
T M
m
m
M



.
T
i
= total efectiv in cadrul grupei i;
S = esantionul de grupe.

( )
2
2 1
1
S m
V T M
M m
_


,
, unde:
( )
2
2
1
1
1
1
1
1
M
i
i
M
i
i
S T T
M
T T
M

.
Estimatorul nedeplasat pentru dispersie este:

( )
2
2 1
1
s m
V T M
M m
_


,
.
unde:

2
2
1
1
1
i
i s
T
s T
m M

.
Pentru a obtine rezultate satisfacatore, conform formulei dispersiei trebuie ca:
grupele sa fie eterogene ( sa aiba valoare redusa), adica trebuie sa se regrupeze subiecti
cat mai diferiti cu putinta din punct de vedere al variabilei Y;
grupele sa aiba marime redusa (N
0
redus) si, prin urmare, sa existe un numar mare de grupe
in cadrul populatiei;
grupele sa aiba marime apropiata;
sa se extraga maximum de grupe (m sa aiba valoare ridicata).
Primele trei conditii se refera la constituirea grupelor iar ultima se refera la modalitatea de
extragere. Cele patru conditii depind in mod direct de bugetul alocat pentru realizarea studiului.
2.2. SONDAJE EMPIRICE (DIRIJATE)
Spre deosebire de sondajele probabiliste, in cazul sondajelor empirice nu mai este posibil
sa se determine, in prealabil, care este probabilitatea de includere in esantion pe care o are fiecare
subiect. In general, aceste sondaje sunt utilizate in cazul in care nu exista o baza de sondaj. In acest
caz statisticianul nu mai poate sa utilizeze probabilitatile p(s) care corespund ansamblului de
esantioane posibile (s).
Libertatea relativa de selectie a esantionului face ca metodele empirice sa fie mult mai rapide si
mai putin costisitoare decat procedeele probabiliste.
Scopul este sa existe o apropiere cat mai mare de sondajele aleatoare.
Din aceasta categorie de sondaje, cea mai utilizata este metoda de esantionare pe cote, care este
prezentata in continuare.
Metoda de esantionare pe cote
Este metoda empirica cea mai frecvent utilizata si se procedeaza astfel incat structura
esantionului sa fie identica cu structura populatiei analizate, in functie de anumite criterii care au
fost stabilite in prealabil (A. M. Dussaix J.M Grosbras, 1994).
Principiul inferentei probabiliste este inlocuit cu ipoteza conform careia, concluziile obtinute
pentru esantionul astfel constituit (care reprezinta o fotografie a populatiei) pot fi extinse la
nivelul intregii populatii.
25
Se presupune ca daca esantionul reproduce fidel anumite caracteristici ale populatiei studiate (si
deci poate fi considerat, prin abuz de limbaj, ca fiind reprezentativ), atunci va putea sa reproduca si
alte caracteristici non controlate si / sau controlabile care constituie obiectul anchetei.
Estimatorul mediei
Y
este egal cu media calculata la nivelul esantionului - y .

1 1
Q Q
q q
q
q
q q
N n
Y Y y y
N n



deoarece specificul metodei este de a impune:
q q
n N
n N

unde:
q Y = media in cadrul categoriei q, calculata la nivelul populatiei;
q
y = media in cadrul categoriei q, calculata la nivelul esantionului;
q
N
= marimea populatiei (cunoscuta) in cadrul categoriei q;
q
n
= marimea esantionului in cadrul categoriei q.
Astfel, sondajul pe cote apare ca o stratificare multipla in care selectia unitatilor in cadrul
stratului nu este aleatoare ci constienta. Acest caracter voluntar al selectiei este un dezavantaj
al metodei, operatorul care trebuie sa gaseasca unitatile de sondaj putand sa fie subiectiv.
In situatia in care exista un refuz sau daca la ora la care a fost efectuata vizita, operatorul nu a
gasit nici o persoana la domiciliul stabilit, contrar sondajului probabilist, acesta nu este obligat
sa insiste sau sa faca o alta vizita, putand alege alt subiect care indeplineste criteriile stabilite.
Prin urmare, deplasarile operatorilor sunt mult mai putine, ceea ce conduce la economii
importante.
Aceasta metoda nu este acceptabila decat daca, in cadrul criteriilor de alegere a cotelor s-au
luat in calcul toate variabilele principale explicative pentru Y.
Pentru a diminua eroarea de sondaj, trebuie sa se presupuna ca valorile variabilei Y nu pot fi
explicate decat prin criteriile de cotare alese si ca nu mai exista criterii ascunse care ar putea
influenta aceste valori. Bineinteles ca, niciodata nu pot fi luate in calcul toate criteriile
explicative. In teorie, exista intotdeauna o eroare de selectie in cadrul cotelor, dar se considera
ca este redusa in cazul in care criteriile de constituire a cotelor au fost bine alese.
In practica, in mod frecvent, cotele se stabilesc in functie de variabilele sex, varsta, categorie
socio-profesionala, mediul de provenienta, in functie de scopul urmarit prin studiu.
Cotele trebuie sa indeplineasac urmatoarele conditii (O. Marchese, Ipsos France, 2004):
sa fie pertinente si asociate variabilelor de interes;
sa fie cunoscute la nivel geografic cat mai detaliat posibil;
sa poate fi usor identificate pe teren;
sa fie independente intre ele (daca doua cote sunt independente, eventuala deformare
a uneia nu implica deformarea celeilalte).
Eroarea de selectie poate fi diminuata daca operatorii sunt instruiti in ceea ce priveste
modalitatea de selectie a indivizilor: trebuie ca interviurile sa fie repartizate pe toata durata
zilei (daca interviurile se realizeaza numai dimineata, va exista un excedent de inactivi) si pe
intreg teritoriul analizat (interviurile nu trebuie facute numai in anumite cartiere deoarece
exista riscul de a avea comportamente asemanatoare).
In scopul canalizarii actiunilor operatorilor, foaia care contine cotele trebuie sa fie insotita de
indicatii precise,vizandu-se apropierea cat mai mult posibil de un tiraj la probabilitati egale (O.
Marchese, Ipsos France, 2004).
26
Principalele cerintele solicitate unui operator profesionist sunt urmatoarele (O. Marchese, Ipsos
France, 2004):
sa stie cum sa procedeze pentru a evita refuzurile;
sa fie disponibil pentru o activitate fara program fix;
sa stie sa evite interogarea, intr-o anumita zona, a persoanelor care seamana mult sau
care traiesc in aceleasi conditii;
sa nu ezite sa renunte la un interviu daca persoana contactata nu corespunde cotelor;
sa respecte indicatiile privind dispersia geografica a persoanelor intervievate.
Estimari
In cazul sondajului pe cote precizia estimatorilor nu este calculabila deoarece nu se
cunoaste nici o probabilitate. Se poate presupune insa ca dispersia are o marime redusa in cazul
in care criteriile in functie de care au fost stabilite cotele explica cat mai bine variabila Y. Daca
se doreste totusi sa se obtina un rezultat numeric, se poate utiliza formula dispersiei din cadrul
sondajului stratificat proportional, care este sondajul probabilist ce se aseamana cel mai bine cu
sondajul pe cote, fiecare sub-populatie pentru care trebuie sa fie respectata o cota fiind
asimilata cu un strat. Daca se accepta aceasta conventie, atunci se accepta si faptul ca
operatorul va reproduce in procesul de selectie o impartialitate si o rigoare comparabile cu cele
ale unui calculator in cazul unui sondaj probabilist.
In cazul esantioanelor foarte mici, eroarea sondajului probabilist poate sa fie nula dar dispersia
sa aiba valoare ridicata (in majoritatea sondajelor probabiliste ordinul de marime al dispersiei
este de 1/n).
Daca marimea esantionului este ridicata, dispersia sondajului probabilist este redusa (eroarea
ramane nula), dar eroarea de selectie in cadrul sondajului empiric ramane aceeasi. Sondajul
probabilist va fi deci preferabil sondajului empiric.
Principiul este ca, pentru esantioane de volum redus trebuie sa se utilizeze sondajul pe
cote, iar pentru esantioane de marime mare, sondajele probabiliste (P. Ardilly, 1994).
Sursa: Les techiques de sondage, P. Ardilly, Editions Technip, Paris, 1994
27
Probabilitate
n mic
$

$
( )
PROB E
$
( )
EMP E
Sondajul empiric poate fi utilizat, de exemplu, in cazul in care se realizeaza teste prealabile
pentru o ancheta importanta.
Pentru a imbunatati extragerea pe cote, limitand costurile anchetei prin utilizarea unui esantion in
mai multe faze, in mod frecvent se realizeaza o stratificare prealabila de unitati primare care sunt
esantionate in mod probabilist.
Apoi, in fiecare unitate primara extrasa, se alege sa se extraga esantionul utilizand metoda pe cote.
Critici aduse metodei (O. Marchese, Ipsos France, 2004):
Biais-ul este creat de insasi conditiile de lucru ale operatorilor:
- la diferite ore din cadrul zilei, anumite categorii ale populatiei prezinta probabilitati
diferite si necunoscute de a fi gasiti de operator;
- probabilitatea de a realiza anumite interviuri variaza, de asemenea, cu
accesibilitatea persoanelor: coduri la intrarea in imobile, numere inscrise in listele
rosii.....
Probabilitatea ca un subiect sa apartina esantionului este necunoscuta, prin urmare, asa cum
am mai precizat, este imposibil sa se evalueze dispersia si deci sa se masoare precizia
estimatorilor;
Exista autori care considera ca aceasta metoda este inutilizabila; alti autori, din lipsa de
ceva mai bun, adopta ipoteza unui tiraj la probablitati egale, ipoteza care nu a fost
niciodata verificata
Estimatorii utilizati sunt deplasati;
Calculele privind marimea esantionului care se realizeaza utilizand formulele sondajului cu
probabilitati egale, sunt aproximari mai mult sau mai putin grosiere;
Planul de sondaj trebuie sa fie insotit de o serie de sfaturi date operatorilor, care vor avea in
vedere:
- reducerea erorii de observatie;
- sa existe o apropiere cat mai mare de tirajul cu probabilitati egale.
Concluzii:
Fata de metodele aleatoare, metoda pe cote este mai rapida; in cazul primelor, subiectii nu
sunt intersanjabili, trebuind sa fie recontactati de mai multe ori. Cu ajutorul cotelor, este
posibil sa se inlocuiasca un subiect cu altul care are aceleasi caracteristici socio-
demografice, ceea ce reduce timpul si costul sondajului.
Inconvenientul major al utilizarii metodei pe cote este ca nu permite calcularea stiintifica
a erorii de sondaj. In practica se considera ca aceasta este mai mica sau egala cu cea
obtinuta in cazul sondajului aleator.
Este important sa se controleze variabilele socio demografice susceptibile de a fi corelate
cu variabilele de interes.
Sectorul de activitate economica trebuie, de asemenea, sa fie controlat prin impunerea de
cote priori sau prin redresare.
28
Ceea ce se cere de fapt operatorului este sa se transforme intr-un instrument de tiraj quasi
aleator care, reuseste sa realizeze, in zona analizata, o selectie a interviurilor apropiata de
echiprobabilitate. In functie de nivelul de pregatire al operatorului si de calitatea pregatirii
efectuate, aceasta situatie se aseamana mai mult sau mai putin cu realitatea care exista pe
teren: in cazul in care cotele impuse operatorilor reflecta corect structura geografica a
zonei, un bun operator realizeaza repede interviurile care ii sunt destinate.
Desi este un sondaj empiric, prin utilizarea metodei pe cote se pot obtine rezultate foarte
satisfacatoare
Datorita riscului de biais de care este afectata aceasta metoda trebuie sa faca obiectul
unei pregatiri minutioase:
- Din punct de vedere statistic: surse utilizate, definirea criteriilor de cercetare,
definirea criteriilor de redresare;
- Pe teren: selectarea si formarea adecvata a operatorilor, claritatea documentelor,
precizia indicatiilor de lucru (O. Marchese, Ipsos France, 2004).
3. MODALITATI DE COLECTARE A DATELOR
Calitatea sondajelor depinde de mai multi factori dintre care cei mai importanti sunt: tehnica de
esantionare, chestionarul utilizat, calitatea activitatii de colectare a informatiilor pe teren si de
metodele de prelucrare si analizare a informatiilor obtinute.
In ceea ce priveste esantionarea, se apreciaza ca la ora actuala tehnicile utilizate sunt dezvoltate
inca din anii 60. De asemenea, metodele de prelucrare si analizare a informatiilor au inregistrat o
imbunatatire continua in ultimii 50 de ani. Prin urmare, tinand cont de progresele inregistrate in
amonte si in aval, valoarea sondajelor este si va fi dependenta din ce in ce mai mult de calitatea
operatiilor de colectare a informatiilor (J. Antoine, 1990).
In vederea realizarii acestei etape se pot utiliza metodele care se bazeaza pe comunicarea directa
sau indirecta cu respondentul folosind un instrument de culegere a informatiilor interviul
personal, telefonul, chestionarul transmis prin posta, internetul precum si metodele care se bazeaza
pe observarea comportamentelor. La aceste doua metode de baza se poate adauga experimentul
care se poate realiza prin comunicare sau observare, fiind, prin excelenta, un instrument care se
incadreaza in categoria studiilor cauzale (J.J. Lambin, 1993).
Alegerea modului de administrare a chestionarului are o mare importanta asupra calitatii
informatiilor si se bazeaza pe mai multi factori, dintre care amintim:
obiectivele studiului de exemplu, ancheta desfasurata pe strada nu este indicata in cazul
in care trebuie colectate multe informatii si necesita un efort de gandire din partea
respondentului;
natura populatiei investigate;
marimea esantionului pentru a interoga, de exemplu, 100 de manageri din 200 dintr-un
sector stabilit, ancheta postala nu este indicata datorita ponderii ridicate a non-
raspunsurilor;
dispersia geografica a esantionului; cu cat aceasta este mai mare, cu atat trebuie sa se
utilizeze metode care limiteaza costul deplasarilor operatorilor;
29
metoda de esantionare daca ancheta se realizeaza, de exemplu pe strada, nu este indicata
folosirea unei metode probabiliste;
complexitatea informatiilor care vor fi colectate cu cat intrebarile din chestionar sunt mai
complexe, cu atat este necesara interventia unui operator si deci este indicata ancheta la
domiciliu;
bugetul alocat cu cat acesta este mai mic, cu atat va trebui sa se faca sacrificii atat in
ceea ce priveste marimea esantionului cat si asupra modalitatii de colectare;
termenul pentru realizarea anchetei;
personalul si sistemul informatic disponibil.
Anchetele fata in fata
Anchetele fata in fata, raman, din motive practice, un mod inconturnabil pentru culegerea
informatiilor permitand controlul constituirii esantioanelor precum si calitatea raspunsurilor.
Intre principalii factori care influenteaza, in acelasi timp, acceptarea principiului de ancheta si
calitatea raspunsurilor amintim:
Natura institutului / firmei care realizeaza ancheta si a beneficiarului. Este dificil sa se
aprecieze daca persoanele interogate raspund mai bine la anchetele publice sau la cele
private. In general, specialistii considera ca pentru a incita publicul sa raspunda, pentru
a obtine o pondere mai redusa a non-raspunsurilor, tema anchetei este mult mai importanta
decat natura institutului / firmei de sondaj sau a beneficiarului.
Tema anchetei. Operatorii cunosc foarte bine faptul ca unele anchete sunt receptate
favorabil de populatie, in timp ce altele sunt destul de dificil de realizat. De exemplu, in
Franta, anchetele privind sistemul de asigurare sunt dificile, aceasta si datorita infuentei,
uneori negative, pe care au avut-o diferiti agenti de asigurare. In achimb, anchetele privind
automobilele se bucura de o buna participare a populatiei (putand fi utilizat un chestionar
mai amplu) deoarece gradul de interes si nivelul de afectivitate sunt mult mai ridicate.
Procedura de stabilire a intalnirii. In majoritatea cazurilor, cand anchetele sunt realizate de
institutele publice, persoanele care urmeaza a fi interogate sunt anuntate dinainte printr-o
scrisoare, ceea ce nu se practica, in general, in anchetele private (in special datorita lipsei
adreselor, ceea ce conduce la utilizarea sondajului pe cote). Este insa dificil sa se aprecieze
daca in primul caz se obtin rezultate mai bune in raport cu al doilea, in ceea ce priveste non
raspunsurile si calitatea informatiilor. Pe de alta parte, asa cum am mai precizat, modul
de lucru al operatorului precum si tema anchetei au o mare influenta asupra gradului de
participare al populatiei (din contra, anuntarea dinainte a unei anchete mai putin populara
poate conduce la diminuarea ratei de acceptare).
Modalitati de realizare a anchetei fata in fata:
Anchetele fata in fata realizate pe strada
In acest caz poate fi intervievat fata in fata un numar mare de persoane, intr-un timp relativ scurt si
cu un cost redus. Acest tip de ancheta permite colectarea raspunsurilor la cald intr-un punct de
vanzare, la o expozitie, etc. Obiectivul este de a interpela trecatorii, care priori intra in cotele
cautate.
Aceasta modalitate de realizare a anchetei prezinta insa mai multe limite, printre care mentionam:
30
recrutarea respondentilor este dependenta de traficul existent pe strada ( de exemplu:
oamenii care muncesc pot fi intervievati in timpul pauzei sau sambata, exista minoritati
nu pot fi gasite decat in anumite cartiere);
trecatorii au putin timp la dispozitie pentru interviu;
uneori persoanele intervievate raspund la intamplare, doar din dorinta de a scapa de
operator;
utilizarea materialelor de prezentare este redusa; aplicatiile CAPI (Computer Assisted
Personal Interview) pot rezolva aceasta problema, insa la ora actuala, datorita costurilor
ridicate, este dificila echiparea operatorilor de interviu cu microcalculatoare de ultima
generatie a caror volum permite utilizarea acestora cu usurinta;
incertitudine privind conditiile meteo;
favorizeaza frauda din partea operatorilor.
Principalul avantaj consta in diminuarea costului aferent cautarii persoanei intervievate, asa cum se
intampla in cazul anchetelor realizate la domiciliu.
Anchetele fata in fata realizate in cadrul saloanelor
In acest caz, pentru administrarea chestionarului, responsabilul studiului reuneste viitorii
respondenti intr-o sala sau profita de o manifestare organizata (colocviu, curs, spectacol, targ,
expozitie, etc.) sau de o calatorie (este cazul anchetelor realizate, de exemplu, in avion).
Principalele avantaje ale acestei metode:
costul / chestionar este redus, in special in cazul anchetelor realizate in cadrul unui
eveniment organizat;
anonimatul fiind garantat, pot fi abordate si subiecte delicate;
este posibil sa se utilizeze toate tipurile de intrebari si sa se realizeze diverse teste.
In lucrarea sa (Qui? Quoi? Comment? Ou la pratique de sondage), Hugues Jacquart afirma ca
aceasta este forma cea mai obiectiva de culegere a informatiilor, cea mai putin afectata de bias:
fara operatori, respondentii sunt singuri in fata chestionarului, conditiile fiind identice pentru toti.
Principalele limite:
nu este garantata reprezentativitatea esantionului;
cand nu este posibil sa se realizeze o manifestare, trebuie sa se organizeze recrutarea si
deplasarea respondentilor, ceea ce poate antrena pe de o parte refuzul acestora, iar pe de
alta cresterea costurilor.
Anchetele realizate la domiciliul respondentilor
Acest tip de ancheta permite administrarea unor chestionare mai complexe si prin urmare,
colectarea unui numar mare de informatii.
Calitatea raspunsurilor este infuentata de prezenta operatorului, al carui rol este de a crea o
atmosfera motivanta, de a explica si reformula intrebarile care nu sunt clare pentru interlocutor, in
special intrebarile de natura tehnica si intrebarile deschise.
In plus, operatorul poate nota comentariile, reactiile, ezitarile respondentului la diferite intrebari.
De asemenea, pot fi verificate anumite raspunsuri prin observarea respondentului si mediului
sau: varsta, nivel cultural, nivelul de viata. In cazul in care se realizeaza testarea produselor la
31
domiciliul respondentului se poate beneficia de situatia reala din viata a acestuia si pot fi ascultate
si parerile celorlalti membrii ai familiei.
Acest tip de ancheta permite controlarea activitatii operatorilor, realizandu-se, de exemplu, o
contra-ancheta in vederea verificarii corectitudinii interviului si comportamentului operatorului.
Principalele inconveniente:
prezenta operatorului poate fi o sursa de bias, in special cand se realizeaza scrierea
raspunsurilor la intrebarile deschise. In mod frecvent se intampla ca interlocutorul sa refuze
sa raspunda la o intrebare pe care o considera jenanta sau sa deformeze raspunsul in
functie de perceptia pe care el o are despre operator: fie pentru a-i face pe plac acestuia,
fie pentru a se pune in valoare.
vizita operatorilor nu este intotdeauna agreata, iar interviul este uneori intrerupt (apeluri
telefonice, copii...);
reusita anchetei la domiciliu se bazeaza pe competenta si onestitatea operatorilor si, prin
urmare, selectarea acestora trebuie sa fie riguroasa;
costul si durata realizarii sunt ridicate in raport cu celelalte metode.
In cazul in care interviul se realizeaza la biroul respondentului, acesta poate pregati dinainte
raspunsul la unele intrebari, insa atmosfera de birou poate influenta anumite raspunsuri, in
special daca in apropiere sunt alte persoane.
Cercetatorul trebuie sa calculeze cu cat mai mare precizie cate interviuri pot fi realizate intr-o zi; in
acest scop pot fi utilizate doua criterii: timpul necesar recrutarii unui respondent si timplul necesar
realizarii efective a interviului.
Daca pentru recrutare este utilizata esantionarea pe cote, cercetatorul va trebui sa determine adica
cate persoane va trebui sa se abordeze inainte de a gasi persoana potrivita.
Aceasta rata este determinata in functie de gradul de penetrare al criteriului analizat in populatia
totala si de locul in care se realizeaza interviul.
Durata efectiva a interviului poate fi determinata prin testarea chestionarului in cadrul unei anchete
pilot.
Calcularea timpului necesar pentru administarea chestionarului trebuie sa ia in considerare
situatiile din viata reala: timpul necesar pentru scrierea raspunsurilor, eventual prezentarea
materialelor, repetarea anumitor intrebari etc. In general interactiunea dintre respondent si operator
mananca din timpul interviului si acest lucru trebuie sa fie prevazut in cadrul cercetarii.
Anchetele realizate cu ajutorul telefonului
La mijlocul anilor 70, acesta modalitate era utilizata, in special, in anchetele realizate in mediul de
afaceri, pentru marele public fiind restrictionata de gradul de penetrare al telefonului in gospodarii.
Asa cum se poate observa din tabelul de mai jos, in Franta, pana in 1997 ponderea gospodariilor
echipate cu telefon fix a cunoscut o crestere continua, insa in numai 5 ani acest indicator a
inregistrat o scadere de aproximativ 10%.
1963* 1970* 1975* 1980* 1986* 1990* 1997** 1998** 1999** 2000** 2001** 2002***
9.3 14.9 30.2 51.0 90.0 93.7 95.8 94.3 92.6 90.5 87.5 85.5
*Sursa: INSEE
**Sursa: Mdiamtrie
***Sursa: Mdiamtrie (prima jumatate a anului 2002)
32
Situatie Romania
In ceea ce priveste aspectul psihologic, se poate admite ca, in prezent, nu mai exista nici un fel de
blocaj vis--vis de aparatura telefonica nici din partea persoanelor de varsta a treia, nici din
partea tinerilor, fiind acceptat ca un mijloc de comunicare obisnuit (G. Brossier A. M. Dussaix
1999).
Calitatea raspunsurilor
Calitatea anchetelor telefonice depinde de un ansamblu de factori, printre cei mai importanti fiind:
populatia analizata;
domeniul studiat;
durata chestionarului si formularea intrebarilor;
sistemul CATI (Computer Assisted Telephone Interview) utilizat;
pregatirea operatorilor;
ambianta salii in care se realizeaza apelurile;
controlarea operatorilor;
planul de sondaj;
metodele de redresare utilizate.
In mod frecvent promotorii anchetei prin telefon insista asupra necesitatii de simlificare a
chestionarului. Dar de fapt, trebuie sa se aibe in vedere simplificarea intrebarilor, chestionarul
putand fi complex, cu numeroase filtre deoarece soft-urile de tip CATI sunt adaptate pentru a
masca aceasta comlexitate respondentului si de a facilita sarcina operatorului.
Problema complexitatii intrebarilor subzista, insa nu este specifica anchetei prin telefon. Ea este
dependenta in principal de modul de formulare al intrebarilor si de tipul informatiei cerute. In cele
mai multe cazuri aceasta problema este atribuita telefonului, deoarece, este posibil ca in absenta
unui suport scris, numerosi respondenti sa aiba dificultati de intelegere sau de memorare a
intrebarii sau a variantelor de raspuns.
Aceast inconvenient poate fi in mare parte diminuat daca, in prealabil, respondentul primeste
chestionarul insotit de o scrisoare cu explicatiile necesare. Insa nu exista certitudinea ca persoana
in cauza pastreaza chestionarul si ca il are in fata in momentul interviului.
Relatia care se stabileste intre operator si respondent este de natura diferita, in functie de
metodologia utilizata. Este mult mai usor sa se mentina atentia respondentilor in timpul unei
anchete fata in fata decat in cazul unei anchete prin telefon. Mai mult, operatorul poate aprecia mai
bine masura in care intrebarile sunt intelese si poate interveni cu explicatii acolo unde este cazul.
In ceea ce priveste comparatiile intre raspunsurile obtinute in cadrul utilizarii interviului fata in fata
si a celui telefonic, au fost facute numeroase studii, in principal in tarile anglo-saxone.
Importanta este contributia lui Edith De Leeuw care a realizat o analiza pentru 33 de studii
publicate in perioada 1952 1986. Domeniile analizate au fost: sanatate (10 studii), comportament
(8 studii), evenimente biografice (6), atitudini (6), sentimente (2), nivelul de cunostinte (1), tirajele
utilizate fiind aleatoare.
Pentru compararea acestor studii au fost luate in calcul urmatoarele criterii:
a) numarul de itemi nu stiu;
33
b) cantitatea de informatii numarul de itemi existent pentru intrebarile deschise sau numarul
de raspunsuri in cazul intrebarilor cu alegere multipla;
c) procentul raspunsurilor care corespund informatiilor disponibile (si valide) provenite din
alte surse;
d) gradul de absenta al erorii (bias) in raport cu normele sociale
e) test asupra distributiei itemilor pentru fiecare intrebare, pentru fiecare din modurile de
colectare a datelor.
Pentru criteriile b), d) si e) diferentele observate intre anchetele realizate prin telefon si cele
realizate fata in fata sunt semnificative din punct de vedere statistic si in favoarea interviurilor fata
in fata. Pentru criteriul c) nu se inregistreaza diferente semnificative; a fost observata o corelatie
negativa intre efectul de talie si anul realizarii anchetei, ceea ce arata ca diferentele se
diminueaza in timp.
Dintr-un alt studiu comparativ privind atitudinile sociale, realizat de Collins si Sykes (1987) in
Marea Britanie, a reiesit ca raspunsurile obtinute utilizand cele doua modalitati (fata in fata si
telefon) sunt similare. Anumite raspunsuri obtinute la intrebarile deschise sunt mai succinte in
cazul interviului telefonic, dar informatiile suplimentare obtinute in interviul fata in fata nu sunt
foarte importante. Pentru intrebarile considerate delicate interviul telefonic nu a constituit o
problema pentru operatori.
Intr-un alt studiu realizat in 1993 de Le Vaillant cu privire la perceptia sociala pentru SIDA, au fost
comparate doua esantioane de cate 1000 de indivizi (pentru un esantion a afost utilizat interviul
fata in fata iar pentru celalalt interviul telefonic). Rezultatele studiului arata o mare convergenta
intre raspunsurile obtinute la interviul fata in fata si cel prin telefon, dar si diferente semnificative
din punct de vedere statistic privind distributia raspunsurilor la 56 de intrebari din numarul total de
190.
Prin urmare, diversitatea rezultatelor obtinute trebuie sa conduca responsabilii anchetelor la
prudenta in alegerea modului de colectare a datelor.
In general, se poate considera ca interviul fata in fata produce informatii de o mai buna calitate,
chiar daca exista contra-exemple in acest sens!
Pe de alta parte, diferentele intre aceste doua modalitati de colectare se dimineaza din ce in ce mai
mult ca urmare a perfectionarii tehnicilor de realizare a interviului telefonic si datorita faptului ca,
la ora actuala telefonul a devenit un obiect de folosinta curenta in cadrul gospodariilor (G. Brossier
A. M. Dussaix 1999).
Controlul anchetei
Posibilitatea urmaririi si controlarii derularii interviului si a activitatii operatorilor reprezinta un
aspect foarte important in obtinerea de informatii cat mai precise.
La acest nivel, interviul telefonic prezinta multiple avantaje in raport cu cel realizat fata in fata:
Posibilitatea unui contol mai bun si o supraveghere mult mai riguroasa a operatorilor
utilizarea aceluiasi local permite un control mult mai eficient si in timp real. In plus, exista
posibilitatea conectarii in orice moment la linia telefonica pentru verificarea operatorului.
Prin urmare, nu mai este necesar sa se faca o verificare posteriori la domiciliul
respondentului, operatie care antreneaza pe de o parte cresterea costului, iar pe de alta parte
o apreciere negativa din partea respondentului.
O mai buna supraveghere a anchetei prezenta operatorilor in acelasi loc permite
culegerea informatiilor zilnic si prin urmare se poate realiza verificarea imediata a acestora.
Este mult mai usor sa se completeze sau sa se corecteze anumite intrebari din chestionar
telefonand din nou la persoana intervievata chiar in ziua in care a fost realizat interviul,
deoarece isi va reaminti cu mai mare usurinta informatiile necesare.
34
O mai buna repartizare a operatorilor in aria de realizare a anchetei in cadrul interviului
telefonic nu mai este necesara specializarea acestora pentru una sau mai multe zone in
vederea reducerii timpului cu deplasarea.
Disponibilitatea rapida a datelor.
Accesul operatorilor in anumite cartiere, in special seara, poate fi dificil (acelasi lucru este
valabil si pentru anumite sate situate din zone greu accesibile).
Cresterea numarului de cladiri dotate cu interfon reprezinta o adevarata piedica in
realizarea interviului fata in fata. Aceasta dificultate poate genera erori de esantionare,
deoarece o parte din populatie poate fi extrem de greu abordabila (trebuie precizat ca un
inconvenient asemanator exista si in cazul interviului telefonic robotul telefonic sau
numerele de telefon secrete) (G. Brossier A. M. Dussaix 1999).
Exista persoane care nu lasa sa intre necunoscuti in locuinta lor, dar care accepta
colaborarea la o anchete prin telefon
O parte din aceste avantaje sunt in mare parte dependente de utilizarea sistemelor CATI.
Este adevarat ca sistemele CAPI (utilizate in interviurile fara in fata) pot oferi avantaje
asemanatoare datorita posibilitatii de transfer, ceea ce permite urmarirea zilnica a anchetei. Insa
acest aspect necesita o logistica mult mai sofisticata si mult mai costisitoare. Mai mult, in cazul
interviului fata in fata, verificarea poate fi facuta zilnic, dar nu in timp real, ceea ce inseamna ca
relatia operator respondent nu poate fi practic urmarita.
Un alt aspect foarte important este costul anchetei. Acesta nu influenteaza in mod direct calitatea
informatiilor. De asemenea, cu cat costul colectarii datelor este mai redus, cu atat poate fi crescuta
marimea esantionului si deci reprezentativitatea datelor si, in final, va creste calitatea datelor.
In ceea ce priveste costul unitar, se apreciaza ca acesta este mai mic in cazul anchetei prin telefon
decat cel aferent anchetei fata in fata, chiar daca, si in prezent, exista divergente in ceea ce priveste
importanta diferentei intre aceste doua costuri.
Aceasta situatie este datorata urmatoarelor aspecte (De Leeuw, Van Der Zouwen 1992, Werking,
Clayton 1991):
eliminarea deplasarilor necesare realizarii interviului permite realizarea de economii
importante (bani + timp);
cresterea eficacitatii activitatii operatorilor;
este necesar un numar mai redus de operatori, ceea ce permite limitarea utilizarii
neprofesionistilor care au nevoie de o perioada de pregatire mai lunga. Acest lucru implica
si reducerea importantei activitatii de coordonare.
Problema existentei numerelor de telefon secrete
Cresterea ponderii numerelor de telefon secrete conduce la diminuarea avantajelor legate de
imbunatatirea echipamentelor utilizate in prezent in cadrul anchetelor telefonice. Situatia reala a
acestui indicator nu este publicata, dar, conform analizelor furnizate de institutele de sondaj, este in
crestere.
In Franta, in cadrul barometrului Sanatate (1999) al CFES (Comitetului Francez de Educatie
pentru Sanatate) acest indicator era de aproximativ 18%, variind de la 10% la 30% in functie de
regiuni.
Caracteristicile socio-demografice ale abonatilor apartinand listei rosii in Franta
Pentru a atenua efectele listei rosii, in 1992, Philippe Tassi a elaborat un procedeu de declinare a
numerelor in cadrul anchetei 75 000 radio -TV pentru audienta media. A fost utilizat un esantion
de 2200 gospodarii pentru lista rosie si 7200 pentru anuar. Acest studiu prezinta doua rezultate
35
contradictorii dupa cum este examinat esantionul persoanelor anchetate sau datele referitoare la
seful gospodariei.
Pentru primul esantion, autorul a constatat asemanari cu privire la caracteristica sex, varsta,
activitatea profesionala a persoanelor intervievate din cadrul gospodariilor apartinand listei rosii si
anuarului. In schimb, cand sunt analizate datele socio-economice corespunzatoare sefului
gospodariei apar diferente semnificative.
Astfel, conform tabelului de mai jos, se poate constata ca, seful de menaj inscris in lista rosie este
mai tanar (70 % aveau sub 50 de ani, fata de 50% pentru anuar) si au un grad de instruire superior
(G. Brossier A. M. Dussaix 1999).
Tabel nr......: Structura populatiei (Sursa: Mdiamtrie)
Lista rosie Anuar
Varsta sefului
gospodariei
15 - 24 10,1% 5,1%
25 - 34 27,5% 18,8%
35 - 49 33,0% 26,5%
50 - 64 17,9% 24,1%
65 si peste 11,6% 25,4%
Gradul de instruire
Studii primare 21,2% 35,4%
Studii secundare 27,9% 23,4%
Studii tehnice sau
scoala profesionala
22,5% 20,5%
Studii superioare 26,8% 19,3%
Sursa:
Acest studiu ofera o solutie pentru a diminua efectele existentei liste rosii, declinarea numerelor
permitand reconstituirea acesteia.
Metoda utilizata de Philippe Tassi consta in a selectiona, intr-o prima faza, un esantion aleator de
abonati din anuar. Apoi, pentru numerele de telefon care nu conduc la realizarea unei anchete
valide, sunt schimbate ultimele doua cifre in mod aleator. Gestionarea numerelor realizata de
France Telecom ofera posibilitatea de a utiliza aceeasi centrala telefonica si deci de a selectiona o
gospodarie care face parte din aceeasi regiune. Astfel, autorul a obtinut o rata de refuz
asemanatoare pentru esantionul declinat si pentru cel furnizat de France Tlcom.
Aceasta metoda prezinta insa si unele dezavantaje:
obtinerea de numere non-valide sau atribuite institutiilor; in acest caz se poate abandona
numarul sau poate fi declinat din nou, ceea ce presupune existenta unui esantion important;
deoarece nu se dispune de adresa gospodariei, nu poate fi facuta, in prealabil, o informare
despre derularea anchetei;
nu furnizeaza un esantion totalmente aleator, chiar daca declinarea este realizata aleator.
In ceea ce priveste bazele de sondaj, pot fi utilizate:
Anuarul telefonic care prezinta urmatoarele avantaje:
- acopera ansamblul teritoriului;
- este actualizat periodic;
- este organizat pe judete, ceea ce permite realizarea stratificarii dupa acest criteriu.
36
Dar prezinta si o serie de dezavantaje:
- nu este realizata intotdeauna distinctia intre numerele de telefon ale persoanelor
fizice si cele ale personelor juridice; este cazul, in special, al micilor producatori al
caror numar figureaza, concomitent, in ambele categorii;
- existenta numerelor de telefon secrete.
Aceasta baza de sondaj este in special utilizata in UE; in SUA , datorita mobilitatii foarte ridicate a
populatiei nu este considerata de catre institutele de sondaj ca un instrument viabil.
Generarea aleatoare a numerelor de telefon (Random Digit Dailing). Acest procedeu
permite obtinerea unei reprezentativitati comparabile pentru persoanele existente in anuar
si pentru cele care figureaza in lista rosie, insa prezinta o serie de dezavantaje dintre care
mentionam:
- generarea unui numar mare de numere non-valide sau in afara ariei anchetei;
- necesitatea unei delimitari geografice corespunzatoare a centrelor telefonice;
- supra-reprezentarea gospodariilor care au mai multe linii telefonice.
Generarea aleatoare de numere este utilizata in special in SUA datorita inconvenientului pe care il
prezinta anuarul telefonic in aceasta tara; este un procedeu costisitoar datorita proportiei ridicate a
numerelor non-atribuite.
Alte surse, cum ar fi listele electorale, liste comerciale.
Tehnica de esantionare utilizata
Esantionarea pe cote este recomandata in situatia in care esantionul este de marime redusa,
maximum 2000 de indivizi (Deville, 1993). Operatorul are libertatea alegerii respondentilor care
vor face parte din esantion, dar pot rezultat erori de selectie. De asemenea, aceasta tehnica conduce
la esantioane care sub-reprezinta populatiile dificil de contactat. Un alt inconvenient este ca
intervalele de incredere nu pot fi calculate in mod riguros.
De asemenea, se poate utiliza sondajul aleator simplu si apoi poate fi realizata operatia de
stratificate, in special in functie de criteriul geografic.
Populatia anchetata
Presupunand ca ancheta se realizeaza in randul abonatilor telefonici, cercetatorul trebuie sa
stabileasca daca vor fi utilizate gospodariile sau indivizii.
Primul nivel este mult mai util, de exempu, in cadrul studiilor privind dotarea cu echipament, in
timp ce al doilea nivel este interesant pentru realizarea analizelor de comportament.
Daca se decide sa se interogheze individul, atunci se poate alege intre anchetarea unei persoane
din cadrul gospodariei sau a membrilor a caror varsta se incadreaza intr-un interval stabilit de
cercetator.
Aceasta ultima varianta, desi din punct de vedere statistic prezinta o serie de dezavantaje, este
preferata in unele situatii deoarece:
reduce costul;
se pot analiza interdependentele familiale si repartizarea rolurilor in cadrul gospodariei.
37
In ceea ce priveste alegerea individului, se pot utiliza mai multe procedee printre care amintim:
persoana care a sarbatorit cel mai recent ziua de nastere, persoana din familie care pregateste, de
exemplu, micul dejun.
Dezvoltarea telefoniei mobile
In ultimii ani cresterea numarului de persoane care utilizeaza un telefon mobil este spectaculosa,
atat in cadrul UE cat si in SUA.
In Franta, de exemplu, conform informatiilor furnizate de Mdiamtrie Multimedia Barometers,
11.5% dintre indivizii in varsta de 15 ani si peste nu aveau un telefon fix in prima jumatate a anului
2002 insa 9.3% dintre acestia aveau un mobil.
Se stie ca, situatia socio-demografica a acestor persoane este foarte diferita in raport cu cele care
dispun de un telefon fix. In general sunt tineri si apartin, in majoritate, gospodariilor formate dintr-
o singura persoana.
Telefonul mobil este mai degraba asociat cu notiunea de individ decat cu cea de gospodarie, acest
aspect putand constitui un avantaj pentru anchetele realizate la nivel de individ, chiar daca acest tip
nu exclude descrierea gospodariei (numarul membrilor, tipul de echipament electrocasnic utilizat).
Telefonul fix poate oferi o serie de informatii importante, care pot fi exploatate cu usurinta:
adresa gospodariei si prin urmare se pot obtine informatii privind vecinii, tipul de
locuinta;
se stie localizarea geografica a respondentilor - acestia sunt in orasul in care locuiesc, la
domiciliul stabil.
O persoana care raspunde la un tefelon fix se afla in mediul sau natural, poate raspunde la apelul
telefonic si, eventual, poate accepta sa raspunda la intrebarile din chestionar. In schimb, o persoana
care raspunde la un numar de telefon mobil nu se afla intotdeauna intr-un mediu favorabil unei
discutii telefonice, poate sa fie ocupata cu probleme profesionale, etc; exista posibilitatea revenirii
prin fixarea, de comun acord, a unei ore, insa pot exista aceleasi probleme. De asemenea, pot
exista si alte inconveniente, cum ar fi, de exemplu, faptul ca reteaua nu acopera intreg teritoriul
tarii.
Absenta anuarului cu numere de telefon mobil precum si imposibilitatea afectarii riguroase a
unui numar de mobil unui individ sau unei gospodarii si prin urmare unei zone geografie, costul
comunicarii de acest tip sunt doar cateva aspecte care vor aduce modificari in anchetele telefonice.
Insa problema cruciala la ora actuala ramane lipsa unei baze de date; neputand repera dublele
inregistrari, nu este posibil sa se calculeze probabilitatea de includere in esantion (Roy et
Vanheuverzwyn, 2000).
Anchetele realizate prin Internet
Putin costisitor si rapid, internetul este considerat de unii specialisti un excelent mijloc pentru
difuzarea chestionarelor si recoltarea datelor.
Utilizarea Web-ului in acest scop este foarte raspandita in Statele Unite si in Canada.
Conform statisticilor, in SUA piata studiilor on-ligne a cunoscut o puternica crestere de la 258
milioane dolari in 2000 la 489 milioane dolari in 2001, iar pentru 2002 aceasta piata a fost estimata
la aproximativ 600 milioane dolari, de zece ori mai mult decat piata europeana. Firme precum
Procter Gamble realizeaza marea majoritate a testelor de concepere a produselor on-ligne.
In Europa exista inca rezerve in privinta utilizarii internetului in cadrul anchetelor.
38
Totusi marile firme, bancile si societatile de asigurare au inceput sa fie din ce in ce mai interesate
de acest instrument, in special pentru realizarea studiilor de satisfactie.
Viitorul anchetelor on-ligne va depinde insa de gradul de raspandire a internetului, dar
fundamentele trebuie sa ramana aceleasi:
Sursa: (O. Marchese, Ipsos France, 2004)
Anchetele prin internet pot fi comparate cu anchetele postale, traditionalul chestionar fiind inlocuit
cu un formular difuzat prin e-mail sau plasat pe un site web.
In functie de suportul care gazduieste chestionarul, exista trei tipuri principale de anchete on
ligne (J. Moscarola S. Ganassali, 2002):
anchete in care chestionarul este atasat atunci cand se transmite un e-mail, fie in fisier
distinct, fie in interiorul aceluiasi mesaj;
transmiterea chestionarului asociat cu un program (care poate fi salvat) in vederea
completarii;
sistem web integrat plecand de la un program sursa, coordonatorul anchetei
construieste chestionarul si il va plasa pe un server specializat in administrarea anchetelor
on ligne.
Insa anchetele on-ligne sunt in mod frecvent criticate datorita lacunelor in ceea ce priveste
esantionarea, in cazul chestionarelor plasate pe un site cei care decid sa raspunda fiind
vizitatorii. Daca nu exista un numar consecvent de vizitatori nu se va putea obtine un numar
suficient de respondenti; pentru remedierea acestui aspect pot fi utilizate diverse promotii care vor
fi plasate si pe alte site-uri. Dar este foarte posibil ca vizitatorii sa completeze chestionarul doar
pentru a obtine cadoul promis si in realitate sa nu fie interesati de tema anchetei.
Pe de alta parte, este destul de dificil sa se verifice daca respondentii sunt ceea ce pretind a fi si ca
nu completeaza de mai multe ori chestionarul.
Din cercetarile care au fost realizate pana acum s-a constatat ca cei care participa la acest tip de
anchete au urmatoarele caracteristici (O. Marchese, Ipsos France, 2004):
++ tineri;
++ barbati;
++ instruiti;
++ profesii superioare.
Pentru anumite populatii insa, acoperirea poate fi corecta (O. Marchese, Ipsos France, 2004):
vizitatorii de sit-uri web;
profesori universitari,
persoane care lucreaza in domeniul informatic;
salariatii firmelor care sunt conectate la Internet, etc.
39
In lucrarea Web Survey Design and Administration, Couper (2001) propune evaluarea
diferitelor metode de ancheta utilizand criteriul erorii totale. De asemenea, este mentionat faptul ca
eroarea de reprezentativitate este principala problema in cadrul anchetelor prin Internet, cu
toate ca aceasta tehnica se amelioreaza continuu.
Chiar daca criteriile socio-demografice pot fi controlate, stilul de viata, atitudinile si
comportamentul utilizatorilor de internet sunt foarte specifice.
In plus, pana la ora actuala nu exista o lisa cu adresele electronice si identificarea dupa acest
criteriu este destul de dificila, aceeasi persoana putand avea mai multe adrese sau unele sunt
inutilizabile.
Referitor la gradul de participare, opiniile specialistilor difera Dillmann & al. (2001) si Couper
(2001) considera ca in cadrul anchetelor postale acest indicator este superior fata de anchetele on
ligne.
Ca si celelalte suporturi posibile, Internetul va fi ales in functie de obiectivele anchetei.
In ceea ce priveste chestionarul propriu-zis, in urma progreselor realizate se poate controla mai
bine efectele expunerii si se pot reduce erorile sistematice. Ideal, un chestionar trebuie sa aiba
maximum 25 30 intrebari si sa dureze 10-15 minute, prin urmare obiectivele trebuie sa fie foarte
precise.
Cu toate inconvenientele prezentate mai sus, anchetele realizate prin internet prezinta insa si unele
avantaje dintre care mentionam:
rapiditate (este posibil sa se lanseze o ancheta dimineata si dupa-amiaza sa se difuzeze
rezultatele);
costul de difuzare este practic nul;
raspunsurile sunt introduse in mod direct de respondent, ceea ce elimina practic bugetul cu
colectarea;
interactivitate:
- derularea intrebarilor care apar pe ecran poate fi controlata de o maniera mult mai
fina decat in cazul chestionarelor pe suport de hartie ( prezentarea progresiva a
intrebarilor permite trecerea la ecranul urmator, afisarea intrebarilor poate fi
conditionata de raspunsurile precedente, etc.);
- multimedia favorizeaza utilizarea imaginilor, sunetelor, video;
- pentru anchetele lansate de pe un site web se poate controla momentul in care
vizitatorul va fi solicitat sa raspunda;
- urmarirea on-line a colectarii datelor, permite ca, in functie de rezultatele
obtinute sa se gestioneze cotele, sa se efectueze relansari, sa se modifice
chestionarul in vederea reformularii unei intrebari care nu este inteleasa, sa se
adauge modalitati sau intrebari.
Tendintele inregistrate in colectarea datelor
Fenomenul care se manifesta in prezent si care tinde sa se generalizeze este utilizarea sistemelor
CAI (Computer Assisted Interviews) fie in cadrul interviurilor, fie in cadrul sistemelor EDI
(Electronic Data Interchange).
In vederea realizarii anchetelor prin telefon sunt utilizate, de peste 15 ani, sistemele CATI
(Computer Assisted Telephone Interview) si mult mai recent au fost dezvoltate sistemele CAPI
(Computer Assisted Personal Interview).
40
Ca urmare a cercetarilor recente, au fost integrate in cadrul grupei CAI sistemele CASI (Computer
Assisted Self Interview) in care chestionarul este propus direct respondentului, pe cale electronica.
Insa aceste sisteme presupun ca persoanele interogate sa dispuna de echipamentul necesar.
In ultimii ani prelucrarea raspunsurilor furnizate de vocea respondentului si inregistrate direct pe
suport magnetic sau electronic (Interactive Voice Response) a constituit obiectul cercetarilor
tehnice si experimentelor.
La nivelul firmelor si institutelor, alianta dintre sistemele CAI si EDI se plaseaza in contextul
retelelor si bazelor de date.
Tendinta este ca anchetele sa nu se mai adreseze separat diverselor unitati statistice, putand fi
realizate, cel putin partial, prin interogarea bazelor de date, iar transmiterea chestionarului sa fie
inlocuita prin procedurile EDI.
De asemenea, trebuie sa se tina seama de evolutiile posibile privind obiectele multimedia
(combinarea textelor, sunetelor si imaginilor) obiectele multidimensionale (hiper-text), obiectele
cognitive (sistemele expert), obiectele virtuale..., adica sa se stie cum sa fie citite, inregistrate,
stocate, prelucrate si transmise in limbajul apropiat de cel al utilizatorilor finali.
CAPI (Computer Assisted Personal Interiewing)
Pentru interviul fata in fata, softurile de tip CAPI permit nu numai pregatirea chestionarului, dar
si introducerea intr-o baza de date a informatiilor obtinute si recuperarea rezultatelor pe suport
informatic.
In cursul interviului, aceste softuri permit derularea automata a chestionarului, ceea ce asigura
respectarea riguroasa a filtrelor. Ideal este sa se dispuna de doua ecrane unul pentru operator si
celalalt pentru persoana intervievata.
Dar CAPI constituie si o prezenta a institutului in timpul interviului: sunt inregistrate datele la care
incep si se sfarsesc intalnirile, eventual timpul de raspuns la o intrebare sau la o fractiune din
chestionar.
Aceste aplicatii permit si inregistreaza intreruperea si reluarea interviului si deci anchetele in mai
multe faze
Rezultatele sunt introduse si apoi transmise, institutului sau firmei prin modem, in general sera.
In prezent se poate utiliza si sistemul CAPI fara fir, un calculator PDA (Personal Digital
Organizer) este conectat la internet, tehnologia pentru aceste instrumente progresand rapid.
Utilizarea PDA permite obtinerea de avantaje la mai multe niveluri:
in pregatirea unei campanii de interviuri responsabilul studiului castiga mai mult timp,
sunt eliminate cheltuielile cu imprimarea;
pe teren o mai buna productivitate in realizarea interviurilor; o echipa dotata cu PDA este
de trei ori mai rapida decat o echipa care foloseste chestionare pe suport de hartie;
dar castigul cel mai mare este la nivelul explotarii datelor- in cateva ore este posibil sa se
asigure in mod automat toata faza de recuperare a informatiilor, prelucrarea datelor si
vizualizarea lor sub forma grafica. Din punct de vedere calitativ, PDA reduce riscul
aparitiei erorilor pentru tot procesul si deci contribuie la cresterea calitatii globale a
anchetei.
Cu titlu de exemplu, s-a estimat ca, pentru realizarea de 15.000 interviuri, 5 PDA pot fi amortizate
in aproximativ un an.
Efectele asupra respondentilor
Cu toate ca primii utilizatori ai sistemului CAPI au avut teama de o influenta negativa a acestuia
asupra ratei raspunsurilor, acest aspect nu a fost semnalat nici chiar in primele anchete care au fost
realizate in Suedia si Olanda (Van Bastelaer, Kerssemakers & Sikkel, 1987; Van Bastelaer & al,
1988). O serie de studii realizate in anii 90 au confirmat ca chestionarele pe suport de hartie si
41
sistemele CAPI au oferit rate de raspuns comparabile in S.U.A. (Bradbrun & al., 1992; Sperry &
al., 1991; Thornberry & al., 1991), Anglia (Martin & al., 1994), Suedia (Statistics Sweden, 1989)
si Germania (Riede & Dorn, 1991). Aceste studii arata si faptul ca ponderea reactiilor negative in
randul respondentilor a fost destul de redusa (1 4 %), cele mai multe reactii fiind neutre sau
pozitive.
Efectele asupra operatorului
Operatorii au in general o atitudine pozitiva in ceea ce priveste aplicatiile CAPI, in special atunci
cand sunt utilizate chestionare complexe (Riede & Dorn, 1991; Edwards & al., 1993).
Edwards & al arata in comparatia pe care o realizeaza in 1993 ca trei din patru operatori apreciau
chestionarul pe suport de hartie ca fiind obositor.
In ceea ce priveste aspectele eronomice, in urma unui studiu realizat in 1992, Couper & Groves
precizeaza ca volumul laptop-urilor este o problema pentru unii operatori.
Efectele asupra calitatii datelor
Asa cum am mai aratat, gradul de acceptare al aplicatiilor CAPI este ridicat atat in randul
operatorilor cat si in randul respondentilor si nu exista nici un fel de indicatie ca utilizarea
calculatorului ar perturba realizarea interviului (Beckenbach, 1992).
In ceea ce priveste non-raspunsurile, ponderea acestora este mult mai redusa in cazul CAPI, in
special datorita faptului ca operatorii nu pot face erori in ceea ce priveste erorile de adresare
(routing errors) (Sebestik & al., 1988; Olsen, 1992).
In studiul comparativ pe care il realizeaza in 1984 Waterton apreciaza ca efectul utilizarii CAPI
este pozitiv in cazul existentei intrebarilor delicate privind consumul de alcool. In acest caz a fost
raportat un consum mult mai mare fata de cazul chestionarelor pe suport de hartie, putandu-se
presupune ca sitemele CAPI au influentat intr-o mai mica masura eroarea datorata apartenentei la
normele sociale (social desirability bias).
Efectul asupra costurilor
In 1988 Sebestik & al. face o comparatie intre costul CAPI si costul PAPI (Paper And Pencil
Interview) in cazul unui esantion redus (CAPI + PAPI = 200), fiind excluse investitiile in
echipamentul hard si soft.
Concluzia a fost ca utilizarea CAPI a condus la un cost total mai ridicat, in special ca urmare a
costurilor cu instruirea operatorilor. Intr-un alt studiu realizat pe un esantion mai mare (numarul de
respondenti a fost de 300 in fiecare caz) Baker & Bradburn (1992) aprecia ca utilizarea CAPI a
condus la un cost total cu aproximativ 12% mai mare fata de PAPI.
Sitemele CATI (Computer Assisted Telephone Interviewing)
La originea anchetelor prin telefon a fost transmiterea verbala a intrebarilor existente in
chestionarele pe suport de hartie, fara asistenta speciala; operatorii notau sau bifau raspunsurile, iar
dupa aceea era realizata operatia de colectare a tuturor informatiilor si transcrierea acestora intr-o
baza de date.
La inceputul anilor 70 in SUA, piata studiilor de marketing a declansat primele cercetari in
domeniul sistemelor de asistenta informatizata pentru anchetele prin telefon CATI. Acest sistem
a facut din telefon un instrument care este in acelasi timp modern si adapat realizarii anchetelor.
In Europa insa acesta descoperire a patruns mult mai tarziu; de exemplu in Franta este utilizat la
sfarsitul anilor 80.
42
Efectul asupra respondentului
In general, in interviurile telefonice, respondentul nu este informat de faptul ca este utilizat sau nu
un calculator, si de aceea exista foarte putine diferente intre interviul traditional si CATI.
In urma unor studii comparative, in 1986, Groves si Nichollas, afirma ca, in ceea ce priveste non-
raspunsurile, nu exista diferente intre interviurile telefonice traditionale si CATI.
De asemenea, tot ca urmare a realizarii de studii comparative, s-a constatat ca nu exista diferente in
comportamentul respondentilor daca ei stiu ca raspunsurile sunt introduse direct in calculator
(Catlin Ingram, 1988; Groves Nichollas, 1986; Weeks, 1992).
Efectul aspupra calitatii datelor
In 1986 Groves si Nichollas afirma ca sistemele CATI conduc la reducerea non-raspunsurilor
datorita faptului ca sunt eliminate erorile de adresare (routing errors), dar acest efect este
important numai in cazul chestionarelor care contin multe intrebari.
Cercetarea realizata de Catlin si Ingram in 1988 atrage atentia in special asupra efectelor existentei
intrebarilor deschise. Se afirma ca nu sunt diferente in ceea ce priveste erorile de introducere a
textului, codificare sau lungimea raspunsurilor intre sistemele CATI si CAPI.
Structura unei celule CATI
Un platou de apel CATI este o retea de posturi care sunt pilotate in mod centralizat, in acelasi
timp pentru emiterea unui apel si pentru stocarea raspunsurilor.
Arhitectura softwer a unui platou de apel este de tip Client / Server, care are pentru partea Server
un modul central ce utilizeaza o baza de date relationala, iar pentru partea Client, modulele de
colectare si ansamblul de instrumente de administrare, supervizare, creare de scenarii si analizarea
datelor. In general softurile Server, Administrator si Colectare sunt instalate, fiecare, pe posturi
diferite (un post Server CATI, mai multe posturi Colectare CATI, unul sau mai multe posturi
Administrator CATI).
Supervizarea este o operatie care poate fi realizata de fiecrea post care este conectat la retea, care
poate fi sau nu un post local. Crearea de scenarii si analizarea datelor pot fi realizate pe
calculatoare care, nu trebuie sa fie neaparat conectate in retea.
Postul Server indeplineste functii care sunt considerate indispensabile pentru functionarea unui
platou de apel:
gestionarea bazei de date; server-ul selectioneaza un numar de telefon si il transmite la
unul din posturile disponibile; aceasta selectie este realizata in mod aleator sau in
functie de stabilirea anumitor cote;
cand o persoana nu poate fi contactata sau cere sa fie reapelata ulterior, server-ul
gestioneaza transmiterea numarului de telefon la postul operatorului, la momentul
stabilit;
distribuirea scenariilor de apel, care sunt chestionare inteligente instalate pe server; in
momentul in care un operator se conecteaza, indicand numele si parola, server-ul
transmite catre calculatorul acestuia chestionarul corespunzator.
inregistreaza in permanenta toate datele privind conectarile, deconectarile, rezultatele
convorbirilor...., ceea ce permite urmarirea imediata a performantelor si realizarii
obiectivelor;
43
stocarea raspunsurilor obtinute; imediat ce o convorbire este terminata, raspunsurile
colectate sunt inregistrate pe server, ceea ce face ca datele sa fie imedit disponibile in
vederea realizarii unei prelucrari statistice.
Sistemele evoluate au integrate functii de gestionare in timp real de realizare a obiectivelor,
cum ar fi, de exemplu, cotele dinamice este oprita intervievarea categoriilor de persoane
pentru care a fost atins pragul stabilit.
Un singur server CATI poate gazdui, in general, mai multe operatii care pot functiona
simultan.
Posturile de colectare
Fiecare operator dispune de un post de colectare conectat la server-ul CATI.
Functia lor principala este de a permite sa se interogheze respondentii (care sunt transmisi de
care server) prin telefon cu ajutorul unui chestionar care este afisat pe ecran. Raspunsurile
primite sunt inregistrate simultan si orienteaza continuarea convorbirii, conform scenariului
definit.
In mod frecvent, aceste posturi contin numai programul de colectare CATI; toate celelalte date
cu privire la studiu sunt transmise cu ajutorul server-ului CATI care are, de asemenea, si
functia stocarii datelor colectate.
Posturile sunt intersanjabile si permit conectarea operatorilor in functie de momentele din
timpul zilei interviurile B to B se realizeaza in timpul zilei, in timp ce interviurile cu
persoanele fizice se deruleaza cu preponderenta seara.
Postul Administrator
Functia administratorului CATI consta, pe de o parte, in a transmite informatiile necesare
server-ului in vederea gestionarii posturilor de colectare, iar pe de alta parte, de a verifica si a
ajusta functionarea acestuia in timpul operatiilor de apelare. Ansambul informatiilor pe care
administratorul le transmite server-ului sunt regrupate in notiunea de campanie.
O campanie este constituita dintr-un chestionar (sau script), din bazele de date, drepturile de
acces pe care le au operatorii, un indicator care permite diferentierea unui apel pozitiv de unul
negativ (care este variabil in functie de chestionar) si din cotele de apel.
Supervizarea
In cadrul unui platou de apel CATI, prin definitie, supervizarea corespunde vizualizarii si
ascultarii la distanta a ceea ce se produce la un post de apel putand fi considerata ca un
element suplimentar sau ca un element indispensabil. Aceasta apreciere depinde de nivelul de
pregatire si de increderea acordata operatorilor, dar si de gradul de exigenta in ceea ce priveste
calitatea informatiilor. Solutia cea mai economica pentru a vizualiza la distanta ceea ce se
intampla la un post de apel este de a utiliza un soft de supervizare standard (de exemplu PC
Anywhere sau Laplink).
44
CAWI (Computer Assisted Web Interiewing)
In ultimul timp, softurile de tip CAWI au inceput sa fie din ce in ce mai utilizate. Chiar daca apar
intrebari in legatura cu reprezentativitatea esantionului, nu poate fi negata eficacitatea sa in special
in cazul chestionarelor auto-administrate.
In prezent insa, aceasta aplicatie nu se poate utiliza pentru toate anchetele, situatia fiind oarecum
aseamanatoare cu interviurile telefonice acum 30 de ani.
Institutele de sondaj folosesc CAWI in special pentru pre-testarea chestionarelor si apoi o aplicatie
de tip CAPI sau CATI.
Fluxul de informatii si tehnologia utilizata
Comunicarea intre actorii anchetei necesita existenta unui server pe care va fi plasat chestionarul
si unde vor fi inregistrate raspunsurile. Prin conectarea la acest centru unic, responsabilul studiului,
respondentii si beneficiarul pot accesa informatiile la care au dreptul (J. Moscarola S. Ganassali,
2002).
Publicarea anchetei: responsabilul studiului server
Prima etapa consta in instalarea pe server a fisierelor anchetei care servesc la:
afisarea formularului;
inregistrarea raspunsurilor;
vizualizarea rezultatelor in cursul colectarii raspunsurilor.
Difuzarea formularului: responsabilul studiului server
responsabilul studiului respondent
In acesta etapa se urmareste ca viitorul respondent sa aiba acces la chestionar, acesta fiind plasat
intr-un loc public sau transmis prin e-mail. In acest scop, responsabilul studiului trebuie sa stie
pe ce server si in ce loc (adresa sau URL) a fost instalata ancheta. El poate cominica adresa in doua
modalitai (J. Moscarola S. Ganassali, 2002):
prin creearea unei legaturi pe un site web;
prin transmiterea unui e-mail cu adresa la care se poate completa chestionarul.
Completarea chestionarului: server respondent
45
Este etapa care permite respondentului sa vizualizeze intrebarile si sa raspunda, necesitand un
dublu-flux:
transmiterea de pe server catre postul respondentului a informatiilor necesare pentru
afisarea formularului;
transmiterea de la postul respondentului catre server a raspunsurilor.
Aceasta etapa este declansata de catre respondent ca urmare a:
vizitarii unui site - el selectioneaza o legatura hiper-text, un buton, o imagine animata
care conduce la chestionar (de asemenea, acesta poate sa fie afisat automat, in functie de
parcursul in site);
la receptionarea unui curier electronic, acesta selectioneaza legatura hiper text plasata in
mesaj care permite afisarea formularului.
Recuperarea datelor: server responsabilul studiului
Este etapa finala a procesului de colectare, responsabilul studiului plaseaza pe postul sau fisierele
cu raspunsurile primite.
Urmarirea raspunsurilor on ligne: server responsabilul studiului
server beneficiar
In cursul colectarii, responsabilul studiului sau beneficiarul pot vizualiza rezultatele care corespund
informatiilor culese in momentul consultarii.
Prelucrarile statistice sunt efectuate de server care transmite paginile cu rezultatele responsabilului
studiului si beneficiarului. Aceste rezultate in timp real pot fi, de asemenea, transmise si
respondentului dupa ce acesta a completat chestionarul.
Publicarea si difuzarea raportului final: responsabilul studiului server beneficiar
Acest act reprezinta finalizarea studiului, in vederea difuzarii raportului putandu-se utiliza din nou
server - ul (serverul anchetei sau oricarea altul), ceea ce presupune:
inregistrarea raporului pe server;
comunicarea (prin e-mail sau pe site) a legaturii catre acest raport.
46
Comparatie intre tipurile de colectare a datelor
In tabelul de mai jos sunt comparate modalitatile de culegere a datelor in functie de criteriile de
calitate asociate fiecarei modalitati, esantion si baza de sondaj:
Criterii
Anchetele fata in
fata
Anchetele postale
Anchetele prin
telefon
Anchetele prin
Internet
1.Culegerea datelor
Lungime
Volum
Chestionarul poate
fi complex si poate
dura pana la o ora
si jumatate
Lungimea
chestionarului
trebuie sa fie de 4
6 pagini
maximum
Chestionarul nu
trebuie sa fie lung,
mai putin de 30 de
minute
Chestionarul nu
trebuie sa fie lung:
10 15 min
Flexibilitate
Este posibil sa se
prezinte suporturi
(vizuale auditive,
tactile).
Nu este posibil,
deoarece nu exista
interactiune.
Flexibilitatea nu este
puternica, ca in
cazul anchetei fata in
fata; interactiunea
dinte operator si
respondent permite o
anumita
adaptibilitate a
discursului
operatorului.
Pot fi prezentate
imagini, exista
posibilitatea
avansarii automate
de la o pagina la
alta
Dinamica
chestionarului
Coordonarea
succesiunii
intrebarilor
Nu este posibila
coordonarea
succesiunii
intrebarilor
Coordonarea
succesiunii
intrebarilor
Coordonarea
succesiunii
intrebarilor
Rapiditatea realizarii
anchetei
Durata medie, dar
se stie cand trebuie
prelucrate
rezultatele
Ritmul primirii
chestionarelor
completate este o
problema majora
(nu se stie din ce
moment se poate
incepe prelucrarea
raspunsurilor
primite)
Acheta telefonica
este rapida (sistemul
CATI)
Prelucrarea este
rapida
Cost Costisitoare
Economica:
acoperirea
geografica este
buna si se
realizeaza cu
cheltuieli reduse
Foarte economica:
acoperirea
geografica este buna
si se realizeaza fara
deplasari sau
expedieri postale
Putin costisitoare,
exceptand costurile
cu echipamentul
Culegerea de
informatii
suplimentare
Permite culegerea
de informatii
detaliate si a
informatiilor
suplimentare
Nici o informatie
suplimentara
Informatii
suplimentare
Este posibila
culegerea de
informatii
calitative, dar in
mod frecvent sunt
utilizate intrebarile
47
Criterii
Anchetele fata in
fata
Anchetele postale
Anchetele prin
telefon
Anchetele prin
Internet
inchise.
2. Esantion
Identitatea persoanei
interogate
Controlata de
operator
Nu se stie cine
raspunde in
realitate
Controlata de
operator
Problema privind
reprezentativitatea
esantionului
Dispersie geografica
Dispersia este
limitata de
costurile cu
deplasarea
operatorilor
Dispersia
geografica nu
reprezinta o
problema
Este posibila o
dispersie geografica
puternica
Nu se ia in
considerare
3.Baza de sondaj
Non-raspuns
Ponderea non-
raspunsurilor este
variabila
Frecvent, ponderea
non-raspunsurilor
este foarte ridicata
O data ce persoana
este contactata,
ponderea refuzurilor
este estimata intre
20% - 40 %, cu o
puternica diminuare
daca se fixeaza data /
ora pentru realizarea
interviului
Ponderea non-
raspunsurilor este
ridicata
Controlarea activitatii
operatorului
Controlul este
dificil deoarece
este dependent de
relatia care se
stabileste intre
operator si
respondent
Acest criteriu nu
este semnificativ
pentru ancheta
postala
Controlul este mult
mai facil si in plus,
operatorii sunt
prezenti in acelasi
loc
Nu se aplica
Sursa: Marketing - Etudes et Recherches en Marketing, Yves Evrard & al, Dunod, Paris, 2000
Comparatia realizata mai sus este reluata in tabelul urmator:
48
Criterii
Anchetele fata
in fata
Anchetele
postale
Anchetele prin
telefon
Anchetele prin
Internet
1.Culegerea datelor
Volum + = = =
Flexibilitate + - = =
Dinamica
chestionarului
+ - + +
Rapiditate = - + +
Cost - + = +
Informatii suplimentare + - = =
2. Esantion
Identitatea persoanei
interogate
+ - + -
Dispersie geografica - + = =
3. Baza de sondaj
Non-raspuns = - + +
Controlarea activitatii
operatorului
- = + +
Sursa: La recherche marketing, Analyser Mesurer Prvoir, J.J. Lambin, Ediscience International, Paris, 1993
Legenda:
+ modalitatea de culegere a informatiilor este bine reprezentata in cadrul criteriului;
- modalitatea de culegere a informatiilor nu este bine reprezentata in cadrul criteriului;
= pozitie intermediara.
4. ANCHETELE SPECIALE PANELUL
Panelurile au aparut initial in sectorul produselor de larg consum care a manifestat mai
repede nevoia de a dispune de informatii continue pentru a se putea adapta mai bine conditiile
ofertei la cele ale cererii. Primul panel a fost creat in 1929 in Statele Unite de catre Arthur Charles
Nielsen (este vorba de un panel de distributori) , in Europa fiind introduse in mod progresiv,
incepand cu 1950.
Panelurile reprezinta primul post de cheltuieli in studii de piata, fiindu-le destinate
aproximativ o treime din bugetele de studii si cercetari din cadul bugetului de marketing.
Acordarea unei asemenea suprematii se datoreaza faptului ca panelurile abordeaza in mod direct
operational integralitatea elementelor mixului de marketing.
Spre deosebire de anchetele punctuale in care un esantion de subiecti este interogat o
singura data, obtinandu-se o imagine asupra fenomenului cercetat la un anumit moment, tehnicile
bazate pe panel permit urmarirea in timp a comportamentelor subiectilor.
Acest aspect constituie un avantaj major al panelului in comparatie cu anchetele periodice.
Prin urmare, datele obtinute sunt mai mult de natura comportamentala decat atitudinala.
49
D. Blanchard si D. Lesceux (1995) difinesc panelul ca fiind un esantion statistic permanent,
reprezentativ pentru un univers definit la un moment precis, in care sunt efectuate, la intervale
regulate de timp, un anumit numar de masuratori.
Frecventa colectarii informatiilor, cat si instrumentele utilizate depind de:
subiectul anchetei;
utilizarea datelor;
gradul de prcizie;
bugetul disponibil;
ritmul de raportare cerut.
Principalele tipuri de paneluri sunt:
panelurile de distribuitori - au ca rol principal de a cuantifica marimea pietei si marcilor;
panelurile de consumatori sunt instrumente complementare, cu caracter strategic, care
permit explicarea, intelegerea si previzionarea diverselor fenomene.
In afara de aceste doua categorii mai pot fi intalnite si alte tipuri, ca de exemplu: paneluri de
telespectatori, paneluri pentru diferite profesii (exemplu: medici, farmacisti), panelurile utilizate
pentru anchetele privind forta de munca etc.
Panelurile participa in mod direct si cotidian la toate deciziile strategice si tactice care se iau in
cadrul firmei.
In domeniul marketingului, panelurile abordeaza toate elementele mix-ului de marketing. Ele sunt
instrumente indispensabile in materie de diagnostic si pentru realizarea planurilor de marketing, in
vederea luarii deciziilor, pentru controlarea actiunilor si masurarea eficacitatii acestora asupra
vanzarilor si profitului. Mai mult, anumite paneluri care sunt concepute pentru realizarea de teste,
permit responsabililor de marketing de a masura potentialul inovarii, deci sa se elaboreze
previziuni privind volumul vanzarilor.
Pentru departamentul vanzari, panelurile stau la baza urmaririi performantelor si eficacitatii fortei
de vanzare, a rezultatelor obtinute de fortele de vanzare ale principalilor concurenti, reprezentand
suporturi de argumentare importante in fata distribuitorilor.
Pentru managementul de nivel superior si pentru departamentul financiar, panelurile permit sa se
realizeze un dialog eficient cu actionarii firmei, sa se faca alegeri in ceea ce priveste politica de
investitii pe termen mediu si lung.
In ceea ce priveste responsabilul de merchandisig, panelul este singurul instrument care ii permite
sa sfatuiasca in mod judicios punctele de vanzare en detail privind gestionarea si optimizarea
sortimentului de produse.
In concluzie, panelurile reprezinta veritabile instrumente de comunicare pentru intreaga firma dar
si de manipulare: pot fi difuzate mesaje de natura fundamental diferita pentru publicuri diferite,
utilizand aceleasi cifre si date (D. Blanchard si D. Lesceux, 1995).
In mod frecvent, panelurile fac obiectul a doua tipuri principale de critici (B. Pinet, 1980), ce pot fi
rezumate astfel:
50
un panel nu este un esantion cu adevarat reprezentativ pentru populatia care va fi studiata,
deoarece anumite categorii de indivizi, magazine.....nu accepta sa intre intr-un sistem
durabil de colectare a informatiilor;
caracterul repetitiv al anchetelor pentru aceeasi indivizi, institutii..... are drept
efectdeformarea comportamentului acestora si prin urmare, acesta nu mai este cu adevarat
reprezentativ pentru universul studiat.
Cat priveste colectarea datelor, metodelor traditionale de colectare li s-au alaturat o noua
tehnologie bazata pe citirea optica a codurilor. Aceasta revolutie s-a produs in Statele Unite inca
de la inceputul anilor 80; in Franta a inceput din 1986 o data cu lansarea panelului de consumatori
Scan 5000 de catre societatea Nielsen. In afara de schimbarea metodelor de lucru care s-au produs
la utilizatorii de panel, aceasta tehnologie a condus la fuzionari, absorbtii in cadrul institutelor de
studii.
Panelurile de distribuitori
Un panel de distribuitori este un esantion statistic permanent de puncte de vanzari cu amanuntul,
reprezentativ la un moment precis unui univers comercial definit, permitand urmarirea in mod
continuu si la intervale regulate a desfacerii produselor de larg consum prin intermediul diferitelor
circuite de distributie (D. Blanchard si D. Lesceux, 1995).
Acest instrument este singurul care permite cunoasterea desfacerii produselor prin intermediul
diferitelor circuite de distributie. Cu ajutorul satatisticilor furnizate, firma cunoaste livrarile zilnice,
pe referinta, pe regiune, pe vanzator si pe client.
Informatiile oferite de panel pot fi exploatate de atat la nivelul managementului superior, cat si in
cadrul fiecarui departament.
De exemplu, pentru departamentul marketing, panelurile permit:
Cunoasterea:
dimensiunii pietei si evolutiei acesteia, in toata tara si pe circuite de distributie si
regiuni;
evolutiei vanzarilor in magazine pentru marca sa si pentru marcile concurente;
cotei de piata la nivel national, pe circuite de distributie si pe regiune;
politicii practicate de concurenti la nivelul mix-ului de marketing (sortiment, pret,
promotii, ....);
dezavantajele marcii sale: de natura comerciala sau marketing;
rezultatelor obtinute de noile produse si concepte introduse recent pe piata de catre
concurenti.
Controlarea:
existentei marcii in circuitele de distributie;
aplicarea planului promotional de catre echipa de vanzari;
respectarea de catre magazine a pretului de vanzare si a suprafetei de expunere;
rentabilitatea operatiilor promotionale realizate pentru o anumita marca;
evolutia rentabilitatii concurentilor si care a fost costul cresterii cotei de piata.
51
Previzionarea:
cotei de piata;
impactul asupra vanzarilor a unei reduceri de pret, unei operatii promotionale sau
cresterea suprafetei de expunere.
In Franta exista trei mari firme care dispun de un astfel de panel: NIELSEN, IRI-SECODIP, GfK.
Panelurile NIELSEN
Printre panelurile gestionate de NIELSEN se numara SCANTRACK, panelul format din
farmacii, panelul format din tutungerii, panelul format din magazine cu aparate electrocasnice.
Panelul SCANTRACK include toate magazinele care au o spurafata de vanzare mai mare de 400
m
2
, avand cel putin un raion alimentar, cu exceptia hard discounters. Este un panel interogat
saptamanal, datele sunt colectate in fiecare saptamana cu ajutorul citiorului optic si reprezinta
volumul si valoarea vanzarilor realizate.
Panelul IRI-SECODIP
Este un panel interogat saptamanal, realizat dintr-un esantion de hyper sau super market-
uri utilizand tehnica scaning.
Panelurile GfK
Panelurile GfK sunt formate din magazine specializate in vanzarea de bunuri de folosinta
indelungata. Panelurile gestionate de GfK sunt in domeniul electrocasnic, electronic, micro-
informatica, birotica si telefonie, bricolage, optica, foto.
Panelul de consumatori
Este definit ca un esantion statistic permanent constituit din gospodarii, reprezentativ pentru
ansablul populatiei unei tari, in care sunt efectuate, in mod continuu si la intervale regulate de
timp, masuratori destinate sa evalueze achizitionarile produselor de consum curent efectuate (D.
Blanchard si D. Lesceux, 1995).
Rolul panelurilor de consumatori:
Pentru departamentul de marketing, panelul de consumatori este un complement indispensabil
celui de distriobuitori in vederea intelegerii problemelor care apar si care pot ramane, in unele
cazuri, inexplicabile.
Daca panelul de distribuitori are ca rol principal masurarea piatelor si de a evidentia punctele
comerciale forte si slabe si marketingul de marca, panelul de consumatori va oferi informatii
privind actele de cumparare ale consumatorilor.
Prin utilizarea informatiilor furnizate de panel se poate raspunde la intrebari de genul (D.
Blanchard si D. Lesceux, 1995):
cate gospodarii cumpara produse in fiecare an pe piata si aleg marca X;
care este evolutia numarului de cumparatori?
care este cantitatea pe care o cumpara si cum evolueaza procesul de re achizitionare?
piata este saturata sau are inca potential pentru atragerea de noi consumatori?
care este centrul pietei tinta si a marcii firmei?
52
cum evolueaza profilul consumatorilor firmei?
clientii firmei au imbatranit?
ultima campanie de comunicare a permis intinerirea clientilor marcii?
care sunt concurentii cei mai periculosi?
care este segmentarea pietei in ceea ce priveste consumatorii?
care sunt stimulii care influenteaza cel mai mult comportamentul de cumparare pe piata
pentru diferite marci?
clientii sunt fideli marcii, cand apeleaza la concurenti, care sunt acesti concurenti si
motivele? Etc.
Recrutarea panelurilor
Ca regula generala, principiile care sunt valabile pentru orice esantion sunt valabile si pentru panel:
definirea precisa a populatiei de referinta;
baza de sondaj adecvata;
plan de sondaj eficient;
utilizarea metodei de colectare a datelor adecvata;
alegerea metodei de redresare pertinente.
Exista insa reguli specifice care trebuie respectate, ca de exemplu:
o data ce au fost stabilite elementele constitutive, este recomandat sa nu se incerce
schimbarea acestora;
daca se cunoaste bias-ul, in cele mai multe cazuri este preferabil sa fie mentinut decat sa se
incerce corectarea sa;
regulile de intretinere a panelului trebuie sa faca obiectul unui studiu riguros inca de la
inceput.
Fara a intra in detalii, mentionam etapele necesare constituirii unui panel, dupa ce in prealabil, s-a
decis care este planul de esantionare:
selectionarea esantionului;
contactarea persoanelor selectionate si prezentarea sarcinilor pe care trebuie sa le
indeplineasca;
institutul trebuie sa aiba acordul persoanelor care vor constitui panelul si sa se asigure de
colaborarea acestora.
Asa cum se poate observa, primele trei etape nu difera de esantioanele ad hoc, apreciinduse ca
gradul de participare este comparabil cu cel obtinut pentru acestea.
Ultima etapa este specifica recrutarii panelurilor; chiar daca variaza in functie de complexitatea
sarcinilor si de timpul solicitat persoanelor incluse in panel, ratele de recrutare ale panelurilor sunt
inferioare ratelor de raspuns pentru anchetele ad hoc.
Dupa ce s-a realizat recrutarea persoanelor participante, nu este niciodata indicat sa se incarce
sarcinile care trebuie indeplinite de acestea. Daca nu se respecta acest principiu, se va obtine o rata
a abandonarilor mult mai ridicata, chiar cu ocazia primelor experiente (situatia este comparabila
cu cea in care operatorii triseaza asupra duratei chestionarului in faza de contact). Acest fapt va
costa scump institutul, va crea probleme de gestionare a panelului si va creste dificultatile pentru
mentinerea reprezentativitatii.
53
Dimensionarea dispozitivului de recrutare trebuie sa ia in consideratie sub populatiile care sunt
cel mai dificil de recrutat (datorita raritatii acestora sau dispozitiei reduse de a participa la acest
tip de studiu).
Ca urmare a ratelor reduse de recrutare si de variabilitatea ridicata a acestora in functie de
categoriile de populatie, adesea, modul de esantionare practicat este cel pe cote.
In functie de resursele disponibile si de tipul de recrutare realizat, modalitatea de contact poate fi
curierul, telefonul, face to face, on line, sau un mix de mai multe metode. De asemenea, in
alegerea modului se va tine seama si de nivelul de pregatire al persoanelor recrutate.
Gestionarea panelurilor
Recrutarea unui panel este o operatie foarte costisitoare si prin urmare, institutul trebuie sa se
asigure un un nivel cat mai ridicat cu putinta de colaborare din partea panelistilor. Continuitatea si
coerenta colectarii datelor depind de aceasta relatie de colaborare care trebuie stabilita intre cei doi
parteneri. Ea trebuie sa se bazeze pe un contract ce va fi respectat de ambele parti. Pe de alta parte
institutul va trebui sa evite sa ceara panelistilor sa efectueze sarcini care nu au fost definite cu
ocazia recrutarii si sa creaesca timpul conventit initial.
In ceea ce priveste stimulentele acordate panelistilor, acestea nu trebuie sa fie percepute ca o
remuneratie, dar nici ca fiind derizorii. Ele au scopul de a contribui la calitatea si regularitatea
colaborarii si de a incita panelistii sa prelungeasca durata relatiei. Insa stimulentele acordate nu
trebuie sa aiba legatura cu tema studiului si nici sa aiba influenta asupra modificarii
comportamentului panelistilor in cursul timpului.
Comunicarea intre institut si panelisti este, de asemenea, un element foarte important al operatiei
de gestionare. In acest sens se vor utiliza newsletters sau sit-uri internet speciale precum si
servere locate interactive sau contacte cu animatori (fata in fata sau convorbiri telefonice). Ea
poate indeplini si alte functii, ca de exemplu amintirea momentelor importante din viata
panelului si/sau poate contribui la formarea continua a panelistilor, prin ilustrarea celor mai bune
practici.
In concluzie, momentele cele mai importante in gestionarea panelurilor sunt:
definirea contractului intre cele doua parti;
acordarea de stimulente;
animarea;
frecventa solicitarilor;
modalitatile de recrutare complementara;
eliminarea din panel a persoanelor care nu raspund.
Cat priveste calitatea unui panel, aceasta este intotdeauna judecata in functie de coerenta
evolutiilor cuantificate si este puternic influentata de conformarea practicilor panelistilor la
sfaturile date de catre institut (Oliv).
Pe toata durata de viata a panelului sunt utilizate proceduri de precautie si de control foarte stricte,
ca de exemplu:
adesea, datele care sunt colectate de la o persoana care tocmai a intrat in panel nu sunt
utilizate;
practicile atipice (in raport cu media esantionului sau a istoricului individului) fac obiectul
validarii declaratiilor;
54
este verificat consumul de produse de baza, ceea ce constituie o sursa de control indirect
a datelor colectate.
Principalele paneluri care exista in Franta la ora actuala:
Panelul CONSOSCAN, creat de firma SECODIP
Pana la sfarsitul anului 1994 SECODIP utiliza doua tipuri de panel de cate 4500 gospodarii
cu ajutorul carora se studiau cumparaturile de produse alimentare, igiena, parfumerie, articole
textile si de intretinere. Aceste paneluri au fost reprezentative la nivelul gospodariilor obisnuite
din Franta, nefiind incluse si cele formate dintr-o singura persoana.
O data pe saptamana, trebuiau completate si transmise chestionarele referitoare la cumparaturile
efectuate in aceasta perioada. Pentru fiecare produs cumparat, trebuia indicata marca, cantitatea
cumparata, pretul platit si furnizorul.
Din 1995 aceste doua tipuri de panel au fost inlocuite cu panelul CONSOSCAN care este
alcatuit din 8000 de gospodarii, incluzand si pe cele formate dintr-o singura persoana. Fiecare
gospodarie este echipata cu un cititor de cod de bare care permite citirea, inregistrarea si
transmiterea codurilor de bare pentru produsele cumparate.
De asemenea, pentru fiecare act de cumparare trebuie notate locul, data, suma totala a
cumparaturilor efectuate, identificarea produselor (cu precizarea eventualelor promotii), cantitatea
si pretul.
Panelul HOMESCAN creat de firma NIELSEN
Acest panel este compus din 8000 de gospodarii care sunt echipate cu cititor de cod de
bare, functionarea sa fiind asemanatoare cu cea a panelului CONSOSCAN cu deosebirea ca
alegerea gospodariilor este facuta in primele 150 localitati reprezentative din punct de vedere al
consumului, iar in 70% din cazuri nu este necesara mentionarea pretului care este cunoscut din alte
surse.
Panelul SOFRES creat de firma SOFRES
SOFRES gestioneaza mai multe tipuri de panel, cel mai important fiind METASCOPE. Acesta
este constituit dintr-un esantion permanent de 20000 de gospodarii care este reprezentativ la
nivelul intregii tari. Acest esantion nu este insa echipat cu cititor de cod de bare, fiind consultat
lunar cu ajutorul unui chestionar auto-administrat privind cumparaturile de ceasuri, ochelari si
lentile, pneuri si alte produse. Pentru produsele care au frecventa redusa de cumparare, deoarece
este costisitor sa se trimita un chestionar detaliat la 20000 de gospodarii, SOFRES a adoptat
urmatorul principiu:
selectarea populatiei tinta;
expedierea unui chestionar gospodariilor selectionate in vederea cunoasterii detaliate a
cumparaturilor realizate.
Panelul PANELIPSOS creat de IPSOS
Firma IPSOS gestioneaza un panel foarte mare de gospodarii 30000, care face parte dintr-
un panel european, utilizandu-se o metodologie comuna. Acest panel este interogat telefonic, fata
in fata sau pe cale postala.
In Romania, dupa 1990, pentru a asigura un cadru unitar cercetarilor prin sondaj, a aparut
ideea constituirii unui esantion MASTER reprezentativ la nivelul intregii tari. Acesta poate sa fie
utilizat in cercetari complexe precum: Ancheta asupra Fortei de Munca in Gospodarii (AMIGO),
Ancheta Integrala in Gospodarii (care a fost divizata ulterior in Ancheta asupra Bugetelor de
Familie, Ancheta asupra Conditiilor de Viata, Ancheta Bugetelor de Timp, Ancheta de Sanatate),
Ancheta structurala in intreprinderi, Ancheta structurii castigurilor, Ancheta finantelor publice,
55
Ancheta transportului aerian si auto, Ancheta structurala in agricultura, Ancheta pilot referitoare la
comertul exterior, Ancheta nationala asupra activitatii copilului, Ancheta asupra formarii
profesionale continue etc.
La proiectarea Recensamantului Populatiei din 1992 (RPL 92) nu s-au luat in considerare
cerintele specifice ale utilizarii rezultatelor acestuia pentru proiectarea unei baze de sondaj
necesara anchetelor din perioada intercensitara. Prin urmare au fost necesare trei directii de
actiune:
adaptarea planului de sondaj pentru EMZOT (Esantionul Multifunctional de Zone
Teritoriale) in conditiile impuse de organizarea si desfasurarea RPL 92;
acceptarea constienta a distorsiunilor impuse de dimensiunile neomogene ale zonelor
teritoriale utilizate pentru RPL 92 (sectoare si sectii de recensamant de dimensiuni diferite
in mediul rural si urban);
cautarea metodelor pentru tratarea ulterioara a acestor distorsiuni.
In mod normal si ideal, bazele de sondaj ale anchetelor in gospodarii sunt construite dupa ce se
dispune de un prim set minim de informatii provenite din datele de recensamant. Dar proiectarea
acestora trebuie sa se realizeze in acelasi timp cu recensamantul. Proiectarea EMZOT a fost
realizata insa ulterior proiectarii RPL 92.
Au aparut distorsiuni in legatura cu structura pe medii a populatiilor statistice formate din locuinte,
gospodarii sau indivizi. Prin urmare, s-a acordat importanta gasirii metodelor de redresare a
viitoarelor esantioane pentru a compensa, pe de o parte, efectul acestor distorsiuni, iar pe de alta
parte pentru a diminua efectele non-raspunsurilor.
Prima actualizare a EMZOT s-a realizat in noiembrie 1993. Cu aceasta ocazie s-au constituit
cele 501 centre de cercetare care alcatuiesc in prezent EMZOT (252 in mediul urban si 249 in
mediul rural), cu urmatoarele caracteristici:
fiecare centru din mediul rural contine 476 de locuinte, iar din mediul urban 526 locuinte;
in fiecare centru isi desfasoara activitatea un anchetator permanent avand calitatea de
colaborator al INS;
centrele de cercetare sunt delimitate perfect in teritoriu;
centrele si locuintele permanente au atasate un cod permanent care permite aplicarea unui
sistem informatizat de gestiune, identificarea unica a aparitiilor, disparitiilor, modificarilor
de destinatie a locuintelor in limitele geografice ale centrului.
A doua si ultima actualizare a avut loc in anul 1995. Au fost folosite doua principii de creare a
centrelor de cercetare: de vecinatate si compactizare. Conform primului, suprafetele aferente
locuintelor trebuie sa aiba frontiere comune. Potrivit celui de-al doile principiu, intre locuinte nu
trebuie sa existe suprafete virane sau neocupate.
Sistemul de gestiune EMZOT este conceput ca o baza de date de tip ORACLE. Aceasta
contine informatii referitoare la numarul de gospodarii si persoane din toate cele aproximativ
250000 de locuinte din care este alcatuita.
Sistemul de gestiune este structurat astfel incat sa permita:
aplicarea planurilor de sondaj in valuri si rotationare;
evitarea suprasolicitarii gospodariilor si indivizilor prin includerea in mai multe anchete;
panelizarea unor parti ale esantioanelor pentru studii longitudinale.
Actualizarea EMZOT a fost planificata a se realiza in fiecare an, prin aceasta urmarindu-se:
determinarea distorsiunilor care ar fi putut sa apara in conditiile in care centrele sunt
fixe;
56
obtinerea informatiilor privind numarul si componenta gospodariilor si statutul
ocupational al capului gospodariei, informatii care nu sunt disponibile din alte surse
in perioada intercensitara.
Problemele corespunzatoare tehnicii panelului
Aceste probleme se datoreaza reprezentativitatii panelului si erorilor specifice introduse de
utilizarea acestei tehnici.
Erorile de reprezentativitate rezulta ca urmare a erorilor de selectie, non-raspunsurilor,
schimbarilor aparute in populatia analizata.
Eroarea de selectie apare in cazul in care gospodariile selectionate refuza sa colaboreze. Chiar
daca panelul este reprezentativ din punct de vedere socio-demografic, problema este ca nu se stie
in ce masura comportamentul subiectilor care accepta sa faca parte din panel este identic cu cel al
subiectilor care refuza, ceea ce conduce la aparitia erorii de selectie.
Non-raspunsurile
Cauzele principale ale non-raspunsurilor sunt disparitia subiectilor care constituie panelul,
abandonul acestora sau omiterea unor intrebari din chestionar, datorita rutinei sau aparitiei
fenomenului de plictiseala.
Disparitia subiectilor este datorata mortii naturale, schimbarii categoriei in care sunt
incadrati (in special in cazul firmelor), schimbarii domiciliului, solutionarea acestei probleme
depinzand in primul rand de identificarea cauzei.
Cand disparitia este datorata iesirii din campul anchetei (deces, schimbarea categoriei), pastrand
ponderile initiale si utilizand inferenta statistica, nu va fi introdusa nici o eroare in estimarea
populatiei totale.
Din contra, daca subiectii care au disparut din panel raman in campul anchetei (schimbare
domiciliu) se va realiza o operatie de reponderare.
In ceea ce priveste aparitia fenomenului de obisnuinta, acesta se datoreaza interogarii
aceluiasi subiect de mai multe ori ceea ce poate introduce erori de observatie. Pentru a limita acest
fenomen, se poate utiliza metoda rotatiei sub-esantioanelor: in functie de gradul de dificultate al
chestionarului, responsabilul anchetei determina de cate ori poate fi interogat in mod rezonabil un
subiect. Astfel, se extrag sub-esantioane si o data ce numarul de interviuri este atins pentru sub-
esantionul cel mai vechi, acesta este inlocuit cu un alt sub-esantion care este extras in aceleasi
conditii.
Erori specifice panelurilor
Se refera in special la panelurile de cosumatori care trebuie sa declare cumparaturile pe care
le-au facut in cursul unei perioade de timp:
erori datorate uitarii anumitor cumparaturi, care depind direct de marimea perioadei de
referinta (de exemplu o luna sau o saptamana; cea mai buna alegere trebuie sa aiba in
vedere natura produselor);
erori privind inregistrarea datei la care au fost realizate cumparaturile.
O eroare specifica tehnicii panelului este datorata efectului de panel si se refera la
schimbarea comportamentului datorita interviurilor repetate.
57
Acesata eroare are o inflenta directa asupra gestionarii panelurilor, in practica procedandu-se la
inlocuirea subiectilor care fac parte din panel de o perioada lunga de timp.
Estimarea dispersiei
Castigul adus de metodologia panelurilor in ceea ce priveste precizia, reiese din calculul dispersiei
(P. Ardilly, 1994):
Metoda 1
In cazul in care este utilizat un sondaj aleator simplu la doua perioade de timp succesive (1
si 2), pentru fiecare perioada extragandu-se cate un esantion, independent de la o perioada la alta,
t Y
este estimata prin media
t
y a esantionului s
t
, (
t
y este un estimator nedeplasat pentru
t Y
).
Conform proprietatilor sperantei matematice,
2 1
y y este un estimator nedeplasat pentru
2 1 Y Y
.
Utilizand proprietatile dispersiei rezulta ca ( ) ( ) ( )
2 1 1 2
V y y V y V y +
deoarece
1
y si
2
y sunt
independente.
Metoda 2
Daca la momentul t=1 se extrage un esantion s
1
care este interogat si la t=2, se calculeaza
mediile pentru acelasi esantion la cele doua momente:
1
y si
2
y .
2 1
y y este un estimator nedeplasat pentru
2 1 Y Y
, dar ( ) ( ) ( ) ( )
2 1 1 2 1 2
2 cov ; V y y V y V y y y +
,
care este mai redusa decat cea obtinuta in cadrul primei metode pentru cazul in care covarianta este
pozitiva.
In concluzie, principalele avantajele ale utilizarii tehnicii panelului sunt:
Permite urmarirea evolutiei in timp a comportamentului subiectilor sau gospodariilor;
panelurile formate din gospodarii permitand realizarea studiilor de fidelitate, studierea
fenomenelor de cumparare, ceea ce este foarte important mai ales in cazul lansarii noilor
produse.
Precizia cu care este masurata evolutia fenomenului analizat este mult mai mare.
De exemplu, pentru masurarea evolutiei cotei de piata intre doua perioade de timp,
utilizand tehnica panelului precizia estimarii acestui indicator este mai buna decat daca s-ar
utiliza doua esantioane distincte de aceeasi marime, interogate succesiv.
Deci, pentru masurarea evolutiilor in timp a unui fenomen, tehnica panelului este cea mai
buna.
Un panel este selectionat o singura data; trebuie insa sa se tina cont de eventualele operatii
de inlocuire a subiectilor. In consecinta, costurile cu selectarea esantionului corespund
numai primei etape de constituire a panelului.
In cazul panelurilor de gospodarii, in momentul recrutarii se poate administra un chestionar
foarte complex, ceea ce in cazul anchetelor asupra esantioanelor independente este destul
de dificil de realizat. Acest volum de informatii va permite cunoasterea a numerosi factori
explicativi privind comportamentele, informatii care pot fi utilizate ulterior in vederea
analizarii non-raspunsurilor.
Permite mentinerea esantioanelor de volum mare.
5. REDRESAREA (ECHILIBRAREA) ESANTIOANELOR
58
Rezultatele obtinute in urma realizarii unui sondaj pot fi imbunatatite a posteriori prin
integrarea in formulele estimatorilor a informatiilor auxiliare disponibile pentru ansamblul
populatiei.
Prin urmare, metodele de redresare constau in ponderarea indivizilor din cadrul unui esantion astfel
incat anumite variabile sa coincida cu valori externe fiabile, ca de exemplu valorile obtinute in
urma unui recensamant.
Aceasta metoda permite, de asemenea, diminuarea erorii datorata non-raspunsurilor.
In mod frecvent, redresarea este considerata ca o simpla etapa informatica, care permite se se
caleze mecanic structura esantionului in functie de cea a populatiei studiate. Aceasta sfarseste prin
a deveni o practica de machiaj a esantionului, avand drept scop sa corecteze erorile intre cotele
cerute si cele realizate. Ca orice alta faza a anchetei, rederesarea trebuie sa fie pregatita in amonte:
trebuie sa se puna intrebarile adecvate, operatia de codificare sa se realizeze in mod omogen
(exemplu: gospodarii versus indivizi...) (O. Marchese, Ipsos France, 2004).
Principiul operatiei de redresare dupa o variabila X
i
este urmatorul: fiind extras un esantion
cu ajutorul unei metode oarecare, se construieste un estimator care, utilizat pentru estimarea
adevaratului total T cunoscut pentru variabila X, conduce la estimarea parametrului T oricare ar
fi esantionul utilizat (P. Ardilly, 1994). Prin urmare, cand exista o informatie auxiliara X
i
, aceasta
trebuie utilizata in scopul obtinerii unor estimatori mai precisi.
Informatiile auxiliare pot proveni dintr-un rencensamant, dintr-o ancheta prin sondaj realizata pe
un esantion mai mare sau trebuie sa fie furnizata de un expert. Poate fi vorba, de exemplu de
structura gospodariilor in functie de diferite criterii socio-demografice: regiune, numarul de
persoane care compun gosponaria, etc,.
Aceste informatii pot fi integrate in momentul realizarii planului de sondaj si/sau a posteori prin
utilizarea unei metode de redresare obtinandu-se astfel o imbunatatire a calitatii rezultatelor.
Variabilele de redresare trebuie sa fie cat mai corelate cu putinta cu tematica studiului, in vederea
selectionarii lor fiind utilizate in mod frecvent metodele de segmentare. O alta conditie este ca
acestea sa fie putin numeroase si sa fie agregate in mod pertinent.
Alegerea metodei de redresare depinde de:
planul de sondaj;
natura variabilelor auxiliare;
tipul legaturii dintre variabila studiata si variabila (variabilele) auxiliara (auxiliare);
numarul variabilelor auxiliare disponibile.
In cazul studiilor de marketing, variabilele utilizate in mod frecvent in vederea redresarii sunt
varsta, sex, caracteristicile socio profesionale, prezenta copiilor....
Este foarte important sa se respecte conditiile (O. Marchese, Ipsos France, 2004):
sa se utilizeze date de referinta fiabile si actualizate;
daca este necesar se va redresa in mai multe etape;
sa se mentina spiritul critic in ceea ce priveste erorile de masurare comise.
Sunt cunoscute trei metode in vederea redresarii:
post-stratificarea;
estimatorul calculat sub forma de rata (coeficient);
59
regresia.
Post-stratificarea
Utilizand un sondaj aleator simplu, se extrage un esantion de marime n, iar in cadrul
esantionului sunt determinate H categorii numite post-straturi in functie de valorile uneia sau mai
multor variabile cunoscute pentru fiecare individ din cadrul esantionului.
Se presupune ca efectivul global pentru fiecare categorie h in cadrul populatiei N
h
este cunoscut.
Daca se noteaza cu
h
y media variabilei Y obtinuta pentru post-stratul h, atunci

1
H
POST
h h
h
T N y

este un estimator nedeplasat pentru T si se numeste estimatorul post-stratificat


al lui T.
Pentru estimarea mediei formula de mai sus va fi divizata prin populatia totala:

1
H
h
POST
h
h
N
Y y
N

.
Expresia obtinuta pentru

POST T
nu difera fundamental de cea corespunzatoare estimatorului
populatiei totale in cazul sondajului stratificat. Diferenta fundamentala consta in metoda de
extragere a esantionului deoarece, daca in cazul extragerii stratificate marimea esantionului n
h
in
cadrul stratului h este aleasa de statistician, in cazul post-stratificarii utilizand un sondaj aleator
simplu, marimea n
h
este aleatoare, dar va trebui sa fie respectata conditia:
1
H
h
h
n n

.
Observatie: post-stratificarea este o metoda de redresare in functie de efectivele N
h
. Din acest
motiv se numeste si metoda calarii pentru efectivele N
h
(P. Ardilly, 1994).
Comparand
h
y si

POST Y
se poate constata ca tehnica redresarii se traduce prin modificarea
ponderii initiale a sondajului. Inaintea efectuarii operatiei de redresare, ponderea este
1
i
W
n
, iar
dupa redresare
( )
1
h
i
h
N
W s
N n

daca i este in categoria h.
Tehnica post-stratificarii permite ajustarea valorilor Y aberante in loc sa se elimine indivizii
corespunzatori din cadrul esantionului, este preferabil ca acestia sa fie grupati in post-straturi, dar
va trebui sa se cunoasca ponderea lor in cadrul populatiei.
Precizia estimatorului post-stratificat pentru medie -

POST Y
in cazul unui tiraj aleator simplu, poate
fi calculata prin utilizarea relatiei:

( )
2 2
2
1 1
1 1
1
H H
h h
POST
h h
h h
N N f f
V Y S S
n N n N

_ _ _
+

, , ,

Calculul este complicat datorita faptului ca n
h
este o variabila aleatoare care se afla la numitor si nu
se cunoaste cum sa se exprime exact speranta matematica a inversului unei variabile aleatoare.
Daca se considera ca n este suficient de mare si ca N
h
/N nu este foarte mic, atunci:
( )
( )
( ) ( )
2
1 1
1
h
h h
h
V n
E
n E n
E n
_
_

+


,
,
Observatie: relatia pentru calculul dispersiei arata ca este preferabil sa se constituie post-straturi
omogene (datorita prezentei dispersiei S
h
2
).
In practica, variabila calitativa auxiliara X care permite definirea post-straturilor trebuie sa explice
cat mai bine posibil variabila Y. Din punct de vedere matematic aceasta conditie este justificata
60
datorita prezentei dispersiei S
h
2
: dispersia estimatorului este mai redusa cand Y variaza putin in
cadrul fiecarui strat. Fiecare post-start fiind alcatuit din indivizi pentru care variabila calitativa
utilizata pentru post-strtificare X ia aceeasi valoare (prin conventie), conditia ca S
h
2
sa ia valori
mici se traduce prin puterea cu care variabila X poate explica variabila Y.
Redresarea cu ajutorul estimatorului calculat sub forma de rata (coeficient)
Este vorba de un estimator care este determinat conform urmatorului principiu: fie X
i
o
variabila auxiliara cantitativa si Y
i
variabila analizata, intre cele doua variabile existand o relatie
liniara de tipul:
i i i
Y R X U +
.
R = coeficientul de proportionalitate;
U
i
= eroarea care nu poate fi controlata (nu depinde de Xi)
Relatia de mai sus poate fi aplicata pentru toti indivizii din cadrul populatiei, caz in care erorile se
compenseaza
1
0
N
i
i
U

daca si numai daca


Y
R
X
.
Daca se considera ca extragerea este aleatoare simpla si ca erorile U
i
se compenseaza intre diferiti
indivizi din cadrul esantionului, adica
( ) 0 0
i i i
i s i s
U Y RX



0
y
y Rx R
x

Relatia
0
i
i s
U

constituie o aproximatie care poate fi acceptata doar daca aceste erori sunt mici.
In acest caz

R
X
Y y
x
realizeaza o estimare rezonabila pentru
Y
.
Acest estimator (

Y
) se numeste estimatorul raport sau coeficient.
Observatie: a estima cu ajutorul unui raport inseamna deci a redresa in functie de variabila X cand
exista un esantion care nu este reprezentativ in raport cu aceasta variabila.
Fiecarui individ care face parte din esantion ii corespunde o pondere W
i
(s) care este egala
cu: ( )
1
i
X
W s
n x
deoarece ( )

R
i
i s
X
W s Yi y Y
x

.
Performantele statistice ale lui

R Y
sunt urmatoarele (in cazul unui sondaj aleator simplu):
1. Este usor deplasat; eroarea este redusa daca esantionul este mare, in cazul in care
esantionul este mic (nu poate fi precizata o valoare fara a cunoaste parametrii populatiei
ca ordin de marime, se va considera ca n este mare daca este alcatuit din cateva zeci de
indivizi)

R Y
poate fi puternic deplasat si trebuie sa fie utilizat cu prudenta.
In cazul sondajului aleator simplu:
( )
2
1
( )
X X Y
f
S S S
Deplasarea biais Y
n X X Y

_

1

,
1
]
= coeficientul de corelatie liniara intre X si Y.
Se poate observa ca eroarea este nula daca
2
X Y
X
S S Y
S X

, adica in cazul in care dreapta de


regresie trece prin origine (termenul
2
X Y
X
S S
S

fiind panta acestei drepte).
61
2. Dispersia lui

R Y
este cunoscuta cu aproximatie si numai in cazul in care n este mare. In
cazul unui sondaj aleator simplu (cand n este mare), aceasta este:

( )
( )
2
1
U
R
S
V Y f
n

S
U
2
= dispersia pentru U
i
( )
i i i
U Y R X
; unde
2 2
1
1
1
N
U i
i
S U
N


.
Estimarea dispersiei
Pentru a estima dispersia in cazul in care sondajul este aleator simplu trebuie sa se
inlocuiasca S
U
2
printr-un estimator nedeplasat s
U
2
calculat la nivelul esantionului.
Parametrul R care apare in relatia lui U
i
este inlocuit prin urmatorul estimator:

y
R
x


( )
2
2
1 1 1
1
R
i i U
i s
f y f
V Y Y X s
n n n x

Acest estimator este usor deplasat daca in relatia


i i i
Y R X U +
erorile sunt reduse si daca n
este suficient de mare.
Redresarea cu ajutorul metodei regresiei
Aceasta metoda este utilizata in cazul in care intre datele existente este o relatie de tipul
( )
i
y f x u +
, cum ar fi, de exemplu:
i i i
Y a b X U + +
.
Valorile variabilei de perturbatie U
i
trebuie sa fie mici, independente de X
i
si sa verifice relatia:
1
0
N
i
i
U

.
Consideram ca sondajul este aleator simplu, valorile pentru variabila X
i
sunt cunoscute si trebuie
estimata media
Y
.
Valorile optime pentru a si b (care minimizeaza suma patratelor pentru U
i
) sunt:
( ) ( )
( )
1
2
1
N
i i
i
N
i
X X Y Y
b
Xi X

$
$
a Y b X
$
Relatia
i i i
Y a b X U + +
trebuie sa fie vazuta ca o parametrizare a valorilor Y
i
in care se
rescrie Y
i
in functie de o constanta, de X
i
si de U
i
.
Ca si in cazul metodei precedente, deoarece sondajul este aleator simplu si erorile sunt mici si
distribuite in jurul lui 0, se poate considera ca suma acestora la nivelul tuturor indivizilor din
esantion este aproximativ nula (adica erorile se compenseaza intre ele).
Rezulta ca:
$
Y a b X +
$
si
$
y a b x +
$
( )
Y y bX bx b X x
$ $ $
Prin urmare, se poate aproxima
Y
prin

( )
Y y b X x +
$
.
In acest stadiu,
b
$
nu este cunoscut si deci trebuie sa fie estimat. Un estimator logic pentru
b
$
este
obtinut prin inlocuirea expresiilor la nivelul populatiei (necunoscute) prin expresiile similare
calculate la nivel de esantion:
62
( )( )
( )
2
1
i i
i s
N
i
X x Y y
b
Xi x

$
$
$
$
a y b x
$
$
Estimatorul global pentru
Y
este:

( )
REG Y y b X x +
$
$
- estimatorul obtinut cu ajutorul regresiei.

REG Y
este un estimator liniar, adica de tipul:
( )
i i
i s
W s Y

, fiecare individ fiind ponderat prin


W
i
(s). Se poate scrie ca:

( )
( ) REG
i i
i s
Y y b X x W s Y

$
$
( )
( )
( )
( )
2
1 i
i
i s
X x
Wi s X x
n
X x

Estimarea preciziei
Performantele statistice ale estimatorului

REG Y
sunt urmatoarele:
1. Este usor deplasat in cazul esantioanelor mari (n 30); (pentru esantioane mici exista
riscul obtinerii unor estimari mediocre).
2. In cazul in care esantionul este mare, dispersia poate fi determinata conform relatiei:

( )
2
1
REG
U
f
V Y S
n

, unde
2 2
1
1
1
N
U i
i
S U
N


.
$
i i i
U Y a b X
$
De altfel, este demonstrat ca: ( )
2 2 2
1
U
S S
, unde
( ) ( )
( ) ( )
1
2 2
1 1
N
i i
i
N N
i i
i i
X X Y Y
X X Y Y


= coeficientul de corelatie liniara intre X si Y, [ ]
1;1
.
Utilizand relatia de mai sus in calculul dispersiei se obtine:

( )
( ) ( )
2
1 REG V Y V y
Observatie: daca sondajul este aleator simplu, atunci

( )
( )
0 REG V Y V y
si prin urmare se
prefera sa se utilizeze

REG Y
in loc de y in cazul in care esantionul este mare. Avantajul utilizarii
lui

REG Y
depinde de factorul
2
1 .
In cazul in care intre X si Y nu exista o legatura liniara de tipul Y a b X + (adica erorile U
i
sunt
mari sau foarte mari) atunci
2
va avea o valoare redusa, apropiata de 0 in acest caz nu este
avantajos sa se utilizeze

REG Y
.
Estimarea dispersiei S
U
2
se realizeaza plecand de la dispersia erorilor in cadrul esantionului.
Deoarece intervin parametrii necunoscuti
$
a
si
b
$
, erorile U
i
sunt estimate conform relatiei:
$
$
i
i i
U Y a b X
$
$
; cu

0 i
i s
U

.
Rezulta ca

( )
$
$
( )
2
1 1
1
REG
i i
i s
f
V Y Y a b X
n n


$
$
.
Utilizand aceasta relatie se pot construi intervale de incredere pentru
Y
.
63
Concluzii:
Toate metodele de redresare pot fi considerate ca un caz particular al urmatoarei probleme:
ca urmare a extragerii unui esantion s printr-o metoda oarecare, se dispune de o variabila de
ponderare pentru fiecare individ k, notata cu d
k
. De altfel, se cunoaste o variabila auxiliara
X
k
pentru fiecare individ k din cadrul populatiei
1
N
k
k
X X

.
Scopul procedurii este de a determina o noua variabila de ponderare pentru k, notata cu W
k
,
care permite estimarea perfecta a totalului X.
Prin urmare,
( )
k k
k s
d X X

si se urmareste ca, pentru orice esantion s,


( )
k k
k s
W X X

(P. Ardilly, 1994).


Redresarea este indispensabila in vederea corectarii erorilor de non observare si
standardizarii de structuri in scopul realizarii de comparatii.
Redresarea nu poate corecta erorile de masurare (declaratii de venituri...).
Redresarea poate creste biais-urile (O. Marchese, Ipsos France, 2004).
6. ALEGEREA UNEI METODE DE SONDAJ
In practica, aceasta alegere depinde de deciziile luate in diferite faze de elaborare a
anchetei, cei mai importanti factori de influenta fiind:
obiectivele anchetei;
natura populatiei studiate;
bugetul disponibil;
modul de administrare al chestionarului.
Obiectivele anchetei
Alegerea unei metode de sondaj rezulta dintr-un compromis care permite satisfacerea
obiectivelor anchetei la cel mai bun cost si in termenele stabilite.
Tipul de sondaj ales depinde deci de scopurile economice asociate rezultatelor anchetei.
Este important sa se stabileasca de la inceput daca rezultatele anchetei au ca scop descrierea
anumitor sub-grupe din cadrul populatiei, caz in care este necesar ca acestea sa aiba o pondere mai
mare in esantion. Definirea planului de sondaj este relativ simpla in cazul in care se studiaza o
singura variabila, insa in practica, este un caz exceptional, predominante fiind anchetele multi-
obiectiv.
Natura populatiei studiate
Daca populatia studiata este foarte dispersata din punct de vedere geografic si daca
interviul se realizeaza la domiciliu, din cauza costurilor ridicate cu deplasarea operatorilor, este
practic imposibila realizarea acestor interviuri la nivelul intregului teritoriu. Acestea vor fi
concentrate numai intr-un anumit numar de judete. Se va opta deci pentru un sondaj in doua faze
dupa ce in prealabil a fost realizata stratificarea judetelor. Studierea populatiilor rare se
realizeaza cu dificultate si cu costuri foarte mari.
64
Pentru a utiliza o metoda aleatoare de sondaj, este indispensabila existenta unei baze de date. Daca
nu exista o astfel de lista va trebui sa se utilizeze metodele empirice.
De exemplu, in cazul studierii clientelei unui centru comercial vor trebui esantionate locurile si
orele la care se realizeaza ancheta pentru a se tine seama de variatiile aparute in cadrul clientelei si
de frecventele in cursul timpului.
Bugetul disponibil
In practica, frecvent, marimea esantionului este determinata ca raport intre bugetul
disponibil si costul unitar al anchetei.
De exemplu, in cazul a doua anchete succesive care au ca scop evidentierea evolutiei ponderii de
satisfactie, daca marimea esantionului ales este mica nu se vor putea evidentia corect evolutiile
inregistrate. Planul de sondaj si marimea esantionului trebuie deci alese luand in considerare,
simultan, obiectivele anchetei (Care este precizia dorita? Se doreste descrierea intregii populatii
dar si a sub-populatiilor?) si restrictiile materiale (bugetul disponibil, termenul de realizare).
Modul de administrare al chestionarului
Metoda de esantionare nu va fi aceeasi daca, de exemplu, ancheta se realizeaza telefonic
sau daca se realizeaza la nivelul intregului teritoriu prin interviuri fata in fata la domiciliu
subiectului. In acest caz, gestionarea costurilor impune concentrarea interviurilor intr-un anumit
numar de puncte de ancheta.
In concluzie, alegerea unei metode de sondaj nu reprezinta decat o etapa in elaborarea unei
anchete si este dependenta de toate componentele acesteia.
7. SURSE DE EROARE IN CADRUL SONDAJELOR
Daca rezultatele sondajului vor fi sau nu reprezentative pentru intreaga populatie, acest
lucru va depinde, in primul rand, de erorile introduse prin procedeul de sondaj ales.
Pentru ca rezultatele sa fie utilizabile, trebuie ca aceste erori sa fie cat mai mici, cu atat mai mult
cu cat, chiar pentru un sondaj corect realizat, rezultatele obtinute nu pot reprezenta decat cu o
oarecare aproximatie parametrii intregii populatii.
Valoarea estimata a parametrului analizat este diferita de valoarea adevarata (necunoscuta)
datorita a doua mari grupe de erori:
a) erori specifice sondajului:
erori de reprezentativitate;
erori de esantionare;
erori datorate non-raspunsurilor.
b) erori de observare sau de masurare (comune tuturor tipurilor de observari) - provin din
abaterile intre raspunsurile furnizate de persoanele intervievate si adevaratele valori.
Acest tip de erori pot apare datorita operatorilor, chestionarului utilizat, subiectilor
investigati.
O eroare relativa mai mica de 5% permite sa se aprecieze ca sondajul este reprezentativ si ofera o
imagine fidela a realitatii.
Din punct de vedere teoretic, eroarea de sondaj poate fi redusa oricat de mult, dar acest lucru
implica o crestere a dimensiunii esantionului, pana la limita intregii populatii, insa in acest caz
65
dispar avantajele sondajului. Prin urmare, dimensionarea erorii este o problema a proiectarii
sondajului si depinde de stabilirea unui compromis acceptabil intre nivelul erorii si costul
marimii esantionului.
Erorile de reprezentativitate
Acest tip de erori sunt datorate unei baze de sondaj incomplete sau restrictiilor in realizarea
anchetei. O baza de sondaj incompleta genereaza deci o acoperire necorespunzatoare a
populatiei, in acest caz existand, inca de la inceput, o abatere care nu poate fi masurata. In cazul
anchetelor telefonice, pentru a extrage un esantion, sunt utilizate in mod frecvent listele de abonati,
insa exista si abonati care nu doresc sa li se publice numarul de telefon in aceste liste.
Nereprezentativitatea poate fi, de asemenea, o consecinta directa a imbatranirii sau a
modificarii structurii reale a populatiei. De exemplu, in situatia in care se doreste sa se realizeze
esantionarea gospodariilor utilizand listele disponibile la momentul t (liste care contin adresele
gospodariilor dar si adresele magazinelor, cabinete medicale....) va trebui ca in cadrul acestora sa
se elimine tot ceea ce nu este gospodarie. Acest lucru va introduce o eroare de reprezentativitate la
momentul t+1, deoarece exista posibilitatea ca anumite locuinte dintre cele care au fost eliminate la
momentul t sa isi schimbe statutul in intervalul [t; t+1] devenind gospodarii (P. Ardilly, 1994).
Erorile de reprezentativitate specifice sondajului pot fi de doua feluri:
erori sistematice;
erori intamplatoare.
Principalele cauze care conduc la aparitia erorilor sistematice sunt:
alegerea deliberata a unor date considerate in mod eronat ca fiind reprezentative;
alegerea la nimereala a elementelor sondajului;
dorinta statisticianului de a obtine un anumit rezultat;
substituirea unei unitati de cercetare prin alta ce ofera o mai mare comoditate in obtinerea
datelor;
cuprinderea incompleta in sondaj a unitatilor de cercetare.
Erorile intamplatoare, spre deosebire de cele sistematice, apar in insasi procesul sondajului, ele
producandu-se chiar daca se respecta principiile teoriei selectiei, deoarece esantionul nu reproduce
decat cu o oarecare aproximatie distributia variabilelor populatiei. Prin urmare, media sau oricare
alta valoare a esantionului va prezenta anumite abateri fata de parametrii populatiei analizate. Desi
nu pot fi evitate cu ajutorul unor procedee statistice, erorile de reprezentativitate pot fi calculate
anticipat in cazul in care sondajul este probabilistic.
Eroarea de reprezentativitate este dependenta de (O. Marchese, Ipsos France, 2004):
proportia populatiei neacoperite de baza de sondaj;
diferenta in cadrul variabilei studiate intre baza de sondaj (frame population) si ansamblul
unitatilor studiate (target population).

( )
nc
c c nc
N
Y Y Y Y
N
+ ,
unde:
Y = valoarea a N unitati incluse in target population;
66
Y
c
= valoarea celor Nc unitati acoperite de baza de sondaj;
Y
nc
= valoarea celor Nnc neacoperite de baza de sondaj.
La verificarea reprezentativitatii esantionului se pleaca de la compararea structurii pe grupe
a esantionului sau a populatiei denumita si structura programata. In cazul in care aceste structuri nu
difera cu mai mult de 5% se accepta faptul ca esantionul constituit este reprezentativ.
Observatie: eroarea de reprezentativitate (O. Marchese, Ipsos France, 2004):
este dependenta de variabila studiata;
nu este o proprietate a esantionului.
Erorile de esantionare
Sondajul este caracterizat printr-o eroare de esantionare care poate fi cuantificata prin
biais, dispersie si prin eroarea medie patratica si care se reflecta in existenta unei legi pentru
estimatorul obtinut. Acestui tip de erori i se pot asimila erorile care rezulta din imperfectiunile ce
exista in baza de date, cum ar fi prezenta dublelor inregistrari si a imbatranirii informatiilor
auxiliare.
Estimatorii calculati, a caror formula nu tine cont de aceste distorsiuni, sunt pe de o parte
eronati, in cazul in care in baza de date exista duble inregistrari sau daca informatia auxiliara face
parte din formula estimatorului (pentru redresare s-a folosit o informatie depasita), iar pe de alta
parte suporta o pierdere de eficacitate deoarece optimizarea planului de sondaj este gandita in
functie de o structura care nu mai este de actualitate.
Eroarea de esantionare exista practic in toate tipurile de sondajele, ea este nula doar in cazul
recensamintelor.
Non-raspunsurile
In teorie, statisticienii, folosind tehnicile de sondaj si putin fler pot constitui un esantion
care sa aiba precizia ceruta si permisa de bugetul alocat, cu conditia ca, toti cei care fac parte din
esantion sa poata fi gasiti si sa accepte sa raspunda la intrebarile din chestionar.
Non-raspunsul este insa o problema de care nici un investigator al colectivitatilor umane nu poate
scapa; aceste colectivitati nu se afla sub controlul sau si intotdeauna vor exista persoane care nu
vor sa raspunda, care nu se afla la domiciliu etc.
Prezenta non-raspunsurilor are drept efect, pe de o parte, imposibilitatea observarii valorii
variabilei analizate, iar pe de alta parte, antreneaza un biais non-masurabil deoarece nu se stie daca
unitatile observate sunt comparabile cu cele non-observate.
In cadrul problemelor datorate non-raspunsurilor trebuie sa se faca distinctie intre:
non-raspunsurile partiale la anumite intrebari din chestionar;
non-raspunsurile totale, care pot fi cauzate de:
absenta de la domiciliu in orice esantion pot fi cuprinse persoane a caror
absenta de la domiciliu este atat de indelungata, incat orice repetare a vizitei
operatorului ar fi inutila;
67
incapacitatea de a participa la ancheta (de exemplu in cadrul unor anchete
desfasurate de companiile aeriene nu toti pasagerii cunosc limba in care este
redactat chestionarul);
refuzul de a coopera;
schimbari de adrese, aceste situatii pot aparea chiar daca baza de sondaj a fost
alcatuita destul de recent.
Non-raspunsurile se diferentiaza de erorile de reprezentativitate datorita faptului ca
amploarea lor poate fi masurata plecand de la esantionul extras, in timp ce marimea erorii de
reprezentativitate nu este in mod necesar masurabila: putem fi constienti de absenta anumitor
indivizi din baza de sondaj, fara a stii insa care sunt acestia si in ce numar.
Observatie: o pondere redusa a non-raspunsurilor poate fi foarte periculoasa daca
persoanele care raspund si cele care refuza sa raspunda au comportamente foarte diferite in ceea ce
priveste temele anchetei; si invers, o pondere ridicata a non-raspunsurilor nu este foarte grava in
cazul in care comportamentele acestora sunt asemanatoare.
Ajustarea non-raspunsurilor
Ponderea non-raspunsurilor definita ca raport intre numarul non-raspunsurilor si numarul
total al indivizilor intervievati variaza de la o ancheta la alta.
Fiecare tip de non-raspuns necesita o tehnica specifica de corectie: metodele de reponderare sunt
utilizate cu precadere pentru compensarea non-raspunsurilor totale in timp ce pentru non-
raspunsurile partiale sunt utilizate metodele de imputare.
Oricare ar fi tipul non-raspunsurilor (totale sau partiale) pentru o variabila Y, in practica, acestea
implica:
diminuarea preciziei estimatorilor;
aparitia erorilor.
Existenta non-raspunsurilor conduce la aparitia urmatoarei probleme: aplicand formulele
obisnuite pentru respondenti, estimatorii obtinuti sunt deplasati (sub-estimeaza sau supra-estimeaza
valorile reale), cu exceptia cazului in care persoanele care nu raspund au un comportament identic
cu cele care raspund. Insa in realitate acest lucru este practic imposibil.
Pentru ajustarea non-raspunsurilor se poate considera ca fiecare individ din cadrul esantionului
are doua atitudini fata de o intrebare: de a raspunde sau nu, fiecare din aceste decizii avand o
anumita probabilitate. Conform teoriei sondajului, eroarea nu este nula decat intr-un singur caz
ideal dar irealist: atunci cand fiecare individ i din cadrul populatiei are o probabilitate de raspuns
R
i
care sa fie strict pozitiva si cunoscuta de statistician.
Estimatorul nedeplasat pentru T este:
i
R
i r
i i
Y
T
P R

.
P
i
= probabilitatea de includere a individului i in esantionul s;
r = indivizii care au raspuns .respondentii).
Daca se accepta ipoteza existentei a doua straturi (unul constituit din respondenti iar celalalt din
non-respondenti), atunci estimatorul

R T
este deplasat:
( )
r nr
N r
Deplasarea Y Y
N


unde:
r Y
= media variabilei Y pentru respondenti;
nr Y
= media variabilei Y pentru non-respondentii potentiali.
68
In prezenta non-raspunsurilor, estimatorii sunt mai putin precisi deoarece in cadrul
formulelor intervine marimea esantionului respondentilor. Prin urmare, este indicat, in masura in
care este posibil, sa se anticipeze ponderea non-raspunsurilor si sa se mareasca, in consecinta,
esantionul. Aceasta ajustare creste precizia, insa nu elimina eroarea introdusa de prezenta non-
raspunsurilor.
Pentru diminuarea erorii introduse de non-raspunsuri exista doua tehnici (metode):
reponderarea respondentilor in scopul compensarii existentei non-raspunsurilor totale se
va creste ponderea respondentilor;
imputarea non-raspunsurilor partiale acestea sunt inlocuite prin una sau mai multe valori
plauzibile.
Metoda de reponderare
Obiectivul acestei metode este de a permite nu numai o inferenta directa de la esantion la
populatia totala, ci o inferenta in doua etape:
prima etapa inferenta de la esantionul alcatuit din respondenti la esantionul total (in
aceasta etapa se presupune ca probabilitatea R
i
este diferita de zero);
a doua etapa inferenta de la esantionul s la populatia studiata, obtinuta cu ajutorul
probabilitatii P
i
(in aceasta etapa probabilitatea P
i
este diferita de zero).
Estimari
Adoptand ca model existenta unei probabilitati de raspuns comuna pentru toti indivizii
din cadrul populatiei, in conditiile in care s este extras printr-un sondaj aleator simplu, se poate
estima media
Y
cu ajutorul estimatorului mediei calculata pentru esantionul format din
respondenti -
r
y :


1 1 R
i i
R
i r i r
i i
Y Y T
Y
n
N N R P N
N



.
Estimand ca raport intre marimea esantionului respondentilor si marimea totala a esantionului
m/n se obtine:

1 1
i
R
i R
i r i r
Y
Y Y y
n m
N m
N n


Astfel, daca fiecarui individ din cadrul populatiei i se atribuie aceeasi probabilitate de a
raspunde, reponderarea conduce la estimarea mediei
Y
cu ajutorul mediei respondentilor din
cadrul esantionului. In acest caz, considerat ideal, pentru calculul sperantei matematice, se
considera ca esantionul respondentilor este un sub-esantion in s, obtinut prin sondaj aleator simplu.
Aceasta proprietate arata ca media respondentilor este un bun estimator pentru adevatata medie:
( )
R
E y y
si cum ( )
E y Y
in final rezulta ca ( )
R
E y Y
.
In practica exista insa un decalaj intre ipoteza introdusa de statistician (probabilitate constanta
diferita de zero ) si realitate:
( )
1
( )
i
i R
i s
n R
Deplasarea biais E y y Y y
n r

_


,

Calculul dispersiei
Se poate considera ca procesul extragerii esantionului constituit din respondenti rezulta din
urmatoarea succesiune de operatii: extragerea esantionului s cu ajutorul unui sondaj aleator simplu,
69
post-stratificarea in h categorii in cadrul carora raspunsurile sunt omogene conform probabilitatii
de raspuns
h
, extragerea Bernoulli in cadrul esantionului s, cu probabilitatea de includere
h
.
Pentru

,
1
H
R
h h R
h
N
T n y
n

_


,

si

,
1
H
POST
h h R
h
T N y

( )
2 2
2 2
2
1 1
1 1
H H
h h
h h
POST
h h
h h h
h h
S S m m
V T N N
N n m
m
_ _
+

, ,

si

( )

( ) ( )

( )
1
H
R POST h POST
h
h
N
V T V T N Y Y V T
n

+ >

,
unde
h
h
h
N
m n
N
.
h

= probabilitatea de a raspunde pentru oricare individ din categoria h (probabilitate necunoscuta,


dar estimata prin m
h
/n
h
).
Observatie: precizia estimarii depinde direct de dispersia variabilei Y
i
in cadrul grupelor formate
din raspunsuri omogene.
Metoda imputarii
Metoda imputarii este o metoda empirica care este frecvent utilizata in vederea eliminarii
non-raspunsurilor partiale.
Aceasta metoda consta in estimarea valorii necunoscute pentru variabila Y
i
corespunzatoare
fiecarui non-respondent printr-o valoare pertinenta Y
i
*
.
Determinarea valorii Y
i
*
se realizeaza cu ajutorul ipotezei privind comportamentul indivizilor care
consta in corelarea valorii Y
i
cu o informatie auxiliara X
i
cunoscuta. Astfel, daca se cunoaste
valoarea X
i
pentru non-respondent se poate utiliza modelul pentru a estima adevarata valoare Y
i
care il caracterizeaza. Aceast lucru nu este admis decat daca legatura dintre Y
i
si X
i
pentru
respondenti este valabila si pentru non-respondenti.
In practica, aceasta metoda este considerata delicata, evitandu-se utilizarea sa in cazul in care
ponderea non-raspunsurilor este mai mare de 40%.
Avantajul sau consta in faptul ca matricea care contine indivizii si variabilele este
completa, ceea ce permite tratarea datelor imputate ca date reale.
Principalul inconvenient este ca poate conduce la o subevaluare semnificativa a dispersiei
estimatorilor construiti.
Odata realizata aceasta operatie, se pot utiliza estimatorii clasici care au fost prezentati
anterior ( in functie de metoda de tiraj utilizata). Este suficient sa fie construiti plecand de la
valorile colectate pentru Y
i
corespunzatoare respondentilor sau de la valorile imputate Y
i
*
pentru
non-respondenti.
Principalele metode utilizate sunt:
a) Metoda deductiva
Informatiile care lipsesc sunt deduse din raspunsurile date de individ la celelalte intrebari.
Acest tip de imputare este frecvent utilizat pentru corectarea datelor nevalide.
De exemplu un individ de 14 ani a declarat ca este de profesie medic. Corecta deductiva consa in
a-l clasifica ca fiind inactiv profesional.
b) Imputarea cu ajutorul mediei
70
Consta in inlocuirea non-raspunsului de la pozitia (i,j) cu media raspunsurilor care au fost
obtinute la intrebarea j.
In acest model

Y
este un estimator nedeplasat pentru
Y
. Prin constructie, media calculata pentru
respondenti este identica cu cea calculata pentru ansamblul datelor:
r Y Y
.
c) Hot-deck
Imputarea cu ajutorul acestei metode se bazeaza pe conceptul de donator. Non-
raspunsurile partiale sunt inlocuite printr-o valoare observata corespunzatoare unui respondent care
poate fi ales in mod aleator. Altfel spus, daca i este non-respondent si j respondent si X
i
= X
j
,
atunci se poate considera ca Y
i
este asemanator cu Y
j
. Aceasta metoda poate fi aplicata numai daca
X explica bine variabila Y.
Exista mai multe variante:
c.1) Metoda hot-deck aleatoare cu revenire
Respondentul ale carui observatii vor fi utilizate este ales printr-un sondaj aleator cu
revenire. Dispersia estimatorului astfel obtinut este:

( )
2
2
1 1 1
/ 1 1
r S
V Y r S
r N r n n
_ _ _
+

, , ,
Acest indicator este format din doi termeni: primul termen reprezinta dispersia
corespunzatoare respondentilor, al doilea termen corespunde operatiei de imputare.
Disperia obtinuta ca urmare a utilizarii acestei metode este mai mare decat cea obtinuta prin
metoda imputarii cu ajutorul mediei.
c.2) Metoda hot-deck aleatoare fara revenire
Respondentul ale carui observatii vor fi utilizate este ales printr-un sondaj aleator fara
revenire.
Dispersia estimatorului astfel obtinut este:

( )
( )
2
2
2
2
1 1
/ 1
n r
n r S
V Y r S
r N n r n r


_ _
+

, ,
Aceasta expresie este formata din doi termeni: primul termen reprezinta dispersia datorata
respondentilor, al doilea termen rezulta din operatia de imputare.
Observatie: dispersia care rezulta ca urmare a utilizarii operatiei de imputare este mai mica in cazul
metodei hot-deck fara revenire decat cea care rezulta din metoda hot-deck cu revenire.
d) Cold-deck
In acest caz non-raspunsurile sunt inlocuite cu date care provin din alte surse decat sondajul
curent.
Concluzii:
Utilizarea tehnicilor de imputare depaseste cadrul metodelor de sondaj deoarece sunt
utilizate de fiecare data cand trebuie inlocuite non-raspunsurile din cadrul fisierelor printr-o
valoare reala in scopul exploatarii acestor fisiere.
Aceste tehnici pot servi si pentru inlocuirea valorilor aberante prin valori rezonabile.
71
In ceea ce priveste alegerea metodei de ajustare a non-raspunsurilor, trebuie sa se aibe in
vedere informatiile disponibile, ipotezele care trebuie formulate, precum si numarul variabilelor
considerate:
In cazul in care exista o variabila auxiliara X cunoscuta pentru fiecare individ din cadrul
esantionului (s), X si Y fiind corelate, se prefera sa se utilizeze tehnica imputarii se vor
determina parametrii relatiei de corelatie si se considera ipoteza conform careia aceasta
relatie intre X si Y este aceeasi atat pentru respondenti cat si pentru non-respondenti. Daca
se cunoaste X pentru fiecare non-respondent atunci se poate estima Y cu o precizie mai
mare utilizand aceasta tehnica decat tehnica reponderarii (care presupune estimarea
probabilitatii de raspuns R
i
, operatie dificil de realizat). Esantionul extras initial este
divizat in doua parti: respondentii, pentru care se cunoaste Y
i
si non-respondentii, pentru
care se obtin valorile estimate Y
i
*
cu ajutorul modelului de imputare, valori care sunt
aproximativ egale cu valorile reale Y
i
. Dezavantajul acestei metode este ca imputarea
trebuie realizata pentru fiecare variabila Y, ceea ce in practica este foarte dificil de realizat
in cazul anchetelor multicriteriu. Pentru non-raspunsurile partiale imputarea este utilizata in
mod frecvent cu succes deoarece in cele mai multe cazuri variabila Y este frecvent corelata
cu alte variabile cunoscute la nivel individual pentru non-respondenti.
Daca nu exista nici o informatie suplimentara X, este recomandata metoda reponderarii.
Aceasta metoda este foarte utila deoarece pentru non-raspunsurile totale probabilitatea R
i
nu depinde de variabila Y considerata si in practica, in cazul anchetelor multicriteriu,
calculul nu este realizat decat o singura data.
Situatiile frecvent intalnite in ajustarea non-raspunsurilor pot fi sintetizate astfel:
Sursa: Les techniques de sondages, P Ardilly, Editions Technip, Paris, 1994
Cea mai buna metoda pentru diminuarea numarului non-raspunsurilor este de a incerca de
mai multe ori contactarea persoanelor in cauza. O ancheta bine conceputa trebuie sa ia in calcul 3
sau 4 incercari de a intervieva acesti indivizi. In acest caz, vor fi marcate chestionarele astfel
completate pentru a putea izola aceste grupe de indivizi in scopul studierii comportamentului
acestora si compararii cu persoanele care au raspuns la prima incercare. O astfel de abordare
72
Raspunsuri partiale + informatii
auxiliare disponibile
Non-raspunsuri totale si nu sunt
disponibile informatii auxiliare
Y
1
Y
2
Respondenti
Imputare utilizand X
si Y
1
Imputare utilizand X
sau reponderare
Reponderare
Non-raspunsuri totale +
informatii auxiliare disponibile
Y X
permite studierea legaturii dintre variabila analizata si numarul de incercari si utilizarea acestei
informatii suplimentare pentru realizarea operatiei de redresare.
Erorile de masurare
Erorile de observare sau de masurare provin din faptul ca valoarea obtinuta cu ajutorul
anchetei realizate poate fi o valoare Y
i
*
diferita, uneori chiar foarte diferita, de valoarea
adevarata Y
i
care este asociata subiectului i. Acest tip de erori provin in mod frecvent din faptul ca
chestionarul contine intrebari sensibile care nu pot fi evitate in cazul anchetelor referitoare la
subiecte cum ar fi veniturile, consumul de droguri, sexualitate, etc.
In cadrul acestor anchete, eroarea de observare este introdusa in mod voluntar de catre subiect.
Exista insa si alte cauze care permit aparitia acestui tip de eroare, cum ar fi:
existenta unor intrebari care fac apel la memoria persoanei investigate; se stie ca in cazul
anchetelor referitoare la consumul gospodariilor, exista aproape intotdeauna tendinta de a
sub-estima consumul bunurilor care au pret redus si de a supra-estima consumul de bunuri
cu preturi ridicate.
erori introduse de catre operatori care interpreteaza intrebarile si sufla raspunsul
persoanei anchetate;
erori care provin din editarea necorespunzatoare a chestionarului;
erori de codificare, este cazul intrebarilor deschise (de exemplu intrebarile referitoare la
profesie sunt in general surse de erori);
erori datorate programelor informatice utilizate;
neantelegerea intrebarilor de catre persoana intervievata (persoane in varsta, straini,
persoane handicapate...sau pur si simplu intrebarea nu este formulata corect) precum si
ordinea acestora in cadrul chestionarului sau ordinea variantelor de raspuns;
individul din cadrul esantionului a fost inlocuit, in mod voluntar sau din greseala, cu un alt
individ;
aparitia oboselii datorita duratei interviului;
alte cauze datorate asa numitului efect operator: sex, varsta, maniera de a se prezenta a
acestuia .... au consecinte asupra calitatii raspunsurilor obtinute.
Pentru a minimiza aceste erori trebuie sa se insiste pe o buna instruire a operatorilor, sa se
realizeze un test prealabil al chestionarului in vederea eliminarii eventualelor intrebari
ambigue.
De asemenea, trebuie sa se efectueze un control al operatorilor, sa se recontacteze persoana
anchetata in cazul in care exista raspunsuri incoerente.
Printre aspectele care deterimina erorile de observare se pot evidentia varsta persoanei
anchetate, activitatea sa, mediul sau de viata, aspecte care inflenteaza calitatea raspunsurilor
obtinute.
Concluzii:
Erorile care au fost prezentate pot fi legate unele de altele, de exemplu din dorinta de a
reduce cat mai mult non raspunsurile se pot amplifica erorile de masurare.
In general, se fac eforturi de modelare pentru eroarea de esantionare si pentru non
raspunsuri.
Frecvent, se cunoaste foarte putin, sau in unele situatii nu se stie nimic, despre erorile de
observare si cele de esantionare.
73
Eforturile care vizeaza imbunatatirea unei metode de tiraj sau formula unui estimator
pentru cresterea preciziei pot fi iluzorii daca erorile de observare, de reprezentativitate si
non raspunsurile sunt importante.
Teoria statistica ofera instrumentele necesare pentru a masura si a reduce erorile, arta
operatorului consta in a judeca importanta non masurabilului/
Practica aceastei arte solicita intelegerea:
- Cauzelor care sunt la originea acestor erori;
- Importanta acestora;
- Efectele generalizate
- Costurilor relative eforturilor de reducere a erorilor.
Judecarea importantei non masurabilului este o arta care nu trebuie transformata in
alibi pentru a inceta orice efort de modelare si de masurare a erorilor.
8. ELABORAREA CHESTIONARULUI
Alegerea metodologiei de studiu depinde esential de obiectivul cercetarii; distinctia clasica
intre metodele calitative si cele cantitative bazandu-se pe marimea esantionului.
O ancheta cuprinde trei elemente principale:
chestionarul, care constituie instrumentul de masura;
acesta se aplica la un esantion;
cu care se comunica printr-un mijloc de culegere a informatiilor.
Desi uneori sunt neglijate deoarece nu pot fi estimate prin procedee statistice, erorile care
provin din neantelegerea intrebarilor de catre subiect sau din faptul ca modul in care a fost
formulata intrebarea influenteaza raspunsul, sunt tot atat de importante ca si erorile de esantionare.
Pana in prezent nu se cunoaste o metodologie precisa pentru elaborarea unui bun chestionar,
experienta jucand in acest caz un rol esential.
Procesul de elaborare a chestionarului
Procedura generala pentru realizarea chestionarului anchetei consta in parcurgerea
urmatoarelor faze:
definirea informatiilor necesare;
definirea tipului de intrebari;
numarul si ordinea intrebarilor;
redactarea proiectului chestionarului.
Definirea informatiilor necesare
In mod frecvent exista tentatia sa se includa in chestionar intrebari despre subiecte care nu
au legatura cu obiectivul principal al studiului.
Existenta intrebarilor marginale poate avea influente negative asupra persoanelor intervievate
(diminuarea interesului, provocarea oboselii, etc.) si deci sa afecteze calitatea ansamblului
informatiilor.
Definirea corecta a informatiilor necesare presupune ca a fost realizata o analiza precisa a scopului
si ca au fost formulate ipotezele anchetei.
74
O buna modalitate de a verifica ca nu au fost incluse in chestionar intrebari inutile este de a
gandi prelucrarea informatiilor inainte de realizarea propriu-zisa a interviurilor. In acest mod se
pot depista si posibilele incompatibilitati intre codificare si planul de prelucrare prevazut.
In concluzie, pentru a incepe elaborarea chestionarului trebuie sa se respecte principiul urmator:
daca o intrebare nu poate fi asocia unui obiectiv din planul de sondaj, atunci aceasta intrebare
trebuie sa fie reformulata sau eliminata.
Definirea tipului de intrebari
Se poate considera ca elaborarea unui chestionar este operatia de transpunere a intrebarilor
pe care le are cercetatorul cu privire la problema care face obiectul sondajului.
Aceeasi intrebare poate fi formulata in mai multe feluri (de exemplu intrebari deschise sau
inchise), alegerea formatului fiind influentata de modul de comunicare cu persoana interogata.
Numarul si ordinea intrebarilor
Numarul intrebarilor continute in chestionar determina durata discutiei cu persoana
interogata.
Trebuie insa sa se faca un compromis intre dorinta de a obtine informatii cat mai detaliate si
evitarea obosirii persoanei intervievate.
Numarul de intrebari va depinde in principal de doi factori:
locul in care se realizeaza interviul este posibil sa se includa mai multe intrebari in cazul
in care interviul se realizeaza la domiciliul respondentului decat daca se efectueaza, de
exemplu, la iesirea dintr-un magazin;
subiectul studiat respondentul va fi mult mai dispus sa consacre timp daca subiectul
interviului il intereseaza in mod deosebit.
In ceea ce priveste ordinea intrebarilor, nu exista o metoda general valabila, insa exista anumite
reguli care trebuie respectate.
Aceste reguli se aplica in special chestionarelor interactive:
progresivitatea intrebarilor trebuie sa se inceapa cu intrebari generale (relativ neutre si
usoare) si sa se continue cu intrebari din ce in ce mai precise. Aceasta progresivitate
permite respondentului sa se familiarizeze cu chestionarul si sa inceapa sa se gandeasca la
subiectul anchetei;
introducerea intrebarilor filtru aceste intrebari permit segmentarea ulterioara a
esantionului;
intrebarile de identificare, acestea se plaseaza de obicei la sfarsitul chestionarului si permit
o descriere a individului in functie de criterii socio-economice, insa trebuie respectat
anonimatul.
Redactarea proiectului chestionarului
Problema formularii precise a intrebarilor este destul de delicata si trebuie sa se tina
seama de faptul ca persoanele carora li se va administra chestionarul pot proveni din medii sociale
diferite, avand deci niveluri de educatie diferite.
Semnificatiile multiple pe care le poate avea acelasi cuvant poate constitui o sursa de eroare
respondentul putand interpreta intrebarea intr-un alt mod decat cel la care s-a gandit cercetatorul.
Din acest motiv este prudent sa se verifice calitatea chestionarului prin realizarea unui pretest pe
un esantion redus, care sa reflecte insa diversitatea populatiei care va fi studiata in cadrul
sondajului.
75
Acest pretest nu va conduce la o certitudine absoluta privind acuratetea chestionarului, dar va
permite evitarea erorilor flagrante si se va putea, de asemenea, evalua durata unui interviu.
Redactarea chestionarului
In procesul de redactare a intrebarilor va trebui sa se tina seama de:
continutul;
formatul;
formularea acestora.
Continutul intrebarilor
Inainte de toate, intrebarile trebuie sa fie pertinente, adica sa raspunda problemelor
utilizatorului in vederea luarii deciziilor. Redactarea chestionarului reprezinta de fapt enuntarea
ipotezelor. Cercetatorul nu face doar o simpla lista cu intrebarile care trebuie incluse in chestionar,
ci transforma aceste ipoteze in instrumente de masura aplicabile persoanelor interogate.
Intrebarile se bazeaza pe doua categorii principale de fenomene:
mentale (opinii, atitudini, intentii) care nu sunt observabile in mod direct;
comportamentele care, din punct de vedere teoretic, sunt observabile.
Pentru a raspunde la o intrebare, respondentul parcurge mai multe etape:
interpretarea intrebarii - implica doua operatii corelate intre ele: intelegerea cuvintelor
utilizate si gasirea sensului intrebarii cu scopul de a da un raspuns;
cautarea informatiilor dupa ce prima etapa este finalizata, respondentul face apel la
memorie pentru a gasi datele necesare; fie informatia este disponibila imediat (de exemplu
nume, varsta...) fie trebuie sa reconstituie anumite evenimente;
alegerea sau formularea raspunsului;
modificarea daca exista o intrebare considerata sensibila, pot aparea situatii in care
respondentul isi modifica raspunsul initial din dorinta de a se plasa in normele sociale;
comunicarea in aceasta etapa respondentul comunica in scris sau oral raspunsul pe care l-
a ales sau formulat;
Este deci esential ca in conceperea chestionarului sa se tina seama de procesul cognitiv
deoarece, facilitand acest proces se maximizeaza sansele de a obtine raspunsuri adecvate la
intrebarile existente.
Formatul intrebarilor
Pot fi utilizate doua tipuri principale de intrebari:
a) Intrebari deschise
In acest caz respondentul este liber sa raspunda utilizand propriul vocabular. Intrebarile
deschise pot oferi mai multe informatii datorita lipsei oricarei constrangeri in formularea
raspunsului. Acest tip de intrebari este foarte util in special in etapa exploratorie a sondajului, cand
cercetatorul cauta mai mult sa inteleaga modul de a gandi al oamenilor si mai putin sa masoare
cate persoane gandesc intr-un anumit fel.
76
Exista diverse tipuri de intrebari deschise, cele mai utilizate fiind urmatoarele:
complet nestructurate subiectii pot raspunde cum doresc;
asocieri de cuvinte se dau pe rand diferite cuvinte si li se cere respondentilor sa noteze
primul cuvant care le vine in minte;
completarea frazei li se prezinta respondentilor o povestire incompleta pe care trebuie
sa o continue;
completarea unei imagini;
testul de aperceptie tematica li se prezinta respondentilor o imagine si li se cere sa
alcatuiasca o povestire despre ceea ce cred ei ca se intampla in aceasta.
Studiile cantitative concepute de profesionisti contin in general foarte putine intrebari
deschise. In mod frecvent se intalnesc insa chestionare care propun la fiecare intrebare inchisa, o
intrebare deschisa de genul: Care este motivul sau Comentati. In realitate, acesta combinatie
arata lipsa experientei in intocmirea chestionarului.
Intrebarile deschise prezinta urmatorele inconveniente majore:
riscul de a obtine raspunsuri superficiale - respondentul poate sa spuna nu stiu sau sa dea
primul raspuns care ii vine in minte ( ponderea non-raspunsurilor este mult mai mare in
cadru intrebarilor deschise).
pentru a putea numara raspunsurile este necesar sa se utilizeze codificarea (se asociaza un
simbol numeric fiecarui raspuns diferit); aceasta operatie consuma insa timp si este
costisitoare. In plus, in unele situatii, pentru a se evita obtinerea unei liste prea mari de
coduri se realizeaza regruparea raspunsurilor care au semnificatie asemanatoare, pierzand
astfel o parte din diversitatea informatiilor.
in cazul in care raspunsurile sunt completate manual de catre operator sau de catre persoana
intervievata, exista riscul aparitiei erorilor ca urmare a ilizibilitatii scrisului;
nu ofera nici o informatie respondentilor in ceea ce priveste natura raspunsului asteptat.
Aceste dezavantaje nu trebuie sa conduca insa la concluzia ca intrebarile deschise vor fi
exculse din cadrul chestionarelor. Astfel, cand este propusa o lista de itemi de genul marca
utilizata, magazin frecventat, tara de origine, etc., categoria Altele, precizati care...... permite
colectarea de itemi complementari care nu au fost prevazuti initial.
Obiectivul responsabilului anchetei este de a extrage maximum de informatii din raspunsurile
obtinute. Unele programe informatice propun module specializate pentru prelucrarea acestui tip de
intrebari: Analiza semantica, Analiza lexicala, insa aceste aplicatii nu sunt capabile sa
extraga automat sensul raspunsurilor obtinute. Pana in prezent nu a fost creat programul informatic
care sa poata intelege sensul real al raspunsului. Programele informatice permit determinarea
frecventei unui cuvant, regruparea acestora in expresii, reperarea negatiilor, realizarea de grafice
care leaga cuvintele intre ele in functie de frecventele de asociere in cadrul frazelor, etc,. Dar o
data ce au fost realizate toate analizele de acest gen, in final sunt obtinute o multitudine de
informatii si deci responsabilul studiului este confruntat cu acelasi gen de problema care a existat
la inceput.
Pentru a putea utiliza in cadrul analizelor statistice raspunsurile obtinute la intrebarile
deschise impreuna cu alte variabile, trebuie sa se realizeze operatia de codificare. Insa nici un
progam informatic nu poate realiza acest lucru fara interventia umana.
Unele programe informatice ofera functionalitati interesante de genul:
afisarea listei raspunsurilor textuale obtinute, realizandu-se clasificarea acestora in functie
de diferite criterii (de exemplu prezenta anumitor expresii);
analizand raspunsurile obtinute pot fi formulate intrebari inchise existand posibilitatea
creerii modalitatilor in functie de temele gasite in raspunsurile obtinute.
77
Pentru a reduce costul codificarii se pot utiliza intrebarile deschise precodate: operatorul
lanseaza intrebarea sub forma deschisa insa dispune de o lista care ii permite sa codifice
imediat raspunsul. Este prevazuta si categoria altele care permite sa se noteze in clar raspunsurile
care nu sunt prevazute in lista.
Intrebarile inchise
In acest caz persoana intervievata trebuie sa efectueze o alegere intre un numar limitat de
raspunsuri care sunt stabilite de cercetator; in anumite situatii alegerea putand fi multipla.
Principalele tipuri de intrebari inchise sunt:
dihotomice o intrebare cu doua raspunsuri;
alegere multipla;
scala lui Likert o afirmatie fata de care persoana chestionata isi arata acordul sau
dezacordul;
diferenta semantica o scala cuprinsa intre doi termeni bipolari si pe care subiectul alege
punctul care reprezinta opinia sa;
scala importantei se apreciaza importanta unei caracteristici;
scala de apreciere o caracteristica este apreciata cu calificative de la slab la excelent.
Avantajul acestor intrebari este ca raspunsul poate fi transcris direct intr-un fisier fara a mai
fi necesare operatii de post-codificare costisitoare si care pot introduce erori.
In plus, daca gama variantelor de raspuns este pertinenta, intrebarea inchisa poate ajuta subiectul la
alegerea raspunsului.
Pentru elaborarea chestionarului este insa recomandat sa se utilizeze cu precadere intrebarile
inchise.
Formularea intrebarilor
Intrebarile trebuie sa fie formulate astfel incat:
sa fie intelese de persoanele interogate trebuie deci sa se acorde o mare atentie
vocabularului ales. Intrebarea trebuie sa fie formulata astfel incat respondentul sa o
interpreteze in acelasi mod ca si cercetatorul.
Daca utilizarea unor cuvinte tehnice este indispensabila atunci se recomanda sa se includa
definitia acestora in chestionar sau in ghidul de instruire.
Pentru a nu se creea confuzii in interpretarea unei intrebari trebuie sa se evite utilizarea
negatiei sau a dublei negatii.
sa aiba variante de raspuns cunoscute de catre persoana interogata (necunoasterea acestora
constituind o sursa de eroare).
sa favorizeze raspunsuri sincere modul de formulare a unei intrebari poate manipula
opinia persoanei interogate.
Principalele erori care pot interveni in formularea intrebarilor:
utilizarea unui limbaj prea tehnic pentru persoanele interogate;
utilizarea unor termeni imprecisi, cu caracter ambigu;
formularea unor intrebari prea lungi (se recomanda sa se foloseasca maximum 20 de
cuvinte);
structura intrebarii este mult prea complexa dubla negatie, doua intrebari in una singura;
78
sugerarea raspunsurilor.
Efectele datorate interactiunii intre intrebari
Acestea pot fi grupate in urmatoarele categorii principale:
efectul de halo daca mai multe intrebari sunt formulate sub forma de scala orientata in
acelasi sens, persoana interogata va avea tendinta sa raspunda mereu in acelasi mod. In
acest caz se recomanda schimbarea sensului scalelor pentru a face ca respondentul sa se
gandeasca la fiecare intrebare.
efectul de contaminare este vorba de influenta directa pe care o are o intrebare asupra
urmatoarelor.
CONCLUZII FINALE
79
Cu toate ca sondajul a fost utilizat inca din anii 30 pentru consultarea opiniei publice,
marile firme au inceput sa le utilizeze pentru studierea satisfactiei consumatorilor abia in
anii 70. Competitia si concurenta din ce in ce mai puternica le-a obligat sa inteleaga mai
bine perceptia clientilor in scopul diferentierii acestora. (De exemplu, la ora actuala in
Franta, studiile privind satisfactia clientilor reprezinta aproximativ 40 % din intreaga piata
a sondajelor).
Cele mai multe sondaje sunt realizate in Franta in medie, 500 de anchete publicate pe an.
In randul acestora, ponderea ce mai mare o au sondajele politice, care sunt mai numeroase
chiar si in raport cu cele realizate in SUA.
In elaborarea planului de sondaj va trebui sa se tina seama, cel putin in cazul in care se va
alege un sondaj probabilist, de urmatoarele aspecte:
- utilizarea unei baze de sondaj de calitate;
- procedura de selectie a esantionului;
- minimizarea erorilor de observatie;
- minimizarea numarului de non-raspunsuri;
- eroarea medie patratica sa fie redusa;
- estimarea dispersiei sa se realizeze cu usurinta.
Principalele problemele care apar, din punct de vedere statistic, ca urmare a utilizarii
tehnicii sondajului se refera la: alegerea unei metode de esantionare si masurarea calitatii
estimatorilor obtinuti.
In ceea ce priveste esantionarea, aceasta este faza care se realizeaza o singura data
angajand toate variabilele si conditionand toate operatiile, in timp ce estimarea este
operatia care se realizeaza la capatul lantului.
Prin urmare, metoda de esantionare are consecinte determinante in ceea ce priveste
aplicarea procedurilor statistice: daca sondajul nu este aleator simplu cu probabilitati
egale cu revenire, procedurile de analiza statistica bazate pe ipoteza selectiei unei variabile
aleatoare independente nu mai pot fi aplicate ca atare.
Principalii factori care influenteaza alegerea unei metode de esantionare sunt:
- obiectivele anchetei;
- natura populatiei studiate;
- bugetul disponibil;
- modul de administrare al chestionarului.
In general, pentru esantioane de volum redus este recomandabil sa se utilizeze sondajul pe
cote, iar pentru esantioane de marime mare, sondajele probabiliste.
Pentru urmarirea in timp a comportamentelor de cumparare si a utilizarii produselor sunt
utilizate panelurile de consumatori; acestea pot fi folosite si pentru realizarea anchetelor
ad-hoc in vederea determinarii pietelor tinta.
In ceea ce priveste estimarea parametrilor, in practica formulele pentru calculul acestora
sunt destul de rar utilizate asa cum sunt prezentate in lucrarile de specialitate, ele trebuind
sa fie adaptate situatiilor reale.
Ameliorarea calitatii rezultatelor sondajelor depinde, esential, fie de gasirea unei informatii
auxiliare, care implica un anumit cost, fie de marirea dimensiunii esantionului, care
80
introduce, de asemenea, un cost suplimentar. O informatie auxiliara pertinenta nu poate
fi furnizata decat de un expert si prin urmare este indispensabila colaborarea dintre acesta
si statisticienii antrenati in realizarea sondajului.
O data ce este disponibila o informatie auxiliara pertinenta, statisticianul o poate utiliza fie
in momentul esantionarii fie in fazele in care se realizeaza estimarea parametrilor si
redresarea esantionului.
Redresarea permite cresterea preciziei estimatorilor daca variabilele de redresare sunt
corelate cu variabila analizata.
In ceea ce priveste erorile de sondaj, in prezent exista doua tendinte majore:
- diminuarea erorilor de observare ca urmare a introducerii noilor tehnologii de
colectare a datelor;
- cresterea erorilor specifice sondajului, ca urmare a cresterii ponderii non-
raspunsurilor.
Erorea introdusa de existenta de non-raspunsurilor poate fi diminuata utilizand tehnicile
reponderarii respondentilor sau imputarii non-raspunsurilor partiale.
Ajustarea non-raspunsurilor are ca obiectiv prioritar limitarea erorii datorate faptului ca
respondentii si non-respondentii sunt doua sub-populatii in care distributia valorilor
individuale Y
i
difera a pripori. Daca nu se tine cont de existenta non-raspunsurilor in
expresiile estimatorilor inseamna nu se face distinctie intre cele doua sub-populatii.
Metodele de reponderare si cele de imputare au un punct comun fundamental: trebuie
gasite sub-populatiile in cadrul carora exista omogenitate.
Teoria stiintifica privind esantionarea si estimarea indicatorilor nu elimina insa erorile care
sunt generate de utilizarea sondajelor, dar acestea pot fi diminuate. Poate in acest domeniu,
mai mult decat oriunde putem spune ca: It is easy to lie with statistics and impossible to
tell the truth without statistics (Andrejs Dunkils).
81

S-ar putea să vă placă și