I. NOIUNI SPECIFICE SONDAJULUI STATISTIC II. PRINCIPALELE PROCEDEE I METODE DE SONDAJ III. ERORI DE SONDAJ
I.Metoda sondajului ofer posibilitatea de a obine informaii referitoare la ntreaga colectivitate prin observarea numai a unei pri a acesteia. n statistic, de obicei, culegerea datelor se face prin observare total sau parial. Ca observare parial selecia se face prin obinerea unor eantioane reprezentative. Se consider reprezentativ sondajul care nu conduce la erori fa de colectivitatea de baz de cel mult 5%. Avantajul principal al metodei sondajului statistic const n aceea c el se aplic n toate cazurile cnd nu dispunem de mult timp pentru a obine un volum de informaii necesar i suficient, cu un grad de exactitate acceptabil. Pe baza datelor din colectivitatea total putem obine nite indicatori care se numesc parametri care n cazul eantionului se numesc estimatori. Cu ajutorul seleciei statistice se estimeaz parametrii colectivitii totale folosind principiile teoriei probabilitii. n acest scop ar trebui s trecem dou etape: - etapa descriptiv, unde culegem i prelucrm datele referitoare la eantion i calculul indicatorilor ce-l definesc (media, dispersia . a.) - inferena statistic care const n extinderea indicatorilor eantionului asupra colectivitii generale. n cercetarea statistic snt folosii deseori irul de termeni i noiuni distini pentru colectivitatea general i eantion. Colectivitate general sau populaie se numete irul unitilor care formeaz obiectul supus cercetrii. Volumul colectivitii generale este notat cu N cnd colectivitatea este format din uniti simple i cu R cnd este format din uniti complexe. Cu M se noteaz numrul unitilor la care s-a obinut rezultat afirmativ. n cazul caracteristicilor alternative. Colectivitate de selecie, eantion, mostr, prob este acea parte a colectivitii generale de la care se culeg datele pentru inferen statistic. Volumul colectivitii de selecie se noteaz cu n pentru unitile simple i cu r pentru unitile complexe. Pentru caracteristicile alternative numrul unitilor cu rspuns afirmativ se noteaz cu m. Dintr-o colectivitate general se pot extrage mai multe eantioane. Calculul indicatorilor colectivitii totale i a eantionului l putem observa n tabelul urmtor:
Caracteristica Denumirea indicatorilor Nealternativ Alternativ Colectivitatea general Colectivitatea de selecie Colectivitatea general Colectivitatea de selecie Media x x0=xi/N x= xi/n p=M/N w=m/n Dispersia 0=(xi-x0)/N i=(xi-x0)/n p=p*q=p*(1-p) w=w(1-w) Abaterea medie ptratic 0= 0 i= i p= p w= w
Principalele avantaje ale seleciei statistice snt: - operativitatea (se efectueaz n termeni redui de timp); - economicitatea (face economie de cheltuieli umane i materiale); - completitidine (erori mai puine i mai uor de controlat, n<N); - amplicitate i consisten (se testeaz i se verific); - practicitate (se folosete cnd observarea total nu e posibil de nfptuit); - calitatea rezultatelor ridicat; - se folosete cu rezultate bune n activitatea de marketing (cererea la produse noi); - se folosete n organizarea unei cercetri totale (selecie pilot); Ca s se respecte reprezentativitatea colectivitii generale este necesar s respectm urmtoarele condiii: - selecia s se fac obiectiv, fr preferine, cu probabilitate calculat din timp; - eantionul s fie suficient de mare s redea trsturile colectivitii; - unitile n eantion s se includ independent de alte uniti.
II.La formarea eantionului de selecie se folosesc diferite modaliti printre care: selecii aleatoare, selecii subiectiv organizate sau dirijate i selecii mixte. Selecia aleatoare st la baza modelului utilizat pentru asigurarea reprezentativitii. Acest procedeu este bazat pe principiul tragerii la sori, procedeul cu numere ntmpltoare, procedeul seleciei mecanice. n cazul seleciei dirijate, alegerea unitilor se fac de ctre persoanele care culeg datele. Selecia mixt este o combinare a principiilor seleciei aleatoare i a seleciei dirijate. 2
Procedeul tragerii la sori are la baz extragerea aleatoare a unor elemente care reprezint cte o unitate a colectivitii generale. Snt dou scheme de extragere: 1. prin selecie repetat sau a bilei revenite; 2. prin procedeul seleciei nerepetate sau a bilei nerevenite. n primul caz probabilitatea de a fi selectat fiecare unitate este constant (p=1/N). n al doilea caz probabilitatea crete pe msur ce snt extrase mai multe bile: p1=1/N; p2=1/(N-1); p3=1/(N-2); pn=1/(N-(n-1)) Procedeul cu numere ntmpltoare bazat pe tabelele cu numere ntmpltoare. Procedeul seleciei mecanice se folosete dup aranjarea unitilor ntr-o anumit ordine. n primul rnd se stabilete pasul de numrare K=N/n cu ajutorul cruia se mparte colectivitatea n grupe de volum egal. Din prima grup se extrage o unitate la ntmplare i fiecare urmtoare unitate se extrage folosind pasul de numrare. Seleciile dirijate i mixte se folosesc n sondajele de opinie .a.
III.Prin eroare se nelege abaterea valorilor indicatorilor obinui pe baza eantionului de la aceiai indicatori obinui n urma observrii totale. Erorile se mpart dup treptele cercetrii statistice n erori: de observare, de prelucrare, de reprezentativitate i de modelare. Erorile de nregistrare nu afecteaz calitatea informaiilor culese deoarece snt puine la numr, ntmpltoare i nesistematice. Erorile de reprezentativitate se mpart n: - sistematice, - ntmpltoare. Erorile sistematice se datoreaz nerespectrii principiilor teoriei seleciei. Fiind condiionate de alegerea preferenial, alegerea la nimereal .a. erorile ntmpltoare snt specifice sondajului i se mai numesc erori efective i erori probabile. Erorile efective se pot calcula numai pentru caracteristicile la care s-au nregistrat date pentru observarea total ca diferen dintre media eantionului i media colectivitii totale. Aceste erori stau la baza verificrii reprezentativitii eantionului. Reprezentativitatea se verific i prin coeficientul de reprezentativitate. (dx%)=dr/x0 (unde: dr eroarea efectiv de reprezentativitate; x0 media colectivitii generale) Dac nu se cunoate x0 se efectueaz mai multe selecii succesive i se calculeaz media mediilor de selecie ( x ). Dx=x- x; dx%=((x- x)/ x)*100 Eroarea este o mrime aleatoare. n practic se folosete un eantion i nu se cunoate eroarea de selecie care va aprea. n acest scop se calculeaz valoarea medie de reprezentativitate ca abatere medie ptratic a tuturor mediilor de selecie posibile fa de media colectivitii generale. x= (xi-x0)*ni/ni Cu ct mrimea eantionului este mai mare cu att media de selecie va fi un estimator mai corect al mediei generale. Dac n>40 media se distribuie dup curba normal a lui Gauss-Laplace de medie x0 i dispersia /n. Pentru comparabilitate erorile se exprim n abateri normale. zi=(xi-x0)/ x Se primete urmtoarea probabilitate +z -(u/2)du P(x-z* x<x0<x+z* x)=(1/2*N)*e = z -z z - funcia de probabilitate cu care se garanteaz rezultatele z - coeficientul funciei de probabilitate z=z*x - se numete eroare limit Odat cu creterea probabilitii crete i intervalul de ncredere al mediei i scade exactitatea de estimare a mediei colectivitii generale. n cazul seleciei ntmpltoare repetate. Eroarea medie de reprezentativitate se calculeaz: 0=n* x x= 0/n Dispersia total poate fi nlocuit cu dispersia eantionului cnd acesta este destul de mare. 0= i x= i/n n cazul seleciei repetate, 0>n* x; x(nerepetat)/x(repetat)=(N-n)/(N-1) Deci, x(nerepetat)<x(repetat) (N-n)/(N-1) coeficient de corecie n cazul bilei nerevenite. Deci, x=(0/n)*(1-n/N) =(i/n)*(1-n/N) - selecia nerepetat Pentru caracteristica alternativ eroarea medie de selecie se calculeaz, w=p*(1-p)/n w(1-w)/n - selecia repetat; w=(1-n/N)*p*(1-p)/n(1-n/N)w(1-w)/n - selecia nerepetat. Eroarea medie limit, x=z*x - caracteristica nealternativ; x=z*w - caracteristica alternativ. Aceast eroare se modific pe baza volumului eantionului (n) i a probabilitii. 3
TEMA 12. ESTIMAREA ERORILOR DE SONDAJ I A VOLUMULUI EANTIONULUI PE TIPURI DE SELECIE
I. SONDAJUL ALEATOR SIMPLU REPETAT II. SONDAJUL ALEATOR SIMPLU NEREPETAT III. SONDAJUL MECANIC IV. SONDAJUL TIPIC V. EXTINDEREA REZULTATELOR SELECIEI
I.Eantionarea simpl aleatoare este modelul de baz utilizat pentru asigurarea reprezentativitii. Sondajul aleator simplu este utilizat pentru colectiviti statistice negrupate, formate din uniti simple care au un anumit grad de omogenitate. n cazul acestui tip de sondaj fiecare unitate are ans egal de selecie n eantion. Pentru sondajul aleator simplu repetat formarea eantionului const n extragerea unitilor n mod repetat dintr-o urn sau dintr-o list stabilit din timp. Pentru a calcula indicatorii de selecie se folosete dispersia general (0) sau cea de selecie (i) ce msoar variaia caracteristicii studiate. n cazul sondajului aleator simplu erorile de reprezentativitate snt destul de mari n raport cu alte tipuri de selecie, deoarece dispersia msoar variaia pe baza tuturor cauzelor. Precizia de estimare a parametrilor depinde de mrimea dispersiei ca indicator al variaiei, de probabilitatea cu care se garanteaz apariia rezultatelor, de eroarea limit i de mrimea eantionului. Probabilitatea de apariie a unei uniti din eantion este P (Xi=xi)=1/N Dac ne referim la independena valorilor variabilei din eantion calculm media de sondaj care este un estimator nedeplasat al mediei (m) a colectivitii generale M ( x )=m Dispersia mediei de sondaj. D ( x )= 0 i abaterea medie ptratic x= 0/ni/n Deoarece lucrm cu o eroare oarecare, eroarea medie limit este egal cu: x=z*x=z*0/n=>x=z*0/n De unde volumul eantionului pentru sondajul aleator simplu repetat este n= z*0/x z*i/x Coeficientul de probabilitate z este direct proporional cu eroarea medie limit i invers proporional cu eroarea medie de reprezentativitate. Deoarece x=z*x=>z=x/x Seleciei i este caracteristic faptul c odat cu creterea probabilitii scade precizia, ns creterea preciziei cu aceeai probabilitate se poate obine prin mrirea eantionului.
II.Sondajul simplu presupune c eantionul se alege la ntmplare din ntreaga colectivitate. Eficiena sondajului n cauz depinde de variaia caracteristicii studiate n cadrul colectivitii generale i de volumul eantionului. Pentru a obine un grad sporit de reprezentativitate se impune un volum mai mare a eantionului. n cazul nostru probabilitatea extragerii unui element din colectivitatea general depinde de extragerile precedente P(xn)=1/(N-n) Dispersia se calculeaz ca: x=D(x)=(0/n)*((N-n)/(N-1))(i/n)*((N-n)/(N-1)) Abaterea medie de reprezentativitate ca eroare medie: x=(0/n)*(N-n)/(N-1)(i/n)*(N-n)/(N-1)(i/n)*1-n/N Volumul eantionului se calculeaz dup formula: n=z*0/( x+ z*0/N)
III.Sondajul sistematic, numit i mecanic ocup un loc intermediar ntre sondajul aleator i nealeator. Acest sondaj const n extragerea din populaie, sistematizat dup un criteriu anumit, a numrului n de uniti care-l formeaz, prin aplicarea pasului de eantionare, egal cu N/n. Dac ordinea de sistematizare este aleatoare, extracia sistematic este echivalent cu extracia aleatoare simpl. Cnd fenomenul observat se produce n timp, pasul de extracie poate fi intervalul de timp dintre evenimente sau diferena dintre numrul de ordine. Folosirea acestui tip de sondaj nu se admite cnd n producerea cazurilor exist o ciclicitate. Din cauza probabilitii de coincidere a pasului de eantionare cu fazele ciclului ceea ce conduce la obinerea erorilor sistematice de sondaj. De obicei, la estimarea rezultatelor sondajului mecanic se decurge la metodele utilizate n cazul sondajului simplu nerepetat. Eroarea de sondaj se calculeaz: x=(i/n)*1-n/N Volumul eantionului: n=z*0/(x+ z*0/N)
IV.Pe lng creterea dimensiunilor eantionului o cale de mrime a preciziei este stratificarea. Prin stratificare se subnelege efectuarea sondajului tipic. Acest tip de sondaj se folosete pe larg n studiul fenomenelor social economice care snt mprite n grupe omogene dup o caracteristic esenial ce se noteaz cu N1,N2,,Nr i se reprezint n sondaj prin volumul subeantioanelor n1,n2,,nr. . Prin stratificare se presupune mprirea populaiei n straturi ct mai omogene cu caracteristici ct mai asemntoare. Dup mprirea colectivitii n straturi omogene se aleg la ntmplare cte un eantion din fiecare strat. Sondajul tipic asigur reprezentarea exact a diferitor straturi ale populaiei n eantion. Dac gruparea a fost omogen mediile de grup ( xi ) au valori apropiate de valorile individuale din care s-au calculat, abaterile snt mici i gradul de variaie la fel. 4
Pentru calculul erorilor medii de sondaj se folosete media dispersiilor de grup din colectivitatea total () sau din colectivitatea de selecie (i) 0=i0/ni ; i=i/ni Media de selecie se calculeaz ca medie aritmetic ponderat a mediilor subeantioanelor. x=xi*ni/ni Pentru sporirea preciziei se verific s existe legtur ct mai puternic ntre criteriul de stratificare i variabila studiat. Fcnd referire la regula de adunare a dispersiilor media dispersiilor pariale este o component a dispersiei totale 0=i+. De unde rezult c n cazul seleciei tipice eroarea medie de selecie este mai mic dect n cazul seleciei ntmpltoare simple. Se cunosc urmtoarele tipuri de selecie tipic: 1. Selecie tipic simpl. Volumul subeantioanelor este acelai n toate grupele: ni=n/r 2. Selecia tipic proporional ine cont de structura grupelor din colectivitatea general. ni=n*Ni/Ni 3. Selecia tipic optim; cnd la formarea eantionului se ia n consideraie ponderea grupelor, n colectivitatea general i mrimea variaiei din interiorul grupelor. ni=n*Ni*i0/ni*i0 n cazul sondajului tipic, indicatorii de selecie se calculeaz folosind media dispersiilor pariale: - pentru caracteristica nealternativ: selecia repetat: x= 0/ni/n selecia nerepetat: x= (0/n)/(1-n/N)(i/n)/(1-N/n) - pentru caracteristica alternativ: selecie repetat, w=p*(1-p)/nw(1-w)/n selecie nerepetat, w=(1-n/N)*p*(1-p)/n(1-n/N)w(1-w)/n V.Indicatorii statistici calculai pe baza informaiilor culese de la unitile selectate servesc la estimarea parametrilor colectivitii generale cu o anumit precizie i probabilitate stabilit. Se folosesc dou procedee de extindere a rezultatelor: 1) Procedeul coeficientului de corelaie pentru verificarea autenticitii datelor culese dintr-o observaie total. 2) Procedeul extinderii directe se folosete n caracterizarea fenomenelor pentru care nu dispunem de observaii din observarea total. Astfel se estimeaz nivelul mediu al colectivitii generale. x -x < x0 < x-x -caracteristica nealternativ; w -w < p < w+w Nivelul total al caracteristicii pentru ntreaga colectivitate n cazul caracteristicilor nealternative i alternative se calculeaz astfel: N*( x -x) < xi < ( x + x)*N N*( w -w) < Mi < ( w -w)*N 5