Documente Academic
Documente Profesional
Documente Cultură
CAPITOLUL 5.
CERCETAREA SELECTIV
Cuvinte cheie: - cercetarea selectiv - sondajul - selecia simpl repetat (urna cu bil revenit). - selecia simpl nerepetat (urna cu bil nerevenit), - reprezentativitatea eantionului - eroare de reprezentativitate - eroare medie de reprezentativitate - eroarea limit admis n societatea contemporan, cea mai mare parte a informaiilor despre mediul de afaceri este obinut nu prin nregistrri exhaustive, ci prin investigaii pariale, cunoscute sub numele de anchete statistice. Ele sunt preferate ca urmare a faptului c ofer informaii suficient de corecte ntr-un timp relativ scurt, astfel nct managerul unei ntreprinderi sau omul de afaceri poate valorifica n timp real o oportunitate sau poate evita, elimina sau mcar reduce o parte din riscurile implicrii n circuitul economic. n prezentul capitol sunt prezentate fundamentele sondajului statistic ca instrument metodologic de realizare a anchetelor n rndul ntreprinderilor, al menajelor, al consumatorilor, al privitorilor la emisiunile TV, al asculttorilor de radio etc. Parcurgnd acest capitol, economistul are posibilitatea de a nelege avantajele i inconvenientele sondajului statistic, etapele acestei forme de cercetare a realitii economice, principalele procedee de eantionare, precum i modul de calcul al indicatorilor specifici celor mai frecvent utilizate tipuri de selecie. Sunt artate, de asemenea, modalitile de extindere a rezultatelor sondajului asupra ntregii colectiviti supuse cercetrii, precum i cile de determinare a volumului necesar al eantionului ntrun sondaj statistic. Nu ntotdeauna este posibil sau rentabil (cost, durat) s facem o cercetare exsuasiv. n aceste condiii folosim cercetarea selectiv. Cercetarea selectiv presupune culegerea i prelucrarea datelor referitoare la o parte a colectivitii generale, iar rezultatele obinute se extind asupra ntregului obiect al cunoaterii pentru a obine o caracterizare satisfctoare. Este necesar ca partea observat (eantion, mostr, prob, selecie) s fie reprezentativ adic s reproduc la scar redus trsturile eseniale ale colectivitii ntregi. Sondajul este o form a cercetrii statistice realizat pe baza unei pri reprezentative din populaia (colectivitatea general) studiat. El presupune urmtoarele etape consecutive: 1) extragerea unui eantion reprezentativ din colectivitatea general (eantionarea) i culegerea de date despre despre elementele extrase (obserarea eantionului); 2) descrierea statistic a eantionului prin indicatori specifici fiecrei caracteristici nregistrate n cadrul programului de observare (obinerea estimatorilor); 3) extinderea rezultatelor obinute la nivel de eantion asupra colectivitii generale (estimarea parametrilor colectivitii generale = inferena statistic).
(dispersia)
(1 p)
2 p
n general nu se cunosc aspecte legate de colectivitatea general. Cercetartea selectiv este folosit pentru a estima pe baza eantionului parametrii colectivitii generale.
x =
(x x f
i i
2 0
fi
De obicei nu se cunoate dect un singur eantion. Se poate face ns calcul anticipat al lui x pornind de la relaia dintre dispersia colectivitii generale (20), ptratul erorii medii de reprezentativitate x2 i volumul eantionului. n cazul seleciei simple repetate aceast relaie este:
2 2 0 = x n
, adic eroarea medie de reprezentativitate este direct n proporional cu dispersia colevtivitii generale i invers proporional cu volumul eantionului. Dac nu se cunoate 20 se accept c dispersia unicului eantion cunoscut 2 ofer o marj satisfctoare a mprtierii elementelor colectivitii dac eantionul este convenabil de mare. Totui se face o corecie cu 1, adic: . n 1 Dac se folosete o variabil alternativ, eroarea medie de reprezentativitate se stabilete potrivit acelorai relaii, adic atunci cnd se cunoate dispersia colectivitii generale: p (1 p ) w = n iar, dac nu se cunoate dect eantionul, atunci:
ceea ce nseamn c x =
2 0
x =
w =
w(1 w) n 1
Aceste relaii sunt pentru selecia simpl repetat (mecanic) Dac se practic selecia simpl nerepetat, eantioanele sunt mai reprezentative dect la selecia repetat, se introduce un coeficient de corecie pentru a estima eroarea medie de reprezentativitate: - pentru selecia nerepetat, variabil numeric:
x =
n 1 n 1 N
2 0
x =
2 0
n 1 n N
w =
w(1 w) n 1 n 1 N
n practica economic nu intereseaz eroarea medie de reprezentativitate, ci eroarea maxim (abaterea maxim) sau eroarea limit ce poate apare la estimare pentru o anumit probabilitate. Deoarece aceast eroare este diferena dintre x i x 0 ne folosim de proprietile repatiiei normale pentru a asocia diverse mrimi ale erorii cu probalilitile aferente.
Eroare limit se calculeaz: pentru variabil numeric:
x = z x
pentru variabila alternativ:
w = z w
Exist tabele ale repartiiei normale care ne arat relaia dintre coeficientul de multiplicare z sau t sau probabilitatea (z) sau (t) corespunztoare. Eroarea limit arat diferena maxim n plus sau n minus care poate surveni la o anumit probabilitate (z), z fiind utilizat n calculul erorii limit. Necunoscnd parametrii colectivitii generale, rezult c pentru o variabil numeric x 0 x x , iar pentru o variabil alternativ avem p (w w ) cu
probabilitatea corespunztoare. (z) = funcia de probabilitate cu care se genereaz rezultatele z = coeficientul funciei de probabilitate. Eroarea limit se poate mri sau micora fie prin modificarea volumului eantionului (n), fie prin modificarea probabilitii cu care se garanteaz rezultatele, deoarece dispersia colectivitii totale rmne aceeai. Dup modul n care se combin sistemul de organizare, felul unitilor de selecie i procedeul de selecie folosit, n cercetarea activitii economice i sociale, se disting urmtoarele tipuri de selecie: - selecie ntmpltoare simpl; - selecie mecanic; - selecie tipic (stratificat); - selecia de serii. Pentru fiecare tip de selecie se calculeaz trei indicatori: eroarea de medie de reprezentativitate, eroarea limit i volumul eantionului. Selecia ntmpltoare simpl este utilizat n special pentru colectiviti formate dintr-un numr de uniti simple i care se caracterizeaz printr-un anumit grad de omogenitate. Erorile de reprezentativitate sunt mari n raport cu alte tipuri de selecie,
2 0
2 z 0 z 2 i2 n= 2x 2x 2
x = z x = z
2 0
n 1 n = n N
2 z2 0 z 2 i2 2 z2 0 z 2 i2 2 x + 2x + N N
n mod similar se procedeaz i n cazul caracteristicii alternative. Urmtorul tabel sintetizeaz eroarea medie de reprezentativitate, eroarea limit i volumul eantionului pentru caracteristica numeric i pentru cea alternativ n cazul seleciei repetate i a seleciei nerepetate:
Indicatorul err. medie de reprezentativitate err. limit volumul eantionului selecia repetat 2 2 0 i x = n n 1 Caracteristica nealternativ (numeric) selecia nerepetat 2 2 0 i n n x = 1 1 n N n 1 N
x = z z n= z 2x
2 2 0
x = z x z 2x
2 2 i
n=
2 0 z 2 2 0 N
0 i
2 x +
2 z2 i 2 x + N
2 p (1 p ) n
w(1 w) n 1
w =
p (1 p ) n 1 n N
2 p (1 p )
w(1 w) n 1 n 1 N
2 w(1 w) 2 z w(1 w) N
w = z w
n= z 2 p (1 p ) z 2 w 2 w(1 w) 2 w
w = z w
n= z z 2 p (1 p ) 2 w + N z 2 w +
Pentru a ilustra valenele cognitive ale indicatorilor prezentai mai sus, s acceptm c responsabilul departamentului de resurse umane dintr-o corporaie multinaional avnd N = 4000 de angajai direct operativi a decis realizarea unui studiu cu privire la nevoile de formare profesional continu ale acestei categorii de salariai i disponibilitatea lor de a participa la astfel de programe. Pentru a rspunde acestei decizii, consiliul director al corporaiei aprob organizarea unui sondaj statistic n rndul salariailor, volumul eantionului fiind de n = 100 de persoane. Asigurarea reprezentativitii eantionului de numai 2,5% din totalul
Numr personal
17 30 25 18 10 100
Prelucrarea datelor referitoare la aceast caracteristic numeric (vrsta personalului), permite constatarea c la nivelul eantionului, vrsta medie este de: xi ni = 3740 = 37,4 ani, x= ni 100 iar dispersia n jurul mediei eantionului este:
(x x ) n = n
2 i i
Observaii: 1) Eantionul este destul de omogen (v = 32,7%) pentru a putea considera c media de 37,4 ani caracterizeaz corect vrsta tuturor celor 100 de persoane nregistrate. 2) Dac media nu este reprezentativ la nivelul eantionului (v>>35%), nu are sens s se mai continue cercetarea printr-o eventual tentativ de extindere a acestui indicator (deja nereprezentativ la nivel restrns) asupra colectivitii generale.
ntre rspunsurile nregistrate de la cele 100 de persoane cuprinse n sondaj se mai constat c 82 sunt dornice s participe la un program de formare continu, n timp ce restul de 18 persoane resping oportunitatea oferit de angajator. Aceast caracteristic alternativ, prezint o medie de: m 82 w= = = 0,82 n 100 i o dispersie de: 2 w = w(1 w) = 0,82 0,18 = 0,1476 Dac s-ar fi utilizat procedeul extragerii mecanice sau procedeul extragerii repetate, atunci pentru calculul erorii medii de reprezentativitate a unui (oricrui) eantion de volum n=100 s-ar fi aplicat relaiile [5.4] pentru caracteristica numeric i [5.6] pentru cea alternativ. Cum sondajul a avut n vedere extragerea nerepetat (pentru a spori
n 100 149,24 = 1,21 ani, 1 = 1 n 1 N 100 1 4000 ceea ce nseamn c media unui eantion de volum n = 100 obinut prin extragere aleatoare nerepetat se abate n medie cu 1,2 ani (+) fa de vrsta medie real ( x0 ) a celor 4000 de persoane angajate de corporaie;
x =
w(1 w) n 100 0,1476 = 0,038 1 1 = n 1 N 100 1 4000 Rezultatul indic o abatere medie cu +3,8% a proporiei personalului dornic de a participa la formarea profesional continu cuprins n eantion, fa de proporia real M p= n rndul ntregului personal al corporaiei. N
w =
n practica economic nu intereseaz, de obicei, eroarea medie de reprezentativitate a eantionului, ci abaterea maxim sau eroarea limit ce poate apare ca diferen ntre media unui eantion (estimator) i media colectivitii generale (parametru) la estimarea acestuia cu o anumit probabilitate. Deoarece eroarea limit este diferena dintre x i x 0, ne folosim de proprietile repatiiei normale pentru a asocia diverse mrimi ale erorii cu probalilitile aferente msurate ca (sub) multipli ai abaterii standard a mediilor de eantionare fa de x0 . Eroarea limit se calculeaz astfel: pentru variabil numeric: x = z x pentru variabila alternativ: [5.8] [5.7]
w = z w
Exist tabele ale repartiiei normale care exprim relaia dintre argumentul z sau t i funcia de probabilitatea (z) sau (t) corespunztoare. n exemplul considerat, eroarea limit pentru o probabilitate (z) = 0,95 (z = 1,96) este: y pentru caracteristica numeric, de aproximativ 2,4 ani: x = z x = 1,96 1,21 = 2,37 ani 2,4 ani,
Interpretarea este asemntoare celei prezentate la x. Diferena maxim ntre w i p (proporia celor nclinai s fac un program de formare contiun n cadrul eantionului w i, respectiv n colectivitatea general - p) este, cu aceeai probabilitate (z) = 0,95 de 7,4%.
Observaii: 1. Un tabel cu valorile funciei Gauss Laplace corespunznd diferitelor valori ale lui z se gsete n volumul Bazele statisticii pentru economiti. Aplicaii. Bucureti, Editura Tribuna Economic, 2002, p. 259-260. 2. Dac s-ar fi folosit extragerea mecanic, sau extragerea repetat, eroarea limit era ceva mai mare: x = 2,41 ani (fa de 2,37 ani); w = 7,6% (fa de 7,4%). Coeficientul de corecie aplicat n cazul sondajului nerepetat este ntotdeauna o mrime subunitar care restrnge mrimea erorii medii de reprezentativitate i, respectiv, a erorii limit, oferind o estimare mai exact a parametrilor colectivitii generale. 3. Nu este obligatoriu ca probabilitatea cu care se estimeaz diveri parametrii ai colectivitii generale s fie aceeai la toate variabilele cerectate.
100 = 7,2% ) x Pe baza acestor date, se poate estima eroarea medie de reprezentativitate, tiind c n cazul extragerii mecanice se aplic relaia de la sondajul simplu, aleator, repetat:
variaie v =
x =
2
n
Un eantion de 150 produse prelevate mecanic din producia zilei, prezint, n medie, o abatere cu 0,118 bomboane/pachet fa de numrul mediu ( x0 ) ce caracterizeaz ntrega producie. Eroarea limit pentru (z) = 0,9973: x = z x = 3 0,118 = 0,35 bucati Numrul mediu de bomboane/pachet n producia zilei se situeaz, cu probabilitatea de 0,9973 n intervalul: x0 ( x x ), adica, x 0 ( 20,1 0,35) Prin urmare: 19,75 x 0 20,45 , ceea ce, aplicat ntregii producii a zilei conduce (prin multiplicarea cu N = 3000) la un numr total (T) de bomboane ambalate de: 59250 T 61350 , cu (z) = 0,9973, n condiiile n care reglajul trebuia s ncadreze acest numr ntre (20-1)3000 = 57.000 buci i (20+1)3000 = 63.000 buci.
n=
Rspuns: Pentru a rspunde unei astfel de exigene, ar fi suficient s se preleve prin extragere mecanic doar 34 pachete, ceea ce la o producie total de 3000 pachete N nseamn un pas de numrare 88 . n S se observe n eantionul de 150 pachete, cota de produse care nu ndeplinesc cerina de 20 bomboane/pachet i s se estimeze cu (z) = 0,90 (z = 1,65) cota minim i maxim, precum i numrul minim i maxim de pachete necorespunztoare din punct de vedere al coninutului n producia unei zile. Rezolvare: Din 150 pachete prelevate, 12+9 = 21 pachete conin fie mai multe, fie mai puine produse dect numrul standard de 20 bomboane/pachet. 2 ) caracteristicii alternative n cadrul eantionului, media (w) i dispersia ( w sunt:
m 21 = = 0,14 , ceea ce nseamn c 14% din eantion nu corespunde n 150 standardului de ambalare. w=
2 w = w(1 w) = 0,14 0,86 = 0,1204
Eroarea medie de reprezentativitate a unui eantion de volum 150 obinut prin prelevare mecanic este de:
w =
2 w
Un eantion de volum 150 prelevat mecanic se caracterizeaz, n medie, printr-o cot de produse necorespunztoare cu 2,83% mai mare sau mai mic dect cota parte specific ntregii producii a unei zile. Eroarea limit pentru o probabilitate de 0,90 este de:
x =
w =
2 w
Cu acest rezultat, locul cercetrii selective este luat de examinarea integral a lotului comandat.
5.2.n rndul personalului operativ al unui centru de librrii se efectueaz un sondaj stratificat cu extragere nerepetat. ntre caracteristicile observate pe cele n = 80 de persoane din eantion, se numr vnzrile medii sptmnale (milioane lei) i felul raionului de mrfuri. Rezultatele nregistrrii eantionului se prezint astfel:
3 5 2 --10
--3 5 12 20
--12 12 6 30
2 8 10 --20
5 28 29 18 80
Se cere: S se caracterizeze acest eantion. Rezolvare: Vnzarea medie sptmnal realizat de cele 80 persoane este x = 5,5 mil lei. Amplitudinea variaiei este de 6 mil lei, adic 109,09% fa de medie. Acest indicator permite aprecierea c cele 80 de elemente ale eantionului prezint o mprtiere relativ mare (peste 100%). Dispersia eantionului: 2 = 3,05 . Abaterea standard: = 1,7464 mil lei. Coeficientul de variaie: v = 31,75%. n pofida ntinderii relativ mari a mprtierii, colectivitatea este destul de omogen (intensitatea mprtierii este sub 35%). Analiza variaiei vnzrilor medii sptmnale n cadrul celor 4 grupe constituite dup felul mrfurilor comercializate i elementele de calcul pentru verificarea regulii de adunare a dispersiilor sunt prezentate n tabelul 53.2. Pe baza acestei identiti se stabilete n ce msur influeneaz felul mrfurilor variaiei volumului vnzrilor sptmnale.
Raionul j nj
xj
3,8 6,9 5,6 4,8 ---
2 j
1,96 2,19 2,24 1,76 ---
xj x
-1,7 +1,4 +0,1 -0,7 ---
( x j x)2 n j
28,9 39,2 0,3 9,8 78,2
2 j nj
19,6 43,8 67,2 35,2 165,8
1 2 3 4 ---
10 20 30 20 80
Dispersia general a eantionului este deja calculat: 2 = 3,05 . Dispersia indus (explicat) de ( x j x ) 2 n j 78,2 2 = = = 0,9775 . n j 80 Dispersia rezidual: =
2
felul
mrfurilor
vndute:
2 n j n j
165,8 = 2,0725 80
Varietatea mrfurilor comercializate n diferitele raioane ale centrului de librrii explic n proporie de 32% variaia vnzrilor medii sptmnale realizate de cele 80 de persoane din eantion. S se estimeze cu (z) = 0,9545 (z = 2) volumul mediu sptmnal al vnzrilor realizate de ntregul personal operativ al centrului de librrii (N = 760 persoane). Rezolvare: Eroarea medie de reprezentativitate n cazul sondajului stratificat cu extragere nerepetat se determin astfel:
x =
n 1 = n N
Eroarea limit: x = z x = 2 0,15 = 0,3 mil.lei Prin urmare, x 0 (5,5 0,3) cu o probabilitate de 95,45%. Limitele intervalului n care se ncadreaz vnzarea medie sptmnal a celor 760 angajai direct n procesul vnzrii sunt: 5,2 mil lei i, respectiv, 5,8 mil lei. Pe acest temei, managementul acestei firme poate conta sptmnal, cu (z) = 0,9545, pe ncasri situate ntre 3952 i 4408 milioane lei. Ct de mare ar trebui s fie eantionul ntr-o nou cercetare selectiv bazat pe extracia stratificat nerepetat a elementelor componente, dac estimarea ar trebui fcut cu aceeai probabilitate (z) = 0,9545 (z = 2), dar n limitele unui interval de estimare de 0,5 milioane lei? Rspuns:
n= z2 2 2 + z
2 2
Cu ce probabilitate s-ar putea face estimarea limitelor intervalului n care se ncadreaz vnzarea medie sptmnal, dac x = 0,5 mil lei, dar se pstreaz mrimea iniial a eantionului: n = 80 persoane? Rspuns: Prin nlocuire n relaia de mai sus, se obine c z = 3,28, ceea ce corespunde lui (z) = 0,999481 n orice tabel al distribuiei normale.
Mai sus s-au artat valorile Nj, iar n tabelul 53.2, coloana a cincea, se afl 2 j . Cu aceste date, pentru aflarea numrului de persoane care urmeaz s intre n alctuirea eantionului din rndul celor care se ocup de anticariat este:
n1 = 32
Se cere: 1. s se reprezinte grafic repartiia; 2. se consider c cele 100 de persoane constituie un eantion extras aleator, simplu, nerepetat dintr-o colectivitate general de 1000 persoane; s se determine intervalele de vrst ntre care se situeaz vrsta medie a celor 1000 persoane considerndu-se ( z ) = 0,9545; z = 2.
5.5. Timpul pentru nottoarele cu vrsta cuprins ntre 9 i 10 ani pe distana de 50 metrii, stilul fluture, este aproximativ normal distribuit cu media 49,4 secunde i abaterea standard de 2,8 secunde. 1. s se gseasc probabilitatea n cazul unui eantion aleator simplu de 25 de nottoare care s aibe media mai mare de 50,15 secunde. 5.6. S se obin un eantion aleator de mrime 25 cu media x = 83,4 i abaterea medie ptratic = 12 , dintr-o populaie cu o distribuie normal dac media colectivitii generale este x 0 = 83. 5.7. n tabelul urmtor sunt prezentai numrul de enoriai ai unei biserici ortodoxe pe grupe de vrst:
Vrsta (ani) Sub 20 21-50 peste 50 Numr de enoriai 274 526 345
Se cere: 1. dac se efectueaz o selecie stratificat de volum n=100, s se determine numrul de enoriai care trebuie s fac parte din fiecare strat; 2. aceeai cerin n cazul n care se cunosc abaterile standard ale celor trei straturi: 1 = 1,2; 2 = 4,8; 3 = 2,3.
Se cere: 1. dac se utilizeaz selecia stratificat de volum n=200, care va fi mrimea fiecrui strat?
5.10. Un eantion de 500 de familii chestionate n legtur cu nivelul mediu al cheltuielilor destinate produselor alimentare se prezint astfel:
Cheltuieli pentru alimente (mii lei) Sub 500 500-800 600-900 900-1200 peste 1200 Total Numr de persoane 80 120 150 100 50 500
1. s se determine coeficientul de asimetrie al repartiiei; 2. dac cele 500 de familii sunt considerate ca fiind o colectivitate general din care se extrege un eantion aleator i nerepetat cu ( z ) = 0,8064; z = 1,3 , s se deteremine mrimea eantionului.