Sunteți pe pagina 1din 20

Statistic teoretic i economic

CAPITOLUL 5.

CERCETAREA SELECTIV
Cuvinte cheie: - cercetarea selectiv - sondajul - selecia simpl repetat (urna cu bil revenit). - selecia simpl nerepetat (urna cu bil nerevenit), - reprezentativitatea eantionului - eroare de reprezentativitate - eroare medie de reprezentativitate - eroarea limit admis n societatea contemporan, cea mai mare parte a informaiilor despre mediul de afaceri este obinut nu prin nregistrri exhaustive, ci prin investigaii pariale, cunoscute sub numele de anchete statistice. Ele sunt preferate ca urmare a faptului c ofer informaii suficient de corecte ntr-un timp relativ scurt, astfel nct managerul unei ntreprinderi sau omul de afaceri poate valorifica n timp real o oportunitate sau poate evita, elimina sau mcar reduce o parte din riscurile implicrii n circuitul economic. n prezentul capitol sunt prezentate fundamentele sondajului statistic ca instrument metodologic de realizare a anchetelor n rndul ntreprinderilor, al menajelor, al consumatorilor, al privitorilor la emisiunile TV, al asculttorilor de radio etc. Parcurgnd acest capitol, economistul are posibilitatea de a nelege avantajele i inconvenientele sondajului statistic, etapele acestei forme de cercetare a realitii economice, principalele procedee de eantionare, precum i modul de calcul al indicatorilor specifici celor mai frecvent utilizate tipuri de selecie. Sunt artate, de asemenea, modalitile de extindere a rezultatelor sondajului asupra ntregii colectiviti supuse cercetrii, precum i cile de determinare a volumului necesar al eantionului ntrun sondaj statistic. Nu ntotdeauna este posibil sau rentabil (cost, durat) s facem o cercetare exsuasiv. n aceste condiii folosim cercetarea selectiv. Cercetarea selectiv presupune culegerea i prelucrarea datelor referitoare la o parte a colectivitii generale, iar rezultatele obinute se extind asupra ntregului obiect al cunoaterii pentru a obine o caracterizare satisfctoare. Este necesar ca partea observat (eantion, mostr, prob, selecie) s fie reprezentativ adic s reproduc la scar redus trsturile eseniale ale colectivitii ntregi. Sondajul este o form a cercetrii statistice realizat pe baza unei pri reprezentative din populaia (colectivitatea general) studiat. El presupune urmtoarele etape consecutive: 1) extragerea unui eantion reprezentativ din colectivitatea general (eantionarea) i culegerea de date despre despre elementele extrase (obserarea eantionului); 2) descrierea statistic a eantionului prin indicatori specifici fiecrei caracteristici nregistrate n cadrul programului de observare (obinerea estimatorilor); 3) extinderea rezultatelor obinute la nivel de eantion asupra colectivitii generale (estimarea parametrilor colectivitii generale = inferena statistic).

Statistic teoretic i economic


Dup scopul urmrit, sondajul statistic poate fi: sondaj descriptiv ntreprins n vederea estimrii parametrilor ce caracterizeaz o populaie; sondaj analitic realizat pentru verificarea (testarea) unor ipoteze statistice. Realizarea sondajului are rost numai dac volumul eantionului (n) este mult mai mic dect volumul colectivitii generale (N) din care a fost extras. Eantionul (mostra, proba, colectivitatea de selecie) este o submulime a populaiei statistice, astfel extras (obinut) nct s reprezinte principalele trsturi ale colectivitii generale. Colectivitatea general (populaia) este alctuit din totalitatea unitilor (a elementelor simple sau complexe) a cror mulime formeaz fenomenul/procesul supus analizei. Deoarece din ntreaga populaie se extrage un numr de elemente, ea se mai numete i baz de sondaj. Att colectivitatea general, ct i eantionul se caracterizeaz prin indicatori statistici. Dac cercetarea este exhaustiv, indicatorii se mai numesc i parametrii colectivitii generale. n cadrul sondajului statistic, parametrii se estimeaz cu ajutorul indicatorilor specifici eantionului, numii din acest motiv i estimatori. n Tabelul nr. 5.1 se prezint sistemul uzual de notaii pentru parametrii colectivitii generale i estimatorii lor n cadrul unui eantion. Avantaje cercetarii selective: mai ieftin, mai operativ, mai exact pentru c se face pe un numr redus de elemente; poate fi mai bogat, complet fa de cercetarea total; rezultatele cercetrii selective pot fi verificate dac este necesar prin alt cercetare selectiv sau printr-o cercetare total (invers nu); se folosete cnd se presupune distrugerea elementelor n cazul cercetrii. Noiuni fundamentale flosite n cercetarea selectiv Sunt de fapt noiuni perechi care vizeaz colectivitatea general pe de o parte i eantionul pe de alt parte.
colectivitate general N (volumul) x 0 (media)
2 0

eantion n (volumul) x (media) 2 (dispersia) w = m/n


2 w (1 w)

(dispersia)

p2 = M/N (pt. car. alternativ)

(1 p)
2 p

n general nu se cunosc aspecte legate de colectivitatea general. Cercetartea selectiv este folosit pentru a estima pe baza eantionului parametrii colectivitii generale.

Statistic teoretic i economic


5.1.Procedee de selecie Se recomand alegerea procedeului de selecie n funcie de mrimea (N) a colectivitii generale i n funcie de omogenitatea sau eterogenitatea acesteia. Dac colectivitatea general este omogen putem folosi: procedeul loteriei procedeul tabelului cu numere ntmpltoare sau un program pe calculator de generare de numere ntmpltoare; procedeul mecanic sau al pasului de numrare. Dac colectivitatea general este eterogen se recomand folosirea selectiei dirijate pentru a asigura reprezentativitatea eantionului (procedeul seleciei stratificate, selecie tipic). Dac colectivitatea general este alctuit din uniti complexe numite i serii (de ex. populaia alctuit pe familii, locurile de mrfuri grupate pe palei etc.) se recomand procedeul seleciei de serie. Procedeul loteriei. Se aplic n cazul colectivitii generale de volum mic, relativ omogen. Aplicablitatea const n numerotarea de la 1 la N a tuturor elementelor din colectivitatea general (ceea ce uneori este incomod) confecionnd jetoane sau bile absolut de aceleai dimensiuni, care se introduc ntr-o urn i se amestec nainte de fiecare extragere. Extragerea poate fi efectuat n dou variante: selecia simpl repetat (urna cu bil revenit). n acest caz, la fiecare extragere exist o aplicabilitate de 1/N de a intra n alctuirea eantionului. Folosind aceast variant se pot forma foarte multe eantioane diferite avnd acelai volum, dar posibilitatea includerii a unui acelai element face ca reprezentativitatea includerii a unui acelai element face ca reprezentativitatea eantionului s fie redus. selecia simpl nerepetat (urna cu bil nerevenit), prin care probabilitatea includerii n eantion crete, treptat pe msura extragerii elementelor. La extragerea I, probalilitatea extrageriiv este 1/N; la extragerea a II-a probalilitatea extragerii este de 1/(N-1) si asa mai departe; la ultima extragere, probalilitatea va fi: 1/[N (n+1)]. Aceste eantioane se bucur de o mai mare reprezentativitate, iar numrul lor este CnN (mult mai mic dect la selecia repetat Nn). Pentru a evita constituirea urnelor cu bile se poate folosi fie tabele cu numere ntmpltoare, fie un program de calculator care s genereze numere ntmpltoare. Procedeul mecanic sau al pasului de numrare. Acest procedeu este foarte operativ dar nu asigur o selecie strict aleatoare, doar primul element din eantion se extrage la ntmplare, restul intrnd n componena eantionului ca urmare a poziiei ocupate. tiind c exist N elemente n colectivitatea general i c eenationul trebuie s fie de n elemente, se calculeaz k; k = N/n, adic pasul de numrare. Din primele k elemente se extrage, la ntmplare, unul, acesta devenind primul element al eantionului. Numrul de ordine al celorlate elemente se afl adunnd succesiv k. Dac elementele colectivitii generale sunt eterogene, constatndu-se o anumit stratificare a colectivitii generale se recomand s fie folosit o selecie dirijat

Statistic teoretic i economic


(nealeatoare) pentru a asigura ptrunderea n eantion a unor elemente din toate straturile tipice. O asemenea selecie dirijat este selecia stratificat sau selecia tipic: dup stabilirea volumului n al eantionului se stabilete componena pe straturi (numr de elemente din fiecare strat), astfel nct structura eantionului s corespund structurii colectivitii generale. Pentru extragerea separat din fiecare strat a numrului corespunztor de elemente, se utilizeaz unul din procedeele aleatoare de mai sus. Selecia de serii (sau de uniti complexe) reprezint un alt procedeu de selecie. Pentru colectivitatea organizat pe uniti complexe (populaia organizat pe familii) se recomand s nu distrugem aceste structuri pentru a extrage uniti simple, ci s preferm extragerea de uniti complexe sau extragerea de serii.
5.2.Reprezentativitatea eantionului. Reprezentativitatea eantionului inseamna capacitatea acestuia de a reda trsturile eseniale ale colectivitii generale din care s-a extras chiar dac volumul eenationului este mult mai mic dect volumul colectivitii din cade s-a extras. Dintre metodele de exprimare a reprezentativitii eantionului cele mai frecvente se refer la compararea structurii eantionului cu structura colectivitii generale sau la compararea mediei eantionului x cu media colectivitii generale x 0, la una sau mai multe caracteristici cunoscute, nregistrarea att pe eantion ct i la colectivitatea general. De exemplu compararea mediei de vrst a eantionului cu media de vrst a ntregii ri. Se ntmpl, n unele cazuri, s nu se cunoasc nimic despre colectivitatea general. n acest caz cnd nu este posibil compararea cu parametrii colectivitii generale, se recomand extragerea a cel puin dou eantioane diferite din aceeai colectivitate general i compararea mediilor sau structurilor acestor eantioane. Dac ele nu difer semnificativ, atunci oricare dintre eantioane poate fi folosit pentru a estima parametrii colectivitii generale. 5.3.Calculul indicatorilor de selecie i extinderea rezultatelor pentru principalele tipuri de selecie. Diferena dintre media eantionului i media colectivitii generale se numete eroare de reprezentativitate. n domeniul social economic se consider c eantionul este x x0 reprezentativ ct timp aceast diferen este mai mic de 5% 100 x fa de 0 media colectivitii generale. Eroarea de reprezentativitate este determinat fie de cauze sistematice (voite sau ntmpltoare) care duc la alctuirea unui eantion dup criterii subiective, fie de abateri (erori) aleatoare. Dac se iau n considerare toate eantioanele de un anumit volum n, obinute prin acelai procedeu de extragere, se constat mediile acestor eantioane ( x i) se distribuie normal fa de valoarea pe care o nregistreaz media colectivitii generale ( x 0). Eantioanele avnd media identic egal cu x 0 sunt cele mai frecvente. Se numete eroare medie de reprezentativitate abaterea medie ptratic a mediilor de eantionare fa de x 0 . Pentru a putea calcula aceast valoare medie de

Statistic teoretic i economic


reprezentativitate (x pentru variabila numeric i w pentru variabila alternativ) ar trebui s avem toate mediile de eantioane posibile i frecvenele lor de apariie.

x =

(x x f
i i

2 0

fi

De obicei nu se cunoate dect un singur eantion. Se poate face ns calcul anticipat al lui x pornind de la relaia dintre dispersia colectivitii generale (20), ptratul erorii medii de reprezentativitate x2 i volumul eantionului. n cazul seleciei simple repetate aceast relaie este:
2 2 0 = x n

, adic eroarea medie de reprezentativitate este direct n proporional cu dispersia colevtivitii generale i invers proporional cu volumul eantionului. Dac nu se cunoate 20 se accept c dispersia unicului eantion cunoscut 2 ofer o marj satisfctoare a mprtierii elementelor colectivitii dac eantionul este convenabil de mare. Totui se face o corecie cu 1, adic: . n 1 Dac se folosete o variabil alternativ, eroarea medie de reprezentativitate se stabilete potrivit acelorai relaii, adic atunci cnd se cunoate dispersia colectivitii generale: p (1 p ) w = n iar, dac nu se cunoate dect eantionul, atunci:

ceea ce nseamn c x =

2 0

x =

w =

w(1 w) n 1

Aceste relaii sunt pentru selecia simpl repetat (mecanic) Dac se practic selecia simpl nerepetat, eantioanele sunt mai reprezentative dect la selecia repetat, se introduce un coeficient de corecie pentru a estima eroarea medie de reprezentativitate: - pentru selecia nerepetat, variabil numeric:

x =

n 1 n 1 N

2 0

x =

2 0

n 1 n N

Statistic teoretic i economic


pentru o caracteristic alternativ:

w =

w(1 w) n 1 n 1 N

n practica economic nu intereseaz eroarea medie de reprezentativitate, ci eroarea maxim (abaterea maxim) sau eroarea limit ce poate apare la estimare pentru o anumit probabilitate. Deoarece aceast eroare este diferena dintre x i x 0 ne folosim de proprietile repatiiei normale pentru a asocia diverse mrimi ale erorii cu probalilitile aferente.
Eroare limit se calculeaz: pentru variabil numeric:

x = z x
pentru variabila alternativ:

w = z w
Exist tabele ale repartiiei normale care ne arat relaia dintre coeficientul de multiplicare z sau t sau probabilitatea (z) sau (t) corespunztoare. Eroarea limit arat diferena maxim n plus sau n minus care poate surveni la o anumit probabilitate (z), z fiind utilizat n calculul erorii limit. Necunoscnd parametrii colectivitii generale, rezult c pentru o variabil numeric x 0 x x , iar pentru o variabil alternativ avem p (w w ) cu

probabilitatea corespunztoare. (z) = funcia de probabilitate cu care se genereaz rezultatele z = coeficientul funciei de probabilitate. Eroarea limit se poate mri sau micora fie prin modificarea volumului eantionului (n), fie prin modificarea probabilitii cu care se garanteaz rezultatele, deoarece dispersia colectivitii totale rmne aceeai. Dup modul n care se combin sistemul de organizare, felul unitilor de selecie i procedeul de selecie folosit, n cercetarea activitii economice i sociale, se disting urmtoarele tipuri de selecie: - selecie ntmpltoare simpl; - selecie mecanic; - selecie tipic (stratificat); - selecia de serii. Pentru fiecare tip de selecie se calculeaz trei indicatori: eroarea de medie de reprezentativitate, eroarea limit i volumul eantionului. Selecia ntmpltoare simpl este utilizat n special pentru colectiviti formate dintr-un numr de uniti simple i care se caracterizeaz printr-un anumit grad de omogenitate. Erorile de reprezentativitate sunt mari n raport cu alte tipuri de selecie,

Statistic teoretic i economic


deoarece dispersia folosit msoar variaia total a caracteristicii datorat cauzelor care influeneaz. Deoarece, n practic, se lucreaz cu o eroare limitat, calculul volumului eantionului (n) se face flosind formula erorii limit. - selecia ntmpltoare simpl repetat:
x = z x = z =z
2 x 2 2 0

2 0

2 z 0 z 2 i2 n= 2x 2x 2

selecia ntmpltoare simpl nerepetat:

x = z x = z

2 0

n 1 n = n N

2 z2 0 z 2 i2 2 z2 0 z 2 i2 2 x + 2x + N N

n mod similar se procedeaz i n cazul caracteristicii alternative. Urmtorul tabel sintetizeaz eroarea medie de reprezentativitate, eroarea limit i volumul eantionului pentru caracteristica numeric i pentru cea alternativ n cazul seleciei repetate i a seleciei nerepetate:
Indicatorul err. medie de reprezentativitate err. limit volumul eantionului selecia repetat 2 2 0 i x = n n 1 Caracteristica nealternativ (numeric) selecia nerepetat 2 2 0 i n n x = 1 1 n N n 1 N

x = z z n= z 2x
2 2 0

x = z x z 2x
2 2 i

n=

2 0 z 2 2 0 N

0 i

2 x +

2 z2 i 2 x + N

Indicatorul selecia repetat err. medie de reprezentativitate

Caracteristica alternativ selecia nerepetat

2 p (1 p ) n

w(1 w) n 1

w =

p (1 p ) n 1 n N
2 p (1 p )

w(1 w) n 1 n 1 N
2 w(1 w) 2 z w(1 w) N

err. limit volumul eantionului

w = z w
n= z 2 p (1 p ) z 2 w 2 w(1 w) 2 w

w = z w
n= z z 2 p (1 p ) 2 w + N z 2 w +

Statistic teoretic i economic


Selecia mecanic se folosete atunci cnd se combin cu alte tipuri de selecie. Pentru calculul erorilor de selecie se folosesc formulele de la seleia ntmpltoare simpl repetat. Acest tip de selecie se aplic la cercetrile de laborator i la estimarea recoltei medii la hectar a produciei agricole nainte de recoltare. Selecia tipic (stratificat) se aplic cel mai frecvent n studiul fenomenelor economico-sociale care au fost, n prealabil, mprtite n grupe omogene (straturi sau tipuri) dup o caracteristic esenial. selecia tipic simpl caracterizat prin faptul c extragerea unitilor din fiecare grup se face la ntmplare fr a se ine seama de ponderea unitilor din fiecare grup a colectivitii generale. selecia tipic proporional este selecia la care volumul subeantioanelor difer n raport cu ponderea pe care o are fiecare grup n colectivitatea general i se respect proporia de selecie. selecia tipic optim se caracterizeaz prin faptul c la formara eantionului se ia n considerare ponderea pe care o au grupele n colectivitatea general i mrimea variaiei din interiorul grupelor msurat prin abaterea medie ptratic. n general, se poate spune c selecia tipic d cele mai mici erori n activitatea practic dar este greu de aplicat. Selecia de serii se folosete cnd colectivitatea general este format din uniti complexe numite i serii (echipe, brigzi, magazine etc.). Aceste uniti sunt formate din uniti simple care prezint caracteristici ce le deosebesc una de alta, adic au un caracter eterogen, n raport cu unitile componente ale grupelor tipice care se caracterizeaz prin omogenitate. Caracteristic pentru acest tip de selecie este faptul c n locul variantelor concrete ale caracteristicilor de la sondajele bazate pe uniti simple se vor folosi indicatori de selecie calculai la nivelul seriei. Cerina reprezentativitii se va asigura prin apropierea mediilor din seriile de uniti selectate de mediile din seriile colectivitii generale. Pentru extinderea rezultatelor asupra ntregii colectiviti se folosesc dou procedee: procedeul coeficientului de corecie se folosete de obicei la verificarea autenticitii datelor culese dintr-o observare, total. procedeul extinderii directe se utilizeaz la caracterizarea fenomenelor pentru care nu dispunem de informaii prin observarea total. n esen acest procedeu const n estimarea parametrilor colectivitii generale pe baza rezultatelor seleciei statistice.
x x < x0 < x + x

Pentru a ilustra valenele cognitive ale indicatorilor prezentai mai sus, s acceptm c responsabilul departamentului de resurse umane dintr-o corporaie multinaional avnd N = 4000 de angajai direct operativi a decis realizarea unui studiu cu privire la nevoile de formare profesional continu ale acestei categorii de salariai i disponibilitatea lor de a participa la astfel de programe. Pentru a rspunde acestei decizii, consiliul director al corporaiei aprob organizarea unui sondaj statistic n rndul salariailor, volumul eantionului fiind de n = 100 de persoane. Asigurarea reprezentativitii eantionului de numai 2,5% din totalul

Statistic teoretic i economic


n salariailor direct operativi 100 = 2,5% s-a fcut prin luarea n considerare a N vrstei, precum i a structurii socio-profesionale a ntregului personal operativ. n cadrul programului de observare selectiv, ntre alte caracteristici urmrite, se nregistreaz vrsta salariailor (exprimat n ani de via mplinii), precum i interesul (disponibilitatea) acestora de a participa la un program de formare profesional continu. n tabelul de mai jos se prezint rezultatul gruprii n funcie de vrst a celor 100 de persoane din eantionul extras aleator i nerepetat. Repartiia personalului cuprins n eantion n funcie de vrst
Grupe de vrst (ani mplinii) Sub 25*) 25 35 35 45 45 55 peste 55 Total
*)

Numr personal

17 30 25 18 10 100

Limita superioar nu este cuprins n interval.

Prelucrarea datelor referitoare la aceast caracteristic numeric (vrsta personalului), permite constatarea c la nivelul eantionului, vrsta medie este de: xi ni = 3740 = 37,4 ani, x= ni 100 iar dispersia n jurul mediei eantionului este:

(x x ) n = n
2 i i

14924 = 149,24 . 100

Observaii: 1) Eantionul este destul de omogen (v = 32,7%) pentru a putea considera c media de 37,4 ani caracterizeaz corect vrsta tuturor celor 100 de persoane nregistrate. 2) Dac media nu este reprezentativ la nivelul eantionului (v>>35%), nu are sens s se mai continue cercetarea printr-o eventual tentativ de extindere a acestui indicator (deja nereprezentativ la nivel restrns) asupra colectivitii generale.

ntre rspunsurile nregistrate de la cele 100 de persoane cuprinse n sondaj se mai constat c 82 sunt dornice s participe la un program de formare continu, n timp ce restul de 18 persoane resping oportunitatea oferit de angajator. Aceast caracteristic alternativ, prezint o medie de: m 82 w= = = 0,82 n 100 i o dispersie de: 2 w = w(1 w) = 0,82 0,18 = 0,1476 Dac s-ar fi utilizat procedeul extragerii mecanice sau procedeul extragerii repetate, atunci pentru calculul erorii medii de reprezentativitate a unui (oricrui) eantion de volum n=100 s-ar fi aplicat relaiile [5.4] pentru caracteristica numeric i [5.6] pentru cea alternativ. Cum sondajul a avut n vedere extragerea nerepetat (pentru a spori

Statistic teoretic i economic


reprezentativitatea eantionului), se aplic relaiile [5.4] i, respectiv [5.6], obinnduse:
y

pentru caracteristica numeric:

n 100 149,24 = 1,21 ani, 1 = 1 n 1 N 100 1 4000 ceea ce nseamn c media unui eantion de volum n = 100 obinut prin extragere aleatoare nerepetat se abate n medie cu 1,2 ani (+) fa de vrsta medie real ( x0 ) a celor 4000 de persoane angajate de corporaie;

x =

pentru caracteristica alternativ:

w(1 w) n 100 0,1476 = 0,038 1 1 = n 1 N 100 1 4000 Rezultatul indic o abatere medie cu +3,8% a proporiei personalului dornic de a participa la formarea profesional continu cuprins n eantion, fa de proporia real M p= n rndul ntregului personal al corporaiei. N

w =

n practica economic nu intereseaz, de obicei, eroarea medie de reprezentativitate a eantionului, ci abaterea maxim sau eroarea limit ce poate apare ca diferen ntre media unui eantion (estimator) i media colectivitii generale (parametru) la estimarea acestuia cu o anumit probabilitate. Deoarece eroarea limit este diferena dintre x i x 0, ne folosim de proprietile repatiiei normale pentru a asocia diverse mrimi ale erorii cu probalilitile aferente msurate ca (sub) multipli ai abaterii standard a mediilor de eantionare fa de x0 . Eroarea limit se calculeaz astfel: pentru variabil numeric: x = z x pentru variabila alternativ: [5.8] [5.7]

w = z w

Exist tabele ale repartiiei normale care exprim relaia dintre argumentul z sau t i funcia de probabilitatea (z) sau (t) corespunztoare. n exemplul considerat, eroarea limit pentru o probabilitate (z) = 0,95 (z = 1,96) este: y pentru caracteristica numeric, de aproximativ 2,4 ani: x = z x = 1,96 1,21 = 2,37 ani 2,4 ani,

Statistic teoretic i economic


Semnificaia rezultatului: distana maxim ce poate exista ntre media eantionului ( x0 ) este de +2,4 ani, aceast afirmaie fiind valabil cu o probabilitate de 0,95 (se accept un prag de eroare =0,05);
y pentru caracteristica alternativ: w = z w = 1,96 0,038 = 0,07448 sau 7,4%.

Interpretarea este asemntoare celei prezentate la x. Diferena maxim ntre w i p (proporia celor nclinai s fac un program de formare contiun n cadrul eantionului w i, respectiv n colectivitatea general - p) este, cu aceeai probabilitate (z) = 0,95 de 7,4%.
Observaii: 1. Un tabel cu valorile funciei Gauss Laplace corespunznd diferitelor valori ale lui z se gsete n volumul Bazele statisticii pentru economiti. Aplicaii. Bucureti, Editura Tribuna Economic, 2002, p. 259-260. 2. Dac s-ar fi folosit extragerea mecanic, sau extragerea repetat, eroarea limit era ceva mai mare: x = 2,41 ani (fa de 2,37 ani); w = 7,6% (fa de 7,4%). Coeficientul de corecie aplicat n cazul sondajului nerepetat este ntotdeauna o mrime subunitar care restrnge mrimea erorii medii de reprezentativitate i, respectiv, a erorii limit, oferind o estimare mai exact a parametrilor colectivitii generale. 3. Nu este obligatoriu ca probabilitatea cu care se estimeaz diveri parametrii ai colectivitii generale s fie aceeai la toate variabilele cerectate.

Statistic teoretic i economic Probleme i aplicaii.


5.1. Un echipament de ambalare este astfel reglat nct s mpacheteze cte 20 de bomboane cu o toleran de 1 bucat. Pentru a aprecia calitatea reglajului, din producia unei zile s-a prelevat prin extragere mecanic un eantion de 150 pachete care conineau n total 3015 bomboane n loc de 3000 bomboane. Din cercetarea eantionului rezult c n jurul mediei de 20,1 bomboane/pachet, intensitatea mprtierii era de 7,2%, n condiiile n care 129 pachete conineau exact 20 bomboane, 12 pachete aveau 21 sau mai multe bomboane, iar 9 pachete erau cu 19 sau mai puine bomboane. Se cere: S se estimeze cu o probabilitate (z) = 0,9973 (z = 3) numrul total de bomboane ambalate n lotul de N = 3000 pachete realizate n cursul zilei i s se observe dac echipamentul se ncadreaz n tolerana admis. Rezolvare: Din enunul problemei rezult c eantionul se caracterizeaz prin: Volumul n = 150 pachete; Media x = 20,1 bomboane/pachet; Abaterea standard = 1,4472 bomboane/pachet (din relaia coeficientului de

100 = 7,2% ) x Pe baza acestor date, se poate estima eroarea medie de reprezentativitate, tiind c n cazul extragerii mecanice se aplic relaia de la sondajul simplu, aleator, repetat:

variaie v =

x =

2
n

2,0944 = 0,118 bucati 150

Un eantion de 150 produse prelevate mecanic din producia zilei, prezint, n medie, o abatere cu 0,118 bomboane/pachet fa de numrul mediu ( x0 ) ce caracterizeaz ntrega producie. Eroarea limit pentru (z) = 0,9973: x = z x = 3 0,118 = 0,35 bucati Numrul mediu de bomboane/pachet n producia zilei se situeaz, cu probabilitatea de 0,9973 n intervalul: x0 ( x x ), adica, x 0 ( 20,1 0,35) Prin urmare: 19,75 x 0 20,45 , ceea ce, aplicat ntregii producii a zilei conduce (prin multiplicarea cu N = 3000) la un numr total (T) de bomboane ambalate de: 59250 T 61350 , cu (z) = 0,9973, n condiiile n care reglajul trebuia s ncadreze acest numr ntre (20-1)3000 = 57.000 buci i (20+1)3000 = 63.000 buci.

Statistic teoretic i economic


ntruct intervalul de estimare (59.250, 61.350) este mult mai mic dect tolerana admis (57.000, 63.000), rezult c reglajul este corespunztor. Rspuns: Numrul total de bomboane ambalate este situat, cu (z) = 0,9973 ntre 59.250 i 61.350 buci. Echipamentul se ncadreaz n tolerena admis. Ct de mare ar trebui s fie un eantion, dac numrul mediu de bomboane/pachet ar trebui estimat cu (z) = 0,9545 (z = 2) n limitele unui interval de 0,5 buci?
Rezolvare:

n=

z 2 2 4 2,0944 = = 33,5104 34 pachete . 2x 0,52

Rspuns: Pentru a rspunde unei astfel de exigene, ar fi suficient s se preleve prin extragere mecanic doar 34 pachete, ceea ce la o producie total de 3000 pachete N nseamn un pas de numrare 88 . n S se observe n eantionul de 150 pachete, cota de produse care nu ndeplinesc cerina de 20 bomboane/pachet i s se estimeze cu (z) = 0,90 (z = 1,65) cota minim i maxim, precum i numrul minim i maxim de pachete necorespunztoare din punct de vedere al coninutului n producia unei zile. Rezolvare: Din 150 pachete prelevate, 12+9 = 21 pachete conin fie mai multe, fie mai puine produse dect numrul standard de 20 bomboane/pachet. 2 ) caracteristicii alternative n cadrul eantionului, media (w) i dispersia ( w sunt:

m 21 = = 0,14 , ceea ce nseamn c 14% din eantion nu corespunde n 150 standardului de ambalare. w=
2 w = w(1 w) = 0,14 0,86 = 0,1204

Eroarea medie de reprezentativitate a unui eantion de volum 150 obinut prin prelevare mecanic este de:

w =

2 w

0,1204 = 0,0283 sau 2,83% 150

Un eantion de volum 150 prelevat mecanic se caracterizeaz, n medie, printr-o cot de produse necorespunztoare cu 2,83% mai mare sau mai mic dect cota parte specific ntregii producii a unei zile. Eroarea limit pentru o probabilitate de 0,90 este de:

Statistic teoretic i economic


w = z w = 1,65 0,0283 = 0,0467 sau 4,7% . La probabilitatea menionat, abaterea maxim a unui eantion de volum 150 prelevat mecanic fa de cota real de produse necorespunztoare din producia unei zile este 4,7%. n aceste condiii, la (z) = 0,90, cota minim i maxim de defecte n producia zilei este cuprins n intervalul: p ( w w ), adica : p (0,14 0,047) sau: 0,093 p 0,187 , cu (z) = 0,90. Numrul minim i maxim de pachete necorespunztoare (M) n producia unei zile se obine nmulind cu N = 3000 limitele intervalului n care se ncadreaz cota de defecte: 279 M 561 pachete, cu (z) = 0,90. Cel puin 279 pachete i cel mult 561 pachete din lotul fabricat de 3000, cuprinde mai mult sau mai puin de 20 bomboane/pachet, cu o probabilitate de 0,90 (sau cu o marj de eroare acceptat de 1-0,90 = 0,10 sau 10%). Avnd n vedere c un client nu va reclama dect n situaia n care obine mai puine bomboane dect numrul de 20 (care apare nscris pe pachet), se cere refacerea calculelor, considernd c m = 9 pachete din 150 verificate. Rspuns: w = 0,06; w(1-w) = 0,0564; w = 0,02; w = 0,03; 0,03 p 0,09 ; 90 M 270 pachete, cu ( z ) = 0,9 .
5.2. Dintr-o comand de 1000 piese, se prelev un eantion de 65 piese prin extragere aleatoare, simpl, nerepetat. Potrivit comenzii, fiecare pies ar trebui s cntreasc 85 grame. Dup examinarea eantionului, se constat c greutatea medie a pieselor este de 87,2g, dispersia eantionului fiind de 70,6746, abaterea standard de 8,4g, coeficientul de variaie 9,6%. ntre piesele eantionului se afl 26 piese cu greutatea mai mare dect cea prevzut de comand. Se cere: Estimarea cu (z) = 0,9545 (z = 2) limitele intervalului n care se nscrie greutatea medie a celor 1000 piese din lot. Rezolvare: Eroarea medie de reprezentativitate n cazul sondajului aleator, simplu, nerepetat, se estimeaz astfel:

x =

n 70,6746 65 1 = 1 = 1,0083 g n N 65 1000

Statistic teoretic i economic


Eroarea limit: x = z x = 2 1,0083 2,02 g , pentru (z) = 0,9545 Intervalul n care se nscrie greutatea medie a tuturor pieselor cu probabilitatea menionat este: x 0 (87,2 2,02) 85,18 x 0 89,22 g Estimarea cu (z) = 0,90 (z = 1,65) a cotei maxime de produse cu greutatea depit. Rezolvare:

w =

2 w

n 2 1 , unde w = w(1 w) = 0,4 0,6 = 0,24 n N

w = 0,059 sau 5,9%


w = z w = 1,65 0,059 = 0,097 sau 9,7% Cota maxim este, de fapt, limita superioar a intervalului n care se nscrie p, respectiv w + w = 0,4 + 0,097 = 0,497, ceea ce, n mrime absolut, nseamn 497 piese. Ct de mare ar trebui s fie eantionul extras prin acelai procedeu pentru o nou cercetare, dac ar trebui s se estimeze cota minim i maxim cu probabilitatea (z) = 0,9545 (z = 2) n limitele unui interval de 5%, respective 0,05.
Rspuns:
n=
2 4 0,24 z2 w = = 974,62 975 piese 2 2 2 z w 0,05 + 0,00096 2 w + N

Cu acest rezultat, locul cercetrii selective este luat de examinarea integral a lotului comandat.
5.2.n rndul personalului operativ al unui centru de librrii se efectueaz un sondaj stratificat cu extragere nerepetat. ntre caracteristicile observate pe cele n = 80 de persoane din eantion, se numr vnzrile medii sptmnale (milioane lei) i felul raionului de mrfuri. Rezultatele nregistrrii eantionului se prezint astfel:

Statistic teoretic i economic


Anticariat Vnzri medii (mil lei) Pn la 3 35 57 7 i peste Total Felul raionului de mrfuri Jucrii Librrie Total Papetrie

3 5 2 --10

--3 5 12 20

--12 12 6 30

2 8 10 --20

5 28 29 18 80

Se cere: S se caracterizeze acest eantion. Rezolvare: Vnzarea medie sptmnal realizat de cele 80 persoane este x = 5,5 mil lei. Amplitudinea variaiei este de 6 mil lei, adic 109,09% fa de medie. Acest indicator permite aprecierea c cele 80 de elemente ale eantionului prezint o mprtiere relativ mare (peste 100%). Dispersia eantionului: 2 = 3,05 . Abaterea standard: = 1,7464 mil lei. Coeficientul de variaie: v = 31,75%. n pofida ntinderii relativ mari a mprtierii, colectivitatea este destul de omogen (intensitatea mprtierii este sub 35%). Analiza variaiei vnzrilor medii sptmnale n cadrul celor 4 grupe constituite dup felul mrfurilor comercializate i elementele de calcul pentru verificarea regulii de adunare a dispersiilor sunt prezentate n tabelul 53.2. Pe baza acestei identiti se stabilete n ce msur influeneaz felul mrfurilor variaiei volumului vnzrilor sptmnale.
Raionul j nj

xj
3,8 6,9 5,6 4,8 ---

2 j
1,96 2,19 2,24 1,76 ---

xj x
-1,7 +1,4 +0,1 -0,7 ---

( x j x)2 n j
28,9 39,2 0,3 9,8 78,2

2 j nj
19,6 43,8 67,2 35,2 165,8

Anticariat Jucrii Librrie Papetrie Total

1 2 3 4 ---

10 20 30 20 80

Regula de adunare a dispersiilor: 2 = 2 + 2 , n care:


Dispersia general a eantionului este deja calculat: 2 = 3,05 . Dispersia indus (explicat) de ( x j x ) 2 n j 78,2 2 = = = 0,9775 . n j 80 Dispersia rezidual: =
2

felul

mrfurilor

vndute:

2 n j n j

165,8 = 2,0725 80

Statistic teoretic i economic


Regula se verific: 3,05 = 0,9775 + 2,0725, iar pe baza ei se calculeaz coeficientul de determinaie:
D=
0,9775 2 100 = 100 = 32% 2 3,05

Varietatea mrfurilor comercializate n diferitele raioane ale centrului de librrii explic n proporie de 32% variaia vnzrilor medii sptmnale realizate de cele 80 de persoane din eantion. S se estimeze cu (z) = 0,9545 (z = 2) volumul mediu sptmnal al vnzrilor realizate de ntregul personal operativ al centrului de librrii (N = 760 persoane). Rezolvare: Eroarea medie de reprezentativitate n cazul sondajului stratificat cu extragere nerepetat se determin astfel:

x =

n 1 = n N

2,0725 80 = 0,15 mil lei 1 80 760

Eroarea limit: x = z x = 2 0,15 = 0,3 mil.lei Prin urmare, x 0 (5,5 0,3) cu o probabilitate de 95,45%. Limitele intervalului n care se ncadreaz vnzarea medie sptmnal a celor 760 angajai direct n procesul vnzrii sunt: 5,2 mil lei i, respectiv, 5,8 mil lei. Pe acest temei, managementul acestei firme poate conta sptmnal, cu (z) = 0,9545, pe ncasri situate ntre 3952 i 4408 milioane lei. Ct de mare ar trebui s fie eantionul ntr-o nou cercetare selectiv bazat pe extracia stratificat nerepetat a elementelor componente, dac estimarea ar trebui fcut cu aceeai probabilitate (z) = 0,9545 (z = 2), dar n limitele unui interval de estimare de 0,5 milioane lei? Rspuns:
n= z2 2 2 + z
2 2

4 2,0725 = 31,74 32 persoane 8,28 2 0,5 + 760

Cu ce probabilitate s-ar putea face estimarea limitelor intervalului n care se ncadreaz vnzarea medie sptmnal, dac x = 0,5 mil lei, dar se pstreaz mrimea iniial a eantionului: n = 80 persoane? Rspuns: Prin nlocuire n relaia de mai sus, se obine c z = 3,28, ceea ce corespunde lui (z) = 0,999481 n orice tabel al distribuiei normale.

Statistic teoretic i economic


Revenind la un volum necesar al eantionului de 32 persoane, cum se face stratificarea? Rezolvare: Stratificarea se realizeaz pentru a asigura ptrunderea n eantion a unor elemente din toate tipurile existente n colectivitatea general. Exist mai multe tipuri de stratificare a eantionului: (1) Un procedeu elementar const n stratificarea simpl, respectiv mprirea volumului stabilit al eantionului (n = 32) la numrul grupelor existente n colectivitatea general (r = 4 tipuri de mrfuri comercializate). Prin urmare, cte 32:4 = 8 elemente se vor preleva din fiecare strat, prin extragere nerepetat. Nj specific mulimii (2) Stratificarea proporional ine seama de structura N j ce alctuiete colectivitatea general. n cadrul firmei, personalul operativ (760 persoane) prezint urmtoarea structur: anticariat 9,5% (72 persoane), jucrii 30% (228 persoane), librrie 32,5% (247 persoane), iar n raioanele de papetrie circa 28% (213 persoane). Pentru a transfera aceast structur asupra eantionului, se folosete relaia: Nj nj = n N j Astfel, cele 32 elemente din eantion se repartizeaz dup cum urmeaz: 3 persoane se prelev (prin extragere nerepetat) dintre (cei 72 de) anticari; 10 persoane dintre cele ce comercializeaz jucrii; 10 persoane dintre librari i 9 persoane dintre vnztoarele de la raioanele de papetrie: 3 + 10 + 10 + 9 = 32 persoane. Evident, unele rotunjiri s-au impus fiind vorba de uniti indivizibile (persoane) ale colectivitii generale. (3) Stratificarea optim a eantionului presupune luarea n considerare nu numai a structurii colectivitii generale pe tipuri de activiti ( N j cu j = 1, r ), dar i a dispersiei specifice fiecrei strat ( 2 j ) din colectivitate. Astfel, relaia care se folosete la structurarea eantionului devine:
nj = n N j 2 j N j 2 j

Mai sus s-au artat valorile Nj, iar n tabelul 53.2, coloana a cincea, se afl 2 j . Cu aceste date, pentru aflarea numrului de persoane care urmeaz s intre n alctuirea eantionului din rndul celor care se ocup de anticariat este:
n1 = 32

72 1,96 = 2,88 3 persoane. 1568,6

Statistic teoretic i economic


Pentru celelalte trei grupe rezult, n ordine: 10 persoane; 11 persoane; 8 persoane. 3 + 10 + 11 + 8 = 32 persoane. Observaie: Prelucrarea datelor referitoare la eventualele caracteristici alternative se face n mod asemntor.
5.4. O societate comercial prezint urmtoarea repartiie a personalului su pe grupe de vrst: (date convenionale)
Grupe de vrst (ani) Sub 20 20-30 30-40 40-50 peste 50 Total Numr de persoane 10 30 40 15 5 100

Se cere: 1. s se reprezinte grafic repartiia; 2. se consider c cele 100 de persoane constituie un eantion extras aleator, simplu, nerepetat dintr-o colectivitate general de 1000 persoane; s se determine intervalele de vrst ntre care se situeaz vrsta medie a celor 1000 persoane considerndu-se ( z ) = 0,9545; z = 2.
5.5. Timpul pentru nottoarele cu vrsta cuprins ntre 9 i 10 ani pe distana de 50 metrii, stilul fluture, este aproximativ normal distribuit cu media 49,4 secunde i abaterea standard de 2,8 secunde. 1. s se gseasc probabilitatea n cazul unui eantion aleator simplu de 25 de nottoare care s aibe media mai mare de 50,15 secunde. 5.6. S se obin un eantion aleator de mrime 25 cu media x = 83,4 i abaterea medie ptratic = 12 , dintr-o populaie cu o distribuie normal dac media colectivitii generale este x 0 = 83. 5.7. n tabelul urmtor sunt prezentai numrul de enoriai ai unei biserici ortodoxe pe grupe de vrst:
Vrsta (ani) Sub 20 21-50 peste 50 Numr de enoriai 274 526 345

Se cere: 1. dac se efectueaz o selecie stratificat de volum n=100, s se determine numrul de enoriai care trebuie s fac parte din fiecare strat; 2. aceeai cerin n cazul n care se cunosc abaterile standard ale celor trei straturi: 1 = 1,2; 2 = 4,8; 3 = 2,3.

Statistic teoretic i economic


5.8. Care este valoarea erorii standard a mediei unui eantion de volum n=100, selectat simplu, aleator repetat, dac dispersia este egal cu 25? 5.9. n tabelul urmtor sunt prezentate datele referitoare la localitatea de reziden a studenilor unei faculti economice:
Localizarea geografic Nord est Sud est Sud vest Nord vest Numr de studeni 347 624 196 93

Se cere: 1. dac se utilizeaz selecia stratificat de volum n=200, care va fi mrimea fiecrui strat?
5.10. Un eantion de 500 de familii chestionate n legtur cu nivelul mediu al cheltuielilor destinate produselor alimentare se prezint astfel:
Cheltuieli pentru alimente (mii lei) Sub 500 500-800 600-900 900-1200 peste 1200 Total Numr de persoane 80 120 150 100 50 500

1. s se determine coeficientul de asimetrie al repartiiei; 2. dac cele 500 de familii sunt considerate ca fiind o colectivitate general din care se extrege un eantion aleator i nerepetat cu ( z ) = 0,8064; z = 1,3 , s se deteremine mrimea eantionului.