Sunteți pe pagina 1din 20

Statistic teoretic i economic

CAPITOLUL 5.
CERCETAREA SELECTIV

Cuvinte cheie:
- cercetarea selectiv
- sondajul
- selecia simpl repetat (urna cu bil revenit).
- selecia simpl nerepetat (urna cu bil nerevenit),
- reprezentativitatea eantionului
- eroare de reprezentativitate
- eroare medie de reprezentativitate
- eroarea limit admis

n societatea contemporan, cea mai mare parte a informaiilor despre mediul de
afaceri este obinut nu prin nregistrri exhaustive, ci prin investigaii pariale, cunoscute
sub numele de anchete statistice. Ele sunt preferate ca urmare a faptului c ofer
informaii suficient de corecte ntr-un timp relativ scurt, astfel nct managerul unei
ntreprinderi sau omul de afaceri poate valorifica n timp real o oportunitate sau poate
evita, elimina sau mcar reduce o parte din riscurile implicrii n circuitul economic.
n prezentul capitol sunt prezentate fundamentele sondajului statistic ca
instrument metodologic de realizare a anchetelor n rndul ntreprinderilor, al menajelor,
al consumatorilor, al privitorilor la emisiunile TV, al asculttorilor de radio etc.
Parcurgnd acest capitol, economistul are posibilitatea de a nelege avantajele i
inconvenientele sondajului statistic, etapele acestei forme de cercetare a realitii
economice, principalele procedee de eantionare, precum i modul de calcul al
indicatorilor specifici celor mai frecvent utilizate tipuri de selecie. Sunt artate, de
asemenea, modalitile de extindere a rezultatelor sondajului asupra ntregii colectiviti
supuse cercetrii, precum i cile de determinare a volumului necesar al eantionului ntr-
un sondaj statistic.
Nu ntotdeauna este posibil sau rentabil (cost, durat) s facem o cercetare
exsuasiv. n aceste condiii folosim cercetarea selectiv.
Cercetarea selectiv presupune culegerea i prelucrarea datelor referitoare la o
parte a colectivitii generale, iar rezultatele obinute se extind asupra ntregului obiect al
cunoaterii pentru a obine o caracterizare satisfctoare. Este necesar ca partea observat
(eantion, mostr, prob, selecie) s fie reprezentativ adic s reproduc la scar redus
trsturile eseniale ale colectivitii ntregi.
Sondajul este o form a cercetrii statistice realizat pe baza unei pri
reprezentative din populaia (colectivitatea general) studiat. El presupune urmtoarele
etape consecutive:
1) extragerea unui eantion reprezentativ din colectivitatea general (eantionarea)
i culegerea de date despre despre elementele extrase (obserarea eantionului);
2) descrierea statistic a eantionului prin indicatori specifici fiecrei caracteristici
nregistrate n cadrul programului de observare (obinerea estimatorilor);
3) extinderea rezultatelor obinute la nivel de eantion asupra colectivitii generale
(estimarea parametrilor colectivitii generale = inferena statistic).
Statistic teoretic i economic
Dup scopul urmrit, sondajul statistic poate fi:
sondaj descriptiv ntreprins n vederea estimrii parametrilor ce caracterizeaz o
populaie;
sondaj analitic realizat pentru verificarea (testarea) unor ipoteze statistice.
Realizarea sondajului are rost numai dac volumul eantionului (n) este mult mai mic
dect volumul colectivitii generale (N) din care a fost extras.
Eantionul (mostra, proba, colectivitatea de selecie) este o submulime a
populaiei statistice, astfel extras (obinut) nct s reprezinte principalele trsturi ale
colectivitii generale.
Colectivitatea general (populaia) este alctuit din totalitatea unitilor (a
elementelor simple sau complexe) a cror mulime formeaz fenomenul/procesul supus
analizei. Deoarece din ntreaga populaie se extrage un numr de elemente, ea se mai
numete i baz de sondaj.
Att colectivitatea general, ct i eantionul se caracterizeaz prin indicatori
statistici. Dac cercetarea este exhaustiv, indicatorii se mai numesc i parametrii
colectivitii generale. n cadrul sondajului statistic, parametrii se estimeaz cu ajutorul
indicatorilor specifici eantionului, numii din acest motiv i estimatori. n Tabelul nr. 5.1
se prezint sistemul uzual de notaii pentru parametrii colectivitii generale i estimatorii
lor n cadrul unui eantion.

Avantaje cercetarii selective:
mai ieftin, mai operativ, mai exact pentru c se face pe un numr redus de
elemente;
poate fi mai bogat, complet fa de cercetarea total;
rezultatele cercetrii selective pot fi verificate dac este necesar prin alt cercetare
selectiv sau printr-o cercetare total (invers nu);
se folosete cnd se presupune distrugerea elementelor n cazul cercetrii.

Noiuni fundamentale flosite n cercetarea selectiv
Sunt de fapt noiuni perechi care vizeaz colectivitatea general pe de o parte i
eantionul pe de alt parte.

colectivitate
general
eantion
N (volumul)
0
x (media)
2
0
(dispersia)
n (volumul)
x (media)

2
(dispersia)
p
2
= M/N (pt. car.
alternativ)
) 1 (
2
p
p

w = m/n
) 1 (
2
w
w

n general nu se cunosc aspecte legate de colectivitatea general. Cercetartea
selectiv este folosit pentru a estima pe baza eantionului parametrii colectivitii
generale.


Statistic teoretic i economic
5.1.Procedee de selecie
Se recomand alegerea procedeului de selecie n funcie de mrimea (N) a
colectivitii generale i n funcie de omogenitatea sau eterogenitatea acesteia.
Dac colectivitatea general este omogen putem folosi:
procedeul loteriei
procedeul tabelului cu numere ntmpltoare sau un program pe calculator de
generare de numere ntmpltoare;
procedeul mecanic sau al pasului de numrare.
Dac colectivitatea general este eterogen se recomand folosirea selectiei
dirijate pentru a asigura reprezentativitatea eantionului (procedeul seleciei stratificate,
selecie tipic).
Dac colectivitatea general este alctuit din uniti complexe numite i serii (de
ex. populaia alctuit pe familii, locurile de mrfuri grupate pe palei etc.) se recomand
procedeul seleciei de serie.

Procedeul loteriei.
Se aplic n cazul colectivitii generale de volum mic, relativ omogen.
Aplicablitatea const n numerotarea de la 1 la N a tuturor elementelor din colectivitatea
general (ceea ce uneori este incomod) confecionnd jetoane sau bile absolut de aceleai
dimensiuni, care se introduc ntr-o urn i se amestec nainte de fiecare extragere.
Extragerea poate fi efectuat n dou variante:
selecia simpl repetat (urna cu bil revenit).
n acest caz, la fiecare extragere exist o aplicabilitate de 1/N de a intra n
alctuirea eantionului. Folosind aceast variant se pot forma foarte multe eantioane
diferite avnd acelai volum, dar posibilitatea includerii a unui acelai element face ca
reprezentativitatea includerii a unui acelai element face ca reprezentativitatea
eantionului s fie redus.
selecia simpl nerepetat (urna cu bil nerevenit), prin care probabilitatea
includerii n eantion crete, treptat pe msura extragerii elementelor. La extragerea I,
probalilitatea extrageriiv este 1/N; la extragerea a II-a probalilitatea extragerii este de
1/(N-1) si asa mai departe; la ultima extragere, probalilitatea va fi: 1/[N (n+1)].
Aceste eantioane se bucur de o mai mare reprezentativitate, iar numrul lor este
C
n
N
(mult mai mic dect la selecia repetat N
n
).
Pentru a evita constituirea urnelor cu bile se poate folosi fie tabele cu numere
ntmpltoare, fie un program de calculator care s genereze numere ntmpltoare.
Procedeul mecanic sau al pasului de numrare.
Acest procedeu este foarte operativ dar nu asigur o selecie strict aleatoare, doar
primul element din eantion se extrage la ntmplare, restul intrnd n componena
eantionului ca urmare a poziiei ocupate.
tiind c exist N elemente n colectivitatea general i c eenationul trebuie s
fie de n elemente, se calculeaz k; k = N/n, adic pasul de numrare.
Din primele k elemente se extrage, la ntmplare, unul, acesta devenind primul
element al eantionului. Numrul de ordine al celorlate elemente se afl adunnd succesiv
k.
Dac elementele colectivitii generale sunt eterogene, constatndu-se o anumit
stratificare a colectivitii generale se recomand s fie folosit o selecie dirijat
Statistic teoretic i economic
(nealeatoare) pentru a asigura ptrunderea n eantion a unor elemente din toate straturile
tipice. O asemenea selecie dirijat este selecia stratificat sau selecia tipic: dup
stabilirea volumului n al eantionului se stabilete componena pe straturi (numr de
elemente din fiecare strat), astfel nct structura eantionului s corespund structurii
colectivitii generale. Pentru extragerea separat din fiecare strat a numrului
corespunztor de elemente, se utilizeaz unul din procedeele aleatoare de mai sus.
Selecia de serii (sau de uniti complexe) reprezint un alt procedeu de selecie.
Pentru colectivitatea organizat pe uniti complexe (populaia organizat pe familii) se
recomand s nu distrugem aceste structuri pentru a extrage uniti simple, ci s preferm
extragerea de uniti complexe sau extragerea de serii.

5.2.Reprezentativitatea eantionului.
Reprezentativitatea eantionului inseamna capacitatea acestuia de a reda
trsturile eseniale ale colectivitii generale din care s-a extras chiar dac volumul
eenationului este mult mai mic dect volumul colectivitii din cade s-a extras.
Dintre metodele de exprimare a reprezentativitii eantionului cele mai frecvente
se refer la compararea structurii eantionului cu structura colectivitii generale sau la
compararea mediei eantionului x cu media colectivitii generale x
0,
la una sau mai
multe caracteristici cunoscute, nregistrarea att pe eantion ct i la colectivitatea
general. De exemplu compararea mediei de vrst a eantionului cu media de vrst a
ntregii ri.
Se ntmpl, n unele cazuri, s nu se cunoasc nimic despre colectivitatea
general. n acest caz cnd nu este posibil compararea cu parametrii colectivitii
generale, se recomand extragerea a cel puin dou eantioane diferite din aceeai
colectivitate general i compararea mediilor sau structurilor acestor eantioane. Dac ele
nu difer semnificativ, atunci oricare dintre eantioane poate fi folosit pentru a estima
parametrii colectivitii generale.


5.3.Calculul indicatorilor de selecie i extinderea rezultatelor pentru principalele
tipuri de selecie.
Diferena dintre media eantionului i media colectivitii generale se numete
eroare de reprezentativitate. n domeniul social economic se consider c eantionul este
reprezentativ ct timp aceast diferen este mai mic de 5%

100
0
0
x
x x
fa de
media colectivitii generale.
Eroarea de reprezentativitate este determinat fie de cauze sistematice (voite sau
ntmpltoare) care duc la alctuirea unui eantion dup criterii subiective, fie de abateri
(erori) aleatoare.
Dac se iau n considerare toate eantioanele de un anumit volum n, obinute prin
acelai procedeu de extragere, se constat mediile acestor eantioane ( x
i
) se distribuie
normal fa de valoarea pe care o nregistreaz media colectivitii generale ( x
0
).
Eantioanele avnd media identic egal cu x
0
sunt cele mai frecvente.
Se numete eroare medie de reprezentativitate abaterea medie ptratic a
mediilor de eantionare fa de x
0
. Pentru a putea calcula aceast valoare medie de
Statistic teoretic i economic
reprezentativitate (
x
pentru variabila numeric i
w
pentru variabila alternativ) ar
trebui s avem toate mediile de eantioane posibile i frecvenele lor de apariie.


=
i
i i
x
f
f x x
2
0
(


De obicei nu se cunoate dect un singur eantion. Se poate face ns calcul
anticipat al lui
x
pornind de la relaia dintre dispersia colectivitii generale (
2
0
),
ptratul erorii medii de reprezentativitate
x
2
i volumul eantionului.
n cazul seleciei simple repetate aceast relaie este:

n
x
=
2 2
0


ceea ce nseamn c
n
x
2
0

= , adic eroarea medie de reprezentativitate este direct


proporional cu dispersia colevtivitii generale i invers proporional cu volumul
eantionului.
Dac nu se cunoate
2
0
se accept c dispersia unicului eantion cunoscut
2

ofer o marj satisfctoare a mprtierii elementelor colectivitii dac eantionul este
convenabil de mare. Totui se face o corecie cu 1, adic:

1
2

=
n
x

.
Dac se folosete o variabil alternativ, eroarea medie de reprezentativitate se
stabilete potrivit acelorai relaii, adic atunci cnd se cunoate dispersia colectivitii
generale:
n
p p
w
) 1 (
=

iar, dac nu se cunoate dect eantionul, atunci:

1
) 1 (

=
n
w w
w


Aceste relaii sunt pentru selecia simpl repetat (mecanic)
Dac se practic selecia simpl nerepetat, eantioanele sunt mai reprezentative
dect la selecia repetat, se introduce un coeficient de corecie pentru a estima eroarea
medie de reprezentativitate:
- pentru selecia nerepetat, variabil numeric:

=
N
n
n
x
1
1
2
0

=
N
n
n
x
1
2
0


Statistic teoretic i economic

- pentru o caracteristic alternativ:

=
N
n
n
w w
w
1
1
) 1 (


n practica economic nu intereseaz eroarea medie de reprezentativitate, ci
eroarea maxim (abaterea maxim) sau eroarea limit ce poate apare la estimare pentru o
anumit probabilitate.
Deoarece aceast eroare este diferena dintre x i x
0
ne folosim de proprietile
repatiiei normale pentru a asocia diverse mrimi ale erorii cu probalilitile aferente.

Eroare limit se calculeaz:
pentru variabil numeric:

x x
z =

pentru variabila alternativ:

w w
z =

Exist tabele ale repartiiei normale care ne arat relaia dintre coeficientul de
multiplicare z sau t sau probabilitatea (z) sau (t) corespunztoare.
Eroarea limit arat diferena maxim n plus sau n minus care poate surveni la o
anumit probabilitate (z), z fiind utilizat n calculul erorii limit.
Necunoscnd parametrii colectivitii generale, rezult c pentru o variabil
numeric ( )
x
x x

0
, iar pentru o variabil alternativ avem ( )
w
w p cu
probabilitatea corespunztoare.
(z) = funcia de probabilitate cu care se genereaz rezultatele
z = coeficientul funciei de probabilitate.
Eroarea limit se poate mri sau micora fie prin modificarea volumului
eantionului (n), fie prin modificarea probabilitii cu care se garanteaz rezultatele,
deoarece dispersia colectivitii totale rmne aceeai.
Dup modul n care se combin sistemul de organizare, felul unitilor de selecie
i procedeul de selecie folosit, n cercetarea activitii economice i sociale, se disting
urmtoarele tipuri de selecie:
- selecie ntmpltoare simpl;
- selecie mecanic;
- selecie tipic (stratificat);
- selecia de serii.
Pentru fiecare tip de selecie se calculeaz trei indicatori: eroarea de medie de
reprezentativitate, eroarea limit i volumul eantionului.
Selecia ntmpltoare simpl este utilizat n special pentru colectiviti formate
dintr-un numr de uniti simple i care se caracterizeaz printr-un anumit grad de
omogenitate. Erorile de reprezentativitate sunt mari n raport cu alte tipuri de selecie,
Statistic teoretic i economic
deoarece dispersia folosit msoar variaia total a caracteristicii datorat cauzelor care
influeneaz.
Deoarece, n practic, se lucreaz cu o eroare limitat, calculul volumului
eantionului (n) se face flosind formula erorii limit.
- selecia ntmpltoare simpl repetat:

n
z z
x x
2
0

= =
2
2 2
2
2
0
2 2
0 2 2
x
i
x
x
z z
n
n
z

= =



- selecia ntmpltoare simpl nerepetat:

N
z
z
N
z
z
n
N
n
n
z z
i
x
i
x
x x
2 2
2
2 2
2
0
2
2
2
0
2 2
0
1

= =

n mod similar se procedeaz i n cazul caracteristicii alternative.
Urmtorul tabel sintetizeaz eroarea medie de reprezentativitate, eroarea limit i
volumul eantionului pentru caracteristica numeric i pentru cea alternativ n cazul
seleciei repetate i a seleciei nerepetate:

Caracteristica nealternativ (numeric) Indicatorul
selecia repetat selecia nerepetat
err. medie de
reprezentativitate
1
2 2
0

=
n
i
n
x

=
N
n
n
i
N
n
n
x
1
1
2
1
2
0


err. limit
z x
z =
x x
z =
volumul
eantionului
2
2 2
2
2
0
2
x
i
x
z z
n

=


N
i
z
x
i
z
N
z
x
z
n
2
2 2
0 2
2
0
2
2
2
0
2

=

Caracteristica alternativ Indicatorul
selecia repetat selecia nerepetat
err. medie de
reprezentativitate
1
) 1 ( 2 ) 1 (

=
n
w w
n
p p
w

=
N
n
n
w w
N
n
n
p p
w
1
1
) 1 (
1
) 1 (

err. limit
w w
z =
w w
z =
volumul
eantionului
2
) 1 (
2
2
) 1 (
2
w
w w z
w
p p z
n


=

N
w w z
w
w w z
N
p p z
w
p p z
n
) 1 (
2
2
) 1 (
2
) 1 (
2 2
) 1 (
2

+


+

=

Statistic teoretic i economic
Selecia mecanic se folosete atunci cnd se combin cu alte tipuri de selecie.
Pentru calculul erorilor de selecie se folosesc formulele de la seleia ntmpltoare
simpl repetat. Acest tip de selecie se aplic la cercetrile de laborator i la estimarea
recoltei medii la hectar a produciei agricole nainte de recoltare.
Selecia tipic (stratificat) se aplic cel mai frecvent n studiul fenomenelor
economico-sociale care au fost, n prealabil, mprtite n grupe omogene (straturi sau
tipuri) dup o caracteristic esenial.
selecia tipic simpl caracterizat prin faptul c extragerea unitilor din fiecare
grup se face la ntmplare fr a se ine seama de ponderea unitilor din fiecare grup a
colectivitii generale.
selecia tipic proporional este selecia la care volumul subeantioanelor difer
n raport cu ponderea pe care o are fiecare grup n colectivitatea general i se respect
proporia de selecie.
selecia tipic optim se caracterizeaz prin faptul c la formara eantionului se ia
n considerare ponderea pe care o au grupele n colectivitatea general i mrimea
variaiei din interiorul grupelor msurat prin abaterea medie ptratic.
n general, se poate spune c selecia tipic d cele mai mici erori n activitatea
practic dar este greu de aplicat.
Selecia de serii se folosete cnd colectivitatea general este format din uniti
complexe numite i serii (echipe, brigzi, magazine etc.). Aceste uniti sunt formate din
uniti simple care prezint caracteristici ce le deosebesc una de alta, adic au un caracter
eterogen, n raport cu unitile componente ale grupelor tipice care se caracterizeaz prin
omogenitate.
Caracteristic pentru acest tip de selecie este faptul c n locul variantelor
concrete ale caracteristicilor de la sondajele bazate pe uniti simple se vor folosi
indicatori de selecie calculai la nivelul seriei. Cerina reprezentativitii se va asigura
prin apropierea mediilor din seriile de uniti selectate de mediile din seriile colectivitii
generale.
Pentru extinderea rezultatelor asupra ntregii colectiviti se folosesc dou
procedee:
procedeul coeficientului de corecie se folosete de obicei la verificarea
autenticitii datelor culese dintr-o observare, total.
procedeul extinderii directe se utilizeaz la caracterizarea fenomenelor pentru
care nu dispunem de informaii prin observarea total. n esen acest procedeu const n
estimarea parametrilor colectivitii generale pe baza rezultatelor seleciei statistice.

x x
x x x + < <
0


Pentru a ilustra valenele cognitive ale indicatorilor prezentai mai sus, s
acceptm c responsabilul departamentului de resurse umane dintr-o corporaie
multinaional avnd N = 4000 de angajai direct operativi a decis realizarea unui studiu
cu privire la nevoile de formare profesional continu ale acestei categorii de salariai i
disponibilitatea lor de a participa la astfel de programe.
Pentru a rspunde acestei decizii, consiliul director al corporaiei aprob
organizarea unui sondaj statistic n rndul salariailor, volumul eantionului fiind de n =
100 de persoane. Asigurarea reprezentativitii eantionului de numai 2,5% din totalul
Statistic teoretic i economic
salariailor direct operativi

= % 5 , 2 100
N
n
s-a fcut prin luarea n considerare a
vrstei, precum i a structurii socio-profesionale a ntregului personal operativ.
n cadrul programului de observare selectiv, ntre alte caracteristici urmrite, se
nregistreaz vrsta salariailor (exprimat n ani de via mplinii), precum i interesul
(disponibilitatea) acestora de a participa la un program de formare profesional continu.
n tabelul de mai jos se prezint rezultatul gruprii n funcie de vrst a celor 100
de persoane din eantionul extras aleator i nerepetat.
Repartiia personalului cuprins n eantion n funcie de vrst
Grupe de vrst
(ani mplinii)
Numr personal
Sub 25
*)
25 35
35 45
45 55
peste 55
17
30
25
18
10
Total 100
*)
Limita superioar nu este cuprins n interval.

Prelucrarea datelor referitoare la aceast caracteristic numeric (vrsta personalului),
permite constatarea c la nivelul eantionului, vrsta medie este de:
100
3740
= =

i
i i
n
n x
x = 37,4 ani,
iar dispersia n jurul mediei eantionului este:
( )
24 , 149
100
14924
2
2
= =

i
i i
n
n x x

.
Observaii:
1) Eantionul este destul de omogen (v = 32,7%) pentru a putea considera c media
de 37,4 ani caracterizeaz corect vrsta tuturor celor 100 de persoane nregistrate.
2) Dac media nu este reprezentativ la nivelul eantionului (v>>35%), nu are sens s
se mai continue cercetarea printr-o eventual tentativ de extindere a acestui indicator
(deja nereprezentativ la nivel restrns) asupra colectivitii generale.

ntre rspunsurile nregistrate de la cele 100 de persoane cuprinse n sondaj se mai
constat c 82 sunt dornice s participe la un program de formare continu, n timp ce
restul de 18 persoane resping oportunitatea oferit de angajator. Aceast caracteristic
alternativ, prezint o medie de:
82 , 0
100
82
= = =
n
m
w
i o dispersie de:
( ) 1476 , 0 18 , 0 82 , 0 1
2
= = = w w
w

Dac s-ar fi utilizat procedeul extragerii mecanice sau procedeul extragerii
repetate, atunci pentru calculul erorii medii de reprezentativitate a unui (oricrui) eantion
de volum n=100 s-ar fi aplicat relaiile [5.4] pentru caracteristica numeric i [5.6] pentru
cea alternativ. Cum sondajul a avut n vedere extragerea nerepetat (pentru a spori
Statistic teoretic i economic
reprezentativitatea eantionului), se aplic relaiile [5.4] i, respectiv [5.6], obinndu-
se:

pentru caracteristica numeric:
21 , 1
4000
100
1
1 100
24 , 149
1
1
2
=

=
N
n
n
x

ani,
ceea ce nseamn c media unui eantion de volum n = 100 obinut prin extragere
aleatoare nerepetat se abate n medie cu 1,2 ani (+) fa de vrsta medie real (
0
x ) a
celor 4000 de persoane angajate de corporaie;

pentru caracteristica alternativ:
038 , 0
4000
100
1
1 100
1476 , 0
1
1
) 1 (
=

=
N
n
n
w w
w

Rezultatul indic o abatere medie cu +3,8% a proporiei personalului dornic de a
participa la formarea profesional continu cuprins n eantion, fa de proporia real

=
N
M
p n rndul ntregului personal al corporaiei.

n practica economic nu intereseaz, de obicei, eroarea medie de
reprezentativitate a eantionului, ci abaterea maxim sau eroarea limit ce poate apare
ca diferen ntre media unui eantion (estimator) i media colectivitii generale
(parametru) la estimarea acestuia cu o anumit probabilitate.
Deoarece eroarea limit este diferena dintre x i x
0
,

ne folosim de proprietile
repatiiei normale pentru a asocia diverse mrimi ale erorii cu probalilitile aferente
msurate ca (sub) multipli ai abaterii standard a mediilor de eantionare fa de
0
x .
Eroarea limit se calculeaz astfel:
pentru variabil numeric:

x x
z = [5.7]

pentru variabila alternativ:

w w
z = [5.8]

Exist tabele ale repartiiei normale care exprim relaia dintre argumentul z sau t i
funcia de probabilitatea (z) sau (t) corespunztoare.
n exemplul considerat, eroarea limit pentru o probabilitate (z) = 0,95 (z = 1,96)
este:
pentru caracteristica numeric, de aproximativ 2,4 ani:
37 , 2 21 , 1 96 , 1 = = =
x x
z ani 2,4 ani,
Statistic teoretic i economic
Semnificaia rezultatului: distana maxim ce poate exista ntre media eantionului
(
0
x ) este de +2,4 ani, aceast afirmaie fiind valabil cu o probabilitate de 0,95 (se
accept un prag de eroare =0,05);

pentru caracteristica alternativ:
07448 , 0 038 , 0 96 , 1 = = =
w w
z sau 7,4%.

Interpretarea este asemntoare celei prezentate la
x
. Diferena maxim ntre w i p
(proporia celor nclinai s fac un program de formare contiun n cadrul eantionului
w i, respectiv n colectivitatea general - p) este, cu aceeai probabilitate (z) = 0,95 de
7,4%.

Observaii:
1. Un tabel cu valorile funciei Gauss Laplace corespunznd diferitelor valori ale lui z
se gsete n volumul Bazele statisticii pentru economiti. Aplicaii. Bucureti, Editura
Tribuna Economic, 2002, p. 259-260.
2. Dac s-ar fi folosit extragerea mecanic, sau extragerea repetat, eroarea limit era
ceva mai mare:
x
= 2,41 ani (fa de 2,37 ani);
w
= 7,6% (fa de 7,4%).
Coeficientul de corecie aplicat n cazul sondajului nerepetat este ntotdeauna o
mrime subunitar care restrnge mrimea erorii medii de reprezentativitate i,
respectiv, a erorii limit, oferind o estimare mai exact a parametrilor colectivitii
generale.
3. Nu este obligatoriu ca probabilitatea cu care se estimeaz diveri parametrii ai
colectivitii generale s fie aceeai la toate variabilele cerectate.



Statistic teoretic i economic
Probleme i aplicaii.
5.1. Un echipament de ambalare este astfel reglat nct s mpacheteze cte 20 de
bomboane cu o toleran de 1 bucat.
Pentru a aprecia calitatea reglajului, din producia unei zile s-a prelevat prin
extragere mecanic un eantion de 150 pachete care conineau n total 3015
bomboane n loc de 3000 bomboane. Din cercetarea eantionului rezult c n jurul
mediei de 20,1 bomboane/pachet, intensitatea mprtierii era de 7,2%, n condiiile
n care 129 pachete conineau exact 20 bomboane, 12 pachete aveau 21 sau mai
multe bomboane, iar 9 pachete erau cu 19 sau mai puine bomboane.

Se cere:
S se estimeze cu o probabilitate (z) = 0,9973 (z = 3) numrul total de
bomboane ambalate n lotul de N = 3000 pachete realizate n cursul zilei i s se observe
dac echipamentul se ncadreaz n tolerana admis.

Rezolvare:
Din enunul problemei rezult c eantionul se caracterizeaz prin:
Volumul n = 150 pachete;
Media x = 20,1 bomboane/pachet;
Abaterea standard = 1,4472 bomboane/pachet (din relaia coeficientului de

variaie % 2 , 7 100 = =
x
v

)
Pe baza acestor date, se poate estima eroarea medie de reprezentativitate, tiind
c n cazul extragerii mecanice se aplic relaia de la sondajul simplu, aleator, repetat:

bucati
n
x
118 , 0
150
0944 , 2
2
= = =



Un eantion de 150 produse prelevate mecanic din producia zilei, prezint, n
medie, o abatere cu 0,118 bomboane/pachet fa de numrul mediu (
0
x ) ce caracterizeaz
ntrega producie.
Eroarea limit pentru (z) = 0,9973:

bucati z
x x
35 , 0 118 , 0 3 = = =

Numrul mediu de bomboane/pachet n producia zilei se situeaz, cu
probabilitatea de 0,9973 n intervalul:
) 35 , 0 1 , 20 ( , ), (
0 0
x adica x x
x

Prin urmare: 45 , 20 75 , 19
0
x , ceea ce, aplicat ntregii producii a zilei conduce
(prin multiplicarea cu N = 3000) la un numr total (T) de bomboane ambalate de:
61350 59250 T , cu (z) = 0,9973, n condiiile n care reglajul trebuia s
ncadreze acest numr ntre (20-1)3000 = 57.000 buci i (20+1)3000 = 63.000 buci.
Statistic teoretic i economic
ntruct intervalul de estimare (59.250, 61.350) este mult mai mic dect tolerana
admis (57.000, 63.000), rezult c reglajul este corespunztor.
Rspuns: Numrul total de bomboane ambalate este situat, cu (z) = 0,9973 ntre
59.250 i 61.350 buci. Echipamentul se ncadreaz n tolerena admis.
Ct de mare ar trebui s fie un eantion, dac numrul mediu de bomboane/pachet
ar trebui estimat cu (z) = 0,9545 (z = 2) n limitele unui interval de 0,5 buci?

Rezolvare:

pachete
z
n
x
34 5104 , 33
5 , 0
0944 , 2 4
2 2
2 2
=

=

.

Rspuns: Pentru a rspunde unei astfel de exigene, ar fi suficient s se preleve
prin extragere mecanic doar 34 pachete, ceea ce la o producie total de 3000 pachete
nseamn un pas de numrare 88
n
N
.
S se observe n eantionul de 150 pachete, cota de produse care nu ndeplinesc
cerina de 20 bomboane/pachet i s se estimeze cu (z) = 0,90 (z = 1,65) cota minim i
maxim, precum i numrul minim i maxim de pachete necorespunztoare din punct de
vedere al coninutului n producia unei zile.
Rezolvare:
Din 150 pachete prelevate, 12+9 = 21 pachete conin fie mai multe, fie mai puine
produse dect numrul standard de 20 bomboane/pachet.
n cadrul eantionului, media (w) i dispersia (
2
w
) caracteristicii alternative
sunt:

14 , 0
150
21
= = =
n
m
w , ceea ce nseamn c 14% din eantion nu corespunde
standardului de ambalare.

1204 , 0 86 , 0 14 , 0 ) 1 (
2
= = = w w
w


Eroarea medie de reprezentativitate a unui eantion de volum 150 obinut prin
prelevare mecanic este de:

% 83 , 2 0283 , 0
150
1204 , 0
2
sau
n
w
w
= = =



Un eantion de volum 150 prelevat mecanic se caracterizeaz, n medie, printr-o
cot de produse necorespunztoare cu 2,83% mai mare sau mai mic dect cota parte
specific ntregii producii a unei zile.
Eroarea limit pentru o probabilitate de 0,90 este de:

Statistic teoretic i economic
% 7 , 4 0467 , 0 0283 , 0 65 , 1 sau z
w w
= = = .

La probabilitatea menionat, abaterea maxim a unui eantion de volum 150
prelevat mecanic fa de cota real de produse necorespunztoare din producia unei zile
este 4,7%.
n aceste condiii, la (z) = 0,90, cota minim i maxim de defecte n producia
zilei este cuprins n intervalul:

) 047 , 0 14 , 0 ( : ), ( p adica w p
w
sau:
187 , 0 093 , 0 p , cu (z) = 0,90.

Numrul minim i maxim de pachete necorespunztoare (M) n producia unei zile
se obine nmulind cu N = 3000 limitele intervalului n care se ncadreaz cota de
defecte:
561 279 M pachete, cu (z) = 0,90.
Cel puin 279 pachete i cel mult 561 pachete din lotul fabricat de 3000, cuprinde
mai mult sau mai puin de 20 bomboane/pachet, cu o probabilitate de 0,90 (sau cu o
marj de eroare acceptat de 1-0,90 = 0,10 sau 10%).
Avnd n vedere c un client nu va reclama dect n situaia n care obine mai
puine bomboane dect numrul de 20 (care apare nscris pe pachet), se cere refacerea
calculelor, considernd c m = 9 pachete din 150 verificate.
Rspuns: w = 0,06; w(1-w) = 0,0564; 09 , 0 03 , 0 ; 03 , 0 ; 02 , 0 = = p
w w
;
270 90 M pachete, 9 , 0 ) ( = z cu .

5.2. Dintr-o comand de 1000 piese, se prelev un eantion de 65 piese prin extragere
aleatoare, simpl, nerepetat. Potrivit comenzii, fiecare pies ar trebui s cntreasc
85 grame. Dup examinarea eantionului, se constat c greutatea medie a pieselor
este de 87,2g, dispersia eantionului fiind de 70,6746, abaterea standard de 8,4g,
coeficientul de variaie 9,6%. ntre piesele eantionului se afl 26 piese cu greutatea
mai mare dect cea prevzut de comand.

Se cere:
Estimarea cu (z) = 0,9545 (z = 2) limitele intervalului n care se nscrie
greutatea medie a celor 1000 piese din lot.


Rezolvare:
Eroarea medie de reprezentativitate n cazul sondajului aleator, simplu, nerepetat,
se estimeaz astfel:

g
N
n
n
x
0083 , 1
1000
65
1
65
6746 , 70
1
2
=

=




Statistic teoretic i economic
Eroarea limit:

g z
x x
02 , 2 0083 , 1 2 = = , pentru (z) = 0,9545

Intervalul n care se nscrie greutatea medie a tuturor pieselor cu probabilitatea
menionat este:
g x x 22 , 89 18 , 85 ) 02 , 2 2 , 87 (
0 0

Estimarea cu (z) = 0,90 (z = 1,65) a cotei maxime de produse cu greutatea
depit.
Rezolvare:

=
N
n
n
w
w
1
2

, unde 24 , 0 6 , 0 4 , 0 ) 1 (
2
= = = w w
w


059 , 0 =
w
sau 5,9%

% 7 , 9 097 , 0 059 , 0 65 , 1 sau z
w w
= = =

Cota maxim este, de fapt, limita superioar a intervalului n care se nscrie p,
respectiv w +
w
= 0,4 + 0,097 = 0,497, ceea ce, n mrime absolut, nseamn 497 piese.
Ct de mare ar trebui s fie eantionul extras prin acelai procedeu pentru o nou
cercetare, dac ar trebui s se estimeze cota minim i maxim cu probabilitatea (z) =
0,9545 (z = 2) n limitele unui interval de 5%, respective 0,05.

Rspuns:

piese
N
z
z
n
w
w
w
975 62 , 974
00096 , 0 05 , 0
24 , 0 4
2 2 2
2
2 2
=
+



Cu acest rezultat, locul cercetrii selective este luat de examinarea integral a
lotului comandat.

5.2.n rndul personalului operativ al unui centru de librrii se efectueaz un sondaj
stratificat cu extragere nerepetat. ntre caracteristicile observate pe cele n = 80
de persoane din eantion, se numr vnzrile medii sptmnale (milioane lei)
i felul raionului de mrfuri. Rezultatele nregistrrii eantionului se prezint
astfel:






Statistic teoretic i economic
Felul raionului de mrfuri



Vnzri
medii (mil lei)
Anticariat Jucrii Librrie Papetrie
Total
Pn la 3 3 --- --- 2 5
3 5 5 3 12 8 28
5 7 2 5 12 10 29
7 i peste --- 12 6 --- 18
Total 10 20 30 20 80

Se cere:
S se caracterizeze acest eantion.
Rezolvare:
Vnzarea medie sptmnal realizat de cele 80 persoane este 5 , 5 = x mil lei.
Amplitudinea variaiei este de 6 mil lei, adic 109,09% fa de medie. Acest indicator
permite aprecierea c cele 80 de elemente ale eantionului prezint o mprtiere relativ
mare (peste 100%).
Dispersia eantionului: 05 , 3
2
= .
Abaterea standard: = 1,7464 mil lei.
Coeficientul de variaie: v = 31,75%.
n pofida ntinderii relativ mari a mprtierii, colectivitatea este destul de
omogen (intensitatea mprtierii este sub 35%).
Analiza variaiei vnzrilor medii sptmnale n cadrul celor 4 grupe constituite
dup felul mrfurilor comercializate i elementele de calcul pentru verificarea regulii de
adunare a dispersiilor sunt prezentate n tabelul 53.2. Pe baza acestei identiti se
stabilete n ce msur influeneaz felul mrfurilor variaiei volumului vnzrilor
sptmnale.

Raionul j n
j
j
x
2
j
x x
j

j j
n x x
2
) (
j j
n
2

Anticariat 1 10 3,8 1,96 -1,7 28,9 19,6


Jucrii 2 20 6,9 2,19 +1,4 39,2 43,8
Librrie 3 30 5,6 2,24 +0,1 0,3 67,2
Papetrie 4 20 4,8 1,76 -0,7 9,8 35,2
Total --- 80 --- --- --- 78,2 165,8

Regula de adunare a dispersiilor:
2 2 2
+ = , n care:
Dispersia general a eantionului este deja calculat: 05 , 3
2
= .
Dispersia indus (explicat) de felul mrfurilor vndute:
9775 , 0
80
2 , 78
) (
2
2
= =


=
j
j j
n
n x x
.

Dispersia rezidual: 0725 , 2
80
8 , 165
2
2
= =


=
j
j
n
n

Statistic teoretic i economic
Regula se verific: 3,05 = 0,9775 + 2,0725, iar pe baza ei se calculeaz
coeficientul de determinaie:

% 32 100
05 , 3
9775 , 0
100
2
2
= = =

D

Varietatea mrfurilor comercializate n diferitele raioane ale centrului de librrii
explic n proporie de 32% variaia vnzrilor medii sptmnale realizate de cele 80 de
persoane din eantion.
S se estimeze cu (z) = 0,9545 (z = 2) volumul mediu sptmnal al vnzrilor
realizate de ntregul personal operativ al centrului de librrii (N = 760 persoane).
Rezolvare:
Eroarea medie de reprezentativitate n cazul sondajului stratificat cu extragere
nerepetat se determin astfel:

lei mil
N
n
n
x
15 , 0
760
80
1
80
0725 , 2
1
2
=

=



Eroarea limit:

lei mil z
x x
. 3 , 0 15 , 0 2 = = =

Prin urmare, ) 3 , 0 5 , 5 (
0
x cu o probabilitate de 95,45%.
Limitele intervalului n care se ncadreaz vnzarea medie sptmnal a celor
760 angajai direct n procesul vnzrii sunt: 5,2 mil lei i, respectiv, 5,8 mil lei.
Pe acest temei, managementul acestei firme poate conta sptmnal, cu (z) =
0,9545, pe ncasri situate ntre 3952 i 4408 milioane lei.
Ct de mare ar trebui s fie eantionul ntr-o nou cercetare selectiv bazat pe
extracia stratificat nerepetat a elementelor componente, dac estimarea ar trebui fcut
cu aceeai probabilitate (z) = 0,9545 (z = 2), dar n limitele unui interval de estimare de
0,5 milioane lei?
Rspuns:

persoane
N
z
z
n 32 74 , 31
760
28 , 8
5 , 0
0725 , 2 4
2
2 2
2
2 2
=
+



Cu ce probabilitate s-ar putea face estimarea limitelor intervalului n care se
ncadreaz vnzarea medie sptmnal, dac =
x
0,5 mil lei, dar se pstreaz
mrimea iniial a eantionului: n = 80 persoane?
Rspuns: Prin nlocuire n relaia de mai sus, se obine c z = 3,28, ceea ce corespunde
lui (z) = 0,999481 n orice tabel al distribuiei normale.
Statistic teoretic i economic
Revenind la un volum necesar al eantionului de 32 persoane, cum se face
stratificarea?
Rezolvare:
Stratificarea se realizeaz pentru a asigura ptrunderea n eantion a unor
elemente din toate tipurile existente n colectivitatea general. Exist mai multe tipuri de
stratificare a eantionului:
(1) Un procedeu elementar const n stratificarea simpl, respectiv mprirea
volumului stabilit al eantionului (n = 32) la numrul grupelor existente n colectivitatea
general (r = 4 tipuri de mrfuri comercializate).
Prin urmare, cte 32:4 = 8 elemente se vor preleva din fiecare strat, prin extragere
nerepetat.
(2) Stratificarea proporional ine seama de structura

j
j
N
N
specific mulimii
ce alctuiete colectivitatea general. n cadrul firmei, personalul operativ (760 persoane)
prezint urmtoarea structur: anticariat 9,5% (72 persoane), jucrii 30% (228 persoane),
librrie 32,5% (247 persoane), iar n raioanele de papetrie circa 28% (213 persoane).
Pentru a transfera aceast structur asupra eantionului, se folosete relaia:

j
j
j
N
N
n n

=
Astfel, cele 32 elemente din eantion se repartizeaz dup cum urmeaz: 3
persoane se prelev (prin extragere nerepetat) dintre (cei 72 de) anticari; 10 persoane
dintre cele ce comercializeaz jucrii; 10 persoane dintre librari i 9 persoane dintre
vnztoarele de la raioanele de papetrie:
3 + 10 + 10 + 9 = 32 persoane.
Evident, unele rotunjiri s-au impus fiind vorba de uniti indivizibile (persoane)
ale colectivitii generale.

(3) Stratificarea optim a eantionului presupune luarea n considerare nu numai a
structurii colectivitii generale pe tipuri de activiti ( r j cu N
j
, 1 = ), dar i a dispersiei
specifice fiecrei strat (
2
j
) din colectivitate.
Astfel, relaia care se folosete la structurarea eantionului devine:

2
2
j j
j j
j
N
N
n n



=

Mai sus s-au artat valorile N
j,
iar n tabelul 53.2, coloana a cincea, se afl
2
j
. Cu
aceste date, pentru aflarea numrului de persoane care urmeaz s intre n alctuirea
eantionului din rndul celor care se ocup de anticariat este:

. 3 88 , 2
6 , 1568
96 , 1 72
32
1
persoane n =

=
Statistic teoretic i economic
Pentru celelalte trei grupe rezult, n ordine: 10 persoane; 11 persoane; 8
persoane.
3 + 10 + 11 + 8 = 32 persoane.
Observaie: Prelucrarea datelor referitoare la eventualele caracteristici alternative se face
n mod asemntor.

5.4. O societate comercial prezint urmtoarea repartiie a personalului su pe
grupe de vrst:
(date convenionale)
Grupe de vrst (ani) Numr de persoane
Sub 20
20-30
30-40
40-50
peste 50
10
30
40
15
5
Total 100

Se cere:
1. s se reprezinte grafic repartiia;
2. se consider c cele 100 de persoane constituie un eantion extras aleator, simplu,
nerepetat dintr-o colectivitate general de 1000 persoane; s se determine intervalele de
vrst ntre care se situeaz vrsta medie a celor 1000 persoane considerndu-se
. 2 ; 9545 , 0 ) ( = = z z

5.5. Timpul pentru nottoarele cu vrsta cuprins ntre 9 i 10 ani pe distana de 50
metrii, stilul fluture, este aproximativ normal distribuit cu media 49,4 secunde i
abaterea standard de 2,8 secunde.
1. s se gseasc probabilitatea n cazul unui eantion aleator simplu de 25 de nottoare
care s aibe media mai mare de 50,15 secunde.

5.6. S se obin un eantion aleator de mrime 25 cu media 4 , 83 = x i abaterea
medie ptratic 12 = , dintr-o populaie cu o distribuie normal dac media
colectivitii generale este . 83
0
= x

5.7. n tabelul urmtor sunt prezentai numrul de enoriai ai unei biserici ortodoxe
pe grupe de vrst:

Vrsta (ani) Numr de enoriai
Sub 20
21-50
peste 50
274
526
345

Se cere:
1. dac se efectueaz o selecie stratificat de volum n=100, s se determine numrul de
enoriai care trebuie s fac parte din fiecare strat;
2. aceeai cerin n cazul n care se cunosc abaterile standard ale celor trei straturi:
. 3 , 2 ; 8 , 4 ; 2 , 1
3 2 1
= = =
Statistic teoretic i economic
5.8. Care este valoarea erorii standard a mediei unui eantion de volum n=100,
selectat simplu, aleator repetat, dac dispersia este egal cu 25?

5.9. n tabelul urmtor sunt prezentate datele referitoare la localitatea de reziden
a studenilor unei faculti economice:

Localizarea geografic Numr de studeni
Nord est
Sud est
Sud vest
Nord vest
347
624
196
93
Se cere:
1. dac se utilizeaz selecia stratificat de volum n=200, care va fi mrimea fiecrui
strat?

5.10. Un eantion de 500 de familii chestionate n legtur cu nivelul mediu al
cheltuielilor destinate produselor alimentare se prezint astfel:

Cheltuieli pentru alimente (mii lei) Numr de persoane
Sub 500
500-800
600-900
900-1200
peste 1200
80
120
150
100
50
Total 500

1. s se determine coeficientul de asimetrie al repartiiei;
2. dac cele 500 de familii sunt considerate ca fiind o colectivitate general din care se
extrege un eantion aleator i nerepetat cu 3 , 1 ; 8064 , 0 ) ( = = z z , s se deteremine
mrimea eantionului.