Sunteți pe pagina 1din 20

Statistică teoretică şi economică

CAPITOLUL 5.
CERCETAREA SELECTIVĂ
Cuvinte cheie:
- cercetarea selectivă
- sondajul
- selecţia simplă repetată (urna cu bilă revenită).
- selecţia simplă nerepetată (urna cu bilă nerevenită),
- reprezentativitatea eşantionului
- eroare de reprezentativitate
- eroare medie de reprezentativitate
- eroarea limită admisă

În societatea contemporană, cea mai mare parte a informaţiilor despre mediul de


afaceri este obţinută nu prin înregistrări exhaustive, ci prin investigaţii parţiale, cunoscute
sub numele de anchete statistice. Ele sunt preferate ca urmare a faptului că oferă
informaţii suficient de corecte într-un timp relativ scurt, astfel încât managerul unei
întreprinderi sau omul de afaceri poate valorifica în timp real o oportunitate sau poate
evita, elimina sau măcar reduce o parte din riscurile implicării în circuitul economic.
În prezentul capitol sunt prezentate fundamentele sondajului statistic ca
instrument metodologic de realizare a anchetelor în rândul întreprinderilor, al menajelor,
al consumatorilor, al privitorilor la emisiunile TV, al ascultătorilor de radio etc.
Parcurgând acest capitol, economistul are posibilitatea de a înţelege avantajele şi
inconvenientele sondajului statistic, etapele acestei forme de cercetare a realităţii
economice, principalele procedee de eşantionare, precum şi modul de calcul al
indicatorilor specifici celor mai frecvent utilizate tipuri de selecţie. Sunt arătate, de
asemenea, modalităţile de extindere a rezultatelor sondajului asupra întregii colectivităţi
supuse cercetării, precum şi căile de determinare a volumului necesar al eşantionului într-
un sondaj statistic.
Nu întotdeauna este posibil sau rentabil (cost, durată) să facem o cercetare
exsuasivă. În aceste condiţii folosim cercetarea selectivă.
Cercetarea selectivă presupune culegerea şi prelucrarea datelor referitoare la o
parte a colectivităţii generale, iar rezultatele obţinute se extind asupra întregului obiect al
cunoaşterii pentru a obţine o caracterizare satisfăcătoare. Este necesar ca partea observată
(eşantion, mostră, probă, selecţie) să fie reprezentativă adică să reproducă la scară redusă
trăsăturile esenţiale ale colectivităţii întregi.
Sondajul este o formă a cercetării statistice realizată pe baza unei părţi
reprezentative din populaţia (colectivitatea generală) studiată. El presupune următoarele
etape consecutive:
1) extragerea unui eşantion reprezentativ din colectivitatea generală (eşantionarea)
şi culegerea de date despre despre elementele extrase (obserarea eşantionului);
2) descrierea statistică a eşantionului prin indicatori specifici fiecărei caracteristici
înregistrate în cadrul programului de observare (obţinerea estimatorilor);
3) extinderea rezultatelor obţinute la nivel de eşantion asupra colectivităţii generale
(estimarea parametrilor colectivităţii generale = inferenţa statistică).
Statistică teoretică şi economică

După scopul urmărit, sondajul statistic poate fi:


• sondaj descriptiv întreprins în vederea estimării parametrilor ce caracterizează o
populaţie;
• sondaj analitic realizat pentru verificarea (testarea) unor ipoteze statistice.
Realizarea sondajului are rost numai dacă volumul eşantionului (n) este mult mai mic
decât volumul colectivităţii generale (N) din care a fost extras.
Eşantionul (mostra, proba, colectivitatea de selecţie) este o submulţime a
populaţiei statistice, astfel extrasă (obţinută) încât să reprezinte principalele trăsături ale
colectivităţii generale.
Colectivitatea generală (populaţia) este alcătuită din totalitatea unităţilor (a
elementelor simple sau complexe) a căror mulţime formează fenomenul/procesul supus
analizei. Deoarece din întreaga populaţie se extrage un număr de elemente, ea se mai
numeşte şi bază de sondaj.
Atât colectivitatea generală, cât şi eşantionul se caracterizează prin indicatori
statistici. Dacă cercetarea este exhaustivă, indicatorii se mai numesc şi parametrii
colectivităţii generale. În cadrul sondajului statistic, parametrii se estimează cu ajutorul
indicatorilor specifici eşantionului, numiţi din acest motiv şi estimatori. În Tabelul nr. 5.1
se prezintă sistemul uzual de notaţii pentru parametrii colectivităţii generale şi estimatorii
lor în cadrul unui eşantion.

Avantaje cercetarii selective:


• mai ieftină, mai operativă, mai exactă pentru că se face pe un număr redus de
elemente;
• poate fi mai bogată, completă faţă de cercetarea totală;
• rezultatele cercetării selective pot fi verificate dacă este necesar prin altă cercetare
selectivă sau printr-o cercetare totală (invers nu);
• se foloseşte când se presupune distrugerea elementelor în cazul cercetării.

Noţiuni fundamentale flosite în cercetarea selectivă


Sunt de fapt noţiuni perechi care vizează colectivitatea generală pe de o parte şi
eşantionul pe de altă parte.

colectivitate eşantion
generală
N (volumul) n (volumul)
x 0 (media) x (media)
σ2 (dispersia)
σ 02 (dispersia)
p2 = M/N (pt. car. w = m/n
alternativ) σ w2 (1 − w)
σ (1 − p)
2
p

În general nu se cunosc aspecte legate de colectivitatea generală. Cercetartea


selectivă este folosită pentru a estima pe baza eşantionului parametrii colectivităţii
generale.
Statistică teoretică şi economică

5.1.Procedee de selecţie
Se recomandă alegerea procedeului de selecţie în funcţie de mărimea (N) a
colectivităţii generale şi în funcţie de omogenitatea sau eterogenitatea acesteia.
Dacă colectivitatea generală este omogenă putem folosi:
• procedeul loteriei
• procedeul tabelului cu numere întâmplătoare sau un program pe calculator de
generare de numere întâmplătoare;
• procedeul mecanic sau al pasului de numărare.
Dacă colectivitatea generală este eterogenă se recomandă folosirea selectţiei
dirijate pentru a asigura reprezentativitatea eşantionului (procedeul selecţiei stratificate,
selecţie tipică).
Dacă colectivitatea generală este alcătuită din unităţi complexe numite şi serii (de
ex. populaţia alcătuită pe familii, locurile de mărfuri grupate pe paleţi etc.) se recomandă
procedeul selecţiei de serie.

Procedeul loteriei.
Se aplică în cazul colectivităţii generale de volum mic, relativ omogenă.
Aplicablitatea constă în numerotarea de la 1 la N a tuturor elementelor din colectivitatea
generală (ceea ce uneori este incomod) confecţionând jetoane sau bile absolut de aceleaşi
dimensiuni, care se introduc într-o urnă şi se amestecă înainte de fiecare extragere.
Extragerea poate fi efectuată în două variante:
¾ selecţia simplă repetată (urna cu bilă revenită).
În acest caz, la fiecare extragere există o aplicabilitate de 1/N de a intra în
alcătuirea eşantionului. Folosind această variantă se pot forma foarte multe eşantioane
diferite având acelaşi volum, dar posibilitatea includerii a unui acelaşi element face ca
reprezentativitatea includerii a unui acelaşi element face ca reprezentativitatea
eşantionului să fie redusă.
¾ selecţia simplă nerepetată (urna cu bilă nerevenită), prin care probabilitatea
includerii în eşantion creşte, treptat pe măsura extragerii elementelor. La extragerea I,
probalilitatea extrageriiv este 1/N; la extragerea a II-a probalilitatea extragerii este de
1/(N-1) si asa mai departe; la ultima extragere, probalilitatea va fi: 1/[N – (n+1)].
Aceste eşantioane se bucură de o mai mare reprezentativitate, iar numărul lor este
CnN (mult mai mic decât la selecţia repetată Nn).
Pentru a evita constituirea urnelor cu bile se poate folosi fie tabele cu numere
întâmplătoare, fie un program de calculator care să genereze numere întâmplătoare.
Procedeul mecanic sau al pasului de numărare.
Acest procedeu este foarte operativ dar nu asigură o selecţie strict aleatoare, doar
primul element din eşantion se extrage la întâmplare, restul intrând în componenţa
eşantionului ca urmare a poziţiei ocupate.
Ştiind că există N elemente în colectivitatea generală şi că eşenationul trebuie să
fie de n elemente, se calculează k; k = N/n, adică pasul de numărare.
Din primele k elemente se extrage, la întâmplare, unul, acesta devenind primul
element al eşantionului. Numărul de ordine al celorlate elemente se află adunând succesiv
k.
Dacă elementele colectivităţii generale sunt eterogene, constatându-se o anumită
stratificare a colectivităţii generale se recomandă să fie folosită o selecţie dirijată
Statistică teoretică şi economică

(nealeatoare) pentru a asigura pătrunderea în eşantion a unor elemente din toate straturile
tipice. O asemenea selecţie dirijată este selecţia stratificată sau selecţia tipică: după
stabilirea volumului n al eşantionului se stabileşte componenţa pe straturi (număr de
elemente din fiecare strat), astfel încât structura eşantionului să corespundă structurii
colectivităţii generale. Pentru extragerea separată din fiecare strat a numărului
corespunzător de elemente, se utilizează unul din procedeele aleatoare de mai sus.
Selecţia de serii (sau de unităţi complexe) reprezintă un alt procedeu de selecţie.
Pentru colectivitatea organizată pe unităţi complexe (populaţia organizată pe familii) se
recomandă să nu distrugem aceste structuri pentru a extrage unităţi simple, ci să preferăm
extragerea de unităţi complexe sau extragerea de serii.

5.2.Reprezentativitatea eşantionului.
Reprezentativitatea eşantionului inseamna capacitatea acestuia de a reda
trăsăturile esenţiale ale colectivităţii generale din care s-a extras chiar dacă volumul
eşenationului este mult mai mic decât volumul colectivităţii din cade s-a extras.
Dintre metodele de exprimare a reprezentativităţii eşantionului cele mai frecvente
se referă la compararea structurii eşantionului cu structura colectivităţii generale sau la
compararea mediei eşantionului x cu media colectivităţii generale x 0, la una sau mai
multe caracteristici cunoscute, înregistrarea atât pe eşantion cât şi la colectivitatea
generală. De exemplu compararea mediei de vârstă a eşantionului cu media de vârstă a
întregii ţări.
Se întâmplă, în unele cazuri, să nu se cunoască nimic despre colectivitatea
generală. În acest caz când nu este posibilă compararea cu parametrii colectivităţii
generale, se recomandă extragerea a cel puţin două eşantioane diferite din aceeaşi
colectivitate generală şi compararea mediilor sau structurilor acestor eşantioane. Dacă ele
nu diferă semnificativ, atunci oricare dintre eşantioane poate fi folosit pentru a estima
parametrii colectivităţii generale.

5.3.Calculul indicatorilor de selecţie şi extinderea rezultatelor pentru principalele


tipuri de selecţie.
Diferenţa dintre media eşantionului şi media colectivităţii generale se numeşte
eroare de reprezentativitate. În domeniul social economic se consideră că eşantionul este
 x − x0 
reprezentativ cât timp această diferenţă este mai mică de ± 5%  ⋅ 100  faţă de
 x0 
media colectivităţii generale.
Eroarea de reprezentativitate este determinată fie de cauze sistematice (voite sau
întâmplătoare) care duc la alcătuirea unui eşantion după criterii subiective, fie de abateri
(erori) aleatoare.
Dacă se iau în considerare toate eşantioanele de un anumit volum n, obţinute prin
acelaşi procedeu de extragere, se constată mediile acestor eşantioane ( x i) se distribuie
normal faţă de valoarea pe care o înregistrează media colectivităţii generale ( x 0).
Eşantioanele având media identic egală cu x 0 sunt cele mai frecvente.
Se numeşte eroare medie de reprezentativitate abaterea medie pătratică a
mediilor de eşantionare faţă de x 0 . Pentru a putea calcula această valoare medie de
Statistică teoretică şi economică

reprezentativitate (µx pentru variabila numerică şi µw pentru variabila alternativă) ar


trebui să avem toate mediile de eşantioane posibile şi frecvenţele lor de apariţie.

µx =
∑ (x − x
i
2
0 ⋅ fi
∑f i

De obicei nu se cunoaşte decât un singur eşantion. Se poate face însă calcul


anticipat al lui µx pornind de la relaţia dintre dispersia colectivităţii generale (σ20),
pătratul erorii medii de reprezentativitate µx2 şi volumul eşantionului.
În cazul selecţiei simple repetate această relaţie este:

σ 02 = µ x2 ⋅ n

σ 02
ceea ce înseamnă că µ x = , adică eroarea medie de reprezentativitate este direct
n
proporţională cu dispersia colevtivităţii generale şi invers proporţională cu volumul
eşantionului.
Dacă nu se cunoaşte σ20 se acceptă că dispersia unicului eşantion cunoscut σ2
oferă o marjă satisfăcătoare a împrăştierii elementelor colectivităţii dacă eşantionul este
convenabil de mare. Totuşi se face o corecţie cu 1, adică:

σ2
µx = .
n −1
Dacă se foloseşte o variabilă alternativă, eroarea medie de reprezentativitate se
stabileşte potrivit aceloraşi relaţii, adică atunci când se cunoaşte dispersia colectivităţii
generale:
p (1 − p )
µw =
n

iar, dacă nu se cunoaşte decât eşantionul, atunci:

w(1 − w)
µw =
n −1

Aceste relaţii sunt pentru selecţia simplă repetată (mecanică)


Dacă se practică selecţia simplă nerepetată, eşantioanele sunt mai reprezentative
decât la selecţia repetată, se introduce un coeficient de corecţie pentru a estima eroarea
medie de reprezentativitate:
- pentru selecţia nerepetată, variabilă numerică:

σ 02  n σ 02  n
µx = 1 −  µx = 1 − 
n −1 N n  N
Statistică teoretică şi economică

- pentru o caracteristică alternativă:


w(1 − w)  n
µw = ⋅ 1 − 
n −1  N 

În practica economică nu interesează eroarea medie de reprezentativitate, ci


eroarea maximă (abaterea maximă) sau eroarea limită ce poate apare la estimare pentru o
anumită probabilitate.
Deoarece această eroare este diferenţa dintre x şi x 0 ne folosim de proprietăţile
repatiţiei normale pentru a asocia diverse mărimi ale erorii cu probalilităţile aferente.

Eroare limită se calculează:


• pentru variabilă numerică:

∆x = z ⋅ µx

• pentru variabila alternativă:

∆w = z ⋅ µw

Există tabele ale repartiţiei normale care ne arată relaţia dintre coeficientul de
multiplicare z sau t sau probabilitatea φ (z) sau φ (t) corespunzătoare.
Eroarea limită arată diferenţa maximă în plus sau în minus care poate surveni la o
anumită probabilitate φ (z), z fiind utilizat în calculul erorii limită.
Necunoscând parametrii colectivităţii generale, rezultă că pentru o variabilă
( )
numerică x 0 ∈ x ± ± ∆ x , iar pentru o variabilă alternativă avem p ∈ (w ± ∆ w ) cu
probabilitatea corespunzătoare.
φ (z) = funcţia de probabilitate cu care se generează rezultatele
z = coeficientul funcţiei de probabilitate.
Eroarea limită se poate mări sau micşora fie prin modificarea volumului
eşantionului (n), fie prin modificarea probabilităţii cu care se garantează rezultatele,
deoarece dispersia colectivităţii totale rămâne aceeaşi.
După modul în care se combină sistemul de organizare, felul unităţilor de selecţie
şi procedeul de selecţie folosit, în cercetarea activităţii economice şi sociale, se disting
următoarele tipuri de selecţie:
- selecţie întâmplătoare simplă;
- selecţie mecanică;
- selecţie tipică (stratificată);
- selecţia de serii.
Pentru fiecare tip de selecţie se calculează trei indicatori: eroarea de medie de
reprezentativitate, eroarea limită şi volumul eşantionului.
Selecţia întâmplătoare simplă este utilizată în special pentru colectivităţi formate
dintr-un număr de unităţi simple şi care se caracterizează printr-un anumit grad de
omogenitate. Erorile de reprezentativitate sunt mari în raport cu alte tipuri de selecţie,
Statistică teoretică şi economică

deoarece dispersia folosită măsoară variaţia totală a caracteristicii datorată cauzelor care
influenţează.
Deoarece, în practică, se lucrează cu o eroare limitată, calculul volumului
eşantionului (n) se face flosind formula erorii limită.
- selecţia întâmplătoare simplă repetată:

σ 02
∆x = z ⋅ µx = z ⋅
n
σ 2
z ⋅ σ 02 z 2 ⋅ σ i2
2
∆ =z ⋅
2
x
2 0
⇒ n= ≈
n ∆2x ∆2x

- selecţia întâmplătoare simplă nerepetată:

σ 02  n z 2 ⋅ σ 02 z 2 ⋅ σ i2
∆x = z ⋅ µx = z ⋅ 1 −  ⇒ n = ≈
n  N z 2 ⋅ σ 02 z 2 ⋅ σ i2
∆x +
2
∆2x +
N N

În mod similar se procedează şi în cazul caracteristicii alternative.


Următorul tabel sintetizează eroarea medie de reprezentativitate, eroarea limită şi
volumul eşantionului pentru caracteristica numerică şi pentru cea alternativă în cazul
selecţiei repetate şi a selecţiei nerepetate:

Indicatorul Caracteristica nealternativă (numerică)


selecţia repetată selecţia nerepetată
err. medie de 2 2 2 2
reprezentativitate σ0 σi σ0  n σi  n
µx = ≈ µx = 1 −  ≈ 1 − 
n n −1 n  N n −1 N
err. limită ∆x = z ⋅ µz ∆x = z ⋅ µx
volumul z ⋅σ2 2
z ⋅σ
2 2
z
2 2
⋅σ0 z
2 0
⋅σi
eşantionului n= 0
≈ i
n= ≈
∆2x ∆2x z
2 2
⋅σ0
2
z2 ⋅ σ i
2 2
∆x + ∆x +
N N

Indicatorul Caracteristica alternativă


selecţia repetată selecţia nerepetată
err. medie de 2 p (1 − p ) w(1 − w) p (1 − p )  n w(1 − w)  n 
reprezentativitate µ =σ ≈ µw = ⋅ 1 −  ≈ ⋅ 1 
w n n −1 n  N n −1  N 
err. limită ∆w = z ⋅ µw ∆w = z ⋅ µw
volumul 2 2 2 2
z ⋅ p (1 − p ) z ⋅ w(1 − w) z ⋅ p (1 − p ) z ⋅ w(1 − w)
eşantionului n= ≈ n= ≈
2 2 z 2 ⋅ p (1 − p ) 2
∆w ∆w 2 2 z ⋅ w(1 − w)
∆w + ∆w +
N N
Statistică teoretică şi economică

Selecţia mecanică se foloseşte atunci când se combină cu alte tipuri de selecţie.


Pentru calculul erorilor de selecţie se folosesc formulele de la seleţia întâmplătoare
simplă repetată. Acest tip de selecţie se aplică la cercetările de laborator şi la estimarea
recoltei medii la hectar a producţiei agricole înainte de recoltare.
Selecţia tipică (stratificată) se aplică cel mai frecvent în studiul fenomenelor
economico-sociale care au fost, în prealabil, împărtăşite în grupe omogene (straturi sau
tipuri) după o caracteristică esenţială.
• selecţia tipică simplă caracterizată prin faptul că extragerea unităţilor din fiecare
grupă se face la întâmplare fără a se ţine seama de ponderea unităţilor din fiecare grupă a
colectivităţii generale.
• selecţia tipică proporţională este selecţia la care volumul subeşantioanelor diferă
în raport cu ponderea pe care o are fiecare grupă în colectivitatea generală şi se respectă
proporţia de selecţie.
• selecţia tipică optimă se caracterizează prin faptul că la formara eşantionului se ia
în considerare ponderea pe care o au grupele în colectivitatea generală şi mărimea
variaţiei din interiorul grupelor măsurată prin abaterea medie pătratică.
În general, se poate spune că selecţia tipică dă cele mai mici erori în activitatea
practică dar este greu de aplicat.
Selecţia de serii se foloseşte când colectivitatea generală este formată din unităţi
complexe numite şi serii (echipe, brigăzi, magazine etc.). Aceste unităţi sunt formate din
unităţi simple care prezintă caracteristici ce le deosebesc una de alta, adică au un caracter
eterogen, în raport cu unităţile componente ale grupelor tipice care se caracterizează prin
omogenitate.
Caracteristic pentru acest tip de selecţie este faptul că în locul variantelor
concrete ale caracteristicilor de la sondajele bazate pe unităţi simple se vor folosi
indicatori de selecţie calculaţi la nivelul seriei. Cerinţa reprezentativităţii se va asigura
prin apropierea mediilor din seriile de unităţi selectate de mediile din seriile colectivităţii
generale.
Pentru extinderea rezultatelor asupra întregii colectivităţi se folosesc două
procedee:
• procedeul coeficientului de corecţie se foloseşte de obicei la verificarea
autenticităţii datelor culese dintr-o observare, totală.
• procedeul extinderii directe se utilizează la caracterizarea fenomenelor pentru
care nu dispunem de informaţii prin observarea totală. În esenţă acest procedeu constă în
estimarea parametrilor colectivităţii generale pe baza rezultatelor selecţiei statistice.

x − ∆ x < x0 < x + ∆ x

Pentru a ilustra valenţele cognitive ale indicatorilor prezentaţi mai sus, să


acceptăm că responsabilul departamentului de resurse umane dintr-o corporaţie
multinaţională având N = 4000 de angajaţi direct operativi a decis realizarea unui studiu
cu privire la nevoile de formare profesională continuă ale acestei categorii de salariaţi şi
disponibilitatea lor de a participa la astfel de programe.
Pentru a răspunde acestei decizii, consiliul director al corporaţiei aprobă
organizarea unui sondaj statistic în rândul salariaţilor, volumul eşantionului fiind de n =
100 de persoane. Asigurarea reprezentativităţii eşantionului de numai 2,5% din totalul
Statistică teoretică şi economică

n 
salariaţilor direct operativi  ⋅ 100 = 2,5%  s-a făcut prin luarea în considerare a
N 
vârstei, precum şi a structurii socio-profesionale a întregului personal operativ.
În cadrul programului de observare selectivă, între alte caracteristici urmărite, se
înregistrează vârsta salariaţilor (exprimată în ani de viaţă împliniţi), precum şi interesul
(disponibilitatea) acestora de a participa la un program de formare profesională continuă.
În tabelul de mai jos se prezintă rezultatul grupării în funcţie de vârstă a celor 100
de persoane din eşantionul extras aleator şi nerepetat.
Repartiţia personalului cuprins în eşantion în funcţie de vârstă
Grupe de vârstă Număr personal
(ani împliniţi)
Sub 25*) 17
25 – 35 30
35 – 45 25
45 – 55 18
peste 55 10
Total 100
*)
Limita superioară nu este cuprinsă în interval.

Prelucrarea datelor referitoare la această caracteristică numerică (vârsta personalului),


permite constatarea că la nivelul eşantionului, vârsta medie este de:

x=
∑ xi ni = 3740 = 37,4 ani,
∑ ni 100
iar dispersia în jurul mediei eşantionului este:
∑ (x − x ) n
2
14924
σ
i i
2
= = = 149,24 .
∑n i 100
Observaţii:
1) Eşantionul este destul de omogen (v = 32,7%) pentru a putea considera că media
de 37,4 ani caracterizează corect vârsta tuturor celor 100 de persoane înregistrate.
2) Dacă media nu este reprezentativă la nivelul eşantionului (v>>35%), nu are sens să
se mai continue cercetarea printr-o eventuală tentativă de extindere a acestui indicator
(deja nereprezentativ la nivel restrâns) asupra colectivităţii generale.

Între răspunsurile înregistrate de la cele 100 de persoane cuprinse în sondaj se mai


constată că 82 sunt dornice să participe la un program de formare continuă, în timp ce
restul de 18 persoane resping oportunitatea oferită de angajator. Această caracteristică
alternativă, prezintă o medie de:
m 82
w= = = 0,82
n 100
şi o dispersie de:
σ w2 = w(1 − w) = 0,82 ⋅ 0,18 = 0,1476
Dacă s-ar fi utilizat procedeul extragerii mecanice sau procedeul extragerii
repetate, atunci pentru calculul erorii medii de reprezentativitate a unui (oricărui) eşantion
de volum n=100 s-ar fi aplicat relaţiile [5.4] pentru caracteristica numerică şi [5.6] pentru
cea alternativă. Cum sondajul a avut în vedere extragerea nerepetată (pentru a spori
Statistică teoretică şi economică

reprezentativitatea eşantionului), se aplică relaţiile [5.4’] şi, respectiv [5.6’], obţinându-


se:

y pentru caracteristica numerică:


σ2  n 149,24  100 
µx = 1 −  = 1 −  = ±1,21 ani,
n −1 N  100 − 1  4000 
ceea ce înseamnă că media unui eşantion de volum n = 100 obţinut prin extragere
aleatoare nerepetată se abate în medie cu 1,2 ani (+) faţă de vârsta medie reală ( x0 ) a
celor 4000 de persoane angajate de corporaţie;

y pentru caracteristica alternativă:


w(1 − w)  n 0,1476  100 
µw = 1 −  = 1 −  = ±0,038
n −1  N 100 − 1  4000 
Rezultatul indică o abatere medie cu +3,8% a proporţiei personalului dornic de a
participa la formarea profesională continuă cuprins în eşantion, faţă de proporţia reală
 M
p=  în rândul întregului personal al corporaţiei.
 N

În practica economică nu interesează, de obicei, eroarea medie de


reprezentativitate a eşantionului, ci abaterea maximă sau eroarea limită ce poate apare
ca diferenţă între media unui eşantion (estimator) şi media colectivităţii generale
(parametru) la estimarea acestuia cu o anumită probabilitate.
Deoarece eroarea limită este diferenţa dintre x şi x 0, ne folosim de proprietăţile
repatiţiei normale pentru a asocia diverse mărimi ale erorii cu probalilităţile aferente
măsurate ca (sub) multipli ai abaterii standard a mediilor de eşantionare faţă de x0 .
Eroarea limită se calculează astfel:
• pentru variabilă numerică:

∆x = z ⋅ µx [5.7]

• pentru variabila alternativă:

∆w = z ⋅ µw [5.8]

Există tabele ale repartiţiei normale care exprimă relaţia dintre argumentul z sau t şi
funcţia de probabilitatea φ(z) sau φ(t) corespunzătoare.
În exemplul considerat, eroarea limită pentru o probabilitate Φ(z) = 0,95 (z = 1,96)
este:
y pentru caracteristica numerică, de aproximativ 2,4 ani:
∆ x = z ⋅ µ x = 1,96 ⋅ 1,21 = 2,37 ani ≅ 2,4 ani,
Statistică teoretică şi economică

Semnificaţia rezultatului: distanţa maximă ce poate exista între media eşantionului


( x0 ) este de +2,4 ani, această afirmaţie fiind valabilă cu o probabilitate de 0,95 (se
acceptă un prag de eroare α=0,05);

y pentru caracteristica alternativă:


∆ w = z ⋅ µ w = 1,96 ⋅ 0,038 = 0,07448 sau 7,4%.

Interpretarea este asemănătoare celei prezentate la ∆x. Diferenţa maximă între w şi p


(proporţia celor înclinaţi să facă un program de formare contiună în cadrul eşantionului –
w şi, respectiv în colectivitatea generală - p) este, cu aceeaşi probabilitate Φ(z) = 0,95 de
7,4%.

Observaţii:
1. Un tabel cu valorile funcţiei Gauss – Laplace corespunzând diferitelor valori ale lui z
se găseşte în volumul Bazele statisticii pentru economişti. Aplicaţii. Bucureşti, Editura
Tribuna Economică, 2002, p. 259-260.
2. Dacă s-ar fi folosit extragerea mecanică, sau extragerea repetată, eroarea limită era
ceva mai mare: ∆x = 2,41 ani (faţă de 2,37 ani); ∆w = 7,6% (faţă de 7,4%).
Coeficientul de corecţie aplicat în cazul sondajului nerepetat este întotdeauna o
mărime subunitară care restrânge mărimea erorii medii de reprezentativitate şi,
respectiv, a erorii limită, oferind o estimare mai exactă a parametrilor colectivităţii
generale.
3. Nu este obligatoriu ca probabilitatea cu care se estimează diverşi parametrii ai
colectivităţii generale să fie aceeaşi la toate variabilele cerectate.
Statistică teoretică şi economică

Probleme şi aplicaţii.
5.1. Un echipament de ambalare este astfel reglat încât să împacheteze câte 20 de
bomboane cu o toleranţă de ±1 bucată.
Pentru a aprecia calitatea reglajului, din producţia unei zile s-a prelevat prin
extragere mecanică un eşantion de 150 pachete care conţineau în total 3015
bomboane în loc de 3000 bomboane. Din cercetarea eşantionului rezultă că în jurul
mediei de 20,1 bomboane/pachet, intensitatea împrăştierii era de 7,2%, în condiţiile
în care 129 pachete conţineau exact 20 bomboane, 12 pachete aveau 21 sau mai
multe bomboane, iar 9 pachete erau cu 19 sau mai puţine bomboane.

Se cere:
Să se estimeze cu o probabilitate Φ(z) = 0,9973 (z = 3) numărul total de
bomboane ambalate în lotul de N = 3000 pachete realizate în cursul zilei şi să se observe
dacă echipamentul se încadrează în toleranţa admisă.

Rezolvare:
Din enunţul problemei rezultă că eşantionul se caracterizează prin:
• Volumul n = 150 pachete;
• Media x = 20,1 bomboane/pachet;
• Abaterea standard σ = 1,4472 bomboane/pachet (din relaţia coeficientului de

σ
variaţie v = ⋅ 100 = 7,2% )
x
Pe baza acestor date, se poate estima eroarea medie de reprezentativitate, ştiind
că în cazul extragerii mecanice se aplică relaţia de la sondajul simplu, aleator, repetat:

σ2 2,0944
µx = = = 0,118 bucati
n 150

Un eşantion de 150 produse prelevate mecanic din producţia zilei, prezintă, în


medie, o abatere cu 0,118 bomboane/pachet faţă de numărul mediu ( x0 ) ce caracterizează
întrega producţie.
Eroarea limită pentru Φ(z) = 0,9973:

∆ x = z ⋅ µ x = 3 ⋅ 0,118 = 0,35 bucati

Numărul mediu de bomboane/pachet în producţia zilei se situează, cu


probabilitatea de 0,9973 în intervalul:
x0 ∈ ( x ± ∆ x ), adica, x 0 ∈ ( 20,1 ± 0,35)
Prin urmare: 19,75 ≤ x 0 ≤ 20,45 , ceea ce, aplicat întregii producţii a zilei conduce
(prin multiplicarea cu N = 3000) la un număr total (T) de bomboane ambalate de:
59250 ≤ T ≤ 61350 , cu Φ(z) = 0,9973, în condiţiile în care reglajul trebuia să
încadreze acest număr între (20-1)⋅3000 = 57.000 bucăţi şi (20+1)⋅3000 = 63.000 bucăţi.
Statistică teoretică şi economică

Întrucât intervalul de estimare (59.250, 61.350) este mult mai mic decât toleranţa
admisă (57.000, 63.000), rezultă că reglajul este corespunzător.
Răspuns: Numărul total de bomboane ambalate este situat, cu Φ(z) = 0,9973 între
59.250 şi 61.350 bucăţi. Echipamentul se încadrează în tolerenţa admisă.
Cât de mare ar trebui să fie un eşantion, dacă numărul mediu de bomboane/pachet
ar trebui estimat cu Φ(z) = 0,9545 (z = 2) în limitele unui interval de ±0,5 bucăţi?

Rezolvare:

z 2 ⋅ σ 2 4 ⋅ 2,0944
n= = = 33,5104 ≅ 34 pachete .
∆2x 0,52

Răspuns: Pentru a răspunde unei astfel de exigenţe, ar fi suficient să se preleve


prin extragere mecanică doar 34 pachete, ceea ce la o producţie totală de 3000 pachete
N
înseamnă un pas de numărare ≈ 88 .
n
Să se observe în eşantionul de 150 pachete, cota de produse care nu îndeplinesc
cerinţa de 20 bomboane/pachet şi să se estimeze cu Φ(z) = 0,90 (z = 1,65) cota minimă şi
maximă, precum şi numărul minim şi maxim de pachete necorespunzătoare din punct de
vedere al conţinutului în producţia unei zile.
Rezolvare:
Din 150 pachete prelevate, 12+9 = 21 pachete conţin fie mai multe, fie mai puţine
produse decât numărul standard de 20 bomboane/pachet.
În cadrul eşantionului, media (w) şi dispersia ( σ w2 ) caracteristicii alternative
sunt:

m 21
w= = = 0,14 , ceea ce înseamnă că 14% din eşantion nu corespunde
n 150
standardului de ambalare.

σ w2 = w(1 − w) = 0,14 ⋅ 0,86 = 0,1204

Eroarea medie de reprezentativitate a unui eşantion de volum 150 obţinut prin


prelevare mecanică este de:

σ w2 0,1204
µw = = = 0,0283 sau 2,83%
n 150

Un eşantion de volum 150 prelevat mecanic se caracterizează, în medie, printr-o


cotă de produse necorespunzătoare cu 2,83% mai mare sau mai mică decât cota parte
specifică întregii producţii a unei zile.
Eroarea limită pentru o probabilitate de 0,90 este de:
Statistică teoretică şi economică

∆ w = z ⋅ µ w = 1,65 ⋅ 0,0283 = 0,0467 sau 4,7% .

La probabilitatea menţionată, abaterea maximă a unui eşantion de volum 150


prelevat mecanic faţă de cota reală de produse necorespunzătoare din producţia unei zile
este 4,7%.
În aceste condiţii, la Φ(z) = 0,90, cota minimă şi maximă de defecte în producţia
zilei este cuprinsă în intervalul:

p ∈ ( w ± ∆ w ), adica : p ∈ (0,14 ± 0,047) sau:


0,093 ≤ p ≤ 0,187 , cu Φ(z) = 0,90.

Numărul minim şi maxim de pachete necorespunzătoare (M) în producţia unei zile


se obţine înmulţind cu N = 3000 limitele intervalului în care se încadrează cota de
defecte:
279 ≤ M ≤ 561 pachete, cu Φ(z) = 0,90.
Cel puţin 279 pachete şi cel mult 561 pachete din lotul fabricat de 3000, cuprinde
mai mult sau mai puţin de 20 bomboane/pachet, cu o probabilitate de 0,90 (sau cu o
marjă de eroare acceptată de 1-0,90 = 0,10 sau 10%).
Având în vedere că un client nu va reclama decât în situaţia în care obţine mai
puţine bomboane decât numărul de 20 (care apare înscris pe pachet), se cere refacerea
calculelor, considerând că m = 9 pachete din 150 verificate.
Răspuns: w = 0,06; w(1-w) = 0,0564; µ w = 0,02; ∆ w = 0,03; 0,03 ≤ p ≤ 0,09 ;
90 ≤ M ≤ 270 pachete, cu Φ ( z ) = 0,9 .

5.2. Dintr-o comandă de 1000 piese, se prelevă un eşantion de 65 piese prin extragere
aleatoare, simplă, nerepetată. Potrivit comenzii, fiecare piesă ar trebui să cântărească
85 grame. După examinarea eşantionului, se constată că greutatea medie a pieselor
este de 87,2g, dispersia eşantionului fiind de 70,6746, abaterea standard de 8,4g,
coeficientul de variaţie 9,6%. Între piesele eşantionului se află 26 piese cu greutatea
mai mare decât cea prevăzută de comandă.

Se cere:
Estimarea cu Φ(z) = 0,9545 (z = 2) limitele intervalului în care se înscrie
greutatea medie a celor 1000 piese din lot.

Rezolvare:
Eroarea medie de reprezentativitate în cazul sondajului aleator, simplu, nerepetat,
se estimează astfel:

σ2  n 70,6746  65 
µx = 1 −  = 1 −  = 1,0083 g
n  N 65  1000 
Statistică teoretică şi economică

Eroarea limită:

∆ x = z ⋅ µ x = 2 ⋅ 1,0083 ≈ 2,02 g , pentru Φ(z) = 0,9545

Intervalul în care se înscrie greutatea medie a tuturor pieselor cu probabilitatea


menţionată este:
x 0 ∈ (87,2 ± 2,02) ⇒ 85,18 ≤ x 0 ≤ 89,22 g
Estimarea cu Φ(z) = 0,90 (z = 1,65) a cotei maxime de produse cu greutatea
depăşită.
Rezolvare:

σ w2  n
µw = 1 −  , unde σ w = w(1 − w) = 0,4 ⋅ 0,6 = 0,24
2

n  N

µ w = 0,059 sau 5,9%

∆ w = z ⋅ µ w = 1,65 ⋅ 0,059 = 0,097 sau 9,7%

Cota maximă este, de fapt, limita superioară a intervalului în care se înscrie p,


respectiv w + ∆w = 0,4 + 0,097 = 0,497, ceea ce, în mărime absolută, înseamnă 497 piese.
Cât de mare ar trebui să fie eşantionul extras prin acelaşi procedeu pentru o nouă
cercetare, dacă ar trebui să se estimeze cota minimă şi maximă cu probabilitatea Φ(z) =
0,9545 (z = 2) în limitele unui interval de ±5%, respective ±0,05.

Răspuns:

z 2 ⋅ σ w2 4 ⋅ 0,24
n= = = 974,62 ≅ 975 piese
z ⋅ σ w 0,05 + 0,00096
2 2 2
∆w +
2

Cu acest rezultat, locul cercetării selective este luat de examinarea integrală a


lotului comandat.

5.2.În rândul personalului operativ al unui centru de librării se efectuează un sondaj


stratificat cu extragere nerepetată. Între caracteristicile observate pe cele n = 80
de persoane din eşantion, se numără vânzările medii săptămânale (milioane lei)
şi felul raionului de mărfuri. Rezultatele înregistrării eşantionului se prezintă
astfel:
Statistică teoretică şi economică

Felul raionului de mărfuri Total


Anticariat Jucării Librărie Papetărie

Vânzări
medii (mil lei)
Până la 3 3 --- --- 2 5
3–5 5 3 12 8 28
5–7 2 5 12 10 29
7 şi peste --- 12 6 --- 18
Total 10 20 30 20 80

Se cere:
Să se caracterizeze acest eşantion.
Rezolvare:
Vânzarea medie săptămânală realizată de cele 80 persoane este x = 5,5 mil lei.
Amplitudinea variaţiei este de 6 mil lei, adică 109,09% faţă de medie. Acest indicator
permite aprecierea că cele 80 de elemente ale eşantionului prezintă o împrăştiere relativ
mare (peste 100%).
Dispersia eşantionului: σ 2 = 3,05 .
Abaterea standard: σ = 1,7464 mil lei.
Coeficientul de variaţie: v = 31,75%.
În pofida întinderii relativ mari a împrăştierii, colectivitatea este destul de
omogenă (intensitatea împrăştierii este sub 35%).
Analiza variaţiei vânzărilor medii săptămânale în cadrul celor 4 grupe constituite
după felul mărfurilor comercializate şi elementele de calcul pentru verificarea regulii de
adunare a dispersiilor sunt prezentate în tabelul 53.2. Pe baza acestei identităţi se
stabileşte în ce măsură influenţează felul mărfurilor variaţiei volumului vânzărilor
săptămânale.

Raionul j nj xj σ 2j xj − x ( x j − x)2 ⋅ n j σ 2j ⋅ n j
Anticariat 1 10 3,8 1,96 -1,7 28,9 19,6
Jucării 2 20 6,9 2,19 +1,4 39,2 43,8
Librărie 3 30 5,6 2,24 +0,1 0,3 67,2
Papetărie 4 20 4,8 1,76 -0,7 9,8 35,2
Total --- 80 --- --- --- 78,2 165,8

Regula de adunare a dispersiilor: σ 2 = δ 2 + σ 2 , în care:


‰ Dispersia generală a eşantionului este deja calculată: σ 2 = 3,05 .
‰ Dispersia indusă (explicată) de felul mărfurilor vândute:
Σ( x j − x ) 2 ⋅ n j 78,2
δ =
2
= = 0,9775 .
Σn j 80

Σσ 2 ⋅ n j 165,8
‰ Dispersia reziduală: σ = 2
= = 2,0725
Σn j 80
Statistică teoretică şi economică

Regula se verifică: 3,05 = 0,9775 + 2,0725, iar pe baza ei se calculează


coeficientul de determinaţie:

δ2 0,9775
D= ⋅ 100 = ⋅ 100 = 32%
σ 2
3,05

Varietatea mărfurilor comercializate în diferitele raioane ale centrului de librării


explică în proporţie de 32% variaţia vânzărilor medii săptămânale realizate de cele 80 de
persoane din eşantion.
Să se estimeze cu Φ(z) = 0,9545 (z = 2) volumul mediu săptămânal al vânzărilor
realizate de întregul personal operativ al centrului de librării (N = 760 persoane).
Rezolvare:
Eroarea medie de reprezentativitate în cazul sondajului stratificat cu extragere
nerepetată se determină astfel:

σ2 n 2,0725  80 
µx = 1 −  = 1 −  = 0,15 mil lei
n  N 80  760 

Eroarea limită:

∆ x = z ⋅ µ x = 2 ⋅ 0,15 = 0,3 mil.lei

Prin urmare, x 0 ∈ (5,5 ± 0,3) cu o probabilitate de 95,45%.


Limitele intervalului în care se încadrează vânzarea medie săptămânală a celor
760 angajaţi direct în procesul vânzării sunt: 5,2 mil lei şi, respectiv, 5,8 mil lei.
Pe acest temei, managementul acestei firme poate conta sâptămânal, cu Φ(z) =
0,9545, pe încasări situate între 3952 şi 4408 milioane lei.
Cât de mare ar trebui să fie eşantionul într-o nouă cercetare selectivă bazată pe
extracţia stratificată nerepetată a elementelor componente, dacă estimarea ar trebui făcută
cu aceeaşi probabilitate Φ(z) = 0,9545 (z = 2), dar în limitele unui interval de estimare de
±0,5 milioane lei?
Răspuns:

z2 ⋅σ 2 4 ⋅ 2,0725
n= = = 31,74 ≅ 32 persoane
z ⋅σ
2 2
8,28
∆2 + 0,5 +
2

N 760

Cu ce probabilitate s-ar putea face estimarea limitelor intervalului în care se


încadrează vânzarea medie săptămânală, dacă ∆ x = ±0,5 mil lei, dar se păstrează
mărimea iniţială a eşantionului: n = 80 persoane?
Răspuns: Prin înlocuire în relaţia de mai sus, se obţine că z = 3,28, ceea ce corespunde
lui Φ(z) = 0,999481 în orice tabel al distribuţiei normale.
Statistică teoretică şi economică

Revenind la un volum necesar al eşantionului de 32 persoane, cum se face


stratificarea?
Rezolvare:
Stratificarea se realizează pentru a asigura pătrunderea în eşantion a unor
elemente din toate tipurile existente în colectivitatea generală. Există mai multe tipuri de
stratificare a eşantionului:
(1) Un procedeu elementar constă în stratificarea simplă, respectiv împărţirea
volumului stabilit al eşantionului (n = 32) la numărul grupelor existente în colectivitatea
generală (r = 4 tipuri de mărfuri comercializate).
Prin urmare, câte 32:4 = 8 elemente se vor preleva din fiecare strat, prin extragere
nerepetată.
 Nj 
(2) Stratificarea proporţională ţine seama de structura   specifică mulţimii
 ΣN 
 j 
ce alcătuieşte colectivitatea generală. În cadrul firmei, personalul operativ (760 persoane)
prezintă următoarea structură: anticariat 9,5% (72 persoane), jucării 30% (228 persoane),
librărie 32,5% (247 persoane), iar în raioanele de papetărie circa 28% (213 persoane).
Pentru a transfera această structură asupra eşantionului, se foloseşte relaţia:
Nj
nj = n⋅
ΣN j
Astfel, cele 32 elemente din eşantion se repartizează după cum urmează: 3
persoane se prelevă (prin extragere nerepetată) dintre (cei 72 de) anticari; 10 persoane
dintre cele ce comercializează jucării; 10 persoane dintre librari şi 9 persoane dintre
vânzătoarele de la raioanele de papetărie:
3 + 10 + 10 + 9 = 32 persoane.
Evident, unele rotunjiri s-au impus fiind vorba de unităţi indivizibile (persoane)
ale colectivităţii generale.

(3) Stratificarea optimă a eşantionului presupune luarea în considerare nu numai a


structurii colectivităţii generale pe tipuri de activităţi ( N j cu j = 1, r ), dar şi a dispersiei
specifice fiecărei strat ( σ 2j ) din colectivitate.
Astfel, relaţia care se foloseşte la structurarea eşantionului devine:

N j ⋅ σ 2j
nj = n⋅
ΣN j ⋅ σ 2j

Mai sus s-au arătat valorile Nj, iar în tabelul 53.2, coloana a cincea, se află σ 2j . Cu
aceste date, pentru aflarea numărului de persoane care urmează să intre în alcătuirea
eşantionului din rândul celor care se ocupă de anticariat este:

72 ⋅ 1,96
n1 = 32 ⋅ = 2,88 ≅ 3 persoane.
1568,6
Statistică teoretică şi economică

Pentru celelalte trei grupe rezultă, în ordine: 10 persoane; 11 persoane; 8


persoane.
3 + 10 + 11 + 8 = 32 persoane.
Observaţie: Prelucrarea datelor referitoare la eventualele caracteristici alternative se face
în mod asemănător.

5.4. O societate comercială prezintă următoarea repartiţie a personalului său pe


grupe de vârstă:
(date convenţionale)
Grupe de vârstă (ani) Număr de persoane
Sub 20 10
20-30 30
30-40 40
40-50 15
peste 50 5
Total 100

Se cere:
1. să se reprezinte grafic repartiţia;
2. se consideră că cele 100 de persoane constituie un eşantion extras aleator, simplu,
nerepetat dintr-o colectivitate generală de 1000 persoane; să se determine intervalele de
vârstă între care se situează vârsta medie a celor 1000 persoane considerându-se
Φ( z ) = 0,9545; z = 2.

5.5. Timpul pentru înotătoarele cu vârsta cuprinsă între 9 şi 10 ani pe distanţa de 50


metrii, stilul fluture, este aproximativ normal distribuită cu media 49,4 secunde şi
abaterea standard de 2,8 secunde.
1. să se găsească probabilitatea în cazul unui eşantion aleator simplu de 25 de înotătoare
care să aibe media mai mare de 50,15 secunde.

5.6. Să se obţină un eşantion aleator de mărime 25 cu media x = 83,4 şi abaterea


medie pătratică σ = 12 , dintr-o populaţie cu o distribuţie normală dacă media
colectivităţii generale este x 0 = 83.

5.7. În tabelul următor sunt prezentaţi numărul de enoriaşi ai unei biserici ortodoxe
pe grupe de vârstă:

Vârsta (ani) Număr de enoriaşi


Sub 20 274
21-50 526
peste 50 345

Se cere:
1. dacă se efectuează o selecţie stratificată de volum n=100, să se determine numărul de
enoriaşi care trebuie să facă parte din fiecare strat;
2. aceeaşi cerinţă în cazul în care se cunosc abaterile standard ale celor trei straturi:
σ 1 = 1,2; σ 2 = 4,8; σ 3 = 2,3.
Statistică teoretică şi economică

5.8. Care este valoarea erorii standard a mediei unui eşantion de volum n=100,
selectat simplu, aleator repetat, dacă dispersia este egală cu 25?

5.9. În tabelul următor sunt prezentate datele referitoare la localitatea de rezidenţă


a studenţilor unei facultăţi economice:

Localizarea geografică Număr de studenţi


Nord – est 347
Sud – est 624
Sud – vest 196
Nord – vest 93
Se cere:
1. dacă se utilizează selecţia stratificată de volum n=200, care va fi mărimea fiecărui
strat?

5.10. Un eşantion de 500 de familii chestionate în legătură cu nivelul mediu al


cheltuielilor destinate produselor alimentare se prezintă astfel:

Cheltuieli pentru alimente (mii lei) Număr de persoane


Sub 500 80
500-800 120
600-900 150
900-1200 100
peste 1200 50
Total 500

1. să se determine coeficientul de asimetrie al repartiţiei;


2. dacă cele 500 de familii sunt considerate ca fiind o colectivitate generală din care se
extrege un eşantion aleator şi nerepetat cu φ ( z ) = 0,8064; z = 1,3 , să se deteremine
mărimea eşantionului.

S-ar putea să vă placă și