Sunteți pe pagina 1din 11

SONDAJUL STATISTIC

Estimarea mediei:
Intervalul de încredere este: x −  x    x +  x pentru sondaj simplu (serii unidimensionale)

Intervalul de încredere este: 𝑦̄ − 𝛥𝑦 ≤ 𝜇 ≤ 𝑦̄ + 𝛥𝑦 pentru sondaj stratificat (serii bidimensionale)


Eroarea limita maxim admisa (eroarea de estimatie):
𝛥𝑥 = 𝑧𝛼/2 ⋅ 𝑠𝑥 pentru sondajul simplu
𝛥𝑦 = 𝑧𝛼/2 ⋅ 𝑠𝑦 pentru sondajul stratificat
𝑧𝛼/2 argumentul functiei Gauss Laplace pentru probabilitatea P cu care se garanteaza rezultatele
𝛼 prag de semnificatie = 1-P

Ex: P=0,95 => α =1-P=0.05=> α /2=0,05/2=0,025=>0,5-0,025=0,475 Aceasta valoare o cautam in


interiorul tabelului repartitiei normale (tabelul z) si gasim ca 0,475 se afla la intersectia liniei 1,9
cu coloana 0,06,deci valorea critica z(0,05/2)=1,9+0,06=1,96.

Eroarea standard:
Sondaj simplu repetat ∑𝑛𝑖=1(𝑥𝑖 − 𝑥)2
𝑠2 𝑠2 =
𝑠𝑥 = √ 𝑛−1
𝑛

nerepetat
𝑠2 𝑛
𝑠𝑥 = √ (1 − )
𝑛 𝑁

Sondaj stratificat repetat ∑𝑟𝑖=1 𝑠𝑖2 (𝑛𝑖 − 1) 𝑆𝑆𝑊


𝑠̄ 2 2
𝑠̄ = =
𝑠𝑦 = √ 𝑛−𝑟 𝑛−𝑟
𝑛

nerepetat
𝑠̄ 2 𝑛
𝑠𝑦 = √ (1 − )
𝑛 𝑁

Estimarea valorii totale:


Intervalul de încredere este: N(𝑥̄ − 𝛥𝑥 ) ≤ ∑𝑁𝑖=1 𝑥𝑖 ≤ 𝑁(𝑥̄ + 𝛥𝑥 ) pentru sondaj simplu (serii
unidimensionale)
Intervalul de încredere este: 𝑁(𝑦̄ − 𝛥𝑦) ≤ ∑𝑁𝑖=1 𝑦𝑖 ≤ 𝑁(𝑦̄ + 𝛥𝑦 ) pentru sondaj stratificat (serii

bidimensionale)
Lungimea intervalului de încredere scade dacă:
- se măreşte volumul eşantionului;
- se diminuează probabilitatea de garantare a rezultatelor;
- datele au o variabilitate redusă (omogenitate ridicată).

Determinarea volumului eşantionului


Tip sondaj Tip selecţie Volumul eşantionului Observaţii
a) variabilă numerică
( z / 2 ) 2  s 2
repetată n= s 2 este estimatorul
2
x
simplu
2
𝑧𝛼/2 𝑠2 𝑁 2
𝑧𝛼/2 𝑠2 dispersiei 2, de
nerepetată 𝑛= = regulă necunoscută
2
𝑧𝛼/2 𝑠 2 + 𝛥2𝑥 𝑁 2
𝑧𝛼/2 𝑠2
𝛥2𝑥 +
𝑁
(𝑧𝛼/2 )2 ⋅ 𝑠̄ 2
repetată 𝑛= r

stratificat
𝛥2𝑦
𝑧 2 ⋅ 𝑠̄ 2
 s (n 2
i i − 1)
nerepetată 𝑛= s =
2 i =1

𝛥2𝑦 +
𝑧 2 ⋅ 𝑠̄ 2 n−r
𝑁
b) variabilă categorială alternativă
z 2 f (1 − f )
repetată n=
2f
simplu z 2 f (1 − f ) N z 2 f (1 − f )
n= =
nerepetată  N + z 2 f (1 − f )
2
z 2 f (1 − f )
f
2f +
N
z 2  s f2
repetată n=
2f r

stratificat z 2  s f2 s 2
fi ni
n == s =
2 i =1

z 2  s f2 n−r
f
nerepetată
2f +
N

APLICAȚII REZOLVATE

1. Pentru un eşantion de 100 unităţi hoteliere de tip pensiune din România s-au obţimut
următoarele rezultate în anul 2014:
- valoarea medie a încasărilor în primul trimestru al anului: 200 mil lei;
- dispersia privind profitul: 900.
Ştiind că eşantionul reprezintă 10% din totalul unităţilor hoteliere de tip pensiune, s-a
format prin selecţie nerepetată şi rezultatele se garantează cu o probabilitate P=0,9973 (z=3) se
cere:
a) estimarea valorii medii a încasărilor şi a încasărilor totale la nivelul colectivităţii
generale;
b) dimensionarea unui nou eşantion dacă eroarea limită maximă admisă creşte cu 5%;
c) dimensionarea unui nou eşantion dacă eroarea limită maximă admisă scade cu 5%;
d) dimensionarea unui nou eşantion dacă probabilitatea cu care se garantează rezultatele este
P=0,9545 (z=2).
Rezolvare:
Suntem în cazul sondajului simplu nerepetat.
a) Pentru estimarea parametrilor în populaţia totală este necesar să se calculeze
eroarea limită maximă admisă:
𝑠2 𝑛 900
𝛥𝑥 = 𝑧𝛼/2 ⋅ 𝑠𝑥 = 𝑧𝛼/2 √ 𝑛 (1 − 𝑁) = 3√100 0,9=8,37 mil.lei

Estimarea valorii medii a încasărilor:


x − x    x + x
200 − 8,37    200 + 8,37
181,63    208,37

Interpretare: Valoarea medie a încasărilor la nivelul întregii colectivităţi se găseşte în intervalul


(181,63; 208,37) milioane lei/unitate hotelieră cu o probabilitate de 99,73%.
Estimarea valorii totale a încasărilor:
N
N  ( x −  x )   xi  N  ( x +  x )
i =1
N
1000 181,63   xi  1000  208,37
i =1
N
181630   xi  208370
i =1

Interpretare: Valoarea totală a încasărilor la nivelul întregii colectivităţi se găseşte în intervalul


(181630; 208370) milioane lei cu o probabilitate de 99,73%.
b) Pentru dimensionarea unui nou eşantion când creşte eroarea se foloseşte relaţia:
unităţi hoteliere
2
𝑧𝛼/2 𝑠2
𝑛′ = 2
𝑧𝛼/2 𝑠2
𝛥′2
𝑥 + 𝑁
3  900
2
n= = 94,9  95 unităţi hoteliere
'
3  900
2
8,7885 +
2
1000
 x = 1,05  8,37 = 8,7885 mil.lei
'

Interpretare: A crescut eroarea limită maximă admisă şi a scăzut volumul eşantionului.


c) Pentru dimensionarea unui nou eşantion când scade eroarea se foloseşte relaţia:
unităţi hoteliere
2
𝑧𝛼/2 𝑠2
𝑛′ = 2
𝑧𝛼/2 𝑠2
𝛥′2
𝑥 + 𝑁
3  900
2
n= = 113,5  114 unităţi hoteliere
'
3  900
2
7,9515 +
2
1000
x
'
= 0,95  8 ,37 = 7,9515 mil.lei
Interpretare: A scăzut eroarea limită maximă admisă şi a crescut volumul eşantionului. Între
eroarea limită maximă admisă şi volumul eşantionului există relaţie de inversă proporţionalitate.
d) Pentru dimensionarea unui nou eşantion când scade probabilitatea cu care se garantează
rezultatele se foloseşte relaţia:
′2
𝑧𝛼/2 𝑠2
𝑛′ = 𝑧′2 2 unităţi hoteliere
𝛼/2 𝑠
𝛥2
𝑥
+
𝑁

2  900
2
n= = 48,87  49 unităţi hoteliere
'

2
2
 900
8,37 +
2
1000
Interpretare: Între probabilitatea cu care se garantează rezultatele şi volumul eşantionului există
relaţie de directă proporţionalitate.

2. Pentru un eşantion de 50 clienţi (persoane fizice) ai unei bănci se cunosc datele:


Grupe de clienţi după valoarea Număr
depozitelor bancare (mii RON) clienţi
sub 2 5
2-4 15
4-6 20
6-8 8
peste 8 2
Total 50
Se cere:
a) estimaţi limitele între care se vor încadra valoarea medie şi valoarea totală a
depozitelor bancare în colectivitatea generală dacă eşantionul reprezintă 10% din
totalul clienţilor, s-a format prin selecţie nerepetată, iar probabilitatea cu care se
garantează rezultatele este 0.9545 (z =2 );
b) determinaţi noul volum al eşantionului dacă eroarea limită maximă admisă este de 0,8 mii
RON;
c) transformaţi variabila „valoarea depozitului” în variabilă alternativă (binară) luând
drept prag limita inferioară a intervalului în care se găseşte media;
d) estimaţi limitele între care se va încadra proporţia clienţilor cu valoarea depozitelor
mai mică decât valoarea luată ca prag.

Rezolvare:
Suntem în cazul sondajului aleatoriu simplu.
a) Pentru estimarea parametrilor colectivităţii generale trebuie efectuate următoarele
calcule în prealabil:
- calcularea mediei eşantionului:
5
 xi  ni
i =1 1  5 + 3  15 + 5  20 + 7  8 + 9  2
x= 5
= = 4,48 mii RON
 ni 50
i =1

- calcularea dispersiei:
∑𝑛𝑖=1(𝑥𝑖 − 𝑥)2 (1 − 4,48)2 5 + (3 − 4,48)2 15 + ⋯ + (9 − 4,48)2 2
𝑠2 = = 𝑠2 = = 3,8096
𝑛 50

- calcularea erorii limite maxime admise:


𝑠2 𝑛 3,8096
𝛥𝑥 = 𝑧𝛼/2 ⋅ 𝑠𝑥 = 𝑧𝛼/2 √ (1 − ) = 2√ 0,9=0,52 mii RON
𝑛 𝑁 50

Estimarea mediei în colectivitatea generală:


x − x    x + x
4,48 − 0,52    4,48 + 0,52
3,96    5
Interpretare: Valoarea medie a depozitelor bancare la nivelul întregii colectivităţi se găseşte în
intervalul (3,96; 5) mii RON cu o probabilitate de 95,45%.
Estimarea valorii totale în colectivitatea generală:
N
N  ( x −  x )   xi  N  ( x +  x )
i =1
N
500  3,96   xi  500  5
i =1
N
1980   xi  2500
i =1

Interpretare: Valoarea totală a depozitelor bancare la nivelul întregii colectivităţi se găseşte în


intervalul (1980; 2500) mii RON cu o probabilitate de 95,45%.
b) Noul volum al eşantionului:
2
𝑧𝛼/2 𝑠2
𝑛′ = 2
𝑧𝛼/2 𝑠2
𝛥′2
𝑥 + 𝑁
clienţi
2  3,8096
2
n= = 22,74  23 clienţi
'

2  3,8096
2
(0,8) +
2
500

c) Avem o variabilă alternativă (binară):


x = 4,48  [4,6)

Răspuns Număr clienţi


DA m=20
Nu n-m=30
Total n=50

d) În cazul variabilei alternative, indicatorii se calculează astfel:


- media:
𝑚 20
𝑓= = = 0.4
𝑛 50
Interpretare : 40% dintre clienţi au valoarea depozitelor peste 4 mii RON.
- dispersia:

𝑠𝑓2 = 𝑓(1 − 𝑓) = 0.4 ⋅ 0.6 = 0.24

- eroarea limită maximă admisă:


𝑓(1 − 𝑓) 𝑛 0.24
𝛥𝑓 = 𝑧𝛼/2 ⋅ 𝑠𝑓 = 2√ (1 − ) = 2√ 0.9 = 0.13
𝑛 𝑁 50

Estimarea proporţiei clienţilor cu valoarea depozitelor sub valoarea considerată drept prag
(4 mii RON):

f −f  p  f +f .

0,4 − 0,13 ≤ 𝑝 ≤ 0,4 + 0,13.

Interpretare: Ponderea clienţilor care au valoarea depozitelor sub 4 mii RON este cuprinsă între
27 şi 53%.
Estimarea numărului clienţilor cu valoarea depozitelor sub valoarea considerată drept prag
(4 mii RON):

N(𝑓 − 𝛥𝑓 ) ≤ 𝑝 ≤ 𝑁(𝑓 + 𝛥𝑓 ).

500(0,4 − 0,13) ≤ 𝑀 ≤ 500(0,4 + 0,13).

135<M<265

Interpretare : Numărul clienţilor care au valoarea depozitelor sub 4 mii RON este cuprins între
135 şi 265.

3.Pentru un eşantion de 50 de farmacii, ce aparţin unui anumit lanţ farmaceutic, din trei oraşe reşedinţă de
judeţ, s-au înregistrat valorile aferente vânzărilor medii zilnice, în unităţi monetare (u.m.). După prelucrarea
valorilor primare au rezultat datele din tabelul următor:
Număr de Dispersia
Oraşul Vânzări medii zilnice (u.m.)
farmacii vânzărilor
Oraşul A 15 45 100
Oraşul B 22 35 81
Oraşul C 13 66 225

Estimaţi, pentru un nivel de încredere de 95%, valoarea medie a vânzărilor zilnice la nivelul unei farmacii
ce aparţine respectivului lanţ farmaceutic.

Rezolvare:
Intervalul de încredere este: 𝑦̄ − 𝛥𝑦 ≤ 𝜇 ≤ 𝑦̄ + 𝛥𝑦
𝑦̄ - reprezintă valoarea medie a vânzărilor la nivelul eşantionului, valoare determinată ca medie a mediilor
de grupă:
∑3𝑖=1 𝑦𝑖 ⋅𝑛𝑖 45⋅15+35⋅22+66⋅13
𝑦= ∑3𝑖=1 𝑛𝑖
= = 46.06u.m.
50

Întrucât înregistrarea şi prelucrarea datelor s-a realizat la nivelul celor trei grupe/straturi şi nu dispunem de
informaţii referitoare la volumul populaţiei statistice (N = nr. total de farmacii ce aparţine lanţului
farmaceutic respectiv) considerăm sondajul realizat ca fiind stratificat repetat.
Erorile specifice acestui tip de sondaj sunt:
• Eroarea standard (eroarea medie probabilă):
r

𝑠̄ 2  s (n 2
ii i − 1)
𝑠𝑦 = √ , unde s = 2 i =1
𝑛
n−r
r

 s (n 2
i i − 1)
100 14 + 81 21 + 225 12
s =
2 i =1
= = 123.425
n−r 50 − 3

𝑠̄ 2 123.425
𝑠𝑦 = √ =√ = 1.57
𝑛 50

• Eroarea de estimaţie (eroarea limită, eroarea maximă admisă)


𝛥𝑦 = 𝑧𝛼/2 ⋅ 𝑠𝑦 = 1.96 ⋅ 1.57 = 3.08 u.m.
Intervalul de încredere pentru valoarea medie a vânzărilor este:
46.06 − 3.08    46.06 + 3.08
Aşadar, valoarea medie a vânzărilor medii zilnice la nivelul unei farmacii ce aparţine respectivului lanţ
farmaceutic este cuprinsă între 42,98 şi 49,14 u.m., pentru un nivel de încredere de 95%.

4. Un eşantion de 200 de specialişti în domeniu au fost rugaţi să analizeze şi să formuleze aprecieri asupra
noului pachet legislativ din domeniul sănătăţii supus dezbaterii publice. Rezultatele sistematizate sunt:
Opinia Excelent Bun Satisfăcător Slab
Număr de răspunsuri 45 80 64 11
Estimaţi proporţia specialiştilor care apreciază noul pachet legislativ ca fiind cel puţin bun, pentru un nivel
de semnificaţie de 5%.

Rezolvare:

Pentru determinarea proporţiei specialiştilor care apreciază noul pachet legislativ ca fiind cel puţin bun,
transformăm variabila categorială nealternativă „opinia” într-o variabilă alternativă de tipul:
Opinia Număr de răspunsuri
Cel mult satisfăcător (slab+satisfăcător) 75
Cel puţin bun (bun+excelent) m = 125
Total n = 200

În cazul unei variabile categoriale alternative intervalul de încredere este: f −  f  p  f +  f .

Media şi dispersia variabilei alternative a cărei stare favorabilă este definită de aprecierea noului pachet
legislativ ca fiind cel puţin bun sunt:
𝑚 125
𝑓= 𝑛
= 200 = 0.625 (62,5%); 𝑠𝑓2 = 𝑓(1 − 𝑓) = 0.625 ⋅ 0.375 = 0.234

Întrucât nu dispunem de informaţii referitoare la volumul populaţiei statistice (N = nr. total de specialişti
din domeniu) considerăm sondajul realizat ca fiind simplu repetat.
Erorile specifice acestui tip de sondaj sunt:
• Eroarea standard (eroarea medie probabilă):

𝑓(1 − 𝑓) 0.234
𝑠𝑓 = √ =√ = 0.034
𝑛 200

• Eroarea de estimaţie (eroarea limită, eroarea maximă admisă)


𝛥𝑓 = 𝑧𝛼/2 ⋅ 𝑠𝑓 = 1.96 ⋅ 0.034 = 0.067
Intervalul de încredere pentru proporţiei specialiştilor care apreciază noul pachet legislativ ca fiind
cel puţin bun este:
0.625 − 0.067  p  0.625 + 0.067
0.558  p  0.692
Aşadar, proporţia specialiştilor care apreciază noul pachet legislativ ca fiind cel puţin bun este este
cuprinsă între 55,8% şi 69,2%, pentru un nivel de semnificaţie de 5%.
APLICAȚII PROPUSE SPRE REZOLVARE

1. Pentru un sondaj organizat la nivelul a 100 sucursale ale unor bănci comerciale din
România s-au obţinut următoarele rezultate:
Grupe de sucursale după Număr Valoarea medie a Coeficientul de
numărul angajaţilor de la sucursale creditelor acordate variaţie (%)
Departamentul Credite (mii RON)
sub 5 20 200 2,5
5 – 10 50 250 2
peste 10 30 280 3
Total 100 - -
Ştiind că eşantionul reprezintă 10% din colectivitatea generală şi a fost extras prin selecţie
nerepetată, se cere:
a) să se verifice gradul de omogenitate al eşantionului;
b) să se estimeze între ce limite se vor încadra valoarea medie a creditelor acordate şi
valoarea totală dacă probabilitatea cu care se garantează rezultatele este P=0,9973 (z=3);
c) calculaţi volumul unui nou eşantion şi distribuiţi-l proporţional pe subeşantioane dacă:
- eroarea limită creşte cu 20%;
- eroarea limită scade cu 20%;
- rezultatele se garantează cu o probabilitate P=0,9545 (z=2).

2. Distribuţia unui eşantion de 40 de salariaţi ai unei bănci după numărul de zile de


concediu de odihnă dintr-un an este prezentată în tabelul de mai jos:
Zile concediu 15 16 17 18 19 20 21
Număr salariaţi 4 5 6 15 3 4 3

Se cere:
a) să se calculeze eroarea medie de reprezentativitate şi eroarea limită maximă admisă dacă
eşantionul reprezintă 10% din totalul angajaţilor, s-a format prin selecţie nerepetată, iar P=
0,9545 (z=2);
b) să se determine parametrii colectivităţii generale;
c) să se determine proporţia numărului de angajaţi din colectivitatea generală care au avut
concediu de odihnă cu durata mai mică decât durata medie la nivelul eşantionului.

3. Dintr-un sondaj statistic de 10% selectat întâmplător şi nerepetat din cei 2000 de agenti
economici dintr-o ramură s-au obţinut datele:
Grupe de agenţi economici Ponderea Profitul mediu
după mărimea capitalului agenţilor (mii RON/ag.ec.)
(mii RON) economici (%)
sub 20 30 25
20-50 50 30
peste 50 20 40
Ştiind că valoarea coeficientului de variaţie a profitului pe total eşantion este de 20% se
cere:
a) să se stabilească dacă factorul de grupare (mărimea capitalului) este semnificativ pentru
variaţia profitului;
b) să se stabilească limitele între care se vor încadra profitul mediu şi total în colectivitatea
generală dacă probabilitatea cu care se garantează rezultatele este P=0,9545 (z=2).

4. În urma sistematizării datelor privind vechimea în muncă pentru un eşantion de 40 de


angajaţi ai unei bănci s-a obţinut următoarea distribuţie de frecvenţe:
Grupe de salariaţi după Număr
vechime (ani) salariaţi
sub 4 5
4-8 2
8-12 15
12-16 8
16-20 6
peste 20 4
Total 40
Se cere:
a) estimarea vechimii medii a angajaţilor la nivelul întregii bănci (colectivitatea generală)
ştiind că eşantionul reprezintă 10% din colectivitatea generală, s-a format prin selecţie
nerepetată, iar rezultatele se garantează cu o probabilitate de 0,9973 (z=3);
b) să se estimeze volumul eşantionului dacă probabilitatea cu care se garantează rezultatele
este 0,9545 (z=2) şi să se precizeze relaţia care există între probabilitate şi volumul
eşantionului;
c) să se determine numărul de salariaţi din colectivitatea generală care au vechimea peste
16 ani.

5. Pentru 200 din magazinele unei companii producătoare de produse electrocasnice s-au
înregistrat vânzările săptămânale de combine frigorifice:
Grupe de magazine după Ponderea
vânzările săptămânale magazinelor
(bucăţi) (%)
0-4 7
4-8 20
8-12 32
12-16 26
16-20 10
20-24 5
Total 100
Se cere:
a) estimaţi parametrii colectivităţii generale (vânzările medii şi totale ale companiei) dacă
eşantionul reprezintă 10% din total, s-a format prin selecţie nerepetată şi probabilitatea cu
care se garantează rezultatele este 0,95 (z=1,96);
b) să se determine noul volum al eşantionului dacă eroarea limită maximă admisă se
măreşte de două ori.

6.Se cunosc următoarele date referitoare la un eşantion de 200 de sucursale ale unor bănci
comerciale din România în luna august 2014:
Numărul de angajaţi Număr Valoarea medie a Coeficientul de
dintr-o sucursală sucursale depozitelor în euro variaţie al valorii
atrase într-o lună depozitelor (%)
(mii Euro)
sub 10 40 200 2,5
10 – 20 100 250 2
20 şi peste 60 300 4
Total 200 - -
Se cere:
a) să se calculeze eroarea medie de reprezentativitate şi eroarea limită maximă admisă dacă
eşantionul reprezintă 10% din numărul sucursalelor, s-a format prin selecţie nerepetată, iar
probabilitatea cu care se garantează rezultatele este P= 0,9973 (z=3);
b) să se determine parametrii colectivităţii generale (media şi nivelul totalizat al caracteristicii
pentru populaţie);
c) să se determine noul volum al eşantionului dacă eroarea limită maximă admisă scade cu
20% şi să se distribuie proporţional pe subeşantioane;
d) să se determine noul volum al eşantionului dacă probabilitatea cu care se garantează
rezultatele este P = 0,9545 (z = 2).

TESTE GRILĂ

1. Între eroare şi volumul eşantionului există o relaţie:


a) de directă proporţionalitate;
b) de inversă proporţionalitate;
c) uniform;
d) neliniară.
2. Între probabilitate şi volumul eşantionului există o:
a) legătură directă;
b) legătură inversă;
c) legătură liniară;
d) legătură neliniară.
4. Erorile de reprezentativitate:
a) sunt specifice sondajului;
b) sunt comune oricărei metode statistice de observare;
c) sunt determinate de respondenţi;
d) sunt determinate de operatorul de interviu.
6. Eroarea obţinută în cazul unui sondaj simplu faţă de un sondaj stratificat
pentru acelaşi set de date, este:
a) mai mare;
b) mai mică;
c) egală.

S-ar putea să vă placă și