Sunteți pe pagina 1din 41

FORMULE STATISTICA

frecvenţa relativă

ponderea sau greutatea specifică a unui element (xi) în totalul

colectivităţii ( ) se obţine pe baza relaţiei:

Media aritmetică simplă se foloseşte pentru seriile în care fiecare


nivel al caracteristicii este purtat de o singură unitate statistică.

sau , , n=volumul

colectivităţii
Media aritmetică ponderată se foloseşte în cazul seriilor cu
frecvenţe

sau

formule de calcul simplificat a mediei aritmetice:

-pt. serii simple:

-pt. serii ponderate:

a. Dacă se micşorează fiecare variantă a caracteristicii de un anumit


număr de ori ”k”, atunci media seriei se micşorează de acelaşi număr de
ori.
Se obţin următoarele relaţii:

-pt. serii simple:

-pt. serii ponderate:


b. Dacă frecvenţele seriei se micşorează de un număr „c” de ori,
atunci media aritmetică rămâne neschimbată.
Această proprietate se aplică numai seriilor cu frecvenţe.

c. Suma algebrică a abaterilor nivelurilor individuale ale


caracteristicii de la media lor este egală cu zero.

formule de calcul simplificat al mediei aritmetice:

-pt. serii simple:

-pt. serii ponderate:

Media, în cazul caracteristicii alternative


Media unităţilor care nu poartă acea caracteristică se notează cu „q” şi
se determină astfel:

aplicarea relaţiei de calcul a modului:

, unde:

x0 = limita inferioară a intervalului modal,


d = mărimea intervalului modal,
= diferenţa dintre frecvenţa intervalului modal şi frecvenţa intervalului
anterior celui modal,
= diferenţa dintre frecvenţa intervalului modal şi frecvenţa intervalului
următor celui modal.
Pe cale grafică, modul se determină pe baza histogramei

Metodologia de calcul a medianei este diferită după natura seriei


luate în calcul.
Pentru serii simple se întâlnesc două situaţii:
-seria are un număr impar de termeni, când mediana este acea variantă a

caracteristicii cu rangul , după ce în prealabil seria a fost ordonată

crescător, unde n = nr. termenilor.


: ;

, unde:

x0 = limita inferioară a intervalului median;


d = mărimea intervalului median;
Na = frecvenţa cumulată anterioară intervalului median;
nMe = frecvenţa reală a intervalului median.
Pe cale grafică mediana se determină ca şi în situaţia precedentă cu
ajutorul curbei frecvenţelor cumulate.

Quartilele

x0 = limita inferioară a intervalului quattilic;


d = mărimea intervalului quartilic;
UQ1, UQ2, UQ3 = unităţile quartilice;
Na = frecvenţa cumulată anterioară intervalului quartilic;
nQ1, nQ2, nQ3 = frecvenţele reale ale intervalului quartilic.
; ;

Decilele

D5 = Me = Q2

În cazul seriilor cu frecvenţe în care caracteristica este dată pe


variante, mediala se calculează în următoarele etape:
-se determină produsele ;
-se calculează şirul produselor cumulate, notate cu Li;
-se determină unitatea medială conform relaţiei: ;

-se caută locul unităţii mediale pe şirul L i, alegând un nivel egal sau mai
mare decât acesta;
-se identifică mediala ca fiind nivelul caracteristicii corespunzător unităţii
mediale.

În cazul seriilor cu frecvenţe şi caracteristica sub formă de intervale de


variaţie, mediala se determină tot prin calcul şi grafic.
Prin calcul se parcurg operaţiile:
-se determină produsele ;
-se calculează şirul produselor cumulate, notate cu Li;

-se determină unitatea medială conform relaţiei: ;

-se caută locul unităţii mediale pe şirul L i, alegând un nivel egal sau mai
mare decât acesta;
-se identifică intervalul medial, ca fiind intervalul caracteristicii
corespunzător unităţii mediale;

-se aplică formula medialei: , unde:

x0 = limita inferioară a intervalului medial;


d = mărimea intervalului medial;
UMl = unitatea medială;
La = produsul cumulat anterioar intervalului medial;
= produsul corespunzător intervalului medial.
Media cronologică simplă se calculează când momentele sunt egal distanţate
între ele.

Pentru seria , .

Prin transformare, această relaţie devine: .

Media cronologică ponderată se calculează atunci când intervalele de


timp dintre termenii seriilor de momente sunt inegale.
În acest caz, mediile parţiale, din care se calculează media întregii
perioade, sunt ponderate cu durata perioadelor parţiale dintre termenii seriei,
notate cu ti.

Media armonică simplă:

Media armonică ponderată:

Considerăm seria: .
-mediile mobile din câte 3 termeni:

, , , .

-mediile mobile din câte 4 termeni:

, , , .

Media progresivă

, unde:

= media generală a seriei;


= media termenilor calitativ superiori mediei generale.

Media geometrică simplă:

Media geometrică ponderată:

Media pătratică simplă:

Media pătratică ponderată:


 Indicatorii simpli ai dispersiei

Amplitudinea variaţiei

În mărime absolută

În mărime relativă

, unde:

= nivelul maxim, respectiv minim al variabilei X;


= nivelul mediu al variabilei X.

2. Abaterea individuală

În mărime absolută

În mărime relativă

 Indicatorii sintetici ai dispersiei


1. Abaterea medie liniară
-pentru serii simple: , când

-pentru serii cu frecvenţe: , când

2. Varianţa (dispersia)

-pentru serii simple: ,

-pentru serii cu frecvenţe: .

3. Abaterea medie pătratică (deviaţia standard)

pentru serii simple:

-pentru serii cu frecvenţe:

Intervalul mediu de variaţie


, respectiv
. Coeficientul mediu de variaţie
, respectiv

Proprietăţile dispersiei sunt:


 Dispersia unei distribuţii este egală cu diferenţa dintre media
pătratelor tuturor variantelor caracteristicii şi pătratul mediei.

Dispersia unui şir de valori constante este egală cu zero,


 Dispersia calculată din abaterile variantelor caracteristicii faţă
de constanta „a” este mai mare decât dispersia calculată din aceleaşi variante
faţă de media lor cu pătratul diferenţei dintre medie şi constanta „a”.

-pentru serii simple: ,

-pentru serii cu frecvenţe: .

 Dacă fiecare nivel al caracteristicii se micşorează de „k” ori, atunci


dispersia se micşorează de „k2” ori.

-pentru serii simple: ,

-pentru serii cu frecvenţe: .

 Dacă se împarte fiecare nivel al frecvenţelor printr-o constantă „c”,


atunci dispersia rămâne neschimbată.
Aceste proprietăţi sunt folosite pentru calculul simplificat al
dispersiei. Din combinarea lor se ajunge la formulele care conduc la cea mai
mare simplificare a calculelor.

-pentru serii simple: ,

-pentru serii cu frecvenţe: .

Indicatorii de asimetrie
O primă imagine asupra gradului de asimetrie (As) al unei distribuţii o
putem face comparând media ei asimetrică cu modul.

, asimetrie negativă, cu extinderea frecvenţelor spre


stânga.
, asimetrie pozitivă, cu extinderea frecvenţelor spre
dreapta.
În mărimi relative se utilizează coeficientul de asimetrie a lui Pearson
(kas).

Dacă kas =0, , distribuţie simetrică


Dacă kas >0, , distribuţie asimetrică spre dreapta
Dacă kas <0, , distribuţie asimetrică spre stânga.
Pentru seriile moderat asimetrice, coef. de asimetrie trebuie să ia
valori cuprinse în intervalul (-0,3 ; 0,3). Pentru valori în afara acestui
interval se consideră că distribuţiile respective sunt puternic asimetrice.
coeficientul de asimetrie Yule (Cay).

, unde: q2 = Q3 – Me

q1 = Me – Q1.
Dacă valorile Cay se apropie de , atunci distribuţia este moderat
asimetrică, iar dcaă depăşesc , atunci distribuţia este pronunţat
asimetrică.

) Indicatorii de boltire.
. de boltire Pearson ( ) şi coef. de boltire Fisher ( ).

, unde: este dispersia.

, iar se determină după relaţia:

Pentru o distribuţie normală (curba Gauss-Laplace), coeficientul de


boltire ia valoarea 3. Dacă , atunci distribuţia este leptocurtică, iar
dacă , atunci distribuţia este platicurtică.
Coef. de boltire Fisher ( )
, cu interpretarea:

dacă , , distribuţie normală;


, , distribuţie leptocurtică;
, , distribuţie platicurtică.

6.2. Indicii simpli

 Indicele simplu al cantităţilor sau al volumului fizic care este determinat

după relaţia: ,

q1 = volumul fizic în perioada curentă


q0 = volumul fizic în perioada de bază
 Indicele simplu al preţurilor stabilit astfel:

p1 = preţul în perioada curentă


p0 = preţul în perioada de bază
 Indicele simplu valoric stabilit astfel:

, dar v1=q1p1

v0=q0p0

Între aceşti indici se verifică relaţia:


6.2. Indicii simpli
 Indicele simplu al cantităţilor sau al volumului fizic care este determinat

după relaţia: ,

q1 = volumul fizic în perioada curentă


q0 = volumul fizic în perioada de bază
 Indicele simplu al preţurilor stabilit astfel:

p1 = preţul în perioada curentă


p0 = preţul în perioada de bază
 Indicele simplu valoric stabilit astfel:

, dar v1=q1p1

v0=q0p0

Între aceşti indici se verifică relaţia:

Indicii de grup
a. Indicele agregat
Indicele agregat simplu al producţiei se determină astfel:

indicele agregat ponderat, calculat astfel:

sisteme de
ponderare

E. Laspeyres

H. Paasche

variaţiei valorice
Între aceşti indici se verifică relaţia:

În teoria indicilor se mai întâlnesc şi unele sisteme de ponderare care


ţin seama de ponderile din ambele perioade. Întâlnim astfel:
-indicele preţurilor calculat de Edgeworth

-indicele ideal al lui Fisher.


indicelui de grup al volumului fizic
modificarea absolută va fi

Pentru indicele de grup al preţurilor, modificarea absolută va fi:

În cazul indicelui de grup valoric, modificarea este:

În cazul influenţei factorilor exprimată în mărimi absolute se verifică


relaţia:

b. Indic
ele mediu aritmetic ponderat

c. Indic
ele mediu armonic ponderat
6.4 Sistemul indicilor calculaţi din mărimi medii
A. indicele de variaţie bifactorială;
B. indicele cu structură fixă;
C. indicele schimbării structurii.
A. indicele de variaţie bifactorială

B. indicele cu structură fixă (Is.f)

de Laspeyres

C. indicele variaţiei structurii (Iv.s.).


Laspeyres,

Între aceste trei categorii de indici se stabileşte relaţia:

6.5 Gruparea indicilor dinamicii după felul bazei


Indici cu bază fixă
, , .... , ,

Indici cu bază fixă


, , .... , ,
produsul indicilor cu bază mobilă

împărţind doi indici cu bază fixă

6.6Ritmul variaţiei şi al sporului


A. indicatori absoluţi
B. indicatori relativi
C. indicatori medii.
A. Indicatorii absoluţi
Cuprind sporul absolut, care, după modul de alegere a bazei, este:
 spor absolut cu bază fixă ( ) – se obţine ca diferenţă între fiecare
termen al sumei şi termenul ales drept bază de raportare. Considerând
seria: x0, x1, x2, ... , xn, sporul absolut cu bază fixă se va calcula astfel:
; ; .....; sau generalizând:

 spor absolut cu bază mobilă ( ) – este diferenţa dintre fiecare


termen al seriei şi termenul anterior. În aceeaşi serie vom avea:
; ; .....; sau
generalizând:
Între sporurile absolute cu baza fixă şi cele cu baza mobilă se verifică
relaţiile:
-suma sporurilor cu baza mobilă este sporul cu bază fixă al ultimului an:
-diferenţa dintre două sporuri absolute cu baza fixă consecutive este egală cu
sporul cu bază mobilă corespunzător:

B. Indicatorii relativi
1. Ritmul variaţiei (Rx) – exprimă viteză de variaţie exprimată în mărimi
relative. După modul de calcul, rimul variaţiei este de două feluri:
 Ritmul variaţiei cu bază fixă ( ) – arată de câte ori a crescut sau
scăzut nivelul unui fenomen în decursul unei perioade de timp şi se
calculează astfel:

 Ritmul variaţiei cu bază mobilă ( ) – arată de câte ori a crescut sau


scăzut nivelul unui fenomen într-un moment faţă de momentul anterior.

Între ritmul variaţiei cu bază fixă şi cel cu bază mobilă se verifică


relaţiile:
-produsul ritmurilor cu bază mobilă este ritmul cu bază fixă al întregii
perioade:

-raportul a două ritmuri ale variabilei cu bază fixă este egal cu ritmul cu bază
mobilă corespunzător:
2 Ritmul sporului (rx) – exprimă mărimea creşterii sau scăderii în decursul
unei anumite perioade de timp faţă de perioada de bază a unui indicator. Se
calculează:
 Ritmul sporului cu bază fixă ( ) – se calculează ca raport între sporul
cu bază fixă şi nivelul fenomenului considerat din perioada de bază,
astfel:

 Ritmul sporului cu bază mobilă ( ) – se calculează ca raport între


sporul cu bază mobilă şi nivelul fenomenului considerat din perioada
anterioară, astfel:

Relaţii între aceste ritmuri:

C. Indicatorii medii
1. Sporul mediu ( )
, unde:

xn = ultimul termen al seriei,


x0 = primul termen al seriei,
n = nr. termenilor seriei.
2. Ritmul mediu al variaţiei ( )

Ritmul mediu al sporului ( )


sau în procente:

A. Regresie şi corelaţie liniară


y = a + bx
-dacă b>0, indică o legătură directă
-dacă b=0, nu există legătură
-dacă b<0, indică o legătură inversă.
metoda celor mai mici pătrate
suma pătratelor diferenţelor dintre valorile reale ale lui y şi valorile
teoretice date de ecuaţia de regresie să fie minimă.
minim, respectiv
minim.

Prin metoda lui Cramer sau a determinanţilor, parametrii a şi b se


determină astfel (pentru seriile simple):

serii cu frecvenţe, sistemul de ecuaţii normale devine:

Determinarea parametrilor a şi b prin aceeaşi metodă conduce la


rezultatele:
Coeficientul de corelaţie
, unde:

xi = caracteristica factorială;
yi = caracteristica rezultativă;
= mediile celor două caracteristici;
= abaterea medie pătratică a celor două caracteristici.
Dacă în această relaţie înlocuim pe , cu expresiile lor dezvoltate
şi efectuăm simplificările posibile, se ajunge la formula:

-pt. serii simple

-pt. serii cu

frecvenţă

Raportul de corelaţie ( )

, unde:

= dispersia valorilor reale ale variabilei y;


= dispersia valorilor teoretice ale variabilei y.
În cazul unei legături liniare simple, ecuaţia raportului de corelaţie
devine:
În cazul seriilor cu frecvenţe:

Raportul de corelaţie are valori cuprinse între 0 şi 1, cu următoarele


semnificaţii:
- = 1 arată că între variabile există legătură;
- = 0 între variabile nu există legătură.
Valoarea la pătrat a raportului de corelaţie prezintă raportul de
determinaţie:

şi arată ponderea influenţei factorului x asupra variaţiei

variabilei y.

B. Regresie şi corelaţie curbilinie


a. Regresie şi corelaţie de tip hiperbolic

Prin regula lui Cramer obţinem:


Fiind vorba de o legătură curbilinie, intensitatea legăturii se determină
numai cu ajutorul raportului de corelaţie.

b. Regresie şi corelaţie de tip parabolic


parabola de gradul doi,
y = a+bx+cx2
Parametrii a, b, c se determină prin metoda celor mai mici pătrate, din
sistemul:

Intensitatea corelaţiei parabolice se măsoară cu ajutorul raportului de


corelaţie:
Regresie şi corelaţie multiplă
, unde:
a0 = parametrul care exprimă influenţa celorlalţi factori consideraţi cu
acţiune constantă, în afară de factorii cauzali luaţi în calcul;
ai = coeficienţi de regresie multiplă care arată cu cât variază variabila
rezultativă, atunci când variabila factorială xi se modifică cu o unitate.

7.1 Corelaţia neparametrică


1. Coeficientul de concordanţă Fechner
Coeficientul de concordanţă simplu
, unde:

c = număr de concordanţe de semn ale abaterilor;


d = număr de disconcordanţe de semn ale abaterilor.

n = numărul perechilor de valori corelate


Dacă unele diferenţe sau sunt nule, atunci nu se consideră
nici concordanţă, nici discordanţă, ci este exclusă din calcul.
Coeficientul de concordanţă ponderat
, unde:

C = suma produselor pozitive,


D = valoarea absolută a sumei produselor negative.
O altă variantă a coeficientului ponderat de concordanţă Fechner se
apropie de coeficientul de corelaţie Pearson şi se determină astfel:

Coeficientul Fechner poate varia între -1 şi +1, cu semnificaţia unei


legături directe sau inverse mai mult sau mai puţin intense.

2. Coeficienţii de corelaţie a rangurilor


Coeficientul Spearman
, unde:

d = diferenţele dintre rangurile celor două variabile;


n = nr. perechilor de valori xi, yi.
b. Coeficientul Kendall
, unde:

pi = nr. rangurilor superioare ale variabilei yi ordonate după xi, care există
după fiecare rang;
qi = nr. rangurilor inferioare ale variabilei y i ordonate după xi, care există
după fiecare rang;
n = nr. unităţilor observate.
Acest coef. poate lua valori cuprinse între -1 şi +1, cu aceleaşi
semnificaţii.

Coeficientul de asociere

Valoarea coef. de asociere are ca interval de variaţie (-1;+1) şi se


interpretează ca oricare coef. de corelaţie.
SONDAJUL
584. În scopul analizei capacităţii de cazare turistică dintr-o zonă montană, o firmă
interesată efectuează un sondaj simplu aleator de volum 10% din colectivitatea generală, obţinând
următoarele date sistematizate:

Tabelul 234
Intervale de variaţie a Număr de unităţi
capacităţii de cazare turistice
(locuri/unitate)
20 – 40 8
40 – 60 10
60 – 80 32
80 – 100 7
100 şi peste 3
Total 60

Se cere:
a) Să se determine capacitatea medie de cazare în eşantion şi să se precizeze dacă valoarea
medie obţinută este reprezentativă pentru colectivitatea de selecţie analizată;
b) Să se calculeze eroarea medie probabilă de selecţie şi eroarea maximă admisibilă, dacă
rezultatele se garantează cu o probabilitate de 95%, pentru care z = 1,96 (în ipoteza unei selecţii
aleatoare repetate şi în ipoteza unei selecţii aleatoare nerepetate);
c) Să se estimeze limitele între care se va situa capacitatea medie de cazare pe unitatea
turistică în colectivitatea generală şi limitele între care se va situa capacitatea totală de cazare;
d) Să se determine noul volum de selecţie care va fi necesar, dacă firma ce efectuează
analiza doreşte ca eroarea limită (maximă admisibilă) să se reducă la jumătate, iar probabilitatea
cu care se garantează rezultatele să fie de 95,45% (z = 2);
e) Să se estimeze între ce limite se va încadra ponderea unităţilor turistice cu capacitate de
cazare de 80 şi peste 80 de locuri şi limitele între care se va situa numărul acestor unităţi, dacă
rezultatele se garantează cu o probabilitate de 99,73% (z = 3);
f) Care va fi noul volum al eşantionului necesar pentru a estima această pondere cu o eroare
limită mai mică cu 25%.

Rezolvare:

a) Pentru determinarea capacităţii medii din colectivitatea de selecţie, vom calcula:

locuri/unitate

Tabelul 235
xi ni xini
30 8 240 10195,92
50 10 500 2464,90
70 32 2240 591,68
90 7 630 4133,43
110 3 330 5887,47
Total 60 3940 23273,4
În scopul verificării omogenităţii colectivităţii de selecţie studiate şi a reprezentativităţii
(semnificaţiei) mediei obţinute, vom determina:

, unde

locuri/unitate

Capacitatea de cazare turistică se abate, aşadar, în medie (în plus sau în minus) cu 19,7 locuri
de la capacitatea medie de cazare.

Capacitatea medie de cazare (65,7 locuri/unitate) este o valoare semnificativă ce


caracterizează tendinţa centrală din colectivitatea de selecţie.

Pentru următoarele puncte se va efectua analiza separat în ipoteza unei selecţii repetate şi apoi
în ipoteza unei selecţii aleatoare fără revenire.

Ipoteza selecţiei aleatoare cu revenire.

b) Eroarea medie probabilă de selecţie:

locuri/unitate turistică.

Eroarea maximă admisibilă (limită):


locuri/unitate turistică.

c) Estimarea pe interval de încredere a mediei din colectivitatea generală:

locuri/unitate turistică.
locuri/unitate turistică.

Estimarea pe interval de încredere a capacităţii totale de cazare:

Cum sondajul este de volum 10% din colectivitatea generală


, rezultă că N = 600 unităţi turistice.

locuri.
locuri de cazare în unităţile turistice din zona montană (garantat cu o
probabilitate de 95%).
d) Dacă factorii interesaţi doresc să obţină informaţiile cu o precizie crescută (eroare limită mai
mică) şi să garanteze rezultatele cu o probabilitate mai mare, este clar că va fi necesar să se
selecteze un eşantion de volum mai mare din colectivitatea generală de 600 de unităţi.

Într-adevăr:

unităţi turistice,

unde locuri/unitate.

Aşadar, se vor extrage 250 de unităţi în eşantion, pentru care se vor siste matiza datele, se vor
prelucra şi se va efectua inferenţa statistică.

e) Variabila „capacitate de cazare de 80 şi peste 80 de locuri pe o unitate“ este o variabilă


alternativă, care acceptă două variante de răspuns: unităţile statistice pot avea capacitatea de
cazare de 80 şi peste 80 de locuri sau capacitatea mai mică de 80 de locuri. Atunci:
- în eşantion
– media: (16,7%), unde m = numărul cazurilor cu răspuns
favorabil (7+3);

– dispersia: ;

– eroarea medie probabilă de reprezentativitate:

(4,8%);

– eroarea limită admisibilă pentru o probabilitate de garantare a rezultatelor de 99,73%:


(14,4%);

– limitele între care se va situa ponderea unităţilor cu capacitate de cazare de 80 şi peste


80 de locuri:

– estimarea pe interval de încredere a numărului de unităţi cu capacitate de 80 şi peste 80


de locuri:

unităţi turistice.

f) Noul volum al eşantionului, dacă se doreşte ca eroarea limită să fie mai mică cu 25%:
unităţi turistice selectate pentru care se vor efectua

etapele descriptivă şi de inferenţă statistică.

Ipoteza selecţiei aleatoare simple fără revenire.

b) locuri / unitate turistică.

locuri / unitate turistică.

c)
locuri/unitate turistică.
locuri/unitate turistică.

locuri.

d) locuri/unitate.

unităţi turistice.

e) (4,5%)

(13,5%)

unităţi turistice.
unităţi turistice.

f)

unităţi turistice.
585. 100 de cetăţeni selectaţi aleator sunt rugaţi, în cadrul unui sondaj, să-şi spună opinia
privind un act normativ recent intrat în vigoare. Rezultatele sistematizate sunt:
Tabelul 236
Sex Opinia
Pro Contra Nu ştiu
Masculin 22 10 3
Feminin 12 45 8

Pentru o probabilitate de 95,45% să se estimeze ponderea cetăţenilor a căror opinie asupra actului
normativ este "Contra" sau "Nu ştiu".

Rezolvare:

(37%)

(82%)

(4%)

(8%)

586. Un eşantion aleator de 80 de observaţii a fost selectat dintr-o populaţie normal


distribuită. În urma calculelor a rezultat valoarea medie în eşantion şi abaterea medie
pătratică 2,6. Să se determine intervalul de încredere, garantat cu o probabilitate de 95%, pentru
media colectivităţii generale ( ).
Rezolvare:

587. Presupunem că dorim să determinăm proporţia absolvenţilor unui liceu care se vor
înscrie în învăţământul superior. Numărul elevilor de clasa a XII–a din liceul supus analizei este
500. Un eşantion de 30 de elevi este selectat aleator fără revenire, iar rezultatele cercetării arată că
19 elevi vor să se înscrie la o instituţie din învăţământul superior. Utilizând aceste informaţii, să
se estimeze proporţia în întreaga colectivitate (p), pentru un nivel de încredere de 90%.

Rezolvare:

Avem: N = 500
n = 30
w = 19 / 30 = 0,6333
Pentru a estima intervalul de încredere, vom calcula un estimator al dispersiei proporţiei
populaţiei:
şi un estimator al

abaterii medii pătratice (eroarea medie probabilă de reprezentativitate):

Intervalul de încredere pentru o probabilitate 100(1-) este:

Pentru a construi un interval de încredere, pentru un nivel de încredere de 90%, vom folosi z0,05
= 1,645:

Ceea ce înseamnă că ne putem aştepta, cu o probabilitate de 90%, ca proporţia absolvenţilor


de liceu care se vor înscrie la facultate să fie cuprinsă între 49,29% şi 77,36%.

588. Un analist contabil doreşte să estimeze valoarea medie a facturilor emise de firma la
care lucrează. El hotărăşte să extragă un eşantion simplu aleator din totalul celor 1025 de facturi
emise într-o anumită perioadă. Din cercetări anterioare cunoaşte dispersia în colectivitate
.
a) Ce volum de sondaj ar fi necesar, dacă doreşte să estimeze valoarea medie a facturilor
emise cu un nivel de precizie, măsurat de eroarea medie de reprezentativitate mii lei;
b) Ce volum de sondaj este necesar, dacă se doreşte ca eroarea medie de reprezentativitate să
fie mii lei.
c) Presupunem că analistul nu este sigur care este valoarea erorii medii de reprezentativitate
necesară. Totuşi, el doreşte să estimeze rezultatele pe un interval de încredere de 10 mii lei de
fiecare parte a mediei eşantionului, cu o probabilitate de 95%. Care va fi atunci volumul
eşantionului necesar?

Rezolvare:

a)

Aşadar, volumul eşantionului necesar este:

facturi.

Pentru a estima rezultatele cu o eroare medie de reprezentativitate de 8,7 mii lei, va trebui să
selecteze aleator nerepetat 32 de facturi.

b) facturi.

După cum se observă, dacă eroarea medie probabilă scade (adică precizia dorită creşte), atunci
volumul eşantionului va fi mai mare.

c) Eroarea limită de reprezentativitate este:

şi z’ = z/2 = z0,025 =1,96

Aşadar, pentru a estima rezultatele pe un interval de încredere de 20 mii lei ( ), cu o


probabilitate de 95%, va trebui să eşantioneze aleator nerepetat 86 de facturi.

589. Pentru a estima salariul mediu al unui salariat din oraşul „A“, un cercetător a selectat
aleator nerepetat 100 din cei 1000 de salariaţi. În urma cercetării a rezultat că un salariat câştigă
în medie 2,5 mil. lei, cu un coeficient de variaţie de 10%. Dacă dorim să garantăm rezultatele cu o
probabilitate de 95,45%, atunci putem spune că salariul mediul al unui salariat din întregul oraş se
încadrează între:
a) (2405; 2595) mii lei;
b) (2575; 3204) mii lei;
c) (2,575; 3,204) mil. lei;
d) (1,772; 2, 324) mil. lei;
e) nici una dintre variantele de mai sus.

Rezolvare:

n = 100;
N = 1000;
;
v = 10%;
z = 2 pt. P = 95,45%.

.
Eroarea limită în cazul sondajului simplu nerepetat va fi:

Atunci intervalul de încredere pentru media colectivităţii generale va avea limitele:

;
.

Deci corectă este varianta a).

590. În urma unui studiu efectuat pe 500 din cei 2000 de studenţi ai unei facultăţi din ASE
a rezultat că 15% dintre ei provin din licee cu profil economic. Pentru o probabilitate de 99,73%,
se poate afirma că ponderea studenţilor din întreaga facultate care au absolvit licee economice se
situează în intervalul de încredere:
a) (20%; 25%);
b) (14%; 16%);
c) (0,1%; 2%);
d) (11%; 19%);
e) nici una dintre variantele anterioare.

Rezolvare:

Notăm: n = 500; N= 2000.

Este vorba de o caracteristică alternativă.


.

Dispersia caracteristicii alternative este:


.

Eroarea limită, pentru un sondaj simplu nerepetat, va fi:

Intervalul de încercare pentru media colectivităţii generale vă avea limitele:


;
.

591. În urma unei cercetări selective efectuate pe un eşantion ales dintre salariaţii unei
societăţi comerciale a rezultat că vechimea medie în muncă a unui salariat este de 10,2 ani, cu o
dispersie de 0,05 ani.
Pentru a estima vechimea medie a unui salariat pe întreaga societate comercială, cu o eroare
limită de 0,05 ani şi o probabilitate de garantare a rezultatelor de 95,4%, va trebui să includem în
eşantion:
a) 20 de salariaţi;
b) 100 de salariaţi;
c) 80 de salariaţi;
d) 120 de salariaţi;
c) 200 de salariaţi.

Rezolvare:

Ştim că în cazul sondajului aleator simplu repetat (deoarece nu cunoaştem volumul


colectivităţii generale) noul volum al eşantionului se determină cu relaţia:

de salariaţi, deci este corectă varianta c).

592. În urma unui sondaj, aplicat pe un eşantion ales dintre cei 750 de salariaţi ai unui
întreprinderi economice, a rezultat că 20% dintre cei cercetaţi au efectuat ore suplimentare. Un
cercetător doreşte să estimeze cu o probabilitate de 95,45% şi o eroare medie de reprezentativitate
de 3% procentul salariaţilor care au rămas peste program să lucreze. Pentru aceasta, el va trebui
să includă în eşantion:
a) 150 de salariaţi;
b) 200 de salariaţi;
c) 120 de salariaţi;
d) 144 de salariaţi;
e) 500 de salariaţi.

Rezolvare:

Este vorba de o caracteristică alternativă, a cărei medie va fi:


w = p = 0,2.
iar dispersia:
.
Eroarea limită va fi:
.
Volumul eşantionului va fi dat de:

salariaţi.

Deci se alege varianta d).

S-ar putea să vă placă și