Documente Academic
Documente Profesional
Documente Cultură
INDICATORI STATISTICI
- continuare -
EXERCIȚIU: Ca și în exercițiul anterior, dorim să studiem, din punct de vedere statistic, numărul de
analize efectuate într-un laboratoare în ultimele 120 săptămâni. De data aceasta, ne vom apropia și mai
mult de o situație reală, în care aceste valori nu sunt reprezentate de sume rotunde, motiv pentru care
vom face o distribuție a veniturilor pe anumite clase (intervale):
Presupunem că numărul analizelor efectuate în ultimele 120 săptămâni au fost următoarele:
Cu alte cuvinte avem 15 săptămâni în care s-au efectuat mai puțin de 700 analize, 16 între 700 și 800
analize,…, 14 săptămâni cu mai mult de 1200 analize.
‼! Atenție ‼!
- Când facem o astfel de grupare pe intervale trebuie să fim atenți la limitele grupării, adică acestea
trebuie să fie foarte clar delimitate. De exemplu săptămâna în care s-au efectuat 800 analize va fi
trecută în grupa [800,900) nu în [700,800).
- Modul în care facem gruparea depinde mult de ce reprezintă datele din seria statistică. De exemplu,
la nivel național: șomerii sunt grupați pe intervale de vârstă din 5 în 5 ani (15 - 19 ani, 20 - 24 ani,
25 - 29 ani, 30 - 34 ani, 35 - 39 ani,…, 70 - 74 ani, 75 ani si peste) în timp ce pentru populația activa
se utilizează următoarele grupe de vârstă 15 - 24 ani, 25 - 34 ani, 35 - 49 ani, 50 - 64 ani, 65 ani si
peste.
- Intervalele de grupare nu trebuie neapărat să respecte același pas (aceeași lungime). Din nou trebuie
adaptată lungimea intervalului la fenomenul, indicatorul studiat. De exemplu, pentru clasificarea
întreprinderilor active, se folosesc următoarele clase de mărimi după numărul de salariați: 0-9
persoane, 10-49 persoane, 50-249 persoane, 250 persoane si peste.
1
REZOLVARE
Avem așadar o serie statistică ce cuprinde 120 de valori. Diferența față de seriile studiate în seminarul
trecut este aceea că aceste valori sunt grupate pe intervale.
Cum procedăm ?
Simplu‼!
Vom considera că fiecare interval este reprezentat de valoarea medie a acestuia (limita inferioară +
limita superioară) / 2.
700+800
De exemplu, intervalului [700,800) i se asociază valoarea = 750.
2
În cazul intervalelor marginale (< 700, respectiv ≥ 1200) se va considera că acestea au aceeași lungime
ca intervalele imediat apropiate ([700,800), respectiv [1100,1200)).
Astfel problema se va reduce la o problemă asemănătoare cu cea din exercițiul studiat săptămâna trecută,
luând ca valori xi centrele de interval:
Numărul săptămânilor
Centrul de interval
Numărul analizelor (frecvența absolută)
xi
fi
< 700 650 15
[700,800) 750 16
[800,900) 850 18
[900,1000) 950 21
[1000,1100) 1050 19
[1100,1200) 1150 17
≥ 1200 1250 14
Total - 120
Singurele diferențe vor apărea la calculul cuantilelor (mediana, cuartile, decile, centile) și ale valorilor
modale, unde vom avea formule mai exacte care țin cont și de intervale‼!
I. INDICATORII DE FRECVENȚE
Vom sintetiza calculele în următorul tabel (calculele fiind asemănătoare cu cele din exemplul de
săptămâna trecută).
Tabelul nr. 1
Numărul Frecvențe absolute Frecvențe relative
Centrul Frecvența Frecvența
săptămânilor cumulate cumulate (%)
Numărul de relativă relativă
(frecvența
analizelor interval (neprocentual) (procentual, %)
absolută) Ascendent Descendent Ascendent Descendent
xi 𝒇∗𝒊 𝒇𝒊∗ Fa Fd Fa Fd
fi
< 700 650 15 0,125 12,50% 15 120 12,50% 100,00%
[700,800) 750 16 0,133 13,33% 31 105 25,83% 87,50%
[800,900) 850 18 0,150 15,00% 49 89 40,83% 74,17%
[900,1000) 950 21 0,175 17,50% 70 71 58,33% 59,17%
[1000,1100) 1050 19 0,158 15,83% 89 50 74,17% 41,67%
[1100,1200) 1150 17 0,142 14,17% 106 31 88,33% 25,83%
≥ 1200 1250 14 0,117 11,67% 120 14 100,00% 11,67%
Total - 120 1 100.00% - - - -
2
Semnificația și justificarea calculării acestor indicatori este explicată în seminarul anterior, așa că vă
voi arăta doar formulele și modul de calcul al acestor indicatori pentru seriile cu distribuții de frecvențe
pe intervale.
I.2. Cuantile
a) Mediana (Me)
În cazul acestor tipuri de serii vom determina pentru început intervalul median, adică intervalul de
grupare ce corespunde primei frecvențe cumulate ascendent ce depășește LoMe:
∑ 𝑓𝑖 + 1
. 𝐿𝑜𝑀𝑒 =
2
120+1
Adică, în problema noastră,: LoMe = 2 = 60,5, prima frecvență cumulată ascendent fiind 70
(marcată cu roșu în tabelul nr.1), valoare ce corespunde intervalului [900,1000).
În concluzie [900,1000) este intervalul median.
3
În continuare, se determină valoarea medianei folosind relația de calcul:
f i +1
− Fa ( Me − 1)
Me = x M e
inf
+ hMe 2
f Me
unde:
Avem:
60,5 − 49
𝑀𝑒 = 900 + 100 ∙ = 954,76
21
1
( f i + 1) − Fa (Q1 − 1) 2
( f i + 1) − Fa (Q2 − 1)
Q1 = xQ1
inf
+ hQ1 4 Q2 = xQ2
inf
+ hQ2 4 = Me
f Q1 f Q2
4
3
( f i + 1) − Fa (Q3 − 1)
Q3 = xQ3
inf
+ hQ3 4
f Q3
unde: xQ1inf, xQ2inf, xQ3inf – limita inferioară a intervalului în care se găsește Q1, Q2, Q3;
hQ1, hQ2, hQ3 – lungimea intervalului în care se găsește Q1, Q2, Q3;
fQ1, fQ2, fQ3 – frecvenţa absolută a intervalului în care se găsește Q1, Q2, Q3;
Fa(Q1- 1); Fa(Q2-1); Fa(Q3-1) – frecvențele cumulate până la intervalul precedent cuartilelor.
Avem:
30,25 − 15
𝑄1 = 700 + 100 ∙ = 795,31
16
60,5 − 49
𝑄2 = 𝑀𝑒 = 900 + 100 ∙ = 954,76
21
90,75 − 89
𝑄3 = 1100 + 100 ∙ = 1110,29
17
Observație: Pentru seriile statistice care au mai multe elemente se pot calcula într-un mod asemănător
decilele (D1, D2, D3, D4, D5, D6, D7, D8, D9) și centilele (C1, C2,…, C99).
1 + 2
unde:
xinfMo – limita inferioară a intervalului modal
Deoarece 21 este cea mai mare frecvență absolută rezultă că intervalul modal este [900,1000). Atunci
avem:
(21 − 18)
𝑀𝑜 = 900 + 100 ∙ = 960.
(21 − 18) + (21 − 19)
5
II. INDICATORII VARIAȚIEI
Concluzii finale: seria este relativ omogenă, media fiind moderat reprezentativă.