Sunteți pe pagina 1din 6

Cap. II.

INDICATORI STATISTICI
- continuare -

Caz III. Serii statistice cu distribuție de frecvențe pe intervale

EXERCIȚIU: Ca și în exercițiul anterior, dorim să studiem, din punct de vedere statistic, numărul de
analize efectuate într-un laboratoare în ultimele 120 săptămâni. De data aceasta, ne vom apropia și mai
mult de o situație reală, în care aceste valori nu sunt reprezentate de sume rotunde, motiv pentru care
vom face o distribuție a veniturilor pe anumite clase (intervale):
Presupunem că numărul analizelor efectuate în ultimele 120 săptămâni au fost următoarele:

Numărul săptămânilor în care


au fost înregistrate aceste valori
Numărul analizelor
(frecvența absolută)
fi
< 700 15
[700,800) 16
[800,900) 18
[900,1000) 21
[1000,1100) 19
[1100,1200) 17
≥ 1200 14
Total 120

Cu alte cuvinte avem 15 săptămâni în care s-au efectuat mai puțin de 700 analize, 16 între 700 și 800
analize,…, 14 săptămâni cu mai mult de 1200 analize.

‼! Atenție ‼!
- Când facem o astfel de grupare pe intervale trebuie să fim atenți la limitele grupării, adică acestea
trebuie să fie foarte clar delimitate. De exemplu săptămâna în care s-au efectuat 800 analize va fi
trecută în grupa [800,900) nu în [700,800).
- Modul în care facem gruparea depinde mult de ce reprezintă datele din seria statistică. De exemplu,
la nivel național: șomerii sunt grupați pe intervale de vârstă din 5 în 5 ani (15 - 19 ani, 20 - 24 ani,
25 - 29 ani, 30 - 34 ani, 35 - 39 ani,…, 70 - 74 ani, 75 ani si peste) în timp ce pentru populația activa
se utilizează următoarele grupe de vârstă 15 - 24 ani, 25 - 34 ani, 35 - 49 ani, 50 - 64 ani, 65 ani si
peste.
- Intervalele de grupare nu trebuie neapărat să respecte același pas (aceeași lungime). Din nou trebuie
adaptată lungimea intervalului la fenomenul, indicatorul studiat. De exemplu, pentru clasificarea
întreprinderilor active, se folosesc următoarele clase de mărimi după numărul de salariați: 0-9
persoane, 10-49 persoane, 50-249 persoane, 250 persoane si peste.

1
REZOLVARE
Avem așadar o serie statistică ce cuprinde 120 de valori. Diferența față de seriile studiate în seminarul
trecut este aceea că aceste valori sunt grupate pe intervale.

Cum procedăm ?
Simplu‼!
Vom considera că fiecare interval este reprezentat de valoarea medie a acestuia (limita inferioară +
limita superioară) / 2.
700+800
De exemplu, intervalului [700,800) i se asociază valoarea = 750.
2
În cazul intervalelor marginale (< 700, respectiv ≥ 1200) se va considera că acestea au aceeași lungime
ca intervalele imediat apropiate ([700,800), respectiv [1100,1200)).
Astfel problema se va reduce la o problemă asemănătoare cu cea din exercițiul studiat săptămâna trecută,
luând ca valori xi centrele de interval:

Numărul săptămânilor
Centrul de interval
Numărul analizelor (frecvența absolută)
xi
fi
< 700 650 15
[700,800) 750 16
[800,900) 850 18
[900,1000) 950 21
[1000,1100) 1050 19
[1100,1200) 1150 17
≥ 1200 1250 14
Total - 120
Singurele diferențe vor apărea la calculul cuantilelor (mediana, cuartile, decile, centile) și ale valorilor
modale, unde vom avea formule mai exacte care țin cont și de intervale‼!
I. INDICATORII DE FRECVENȚE
Vom sintetiza calculele în următorul tabel (calculele fiind asemănătoare cu cele din exemplul de
săptămâna trecută).
Tabelul nr. 1
Numărul Frecvențe absolute Frecvențe relative
Centrul Frecvența Frecvența
săptămânilor cumulate cumulate (%)
Numărul de relativă relativă
(frecvența
analizelor interval (neprocentual) (procentual, %)
absolută) Ascendent Descendent Ascendent Descendent
xi 𝒇∗𝒊 𝒇𝒊∗ Fa Fd Fa Fd
fi
< 700 650 15 0,125 12,50% 15 120 12,50% 100,00%
[700,800) 750 16 0,133 13,33% 31 105 25,83% 87,50%
[800,900) 850 18 0,150 15,00% 49 89 40,83% 74,17%
[900,1000) 950 21 0,175 17,50% 70 71 58,33% 59,17%
[1000,1100) 1050 19 0,158 15,83% 89 50 74,17% 41,67%
[1100,1200) 1150 17 0,142 14,17% 106 31 88,33% 25,83%
≥ 1200 1250 14 0,117 11,67% 120 14 100,00% 11,67%
Total - 120 1 100.00% - - - -

2
Semnificația și justificarea calculării acestor indicatori este explicată în seminarul anterior, așa că vă
voi arăta doar formulele și modul de calcul al acestor indicatori pentru seriile cu distribuții de frecvențe
pe intervale.

II. INDICATORII TENDINȚEI CENTRALE

Pentru comoditate vom efectua majoritatea calculelor în următorul tabel:


Tabelul nr. 2
Numărul
Centrul de
Numărul săptămânilor 𝑥𝑖 − 𝑥̅
analizelor
interval
(frecvența absolută)
x i · fi (𝑥𝑖 − 𝑥̅ )2 (𝑥𝑖 − 𝑥̅ )2 ∙ 𝑓𝑖
xi (di)
fi
< 700 650 15 9.750 -300 90.000 1.350.000
[700,800) 750 16 12.000 -200 40.000 640.000
[800,900) 850 18 15.300 -100 10.000 180.000
[900,1000) 950 21 19.950 0 0 0
[1000,1100) 1050 19 19.950 1000 10.000 190.000
[1100,1200) 1150 17 19.550 200 40.000 680.000
≥ 1200 1250 14 17.500 300 90.000 1.260.000
Total 120 114.000 - - 4.300.000

I.1. Valoarea medie (𝑥̅ )

∑ 𝑥𝑖 ∙ 𝑓𝑖 650 ∙ 15 + 750 ∙ 16 + 850 ∙ 18 + 950 ∙ 21 + 1050 ∙ 19 + 1150 ∙ 17 + 1250 ∙ 14


𝑥̅ = =
∑ 𝑓𝑖 120
114.000
= = 950
120
∑ 𝑥𝑖 ∙𝑓𝑖 114.000
Altfel, valoarea medie o putem calcula direct, preluând datele din tabel: 𝑥̅ = ∑ 𝑓𝑖
= = 950,
120
adică totalul din coloana xi · fi, împărțit la totalul din coloana corespunzătoare frecvențelor (fi).

I.2. Cuantile

a) Mediana (Me)
În cazul acestor tipuri de serii vom determina pentru început intervalul median, adică intervalul de
grupare ce corespunde primei frecvențe cumulate ascendent ce depășește LoMe:

∑ 𝑓𝑖 + 1
. 𝐿𝑜𝑀𝑒 =
2
120+1
Adică, în problema noastră,: LoMe = 2 = 60,5, prima frecvență cumulată ascendent fiind 70
(marcată cu roșu în tabelul nr.1), valoare ce corespunde intervalului [900,1000).
În concluzie [900,1000) este intervalul median.

3
În continuare, se determină valoarea medianei folosind relația de calcul:

f i +1
− Fa ( Me − 1)
Me = x M e
inf
+ hMe 2
f Me
unde:

xMeinf – limita inferioară a intervalului median

hMe – lungimea intervalului median

fMe – frecvenţa absolută a intervalului median

fi – suma totală a frecvențelor absolute

Fa(Me- 1) – frecvențele cumulate ascendent până la intervalul median.

Avem:
60,5 − 49
𝑀𝑒 = 900 + 100 ∙ = 954,76
21

b) Cuartile (Q1, Q2, Q3)


Într-un mod asemănător calculăm și cuartilele.
Calculăm locurile celor trei cuartile:
∑ 𝑓𝑖 + 1 121
𝐿𝑜𝑄1 = = = 30,25
4 4
2 ∙ (∑ 𝑓𝑖 + 1) 2 ∙ 121
𝐿𝑜𝑄2 = = = 60,5 = 𝐿𝑜𝑀𝑒
4 4
3 ∙ (∑ 𝑓𝑖 + 1) 3 ∙ 121
𝐿𝑜𝑄3 = = = 90,75
4 4
Pentru determinarea intervalelor cuartilice se folosește același procedeu ca și în cazul intervalului
median:
− Intervalul cuartilic 1, cel care conține Q1 este intervalul corespunzător primei frecvențe cumulate
ascendent ce depășește LoQ1, adică [700,800)
− Intervalul quartilic 2, care-l conține pe Q2, este același cu intervalul median [900,1000)
− Intervalul quartilic 3, corespunzător lui Q3, este intervalul corespunzător primei frecvențe
cumulate ascendent ce depășește LoQ3, adică [1100,1200).
Valorile cuartilelor se determină folosind următoarele relații:

1
( f i + 1) − Fa (Q1 − 1) 2
( f i + 1) − Fa (Q2 − 1)
Q1 = xQ1
inf
+ hQ1 4 Q2 = xQ2
inf
+ hQ2 4 = Me
f Q1 f Q2

4
3
( f i + 1) − Fa (Q3 − 1)
Q3 = xQ3
inf
+ hQ3 4
f Q3
unde: xQ1inf, xQ2inf, xQ3inf – limita inferioară a intervalului în care se găsește Q1, Q2, Q3;
hQ1, hQ2, hQ3 – lungimea intervalului în care se găsește Q1, Q2, Q3;
fQ1, fQ2, fQ3 – frecvenţa absolută a intervalului în care se găsește Q1, Q2, Q3;

Fa(Q1- 1); Fa(Q2-1); Fa(Q3-1) – frecvențele cumulate până la intervalul precedent cuartilelor.

Avem:
30,25 − 15
𝑄1 = 700 + 100 ∙ = 795,31
16

60,5 − 49
𝑄2 = 𝑀𝑒 = 900 + 100 ∙ = 954,76
21

90,75 − 89
𝑄3 = 1100 + 100 ∙ = 1110,29
17

Observație: Pentru seriile statistice care au mai multe elemente se pot calcula într-un mod asemănător
decilele (D1, D2, D3, D4, D5, D6, D7, D8, D9) și centilele (C1, C2,…, C99).

I.3. Modul (Mo)


Valoarea modală se poate determina cu următoarea formulă.
1
Mo = x Mo + hMo
inf

1 +  2
unde:
xinfMo – limita inferioară a intervalului modal

xsupMo – limita superioară a intervalului modal

hMo – lungimea intervalului modal hMo = xsupMo - xinfMo

1 – diferență dintre frecvența intervalului modal și frecvența intervalului precedent

2 – diferență dintre frecvența intervalului modal și frecvența intervalului următor.

Deoarece 21 este cea mai mare frecvență absolută rezultă că intervalul modal este [900,1000). Atunci
avem:
(21 − 18)
𝑀𝑜 = 900 + 100 ∙ = 960.
(21 − 18) + (21 − 19)

5
II. INDICATORII VARIAȚIEI

II.1. Amplitudinea absolută (A sau Aa)


𝐴 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 = 1250 − 650 = 600

II.2. Amplitudinea relativă (Ar)


𝐴 600
𝐴𝑟 = ∙ 100% = ∙ 100% = 63,16%
𝑥̅ 950

II.3. Abaterile individuale sau deviațiile individuale (absolute) - di


Acestea sunt calculate în cea de-a 5-a coloană a tabelului nr. 2.
Atenție‼! Deși în tabel avem 7 valori ale abaterilor individuale, vă reamintesc faptul că acestea se
calculează ca diferența dintre fiecare termen și valoarea medie, adică trebuie să avem atâtea abateri
individuale câți termeni sunt (120 în cazul nostru). Vezi explicația de săptămâna trecută‼!

II.4. Varianța sau dispersia (𝝈𝟐 )


Se calculează cu ajutorul formulei:
2
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 ∙ 𝑓𝑖
𝜎 =
∑ 𝑓𝑖
Din nou folosim datele din tabelul nr. 2 (împărțim totalul din ultima coloană la totalul din cea de a treia
coloană):
4.300.000
𝜎2 = = 35.833,33
120
II.5. Abaterea medie pătratică sau abaterea standard (𝝈)
𝜎 = √𝜎 2 = √35.833,33 = 189,30.
II.6. Coeficientul de variație (𝝊, sau cv)
𝜎 189,30
𝜐 = ∙ 100% = ∙ 100% = 19,93%
𝑥̅ 950

Concluzii finale: seria este relativ omogenă, media fiind moderat reprezentativă.

S-ar putea să vă placă și