Sunteți pe pagina 1din 16

Bazele Statisticii Seminarii 3-5

2. ANALIZA UNEI SERII STATISTICE UNIDIMENSIONALE

Prin această aplicaţie se urmăreşte analiza statistică descriptivă a distribuţiei asiguraţilor unei
companii de asigurări auto din Iaşi după numărul de accidente, durata asigurării, vârsta
asiguratului, genul şi statutul profesional al asiguratului şi experienţa conducătorului auto,
înregistrate în anul 2019. Datele au fost preluate din portofoliul de asigurări al companiei.

2.1. Variabile cantitative

2.1.1. Variabile discrete

Distribuţia portofoliului de asiguraţi, după durata asigurării şi numărul de accidente, este


prezentată în tabelul 1, respectiv tabelul 2.

Tabel 1. Distribuţia clienţilor Tabel 2. Distribuţia clienţilor companiei


companiei de asigurări auto din Iaşi, de asigurări auto din Iaşi, după numărul
după durata asigurării, în anul 2019 de accidente, în anul 2019
Durata Număr de
Asigurat Asigurat
asigurării accidente
Asigurat 1 6 Asigurat 1 0
Asigurat 2 12 Asigurat 2 1
Asigurat 3 24 Asigurat 3 1
Asigurat 4 6 Asigurat 4 3
Asigurat 5 24 Asigurat 5 2
Asigurat 6 12 Asigurat 6 2
Asigurat 7 24 Asigurat 7 1
Asigurat 8 6 Asigurat 8 0
Asigurat 9 12 Asigurat 9 0
Asigurat 10 4
Asigurat 11 0
Asigurat 12 0

Se cere:
1. Prezentarea seriei statistice
a. Să se caracterizeze cele două serii.
- este o serie statistică unidimensională (observată după o variabilă discretă) simplă (cu
frecvențe egale):
̅̅̅̅̅̅
𝑿: (𝒙𝒊 ), 𝒊 = 𝟏, 𝒎
𝑋: (6, 12, 24), 𝑖 = ̅̅̅̅
1,3
- este o serie statistică unidimensională (observată după o variabilă discretă) cu frecvențe
inegale:
𝒙𝒊
𝑿: ( ) , 𝒊 = ̅̅̅̅̅̅
𝟏, 𝒎
𝒏𝒊
01234
𝑋: ( ) , 𝑖 = ̅̅̅̅
1,5
53211

1
Bazele Statisticii Seminarii 3-5

b. Să se calculeze frecvenţele absolute şi frecvenţele relative cumulate crescător şi


descrescător.

2. Analiza seriei folosind indicatori ai statisticii descriptive


a. Să se definească indicatorii tendinţei centrale. Să se determine durata medie de asigurare,
respectiv numărul mediu de accidente al unui asigurat, folosind mărimile medii: media
aritmetică, modul, mediana.
b. Să se definească quartilele, respectiv decilele, şi să se interpreteze valorile acestora.
c. Să se definească indicatorii dispersiei (variaţiei). Să se calculeze şi să se interpreteze
valorile obţinute pentru toţi indicatorii dispersiei: abaterea medie liniară, varianţa,
abaterea standard, coeficientul de variaţie şi amplitudinea intervalului interquartilic.
d. Să se definească indicatorii formei distribuţiei şi să se interpreteze valorile acestora:
coeficientul de asimetrie Fisher (Skewness) şi coeficientul de boltire Fisher (Kurtosis).

3. Analiza seriei folosind procedee grafice


a. Să se aprecieze forma distribuţiei celor două variabile analizate (pe baza poligonului
frecvenţelor, a curbei frecvenţelor şi a diagramei box-plot sau box-and-wisker).
b. Să se identifice valorile extreme şi să se analizeze influenţa lor asupra rezultatelor
statistice (prin intermediul diagramei box-and-whiskers).

Tabel 3. Distribuţia eşantionului de asiguraţi după durata asigurării


(serie simplă)
Durata Frecvențe absolute (Efective) cumulate
Efectivul
asigurării
𝒏𝒊 𝑵𝒊 ↓ 𝑵𝒊 ↑
(luni)
𝒙𝟏 = 6 𝒏𝟏 = 3 𝑁1 ↓= 𝑛1 = 3 𝑁1 ↑= 𝑁2 ↑ +𝑛1 = 9
𝒙𝟐 = 12 𝒏𝟐 = 3 𝑁2 ↓= 𝑁1 ↓ +𝑛2 = 6 𝑁2 ↑= 𝑁3 ↑ +𝑛2 = 6
𝒙𝟑 = 24 𝒏𝟑 = 3 𝑁3 ↓= 𝑁2 ↓ +𝑛3 = 9 𝑁3 ↑= 𝑛3 = 3
Total 𝒏 =9 - -

Frecvențe
Frecvențe relative Frecvențe relative cumulate
relative
𝒇 𝒊 = 𝒏 𝒊 ⁄𝒏
𝒇𝒊 ∗ 𝟏𝟎𝟎% 𝑭𝒊 ↓ 𝑭𝒊 ↑
𝒇𝟏 = 𝒏𝟏 ⁄𝒏 = 𝟑⁄𝟗 = 0,33 33% 𝐹1 ↓= 𝑓1 = 0,33 𝐹1 ↑= 𝐹2 ↑ +𝑓1 = 1
𝒇𝟐 = 𝒏𝟐 ⁄𝒏 = 𝟑⁄𝟗 = 0,33 33% 𝐹2 ↓= 𝐹1 ↓ +𝑓2 = 0,66 𝐹2 ↑= 𝐹3 ↑ +𝑓2 = 0,66
𝒇𝟑 = 𝒏𝟑 ⁄𝒏 = 𝟑⁄𝟗 = 0,33 33% 𝐹3 ↓= 𝐹2 ↓ +𝑓3 = 1 𝐹3 ↑= 𝑓3 = 0,33
𝒇=1 100% - -

Interpretare rezultate:

Frecvențe absolute și frecvențe absolute cumulate crescător și descrescător:


𝑛1 = 3 𝑎𝑠𝑖𝑔𝑢𝑟𝑎ț𝑖: 3 asigurați din total au durata de asigurare de 6 luni;
𝑁2 ↓= 6 𝑎𝑠𝑖𝑔𝑢𝑟𝑎ț𝑖: 6 asigurați din total au cel mult sau până la 12 luni de asigurare;
𝑁2 ↑= 6 𝑎𝑠𝑖𝑔𝑢𝑟𝑎ț𝑖: 6 asigurați din total au cel puțin sau peste 12 luni de asigurare.

2
Bazele Statisticii Seminarii 3-5

Frecvențe relative și frecvențe relative cumulate crescător și descrescător:


𝑓3 ∗ 100% = 33%: 33% din totalul asiguraților au 24 luni de asigurare;
𝐹1 ↓= 33%: 33% din totalul asiguraților au cel mult sau până la 6 luni de asigurare;
𝐹2 ↑= 66%: 66% din totalul asiguraților au cel puțin sau peste 12 luni de asigurare.

Tabel 4. Elementele de calcul ale indicatorilor: media aritmetică, abaterea medie liniară,
varianţa şi abaterea standard (durata asigurării)
Media aritmetică ponderată
𝒙𝒊 𝒏𝒊 𝒙𝒊 ∗ 𝒏𝒊 𝒇𝒊 𝒙𝒊 ∗ 𝒇𝒊
𝒙𝟏 = 6 𝒏𝟏 =3 𝒙𝟏 ∗ 𝒏𝟏 = 18 𝒇𝟏 = 0,33 𝒙𝟏 ∗ 𝒇𝟏 = 1,98
𝒙𝟐 = 12 𝒏𝟐 =3 𝒙𝟐 ∗ 𝒏𝟐 = 36 𝒇𝟐 = 0,33 𝒙𝟐 ∗ 𝒇𝟐 = 3,96
𝒙𝟑 = 24 𝒏𝟑 =3 𝒙𝟑 ∗ 𝒏𝟑 = 72 𝒇𝟑 = 0,33 𝒙𝟑 ∗ 𝒇𝟑 = 7,92
Total ∑𝒎
𝒊=𝟏 𝒏𝒊 =9 ∑𝒎 𝒙
𝒊=𝟏 𝒊 ∗ 𝒏 𝒊 = 126 ∑𝒎
𝒊=𝟏 𝒇𝒊 = 1 ∑𝒎
𝒊=𝟏 𝒙𝒊 ∗ 𝒇𝒊 = 14
Media

(𝒙𝒊 − 𝒙
̅) |𝒙𝒊 − 𝒙
̅| |𝒙𝒊 − 𝒙
̅ | ∗ 𝒏𝒊 𝒙)𝟐
(𝒙𝒊 − ̅ 𝒙)𝟐 ∗ 𝒏𝒊
(𝒙𝒊 − ̅
-8 8 24 64 192
-2 2 6 4 12
10 10 30 100 300
0 - 60 - 504

Calculul și interpretarea rezultatelor:

Indicatori ai statisticii Relația de calcul Interpretare


descriptive
Media - media aritmetică simplă Durata medie de asigurare pentru un
aritmetică ∑𝒏𝒊=𝟏 𝒙𝒊 ∑𝟗𝒊=𝟏 𝒙𝒊 asigurat este de 14 luni sau în medie,
̅
𝒙= = un asigurat are o durată de asigurare
𝒏 𝟗
6 + 12 + 24 + ⋯ + 12 de 14 luni.
𝑥̅ = = 14 𝑙𝑢𝑛𝑖
9
- media aritmetică ponderată
∑𝒎𝒊=𝟏 𝒙𝒊 ∗ 𝒏𝒊 ∑𝟑𝒊=𝟏 𝒙𝒊 ∗ 𝒏𝒊
̅=
𝒙 =
∑𝒎𝒊=𝟏 𝒏𝒊 𝒏
18 + 36 + 72 126
𝑥̅ = = = 14 𝑙𝑢𝑛𝑖
Indicatori 9 9
ai Mediana Ordonăm crescător seria de date: Primii 50% din asigurați au cel mult
tendinţei (6 6 6 12 12 12 24 24 24) (până la) 12 luni de asigurare, iar
centrale Calculăm unitatea medianei: restul de 50% din asigurați au cel
𝑛 + 1 10 puțin (peste) 12 luni de asigurare.
𝑼𝑴𝒆 = = =5
2 2
Fiind o serie cu număr impar de
termini, mediana se află pe poziția 5 în
seria de date ordonată crescător, adică
chiar în centrul seriei.
𝑴𝒆 = 𝑥5 = 12 𝑙𝑢𝑛𝑖
Ordonăm crescător seria de date:
(6 6 9 9 12 12 24 24)
Calculăm unitatea medianei:

3
Bazele Statisticii Seminarii 3-5

𝑛+1 9
𝑼𝑴𝒆 = = = 4,5
2 2
Fiind o serie cu număr par de termini,
mediana se află pe poziția 5 în seria de
date ordonată crescător, adică chiar în
centrul seriei.
9 + 12
𝑴𝒆 = = 10,5 𝑙𝑢𝑛𝑖 ≅ 11 𝑙𝑢𝑛𝑖
2
Modul În cazul unei serii simple, modul un se calculează
Quartila 1 Ordonăm crescător seria de date: Primii 25% din asigurați au până la 6
(6 6 6 12 12 12 24 24 24) luni de asigurare, iar restul de 75% au
Calculăm unitatea quartilei 1: durata de asigurare peste 6 luni.
𝑛 + 1 10
𝑼𝑸𝟏 = = = 2,5
4 4
Quartila 1 se găsește între termenii 2 și
3 ai seriei ordonate crescător și se
calculează ca medie aritmetică a
acestora:
6+6
𝑸𝟏 = = 6 𝑙𝑢𝑛𝑖
2
Quartila 2 𝑸𝟐 = 𝑴𝒆
Quartila 3 Ordonăm crescător seria de date: Primii 75% din totatul asiguraților au
(6 6 6 12 12 12 24 24 24) durata de asigurare de cel mult 24 de
Calculăm unitatea quartilei 3: luni de asigurare, iar pentru restul de
3(𝑛 + 1) 30 25%, durata de asigurare este de cel
𝑈 𝑄3 = = = 7,5 puțin 24 de luni.
4 4
Quartila 3 se găsește între termenii 7 și
8 ai seriei ordonate crescător și se
calculează ca medie aritmetică a
acestora:
24 + 24
𝑄3 = = 24 𝑙𝑢𝑛𝑖
2
Decila 1 Ordonăm crescător seria de date: Primii 10% din asigurați au cel mult 6
(6 6 6 12 12 12 24 24 24) luni de asigurare, iar restul de 75% au
Calculăm unitatea decilei 1: durata de asigurare de cel puțin 6 luni.
𝑛 + 1 10
𝑈𝐷1 = = =1
10 10
Decila 1 se găsește pe poziția 1 a seriei
ordonate crescător:
𝐷1 = 6 𝑙𝑢𝑛𝑖
Decila 5 𝑫𝟓 = 𝑸𝟐 = 𝑴𝒆
Decila 9 Ordonăm crescător seria de date: Primii 90% din totatul asiguraților au
(6 6 6 12 12 12 24 24 24) durata de asigurare până la 24 de luni
Calculăm unitatea decilei 9: de asigurare, iar restul de 10% au
𝐷9
9(𝑛 + 1) 90
𝑈 = = =9 peste 24 de luni de asigurare.
10 10
Decila 9 se găsește pe poziția 9 a seriei
ordonate crescător:
𝐷9 = 24 𝑙𝑢𝑛𝑖
Indicatori Abaterea ∑𝒏 |𝒙 − 𝒙 ̅| Pentru eșantionul analizat, durata de
̅ = 𝒊=𝟏 𝒊
𝒅
ai medie 𝒏
4
Bazele Statisticii Seminarii 3-5

dispersiei liniară ∑𝒎 |𝒙 − 𝒙 ̅ | ∗ 𝒏𝒊 asigurare se abate, în medie, cu aprox.


̅ = 𝒊=𝟏 𝒊
𝒅
𝒏 7 luni de la valoarea medie de 14 (𝒙 ̅=
60 14) luni, în sens pozitiv şi negativ.
̅
𝑑= = 6,66 ≅ 7 𝑙𝑢𝑛𝑖
9
Varianţa ∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙̅)𝟐 Nu are unitate de măsură şi nu se
𝒔𝟐 = interpretează; pe baza acestui
𝒏
𝒎
∑ 𝒊=𝟏 (𝒙𝒊 − 𝒙)𝟐 ∗ 𝒏𝒊
̅ indicator se calculează abaterea
𝒔𝟐 =
𝒏 standard (numită şi abaterea medie
504 pătratică).
𝑠2 = = 56
9
Abaterea 𝒔 = √𝒔𝟐 = √56 = 7,48 ≅ 8 𝑙𝑢𝑛𝑖 Pentru eșantionul analizat, durata de
standard asigurare se abate, în medie, cu aprox.
8 luni de la valoarea medie de 14 luni
̅ = 14), în sens pozitiv şi negativ.
(𝒙
Observație: Întotdeauna are loc relaţia
𝒔>𝒅 ̅ , deoarece, abaterea standard
reflectă mai bine abaterile mai mari de
la medie, fiind considerat mai eficient
decât abaterea medie liniară.
Coeficientul 𝒔 𝑣 = 53,45% > 50% , ceea ce arată
de variaţie 𝒗= ∗ 𝟏𝟎𝟎% distribuția asiguraților după durata
̅
𝒙
asigurării este eterogenă, caracterizată
7,48 prin dispersie mare şi medie cu un
𝑣= ∗ 100% = 53,43%
14 grad scăzut de reprezentativitate.
Observație:
𝑣 < 50% : distribuție omogenă,
caracterizată prin dispersie mică și
medie reprezentativă.
𝑣 > 50% : distribuție eterogenă,
caracterizată prin dispersie mare și
medie nereprezentativă.
Intervalul 𝑰𝒒 = 𝑸𝟑 − 𝑸𝟏 Intervalul cuprinde doar 50% din
interquartilic 𝐼𝑞 = 24 − 6 = 18 𝑙𝑢𝑛𝑖 populaţie şi se raportează la valoare
medianei.
Indicatorul 𝜸𝟏 = 𝟏, 𝟕𝟏 Având în vedere că 𝛾1 = 1,71 > 0, se
asimetriei poate spune că distribuţia asiguraților
după durata asigurării este asimetrică
la dreapta.
Observație:
𝛾1 = 0 (𝒙̅ = 𝑀𝑒 = 𝑀𝑜): distribuția
Indicatori este simetrică.
ai formei 𝛾1 > 0 (𝒙̅ > 𝑀𝑒 > 𝑀𝑜): distribuția
unei este asimetrică la dreapta (asimetrie
distribuții pozitivă).
𝛾1 < 0 (𝒙̅ < 𝑀𝑒 < 𝑀𝑜): distribuția
este asimetrică la stânga (asimetrie
negativă).
Indicatorul 𝜸𝟐 = 𝟎, 𝟒𝟔 Având în vedere că 𝛾2 = 0,46 > 0, se
boltirii poate spune că distribuţia asiguraților
după durata asigurării este

5
Bazele Statisticii Seminarii 3-5

leptocurtică.
Observație:
𝛾2 = 0 ∶ distribuția este mezocurtică
sau normală.
𝛾2 > 0 ∶ distribuția este leptocurtică.
𝛾2 < 0 ∶ distribuția este platicurtică.
𝑚
Volumul eşantionului -
𝑛=∑ 𝑛𝑖 = 9
𝑖=1

Tabel 5. Distribuţia eşantionului de asiguraţi după numărul de accidente


(serie cu frecvenţe diferite)
Numărul Frecvenţe Frecvenţe absolute Frecvențe Frecvențe relative
de absolute cumulate relative cumulate
accidente 𝒏𝒊 𝑵𝒊 ↓ 𝑵𝒊 ↑ 𝒇𝒊 𝑭𝒊 ↓ 𝑭𝒊 ↑
0 5 5 12 0,42 0,42 1
1 3 8 7 0,25 0,67 0,58
2 2 10 4 0,17 0,84 0,33
3 1 11 2 0,08 0,92 0,17
4 1 12 1 0,08 1,00 0,08
Total 12 - - 1 - -

Interpretare rezultate:
Frecvențe absolute și frecvențe absolute cumulate crescător și descrescător:
𝑛2 = 3 𝑎𝑠𝑖𝑔𝑢𝑟𝑎ț𝑖: 3 asigurați din total au înregistrat 1 accident;
𝑁3 ↓= 10 𝑎𝑠𝑖𝑔𝑢𝑟𝑎ț𝑖: 10 asigurați din total au cel mult sau până la 2 accidente declarate;
𝑁4 ↑= 2 𝑎𝑠𝑖𝑔𝑢𝑟𝑎ț𝑖: 2 asigurați din total au cel puțin sau peste 3 accidente declarate.
Frecvențe relative și frecvențe relative cumulate crescător și descrescător:
𝑓3 ∗ 100% = 17%: 17% din totalul asiguraților au 2 accidente declarate;
𝐹4 ↓= 92%: 92% din totalul asiguraților au cel mult sau până la 3 accidente declarate;
𝐹5 ↑= 8%: 8% din totalul asiguraților au cel puțin sau peste 4 accidente declarate.

Tabel 6. Elementele de calcul ale indicatorilor: media aritmetică, abaterea medie liniară,
varianţa şi abaterea standard (numărul de accidente)
𝒙𝒊 𝒏𝒊 𝒙𝒊 ∗ 𝒏𝒊 (𝒙𝒊 − ̅𝒙) |𝒙𝒊 − ̅
𝒙| |𝒙𝒊 − ̅
𝒙| ∗ 𝒏𝒊 𝒙)𝟐
(𝒙𝒊 − ̅ 𝒙)𝟐 ∗ 𝒏𝒊
(𝒙𝒊 − ̅
0 5 0 -1,17 1,17 5,85 1,37 6,84
1 3 3 -0,17 0,17 0,51 0,03 0,09
2 2 4 0,83 0,83 1,66 0,69 1,38
3 1 3 1,83 1,83 1,83 3,35 3,35
4 1 4 2,83 2,83 2,83 8,01 8,01
Total 12 14 - - 12,68 - 19,67

Calculul și interpretarea rezultatelor:

6
Bazele Statisticii Seminarii 3-5

Indicatori ai statisticii Relația de calcul Interpretare


descriptive
∑𝒎 𝒙𝒊 ∗ 𝒏𝒊 Numărul mediu de accidente declarate
Media ̅ = 𝒊=𝟏
𝒙 de un asigurat este de aproximativ 1
𝒏
aritmetică 14 accident sau în medie, un asigurat
𝑥̅ = = 1,17 ≅ 1 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡 declară aproximativ 1 accident.
12
Calculăm frecvențele absolute Primii 50% din asigurați au cel mult
cumulate crescător: (până la) 1 accident declarat, iar restul
𝑵𝒊 ↓ de 50% din asigurați au cel puțin
Calculăm unitatea medianei: (peste) 1 accident declarat.
𝑛 + 1 13
𝑈 𝑀𝑒 = = = 6,5
Mediana 2 2
Căutăm prima valoare a lui 𝑁𝑖 ↓ care
îndeplinește condiția 𝑁𝑖 ↓ ≥ 𝑈 𝑀𝑒 :
𝑁2 ↓= 8 > 𝑈 𝑀𝑒 = 6,5
În dreptul lui 𝑁2 ↓= 8 citim valoarea
lui 𝑥2 care este de fapt mediana:
Indicatori 𝑀𝑒 = 1 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡
ai 𝑴𝒐 = 𝒙𝒊 → 𝒏𝒊𝒎𝒂𝒙 Cei mai mulți dintre asigurați nu au
Modul
tendinţei 𝑛𝑖𝑚𝑎𝑥 = 5 ⟹ 𝑀𝑜 = 0 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑒 declarat nici un accident.
centrale Se urmează modelul de calcul al Primii 25% din asigurați au înregistrat
medianei, ținându-se cont de formula cel mult (până la) 0 accidente, iar
Quartila 1
pentru unitatea quartilică 1: restul de 75% din asigurați au cel
𝑄1 = 0 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑒 puțin (peste) 0 accidente declarate.
Se urmează modelul de calcul al Primii 75% din asigurați au înregistrat
medianei, ținându-se cont de formula cel mult (până la) 2 accidente, iar
Quartila 3
pentru unitatea quartilică 3: restul de 25% din asigurați au cel
𝑄3 = 2 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑒 puțin (peste) 2 accidente declarate.
Se urmează modelul de calcul al Primii 10% din asigurați au înregistrat
medianei, ținându-se cont de formula cel mult (până la) 0 accidente, iar
Decila 1
pentru unitatea decilică 1: restul de 90% din asigurați au cel
𝐷1 = 0 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑒 puțin (peste) 0 accidente declarate.
Se urmează modelul de calcul al Primii 90% din asigurați au înregistrat
medianei, ținându-se cont de formula cel mult (până la) 3 accidente, iar
Decila 9 pentru unitatea decilică 1: restul de 10% din asigurați au cel
𝐷9 = 3 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑒 puțin (peste) 3 accidente declarate.
∑𝒎
𝒊=𝟏|𝒙𝒊 − 𝒙
̅ | ∗ 𝒏𝒊 Pentru eșantionul analizat, numărul de
̅=
𝒅
Abaterea 𝒏 accidente se abate, în medie, cu 1
12 accident de la numărul mediu de
medie 𝑑̅ = = 1 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡
liniară 12 aproximativ 1 accident ( 𝒙 ̅ = 1 ), în
Indicatori sens pozitiv şi negativ.
ai
∑𝒎 𝒙)𝟐 ∗ 𝒏𝒊
𝒊=𝟏(𝒙𝒊 − ̅ Nu are unitate de măsură şi nu se
dispersiei 𝟐
𝒔 =
𝒏 interpretează; pe baza acestui
Varianţa 19,67 indicator se calculează abaterea
𝑠2 = = 1,64
12 standard (numită şi abaterea medie
pătratică).

7
Bazele Statisticii Seminarii 3-5

𝒔 = √𝒔𝟐 Pentru eșantionul analizat, numărul de


𝑠 = √1,64 = 1,29 ≅ 1 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡 accidente se abate, în medie, cu
Abaterea aproximativ 1 accident de la numărul
standard
mediu de aproximativ 1 accident (𝒙 ̅=
1), în sens pozitiv şi negativ.
𝒔 𝑣 = 109,45% > 50%, ceea ce arată
𝒗 = ∗ 𝟏𝟎𝟎%
̅
𝒙 distribuția asiguraților după numărul
Coeficientul 1,29
𝑣= ∗ 100% = 110,25% de accidente este eterogenă,
de variaţie
1,17 caracterizată prin dispersie mare şi o
medie nereprezentativă.
𝑰𝒒 = 𝑸𝟑 − 𝑸𝟏 Intervalul cuprinde doar 50% din
Intervalul 𝐼𝑞 = 2 − 0 = 2 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑒 populaţie şi se raportează la valoare
interquartilic
medianei.
𝜸𝟏 = 𝟏, 𝟎𝟏 Având în vedere că 𝛾1 = 1,01 > 0, se
Idicatorul poate spune că distribuţia asiguraților
Indicatori asimetriei după numărul de accidente este
ai formei asimetrică la dreapta.
unei 𝜸𝟐 = 𝟎, 𝟐𝟎 Având în vedere că 𝛾2 = 0,20 > 0, se
distribuții Indicatorul poate spune că distribuţia asiguraților
boltirii după numărul de accidente este
leptocurtică.
𝑚
Volumul eşantionului -
𝑛=∑ 𝑛𝑖 = 12
𝑖=1

Tabel 7. Indicatorii statistici descriptivi ai duratei asigurării şi ai numărului de accidente


Durata Număr de
Indicatori ai statisticii descriptive Notaţie
asigurării accidente
Mean Media ̅
𝒙 14 1
Indicatori
Median Mediana 𝑴𝒆 = 𝑸𝟐 = 𝑫𝟓 12 1
ai
Mode Modul 𝑴𝒐 - 0
tendinţei
Quartila 1 𝑸𝟏 6 0
centrale
Quartila 3 𝑸𝟑 24 2
(mărimi
Decila 1 𝑫𝟏 6 0
medii)
Decila 9 𝑫𝟗 24 3
Abaterea medie liniară 𝒅̅ 7 1
Indicatori Sample Variance Varianţa 𝒔𝟐 56 1,64
ai Standard Deviation Abaterea standard 𝒔 8 1
dispersiei Coeficientul de variaţie 𝝂 53,43% 110,25%
(variaţiei) Amplitudinea 𝑰𝒒 18 2
intervalului interquartilic
Indicatori Skewness Idicatorul asimetriei 𝜸𝟏 1,71 1,01
ai formei Kurtosis Indicatorul boltirii 𝜸𝟐 0,46 0,20
Count Volumul eşantionului 𝒏 9 12

8
Bazele Statisticii Seminarii 3-5

6
5
4

Frequency
3
2
1
0
0 1 2 3 4
Numarul de accidente

Figura 1. Distribuţia clienţilor companiei de asigurări auto după numărul de accidente, în 2015

Interpretare histogramă:
Distribuția asiguraților după numărul de accidente este asimetrică la dreapta (după asimetrie)
și leptocurtică (după boltire).
Pe baza reprezentării grafice, se poate determina că valoarea modului este 0 accidente
deoarece se observă că frecvenței maxime de 5 îi revine valoarea variabilei (numărul de
accidente) de 0 accidente.

9
Bazele Statisticii Seminarii 3-5

2.1.2. Variabile continue

Pentru analiza distribuţiei portofoliului de asiguraţi după vârsta asiguraţilor, se cere:

1. Prezentarea seriei statistice


a. Să se caracterizeze seria de date.
b. Să se obţină distribuţia efectivelor după caracteristica vârsta asiguraţilor, pe grupe de
vârstă, efectivul cumulat, frecvenţa relativă şi frecvenţa relativă cumulată. (Tabelul 8)

2. Analiza seriei folosind indicatori ai statisticii descriptive


a. Să se calculeze vârsta medie pentru un asigurat, folosind indicatorii tendinţei centrale.
(Tabelul 9)
b. Să se calculeze şi să se interpreteze valorile indicatorilor dispersiei. (Tabel 9)
c. Să se interpreteze valorile indicatorilor formei distribuţiei. (Tabel 10)

3. Analiza seriei folosind procedee grafice


a. Să se aprecieze forma distribuţiei asiguraţilor după vârstă pe baza histogramei şi a
diagramei box-plot.

Tabel 8. Distribuţia eşantionului de asiguraţi după grupa de vârstă


Efectivul Frecvente Frecvente relative
Grupa de Efective cumulate
relative cumulate
varsta
𝒏𝒊 𝑵𝒊 ↓ 𝑵𝒊 ↑ 𝒇𝒊 𝑭𝒊 ↓ 𝑭𝒊 ↑
[18-26) 36 36 200 0,18 0,18 1,00
[26-31) 26 62 164 0,13 0,31 0,82
[31-65) 120 182 138 0,60 0,91 0,69
[65-70] 18 200 18 0,09 1,00 0,09
Total 𝒏 = 200 - - 1,00 - -

Interpretare rezultate:

Frecvențe absolute și frecvențe absolute cumulate crescător și descrescător:


𝑛2 = 26 𝑎𝑠𝑖𝑔𝑢𝑟𝑎ț𝑖: 26 din totalul asiguraților au vârsta cuprinsă în intervalul 26 și 31 de ani;
𝑁3 ↓= 138 𝑎𝑠𝑖𝑔𝑢𝑟𝑎ț𝑖: 138 de asigurați din total au cel mult sau până la 65 de ani;
𝑁2 ↑= 164 𝑎𝑠𝑖𝑔𝑢𝑟𝑎ț𝑖: 164 de asigurați din total au cel puțin sau peste 26 de ani.

Frecvențe relative și frecvențe relative cumulate crescător și descrescător:


𝑓4 ∗ 100% = 9%: 9% din totalul asiguraților au vârsta cuprinsă în intervalul 65 și 70 de ani;
𝐹2 ↓= 31%: 31% din totalul asiguraților au cel mult sau până la 31 de ani;
𝐹3 ↑= 69%: 82% din totalul asiguraților au cel puțin sau peste 31 de ani.

10
Bazele Statisticii Seminarii 3-5

Tabel 9. Elementele de calcul ale mediei aritmetice, abaterii medii liniare, varianţei şi abaterii
standard
Efective Mijlocul
Grupa de (frecvenţe intervalelor
vârsta absolute) ′
𝒙𝒊−𝟏 + 𝒙𝒊 (𝒙′𝒊 ∗ 𝒏𝒊 ) (𝒙′𝒊 − 𝒙
̅) |𝒙′𝒊 − 𝒙
̅| |𝒙′𝒊 − 𝒙
̅| (𝒙′𝒊 − 𝒙
̅)𝟐 (𝒙′𝒊 − 𝒙
̅)𝟐
(𝒙𝒊−𝟏 − 𝒙𝒊 ) (𝒏𝒊 ) (𝒙𝒊 = ) ∗ 𝒏𝒊 ∗ 𝒏𝒊
𝟐
18 + 26 𝑥1′ ∗ 𝑛1 = 𝑥1′ − 𝑥̅ =
𝑥1′ = = 22 ∗ 36 = 22 − 42,54 = |−20,54| = 20,54 ∗ 36 = (22 − 42,54)2 = 42,54 ∗ 36 =
2
[18-26) 36 22 792 -20,54 20,54 739,44 421,8916 15188,098

[26-31) 26 𝑥2 = 28,5 741 -14,04 14,04 365,04 197,1216 5125,1616
[31-65) 120 𝑥3′ = 48 5760 5,46 5,46 655,2 29,8116 3577,392

[65-70] 18 𝑥4 = 67,5 1215 24,96 24,96 449,28 623,0016 11214,029
Total 200 - 8508 - - 2208,96 - 35104,68

Calculul și interpretarea rezultatelor:

Indicatori ai statisticii Relația de calcul Interpretare


descriptive
∑𝒎 ′
𝒊=𝟏 𝒙𝒊 ∗ 𝒏𝒊 Vârsta medie a unui asigurat este de
Media ̅=
𝒙 42,54 de ani sau în medie, un asigurat
𝒏
aritmetică 8508 are vârsta de 42,54 de ani.
𝑥̅ = = 42,54 𝑎𝑛𝑖
200
Calculăm frecvențele absolute Primii 50% din asigurați au cel mult
cumulate crescător: (până la) 42,08 ani, iar restul de 50%
𝑵𝒊 ↓ din asigurați au vârsta de cel puțin
Calculăm unitatea medianei: (peste) 42,08 ani.
𝑛 + 1 201
𝑈 𝑀𝑒 = = = 100,5
2 2
Mediana Căutăm acea primă valoare a lui 𝑁𝑖 ↓
care îndeplinește condiția 𝑁𝑖 ↓ ≥ 𝑈 𝑀𝑒 :
𝑁3 ↓= 120 > 𝑈 𝑀𝑒 = 100,5
În dreptul lui 𝑁3 ↓= 120 citim
Indicatori intervalul [31-65) care include
ai valoarea medianei:
tendinţei
𝑀𝑒 = 42,08 𝑎𝑛𝑖
centrale
Identificăm frecvenţa absolută maxime Cei mai mulți dintre asigurați au
Modul ( 𝑛𝑖𝑚𝑎𝑥 = 120 ), în dreptul căreia se vârsta între 31 și 65 de ani.
citeşte intervalul modal de [31 − 65).
Se urmează modelul de calcul al Primii 25% din asigurați au cel mult
medianei, ținându-se cont de formula (până la) 28,69 de ani, iar restul de
Quartila 1
pentru unitatea quartilică 1: 25% din asigurați au vârsta de cel
𝑄1 = 28,69 𝑎𝑛𝑖 puțin (peste) 28,69 de ani.
Se urmează modelul de calcul al Primii 75% din asigurați au cel mult
medianei, ținându-se cont de formula (până la) 55,93 de ani, iar restul de
Quartila 3
pentru unitatea quartilică 3: 25% din asigurați au vârsta de cel
𝑄3 = 55,93 𝑎𝑛𝑖 puțin (peste) 55,93 de ani.
Se urmează modelul de calcul al Primii 10% din asigurați au cel mult
Decila 1 medianei, ținându-se cont de formula (până la) 19,44 de ani, iar restul de
pentru unitatea decilică 1: 90% din asigurați au vârsta de cel

11
Bazele Statisticii Seminarii 3-5

𝐷1 = 19,44 𝑎𝑛𝑖 puțin (peste) 19,44 de ani.


Se urmează modelul de calcul al Primii 90% din asigurați au cel mult
medianei, ținându-se cont de formula (până la) 64,63 de ani, iar restul de
Decila 9 pentru unitatea decilică 1: 10% din asigurați au vârsta de cel
𝐷9 = 64,63 𝑎𝑛𝑖 puțin (peste) 64,63 de ani.
∑𝒎 |𝒙′ − 𝒙
̅ | ∗ 𝒏𝒊 Pentru eșantionul analizat, vârsta
Abaterea ̅ = 𝒊=𝟏 𝒊
𝒅
𝒏 asiguraților se abate, în medie, cu
medie 2208,96
𝑑̅ = = 11,04 𝑎𝑛𝑖 11,04 ani de la vârsta medie de 42,54
liniară 200 de ani, în sens pozitiv şi negativ.
∑𝒎 ′
̅)𝟐 ∗ 𝒏𝒊
𝒊=𝟏(𝒙𝒊 − 𝒙 Nu are unitate de măsură şi nu se
𝒔𝟐 = interpretează; pe baza acestui
𝒏
Varianţa 2
35104,68 indicator se calculează abaterea
𝑠 = = 175,52
200 standard (numită şi abaterea medie
pătratică).
𝒔 = √𝒔𝟐 Pentru eșantionul analizat, vârsta
Indicatori
ai 𝑠 = √175,52 = 13,25 𝑎𝑛𝑖 asiguraților se abate, în medie, cu
Abaterea 13,25 de ani de la vârsta medie de
dispersiei standard
42,54 de ani, în sens pozitiv şi
negativ.
𝒔 𝑣 = 31,14% < 50% , ceea ce arată
𝒗= ∗ 𝟏𝟎𝟎%
̅
𝒙 distribuția asiguraților după vârstă este
Coeficientul 13,25
𝑣= ∗ 100% = 31,14% omogenă, caracterizată prin dispersie
de variaţie
42,54 mică şi medie cu un grad ridicat de
reprezentativitate.
𝑰𝒒 = 𝑸𝟑 − 𝑸𝟏 Intervalul cuprinde doar 50% din
Intervalul 𝐼𝑞 = 37,55 𝑎𝑛𝑖 populaţie şi se raportează la valoare
interquartilic
medianei.
𝜸𝟏 = −𝟎, 𝟕𝟔 Având în vedere că 𝛾1 = −0,76 < 0,
Indicatorul se poate spune că distribuţia
Indicatori asimetriei asiguraților după vârstă este
ai formei asimetrică la stânga.
unei 𝜸𝟐 = 𝟎, 𝟒𝟕 Având în vedere că 𝛾2 = 0,47 > 0, se
distribuții Indicatorul poate spune că se poate spune că
boltirii distribuţia asiguraților după vârstă este
leptocurtică.
𝑚
Volumul eşantionului -
𝑛=∑ 𝑛𝑖 = 200
𝑖=1

12
Bazele Statisticii Seminarii 3-5

Tabel 10. Indicatorii statistici descriptivi ai vârstei asiguraţilor

Vârsta
Indicatori ai statisticii descriptive Notaţie
asiguraților
Mean Media ̅
𝒙 42,54
Median Mediana 𝑴𝒆 = 𝑸𝟐 = 𝑫𝟓 42,08
Indicatori
Mode Intervalul modal (𝒙𝒊−𝟏 − 𝒙𝒊 ) [31-65)
ai
Quartila 1 𝑸𝟏 28,69
tendinţei
Quartila 3 𝑸𝟑 55,93
centrale
Decila 1 𝑫𝟏 19,44
Decila 9 𝑫𝟗 64,43
Abaterea medie liniară ̅
𝒅 11,04
Sample Variance Varianţa 𝒔𝟐 175,52
Indicatori Standard Deviation Abaterea standard 𝒔 13,25
ai Coeficientul de variaţie 𝝂 31,14%
dispersiei Amplitudinea
intervalului 𝑰𝒒 37,55
interquartilic
Indicatori Skewness Indicatorul asimetriei 𝜸𝟏 -0,76
ai formei Kurtosis Idicatorul boltirii 𝜸𝟐 0,47
Count Volumul eşantionului 𝒏 200

140
120
120
100
Frequency

80
60
36 Frequency
40 26
18
20
0
18-25 26-30 31-65 66-70
Grupa de varsta

Figura 2. Distribuţia clienţilor companiei de asigurări auto după vârstă, în anul 2015

Interpretare histogramă:
Distribuția asiguraților după vârstă este asimetrică la stânga (după asimetrie) și leptocurtică
(după boltire).
Pe baza reprezentării grafice, se poate determina că intervalul modal este 31-65 de ani
deoarece se observă că frecvenței maxime de 120 îi revine această grupă de vârstă.

13
Bazele Statisticii Seminarii 3-5

2.2. Variabile calitative (nenumerice)

2.2.1. Variabile nominale

Distribuţia portofoliului de asigurări după statutul profesional al asiguratului este prezentată


în tabelul 12.

Se cere:
a. Să se caracterizeze seria de date.
b. Să se calculeze modul şi să se interpreteze rezultatul obţinut.
c. Să se reprezinte grafic distribuţia asiguraţilor după caracteristica statutul profesional al
asiguratului.

Tabel 12. Distribuţia eşantionului de asiguraţi după statutul profesional


Frecvente Frecvente
Efectivul Modul relative relative
Statutul profesional 𝒏𝒊 𝑴𝒐 𝒇𝒊 𝒇𝒊 ∗ 𝟏𝟎𝟎%
Angajat 63 0,32 32%
Casnic 36 0,18 18%
𝑛𝑖 = 𝑛𝑚𝑎𝑥 = 63
Pensionat 27 0,14 14%
𝑛𝑚𝑎𝑥 → 𝑥𝑖 = 𝐴𝑛𝑔𝑎𝑗𝑎𝑡
Liber profesionist 32 0,16 16%
𝐴𝑛𝑔𝑎𝑗𝑎𝑡 → 𝑀𝑜
Neangajat 42 0,20 20%
Total 200 1 100%

Interpretare rezultate:

Frecvențe absolute și frecvențe relative:


𝑛3 = 27 𝑎𝑠𝑖𝑔𝑢𝑟𝑎ț𝑖: 27 din totalul asiguraților sunt pensionari;
𝑓4 ∗ 100% = 16%: 16% din totalul asiguraților sunt liber profesioniști;
𝑀𝑜 → 𝐴𝑛𝑔𝑎𝑗𝑎𝑡: Cei mai mulți dintre asigurați sunt angajați.

63 Angajat
70
60
50 42 Casnic
36 21,00%
40 32 31,50%
27
30 Pensionat
16,00%
20
10 18,00% Liber
0 13,50% profesionist
Neangajat

Figura 4. Distribuţia asiguraţilor după statutul Figura 5. Distribuţia asiguraţilor după


profesional (diagrama bar chart) statutul profesional (diagrama pie chart)

14
Bazele Statisticii Seminarii 3-5

2.2.2. Variabile ordinale

Distribuţia portofoliului de asiguraţi după experienţa conducătorului auto este prezentată în


tabelul 13.

Se cere:
a. Să se caracterizeze seria de date.
b. Să se calculeze frecvenţele absolute, frecvenţele relative şi frecvenţele cumulate crescător.
c. Să se calculeze modul şi quartilele şi să se interpreteze rezultatul obţinut.
d. Să se reprezinte grafic distribuţia asiguraţilor după caracteristica considerată.

Tabel 13. Distribuţia eşantionului de asiguraţi după experienţa conducătorului auto


Frecvenţe Frecvente Indicatori
Experienţa Frecvenţe absolute Frecvente relative Frecvente ai
conducătorului absolute cumulate relative cumulate relative tendinţei
auto 𝒙𝒊 𝒏𝒊 𝑵𝒊 ↓ 𝒇𝒊 𝑭𝒊 ↓ 𝒇𝒊 ∗ 𝟏𝟎𝟎% centrale
Incepator 1 22 22 0,11 0,11 11% 𝑴𝒐 = 4
Tanar 2 50 72 0,25 0,36 25% 𝑴𝒆 = 4
Varstnic 3 28 100 0,14 0,50 14% 𝑸𝟏 = 2
Experimentat 4 80 180 0,4 0,90 40% 𝑸𝟑 = 4
Senior 5 20 200 0,1 1 10% -
Total - 200 - 1 - 100% -

Interpretare rezultate:

Frecvențe absolute și frecvențe absolute cumulate crescător și descrescător:


𝑛4 = 4 𝑎𝑠𝑖𝑔𝑢𝑟𝑎ț𝑖: 4 asigurați din total intră în categoria experimentat;
𝑁3 ↓= 100 𝑎𝑠𝑖𝑔𝑢𝑟𝑎ț𝑖: 100 de asigurați din total intră în categoriile începător, tânăr și vârstnic.

Frecvențe relative și frecvențe relative cumulate crescător și descrescător:


𝑓1 ∗ 100% = 11%: 11% din totalul asiguraților sunt începători;
𝐹4 ↓= 90% : 90% din totalul asiguraților intră în categoriile începător, tânăr, vârstnic și
experimentat.

Modul: Se calculează ca în cazul variabilelor numerice și al variabilei nominale și se


interpretează la fel: cei mai mulți dintre asigurați intră în categoria experimentați.

Mediana: Se calculează ca în cazul seriilor cu frecvențe diferite observate după o variabilă


discretă sau după o variabila continuă și se interpretează astfel: primii 50% dintre asigurați intră
în categoriile începător, tânăr, vârstnic și experimentat, iar restul de 50% fac parte din categoriile
experimentat și senior.

15
Bazele Statisticii Seminarii 3-5

Quartila 1: Se calculează ca mediana și se interpretează astfel: primii 25% dintre asigurați


începători și tineri după experiența în condus, iar restul de 75% fac parte din categoriile vârstnic,
experimentat și senior.

Quartila 3: Se calculează ca mediana și se interpretează astfel: primii 75% dintre asigurați intră în
categoriile începător, tânăr, vârstnic și experimentat, iar restul de 25% fac parte din categoriile
experimentat și senior.

Senior 20
20 22
10% 11% Incepator
Experimentat 80 50 Tanar
80 25%
28 Varstnic
Varstnic 28 40%
14% Experimentat
Senior
Tanar 50

Incepator 22

0 20 40 60 80 100

Figura 6. Distribuţia asiguraţilor după variabila Figura 7. Distribuţia asiguraţilor după


experienţa asiguratului (diagrama bar chart) variabila experienţa asiguratului (diagrama pie
chart)

16

S-ar putea să vă placă și