Documente Academic
Documente Profesional
Documente Cultură
Prin această aplicaţie se urmăreşte analiza statistică descriptivă a distribuţiei asiguraţilor unei
companii de asigurări auto din Iaşi după numărul de accidente, durata asigurării, vârsta
asiguratului, genul şi statutul profesional al asiguratului şi experienţa conducătorului auto,
înregistrate în anul 2019. Datele au fost preluate din portofoliul de asigurări al companiei.
Se cere:
1. Prezentarea seriei statistice
a. Să se caracterizeze cele două serii.
- este o serie statistică unidimensională (observată după o variabilă discretă) simplă (cu
frecvențe egale):
̅̅̅̅̅̅
𝑿: (𝒙𝒊 ), 𝒊 = 𝟏, 𝒎
𝑋: (6, 12, 24), 𝑖 = ̅̅̅̅
1,3
- este o serie statistică unidimensională (observată după o variabilă discretă) cu frecvențe
inegale:
𝒙𝒊
𝑿: ( ) , 𝒊 = ̅̅̅̅̅̅
𝟏, 𝒎
𝒏𝒊
01234
𝑋: ( ) , 𝑖 = ̅̅̅̅
1,5
53211
1
Bazele Statisticii Seminarii 3-5
Frecvențe
Frecvențe relative Frecvențe relative cumulate
relative
𝒇 𝒊 = 𝒏 𝒊 ⁄𝒏
𝒇𝒊 ∗ 𝟏𝟎𝟎% 𝑭𝒊 ↓ 𝑭𝒊 ↑
𝒇𝟏 = 𝒏𝟏 ⁄𝒏 = 𝟑⁄𝟗 = 0,33 33% 𝐹1 ↓= 𝑓1 = 0,33 𝐹1 ↑= 𝐹2 ↑ +𝑓1 = 1
𝒇𝟐 = 𝒏𝟐 ⁄𝒏 = 𝟑⁄𝟗 = 0,33 33% 𝐹2 ↓= 𝐹1 ↓ +𝑓2 = 0,66 𝐹2 ↑= 𝐹3 ↑ +𝑓2 = 0,66
𝒇𝟑 = 𝒏𝟑 ⁄𝒏 = 𝟑⁄𝟗 = 0,33 33% 𝐹3 ↓= 𝐹2 ↓ +𝑓3 = 1 𝐹3 ↑= 𝑓3 = 0,33
𝒇=1 100% - -
Interpretare rezultate:
2
Bazele Statisticii Seminarii 3-5
Tabel 4. Elementele de calcul ale indicatorilor: media aritmetică, abaterea medie liniară,
varianţa şi abaterea standard (durata asigurării)
Media aritmetică ponderată
𝒙𝒊 𝒏𝒊 𝒙𝒊 ∗ 𝒏𝒊 𝒇𝒊 𝒙𝒊 ∗ 𝒇𝒊
𝒙𝟏 = 6 𝒏𝟏 =3 𝒙𝟏 ∗ 𝒏𝟏 = 18 𝒇𝟏 = 0,33 𝒙𝟏 ∗ 𝒇𝟏 = 1,98
𝒙𝟐 = 12 𝒏𝟐 =3 𝒙𝟐 ∗ 𝒏𝟐 = 36 𝒇𝟐 = 0,33 𝒙𝟐 ∗ 𝒇𝟐 = 3,96
𝒙𝟑 = 24 𝒏𝟑 =3 𝒙𝟑 ∗ 𝒏𝟑 = 72 𝒇𝟑 = 0,33 𝒙𝟑 ∗ 𝒇𝟑 = 7,92
Total ∑𝒎
𝒊=𝟏 𝒏𝒊 =9 ∑𝒎 𝒙
𝒊=𝟏 𝒊 ∗ 𝒏 𝒊 = 126 ∑𝒎
𝒊=𝟏 𝒇𝒊 = 1 ∑𝒎
𝒊=𝟏 𝒙𝒊 ∗ 𝒇𝒊 = 14
Media
(𝒙𝒊 − 𝒙
̅) |𝒙𝒊 − 𝒙
̅| |𝒙𝒊 − 𝒙
̅ | ∗ 𝒏𝒊 𝒙)𝟐
(𝒙𝒊 − ̅ 𝒙)𝟐 ∗ 𝒏𝒊
(𝒙𝒊 − ̅
-8 8 24 64 192
-2 2 6 4 12
10 10 30 100 300
0 - 60 - 504
3
Bazele Statisticii Seminarii 3-5
𝑛+1 9
𝑼𝑴𝒆 = = = 4,5
2 2
Fiind o serie cu număr par de termini,
mediana se află pe poziția 5 în seria de
date ordonată crescător, adică chiar în
centrul seriei.
9 + 12
𝑴𝒆 = = 10,5 𝑙𝑢𝑛𝑖 ≅ 11 𝑙𝑢𝑛𝑖
2
Modul În cazul unei serii simple, modul un se calculează
Quartila 1 Ordonăm crescător seria de date: Primii 25% din asigurați au până la 6
(6 6 6 12 12 12 24 24 24) luni de asigurare, iar restul de 75% au
Calculăm unitatea quartilei 1: durata de asigurare peste 6 luni.
𝑛 + 1 10
𝑼𝑸𝟏 = = = 2,5
4 4
Quartila 1 se găsește între termenii 2 și
3 ai seriei ordonate crescător și se
calculează ca medie aritmetică a
acestora:
6+6
𝑸𝟏 = = 6 𝑙𝑢𝑛𝑖
2
Quartila 2 𝑸𝟐 = 𝑴𝒆
Quartila 3 Ordonăm crescător seria de date: Primii 75% din totatul asiguraților au
(6 6 6 12 12 12 24 24 24) durata de asigurare de cel mult 24 de
Calculăm unitatea quartilei 3: luni de asigurare, iar pentru restul de
3(𝑛 + 1) 30 25%, durata de asigurare este de cel
𝑈 𝑄3 = = = 7,5 puțin 24 de luni.
4 4
Quartila 3 se găsește între termenii 7 și
8 ai seriei ordonate crescător și se
calculează ca medie aritmetică a
acestora:
24 + 24
𝑄3 = = 24 𝑙𝑢𝑛𝑖
2
Decila 1 Ordonăm crescător seria de date: Primii 10% din asigurați au cel mult 6
(6 6 6 12 12 12 24 24 24) luni de asigurare, iar restul de 75% au
Calculăm unitatea decilei 1: durata de asigurare de cel puțin 6 luni.
𝑛 + 1 10
𝑈𝐷1 = = =1
10 10
Decila 1 se găsește pe poziția 1 a seriei
ordonate crescător:
𝐷1 = 6 𝑙𝑢𝑛𝑖
Decila 5 𝑫𝟓 = 𝑸𝟐 = 𝑴𝒆
Decila 9 Ordonăm crescător seria de date: Primii 90% din totatul asiguraților au
(6 6 6 12 12 12 24 24 24) durata de asigurare până la 24 de luni
Calculăm unitatea decilei 9: de asigurare, iar restul de 10% au
𝐷9
9(𝑛 + 1) 90
𝑈 = = =9 peste 24 de luni de asigurare.
10 10
Decila 9 se găsește pe poziția 9 a seriei
ordonate crescător:
𝐷9 = 24 𝑙𝑢𝑛𝑖
Indicatori Abaterea ∑𝒏 |𝒙 − 𝒙 ̅| Pentru eșantionul analizat, durata de
̅ = 𝒊=𝟏 𝒊
𝒅
ai medie 𝒏
4
Bazele Statisticii Seminarii 3-5
5
Bazele Statisticii Seminarii 3-5
leptocurtică.
Observație:
𝛾2 = 0 ∶ distribuția este mezocurtică
sau normală.
𝛾2 > 0 ∶ distribuția este leptocurtică.
𝛾2 < 0 ∶ distribuția este platicurtică.
𝑚
Volumul eşantionului -
𝑛=∑ 𝑛𝑖 = 9
𝑖=1
Interpretare rezultate:
Frecvențe absolute și frecvențe absolute cumulate crescător și descrescător:
𝑛2 = 3 𝑎𝑠𝑖𝑔𝑢𝑟𝑎ț𝑖: 3 asigurați din total au înregistrat 1 accident;
𝑁3 ↓= 10 𝑎𝑠𝑖𝑔𝑢𝑟𝑎ț𝑖: 10 asigurați din total au cel mult sau până la 2 accidente declarate;
𝑁4 ↑= 2 𝑎𝑠𝑖𝑔𝑢𝑟𝑎ț𝑖: 2 asigurați din total au cel puțin sau peste 3 accidente declarate.
Frecvențe relative și frecvențe relative cumulate crescător și descrescător:
𝑓3 ∗ 100% = 17%: 17% din totalul asiguraților au 2 accidente declarate;
𝐹4 ↓= 92%: 92% din totalul asiguraților au cel mult sau până la 3 accidente declarate;
𝐹5 ↑= 8%: 8% din totalul asiguraților au cel puțin sau peste 4 accidente declarate.
Tabel 6. Elementele de calcul ale indicatorilor: media aritmetică, abaterea medie liniară,
varianţa şi abaterea standard (numărul de accidente)
𝒙𝒊 𝒏𝒊 𝒙𝒊 ∗ 𝒏𝒊 (𝒙𝒊 − ̅𝒙) |𝒙𝒊 − ̅
𝒙| |𝒙𝒊 − ̅
𝒙| ∗ 𝒏𝒊 𝒙)𝟐
(𝒙𝒊 − ̅ 𝒙)𝟐 ∗ 𝒏𝒊
(𝒙𝒊 − ̅
0 5 0 -1,17 1,17 5,85 1,37 6,84
1 3 3 -0,17 0,17 0,51 0,03 0,09
2 2 4 0,83 0,83 1,66 0,69 1,38
3 1 3 1,83 1,83 1,83 3,35 3,35
4 1 4 2,83 2,83 2,83 8,01 8,01
Total 12 14 - - 12,68 - 19,67
6
Bazele Statisticii Seminarii 3-5
7
Bazele Statisticii Seminarii 3-5
8
Bazele Statisticii Seminarii 3-5
6
5
4
Frequency
3
2
1
0
0 1 2 3 4
Numarul de accidente
Figura 1. Distribuţia clienţilor companiei de asigurări auto după numărul de accidente, în 2015
Interpretare histogramă:
Distribuția asiguraților după numărul de accidente este asimetrică la dreapta (după asimetrie)
și leptocurtică (după boltire).
Pe baza reprezentării grafice, se poate determina că valoarea modului este 0 accidente
deoarece se observă că frecvenței maxime de 5 îi revine valoarea variabilei (numărul de
accidente) de 0 accidente.
9
Bazele Statisticii Seminarii 3-5
Interpretare rezultate:
10
Bazele Statisticii Seminarii 3-5
Tabel 9. Elementele de calcul ale mediei aritmetice, abaterii medii liniare, varianţei şi abaterii
standard
Efective Mijlocul
Grupa de (frecvenţe intervalelor
vârsta absolute) ′
𝒙𝒊−𝟏 + 𝒙𝒊 (𝒙′𝒊 ∗ 𝒏𝒊 ) (𝒙′𝒊 − 𝒙
̅) |𝒙′𝒊 − 𝒙
̅| |𝒙′𝒊 − 𝒙
̅| (𝒙′𝒊 − 𝒙
̅)𝟐 (𝒙′𝒊 − 𝒙
̅)𝟐
(𝒙𝒊−𝟏 − 𝒙𝒊 ) (𝒏𝒊 ) (𝒙𝒊 = ) ∗ 𝒏𝒊 ∗ 𝒏𝒊
𝟐
18 + 26 𝑥1′ ∗ 𝑛1 = 𝑥1′ − 𝑥̅ =
𝑥1′ = = 22 ∗ 36 = 22 − 42,54 = |−20,54| = 20,54 ∗ 36 = (22 − 42,54)2 = 42,54 ∗ 36 =
2
[18-26) 36 22 792 -20,54 20,54 739,44 421,8916 15188,098
′
[26-31) 26 𝑥2 = 28,5 741 -14,04 14,04 365,04 197,1216 5125,1616
[31-65) 120 𝑥3′ = 48 5760 5,46 5,46 655,2 29,8116 3577,392
′
[65-70] 18 𝑥4 = 67,5 1215 24,96 24,96 449,28 623,0016 11214,029
Total 200 - 8508 - - 2208,96 - 35104,68
11
Bazele Statisticii Seminarii 3-5
12
Bazele Statisticii Seminarii 3-5
Vârsta
Indicatori ai statisticii descriptive Notaţie
asiguraților
Mean Media ̅
𝒙 42,54
Median Mediana 𝑴𝒆 = 𝑸𝟐 = 𝑫𝟓 42,08
Indicatori
Mode Intervalul modal (𝒙𝒊−𝟏 − 𝒙𝒊 ) [31-65)
ai
Quartila 1 𝑸𝟏 28,69
tendinţei
Quartila 3 𝑸𝟑 55,93
centrale
Decila 1 𝑫𝟏 19,44
Decila 9 𝑫𝟗 64,43
Abaterea medie liniară ̅
𝒅 11,04
Sample Variance Varianţa 𝒔𝟐 175,52
Indicatori Standard Deviation Abaterea standard 𝒔 13,25
ai Coeficientul de variaţie 𝝂 31,14%
dispersiei Amplitudinea
intervalului 𝑰𝒒 37,55
interquartilic
Indicatori Skewness Indicatorul asimetriei 𝜸𝟏 -0,76
ai formei Kurtosis Idicatorul boltirii 𝜸𝟐 0,47
Count Volumul eşantionului 𝒏 200
140
120
120
100
Frequency
80
60
36 Frequency
40 26
18
20
0
18-25 26-30 31-65 66-70
Grupa de varsta
Figura 2. Distribuţia clienţilor companiei de asigurări auto după vârstă, în anul 2015
Interpretare histogramă:
Distribuția asiguraților după vârstă este asimetrică la stânga (după asimetrie) și leptocurtică
(după boltire).
Pe baza reprezentării grafice, se poate determina că intervalul modal este 31-65 de ani
deoarece se observă că frecvenței maxime de 120 îi revine această grupă de vârstă.
13
Bazele Statisticii Seminarii 3-5
Se cere:
a. Să se caracterizeze seria de date.
b. Să se calculeze modul şi să se interpreteze rezultatul obţinut.
c. Să se reprezinte grafic distribuţia asiguraţilor după caracteristica statutul profesional al
asiguratului.
Interpretare rezultate:
63 Angajat
70
60
50 42 Casnic
36 21,00%
40 32 31,50%
27
30 Pensionat
16,00%
20
10 18,00% Liber
0 13,50% profesionist
Neangajat
14
Bazele Statisticii Seminarii 3-5
Se cere:
a. Să se caracterizeze seria de date.
b. Să se calculeze frecvenţele absolute, frecvenţele relative şi frecvenţele cumulate crescător.
c. Să se calculeze modul şi quartilele şi să se interpreteze rezultatul obţinut.
d. Să se reprezinte grafic distribuţia asiguraţilor după caracteristica considerată.
Interpretare rezultate:
15
Bazele Statisticii Seminarii 3-5
Quartila 3: Se calculează ca mediana și se interpretează astfel: primii 75% dintre asigurați intră în
categoriile începător, tânăr, vârstnic și experimentat, iar restul de 25% fac parte din categoriile
experimentat și senior.
Senior 20
20 22
10% 11% Incepator
Experimentat 80 50 Tanar
80 25%
28 Varstnic
Varstnic 28 40%
14% Experimentat
Senior
Tanar 50
Incepator 22
0 20 40 60 80 100
16