Sunteți pe pagina 1din 5

2.2.

ANALIZA UNEI SERII STATISTICE UNIDIMENSIONALE PENTRU O VARIABILĂ


NUMERICĂ CONTINUĂ

Pentru analiza distribuţiei ţărilor din Europa după PIB/locuitor (euro) în anul 2017, se cere:

a. Să se caracterizeze seria de date.

b. Să se obţină distribuţia efectivelor după caracteristica PIB/locuitor, pe intervale de valori,


efectivul cumulat, frecvenţa relativă şi frecvenţa relativă cumulată.

- Să se determine numărul de ţări al căror PIB are cel puţin valoare 40000 de euro.
- Să se calculeze efectivul ţărilor care au PIB-ul de cel mult 40000 de euro.

PIB/locuitor Efective cumulate Efective cumulate


Efectivul Efectivul
(euro) crescător descrescător
𝒏𝒊 𝒏𝒊
(𝒙𝒊−𝟏 − 𝒙𝒊 ) 𝑵𝒊 ↓ 𝑵𝒊 ↑
[3600-20000) 𝑛1 = 16 𝑛1 = 16 𝑛1 = 16 16 + 16 = 32
[20000-40000) 𝑛2 = 12 16 + 12 = 28 𝑛2 = 12 4 + 12 = 16
[40000-60000) 𝑛3 = 2 28 + 2 = 30 𝑛3 = 2 2+2=4
[60000-80000) 𝑛4 = 2 30 + 2 = 32 𝑛4 = 2 𝑛4 = 2
Total 𝒏 = 𝟑𝟐 - 𝒏 = 𝟑𝟐 -

- Să se determine cât la % din total reprezintă ţările care se încadrează, în funcţie de PIB, în
intervalul de valori [3600-20000) euro.
- Să se afle ponderea ţărilor care au valoarea PIB-ului până la 60000 de euro.

PIB/locuitor Frecvente Frecvente Frecvente relative


Efectivul
(euro) relative relative cumulate
𝒏𝒊
(𝒙𝒊−𝟏 − 𝒙𝒊 ) 𝒇 𝒊 = 𝒏 𝒊 ⁄𝒏 𝒇𝒊 ∗ 𝟏𝟎𝟎% 𝑭𝒊 ↓ 𝑭𝒊 ↑
[3600-20000) 𝑛1 = 16 16⁄32 = 0,50 50% 0,5 1
[20000-40000) 𝑛2 = 12 12⁄32 = 0,38 38% 0,88 0,50
[40000-60000) 𝑛3 = 2 2⁄32 = 0,06 6% 0,94 0,12
[60000-80000) 𝑛4 = 2 2⁄32 = 0,06 6% 1,00 0,06
Total 𝒏 = 𝟑𝟐 𝒇=𝟏 100% - -

c. Să se calculeze valoarea medie a PIB-ului pentru o ţară, folosind indicatorii tendinţei centrale.

PIB/locuitor Mijlocul intervalelor


(euro) Efectivul 𝒙𝒊−𝟏 + 𝒙𝒊 Media aritmetică
(𝒙𝒊−𝟏 − 𝒙𝒊 ) (𝒏𝒊 ) (𝒙′𝒊 = ) (𝒙′𝒊 ∗ 𝒏𝒊 ) ̅
𝒙
𝟐
[3600-20000) 16 (3600 + 20000)⁄2 = 11800 11800 ∗ 16 = 118800 ∑𝑚 𝒙′ ∗ 𝒏𝒊
(20000 + 40000)⁄2 = 30000 ̅ = 𝑖=1 𝒊
𝒙
[20000-40000) 12 30000 ∗ 12 = 360000 𝒏
788800
[40000-60000) 2 (40000 + 60000)⁄2 = 50000 50000 ∗ 2 = 100000 ̅=
𝒙 = 𝟐𝟒𝟔𝟓𝟎 euro
32
[60000-80000) 2 (60000 + 80000)⁄2 = 70000 70000 ∗ 2 = 140000
𝑚
𝑚
Total ∑ 𝒏𝒊 = 𝟑𝟐 - ∑ 𝒙′𝒊 ∗ 𝒏𝒊 = 788800
𝑖=1
𝑖=1

1
Interpretare:

- media aritmetică: valoarea medie a PIB-ului pentru o ţară din Europa este de 24650 de euro sau
în medie, o ţară din Europa înregistrează un PIB de 24650 de euro.
- modul: în cazul unei serii de date observate după o variabilă continuă, de regulă, se
interpretează intervalul modal.
- intervalul modal: se determină pe baza frecvenţei absolute maxime (𝑛𝑖𝑚𝑎𝑥 = 16 ), în dreptul
căreia se citeşte intervalul modal de [3600 − 20000) şi se interpretează astfel: cele mai multe
ţări din Europa au PIB-ul cuprins în intervalul [3600 − 20000) euro.
- mediana: împarte seria de date în două părţi egale, 50% din colectivitatea statistică având valori
de cel mult (până la) valoarea medianei, şi 50% din populaţie având valori de cel puţin (peste)
valoarea medianei. Pe baza rezultatelor din tabelul indicatorilor, 𝑀𝑒 = 23550 de euro şi
interpretăm astfel: 50% din ţările europene au un PIB de cel mult 23550 de euro şi restul de
50% dintre ţări au PIB peste această valoare.
- quartile: împart seria de date în patru părţi egale; interpretăm valorile pentru quartila 1, quartila
2 care se identifică cu mediana (𝑄2 = 𝑀𝑒) şi quartila 3. Quartila 1 (𝑄1 = 16650 de euro) se
interpretează: primele 25% din ţările Europei înregistrează un PIB până la 16650 de euro, iar
restul de 75% au un PIB peste această valoare. Quartila 3 ( 𝑄3 = 44825 de euro) se
interpretează: primele 75% din totatul țărilor observate au valori ale PIB-ului de cel mult 44825
de euro, iar pentru restul de 25%, PIB-ul are valori de cel puţin 44825 de euro.
- decile: împart seria în 10 părţi egale; interpretăm valorile pentru decila 1 (𝐷1 = 4730 𝑒𝑢𝑟𝑜):
primele 10% din ţări au valori până la 4730 de euro, restul de 90% au PIB-ul peste 4730 de
euro; decila 5 se identifică cu mediana şi quartila 2 ( 𝐷5 = 𝑄2 = 𝑀𝑒 ); decila 9 ( 𝐷9 =
63040 𝑒𝑢𝑟𝑜): primele 90% din ţări au un PIB de cel mult 63040 de euro, restul au un PIB de
cel puţin 63040 de euro.

d. Să se calculeze şi să se interpreteze valorile obţinute pentru indicatorii dispersiei.

Mijlocul Abaterea medie


Efectivul intervalelor liniară
(𝒏𝒊 ) (𝒙′𝒊 ) (𝒙′𝒊 − 𝒙
̅) |𝒙′𝒊 − 𝒙
̅| |𝒙′𝒊 − 𝒙
̅ | ∗ 𝒏𝒊 ̅)
(𝒅
𝑚
16 11800 (28000 − 24650 ) = −12850 12850 12850 ∗ 16 = 205600 ∑𝑖=1|𝒙′𝒊 − ̅
𝒙| ∗ 𝒏𝒊
̅
𝒅=
12 30000 (30000 − 24650 ) = 5350 5350 5350 ∗ 12 = 64200 𝒏
2 50000 (50000 − 24650 ) = 25350 25350 25350 ∗ 2 = 50700 411200
̅=
𝒅
2 70000 (70000 − 24650 ) = 45350 45350 45350 ∗ 2 = 90700 32
𝑚 ̅ = 𝟏𝟐𝟖𝟓𝟎 euro
𝒅
𝒏 = 𝟑𝟐 - - - ∑|𝒙′𝒊 − 𝒙
̅| ∗ 𝒏𝒊 = 411200
𝑖=1

Interpretare:

- abaterea medie liniară: pentru ansamblul ţărilor europene analizate, valoarea PIB-ului se abate,
în medie, cu 12850 de euro de la valoarea medie de 24650 de euro, în sens pozitiv şi negativ.

2
′ 𝟐
∑𝑚 ̅ ) ∗ 𝒏𝒊
𝑖=1(𝒙𝒊 − 𝒙
Mijlocul 𝒔𝟐 =
Efectivul intervalelor Varianţa 𝑛
(𝒏𝒊 ) (𝒙′𝒊 ) (𝒙′𝒊 − 𝒙
̅) (𝒙′𝒊
𝟐
̅)
−𝒙 (𝒙′𝒊
𝟐
̅ ) ∗ 𝒏𝒊
−𝒙 𝒔𝟐 = 𝟐𝟔𝟏𝟗𝟗𝟕𝟓𝟎𝟎

16 11800 -12850 (−12850)𝟐 (−12850)2 ∗ 16 Abaterea 𝒔 = √𝒔𝟐 = √327605393


12 30000 5350 (5350)𝟐 (5350)2 ∗ 12 standard 𝒔 = 𝟏𝟔𝟏𝟖𝟔, 𝟑𝟒 euro
2 50000 25350 (25350)𝟐 (25350)2 ∗ 2 𝒔
𝒗 = ∗ 𝟏𝟎𝟎%
2 70000 45350 (45350)𝟐 (45350)2 ∗ 2 ̅
𝒙
Coeficientul 𝟏𝟔𝟏𝟖𝟔, 𝟑𝟒
𝑚 𝟐 de variaţie 𝒗= ∗ 𝟏𝟎𝟎%
𝟑𝟐 - - - ∑ (𝒙′𝒊 − 𝒙
̅ ) ∗ 𝒏𝒊 𝟐𝟒𝟔𝟓𝟎
𝑖=1 𝒗 = 𝟔𝟓, 𝟔𝟔%

Interpretare:
- varianţa: nu are unitate de măsură şi nu se interpretează; pe baza acestui indicator se calculează
abaterea standard (numită şi abaterea medie pătratică).
- abaterea standard: pentru oricare din ţările europene analizate, în medie, valoarea PIB-ului se
abate de la media de 24650 de euro cu 16186,34 euro; întotdeauna are loc relaţia 𝑠 > 𝑑̅ ,
deoarece, abaterea standard reflectă mai bine abaterile mai mari de la medie, fiind considerat
mai eficient decât abaterea medie liniară.
- coeficientul de variaţie: 𝑣 = 65,66% > 50%, ceea ce arată că dispersia este mare, populaţia
studiată este eterogenă şi media are un grad de reprezentativitate scăzut. În cealaltă situaţie, cu
𝑣 < 50% , spunem că există o dispersie mică, populaţia este omogenă şi media este
semnificativă sau are un grad de reprezentativitate ridicat.
- intervalul interquartilic: 𝐼𝑞 = 𝑄3 − 𝑄1 = 28175 de euro, intervalul cuprinde doar 50% din
populaţie şi se raportează la valoare medianei.

f. Să se interpreteze valorile indicatorilor formei distribuţiei din tabelul indicatorilor statisticii


descriptive.

Interpretare:
- asimetria reflectă gradul de împrăştiere a frecvenţelor de o parte şi de alta a mediei; poate fi
reprezentată grafic prin histograma şi diagrama box-plot;
- coeficientul Fisher de asimetrie (Skewness): având în vedere că 𝛾1 = 0,46 > 0, se poate spune
că distribuţia ţărilor europene după valoarea PIB-ului este asimetrică la dreapta sau asimetrică
pozitiv; dacă 𝛾1 < 0, distribuţia era asimetrică la stânga sau asimetrică negativ, iar dacă 𝛾1 =
0, distribuţia era simetrică.
- asimetria mai poate fi depistată şi de relaţia dintre indicatorii tendinţei centrale: dacă (𝑥̅ =
𝑀𝑒 = 𝑀𝑜) distribuţia este simetrică; dacă (𝑥̅ < 𝑀𝑒 < 𝑀𝑜) distribuţia este asimetrică la stânga;
dacă (𝑥̅ > 𝑀𝑒 > 𝑀𝑜) distribuţia este asimetrică la dreapta.
- boltirea măsoară gradul aglomerării frecvenţelor în jurul valorii medii a distribuţiei; poate fi
reprezentată grafic prin histograma.
- coeficientul Fisher de boltire (Kurtosis): având în vedere că 𝛾2 = 1,71 > 0, se poate spune că
distribuţia ţărilor europene după valoarea PIB-ului este leptocurtică; dacă 𝛾2 < 0, distribuţia
era platicurtică, iar dacă 𝛾2 = 0, distribuţia era mezocurtică sau normală.
3
Tabel 1. Indicatorii statisticii descriptive

Indicatori ai statisticii descriptive Notaţie PIB/locuitor


Mean Media ̅
𝒙 24650
Median Mediana 𝑴𝒆 = 𝑸𝟐 = 𝑫𝟓 23550
Indicatori
Mode Modul 𝑴𝒐 [3600-20000)
ai
Quartila 1 𝑸𝟏 16650
tendinţei
Quartila 3 𝑸𝟑 44825
centrale Quantile
Decila 1 𝑫𝟏 4730
Decila 9 𝑫𝟗 63040
Abaterea medie liniară 𝒅̅ 12850
Indicatori Sample Variance Varianţa 𝒔𝟐 261997500
ai Standard Deviation Abaterea standard 𝒔 16186,34
dispersiei Coeficientul de variaţie 𝝂 65,66%
Intervalul interquartilic 𝑰𝒒 28175
Indicatori Skewness Idicatorul asimetriei 𝜸𝟏 0,46
ai formei Kurtosis Indicatorul boltirii 𝜸𝟐 1,71
Count Volumul eşantionului 𝒏 32

g. Să se aprecieze forma distribuţiei ţărilor după PIB pe locuitor, pe baza histogramei şi a


diagramei box-plot.

Interpretare:
- histograma:

20

15
Frequency

10
Frequency

0
20000 40000 60000 80000

Figura 1. Distribuţia ţărilor europene după PIB/locuitor în anul 2017

Pe baza histogramei, se poate observa că distribuţia ţărilor din Europa după variabila PIB este o
distribuţie asimetrică la dreapta sau pozitivă (după reprezentarea asimetriei) şi o distribuţiei leptocurtică
(după reprezentarea boltirii).

4
- diagrama box-plot (reprezentarea asimetriei): se bazează pe valorile minime şi maxime ale
seriei de date şi cinci indicatori ai tendinţei centrale, decilele 1 şi 9, quartilele 1 şi 3 şi mediana,
între care există întotdeauna relaţia: 𝒙𝒎𝒊𝒏 < 𝑫𝟏 < 𝑸𝟏 < 𝑴𝒆 < 𝑸𝟑 < 𝑫𝟗 < 𝒙𝒎𝒂𝒙;

xmin D1 Q1 Me Q3 D9 xmax

3600 4730 16650 23550 44825 63040 80000

- diagrama box-plot sau box-and-wisker facilitează compararea simultană a mai multor


distribuţii.

S-ar putea să vă placă și