Sunteți pe pagina 1din 5

2.1.

ANALIZA UNEI SERII STATISTICE UNIDIMENSIONALE PENTRU O VARIABILĂ


NUMERICĂ CONTINUĂ

Pentru analiza distribuţiei ţărilor din Europa după PIB/locuitor (euro) în anul 2017, se cere:

a. Să se caracterizeze seria de date.

b. Să se obţină distribuţia efectivelor după caracteristica PIB/locuitor, pe intervale de valori,


efectivul cumulat, frecvenţa relativă şi frecvenţa relativă cumulată.

- Să se determine numărul de ţări al căror PIB are cel puţin valoare 40000 de euro. Să se
calculeze efectivul ţărilor care au PIB-ul de cel mult 35000 de euro.

PIB/locuitor Efective cumulate Efective cumulate


Efectivul Efectivul
(euro) crescător descrescător
ni ni
( x i−1−x i ) Ni ↓ Ni ↑
[3600-20000) n1 =16 n1 =16 n1 =16 16+16=32
[20000-40000) n2 =12 16+12=28 n2 =12 4 +12=16
[40000-60000) n3 =2 28+2=30 n3 =2 2+2=4
[60000-80000) n 4=2 30+2=32 n 4=2 n 4=2
Total n=32 - n=32 -

- Să se determine cât la % din total reprezintă ţările care se încadrează, în funcţie de PIB, în
intervalul de valori [3600-20000) euro.
- Să se afle ponderea ţărilor care au valoarea PIB-ului până la 60000 de euro.

PIB/locuitor Frecvente Frecvente Frecvente relative


Efectivul
(euro) relative relative cumulate
ni f i∗100 %
( x i−1−x i ) f i=ni /n Fi↓ Fi↑
[3600-20000) n1 =16 16 /32=0,50 50% 0,5 1
[20000-40000) n2 =12 12/32=0,38 38% 0,88 0,50
[40000-60000) n3 =2 2/32=0,06 6% 0,94 0,13
[60000-80000) n 4=2 2/32=0,06 6% 1,00 0,06
Total n=32 f =1 100% - -

c. Să se calculeze valoarea medie a PIB-ului pentru o ţară, folosind indicatorii tendinţei centrale.

PIB/locuitor Mijlocul intervalelor


(euro) Efectivul x i−1 + x i
( x i−1−x i ) ( n i) ( x 'i=
2 ) ( x 'i∗ni )
Media aritmetică

m
[3600-20000) 16 ( 3600+20000 ) /2=28000 28000∗16=448000
[20000-40000) 12 ( 20000+ 40000 ) /2=30000 30000∗12=360000 ∑ x 'i∗ni
[40000-60000) 2 ( 40000+ 60000 ) /2=50000 50000∗2=100000 x́= i=1
n
[60000-80000) 2 ( 60000+80000 ) /2=70000 70000∗2=140 000

1
m m
1048000
∑ ni=32 ∑ x 'i∗ni=1048000 x́= =32750
Total i=1 - i=1
32

Interpretare:

- media aritmetică: valoarea medie a PIB-ului pentru o ţară din Europa este de 32750 de euro sau
în medie, o ţară din Europa înregistrează un PIB de 32750 de euro.
- modul: în cazul unei serii de date observată după o variabilă continuă, de regulă, se
interpretează intervalul modal.
- intervalul modal: se determină pe baza frecvenţei absolute maxime (nimax =16), în dreptul căreia
se citeşte intervalul modal de ¿ şi se interpretează astfel: cele mai multe ţări din Europa au PIB-
ul cuprins în intervalul ¿ euro.
- mediana: împarte seria de date în două părţi egale, 50% din colectivitatea statistică având valori
de cel mult (până la) valoarea medianei, şi 50% din populaţie având valori de cel puţin (peste)
valoarea medianei. Pe baza rezultatelor din tabelul indicatorilor, Me=19550de euro şi
interpretăm astfel: 50% din ţările europene au un PIB de cel mult 19550 de euro şi restul ţărilor
peste această valoare.
- quartile: împart seria de date în patru părţi egale; interpretăm valorile pentru quartila 1, quartila
2 care se identifică cu mediana (Q 1=Me ) şi quartila 3. Quartila 1 (Q 1=10650 de euro) se
interpretează: 25% din ţările Europei înregistrează un PIB până la 10650 de euro, iar restul de
75% au un PIB peste această valoare. Quartila 1 (Q3=34825 de euro) se interpretează: 75% din
totatul eşantionului observat are valori ale PIB-ului de cel mult 34825 de euro, iar pentru restul
de 25% din eşantion, PIB-ul are valori de cel puţin 34825 de euro.
- decile: împart seria în 10 părţi egale; interpretăm valorile pentru decila 1 ( D1=730 euro ): 10%
din ţări au valori până la 730 de euro, restul au un PIB peste 730 de euro; decila 5 se identifică
cu mediana şi quartila 2 ( D 5=Q 1 =Me); decila 9 ( D 9=43040 euro ): 90% din ţări au un PIB de
cel mult 43040 de euro, restul au un PIB de cel puţin 43040 de euro.

d. Să se calculeze şi să se interpreteze valorile obţinute pentru indicatorii dispersiei.

Mijlocul Abaterea medie


intervalelo liniară
Efectivul r ( d́ )
( n i) ( x 'i ) ( x 'i− x́ ) |x 'i− x́| |x 'i− x́|∗ni
m
16 28000 ( 28000−32750 )=−4750 4750 4750∗16=76000
12 30000 ( 30000−32750 )=−2750 2750 2750∗12=33000 ∑|x 'i− x́|∗ni
2 50000 ( 50000−32750 )=17250 17250 17250∗2=34500 d́= i=1
n
2 70000 ( 70000−32750 )=37250 37250 37250∗2=65500 209000
d́=
m
32
n=32 - - - ∑|xi −x́|∗ni =209000 d́=6531,25
' euro
i=1

2
Interpretare:

- abaterea medie liniară: pentru ansamblul ţărilor europene analizate, valoarea PIB-ului se abate,
în medie, cu 6531,25 de euro de la valoarea medie de 32750 de euro, în sens pozitiv şi negativ.

m
2
Mijlocul
intervalelo
∑ ( x 'i− x́ ) ∗ni
r
Varianţa s2= i=1
Efectivul n
2 2
( n i) ( x 'i ) ( x 'i− x́ ) ( x 'i− x́ ) ( x 'i− x́ ) ∗ni 2
s =327605393
16 28000 -4750 (−4750 )2 2
(−4750 ) ∗16 Abaterea s= √ s2 =√327605393
12 30000 -2750 (−2750 )2 (−2750 )2∗12 standard s=18100 euro
2 50000 17250 ( 17250 )2 2
( 17250 ) ∗2 s
v= ∗100 %
2 70000 37250 ( 37250 )2 ( 37250 )2∗2 x́
Coeficientul
18100
m
2 de variaţie v= ∗100 %
32 - - - ∑ ( x 'i−x́ ) ∗n i 32750
i=1 v=55,27 %

Interpretare:
- varianţa: nu are unitate de măsură şi nu se interpretează; pe baza acestui indicator se calculează
abaterea standard (numită şi abaterea medie pătratică).
- abaterea standard: pentru oricare din ţările europene analizate, în medie, valoarea PIB-ului se
abate de la media de 6531,25 de euro cu 18100 de euro; întotdeauna are loc relaţia s> d́,
deoarece, abaterea standard reflectă mai bine abaterile mai mari de la medie, fiind considerat
mai eficient decât abaterea medie liniară.
- coeficientul de variaţie: v=55,27 %> 50 %, ceea ce arată că dispersia este mare, populaţia
studiată este eterogenă şi media are un grad de reprezentativitate scăzut. În cealaltă situaţie, cu
v<50 %, spunem că există o dispersie mică, populaţia este omogenă şi media este semnificativă
sau are un grad de reprezentativitate ridicat.
- intervalul interquartilic: Iq=Q 3−Q 1 =24175 de euro, intervalul cuprinde doar 50% din
populaţie şi se raportează la valoare medianei.

f. Să se interpreteze valorile indicatorilor formei distribuţiei din tabelul indicatorilor statisticii


descriptive.

Interpretare:
- asimetria reflectă gradul de împrăştiere a frecvenţelor de o parte şi de alta a mediei; poate fi
reprezentată grafic prin histograma şi diagrama box-plot;
- coeficientul Fisher de asimetrie (Skewness): având în vedere că γ 1=1,11> 0, se poate spune că
distribuţia ţărilor europene după valoarea PIB/locuitor este asimetrică la dreapta sau asimetrică
pozitiv; dacă γ 1 <0, distribuţia era asimetrică la stânga sau asimetrică negativ, iar dacă γ 1=0 ,
distribuţia era simetrică.

3
- asimetria mai poate fi depistată şi de relaţia dintre indicatorii tendinţei centrale: dacă
( x́=Me=Mo ) distribuţia este simetrică; dacă ( x́ < Me< Mo ) distribuţia este asimetrică la stânga;
dacă ( x́ > Me> Mo ) distribuţia este asimetrică la dreapta.
- boltirea măsoară gradul aglomerării frecvenţelor în jurul valorii medii a distribuţiei; poate fi
reprezentată grafic prin histograma.
- coeficientul Fisher de boltire (Kurtosis): având în vedere că γ 2=1,10> 0, se poate spune că
distribuţia ţărilor europene după valoarea PIB/locuitor este leptocurtică; dacă γ 2 <0, distribuţia
era platicurtică, iar dacă γ 2=0 , distribuţia era mezocurtică sau normală.
Tabel 1. Indicatorii statisticii descriptive
Indicatori ai statisticii descriptive Notaţie PIB/locuitor
Mean Media x́ 32750
Median Mediana Me=Q 2=D 5 19550
Indicatori Mode Modul Mo [3600-20000)
ai Q1
Quartila 1 10650
tendinţei
Quartila 3 Q3 34825
centrale Quantile
Decila 1 D1 730
Decila 9 D9 43040
Abaterea medie liniară d́ 6531,25
Indicatori Sample Variance Varianţa σ2 327605393
ai Standard Deviation Abaterea standard σ 18100
dispersiei Coeficientul de variaţie ν 55,27%
Intervalul interquartilic Iq 24175
Indicatori Kurtosis Indicatorul boltirii γ2 1,71
ai formei Skewness Idicatorul asimetriei γ1 0,46
Count Volumul eşantionului n 32

g. Să se aprecieze forma distribuţiei ţărilor după PIB pe locuitor, pe baza histogramei şi a


diagramei box-plot.

Interpretare:
- histograma:
18
16
14
12
Frequency

10
8 Frequency
6
4
2
0
20000 40000 60000 80000
Figura 2. Distribuţia ţărilor europene după PIB/locuitor în anul 2017

4
Pe baza histogramei, se poate observa că distribuţia ţărilor din Europa după variabila
PIB/locuitor este o distribuţie asimetrică la dreapta sau pozitivă (după reprezentarea asimetriei) şi o
distribuţiei leptocurtică (după reprezentarea boltirii).

- diagrama box-plot (reprezentarea asimetriei): se bazează pe valorile minime şi maxime ale


seriei de date şi cinci indicatori ai tendinţei centrale, decilele 1 şi 9, quartilele 1 şi 3 şi mediana,
între care există întotdeauna relaţia: x min < D 1 <Q 1 < Me<Q 3 < D 9 < x max;
- diagrama box-plot sau box-and-wisker facilitează compararea simultană a mai multor
distribuţii.

S-ar putea să vă placă și