Sunteți pe pagina 1din 33

Statistica

Indicatori ai
formei
distribuției şi
concentrării
O. Verejan
Conf.univ.,dr.
Subiectele:
1. Elemente introductive
2. Indicatori de asimetrie
2. Indicatori de boltire (kurtosis)
3. Indicatori ai concentrării
1. ELEMENTE INTRODUCTIVE

ASIMETRIE –
repartizarea frecvențelor de o parte sau de alta a valorii
centrale a seriei de distributie

BOLTIREA –
măsoară aglomerarea frecvențelor în zona centrală a
seriei, lîngă medie
Indicatorii medii și ai variației determinați pentru seriile
de date trebuie completați în cadrul analizei cu
informaţii referitoare la forma în care se repartizează
unităţile colectivităţii după caracteristica urmărită.

Analiza statistică a formelor de repartizare a


frecvenţelor presupune caracterizarea asimetriei
(Skewness) şi a aplatizării curbei frecvenţelor
(Kurtosis).
Repartiția angajaților dupa
vechimea înNr muncă
angajati
Vechi 1-3 3 3-5 10
mea Nr 3-5 5 5-7 20
(ani) angajati 5-7 7 7-9 39
1-3 15 7-9 10 9-11 20
3-5 40 9-11 25 11-13 10
5-7 25 11-13 40 13-15 3
7-9 10 13-15 15 Total 105
9-11 7 Vechi 105
Total
11- 5 mea
13 3 (ani)
13- 105
15 Vechi Nr
Total mea angajati
(ani) 1-3 3
Repartiția angajaților dupa
vechimea în muncă
Vechi
Vechime Vechime Nr mea
a (ani) Nr angajati a (ani) angajati (ani) Nr angajati
1-3 15 1-3 3 1-3 3
3-5 40 3-5 5 3-5 10
5-7 25 5-7 7 5-7 20
7-9 10 7-9 10 7-9 39
9-11 7 9-11 25 9-11 20
11-13 5 11-13 40 11-13 10
13-15 3 13-15 15 13-15 3
Total 105 Total 105 Total 105
Repartiția angajaților dupa
vechimea în muncă
45 45
40 40
40 40
35 35
30 30
25 25
25 25
20 20
15 15
15 15
10 10
10 7 10
5 7
3 5
5 3
5
45
0
1-3 3-5 5-7 7-490 9-11 11-13 13-15 390
1-3 3-5 5-7 7-9 9-11 11-13 13-15
35

30

25
20 20
20

15
10 10
10

5 3 3

0
1-3 3-5 5-7 7-9 9-11 11-13 13-15
Repartiția angajaților dupa
vechimea în muncă
Repartiția angajaților dupa
vechimea în muncă

Vechimea Vechimea
gajati (ani) Nr (ani) Nr angajati
an 1-3 3
1-3 3 3-5 5
3-5 5 5-7 20
5-7 7 7-9 40
7-9 9 9-11 25
9-11 8 11-13 7
11-13 7 13-15 2
13-15 5 Total 102
Total 44
Metode

•Grafic
Asimetria
•Numeric

•Grafic
Boltirea
•Numeric
2. IDICATORII DE ASIMETRIE

Asimetrie - deplasarea valorilor individuale faţă de


anumite valori tipice ale tendinţei centrale.

Seriile empirice cu care lucrează statistica tind deseori


către modelul repartiţiei normale, care este o
distribuţie
perfect simetrică .
Comparaţia între medie, valoarea modală și mediană
permite interpretarea gradului de asimetrie a unei
distribuţii de frecvenţe
Histograma și poligonul frecvenţelor oferă o primă
imagine asupra gradului de asimetrie.
Distribuţia perfect simetrică se caracterizează prin
egalitatea dintre medie, mediană şi modul.
Asimetria pozitivă (de dreapta) este caracteristică
acelor colectivităţi în care predomină valorile mici ale
caracteristicii, de unde rezultă următoarea relaţie de
inegalitate
𝑀𝑜 < 𝑀𝑒 < 𝑥ҧ
Asimetria negativă este specifică seriilor de distribuţie de
frecvenţe în care predomină valorile mari ale
caracteristicii,
astfel încât 𝑥 < 𝑀𝑒 < 𝑀𝑜

Media este semnificativă pentru valorile mari ale


caracteristicii; termenii cu valori mici ai seriei statistice nu
sunt bine reprezentaţi.
CONCLUZIE:

Repartiția asimetrică (sau oblică) se caracterizează


prin faptul că frecvenţele valorilor caracteristicii
urmărite sunt deplasate mai mult sau mai puţin, într-o
parte şi alta faţă de tendinţa centrală (exprimată prin:
Me, Mo sau 𝑥ҧ).
Amploare asimetriei statistice unimodale se
caracterizează prin prisma unor indicatori sintetici,
precum:
🞇 Coeficientul lui Yule şi Kendall ;
🞇 Coeficienţii lui Karl Pearson.
Coeficientul Yule
Yule şi Kendall comparând modul de etalare a frecvenţelor la dreapta şi la
stânga medianei şi ţinând cont de poziţia cuartilelor în raport cu mediana au
recomandat pentru măsurarea asimetriei folosirea distanţele dintre cuartile ca
măsură a asimetriei, conform relaţiei:

Proprietăți:
🞇 Coeficientul ia valori în intervalul -1 şi +1; ƒ
🞇 dacă CY = 0 simetrie (sau cuartilele sunt echidistante);
🞇 dacă CY > 0 pozitivă (sau etalarea frecvenţelor spre dreapta); ƒ
🞇 dacă CY < 0 asimetrie negativă (sau etalarea frecvenţelor spre stânga);
🞇 dacă acest coeficient are valoarea sub ±0,1 seria este considerată moderat
asimetrică;
🞇 iar peste ±0,3 seria este pronunţat asimetrică; ƒ
🞇 coeficientul lui Yule şi Kendall poate fi utilizat în compararea asimetriei
mai multor repartiţii de frecvenţe.
Coeficienţii lui Karl Pearson
Coeficientul empiric de asimetrie Pearson
Pentru măsurarea asimetriei K. Pearson analizează poziţia a două valori
centrale (valoarea modală şi medie) relativizată prin abaterea medie
pătratică, astfel:

Într-o repartiţie de frecvenţe moderat asimetrică (Mo,


Me, � ) se


verifică, în mod aproximativ, relaţia:
Substituind această expresie în relaţia de mai sus se obţine următoarea
formulă alternativă:

🞇 dacă coeficienţii au valori > 0 asimetrie pozitivă;


🞇 dacă coeficienţii au valori < 0 asimetrie negativă;
🞇 dacă coeficienţii au valori = 0 serie perfect simetrică;
🞇 seriile de distribuţie moderat asimetrice au valoarea coeficientului de
asimetrie :
Coeficientul de asimetrie Pearson (β1)
Se calculează în baza momentelor centrate de ordin impar

  3
2

1
 23
unde: μ2 și μ4 - momente centrate de ordinul 2 respectiv 3.

 
 (x i  X )2
 ni
2
n i

 
 (x  X )
i 3
n
i
3
n i
Asimetria distribuţiilor unităţilor într-o colectivitate după caracteristica
urmărită poate fi vizibilă pe reprezentările grafice - histograma, poligonul
frecvenţelor - comparate cu alura clopotului lui Gauss.

Graficele seriilor de frecvenţă sunt mai mult sau mai puţin aplatizate în
comparaţie cu graficul legii normale (Gauss-Laplace).

Identificăm trei situații distincte ce prezintă forma distribuției:

Rădăcinile etimologice
ale denumirilor
utilizate sunt greceşti:

platys = larg (lat)


şi leptos = îngust (subţire).
Indicatorii “de exces” sau kurtosis (kurtos=cocoşat) sunt coeficienţii β2
și γ care reflectă intensitatea concentrării frecvenţelor în centrul
distribuţiei:

a) Coeficientul de boltire Pearson β2, este dat de relaţia:


4
 
2
 22
unde: μ2 și μ4 - momente centrate de ordinul 2 și 4

 
 (x i  X )2
 ni
2
n i

 
 (x i  X )4
 ni
n
4
i
b) Coieficientul de boltire al lui Fisher γ2, dat de relaţia:

 2  2 4
3 3
 2
2

Etalonul pentru aprecierea gradului de aplatizare al unei serii empirice îl


reprezintă distribuţia normală.

Dacă:
β2 > 3 (sau γ2 > 0) – distribuţia se numeşte leptokurtică, având un “vârf” mai
ascuţit şi „cozi” mai lungi decât la cea normală;
β2 < 3 (sau γ2 < 0) – distribuţia se numeşte platikurtică, având un “vârf” mai
aplatizat (“turtit”) şi „cozi” mai scurte decât la cea normală;
β2 ≈ 3 (sau γ2 ≈ 0) - distribuţia se numeşte mezokurtică şi este echivalentă cu cea
normală în privinţa gradului de aplatizare.

Calculul şi interpretarea coeficienţilor de aplatizare prezentaţi trebuie completat cu


analiza graficului distribuţiei empirice comparativ cu cel al distribuţiei normale.
Utilizare Excel
tools / data analysis / descriptive statistics

Excel
Statistics for Business and
Economics, 6e © 2007
Pearson Education,
Inc.

output

Chap 3-24
PRET CASE lei:

2,000,000
500,000
300,000
100,000
100,000

Chap 3-25
!!! Analiza asimetriei şi aplatizării are sens numai în
cazul distribuţiilor empirice unidimensionale care
prezintă o singură valoare modală !!!
Analiza statistică a concentrării/diversificării
Probelematica concentrării-diversificării formulată pentru
prima dată de Corado Gini (1912) – o dată cu analiza
distribuţiei veniturilor unei populaţii – este deosebit de
importantă şi prezintă interes în diverse domenii.

Se folosesc pe larg în caracterizarea structurii pieţelor;


analiza inegalităţilor dintre repartiţiile de structură; analiza
repartiţiilor regionale etc.
Prin concentrare se înţelege, în general, aglomerarea
unităţilor unei populaţii statistice sau a valorilor globale
ale unei distribuţii în jurul unei valori tipice a variabilei
analizate X.

Altfel spus, o pondere mică din colectivitate deţine o


pondere mare din valoarea variabilei studiate.

La caracterizarea statistică a concentrării se pot folosi:

🞇 metoda grafică
🞇 indicatori statistici adecvaţi.
Analiza concentrării se bazează pe curba de concentrare
denumită şi curba lui Lorenz care se construieşte, de regulă,
pentru repartiţiile de frecvențe.
Algoritmul de construire fiind:
1. Calcularea frecvenţelor relative ;
2. Calculul frecvenţelor relative cumulate crescător (Fi * 𝗍)
3. Determinarea nivelului totalizat al caracteristicii pe fiecare grupă (xini) şi
pe total colectivitate σ 𝒙𝒊𝒏𝒊;
4. Determinarea greutăţii specifice care exprimă ponderea nivelului
totalizator al fiecărei grupe în total ;

5. Calcularea greutăţilor specifice cumulate crescător (gi* 𝗍);


6. Construirea curbei de concentrare.
Graficul se construieşte în sistem de axe OX, OY.
Pe OX se reprezintă frecvenţele relative cumulate (Fi * 𝗍),
iar pe OY greutăţile specifice cumulate (gi* 𝗍).
Fiecare pereche de valori (Fi * 𝗍, gi* 𝗍 ) se reprezintă grafic
printr-un punct. Unind succesiv două câte două puncte
alăturate prin segmente de dreaptă se obţine curba de
concentrare.
Suprafaţa mărginită de curba de concentrare şi dreapta
egalităţii perfecte a frecvenţelor (diagonala care uneşte
punctele de coordonate (0,0) şi (100,100)) se numeşte arie
de concentrare.
!!!Cu cât aria de concentrare este mai mare cu atât
concentrarea este mai puternică, iar diversificarea este
mai slabă!!!
gi* 𝗍 gi* 𝗍 gi * 𝗍

F *𝗍 Fi *
i Fi * 𝗍
𝗍
🞇 Coeficientul de concentrare Gini se va determina
potrivit relaţiei:

Coeficientul Gini ia valori în intervalul ;


Pentru a înlătura dezavantajul legat de faptul că limita
inferioară este variabilă, depinzând de numărul termenilor
seriei, se foloseşte un alt indicator de concentrare
propus de R. Struck:

Coeficientul ia valori în intervalul [0,1].

Cu cât nivelul coeficientului este mai aproape de limita


inferioară, cu atât este mai uniformă repartizarea
elementelor colectivităţii pe tipurile calitative observate
(grupe/clase).
O apropiere de limita superioară sugerează o concentrare pe
un anumit tip sau pe câteva tipuri calitative.