Sunteți pe pagina 1din 12

Analiza formei distribuiei

n cazul variabilelor numerice ne intereseaz i forma


distribuiei
Distribuia datelor se compar, n general, cu distribuia
normal teoretic i se analizeaz dou aspecte:
- oblicitatea = msura n care distribuia se abate de la
forma perfect de simetrie a valorilor n jurul tendinei
centrale
- boltirea sau aplatizarea = msura n care distribuia
este mai plat sau mai boltit n raport cu distribuia
normal teoretic
ASIMETRIA
Asimetria (skewness, n engl.) unei serii de distribuie de
frecvene se observ din reprezentarea grafic prin histogram
sau poligonul frecvenelor, prin modalitatea n care sunt situai,
unul fa de cellalt, indicatorii tendinei centrale.
Coeficientul de asimetrie (skewness) exprim gradul de
dezechilibru al unei distribuii i se determin, pe eantion, cu
formula:




3
1
3
2 1
s
x x
n n
n
CAS
n
i
i


1
1
2

n
x x
s
n
i
i
ASIMETRIA
Dac
0 CAS
, avem asimetrie pozitiv, coada distribuiei este mai
alungit la dreapta, n serie predominnd valorile mici
Dac
0 CAS
, avem asimetrie negativ, coada distribuiei este mai
alungit la stnga, n serie predominnd valorile mari
Dac
0 CAS
, avem serie perfect simetric
Dac
1 CAS
distribuia empiric difer semnificativ de distribuia
normal i se recomand tranformarea datelor (se logaritmeaz
valorile variabilei, obinndu-se astfel o distribuie aproximativ
normal)
ASIMETRIA
BOLTIREA/APLATIZAREA
Boltirea (kurtosis, n engl.) exprim nlimea curbei
(cocoaei) comparativ cu distribuia normal teoretic.
ntlnim, astfel distribuii leptocurtice, ascuite (cu
cocoaa nalt) i distribuii platicurtice, aplatizate.

distribuie leptocurtic
distribuie platicurtic
BOLTIREA/APLATIZAREA
Coeficientul de boltire sau aplatizare (kurtosis) este o msur a mprtierii
fiecrei observaii n jurul unei valori centrale i se determin, pe eantion, cu
formula:





3 2
1 3
3 2 1
1
2
4
1
4

n n
n
s
x x
n n n
n n
CBA
n
i
i
, unde

1
1
2

n
x x
s
n
i
i
.
Dac 0 CBA , avem distribuie leptocurtic, valorile varibilei fiind concentrate
n jurul indicatorilor tendinei centrale
Dac
0 CBA
, avem distribuii platicurtice valorile varibilei fiind dispersate n
raport cu indicatorii tendinei centrale
Dac 0 CBA , avem distribuie mezocurtic, adic distribuia normal.
Transformarea datelor n cazul distribuiilor profund asimetrice
ntr-o distribuie profund asimetric datele sunt concentrate fie n zona
valorilor mici, fie n zona valorilor mari
Indicatorii statistici descriptivi (ai tendinei centrale, variabilitii i
formei distribuiei) se utilizeaz pentru caracterizarea distribuiilor
normale sau cu tendin de normalitate.
Indicatorii calculai pentru distribuii profund asimetrice nu
caracterizeaz corect datele.
O soluie este transformarea datelor pentru a nlocui distribuiile
asimetrice cu unele cu tendin de normalitate.
Transformarea nseamn nlocuirea fiecrei valori observate cu o nou
valoare obinut prin aplicarea unei anumite funcii.
Transformarea datelor n cazul distribuiilor profund asimetrice
Transformarea recomandat n cazul distribuiilor asimetrice
cu valori pozitive (majoritatea variabilelor economico-sociale
au valori pozitive) este logaritmarea.
Prin logaritmare, scala se lrgete lng valoarea zero,
permind mprtierea valorilor mici, care erau concentrate n
primele intervale.
Prin logaritmare, valorile mari se concentreaz.
n interpretarea ulterioar a indicatorilor calculai va trebui s
inem seama de aceste transformri.
Exemplu: Distribuia a 296 abonai n funcie de valoarea facturilor telefonice pltite
Me=36,4
Dup logaritmare
56 , 36 10
563 , 1
x
4 , 36 10
561 , 1
Me
Prin antilogaritmare se obine c media este egal cu 36,56, iar mediana este egal
cu 36,4, valori mult mai apropiate dect n cazul datelor iniiale:

Indicatorii statistici descriptivi
obinui n EXCEL
Media
Mediana
Modul
Abaterea medie
ptratic (standard)
Dispersia
Coeficientul de boltire
Coeficientul de asimetrie
Volumul eantionului (n)
Amplitudinea

S-ar putea să vă placă și