Sunteți pe pagina 1din 9

5.

Asimetria i boltirea (sau aplatizarea)


n urma prelucrrii primare a informaiilor se obin serii de reparti ie de
frecvene empirice care se pot compara cu reparti iile teoretice, pentru care s-au
calculat parametrii (medie, dispersie etc.) i este cunoscut forma lor de reparti ie. Cea
mai frecvent repartiie teoretic ctre care tind seriile empirice este distribuia
normal ale crei frecvene se distribuie simetric de o parte i de alta a frecven ei
maxime plasat la centul seriei, iar graficul acesteia are forma de clopot n raport cu
ordonata maxim.
Distribuia normal a fost descris de Ch.Fr. Gauss (1777-1855) i de P.S.
Laplace (1749-1827), fiind numit i distribuie gaussian, distribuie sau funcie
Gauss-Laplace, clopotul lui Gauss sau distribuie Z.

Particularitile acestei distribuii:


1. frecvenele valorilor individuale cresc pn la atingerea valorii tendin ei
centrale, apoi scad;
2. este asimptotic la zero (linie sau dreapt de care se apropie o curb, dar pe
care nu o atinge niciodat la o distan finit; curba frecven elor nu atinge niciodat
axa OX);
3. indicatorii tendinei centrale au aceeai valoare: Media = Mediana =
Modul;
4. e o distribuie Teoretic. Distribu iile empirice se pot abate semnificativ sau
nu.
Caracteristicile distribuiei normale:
1.Modalitatea (sub aspectul modalitii o distribuie normal este o distribuie
unimodal (are o singur valoare modal o singur valoare individual cu frecven
maxim). Remarc: o distribuie multimodal nu este o distribu ie normal)
2.Simetria (o distribuie normal este o distribuie simetric n jurul tendin ei
centrale)

Orice ndeprtare a distribuiilor de la simetrie n statistic este cunoscut sub


denumirea de asimetrie (ce reprezint deplasarea pe orizontal a vrfului curbei
experimentale fa de curba normal). La interpretarea gradului de asimetrie se
pornete de la poziia i valorile pe care le au cei trei indicatori ai tendinei centrale:
media, mediana i modul.
O distribuie nonsimetric se mai numete i oblic i ea poate prezenta
asimetrie de stnga sau de dreapta (vezi figurile 2 i 3)

Atunci cnd exist o serie de valori extreme mari, vorbim despre o distribu ie asimetric
pozitiv (Skewness pozitiv): modul are cea mai mic valoare, urmat de median, iar media are cea
mai mare valoare (deoarece urmeaz valorile extreme); ne spune c foarte multe unit i au
nregistrat valori mici;
Atunci cnd exist o serie de valori extreme mici, vorbim despre o distribu ie asimetric
negativ (Skewness negativ): media are cea mai mic valoare, urmat de median i apoi de mod
(valoarea cea mai mare); ne spune c foarte multe uniti au nregistrat valori mari.

Indicatorii de asimetrie:
1. Asimetria absolut (propus de Pearson) se calculeaz dup relaia: As x Mo
Rezultatul arat ct de mare este abaterea dintre cei doi indicatori. Deoarece se exprim n
unitile de msur ale variabilei analizate, acest indicator nu poate fi folosit la comparaii
ntre serii exprimate diferit.
De aceea pentru a msura gradul de asimetrie recurgem la indicatorii de asimetrie
relativi. Din acest grup reinem un anumit numr de coeficieni, adic numere fr
dimensiune, permind comparaiile.
2. Se prezint coeficienii de asimetrie ce poart numele autorilor lor (Pearson, Yule,
Kendall, Fisher)
Pearson propune:
x Mo
a.

Cas

(Cas = 0 - simetrie; semnul coeficientului apreciaz forma asimetriei: C as 0 - asimetrie de


stnga (simetrie oblic la stnga); Cas0 - asimetrie de dreapta (simetrie oblic la
dreapta)). Acest coeficient poate lua valori cuprinse ntre 1 i +1; cu ct e mai mic n
valoare absolut (tinde spre zero) cu att asimetria e mai mic i invers, cu ct coeficientul
tinde spre unu seria prezint o asimetrie pronunat. Coeficientul e recomandabil a se
folosi numai pentru distribuii uor asimetrice.

b.

I
as

3 x Me

- formula utilizat n cazul seriilor u or asimetrice bazate pe un

numr mare de cazuri observate, cnd se cunoate mediana seriei i cnd ntre cei
trei indicatori ai tendinei centrale se verific relaia:
Modul = Media 3(Media - Median). Coeficientul poate lua valori ntre 3 i +3 , el
va arta un grad mai mare de simetrie cu ct se va apropia mai mult de zero. Valori
mari (apropiate de 3) indic o asimetrie cu intensitate foarte mare.
c. n perioada 1894-1895 K. Pearson introduce n teoria i practica statistic un nou
coeficient de asimetrie, bazat pe calculul momentelor centrate i cunoscute sub
numele de coeficientul 1 . Relaia de calcul a acestui coeficient este urmtoarea:

32
1 3
2

unde:

momentul centrat de ordinul 2 :

2
3

x x

xi

ni

x ni
3

ni
momentul centrat de ordinul 3 :
Calculul coeficientului 1 pentru msurarea asimetriei este mai dificil, dar el este mai
bine elaborat i se adapteaz mai bine atunci cnd numrul observa iilor (valorilor
individuale) asupra caracteristicii este mare.
Dac 1 = 0 simetrie; dac 1 0 asimetrie de dreapta; dac 1 0 asimetrie de stnga;

d. Ronald Fisher propune: Coeficientul 1 ca msur a asimetriei acesta este rdcina


3
ptratic a coeficientului 1:

1 1

22

Interpretarea coeficientului 1 este similar cu cea a coeficientului 1. Mai mult, sensul


deplasrii valorilor individuale fa de tendina central poate fi analizat att cu
coeficientul 1 al lui K. Pearson, ct i cu coeficientul 1. a lui R.Fisher, deoarece
amndoi se bazeaz pe momentul centrat de ordinul 3. Astfel:
dac 1 = 0 simetrie; dac 1 0 asimetrie de dreapta; dac 1 0 asimetrie de stnga;
e. Yule i Kendall (comparnd modul de etalare a frecvenelor la dreapta i la stnga
medianei i innd cont de poziia cuartilelor n raport cu mediana, pentru msurarea
asimetriei) propune:
Q3 Me Me Q1
C asYK
Q3 Me Me Q1
valorile coeficientului sunt cuprinse n intervalul (-1;+1).
(CasYK=0 - simetrie; CasYK 0 asimetrie de stnga; CasYK 0 - asimetrie de dreapta).
Dac acest coeficient se apropie de 0.1 se apreciaz c seria este moderat asimetric, iar
peste 0.3 se consider c seria este pronunat asimetric.

3. Boltirea (sau aplatizarea sau excesul)


O distribuie normal este o distribuie mezocurtilic, adic normal boltit.
Atunci cnd variabilitatea valorilor individuale n jurul tendin ei centrale este prea
mic, distribuia se numete leptocurtic (Kurtosis pozitiv sau distribuie ascuit):
are o abatere standard relativ mic, valorile se nghesuie n jurul tendinei
centrale. Apar fluctuaii mici ale valorilor n zona tendinei centrale i mari n zona
extremelor (n cozi).
Atunci cnd variabilitatea valorilor individuale n jurul tendin ei centrale este prea
mare, distribuia se numete platicurtic (Kurtosis negativ sau distribuie turtit):
are o abatere standard relativ mare, valorile sunt mpr tiate n jurul tendinei
centrale. Apar fluctuaii mari de scoruri n zona mediei.

Pentru msurarea aplatizrii curbelor de frecvene trebuie


s se urmreasc comparativ dac distribuia este mai mult sau
mai puin aplatizat n raport cu curba Gauss-Laplace (distribu ie
normal). n acest sens se pot utiliza urmtorii coeficieni:
1. Coeficientul 2 al lui Pearson:
unde: 4 momentul centrat de ordinul 4 :

4
2
2

x
ni
i

ni
Interpretare:
2 = 3 (repartiie mezocurtic, adic aplatizarea curbei de
frecvene este identic cu cea a curbei normale)
2 > 3 (repartiie leptocurtic)
2 < 3 (repartiie platicurtic)

2. Coeficientul 2 al lui R. Fisher msoar excesul fa de boltirea unei


distribuii normale Gauss-Laplace:

2 2 3

4
3
2
2

- exces al seriei

Interpretare:
2=0 (repartiie mezocurtic, adic distribuie normal) excesul e nul;
2 >0 (repartiie leptocurtic) valorile variabilei fiind concentrate n
jurul indicatorilor tendinei centrale;
2<0 (repartiie platicurtic) valorile variabilei fiind dispersate n raport
cu indicatorii tendinei centrale.
Calculul coeficienilor ca msuri ale aplatizrii este anevoios, prin
operaiile pe care le implic. Acest neajuns poate fi compensat prin analiza
reprezentrilor grafice (corect trasate) ale distribu iilor de frecven e (histograma,
poligonul frecvenelor) etc.

S-ar putea să vă placă și