Sunteți pe pagina 1din 4

5.

Asimetria şi boltirea (sau aplatizarea)


În urma prelucrării primare a informațiilor se obțin serii de repartiție de frecvențe empirice care se pot compara cu
repartițiile teoretice, pentru care s-au calculat parametrii (medie, dispersie etc.) și este cunoscută forma lor de
repartiție. Cea mai frecventă repartiție teoretică către care tind seriile empirice este distribuția normală ale cărei
frecvențe se distribuie simetric de o parte și de alta a frecvenței maxime plasată la centul seriei, iar graficul acesteia are
forma de clopot în raport cu ordonata maximă.
Distribuția normală a fost descrisă de Ch.Fr. Gauss (1777-1855) și de P.S. Laplace (1749-1827), fiind numită și distribuție
gaussiană, distribuție sau funcție Gauss-Laplace, „clopotul lui Gauss” sau distribuție Z.

Particularitățile acestei distribuții:


1. frecvențele valorilor individuale cresc până la atingerea valorii tendinței centrale, apoi scad;
2. este asimptotică la zero (linie sau dreaptă de care se apropie o curbă, dar pe care nu o atinge niciodată la o
distanță finită; curba frecvențelor nu atinge niciodată axa OX);
3. indicatorii tendinței centrale au aceeaşi valoare: Media = Mediana = Modul;
4. e o distribuție Teoretică. Distribuțiile empirice se pot abate semnificativ sau nu.
Caracteristicile distribuției normale:
1. Modalitatea (sub aspectul modalității o distribuție normală este o distribuție unimodală (are o singură valoare
modală – o singură valoare individuală cu frecvență maximă). Remarcă: o distribuție multimodală nu este o
distribuție normală)
2. Simetria (o distribuție normală este o distribuție simetrică în jurul tendinței centrale)

Orice îndepărtare a distribuţiilor de la simetrie în statistică este cunoscut sub denumirea de asimetrie (ce reprezintă
deplasarea pe orizontală a vârfului curbei experimentale faţă de curba normală). La interpretarea gradului de asimetrie
se porneşte de la poziţia şi valorile pe care le au cei trei indicatori ai tendinţei centrale: media, mediana şi modul.
O distribuţie nonsimetrică se mai numeşte şi oblică şi ea poate prezenta asimetrie de stânga sau de dreapta.

Atunci când există o serie de valori extreme mari, vorbim despre o distribuție asimetrică pozitivă (Skewness pozitiv):
modul are cea mai mică valoare, urmată de mediană, iar media are cea mai mare valoare (deoarece urmează valorile
extreme); ne spune că foarte multe unități au înregistrat valori mici;
• Atunci când există o serie de valori extreme mici, vorbim despre o distribuție asimetrică negativă (Skewness
negativ): media are cea mai mică valoare, urmată de mediană și apoi de mod (valoarea cea mai mare); ne spune
că foarte multe unități au înregistrat valori mari.

Indicatorii de asimetrie:
1. Asimetria absolută (propusă de Pearson) se calculează după relaţia: As= x(medium)- Mo
Rezultatul arată cât de mare este abaterea dintre cei doi indicatori. Deoarece se exprimă în unităţile de măsură ale
variabilei analizate, acest indicator nu poate fi folosit la comparaţii între serii exprimate diferit.
De aceea pentru a măsura gradul de asimetrie recurgem la indicatorii de asimetrie relativi. Din acest grup reţinem un
anumit număr de coeficienţi, adică numere fără dimensiune, permiţând comparaţiile.
2. Se prezintă coeficienţii de asimetrie ce poartă numele autorilor lor (Pearson, Yule, Kendall, Fisher)
Pearson propune:

a. Cas= x(medium)-Mo totul raportat la abaterea medie patratica (sigma)

(Cas = 0 - simetrie; semnul coeficientului apreciază forma asimetriei: C as >0 - asimetrie de stânga (simetrie oblică la
stânga); Cas<0 - asimetrie de dreapta (simetrie oblică la dreapta)). Acest coeficient poate lua valori cuprinse între –1 şi
+1; cu cât e mai mic în valoare absolută (tinde spre zero) cu atât asimetria e mai mică și invers, cu cât coeficientul tinde
spre unu seria prezintă o asimetrie pronunțată. Coeficientul e recomandabil a se folosi numai pentru distribuţii uşor
asimetrice.

b. – formula utilizată în cazul seriilor ușor asimetrice bazate pe un număr mare de cazuri observate,
când se cunoaşte mediana seriei și când între cei trei indicatori ai tendinţei centrale se verifică relaţia: Modul = Media –
3(Media - Mediană). Coeficientul poate lua valori între –3 şi +3 , el va arăta un grad mai mare de simetrie cu cât se va
apropia mai mult de zero. Valori mari (apropiate de ±3) indică o asimetrie cu intensitate foarte mare.
c. În perioada 1894-1895 K. Pearson introduce în teoria și practica statistică un nou coeficient de asimetrie, bazat pe
calculul momentelor centrate și cunoscute sub numele de coeficientul β1 . Relația de calcul a acestui coeficient este
următoarea:
unde:

momentul centrat de ordinul 2 :


momentul centrat de ordinul 3 :
Calculul coeficientului β1 pentru măsurarea asimetriei este mai dificil, dar el este mai bine elaborat și se adaptează mai
bine atunci când numărul observațiilor (valorilor individuale) asupra caracteristicii este mare.
Dacă β1 = 0 – simetrie; dacă β1 ‹ 0 – asimetrie de dreapta; dacă β1 › 0 – asimetrie de stânga;

d. Ronald Fisher propune: Coeficientul γ1 ca măsură a asimetriei acesta este rădăcina pătratică a coeficientului β1:
Interpretarea coeficientului γ1 este similară cu cea a coeficientului β1. Mai mult, sensul deplasării valorilor individuale
față de tendința centrală poate fi analizat atât cu coeficientul β1 al lui K. Pearson, cât și cu coeficientul γ1. a lui R.Fisher,
deoarece amândoi se bazează pe momentul centrat de ordinul 3. Astfel:
dacă γ1 = 0 – simetrie; dacă γ1 ‹ 0 – asimetrie de dreapta; dacă γ1 › 0 – asimetrie de stânga;
 
e. Yule și Kendall (comparând modul de etalare a frecvențelor la dreapta și la stânga medianei și ținând cont de poziția
cuartilelor în raport cu mediana, pentru măsurarea asimetriei) propune:
valorile coeficientului sunt cuprinse în intervalul (-1;+1).
(CasYK=0 - simetrie; CasYK >0 – asimetrie de stânga; CasYK <0 - asimetrie de dreapta).
Dacă acest coeficient se apropie de 0.1 se apreciază că seria este moderat asimetrică, iar peste 0.3 se consideră că seria
este pronunţat asimetrică.

3. Boltirea (sau aplatizarea sau excesul)


O distribuție normală este o distribuție mezocurtilică, adică normal boltită.
Atunci când variabilitatea valorilor individuale în jurul tendinței centrale este prea mică, distribuția se numește
leptocurtică (Kurtosis pozitiv sau distribuţie ascuțită): are o abatere standard relativ mică, valorile se „înghesuie” în jurul
tendinței centrale. Apar fluctuații mici ale valorilor în zona tendinței centrale și mari în zona extremelor (în cozi).
Atunci când variabilitatea valorilor individuale în jurul tendinței centrale este prea mare, distribuția se numește
platicurtică (Kurtosis negativ sau distribuţie turtită): are o abatere standard relativ mare, valorile sunt „împrăștiate” în
jurul tendinței centrale. Apar fluctuații mari de scoruri în zona mediei.

Pentru măsurarea aplatizării curbelor de frecvențe trebuie să se urmărească comparativ dacă distribuția este mai mult
sau mai puțin aplatizată în raport cu curba Gauss-Laplace (distribuție normală). În acest sens se pot utiliza următorii
coeficienți:
1. Coeficientul β2 al lui Pearson:
unde: µ4 momentul centrat de ordinul 4 :
Interpretare:
β2 = 3 (repartiţie mezocurtică, adică aplatizarea curbei de frecvențe este identică cu cea a curbei normale)
β 2 > 3 (repartiţie leptocurtică)
β 2 < 3 (repartiţie platicurtică)

2. Coeficientul γ2 al lui R. Fisher – măsoară excesul faţă de boltirea unei distribuţii normale Gauss-Laplace:
- exces al seriei
Interpretare:
γ2=0 (repartiţie mezocurtică, adică distribuție normală) – excesul e nul;
γ2 >0 (repartiţie leptocurtică) – valorile variabilei fiind concentrate în jurul indicatorilor tendinţei centrale;
γ2<0 (repartiţie platicurtică) – valorile variabilei fiind dispersate în raport cu indicatorii tendinţei centrale.
 Calculul coeficienților ca măsuri ale aplatizării este anevoios, prin operațiile pe care le implică. Acest neajuns poate fi
compensat prin analiza reprezentărilor grafice (corect trasate) ale distribuțiilor de frecvențe (histograma, poligonul
frecvențelor) etc.

S-ar putea să vă placă și