Sunteți pe pagina 1din 9

Indicatori ai formei distribuiei Cei trei indicatori medii (de calcul i de poziie) ofer informaii pertinente privind forma

distribuiei ntr-o serie de date statistice: pentru o distribuie simetric, media, mediana i modul coincid (figura 3. a). dac distri!uia este cu tendin de normalitate, dar asimetric spre dreapta, adic spre valori mari (cu coada mai lung a distri!uiei spre valorile mari), atunci x > Me > Mo (figura 3. !)" dac distri!uia este cu tendin de normalitate, dar asimetric spre stnga, adic spre valori mici (cu coada mai lung a distri!uiei spre valorile mici), atunci x < Me < Mo (figura nr. 3. c). #n general, pentru repartiii moderat asimetrice, e$ist o relaie empiric ntre cele trei valori i anume: Mo x 3(Me x )

Figura 3.2
a) distribuie simetric; b) distribuie cu asimetrie pozitiv; c) distribuie cu asimetrie negativ

#n cazul varia!ilelor numerice, pe l%ng determinarea indicatorilor tendinei centrale i varia!ilitii, ne punem pro!lema s studiem i modul n care valorile individuale sunt deplasate i concentrate comparativ cu tendina central, s analizm, cu alte cuvinte, forma distribuiei. &istri!uiile empirice se raporteaz, n general, la distri!uia normal teoretic i se ncearc analiza a dou aspecte: 'sura n care distri!uia se a!ate de la forma perfect de simetrie a valorilor n (urul tendinei centrale, analiz%ndu-se n acest caz oblicitatea" 'sura n care distri!uia este mai plat sau mai !oltit n raport cu distri!uia normal teoretic, analiz%ndu-se n acest caz boltirea sau aplatizarea. 1. Analiza asimetriei (oblicitii) Asimetria (skewness, n engl.) unei serii de distri!uie de frecvene se o!serv din reprezentarea grafic prin )istogram sau poligonul frecvenelor, prin modalitatea n care sunt situai, unul fa de cellalt, indicatorii tendinei centrale.

repartitie cu asimetrie negativa

repartitie cu asimetrie pozitiva

*ipul de asimetrie prezent n serie poate s fie descris doar prin simpla vizualizare a graficului (figura 3. ), dar ea poate s fie i msurat, prin indicatori specifici.

+age , -

&istri!uiile de frecvene pot fi perfect simetrice, i n acest caz x = Me = M . .

10

Sim

etrie (asimetrie zero); media (7) = mediana (7).

&istri!uiile de frecvene pot fi asimetrice, cu asimetrie pozitiv, caz n care x > Me > M . .

10

Asimetrie pozitiv (de dreapta); media (6) > mediana (5).

&istri!uiile de frecvene pot fi asimetrice, cu asimetrie negativ, caz n care x < Me < M . .

10

Asi

metrie negativ (de stnga); media (8) < mediana (9).

oeficientu! de asimetrie (skewness) e$prim gradul de asimetrie al unei distri!uii, n raport cu distri!uia normal teoretic i se determin, n eantion, cu formula:
CAS =
3 ( xi x ) i =n

, unde

ns

s=

(x
i =-

x)

n -

Definiia este bazat pe momentul centrat de ordinul 3. &ac CAS > . , avem asimetrie pozitiv, coada distri!uiei este mai alungit la dreapta, n serie predomin%nd valorile mici (media / mediana) &ac CAS < . , avem asimetrie negativ, coada distri!uiei este mai alungit la st%nga, n serie predomin%nd valorile mari (media 0 mediana) &ac CAS = . , avem serie perfect simetric
- distri!uia empiric difer semnificativ de distri!uia normal i se recomand tranformarea &ac CAS > datelor (se lo aritmeaz !alorile !ariabilei" obin#ndu$se astfel o distribuie aproximati! normal%

#n "# "$ se utilizeaz funcia: %&"' pentru determinarea coeficientului de asimetrie n eantion. +rogramul %(%% permite determinarea coeficientului de asimetrie (C12) folosind urmtoarea secven de comenzi: Anal&ze Descripti!e Statistics 're(uencies Statistics Skewness

+age ,

2. Analiza boltirii/aplatizrii Boltirea (kurtosis, n engl.) e$prim nlimea cur!ei (3cocoaei4) comparativ cu distri!uia normal teoretic. #nt%lnim, astfel distribuii leptocurtice, ascuite (cu 3cocoaa4 nalt) i distribuii platicurtice, aplatizate.

distri!uie leptocurtic

distri!uie platicurtic

)istribuia !eptocurtic, respectiv p!aticurtic oeficientu! de bo!tire sau ap!atizare (kurtosis) este o msur a mprtierii fiecrei o!servaii n (urul unei valori centrale i se determin, pe eantion, cu formula:
C)A =

(x
i =-

x)

n s

( )

3 ,

unde

s =

( x
i =-

x)

n -

Definiia este bazat pe momentul centrat de ordinul *. &ac C)A > . , avem distri!uie leptocurtic, valorile vari!ilei fiind concentrate *n +uru! indicatori!or tendinei centra!e &ac C)A < . , avem distri!uii platicurtice valorile vari!ilei fiind dispersate *n raport cu indicatorii tendinei centra!e &ac C)A = . , avem distri!uie mezocurtic, adic distri!uia normal. #n "# "$ se utilizeaz funcia &,-. pentru determinarea coeficientului de !oltire (C61) n eantion. +rogramul %(%% permite determinarea coeficientului de aplatizare (C61) folosind urmtoarea secven de comenzi: Anal&ze Descripti!e Statistics 're(uencies Statistics +urtosis

+age , 3

.ransformarea date!or *n cazu! distribuii!or profund asimetrice 7 distri!uie profund asimetric nu este normal sau cu tendin de normalitate, deoarece valorile sunt concentrate fie n zona valorilor mici, fie n zona valorilor mari ale distri!uiei. ,n exemplu de distribuie profund asimetric este distribuia statelor -uropei dup numrul populaiei. Asimetria reflect faptul c cele mai multe state au un numr mic (sau relati! redus% al populaiei .i doar c#te!a state au populaia numeroas.
39 3. 9 8umar state . -9 -. 9 .

.--.

-.- .

.-3.

3.-5. +opulatie (mil. locuitori)

5.-9.

9.-:.

:.-;.

;. si peste

)istribuia state!or "uropei dup numru! !ocuitori!or *n anu! 2//0

/ndicatorii statistici descripti!i prezentai (ai tendinei centrale, varia!ilitii i formei distri!uiei) se utilizeaz pentru caracterizarea distribuiilor normale sau cu tendin de normalitate . &ac aceti indicatori sunt utilizai pentru distri!uii profund asimetrice rezultatele pot fi deformate sau c)iar complet greite. 7 soluie pentru aceast pro!lem a asimetriei este utilizarea transformrii datelor, pentru a nlocui distri!uiile asimetrice cu unele cu tendin de normalitate. 0ransformarea nseamn nlocuirea fiecrei valori o!servate cu o nou valoare o!inut prin aplicarea unei anumite funcii. .ransformarea recomandat n cazul distribuiilor asimetrice cu !alori poziti!e (ma(oritatea varia!ilelor economico-sociale au valori pozitive) este !ogaritmarea. +rin logaritmare, scala se lrgete l%ng valoarea zero, permi%nd rsp%ndirea valorilor mici, care erau aglomerate n primele intervale. &e asemenea, valorile mari, prin logaritmare, se condenseaz i se apropie. #n interpretarea ulterioar a datelor va tre!ui ns s inem seama de aceste transformri. Ap!icaie +entru a fundamenta decizia de lansare a unui nou pac)et de servicii, managemetul companiei <omtelecom dorete s cunoasc, pe l%ng ale varia!ile, costul serviciilor oferite n prezent prin intermediul valorilor facturilor pltite de clieni. 1stfel, a fost selectat aleator un eantion de =: de a!onai i nregistrate valorile facturilor pltite n luna precedent (n >ur): 39,;. 3 ,.9 3,9. 5;,?9 5;,?. 33,=. +age , 5 :5,=. ::,99 59,?9 55,:. ,:9 35,-. :-,.9 5,;9 5;,3. 5;,.. :,:. ::,.. 3?,3. 59,-. ;,5. 99,99 3?,?. 5,:9 -?,;. ?,?9 3.,?. 5:, . 99,=. =,-9 9-,5. :3,.. 3-,-9 5.,5. 5-, 9 3-,?. 3;,5. 39,=. 5:,;. ?,99 9.,:. 3;,?9 5=,=9 5;,?9 3;,59 3:,5. 5?,?9 9;,.. 99, 9 3=,9. 33, . 33,99 ., 9 =,-9 95,?9 :.,-9 53,=9 ;,;. 3,5. 9=,99 5-,:9 5?,9. 3?,?. 99,9. :,-9 3 ,99 9-,.. 53,9. 5 ,:9 33,:. ?,=9 5:,;. -=,.9 =,5. 53,.9 3,9. ?,99 5.,3.

5.,39 5;,=. :,-. .,?. 35,9. 9;,.9 :,;9 9.,:. -;,59 39,5. 5;,;. : ,?. 3-,:9 ;,=. -=,59 -5,=. -,39

3.,=. ?.,39 3 ,.. :,=. 3.,.. 3,:9 3.,.9 33,5. 3.,:. ;=, . :=,99 5,=9 5,-9 3, . -9,-. 3 ,.. 3=,?.

5,-9 3:,;. 5-, . ;,.9 ;,-9 :.,39 ;,9. ,?. 9;,?. -,;. 3=,99 3:,:9 ?,39 -,9. 3:,:. -,=9 3;, 9

3?, 9 39,-9 9:,59 ?,5. 39,99 3, . :-,-. =:, 9 5:,5. =,;9 99,3. 3;,5. 39,39 ;,;. 9.,=9 3;,-9 ?,.9

-,:9 -=,:9 35,-9 3?,?. 35, . 9.,:9 3.,.9 ?9,?9 9,5. -,=. 3 ,9. 3=,9. 3-,.. 5-,3. 3,5. ?,-9 :?,3.

5,;. 59,59 35,3. 95,5. 5,:9 -,5. 3-, 9 ---,=9 9,;9 5,59 3:,3. 5 ,.9 :5, . ;,-. :,5. 9,-9 9.,59 5-,5. -;,=9 .,:9 =,:9 9=,-9 9.,;. 3,39 35,3. 3,3. 5 ,;. 5;,5. 9-,39 3.,=9 33,?9 3?,39 5-,.. 5 ,?9 5;,9. 55,=. ::,=. 9.,;9 ?,.9 ;,=. 5-,39 9 ,5. 3-,=. 39, 9 3=,?. ?,.9 3,.. ?3,;. ,.. :;,.. -.=,;.

9?,5. 5?,3. 3:,?. :.,3. 3-,;9 -=,3. 53,;9 3.,-9 9.,?9 3.,5. :-,:. 3., . 9,3. :?,-. 3?,59 9.,=. 5?,?.

3=,:. 55,;9 33,.9 3:,=9 35,99 9., . 33, 9 3;,=. 5.,.9 ,9. 5 ,?9 -,?. ?,?. 9 ,=. 5.,?9 9:,99 -,9.

:,;9 3,=9 ?,3. :,=. 53,39 5?,:9 39,;9 5-,?9 3:,5. :,5. 93,.. 3;,;. : ,59 ; ,:. 5?,.9 3.,3.

9?, 9 3.,;9 9?,?9 3=,3. 9,-9 3;,;. 39,=9 5-,-9 ;5,?. 3-,3. 5 ,=. ;,.9 3:,.. -=,?9 5:,99 33,;9

?,.. 39,;9 3:,;. 3:,?9 33,=9 9,=. 5.,;9 -:,?9 :5,.. -=, 55,3=, 9 33,:9,? -;,;. =,5.

Caracterizm, n continuare, distri!uia a!onailor n funcie de valoarea facturilor pltite folosind metodele cunoscute de descriere i analiz a datelor. 1eprezentarea rafic .i determinarea .i interpretarea indicatorilor tendinei centrale" !ariabilitii .i formei distribuiei folosind2 1. (rogramu! "# "$ @olosind secvena de comenzi: 0ools Data anal&sis Descripti!e Statistics 2e o!ine urmtorul output:
a!t"ra Mean Standard Error Median Mode Standard Deviation Samp!e "ariance #urtosis S$e%ness &ange Minimum Ma'imum Sum (ount 39,1347973 0,890989478 36,4 38,8 15,3 916 59 34,983 57 3,078697599 1,359497 54 97,05 14,9 111,95 11583,9 96

+age , 9

2. (rogramu! %(%% @olosind secvena de comenzi: Anal&ze Descripti!e Statistics 're(uencies Statistics" C3arts

<ezultatele din output-urile prezentate permit formularea urmtoarelor concluzii: Aaloarea medie a unei facturi este de apro$imativ 3= >ur, facturile celor =: de a!onai, fiind, n medie, mai mari sau mai mici cu apro$imativ -9,3 >ur" Bumtate dintre facturi au o valoare mai mare de 3:,5 >ur sau, altfel spus pro!a!ilitatea ca o factur s fie mai mare de 3:,5 >ur este de 9.C" 2eria prezint mai multe valori modale, iar cea mai mic valoare modal este ? >ur" &ac analizm comparativ indicatorii tendinei centrale, n special media i mediana (seria fiind multimodal) o!servm c acestea difer destul de mult" Coeficientul de asimetrie este pozitiv i mai mare dec%t unu, situaie ce arat c distri!uia este profund asimetric la dreapta (cele mai multe facturi au valori mici), indicatorii tendinei

+age , :

centrale calculai pentru aceste date ofer informaii eronate i se impune transformarea datelor prin logaritmare" Aaloarea coeficientului de !oltireDaplatizare este pozitiv (distri!uie leptocurtic) i mare indic%nd faptul c distri!uia datelor nu este normal sau cu tendin de normalitate" Cuantilele distri!uiei se pot determina folosind urmtoarea secven de comenzi:
Anal&ze Descripti!e Statistics 're(uencies 4ercentile 5alues

+utem determina cuartilele sau percentilele de un anumit ordin k. Considerm c managerul este interesat de determinarea valorii facturii su! care se situeaz 9C, respectiv =9C dintre a!onai. 7utput-ul o!inut este:

+utem formula urmtoarele concluzii: 9C dintre a!onai pltec facturi mai mici de ? >ur" 9.C dintre a!onai pltesc facturi cu o valoare cuprins ntre ? i 5;,:9 >ur" &oar 9C dintre facturi au o valoare mai mare de ::,: >ur sau, altfel spus, pro!a!ilitatea ca o factur s ai! o valoare mai mare de ::,: >ur este de 9C" +ro!a!ilitatea ca o factur s ai! o valoare mai mare de .,9= >ur este de =9C. Construim diagrama 6o$plot i determinm indicatori statistici afereni utiliz%nd urmtoarea secven de comenzi 2+22:
Anal&ze Descripti!e Statistics -xplore Statistics" Descripti!es 4lots

+age , ;

#n diagrama 6o$plot sunt fi$ate: Aalorile considerate a fi va!ori e2treme


x min = xi 6- -,9 /61 /61 = 63 66- -,9 /61 = ?,. 9 -,9 -=,:5 = -,539 x min = -5,=
!" se nume#te abatere intercuartilic ( nter!uartile "an$e)

xma$ = xi 63 +-,9 /61 /61 = 63 663 +-,9 /61 = 5;,: +-,9 -=,:5 = ;;,.: xma$ = ;;,.:

valorile considerate a fi va!ori aberante (outliers) 5alori aberante sunt considerate valorile mai mari dec%t 63 +-,9 /61 sau mai mici dec%t 6- -,9 /61 . Cuartilele ( 6- , 6 = Me, 63 ) &eoarece valoarea coeficienilor de asimetrie i de !oltireDaplatizare recomand transformarea datelor prin logaritmare prezentm n continuare )istograma i indicatorii statistici descriptivi pe !aza valorilor varia!ilei 3factura4 logaritmate n !aza -.:

+age , ?

+e !aza rezultatelor o!inute se pot formula urmtoarele concluzii: 2e o!serv, pe )istograma o!inut pe !aza datelor logaritmate, o distri!uie cu tendin de normalitate" Aalorile coeficienilor ce caracterizeaz forma distri!uiei sunt aproiate de zero i indic o distri!uie uor asimetric la dreapta i platicurtic (aplatizat)" +rin antilogaritmare se o!ine c media este egal cu 3:,9:, iar mediana este egal cu 3:,5, valori mult mai apropiate dec%t n cazul datelor iniiale: x =-.-,9:3 = 3:,9: , iar Me =-.-,9:- = 3:,5 " 7!servm c pentru median se o!ine tot valoarea de 3:,5, similar cazului datelor nelogaritmate. #n sc)im!, media o!inut prin transformarea datelor este mai mic dec%t cea iniial i mult mai apropiat de valoarea median. Endicatorii tendinei centrale determinai astfel sunt mai potrivii pentru caracterizarea datelor.

+age , =