Sunteți pe pagina 1din 9

ANALIZA SERIILOR DE DISTRIBUIE UNIDIMENSIONALE 3.3.1.

Indicatorii tendinei centrale


Analiza tendinei centrale, n seriile de repartiie, presupune luarea n consideraie, nu numai a valorilor individuale, ci i a formei n care se repartizeaz frecvenele de apariie a acestor valori. 3.3.1.1. Mrimile Medii Mrimile Medii sunt instrumente statistice ce exprim, n mod sintetic i generalizat, ceea ce este normal esenial, tipic i general n evoluia fenomenelor. Pentru aplicarea corect a mediilor este necesar s se respecte urmtoarele condiii: a) calculul mediilor s se bazeze pe folosirea unui numr mare de cazuri individuale diferite, sub care s-a nregistrat caracteristica, a cror variaie este ntmpltoare n raport cu fenomenul n totalitatea lui; b) valorile din care se va calcula media s fie omogene; c) alegerea acelei forme de medie care corespunde cel mai bine formei de variaie a caracteristicii cercetate i informaiilor de care se dispune. Media valorilor individuale ale unui fenomen de mas este expresia sintetizrii ntr-un singur nivel reprezentativ, ceea ce este esenial, tipic n apariia, manifestarea i dezvoltarea lui. Mediile cele mai frecvent ntlnite: Media aritmetic ( X ). Se folosete n general cnd fenomenul supus cercetrii nregistreaz modificri aproximativ constante ntr-o progresie aritmetic. Poate fi:
i=1 Media aritmetic simpl: X =

xi n
,

unde: X = media aritmetic n = nr. variantelor individuale x i = suma valorilor individuale ale caracteristicii

Media aritmetic ponderat: se folosete pentru seriile de distribuie, cnd variante ale caracteristicii se nregistreaz de mai multe ori.
X =
i = 1 p

x i n i n i

i = 1

unde: x1, x2,..., xp niveluri individuale, ni frecvena grupelor


X a i * ni h i Formula de calcul a mediei simplificate: X = *h + a ni
i

unde a = valoarea caracteristicii cu frecven maxim

Observaii: sensibilitatea ei, fa de valorile extreme ale seriei;

devine nereprezentativ, dac termenii seriei sunt foarte mprtiai; omogenitatea colectivitii este o condiie a reprezentativitii, pentru orice tip de mrime medie; este indicat a se calcula cnd frecvenele maxime sunt n cen-trul seriei.
Media armonic ( X h ) Se calculeaz din valorile inverse ale ter-menilor seriei, ca medie simpl sau ponderat. n Pentru serii simple: X h = i = 1,p 1 i x i ni i Xh = Pentru serii de frecven: 1 *ni i xi Observaii: pentru distribuiile de frecven este indicat a se folosi cnd n serie predomin valorile mici, seria fiind asimetric ctre valorile minime ale caracteristicii (frecvena maxim este n prima grup). Media ptratic ( X p ) Se calculeaz prin extragerea rdcinii ptrate din media aritmetic a
ptratelor termenilor seriei, ca medie simpl sau ponderat:

Pentru seriile simple:

Xp =

xi n

Pentru seriile de frecven: X p =

2 xi ni ni

Observaii: Se folosete cnd dm o importan mare termenilor mari ai seriei sau n cazul n care termenii seriei au valori pozitive i negative. Frecvena maxim va fi la ultima grup a seriei. Media geometric ( X g ). Se bazeaz pe relaia de produs a termenilor seriei i se mai numete i
medie logaritmic. Pentru seria simpl:

X g = n x i , i = 1, n
Xg = ni x
ni i

Pentru seria frecvenelor: Dac logaritmm rezult:

, i = 1, n

Pentru seria simpl: lg X g

lg x i n
=

Pentru seria frecvenelor: lg X g

n i lg x i . ni

Media ( X g ) se afl prin antilogaritm.

Observaii:

nu poate fi folosit dac n cadrul seriei exist cel puin un termen negativ, expresia devine imaginar; sau dac exist un termen zero, anuleaz produsul termenilor; mai este denumit i medie de ritm, fiind folosit pentru cal-culul ritmului mediu de cretere. Relaiile existente ntre aceste medii sunt date de inegalitile:

Xh Xg X Xp
3.3.1.2. Indicatorii de poziie

Sunt denumii i medii de structur, iar dintre acetia amintim: quantile de ordinul K: - pentru K = 2 mediana (Me); pentru K = 4 quartilele (Q1, Q2 = Me, Q3); - pentru K = 10 decilele (D1, .,D5 = Me, .., D9) valoarea modal sau modul (Mo) Aceti indicatori evideniaz tendina de aglomerare sau concentrare a valorilor individuale, ctre anumite valori tipice. Se folosesc pentru: estimarea nivelului mediu; evaluarea asimetriei seriei etc.; Mediana (Me) reprezint acea valoare a caracteristicii situat n mijlocul seriei dup ce termenii seriei au fost aranjai cresctor sau descresctor. Cazul seriei simple numr impar de termeni: 1 5 9 12 16 20 25 Me =12

numr par de termeni: 1 5 8 12 16 20

Me =

8 + 12 20 = = 10 2 2

Cazul seriei de distribuie de frecven Seria statistic fr intervale (ex. distribuia loturilor de produse dup numrul rebuturilor):
Nr. rebuturi din lot xi 0 1 2 3 4 5 TOTAL Nr. de loturi ni 10 20 40 15 10 5 100 Frecvene cumulate 10 30 70 85 95 100

Pentru aceast serie valoarea Me va fi acea valoare a caracteristicii corespunztoare primei ni + 1 frecvene cumulate ascendent ce depete valoarea lui . Aceast relaie ne d locul medianei 2 pentru seriile de frecven cu intervale. 100 + 1 ni + 1 ex. = = 50,5 prima frecven mai mare este 70, Me = 2 2 2

Cazul seriei statistice cu intervale: Pentru calculul Me se urmresc etapele: cumularea cresctoare a frecvenelor ni + 1 determinarea locului Me cu relaia ; 2

ni +1 n pMe 2 calculul medianei cu formula: Me = X 0 + h n Me unde: X0 limita inferioar a intervalului median; h mrimea intervalului; n pMe = suma frecvenelor cumulate, precedente intervalului median;
n Me = frecvena absolut a intervalului median.

Exemplu Gruparea muncitorilor dup vechime Numr muncitori Frecvene cumulate

0-5

5-10

10-15

15-20

20-25

25-30

30-35

TOTAL

5 5

7 12

10 22

12 34

18 52

15 67

7 74

74

n i + 1 74 + 1 = = 37,5 (20,25) 2 2 37,5 34 Me = 20+5 = 20,97 Me = 20,97 18 Quartile sunt acele valori ale caracteristicii ce mpart seria ordonat n patru pri egale. Sunt n numr de trei (Q1, Q2, Q3) i se calculeaz cu relaiile:

Locul Me =

+1

Q1 = X 0 + h
X
0

n pQ1

n Q1

= limita inferioar a intervalului Q1, h = mrimea intervalului ni +1 = locul primei quartile Q1 4 n pQ1 = frecvene cumulate precedente ale intervalului Q1 n Q1 = frecvena absolut a intervalului Q1

Q2 = Me

3 4 Q3 = X 0 + h

( n

+1 n Q3

) n

pQ 3

3 n i + 1 = locul Q3 4 n pQ3 = frecvene cumulate precedente intervalului Q3 nQ 3 = frecvena absolut a Q3


X 0 = limita inferioar a intervalului Q3,

Valoarea modal sau Modul (Mo) Reprezint acea valoare a caracteristicii, care are cea mai mare frecven de apariie. Se calculeaz numai n distribuie de frecven. Pentru o repartiie de frecven pe variate M0 se identific pe calea simplei examinri a irului de frecvene. Mo = 2 (frecvena maxim (ni) = 40)

Numr rebuturi xi Numr loturi ni

0 10

1 20

2 40

3 15

4 10

5 5

TOTAL 100

Pentru o serie de frecven pe intervale, determinarea M0 se face pe etape: determinarea intervalului modal, fiind intervalul de variaie al caracteristicii cu frecven maxim estimarea valorii modale cu relaia:

Mo = Xo + h

1 1 + 2

unde: X 0 = limita inferioar a intervalului modal 1 = diferena dintre frecvena intervalului modal i frecvena intervalului precedent 2 = diferena dintre frecvena intervalului modal i frecvena intervalului urmtor h = mrimea intervalului.

Exemplu Calculul M0 pe exemplul seriei de frecvene (conform exemplului de la Me) unde intervalul modal este (20,25)
Mo = 20 +5

(18 12 ) = 23 ,33 (18 12 ) + (18 15 )

20 < 23,33 < 25

Observaii: M poate nlocui media cnd ea nu se poate calcula sau nu are sens a fi calculat: industria confeciilor: nu exist mrime medie, ci talia cea mai cutat (la fel la nclminte) M este util pentru seria de repartiie asimetric. M i M se exprim n aceleai unitate de msur ca i variabila studiat.

3.3.2. Indicatorii variaiei


Cu ct gradul de complexitate al unui fenomen este mai mare, cu att gama factorilor de influen este mai larg i implicit cu att mai mare este variabilitatea termenilor unei serii de repartiie. Indicatorii statistici ai variaiei rezolv: verificarea reprezentativitii mediei ca valoare tipic a seriei de distribuie; verificarea gradului de omogenitate al seriei; verificarea sistematizrii informaiilor prin gruparea statistic; caracterizarea gradului i formei de variaie a unei variabile statistice. Clasificarea indicatorilor variaiei: 1. Dup numrul variantelor cuprinse n metodologia lor de calcul: indicatori simpli; indicatori sintetici ai variaiei. 2. Dup metodologia de calcul i forma de exprimare, deosebim: indicatori ai mprtierii, calculai ca mrimi absolute; indicatori de variaie calculai ca mrimi relative, n raport cu valoarea unui indicator al tendinei centrale (media). 3. Dup modul de sistematizare a datelor complexe: indicatori ai variaiei, calculai pentru serii de distribuie unidimensionale. indicatori ai variaiei, calculai pentru serii de distribuie multidimensionale.

Indicatorii simpli ai variaiei se caracterizeaz prin aceea c se calculeaz n cifre absolute sau relative, prin compararea valorilor individuale extreme, sau prin compararea fiecrei valori individuale cu valoarea lor medie.

Amplitudinea mprtierii este expresia cantitativ a domeniului de variaie al unui fenomen i se calculeaz ca mrime absolut sau relativ. Amplitudinea absolut: A = Xmax Xmin
Amplitudinea relativ: A% =

A 100 X

Se utilizeaz la alegerea numrului de grupe (r), la stabilirea mrimii interva-lului de grupare (h), la dirijarea statistic a procesului de fabricaie. Abaterile individuale (di) ne arat cu cte uniti de msur, sau de cte ori valoarea individual a caracteristicii este mai mare sau mai mic dect mrimea unui indicator al tendinei centrale. Abaterile individuale se calculeaz n cifre absolute sau relative: Abaterile individuale absolute (di):

di = Xi X , pentru i = 1, n
=

di 100 , pentru i = 1, n x Observaie. Indicatorii simpli ai variaiei permit o caracterizare parial i aproximativ a variaiei pentru c se calculeaz pe baza relaiei ntre doi termeni ai seriei, sau ntre fiecare termen i media lor.
Abaterile individuale relative (di%): di%

Indicatorii sintetici ai mprtierii caracterizeaz gradul de variaie lund n considerare toi termenii seriei. Indicatorii sintetizeaz ntr-o singur expresie numeric, variaia valorilor individuale, fa de tendina central a caracteristicilor urmrite ntr-o populaie statistic. n funcie de metodologia de calcul n statistic se calculeaz: Abaterea medie absolut d reprezint media aritmetic simpl sau ponderat a abaterilor absolute ale termenilor seriei de la tendina lor central.

()

xi x
i Pentru serii simple: d =

pentru i = 1, k

Pentru serii de frecven: d =

xi x ni

ni

pentru i = 1, k

unde: k = numrul de variante distincte sau intervale de grupare; ni = frecvene absolute Observaii: Pentru seriile de distribuie pe intervale se iau centrele de interval (Xi). Este concludent numai pentru seriile cu grad mare de omogenitate. Dispersia 2 se calculeaz ca o medie aritmetic simpl sau ponderat a ptratelor abaterilor termenilor de la media lor. 2 xi x 2 i Pentru seria simpl: = pentru i = 1, p

( )

Pentru seria de frecven :

= i

xi x
i

)2 * n i

ni

Pentru serii de frecvene relative :

=
2

xi x
i

)2 * n * i
2

100
*ni

x a i h 2 i Formula de calcul simplificat al dispersiei : = ni


i

*h2 x a

)2

unde: a = valoarea caracteristicii (Xi) corespunztoare frecvenei maxime.

Observaii: 2 i x calculate pe baza seriilor de repartiie pe intervale, sunt mai puin exacte dect dac s-ar folosi date individuale negrupate. cu ct intervalele de grupare sunt mai mari, cu att 2 i x sunt mai puin semnificative.
2 este un indicator abstract, fr coninut economic. 2 msoar variaia total a caracteristicilor studiate, datorate cauzelor eseniale i ntmpltoare. Abaterea medie ptratic (abaterea standard). Se definete ca medie ptratic simpl sau ponderat, a abaterilor valorilor individuale de la tendina central, sau ca rdcin ptrat a dispersiei.

Astfel: = , unde = dispersia, calculat prin orice metod. Observaii: abaterea medie ptratic se exprim n unitatea de msur a caracteristicii studiate, iar valoarea sa este cu att mai mare cu ct variaia valorilor individuale din care s-a calculat este mai mare; comparnd cu d , calculate pentru aceeai serie: d ; n analizele statistice, se prefer , ca fiind un parametru al legii normale (majoritatea metodelor statistice au la baz ipoteza normalitii); se preteaz mai bine la calculul algebric; n analizele financiar-bursiere poate fi utilizat ca o msur a riscului.
2
2

Coeficientul de variaie (v). Este o msur a dispersiei relative care descrie abaterea medie ptratic ca procent din media aritmetic. Permite compararea mprtierii valorilor individuale a mai multor caracteristici cantitative ce nu sunt exprimate n aceeai UM. Se calculeaz cu relaia:

V =

* 100 x

Observaii: coeficientul de variaie ia valori n intervalul 0-100%; dac tinde spre 0, este o variaie slab, o colectivitate omogen i o medie cu un grad mare de reprezentativitate; dac tinde spre 100%, variaia este intens, colectivitatea eterogen; practica a stabilit pragul de trecere de la omogenitate la eterogenitate: dac v 35%, colectivitatea este omogen, media reprezentativ, gruparea bine efectuat. dac v 35%, colectivitatea este eterogen, media nereprezentativ, gruparea trebuie refcut.

3.3.3. Analiza variaiei ntr-o serie de repartiie bidimensional


Analiza detaliat a fenomenelor social-economice, cu grad mare de complexitate, necesit structurarea colectivitii pe grupe relativ omogene, n funcie de variaia uneia sau a mai multor caracteristici de grupare. Astfel, studiul mprtierii unei caracteristici n ntreaga colectivitate trebuie s se completeze cu analiza mprtierii din fiecare grup i dintre grupe, identificndu-se astfel, rolul diferiilor factori de influen asupra variaiei caracteristicii n colectivitatea respectiv. Regula de adunare a dispersiilor arat relaia dintre dispersia total i cele dou dispersii factoriale, cu formula:

02 = 2 + 2
2

2 unde: 0 = dispersia total; 2 = media dispersiilor pariale; = dispersia dintre grupe. Pe baza ei se calculeaz:

100 2 0 arat care este ponderea factorului principal de grupare n variaie total a caracteristicii.
Coeficientul de determinaie R
2

Coeficientul de nedeterminaie K

02

100

arat care este ponderea factorilor ntmpltori n variaia total a caracteristicii. ntre cei doi coeficieni exist urmtoarea relaie: R 2 + K 2 = 1 Dac: R 2 > K 2 , factorul principal de grupare acioneaz hotrtor asupra variaiei caracteristicii rezultative.

R2 < K2 , variaia caracteristicii rezultative se datoreaz influenei exercitate de alte cauze, aceasta fiind independent de variaia caracteristicii factoriale.

3.3.4. Analiza asimetriei repartiiilor empirice


n urma prelucrrii informaiilor se obin serii de repartiie de frecven empirice, ce se pot compara cu repartiii teoretice, a cror form de repartiie este cunoscut. Cea mai frecvent serie de repartiie, ctre care tind seriile empirice, este distribuia normal sau funcia GAUSS-LAPLACE, ale crei frecvene se distribuie simetric, de-o parte i de alta a frecvenei maxime, plasat n centrul seriei. Graficul acestei distribuii are form de clopot, n raport cu ordonata maxim, iar X = Me = Mo . Noiunea de asimetrie se refer la felul n care frecvenele unei distribuii empirice se abat de la curba normal a frecvenelor. Sunt cunoscute distribuii empirice: uor asimetrice; pronunat asimetrice. Reprezentrile grafice ne ofer o imagine asupra asimetriei, dar gradul de asimetrie este msurat cu indicatori specifici, din care amintim pe cel mai important:

Coeficientul de asimetrie (Cas) a lui PEARSON se calculeaz ca raport ntre asimetria absolut (AS) i abaterea medie ptratic.
As = X Mo;

Cas =

X Mo

Cas are o valoare abstract, artnd mrimea i felul asimetriei, iar valorile lui sunt cuprinse n intervalul (-1, 1). Dac: Cas = 0, seria este simetric; Cas 0, asimetrie mic Cas (+/- 1), asimetrie pronunat Cas n intervalul (0,1) asimetrie pozitiv

Cas n intervalul (-1,0) asimetrie negativ.

S-ar putea să vă placă și