Sunteți pe pagina 1din 9

ANALIZA SERIILOR DE DISTRIBUłIE UNIDIMENSIONALE 3.3.1. Indicatorii tendinŃei centrale

Analiza tendinŃei centrale, în seriile de repartiŃie, presupune luarea în consideraŃie, nu numai a valorilor individuale, ci şi a formei în care se repartizează frecvenŃele de apariŃie a acestor valori.

3.3.1.1. Mărimile Medii Mărimile Medii sunt instrumente statistice ce exprimă, în mod sintetic şi generalizat, ceea ce este normal esenŃial, tipic şi general în evoluŃia fenomenelor. Pentru aplicarea corectă a mediilor este necesar să se respecte următoarele condiŃii:

a) calculul mediilor să se bazeze pe folosirea unui număr mare de cazuri individuale diferite, sub

care s-a înregistrat caracteristica, a căror variaŃie este întâmplătoare în raport cu fenomenul în totalitatea lui;

b) valorile din care se va calcula media să fie omogene;

c) alegerea acelei forme de medie care corespunde cel mai bine formei de variaŃie a caracteristicii

cercetate şi informaŃiilor de care se dispune. Media valorilor individuale ale unui fenomen de masă este expresia sintetizării într-un singur nivel reprezentativ, ceea ce este esenŃial, tipic în apariŃia, manifestarea şi dezvoltarea lui. Mediile cele mai frecvent întâlnite:

Media aritmetică ( X ). Se foloseşte în general când fenomenul supus cercetării înregistrează modificări aproximativ constante într-o progresie aritmetică. Poate fi:

Media aritmetică simplă:

n ∑ x i = 1 X = i n
n
x i
= 1
X
= i
n

,

unde: X = media aritmetică n = nr. variantelor individuale

x = suma valorilor individuale ale caracteristicii

i

Media

aritmetică

ponderată:

se

foloseşte

pentru

seriile

de

distribuŃie,

caracteristicii se înregistrează de mai multe ori.

p ∑ x n i i i = 1 X = p ∑ n i
p
x
n
i
i
i
=
1
X
=
p
n
i
i
=
1
 X
i
a   * n
i
i
h
X =
* h
+
a
∑ n
i
i

unde:

x

1 , x 2 ,

,

x p – niveluri individuale,

n

i – frecvenŃa grupelor

Formula de calcul a mediei simplificate:

unde

a = valoarea caracteristicii cu frecvenŃă maximă

ObservaŃii:

sensibilitatea ei, faŃă de valorile extreme ale seriei;

când

variante

ale

devine nereprezentativă, dacă termenii seriei sunt foarte împrăştiaŃi;

omogenitatea colectivităŃii este o condiŃie a reprezentativităŃii, pentru orice tip de mărime medie;

este indicat a se calcula când frecvenŃele maxime sunt în cen-trul seriei.

Media armonică ( sau ponderată.

Pentru serii simple:

X

h ) Se calculează din valorile inverse ale ter-menilor seriei, ca medie simplă

n X = i = 1,p h 1 ∑ x i i ∑ n i
n
X
=
i = 1,p
h
1
x
i
i
n
i
i
X
=
h
1
* n
i
x
i
i

Pentru serii de frecvenŃă:

ObservaŃii:

pentru distribuŃiile de frecvenŃă este indicat a se folosi când în serie predomină valorile mici, seria fiind asimetrică către valorile minime ale caracteristicii (frecvenŃa maximă este în prima grupă).

Media pătratică (

X

p ) Se calculează prin extragerea rădăcinii pătrate din media aritmetică a

pătratelor termenilor seriei, ca medie simplă sau ponderată:

termenilor seriei, ca medie simpl ă sau ponderat ă : X p = 2 ∑ x

X

p

=

2 ∑ x i n
2
∑ x
i
n

Pentru seriile simple:

ponderat ă : X p = 2 ∑ x i n Pentru seriile simple: X p

X

p

=

2 ∑ x n i i ∑ n i
2
∑ x
n
i
i
∑ n
i

Pentru seriile de frecvenŃă:

ObservaŃii:

Se foloseşte când dăm o importanŃă mare termenilor mari ai seriei sau în cazul în care termenii seriei au valori pozitive şi negative.

FrecvenŃa maximă va fi la ultima grupă a seriei.

Media geometrică (

X

g ). Se bazează pe relaŃia de produs a termenilor seriei şi se mai numeşte şi

medie logaritmică.

X

g

=

n x i
n
x
i

,i

=

1,n

 
 

X

g

=

n n i x i i
n
n
i
x
i
i

, i

=

1, n

 

X

   

lg

x

i

 

lg

g

=

n

     

n

i

lg x

i

   

X

g

=

n

i

.

Pentru seria simplă:

Pentru seria frecvenŃelor:

Dacă logaritmăm rezultă:

Pentru seria simplă:

Pentru seria frecvenŃelor: lg

Media ( X

g ) se află prin antilogaritm.

ObservaŃii:

nu poate fi folosită dacă în cadrul seriei există cel puŃin un termen negativ, expresia devine imaginară;

sau dacă există un termen zero, anulează produsul termenilor;

mai este denumită şi medie de ritm, fiind folosită pentru cal-culul ritmului mediu de creştere. RelaŃiile existente între aceste medii sunt date de inegalităŃile:

X

X

X

X

.

h

g

p

3.3.1.2. Indicatorii de poziŃie

Sunt denumiŃi şi medii de structură, iar dintre aceştia amintim:

• quantile de ordinul K:

- pentru K = 2 –mediana (Me);

- pentru K = 4 – quartilele (Q 1, Q 2 = M e, Q 3 );

- pentru K = 10 –decilele (D 1, ., D 5 = M e,

,

D 9 )

• valoarea modală sau modul (Mo) Aceşti indicatori evidenŃiază tendinŃa de aglomerare sau concentrare a valorilor individuale, către anumite valori tipice. Se folosesc pentru: estimarea nivelului mediu; evaluarea asimetriei seriei etc.; Mediana (Me) – reprezintă acea valoare a caracteristicii situată în mijlocul seriei după ce termenii seriei au fost aranjaŃi crescător sau descrescător. Cazul seriei simple

număr impar de termeni: 1

număr par de termeni: 1

5

5

9

12

16

20 25

Me =12

 

8

12

16

20

Me

=

8

+

2

12

=

20

2

= 10

Cazul seriei de distribuŃie de frecvenŃă

Seria statistică fără intervale (ex. distribuŃia loturilor de produse după numărul rebuturilor):

Nr. rebuturi din lot

Nr. de loturi

FrecvenŃe

x

i

n

i

cumulate

0

10

10

1

20

30

2

40

70

3

15

85

4

10

95

5

5

100

TOTAL

100

 

Pentru această serie valoarea Me va fi acea valoare a caracteristicii corespunzătoare primei

. Această relaŃie ne dă locul medianei

n

i

+

1

frecvenŃe cumulate ascendent ce depăşeşte valoarea lui

pentru seriile de frecvenŃă cu intervale.

+1

2

n

i

+

1

100

ex.

2

=

2

= 50,5 –prima frecvenŃă mai mare este 70, Me = 2

Cazul seriei statistice cu intervale:

Pentru calculul Me se urmăresc etapele:

• cumularea crescătoare a frecvenŃelor

• determinarea locului Me cu relaŃia

n

i

+

1

2

;

• calculul medianei cu formula:

Me

=

X

0 +

h

n

i

+

1

 
 

2

 

n

pMe

 

n

Me

unde: X 0 – limita inferioară a intervalului median; h – mărimea intervalului;

n pMe

= suma frecvenŃelor cumulate, precedente intervalului median;

n Me

= frecvenŃa absolută a intervalului median.

Exemplu

Gruparea

     

0-5

 

5-10

 

10-15

15-20

20-25

25-30

30-35

TOTAL

muncitorilor după

     

vechime

Număr muncitori

       

5

 

7

10

12

18

15

7

74

FrecvenŃe cumulate

       

5

 

12

 

22

34

52

67

74

 

Locul Me

=

n

 

i

+

1

=

74

+

1

=

37,5

 
 

2

 

2

 

(20,25)

Me = 20+5

37,5

34 =

20,97

 

Me = 20,97

   

18

Quartile sunt acele valori ale caracteristicii ce împart seria ordonată în patru părŃi egale. Sunt în

număr de trei (Q 1 , Q 2 , Q 3 ) şi se calculează cu relaŃiile:

∑ n + 1 i ∑ n pQ1 4 Q X h 1 = 0
∑ n
+ 1
i
n pQ1
4
Q
X
h
1 =
0 +
n Q1

X 0 = limita inferioară a intervalului Q 1, h = mărimea intervalului

n

i

+

1

4

= locul primei quartile Q 1

n pQ1

= frecvenŃe cumulate precedente ale intervalului Q 1

n Q1

= frecvenŃa absolută a intervalului Q 1

Q 2

=

Me

 
 

X

+

h

4

n

i

+

3 1

(

)

n

pQ3

Q 3

=

0

 

n

Q3

X 0 = limita inferioară a intervalului Q 3,

3

4

(

n +1

i

)

= locul Q 3

n pQ3

= frecvenŃe cumulate precedente intervalului Q 3

n Q3

= frecvenŃa absolută a Q 3

Valoarea modală sau Modul (Mo) Reprezintă acea valoare a caracteristicii, care are cea mai mare frecvenŃă de apariŃie. Se calculează numai în distribuŃie de frecvenŃă. Pentru o repartiŃie de frecvenŃă pe variate M 0 se identifică pe calea simplei examinări a şirului de frecvenŃe. Mo = 2 (frecvenŃa maximă ∑(n i ) = 40)

Număr rebuturi x i

0

1

2

3

4

5

TOTAL

Număr loturi n i

10

20

40

15

10

5

100

Pentru o serie de frecvenŃă pe intervale, determinarea M 0 se face pe etape:

– determinarea intervalului modal, fiind intervalul de variaŃie al caracteristicii cu frecvenŃă maximă

– estimarea valorii modale cu relaŃia:

Mo

=

Xo

+

h

 

1

 

1

+

2

unde: X

0 = limita inferioară a intervalului modal

1 = diferenŃa dintre frecvenŃa intervalului modal şi frecvenŃa intervalului precedent

2 = diferenŃa dintre frecvenŃa intervalului modal şi frecvenŃa intervalului următor

h =

mărimea intervalului.

Exemplu

Calculul M 0 modal este (20,25)

Mo

= 20 +5

ObservaŃii:

pe exemplul seriei de frecvenŃe (conform exemplului de la Me) unde intervalul

(

18

12

)

(

18

12

)

+

(

18

15

)

= 23,33

20 < 23,33 < 25

• Mо poate înlocui media când ea nu se poate calcula sau nu are sens a fi calculată: industria confecŃiilor: nu există mărime medie, ci talia cea mai căutată (la fel la încălŃăminte)

• Mо este util pentru seria de repartiŃie asimetrică.

• Mе şi Mо se exprimă în aceleaşi unitate de măsură ca şi variabila studiată.

3.3.2. Indicatorii variaŃiei

Cu cât gradul de complexitate al unui fenomen este mai mare, cu atât gama factorilor de influenŃă

este mai largă şi implicit cu atât mai mare este variabilitatea termenilor unei serii de repartiŃie.

Indicatorii statistici ai variaŃiei rezolvă:

– verificarea reprezentativităŃii mediei ca valoare tipică a seriei de distribuŃie;

– verificarea gradului de omogenitate al seriei;

– verificarea sistematizării informaŃiilor prin gruparea statistică;

– caracterizarea gradului şi formei de variaŃie a unei variabile statistice. Clasificarea indicatorilor variaŃiei:

1. După numărul variantelor cuprinse în metodologia lor de calcul:

– indicatori simpli;

– indicatori sintetici ai variaŃiei.

2. După metodologia de calcul şi forma de exprimare, deosebim:

– indicatori ai împrăştierii, calculaŃi ca mărimi absolute;

– indicatori de variaŃie calculaŃi ca mărimi relative, în raport cu valoarea unui indicator al tendinŃei centrale (media).

3. După modul de sistematizare a datelor complexe:

– indicatori ai variaŃiei, calculaŃi pentru serii de distribuŃie unidimensionale.

– indicatori ai variaŃiei, calculaŃi pentru serii de distribuŃie multidimensionale.

Indicatorii simpli ai variaŃiei se caracterizează prin aceea că se calculează în cifre absolute sau relative, prin compararea valorilor individuale extreme, sau prin compararea fiecărei valori individuale cu valoarea lor medie.

Amplitudinea împrăştierii este expresia cantitativă a domeniului de variaŃie al unui fenomen şi se calculează ca mărime absolută sau relativă.

A = X max – X min

A

100 100

X

Amplitudinea absolută:

Amplitudinea relativă: A % =

Se utilizează la alegerea numărului de grupe (r), la stabilirea mărimii interva-lului de grupare (h), la dirijarea statistică a procesului de fabricaŃie. Abaterile individuale (di) ne arată cu câte unităŃi de măsură, sau de câte ori valoarea individuală a caracteristicii este mai mare sau mai mică decât mărimea unui indicator al tendinŃei centrale. Abaterile individuale se calculează în cifre absolute sau relative:

di = X i X

Abaterile individuale absolute (di):

, pentru i = 1,n

di

x

100

Abaterile individuale relative (di % ): di % =

, pentru i = 1,n

ObservaŃie. Indicatorii simpli ai variaŃiei permit o caracterizare parŃială şi aproximativă a variaŃiei pentru că se calculează pe baza relaŃiei între doi termeni ai seriei, sau între fiecare termen şi media lor.

Indicatorii sintetici ai împrăştierii caracterizează gradul de variaŃie luând în considerare toŃi termenii seriei. Indicatorii sintetizează într-o singură expresie numerică, variaŃia valorilor individuale, faŃă de tendinŃa centrală a caracteristicilor urmărite într-o populaŃie statistică. În funcŃie de metodologia de calcul în statistică se calculează:

Abaterea medie absolută (d) reprezintă media aritmetică simplă sau ponderată a abaterilor absolute ale termenilor seriei de la tendinŃa lor centrală.

∑ xi x i d =
xi
x
i
d
=
   
 

n

 
   

x

i

x
x

n

i

d

=

i

 
 

i

ni

 

Pentru serii simple:

pentru i = 1, k

Pentru serii de frecvenŃă:

pentru i = 1, k

unde: k = numărul de variante distincte sau intervale de grupare; ni = frecvenŃe absolute ObservaŃii:

Pentru seriile de distribuŃie pe intervale se iau centrele de interval (X i ). Este concludentă numai pentru seriile cu grad mare de omogenitate.

Dispersia (

2

)

se calculează ca o medie aritmetică simplă sau ponderată a pătratelor abaterilor

termenilor de la media lor.

( ) 2 ∑ x x i 2 i = n ( ) 2 ∑
(
) 2
x
x
i
2
i
=
n
(
)
2
x
x
* n
i
i
2
i
=
∑ ni
i

pentru i =1, p

Pentru seria simplă:

Pentru seria de frecvenŃă :

( ) 2 * ∑ x x * n i i % 2 i =
(
)
2
*
x
x
* n
i
i
%
2
i
=
100
2
a
i
∑   x
* n
i
h
2
i
2
(
) 2
=
* h
x
a
ni
i

Pentru serii de frecvenŃe relative :

Formula de calcul simplificat al dispersiei :

unde: a = valoarea caracteristicii (X i ) corespunzătoare frecvenŃei maxime.

ObservaŃii:

2

şi x calculate pe baza seriilor de repartiŃie pe intervale, sunt mai puŃin exacte decât dacă s-ar folosi date individuale negrupate.

2

• cu cât intervalele de grupare sunt mai mari, cu atât

caracteristicilor

şi x sunt mai puŃin semnificative.

studiate,

datorate

cauzelor

2

2

este un indicator abstract, fără conŃinut economic.

măsoară

variaŃia

totală

a

esenŃiale

întâmplătoare.

şi

Abaterea medie pătratică (abaterea standard). Se defineşte ca medie pătratică simplă sau

ponderată, a abaterilor valorilor individuale de la tendinŃa centrală, sau ca rădăcină pătrată a dispersiei.

=

2
2

,

2 = dispersia, calculată prin orice metodă.

Astfel:

ObservaŃii:

• abaterea medie pătratică se exprimă în unitatea de măsură a caracteristicii studiate, iar valoarea

unde

sa este cu atât mai mare cu cât variaŃia valorilor individuale din care s-a calculat este mai mare;

• comparând cu d , calculate pentru aceeaşi serie: d ;

• în analizele statistice, se preferă

, ca fiind un parametru al legii normale (majoritatea

metodelor statistice au la bază ipoteza normalităŃii);

• se pretează mai bine la calculul algebric;

• în analizele financiar-bursiere poate fi utilizată ca o măsură a riscului.

Coeficientul de variaŃie (v). Este o măsură a dispersiei relative care descrie abaterea medie pătratică ca procent din media aritmetică. Permite compararea împrăştierii valorilor individuale a mai multor caracteristici cantitative ce nu sunt exprimate în aceeaşi UM.

x

V

=

V = * 100

* 100

Se calculează cu relaŃia:

ObservaŃii:

• coeficientul de variaŃie ia valori în intervalul 0-100%;

• dacă tinde spre 0, este o variaŃie slabă, o colectivitate omogenă şi o medie cu un grad mare de

reprezentativitate;

• dacă tinde spre 100%, variaŃia este intensă, colectivitatea eterogenă;

• practica a stabilit pragul de trecere de la omogenitate la eterogenitate:

– dacă „v” 35%, colectivitatea este omogenă, media reprezentativă, gruparea bine efectuată.

– dacă „v” 35%, colectivitatea este eterogenă, media nereprezentativă, gruparea trebuie refăcută.

3.3.3.

Analiza variaŃiei într-o serie de repartiŃie bidimensională

Analiza detaliată a fenomenelor social-economice, cu grad mare de complexitate, necesită structurarea colectivităŃii pe grupe relativ omogene, în funcŃie de variaŃia uneia sau a mai multor caracteristici de grupare. Astfel, studiul împrăştierii unei caracteristici în întreaga colectivitate trebuie să se completeze cu analiza împrăştierii din fiecare grupă şi dintre grupe, identificându-se astfel, rolul diferiŃilor factori de influenŃă asupra variaŃiei caracteristicii în colectivitatea respectivă. Regula de adunare a dispersiilor arată relaŃia dintre dispersia totală şi cele două dispersii

0

2

=

2

+

2

 

2

factoriale, cu formula:

unde:

Pe baza ei se calculează:

= dispersia totală;

2

0

= media dispersiilor parŃiale; δ = dispersia dintre grupe.

Coeficientul de determinaŃie

2

2

0

R

R 2 = ◊ 100

2

=

100

R 2 = ◊ 100

– arată care este ponderea factorului principal de grupare în variaŃie totală a caracteristicii.

Coeficientul de nedeterminaŃie

K

2

2 = 2 0
2
=
2
0

100

– arată care este ponderea factorilor întâmplători în variaŃia totală a caracteristicii.

Între cei doi coeficienŃi există următoarea relaŃie: R

Dacă:

2

+

K

2

=

1

R

2

> K

2

, factorul principal de grupare acŃionează hotărâtor asupra variaŃiei caracteristicii

rezultative.

R 2

2

< K , variaŃia caracteristicii rezultative se datorează influenŃei exercitate de alte cauze, aceasta

fiind independentă de variaŃia caracteristicii factoriale.

3.3.4. Analiza asimetriei repartiŃiilor empirice

În urma prelucrării informaŃiilor se obŃin serii de repartiŃie de frecvenŃă empirice, ce se pot compara cu repartiŃii teoretice, a căror formă de repartiŃie este cunoscută. Cea mai frecventă serie de repartiŃie, către care tind seriile empirice, este distribuŃia normală sau funcŃia GAUSS-LAPLACE, ale cărei frecvenŃe se distribuie simetric, de-o parte şi de alta a frecvenŃei maxime, plasată în centrul seriei.

Graficul acestei distribuŃii are formă de clopot, în raport cu ordonata maximă, iar X = Me = Mo . NoŃiunea de asimetrie se referă la felul în care frecvenŃele unei distribuŃii empirice se abat de la curba normală a frecvenŃelor. Sunt cunoscute distribuŃii empirice: uşor asimetrice; pronunŃat asimetrice. Reprezentările grafice ne oferă o imagine asupra asimetriei, dar gradul de asimetrie este măsurat cu indicatori specifici, din care amintim pe cel mai important:

Coeficientul de asimetrie (Cas) a lui PEARSON

– se calculează ca raport între asimetria absolută (AS) şi abaterea medie pătratică.

As = X

Mo;

Cas

=

X

X Mo

Mo

– Cas are o valoare abstractă, arătând mărimea şi felul asimetriei, iar valorile lui sunt cuprinse în intervalul (-1, 1).

– Dacă:

Cas = 0, seria este simetrică; Cas 0, asimetrie mică Cas (+/- 1), asimetrie pronunŃată Cas în intervalul (0,1) asimetrie pozitivă

Cas în intervalul (-1,0) asimetrie negativă.