Sunteți pe pagina 1din 27

CURS 4

INDICATORII VARIATIEI

1
ANALIZA VARIABILITĂŢII

Necesitate:

- Statistica studiază fenomene de masă, adică fenomene care se


produc la numeroase unităţi statistice şi variază ca nivel de la o unitate
la alta. Cu cât fenomenele sunt influenţate de mai mulţi factori, cu atât
sunt mai complexe şi prezintă un grad mai mare de variaţie.
- pentru folosirea corectă a indicatorilor medii, este necesară
verificarea reprezentativităţii lor. Media este reprezentativă doar dacă
seria de date din care s-a calculat este omogenă (prezintă un grad
scăzut de variaţie).
- variabilitatea este, deci, o trăsătură esenţială a fenomenelor şi
proceselor care formează obiectul de studiu al statisticii, indicatorii de
măsurare a variabilităţii completează informaţiile aduse de indicatorii
descriptivi ai tendinţei centrale, pentru o analiză mai aprofundată a
unui set de date.
2
ni ni
B A B

xi

xi

x b) xA xB
a)
B
ni Două distribuţii pot avea:
- tendinţe centrale asemănătoare, dar
A grade diferite de împrăştiere a
valorilor (a)
- tendinţe centrale diferite, dar grade
xi identice de dispersare a valorilor (b)
c) xA xB - tendinţe centrale diferite, dar si grade
diferite de variabilitate a valorilor (c)

3
Sistemul de indicatori ai variabilităţii:

Variabilitatea este caracterizată şi măsurată printr-un sistem de


indicatori, care se pot clasifica după următoarele criterii:

A. după nivelul la care se calculează şi aria de cuprindere, avem:


 indicatori simpli ai variaţiei (calculaţi la nivelul unei unităţi

statistice);
 indicatori sintetici ai variaţiei (calculaţi la nivelul întregii

colectivităţi sau al unei grupe a acesteia).

B. după forma de exprimare, pot fi:


 indicatori absoluţi (exprimă variaţia în unităţi concrete de

măsură);
 indicatori relativi (exprimă variaţia în procente sau

coeficienţi).

4
I. Indicatorii simpli ai variabilităţii

I. Indicatorii simpli ai variaţiei sunt acei indicatori care arată


împrăştierea valorilor una faţă de alta sau împrăştierea valorilor faţă
de o anumită valoare, de regulă față de medie; Se exprimă atât în
mărimi absolute (având aceleaşi unităţi de măsură ca şi caracteristica
studiată), cât şi în mărimi relative (obţinute prin raportarea mărimii
absolute la medie).
Indicatorii simpli ai variaţiei sunt:
 amplitudinea absolută a variaţiei;
 amplitudinea relativă a variaţiei;
 abaterea interquartilică;
 abaterile individuale absolute;
 abaterile individuale relative.

5
I. Indicatorii simpli ai variabilităţii
a) Amplitudinea absolută a variaţiei (Ax) arată câmpul maxim de
împrăştiere a valorilor caracteristicii:
Ax = xmax - xmin

Se utilizează în etapa de grupare a datelor, mai precis la construirea


intervalelor de variaţie şi se mai utilizează şi la construirea graficelor.
Amplitudinea este foarte sensibilă la valorile extreme. Cu cât acestea
sunt mai îndepărtate cu atât câmpul de împrăştiere a valorilor este mai
mare

6
I. Indicatorii simpli ai variabilităţii
b) Amplitudinea relativă a variaţiei (Ax(%)) se obţine prin
raportarea amplitudinii absolute la medie. Se exprimă în
coeficienți sau procente, deci pot fi comparate serii după
caracteristici exprimate în unităţi de măsură diferite:
Ax
Ax (%)   100
x

7
I. Indicatorii simpli ai variabilităţii

c) Abaterea (devierea) individuală absolută arată împrăștierea


fiecărei valori de la valoarea medie:
d i  xi  x , cu i  1, n reprezentând unitatea statistică.
În practică se utilizează mai mult abaterea absolută
maximă şi abaterea absolută minimă:
 Abaterea maximă pozitivă (în expresie absolută):

d max  x max  x

 Abaterea maximă negativă (în expresie absolută):



d max  x min  x

8
I. Indicatorii simpli ai variabilității

d) Abaterile individuale relative se exprimă în


coeficienţi sau procente şi se calculează raportând
abaterile individuale absolute la medie:
di
d i (%)   100
x

9
II. Indicatorii sintetici ai variabilităţii

Indicatorii sintetici ai variaţiei – iau în considerare


toţi termenii seriei în calculul lor, sintetizând într-
o singură valoare întreaga împrăştiere din serie.
Indicatorii sintetici ai variaţiei sunt:
 abaterea medie liniară ;

 dispersia (varianţa);

 abaterea medie pătratică;

 coeficientul de variaţie.

10
II. Indicatorii sintetici ai variabilităţii

Măsoară în mod sintetic abaterea termenilor seriei faţă de nivelul mediu al


acesteia.

1. Abaterea medie liniară (sau abaterea medie absolută) se calculează ca


o medie aritmetică simplă sau ponderată a abaterilor individuale luate în valoarea
absolută, ale termenilor seriei faţă de media lor.
Arată cu câte unităţi de măsură concrete s-a modificat în medie un termen al seriei
faţă de nivelul mediu al acesteia.
n
 xi x
i 1
d 
 pentru o serie simplă: n
r r
 xi  x ni  xi  x ni*
i 1 i 1
d  d  r
r
 pentru o serie de frecvenţe:  ni sau  ni*
i 1 i 1

11
II. Indicatorii sintetici ai variabilităţii

Dezavantaje ale abaterii medii liniare:


 se exprimă în aceeaşi unitate de măsură ca şi
caracteristica analizată, deci nu poate fi utilizată la
compararea a două sau mai multe serii după
caracteristici exprimate în unităţi de măsură diferite;
 nu ţine seama de semnul algebric;
 nu ţine seama de faptul că abaterile mai mari în
valoare absolută influenţează în mai mare măsură
gradul de variaţie al unei caracteristici comparativ cu
abaterile mici.
12
II. Indicatorii sintetici ai variabilităţii

2. Dispersia (sau varianţa) este media aritmetică simplă sau


ponderată a pătratelor abaterilor individuale absolute, ale
termenilor seriei faţă de media lor.
  x  x
n
2
i

 pentru o serie simplă:  


2 i 1
n
 x  x n
r

  x  x n
r 2
2 *
i i i i

2  i 1 2  i 1
 pentru o serie de frecvenţe: r sau r

n
i 1
i n
i 1
*
i

Observaţii:
Dispersia nu are unitate de măsură;
Cu cât este mai apropiată de 0 cu atât variaţia este mai mică; cu
cât este mai depărtată de 0, cu atât variaţia este mia mare.
Prezintă avantajul că, prin ridicarea la pătrat, acordă o importanţă
mai mare abaterilor individuale mai mari în valoare absolută faţă de
media seriei: 13
II. Indicatorii sintetici ai variabilităţii

Dispersia se poate determina şi fără calculul în prealabil


al abaterilor absolute:
2

x 
n n n
 n 
    xi
2
i x x 2
i x 2
i 
  i 1 
2
2  i 1
 i 1  x  i 1
n n n  n  (pentru serii simple)
 
 
2

 
n n n
 n 
xi  x ni  x n  
2 2
i i x n  2
i i xi i 
n
  i 1n 
2
 
2 i 1
 i 1n  x  i 1n
n
  (pentru serii de frecvenţe)
i 1
ni i 1
ni i 1
ni   ni 
 i 1 

14
II. Indicatorii sintetici ai variabilităţii

Unele proprietăţi ale dispersiei

a. Pentru un şir de valori constante, dispersia este întotdeauna


nulă.
b. Dacă într-o serie (simplă sau de frecvenţe) fiecare termen se
măreşte sau se micşorează cu o aceeaşi constantă „a”, atunci
dispersia seriei nu se modifică.
c. Dacă într-o serie (simplă sau de frecvenţe), fiecare termen se
măreşte sau se micşorează de un acelaşi număr de ori (h),
atunci dispersia seriei se va modifica şi ea în acelaşi sens de „h2”
ori, faţă de dispersia seriei iniţiale.

15
REGULA ADUNARII DISPERSIILOR

 O serie statistică poate să fie structurată în grupuri (serii componente) după un


factor principal de grupare sau după un criteriu organizatoric.
 Dacă o serie statistică este alcătuită din mai multe serii componente, am văzut,
atunci când am studiat media aritmetică, că media întregii serii poate fi calculată
ca o medie din mediile parţiale. Pentru dispersie, compunerea se face însă după o
schemă ceva mai elaborată, cunoscută ca regula adunării dispersiilor.
 Astfel, dacă o serie este compusă din m serii componente (grupuri), fiecare serie
componentă fiind de volum nj, j  1, m , atunci se pot calcula mediile seriilor
componente, x j , j  1, m şi dispersiile seriilor componente:

x  x 
nj
2
i j

 x2j  i 1
, j  1, m .
nj

16
REGULA ADUNARII DISPERSIILOR
 Dispersia generală (totala) a colectivităţii poate fi scrisă în funcţie de dispersiile
seriilor componente (grupurilor):

x 
m m


2
2
xj nj j  x nj
j 1 j 1
 x2  m
 m

nj 1
j n j 1
j
,

unde x este media întregii colectivităţi studiate.


 Media dispersiilor parţiale (de grupa) este
m

 2
xj nj
 x2  j 1
m

n j 1
j

Ea sintetizează împrăştierea valorilor din interiorul seriilor componente, împrăştierea


datorată altor factori, mai puţin celui după care s-a structurat colectivitatea în cele m
grupuri.
17
REGULA ADUNARII DISPERSIILOR

 Dispersia dintre grupe sintetizează împrăştierea valorilor de la media generală


doar ca urmare a acţiunii factorului după care s-au alcătuit grupurile, seriile
componente.
 Prin calculul mediilor parţiale, ceilalţi factori au fost balansaţi, echilibraţi. Singurul
factor care poate duce la diferenţe între mediile parţiale ale grupurilor este, deci,
factorul după care s-au alcătuit seriile componente. Cu cât seriile componente sunt
mai diferite între ele din punctul de vedere al acestui factor, cu atât mediile parţiale
vor diferi mai mult una faţă de alta şi faţă de media generală.

x 
m
2
j x nj
j 1
 x2  m

n
j 1
j

18
REGULA ADUNARII DISPERSIILOR
 Regula de adunare a dispersiilor este, deci:
2
     x2 , adica dispersia totală este egală cu media dispersiilor de
2
x x

grupă plus dispersia dintre grupe.


 Cu cât dispersia mediilor parţiale de la media generală, adică dispersia dintre
grupe  x2  , are o pondere mai mare în dispersia totală  x , cu atât acest lucru
2

înseamnă că factorul după care s-a împărţit colectivitatea în serii componente


explică mai mult variaţia variabilei studiate.

 Cu cât media dispersiilor parţiale  


2
x are o pondere mai mare în dispersia
totală  x , cu atât acest lucru semnifică o importanţă mai mare în variaţia
2

variabilei, a altor factori.

19
REGULA ADUNARII DISPERSIILOR

Putem spune, deci, că  x  explică măsura în care factorul de grupare


2

determină variaţia variabilei studiate şi putem calcula coeficientul de
determinaţie:
 2
R 2  x2
x
sau, în expresie procentuală, gradul de determinaţie:
 x2
2
R%  2 100
x
 Coeficientul de determinaţie arată cât din variabilitatea caracteristicii studiate
este determinată de factorul de grupare, ori de criteriul organizatoric ales.

20
REGULA ADUNARII DISPERSIILOR
Exemplu

O firmă ce comercializează produse cosmetice a realizat într-o lună de vară, prin cele 30 de
magazine de desfacere situate pe litoral, o vânzare medie de 400 milioane lei pe magazin, cu
o dispersie a vânzărilor de 2500; iar prin cele 20 de magazine din zona montană, o vânzare
medie de 200 milioane lei, cu o dispersie de 1600. Pentru a afla gradul în care zona de
amplasare a magazinelor determină variaţia vânzărilor, vom nota:

nL  30; x L  400 mil lei ; xL


2
 2500;
nM  20; x M  200 mil lei ; xM
2
 1600

şi vom calcula:
x L  n L  x M  nM 30  400  20  200 16000
x    320 mil lei , media totală determinandu-se
n L  nM 50 50
ca o medie a mediilor de grupă.

21
REGULA ADUNARII DISPERSIILOR
 xL
2
2nL   xM
2
nM 2500  30  1600  20 107000
  x    2140
nL  nM 50 50

 2

x L  2
 
 x n L  x M  x n M  400  320  2 30   200  320  2 20 480000
2

   9600
x
nL  nM 50 50

Dispersia totală se determină folosind regula de adunare a dispersiilor:


2
     x2  2140  9600  11740
2
x x

Aşadar
 x2 9600
R  2 100 
2
% 100  81,77% ,
x 11740
ceea ce înseamnă că o pondere de 81,77% din variaţia vânzărilor este explicată
prin zona de amplasare a magazinelor.

22
II. Indicatorii sintetici ai variabilităţii

Dispersia pentru o caracteristică alternativă, sistematizată sub forma:


Variantele caracteristicii Codificare numerică Nr. de unităţi statistice Frecvenţe relative
alternative (xi) (frecvenţe) (ni)
( ni* )
DA (stare favorabilă) 1 m
m
w
n
NU (stare nefavorabilă) 0 n-m nm
 1 w
n
TOTAL - n 1

va fi dată de:

 2

 1  w m   0  w  n  m 
2 2
2m
 1  w   w 2
nm
  1  w   w  w 2  1  w   w 1  w 
2
alt
n n n
unde w este media variabilei alternative, iar m este numărul unităţilor statistice la care întâlnim varianta
„favorabilă” a caracteristicii.

23
II. Indicatorii sintetici ai variabilităţii

3. Abaterea medie pătratică (sau abatere standard, sau deviaţie standard) este media pătratică
simplă sau ponderată a abaterilor individuale absolute faţă de medie:

 x  x
n
2
i
   2 i 1
 pentru o serie simplă: n

 x  x n
r

  x  x n
r 2 *
2
i i i i

  2  i 1
r
  
2 i 1
r
 pentru o serie de frecvenţe  ni sau n
i 1
*
i
i 1

24
II. Indicatorii sintetici ai variabilităţii
Observaţii:
 Deviaţia standard se măsoară în unităţi de măsură
concrete, aceeaşi unitate ca şi caracteristica pentru care
s-a calculat. De aceea, ca şi abaterea medie liniară, ea
nu poate fi utilizată pentru compararea variaţiei unor serii
care se referă la variabile diferite, ale căror unităţi de
măsură sunt diferite.
 Deviaţia standard, fiind calculată pe baza unei medii
pătratice, este, de regulă, mai mare decât abaterea
medie liniară, ce reprezintă o medie aritmetică. Evident,
acest lucru se întâmplă numai dacă ambii indicatori sunt
calculaţi pentru aceeaşi serie:  d
 Pentru o distribuţie cu tendinţă de normalitate, între
abaterea medie liniară şi cea pătratică există următoarea
4
relaţie: d  
5
25
II. Indicatorii sintetici ai variabilităţii

4. Coeficientul de variaţie este indicatorul sintetic al


variaţiei care măsoară în mod relativ şi sintetic gradul de
împrăştiere a valorilor faţă de tendinţa centrală a seriei.
 d
CV   100 CV '   100
x sau x
Avantaj: Nu depinde de unitatea de măsură a caracteristicii
urmărite, de aceea poate fi folosit pentru a compara
omogenitatea sau, dimpotrivă, eterogenitatea a două sau
mai multe serii, care se referă la variabile diferite.

26
Interpretare:
Dacă CV = 0 seria este perfect omogenă, toţi termenii
seriei sunt egali între ei şi sunt egali cu media: în acest caz
nu există variaţie.
Dacă CV  5%, seria este foarte omogenă, variaţia este
foarte mică, media este foarte reprezentativă, iar gruparea a
fost foarte bine executată (în cazul seriilor de distribuţie de
frecvenţe).
Dacă CV  35%, seria este omogenă.
Dacă CV  70 -75%, seria este eterogenă, variaţia este
foarte mare, media nu este reprezentativă, iar gruparea
trebuie refăcută. 27

S-ar putea să vă placă și