Sunteți pe pagina 1din 5

INDICATORI STATISTICI

Oricare ar fi forma repartiţiei empirice (fig. 2.1), aceasta se caracterizează prin:


tendinţa centrală (1) a valorilor (localizarea majorităţii lor), distanţa faţă de tendinţa
centrală (variaţia valorilor) (2) şi forma curbei (3). Caracterizarea repartiţiei se face prin
indicatori, care sunt mărimi ce oferă într-o formă precisă şi concentrată informaţii
referitoare la densitatea de repartiţie.

Fig 2.1 Componentele unei repartiţii

2.1 Indicatori ai tendinţei centrale

Tendinţa centrală prezintă o sinteză a modului cum se manifestă valorile


individuale [1].
Media (M) este un număr susceptibil de a rezuma ansamblul valorilor observate. Ea
exprimă nivelul atins de o variabilă numerică atunci când este uniform repartizată. Este
un indicator generalizator care arată tendinţa centrală de evoluţie, astfel încât este o
valoare reprezentativă. Se poate defini fie o media simplă (pentru valori negrupate) de
ordinul r fie o medie ponderată (pentru valori grupate cu frecvenţa f):
n

1 n
x f i i
M r
 (  xk ) r
M i 1
n
n k 1
f
i 1
i

Media ponderată se reduce la media simplă dacă frecvenţele valorilor sunt egale între ele.
Dacă:
r = - 1, rezultă medie armonică Mh; r = 0, rezultă medie geometrică Mg;
r = 1, rezultă medie aritmetică Ma ; r = 2, rezultă medie pătratică Mq .
Domenii de utilizare a diferitelor tipuri de medii:
 media armonică se calculează când rezultatul este invers proporţional cu
variabila.
Cons tan tă
Re zultatul 
Variabil ă
În muzică este media a două note date, obţinute cu coarde de lungime diferite. Nota
medie este dată de o coardă cu lungimea media armonică a celor două coarde.

Nr. vibraţii = 1 / lungimea corzii


 media geometrică se calculează pentru a determina ritmul de variaţie a unui
fenomen; se aplică când rezultatul final se obţine prin produsul unor factori.
 media aritmetică se calculează când datele sunt apropiate sau oscilează în jurul
unor valori; se aplică când rezultatul final se obţine prin suma unor factori.
 media pătratică se calculează când datele se prezintă ca o succesiune de valori
pozitive sau negative.
Mediana (Me) este valoarea centrală dintr-un şir, faţă de care frecvenţa valorilor
mai mici decât ea este egală cu frecvenţa valorilor mai mari decât ea. Se calculează diferit
în cazul unui şir par de termeni sau impar.
x n   x n 
   1  M e  x n 1 
2 2 
Me   
 2 
2
Astfel mediana este acea valoare a unei serii statistice de numere care o împarte
în două grupe egale ca număr de valori (în raport cu care variabilele au aceeaşi
probabilitate de a fi inferioare sau superioare). Este valoarea care ocupă locul central.
Cuantila împarte intervalul de valori ale unei variabile, ordonate crescător sau
descrescător într-un număr de k părţi egale. Dacă k = 2 se obţine mediana, dacă k = 4 se
obtin trei cuartile, dacă k = 10 se obţin nouă decile, dacă k = 100 se obţin 99 centile.
Modulul (Mo) este valoarea care are frecvenţa cea mai mare din şirul statistic
analizat, deci, este valoarea dominantă, valoarea corespunzătoare frecvenţei maxime.
Pentru aceasta trebuie ca distribuţia datelor să fie aproape normală. Modulul este o
estimare brută a tendinţei centrale şi se foloseşte la o apreciere sumară.

Mo = M - 3(M - Me),

2.2 Indicatori ai variaţiei

Aceşti indicatori arată distanţa faţă de tendinţă centrală (împrăştierea valorilor).


Variaţia exprimă măsura în care media este reprezentativă pentru o colectivitate de date.
O valoare mică a împrăştierii înseamnă o concentrare a valorilor in jurul mediei.
Indicatorii folosiţi sunt [1]:
Amplitudinea (R) este intervalul de variaţie a valorilor şi reprezintă diferenţa
dintre valoarea cea mai mare şi valoarea cea mai mică a unei variabile. Este sensibilă
când sunt valori aberante.
R = Xmax - Xmin
Anvergura este intervalul dintre centilele 95 şi 5. Spre deosebire de amplitudine,
ea elimină valorile aberante.
Abaterea medie absolută – este media abaterilor faţă de medie M (sau mediană
Me, sau modul Mo).

Ca valoare dMe < dM


Dispersia (D) este indicatorul împrăştierii valorilor variabilei aleatoare. Este
media pătratelor abaterilor de la tendinţa lor centrală. Cu cât valorile individuale sunt mai
apropiate între ele, cu atât dispersia este mai mică. Dispersia nu are unitate de măsură.
Dacă x1 = x2 = …. Xn atunci D = 0

DM   2

 x i M
2

sau DMe   2

 x i  Me 
2

n n
Ca valoare DMe < dM
Abaterea medie patratică este o măsură a depărtării faţă de medie. Arată
reprezentativitatea mediei, omogenitatea valorilor individuale.
 x M
2
i
 
n
Coeficientul de variaţie (CV) indică eterogenitatea populaţiei statistice. El arată
în ce raport se găseşte împrăştierea unei variabile faţă nivelul ei mediu. Este o măsură a
împrăştierii relative şi indică dacă abaterea este acceptabilă.

CV  .100
M
Abaterea este acceptabilă dacă CV < 3%. Când CV = 0 seria este mai omogenă.

2.3 Indicatori ai formei curbei

Momentul (m) [1] de ordinul k în raport cu o valoare A este (ca şi în mecanică)


valoarea unei mărimi în raport cu alta:
1 n
m k    xi  A
k

n i 1
Când k = 1 şi A = 0, m1 este media aritmetică; când k = 2 şi xo = M, m2 este dispersia.

Coeficientul de asimetrie (Pearson) (β1) arată gradul de asimetrie a curbei


frecvenţelor faţă de media aritmetică (fig. 2.5) [2]:
M  M0 m3 2
β1  sau β1  ( )
 m2

unde: M – media, M 0 - modul,  - abaterea medie pătratică standard.


Dacă β1 < 0 asimetria este la stânga ;
β1 = 0 distribuţia este simetrică ;
β1 > 0 asimetria este la dreapta (extindere a frecventelor spre dreapta).

f(x) f(x)
f(x)

x x x
asimetrie de dreapta asimetrie de stânga simetrie
1 > 0 1 < 0 1 = 0

Fig. 2.5. Asimetria curbelor de frecvenţă

Coeficientul de boltire (β2) arată gradul de înclinaţie a pantei curbei ce


reprezintă densitatea de repartiţie în vecinătatea modulului:
m
2  4
m2
La distribuţia normală  2  3
- dacă  2  3 curbă este aplatizată;
- dacă  2  3 curbă este ascuţită.
Boltirea arată ascuţirea sau aplatizarea unei repartiţii în comparaţie cu repartiţia
normală.
Excesul (E) arată turtirea curbei frecvenţelor: E = β2 – 3. În funcţie de valorile
lui E, curba poate fi (fig. 2.6) [2] platicurtică (a), mezocurtică (b) şi leptocurtică (c).
Curba leptocurtică este o repartiţie normală cu vârful mult mai înalt, deci cu frecvenţă
mai mare a valorilor în jurul mediei. Curba platicurtică este o repartiţie în care valorile
au aproape aceeaşi frecvenţă de apariţie (curba este aplatizată).
f(x) f(x) f(x)

x x x
aplatisată aplatisare medie ascuţită
(platicurtică) (mezocurtică) (leptocurtică)
1 <3; 1
3; 1 >3;

Fig. 2.6. Tipuri de aplatizări

Normarea reprezintă o transformare a variabilei aleatoare x în z (fig. 2.7).


Deoarece repartiţia normală f(x) este simetrică, se poate translata graficul pentru a fi
simetric faţă de axa f(z).
Normarea este necesară pentru a compara două variabile x şi y. Nu este suficient
să se compare doar mediile. Trebuie să se compare simultan mediile si variaţiile. Astfel
este neceasr să apară variabilele zx şi zy

z
Fig 2.7 Normarea variabilei

xx
Noua variabilă este z 

Este folosită pentru calculul probabilităţii :
x Z2

p (X < x) = F(x) = F(z) = 0,5+ e

d
dz = 0,5 + ø(z)

unde ø(z) este funcţia Laplace.

S-ar putea să vă placă și