Sunteți pe pagina 1din 4

MĂSURI ALE TENDINŢEI. CENTRALITATE. DISPERSIE. ASIMETRIE.

BOLTIRE
Tendinţa de centralitate
Pentru o serie de date statistice univariată, distribuţia de frecvenţe reprezintă şirul
numărul valorilor pe care variabila le ia.
În cadrul distribuţiilor de frecvenţe se poate observa gruparea valorilor în jurul unei
valori centrale. În acestă situaţie curba de distribuţie are forma unui clopot, fiind cunoscută
sub denumirea de curbă normală sau Gauss-Laplace.
Gruparea valorilor în jurul unei valori centrale se numeşte tendinţa de centralitate a
unei distribuţii de frecvenţe.
Măsura tendinţei de centralitate este dată de un set valori grupate în jurul valorii
centrale, reprezentativitatea acesteia fiind dată de gradul de concentrare al datelor în jurul
valorii centrale.
Principalii parametri ce măsuară tendinţa de centralitate sunt: media aritmetică, media
aritmetică modificată, media aritmetică ponderată, mediana, dominanta, media geometrică,
media pătratică.
A. Media aritmetică
Media aritmetică a unei serii de date statistice x1, x2, ...., xn asociată unui eșantion se
n

∑x i
obţine cu ajutorul formulei: X = .
i =1
n
În cazul utilizării claselor de frecvență media aritmetică se estimează cu formula:
m

∑ F ⋅C i i
Xcls = i =1
, unde Fi, Ci reprezintă frecvenţa respectiv centrul clasei i, n este talia
n
eşantionului, m este numărul claselor de frecvenţă.
Principalele proprietăţi ale mediei aritmetice sunt:
1. Media aritmetică depinde de toate valorile seriei statistice;
2. Valorile extreme conduc la deteriorarea reprezentativităţii mediei aritmetice ca măsură a
centralităţii;
Exemplu deteriorare medie aritmetică:
- într-un atac de gripă într-o clasă de elevi un eşantion de 7 elevi prezintă simptomele clinice
după un număr de: 3, 4, 3, 5, 6, 7, 7 zile. Deci media aritmetică este 5 zile. Dacă semnele
clinice ar fi apărut după: 3, 4, 3, 5, 6, 14, 28 zile atunci media aritmetică ar fi 10 zile adică
este afectată de valorile extreme.
n
3. Suma diferenţelor dintre media aritmetică şi valorile seriei este zero: ∑ (x i − X) = 0 ;
i =1
4. Schimbarea originii axei scalei variabilei seriei statistice conduce la modificarea mediei
aritmetice: X n = X + k , unde k este constanta de modificare a originii scalei;
5. Transformarea scalei variabilei seriei statistice conduce la modificarea mediei aritmetice:
X n = k ⋅ X , unde k este constanta de transformare a scalei;
6. Respectă principiul celor mai mici pătrate adică suma pătratelor abaterilor valorilor seriei
statistice faţă de media aritmetică este minimul sumei pătratelor abaterilor valorilor seriei faţă
n n
2
de orice valoare a axei reale: ∑ (x −X) i = min ∑ ( x i − X) 2 .
X∈R
i =1 i =1
B. Media aritmetică modificată
Atunci când media aritmetică este afectată de valorile extreme, în studiile statistice, se
procedează la eliminarea valorilor extreme obţinându-se astfel media aritmetică modificată. În
practică se elimină unui procent de valori extreme încadrat în intervalul 5-10%.
C. Media aritmetică ponderată
Media aritmetică ponderată este raportul între suma produselor valorilor seriei
n

∑x ⋅p i i
statistice şi a ponderilor acestora şi suma ponderilor: X P = i =1
n
. Ponderea pi a valorii xi
∑p
i =1
i

reprezintă importanţa valorii xi în raport cu celelalte valori ale seriei statistice.


D. Mediana
Mediana este valoarea pentru care jumătate din valorile seriei statistice sunt inferioare
sau egale, cealaltă jumătăte sunt superioare sau egale.
Înainte de calculul medianei seria de date se ordoneză. Formula de calcul este:
- pentru serii impare: Me = X ( n +1) / 2 ;
X n / 2 + X ( n / 2) +1
- pentru serii pare: Me = .
2
În cazul utilizării claselor de frecvenţă clasa mediană va conţine mediana.
Principalele proprietăţi ale medianei sunt:
1. Spre deosebire de media aritmetică, mediana nu este influenţată de valorile extreme;
2. Mediana este reprezentativă pentru seria de date numai dacă valorile se grupează în jurului
ei;
3. Respectă principiul conform căruia suma abaterilor absolute ale valorilor seriei statistice
faţă de mediană este minimul sumei abaterilor absolute ale valorilor seriei faţă de orice
n n
valoare a axei reale: ∑ x i −Me = min ∑ x i −X .
X∈R
i =1 i =1
Exemplu de mediană:
- pentru seria de date ataşată cantităţii de calciu exprimată în mg conţinută de 15 suplimente
nutritive este: 50, 75, 100, 100, 100, 125, 125, 250, 250, 250, 500, 500, 750, 750, 1000 media
aritmetică este 328.33, mediana este 250.
E. Dominanta
Dominanta sau modala unei serii statistice este valoarea cu frecvenţa de apariţie cea
mai mare.
În cazul utilizării claselor de frecvenţă modala este centrul clasei cu frecvenţa maximă.
O distribuţie de frecvenţe se numeşte unimodală dacă are un singur maxim şi
multimodală dacă are mai multe maxime.
F. Media geometrică
Media geometrică este o valoare medie ce indică tendinţa centrală a unei serii statistice
de valori pozitive, fiind exprimată prin formula: MG = n x1 ⋅ x 2 ... ⋅ x n .
Principalele proprietăţi ale mediei geometrice sunt:
1. Media geometrică depinde de toate valorile seriei statistice;
2. Valorile extreme influenţează într-o mică măsură media geometrică;
3. Media geometrică este inferioară mediei aritmetică.
G. Media pătratică
1 n 2
Media pătratică a valorilor unei serii statistice este: MP = ∑ xi .
n i =1
Dispersia
Dispersia reprezintă gradul de împrăştiere a valorilor unei serii statistice. Cu alte
cuvinte dispersia descrie variabilitatea sau fluctuaţia valorilor seriei statistice.
Măsurile de dispersie, în studiile statistice, joacă un important deoarece:
- oferă informaţii despre gradul de împrăştiere sau aglomerare a a valorilor unei serii
statistice;
- ajută la stabilirea reprezentativităţii măsurilor de centralitate;
- oferă informaţii utilizate în luarea deciziilor în cadrul statisticii inductive sau inferenţiale.
Principalele măsuri de dispersie sunt: amplitudinea, media deviaţiei, variaţia, abaterea
standard, coeficientul de variaţie.
A. Amplitudinea
Amplitudinea unei serii de date statistice reprezintă diferenţa între valoarea maximă şi
minimă: A=xmax-xmin.
Amplitudinea este puternic influenţată de valorile extreme, de aceea atunci când se
utilizează acestea se vor elimina.
B. Media dispersiei
Media disperiei ia în considerare toate valorile seriei şi media aritmetică fiind
n

∑x i −X
exprimată prin formula: MD X = .
i =1
n
Există şi o variantă a mediei dispersie ce are ca referinţă mediana seriei statistice:
n

∑x i − Me
MD Me = i =1
.
n
C. Variaţia
Variaţia este măsura dispersiei ce reprezintă media aritmetică a pătratelor abaterilor de
n

∑ (x i − X )2
la media seriei statistice, fiind exprimată prin formula: s 2 = i =1
.
n
În cazul utilizării claselor de frecvență, variaţia se estimează prin formula:
m

∑ F ⋅ (C i i − X )2
2
s cls = i =1
, unde Fi, Ci reprezintă frecvenţa respectiv centrul clasei i, n este talia
n
eşantionului, m este numărul claselor de frecvenţă.
În statistica inductivă se foloseşte variaţia de eşantionare exprimată prin formula:
n ⋅ s2
S2 = .
n−1
D. Abaterea standard
Abaterea standard sau ecartul tip este rădăcina patrată din variaţie: AS = S 2 şi are
aceeaşi unitate de măsură ca şi media şi datele seriei statistice.
E. Coeficientul de variaţie
Coeficientul de variaţie este egal cu raportul dintre abaterea standard şi media seriei:
AS
CV = .
X
Principalele caracteristici ale coeficientului de variaţie sunt:
- este o măsură relativă a dispersiei;
- este independent de unităţile de măsură şi se exprimă în procente;
- reprezintă procentul abaterii standard din valoarea mediei seriei;
- se foloseşte pentru a realiza comparaţii între dispersiile distribuţiilor de frecvenţă pentru serii
diferite.
Exemplu de utilizare a coeficientului de variaţie:
Se compară două serii de date statistice ale unui eşantion de pacienţi:
- o serie conţine greutăţile cu media de 67.5 Kg şi abaterea standard de 4.3 Kg;
- o serie conţine înălţimile cu media 1.66 m şi abaterea standard de 0.12 m.
4.3
Coeficientul de variaţie pentru greutate este: CVgreutate = = 6. 3% .
67.5
0.12
Coeficientul de variaţie pentru înălţime este: CVinaltime = = 7. 2% .
1.66
Se observă că înălţimea are o variabilitate mai mare decât greutatea.
F. Eroarea standard
În statistica inductivăîn estimarea intervalelor de încredere pentru medie se foloseşte
s
un indicator numit eroarea standard exprimat prin formula: ES = .
n
Asimetria
Asimetria pentru o serie de date statistice indică abaterea de la aspectul simetric şi
direcţia acesteia (pozitivă sau negativă).
Ca măsură a asimetriei se foloseşte momentul de ordinul trei al abaterii de la medie ce
reprezintă media aritmetică a cuburilor abaterilor valorilor seriei de la media aritmetică:
n

∑ (x i − X )3
M3 = i =1
.
n
Momentul de ordinul trei are dezavantajele:
- este exprimat în unităţile de măsură a datelor deci nu permite comparaţii între serii de date
diferite;
- depinde foarte mult de variaţia datelor din serie.
Pentru a elimina aceste dezavantaje momentul de ordinul trei se standardizează
obţinându-se o măsură mult îmbunătăţită. Standardizarea se obţine prin împărţirea la cubul
M3
abaterii standard: M 3std = .
AS 3
Boltirea
Boltirea sau excesul este o măsură a formei seriei de date, măsurând înălţimea
(boltirea) distribuţiei de date faţă de o distribuţie normală, este exprimată prin formula:
n

∑ (x i − X )4
B4 = i =1
−3.
n ⋅ AS4
Boltirea poate fi:
- zero pentru o distribuţie normală a seriei de date;
- pozitivă pentru o serie de date mai înaltă decât o distribuţie normală;
- negativă pentru o serie de date mai joasă decât o distribuţie normală.

S-ar putea să vă placă și