Sunteți pe pagina 1din 36

Analiza statistic a

variabilitii
Subiecte n discuie

1. Variabilitatea noiuni generale


2. Clasificarea indicatorilor variaiei
3. Caracteristica indicatorilor simpli ai
variaiei
4. Caracteristica indicatorilor sintetici
ai variaiei
GENERALITI
Caracterizarea unei colectiviti
statistice prin indicatorii tendinei
centrale ne ajut s depistm ceea ce
este comun, esenial n manifestarea
unui fenomen.
Orice colectivitate are o anumit
organizare intern, definit prin felul n
care valorile individuale se mprtie sau
se concentreaz n jurul valorii centrale.
GENERALITI
Astfel se poate ntmpla ca dou
colectiviti analizate dup aceeai
variabil s fie diferite prin tendina
central, prin dispersie sau prin ambele.
n felul acesta o valoare central poate fi
credibil, o alta nu.
Din acest motiv se impune ca analiza
prin indicatorii tendinei centrale s fie
completat cu indicatori ai variaiei i ai
formei de distribuie.
Variabilitatea

Reprezint abaterile
msurabile ale valorilor
individuale fa de o valoare
central (tipic).
Exemplu
Urmtoarele 2 serii:
{2, 2, 2, 10, 18, 18, 18}
{9, 9, 9, 9, 10, 11, 11, 11, 11}
au aceeai medie (10) i median (10)
dar dispersie diferit. Acest fapt este
evideniat de abaterile nregistrate
fa de medie sau median. Seria a
doua este mai omogen (nregistreaz
o variabilitate mai mic a valorilor
individuale), iar valorile sale tipice
sunt mai reprezentative.
Utilitatea indicatorilor variaiei
1) Analiza gradului de omogenitate a datelor
din care s-au calculat indicatorii tendinei
centrale i verificarea reprezentativitii
acestora;
2) Compararea n timp i (sau) spaiu a mai
multor serii de distribuie dup caracteristici
independente i (sau) interdependente;
3) Selectarea obiectiv a factorilor
semnificativi de influen dup care se
structureaz unitile unei colectiviti
statistice;
4) Separarea aciunii factorilor eseniali de
factorii ntmpltori;
5) Concentrarea valorilor individuale ale
caracteristicilor i deplasarea acestora fa
de valorile tipice etc.
Clasificarea indicatorilor variaiei
I. Dup numrul variantelor luate n calcul :
a. indicatori simpli (amplitudinea variaiei, abaterea
valorilor individuale de la medie, abaterea
intercuantilic)
b. indicatori sintetici (dispersia, abaterea medie
ptratic, coeficientul de variaie)
II. Dup modul de sistematizare a datelor primare:
a. indicatori ai variaiei calculai pentru serii de
distribuie unidimensionale
b. indicatori calculai pentru serii multidimensionale
III. Dup modul de calcul i exprimare:
a. indicatori ai variaiei calculai ca mrimi absolute
b. indicatori ai variaiei calculai ca mrimi relative
Indicatorii simpli ai variaiei
Amplitudinea variaiei (A)
- Se mai numete cmp de variaie sau
amplitudine absolut.
- Se determin prin diferena dintre cea mai
mare i cea mai mic valoare individual
nregistrat.
A = xmax - xmin
Amplitudinea relativ (A%) este
raportul procentual dintre

A x
x
A%x100 x 100
amplitudinea absolut i media

ma
x m
in
aritmetic a valorilor analizate.
Observaii referitor la amplitudine:

1) Se exprim n unitatea de msur a

caracteristicii studiate sau n procente n cazul

amplitudinii relative;

2) Amplitudinea nu ine seama de toate valorile, ci

numai de cele extreme, care adeseori sunt

aberante;

3) Este sensibil la valorile aberante, se consider

un indicator mai puin relevant, nepermind

cunoaterea structurii interne de variaie.


4) n cazul seriei de distribuie pe
intervale valorice calculul
amplitudinii este lipsit de sens;
5) Amplitudinea se utilizeaz
frecvent la alegerea numrului de
intervale de grupare a datelor i la
stabilirea mrimii intervalelor.
Abaterea valorilor individuale de la
medie (di).
Exprim cu cte uniti de msur sau de

ixix
d
cte ori (sau ct la sut) valoarea
caracteristicii individuale a colectivitii se
abate de la mrimea unui indicator al
tendinei centrale.

d xx
d 100 100
- n forma absolut:

% i
- n forma relativ:
x x i
Observaii:
1) valorile individuale se compar cu
valoarea lor medie, dar la fel de bine
poate fi utilizat pentru comparare
oricare alt indicator al tendinei centrale
(de ex. mediana);
2) n seriile de distribuie pe intervale
valorice pentru calculul abaterilor
individuale se iau n considerare centrele
de interval;
3) Abaterea valorilor individuale nu poate da
informaii dect la nivelul fiecrei variante
pierznd imaginea mprtierii pe ansamblul
distribuiei.
4) n analizele statistice se urmresc n mod
deosebit abaterile maxime pozitive (d+max) i
abaterile maxime negative (d-max) calculate n
cifre absolute i relative astfel:

d+max = xmax x sau d+max% = ( d+max/ x )


100

d-max = xmin x sau d -max% = ( d-max/


x ) 100
Abaterea intercuantilic
Se calculeaz ca diferen ntre
cuantila superioar i cuantila
inferioar de acelai ordin. Astfel
pentru r = 4 Q3 Q1 conine 50% din
numrul observaiilor; pentru r = 10
D9 D1 conine 80% din numrul
observaiilor.
Observaii:
1) Acest indicator se exprim n unitatea
de msur a caracteristicii;
2) Calculul abaterii intercuantilice, spre
deosebire de cel al amplitudinii, prezint
avantajul c evit valorile individuale
extreme sau aberante. Prin calculul
acestui indicator se pierd informaii dar
are ctig de cauz omogenitatea.
3) Ca i amplitudinea, abaterea
intercuantilic nu poate fi utilizat n
calcule algebrice.
Dispersia ( 2 )
Se calculeaz ca media aritmetic a
ptratelor abaterilor valorilor
individuale de la tendina central
Pentru o serie simpl formula dispersiei este:

2 = d2 n
Pentru o serie de distribuie pe frecvene formula
dispersiei este:

2 = d2f n
Observaii:
1) Se mai numete varian sau moment centrat
de ordin doi;

2) Este indicatorul care msoar variaia total a


unei caracteristici studiate datorat att
cauzelor eseniale ct i celor ntmpltoare;

3) Este un indicator cu valoare teoretic, util n


verificri de ipoteze statistice, o mrime
abstract folosit ca baz de calcul pentru
abaterea medie ptratic;
4) Nu are form concret de exprimare;

5) Cu ct valorile individuale ale


caracteristicii sunt mai apropiate ntre ele,
cu att mrimea dispersiei este mai mic.
La limit, dac toate valorile individuale
sunt egale ntre ele, dispersia este nul;

6) Dispersia, ca i media valorilor


individuale, este sensibil la prezena
valorilor extreme, aberante.
Abaterea medie ptratic ( )
Este calculat ca o medie ptratic din
abaterile valorilor individuale de la media
lor.
n seriile statistice simple:
= d2 n
n seriile de distribuie pe frecvene:
= d2f n
n cazul n care numrul de frecvene este mai
mic de 120, numitorul formulelor deviaiei
standard devine n-1.
Deviaia standard este cel mai util i mai
important indicator de dispersie. Ea pune
n eviden intervalul valoric, n jurul
mediei, n care s-au distribuit valorile
individuale ale fenomenului studiat.
O deviaie standard cu valoare mic, pune
n eviden strns o distribuie strns a
valorilor frecvenelor fenomenului
cercetat n jurul mediei, deci evideniaz
un eantion omogen.
O valoare mare a deviaiei standard
pune n eviden o dispersie mare a
valorilor individuale n jurul mediei,
dovedind c eantionul este
neomogen i ca atare rezultatele
obinute pe un aa eantion nu pot
fi generalizate.
n general, cu ct deviaia standard are
valori mai mari, cu att media
caracterizeaz mai puin fenomenul
cercetat.

Deviaia standard are o valoare


semnificativ atunci cnd eantionul pe
care am lucrat are o distribuie normal,
adic distribuia se face conform curbei
Gauss Laplace.
Pentru o distribuie normal unitile populaiei
statistice sunt repartizate n modul urmtor:
n cadrul unei asemenea distribuii:
ntre valoarea mediei i cea a
deviaiei standard se distribuie
68,28% din totalul valorilor unei
colectiviti statistice;
ntre medie i 2 valori ale sigmei se
distribuie 95,45% din valori, iar
ntre medie i 3 valori ale sigmei
sunt cuprinse 99,97% din valori.
De obicei, n practica, datorit variabilitii mari
a fenomenelor biologice, se consider ca
normale valorile cuprinse n intervalul

determinat de X 2 .

n cercetrile experimentale, care necesit o


exactitate mai mare, intervalul n care
considerm ca normale valorile frecvenelor
fenomenului cercetat este mai mare,

determinat de X 3 .
Abaterea medie ptratic:
1) Se mai numete abatere standard, deviaie
standard, abatere tip, standard deviation;
2) Este un indicator important n analiza
variaiei, se folosete la estimarea erorilor de
selecie; stabilirea eantionului; n calcule de
corelaie;
3) Se utilizeaz pentru elaborarea standardelor
de dezvoltare fizic, pentru delimitarea
strilor normale de cele patologice;
4) Exprim cu ct se abate n medie
fiecare valoare individual de la media
valorilor, evideniind influena
abaterilor mari;
5) Se calculeaz ca o medie ptratic
simpl sau ponderat a ptratelor
abaterilor valorilor individuale de la
media lor;
6) Se exprim n unitatea de msur n
care se exprim i caracteristica.
Coeficientul de variaie (Cv)
Din cauza faptului c deviaia standard este
exprimat n uniti de msur diferite,
specifice fenomenelor pe care le cercetm,
ea nu poate fi utilizat n aprecierea
comparativ a dou sau mai multe
eantioane, sub aspectul omogenitii, care
se exprim n uniti de msur diferite.
Exemplu

Dac am msurat nlimea i greutatea unui lot de


30 de elevi i am gsit pentru nlime o medie de
145 cm cu o deviaie standard de 5 cm, iar
pentru greutate am gsit o medie de 35 de kg cu o
deviaie de 3 kg, pe baza valorilor deviaiei
standard, exprimate n centimetri i kilograme, nu
putem aprecia sub ce aspect, al nlimii sau al
greutii, lotul de elevi este mai omogen, mai
uniform dezvoltat.
n aceast situaie se recurge la
coeficientul de variaie, care nu este
altceva dect deviaia standard
exprimat procentual.
Coeficientul de variaie este rapotul
procentual dintre valoarea deviaiei
standard i media aritmetic.
Formula de calcul:
Cv = ( X ) 100
Coeficientul de variaie arat ct la sut din
medie reprezint deviaia standard. Astfel,
exprimnd procentual pe , scpm de
influena unitii de msur, putnd compara
ntre ele, sub aspectul omogenitii, cte
eantioane dorim.
n exemplul anterior, coeficientul de variaie
pentru nlime este:

Cv = (5cm 145cm) 100 = 3,4%


Pentru greutate coeficientul de variaie este:

Cv = (3kg 35kg) 100 = 8,6%


Din datele obinute rezult, c lotul de
copii este mai omogen dezvoltat sub
aspectul nlimii, i nu sub aspectul
greutii, cum eram tentai s apreciem
pe baza valorilor deviaiei standard.
Cu ct valoarea procentual a
coeficientului de variaie este mai mic,
cu att eantionul cercetat este mai
omogen.
Se consider c:
un coeficient de variaie cu valori sub 10%
indic o variaie mic, deci o omogenitate care
ne permite s generalizm rezultatele, dac i
din punct de vedere numeric eantionul este
corespunztor.
un coeficient de variaie cu valori cuprinse
ntre 10% i 20% indic o variaie medie.
Eantionul este mai puin omogen ca n primul
caz, dar totui permite generalizarea
rezultatelor obinute, cu o anumit
probabilitate de a grei.
Valorile peste 20% ale
coeficientului de variaie indic o
variaie mare, o lips aproape total
de omogenitate, fapt ce contraindic
generalizarea rezultatelor obinute
pe un asemenea eantion.
nivelul de 35 - 40% este considerat
limit maxim admisibil pentru
coeficientul de variaie.

S-ar putea să vă placă și