Sunteți pe pagina 1din 36

Analiza statistic a

variabilitii

Subiecte n discuie
1.
2.
3.
4.

Variabilitatea noiuni generale


Clasificarea indicatorilor variaiei
Caracteristica indicatorilor simpli ai
variaiei
Caracteristica indicatorilor sintetici
ai variaiei

GENERALITI

Caracterizarea unei colectiviti


statistice prin indicatorii tendinei
centrale ne ajut s depistm ceea ce
este comun, esenial n manifestarea
unui fenomen.
Orice colectivitate are o anumit
organizare intern, definit prin felul n
care valorile individuale se mprtie sau
se concentreaz n jurul valorii centrale.

GENERALITI
Astfel se poate ntmpla ca dou
colectiviti analizate dup aceeai
variabil s fie diferite prin tendina
central, prin dispersie sau prin ambele.
n felul acesta o valoare central poate fi
credibil, o alta nu.
Din acest motiv se impune ca analiza
prin indicatorii tendinei centrale s fie
completat cu indicatori ai variaiei i ai
formei de distribuie.

Variabilitatea
Reprezint

abaterile
msurabile ale valorilor
individuale fa de o valoare
central (tipic).

Exemplu
Urmtoarele 2 serii:
{2, 2, 2, 10, 18, 18, 18}
{9, 9, 9, 9, 10, 11, 11, 11, 11}
au aceeai medie (10) i median (10)
dar dispersie diferit. Acest fapt este
evideniat de abaterile nregistrate
fa de medie sau median. Seria a
doua este mai omogen (nregistreaz
o variabilitate mai mic a valorilor
individuale), iar valorile sale tipice
sunt mai reprezentative.

Utilitatea indicatorilor variaiei


1) Analiza gradului de omogenitate a datelor
din care s-au calculat indicatorii tendinei
centrale i verificarea reprezentativitii
acestora;
2) Compararea n timp i (sau) spaiu a mai
multor serii de distribuie dup caracteristici
independente i (sau) interdependente;
3)
Selectarea
obiectiv
a
factorilor
semnificativi de influen dup care se
structureaz
unitile
unei
colectiviti
statistice;
4) Separarea aciunii factorilor eseniali de
factorii ntmpltori;
5) Concentrarea valorilor individuale ale
caracteristicilor i deplasarea acestora fa
de valorile tipice etc.

Clasificarea indicatorilor variaiei


I.

Dup numrul variantelor luate n calcul :


a.
indicatori simpli (amplitudinea variaiei, abaterea
valorilor individuale de la medie, abaterea
intercuantilic)
b.
indicatori sintetici (dispersia, abaterea medie
ptratic, coeficientul de variaie)

II.

Dup modul de sistematizare a datelor primare:


a.
indicatori ai variaiei calculai pentru serii de
distribuie unidimensionale
b.
indicatori calculai pentru serii multidimensionale

III.

Dup modul de calcul i exprimare:


a.
indicatori ai variaiei calculai ca mrimi absolute
b.
indicatori ai variaiei calculai ca mrimi relative

Indicatorii simpli ai variaiei


Amplitudinea variaiei (A)
-

Se mai numete cmp de variaie sau

amplitudine absolut.
- Se determin prin diferena dintre cea mai
mare i cea mai mic valoare individual
nregistrat.
A = xmax - xmin

Amplitudinea
raportul

relativ

(A%)

procentual

este
dintre

x
A
m
a
x
m
i
n
A%x100 x 100

amplitudinea

absolut

aritmetic a valorilor analizate.

media

Observaii referitor la amplitudine:


1)

Se

exprim

unitatea

de

msur

caracteristicii studiate sau n procente n cazul


amplitudinii relative;
2) Amplitudinea nu ine seama de toate valorile, ci
numai de cele extreme, care adeseori sunt
aberante;
3) Este sensibil la valorile aberante, se consider
un indicator mai puin relevant, nepermind
cunoaterea structurii interne de variaie.

4) n cazul seriei de distribuie pe


intervale

valorice

calculul

amplitudinii este lipsit de sens;


5)

Amplitudinea

se

utilizeaz

frecvent la alegerea numrului de


intervale de grupare a datelor i la
stabilirea mrimii intervalelor.

Abaterea valorilor individuale de la


medie (di).
Exprim cu cte uniti de msur sau de
cte

ori

d
ixix
d
x

x
d 100 100
(sau

ct

la

sut)

valoarea

caracteristicii individuale a colectivitii se


abate de la mrimea unui indicator al
tendinei centrale.

- n forma absolut:

x x

i
%

- n forma relativ:

Observaii:
1) valorile individuale se compar cu
valoarea lor medie, dar la fel de bine
poate

fi

utilizat

pentru

comparare

oricare alt indicator al tendinei centrale


(de ex. mediana);
2) n seriile de distribuie pe intervale
valorice

pentru

calculul

abaterilor

individuale se iau n considerare centrele


de interval;

3) Abaterea valorilor individuale nu poate da


informaii dect la nivelul fiecrei variante
pierznd imaginea mprtierii pe ansamblul
distribuiei.
4) n analizele statistice se urmresc n mod
deosebit abaterile maxime pozitive (d+max) i
abaterile maxime negative (d-max) calculate n
cifre absolute i relative astfel:
d+max = xmax x

sau

d+max% = ( d+max/ x )

100
d-max = xmin x
x ) 100

sau

d -max% = ( d-max/

Abaterea intercuantilic
Se

calculeaz

cuantila

ca

diferen

superioar

ntre

cuantila

inferioar de acelai ordin. Astfel


pentru r = 4 Q3 Q1 conine 50% din
numrul observaiilor; pentru r = 10
D9 D1 conine 80% din numrul
observaiilor.

Observaii:
1) Acest indicator se exprim n unitatea
de msur a caracteristicii;
2) Calculul abaterii intercuantilice, spre
deosebire de cel al amplitudinii, prezint
avantajul c evit valorile individuale
extreme sau aberante. Prin calculul
acestui indicator se pierd informaii dar
are ctig de cauz omogenitatea.
3)
Ca
i
amplitudinea,
abaterea
intercuantilic nu poate fi utilizat n
calcule algebrice.

Dispersia ( 2 )
Se calculeaz ca media aritmetic a
ptratelor

abaterilor

valorilor

individuale de la tendina central


Pentru o serie simpl formula dispersiei este:

2 = d2 n
Pentru o serie de distribuie pe frecvene formula
dispersiei este:

2 = d2f n

Observaii:
1) Se mai numete varian sau moment centrat
de ordin doi;
2) Este indicatorul care msoar variaia total a
unei

caracteristici

studiate

datorat

att

cauzelor eseniale ct i celor ntmpltoare;


3) Este un indicator cu valoare teoretic, util n
verificri

de

ipoteze

statistice,

mrime

abstract folosit ca baz de calcul pentru


abaterea medie ptratic;

4) Nu are form concret de exprimare;


5)

Cu

ct

valorile

individuale

ale

caracteristicii sunt mai apropiate ntre ele,


cu att mrimea dispersiei este mai mic.
La limit, dac toate valorile individuale
sunt egale ntre ele, dispersia este nul;
6)

Dispersia,

ca

media

valorilor

individuale, este sensibil la prezena


valorilor extreme, aberante.

Abaterea medie ptratic ( )

Este calculat ca o medie ptratic din


abaterile valorilor individuale de la media
lor.
n seriile statistice simple:

= d2 n
n seriile de distribuie pe frecvene:

= d2f n
n cazul n care numrul de frecvene este mai
mic de 120, numitorul formulelor deviaiei
standard devine n-1.

Deviaia standard este cel mai util i mai


important indicator de dispersie. Ea pune
n eviden intervalul valoric, n jurul
mediei, n care s-au distribuit valorile
individuale ale fenomenului studiat.
O deviaie standard cu valoare mic, pune
n eviden strns o distribuie strns a
valorilor

frecvenelor

fenomenului

cercetat n jurul mediei, deci evideniaz


un eantion omogen.

O valoare mare a deviaiei standard


pune n eviden o dispersie mare a
valorilor individuale n jurul mediei,
dovedind

eantionul

este

neomogen i ca atare rezultatele


obinute pe un aa eantion nu pot
fi generalizate.

n general, cu ct deviaia standard are


valori

mai

mari,

caracterizeaz

mai

cu

att

puin

media

fenomenul

cercetat.
Deviaia

standard

are

valoare

semnificativ atunci cnd eantionul pe


care am lucrat are o distribuie normal,
adic distribuia se face conform curbei
Gauss Laplace.

Pentru o distribuie normal unitile populaiei


statistice sunt repartizate n modul urmtor:

n cadrul unei asemenea distribuii:

ntre valoarea mediei i cea a

deviaiei

standard

se

distribuie

68,28% din totalul valorilor unei


colectiviti statistice;
ntre

medie i 2 valori ale sigmei se

distribuie 95,45% din valori, iar


ntre

medie i 3 valori ale sigmei

sunt cuprinse 99,97% din valori.

De obicei, n practica, datorit variabilitii mari


a

fenomenelor

normale

biologice,

valorile

se

cuprinse

consider
n

ca

intervalul

determinat de X 2 .
n cercetrile experimentale, care necesit o
exactitate

mai

mare,

intervalul

care

considerm ca normale valorile frecvenelor


fenomenului

cercetat

determinat de X 3 .

este

mai

mare,

Abaterea medie ptratic:


1) Se mai numete abatere standard, deviaie
standard, abatere tip, standard deviation;
2)

Este

un

indicator

important

analiza

variaiei, se folosete la estimarea erorilor de


selecie; stabilirea eantionului; n calcule de
corelaie;
3) Se utilizeaz pentru elaborarea standardelor
de

dezvoltare

fizic,

pentru

delimitarea

strilor normale de cele patologice;

4) Exprim cu ct se abate n medie


fiecare valoare individual de la media
valorilor,
evideniind
abaterilor mari;

influena

5) Se calculeaz ca o medie ptratic


simpl sau ponderat a ptratelor
abaterilor valorilor individuale de la
media lor;
6) Se exprim n unitatea de msur n
care se exprim i caracteristica.

Coeficientul de variaie (Cv)


Din cauza faptului c deviaia standard este
exprimat n uniti de msur diferite,
specifice fenomenelor pe care le cercetm,
ea

nu

poate

comparativ

fi
a

utilizat
dou

sau

aprecierea
mai

multe

eantioane, sub aspectul omogenitii, care


se exprim n uniti de msur diferite.

Exemplu
Dac am msurat nlimea i greutatea unui lot de
30 de elevi i am gsit pentru nlime o medie de
145 cm cu o deviaie standard de 5 cm, iar
pentru greutate am gsit o medie de 35 de kg cu o
deviaie de 3 kg, pe baza valorilor deviaiei
standard, exprimate n centimetri i kilograme, nu
putem aprecia sub ce aspect, al nlimii sau al
greutii, lotul de elevi este mai omogen, mai
uniform dezvoltat.

n aceast situaie se recurge la


coeficientul de variaie, care nu este
altceva dect deviaia standard
exprimat procentual.
Coeficientul de variaie este rapotul
procentual dintre valoarea deviaiei
standard i media aritmetic.
Formula de calcul:
Cv = ( X ) 100

Coeficientul de variaie arat ct la sut din


medie reprezint deviaia standard. Astfel,
exprimnd

procentual

pe

scpm

de

influena unitii de msur, putnd compara


ntre ele, sub aspectul omogenitii, cte
eantioane dorim.
n exemplul anterior, coeficientul de variaie
pentru nlime este:
Cv = (5cm 145cm) 100 = 3,4%
Pentru greutate coeficientul de variaie este:
Cv = (3kg 35kg) 100 = 8,6%

Din datele obinute rezult, c lotul de


copii este mai omogen dezvoltat sub
aspectul nlimii, i nu sub aspectul
greutii, cum eram tentai s apreciem
pe baza valorilor deviaiei standard.
Cu

ct

valoarea

procentual

coeficientului de variaie este mai mic,


cu att eantionul cercetat este mai
omogen.

Se consider c:

un coeficient de variaie cu valori sub 10%


indic o variaie mic, deci o omogenitate care
ne permite s generalizm rezultatele, dac i
din punct de vedere numeric eantionul este
corespunztor.

un coeficient de variaie cu valori cuprinse


ntre 10% i 20% indic o variaie medie.
Eantionul este mai puin omogen ca n primul
caz,

dar

rezultatelor

totui

permite

obinute,

probabilitate de a grei.

cu

generalizarea
o

anumit

Valorile
peste

20%
ale
coeficientului de variaie indic o
variaie mare, o lips aproape total
de omogenitate, fapt ce contraindic
generalizarea rezultatelor obinute
pe un asemenea eantion.

nivelul

de 35 - 40% este considerat


limit maxim admisibil pentru
coeficientul de variaie.

S-ar putea să vă placă și