Sunteți pe pagina 1din 19

CURS 7-8

PARAMETRII DE DISPERSIE

1. Introducere

2. Parametrii de dispersie absolută


2.1. Întinderea
2.2. Quantilele
2.3. Ecartul absolut mediu/median (abaterea absolută la medie /la
mediană)
2.4. Ecartul-tip (abaterea standard)

3. Parametrii de dispersie absolută şi valorile centrale

4. Parametrii de distribuţie relativă


1. Introducere
Rezumatul unei distribuţii dat de o valoare centrală nu informează asupra dispersiei valorilor în jurul
respectivei valori centrale, adică asupra tendinţei acestora de a se concentra sau de a se dispersa în
jurul acesteia (amintiți-vă de factorii structurali și de cei conjuncturali!...) .

Exemplu : Dacă se consideră doi profesori X şi Y însărcinaţi să evalueze pe o scară de la 0 la 20 activitatea a 9


studenţi, se poate aprecia maniera lor de notare doar analizând media, mediana sau modul notelor lor?

Notele Notele
Studentul
profesorului X profesorului Y
Dacă ne-am limita doar la valorile centrale, am putea
A 7 0 ajunge la concluzia că respectivii profesori X şi Y notează
B 8 5 exact în acelaşi fel, deoarece media = mediana = modul
= 10 însă analiza vizuală a tabelului ne face să ne îndoim
C 9 9 de această concluzie fiindcă este evident că există
D 10 10 diferenţe între stilurile lor de notare. Această diferenţă se
explică prin aceea că profesorul X "concentrează" notele
E 10 10 în jurul lui 10 pe când profesorul Y "dispersează" mai
F 10 10 mult notele în jurul valorii de referinţă.
G 11 11 Prin urmare este util să adăugăm valorilor centrale un
parametru de dispersie absolută care ne oferă un
H 12 15 ordin de mărime a ecartului (a depărtării) valorilor între
I 13 20 ele sau, ceea ce înseamnă acelaşi lucru, a ecartului
valorilor la valoarea centrală de referinţă.
modul 10 10
media 10 10
mediana 10 10

Se numeşte dispersie statistică tendinţa pe care o au valorile distribuţiei unui caracter de a se aşeza de o parte
şi de alta a unei valori centrale şi/sau tendinţa să se îndepărteze unele de altele. Este evident că această
observaţie, însoţită de calculele aferente, nu are sens decât pentru caracterele cantitative .
Măsurarea dispersiei se face fie cu ajutorul parametrilor de dispersie absolută (în unitatea de măsură a
caracterului) fie cu ajutorul parametrilor de dispersie relativă (sub forma unui număr fără dimensiune).
2. Parametrii de distribuţie absolută
Pametrii de dispersie absolută indică cu cât se îndepărtează în general valorile unei distribuţii faţă de
valoarea de referinţă. Un parametru de distribuţie absolută este întotdeauna exprimat în unităţile de
măsură ale variabilei considerate. Astfel, dacă se studiază densi tatea populaţiei europene, unitatea de
măsură a dispersiei acestui caracter se va exprima în loc/km ².
Cei patru parametri de distribuţie absolută sunt: întinderea, intervalul interquartilic, ecartul absolut
mediu (abaterea absolută medie) şi ecartul tip (abaterea standard) .

2.1. Întinderea (amplitudinea) simbol (omega)


Întinderea unei distribuţii este egală cu diferenţa dintre cea mai mare şi cea mai mică valoare a
distribuţiei: = Xmax-Xmin

Exemplu : Notele profesorilor X şi Y :


- Întinderea notelor date de profesorul X este de 13-7=6, ceea ce înseamnă că ecartul maxim între două
note ale profesorului X este de 6.
- Întinderea notelor date de profesorul Y este de (20-0)=20 ceea ce înseamnă că ecartul maxim între
două note ale profesorului Y este de 20.
Prin urmare, dispersia notelor profesorului Y este mult mai mare decât cea a notelor profesorului X.
Inconvenientul întinderii este acela că acest parametru depinde numai de cele două valori extreme ale
distribuţiei: el indică diferenţa maximă între cele două valori dar nu şi diferenţa tipică, specifică
distribuţiei în ansamblul său.
 
Exemplu : Salariile din întreprinderea “Egalitatea”
Întinderea distribuţiei salariilor din întreprindere este de (100 000 - 1300) = 98 700 RO$, valoare care pare
considerabilă. Dacă însă nu considerăm salariile celor trei directori, amplitudinea salariilor nu va mai fi decât
de (5500-1300)=4200 RO$. Astfel, excluzând cei trei directori, se observă că salariaţii întreprinderii au salarii
foarte puţin diferenţiate.

Concluzie : întinderea este un parametru de dispersie absolută simplu de calculat însă este foarte fragil
deoarece nu depinde decât de două valori ale distribuţiei. Acest parametru îşi pierde orice valoare atunci când
o distribuţie prezintă valori excepţionale. Întinderea exprimă doar ordinul de mărime al intervalului de variaţie
a caracteristicii, presupunând că în interiorul acestuia valorile ar fi repartizate uniform (ceea ce, de regulă, nu
este adevărat).

Întinderea se utilizează totuşi atunci când valorile extreme au o semnificaţie deosebită pentru fenomenul
studiat - de ex. amplitudinea termică absolută, în caracterizarea gradului de continentalism climatic al unei
regiuni.
2.2. Quantilele şi intervalul interquartilic

Pentru a elimina inconvenientele întinderii se pot îndepărta valorile extreme şi astfel se calculează intervalul pe
valorile rămase. Acesta este principiul metodei quantilelor. Se numesc quantile bornele (limitele) claselor
rezultate printr-o împărţire în clase efectuată pe principiul efectivelor egale.

Atenţie: metoda quantilelor conduce la efective egale şi nu la amplitudini egale!


 
Dacă valoarea centrală folosită este mediana, atunci dispersia poate fi exprimată sub forma abaterilor cuartile.
Quartilele sunt parametri analogi medianei, dar care împart şirul de valori în 4 părţi egale, fiecare incluzând 25%
din valorile şirului. De-a lungul unui şir ordonat crescător vom identifica, deci, un număr de 3 cuartile, notate de
regulă cu Q1, Q2 (= Me) şi Q3. Prin urmare quartilele, notate Q1, Q2 şi Q3, sunt trei valori care permit
decuparea distribuţiei în patru clase de efective egale:

Clase frecvenţa simplă

[Xmin ; Q1 [ 25 %

[Q1 ; Q2 [ 25 %

[Q2 ; Q3 [ 25 %

[Q3 ; Xmax ] 25 %

- Intervalul interquartilic (Q3-Q1) este un parametru de dispersie absolută care corespunde îndinderii
distribuţiei după îndepărtarea a 25% dintre valorile cele mai mici şi a 25% dintre valorile cele mai mari, de unde
rezultă că în intervalul interquartilic sunt concentrate 50% dintre observaţii.
Cu ajutorul cuartilelor şi a intervalului interquartilic se pot calcula doi indici de dispersie:

- abaterea cuartilă (intercuartilă), care reprezintă diferenţa, în valoare absolută, dintre a treia şi prima
cuartilă (Q3-Q1). Se obţine astfel o imagine asupra dispersiei comparând abaterea intercuartilă cu
amplitudinea totală (ω);

- abaterea semiintercuartilă Q3-Q1/2, care se defineşte ca „media probabilă a abaterilor de la mediană” -


altfel spus, jumătate din modalităţile caracteristicii diferă în medie de mediană prin mai mult decât această
valoare, iar cealaltă jumătate prin mai puţin.

Având, ca şi mediana, avantajul că nu sunt influenţate de valorile extreme ale şirului, abaterile cuartile
păstrează şi dezavantajul acesteia: nu iau în considerare toate valorile, deci nu exprimă întreaga distribuţie
statistică.

Atunci când se doreşte o analiză mai detaliată a modului cum sunt repartizate valorile în interiorul
intervalului total de variaţie, şirul poate fi împărţit în mai mult de 4 părţi egale. Valorile care delimitează
aceste subşiruri sunt cunoscute sub denumirea generică de cuantile. Exemple de cuantile: mediană,
cuartile, quintile, decile (împart şirul iniţial în 10 părţi egale), centile (împart şirul în 100 de părţi) etc.
Determinarea quartilelor

Prima metodă de determinare a quartilelor (utilizarea medianei)

A doua quartilă Q2 a unei distribuţii X este egală cu mediana Me(X)


acestei distribuţii, care se determină conform metodelor expuse în cursul
anterior. După aflarea medianei, se obţin două semi-distribuţii X' şi X"
care corespund valorilor superioare şi respectiv inferioare medianei.
Este evident că Q1 est egală cu mediana distribuţiei X' şi că Q3 est egală Notele Notele
cu mediana distribuţiei X", valori ce pot fi obţinute fără dificultate. Studentul profesorului profesorului
Singura problemă a acestei metode este stabilirea celor două X Y
semidistribuţii X' şi X" atunci când numărul de observaţii este impar. A 7 0
Deoarece în acest caz mediana corespunde unei valori a distribuţiei X,
trebuie mai întâi să fie plasată în fiecare dintre cele două semidistribuţii şi B 8 5
abia apoi se găsesc Q1 şi Q3. C 9 9

Exemplu : Notele profesorilor X şi Y: D 10 10


E 10 10
Pentru profesorul X se calculează mediana care este valoarea celui de-al
cincilea element al distribuţiei (10) şi apoi se construiesc cele două F 10 10
semidistribuţii X'={7,8,9,10,10} şi X"={10,10,11,12,13} care corespund G 11 11
celor 50% valori mai mici şi celor 50% valori mai mari. Q1 este egală
medianei semidistribuţiei X', respectiv 9 iar Q3 est egală medianei H 12 15
semidistribuţiei X", respectiv 11. Intervalul interquartilic este prin urmare I 13 20
egal cu Q3-Q1=2, de unde se deduce că 50 % dintre studenţi au notele
concentrate între 9 şi 11, adică pe intervalul interquartilic de 2 puncte. modul 10 10
media 10 10
Acelaşi calcul efectuat asupra notelor profesorului Y conduce la aceeaşi
concluzie deoarece Q1=9, Q3=11 iar (Q3-Q1)=2. Pentru criteriul reţinut, mediana 10 10
dispersia celor două distribuţii X şi Y este prin urmare aceeaşi, de vreme
ce şi pentru profesorul X şi pentru profesorul Y constatăm că 50% dintre
note sunt concentrate pe un interval de 2 puncte.
A doua metodă de determinare a quartilelor (utilizarea curbelor frecvenţelor cumulate)

Metoda, bazată pe folosirea în special a frecvenţelor cumulate ascendent, poate fi utilizată nu numai pentru
quartile ci se poate aplica în cazul oricărei quantile.
Prin definiţie, frecvenţele cumulate corespunzătoare quartilelor sunt următoarele:
Fasc(Q1) = 25%
Fasc(Q2) = 50 % (mediana)
Fasc(Q3) = 75 %
Ajunge să citim pe curba frecvenţelor cumulate valorile aproximative ce corespund quartilelor Q1, Q2 şi Q3
sau să se efectueze o interpolare liniară între bornele (limitele) împărţirii în clase pentru a se afla valorile
exacte.

Exemplu : Salariile din întreprinderea “Egalitatea”

După stabilirea curbei frecvenţelor cumulate a salariilor întreprinderii plecând de la tabelul elementar, se
determină grafic valorile Q1=2000 RO$, Q2=2800 RO$ şi Q3=4750 RO$.

Trebuie să precizăm faptul că dacă se pleacă de la tabelul împărţirii pe clase de salarii precizia aflării quartilelor va fi redusă din
cauza pierderii de informaţie (nu se cunoaşte repartiţia salariaţilor în cadrul claselor) şi din cauza faptului că interpolarea liniară
poate supra- sau subestima valoarea reală a parametrilor (am obţine de exemplu Q3= 40 000 RO$).

Concluzia care se desprinde este aceea că, după îndepărtarea a 25% din salariile cele mai mici (sub 2 000) şi
a 25% din salariile cele mai mari (peste 4 750), dispersia salariilor din întreprindere este în general redusă
deoarece salariile sunt concentrate pe un interval de 2 750 RO$ (Q3-Q1).
 
După cum am mai amintit, deşi quartilele sunt cele mai utilizate, se pot folosi şi alte decupaje în efective
egale:

- Quintilele împart distribuţia în 6 clase de efective egale şi sunt foarte des utilizate în cartografie.

- Decilele împart distribuţia în 10 clase de efective egale. Intervalul cuprins între prima şi ultima decilă se
numeşte intervalul interdecilic (D9-D1) , care corespunde amplitudinii distribuţiei după îndepărtarea a
10% dintre valorile cele mai mici şi a 10% dintre valorile cele mai mari.

Exemplu : Salariile din întreprinderea “Egalitatea”

După aflarea intervalului interdecilic (eliminarea a 10% dintre salariile cele mai mici şi a 10% dintre salariile
cele mai mari) se obţine D1=1400 RO$ şi D9=25000 RO$ intervalul fiind de D9-D1=23 600 RO $, respectiv
intervalul pe care se concentrează 80% dintre salariile întreprinderii.
2.3. Ecartul absolut mediu/median (abaterea la medie / la mediană) simbol: ea

Definiţie: ecartul absolut mediu este media valorilor absolute a ecarturilor la medie. Altfel spus, ecartul absolut
mediu este distanţa medie faţă de medie.
Deşi mai rar utilizat, se poate calcula în acelaşi mod ecartul absolut median, care este media ecarturilor la
mediană. n n
 | xi - x |  | xi - xmed |
i=1 i=1
ea = ea =
n n
La distribuţiile cu clase de frecvenţe abaterile centrelor de clasă se ponderează cu frecvenţele aferente:
n
 | xi - x | f i
i=1
ea = n
i xi              
A 7 3
 fi
i=1
B 8 2
Interesul celor două valori centrale este acela că sunt simplu de calculat
C 9 1 şi simplu de utilizat. Din păcate ele nu sunt furnizate de cea mai mare
parte a programelor statistice, care dau în schimb ecartul-tip (abaterea
D 10 0
standard), mai greu de interpretat.
E 10 0
Exemplu : Notele profesorilor X şi Y :
F 10 0 Calcularea ecartului absolut mediu a notelor profesorului X se efectuează
G 11 1 prin obţinerea mediei valorilor absolute a ecarturilor la medie.Valoarea
obţinută este de 1,3, ceea ce înseamnă că notele sale se îndepărtează în
H 12 2 medie cu 1,3 puncte faţă de medie. Prin urmare, în medie nu se remarcă
I 13 3 diferenţe mari faţă de medie.Aceleaşi calcule efectuate asupra notelor
profesorului Y vor găsi un ecart absolut mediu de 3,6 puncte, ceea ce
total 90 12 înseamnă că notele sale se îndepărtează în general mai mult faţă de
media 10 12/9 = 1.33 medie. În concluzie, se poate afirma că dispersia notelor profesorului Y
este mai mare decât cea a notelor profesorului X.
2.4. Ecartul-tip (abaterea standard)

Ecartul-tip este rădăcina pătrată a varianţei, ea însăşi fiind definită ca media pătratelor ecarturilor la medie:
1. dispersia sau varianţa (σ²) reprezintă media aritmetică a pătratelor abaterilor valorilor din şir de la media
acestuia: n
2
 ( xi - x )
2 i=1
 =
n

Pentru distribuţiile de frecvenţe formula se modifică în mod corespunzător:


n
2
 ( xi - x ) f i
2 i=1
 = n
 fi
i=1
Varianţa nu este chiar un parametru al dispersiei ci mai degrabă o măsură globală a variaţiei unui caracter ,
respectiv cantitatea medie de informaţie conţinută în diferitele valori ale caracterului. Această cantitate ar fi
nulă dacă valorile ar fi egale şi este cu atât mai mare cu cât valorile sunt diferite unele de altele.

2. ecartul-tip (abaterea standard) este parametrul de dispersie absolută cel mai utilizat în statistică.
Semnificaţia sa este departe de a fi evidentă (media pătratică a ecarturilor la medie) şi multe persoane îl
confundă cu ecartul mediu absolut ( care este media ecarturilor la medie). Formula de calcul:
n
n 2
2  ( xi - x ) f i
 ( xi - x ) iar pentru distribuţiile de frecvenţe:  =  2 = i=1 n
 =  2 = i=1
n  fi
i=1
Fără a intra în detaliile teoretice care depăşesc obiectul acestui curs, utilizatorii ecartului-tip trebuie
să fie conştienţi că utilizarea acestuia nu se justifică pe deplin decât în cazul în care distribuţia
valorilor observate este de formă gaussiană sau cel puţin simetrică şi unimodală.
În cazul în care forma unei distribuţii este de tip gaussian şi numai în acest caz, ecartul-tip poată să
îmbrace o formă probabilistă şi serveşte la definirea intervalelor de încredere în jurul mediei .

  % din valorile unei distribuţii


intervalul
gaussiene

media + sau – 1 σx         68.3%

media + sau - 2  σx         95.5%

media + sau - 3 σx           99.7%

 
Exemplu : Notele profesorilor X şi Y :

Pentru a determina ecartul-tip pentru notele profesorului X trebuie calculată mai î ntâi varianţa, adică media
pătratelor ecarturilor la medie.

Calculul varianţei notelor profesorului X

i xi                  
Varianţa notelor profesorului X fiind de 3,11 se calculează
A 7 9 valoarea ecartului-tip (=1,8 respectiv rădăcina pătrată din
3,11). Valoarea de 1,8 poate fi considerată ca un ordin de
B 8 4 mărime a dispersiei notelor în jurul mediei.
C 9 1
Dacă distribuţia notelor profesorului ar fi fost gaussiană
D 10 0 (ceea ce este dificil de afirmat din cauza eşantionului mic)
atunci ar trebui să găsim în jur de 66 % dintre note în
E 10 0
intervalul [8.2 ; 11.8] care corespunde mediei plus sau
F 10 0 minus un ecart-tip (x ± 1σ) şi 95% dintre note în
intervalul [6.4 ; 13.8] care corespunde mediei plus sau
G 11 1
minus două ecarturi-tip (x ± 2σ).
H 12 4
Acelaşi caclul făcut asupra notelor profesorului Y conduce
I 13 9 la un ecart-tip de 5,3, valoare mult mai mare decât în
cazul profesorului X. Prin urmare ajungem la aceeaşi
total 90 28
concluzie ca şi în cazul ecartului absolut mediu: notele
var = 28/9 = proofesorului Y sunt mult mai dispersate decât acelea ale
media 10
3.11 profesorului X.
3. Parametrii de dispersie absolută şi valorile centrale
 
Rezumatul unei distribuţii prin intermediul unei valori centrale este adesea înşelător deoarece este
incomplet: se poate cunoaşte ordinul de mărime al valorilor dar nu se cunoaşte nimic despre
dispersia valorilor în jurul valorii centrale de referinţă. Rolul principal al parametrilor de dispersie
este prin urmare acela de a însoţi şi de a preciza rezumatele distribuţiei efectuate cu ajutorul
valorilor centrale.

Exemplu : Salariile în întreprinderea “Egalitatea”

Am văzut în cursul precedent că media (10 000 RO$) oferea un rezumat foarte înşelător al salariilor
şi că modul sau mediana erau mult mai reprezentative pentru realitatea distribuţiei. Inconvenientele
mediei ar fi fost mult diminuate dacă ea ar fi fost însoţită de un parametru de dispersie precum
ecartul absolut mediu (20 000 RO$) sau precum ecartul-tip (46 500 RO$). Aceşti parametri ar fi
permis imediat să fie descoperită inegalitatea salariilor existente în întreprindere şi ar fi permis
observatorului să deducă rapid existenţa unei minorităţi cu salarii foarte mari deasupra mediei şi a
unei majorităţi cu salarii inferioare mediei.
 
Un bun rezumat statistic trebuie deci să conţină întotdeauna cel puţin doi parametri: o
valoare centrală şi un parametru de dispersie . Alegerea perechilor de parametri nu se poate
face totuşi la întâmplare, anumite asocieri pot să fie făcute de preferinţă:
 
1. media poate să fie însoţită fie de ecartul-tip fie de ecartul absolut mediu (deoarece aceşti
parametri sunt calculaţi plecând de la medie)
2. mediana poate fi însoţită fie de ecartul absolut median fie de intervalul interquartilic fie de
intervalul interdecilic.
3. Modul, care nu este cu adevărat util decât în cazul distribuţiilor multimodale, poate să fie însoţit
de întindere, care este singurul parametru de dispersie ce îşi păstrează semnificaţia în cazul
distribuţiilor multimodale.
4. Parametrii de distribuţie relativă

Din exemplul celor doi profesori rezultă că parametrii de dispersie


absolută permit să se compare ecartul la valoarea lor centrală a două
distribuţii care sunt identice şi a căror unitate de măsură este aceeaşi .

Ar permite ei însă compararea a două distribuţii care au unităţi de


măsură diferite sau ordine de mărime diferite? Cum vom vedea imediat,
răspunsul este negativ şi este necesar atunci să se construiască noi
unelte de comparare mai adaptate, respectiv parametrii de dispersie
relativă.
Diferenţa dintre dispersia absolută şi dispersia relativă

Să considerăm cazul a două distribuţii X şi Y care descriu acelaşi fenomen (talia) dar pentru două
populaţii diferite (sardine şi stavrid) cu ordine de mărime a distribuţiilor fo arte diferite.

Exemplu : variaţiile de talie la sardine şi la stavrid


Un biolog se întreabă dacă diferenţele de talie sunt mai mari la sardine sau la stavrizi. După ce a
măsurat 100 de stavrizi, a găsit o medie de 50 cm şi un ecart-tip de 5 cm. Pe un eşantion de 100 de
sardine a obţinut o medie de 10 cm şi un ecart-tip de 2,5 cm.
Putem vizualiza diferenţele de mărime la cele două specii examinând ce înseamnă mic, mediu şi
mare atunci când ne bazăm pe valorile mediei şi ecartului-tip.
1) în variaţie absolută,
absolută, diferenţele sunt mai mari la
stavrid decât la sardine. Astfel, se observă că stavrizii
“mari” au în medie 20 cm mai mult decât stavrizii
“mici” în vreme ce sardinele “mari” nu au decât 10 cm
Talia Sardine Stavrid mai mult decât cele “mici”. Această diferenţă este
tradusă de diferenţele dintre parametrii de dispersie
absolută: ecartul-tip este de două ori mai mare la
mică                                                       stavrid (5 cm) decât la sardine (2,5).
   x - 2σ          5 cm                 2) în variaţie relativă concluziile sunt total diferite. Se
40 cm constată că sardinele “mari” sunt de trei ori mai mari
decât cele “mici” în vreme ce stavrizii “mari” nu sunt
decât o dată şi jumătate (1,5) mai mari decât cei
Medie                                                               “mici”.
x 10 cm                                Prin urmare la sardine se înregistrează de fapt
50 cm variaţiile cele mai mari, ceea ce se poate vedea uşor
dacă se calculează un parametru de dispersie relativă
precum coeficientul de variaţie (ecart-tip/medie).
                                             
mare                      Acest raport este de 25% la sardine şi de doar 10% la
                                              stavrizi.
  x + 2σ           
15 cm
Compararea parametrilor de dispersie absolută 60 cm nu are sens decât atunci când caracterele sunt de acelaşi tip şi
de acelaşi ordin de mărime (de exemplu două specii de delfini cu aceeaşi talie medie dar cu ecart-tipuri
diferite).
În caz contrar, compararea nu este posibilă decât dacă facem apel la măsuri de dispersie relativă, adică
făcând raportul dintre un parametru de dispersie absolută şi o valoare centrală .
 
 
Un parametru de dispersie relativă este o măsură a ecartului relativ al valorilor unei distribuţii la o
valoare centrală, fiind prin urmare un raport:
parametrul de dispersie relativă = parametrul de dispersie absolută / valoarea centrală

Problema incomparabilităţii distribuţiilor diferite se rezolvă astfel exprimând dispersia în procente din
valoarea centrală pe baza căreia a fost estimată, rezultând aşa-numiţii indici de variabilitate relativă.
Aceşti indici sunt foarte utili în geografie, mai ales în studierea variabilităţii spaţiale şi/sau temporale a
unui fenomen.
Pornind de la parametrii de dispersie prezentaţi anterior se pot calcula trei astfel de indici:

1. abaterea cuartilă (intercuartilă) relativă, care reprezintă raportul procentual dintre abaterea
intercuartilă şi mediană:
Q 3 - Q1
x100
Q2
2. variabilitatea relativă - raportul procentual dintre abaterea absolută medie şi media aritmetică:

ea
x100
x
3. coeficientul de variaţie (notat de regulă cu CV), ca raport procentual dintre ecartul-tip (abaterea
standard) şi medie:

CV = x100
x
Cei trei indici au avantajele/dezavantajele mărimilor ce intră în calcul. Prin urmare coeficientul de variaţie este,
potenţial, cel mai potrivit pentru a fi utilizat în prelucrări ulterioare.
Utilitatea coeficientului de variație în analiza riscurilor hidrologice
*
* *

Atunci când se analizează un set de date se pune problema alegerii parametrilor statistici care să corespundă
cel mai bine scopurilor analizei statistice. Fără a exista nişte reguli precise, alegerea parametrilor de calculat
trebuie să ţină cont de următoarele aspecte:

- în general este bine să se calculeze toate cele trei valori centrale : Mo (dacă avem o
distribuţie de frecvenţe), Me şi x , întrucât cu ajutorul lor poate fi evaluată asimetria distribuţiei:
i) x < Me < Mo - asimetrie de dreapta, sau negativă;
ii) x > Me > Mo - asimetrie de stânga, sau pozitivă;
iii) x  Me  Mo - distribuţie cvasi-simetrică.

- scopul prelucrării datelor , ca şi faptul dacă rezultatele urmează, sau nu, să fie preluate în
calcule ulterioare. Dacă se urmăreşte doar descrierea şi caracterizarea sintetică a unor ansambluri de date
pentru a facilita înţelegerea unor fenomene, atunci modul sau mediana, împreună cu abaterea medie, abaterile
cuartile şi, eventual, variabilitatea relativă vor fi suficiente, având în vedere şi faptul că aceşti indici sunt mai
intuitivi (deci mai uşor de pus în relaţie cu fenomenul descris). Pentru analize statistice mai complexe, însă,
utilizarea mediei şi a indicilor care au la bază media este obligatorie;

- natura datelor supuse prelucrărilor, altfel spus tipul de caracteristică a cărei distribuţie statistică
se vrea a fi analizată. Contează, deci, dacă avem de-a face cu o carecteristică calitativă nominală sau ordinală,
una cantitativă discretă sau una cantitativă continuă, întrucât, aşa cum s-a văzut anterior, posibilitatea şi
modul de calculare a parametrilor statistici diferă de la un tip la altul;

- nivelul de înţelegere a beneficiarului rezultatelor analizei. Este clar că un beneficiar fără


cunoştinţe de statistică va prefera un material mai bogat în ilustraţii, fără prea multe formule şi indici (cifre) ale
căror semnificaţii sunt mai greu de evaluat şi interpretat;

- prezenţa/absenţa calculatorului , întrucât, aşa cum s-a văzut, determinarea unora dintre
indici presupune calcule laborioase.