Sunteți pe pagina 1din 28

CURS 5-6

VALORILE CENTRALE

1. Clasificarea valorilor centrale


1.1. Valorile centrale fundamentale
1.1.1. Valorile de poziţie: modul şi mediana
1.1.2. Valorile de calcul: media aritmetică

2. Valorile centrale şi formele distribuţiilor

3. Proprietăţile lui Yule


1. Clasificarea valorilor centrale

Scopul valorilor centrale este acela de a rezuma într-o singură valoare ansamblul
valorilor unei distribuţii.

Ele « sunt valori sintetice care exprimă, în mod sintetic şi generalizant, ceea ce este
normal, esenţial, tipic pentru indivizii unei populaţii distribuiţi după o anumită
caracteristică. […] Într-o distribuţie normală, nivelul mediu ocupă o poziţie centrală ,
spre care tinde majoritatea indivizilor unei populaţii, media considerându-se şi
speranţa matematică a acestora.

Mărimile medii mai sunt cunoscute şi sub denumirea de indicatori ai tendinţei


centrale.

Nivelul mediu al unei distribuţii este determinat de acţiunea factorilor esenţiali,


permanenţi. Abaterile la nivelul mediu se datorează factorilor aleatori. Cu cât mai
importantă este acţiunea factorilor aleatori asupra distribuţiei, cu atât valorile
individuale se depărtează de valoarea lor centrală, evidenţiind eterogenitatea
elementelor ansamblului. Ca urmare, reprezentativitatea mediei pentru şirul valorilor
considerate scade ». (E. Jaba, 1996)
Media geometrică a n numere reale pozitive x1, x2,... xn este dată de
formula:

 
Media armonică a n numere reale pozitive x1, x2,... xn este

Media pătratică a n numere reale pozitive x1, x2,... xn este

unde n este numărul de termeni.


1.1. Valorile centrale fundamentale

1.1.1. Valorile de poziţie: modul şi mediana

Modul (Mo)

Modul sau valoarea dominantă, este valoarea cea mai frecventă a unei distribuţii.
Această valoare se calculează întotdeauna plecându-se de la o numărătoare a
modalităţilor caracterului, însă trebuie avut mereu în vedere diferenţele dintre
caracterele discrete şi cele continue. Vizual, clasa modală corespunde vârfului
histogramei.

Când histograma unei distribuţii prezintă două vârfuri separate de o concavitate, se


spune că distribuţia este bimodală. În acest caz se distinge un mod principal şi un mod
secundar. Mult mai rar se pot întâlni distribuţii cu trei sau mai multe moduri.
a) Cazul caracterului cantitativ sau calitativ discret
Pentru un caracter calitativ sau pentru un caracter cantitativ discret având un număr de
modalităţi inferior numărului de elemente, modul este modalitatea care are frecvenţa simplă
cea mai mare (sau efectivul cel mai mare, ceea ce este acelaşi lucru).
frecvenţa
nota efectivul simplă
xi ni fi%

3 4   Exerciţiu: Cei 112 masteranzi de la Turism şi dezvoltare


4 33   regională au obţinut la examenul de « Politici de dezvoltare
5 27   regională » rezultatele sintetizate în tabelul alăturat. Se cere
să găsiţi modul acestei distribuţii.
6 17  
7 14  
8 6  
9 7  
10 4  

frecvenţa
nota efectivul simplă
xi ni fi%

3 4 3,6
4 33 29,5
5 27 24,1
6 17 15,2
7 14 12,5
8 6 5,4
9 7 6,3
10 4 3,6
Total 112 100,0
b) Cazul caracterului cantitativ continuu

Modalităţile fiind în număr infinit, este puţin probabil ca două elemente să aibă
aceeaşi valoare. În acest caz, modul nu poate fi definit direct şi este nevoie de o
grupare în clase. După grupare se determină clasa modală, care este aceea care
are frecvenţa medie cea mai mare. Clasa modală este clasa în care indivizii sunt
cei mai concentraţi, însă nu în mod necesar şi clasa care are cei mai mulţi indivizi .

Valoarea modală se calculează cu ajutorul unei formule care ia în considerare


atât clasa modală, cât şi clasele vecine acesteia, formulă bazată pe principiul
interpolării liniare (în ipoteza că valorile sunt uniform distribuite în interiorul clasei
modale):
1 =f -f
Mo = l i(Mo) + * a(Mo) unde: 1 (Mo) (Mo-1)
1 +  2  2 = f (Mo) - f (Mo+1)

Mo - modul;
li(Mo) - limita inferioară a clasei modale;
f(Mo) - frecvenţa medie a clasei modale;
f(Mo-1) - frecvenţa medie a clasei de dinaintea celei modale (clasele fiind
ordonate crescător);
f(Mo+1) - frecvenţa medie a clasei de după cea modală;
a(Mo) - amplitudinea clasei modale.
Exerciţiu: Fie o întreprindere cu 20 de salariaţi. Cu ajutorul tabelului de
mai jos determinaţi care este modul de distribuţie a salariilor (salariul
modal).

Clase de Efecti- Frecvenţa Frecvenţa


salarizare vul simplă Clase de Frecvenţa Amplitudinea medie
(RON) Efectivul
salarizare simplă clasei fmi
ni
[0 ; 1000[ 5 25% (xi) fi ai (fi/ai)

[1000 ; 2000[ 6 30% 0,00025


[0 ; 1000[ 5 0,25 1000

[2000 ; 4000 [ 8 40% 0,00030


[1000 ; 2000[ 6 0,30 1000

0,00020
[4000 ; 8000] 1 5% [2000 ; 4000 [ 8 0,40 2000

0,00001
Total 20 100% [4000 ; 8000] 1 0,05 4000

Total 20 1    

1 Mo = 1000+{[
1000+{[0,00030-0,00025/(0,00030-0,00025)+(0,00030
0,00030-0,00025/(0,00030-0,00025)+(0,00030-
-
Mo = l i(Mo) + * a(Mo) 0,00020)]*1000} =
1 +  2 1000+[0,00005/(0,00005+0,00010)]*1000 =

Mo - modul; 1000+(0,00005/0,00015)*1000 =
li(Mo) - limita inferioară a clasei modale;
Δ1= f(Mo)- f(Mo-1); 1000+333,33=1333,33
Δ2= f(Mo)- f(Mo+1);
a(Mo) – amplitudinea
clasei modale.
Coeficientul
Mărimea de reducere Frecvenţele
Clase de Efectivul intervalului a frecvenţelor reduse
salarizare ni li ki=(li/li
ki=(li/limin) hi=ni/ki
[0 ; 1000[ 5 1000 1 5
[1000 ; 2000[ 6 1000 1 6
[2000 ; 4000 [ 8 2000 2 4
[4000 ; 8000] 1 4000 4 0,25
Total 20      

Frecvenţa
medie
redusă
fmi
Mo - modul;
0,00025
li(Mo) - limita
inferioară a clasei
0,00030 modale;

Δ1= f(Mo)- f(Mo-1);


0,00020
Δ2= f(Mo)- f(Mo+1);

0,00001 a(Mo) – amplitudinea


clasei modale.
Prin comparaţie cu celelalte valori centrale, modul prezintă unele avantaje, dar şi
unele dezavantaje.

Avantaje:
- este singura valoare centrală care poate fi determinată în cazul caracteristicilor
calitative nominale - de aceea este deosebit de important pentru geografie, unde se lucrează
deseori cu date de acest tip;
- este util atunci când se urmăreşte reliefarea unei trăsături dominante a
fenomenului analizat pe baza datelor de observaţii - de ex. suprafaţa lacurilor dintr-un teritoriu,
sau numărul de locuitori/comună, unde modul poate indica predominarea unei categorii sau
alteia de mărime. În felul acesta „modul poate fi expresia unei structuri spaţiale ce
caracterizează o regiune, căci el poate traduce o dominantă în climat, peisaj, economie etc.”
(Chadule, 1974).

Dezavantaje:
- întrucât este legat numai de frecvenţă, modul nu reuşeşte să caracterizeze suficient
o distribuţie;
- poziţia şi, eventual, numărul claselor modale depind foarte mult de modul de
grupare în clase; o schimbare a numărului de clase sau a limitelor acestora poate provoca
modificări dramatice în acest sens;
- la unele distribuţii statistice este posibil ca modul să nu existe, altfel spus nu se
pune în evidenţă o valoare, sau o clasă modală, cu frecvenţă maximă;
- prin felul cum se determină, valoarea modală nu posedă calităţi aritmetice bine
definite şi deci nu poate fi preluată în calcule ulterioare pentru derivarea unor caracteristici
suplimentare ale distribuţiilor statistice.
Mediana (Me)

Mediana este o valoare centrală rezervată caracterelor cantitative. Deoarece


valorile caracterului X sunt clasate în ordine crescătoare, mediana este valoarea
caracterului care împarte mulţimea descrisă de X în două submulţimi de efective
egale: 50 % dintre elemente au valori superioare medianei iar 50% au valori
inferioare. Prin urmare, mediana ocupă locul central într-o serie.

Acest lucru trimite la ideea utilizării frecvenţelor cumulate absolute ascendente (Ni
asc) şi respectiv relative (Fi asc). Deoarece Ni variază între 0 şi n iar Fi între 0 şi 1,
locul medianei corespunde valorii Ume, numită unitate mediană, care se calculează
după relaţia Ume = n/2 şi respectiv Ume = 1/2.
Când n<100 unitatea mediană se calculează după relaţia Ume = (n+1)/2.

Mediana se poate calcula fie plecându-se de la tabelul elementar ori de la cel de


distribuţie statistică, fie pe cale grafică.
a) Calculul pe baza tabelului elementar :

Pentru o serie simplă « fără frecvenţe », se ordonează tabelul şi se caută elementul


Ume (unitatea mediană) care împarte distribuţia în două părţi egale, adică se
reperează caracterul care, pentru caracterul X, are rangul (n+1)/2. Dacă distribuţia
are un număr impar de elemente, pentru mediană se găseşte o valoare unică. Dacă
distribuţia are un număr par de elemente se găsesc două valori, care determină
unitatea mediană Ume ca un interval median. În acest caz, ca mediană se ia
centrul acestui interval median.

1 5 1 5

2 10 2 10

3 20 3 20
Me = (20+25)/2 = 22,5
  25 4 25

  35   35

  n=5   42

Ume = (n+1)/2 = 3   n=6

  Me = 20   Ume = (n+1)
(n+1)/2 = 3,5
  20<Me<25
b) Calcul pe baza unui tabel de distribuţie statistică pentru o caracteristică
discretă cu frecvenţe

Pentru o serie cu frecvenţă descriind o caracteristică discretă (respectiv


prezentată pe variante), aflarea Me presupune următoarele operaţii:
1 - determinarea frecvenţelor cumulate Ni;
2 - calcularea unităţii mediane Ume şi găsirea locului ei în şirul de
frecvenţe respectând condiţia Ni> Ume;
3 - în dreptul frecvenţei cumulate egale cu sau mai mari decât Ume (Ni>
Ume) se află nivelul caracteristicii care este Me.

Frecvenţ
frecvenţa Frecvenţ a
nota efectivul cumulată a cumulată
xi ni Ni fi Fi
3 4 4 0,04 0,04
4 33 37 0,29 0,33
Ume = 112/2 = 56 5 27 64 0,24 0,57 Ume = 1/2 = 0,5
(Ni>Ume; 64>56) 6 17 81 0,15 0,72
Me = 5 7 14 95 0,13 0,85
8 6 101 0,05 0,90
9 7 108 0,06 0,96
10 4 112 0,04 1,00
Total 112      
c) Calcul pe baza unui tabel de distribuţie statistică pentru o caracteristică
continuă

După realizarea tabelului, se reperează clasa i care conţine mediana apoi, ca


în cazul modului, se realizează o interpolare liniară pentru a estima valoarea
acesteia după formula:

Me = Linfi + {ai* [(Ume-Ni-1asc)/ni]}

Timpul de Numărul
deplasare zilnică persoanelor
(în minute) chestionate xi ni fi% ai Ci fmi Ni asc Ni desc

0-30 250 0-30 250 12,5 30 15 0,42 250 2000


30-60 500 30-60 500 25,0 30 45 0,83 750 1750
60-90 600 60-90 600 30,0 30 75 1,00 1350 1250
90-120 450 90-120 450 22,5 30 105 0,75 1800 650
120-150 150 120-150 150 7,5 30 135 0,25 1950 200
150 şi peste 50 150 şi peste 50 2,5 30 165 0,08 2000 50
Total 2000 Total 2000 100 - - - - -
Determinarea Me presupune efectuarea următoarelor operaţii
1) Determinarea şirului frecvenţelor cumulate Ni
2) Calcularea unităţii mediane Ume şi găsirea ei în şirul de frecvenţe cumulate respectând condiţia Ni >Ume:
Ume = ni/2 = 2000/2 = 1000; 1350>1000
3) Aflarea intervalului median în dreptul Ume
4) Determinarea Me prin interpolare după formula Me = Linfi + {ai* [(Ume-Ni-1asc)/ni]}

unde:

Linfi = limita inferioară a intervalului median (60)


ai = mărimea intervalului median (30)
Ume = unitatea mediană (1000)
Ni-1asc = frecvenţa cumulată anterior intervalului median (750)
ni = frecvenţa intervalului median (600)

xi ni fi% ai Ci fmi Ni asc Ni desc

0-30 250 12,5 30 15 0,42 250 2000


30-60 500 25,0 30 45 0,83 750 1750
Intervalul median 60-90 600 30,0 30 75 1,00 1350 1250 Ume=1000
90-120 450 22,5 30 105 0,75 1800 650
Me = 72,5
120-150 150 7,5 30 135 0,25 1950 200
150 şi peste 50 2,5 30 165 0,08 2000 50
Total 2000 100 - - - - -

Me = 60 + {30* [(1000-750)/600]} = 60+30*(250/600) = 60+12,5 = 72,5


d) Calcul grafic, pe baza curbelor frecvenţelor cumulate 

Fiind o mărime medie cu poziţie centrală într-o serie statistică ordonată, mediana se
poate afla pe cale grafică folosind curbele frecvenţelor cumulate. Mediana este
reprezentată pe ordonată de valoarea corespunzătoare Ume de pe abscisă.

  Fi asc Fi desc
0 0 2000
30 250 1750
60 750 1250 Ume=1000

90 1350 650
120 1800 200
150 1950 50
180 2000 0
Proprietăţile medianei

Mediana este valoarea caracterului care este cea mai apropiată de toate
celelalte valori, minimizând distanţele calculate în valori absolute. 
 

Aplicaţii în geografie

Faptul că mediana minimizează distanţele faţă de toate punctele unei distribuţii


poate fi utilizat în geografie pentru determinarea localizărilor optime, adică a
acelor localizări care au cea mai bună accesibilitate posibilă (minimizarea
distanţelor de la un punct la toate celelalte) Punctul median poate fi calculat
într-un spaţiu cu o dimensiune (de exemplu localizarea unui depozit de benzină
care să deservească ansamblul benzinăriilor de pe o autostradă) sau într-un
spaţiu cu două dimensiuni (localizarea unei şcoli care să deservească toţi
locuitorii unui cartier).
 
Exerciţiu : Se doreşte amplasarea unui depozit de benzină care să deservească 7 benzinării
situate pe o autostradă la kilometrii 0, 50, 100, 200, 300, 400, 700. Verificaţi că localizarea
optimă a depozitului, adică aceea care minimizează distanţele faţă de toate benzinăriile este
situată în punctul median şi nu în punctul mediu sau în punctul central.

Benzinării Distanţa la Distanţa Distanţa Benzinării Distanţa la Distanţa Distanţa


situate punctul faţă de faţă de situate punctul faţă de faţă de
la km median punctul punctul la km median punctul punctul
n° (Pmedian=?) mediu central n° (200) mediu (250) central
(Pmediu=?) (Pcentral=?) (350)
0 0 200 250 350

50 50 150 200 300

100 100 100 150 250

200 200 0 50 150

300 300 100 50 50

400 400 200 150 50

700 700 500 450 350

Total Total 1250 1300 1500


1.1.2. Valorile de calcul: media aritmetică (x )
 
În principiu, media (x ) nu poate fi calculată decât în cazul caracterelor
cantitative continue. În practică ea este calculată şi pentru caracterele
cantitative discrete, ceea ce conduce la rezultate fermecătoare, precum acela
conform căruia se pot înregistra 2,15 copii pe femeie...

a) Calcularea mediei plecând de la un tabel elementar

Media (x ) este suma elementelor xi divizată prin numărul de elemente :


 
n

x
i=1
i

x=
n
unde n este numărul de elemente
Tabel 1 : salariile
nominale în
întreprinderea
“Egalitatea”
n° Categoria Salariul Exerciţiu : Care este salariul mediu în întreprinderea “Egalitatea”?
(RO$) n
1 ucenic 1300 x
i=1
i

2 ucenic 1300 x=
3 ucenic 1500 n
4 ucenic 1700 Răspuns: masa salarială totală fiind de 200 000 RO$
5 ucenic 1700 iar numărul total al salariaţilor de 20, se obţine un
6 muncitor 2100 salariu mediu de 10 000 RO$.
7 muncitor 2100
8 muncitor 2300
9 muncitor 2500 Acest salariu mediu nu reflectă, în mod evident, decât
10 muncitor 2700 cu totul imperfect salariul încasat de fiecare salariat în
11 muncitor 2900 parte. Dacă eliminăm salariul directorului, salariul
12 muncitor 2900 celorlalţi 19 salariaţi nu va fi în medie decât (100 000 /
13 maistru 4500 19) = 5 263 RO$ . Dacă eliminăm din analiză şi
14 maistru 4500 directorii adjuncţi atunci salariul celor 17 lucrători
15 maistru 5000 rămaşi nu va fi în medie decât 2 941 RO$ ...
16 maistru 5500
17 maistru 5500 Se observă prin urmare că în acest exemplu media este
18 director 20000 un rezumat foarte prost al distribuţiei din cauza
adjunct
prezenţei valorilor excepţionale (directorul) şi a unei
19 director 30000
adjunct puternice disimetrii a histogramei (concentrarea
20 director 100000 salariilor în zona valorilor mici şi dispersia lor în zona
general
valorilor mari).
  total 200000
Tabel 1 : Salariile Tabel 2 : Salariile medii pe categorii socioprofesionale
nominale în în întreprinderea “Egalitatea”
întreprinderea
“Egalitatea” categoria salariul mediu efectivul
xi pi xi*pi
n° Categoria Salariul
1 ucenic 1300 ucenici 1500 5 7500
2 ucenic 1300
3 ucenic 1500 muncitori 2500 7 17500
4 ucenic 1700
maiştri 5000 5 25000
5 ucenic 1700
6 muncitor 2100
directori adjuncţi 25000 2 50000
7 muncitor 2100
8 muncitor 2300
director general 100000 1 100000
9 muncitor 2500
10 muncitor 2700
total 200000??!! 20 200000
11 muncitor 2900
12 muncitor 2900
Calculul mediilor ponderate
13 maistru 4500
14 maistru 4500 Adesea liniile unui tabel elementar corespund unei mulţimi de indivizi şi nu unor
15 maistru 5000 indivizi. În acest caz valorile caracterului corespund deja unor medii iar media
generală va trebui să pondereze fiecare valoare a caracterului cu numărul de indivizi
16 maistru 5500
pe care îi reprezintă. Dacă notăm cu x modalităţile şi cu p ponderea lor atunci
17 maistru 5500 formula de calculare a mediei devine :
18 director 20000 n
adjunct
19 director 30000  xi * pi
i=1 (x ) = (7500+17500+25000+50000+100000)/20 = 10000
adjunct
x= n
20 director 100000
general
 pi
  total 200000 i=1
Media raporturilor şi raportul mediu

O aplicaţie directă a mediei ponderate priveşte raporturile, respectiv caracterele xi


definite ca raporturi a două caractere de stoc V (numărător) şi P (numitor).
Atunci când se analizează o mulţime de indivizi descrişi de asemenea caractere xi
trebuie să se distingă clar raportul mediu şi media raporturilor. Primul este valoarea
raportului V/P (de ex. valoarea PIB / nr. de locuitori), calculat atunci când toţi indivizii
ar fi fuzionaţi, în vreme ce în vreme ce media raporturilor este media valorilor
indivizilor cu ponderi diferite.   

Exemplu : Care ar fi fost PIB-ul pe locuitor al Chinei reunificate cu Taiwanul?


n
Ţara PIB ($ / loc.) Pop (milioane loc.)  xi * pi
i=1
R.P. Chineză  3500   1300 x= n
Taïwan 18500  20  pi
i=1
Sursa : Banca mondială 1997

Media raporturilor, respectiv (3500+18500)/2, ar conduce la o valoare de 11 000 $ pe


locuitor, respectiv o creştere cu 7500 $, ceea ce nu ar corespunde consecinţelor reale ale
reunificării, deoarece această medie nu acordă aceeaşi pondere celor două ţări (China
populară este de 65 de ori mai populată decât Taïwanul!).

Calcularea raportului mediu presupune deci efectuarea unei medii ponderate care ar ajunge la
o valoare de 3727 $ pe locuitor. Astfel, PIB-ul unei Chine reunificate nu ar creşte decât cu 237
$ pe locuitor faţă de situaţia actuală.
Tabel 1 : Salariile
nominale în b) Calcularea mediei plecând de la un tabel de distribuţie statistică
întreprinderea
“Egalitatea” Tabel 3 : Gruparea salariaţilor
pe tranşe de salarii
n° Categoria Salariul
salarii efective frecvenţe amplitudinea Centrul frecvenţa medie
1 ucenic 1300 xi ni fi ai ci fmi
2 ucenic 1300
[1000 ; 2000[ 5 25% 1000 1500 0,00500
3 ucenic 1500
[2000, 4000[ 7 35% 2000 3000 0,00350
4 ucenic 1700
5 ucenic 1700 [4000; 100000] 8 40% 96000 52000 0,00008
6 muncitor 2100
Deoarece din tabel nu se mai poate cunoaşte repartiţia exactă a salariilor în interiorul
7 muncitor 2100
clasei, vom presupune că valoarea care este centrul clasei corespunde mediei
8 muncitor 2300 lucrătorilor grupaţi în această clasă. Calculul va fi prin urmare efectuat astfel: se
9 muncitor 2500 acordă celor 5 indivizi din prima clasă un slariu de 1500 RO$, celor 7 indivizi din a
doua clasă un salariu de 3000 RO$ şi celor 8 indivizi din ultima clasă un salariu mediu
10 muncitor 2700
de 52000 RO$ apoi se aplică formula
11 muncitor 2900
n

 ni * ci
12 muncitor 2900 5*1 500 = 7 500
7*3 000 = 21 000
13 maistru 4500
x= i=1 8*52 000 = 416 000
14 maistru 4500 (7 500 + 21 000 + 416 000)/20 = 22 225
15 maistru 5000 n
16 maistru 5500
17 maistru 5500
18 director 20000 Salariul mediu este atunci, în teorie, 22 225 RO$ ! Această valoare este mult mai
adjunct ridicată decât salariul mediu real deoarece centrele ultimelor două clase nu sunt
19 director 30000 reprezentative şi sunt mult mai ridicate decât media claselor cărora le corespund
adjunct (respectiv 2500 RO$ şi 21 875 RO$).
20 director 100000
general În acest caz salariul modal rezumă mai bine distribuţia?
  total 200000
Dezavantajul mediei aritmetice este că, întrucât ia în consideraţie ordinul de mărime al tuturor
valorilor, devine sensibilă la valorile foarte mari sau foarte mici . Aceste valori extreme pot fi
deseori puţin semnificative, excepţionale sau chiar aberante (erori grosiere de observaţii sau
măsurători). În felul acesta media nu mai reflectă corect tendinţa centrală a distribuţiei statistice .
Pe de altă parte, media „comprimă” excesiv valorile extreme, comparativ cu cele aflate
mai spre centrul repartiţiei. La distribuţiile simetrice faptul acesta contează mai puţin, însă la cele
cu asimetrie pronunţată situaţia se schimbă.

Exemplu. Într-o zonă cu climat arid şirul de precipitaţii anuale (în mm) înregistrate pe
10 ani consecutivi etalează următoarele valori:

0; 10; 0; 0; 100; 20; 250; 0; 0; 20.

Valorile ordonate crescător, pentru determinarea modului şi a medianei:


0; 0; 0; 0; 0; 10; 20; 20; 100; 250.

Valorile centrale sunt: Mo = 0 mm; Me = 5 mm; x = 40 mm.

Este clar că mediana, şi chiar modul, reflectă mai corect condiţiile pluviometrice din
deşert; faţă de acestea media este „trasă” în sus de către cele două valori foarte mari. Rezultă de
aici şi dezavantajul de a folosi o singură valoare centrală pentru caracterizarea unei distribuţii.
Proprietăţile aritmetice ale mediei sunt următoarele:
n
1. Suma abaterilor valorilor din şir de la medie este nulă:
 ( xi - x ) = 0
i=1

2. Dacă valorile din şir se modifică prin adăugarea/scăderea unei constante, atunci media
creşte/scade cu aceeaşi constantă :

x 'i = x i  a  x = x  a
n
 di
3. Dacă y este media unui alt şir şi di sunt diferenţele (xi - yi), atunci x = y + i=1 = y + d
n
Această proprietate este utilă, spre exemplu, în climatologie şi hidrologie pentru prelungirea şirurilor de
observaţii.

4. Suma pătratelor abaterilor valorilor din şir de la media lor aritmetică este minimă:

n
2
 i( x - A ) = minim , unde A =x
i=1
Această proprietate este larg utilizată în calculele ulterioare implicate de analizele distribu ţiilor
statistice.
Atenţie: a nu se confunda cu mediana, care minimizează valorile absolute ale distanţelor şi nu
distanţele ridicate la patrat.
Valorile centrale şi formele distribuţiilor

Compararea celor trei valori centrale sau examenul histogramelor permit definirea formei
distribuţiilor. În funcţie de forma unei distribuţii, cel mai bun rezumat va fi furnizat de una sau de
alta dintre valorile centrale.
 
Distribuţiile bimodale sau multimodale
Distribuţia are mai multe moduri. Modul principal este diferit de medie şi de mediană, care au
şanse mari să corespundă unei zone de dispersie a valorilor. În acest caz nici media şi nici
mediana nu sunt semnificative iar distribuţia nu poate fi rezumată de o singură valoare, fiind
compusă din două grupuri foarte diferite şi prin urmare cel mai bun rezumat este dat de
modurile principal şi secundar al distribuţiei.
 
Distribuţiile unimodale şi simetrice
Când distribuţia este unimodală şi simetrică se observă că media = mediana = modul iar cel
mai bun rezumat este dat de medie, deoarece ea ţine cont de toate observaţiile şi are
proprietăţile statistice cele mai interesante.
 
Distribuţii unimodale asimetrice :
Astfel de distribuţii prezintă două cazuri principale:
- modul < mediana < media : distribuţia este asimetrică la stânga, adică se înregistrează
o concentrare a valorilor mici şi o dispersie a valorilor mari; acesta este cazul cel mai frecvent.
- media < mediana <modul : distribuţia este asimetrică la dreapta, adică se înregistrează
o dispersie a valorilor mici şi o concentrare a valorilor mari; acest caz este mai rar decât
precedentul.

Atunci când asimetria este foarte evidentă, mediana este în general preferabilă mediei, deoarece
ea este mai puţin influenţată de valorile excepţionale, care sunt adesea la originea asimetriei.
Dacă asimetria este foarte puţin marcată este de preferat utilizarea mediei.
Valorile centrale: cele şase proprietăţi ale lui YULE 
Statisticianul Yule (sec. XIX) a definit 6 proprietăţi de dorit pentru valorile centrale.
 
(1) Să fie definite în mod obiectiv
Două persoane care prelucrează aceeaşi informaţie trebuie să ajungă la acelaşi rezultat în ceea ce priveşte
calcularea valorilor centrale (adevărat pentru medie şi pentru mediană dar nu pentru mod, care depinde de
alegerea claselor în urma grupării).

(2) Să depindă de toate observaţiile


Modificarea unei singure observaţii trebuie să conducă la modificarea valorilor centrale (adevărat pentru medie
însă nu pentru mod şi nici pentru mediană). În exemplul cu întreprinderea “Egalitatea” creşterea salariului
directorului de la 100 000 de RO$ la 200 000 RO$ va modifica media (15000 RO$) dar va fi fără urmări asupra
modului sau a medianei.

(3) Să aibă o semnificaţie concretă


Deşi media pare "naturală" ea este de fapt foarte abstractă, pe când modul poate fi definit ca “situaţia cea mai
frecventă” iar mediana ca valoarea “care divizează distr ibuţia în două " (un individ din doi are o valoare
superioară sau inferioară acesteia). Caracterul abstract al mediei apare atunci când se aplică asupra caracterelor
discrete (ce înseamnă 2,5 copii pe femeie ?)

(4) Să fie simplu de calculat


Această preocupare a secolului a XIX-lea nu mai este de actualitate în epoca ordinatoarelor... Toate valorile
centrale sunt uşor de calculat în prezent.

(5) Să fie puţin sensibile la fluctuaţiile de eşantionare


Aparent este vorba de inversul proprietăţii (2). De fapt s-ar putea spune că această proprietate defineşte
soliditatea măsurii în faţa erorilor de înregistrare (informaţii prost codate, valori aberante...) În cazul
întreprinderii “Egalitatea” dacă am fi scris din greşeală 1 000 000 RO$ pentru salariul directorului, media ar fi
"explodat". Mediana în schimb ar fi rezistat şi n-ar fi fost modificată. Modul nu este nici el prea robust fiindcă
trecerea unui individ dintr-o clasă în alta poate modifica clasa modală şi astfel poate modifica modul.

(6) Să se preteze calcului algebric


Când se cunosc valorile centrale a k eşantioane E1...Ek de efective P1...Pk, se poate afla valoarea centrală a
populaţiei E prin reuniunea acestor eşantioane? Răspunsul este afirmativ în cazul mediei (cf. calcului mediilor
ponderate) însă negativă în cazul modului şi al medianei.
Tabelul următor rezumează avantajele şi dezavantajele celor trei valori centrale.

Propritatea lui Yule Modul Mediana Media

1) Este definită în mod - + +


obiectiv
2) Depinde de toate - - +
observaţiile
3) Are o semnificaţie + + -
concretă
4) Este simplu de + + +
calculat
5) Este puţin sensibilă - + -
la fluctuaţiile de
eşantionare
6) Se pretează - - +
calculului algebric

Cele şase proprietăţi ale lui Yule sunt mai mult sau mai puţin bine verificate de fiecare valoare
centrală. Deși în general se preferă media în locul medianei şi a modului, trebuie să se ţină
seama de caracteristicile distribuţiei atunci când se alege o valoare centrală sau alta.

Cunoaşterea valorilor centrale este întotdeauna preţioasă, deoarece ea permite să fie vizualizată
imediat forma aproximativă a distribuţiei . Din păcate valorile centrale nu oferă informaţii asupra
dispersiei valorilor, adică asupra depărtării lor faţă de valorile centrale . Este necesar prin urmare
să asociem fiecărei valori centrale câte un parametru de distribuţie.

S-ar putea să vă placă și