Documente Academic
Documente Profesional
Documente Cultură
VALORILE CENTRALE
Scopul valorilor centrale este acela de a rezuma într-o singură valoare ansamblul
valorilor unei distribuţii.
Ele « sunt valori sintetice care exprimă, în mod sintetic şi generalizant, ceea ce este
normal, esenţial, tipic pentru indivizii unei populaţii distribuiţi după o anumită
caracteristică. […] Într-o distribuţie normală, nivelul mediu ocupă o poziţie centrală ,
spre care tinde majoritatea indivizilor unei populaţii, media considerându-se şi
speranţa matematică a acestora.
Media armonică a n numere reale pozitive x1, x2,... xn este
Modul (Mo)
Modul sau valoarea dominantă, este valoarea cea mai frecventă a unei distribuţii.
Această valoare se calculează întotdeauna plecându-se de la o numărătoare a
modalităţilor caracterului, însă trebuie avut mereu în vedere diferenţele dintre
caracterele discrete şi cele continue. Vizual, clasa modală corespunde vârfului
histogramei.
frecvenţa
nota efectivul simplă
xi ni fi%
3 4 3,6
4 33 29,5
5 27 24,1
6 17 15,2
7 14 12,5
8 6 5,4
9 7 6,3
10 4 3,6
Total 112 100,0
b) Cazul caracterului cantitativ continuu
Modalităţile fiind în număr infinit, este puţin probabil ca două elemente să aibă
aceeaşi valoare. În acest caz, modul nu poate fi definit direct şi este nevoie de o
grupare în clase. După grupare se determină clasa modală, care este aceea care
are frecvenţa medie cea mai mare. Clasa modală este clasa în care indivizii sunt
cei mai concentraţi, însă nu în mod necesar şi clasa care are cei mai mulţi indivizi .
Mo - modul;
li(Mo) - limita inferioară a clasei modale;
f(Mo) - frecvenţa medie a clasei modale;
f(Mo-1) - frecvenţa medie a clasei de dinaintea celei modale (clasele fiind
ordonate crescător);
f(Mo+1) - frecvenţa medie a clasei de după cea modală;
a(Mo) - amplitudinea clasei modale.
Exerciţiu: Fie o întreprindere cu 20 de salariaţi. Cu ajutorul tabelului de
mai jos determinaţi care este modul de distribuţie a salariilor (salariul
modal).
0,00020
[4000 ; 8000] 1 5% [2000 ; 4000 [ 8 0,40 2000
0,00001
Total 20 100% [4000 ; 8000] 1 0,05 4000
Total 20 1
1 Mo = 1000+{[
1000+{[0,00030-0,00025/(0,00030-0,00025)+(0,00030
0,00030-0,00025/(0,00030-0,00025)+(0,00030-
-
Mo = l i(Mo) + * a(Mo) 0,00020)]*1000} =
1 + 2 1000+[0,00005/(0,00005+0,00010)]*1000 =
Mo - modul; 1000+(0,00005/0,00015)*1000 =
li(Mo) - limita inferioară a clasei modale;
Δ1= f(Mo)- f(Mo-1); 1000+333,33=1333,33
Δ2= f(Mo)- f(Mo+1);
a(Mo) – amplitudinea
clasei modale.
Coeficientul
Mărimea de reducere Frecvenţele
Clase de Efectivul intervalului a frecvenţelor reduse
salarizare ni li ki=(li/li
ki=(li/limin) hi=ni/ki
[0 ; 1000[ 5 1000 1 5
[1000 ; 2000[ 6 1000 1 6
[2000 ; 4000 [ 8 2000 2 4
[4000 ; 8000] 1 4000 4 0,25
Total 20
Frecvenţa
medie
redusă
fmi
Mo - modul;
0,00025
li(Mo) - limita
inferioară a clasei
0,00030 modale;
Avantaje:
- este singura valoare centrală care poate fi determinată în cazul caracteristicilor
calitative nominale - de aceea este deosebit de important pentru geografie, unde se lucrează
deseori cu date de acest tip;
- este util atunci când se urmăreşte reliefarea unei trăsături dominante a
fenomenului analizat pe baza datelor de observaţii - de ex. suprafaţa lacurilor dintr-un teritoriu,
sau numărul de locuitori/comună, unde modul poate indica predominarea unei categorii sau
alteia de mărime. În felul acesta „modul poate fi expresia unei structuri spaţiale ce
caracterizează o regiune, căci el poate traduce o dominantă în climat, peisaj, economie etc.”
(Chadule, 1974).
Dezavantaje:
- întrucât este legat numai de frecvenţă, modul nu reuşeşte să caracterizeze suficient
o distribuţie;
- poziţia şi, eventual, numărul claselor modale depind foarte mult de modul de
grupare în clase; o schimbare a numărului de clase sau a limitelor acestora poate provoca
modificări dramatice în acest sens;
- la unele distribuţii statistice este posibil ca modul să nu existe, altfel spus nu se
pune în evidenţă o valoare, sau o clasă modală, cu frecvenţă maximă;
- prin felul cum se determină, valoarea modală nu posedă calităţi aritmetice bine
definite şi deci nu poate fi preluată în calcule ulterioare pentru derivarea unor caracteristici
suplimentare ale distribuţiilor statistice.
Mediana (Me)
Acest lucru trimite la ideea utilizării frecvenţelor cumulate absolute ascendente (Ni
asc) şi respectiv relative (Fi asc). Deoarece Ni variază între 0 şi n iar Fi între 0 şi 1,
locul medianei corespunde valorii Ume, numită unitate mediană, care se calculează
după relaţia Ume = n/2 şi respectiv Ume = 1/2.
Când n<100 unitatea mediană se calculează după relaţia Ume = (n+1)/2.
1 5 1 5
2 10 2 10
3 20 3 20
Me = (20+25)/2 = 22,5
25 4 25
35 35
n=5 42
Me = 20 Ume = (n+1)
(n+1)/2 = 3,5
20<Me<25
b) Calcul pe baza unui tabel de distribuţie statistică pentru o caracteristică
discretă cu frecvenţe
Frecvenţ
frecvenţa Frecvenţ a
nota efectivul cumulată a cumulată
xi ni Ni fi Fi
3 4 4 0,04 0,04
4 33 37 0,29 0,33
Ume = 112/2 = 56 5 27 64 0,24 0,57 Ume = 1/2 = 0,5
(Ni>Ume; 64>56) 6 17 81 0,15 0,72
Me = 5 7 14 95 0,13 0,85
8 6 101 0,05 0,90
9 7 108 0,06 0,96
10 4 112 0,04 1,00
Total 112
c) Calcul pe baza unui tabel de distribuţie statistică pentru o caracteristică
continuă
Timpul de Numărul
deplasare zilnică persoanelor
(în minute) chestionate xi ni fi% ai Ci fmi Ni asc Ni desc
unde:
Fiind o mărime medie cu poziţie centrală într-o serie statistică ordonată, mediana se
poate afla pe cale grafică folosind curbele frecvenţelor cumulate. Mediana este
reprezentată pe ordonată de valoarea corespunzătoare Ume de pe abscisă.
Fi asc Fi desc
0 0 2000
30 250 1750
60 750 1250 Ume=1000
90 1350 650
120 1800 200
150 1950 50
180 2000 0
Proprietăţile medianei
Mediana este valoarea caracterului care este cea mai apropiată de toate
celelalte valori, minimizând distanţele calculate în valori absolute.
Aplicaţii în geografie
x
i=1
i
x=
n
unde n este numărul de elemente
Tabel 1 : salariile
nominale în
întreprinderea
“Egalitatea”
n° Categoria Salariul Exerciţiu : Care este salariul mediu în întreprinderea “Egalitatea”?
(RO$) n
1 ucenic 1300 x
i=1
i
2 ucenic 1300 x=
3 ucenic 1500 n
4 ucenic 1700 Răspuns: masa salarială totală fiind de 200 000 RO$
5 ucenic 1700 iar numărul total al salariaţilor de 20, se obţine un
6 muncitor 2100 salariu mediu de 10 000 RO$.
7 muncitor 2100
8 muncitor 2300
9 muncitor 2500 Acest salariu mediu nu reflectă, în mod evident, decât
10 muncitor 2700 cu totul imperfect salariul încasat de fiecare salariat în
11 muncitor 2900 parte. Dacă eliminăm salariul directorului, salariul
12 muncitor 2900 celorlalţi 19 salariaţi nu va fi în medie decât (100 000 /
13 maistru 4500 19) = 5 263 RO$ . Dacă eliminăm din analiză şi
14 maistru 4500 directorii adjuncţi atunci salariul celor 17 lucrători
15 maistru 5000 rămaşi nu va fi în medie decât 2 941 RO$ ...
16 maistru 5500
17 maistru 5500 Se observă prin urmare că în acest exemplu media este
18 director 20000 un rezumat foarte prost al distribuţiei din cauza
adjunct
prezenţei valorilor excepţionale (directorul) şi a unei
19 director 30000
adjunct puternice disimetrii a histogramei (concentrarea
20 director 100000 salariilor în zona valorilor mici şi dispersia lor în zona
general
valorilor mari).
total 200000
Tabel 1 : Salariile Tabel 2 : Salariile medii pe categorii socioprofesionale
nominale în în întreprinderea “Egalitatea”
întreprinderea
“Egalitatea” categoria salariul mediu efectivul
xi pi xi*pi
n° Categoria Salariul
1 ucenic 1300 ucenici 1500 5 7500
2 ucenic 1300
3 ucenic 1500 muncitori 2500 7 17500
4 ucenic 1700
maiştri 5000 5 25000
5 ucenic 1700
6 muncitor 2100
directori adjuncţi 25000 2 50000
7 muncitor 2100
8 muncitor 2300
director general 100000 1 100000
9 muncitor 2500
10 muncitor 2700
total 200000??!! 20 200000
11 muncitor 2900
12 muncitor 2900
Calculul mediilor ponderate
13 maistru 4500
14 maistru 4500 Adesea liniile unui tabel elementar corespund unei mulţimi de indivizi şi nu unor
15 maistru 5000 indivizi. În acest caz valorile caracterului corespund deja unor medii iar media
generală va trebui să pondereze fiecare valoare a caracterului cu numărul de indivizi
16 maistru 5500
pe care îi reprezintă. Dacă notăm cu x modalităţile şi cu p ponderea lor atunci
17 maistru 5500 formula de calculare a mediei devine :
18 director 20000 n
adjunct
19 director 30000 xi * pi
i=1 (x ) = (7500+17500+25000+50000+100000)/20 = 10000
adjunct
x= n
20 director 100000
general
pi
total 200000 i=1
Media raporturilor şi raportul mediu
Calcularea raportului mediu presupune deci efectuarea unei medii ponderate care ar ajunge la
o valoare de 3727 $ pe locuitor. Astfel, PIB-ul unei Chine reunificate nu ar creşte decât cu 237
$ pe locuitor faţă de situaţia actuală.
Tabel 1 : Salariile
nominale în b) Calcularea mediei plecând de la un tabel de distribuţie statistică
întreprinderea
“Egalitatea” Tabel 3 : Gruparea salariaţilor
pe tranşe de salarii
n° Categoria Salariul
salarii efective frecvenţe amplitudinea Centrul frecvenţa medie
1 ucenic 1300 xi ni fi ai ci fmi
2 ucenic 1300
[1000 ; 2000[ 5 25% 1000 1500 0,00500
3 ucenic 1500
[2000, 4000[ 7 35% 2000 3000 0,00350
4 ucenic 1700
5 ucenic 1700 [4000; 100000] 8 40% 96000 52000 0,00008
6 muncitor 2100
Deoarece din tabel nu se mai poate cunoaşte repartiţia exactă a salariilor în interiorul
7 muncitor 2100
clasei, vom presupune că valoarea care este centrul clasei corespunde mediei
8 muncitor 2300 lucrătorilor grupaţi în această clasă. Calculul va fi prin urmare efectuat astfel: se
9 muncitor 2500 acordă celor 5 indivizi din prima clasă un slariu de 1500 RO$, celor 7 indivizi din a
doua clasă un salariu de 3000 RO$ şi celor 8 indivizi din ultima clasă un salariu mediu
10 muncitor 2700
de 52000 RO$ apoi se aplică formula
11 muncitor 2900
n
ni * ci
12 muncitor 2900 5*1 500 = 7 500
7*3 000 = 21 000
13 maistru 4500
x= i=1 8*52 000 = 416 000
14 maistru 4500 (7 500 + 21 000 + 416 000)/20 = 22 225
15 maistru 5000 n
16 maistru 5500
17 maistru 5500
18 director 20000 Salariul mediu este atunci, în teorie, 22 225 RO$ ! Această valoare este mult mai
adjunct ridicată decât salariul mediu real deoarece centrele ultimelor două clase nu sunt
19 director 30000 reprezentative şi sunt mult mai ridicate decât media claselor cărora le corespund
adjunct (respectiv 2500 RO$ şi 21 875 RO$).
20 director 100000
general În acest caz salariul modal rezumă mai bine distribuţia?
total 200000
Dezavantajul mediei aritmetice este că, întrucât ia în consideraţie ordinul de mărime al tuturor
valorilor, devine sensibilă la valorile foarte mari sau foarte mici . Aceste valori extreme pot fi
deseori puţin semnificative, excepţionale sau chiar aberante (erori grosiere de observaţii sau
măsurători). În felul acesta media nu mai reflectă corect tendinţa centrală a distribuţiei statistice .
Pe de altă parte, media „comprimă” excesiv valorile extreme, comparativ cu cele aflate
mai spre centrul repartiţiei. La distribuţiile simetrice faptul acesta contează mai puţin, însă la cele
cu asimetrie pronunţată situaţia se schimbă.
Exemplu. Într-o zonă cu climat arid şirul de precipitaţii anuale (în mm) înregistrate pe
10 ani consecutivi etalează următoarele valori:
Este clar că mediana, şi chiar modul, reflectă mai corect condiţiile pluviometrice din
deşert; faţă de acestea media este „trasă” în sus de către cele două valori foarte mari. Rezultă de
aici şi dezavantajul de a folosi o singură valoare centrală pentru caracterizarea unei distribuţii.
Proprietăţile aritmetice ale mediei sunt următoarele:
n
1. Suma abaterilor valorilor din şir de la medie este nulă:
( xi - x ) = 0
i=1
2. Dacă valorile din şir se modifică prin adăugarea/scăderea unei constante, atunci media
creşte/scade cu aceeaşi constantă :
x 'i = x i a x = x a
n
di
3. Dacă y este media unui alt şir şi di sunt diferenţele (xi - yi), atunci x = y + i=1 = y + d
n
Această proprietate este utilă, spre exemplu, în climatologie şi hidrologie pentru prelungirea şirurilor de
observaţii.
4. Suma pătratelor abaterilor valorilor din şir de la media lor aritmetică este minimă:
n
2
i( x - A ) = minim , unde A =x
i=1
Această proprietate este larg utilizată în calculele ulterioare implicate de analizele distribu ţiilor
statistice.
Atenţie: a nu se confunda cu mediana, care minimizează valorile absolute ale distanţelor şi nu
distanţele ridicate la patrat.
Valorile centrale şi formele distribuţiilor
Compararea celor trei valori centrale sau examenul histogramelor permit definirea formei
distribuţiilor. În funcţie de forma unei distribuţii, cel mai bun rezumat va fi furnizat de una sau de
alta dintre valorile centrale.
Distribuţiile bimodale sau multimodale
Distribuţia are mai multe moduri. Modul principal este diferit de medie şi de mediană, care au
şanse mari să corespundă unei zone de dispersie a valorilor. În acest caz nici media şi nici
mediana nu sunt semnificative iar distribuţia nu poate fi rezumată de o singură valoare, fiind
compusă din două grupuri foarte diferite şi prin urmare cel mai bun rezumat este dat de
modurile principal şi secundar al distribuţiei.
Distribuţiile unimodale şi simetrice
Când distribuţia este unimodală şi simetrică se observă că media = mediana = modul iar cel
mai bun rezumat este dat de medie, deoarece ea ţine cont de toate observaţiile şi are
proprietăţile statistice cele mai interesante.
Distribuţii unimodale asimetrice :
Astfel de distribuţii prezintă două cazuri principale:
- modul < mediana < media : distribuţia este asimetrică la stânga, adică se înregistrează
o concentrare a valorilor mici şi o dispersie a valorilor mari; acesta este cazul cel mai frecvent.
- media < mediana <modul : distribuţia este asimetrică la dreapta, adică se înregistrează
o dispersie a valorilor mici şi o concentrare a valorilor mari; acest caz este mai rar decât
precedentul.
Atunci când asimetria este foarte evidentă, mediana este în general preferabilă mediei, deoarece
ea este mai puţin influenţată de valorile excepţionale, care sunt adesea la originea asimetriei.
Dacă asimetria este foarte puţin marcată este de preferat utilizarea mediei.
Valorile centrale: cele şase proprietăţi ale lui YULE
Statisticianul Yule (sec. XIX) a definit 6 proprietăţi de dorit pentru valorile centrale.
(1) Să fie definite în mod obiectiv
Două persoane care prelucrează aceeaşi informaţie trebuie să ajungă la acelaşi rezultat în ceea ce priveşte
calcularea valorilor centrale (adevărat pentru medie şi pentru mediană dar nu pentru mod, care depinde de
alegerea claselor în urma grupării).
Cele şase proprietăţi ale lui Yule sunt mai mult sau mai puţin bine verificate de fiecare valoare
centrală. Deși în general se preferă media în locul medianei şi a modului, trebuie să se ţină
seama de caracteristicile distribuţiei atunci când se alege o valoare centrală sau alta.
Cunoaşterea valorilor centrale este întotdeauna preţioasă, deoarece ea permite să fie vizualizată
imediat forma aproximativă a distribuţiei . Din păcate valorile centrale nu oferă informaţii asupra
dispersiei valorilor, adică asupra depărtării lor faţă de valorile centrale . Este necesar prin urmare
să asociem fiecărei valori centrale câte un parametru de distribuţie.