Sunteți pe pagina 1din 40

Capitolul IV

INDICATORII TENDINŢEI CENTRALE

4.1. NECESITATEA UTILIZĂRII INDICATORILOR


TENDINŢEI CENTRALE PENTRU
FUNDAMENTAREA DECIZIILOR
Orice businessman sau manager înainte să decidă trebuie să
cunoască manifestările individuale ale fenomenelor de masă din domeniul
lui de activitate. Riscul în orice iniţiativă este cu atât mai mic cu cât
cunoaşterea este mai profundă. Aceasta demonstrează că adoptarea oricărei
decizii este precedată de cunoaşterea manifestărilor acestor fenomene
social-economice de masă.
Fenomenele de masă se caracterizează în principal prin
variabilitatea formelor de manifestare, determinată de acţiunea combinată
în sensuri diferite a unui complex de factori sistematici sau întâmplători,
obiectivi sau subiectivi, esenţiali sau neesenţiali, identificaţi direct sau
indirect. Fenomenele de masă social-economice intră, deci, sub incidenţa
aleatorului, sub incidenţa legilor statistice. Acestea se manifestă nu la
nivelul fiecărei unităţi din colectivitatea investigată ci la nivelul
colectivităţii, ca tendinţă. Abaterile de la tendinţă se compensează
obiectiv reciproc.
Prin urmare, fundamentarea deciziilor presupune cunoaşterea la
nivelul colectivităţii investigate a tendinţei, a ceea ce este obiectiv,
esenţial, comun şi stabil în formele individuale de manifestare a
fenomenelor; în acest scop este necesar, deci, să se determine indicatori
sintetici adecvaţi.
Indicatorii cu care se caracterizează tendinţa centrală din forma de
manifestare a fenomenelor de masă au ca principală funcţie aceea de a
sintetiza în aşa manieră valorile individuale înregistrate ale caracteristicilor
urmărite astfel încât să fie posibilă substituirea acestora fără să modifice
esenţa şi relaţia obiectivă dintre date. Indicatorii sintetici ai tendinţei
centrale trebuie să fie acceptaţi fără ambiguitate şi trebuie înţeleşi de toată
lumea în acelaşi fel. Valorile lor calculate trebuie să fie valori tipice şi nu
valori arbitrare sau subiective.
Indicatorii tendinţei centrale se determină în general ca indicatori
medii sau indicatori de poziţie (ai localizării), în funcţie de natura
88 Statistică generală
caracteristicilor (variabilelor) urmărite în colectivitatea investigată, de
scopul investigaţiei etc. Sunt dese situaţiile când tendinţa centrală se
caracterizează printr-un anumit tip de medie (aritmetică, armonică, pătratică,
geometrică etc.), dar şi situaţii de utilizare a indicatorilor sintetici de poziţie
(sau localizare - modul, cuantile).
Pentru cunoaşterea obiectivă a tendinţei centrale, elaborarea şi
utilizarea corectă a indicatorilor sintetici este esenţială îndeplinirea unor
cerinţe de principiu, generale. În acest sens, Yule (1945) precizează
condiţiile care ar trebui să le îndeplinească un astfel de indicator şi anume:
- să fie definit în mod obiectiv, independent de dorinţa
utilizatotului;
- să depindă determinarea sa de toate valorile individuale
înregistrate;
- să aibă o semnificaţie concretă, uşor de înţeles chiar şi de
nespecialişti;
- să fie simplu şi rapid de calculat;
- să fie puţin sensibil la fluctuaţiile de selecţie (să nu prezinte
valori puternic diferite, dacă se calculează pe baza mai multor
eşantioane, de acelaşi volum, extrase prin acelaşi procedeu din
aceeaşi colectivitate);
- să se preteze la calcule algebrice (să poată fi utilizat în operaţii de
comparare a mai multor serii statistice sau în operaţii de
agregare/dezagregare).
În general, indicatorii tendinţei centrale calculaţi ca mărimi medii
sau ca medii de structură (localizate) nu satisfac toate condiţiile prevăzute
mai sus. Utilizatorul trebuie, însă, să fie interesat să cunoască condiţiile
neîndeplinite şi implicaţiile acestora pentru fundamentarea deciziilor.

4.2. INDICATORI MEDII


Pentru caracterizarea tendinţei centrale, din manifestarea unui fenomen
de masă, se calculează media valorilor individuale ale caracteristicii urmărite.
Media este o măsură a tendinţei centrale; condiţiile lui Yule fiind îndeplinite
în mod satisfăcător, iar valoarea sa calculată sintetizează într-un singur
nivel reprezentativ tot ceea ce este tipic, esenţial, comun şi obiectiv în
apariţia şi manifestarea fenomenelor de masă. Media se exprimă în unităţi
concrete de măsură, dar are un caracter abstract deoarece valoarea ei
calculată poate să coincidă sau nu cu vreo valoare individuală înregistrată
de variabilă numerică urmărită. Ea are un conţinut cu atât mai real cu cât
este mai reprezentativă cu cât valorile individuale din care se calculează
sunt mai omogene, mai apropiate, ca mărimi, între ele. Numai în aceste
Capitolul IV 89
condiţii în vecinătatea valorii medii se concentrează cele mai multe valori
individuale înregistrate, iar sintetizarea lor într-o singură valoare se
efectuează pe baza unei realităţi obiective.
Calculul mediei, ca măsură a tendinţei centrale, trebuie deci să fie
precedată de verificarea omogenităţii colectivităţii după caracteristica
urmărită. În cazul în care mulţimea valorilor individuale înregistrate este
eterogenă, chiar şi după eliminarea datelor aberante, colectivitatea se
structurează pe grupe omogene, iar apoi se calculează adecvat medii
parţiale (pe grupe). În aceste condiţii media unei caracteristici pe întregul
ansamblu apare ca o sinteză adecvată a mediilor parţiale.
În funcţie de natura caracteristicii urmărite, de scopul investigaţiei,
nivelul mediu al acesteia se calculează ca medie aritmetică, armonică,
pătratică, geometrică etc. Indiferent de tipul de medie adoptat, pentru
caracterizarea tendinţei centrale, media se calculează în funcţie de natura
obiectivă dintre date dar şi în funcţie de forma de repartizare a frecvenţelor,
ca medie simplă sau ponderată. Mediile simple se calculează atunci când se
utilizează toate variantele înregistrate. În cazul în care după
sistematizarea/gruparea datelor, (valorile individuale prezintă frecvenţe diferite
de apariţie) nivelul mediu se calculează ca medie ponderată.

4.2.1. Media aritmetică ( x )


În sens statistic, media aritmetică (sau momentul iniţial de ordinul
unu) a valorilor individuale x1,x2,...xn ale caracteristicii numerice X
reprezintă acea valoare ( x ) care s-ar fi înregistrat dacă toţi factorii de
influenţă ar fi acţionat constant (cu aceeaşi intensitate) la nivelul
fiecărei unităţi de înregistrare. Aceasta înseamnă că media aritmetică ( x )
dacă ar substitui fiecare valoare inviduală xi (cu i = 1, n ) valoarea totalizată
obiectiv formată a caracteristicii nu s-ar modifica. Prin urmare, fiind
obiectivă aditivitatea valorilor individuale avem:
n
∑ xi = nx (4.1) ⇒
i =1
n
∑ xi
i =1
⇒x= (4.2)
n
Aplicaţia 4.1. Opt experţi au cotat o iniţiativă cu următorul punctaj
(din 20): {3,5,7,9,10,11,12,18}. Punctajul mediu obţinut de respectiva
iniţiativă este:
90 Statistică generală
3 + 5 + 7 + 9 + 10 + 11 + 12 + 18
x= = 9,375 /expert - puncte acordate
8
în medie de un expert.
Observaţii şi proprietăţi utile în analiză:
1) Definiţia dată mediei aritmetice (4.2) este adevărată numai dacă
valorile individuale înregistrate sunt numerice. Pentru o serie cu valori
nenumerice sau cu valori măsurabile pe o scală nominală sau ordinală nu se
poate calcula media aritmetică.
2) Mărimea calculată a mediei aritmetice este unică; o serie nu
posedă mai multe medii aritmetice distincte.
3) Mărimea mediei aritmetice poate să coincidă sau nu cu vreo
valoare individuală înregistrată, dar precis ea încadrează între valoarea
minimă şi maximă.
Demonstraţie
Dacă simbolizăm prin x min = min{x 1 , x 2 ,..., x n } şi prin
x max = max{x1 , x 2 ,..., x n } atunci x min ≤ x ≤ x max .
x 1 + x 2 + ... + x n ≥ x min + x min + ... + x min = nx min
1444 424444 3
de n ori
şi
x 1 + x 2 + ... + x n ≤ x max + x max + ... + x max = nx max
1444 424444 3
de n ori
Deci,
nx min ≤ x 1 + x 2 + ... + x n ≤ n ⇒ x min ≤ x ≤ x max
Această proprietate nu trebuie privită şi interpretată mecanic,
deoarece ea în substanţă demonstrează că nivelul mediu este mai aproape de
xmin sau de xmax în funcţie de ordinul de mărime al valorilor individuale şi
de frecvenţa (absolută sau relativă) acestora.
4) Prin definiţie, media aritmetică este legată de toate valorile
numerice înregistrate şi, în consecinţă, este sensibilă la prezenţa valorilor
aberante. Astfel, seria {1, 1, 2, 2, 2, 4, 4, 70} posedă o singură valoare
aberantă (ultima), foarte diferită de celelalte. Media calculată din primele 8
valori individuale (după eliminarea valorii aberante) este egală cu 2,5 ceea
ce reprezintă o valoare centrală "rezonabilă". Dimpotrivă, adăugând şi
ultima valoare se obţine o medie egală cu ≈ 10, nereprezentativă, pentru
seria luată în considerare.
5) Suma diferenţelor dintre toate valorile individuale înregistrate şi
media lor aritmetică este nulă. Această proprietate fiind valabilă pentru
aditivitatea valorilor individuale demonstrează că în condiţiile acţiunii
Capitolul IV 91
exclusive a factorilor întâmplători abaterile pozitive şi negative faţă de
tendinţă, la nivelul ansamblului, se compensează reciproc. Această
proprietate îi dă mediei, în principiu, caracterul de centru de greutate al
ansamblului de date înregistrate.
n n
(x − x) = i=1
Deci, i=1 i
xi − nx = nx − nx = 0 (4.3)
6) Într-o colectivitate statistică, suficient de mare, unde, de obicei,
multe unităţi prezintă pentru o aceeaşi caracteristică (există deci, o
distribuţie de frecvenţe) media aritmetică se calculează ca o medie
aritmetică ponderată. Raţionamentul care stă la baza calculului acesteia este
similar cu cel al mediei aritmetice simple (4.2).
Astfel,
k k
∑ x j n j = x 1n 1 + ... + x k n k = xn 1 + ... + xn k = x ∑ n j (4.4) ⇒
j=1 j=1
k
∑ x jn j
j=1
⇒x= k
(4.5)
∑nj
j=1
unde:
k = numărul variantelor (intervalelor distincte)
nj = frecvenţa variantei distinctive (clasei, grupei sau intervalele de
variaţie) j ( j = 1, k )
k
∑ n j = reprezintă efectul total al colectivităţii sau numărul total de
j=1
valori individuale înregistrate de X (volumul universului observat statistic).
nj
Dacă ţinem seama de frecvenţele relative, f j = k , de apariţie a
∑nj
j=1
valorilor individuale relaţia precedentă devine:
k

k
∑ x jf j
j=1
x = ∑ x j f j sau x = (4.6)
j=1 100
7) În cazul în care frecvenţele relative sau absolute sunt egale între
ele atunci relaţiile de determinare a medie aritmetice simple sau ponderate
echivalente. Afirmaţia este evidentă.
92 Statistică generală
Aplicaţia 4.2. Să considerăm că în contul bancar al unei societăţi
comerciale în 10 zile s-au înregistrat următoarele intrări:
- seria de date observate: {1, 0, 1, 2, 1, 1, 3, 0, 1, 0} ⇒
- seria de date ordonate: {0, 0, 0, 1, 1, 1, 1, 1, 2, 3} ⇒
- distribuţia valorilor observate va fi:
{(0, 3), (1, 5), (2, 1), (3, 1)}
Calculul numărului mediu de intrări ca medie aritmetică ponderată
necesită, uneori, construirea următorului tabel:

Tabelul 4.1.

Număr de intrări în cont xj Număr de zile nj xjnj


x1=0 n1=3 x1n1=0
x2=1 n2=5 x2n2=5
x3=2 n3=1 x3n3=2
x4=3 n4=1 x4n4=3
TOTAL 10 3xjnj

sau

Tabelul 4.2.

fj xjfj
f1=0 x1f1=0
f2=1 x2f2=0,5
f3=2 x3f3=0,2
f4=3 x4f4=0,3
3fj=1,0 3xjfj=1,0

Aplicând relaţia de calcul a mediei aritmetice ponderate se va observa


că aceasta va fi aceeaşi şi egală cu 1; adică în medie o intrare pe zi, din perioada
de timp urmărită.
8) În cazul în care se dispune de o distribuţie pe grupe, (fără să existe
datele iniţiale), nu este posibilă determinarea mediei aritmetice ca în seria
brută, deoarece nu se cunosc decât limitele extreme ale intervalelor de
grupare. Pentru a calcula o valoare apropiată de o valoare reală a mediei
aritmetice se face o convenţie şi în locul valorilor xj se iau în considerare
centrele intervalelor de grupare, calculate după relaţia:
limita inf erioara+limita superioara
xj = 2 ; unde (4.7)
Capitolul IV 93

xj = centrul intervalului de grupare j (j = 1, k).


Această convenţie este indusă de următoarea ipoteză: în interiorul
tuturor intervalelor de grupare, frecvenţele sunt uniform distribuite. În
practică, această ipoteză se verifică foarte rar, motiv pentru care între media
calculată pe baza centrelor de interval şi cea calculată pe baza datelor
iniţiale există diferenţe. Mai mult, se spune că media determinată pe baza
centrelor intervalelor (grupelor) estimează cu anumită eroare adevărata
valoare medie.
Aplicaţia 4.3. Distribuţia a 175 societăţi comerciale după încasările
lunare realizate din desfacerea aceluiaşi sortiment de mărfuri se prezintă
astfel:

Tabelul 4.3.
Distribuţia societăţilor comerciale după volumul încasărilor lunare

Grupe de societăţi Număr Centrul de Încasările totale


comerciale după societăţi interval estimate pe intervale
volumul încasările comerciale (mil. lei) de grupare (mil. lei)
lunare (mil. lei) nj xj x jn j
1 2 3 4
149,5 - 156,5 12 153 1836
156,5 - 163,5 12 160 1920
163,5 - 170,5 29 167 4843
170,5 - 177,5 47 174 8178
177,5 - 184,5 42 181 7602
184,5 - 191,5 22 188 4136
191,5 - 198,5 11 195 2145
7
TOTAL 175 - ∑ x j n j = 30660
i =1

Pe baza datelor din tabelul de mai sus încasarea medie lunară a unei
societăţi din cele 175 este:
30660
x= = 175,2 mil. lei/societate comercială
175
9) Exemplul prezentat evidenţiază faptul că în cazul în care se
dispune de un volum mare de date (de un număr apreciabil de grupe)
calculul manual al mediei aritmetice este destul de greoi. Acest inconvenient
poate fi înlăturat dacă se iau în considerare valorile centrale faţă de o
constantă oarecare „a” şi reduse de un anumit număr de ori (h):
94 Statistică generală
xj −a
uj = (4.8)
h
Deoarece media aritmetică a distribuţiei {(Uj, nj), j = 1,2,..,k} este
k
∑ U jn j xj −a
j=1
U= k
= (4.9),
h
∑nj
j=1

atunci media aritmetică a datelor de valori individuale x j (1, k ) din serie


este dată de relaţia următoare:
x = uh + a (4.10)
În mod curent, valoarea lui "a" se ia egală cu aceea a centrului de
interval cu frecvenţa cea mai mare, iar valoarea lui "h" se ia egală cu
mărimea intervalului de grupare (în cazul distribuţiei pe intervale egale) sau
cu cea a celui mai mare divizor comun al valorilor {xj − a}( cu j = 1, K).
Aplicaţia 4.4. Pe baza datelor din aplicaţia 4.3 media aritmetică se
calculează pe baza relaţiei (4.10) efectuând următoarea desfăşurare:

Tabelul 4.4.

xj −a
xj nj
Uj = h ujnj
a=174; h=7
153 12 -3 -36
160 12 -2 -24
167 29 -1 -29
174 47 0 0
181 42 1 42
188 22 2 44
195 11 3 33
7
TOTAL 175 - ∑ x j n j = 30
i =1

k
∑ U jn j
j=1 30
Se observă că, U = k
= = 0,1714 , iar valoarea mediei
175
∑nj
j=1

aritmetice după (4.10) este x = 0,1714 × 7 + 174 = 175,2 mil. lei/societate


comercială; valoarea identică cu cea obţinută la aplicaţia 4.14.
Capitolul IV 95
9) În cazul în care colectivitatea generală este structurată, valoarea
medie a caracteristicii studiate se calculează ca medie aritmetică ponderată
(uneori simplă) a mediilor parţiale. Astfel, să presupunem că o serie
statistică cu "n" unităţi se structurează în două clase omogene de mărime na
şi nb.
Pentru fiecare clasă s-au calculat mediile aritmetice parţiale x a şi
x b , ale aceleiaşi caracteristici (X). Valoarea medie a caracteristicii (X) pe
ansamblul colectivităţii se va calcula după relaţia:
n axa+n bxb
x= x= n a+n b (4.11)
Generalizând, s-ar putea determina media variabilei numerice
observate X, într-o populaţie (eşantion) structurată după un criteriu
(caracteristică) prestabilit, în funcţie de mediile parţiale după relaţia
următoare:
p
∑ x ln l
l =1
x=x= p
(4.11.1)
∑ nl
l=1

unde: x l = media clasei (partiţiei) l;


n l = numărul de unităţi din partiţia l;
k = numărul de partiţii ale populaţiei studiate
În relaţiile prezentate pentru calculul mediei (inclusiv în 4.11 şi
4.11.1) se pot utiliza nunumai frecvenţe absolute ci şi relative (exprimate în
coeficienţi sau în procente).
Compararea mai multor medii aritmetice ponderate, când frecvenţele
sunt diferite între ele, poate să introducă erori în fundamentarea deciziilor
deoarece în analiza comparată a fenomenului îşi pune amprenta atât
modificarea structurii cât şi variaţia valorilor individuale.
Acest efect "shift and share" prezintă în analiză imprtanţă prin:
- interes economic: relativizează fenomenele; explică o realitate
mascată; descompune o variabilă în mai multe componente;
- interes statistic: necesită o reinterpretare a mediei sau o analiză
critică a rezultatelor medii, fără să se dea impresia că valorile medii
calculate pot să falsifice realitatea.
Principiul "shift and share" are largi utilizări în analizele economice
mai ales atunci când se iau în considerare structuri diferite cum sunt cele
din economia teritorială, demografie, analiza utilizării forţei de muncă
pe sexe şi calificări etc.
96 Statistică generală
11) În cazul în care caracteristica urmărită este alternativă, calculul
nivelului său mediu, în mod convenţional, se face astfel:
- unităţile colectivităţii se împart în două grupe: una formată din
unităţile la care se înregistrează forma directă de manifestare a caracteristicii şi o
alta formată din acele unităţi la care s-a înregistrat opusul formei directe de
manifestare;
- în mod convenţional, această caracteristică alternativă se exprimă numeric
după cum urmează: se acordă valoarea 1 pentru variantele cu răspuns afirmativ
(forma directă) şi valoarea zero variantelor cu răspuns negativ (forma opusă);
- se elaborează distribuţia din tabelul 4.5. şi se calculează valoarea
medie după relaţia (4.5.)

Tabelul 4.5.
Distribuţia generală a frecvenţelor după o caracteristică numerică

Varianta Răspunsul Frecvenţe


Frecvenţe relative
caracteristicii (xi) înregistrat absolute
N - unităţi care
x=1 DA posedă N
caracteristica p = N+M
M - unităţi care
x=0 Nu nu posedă M
caracteristica q = N+M = 1− p
TOTAL - N+M p+ q= 1

Media aritmetică a caracteristicii alternative este o mărime relativă


de structură, deoarece:
1%N+0%M N
N+M = N+M = p; (4.12)

unde p = procentul unităţilor care posedă forma directă a caracteristicii.


12) În cazul a două variabile numerice independente X şi Y observate
avem proprietăţile:
• X±Y =X±Y
(4.13)
• XY = X × Y
Dacă, însă, variabilele X şi Y sunt dependente, atunci XY ≠ X × Y iar
diferenţa Cov( x, y) = XY − X × Y se numeşte covarianţa valorilor
înregistrate pentru cele două variabile.
13) Din motive practice (de simplificare), deseori, analiza statistică se
realizează prelucrând valorile centrate în media aritmetică. Adică,
Capitolul IV 97

x ic = x i − x (4.14)
Unde: x ic = valoarea centrată a valorii individuale xi.
Deci, în situaţia observaţiilor realizate pentru m variabile numerice,
matricea acestora este:
 x 11 x 12 ... x 1n 
 
X =  ... ... ... 
x 
 m1 x m 2 ... x mn 
iar matricea valorilor centrate va fi
 x 11 − x 1 x 12 − x 2 ... x 1n − x n   x1 x2 ... x n 
   
X c = X − X =  ... ... ...  , cu X =  ... ... ... 
   
 x m1 − x 1 x m2 − x 2 ... x mn − x n   x1 x2 ... x n 
În cazul în care se operează cu asemenea valori centrate, media acestora
este egală cu zero:
n n

c
∑ x ic ∑ (x i − x)
i =1 i =1
xi = == x−x =0 (4.15)
n n
14) Într-o serie cronologică continuă pentru care s-au calculat
modificările absolute cu bază mobilă (tranzitivă) şi care prezintă valori
apropiate, atunci modificarea medie absolută pentru întregul orizont al seriei se
determină prin relaţia:
T
∑ ∆xt / t −1 xT − x0
t =1
∆x = =
T −1 T −1

4.2.2. Media armonică ( x h )


Media armonică, ca măsură a tendinţei centrale într-un ansamblu de
observaţii cantitative, se defineşte ca valoare inversă a mediei aritmetice a
inverselor valorilor individuale înregistrate. Aplicarea mediei armonice
pentru exprimarea numerică a tendinţei centrale are sens numai dacă este
obiectivă însumarea inverselor valorilor individuale. Deci, relaţia de calcul a
mediei armonice simple este următoarea:
1 n
xh = = n
( x1i ) x1i
i=1 (4.16)
Aplicaţia 4.5. Să presupunem că se efectuează trei investiţii care
produc acelaşi venit. Ratele lor de randament sunt următoarele: 5%, 10%, şi
98 Statistică generală
15%. Rata medie cu care trebuie plasat capitalul pentru a produce venitul
total al celor trei investiţii va fi calculată ca medie aritmetică a
randamentelor individuale:
3 3
xh = 1 1
+ 10 1
+ 15
= 11 = 8, 18%
5 30
Acest rezultat, după cum se observă, este diferit de valoarea
calculată a mediei aritmetice, care este de 10%.
Aplicaţia 4.6. O persoană cheltuieşte 40.000 lei pentru aprovizionarea
cu trei tipuri de cafea, de calităţi diferite. Preţurile unitare sunt 8.000 lei şi
16.000 lei. Preţul mediu au unui kilogram de cafea se obţine raportând costul
total la cantitatea totală cumpărată:
costul total 3%40000 120000
preţ mediu = cantitatea totala‘ = 5+4+2,5 = 11,5 = 10434,8 lei/kg
Acelaşi rezultat s-ar fi obţinut dacă s-ar fi calculat media armonică a
preţurilor unitare corespunzătoare celor 3 calităţi:
3
1 1 1 = 10434, 8lei/ k g
preţ mediu = 800 + 10000 + 16000
Aplicaţia 4.7. Să presupunem că pentru efectuarea unei operaţii un
lucrător cheltuieşte 15 minute, iar altul 30 minute. Care este timpul mediu
consumat?
Dacă s-ar calcula rapid media aritmetică, s-ar constata că timpul
mediu consumat ar fi 22,5 minute. Pentru a verifica veridicitatea rezultatului
efectuăm următorul raţionament. Într-o oră primul lucrător a executat 60 :
15 = 4 operaţii, iar al doilea 60 : 30 = 2 operaţii. Aceasta înseamnă că
amândoi lucrătorii au efectuat 6 operaţii. Timpul mediu calculat prin
raportarea timpului total lucrat la numărul total al operaţiilor executate este:
60+60 1+1
60 60 = 1 1 = 20
15 + 30 15+ 30 minute/operaţie
Acest rezultat este inferior celui anterior, de 22,5 minute. Care este,
însă, rezultatul corect?
În ipoteza unui consum de timp egal cu timpul mediu de 20 minute,
60 60
într-o oră lucrătorii ar fi efectuat 20 + 20 = 6 operaţii, un număr egal cu cel
efectiv realizat. Dacă timpul mediu ar fii de 22,5 minute, numărul total de
60 60
operaţii efectuate de cei doi lucrători ar fi fost 22,5 + 22,5 = 5 operaţii,
diferit de cel real. Prin urmare, în această aplicaţie timpul mediu consumat
este raţional dacă el se calculează ca media armonică.
Pentru o serie de distribuţii de frecvenţe media armonică ponderată
se calculează după relaţia:
Capitolul IV 99
k

j=1
nj
xh = k

j=1
1
xj n j
(4.17)
dacă se utilizează frecvenţele absolute şi după relaţia:
100
xh = k

j=1
1
xj f j
(4.18)
dacă se utilizează frecvenţele relative.
Se impun câteva observaţii:
1) Pentru aceleaşi valori pozitive, media armonică este mai mică
decât media aritmetică;
2) În cazul în care între două variabile există o relaţie de inversă
1
proporţionalitate (y = x ) aceasta se păstrează şi între mediile calculate
pentru fiecare variabilă.
Spre exemplificare, considerăm valorile individuale ale
productivităţii muncii (Wi ) şi valorile consumului specific de timp de
1
muncă (ti). Între aceste valori există relaţia Wi = . Atunci,
t i.
∑ q i ∑ Wi Ti ∑ Ti ∑ Ti
W= i
= i
. În acelaşi timp, t = i
= i care este o
∑ Ti ∑ Ti ∑ Q i ∑ 1 Ti
i i i
i ti
medie armonică.
Deci relaţia de inversă proporţionalitate există între valorile lor
1
medii ( W = ) deoarece nivelul mediu de timp de muncă se calculează ca
t
media armonică şi nu ca medie aritmetică.
3) Media armonică este egală cu media aritmetică dacă sunt calculate
din aceleaşi valori individuale sau dacă se folosesc ponderi diferite şi
compuse: dacă pentru calculul mediei aritmetice se utilizează frecvenţe reale
(ni sau fi ), iar pentru media armonică se utilizează frecvenţe compuse (xi ni
sau xi fi ), atunci x = x h .
4) Dacă suma valorilor centrate în medie este nulă în cazul mediei
aritmetice, bazându-se pe obiectivitatea însumării valorilor individuale,
avem ∑ ( x i − x ) = 0 , în cazul mediei armonice avem:
i
100 Statistică generală

 1 1 
∑  − =0 (4.19).
i  xi x h 
5) Prin definiţie şi mod de calcul rezultatul determinării mediei
armonice este influenţat de prezenţa valorilor individuale mici şi de
frecvenţa acestora.
6) Media armonică se utilizează pentru exprimarea tendinţei centrale
în funcţie de scopul cercetării şi mai ales în funcţie de natura obiectivă
dintre valorile variabilei numerice observate. De cele mai multe ori, media
armonică se utilizează pentru calculul indicelui (sintetic) al preţurilor
mărfurilor şi tarifelor serviciilor (care sintetizează indicii individuali ai
acestor preţuri şi tarife). Relaţia de calcul a acestui indice este:
∑ q1jp1j
j 100
I1p/ 0 = sau I1p/ 0 = (4.20)
1 j j 1 q jp j
∑ p j q1p1 ∑ pj g1
j=1 i j=1 i
1/ 0 1/ 0

Unde: q1jp1j = valoarea sortimentului de marfă j în perioada curentă;


p
i1 /j 0 = valoarea indicelui preţurilor mărfurilor de sortiment j
(determinat la rândul său după relaţia 4.18);
qp
g 1 j j = ponderea sortimentului de mărfuri j în totalul cheltuielilor
efectuate (de gospodării din eşantion) în perioada curentă.

4.2.3. Media pătratică (sau momentul iniţial de ordinul


doi)
Media pătratică ( x p ) exprimă tendinţa centrală a valorilor numerice
înregistrate pentru variabila observată dacă are sens obiectiv însumarea
pătratelor valorilor individuale. Ea reprezintă acea valoare a caracteristicii
care dacă ar înlocui fiecare valoare individuală din serie suma pătratelor
termenilor seriei nu s-ar modifica.
Deci,
n 2 2 2
x 2 = x 2i + ... + x 2n = x p + ...x p = nx p
i=1 i (4.21)
Prin urmare, media pătratică se calculează după relaţia următoare:
n 1/ 2
x 2i
xp = i=1
n
(4.22)
Pentru o serie de distribuţie de frecvenţe media pătratică ponderată
se determină după relaţia (4.21) sau (4.22).
Capitolul IV 101
1
k 2
x 2j n 2j
xp = i=1
k

j=1
nj
sau, (4.23)
k 1/ 2
x p = x 2j f j
j=1 (4.24)
Definiţia şi relaţiile de calcul ale mediei pătratice conduc la câteva
observaţii importante:
1) Cu toate că media pătratică se poate calcula atât din valori
individuale pozitive, nule sau negative, ea nu are sens din punct de vedere
economic decât dacă se calculează din valori pozitive.
2) Valoarea mediei pătratice este mai mare decât cea a mediei
aritmetice atunci când ele se calculează din aceleaşi date.
3) În mod frecvent media pătratică se utilizează pentru a caracteriza
tendinţa centrală din ansamblul abaterilor valorilor individuale de la valoarea
lor medie. De asemenea, media pătratică se recomandă pentru calculul
nivelului mediu în seriile în care predomină valorile ridicate sau când se
doreşte să se acorde o importanţă mai mare în nivelul mediu a acelor unităţi
pentru care caracteristica urmărită prezintă cele mai mari valori absolute.
4) Fiind obiectivă însumarea pătratelor valorilor individuale, atunci:
n n
∑  x i2 − x p  = 0 ∑  x i2 − x p n j = 0
2 2
sau (4.25)
i =1 i =1

4.2.4. Media geometrică


Spre deosebire de tipurile de medii prezentate anterior, care au la
bază o relaţie de aditivitate între termenii unei serii statistice, media
geometrică se calculează pe baza unei relaţii obiective multiplicative între
termenii aceleiaşi serii.
Prin urmare, media geometrică ( x g ) reprezintă acea valoare a
caracteristicii observate care dacă ar înlocui fiecare valoare individuală din
serie produsul acestora nu s-ar modifica.
n n
Deci, ∏ x i = x 1 × x 2 × ... × x n = 1
x g × ... × x g = x g
4243
(4.26)
i =1
de n ori
de unde
n 1/ n
xg = xi
i=1 - pentru o serie simplă (4.27)
sau
102 Statistică generală
1
k
k nj nj
xj
x g = j−1
j=1
- pentru o serie de distribuţie de frecvenţe
Media geometrică, uneori, se mai numeşte şi medie logaritmică
deoarece se poaten determina prin logaritmii valorilor individuale. Astfel:
ln x i 1
n
ln (x g ) = n , de unde x g = exp .
i=1
n ln (x i )
i=1 (4.28)
Observaţii şi proprietăţi:
1) Dacă relaţia obiectivă dintre date este multiplicativă, atunci
compensarea abaterilor individuale faţă de tendinţa centrală se exprimă prin
relaţia:
n x
∏ i =1 (4.29)
i =1 x g
2) Calculul nivelului mediu ca medie geometrică are sens economic
numai atunci când relaţia de multiplicare a termenilor seriei este reală.
Calculul nivelului mediu într-o serie de distribuţie media geometrică se
utilizează mai rar, îndeosebi când termenii prezintă o evidentă concentrare
către valorile cele mai mici sau când se urmăreşte să se acorde o importanţă
deosebită valorilor individuale reduse.
3) Dacă cel puţin o valoare individuală este nulă sau negativă,
calculul mediei geometrice este lipsit de sens.
4) În mod frecvent, media geometrică se utilizează pentru calculul
indicelui mediu al dinamicii, pentru caracterizarea tendinţei centrale din
seria indicilor de dinamică cu bază mobilă.
5) Media geometrică a produsului (raportului) dintre două variabile
este produsul (raportul) mediilor geometrice ale valorilor variabilelor
observate.
Astfel, dacă indicii de dinamică cu bază mobilă (tranzitivă) sunt
omogeni (prezintă valori apropiate), atunci indicele mediu de dinamică se
determină după relaţia următoare:
x T x
I = I−1 ∏ I *t / t −1 = I−1 T (cu T – 1 = numărul indicilor cu bază
t =1 x0
mobilă) (4.30)
Sub cerinţa compatibilităţii datelor, seria cronologică de lungime se
periodizează (de exemplu în k subperioade omogene). În această situaţie se
jx
determină pentru fiecare subperioadă I t / t −1 (cu j = 1, k ), iar apoi se
determină – simplu sau ponderat – indicele mediu de dinamică, global,
pentru întreaga perioadă studiată. În acest sens poate fi utilizată relaţia de
următoarea formă:
Capitolul IV 103
k
* j ∑ Tj
 jx  jk T
I =I = ∏I j=1 (4.31)
j=1  
cu: Tj = lungimea subperioadei j;
j
I = indicele mediu de dinamică asociat subperioadei j.
Dacă indicele mediu de dinamică arată de câte ori sau de cât la sută
s-au modificat, în medie, valorile variabilei X pe întregul orizont de timp
1, T , pentru a determina cu cât la sută s-au modificat aceleaşi valori pe
acelaşi orizont de timp se calculează ritmul mediu (rata medie) după relaţia:
* *
R = I × 100 − 100 (4.32)
6) Media geometrică a raportului sau produsului dintre două
caracteristici independente este egală cu raportul sau produsul mediilor
geometrice ale celor două caracteristici.
Aplicaţia 4.8. În 1992, 1993 şi 1994 un businessman a realizat un profit
de 10 mil. lei, 20 mil. lei şi 160 mil. lei. Pe baza acestor informaţii se urmăreşte
determinarea indicelui mediu al profitului. În 1993 faţă de 1992 profitul s-a
dublat, iar în 1994 faţă de 1993 profitul s-a multiplicat de 8 ori. Dacă se
calculează rapid media aritmetică se constată că în perioada 1992-1994 profitul
2+8
s-a multiplicat de 2 = 5 ori pe an. Acest rezultat în mod evident este incorect
deoarece dacă profitul din 1992 a fost de 10 mil. lei s-ar fi multiplicat de 5 ori
pe an ar fi trebuit ca în 1993 şi 1994 profiturile realizate să fi fost de 50 mil. lei
şi de 250 mil. lei, valori nereale mult superioare valorilor reale.
Dimpotrivă, dacă indicele mediu de dinamică se determină ca media
geometrică a dinamicilor individuale se obţine următoarea valoare:
x g = 2 % 8 = 4 . Acesta este un rezultat mult mai corect decât cel anterior
deoarece pornind de la 10 mil. lei în 1992 profitul s-ar multiplica de 4 ori în
1994 şi ar fi fost de 160 mil. lei.

4.2.5. Media de ordin „p” (momentul iniţial de ordin


„p”)
Analizând tipurile de medii prezentate constatăm că esenţial pentru
exprimarea numerică reală a tendinţei centrale o analiză detaliată trebuie să
preceadă alegerea tipului de medie. Sunt, în practică, fenomene ale căror
forme individuale de distribuţie solicită pentru exprimarea tendinţei centrale
utilizarea unui anumit tip de medie, care nu a fost prezentată anterior.
Această afirmaţie conduce la ideea determinării mediei de ordin „p”
sau a momentului iniţial de ordin „p”, precum şi la ordinea mediilor de
diverse ordine. În acest sens considerăm o funcţie y = p(x), strict monotonă,
104 Statistică generală
definită pe intervalul de variaţie al datelor [xmin, xmax]. Deci,
p : [ x min , x max ] → R + . Numim media de ordin p a unei variabile, discrete,
de valori xi şi frecvenţe asociate fi valoarea p( x ) pentru care există
egalitatea următoare:
r
p( x ) = ∑ f i p( x i ) (4.32)
i =1

În ansamblul punctelor Mi(xi, yi), cu i = 1, r , generate prin funcţia


stabilită centrul său de greutate este G(xG, yG) unde:
r r r
x G = ∑ x i f i = x şi y G = ∑ y i f i = ∑ p( x i )f i = p( x ) = y
i =1 i =1 i =1
Graficul funcţiei y = p(x) cu punctele sale semnificative se prezintă
mai jos:

y = p( x )

y r = p( x r ) Mr

y i = p( x i )

G
y = p( x ) Mp

y 2 = p( x 2 )

y1 = p ( x 1 )
M1

x
x1 x2 x xp xi xr

Figura 4.1. Graficul funcţiei y = p(x)

Analizând graficul funcţiei y = p(x) observăm următoarele:


Capitolul IV 105
ƒ Convexitatea (sau concavitatea) funcţiei, cât şi poziţia faţă de grafic
a punctului G conduc la ideea unei relaţii între media de ordin „p” şi
media aritmetică ( x ). Aceste relaţii sunt următoarele:
 dp d 2p
 p x > x ⇔ × 2 >0
 d x d ( x )
 dp d 2p
x p = x ⇔ × =0 (4.34)
 d x d 2 (x)
 dp d 2p
x p < x ⇔ × <0
 d x d 2 (x)
Această relaţie sugerează că alegerea tipului de medie să fie
precedată de o analiză calitativă a datelor, de identificare a funcţie după
care se manifestă fenomenul studiat.
ƒ Dacă se ia în considerare funcţia p(x) = xk (cu k ∈ Z ) atunci pentru
valorile individuale din [ x min , x max ] ⊂ R + se defineşte media de
ordin k (sau momentul iniţial de ordin k), notată prin mk.
dp d 2p
Din × = k 2 (k − 1) x 2 k −3 (4.35) se
d x d 2 (x)
constată că:
m k > x ⇔ k > 1;
m k = x ⇔ k = 1;
m k < x ⇔ k < 1.
ƒ Dacă în raţionamentul anterior luăm k = {-1, 0, 1, 2} atunci avem:
k = −1 ⇒ m −1 = x h ;
k ∈ (0,1) ⇒ m k = x g ;
k = 1 ⇒ m1 = x;
k = 2 ⇒ m2 = x p.
ƒ În virtutea strictei monotonii a funcţiei analizate (pentru orice
k 1 < k 2 ⇒ m k1 < m k 2 sau pentru orice k 1 > k 2 ⇒ m k1 > m k 2 )
rezultă existenţa, între mediile prezentate, a următoarei relaţii de
ordine (inegalitatea mediilor): x h ≤ x g ≤ x ≤ x p (4.36)
106 Statistică generală

4.2.6. Media termenilor unei serii cronologice


În seriile de distribuţie (de frecvenţe) analizate când s-a estimat
tendinţa centrală s-au considerat constante timpul şi spaţiul.
În seriile cronologice timpul este variabil iar spaţiul (inclusiv
densitatea frecvenţelor, structura organizatorică etc.) este constant. Această
particularitate este esenţială pentru exprimarea numerică a tendinţei
centrale.
Astfel,
ƒ Într-o serie cronologică de intervale (sau de flux), în virtutea
continuităţii timpului, termenii fiind aditivi, nivelul mediu se
determină (pentru întregul orizont de timp studiat) ca medie
T
∑ xt
t =1
aritmetică simplă după următoarea relaţie: x = (4.37)
T
unde: xt = nivelul variabilei X înregistrate în intervalul t = 1, T
T = numărul de termeni ai seriei cronologice analizate.
ƒ Într-o serie cronologică de momente aditivitatea termenilor nu mai
are sens. În această situaţie pot exista următoarele cazuri:
o Cazul în care momentele de timp de înregistrare a
datelor sunt egal depărtate între ele. Într-o astfel de
serie „de stoc” nivelul de înregistrare la un anumit
moment se poate determina adăugând la nivelul
înregistrat în momentul precedent „intrările” dintre
cele două momente succesive şi eliminând „ieşirile”
dintre aceleaşi momente. La acest considerent mai
adăugăm ipoteza conform căreia între două momente
de timp succesive fenomenul urmează o evoluţie
liniară (aproximativă). În baza acestei ipoteze, nivelul
mediu înregistrat între două momente succesive de
timp s-ar putea determina ca medie aritmetică a
valorilor înregistrate la momentele respective.
Capitolul IV 107

x1 x2 x3 ... xt-1 xt ... xT-1 xT

... ... t

1 2 ... t-1 ... T-1

x + x2 x + x3 x + xt x + xT
x1 = 1 x2 = 2 ... x t −1 = t −1 ... x T = T −1
144424444444244444 42444 244444444444244 3

x 1 + x 2 + ... + x t −1 + ... + x T −1
x CR = =
2
x1 x
+ x 2 + x 3 + ... + x t −1 + x t + ... + x T −1 + T
= 2 2 (4.38)
T −1

Deci, nivelul mediu într-o serie cronologică de


momente egal distanţate se determină după relaţia
(4.37) care este relaţia mediei simple cronologice.
o Cazul în care momentele de înregistrare a datelor
nu sunt egal depărtate. În acest caz, principiul
determinării unei serii cronologice (discontinue) de
momente distanţate inegal este asemănător celui
specific mediei aritmetice: se raportează valoarea
agregată pe întreul orizont de timp a variabilei
observate la numărul termenilor seriei sau la
lungimea orizontului de timp. Ţinem seama, însă, că
seria este formată din stocuri (din termeni neaditivi),
pe orizontul 1, T , fapt care ne conduce la două
situaţii.
1. Cazul când se cunoaşte funcţia
matematică, continuă, care aproximează
evoluţia în timp, în orizotnul 1, T . În
această situaţie, în mod evident (trivial)
108 Statistică generală
nivelul mediu s-ar putea determina după
T
∫ f ( x, t )dt
următoarea relaţie: x = 1
T
(4.39)
∫ dt
1
2. Cazul când nu se cunoaşte funcţia
continuă f(x,t) din orizontul 1, T . În
această situaţie, evoluţia fenomenului
analizat poate fi vizualizată ca în figura
următoare:

x
xT

xt

xt-1 xT-1

x3

x4
x2
x1

t
0 1 2 3 4 ... t-1 t ... T-1 T

Figura 4.2. Evoluţia unui fenomen X la diverse momente din orizontul de


timp 1, T

În situaţia vizualizată mai sus aproximăm evoluţia fenomenului între


două momente succesive cu o dreaptă. Cu cât distanţele dintre momentele
de timp sunt mai mici cu atât aproximările amintite sunt mai realiste.
Pe baza graficului de mai sus se observă că valoarea agregată a
variabilei observate X în fiecare interval dintre două momente succesive de
timp [t-(t-1)] coincide cu aria trapezului corespunzător intervalului. Aria
Capitolul IV 109
t − ( t − 1)
unui asemenea trapez este ( x t −1 + x t ) , cu t = 1, T şi, în consecinţă,
2
T t − ( t − 1)
valoarea agregată a variabilei în orizontul 1, T este ∑ ( x t −1 + x t ) .
t =1 2
Prin urmare, nivelul mediu pe orizontul 1, T se determină printr-o medie –
numită medie cronologică ponderată – în esenţă medie aritmetică,
exprimată prin următoarea relaţie:
T t − ( t − 1)
∑ ( x t −1 + x t )
2
x CR = t =1 T =
t − ( t − 1)

t =1 2
p p + p2 p + p3 p + p T −1 p
x1 1 + x 2 1 + x3 2 + ... + x T −1 T −2 + xT T
= 2 2 2 2 2 (4.40)
p1 + p 2 + ... + p T
Unde: p t −1 = t − ( t − 1) cu t = 1, T reprezintă distanţele (exprimate în unităţi
de timp) dintre două momente succesive.
Aplicaţia 4.9. Se cunosc datele despre stocul de mărfuri dintr-un
depozit, obţinut la diferite date de inventariere:

Tabelul 4.6.

Timpul Stocul de mărfuri – mii lei


01.01.2001 50850
01.02.2001 48950
01.03.2001 49370
01.04.2001 53410
01.06.2001 50630
01.10.2001 55100
01.01.2002 40400

Pe baza datelor de mai sus, nivelul mediu al stocului de mărfuri


existent în depozit în perioada 01.01.2001 – 01.01.2002 este:
30 60 60 90 180 210 90
50850 + 40950 + 49370 + 53410 + 50630 + 50100 + 40400
x CR = 2 2 2 2 2 2 2 =
30 + 30 + 30 + 60 + 120 + 90 + 90
= 507676 mii lei / zi
110 Statistică generală

4.3. INDICATORI DE POZIŢIE


Caracterizarea tendinţei centrale în seriile de repartiţie presupune luarea
în considerare nu numai a valorilor individuale ale caracteristicii urmărite, dar
şi a formei în care se repartizează unităţile colectivităţii după caracteristica
respectivă. De multe ori informaţii mult mai utile fundamentării deciziilor,
decât cele oferite de indicatorii medii, le furnizează indicatorii de poziţie.
Aceasta înseamnă că pentru caracterizarea tendinţei centrale în
seriile de repartiţie rolul de valoare tipică poate fi jucat nu numai de medie
ci şi de indicatori de poziţie: modul şi cuantilele.
Indicatorii de poziţie în ansamblul datelor culese evidenţiază tendinţa
de aglomerare, de concentrare a unităţilor după caracteristica studiată.

4.3.1. Valoarea modală a caracteristicii numerice


Valoarea modală a caracteristicii (numită şi valoare dominantă,
valoarea cea mai probabilă sau modul) reprezintă acea valoare a
caracteristicii care corespunde celui mai mare număr de unităţi sau aceea
care are cea mai mare frecvenţă de apariţie.
De exemplu, în seria {5, 6, 7, 8, 9, 10}valoarea individuală "8" apare
cel mai frecvent: modulul este, deci, 8.
Pentru o repartiţie discretă valoarea modală este uşor reperabilă, pe
calea simplei examinări a şirului de frecvenţe, absolute sau relative. Astfel,
în tabelul statistic {x i , n i } valoarea modală a caracteristicii va fi acea
valoare individuală pentru care frecvenţa de apariţie este mai mare
(acea valoare individuală care se repetă de cele mai multe ori (vezi fig.4.3.).
Dacă seria prezintă două frecvenţe maximale identice atunci se defineşte
intervalul modal, avem repartiţie bimodală.

n n
nj nj

x x
Mo Interval modal

Figura 4.3. Determinarea grafică a valorii modale


Capitolul IV 111
În cazul seriilor de repartiţie pe intervale egale valoarea modală se
determină cu aproximaţie în următoarele etape:
* se identifică intervalul (grupa sau clasa) modal. Intervalul modal
este intervalul cu frecvenţa (absolută sau relativă)cea mai mare sau
intervalul cu densitatea frecvenţelor maximă. În interiorul intervalului
modal se caută (se estimează) valoarea modală.
* estimarea valorii modale. Această operaţie poate fi efectuată în
mai multe variante şi anume:
- dacă în cadrul intervalului modal frecvenţele sunt simetric (sau
aproximativ simetric) distribuite atunci valoarea modală coincide cu centrul
intervalului modal;
- dacă repartiţia frecvenţelor în cadrul intervalului modal nu este
simetrică, atunci valoarea modală (dominantă sau cea mai probabilă) se
determină în raport cu abaterea frecvenţelor intervalului modal conform
relaţiei de mai jos:
∆1
M o = X jMo + h jMo (4.41)
∆1 + ∆ 2
unde:
X jMo - limita inferioară a intervalului modal „j”;
h jM 0 - mărimea intervalului modal;
 1 - diferenţa dintre frecvenţa intervalului modal şi frecvenţa
intervalului precedent;
 2 - diferenţa dintre frecvenţa intervalului modal şi cea a
intervalului următor.
Raţionamentul prin care se ajunge la relaţia (4.41) este sugerat de
figura următoare:
112 Statistică generală

∆1 ∆2

x
x j−1Mo Mo x j+1Mo
x jMo

Figura 4.4. Determinarea grafică a valorii modale

În graficul de mai sus, utilizând teorema asemănării triunghiurilor


(din geometrie) constatăm că:
Mo − x j ∆ ∆1
= 1 ⇒ Mo = x jMo + h jMo c.c.t.d.
x j+1 + Mo ∆ 2 ∆1 + ∆ 2
Aplicaţia 4.10. Distribuţia a 50 unităţi de alimentaţie după volumul
încasărilor zilnice se prezintă astfel:

Tabelul 4.7.

Număr Centrul Număr de


Grupa de unităţi după Observaţii
de unităţi de interval unităţi cumulate
încasările zilnice (mii lei)
ni xi crescător
3
500-550 525 3
12
550-600 575 15
17
600-650 625 32
8 *Interval
650-700 675 40
6 modal
700-750 725 46
4
750-800 775 50
TOTAL 50
Capitolul IV 113
Valoarea modală a încasărilor zilnice sau încasarea zilnică ce mai
frecventă (cea mai probabilă este aproximativ:
17−15
M 0 = 600 + 50 (17−12)+(17−8) = 617, 86 mii lei
Observaţii:
1) În mod asemănător se defineşte şi se poate determină valoarea
antimodală cu cea mai mică frecvenţă, sau cea mai puţin probabilă;
2) Pe graficul repartiţiei statistice (histogramă, poligonul
frecvenţelor) valoarea modală corespunde punctului, de pe abscisă, în care
graficul îşi atinge maximul;
3) Modul satisface condiţiile 1, 3, şi 4 ale lui Yule, dar mai puţin pe
celelalte. El are avantajul principal faţă de medie sau cuantile că se
determină rapid şi are o semnificaţie simplă.
4) Există în practică şi serii de distribuţie multimodale. În astfel de
situaţii se determină mai multe valori modale, dar ele nu pot fi sintetizate
pentru a se obţine o singură valoare modală pentru întreaga colectivitate.
5) Pentru lansarea în producţie de serie a unui tip de confecţie de o
anumită mărime, decizia se ia în funcţie de valoarea modală calculată.
6) Metodologia de calcul a modului pentru seriile de distribuţie de
frecvenţe relative este similară cu cea prezentată mai sus.
7) În practică există serii de distribţie care prezintă două sau mai
multe valori modale. Acestea nu sunt aditive şi, în consecinţă, nu pot fi
agregate pentru determinarea unei valori modale globale (generale). În acest
sens, figura de mai jos este deosebit de sugestivă:

ni

xi
M01 M02

Figura 4.5 Repartiţie bimodală

8) Determinarea valorii modale are, deci, sens să se determine pentru


repartiţiile (unimodale) valorilor individuale ale unei variabile numerice
observate. Dacă repartiţia nu are maxim ci un minim se determină valoarea
114 Statistică generală
antimodală. Valoarea modală are sens să se determine, deci, pentru
repartiţiile multimodale sau repartiţiile în formă de ℑ .

4.3.2. Cuantilele
Cuantilele sunt indicatorii care descriu anumite poziţii localizate în
mod particular în cadrul seriilor de distribuţie. Conceptul de "cuantilă"
indică o divizare a distribuţiei observaţiilor într-un număr oarecare de părţi.
Prin urmare, cuantilele de ordin "r" (Cr ) sunt valori ale caracteristicii
urmărite care împart distribuţia ordonată a observaţiilor în "r" părţi egale. Fiecare
parte are acelaşi efectiv, adică 1/r din numărul total al unităţilor. Cuantilele se mai
1
numesc valori echiprobabile, deoarece p[ x < C k ] = p[ x > C k ] = . Frecvent se
k
utilizează următoarele cuantile:
- mediana sau cuantila de ordin 2 (r=2);
- cuartilele sau cuantilele de ordinul 4 (r=4);
- decilele sau cuantilele de ordinul 10 (r=10);
- centilele sau cuantilele de ordinul 100 (r=100).
Cuantilele de ordin superior (r>4) se calculează în cazul distribuţiilor
cu număr mare de grupe sau clase de valori individuale.
- Mediana (Me): Mediana (cuantila de ordinul 2) reprezintă acea
valoare a caracteristicii localizată în mijlocul seriei sau repartiţiei statistice
cu valori individuale aranjate în ordine crescătoare sau descrescătoare.
Cu alte cuvinte, mediana împarte numărul unităţilor investigate în două
părţi egale: numărul valorilor individuale superioare medianei este egal cu
numărul valorilor individuale mai mici decât mediana. Din această cauză
mediana se mai numeşte valoarea echiprobabilă a caracteristicii:
1
P( x i ≥ Me) = P( x i ≤ Me) = (4.42)
2
Cazul seriei simple: Determinarea medianei, în asemenea situaţii,
presupune ordonarea crescătoare sau descrescătoare a valorilor individuale ale
caracteristicii. După ordonarea termenilor seriei se identifică mediana astfel:
- dacă seria ordonată are un număr impar de termeni, mediana corespunde
n +1 M e = X n+1
cu valoarea individuală de rang 2 . Deci, în acest caz 2 (4.43)
De exemplu, în seria: {5,6,13, 20 { ,34 , 40, 61} sau

Me

în seria: {3,6,12, 15
{ ,21,28,32}

Me
valorile mediane sunt 20 şi respectiv 15.
Capitolul IV 115
- dacă seria ordonată crescător este formată dintr-un număr par de
termeni mediana se determină, în mod convenţional, ca medie aritmetică între
valoarea individuală de rang  n  şi acea de rang  n +1 .
2  2 
   
x n +x n+1

Deci, Me =
2 2
2 (4.44)

De exemplu, în seria {58,13,28,34,40,61,63} ⇒ {13,28, 34


{ , 40
{ ,58,61}
↓ ↓
x3 x4

x3 + x4
Me = = 37
2
Observăm că în cadrul seriei simple impare mediana determinată
respectă pe deplin definiţia valorii mediane. În cazul seriei cu număr par de
termeni, valoarea mediană se determină în mod convenţional şi nu este
conform definiţiei date.
Cazul seriei distribuţiei de frecvenţe: La cazul seriei de distribuţie
de frecvenţe pe variante distincte, semnificaţia valorii mediane este
afectată de metoda sa de calcul. În asemenea situaţie este considerată
valoarea mediană acea valoare individuală a caracteristicii corespunzătoare
k
∑ n i+1
n =1
primei frecvenţe cumulate ascendent care depăşeşte .
2
Aplicaţia 4.11. Să considerăm, în mod convenţional, că în urma
controlului de calitate a 100 loturi de aparate electronice s-au obţinut
următoarele date:
Tabelul 4.4

Număr de aparate Număr de loturi Număr cumulat


electronice cu defecte x1 de aparate ni crescător de loturi
0 10 10
1 20 30
2 40 70
3 15 85
4 10 95
5 5 100
TOTAL 100 -

Se observă, din datele de mai sus, că prima frecvenţă cumulată


crescător care depăşeşte (100+1)/2 = 50,5 este 70 şi corespunde numărului
median de aparate defecte Me = 2. Valoarea mediană, astfel, determinată nu
116 Statistică generală
răspunde definiţiei date deoarece observăm ca valoarea sa 2 nu împarte
seria în două părţi egale: numai 30% din loturi au un număr de defecte mai
puţin 2 şi nu 50% cum cere definiţia. Din această cauză, în asemenea situaţii
se recomandă să se renunţe la mediană cu valoare tipică pentru
caracterizarea tendinţei centrale de repartiţie şi să se recurgă la alte valori
tipice.
În cazul distribuţiei de frecvenţe pe intervale (caz în care datele
îşi pierd individualitatea) valoarea mediană se determină în mod
aproximativ printr-un procedeu de interpolare liniară bazat pe ipoteza
repartizării uniforme a frecvenţelor în interval median.
Procedeul de determinare a valorii mediane a caracteristicii în cazul
distribuţiilor pe intervale se desfăşoară în următoarele etape:
- se determină intervalul median. Acesta este intervalul care
k
∑ n i+1
n =1
corespunde primei frecvenţe cumulate crescător care depăşeşte ;
2
- în cadrul intervalului median; valoarea medianei se determină prin
interpolare cu ajutorul relaţiei următoare:
1 k  jMe
 ∑ n i+1  − ∑ n i−1Me
2
Me = X jMe + h jMe  i =1  i =1 (4.45)
n jMe
unde:
X jMe - limita inferioară a intervalului median;
h jMe - mărimea intervalului median
n jMe - frecvenţa intervalului median
jMe
∑ n i−1Me - suma frecvenţelor precedente intervalului median.
i =1
Pe baza datelor din aplicaţia 4.11 se constată că volumul (median) al
încasărilor este:
22,5−15
M e = 600 + 50 17 = 630, 8 mii lei. Această valoare semnifică
faptul că 50% din numărul unităţilor de alimentaţie publică au încasări
zilnice mai mici de 630,8 mii lei şi 50% au încasările zilnice mai mari de
630,8 mii lei.
Observaţii:
1) Metodologia de calcul a valorii mediane în seriile de distribuţie de
frecvenţe relative este similară cu cea prezentată mai sus;
Capitolul IV 117
2) Raţionamentul de determinare a medianei aplicat repartiţiei
valorilor globale (xjnj) ale caracteristicii analizate conduce la obţinerea
indicatorului de poziţie numit medială, utilizat frecvent în studiul
concentrării.
3) Calculul cuantilelor de ordin r>4 reprezintă o generalizare a
metodologiei de determinare a medianei.
4) Mediana satisface cel mai bine condiţiile lui Yule, cu excepţia
celei de-a 6-a. Ea nu se pretează calculelor algebrice, în cazul în care seria
este structurată în părţi relativ omogene.
5) Valoarea medianei nu este afectată de observaţiile extreme ale
seriei.
Cuartilele sunt valori care localizate într-o serie ordonată împarte
această serie în patru părţi egale, fiecare diviziune conţinând 25% din
valorile individuale înregistrate pentru aceeaşi variabilă numerică.
Procedeul de determinare a cuartilelor este asemănător cu cel al
determinării medianei.
Pentru o serie simplă, determinarea cuartilelor Q1, Q2 = Me, Q3 este
efectuată după procedeul prezentat la mediană. În cazul seriei de distribuţie
de frecvenţe pe variante Q1 este considerată ca fiind valoarea caracteristicii
corespunzătoare primei frecvenţe cumulate ascendent care depăşeşte
1 1 r 
(Fak + 1) =  ∑ n i + 1 ; Q2 = Me; iar Q3 este acea valoare a caracteristicii
4 4  i =1 
corespunzătoare primei frecvenţe cumulate ascendent care depăşeşte
3 3 r 
(Fak + 1) =  ∑ n i + 1 . Dacă seria de distribuţie de frecvenţe este de
4 4  i =1 
intervale, unde valorile individuale îşi pierd individualitatea, valorile
aproximative ale cuartilelor (Q1, Q2 = Me şi Q3) se determină prin procedeul
de interpolare liniar astfel:
- se stabilesc intervalele în care se situează Q1, Q2 şi Q3. Acestea sunt
intervalele corespunzătoare primelor frecvenţe cumulate ascendent care
1 2 3
depăşesc (Fak + 1); (Fak + 1); (Fak + 1) ;
4 4 4
- în etapa anterioară în cadrul intervalelor identificate valorile cuartilelor
(Q1, Q2,Q3) se determină după următorul sistem de relaţii:
118 Statistică generală
1
(Fak + 1) − Faja1−1
Q1 = x ja1 + h ja1 4
n ja1
2
(Fak + 1) − Faja 2 −1
Q 2 = x ja 2 + h ja 2 4 = Me (4.47)
n ja 2
3
(Fak + 1) − Faja 3−1
Q 3 = x ja 3 + h ja 3 4
n ja 3

fi

25% 25% 25% 25%

0 xi
Q1 Q2 Q3

Ffi 100%

75%

50%

25%

0 xi
Q1 Q2 Q3

Figura 4.6. Determinarea grafică a cuartilelor

Din reprezentările grafice anterioare se constată că în diagrama


diferenţială cuartilele corespund absciselor în care dreptele paralele cu Oy
împart diagrama în patru arii egale cu 25%.
Capitolul IV 119
Decilele (în număr de 9) sunt acele valori ale caracteristicii care
împart aria de variabilitate în zece părţi (intervale) egale, conţinând fiecare
10% din numărul observaţiilor.
În cadrul unei serii simple, conform definiţiei, cele 9 decile (D1, D2,
D3, D4, D5 = Me, D6, ..., D9) se determină după procedura prezentată în
cazul medianei. În cazul unei serii de distribuţie de frecvenţe, pe variante,
decila m (Dm, m = 1,9 ) va fi considerată acea valoare corespunzătoare
primei frecvenţe cumulate ascendent care depăşeşte
m m r 
(Fan + 1) =  ∑ n i + 1 cu m = 1, ..., 9.
10 10  i =1 
Dacă avem de-a face cu o serie de distribuţie de frecvenţe pe
intervale, determinarea decilelor se va aproxima, după ce au fost identificate
intervalele în care se găsesc Dm cu m = 1,9 , cu relaţiile obţinute de
asemenea prin interpolare:
1
(Fan + 1) − FajD1−1
D1 = x jD1 + h jD 2 10
n jD1
...
5
(Fan + 1) − FajD5−1
D 5 = x jD5 + h jD5 10 = Me (4.48)
n jD5
...
9
(Fan + 1) − FajD9−1
D 9 = x jD9 + h jD9 10
n jD9
Apelându-se la reprezentarea grafică, se va putea constata că
diagrama diferenţială este împărţită în zece arii egale. Calculul decilelor se
justifică atunci când variaţia valorilor individuale este mare sau foarte mare.
Centile. Dacă avem la dispoziţie o colectivitate statistică cu un
număr mare de unităţi şi cu o variaţie foarte mare, este util pentru analiză
calculul cuantilelor de ordin mai mare ca 10. de exemplu, cuantila de
ordinul 100, numită şi centilă. Centilele în număr de 99 sunt valorile
caracteristicii care împart seria în 100 de părţi egale (fiecare parte conţinând
1
din numărul observaţiilor efectuate).
100
120 Statistică generală
Procedeul de determinare a centilelor este asemănător cu cel al
determinării medianei, cuartilelor şi decilelor (cuantilelor de ordin mai mic
ca 10). Centilele de rang 25 şi 75 se identifică cu Q1 şi Q3, centila de rang 50
se identifică cu mediana, iar centilele de ranguri 10, 20, 30, 40, ..., fiind
decilele D1, D2, ..., D9.

4.4. RELAŢIA DINTRE MEDIA ARITMETICĂ,


VALOAREA MODALĂ ŞI MEDIANĂ
Localizarea în cadrul seriei a valorii mediei aritmetice, a valorii
modale şi mediane conduce la informaţii despre forma de distribuire a
unităţilor colectivităţii după caracteristica urmărită. Astfel:
- dacă există egalitatea x = M 0 = M e atunci, aşa cum s-ar observa şi
din grafic, distribuţia frecvenţelor este simetrică;
- în cazul unei distribuţii unimodale uşor asimetrice, frecvenţele sunt
uşor deplasate într-o parte sau alta, între cei trei indicatori ai tendinţei
centrale există următoarea relaţie, fră să se verifice cu regularitate:
x − M 0 = 3 (x − M e ) (4.46)
Sunt cazuri când unul din cei trei indicatori ai tendinţei centrale are o
semnificaţie mai puternică. Exemple:
1) Fie seria 2, 4, 4, 7, 8, 1000 . În această serie mediana, ca
valoare centrală, este mai semnificativă decât media aritmetică,
corespunzătoare care este afectată de valoarea extremă: 1000.
2) În seria studenţilor din anul I ordonaţi după media obţinută la
concursul de admitere pentru a identifica studentul care se localizează cel
mai bine se caută în mijlocul seriei rangul studentului median; acesta
împarte seria ordonată în două părţi egale.
3) Sindicatele estimează că societatea comercială E îşi remunerează
mai puţin angajaţii. Ei calculează salariul cel mai frecvent obţinut şi declară
că este mai mic decât în alte societăţi comerciale din acelaşi domeniu.
Patronatul în schimb replică şi calculează salariul mediu şi găseşte că acesta
este superior salariilor medii din alte societăţi comerciale. Cele două calcule
efectuate sunt corecte, dar comparaţia suferă; se compară aici un salariu
modal cu un salariu mediu.
Exemplele de mai sus pun în evidenţă faptul că după calculul indicatorilor
tendinţei centrale o atenţie deosebită trebuie acordată analizei în
concordanţă cu natura fenomenului analizat cu gradul de împrăştiere
(variaţie) a valorilor individuale. Aceasta este cu atât mai importantă cu cât
în elaborarea deciziilor se ţine seama de valoarea tipică calculată, cea mai
reprezentativă cu cea mai mare încărcătură informaţională despre tendinţa
centrală.
Capitolul IV 121

Întrebări de control
• În ce situaţii se aplică pentru caracterizarea tendinţei centrale: media
aritmetică, media geometrică, mediana ?
• Ce se înţelege prin cuantile ? Definiţia şi modalitatea de calcul a
cuantilelor de ordinul 2 şi 4.
• Care sunt dezavantajele mediei în caracterizarea tendinţei centrale ?
• Care este semnificaţia valorii modale ? Cum şi când se calculează
aceasta ?
• Cum se determină media variabilei alternative ?
• Care sunt proprietăţile mediei aritmetice, dar ale mediei armonice ?
• Care este trăsătura definitorie a indicatorilor medii utilizaţi pentru
caracterizarea tendinţei centrale ?
• Când nu are sens determinarea mediei aritmetice ?
• Distribuţia angajaţilor S.C. „VIM” după numărul de săptămâni de
concediu din 2001 se prezintă astfel:
Nr. săptămâni de concediu Nr. angajaţi
1 27
2 110
3 302
4 28
Total 467
Se cere să se calculeze şi să interpreteze media, mediana şi valoarea
modală.
• Se cunosc următoarele date:
Intervale de salarii (mil. lei) Nr. angajaţi
1,25 – 2,00 87
2,00 – 2,75 170
2,75 – 3,50 115
3,50 – 4,25 32
4,25 – 5,00 18
5,00 – 5,75 10
5,75 – 6,50 3
Total 3,75
Se cere:
a) Să se reprezinte grafic seria;
b) Să se calculeze şi să se interpreteze salariul mediu, median şi
modal.
122 Statistică generală

• Se cunosc următoarele date:


Numărul de persoane % numărului de % numărului de
dintr-o familie familii în oraşul „A” familii în oraşul „B”
1 17 22,3
2 28,8 30,9
3 17,3 17,3
4 15,8 15,9
5 10,4 8,0
6 5,6 3,3
7 şi peste 5,1 2,3
Total 100,0 100,0
Se cere:
a) Să se calculeze şi să se compare valorile mediane ale celor două
distribuţii;
b) Să se calculeze şi să se compare valorile modale pentru cele
două repartiţii;
c) Se pot calcula mediile celor două repartiţii ? Argumentaţi.
• Distribuţia a 200 de familii după numărul de copii se prezintă astfel
(date convenţionale):
Nr. copii 0 1 2 3 4 5 Total
Nr. familii 20 65 70 30 10 5 200
Valoarea mediană în seria prezentată este:
a) 1 copil;
b) 2 copii;
c) 70 familii;
d) 3 copii;
e) 5 copii.

• Dacă într-o distribuţie unidimensională formată după o variabilă


numerică X valorile individuale sunt evident deplasate către valorile
mari, atunci:
a) x < Me < Mo;
b) x > Me > Mo;
c) x = Me = Mo;
d) x < Mo < Me;
e) x − Me = Mo − x.
Capitolul IV 123

• O întreprindere de transport auto-călători alocă 10 autobuze pentru


traseul M-N a cărui distanţă este D. Datele referitoare la vitezele
medii înregistrate de autovehicule într-o zi sunt următoarele:
Viteza medie (km/h) 40 60 70
Nr. de autovehicule 3 5 2
În medie, un autovehicul a parcurs în ziua considerată traseul M-N
de distanţă D cu o viteză de:
a) 56 km/h;
b) 53,5 km/h;
c) 60 km/h;
d) 70 km/h;
e) 56,7 km/h.
• Se dau datele referitoare la repartiţia salariaţilor unei societăţi
comerciale după vechimea în muncă:
Grupe (ani) Nr. salariaţi
(0-5] 3
(5-10] 5
(10-15] 9
(15-20] 15
(20-25] 9
(25-30] 5
peste 30 3
Total n = 49
Vechimea medie a unui salariat în cadrul societăţii comerciale este:
a) 12,5 ani;
b) 21,5 ani;
c) 9,75 ani;
d) 17,5 ani;
e) 24,5 ani.
• Pentru calculul mediei aritmetice într-o serie numerică de distribuţie
de frecvenţe pe intervale se iau în considerare:
a) limitele inferioare;
b) mijloacele intervalelor, indiferent de repartiţiile din intervale;
c) limitele superioare;
d) limitele superioare dacă frecvenţele sunt relative;
e) mijloacele intervalelor în ipoteza apriorică a normalităţii
repartiţiilor din intervale.
• Pentru următoarele valori ale unei variabile aleatoare X: {7, 11, 14,
14, 12, 20}. Care dintre următoarele afirmaţii este adevărată:
a) Me = 14;
b) Mo = 14 şi Me = 13;
c) x = 13 şi Me = 13;
124 Statistică generală

d) x = 14 şi Mo = 14;
e) x = Mo = Me = 14.
• Considerând următoarele valori ale unei variabile aleatoare X: {5, 7,
4, 5, 20, 6, 4}, indicatorul cel mai potrivit pentru a caracteriza
tendinţa centrală este:
a) media armonică;
b) media;
c) modul;
d) media pătratică;
e) mediana.
• Expresia sintetizării valorilor individuale ale unei variabile statistice
într-un singur nivel reprezentativ a tot ceea ce este esenţial, obiectiv
şi stabil în apariţia şi manifestarea fenomenelor de masă este dată de:
a) valoarea lor mediană;
b) valoarea lor medială;
c) valoarea lor medie;
d) coeficientul lor de variaţie;
e) calculul unei mărimi relative de intensitate.
• Care dintre următoarele afirmaţii nu este adevărată pentru o serie
statistică:
a) între quartila 1 şi quartila 3 se găsesc 50% din observaţii, situate
în centrul distribuţiei;
b) valoarea quartilei 2 este egală cu mediana, doar pentru o serie
simetrică;
c) valoarea medianei este întotdeauna egală cu valoarea quartilei 2;
d) pentru o serie simetrică, abaterea interquartilică este nulă;
e) pentru o serie simetrică, abaterea interquartilică cuprinde 25%
din observaţii.
• Două grupe de studenţi, cu efective de 25 şi respectiv 32 de
persoane, au susţinut un test de cultură generală. Prima grupă a
obţinut media 7,8 iar a doua, 8,4. Nota medie pe ansamblul celor
două grupe este:
a) 8,14;
b) 8,10;
c) 8,12;
d) 8,00;
e) 8,09.
• Media armonică se defineşte ca:
a) media aritmetică calculată din inversele valorilor individuale
înregistrate;
Capitolul IV 125
b) valoarea inversă a mediei aritmetice a termenilor seriei;
c) valoarea inversă a mediei aritmetice, calculată din inversele
pătratelor valorilor individuale înregistrate;
d) valoarea inversă a mediei aritmetice, calculată din inversele
valorilor individuale;
e) valoarea care, dacă ar înlocui termenii seriei, nu ar modifica
suma lor.
• O medie calculată dintr-un şir de valori individuale este
reprezentativă dacă:
a) s-au utilizat frecvenţele absolute de apariţie a valorilor
individuale;
b) şirul de valori individuale este omogen;
c) unul dintre coeficienţii de asimetrie ia valori în intervalul [-1;1];
d) şirul de valori este structurat pe intervale de grupare egale;
e) s-a utilizat media aritmetică.
• Într-o serie de distribuţie normală după o anumită variabilă
numerică, între valoarea mediană, modală şi medie este adevărată
relaţia:
a) x < Mo < Me ;
b) Me < x < Mo ;
c) x = Mo = Me ;
d) x < Me < Mo ;
e) Mo < Me < x .
unde x = media aritmetică; Me = mediana; Me = valoarea modală.
• Despre stocul de mărfuri existent la o societate comercială se cunosc
următoarele date obţinute în urma inventarierii:
1.01. 1.02. 15.03. 10.05. 1.07.
Data inventarierii
1997 1997 1997 1997 1997
Stocul existent (mil. lei) 50 58 68 70 75
Stocul mediu de mărfuri al societăţii comerciale din perioada
1.01.2000 – 1.07.2000 a fost de:
a) 66 mil. lei;
b) 60 mil. lei;
c) 64,2 mil. lei;
d) 50 mil. lei;
e) 75 mil. lei.
126 Statistică generală

• La o bancă se analizează distribuţia debitorilor după situaţia zilelor


de întârziere a rambursării creditelor, astfel:
Intervale de variaţie a numărului de Nr. debitori mai mult decât
zile de întârziere a plăţii limita inferioară
10-20 120
20-30 85
30-40 37
40-50 16
50-60 7
60-70 2
Valoarea mediană calculată utilizând frecvenţe relative este:
a) 25 zile;
b) 35 zile;
c) 27 zile;
d) 23 zile;
e) nu se poate calcula mediana utilizând frecvenţe relative.
• Între decila a treia şi a şaptea se află:
a) 40% din termenii seriei;
b) 60% din termenii seriei;
c) 50% din termenii seriei;
d) 30% din termenii seriei;
e) 70% din termenii seriei.

S-ar putea să vă placă și