Sunteți pe pagina 1din 11

CURS STATISTICĂ - Unitatea de învăţare nr.

ANALIZA STATISTICĂ A DISTRIBUŢIILOR DE FRECVENŢE.


INDICATORII TENDINŢEI CENTRALE (1)

1. Obiectivele unităţii de învăţare

În urma parcurgerii acestei unităţi de învăţare studentul va înţelege care este tipul de
medie adecvat în fiecare situaţie, precum şi modalitatea de calcul a acesteia.

2. Noţiuni generale privind indicatorii tendinţei centrale

Indicatorul statistic reprezintă expresia numerică concretă sau dimensiunea unei


colectivităţi sau fenomen. Poate fi definit ca „rezultat numeric al unei numărări, al unei
măsuri statistice a fenomenelor şi proceselor de masă sau al unui model de calcul statistic
pe baza datelor înregistrate”.
Într-un studiu statistic, indicatorul poate apărea în dublă ipostază:
- purtător de informaţii, reflectând în expresie numerică un fenomen real;
- mijloc de calcul constituind o modalitate de obţinere a informaţiei statistice
Clasificarea indicatorilor statistici:

1. După modul de determinare distingem:


 Indicatorii primari – se obţin în etapa de sistematizare a datelor statistice prin
centralizarea acestora. Aceşti indicatori constituie baza de calcul pentru indicatorii derivaţi.
Centralizarea datelor trebuie făcută numai pentru date care au aceeaşi unitate de măsură şi
acelaşi conţinut şi acceptă însumarea.
Ex.: - numărul total al studenţilor unei facultăţi, numărul studenţilor pe fiecare an de studiu
(volumul total sau pe grupe al unei colectivităţi).
- veniturile salariaţilor unei firme (nivelul total al valorilor individuale al unei
caracteristici)
 Indicatori derivaţi – reprezintă rezultatul prelucrării indicatorilor
primari prin diferite modele de calcul statistic. În categoria indicatorilor derivaţi pac parte:
mărimile relative, indicatorii tendinţei centrale, indicatorii variaţiei şi asimetriei, indicatorii de
concentrare, etc.
Pentru caracterizarea fenomenelor de masă se utilizează atât indicatori primari cât şi derivaţi.
2. După gradul de cuprindere se disting:
 Indicatori sintetici care reprezintă expresii numerice ale
categoriilor economice de sinteză ce caracterizează rezultatele economice la nivel
macroeconomic.
Ex.: Produsul intern brut. Modelul de calcul al acestor indicatori se bazează pe Sistemul
Conturilor Naţionale.
 Indicatorii analitici – care exprimă structura unei colectivităţi şi influenţa
factorilor care acţionează asupra acesteia.
3. După forma de exprimare se disting:
 Indicatori exprimaţi în mărimi absolute adică în unităţi concrete de măsură
aceleaşi cu ale caracteristicii analizate şi cu acelaşi conţinut ca şi caracteristica analizată.
 Indicatori exprimaţi sub formă de mărimi relative adică exprimaţi în
coeficienţi, procente, promile, prodecimile, etc. şi care s-au obţinut prin raportarea a doi
indicatori cu acelaşi conţinut sau cu conţinut diferit, dar aflaţi în relaţie de interdependenţă.

Indicatorii tendinţei centrale reprezintă o categorie deosebit de importantă de


indicatori statistici utilizaţi în analiza variabilelor numerice. Aceşti indicatori sintetici redau
într-o singură măsură ceea ce este tipic, esenţial, caracteristic, obiectiv şi stabil pentru o serie
de date numerice.
Indicatorii tendinţei centrale sunt:
 mărimile medii;
 indicatorii medii de poziţie.
Toţi indicatorii tendinţei centrale au unitatea de măsură a caracteristicii studiate.
Indicatorii tendinţei centrale, pentru a reda corect nivelul în jurul căruia tind valorile
individuale, trebuie să îndeplinească următoarele condiţii:
 să fie definiţi în mod precis printr-o definiţie sau formulă;
 să poată fi calculaţi cu uşurinţă şi rapiditate şi să se preteze calculelor algebrice;
 să nu fie afectaţi prea tare de fluctuaţiile de selecţie în cazul în care datele provin
dintr-un sondaj statistic (adică mediile diferitelor eşantioane de volum egal
provenite din aceeaşi colectivitate să nu fie sensibil diferite);
 să nu aibă caracter matematic prea abstract;
 să fie expresia tuturor observaţiilor făcute.
Aceşti indicatori caracterizează cu atât mai bine tendinţa centrală cu cât datele pe baza
cărora se determină sunt mai omogene.
Cei mai importanţi şi mai utilizaţi indicatori ai tendinţei centrale sunt: media, mediana,
modul.

3. Marimile medii

Cuvântul “medie” este prezent în conversaţiile persoanelor aproape în fiecare zi,


folosindu-se în expresii ca: “durata medie de viaţă a oamenilor”, “durata medie de funcţionare
a unei baterii”, “greutatea medie a pachetelor de zahăr”.Media este o valoare tipică sau
centrală a unei distribuţii.
Pentru ca mărimea medie să aibă un caracter obiectiv este strict necesar ca alegerea
tipului mediei să se facă în funcţie de forma de variaţie şi de sursele de informaţii referitoare
la caracteristica studiată.
Mărimile medii utilizate în analiza seriilor de distribuţie de frecvenţe sunt:
 media aritmetică x;
 media armonică x h  ;
 media pătratică x p ;
 media geometrică x g .
Fiecare dintre cele patru medii poate fi calculată atât ca medie simplă (în cazul datelor
negrupate) sau ca medie ponderată (în cazul datelor grupate pe variante sau intervale de
variaţie).

3.1. Media aritmetică


Media aritmetică x , numită adeseori “medie” este indicatorul cel mai utilizat pentru
caracterizarea tendinţei centrale.
Media se calculează însumând toate valorile individuale şi împărţind suma la numărul
lor, ea reprezentând acea valoare care înlocuind toţi termenii unei serii nu modifică nivelul lor
totalizator.
Media aritmetică calculată pentru o colectivitate statistică este acea valoare care s-ar fi
obţinut dacă toţi factorii ar fi exercitat o influenţă constantă asupra tuturor unităţilor
înregistrate.
Media aritmetică simplă se calculează raportând nivelul totalizat al caracteristicii la
numărul total al unităţilor:
n
 xi
x  i 1
n
xi = valorile individuale ale caracteristicii;
n = numărul unităţilor;
n
 x i = valoarea centralizată (nivelul totalizat) al caracteristicii.
i 1

☺ Exemplul 1
Pentru 5 sucursale ale unei bănci comerciale au fost înregistrate valorile creditelor în luna
decembrie 2020 şi anume: 200.000 Euro; 240.000 Euro; 250.000 Euro; 180.000 Euro;
160.000 Euro. Care este valoarea medie a creditelor acordate în luna decembrie 2020?

5
 xi
i 1 200.000  240.000  250.000  180.000  160.000
x   206.000 Euro/sucursală
5 5

Într-o colectivitate statistică se întâlnesc foarte rar cazuri în care numărul valorilor
caracteristicii coincide cu numărul unităţilor, în colectivităţile statistice de obicei se
înregistrează de mai multe ori aceiaşi valoare a caracteristicii pentru mai multe unităţi şi în
acest caz media se va calcula ca o medie aritmetică ponderată:
k
 xi  ni
x  i1
k
 ni
i 1

k = numărul de grupe (intervale);


= numărul de variante (valori ale caracteristicii).
Dacă avem serie de distribuţie de frecvenţe pe intervale, atunci x i reprezintă mijlocul
(centrul) de interval:
k
x   x i  n *i
i 1

☺ Exemplul 2
Media aritmetică ponderată pentru o serie de repartiţie pe variante.
Repartiţia gospodăriilor dintr-o localitate în funcţie de numărul de copii este prezentată
în tabelul următor:
Nr. copii (xi) 0 1 2 3 4 5 6 7 8
Nr. gospodării (ni) 286 380 416 258 112 62 47 12 7

k
 xi  ni
i 1 0  286  1  380  ...  8  7 3166
Media =   1580  2,00 copii/gospodărie
k 286  380  ...  7
 ni
i 1

☺ Exemplul 3
Repartiţia salariaţilor unei firme în funcţie de valoarea primei acordate la sfârşitul anului 2020
este:

Prima (euro) Nr. salariaţi (ni) Centrul de interval (xi) xi ni


0 – 100 5 50 250
100 – 200 10 150 1.500
200 – 300 20 250 5.000
300 – 400 16 350 5.600
400 – 500 9 450 4.050
5
Total 60 -  xi  ni  16.400
i 1
5
 xi  ni
x  i 1  1660
.400  273,33 euro/salariat
5
 ni
i 1

Media:
 poate să nu aibă o valoare egală cu o valoare individuală înregistrată;
 se poate determina cunoscând doar valoarea totală centralizată a caracteristicii
(nivelul totalizator) şi numărul unităţilor;
 are unitatea de măsură a caracteristicii analizate.

Proprietăţile mediei aritmetice:


1) Dacă pentru toate unităţile se înregistrează aceeaşi valoare a caracteristicii atunci
media este egală cu acea valoare:
x1 = x2 = … = x n = x
n
 xi
nx
x  i 1  x
n n
2) Media aritmetică are întotdeauna valoare cuprinsă între valoarea minimă a
caracteristicii (xmin) şi valoarea maximă (xmax):
x min  x  x max

În cazul seriilor de distribuţie pe intervale, media este cuprinsă între limita


inferioară a primului interval şi limita superioară a ultimului interval.
3) Suma abaterilor valorilor individuale ale caracteristicii de la media lor este nulă,
adică distanţele faţă de centru se compensează reciproc:
- pentru seria simplă:
n
 xi
n
  n
 xi  x   xi  n  x   xi  n  i 1  0
i 1 i 1 i 1 n
n

- pentru seria de frecvenţe:


k
 xi  ni
 x i  x  n i   x i  n i   n i   x i  n i 
k k k k k
i 1
  ni  0
k
i 1 i 1 i 1 i 1 i 1
 ni
i 1

4) În cazul seriilor de frecvenţă, media oscilează în jurul termenului căruia îi


corespunde frecvenţa maximă;
5) Dacă toţi termenii unei serii statistice se măresc sau se micşorează cu o constantă
“a”, atunci şi media se va mări sau se va micşora cu respectiva constantă “a”:
- pentru serii simple:
n n
 x i  a   x i  n  a
x '  i 1  i 1 xa a0
n n
- pentru serii de frecvenţe:
k k
 x i  a   n i  xi  ni  a
x '  i1  i1 xa
k k
 ni  ni
i 1 i 1

6) Dacă toţi termenii unei serii statistice se înmulţesc sau se împart cu o constantă “h”,
atunci şi media se va multiplica sau se va reduce de “h” ori:
- pentru o serie simplă:
n n
 xi  h  xi
x '  i 1  h  i 1 hx h  0,1
n n
- pentru o serie de frecvenţe:
k k
 xi  ni  h h   xi  ni
x '  i 1  i 1
hx
k k
 ni  ni
i 1 i 1

7) Dacă frecvenţele unei serii de repartiţie se multiplică sau se împart cu o constantă


“a”, atunci media nu se va modifica:
k ni 1 k
 xi  a
  xi  ni
a i 1
x '  i 1  x
k n 1 k
 ai   ni
a i 1
i 1

k
Dacă a   n i adică este volumul total al colectivităţii, atunci:
i 1

k ni
 xi  k k
i 1
 ni  x i  n *i k
i 1
x  i 1   x i  n *i
k ni k
i 1
 k  n *i
i 1 i 1
 ni
i 1

n *i = frecvenţele relative

sau
k
 x i  n *i
x  i 1 ,
100
dacă frecvenţele relative sunt exprimate în procente.
8) Media aritmetică este sensibilă la valorile extreme, care pot afecta semnificaţia şi
reprezentativitatea mediei ca valoare centrală. Pentru ca media să fie reprezentativă
trebuie ca datele din care se calculează să fie cât mai omogene;
9) Media generală calculată pentru o serie de repartiţie de frecvenţă corespunzătoare
colectivităţii generale este egală cu media aritmetică ponderată a mediilor parţiale
calculate pe baza seriilor de repartiţie componente:
m
xj nj
j1
x
m
n j
j1

x j = media seriei de repartiţie componentă j;

nj = volumul seriei componente j.

☺ Exemplul 4
Sucursala din Alba a unei bănci comerciale are 40 de angajaţi, dintre care 15 sunt femei, iar
25 bărbaţi. Salariul mediu al femeilor este de 1.370 RON, iar al bărbaţilor de 1.520 RON.
Care este salariul mediu al unui angajat al sucursalei?

m
x j n j
j 1 1.370  15  1.520  25
x   1.463,75 RON
m 40
n j
j 1

10) Media aritmetică calculată pentru o serie simplă şi media aritmetică calculată pentru
aceeaşi serie cu datele grupate pe intervale (utilizând centrul de interval), pot să fie
sau nu egale. Cele două medii sunt egale dacă frecvenţele din seria de repartiţie de
frecvenţe sunt normal distribuite pe fiecare interval.
11) Pentru o variabilă alternativă (binară) media aritmetică se calculează astfel:
Varianta de răspuns xi Frecvenţa (ni) Frecvenţe relative (ni*)
DA 1 m m
w
n
NU 0 n–m 1–w
Total - n 1
2
 xi  ni
i 1 1  m  0  n  m  m
x   w
2 n n
 ni
i 1

☺ Exemplul 5
Să se calculeze media caracteristicii alternative “salariaţi cu prima sub 300 euro”
m
x j n j
j 1 1.370  15  1.520  25
x   1.463,75 RON
m 40
n j
j 1

Prima (euro) Nr. salariaţi


sub 300 35
mai mare sau egală cu 300 25
Total 60
m 35
w   0,583
n 60
m = reprezintă salariaţii care îndeplinesc condiţia cerută, adică “prima sub 300 euro”;
n = numărul total de salariaţi.
Adică: 58,3% din salariaţi au prima sub 300 euro.
Observăm că media caracteristicii alternative (binare) are caracter de greutate specifică
sau pondere.
Media caracteristicii alternative se exprimă în coeficienţi, deci nu are unitatea de măsură
a caracteristicii.

3.2. Media armonică

Media armonică se calculează împărţind frecvenţa absolută totală (numărul total al


unităţilor) la suma inverselor valorilor caracteristicii:
- media armonică simplă:
n
xh  pentru o serie simplă
n 1
x
i 1 i

- media armonică ponderată:


k
 ni
i 1
xh  pentru o serie de frecvenţe
k 1
 x  ni
i 1 i

Dacă termenii seriei sunt pozitivi, atunci x h  x .


Dacă între două variabile interdependente există o relaţie de inversă proporţionalitate,
această relaţie se păstrează şi în cazul mediilor calculate. Deci, dacă pentru calculul uneia se
foloseşte media aritmetică pentru calculul celeilalte se va folosi în mod obligatoriu media
armonică.
Media aritmetică poate fi substituită de media armonică ponderată care foloseşte drept
ponderi xini:
k
 xi  ni
i 1
xh 
k 1
x  xi  ni
i 1 i

Această relaţie se foloseşte la calculul indicelui mediu de grup al preţurilor dacă nu


avem informaţii privind cantitatea de mărfuri, ci doar informaţii privind valoarea şi preţurile.

3.3. Media geometrică

Media geometrică se bazează pe relaţia de produs între termenii seriei:


- pentru o serie simplă:
n
xg  n  xi
i 1

- pentru o serie de frecvenţe:


k
 ni k
x g  i 1  x i ni
i 1

Pentru a putea fi calculate cele două medii trebuie să se logaritmeze relaţiile:


n
 lg x i
lg x g  i 1
n

1 k
lg x g    n i  lg x i
k
i 1
 xi
i 1

S-au obţinut mediile aritmetice ale logaritmilor termenilor seriei.


Media geometrică are o valoare mai mică decât media aritmetică.
Media geometrică nu se poate calcula dacă un termen al seriei este negativ sau egal cu
zero.
Media geometrică se utilizează în cazul seriilor de distribuţie atunci când termenii seriei
prezintă diferenţe mari între ei sau seria prezintă o asimetrie pronunţată.
Prin logaritmare abaterile dintre termeni se micşorează.
Produsul abaterilor individuale ale termenilor seriei de la media geometrică (abateri
calculate sub formă de raport) este egal cu unitatea:
n
x1 x 2 x x  x  ...  x n x g
  ...  n  1 2  1
xg xg xg n n
xg xg

Cu cât fiecare raport în parte este mult mai mare sau mult mai mic decât 1, cu atât seria
este mai eterogenă.

3.4. Media pătratică

Media pătratică se calculează ca radical din media aritmetică a pătratelor termenilor


seriei:
- pentru o serie simplă:
n
 x i2
x p  i1
n
- pentru o serie de frecvenţe:
k
 x i2  n i
x p  i 1
k
 ni
i 1

Media pătratică se utilizează în cazul în care într-o serie de repartiţie predomină valorile
mari ale caracteristicilor sau dacă dorim să le acordăm acestora o importanţă mai mare.

4. Rezumatul Unităţii de învăţare

Indicatorii tendinţei centrale reprezintă o categorie deosebit de importantă de indicatori


statistici utilizaţi în analiza variabilelor numerice. Aceşti indicatori sintetici redau într-o singură
măsură ceea ce este tipic, esenţial, caracteristic, obiectiv şi stabil pentru o serie de date numerice.
Indicatorii tendinţei centrale sunt:
 mărimile medii care pot fi calculate atăt ca medii simple (pentru date negrupate), căt
şi ca medii ponderate (pentru date grupate pe variante sau pe intervale)
- media aritmetică
- media geometrică
- media pătratică
- media armonică
 indicatorii medii de poziţie
- mediana
- modul
Aceşti indicatori caracterizează cu atât mai bine tendinţa centrală cu cât datele pe baza
cărora se determină sunt mai omogene.
Cei mai importanţi şi mai utilizaţi indicatori ai tendinţei centrale sunt: media, mediana,
modul.

S-ar putea să vă placă și