Sunteți pe pagina 1din 65

UNIVERSITATEA “LUCIAN BLAGA”, SIBIU

FACULTATEA DE ȘTIINȚE ECONOMICE

STATISTICĂ ECONOMICĂ
- CURS ID -

Prof.univ.dr. Doina Maria Simion


Lect.univ.dr. Ioana Raluca Sbârcea

2017
UNITATEA DE STUDIU 1
NOȚIUNI GENERALE ÎN STATISTICĂ

Cuprins:
1.1. Introducere
1.2. Obiectivele unității de studiu
1.3. Statistica – noțiuni generale
1.3.1. Definiția statisticii
1.3.2. Statistica minte sau prin statistica se poate minți?
1.3.3. Utilitatea cunoașterii statisticii
1.3.4. Noțiuni de bază utilizate în statistică
1.3.5. Prelucrarea automată a datelor prin softuri statistice
1.3.6. Teoria scalării. Tipuri de scale
1.4. Rezumatul unității de studiu, cuvinte cheie
1.5. Teste de autoevaluare
1.6. Concluzii

1.1 INTRODUCERE
„...gândirea statistică va deveni într-o zi la fel de necesară pentru un cetăţean
eficient, la fel ca şi abilitatea de a citi şi a scrie”. H.G. Wells (1866-1946)
Având în vedere complexitatea fenomenelor și a proceselor social economice
contemporane, pentru cunoașterea acestora este nevoie de utilizarea metodelor
adecvate de investigație stiințifică, în vederea analizei și evidențierii particularităților
sub care ele se manifestă. Statistica este știința care oferă instrumentarul necesar
cunoașterii detaliate, în structură, în dinamică și în corelație a fenomenelor din toate
sectoarele de activitate dintr-o economie. În cadrul acestei unități de studiu, ne
propunem o familiarizare cu conceptul de statistică și cu principalele noțiuni utilizate
în statistică, și o introducere treptată în teoria scalării, ca modalitate de măsurare a
datelor statistice.

CUNOȘTINȚE PRELIMINARE
Pentru înțelegerea noțiunilor discutate în cadrul acestei unități de studiu este nevoie
de cunoștințe de microeconomie, pentru înțelegerea exemplificărilor, și de
matematică, pentru înțelegerea calculelor care se vor realiza.

DURATA MEDIE DE PARCURGERE A UNITĂȚII DE STUDIU


Durata medie de parcurgere a unității de învățare este de 4 ore.
1.2 OBIECTIVELE UNITĂȚII DE STUDIU
După parcurgerea unității de studiu, studenții vor putea:
- definii statistica
- identifica principalele noțiuni statistice în diferite exemple
- evidenția diferențele dintre scalele utilizate în măsurarea datelor statistice
- calcula și interpreta principalii indicatori proprii scalelor

1.3. STATISTICA – NOȚIUNI GENERALE


1.3.1. DEFINIȚIA STATISTICII
Statistica, din cauza complexității pe care o presupune, nu are o definiție unică, fiind
în același timp o știință, o disciplină, un domeniu de activitate, o știință
metodologică și o știință de graniță.
Statistica este o știință pentru că studiază regularităţile cu care fenomenele
economice şi sociale se produc, evidenţiază gradul de influenţă al factorilor şi
mutaţiile structurale din interiorul fenomenelor şi de asemenea permite extinderea
cunoaşterii fenomenelor studiate.
Statistica este o disciplină al cărei obiect de studiu îl reprezintă fenomenele de masă,
numite colectivităţi statistice sau populaţii statistice în care acţionează legi statistice
şi care foloseşte metode proprii de descriere şi analiză.
Statistica este un domeniu de activitate de culegere, prelucrare, interpretare şi
valorificare a datelor privind fenomenele de masă, organizat în instituţii publice sau
societăţi particulare.
Statistica este o știință metodologică care constă într-o colecţie de metode, de
instrumente indispensabile cunoaşterii realităţii.
Statistica este o știință de graniță alături de econometrie, psihologie economică ş.a.
care utilizează instrumentelor formale furnizate de matematică în cunoaşterea
celorlalte domenii: economie, sociologie, medicina, politică etc.
Etimologia cuvântului “statistică” este de origine latină, de la termenul “status”, care
desemnează o stare, o situaţie, un fapt. Astăzi, statistica reprezintă un ansamblu de
principii și metode cu ajutorul cărora putem obţine informaţii utile despre un set de
date.
Domeniul statisticii poate fi divizat în două arii: statistica descriptivă și statistica
inferențială. Statistica descriptivă constă în colectarea, organizarea, sintetizarea,
prezentarea și descrierea datelor numerice și nenumerice iar statistica inferențială
este folosită pentru a face previziuni sau comparații despre un grup mai mare,
folosind informațiile colectate doar de la o mică parte a grupului, implicând
generalizarea.
Exemplu de utilizare a statisticii descriptive și a statisticii inferențiale
Managerul unui lanț de magazine va putea utiliza instrumentarul oferit de
statistica descriptivă, deopotrivă cu cel al statisticii inferențiale, însă în mod
diferit și în momente diferite, în funcție de obiectivul pe care și-l propune si de
tipul de metode utilizate. Astfel, va utiliza:
- Metodele statisticii descriptive atunci cât analizează vânzările realizate
în diferite puncte de lucru, utilizând indicatori de structură, pentru a vedea
care sunt produsele care generează cel mai mare procent de vânzări,
indicatori medii ai vânzărilor, evidențiind reprezentativitatea vânzărilor
medii prin analiza de variație, indicatorii de dinamică pentru a arată
evoluția vânzărilor în timp, metoda indicilor statistici pentru a evidenția
influența factorilor asupra modificării vânzărilor sau indicatorii de
corelație pentru a evidenția legătura dintre factorii care contribuie la
valoarea vânzărilor și evoluția acestora. Datele le poate prezenta sub
formă de tabele sau grafice pentru a le face publice sau pentru a le
prezenta managementului de top.
- Metodele statisticii inferențiale atunci când vrea să prospecteze piața în
vederea deschiderii unei noi unități de vânzare; acțiunile sale vor viza
aplicarea unui chestionar unui eșantion reprezentativ de persoane din
zona în care vrea să se extinde, pentru a evidenția gradul de interes pentru
a realiza cumpărături în zona respectivă. Rezultatele obținute vor fi
extinse la nivelul întregii populații, maangerul realizând ceea ce se
numește inferență statistică.

1.3.2. STATISTICA MINTE SAU PRIN STATISTICĂ SE POATE MINȚI?


Statistica este o știință exactă care nu minte. Însă datele statistice sunt folosite pentru
a minţi. Prin statistică se poate denatura realitatea, se poate “minți”, în următoarele
situaţii:
 falsificarea datelor primare;
 folosirea unor metode greşite de prelucrare a datelor primare datorită
necunoaşterii teoriei statistice;
 interpretarea intenţionat eronată a rezultatelor;
 folosirea unor metode de prezentare (tabele sau grafice)neadecvate;
 incompletitudinea informaţiei statistice.

Exemplu de “minciună” prin date statistice

O bancă care avea o rată a dobânzii la depozite de 10% anunță prin


mijloacele media o creștere cu 10% a dobânzii ca urmare a condițiilor pieței.
Publicul auditor poate înțelege că rata dobânzii a ajuns la 20% (și poate
“alerga” la bancă să-și constituie depozite) sau că rata dobânzii a ajuns la 11%.
În condițiile informației incomplete transmisă de bancă, ambele concluzii sunt
corecte, dar cu siguranță doar una este reală. Dacă informația era corectă și se
transmitea faptul că rata dobânzii a crescut cu 10% în mărime absolută, atunci
nivelul actual real era de 20% sau dacă se transmitea că rata dobânzii a crescut
cu 10%, atunci nivelul actual real era de 11%.

!!!Incompletitudinea informației statistice este cea mai frecventă cauză a


minciunii prin statistică.

1.3.3. UTILITATEA CUNOAȘTERII STATISTICII


Intersecția fiecărui individ cu statistica este permanentă, așadar este necesară
cunoașterea statisticii deoarece:
 suntem în mod curent utilizatori şi furnizori de informaţie, fie în viaţa
profesională, fie în cea particulară
 suntem adesea decidenţi şi calitatea deciziilor noastre depinde de o bună
informare.
 suntem adesea interpreţi de informație şi calitatea înţelegerii noastre depinde
de o bună cunoaştere.
În acest context, o gândire statistică înseamnă o înţelegere concretă, corectă, rapidă,
în context şi în corelaţie a realităţii economice şi sociale.

1.3.4. NOȚIUNI DE BAZĂ UTILIZATE ÎN STATISTICĂ


Pentru a înțelege statistica este necesară cunoașterea noțiunilor de bază utilizate,
respectiv: populație statistică, unitate statistică, variabilă statistică, variantă statistică,
frecvență statistică, relație statistică și informație statistică.
Populația statistică (colectivitate statistică) definește ansamblul elementelor sau
grupul de elemente, cu caracteristici esenţiale comune, pentru care se doreşte
cunoaşterea. Populațile statistice pot fi statice, atunci când timpul este dat sau fixat la
un anumit moment, sau dinamice, atunci când analiza se realizează pe un orizont de
timp variabil.
Exemple de populații statistice

Exemplul 1 - Se analizează notele studenților la sfârșitul primului semestru.


Populația statistică este reprezentată de studenți (grupul de elemente care este
supus analizei) și este o populație statică (momentul este fixat – finele semestrului).

Exemplul 2 – Se analizează PIB-ul țărilor din UE în ultimii 5 ani.


Populația statistică este reprezentată de țările UE și este o populație dinamică
(analiza se extinde pe un orizont de timp de 5 ani).

Exemplul 3 - Se analizează cifra de afaceri a firmelor din turism în ultimul an.


Populația statistică este reprezentată de ................ și este o populație ....................

!!! Populația statistică poate fi formată din persoane, țări, firme, județe, idei, opinii,
profesii, universiăți, etc.
Unitatea statistică este elementul care compune populația statistică și poate fi:
 unitate simplă (de exemplu: un student, o țară, o firmă, un obiect, o părere)
 unitate complexă (de exemplu: o grupă de studenți, o grupă de țări, o grupă de
firme, o echipă de salariați, o familie)
Variabila statistică (caracteristica statistică) reprezintă versiunea măsurabilă a
însuşirii sau trăsăturii comune unităţilor unei colectivităţi, care reprezintă interes în
analiza statistică
Exemple de variabile statistice

Exemplul 1 - Se analizează notele studenților la sfârșitul primului semestru.


Variabila statistică analizată este nota.

Exemplul 2 – Se analizează PIB-ul țărilor din UE în ultimii 5 ani.


Variabila statistică analizată este PIB-ul.

Exemplul 3 - Se analizează cifra de afaceri a firmelor din turism în ultimul an.


Variabila statistică analizată este .......................................................................

În analiza statistică se operează cu mai multe tipuri de variabile, clasificate după


următoarele criterii:
 după dimensiunea în care sunt definite:
- variabile de timp care se referă la dimensiunea
temporară (de exemplu: anul înființării unor firme, durata necesară
execuției unor piese);
- variabile de spațiu care se referă la localizare, la spațiu (de exemplu:
localitatea de reședință a unor persoane, zona de amplasare a unor
obiective);
- variabile atributive care se referă la o însușire, la un atribut (de
exemplu: cifra de afaceri, PIB-ul, profesia, nota, greutatea).
 după natura variabilelor și modul lor de exprimare:
- variabile calitative care sunt exprimate nenumeric (de exemplu:
temperamentul, aprecierea față de un produs, profesia);
- variabile cantitative care sunt exprimate numeric (de exemplu:
vârstă, greutate, profit, PIB, rata inflației); variabilele cantitative la
rândul lor, după tipul variației se împart în:
 variabile continue care poate lua orice valoare dintr-un
interval din domeniul lor de valori (de exemplu: CA =
12.453,2 u.m, rata șomajului = 7,5%);
 variabile discrete sunt cele care pot lua doar anumite
valori (de exemplu: Nr.de studenți = 56 - nu poate fi
niciodata 55,9 sau 56,1 , nr. de mașini, nr. de
niversități);
 variabilele constante care pot lua doar o singură
valoare din domeniul lor de definiție;
 după numărul de variante:
- variabile alternative care pot avea doar două variante (de exemplu:
genul persoanelor poate fi doar masculin sau feminin, mediul de
proveniență doar rural sau urban, răspunsul la o întrebare doar
adevărat sau fals);
- variabile nealternative care pot avea cel putin 3 variante (de
exemplu: salariul angajaților dintr-o firmă poate avea următoarele
valori: 720, 950, 1580, 2000, 3500 u.m).
 după modul de obținere:
- variabile primare care se obțin direct din procesul de culegere a
datelor;
- variabile derivate care se obțin în urma unui model de calcul;
 după relația de cauzalitate:
- variabile independente sau variabile cauză care contribuie la variația
celorlalte variabile (de exemplu: variabila vârstă);
- variabile dependente sau variabile efect care sunt o consecință a
manifestărilor variabilelor cauză (de exemplu: prețul benzinei este
o variabilă efect a variației unor variabile cauză cum ar fi: prețul
barilului de petrol, cursul de schimb leu/dolar sau cuantumul
accizei).
Varianta statistică definește fiecare formă de manifestare a variabilei statistice (de
exemplu variante posibile ale variabilei profesie sunt: medic, avocat, economist,
muncitor, vânzător sau variante posibile ale variabile curs de schimb sunt: 4.54
lei/euro, 4,58 lei/euro, 4,57 lei/euro)
Frecvența statistică reprezintă numărul de apariții ale fiecărei variante a variabile
analizate la nivelul unei populații statistice. Deteminarea frecvenței intervine atunci
când, pentru analiza unui volum mare de date se apelează la sistematizarea lor,
respectiv numărarea elementelor populației pe variante ale variabilei.

Exemplu de formare a frecvenței statistice

Dacă analizăm profesiile dintr-o societate comercială cu 1000 de angajați pentru a


evidenția profesiile care predomină, vom puteam realiza această analiză doar dacă
sistematizăm datele, respectiv dacă le sintetizăm într-o formă prescurtată, care
ulterior să ne permită calcul de indicatori. Prin sistematizare vom obține frecvența
statistică, marcată în tabelul următor alături de variabilă și de populație statistică:
VARIABILA FRECVENȚA
Profesia Nr. de angajați
Economist 250
Ingineri 350
Muncitori 300
Manager 100
TOTAL 1000
POPULAȚIA

Relația statistică este expresia matematică care arată în ce fel o variabilă este
relaționată cu una sau mai multe variabile, ignorând efectele factorilor minori din
sistem. Relația poate fi modelată în mai multe forme, cea mai cuprinzătoare fiind cea
a unei funcții matematice, de tipul y = f(x) unde cu x notăm variabila cauză iar cu y
notăm variabila efect. De exemplu putem modela legături simple între 2 variabile
cum ar fi între preț și cerere, între nivelul cunoștințelor și nivelul notei, între venit și
consum, între rata șomajului și PIB sau putem modela legături multiple, între mai
multe variabile cum ar fi între valoarea creditului care poate fi contractat și
vechimea, venitul, garanția, istoricul cu banca, nr. de copii în întreținere, valoarea
altor credite contractate, etc.
Informația statistică reprezintă conținutul specific, mesajul datelor statistice și
respectiv scopul analizei statistice.
!!! Scopul analizei statistice nu este doar să ajungem la rezultatul corect al unor
indicatori matematici și să surprindem informația oferită de acești indicatori, să o
înțelegem și să o utilizăm astfel încât să obținem o mai bună cunoaștere a realității
economice în care ne aflăm.

1.3.5 PRELUCRAREA AUTOMATĂ A DATELOR PRIN SOFTURI STATISTICE


QSB+ permite realizarea de previziuni pe serii de timp, programare dinamică,
programare liniară, metoda drumului critic, metoda lanţurilor Markov, ş.a. Estimarea
evoluţiei viitoare a unui fenomen se poate realiza prin intermediul mai multor
modele de previziune şi anume modelul mediei simple, modelul mediei mobile cu
trend liniar, modelul ajustării exponenţiale cu sau fără trend liniar, metoda regresiei,
ş.a.
MYSTAT dă posibilitatea calculării de statistici descriptive, calculării testelor de
semnificaţie Z, t şi “hi pătrat” precum si a calculării regresiei şi a corelaţiei
parametrice şi neparametrice pe baza datelor obţinute prin sondaj statistic. Pentru
aceasta se impune formalizarea datelor pentru compatibilitate cu procedura
MYSTAT.
EXCEL include subrutine de calcul de funcţii matematice şi calcul de funcţii
statistice. Subprogramul pentru funcţii statistice facilitează calculul mărimilor medii,
al coeficienţilor de regresie şi corelaţie, dă posibilitatea realizării de previziuni pe
serii de timp şi predicţii pe baza funcţiilor de regresie şi de asemenea permite
realizarea testelor de semnificaţie. Tot cu ajutorul acestui program se pot realiza
diferite forme de reprezentări grafice şi diferite feluri de tabele statistice.
SAS – Statistical Analysis System este un pachet soft care dă posibilitatea
sistematizării și prelucrării unui volum de date suficient de mare în manieră
individuală prin comenzile și instrucțiunile pe care le oferă.
SPSS dă posibilitatea aplicării întregului instrumentar statistic descris de teorie,
de la calcule de statistică descriptivă până la calcule de statistică inferenţială,
prelucrare matricială, pentru un volum mare de date.
1.3.6 TEORIA SCALĂRII. TIPURI DE SCALE
Scalarea reprezintă măsurarea fiecărei variabile, adică acordarea de valori fiecărei
variabile pentru unităţile populaţiei.
Scalarea este necesară deoarece transpune datele în tabele pe baza cărora de pot apoi
determina diferiți indicatori de analiză. Există 3 tipuri de scale, în funcție de tipul
variabilelor pe care le măsoară și în funcție de complexitate, astfel:
 scala nominală – măsoară variabilele calitative;
 scala ordinală – măsoară variabilele calitative care pot fi ordonate;
 scala interval – măsoară variabilele cantitative.
Scala nominală este numită şi scală categorială. Aplicarea acestei scale constă în
repartizarea datelor într-un număr de clase astfel încât fiecare unitate înregistrată să
aparţină unei clase şi numai uneia iar două unităţi aparţinând aceleiaşi clase se
consideră echivalente.
Observaţii:
 folosirea acestei scale nu presupune neapărat graduare
 pentru o uşoară prelucrare e nevoie de codificare. Codificarea numerică sau
alfabetică sugerează adesea o ordonare care poate conduce la greşeli în
analiză
 prelucrarea datelor măsurate cu o astfel de scală presupune numărare
 prelucrarea datelor după o astfel de scală permite compararea între
colectivităţi diferite
 indicatorii cu care se sintetizează datele măsurate într-o astfel de scală sunt
frecvenţele relative şi modulul (dominanta); modulul reprezintă varianta
variabilei care predomină sau care înregistrează cea mai mare frecvență iar
frecvența relativă se notează cu f*și se calculează astfel:

f*= unde fi este frecvența absolută.


Exemplu de analiză a datelor măsurate printr-o scală nominală

Situația angajaților, din punct de vedere al profesiei, se prezintă pentru o


societate comercială conform tabelului nr. 1.1:

Tabel nr. 1.1 – Societatea A

Profesia Nr. de angajați


Inginer 15
Economist 8
Muncitor 50
Administrator 3
TOTAL 76
a) Recunoașteți principalele noțiuni statistice utilizate;
b) Recunoașteți elementele care caracterizează o scală nominală;
c) Observați modulul și calculați frecvențele relative. Interpretați
rezultatele.
Rezolvare:

a) Populația statistică este formată din cei 76 de angajați


Variabila statistică este profesia angajaților – variabilă calitativă
Frecvența statistică este nr. de angajați înregistrat de fiecare variantă a
variabilei, respectiv: 15, 8, 50 și 3 angajați și se notează cu fi
b) Scalarea variabilei profesie presupune observarea datelor la nivelul
societății, pe baza unui stat de funcțiuni, determinarea variantelor
variabilelor, în acest caz inginer, economist, muncitor și administrator și
numărarea angajaților pe fiecare profesie.
Scala este nominală deoarece variabila este calitativă și nu suportă
ordonare, adică profesia, ca variabilă de sine stătătoare, nu poate fi
ierarhizată.
c)

Tip Frecvența relativă


Nr. de angajați (%)
Profesia
(fi) f*=
1 Inginer 15 ×100 = 19,73%
2 Economist 8 10,53
3 Muncitor 50 65,79
4 Administrator 3 3,95
TOTAL 76 100

Interpretarea rezultatelor:
- Frecvența relativă: 10,53% din numărul total de angajați sunt
eonomiști
- Modulul sau dominanta este profesia muncitor, deoarece este varianta
variabilei care predominantă, care înregistrează cea mai mare frecvență,
respectiv 50
Scala ordinală asigură posibilitatea ca unităţile componente ale populaţiei totale să
suporte o anumită ordonare de la mic la mare sau invers, de la simplu la complex sau
invers, etc. Scala ordinală se mai numește și scală de opinie.
Observaţii:
 folosirea acestei scale presupune de asemenea codificarea, care poate fi
numerică (1,2,3,4,5) sau nenumerică (a,b,c,d,e,f). În acest caz codul mai
poartă numele de rang.
 prelucrarea datelor măsurate prin această scală se face prin numărare şi calcul
de frecvenţe relative, frecvențe absolute cumulate calculate ca sumă a
frecvențelor absolute înregistrate până la un anumit nivel și frecvențe relative
cumulate, calculate ca sumă a frecvențelor relative înregistrate până la un
anumit nivel; și pe o scală ordinală se poate observa modulul.

Exemplu de analiză a datelor măsurate printr-o scală ordinală

Aprecierea studenților pentru facultatea în care studiază se prezintă astfel (tabel nr.
1.2):
Tabelul nr. 1.2
Aprecierea studenților Nr. studenți
Foarte bună 285
Bună 150
Slabă 60
Foarte slabă 5
TOTAL 500

a) Recunoașteți principalele noțiuni statistice utilizate;


b) Recunoașteți elementele care caracterizează o scală ordinală;
c) Observați modulul și calculați frecvențele absolute cumulate,
frecvențele relative și frecvențele relative cumulate; interpretați
rezultatele.
d) Care sunt motivele pentru care frecvențele absolute cumulate și
frecvențele relative cumulate nu sunt relevante pentru o scală
nominală?

Rezolvare:

a) Populația statistică este formată din .............................................


Variabila statistică este ................................. și este o variabilă........................
Frecvența statistică este ................................. 5 și se notează cu fi
b) Scalarea variabilei apreciere presupune observarea datelor la nivelul facultății,
pe baza unui chestionar, determinarea variantelor variabilelor, în acest caz
foarte bună, bună, slabă și foarte slabă și numărarea studenților în funcție de
apreciere. Scala este ordinală deoarece variabila este calitativă și suportă
ordonare, în acest caz de la foarte bună la foarte slabă.
c)
Rang Nr. Frecvență Frecvență
studenți absolută Frecvența relativă
Aprecierea relativă (%)
(frecvență cumulată cumulată
studenților f*=
absolută (%)
fi)
1 Foarte bună 285 285 ×100 = 57 57

2 Bună 150 285+150 = 435 30 57+30=87


3 Slabă 60 435+60 = 495 12 87+12=99
4 Foarte 5 495+5 = 500 1 99+1=100
slabă
TOTAL 500 - 100 -

Interpretarea rezultatelor:
- Frecvența absolută cumulată – 435 de elevi au aprecierea foarte bună
și bună sau în primele 2 categorii cele mai bune
- Frecvența relativă – 12% din numărul total de studenți au aprecierea
slabă
- Frecvența relativă cumulată – 87% din totalul studenților au aprecierea
în primele 2 categorii cele mai bune
- Modulul sau dominanta este reprezentat de aprecierea foarte bună,
deoarece este varianta variabilei care predominantă, care înregistrează
cea mai mare frecvență, respectiv 285.

d) Frecvența absolută cumulată și relativă cumulată se calculează doar pentru


scala ordinală (care este mai complexă decât cea nominală) deoarece în
contextul unei variabile ordonate acești 2 indicatori aduc un plus de informație,
respectiv arată numărul de elemente sau procentul în primele categorii sau
grupe (sau în ultimele categorii dacă scala este ordonată descrescător). Această
informație nu era relevantă pentru scala nominală deoarece variabila nu era
ordonată.

Scala interval este scala pentru măsurarea variabilelor cantitative și introduce


distanţa între valorile variabilei.
Exemplu: analiza populaţiei, în sens demografic, după caracteristica “vârstă”
presupune folosirea scalei interval: sub 20 ani, 20-30 , 30-40 , 40-50 , 50-60 ,
60 ani şi peste.
Observaţii:
- punctul zero în cazul scalei interval este considerat arbitrar ales adică nivelul
zero nu semnifică absenţa fenomenului. Dacă punctul zero al scalei este dat în
mod natural, nu arbitrar, atunci se poate introduce şi relaţia de ordine şi
operatorul de raport şi spunem că măsurarea se realizează pe o scală raport.
- măsurarea prin scala interval permite o varietate mare de calcule
- parametrii prin care se sintetizează o distribuţie construită pe scala interval
sunt media, mediana, modulul, cuantila, abaterea standard, variaţia,
indicatorii de corelaţie, etc., indicatori care vor fi dezvoltați pe larg în
următoarele unități de studiu. Tot în unitățile de studiu următoare va fi
abordată construirea unei scale interval
- dintre cele 3 scale cea interval este cea mai complexă, așadar permite și
calculul tuturor indicatorilor prezentați la scalele anterioare (așadar analiza
scalei interval este propusă ca și exercițiu individual.

Exercițiu de analiză a datelor măsurate printr-o scală interval

Valoarea vânzărilor (lei) înregistrată de 44 de firme din același sector de


activitate se prezintă conform tabelului nr. 1.3:

Tabelul nr. 1.3


Valoarea vânzărilor
Nr. de firme
(lei)
40.000 – 60.000 8
60.000 – 80.000 10
80.000 – 100.000 14
100.000 – 120.000 12
TOTAL 44

a) Recunoașteți principalele noțiuni statistice utilizate;


b) Determinați și interpretați frecvențele prezentate la scalele anterioare.
1.4. REZUMATUL UNITĂȚII DE STUDIU. CUVINTE CHEIE
Statistica este o știință compleză care propune utilizare unui instrumentar format
din metode și indicatori necesar pentru cunoașterii realității din orice domeniu, de
interes fiind domeniul economic. Statistica operează cu noțiuni clare, dintre acestea
cele mai importante fiind populația statistică, care se referă la anasamblul
elementelor analizate, variabila statistică care definește caracteristica comună
tuturor elementelor statistice pentru care se dorește analiză și frecvența statistică
care arată numărul de apariții pentru fiecare variantă a variabilei statistice.
Pentru a putea analiza fenomene din diferite arii de activitate se utilzează scalarea,
fiind folosite 3 tipuri de scale, ordonate de la cea mai simplă la cea mai complexă
astfel: scala nominală, scala ordinală și scala interval. Ele diferă în funcție de
variabilele pe care le măsoară și de aici rezultă și indicatorii care pot fi calculați,
respectiv modulul, frecvența relativă, frecvența absolută cumulată și frecvența
relativă cumulată. Pentru o mai bună reținere a caracteristicilor celor 3 scale, în
tabelul nr. 1.5 este prezentată o analiză comparativă între ele pentru a evidenția
asemănările și deosebirile care le caracterizează.

Tabelul nr. 1.5 – Prezentarea sintetizată a caracteristicilor scalelor statistice

Denumirea
Caracteristici ale scalei Exemple de utilizare
scalei

Nominală Măsoară variabile calitative Profesia, Tipul


Absența relației de ordine temperamental,
Permite calculul unei frecvențe Facultățile din cadrul
relative și observarea modului unei universități, Starea
(sau dominantei) civilă

Ordinală Măsoară variabile calitative Calificative pentru


Există relație de ordine activitatea școlară,
Permite calculul unei frecvențe Preferințele
relative, absolute cumulate și consumatorilor pentru un
relative cumulate și observarea anumit produs,
modului (sau dominantei) Aprecierea studenților
pentru profesorii lor
Interval Măsoară variabile cantitative Notele studenților,
Există relație de ordine Profitul, PIB-ul,
Permite calculul unei frecvențe Numărul de angajați,
relative, absolute cumulate și Rata șomajului,
relative cumulate și a indicatorilor Rentabilitatea
proprii statisticii descriptive

CUVINTE CHEIE: statistica, populație statistică, variabilă statistică, frecvență


statistică, frecvență relativă, frecvență absolută cumulată, frecvență relativă
cumulată, scală nominală, scală ordinală, scală interval
DE REȚINUT:
În Statistică rezultatele se interpretează, ceea ce înseamnă că, pe baza indicatorilor
calculați, se transmit informații despre datele analizate care să contribuie la o mai
bună cunoaștere.

1.5 TESTE DE AUTOEVALUARE


1. Departajați caracteristicile discrete de cele continue, din șirul
care urmează:

 Salariul muncitorilor dintr-o firmă;


 Numărul de salariați din societățile de transporturi internaționale;
 Notele studenților din anul II de studiu;
 Numărul studenților promovați la examenul de statistică;
 Volumul impozitelor încasate în jud. Sibiu;
 Numărul contribuabililor dintr-un județ;
 Rezultatele obținute în urma unui test psihologic aplicat elevilor unei
clase;
 Volumul fizic al vânzărilor zlnice de cafea într-o unitate comercială.

2. Precizați care este populația și variabila statistică și apreciați scala care poate
fi folosită pentru măsurare în următoarele cazuri:

 Numărul absențelor înregistrate de salariații unei firme (zile);


 Numărul copiilor înregistrați de 700 de familii dintr-un județ;
 Tipul temperamental al eleviilor unei școli.
 Numărul de pagini a 300 de cărți dintr-o bibliotecă;
 Localitatea de naștere a 100 de angajați ai unei întreprinderi;
 Calificativele obținute de 50 de studenți la un test psihologic.

3. Veniturile angajaților unei firme se prezintă după cum urmează (tabel nr. 1.4):

Tabelul nr. 1.4


Veniturile angajaților Nr. Angajați
Foare mici 22
Mici 13
Medii 45
Mari 10
Foarte mari 10
TOTAL 100

a) Recunoașteți principalele noțiuni statistice utilizate;


b) Recunoașteți scala utilizată și argumentați de ce este utilizată în defavoarea altor
scale;
c) Observați modulul și calculați frecvențele specifice scalei date; interpretați
rezultatele.
UNITATEA DE STUDIU 2
PRELUCRAREA PRIMARĂ A DATELOR

Cuprins:
2.1.Introducere
2.2.Obiectivele unității de studiu
2.3.Prelucrarea primară a datelor
2.3.1. Concept și etape în prelucrarea datelor
2.3.2. Gruparea datelor. Formarea de distribuții de frecvențe.
2.3.3. Prezentarea rezultatelor prelucrării sub formă de tabele și grafice
2.4.Rezumatul unității de studiu, cuvinte cheie
2.5.Teste de autoevaluare

2.1. INTRODUCERE
Statistica oferă un instrumentar prin care volumele mari de date sunt sintetizate, pentru
a putea fi ușor analizate prin calculul de indicatori. În această unitate de studiu vor fi
evidențiate etapele în cadrul prelucrării sau sistematizării datelor și vor fi prezentate
modalitațile de prelucrare a datelor prin grupare și modalitățile de prezentare a lor prin
tabele și grafice. Cunoașterea acestor informații este foarte importantă, deoarece pe
baza acestora se pot înțelege metodele pe care le vom dezvolta în unitățile de studiu
următoare, dar în același timp trebuie să reținut faptul că prin sintetizarea datelor are
loc o pierdere inevitabilă de informații, prin eliminarea a ceea ce este neesențial și
întâmplător, dar în același timp se câștigă sub aspectul obținerii unor informații
sintetice.

CUNOȘTINȚE PRELIMINARE
Pentru înțelegerea noțiunilor discutate în cadrul acestei unități de studiu este nevoie de
cunoștințe de microeconomie, pentru înțelegerea exemplificărilor, și de matematică,
pentru înțelegerea calculelor care se vor realiza.

DURATA MEDIE DE PARCURGERE A UNITĂȚII DE STUDIU


Durata medie de parcurgere a unității de învățare este de 4 ore.

2.2. OBIECTIVELE UNITĂȚII DE STUDIU


După parcurgerea unității de studiu, studenții vor putea:
- Înțelege etapele în prelucrarea și sistematizarea datelor
- Aplica metode de sistematizare a datelor
- Recunoaște principalele tipuri de tabele și grafice utilizate pentru
prezentarea rezultatelor prelucrării statistice.

2.3. PRELUCRAREA PRIMARĂ A DATELOR


2.3.1. CONCEPT ȘI ETAPE ÎN PRELUCRAREA DATELOR
Prelucrarea sau sistematizarea datelor este o etapă în cercetarea statistică care
cuprinde operaţii cu ajutorul cărora se realizează trecerea de la datele individuale la
indicatorii derivaţi, sintetici, care reflectă esenţa din manifestarea fenomenelor.
Prelucrarea datelor se realizează în următoarele etape:
- Observarea statistică sau culegerea datelor individuale;
- Gruparea datelor;
- Prezentarea datelor sub formă de tabele și grafice;
- Analiza și interpretarea rezultatelor prelucrării.

- Observarea statistică sau culegerea datelor


Observarea statistică constă în culegerea și înregistrarea în mod sistematic și unitar a
datelor statistice, de la unităților populației statistice, referitoare la toate
caracteristicile incluse în analiză.
Observările statistice în funcție de periodicitatea lor pot fi continue (adică se
înregistrează permanent – de exemplu natalitatea, mortalitatea), periodice (de
exemplu recensământul) sau ocazionale (de exemplu analiza evoluțiilor micro și
macroeconomice în diferite țări). În funcție de dimensiunea populației analizate,
observările se împart în totale – dacă toată populația este analizată (de exemplu
recensământul) sau parțiale – dacă se analizează doar o parte a populației (de
exemplu sondajele, anchetele, panelurile sau monografiile). De asemenea,
observările statistice se mai împart în primare – atunci când datele nu există și sunt
culese din realitate pentru prima dată și secundare – stunci când datele există în
evidențe, și ele sunt preluate, sintetizate și analizate prin diferite metode.
2.3.2.GRUPAREA DATELOR
Gruparea datelor constă în împărţirea unei colectivităţi în grupe omogene de unităţi
după variaţia uneia sau a mai multor caracteristici. O grupă este considerată omogenă
atunci când unităţile care o compun sunt de acelaşi tip calitativ şi diferă în mică
măsură una de cealaltă, adică înregistrează o variaţie mică.
Condițiile necesare pentru o grupare corectă sunt:
- Omogenitatea – grupele rezultate să nu fie fie mult diferite
- Unicitatea – fiecare unitate a populației trebuie să apațină doar unei grupe
- Completitudinea – toate elementele populației trebuie să fie grupate.
Există posibilitatea ca în anumite populații, unele variabile să prezinte variante
aberante. Valoarea aberanță este varianta variabilei unei unități statistice care se
îndepărtează foarte mult de majoritatea valorilor. De exemplu, dacă se analizează
modul de structurare a populației globale, și se încearcă o grupare a țărilor, luând în
grupare China și India (populație din cele 2 țări reprezintă aproximativ 50% din
populația globală), gruparea nu va fi relevantă, pentru că diferențele între țări sunt
prea mari. Pentru o grupare relevantă este recomandată evidențierea separată a
valorilor aberante, scoaterea lor în afara grupării și sistematizarea datelor rămase.
Clasificarea grupărilor se face în funcție de tipul variabilei de grupare (discretă sau
continuă) și în funcție de plaja valorilor pe care le poate lua variabila astfel:
- Grupare pe variante – atunci când grupăm variabile discrete sau când plaja de
valori pe care le poate lua variabila nu este foarte mare
- Gruparea pe intervale de variație – pentru variabilele continue, care iau valori
pe o plajă largă.

Exemplu de grupare pe variante și grupare pe intervale de variație

a) Gruparea pe variante
Pentru 20 de familie se analizează numărul membrilor și se culeg
următoarele date: 3, 5, 2, 4, 6, 2, 3, 5, 7, 2, 3, 5, 2, 3, 4, 4, 4, 7, 2, 5. Să se
realizeze sistematizarea datelor.
Având în vedere faptul că variabila este discretă și înregistrează doar 6
variante, gruparea se va realiza pe variante, conform tabelul 2.1:
Tabelul nr.2.1
Nr. de membri Nr. de familii
2 5
3 4
4 4
5 4
6 1
7 2
TOTAL 20

b) Gruparea pe intervale de variație


Dacă în schimb se analizează salariul net a 100 de angajați ai unei firme,
fiecare salariu având câte o valoare, atunci gruparea nu este relevantă pe
variante și se realizează gruparea pe intervale de variație, printr-un algoritm
în pași și se obține o scală interval sau o distribuție de frecvențe sau o serie
statistică, ca de exemplu cea prezentată în tabelul 2.2:
Tabelul nr.2.2
Grupe de angajați
după salariul net Nr. de angajați
(u.m.)
900-1400 10
1400-1900 17
1900-2400 23
2400-2900 25
2900-3400 20
3400-3900 3
3900-4400 2
TOTAL 100
Vom obține astfel o distribuție a angajaților în funcție de salariul net
înregistrat.

Algoritm de grupare pe intervale egale de variație:

Pas 1 – Se determină valoarea minimă și maximă a variabilei (xmin și xmax) și


se calculează amplitudinea sau câmpul de variație al variabile:
A = xmax - xmin

Pas 2 – se divide câmpul de variație într-un număr stabil de grupe, care se


determină folosind formula lui H.A.Sturges (1926)

h= , unde:
h – mărimea intervalului de grupare
A – amplitudinea
n – numărul de elemente ale populației analizate
Se recomandă: - utilizarea unui număr potrivit de grupe (4-10 grupe)
- folosirea mărimilor rotunjite de interval

Pas 3 – se formează intervalele de grupare, pornind de la valoarea minimă a


variabilei, adăugând mărimea intervalului, până la valoarea maximă și se numără
câte unități aparțin fiecărui interval. Se obține astfel frecvența statistică, motiv pentru
care grupările obținute poartă denumirea de distribuții de frecvențe.

Gruparea datelor pe intervale egale se poate realiza utilizând intervale închise şi/sau
deschise. Intervalele închise prezintă amândouă limitele, şi cea inferioară şi cea
superioară, iar intervalele deschise numai pe una din acestea. Intervalele deschise se
folosesc pentru sistematizarea datelor privind colectivităţi statistice mari sau
colectivităţi statistice care înregistrează valori aberante. Pentru realizarea calculelor
pe date grupate pe intervale deschise se procedează la închiderea intervalelor
adăugând la limita dată, mărimea intervalului (sau scăzând din limita dată mărimea
intervalului, dacă primul interval de grupare este cel deschis). Această acțiune, deși
contribuie la pierderea unor date, face ca datele aberante să fie eliminate din grupare,
ceea ce va contribui la calcul de indicatori relevanți pentru valorile omogene sau
apropiate, respectiv pentru marea majoritate a valorilor.
Gruparea datelor se poate realiza și pe intervale inegale de variație, fără a utiliza
un algoritm de grupare, atunci când variabila se exprimă calitativ. În exemplul
următor este prezentată și gruparea pe intervale inegale.

2.3.3.PREZENTAREA DATELOR SUB FORMĂ DE TABELE ȘI GRAFICE


Pentru o facilita calculul indicatorilor propuși în instrumentarul statistic, datele
prelucrate se prezintă sub formă de tabele și grafice.
Tabelul statistic este forma de prezentare a datelor care au rezultat din observarea
sau prelucrarea statistică. Un tabel statistic trebuie să poarte un titlu care să prezinte
conținutul datelor și localizarea lor în timp și spațiu, sau un număr, pe baza căruia se
poate apela conținutul din text. De asemenea, trebuie să fie prezentată unitatea de
măsură folosită pentru exprimarea datelor precum și sursa de date și nota explicativă
prin care se aduc lămuriri la diferite proceduri utilizate în elaborarea tabelului.
Tipuri de tabele statistice
- Tabelul descriptiv este utilizat pentru înregistrarea și prezentarea datelor
primare în etapa culegerii și sistematizării datelor (de exemplu tabelul nr. 2.3)
- Tabelul simplu este utilizat pentru prezentarea datelor cronologic, teritorial
sau organizatoric, după o singură variabilă (de exemplu, tabelele 2.4, 2.5, 2.6,
2.7)
- Tabelul combinat reflectă combinarea datelor după cel puțin două variabile, și
are două forme particulare:
 Tabelul cu dublă intrare care prezintă variația simultană a
populației după două variabile, una cauză și una efect (de
exemplu tabelul nr. 2.8)
 Tabelul de asociere care se utilizează atunci când variabilele se
exprimă alternativ de exemplu tabelul 2.9). Variabilele
alternative pure sunt exprimate nenumeric (adevărat / fals,
da/nu, urban/rural) dar și variabilele numerice pot fi exprimate
alternativ, folosind nivelul mediu și exprimarea mai mare sau
mai mic decât acest nivel.
Graficul statistic este o expresie vizuală, concentrată a informației statistice.
Graficul face mai ușor lizibil un fenomen economic măsurat statistic. Un grafic
trebuie să cuprindă titlul graficului, care să localizeze în timp, în spațiu și
administrativ conținutul indicatorilor sau să poarte un număr pentru a putea fi apelat
din text. De asemenea graficul trebuie să cuprindă scara de reprezentare și legenda
graficului care explică figurile folosite în construirea graficului. Ca și în cazul
tabelului statistic, graficul trebuie să aibă menționată sursa de date și nota
explicativă, dacă este cazul.
Tipuri de grafice
- Reprezentări bazate pe figuri geometrice (diagrama prin coloane, prin benzi, de
structură, polară, prin bare, prin suprafețe sau cartogramele și cartodiagramele
– exemplicate în ceea ce urmează)
- Reprezentări grafice specifice în statistică (histograma și poligonul frecvențelor
– grafice de reprezentare a distribuțiilor de frecvențe, cronograma,
corelograma, ș.a. care vor fi prezentate în unități de studiu următoare:
Reprezentarea grafică a distribuțiilor de frecvențe, al căror algoritm de formare este
prezentat în această unitate de studiu, se realizează particular prin:
- Histogramă - este graficul format dintr-o succesiune de dreptunghiuri
alăturate având suprafețele proporționale cu frecvențele fiecărei grupe. Se
construiește în sistemul coordonatelor rectangulare, pe axa absciselor se trec
valorile variabilei, iar pe axa ordonatelor se trec valorile frecvențelor (de
exemplu graficul 2.1).
- Poligonul frecvențelor – este graficul definit printr-o linie frântă care unește
perpendicularele, proporționale cu frecvențele, ridicate din centrele grupelor
înscrise pe axa absciselor (de exemplu graficul 2.2).
Exemplu de construire a unei distribuții de frecvențe (gruparea datelor pe
intervale egale)
1.Se cunosc următoarele date despre vechimea în muncă și salariul net
înregistrat de cei 20 de angajați ai unei firme (tabelul nr.2.3)
Tabelul nr. 2.3
Nr. Cod 1 / Vechime Cod / Salariul net
crt. (ani) / Cod 2 (lei)
1 1 2 1 1 1300
2 2 7 2 3 1600
3 1 6 2 2 1500
4 1 4 1 1 1400
5 3 13 3 5 1800
6 2 7 2 4 1700
7 4 15 4 6 1850
8 2 8 2 2 1500
9 1 4 1 1 1400
10 2 9 2 2 1500
11 1 3 1 1 1300
12 4 15 4 5 1800
13 3 12 3 2 1500
14 5 20 5 6 1880
15 4 18 5 4 1730
16 5 21 5 5 1820
17 1 5 1 2 1500
18 3 14 4 4 1720
19 2 8 2 4 1700
20 2 9 2 2 1500

a) Prezentaţi noţiunile statistice de bază utilizate în tabelul nr. 3.


b) Să se sistematizeze datele, după fiecare variabilă în parte, grupându-se pe
intervale; să se utilzeze 2 metode de grupare; pentru caracteristica
numerică elaboraţi două variante. să se reprezinte grafic una dintre
distribuțiile de frecvențe obținute prin histogramă și poligonul frecvențelor
c) Să se grupeze datele simultan după ambele variabile, folosind tabelul cu
dublă intrare și tabelul de asociere.

Rezolvare

a) Populația statistică – angajații


Variabila statistică – vechimea (x) și salariul (y)

b) Gruparea angajaților după vechime (x)

Pas 1 - Se observă xmin= 2 și xmax = 21 și se calculează amplitudinea sau


câmpul de variație al variabile:
A = xmax - xmin=21-2 = 19
Pas 2 – Se determină mărimea intervalului de variație

h= = 3,57 (rotunjim la 4 ani)

Pas 3 – Se construiesc intervalele egale de 4 ani și frecvențele prin


numărare (fi). Având în vedere faptul că există vechimi egale cu limitele
intervalelor trebuie să ținem cont de principiul unicității, și atunci vom realiza 2
grupări, una în care limita superioară este inclusă în interval (tabelul nr. 2.4) și una
în care limita inferioară este inclusă în interval (tabelul nr.2.5).

Tabelul nr. 2.4 Tabelul nr.2.5


Cod 1 / Grupe de Nr. de Cod 2 / Grupe de Nr. de
angajați după angajați angajați după angajați
vechime* (fi) vechime** (fi)
1 2-6 6 1 2-6 6
2 6-10 6 2 6-10 6
3 10-14 3 3 10-14 3
4 14-18 3 4 14-18 3
5 18-22 2 5 18-22 2
TOTAL 20 TOTAL 20
*limita superioară inclusă în interval **limita inferioară inclusă în interval

Grupare pe intervale egale (utilizată pentru măsurarea variabilelor


cantitatative) sau formarea de distribuții de frecvențe

RECOMANDARE: pentru o mai ușoară prelucrare este bine să se codifice


intervalele, cu numere sau litere, care să se regăsească în dreptul datelor
neprelucrate (în tabelele 2.4 și 2.5, apar codificările cu numere de la 1-5, colorate
diferit pentru cele 2 modalități de grupare – cod 1 și cod 2, pentru limită superioară
și respectiv inferioară inclusă în interval, aceste codificări vor fi trecute în dreptul
fiecări valori a variabile în datele din tabelul nr.2.3 și apoi se numără câte elemente
sunt în fiecare interval). Această codificare va simplifica gruparea datelor
combinat, în tabelul cu dublă intrare și în tabelul de asociere.

Gruparea se poate realiza și pe intervale inegale, nealgoritmic, variabila


exprimându-se calitativ ca în tabelul nr.2.6.
Tabelul nr. 2.6
Vechime Nr. de
angajați
Vechime mică* 6
Vechime medie** 9
Vechime mare*** 5
TOTAL 20
Nota: * între 2-6 ani
** între 6-14 ani
*** peste 14 ani
Un astfel de tabel trebuie însoțit însă de o legendă de prelucrare, care să explice ce
se înțelege prin mică, medie și mare. Sub tabelul nr. 6 este prezentată legenda, cu
titlu de exemplu, aceasta depinzând în principal de cel care realizează prelucrarea.
!!! În general, pentru variabilele cantitative se utilizează gruparea pe intervale
egale, aceasta fiind mult mai exactă decât cea pe intervale inegale (aceasta este
potrivită pentru variabilele calitative pure).

Gruparea angajaților după salariu (y)

Pas 1 - Se observă ymin= 1300 și ymax = 1880 și se calculează amplitudinea


sau câmpul de variație al variabile:
A = ymax - ymin = 1880-1300 = 580

Pas 2 – Se determină mărimea intervalului de variație

h= = 108,98 (rotunjim la 109 lei)

Pas 3 – Se construiesc intervalele egale de 109 lei și frecvențele prin


numărare (fj). Având în vedere faptul că nu există salarii egale cu limitele
intervalelor se va realiza o singură grupare (tabelul nr. 2.7).
Tabelul nr. 2.7
Cod / Grupe de Nr. de
angajați după angajați
salariul net (lei) (fj)
1 1300-1409 4
2 1409-1518 6
3 1518-1627 1
4 1627-1736 4
5 1736-1845 3
6 1845-1954 2
TOTAL 20

Reprezentarea grafică a distribuției de frecvențe din tabelul 2.7 prin


histogramă și poligonul frecvențelor (graficul 2.1 și 2.2)
Graficul 2.1. Histograma

Graficul 2.2 – Poligonul frecvențelor


c) Gruparea datelor simultan după ambele variabile, vechime și salariul net

Tabelul cu dublă intrare ( variabila vechime cauză, și variabila salariul net –


efect) se construiește astfel:
- se construiește un tabel în care pe prima coloană se introduc intervalele de
variație ale variabilei cauză iar pe primul rând intervalele de variație ale
variabilei efect
- în corpul tabelului vor fi numărate frecvențele fij, adică frecvențe de
apariție a angajaților simultan după ambele variabile; dacă prelucrarea s-a
realizat folosind codificări, obținerea acestor frecvențe se va realiza ușor,
pentru că se vor număra perechile de coduri 1-1, 1-2, 1-3...și așa mai
departe.
- se obține în final tabelul 2.8
Tabelul 2.8
Cod /
Salariul
net (lei)
1 2 3 4 5 6 TOTAL
1300- 1409- 1518- 1627- 1736- 1845- DUPĂ
1409 1518 1627 1736 1845 1954 VECHIME
Cod 1 /
Vechimea
(ani)
1 2-6 f11 4 f12 2 f13 0 f14 0 f15 0 f16 0 6
2 6-10 f21 0 f22 3 f23 1 f24 2 f25 0 f26 0 6
3 10-14 f31 0 f32 1 f33 0 f34 1 f35 1 f36 0 3
4 14-18 f41 0 f42 0 f43 0 f44 1 f45 1 f46 1 3
5 18-22 f51 0 f52 0 f53 0 f54 0 f55 1 f56 1 2
TOTAL
DUPĂ 4 6 1 4 3 2 20
SALARIU
Tabelul de asociere
Pentru construirea tabelului de asociere, este nevoie de exprimarea alternativă a
variabilelor, ceea ce presupune determinarea nivelului mediul al fiecărei variabile,
aplicând media aritmetică pe datele primare existente în tabelul 2.3.
Astfel: - vechimea medie = 200 / 20 = 10 ani
- salariul net mediu = 32.000 / 20 = 1600 de lei
Tabelul de asociere este o formă particulară a tabelului cu dublă intrare, așadar
vom avea nivele alternative pentru ambele variabile, și vom construi frecvențele
care să respecte simultant 2 condiții de nivel ( tabelul 2.9).

Tabelul 2.9 – Distribuția angajaților după vechime și salariul net


Salariul net (lei)
TOTAL DUPĂ
Vechimea (ani) ≤ 1600 >1600 VECHIME
≤ 10 10 2 12
>10 1 7 8
TOTAL DUPĂ
SALARIU 11 9 20

2.4. REZUMATUL UNITĂȚII DE STUDIU. CUVINTE CHEIE


Statistica operează cu volume mari de date, motiv pentru care a dezvoltat instrumente
care să îi permită o sistematizare a lor. Această sistematizare se referă la culegerea și
observarea datelor, gruparea datelor în distribuții de frecvențe și prezentarea lor prin
intermediul tabelelor și a graficelor. Chiar dacă prin prelucrarea datelor se pierd
anumite informații comparativ cu datele neprelucrate, există avantajul unei vederi
sintetice asupra datelor primare, a observării relațiilor dintre ele și a unei ușoare
prelucrări.
Din perspectiva modului de prezentare a datelor prelucrate, în statistică, cel mai des
utilizate tabele sunt tabele simple și tabele combinate, iar în categoria graficelor,
histograma și poligonul frecvențelor.

CUVINTE CHEIE: prelucrare primară, formula lui Sturges, distribuție de frecvențe,


tabel simplu, tabel combinat, histogramă, poligonul frecvențelor

DE REȚINUT:
În etapele următoare de prelucrare secundară a datelor, respectiv de analiză a datelor
prin calcule de indicatori statistici, trebuie să se realizeze clar distincția între datele
neprelucrate, care formează o distribuție simplă și datele sistematizate pe grupe, care
formează o distribuție de frecvențe.
2.5 TESTE DE AUTOEVALUARE
1. Pe baza datelor grupate în tabelul 2.4. și 2.5 determinați și
interpretați indicatorii proprii unei scale interval.

2. Despre 40 de firme se cunosc următoarele date depre profitul înregistrat și nr. de


angajați înregistrați la finele anului 2013 (conform tabelului 2.10):
Tabelul nr. 2.10 - Profitul și nr. de angajați din 40 de societăți

Nr. Nr.
Nr.crt. Profit (mii lei) Nr.crt. Profit (mii lei)
angajați angajați
1 2 7 21 12 15
2 23 20 22 15 10
3 10 9 23 18 17
4 28 25 24 19 12
5 3 8 25 32 34
6 9 12 26 34 35
7 14 17 27 20 28
8 25 23 28 22 21
9 21 21 29 30 33
10 24 24 30 16 11
11 24 27 31 2 13
12 2 5 32 24 23
13 6 10 33 22 30
14 9 13 34 22 32
15 17 16 35 16 15
16 6 11 36 38 20
17 24 22 37 13 22
18 23 15 38 24 19
19 24 19 39 27 30
20 19 16 40 29 31

a) Prezentaţi noţiunile statistice de bază utilizate în tabelul nr. 2.10


b) Să se sistematizeze datele, după fiecare variabilă în parte, grupându-se pe
intervale; să se utilzeze 2 metode de grupare; pentru caracteristica numerică elaboraţi
două variante; să se reprezinte grafic una dintre distribuțiile de frecvențe obținute
prin histogramă și poligonul frecvențelor
c) Să se grupeze datele simultan după ambele variabile, folosind tabelul cu dublă
intrare și tabelul de asociere;
d) Pentru una dintre distribuțiile simple, obținute la pct. b, să se calculeze indicatorii
cunoscuți, specifici unei scale interval.

3. Alegerea unei baze de date de pe unul dintre următoarele site-uri: www.insse.ro


– Institutul Național de Statistică, www.ec.europa.eu/eurostat - Site-ul de Statistică al
Comisiei Europene, www.imf.org – Fondul Monetar Internațional,
www.tradingeconomics.com, formata dintr-o populație statistică de 20 de elemente cat
mai omogene, caracterizată după 2 variabile numerice. Să se realizeze prelucrarea
primară a datelor, după modelul prezentat în unitatea de studiu 2.
UNITATEA DE STUDIU 3
MĂRIMI RELATIVE

Cuprins:
3.1.Introducere
3.2.Obiectivele unității de studiu
3.3.Mărimi relative
3.3.1. Concept, dificultăți în construcție și tipuri de mărimi relative
3.3.2. Mărimi relative de structură
3.3.3. Mărimi relative de coordonare
3.3.4. Mărimi relative de intensitate
3.3.5. Mărimi relative de dinamică
3.3.6. Mărimi relative ale planului
3.4.Rezumatul unității de studiu, cuvinte cheie
3.5.Teste de autoevaluare

3.1. INTRODUCERE
După ce datele trec prin etapa de prelucrare primară, după ce sunt grupate și prezentate
sub formă de tabele și grafice, se trece la etapa de prelucrare secundară, respectiv la
etapa de calcul al unor indicatori derivați, care ajută la compararea termenilor, sub
formă de raport sau diferență. Există mai mulți indicatori derivați care se pot grupa în
următoarele categorii: mărimi relative, indicatorii tendinței centrale, indicatorii variației,
indicii statistici.
În cadrul acestei unități de studiu sunt analizate mărimile relative, pornind de la forma
lor generală de calcul și de la dificultățile care pot apărea în construirea lor și
continuând cu caracterizarea fiecărui tip de mărime relativă, din perspectiva modului de
calcul, al reprezentării grafice și al modului concret de aplicare și interpretare. De
asemenea sunt prezentate în cadrul acestei unități aplicații particulare ale unor mărimi
relative, cum ar fi caracterizarea concentrării unui fenomen și analiza poziției pe piață a
unei firme prin cota de piață și cota relativă de piață.

CUNOȘTINȚE PRELIMINARE
Pentru înțelegerea noțiunilor discutate în cadrul acestei unități de studiu este nevoie de
cunoștințe de microeconomie, pentru înțelegerea exemplificărilor, și de matematică,
pentru înțelegerea calculelor care se vor realiza.

DURATA MEDIE DE PARCURGERE A UNITĂȚII DE STUDIU


Durata medie de parcurgere a unității de învățare este de 4 ore.
3.2. OBIECTIVELE UNITĂȚII DE STUDIU
După parcurgerea unității de studiu, studenții vor putea:
- Înțelege conceptul de mărime relativă
- Depista elementele care pot face dificilă construcția mărimilor
relative
- Analiza date prin diferite mărimi relative
- Calcula, interpreta și reprezenta grafic diferite tipuri de mărimi relative
- Caracteriza concentrarea unui fenomen prin diferite modele
- Analiza poziția pe piață a unor entități economice prin cota de piață și
cota relativă de piață.

3.3. MĂRIMI RELATIVE


3.3.1. CONCEPT, DIFICULTĂȚI ÎN CONSTRUCȚIE ȘI TIPURI DE MĂRIMI
RELATIVE
Mărimea relativă se mai numește și indicator statistic sau coeficient statistic și este
rezultatul comparării sub formă de raport sau diferenţă a doi indicatori statistici.
Analiza prin mărimi relative poate viza o analiză în timp (nivelul actual al unui
indicator raportat la nivelul din trecut – de exemplu analiza evoluției PIB-ului
României în ultimii 5 ani), sau o analiză de structurare (nivelul unui indicator
înregistrat de o unitate a unei populații raportat de nivelul total al populației – de
exemplu, structurarea sectoarelor unei economii în funcție de contribuția pe care o
are la formarea PIB, sau raportat la nivelul înregistrat de o unitate semnificativă a
populației – de exemplu, raportul realizărilor unei bănci față de realizările băncii
care ocupă prima poziție în piață) sau o analiză care vizează raport între 2 indicatori
economici total diferiți, dar care puși în corelație contribuie la analiza fenomenului
respectiv (de exemplu, compararea producției cu numărul de angajați, numărului de
studenți cu numărul de cadre didactice, numărului de persoane dintr-o țară cu
numărul de cadre didactice).

Dificultăți în construirea mărimilor relative


Construirea mărimilor relative trebuie să asigure o analiză coerentă a realității
economice ceea ce se poate realiza dacă sunt depăsite principalele dificultăți, care se
referă la următoarele aspecte:
 Asigurarea comparabilității termenilor comparați, în sensul că între
termenii supuși comparării trebuie să existe o relație logică, de
corespondență, de condiționare, de cauzalitate (de exemplu are sens să
împărţim cifra de afaceri la volumul capitalului fix, într-o firmă, obţinând
astfel indicatorul care reflectă eficienţa factorului capital dar nu are sens
să împărţim cifra de afaceri a unei firme la numărul persoanelor aflate în
concediu la un moment dat)
 Alegerea bazei de comparație trebuie făcută astfel încât indicatorul
obținut să aibă semnificație, astfel:
 Dacă analiza se face în timp, atunci baza de comparație va fi
nivelul înregistrat în trecut, într-o perioadă relevantă sau în
perioada imediat anterioară (de exemplu are sens analiza
evoluției cifrei de afaceri a unei firme astfel: CA2014 / CA2013,
și nu raportul CA2013 / CA2014)
 Când raportarea se face între doi indicatori diferiți atunci se
impune raportarea astfel încât raportul să aibă logică și
semnificație ( de exemplu, are sens să calculăm raportul
Capital investit / Număr de investitori și obținem valoarea
capitalului investit per fiecare investitor dar nu are sens să
calculăm raportul Număr de investitori / Capital investit).
 Asigurarea comparabilității datelor care definesc raportul în ceea ce
privește aria de cuprindere și metoda de calcul (de exemplu nu are sens să
raportăm indicatori foarte diferiți cum ar fi populația României și populația
Chinei și nici indicatori care sunt calculați în mod diferit, cum ar fi PIB-ul
României exprimat în prețuri curente și PIB-ul Germaniei determinat la
paritatea puterii de cumpărare, deoarece rezultatele obținute nu sunt
relevante).

Forma de prezentare a mărimilor relative

Forma generală de prezentare a mărimilor relative este:

- Dacă k=0 indicatorul este exprimat ca și coeficient


- Dacă k=2 indicatorul este exprimat în procente
- Dacă k=3 indicatorul este exprimat în promile
- Dacă k=4 indicatorul este exprimat în prodecimile
- Dacă k=5 indicatorul este exprimat în procentimile

Forma mărimilor relative ca și coeficienți și procente se folosesc prioritar în


economie, iar celelalte forme se folosesc în principal în statistica socială (de exemplu,
6 profesori la 1000 de studenți, 21 de persoane bolnave la 100.000 de locuitori).

Tipurile de mărimi relative utilizate în mod frecvent sunt:


- Mărimi relative de structură
- Mărimi relative de coordonare
- Mărimi relative de intensitate
- Mărimi relative de dinamică
- Mărimi relative ale planului

3.3.2. MĂRIMI RELATIVE DE STRUCTURĂ


Mărimile relative de structură exprimă raportul în care se află un element sau un grup
de elemente ale populației față de volumul întregii populații. Se determină atunci când
populaţia supusă analizei a fost împărţită pe grupe şi/sau subgrupe după variaţia uneia
sau mai multor caracteristici de grupare și arată procentul deținut de fiecare grupă în
total.

Forma generală de calcul este:

însă în mod concret, modalitatea de calcul diferă în funcție de tipul de distribuție pe


care se face analiza, astfel:
- pentru distribuții simple, mărimea de structură se notează cu ks și se determină
ca și pondere, astfel:

ks = ,
unde xi – variabila statistică

- pentru distribuțiile de frecvențe, mărimea de structură se poate determina fie


ca frecvență relativă, fie ca pondere, astfel:
 frecvențe relative (f*)

f*=

unde fi este frecvența absolută.

 ponderi (ks)

ks = ,
unde xi – variabila statistică
f i – frecvența statistică absolută
Tabelul de prezentare a calculului mărimilor relative care cuprinde atât
frecvențele relative cât și ponderile poartă denumirea de tabel centralizator.
Reprezentarea grafică a mărimilor relative de structură se realizează prin diagrame
de structură sub formă de pătrat, cerc sau alte figuri geometrice.
Exemplu de analiză prin mărimile relative de structură

Mărimi relative de structură pe distribuții simple

1. Se cunosc informații despre fondul de burse acordat de o facultate


studenților săi conform datelor din tabelul 3.1. Analizați și reprezentați
grafic mărimile relative de structură.

Tabelul 3.1.
Categorie de
burse Fond de bursă ks =
(mii u.m.) (xi)
(%)
Bursa socială 3.106,6 = 49
Bursă de studiu 2.662,8 42
Bursă de merit 570,6 9
TOTAL 6340 100
Interpretarea rezultatelor:
- pondere: 42% din fondul total de bursă este reprezentat de bursele de studiu.

Reprezentarea grafică a mărimilor de structură – cerc de structură

Mărimi relative de structură pe distribuții de frecvențe

2. Nivelul vânzărilor înregistrate de o angajații unei societăți este prezentat în


tabelul 3.2. Analizați structurarea vânzărilor prin mărimile relative de
structură determinate ca frecvențe relative și ponderi.
Tabelul 3.2. – TABELUL CENTRALIZATOR
Centrul
Grupe de Frecvențe intervalului Valori Ponderi
(xi) (u.m.)– ks =
angajați relative (%) centralizate
Nr. de
după salariați f*= valoarea ale
valoarea medie a vânzărilor
vânzărilor (fi) pe intervale
vânzărilor pe
(u.m.) fiecare (xifi) (u.m) (%)
interval*
750×2=
500-1000 2
1500 = 2,09
1000-1500 7 17,95 1250 8750 12,2
1500-2000 15 38,46 1750 26250 36,58
2000-2500 12 30,77 2250 27000 37,63
2500 și 3 7,69 2750 8250 11,50
peste
TOTAL 39 100 - 71750** 100

* Centrul intervalului reprezintă nivelul mediu al variabilei analizate pe fiecare


interval de grupare în parte și de determină ca semisumă a limitelor intervalului.
Pe date grupate pe intervale, analiza mai concretă a variabilei analizate implică de
fiecare dată determinarea centrului de interval. Pentru determinarea centrului de
interval în cazul intervalelor deschise, se procedează la închiderea intervalelor cu
aceași mărime egală cu a celorlalte intervale (de exemplu, ultimul interval 2500 și
peste, se închide teoretic cu mărimea 500 și devine 2500-3000). Prin deteminarea
centrului de interval și prin închiderea intervalelor deschise se pierd date, dar se
pot calcula indicatori pe date sistematizate și în același timp, se elimina datele
aberante.
**71.750 u.m. – reprezintă valoarea totală a vânzărilor pe societate, estimată
folosind centrul intervalului. Determinarea acestei valori totale permite analiza
structurării acestui fenomen

Interpretarea rezultatelor
- frecvența relativă - 17,95% din numărul total de angajați realizează vânzări
cuprinse între 1000 și 1500 u.m
- pondere - 12,2% din valoarea totală a vânzărilor este realizat de cei 7 angajați cu
vânzări între 1500-2000 u.m.

!!!Construirea tabelului centralizator NU are sens pentru toate variabilele și


doar pentru cele care permit determinarea valorilor centralizate pe intervale,
respectiv pentru cele care suportă însumare (de exemplu, dacă facem o analiză
a notelor studenților pe intervale, NU are sens să calculăm ponderi, deoarece acest
lucru ar însemna determinarea valorilor centralizate ca produs între nota centrală
pe interval și numărul de studenți care înregistrează această notă, produs care nu
are sens). În cazul variabilelor neînsumabile direct, mărimile relative de structură
se vor determina doar ca frecvențe relative.
Aplicație a mărimilor relative de structură
Pe lângă semnificaţia directa a mărimilor relative de structură acestea permit
calculul de indicatori prin care se măsoară gradul de concentrare a unui fenomen
economic sau social. Un fenomen este concentrat, atunci când o parte semnificativă a
fenomenului este polarizată pe un număr redus de elemente ale populației. Opusul
concentrării este dispersarea, adică împrăștierea fenomenului pe majoritatea
elementelor populației.
Caracterizarea concentrării, folosind ponderile se realizează utilizând mai multe
modele, dintre acestea, mai des utilizate fiind modelul Hirschman-Herfindhal,
modelul Gini Corado și modelul Strűck.

Modelul Hirschman-Herfindhal propune calculul concentrării prin următoarea


formulă:

KH= , unde pi reprezintă ponderea deținută de


fiecare element sau grupă de elemente în total

Indicatorul ia valori în intervalul ( , unde n reprezintă numărul de unități


sau grupe pentru care se analizează concentrarea. Interpretarea concentrării se face
în funcție de apropierea rezultatului față de limitele intervalului: cu cât se aproprie
mai mult de limita inferioară cu atât concentrarea este mai redusă și cu cât se
aproprie mai mult de limita superioară cu atât concentrarea este mai ridicată.

Modelul Gini Corado propune calculul concentrării prin următoarea formulă:

KG= , unde pi reprezintă ponderea deținută de


fiecare element sau grupă de elemente în total

Indicatorul ia valori în intervalul ( , unde n reprezintă numărul de

unități sau grupe pentru care se analizează concentrarea. Interpretarea concentrării


se face în funcție de apropierea rezultatului față de limitele intervalului: cu cât se
aproprie mai mult de limita inferioară cu atât concentrarea este mai redusă și cu
cât se aproprie mai mult de limita superioară cu atât concentrarea este mai
ridicată.
Modelul Strűck propune calculul concentrării prin următoarea formulă:

Ks= , unde pi reprezintă ponderea deținută de

fiecare element sau grupă de elemente în total


Indicatorul ia valori în intervalul ( . Interpretarea concentrării se face în
funcție de apropierea rezultatului față de limitele intervalului: cu cât se aproprie
mai mult de limita inferioară cu atât concentrarea este mai redusă și cu cât se
aproprie mai mult de limita superioară cu atât concentrarea este mai ridicată.

Exemplu de caracterizare a concentrării

Se solicită analiza concentrării populației școlare pe cicluri de învățământ, folosind


datele prezentate în tabelul 3.3.

Tabelul 3.3.
Grupe de elevi după
Nr. de elevi Ponderi (pi)*
ciclul de învățământ
Învătământ preșcolar 17378 = 0,22 0,0484
Învătământ primar 21046 0,26 0,0676
Învătământ gimnazial 19046 0,24 0,0576
Învătământ profesional 6160 0,08 0,0064
Învătămât liceal 15452 0,19 0,0361
Învătământ postliceal 706 0,01 0,0001
TOTAL 79788 1 0,2162

*având în vedere modul de aplicare a modelelor de concentrare se recomandă


determinarea ponderilor ca și coeficienți, și nu ca și procente.

Caracterizarea concentrării prin următoarele modele:

KH= = 0,2162
KH € ( respectiv ( sau (0,17; 1)
Având în vedere că KH în acest exemplu se apropie mai mult de limita
inferioară, respectiv de 0,17 → concentrare redusă a populației școlare pe cicluri
de învățământ

KG= = = 0,47

KG € ( respectiv ( sau (0,42; 1)


Având în vedere că KG în acest exemplu se apropie mai mult de limita
inferioară, respectiv de 0,42 → concentrare redusă a populației școlare pe cicluri
de învățământ
Ks= = =0,24

Ks € (
Având în vedere că Ks în acest exemplu se apropie mai mult de limita
inferioară, respectiv de 0 → concentrare redusă a populației școlare pe cicluri de
învățământ

3.3.3. MĂRIMI RELATIVE DE COORDONARE


Mărimile relative de coordonare se folosesc atunci când se dorește compararea a două
mărimi ale aceluiași indicator calculat pentru două grupe ale aceleiași populații sau
pentru populații statistice de același fel dar situate în spații diferite.

Forma generală de calcul este:

Baza de comparație se alege ca fiind o valoare semnificativă, care înregistrează cel


mai mic sau cel mai mare nivel.
În mod concret, modalitatea de calcul diferă în funcție de tipul de distribuție pe care se
face analiza, astfel:
- pentru distribuții simple, mărimea de coordonare se notează cu kc și se
determină astfel:

kc = ,
unde xA, respectiv xB – reprezintă indicatorul corespunzător grupei A, respectiv B
- pentru distribuțiile de frecvențe, mărimea de coordonare se poate determina
fie pe baza frecvențelor diferitelor grupe, fie pe baza valorilor centralizate ale
diferitelor grupe, astfel:

kc =
unde fA, respectiv fB este frecvența absolută a grupei A, respectiv B

sau kc = ,
unde xAfA – valori centralizate ale grupei A
xBfB – valori centralizate ale grupei B
Reprezentarea grafică a mărimilor relative de structură se realizează prin diagrame
prin benzi sau prin coloane.

Exemplu de determinare a mărimilor relative de coordonare

Mărimi relative de coordonare pe distribuții simple

1. Se cunosc următoarele date despre fondul de burse acordat de o facultate


studenților săi conform datelor din tabelul 3.4. Analizați și reprezentați
grafic mărimile relative de coordonare.
Tabelul 3.4.
Categorie de
burse
Fond de bursă
(mii u.m.) (xi)
kc = (%)
Bursa socială 3.106,6 – xbaza de = 100
comparație
Bursă de studiu 2.662,8 = 85,71
Bursă de merit 570,6 18,37
TOTAL 6340 -
Interpretarea rezultatelor:
- 85,71% - fondul de bursă alocat burselor de studiu reprezintă 85,41 raportat la
fondul de bursă pentru bursele de studiu.

Reprezentarea grafică a mărimilor de coordonare – diagrama prin benzi

Mărimi relative de coordonare pe distribuții de frecvențe

2. Nivelul vânzărilor înregistrate de o angajații unei societăți este prezentat în


tabelul 3.5. Determinați și interpretați mărimile relative de coordonare.
Tabelul 3.5.
Centrul
Grupe de intervalului Valori
(%)
angajați (xi) (u.m.)– centralizate (%)
Nr. de kc =
după salariați valoarea ale kc =
valoarea medie a vânzărilor
vânzărilor (fi) pe intervale
vânzărilor pe
(u.m.) fiecare (xifi) (u.m)
interval*
750×2=
500-1000 2
1500 = 5,56
1000-1500 7 46,67 1250 8750 32,41
1500-2000 15- 100 1750 26250 97,22
baza de
comp.
2000-2500 12 80 2250 27000 - 100
baza de
comp.
2500 și 3 20 2750 8250 30,56
peste
TOTAL 39 - - 71750 -

Interpretarea rezultatelor
- 80% - numărul de angajați care realizează vânzări între 2000-2500 u.m.
reprezintă 80% raportat la numărul de angajați cu vânzări între 1500-2000 u.m.
- 32,41% - valoarea vânzărilor celor 7 angajați care realizează vânzări între 1000-
1500 u.m. reprezintă 32,41% raportat la valoarea vânzărilor realizată de cei 12
angajați care realizează vânzări între 2000-2500 u.m.

Aplicație comună a mărimilor relative de structură și de coordonare

Un exemplu comun pentru mărimile relative de structură și de coordonare este


reprezentat de indicatorii prin care se caracterizează poziția pe piață a unor entități
economice (firme sau bănci), respectiv cota de piață și cota relativă de piață.
Cota de piață a unei entități este indicatorul care arată cât reprezintă cifra de afaceri a
entității în totalul vânzărilor de pe piața la care participă, fiind astfel o mărime relativă
de structură.
Cota relativă de piață este indicatorul care arată poziția firmelor participante pe o
piață față de lider, fiind astfel o mărime relativă de coordonare.
Exemplu comun de aplicare a mărimilor relative de structură și de
coordonare

Să se analizeze poziția pe piață a primelor 5 bănci din sistemul bancar, luând în


considerare valoarea activelor înregistrată la finele anului 2008 prezentată în
tabelul nr. 3.6. și tinând cont de faptul că valoarea totală a activelor pe piață la acea
dată a fost de 78,60 mld €.
Tabelul 3.6.
Banca Valoarea activelor Cota de piață Cota relativă de
(mld €) (%) piață (%)
BCR 16 - lider = 20,35 = 100
BRD 11,5 14,63 = 71,87
Raiffeisen 6,78 8,62 42,37
Volksbank 5,3 6,74 33,12
Banca
4,6 5,85 28,75
Transilvania

Interpretarea rezultatelor:
- cota de piață de 14,63% arată faptul că activele BRD reprezintă 14,63% din
totalul activelor bancare din sectorul bancar românesc.
- cota relativă de piață de 33,12% arată faptul că activele Volksbank reprezintă
33,12% raportat la activele liderului bancar BCR

3.3.4. MĂRIMI RELATIVE DE INTENSITATE


Mărimile relative de intensitate se obțin prin raportarea a doi indicatori absoluți de
natură diferită, dar care se află în relație de interdependență și se pot calcula atât a
nivelul populației în ansamblu cât și la nivelul grupelor acestora. Indicatorii utilizați în
analiza economico-financiară sunt considerați mărimi relative de inensitate.
Forma generală de calcul este:

unde xi și yi sunt indicatori de natură diferită dar cu legătură între ei.


Exemple de mărimi relative de intensitate

Productivitatea muncii:

W= sau

unde Q – volumul producției


L – numărul de salariați
T – timp

Rentabilitatea = sau

3.3.5. MĂRIMI RELATIVE DE DINAMICĂ


Mărimile relative de dinamică se utilizează pentru caracterizează evoluția în timp a
fenomenelor.
Forma generală de calcul este:

În funcție de modul în care se alege baza de comparație, se pot calcula două tipuri de
mărimi relative de dinamică:

- Mărimi relative de dinamică cu bază fixă (kd n/o) care arată evoluția unui
fenomen față de o perioadă fixată în timp (prima perioadă sau o perioadă
relevantă fixată din trecut).

kd n/o = × 100

- Mărimi relative de dinamică cu bază în lanț (kd n/n-1) care arată evoluția unui
fenomen într-o perioadă față de nivelul înregistrat în perioada imediat
anterioară.

kd n/n-1 = × 100

Reprezentarea grafică a mărimilor relative de dinamică se realizează prin graficul


denumit corelogramă. Corelograma este graficul construit în sistemul de axe în care
pe axa OX se reprezintă variabila timp, iar pe axa OY se reprezintă indicatorul
analizat.
Exemplu de determinare a mărimilor relative de dinamică

Să se analizeze evoluția încasărilor medii per salariat lunare prezentate în tabelul


nr. 3.7. utilizând mărimile relative de dinamică. Să se interpreteze rezultatele și să
se reprezinte grafic evoluția în timp prin corelogramă.

Tabelul nr. 3.7.

kd n/o = kd n/n-1 =
Încasări medii /
Luna
salariat (mii u.m.) × 100 (%) × 100 (%)

Iulie 2,5 = 100 -

August 2,8 = 112 = 112


Septembrie 3,58 143 = 127,8
Octombrie 3,36 134,4 93,8
Noiembrie 3,32 132,8 98,8
Decembrie 3,79 151,6 114,16

Interpretarea rezultatelor:
- 143% - încasările medii pe salariat în septembrie au crescut la 143%, sau au
crescut cu 43% sau au crescut de 1,43 ori față de încasările medii pe salariat din
luna iulie.
- 98,8% – încasările medii pe salariat în noiembrie au scăzut la 98,8%, sau au
scăzut cu 1,2%, sau au scăzut de 0,988 ori față de încasările din luna anterioară
(octombrie)

Reprezentarea grafică prin corelogramă


3.3.6. MĂRIMI RELATIVE ALE PLANULUI
Mărimile relative ale planului sunt forme particulare ale mărimilorrelative de
dinamică, care se utilizează în analiza fenomenelor economice și sociale care se
desfășoară planificat, programat.
Există două mărimi relative ale planului, în funcție de momentul în care se calculează
și scopul cu care se calculează, astfel:
- Mărimea sarcinii de plan (k pl/0) se calculează raportând nivelul planificat pentru
perioada următoare la nivelul realizat în perioada încheiată, pentru a arăta
procentul de creștere planificată a fenomenului analizat

k pl/0 = ×100

- Mărimea îndeplinirii sarcinii de plan (k 1/pl) se calculează raportând nivelul


înregistrat pentru perioada pentru care s-a făcut planificarea la nivelul
planificat, pentru a arăta gradul de îndeplinire al planului

k 1/pl = ×100

Exemplu de determinare a mărimilor relative ale planului

Evoluția vânzărilor realizate de 4 echipe ale unei societăți se prezintă conforma


datelor din tabelul 3.8. Să se determine și să se interpreteze mărimile relative ale
planului.
Tabelul nr. 3.8
Valoare Valoare Valoare
vânzărilor vânzărilor vânzărilor
Echipa
realizată în planificată pentru realizată în
2013 (mii u.m.) 2014 (mii u.m.) 2014 (mii u.m.)
A 50 57,5 65
B 75 86,25 73
C 45 51,75 55
D 30 34,5 25
TOTAL 200 230 218
Echipa k pl/0 = ×100 (%) k 1/pl = ×100 (%)
A ×100 = 115 ×100 = 113,04
B 115 84,64
C 115 106,28
D 115 72,46
TOTAL ×100 = 115 ×100 = 94,78
Interpretarea rezultatelor:
- 115% - pe total societate și pe fiecare echipă în parte se planifică pentru 2014 o
creștere a vânzărilor cu 15% față de 2013 (nu este obligatoriu să se planifice
creșterea uniform pentru toate echipele, acest aspect depinde de viziunea
managerului de vânzări).
- 94,78% – pe total societate, în 2014, valoarea vânzărilor realizată a fost cu
5,22% mai mică decât valoarea planificată.

3.4. REZUMATUL UNITĂȚII DE STUDIU. CUVINTE CHEIE


Prelucrarea secundară a datelor presupune calculul unor indicatori de analiză a
realității, prima categorie fiind reprezentată de mărimile relative. Acești coeficienți
presupun determinarea raportului între un termen de comparat și un termen bază de
comparație și permit analiza structurării unui fenomen, poziționarea unor grupe față
de cele relevante, analiza economică a unor indicatori, evoluția în timp a unui
fenomen și gestiunea activității care se desfășoară în mod planificat. Fiecare mărime
relativă presupune o anumită modalitate de calcul și de interpretare și o anumită
modalitate de reprezentare grafică, care au fost exemplificate în cadrul acestei unități
de studiu.
De asemenea mărimile relative au și aplicații particulare, respectiv analiza
concentrării unui fenomen și analiza poziționării pe piață prin cota de piață și cota
relativă de piață.

CUVINTE CHEIE: mărimi relative de structură, de coodonare, de intensitate, de


dinamică, ale planului, concentrare, cota de piață, cotă relativă de piață, centrul
intervalului

DE REȚINUT:
Pentru determinarea indicatorilor pe distribuții de frecvențe cu date grupate pe intervale,
este necesară determinarea centrului de interval, care reprezintă valoarea medie a
variabilei pe fiecare interval și se determină ca semisumă a limitelor intervalului.
3.5. TESTE DE AUTOEVALUARE
1. Se cunosc următoarele date despre valoarea pensiilor înrgistrate la
nivelul unei regiuni (tabelul nr. 3.9) .
Tabelul nr. 3.9.
Grupe de persoane după
Nr. pensionari
valoarea pensiei (mii u.m.)
Sub 700 45
700-1000 70
1000-1300 120
1300-1600 250
1600-1900 95
1900 și peste 25
Să se construiască tabelul centralizator și să se analizeze rezultatele obținute.
2. Se cunosc următoarele date despre rezervele valutare internaționale ale unor țări
(tabelul 3.10.):
Tabelul nr. 3.10.
Valoarea rezervelor
Țara
valutare (mil USD)
Brazilia 237.000
China 2.416.000
Japonia 1.022.000
România 40.000
Coreea 270.000
Germania 60.000
TOTAL 4.045.000

Să se caracterizeze concentrarea rezervelor valutare la nivelul celor 6 țări folosind


modelele propuse de Hirschman, Gini-Corado si Strűck.

3. Evoluția profitului înregistrat de 50 de societăți se prezintă conform datelor din


tabelul 3.11.
Tabelul nr. 3.11.
Valoarea profitului
Anul
(mii u.m.)
2007 250
2008 350
2009 325
2010 220
2011 125
2012 115
2013 175
2014 225
Analizați evoluția profitului, folosind mărimile relative de dinamică. Construiți
corelograma.
4. Se cunosc următoarele date referitoare la vânzările de medicamente realizate de
principalii producători din țară în 2008 și 2009, conform tabelului 3.12.
Tabelul 3.12

Să se determine cota de piață și cota relativă de piață a producătorilor în 2008 și 2009,


știind că vânzârile totale de medicamente în 2009 au fost de 300 de milioane de euro,
iar în 2008 de 270 milioane de euro.

5. Se cunosc următoarele date despre valoarea vânzărilor din 2009, a vânzărilor


planificată pentru 2010 și valoarea vânzărilor realizată în 2010 de 5 echipe ale unei
societăți (tabelul 3.13):
Tabelul nr. 3.13

Analizați modul de realizare a rezultatelor planificate folosind mărimile relative ale


planului.
UNITATEA DE STUDIU 4
INDICATORI DE POZIȚIE

Cuprins:
4.1.Introducere
4.2.Obiectivele unității de studiu
4.3.Indicatori de poziție
4.3.1. Media
4.3.2. Mediana
4.3.3. Modulul
4.3.4. Relația între medie, mediana și modul
4.4.Rezumatul unității de studiu, cuvinte cheie
4.5.Teste de autoevaluare

4.1. INTRODUCERE
În cadrul acestei unități de studiu sunt abordați indicatorii de poziție, mărimile medii,
mediana și modulul, locul și rolul acestora într-o analiză economică precum și modul de
calcul și interpretarea acestora. Modul de determinare al indicatorilor este prezentat în
mod particular în funcție de tipul de distribuție utilizat pentru prezentarea datelor. La
finalul unității de studiu este prezentată relația între indicatorii de poziție, respectiv
medie, mediană și modul.

CUNOȘTINȚE PRELIMINARE
Pentru înțelegerea noțiunilor discutate în cadrul acestei unități de studiu este nevoie de
cunoștințe de microeconomie, pentru înțelegerea exemplificărilor, și de matematică,
pentru înțelegerea calculelor care se vor realiza.

DURATA MEDIE DE PARCURGERE A UNITĂȚII DE STUDIU


Durata medie de parcurgere a unității de învățare este de 2 ore.

4.2. OBIECTIVELE UNITĂȚII DE STUDIU


După parcurgerea unității de studiu, studenții vor putea:
- Identifica caracteristicile mediei, medianei și modulului
- Analiza date prin indicatori de poziție
- Calcula și interpreta indicatorii de poziție în mod diferit în funcție de tipul
de distribuție utilizată
- Utiliza relația între medie, mediană și modul
4.3. INDICATORI DE POZIȚIE
Indicatorii de poziție sau indicatorii medii se referă la indicatori care reflectă o
valoarea semnificativă sau o valoare care ocupă o poziție semnificativă. Există două
categorii de medii: medii calculate (media aritmetică, pătratică, armonică, geometrică)
și medii poziționale (mediana și modulul).
4.3.1. MEDIA
Media este expresia care sintetizează într-un singur nivel reprezentativ tot ceea ce este
esențial, tipic, comun, obiectiv în apariția, manifestarea și dezvoltarea unui fenomen.
Este numărul susceptibil de a rezuma ansamblul valorilor observate ale unei variabile,
reprezentat de o funcție de aceste valori. Este un indicator de poziție pentru că se află
în interiorul intervalului de variație a variabilei.
Media este un indicator cu o aplicabilitate largă, fiind calculat în toate sectoarele de
activitate, de exemplu: salariul mediu, PIB-ul mediu, vechimea medie, nota medie,
producția medie, rata inflației medie, numărul mediu de salariați, etc.
Media din punct de vedere matematic se poate calcula pe orice șir de date. Din punct
de vedere statistic însă ne propunem să determinăm medii care sunt reprezentative
pentru datele analizate. Astfel, pentru ca o medie să fie reprezentativă, trebuie să fie
îndeplinite următoarele condiții:
 Să existe un număr mare de cazuri individuale pe baza cărora să se calculeze
media (spre exemplu, vârsta medie a 2 persoane, una care are 20 de ani și
cealaltă 30 de ani, este 25 de ani, dar nu este reprezentativă pentru nici una din
persoane; dacă însă se calculează vârsta medie a 100 de persoane cu vârsta
între 20 și 30 ani, aceasta va fi reprezentativă pentru mai multe cazuri
individuale).
 Valorile din care se calculează media trebuie să cât mai omogene, adică să nu
existe diferențe semnificative între valori, pentru că aceste diferențe vor face ca
valoarea medie să nu fie relevantă pentru majoritatea elementelor (spre
exemplu, calculul unei populații medie a țărilor, printre care și China și India,
care au jumătate din populația globală, va face media nereprezentativă).
 Să se folosească forma matematică care se potrivește cel mai bine variației
caracteristicii și volumului de date de care se dispune.
Tipurile de medii care se pot calcula sunt: media aritmetică, media pătratică, media
geometrică, media armonică și media cronologică, fiecare dintre ele având două
forme de calcul, forma simplă utilizată pentru distribuțiile simple și forma ponderată,
utilizată pentru distribuțiile de frecvențe. Media armonică și media cronologică sunt
medii particulare care se utilizează mai rar atunci când datele sunt prezentate
fracțional, respectiv când datele sunt prezentate într-o serie cronologică de momente,
așadar nu vor fi prezentate în cadrul acestei unități de studiu.
Media aritmetică – se folosește atunci când fenomenul supus cercetării înregistrează
modificări aproximativ în progresie aritmetică
Media aritmetică în forma simplă se folosește atunci când datele sunt
nesistematizate, respectiv pe distribuții simple

͞x = ,
unde xi sunt valorile variabilei și n este numărul de elemente ale populației
Media aritmetică în forma ponderată se folosește pentru distribuții de frecvențe

͞x =

unde xi sunt valorile variabilei și fi sunt frecvențele de apariție ale variabilei


Media aritmetică ponderată este influențată atât de nivelul variabilei cât și de nivelul
frecvenței. În cazul distribuțiilor de frecvențe contruite pe intervale, se ia în calcul, ca
nivel al variabilei, centrul intervalului.
Media pătratică – se folosește atunci când fenomenul supus cercetării înregistrează
modificări aproximativ în progresie geometrică.
Media pătratică în forma simplă se folosește atunci când datele sunt nesistematizate,
respectiv pe distribuții simple

͞xp =

unde xi sunt valorile variabilei și n este numărul de elemente ale populației


Media pătratică în forma ponderată se folosește pentru distribuții de frecvențe

͞xp =

unde xi sunt valorile variabilei și fi sunt frecvențele de apariție ale variabilei


Pentru aceeași distribuție, media pătratică este mai mare decât media aritmetică. Prin
media pătratică se scoate în evidență influența valorilor mari ale variabilei. Media
pătratică este utilizată în unitatea de studiu 5, la determinarea abaterii medii pătratice.
Media geometrică – se mai numește și medie de ritm și se folosește atunci când
fenomenul supus cercetării înregistrează un ritm de modificare încetinit chiar dacă
volumul absolut al modificării este din ce în ce mai mare. Spre deosebire de celelalte
feluri de mărimi medii bazate pe relația de aditivitate, media geometrică se bazează
pe relația de produs al termenilor seriei.
Media geometrică în forma simplă se folosește atunci când datele sunt
nesistematizate, respectiv pe distribuții simple

͞xg =
unde xi sunt valorile variabilei și n este numărul de elemente ale populației
Media geometrică în forma ponderată se folosește pentru distribuții de frecvențe

͞xg =

unde xi sunt valorile variabilei și fi sunt frecvențele de apariție ale variabilei


Pentru aceași distribuție, media geometrică este mai mică decât media aritmetică.
Prin media geometrică se scoate în evidență influența valorilor mici ale variabilei. În
mod practic media geometrică se utilizează pentru determinarea indicelui mediu de
dinamică, care va fi tratat în altă unitate de studiu, și acolo va fii și exemplificată.
Media geometrică nu poate fi folosită dacă distribuția statistică are cel puțin un
termen negativ sau zero.

4.3.2. MEDIANA
Mediana, alături de modul sunt variante ale caracteristicii care, prin poziția ocupată în
distribuție exprimă cu aproximație nivelul mediu în jurul căruia tinde să se grupeze fie
întreaga populație, fie o parte preponderentă a acesteia.
Mediana este acea valore a variabilei care ocupă locul central în cadrul distribuției
ordonată crescător sau descrescător, cea care împarte seria statistică în două părți
egale. Numărul valorilor individuale inferioare medianei este egal cu numărul
valorilor individuale superioare acesteia, motiv pentru care mediana se mai numește
și valoarea echiprobabilă a variabilei.
Pentru distribuțiile simple, deteminarea medianei depinde de numărul de termeni ai
seriei, astfel:
 Dacă distribuția are un număr impar de termeni mediana se află pe poziția
(n+1) / 2, în distribuția ordonată crescător sau descrescător
 Dacă distribuția are un număr par de termeni, mediana este dată de semisuma
termenilor centrali, pentru distribuția ordonată crescător sau descrescător.
Pentru distribuțiile de frecvențe, mediana se estimează printr-un algoritm în doi pași:
Pas 1. Se determină intervalul median (intervalul în care se află mediana) ca
fiind primul interval cu frecvența cumulată mai mare decât ∑fi / 2.
Pas 2. Se determină mediana, în mod diferit în funcție de numărul de
elemente ale populației, astfel:
 Dacă distribuția are un număr par de termeni:

Me = xMe + h
 Dacă distribuția are un număr impar de termeni:

Me = xMe + h

Unde:
- Me este mediana
- h este mărimea intervalului median
- xMe este limita inferioară a intervalului median
- fi sunt frecvențele de apariție ale variabilei
- fcum este frecvența cumulată până la intervalul median
- fMe este frecvența absolută a intervalului median
Cu cât diferența (͞x – Me) este mai mică, cu atât media aritmetică este mai
reprezentativă.

4.3.3. MODULUL
Modulul reprezintă acel nivel al variabilei care înregistrează frecvența cea mai mare,
respectiv valoarea care predomină, care se repetă de cele mai multe ori. Modulul se
poate determina doar pe distribuții de frecvențe
Dacă distribuția de frecvențe este pe variante, atunci modulul se observă ca fiind
varianta variabilei care înregistrează cea mai mare frecvență (exemplificarea am
realizat-o în unitatea de studiu 1, pe baza datelor din tabelul 1.1).
Dacă distribuția de frecvențe este pe intervale, modulul se stabilește printr-un
algoritm în doi pași
Pas 1. Se determină intervalul modal (intervalul în care se află modulul) ca
fiind intervalul cu frecvența absolută cea mai mare, sau dacă există 2 intervale cu
frecvența cea mai mare, atunci intervalul modal este primul interval cu frecvența
cumulată mai mare sau egală cu ∑fi / 2.
Pas 2. Se estimează nivelul modulului astfel:

Mo = xMo + h

Unde:
- Mo este modulul
- h este mărimea intervalului modal
- Δ1 este diferența dintre frecvența intervalului modal și frecvența intervalului
imediat anterior
- Δ2 este diferența dintre frecvența intervalului modal și frecvența intervalului
imediat următor
Pe graficul unei distribuții statistice (histograma sau poligonul frecvențelor) valoarea
modală corespunde punctului în care graficul atinge maximul respectiv vârfului
graficului. În practica statistică există distribuții multimodale.
4.3.4. RELAȚIA ÎNTRE MODUL, MEDIANĂ ȘI MEDIA ARITMETICĂ
Relația matematică formulată de Pearson pentru o distribuție ușor asimetrică, adică
distribuția ale cărei frecvențe se abat puțin de la curba normală (Gauss Laplace) a
frecvențelor este următoarea:

Mo = 3Me – 2͞x
În cazul distribuțiilor asimetrice sau care conțin date aberante, relația lui Pearson nu
se verifică. Mediana și modulul, ca indicatori nu sunt influențați de termenii seriei,
deci nici de valorile aberante, în timp ce media sintetizează influența tuturor
termenilor, și de aici este afectată și relația lui Pearson.

Exemplu de determinare a mediei, medianei și modulului

Pentru distribuții simple

1. Distribuția salariilor a 20 de angajați ai unei societăți se prezintă conform


datelor din tabelul 4.1.. Să se determine indicatorii poziției centrale (media
aritmetică și pătratică, mediana și modulul).
Tabelul nr. 4.1.

Nr. crt. Salariul net


(lei)
1 1300
2 1600
3 1500
4 1400
5 1800
6 1700
7 1850
8 1500
9 1400
10 1500
11 1300
12 1800
13 1500
14 1880
15 1730
16 1820
17 1500
18 1720
19 1700
20 1500
TOTAL 32000
Media aritmetică ͞x = = = 1600 lei (salariul mediu)
Media pătratică ͞xp = = = 1609,98 lei
(salariul mediu care evidențiază influența salariilor mari)

Mediana
Pentru determinarea medianei se ordonează valorile seriei crescător:

1300, 1300, 1400, 1400, 1500, 1500, 1500, 1500, 1500, 1500, 1600, 1700, 1700,
1720, 1730, 1800, 1800, 1820, 1850, 1880

Fiind vorba de un număr par de termeni, mediana se determină ca semisuma


termenilor centrali.

Me = = 1550 lei (salariul care ocupă locul central)

Pentru distribuții de frecvențe

2. Folosind datele grupate ale salariilor (tabelul 4.2.), obținute în urma


procedurilor de grupare prezentate în unitatea de studiu 2, să se determine
indicatorii tendinței centrale (media aritmetică și pătratică, mediana și
modulul) și să se verifice relația lui Pearson.
Tabelul 4.2
Grupe de Nr. de Centrul Valori Frecv.
angajați după angajați intervalului (xi) centralizate ale abs.
salariul net (lei) (fi) salariilor (xifi) cum.
1300-1409 4 = 1354,5 1354,5×4=5418 4
1409-1518 6 1463,5 8781 10 – fcum
1518-1627 1 - fMe 1572,5 1572,5 11
1627-1736 4 1681,5 6726 15
1736-1845 3 1790,5 5371,6 18
1845-1954 2 1899,5 3799 20
TOTAL 20 - 31668 -
Interval median
Intervalul modal

Media aritmetică ͞x = = = 1583,4 lei (salariul mediu în


formă ponderată)

Media pătratică

͞xp = = = 1593,83 lei


(salariul mediu în formă ponderată care evidențiază influența salariilor mari)

Mediana (nr. par de termeni – 20 de angajați)


Pas 1. Se determină intervalul median – primul interval care are frecvența
cumulată mai mare decât ∑fi / 2 este intervalul 1518-1627 care are frecvența
cumulată 11, mai mare decât 10 (20/2)
Pas 2.

Me = xMe + h = 1518 + 109 = 1518 lei


(salariul care ocupă locul central)

Modulul
Pas 1 – intervalul modal este intervalul 1409-1518, deoarece înregistrează cea mai
mare frecvență (6)
Pas 2 – determinarea modulului:

Mo = xMo + h = 1409 + 109 = 1440,14 lei


(salariul care predomină sau care înregistrează cea mai mare frecvență)

!!!Având în vedere faptul că indicatorii de poziție sunt calculați pe aceleași date,


distribuția simplă și apoi sistematizată a angajaților analizați după salariul net,
putem remarca diferențe între nivele calculate pe date nesistematizate și pe date
sistematizate (media 1600, respectiv 1583,4, mediana 1550, respectiv 1518).
Diferențele acestea însă nu sunt mari și sunt justificate de faptul că pe date
sistematizate, nivelele sunt estimate, folosind centrul intervalului și algoritmi de
determinare.

Relația lui Pearson


Mo = 3Me – 2͞x
3Me – 2͞x = 3×1518 + 2×1583,4 = 1387,2 ≠ 1440
(distribuția este asimetrică)

4.4. REZUMATUL UNITĂȚII DE STUDIU. CUVINTE CHEIE


O altă categorie de indicatori derivați sunt indicatorii care reflectă valori
semnificative (valoarea medie) și care reflectă poziții semnificative (valoarea
mediană și valoarea modală). Indicatorii de poziție reflectă nivele care încearcă să
surprindă ceea ce este relevant și semnificativ pentru majoritatea elementelor
populației statistice. Pentru ca media calculată fie reprezentativă, trebuie calculată pe
un număr mare de date, cât mai omogene și utilizând forma matematică cea mai
potrivită. Indicatorii tendinței centrale se calculează diferit în funcție de tipul de
distribuție. Între medie, mediană și modul, Pearson a stabilit o relație, care ajută la
caracterizarea asimetriei distribuției analizate.
CUVINTE CHEIE: medie, mediană, modul, relația lui Pearson
DE REȚINUT:
Modul de determinare al indicatorilor tendinței centrale se realizează în mod diferit pe
distribuții simple și pe distribuții de frecvențe, ceea ce determină rezultate ușor diferite
care sunt justificate de faptul că pe date sistematizate, nivelele sunt estimate, folosind
centrul intervalului și algoritmi de determinare. Calculul estimativ pe date
sistematizate este valoros pin faptul că permite analiza unor volume mari de date,
când manipularea datelor primare este foarte dificil de realizat.

4.5. TESTE DE AUTOEVALUARE


1. Folosind datele nesistematizate din cadrul tabelului 2.10 și apoi
datele prelucrate în cadrul aplicației 2b din unitatea de studiu 2 să se determine și
să se interpreteze indicatorii tendinței centrale (media, mediana și modulul).

2. La o bancă se analizează distribuția debitorilor după situația zilelor de


întârzâiere a rambursării creditelor iar datele sunt sintetizate în tabelul 4.3. Să se
determine indicatorii tendinței centrale (media, mediana și modulul).

Tabelul 4.3
Intervale de variație a
numărului de zile de Nr. debitori
întârzâiere a plății
10-20 120
20-30 85
30-40 37
40-50 16
50-60 7
60-70 2

3. Referitor la o societate pe acțiuni se cunosc următoarele informații (tabelul 4.4)


Tabelul 4.3
Grupe de acționari după
contribuția la capitalul Nr. debitori
social (mii u.m.)
Sub 1000 10
1000-1500 15
1500-2000 30
2000-2500 10
2500-3000 7
3000 și peste 3
Să se determine și să se interpreteze indicatorii de poziție. Să se verifice și să se
interpreteze relația lui Pearson.

4. Folosind datele obținute în urma prelucrării în cadrul unității de studiu 2 – la


testele de autoevaluare 2.5 – problema 3, să se determine și să se interpreteze
indicatorii de poziție.
UNITATEA DE STUDIU 5
ANALIZA DE VARIAȚIE

Cuprins:
5.1.Introducere
5.2.Obiectivele unității de studiu
5.3.Analiza de variație
5.3.1. Indicatorii simpli ai variației
5.3.2. Indicatorii sintetici ai variației
5.3.3. Caracterizarea asimetriei într-o disribuție
5.4.Rezumatul unității de studiu, cuvinte cheie
5.5.Teste de autoevaluare

5.1. INTRODUCERE
În analiza populațiilor statistice, un rol important îl au indicatorii medii, respectiv
caracterizarea populației prin nivelul mediu al variabilelor analizate. Un aspect
semnificativ este asigurarea reprezentativității nivelului mediu calculat. Așa cum arătam
în unitatea de studiu 4, o condiție importantă pentru reprezentativitatea mediei este
omogenitatea populației, ceea ce înseamnă un nivel redus al variației sau al diferențelor
care există între elementele populației. Așadar în cadrul acestei unități vor fi prezentați
indicatorii analizei de variație, care au ca obiectiv stabilirea existenței unei variații mari
sau mici în cadrul populației, stabilirea existenței unei populații omogene sau eterogene,
caracterizarea reprezentativității nivelului mediu și stabilirea realizării unei grupări
calitative sau nu.
Analiza de variație este o analiză care trebuie să însoțească deteminarea nivelului mediu
al variabilei și să confirme reprezentativitatea științifică a acestui nivel.
Indicatorii de variație au forme particulare în funcție de tipul de distribuție pe care se
face analiza, respectiv distribuția simplă și distribuția de frecvențe.
CUNOȘTINȚE PRELIMINARE
Pentru înțelegerea noțiunilor discutate în cadrul acestei unități de studiu este nevoie de
cunoștințe de microeconomie, pentru înțelegerea exemplificărilor, și de matematică,
pentru înțelegerea calculelor care se vor realiza.

DURATA MEDIE DE PARCURGERE A UNITĂȚII DE STUDIU


Durata medie de parcurgere a unității de învățare este de 4 ore.

5.2. OBIECTIVELE UNITĂȚII DE STUDIU


După parcurgerea unității de studiu, studenții vor putea:
- Aplica și interpreta indicatorii de variație pe distribuții simple
- Aplica și interpreta indicatorii de variație pe distribuții de frecvențe
- Caracteriza asimetria unei distribuții

5.3. ANALIZA DE VARIAȚIE


Analiza de variație constă în determinarea indicatorilor simpli ai variației (amplitudinea
absolută, amplitudinea relativă, abaterea absolută a valorilor individuale de la medie,
abaterea relativă a valorilor individuale de la medie) și a indicatorilor sintetici ai variației
(abaterea medie liniară, abaterea medie pătratică, coeficientul de variație). Prezentarea
indicatorilor se va face în paralel pentru distribuția simplă și pentru distribuția de
frecvențe.
5.3.1. INDICATORII SIMPLI AI VARIAȚIEI
Amplitudinea absolută a variației (A) se mai numete câmp de variație și descrie paleta
de valori pe care o ia variabila analizată, caracterizând gradul de împrăștiere a valorilor
variabilei. Cu cât amplitudinea este mai mare, cu atât posibilitatea de a analiza o
populație eterogenă este mai mare. Se determină ca diferență între valoarea cea mai
mare și cea mai mică a variabilei.
A = xmax - xmin
Amplitudinea relativă a variației (A%) arată cât de mare este câmpul de variație,
raportat la nivelul mediu al variabilei. O amplitudine absolută mare, va determina o
amplitudine relativă mare, ceea ce dă indiciul existenței unei populații eterogene.

A% = × 100

Deoarece amplitudinea ține seama doar de valorile extreme, și poate fi influențată de


valorile aberante fără să ia în considerare toate valorile variabilei, se consideră un
indicator mai puțin relevant și nu permite cunoașterea profundă a variației .
Abaterea absolută a valorilor individuale de la medie (di)
Acest indicator se determină ca diferență între fiecare valoare a variabilei și valoarea
medie, fiind indicatorul central al analizei de variație, în jurul căruia se construiesc
indicatorii sintetici care vor permite caracterizarea reprezentativătății mediei.
di = xi - x͞
Abaterile absolute sunt negative și pozitive, având în vedere poziția centrală a mediei și
existența valorilor mai mici și mai mari decât medie, însă importantă este dimensiunea
acestor abateri, și mai ales a celor extreme. Cu cât abaterilor valorilor celor mai mari,
respectiv celor mai mici valori față de medie sunt mai mari, cu atât populația este mai
eterogenă.

Abaterea relativă a valorilor individuale de la medie (di%)


Abaterile relative dimensionează abaterile absolute, raportându-le la nivelul mediu. Cu
cât obținem mai multe abateri relative mari (către 100% sau peste acest nivel) cu atât
colectivitatea este mai eterogenă și media mai puțin reprezentativă.

di% = × 100

Abaterea valorilor individuale nu poate oferi informații decât la nivelul fiecărei variante
și nu oferă informații despre împrăștierii pe ansamblul distribuției. Acest aspect este
realizat prin intermediul indicatorilor sintetici.
Indicatorii simpli ai variației, deoarece se referă la valorile extreme sau la diferențele
valorilor față de valoarea medie, nu sunt influențați în modul de calcul de tipul de
distribuție.

5.3.2. INDICATORII SINTETICI AI VARIAȚIEI


Indicatorii sintetici nu se mai calculează pentru fiecare variantă a variabilei, și în mod
sintetic pe toată populația, folosind indicatorii medii. Acest aspect va permite
caracterizarea omogenității populației analizate.
Abaterea medie liniară ( ͞d ) exprimă cu cât se abate în medie fiecare valoare
individuală de la media valorilor și se calculează ca medie aritmetică a abaterilor
valorilor individuale, considerate în mărime absolută de la medie. Acest indicator se
exprimă în unitatea de măsură a variabilei.
Pentru distribuțiile simple

͞d =

Pentru distribuțiile de frecvențe

͞d =

Abaterea medie pătratică (σ) se mai numește și abatere standard exprimă cu cât se
abate în medie fiecare valoare individuală de la media valorilor, evidențiind influența
abaterilor mari și se calculează ca medie pătratică simplă sau ponderată a abaterilor
valorilor individuale, considerate în mărime absolută de la medie. Acest indicator se
exprimă în unitatea de măsură a variabilei. Este un indicator important în analiza
variației, se utilizează la estimarea erorilor de selectție și în calcule de corelație.
Pentru distribuții simple

σ=
Pentru distribuții de frecvențe
σ=

Abaterea standard nu permite compararea variației a două populații care se exprimă în


unități de măsură diferite sau a două populații de același fel în care diferă ordinul de
mărime pentru caracteristicile studiate.
Coeficientul de variație
Coeficientul de variație se mai numește și coeficient de omogenitate și este expresia cea
mai sintetică a variației. Se exprimă în procente și permite compararea între populații
diferite. Coeficientul de variație dimensionează abaterea medie liniară și abaterea medie
pătratică, raportându-le la nivelul mediu al variabilei.

v= sau v =

Interpretarea rezultatelor coeficientului de variație se face conform tabelului 5.1.


Tabelul 5.1 – Interpretarea coeficientului de variație
V Variație Populație Grupare Medie
0-17% Foarte Foarte bine Foarte
Mică
omogenă făcută reprezentativă
17-35% Mică Omogenă Bine făcută Reprezentativă
35-50% Nu este bine
Mare Eterogenă Nereprezentativă
făcută
50-100% Foarte Trebuie Total
Mare
eterogenă refăcută nereprezentativă
Peste 100% Analiza populației prin indicatorii tendinței centrale nu are sens

Așadar, pentru verificarea științifică a nivelului mediu este nevoie de un coeficient de


variație până la nivelul de 35%.
5.3.2. CARACTERIZAREA ASIMETRIEI UNEI DISTRIBUȚII DE
FRECVENȚE
Asimetria se referă la felul în care frecvențele unei distribuții se abat de la curba
normală a frecvențelor. Diferite forme ale distribuțiilor sunt prezentate în graficul 5.1.
(distribuție simetrică, asimetrie la stânga și asimetrie la dreapta).
Se întâlnesc în studii statistice distribuții simetrice, distribuții ușor asimetrice și
distribuții pronunțat asimetrice.
Graficul 5.1

Măsurarea statistică a asimetriei se face prin următorii indicatori: indicatorii densității


de repartiției a frecvențelor, indicatorii propuși de Pearson, coeficienții Beta, coeficienții
Yule, coeficienții Bowley. Dintre aceștia , vom prezenta indicatorii de asimetrie propuși
de Pearson, aceștia fiind mai des utilizați.
Indicatorii propuși de Pearson sunt:
 Asimetria absolută (as) calculată ca diferență între media aritmetică și modul

as= ͞x - Mo
 Coeficientul de asimetrie (Cas)

Cas =

Coeficientul de asimetrie ia valori între -1 și +1 cu următoarea semnificație:


 Cas = 0 distribuția este simetrică
 Cas → 0 distribuția este caracterizată prin asimetrie mică
 Cas → -1 / +1 distribuția este caracterizată printr-o asimetrie pronunțată
 Cas € (-0,3; +0,3) distribuția este caracterizată printr-o asimetrie moderată
Exemplu de analiză a variației

Pentru distribuții simple

1. Distribuția a 20 de angajați analizați după vechime și salariul net se


prezintă conform datelor din tabelul 5.1. Să se analizeze variația angajaților
după vechime.
Tabelul nr. 5.1.

Nr. crt. Vechime (ani) di = xi - x͞ (ani) di% = × 100


(%)
1 2 2-10 = -8 ×100 = -80
2 7 -3 -30
3 6 -4 -40
4 4 -6 -60
5 13 3 30
6 7 -3 -30
7 15 5 50
8 8 -2 -20
9 4 -6 -60
10 9 -1 -10
11 3 -7 -70
12 15 5 50
13 12 2 20
14 20 10 100
15 18 8 80
16 21 11 110
17 5 -5 -50
18 14 4 40
19 8 -2 -20
20 9 -1 -10

Analiza variației vechimii angajaților

Media aritmetică ͞x = = = 10 ani (vechime medie)


INDICATORII SIMPLI AI VARIAȚIEI
Amplitudinea absolută
A = xmax - xmin=21-2 = 19 ani (diferența dintre vechimea maximă și minimă)
Amplitudinea relativă

A% = × 100 = × 100 = 190% (diferența dintre vechimea maximă și minimă


reprezintă 190% raportat la vechimea medie
Abaterea absolută și relativă a valorilor individuale se vor calcula în tabel, pentru
fiecare valoare în parte.
Interpretarea rezultatelor
- vechimea angajatului nr. 12 se abate cu 5 ani de la vechmea medie;
- abaterea vechimii angajatului nr.16 de la vechimea medie reprezintă 110%
raportat la vechimea medie.

INDICATORII SINTETICI AI VARIAȚIEI

Abaterea medie liniară

͞d = = 4,8 ani (vechimea fiecărui angajat se


abate în medie cu 4,8 ani de la vechimea medie)

Abaterea medie pătratică

σ = = = 5,56 ani (vechimea


fiecărui angajat se abate în medie cu 5,56 ani de la vechimea medie, evidențiind
abaterile mari)

Coeficientul de variație

v1 = = = 48%

v2 = = = 55,6%

Având în vedere faptul că v1 € (35%, 50%) și v2 € (50%, 100%), se va interpreta


coeficientul de variație determinat pe baza abaterii medii pătratice, care
evidențiază influența abaterilor mari, astfel:
 Variația în cadrul populației formată de cei 20 de angajați este mare din
punct de vedere al vechimii
 Populația formată din cei 20 de angajați este foarte eterogenă din
perspectiva vechimii
 Vechimea medie este total nereprezentativă
!!! Nu se impune interpretarea referitoare la grupare, deoarece într-o distribuție
simplă datele nu sunt grupate.

Pentru distribuții de frecvențe

2. Folosind datele grupate ale salariilor (tabelul 5.2.), obținute în urma


procedurilor de grupare prezentate în unitatea de studiu 2, să se analizeze
variația în cadrul populației și să se caracterizeze asimetria distribuției.
Tabelul 5.2

Grupe de Nr. de di% = ×


Centrul
angajați după angajați di = xi - x͞ (lei)
intervalului (xi) 100
salariul net (lei) (fi)
(%)
1300-1409 4 = 1354,5 1354,5- ×100
1583,4= -228,9
= -14,46
1409-1518 6 1463,5 -119,9 -7,57
1518-1627 1 1572,5 -10,9 -0,69
1627-1736 4 1681,5 98,1 6,19
1736-1845 3 1790,5 207,1 13,08
1845-1954 2 1899,5 316,1 19,96
TOTAL 20 - -

Media aritmetică ͞x = = = 1583,4 lei (salariul mediu în


formă ponderată)

INDICATORII SIMPLI AI VARIAȚIEI


Amplitudinea absolută
A = xmax - xmin= 1954 – 1300 = 654 lei (diferența dintre salariul maxim și salariul
minim)
Amplitudinea relativă

A% = × 100 = × 100 = 41,30% (diferența dintre salariul maxim și

minim reprezintă 41,30% raportat la salariul mediu – sesizăm diferența foarte


marefață de amplitudinea relativă de la exemplu anterior, care indica o populație
eterogenă; acum indiciul este că populația este omogenă)
Abaterea absolută și relativă a valorilor individuale se vor calcula în tabel, pentru
fiecare valoare în parte.
Interpretarea rezultatelor
-119,9 – salariul celor 6 angajați care au un salariu între 1409-1518 lei, se abate cu
119,9 lei de la salariul mediu
13,08% – abaterea salariului celor 3 angajați cu un salariu între 1736-1845 de la
salariul mediu reprezintă 13,08% raportat la salariul mediu.

INDICATORII SINTETICI AI VARIAȚIEI

Abaterea medie liniară

͞d= = = 164,59 lei (salariul


fiecărui angajat se abate în medie cu 164,59 lei de la salariul mediu)
Abaterea medie pătratică

σ = = =
182,06 lei (salariul fiecărui angajat se abate în medie cu 182,06 lei de la salariul
mediu, evidențiind abaterile mari)
Coeficientul de variație

v= = = 10,39%

v= = = 11,50%

Având în vedere faptul că v € (0, 17%) interpretarea rezultatelor se face astfel:


 Variația în cadrul populației formată de cei 20 de angajați este mică din
punct de vedere al salariului
 Populația formată din cei 20 de angajați este foarte omogenă din
perspectiva salariului
 Gruparea datelor este foarte bine făcută
 Salariul mediu este foarte reprezentativă

CARACTERIZAREA ASIMETRIEI
Ținând cont de modulul calculat la unitatea nr. 4 pe aceeași distribuție
(Mo=1440,14 lei), asimetria o să fie caracterizată prin coeficienții de asimetrie ai
lui Pearson
 Asimetria absolută
as= x͞ – Mo = 1583,4 – 1440,14 = 143,26
 Coeficientul de asimetrie

Cas = = = 0,79
Deoarece Cas → +1 distribuția este caracterizată printr-o asimetrie pronunțată

5.4. REZUMATUL UNITĂȚII DE STUDIU. CUVINTE CHEIE


Analiza de variație este o analiză conexă calculului de indicatori medii și are ca obiectiv
stabilirea relevanței mediei, care este mare atunci când variația este mică și populația
este omogenă. Așadar indicatorii de variație, împărțiți în indicatori simpli și indicatori
sintetici, vor permite să stabilim dacă variația este mică sau mare, dacă populația este
omogenă și eterogenă, dacă media este reprezentativă sau nu și dacă gruparea datelor
(pentru distribuții de frecvențe) este bine făcută sau nu. În momentul în care o populație
statistică este analizată prin indicatori medii, se impune verificarea reprezentativității
mediei prin analiza de variație.
Tot folosind indicatori obținuți în urma analizei de variație, se poate caracteriza
asimetria unei distribuții, respectiv abaterea distribuției de la curba normală de
repartiției. Indicatori prezentați pentru caracterizarea asimetriei sunt indicatorii propuși
de Pearson.
CUVINTE CHEIE: abatere, variație, omogenitate, asimetrie

DE REȚINUT:
Modul de determinare al indicatorilor variației se realizează în mod diferit pe distribuții
simple și pe distribuții de frecvențe.
Dacă coeficienții de variație calculați pe baza abaterii medii liniare și abaterii medii
pătratice sunt încadrați în intervale de interpretare diferiți, se ia în considerare nivelul
determinat prin abaterea medie pătratică, deoarece aceasta evidențiază abaterile mari,
care contribuie la eterogenitatea populației.
5.5. TESTE DE AUTOEVALUARE
1. Folosind datele nesistematizate din cadrul tabelului 2.10 și apoi
datele prelucrate în cadrul aplicației 2b din unitatea de studiu 2 să se determine și să
se interpreteze indicatorii de variație.

2. Distribuția a 380 de firme după numărul de zile al serviciului datoriei la plata


creditelor este prezentată în tabelul 5.3.
Tabelul 5.3
Grupe de firme după
Număr de firme
serviciului datoriei (nr. zile)
40-80 50
80-120 70
120-160 90
160-200 100
200-240 50
240 și peste 20
Să se determine numărul mediu de zile de serviciu al datoriei și să se analizeze
reprezentativitatea acestei medii prin analiza de variație.
3. Distribuția a 50 de firme după capitalul social se prezintă în tabelul 5.4. Să se
determine indicatorii tendinței centrale și să se caracterizeze reprezentativitatea
capitalului social mediu.
Grupe de firme după
Număr de firme
capitalul social (mii um)
Sub 15 10
15-25 12
25-35 22
35-45 4
45 și peste 2
TOTAL 50
4. Folosind datele obținute în urma prelucrării în cadrul unității de studiu 2 – la
testele de autoevaluare 2.5 – problema 3, să se analizeze variația în populația studiată.
BIBLIOGRAFIE:

 Anghelache, C., Tratat de statistică teoretică și economică, Editura


Economică, 2008
 Anghelache, C., Statistică generală – teorie și aplicații, editura Economică,
1999
 Antonescu, C-tin, Andrei, T, Stelian, L., Bazele teoretice ale statisticii,
Editura Fundației România de Mâine, București, 2000
 Baron,T., E.Biji, Statistica teoretică şi economică, Editura didactică şi
pedagogică, Bucureşti, 1996
 Baron T., Anghelache C-tin, Ţiţan E., Statistica, Editura Economică, 1996
 Bădiţă M., Baron T., Korka M., Statistică pentru afaceri, Editura Eficient,
Bucureşti, 1998
 Bernard Delmas, Statistique Descriptive, Nathan Université
 Biji, M.E, Lilea, E., Vătui, M., Gogu, E., Statistica aplicată în economie,
Editura Oscar Print, București, 2007
 Biji E., Wagner P., Lilea E., Statistică, Editura Didactică şi Pedagogică,
Bucureşti, 1999
 Goschin Zizi, Statistică, Editura Expert, Bucureşti ,1999
 Jaba E., Statistica, Editura Economică, 1998
 Maniu A., Mitruţ C-tin, Voineagu V, Statistica pentru managementul
afacerilor, Editura Economică, Bucureşti, 1996
 Merce E., Măruţă P., Statistica economică în turism şi comerţ, UDC, Cluj,
1997
 Negoescu Gh., Ciobanu Rodica, Bazele statisticii pentru afaceri, Editura
ALL BECK, Bucureşti, 1999
 Porojan Dumitru, Statistica şi teoria sondajului, Editura SANSA,
Bucureşti, 1993
 Săvoiu, G., Statistică pentru afaceri, Editura Universitară,București, 2011
 Simion, D.M., Statistică descriptivă, Editura Universității “Lucian Blaga”,
Sibiu, 2002
 Stanciu S., Andrei T., Statistica – teorie şi aplicaţii, Editura ALL, Bucureşti,
1995
 Voineagu, V., Țițan, E., Ghiță, S., Boboc, C., Todose, D., Statistică – baze
teoretice și aplicații, Editura Economică, 2007

S-ar putea să vă placă și