Management. Statistică Descriptivă

Management
Statistică descriptivă
II III
2019
UNIVERSITATEA ”BABEŞ-BOLYAI” CLUJ-NAPOCA
FACULTATEA DE ŞTIINŢE ECONOMICE ŞI GESTIUNEA AFACERILOR
ANUL 2 ID
SEMESTRUL 3
Suport de curs ID
STATISTICĂ DESCRIPTIVĂ
Anul 2
Semestrul 3
Cluj-Napoca
Cuprins
Informaţii generale ii
0.1 Date de contact ale titularilor de curs . . . . . . . . . . . . . . . . . . . . . . . . . . . ii
0.2 Obiective . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
0.3 Competenţe profesionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
0.4 Competenţe transversale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
0.5 Materiale bibliografice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
0.6 Elemente de deontologie academică . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv
0.7 Studenţi cu dizabilităţi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv
1 Serii statistice 1
1.1 Concepte de bază . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Serii de distribuţie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Observarea statistică . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4 Reprezentări grafice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5 Teme de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2 Parametrii repartiţiilor unidimensionale 27

2.1 Parametrii tendinţei centrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2 Parametrii de structură . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.3 Parametrii variaţiei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.4 Parametrii formei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.5 Parametrii concentrării . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.6 Teme de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3 Analiza legăturii dintre variabile statistice 49

3.1 Analiza legăturii dintre variabile calitative . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.2 Analiza legăturii dintre variabile ordinale . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.3 Analiza legăturii dintre variabile cantitative . . . . . . . . . . . . . . . . . . . . . . . . 56
3.4 Funcţii de regresie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.5 Teme de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4 Serii cronologice 69
4.1 Indici statistici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.2 Indicatori medii specifici seriilor cronologice . . . . . . . . . . . . . . . . . . . . . . . . 73
4.3 Componentele unei serii cronologice . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.4 Teme de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
i
Informaţii generale
0.1 Date de contact ale titularilor de curs

Prof. univ. dr. Anuţa BUIGA
Birou 346, sediul Facultăţii de Ştiinţe Economice şi Gestiunea Afacerilor
Str. Teodor Mihali 58-60, Telefon: 0264-418654
E-mail: anuta.buiga@econ.ubbcluj.ro
Prof. univ. dr. Cristian DRAGOŞ

E-mail: cristian.dragos@econ.ubbcluj.ro
Prof. univ. dr. Dorina LAZĂR

E-mail: dorina.lazar@econ.ubbcluj.ro
Conf. univ. dr. Gabriela BRENDEA

E-mail: gabriela.brendea@econ.ubbcluj.ro
Conf. univ. dr. Cristian LITAN

E-mail: cristian.litan@econ.ubbcluj.ro
Conf. univ. dr. Codruţa MARE

E-mail: codruta.mare@econ.ubbcluj.ro
Lect. univ. dr. Darius FILIP

E-mail: darius.filip@econ.ubbcluj.ro
ii
0.2. Obiective iii
0.2 Obiective
Disciplina Statistică descriptivă ı̂şi propune dobândirea unor cunoştinţe privind definirea unei populaţii
statistice, a variabilelor statistice, obţinerea de informaţii cu privire la fenomenul supus cercetării, or-
ganizarea datelor şi prezentarea acestora sub formă de serii statistice, evidenţierea structurii populaţiei
ı̂n raport cu variabilele observate, evidenţierea evoluţiei unui fenomen ı̂n timp sau spaţiu precum şi
reprezentarea grafică a datelor.
0.3 Competenţe profesionale

• Utilizarea conceptelor, teoriilor, principiilor şi metodelor de investigare statistică a fenomenelor
şi proceselor economice;
• Utilizarea eficientă a resurselor sistemelor de calcul;
• Utilizarea adecvată a produselor software de birotică pentru soluţionarea de probleme specifice.
0.4 Competenţe transversale

• Executarea responsabilă a sarcinilor profesionale, ı̂n condiţii de autonomie restrânsă şi asistenţă
calificată;
• Conştientizarea nevoii de formare continuă;
• Utilizarea eficientă a resurselor şi tehnicilor de ı̂nvăţare, pentru dezvoltarea personală şi profe-
sională.
0.5 Materiale bibliografice

1. Anderson D.R., Sweeney D.J., Williams T.A., Statistics for business and economics, South-
Western College Pub, 2008.
2. Andrei T., Stancu S., Statistică - teorie şi aplicaţii, Ed. ALL, Bucureşti, 1995.
3. Bailly P., Carrere C., Statistiques descriptives: Cours, Ed. PUG, Grenoble, 2007.
4. Bressoud E., Kahane J.C., Gillet R., Statistique descriptive: Applications avec Excel et la calcu-
latrice, Ed. Pearson Education, Paris, 2008.
5. Buiga A., Dragoş C., Lazăr D., Brendea G., Litan C., Mare C., Statistică Descriptivă, Ed.
Napoca Star, Cluj-Napoca, 2018;
6. Delmas B., Statistique descriptive pour l’économie et la gestion, Ed. Presses Universitaires du
Septentrion, Lille, 2009.
7. Jaba E., Statistică descriptivă. Teste grilă şi probleme, Ed. Sedcom Libris Iaşi, 2002.
8. Lethielleux M., Statistique descriptive, Ed. Dunod, Paris, 2007.

iv INTRODUCTION
0.6 Elemente de deontologie academică

Plagiatul este o problemă serioasă şi este pedepsită cu asprime. Orice student care este prins că
plagiază se poate aştepta să ı̂i fie anulată munca şi să se ı̂ntreprindă măsuri disciplinare din partea
organismelor de conducere ale facultăţii. Pentru clarificarea noţiunii de plagiat, propunem următoarele
exemple:
- realizarea proiectului de cercetare de către o altă persoană;
- copierea parţială sau totală a unui proiect de cercetare;
- copierea unui proiect de cercetare de pe internet şi răspândirea acestuia şi ı̂n rândul altor studenţi;
- conspectarea unor surse bibliografice fără citirea prealabilă a acestora.
Studenţii pot să utilizeze surse bibliografice aferente tematicii abordate, cu condiţia ca respectivele
surse să fie identificate şi prezentate ı̂n cadrul proiectului de cercetare. Un proiect care se constituie
ı̂n mare parte din compilarea unor idei ale unor autori, neavând o contribuţie proprie din partea
studentului va fi notat cu un calificativ inferior.
0.7 Studenţi cu dizabilităţi

În vederea oferirii de şanse egale studenţilor afectaţi de dizabilităţi motorii sau intelectuale, titularul de
curs ı̂şi manifestă disponibilitatea de a comunica cu studenţii prin intermediul sistemelor informatice
disponibile (spre exemplu: e-mail, website, blog, etc.). Astfel, studenţii cu dizabilităţi vor putea adresa
ı̂ntrebări legate de tematica cursului pe adresa de email a titularului de curs, menţionată la ı̂nceputul
acestui silabus, putând primi lămuririle necesare ı̂n maxim 48 de ore de la primirea mesajului.
Capitolul 1
Serii statistice
Secţiuni
1.1. Concepte de bază
1.2. Serii statistice
1.3. Observarea statistică
1.4. Reprezentări grafice
1.5. Teme de control
Obiective
• definirea unei populaţii statistice, a variabilelor statistice
• obţinerea de informaţii cu privire la fenomenul supus cercetării
• organizarea datelor şi prezentarea acestora sub formă de serii statistice
• evidenţierea structurii populaţiei ı̂n raport cu variabilele observate
• evidenţierea evoluţiei unui fenomen ı̂n timp
Cuvinte cheie
• populaţie statistică, unitate statistică, volum, eşantion, variabilă statistică, observare statistică,
indicator statistic, serie statistică
• observare statistică, serii statistice unidimensionale şi bidimensionale
• reprezentarea grafică a datelor relativ la o variabilă cantitativă, la o variabilă calitativă şi la
două variabile
Rezultate aşteptate
Cunoaşterea şi stăpânirea noţiunilor statistice de bază, cunoaşterea tehnicilor de culegere, grupare
şi prezentare a datelor. Utilizarea indicatorilor statistici cu scopul evidenţierii variaţiei unei mărimi
sau a structurii populaţiei supuse studiului.
1
2 Capitolul 1. Serii statistice
1.1 Concepte de bază

Statistica descriptivă este ştiinţa care se ocupă cu studiul fenomenelor de masă, punând ı̂n evidenţă
anumite particularităţi ale acestor fenomene. Dintre conceptele fundamentale cu care operează statis-
tica descriptivă, se remarcă ı̂n mod pregnant următoarele:
Populaţia statistică - reprezintă mulţimea elementelor de aceeaşi natură, care au una sau mai
multe ı̂nsuşiri comune.
Exemple de populaţii statistice: mulţimea studenţilor unei facultăţi, mulţimea angajaţilor unei
societăţi, mulţimea bibliotecilor din România, etc.
Populaţiile statistice le vom nota cu majusculele de la ı̂nceputul alfabetului: A, B, C, etc.
Unitatea statistică - constituie elementul component al populaţiei statistice.
În exemplele de mai sus, unităţile statistice sunt: studentul, angajatul, biblioteca, etc.
Unităţile statistice le vom nota cu minuscula corespunzătoare majusculei ce simbolizează populaţia
statistică, respectiv ai , bi , ci etc.
Volumul populaţiei - reprezintă numărul unităţilor statistice care alcătuiesc populaţia statistică.
Volumul unei populaţii statistice se notează cu N .
Dacă A este o populaţie statistică de volum N , atunci unităţile statistice care formează populaţia
A sunt: a1 , a2 , ..., aN .
Eşantion - reprezintă o submulţime a unei populaţii statistice, submulţime obţinută pe baza unor
anumite criterii. Volumul eşantionului ı̂l vom nota cu n.
Variabila statistică - reprezintă o ı̂nsuşire sau o trăsătură comună tuturor unităţilor unei populaţii.
În general, variabilele statistice se notează cu majusculele de la sfârşitul alfabetului: X, Y , Z, etc.
Stare (realizare) a unei variabile statistice - reprezintă valoarea ı̂nregistrată de o variabilă

statistică. Dacă se notează cu X o variabilă statistică oarecare, atunci cu x1 , x2 , ..., xN se vor nota
stările variabilei respective.
Variabilele statistice se pot clasifica astfel:
a) După natura lor, variabilele statistice pot fi atributive, de timp sau de spaţiu.
• Variabila atributivă exprimă un atribut sau ı̂nsuşire esenţială (alta, decât timpul sau
spaţiul) unităţilor populaţiei;
• Variabila de timp ne arată timpul ı̂n care au luat fiinţă unităţile populaţiei sau perioada
de timp ı̂n care au existat (există);
• Variabila de spaţiu ne arată spaţiul ı̂n care există sau au luat naştere unităţile populaţiei.
b) După modul de exprimare al stărilor, deosebim:
• Variabila cantitativă este variabila ale cărei stări se exprimă prin valori numerice. Se mai
numeşte şi variabilă metrică.
• Variabila calitativă este variabila ale cărei stări se exprimă prin cuvinte sau coduri. Se mai
numeşte variabilă nominală (stările se exprimă prin cuvinte) sau variabilă ordinală (stările
se exprimă prin coduri).
c) După modul de variaţie, variabila cantitativă poate fi:

1.2. Serii de distribuţie 3
• Variabilă discretă este acea variabilă care ı̂n intervalul său de definiţie ı̂nregistrează cel mult
valori raţionale.
• Variabilă continuă este acea variabilă care poate lua orice valoare reală din intervalul său
de variaţie.
Exemple de variabile statistice relativ la populaţia formată din mulţimea consumatorilor unui
produs:
- vârsta: variabilă atributivă, cantitativă, continuă
X = {x1 = [15 − 20), x2 = [20 − 30), ...}
- frecvenţa de cumpărare: variabilă atributivă, calitativă
Y = {y1 - foarte rar; y2 - rar; ...}
- numărul de sortimente cumpărate relativ la produsul analizat: variabilă atributivă, cantitativă,

discretă:
Z = {z1 = 1; z2 = 2, ...}
- localizarea magazinelor de unde se fac cumpărături: variabilă de spaţiu, calitativă
S = {s1 - cartierul C, s2 - strada S, ...}
- data ultimei cumpărări a produsului analizat: variabilă de timp, cantitativă
T = {t1 = 27.01.2017; t2 = 24.02.2017, ...}
Observarea statistică - constă ı̂n identificarea unităţilor populaţiei şi ı̂nregistrarea stărilor va-
riabilelor ı̂n raport cu care este studiată. Ansamblul stărilor variabilelor rezultate prin observare se
numesc statistici.
După gradul de cuprindere al populaţiei statistice, observarea statistică este de două feluri: totală
şi parţială.
• Observarea totală este acel tip de observare statistică ı̂n care are loc ı̂nregistrarea tuturor
unităţilor care fac parte din populaţia statistică supusă studiului. Recensământul populaţiei României
este un exemplu de observare totală.
• Observarea parţială presupune observarea şi ı̂nregistrarea unui anumit număr de unităţi din
populaţie, alese după criterii bine definite.
În cercetarea statistică a unei populaţii punctul de pornire ı̂l poate constitui fie statisticile exha-
ustive rezultate prin observarea populaţiei univers, fie statisticile rezultate din observarea parţială a
unui eşantion Ã ⊆ A, ı̂n ambele cazuri scopul final fiind acelaşi, respectiv obţinerea de informaţii la
nivelul populaţiei univers A.
Observarea statistică se realizează de obicei prin intermediul chestionarului.
1.2 Serii de distribuţie

Seria statistică este o construcţie care redă fie distribuţia unei populaţii ı̂n raport cu una sau mai
multe variabile, fie variaţia unei mărimi ı̂n timp, ı̂n spaţiu sau de la o categorie la alta.
Seriile statistice se clasifică ı̂n raport cu mai multe criterii, astfel:
1. În raport cu numărul variabilelor

• Serii statistice unidimensionale, au la bază o singură variabilă;

• Serii statistice multidimensionale, care au la bază două sau mai multe variabile.
2. După natura variabilelor deosebim:
• Serii atributive, care au la bază variabile atributive;

• Serii cronologice (de timp sau istorice), care au la bază variabile de timp;
• Serii de spaţiu sau teritoriale, care au la bază o variabilă de spaţiu.
3. După modul de exprimare al stărilor variabilei deosebim:
• Serii calitative, care au la bază variabile calitative;

• Serii cantitative, care au la bază variabile cantitative şi care după modul de variaţie a
variabilei pot fi: discrete (când variabila este discretă) şi continue (când variabila este
continuă).
4. În raport cu natura indicatorului din care este alcătuită seria, avem:
• Serii de frecvenţa sau serii de distribuţie (repartiţie);

• Serii de variaţie.
Seria statistică redând distribuţia populaţiei ı̂n raport cu una sau mai multe variabile constituie
o descompunere a acesteia ı̂ntr-un număr R de clase. O astfel de serie este formată ı̂n exclusivitate
din frecvenţe (absolute cumulate sau necumulate, relative cumulate sau necumulate) şi de aceea se
numesc serii de frecvenţă, de distribuţie sau de repartiţie. Prescurtat se mai foloseşte şi denumirea de
repartiţie statistică sau distribuţie statistică.
Seria statistică ce redă variaţia unei mărimi ı̂n timp, ı̂n spaţiu sau de la o categorie la alta se
numeşte serie de variaţie.
Prezentăm ı̂n continuare cele mai importante serii statistice:
1.2.1. Serii statistice de distribuţie unidimensională

Conform definiţiei de mai sus, prin această serie se distribuie unităţile unei populaţii statistice ı̂n
raport cu una sau mai multe variabile.
Fie o serie statistică unidimensională având la bază variabila X, respectiv:

x1 x2 . . . x i . . . x R
X: ,N (1.1)
N1 N2 . . . Ni . . . NR
unde Ni este frecvenţa absolută a clasei i, i = 1, R şi reprezintă numărul de unităţi ale populaţiei
pentru care variabila X a ı̂nregistrat valoarea xi . Remarcăm faptul că volumul populaţiei se poate
exprima cu ajutorul frecvenţelor absolute
N = N1 + N2 + . . . + NR .
Clasa (grupa) de unităţi ı̂n raport cu o variabilă reuneşte acele unităţi din cadrul populaţiei care
ı̂nregistrează aceeaşi stare a variabilei sau stările variabilei aparţinând unui anumit interval de variaţie.
Ca urmare, ı̂n raport cu o variabilă statistică populaţia poate fi structurată ı̂ntr-un anumit număr
de clase.
De asemenea, relativ la seria statistică unidimensională având la bază variabila X, aceasta poate
fi formată cu frecveţe relative, frecvenţe absolute cumulate sau relative cumulate.
Fie seria X formată cu frecvenţe relative:

x1 x2 . . . xi . . . xR
X: , 100% (1.2)
f1 f2 . . . fi . . . fR
unde fi ne arată ponderea unităţilor din populaţie care au ı̂nregistrat pentru variabila X starea xi :
Ni
fi = , i = 1, R.
N
Pornind de la seria (1.1) se poate deduce seria formată cu frecvenţe absolute cumulate, respectiv:

x1 x2 . . . xi . . . xR
X: (1.3)
Nx1 Nx2 . . . Nxi . . . NxR
unde Nxi reprezintă numărul de unităţi din populaţia studiată pentru care variabila ı̂nregistrează
valori ce nu depăşesc valoarea xi . Avem că:
Nxi = N1 + N2 + . . . + Ni , i = 1, R.
Pornind de la seria (1.1) sau (1.2) se poate deduce seria formată cu frecvenţe relative cumulate,
respectiv:
x1 x2 . . . xi . . . xR
X: (1.4)
Fx1 Fx2 . . . Fxi . . . FxR
unde Fxi exprimă ponderea unităţilor populaţiei studiate pentru care variabila a ı̂nregistrat valori ce
nu depăşesc valoarea xi . Avem că
Nxi
Fxi = f1 + f2 + . . . + fi sau Fxi = · 100%, i = 1, R.
N
- Aplicaţie. Distribuţia clienţilor ı̂n raport cu sortimentele de cafea servite ı̂ntr-o anumită zi la o
cafenea a fost:
a) Identificaţi populaţia statistică, unitatea statistică
Sortiment cafea Nr. clienţi şi volumul populaţiei statistice;
Naturală 21 b) Construiţi seriile de distribuţie unidimensionale cu
Cappuccino 32 frecvenţe derivate;
Espresso 43 c) Caracterizaţi variabila care stă la baza seriilor uni-
dimensionale.
Rezolvare. a) Populaţia statistică este reprezentată ı̂n acest caz de mulţimea clienţilor. Unitatea
statistică este clientul. Volumul populaţiei statistice este N = 21 + 32 + 43 = 96 clienţi.
b) Folosind tabelul de mai sus, se pot construi următoarele
serii:
Naturală Cappuccino Espresso
- Seria unidimensională cu frecvenţe absolute: X : , 96
21 32 43
- Seria unidimensională cu frecvenţe absolute cumulate:

Naturală Cappuccino Espresso Naturală Cappuccino Espresso
X: ⇔X:
21 21 + 32 21 + 32 + 43 21 53 96
- Seria unidimensională cu frecvenţe relative:

Naturală Cappuccino Espresso Naturală Cappuccino Espresso
X: 21/96 32/96 43/96
⇔X: , 100%
21, 88% 33, 33% 44, 79%
- Seria unidimensională cu frecvenţe relative cumulate:

Naturală Cappuccino Espresso
X: .
21, 88% 55, 21% 100%
c) La baza seriilor unidimensionale de mai sus, se află variabila statistică X ce indică sortimentul
de cafea ales de clienţii cafenelei. Variabila X este atributivă şi calitativă.
1.2.2. Serii statistice de distribuţie bidimensională

Seria statistică de distribuţie bidimensională este o construcţie ce reda distribuţia unei populaţii
ı̂n raport cu două variabile.
Astfel, fie populaţia statistică A studiată ı̂n raport cu variabilele X şi Y . Rezultatele observării se
pot grupa ı̂ntr-un tabel de forma următoare:
HH X
H x1 x2 ... xj ... xK T otal
Y HH
H
y1 N11 N12 ... N1j ... N1K N1·
y2 N21 N22 ... N2j ... N2K N2·
.. .. .. .. .. ..
. . . ... . ... . . (1.5)
yi Ni1 Ni2 ... Nij ... NiK Ni·
.. .. .. .. .. ..
. . . ... . ... . .
yL NL1 NL2 ... NLj ... NLK NL·
T otal N·1 N·2 ... N·j ... N·K N
unde:
Nij − reprezintă numărul de unităţi pentru care, variabila X ı̂nregistrează starea xj şi
variabila Y ı̂nregistrează starea yi ;
Ni· − reprezintă numărul de unităţi pentru care Y = yi , indiferent de nivelul ı̂nregistrat
de variabila X;
N·j − reprezintă numărul de unităţi pentru care X = xj , indiferent de nivelul ı̂nregistrat
de variabila Y ;
N − reprezintă numărul total de unităţi analizate, adică volumul populaţiei statistice.
Din seria bidimensională se pot extrage următoarele serii unidimensionale:

• Serii de repartiţie marginale ı̂n raport cu X şi Y :

x1 x2 . . . xj . . . xK y1 y2 . . . yi . . . yL
X: , respectiv Y : .
N·1 N·2 . . . N·j . . . N·K N1· N2· . . . Ni· . . . NL·
• Serii de repartiţie condiţionate:

- seria de repartiţie unidimensională ı̂n raport cu X, condiţionată de Y = yi

x1 x2 . . . xj . . . xK
X/Y =yi : , pentru orice i = 1, L;
Ni1 Ni2 . . . Nij . . . NiK
- seria de repartiţie unidimensională ı̂n raport cu Y , condiţionată de X = xj

y1 y2 . . . y i . . . y L
Y /X=xj : pentru orice j = 1, K.
N1j N2j . . . Nij . . . NLj
De asemenea se poate elabora sau deduce seria de repartiţie bidimensională formată cu frecvenţe
relative, unde:
Nij Ni· N·j
fij = , fi· = , f·j = , pentru orice i = 1, L, j = 1, K.
N N N
- Aplicaţie. Se consideră repartiţia angajaţilor unei firme de IT din Cluj-Napoca ı̂n funcţie de
venitul lunar (e) şi funcţia deţinută ı̂n firmă:
```
``` Venitul lunar
``` [100 − 500) [500 − 1000) [1000 − 3000)
Funcţia ```
``
Analist − 2 8
P rogramator 13 24 17
a) Precizaţi populaţia statistică, unitatea statistică şi volumul populaţiei statistice;

b) Extrageţi toate seriile de repartiţie unidimensionale cu frecvenţe absolute;
c) Construiţi seria bidimensională cu frecvenţe relative;
d) Care este procentul programatorilor cu venitul lunar de cel mult 1000e ?
Rezolvare. Pentru ı̂nceput, notăm variabilele statistice: X - venitul lunar şi Y - funcţia deţinută.
Rescriem tabelul de mai sus folosind notaţiile convenite şi totalurile aferente:
PP
X
[100 − 500) [500 − 1000) [1000 − 3000)
PP
PP T otal
Y P P
P
Analist − 2 8 10
P rogramator 13 24 17 54
T otal 13 26 25 64
a) Populaţia statistică analizată este reprezentată de mulţimea angajaţilor, unitatea statistică ce

formează populaţia este angajatul, iar volumul populaţiei statistice analizate este N = 64 angajaţi.
b) Seriile unidimensionale marginale sunt:

[100 - 500) [500 - 1000) [1000 - 3000) Analist Programator
X: , respectiv Y : .
13 26 25 10 54
Seriile condiţionate ı̂n raport cu variabila X sunt:


[100 - 500) [500 - 1000) [1000 - 3000)
X/Y =Analist :
- 2 8

[100 - 500) [500 - 1000) [1000 - 3000)
respectiv, X/Y =P rogramator : .
13 24 17
Seriile condiţionate ı̂n raport cu variabila Y sunt:

Analist P rogramator Analist P rogramator
Y /X=[100−500) : , Y /X=[500−1000) :
- 13 2 24

Analist P rogramator
şi respectiv Y /X=[1000−3000) : .
8 17
c) Seria bidimensională cu frecvenţe relative se obţine din seria bidimensională cu frecvenţe abso-
N
lute, aplicând formula fij = Nij , pentru orice i = 1, 2 şi j = 1, 3. Obţinem seria bidimensională:
PP
X
[100 − 500) [500 − 1000) [1000 − 3000)
PP
PP T otal
Y P P
P
Analist − 0, 03 0, 13 0, 16
P rogramator 0, 20 0, 38 0, 26 0, 84
T otal 0, 20 0, 41 0, 39 1
sau, ı̂n procente:

PP
X
[100 − 500) [500 − 1000) [1000 − 3000)
PP
PP T otal
Y P P
P
Analist − 3% 13% 16%
P rogramator 20% 38% 26% 84%
T otal 20% 41% 39% 100%
d) Din seria bidimensională cu frecvenţe relative constatăm că 58% din programatori obţin un
venit lunar de cel mult 1000e.
1.2.3. Serii statistice de variaţie

Conform definiţiei, seria de variaţie redă variaţia unei mărimi ı̂n timp, ı̂n spaţiu sau de la o
categorie la alta. Ca urmare, ı̂n continuare vom vorbi de serii cronologice (au la bază o variabilă de
timp), serii de spaţiu (au la bază o variabilă de spaţiu) şi serii categoriale (au la bază variabile
atributive). Cele mai des ı̂ntâlnite sunt seriile cronologice şi seriile de spaţiu.
Seriile de variaţie au la bază mărimi absolute şi relative. După unii autori, din cadrul mărimilor
absolute fac parte indicatorul de nivel şi diferenţa absolută a unei mărimi, iar din cadrul mărimilor
relative fac parte indicatorul relativ de intensitate, indicele statistic şi diferenţa relativă a unei mărimi.
Indicatorul de nivel (Y ) este o mărime ce reflectă nivelul unui fenomen analizat. De exemplu:
producţia diferitelor produse, veniturile populaţiei, suprafaţa cultivată cu principalele culturi agricole,
transportul, exportul, importul, etc.
Diferenţa absolută a unei mărimi (∆Y ) exprimă diferenţa dintre nivelul cercetat şi nivelul bază
de comparaţie al mărimii analizate. Se exprimă ı̂n aceeaşi unitate de măsură ı̂n care este cuantificat
fenomenul analizat şi ne arată cu cât s-a modificat acesta de la un nivel la altul.
Indicele statistic al unei mărimi (IY ) exprimă raportul dintre nivelul cercetat şi nivelul bază
de comparaţie al mărimii analizate. Ne arată de câte ori se modifică acea mărime, de la un nivel la
altul.
Diferenţa relativă a unei mărimi (RY ) exprimă raportul dintre diferenţa absolută a mărimii
respective şi nivelul bază de comparaţie al acesteia. Ne arată cu cât la sută se modifică mărimea de
la un nivel la altul.
Indicatorul relativ de intensitate (d) se defineşte ca raport ı̂ntre doi indicatori de nivel de
natură diferită şi arată gradul de răspândire a fenomenului cuantificat de indicatorul de la numărător
ı̂n raport cu fenomenul cuantificat de indicatorul de la numitor. De exemplu: producţia diferitelor
culturi/ha, densitatea populaţiei, producţia principalelor produse/locuitor, rata şomajului, etc.
Serii cronologice
Seria cronologică reflectă evoluţia ı̂n timp a unei mărimi.
Valorile variabilei ca funcţie de timp pot fi fixate la un anumit moment de timp sau să se refere la
un interval de timp.
Seria cronologică de momente este o serie de observaţii ordonate ı̂n timp, exprimând stocuri
[Trebici V., 1985]. De exemplu: volumul populaţiei, numărul de universităti, bănci, instituţii, fonduri
fixe, numărul salariaţilor, ı̂ntreprinderile mici şi mijlocii din diferite domenii de activitate, unităţile
de cazare turistică, etc. Într-o astfel de serie ı̂nsumarea mărimii analizate nu are sens din punct de
vedere al conţinutului, aceasta fiind permisă din considerente de calcul, ajustări etc.
Seria cronologică de intervale este o serie de observaţii ordonate ı̂n timp exprimând fluxuri. De
exemplu: născuţii vii, divorţurile, decesele, producţia diferitelor culturi sau produse, venituri, cheltu-
ieli, producţia industrială, agricolă, exportul, importul etc. Într-o astfel de serie are sens ı̂nsumarea
mărimii analizate.
Fie o serie cronologică de momente sau de intervale ce reflectă evoluţia ı̂n timp a nivelului unei
mărimi Y ,
0 1 2 ... t ... T
Y : (1.6)
y0 y1 y2 . . . yt . . . yT
Pornind de la această serie se pot deduce seriile formate cu diferenţe absolute, indici statistici şi
diferenţe relative. În funcţie de modul de raportare a stărilor variabilei timp t, mărimile de mai sus
se pot calcula cu bază fixă (t/t0 ) (baza de comparaţie rămâne aceeaşi) sau cu bază ı̂n lanţ (t/t − 1)
(baza de comparaţie se schimbă, fiind considerată cea precedentă nivelului comparat).
Fie seriile cronologice formate cu:

• diferenţe absolute cu bază fixă:
!
0 1 2 ... t ... T
∆t/t
y
0
: 1/0 2/0 t/0 T /0 (1.7)
0 ∆y ∆y . . . ∆y . . . ∆y
t/0
unde ∆y = yt − y0 , pentru orice t = 0, T ;
• diferenţe absolute cu bază ı̂n lanţ:
!
0 1 2 ... t ... T
∆yt/t−1 : 1/0 2/1 t/t−1 T /T −1 (1.8)
− ∆y ∆y . . . ∆y . . . ∆y
t/t−1
unde ∆y = yt − yt−1 , pentru orice t = 1, T .
Între cele două tipuri de diferenţe absolute cu bază fixă şi cu bază ı̂n lanţ, există relaţii de legătură
ce ne permit exprimarea unora ı̂n funcţie de celelalte. În acest context, ı̂nsumând diferenţele absolute
cu bază ı̂n lanţ se obţin diferenţele absolute cu bază fixă:
∆t/0 1/0 2/1 t/t−1

y = ∆y + ∆y + . . . + ∆y , pentru orice t = 1, T .
Scăzând diferenţele succesive cu bază fixă se obţin diferenţele cu bază ı̂n lanţ:
∆t/0 t−1/0
y − ∆y = yt − y0 − yt−1 + y0 = ∆t/t−1
y .
Diferenţa absolută ne arată cu cât se modifică mărimea analizată de la un moment la altul. Se

exprimă ı̂n aceeaşi unitate de măsură ı̂n care este cuantificat fenomenul studiat.
Dacă fenomenul analizat se exprimă valoric, atunci diferenţa absolută nu reflectă prea bine mo-
dificările ce intervin, impunându-se utilizarea mărimilor relative precum indicele statistic şi diferenţa
relativă.
Fie seriile cronologice formate cu:

• indici statistici cu bază fixă
!
0 1 2 ... t ... T
Iyt/t0 : 1/0 2/0 t/0 T /0 (1.9)
1 Iy Iy . . . Iy . . . Iy
t/0 yt
unde Iy = (·100%), pentru orice t = 0, T ;
y0
• indici statistici cu bază ı̂n lanţ
!
0 1 2 ... t ... T
Iyt/t−1 : 1/0 2/1 t/t−1 T /T −1 (1.10)
− Iy Iy . . . Iy . . . Iy
t/t−1 yt
unde Iy = (·100%), pentru orice t = 1, T .
yt−1
Între cele două tipuri de indici există următoarele relaţii de legătură:
- Facând produsul indicilor cu bază ı̂n lanţ până la o anumită stare a variabilei t, se obţine indicele
cu bază fixă al clasei respective.
y1 y2 yt
Iy1/0 · Iy2/1 · . . . · Iyt/t−1 = · · ... · = Iyt/0 , pentru orice t = 0, T .
y0 y1 yt−1
- Împărţind doi indici succesivi cu bază fixă se obţine un indice cu bază ı̂n lanţ:
t/0
Iy yt y0 yt
t−1/0
= · = = Iyt/t−1 , pentru orice t = 1, T .
Iy y0 yt−1 yt−1
Indicele statistic ne arată de câte ori se modifică fenomenul analizat. Este mărimea cel mai des
folosită ı̂n caracterizarea evoluţiei fenomenelor din economie.
Având ca bază de referinţa o serie cronologică de forma (1.7) se pot elabora serii formate cu:
• diferenţe relative cu bază fixă

!
0 1 2 ... t ... T
Ryt/t0 : 1/0 2/0 t/0 T /0 (1.11)
0 Ry Ry . . . Ry . . . Ry
t/0
t/0 ∆y yt − y0 yt
unde Ry = = = − 1 = (I t/0 − 1)(·100%), pentru orice t = 0, T ;
y0 y0 y0
• diferenţe relative cu baza ı̂n lanţ
!
0 1 2 ... t ... T
Ryt/t−1 : 1/0 2/1 t/t−1 T /T −1 (1.12)
− Ry Ry . . . Ry . . . Ry
t/t−1
t/t−1 ∆y yt − yt−1 yt
unde Ry = = = − 1 = (I t/t−1 − 1)(·100%), pentru orice t = 1, T .
yt−1 yt−1 yt−1
Această mărime la fel ca şi indicele statistic, se foloseşte frecvent ı̂n caracterizarea fenomenelor din
economie.
- Aplicaţie. Evoluţia producţiei de grâu (mil. tone) ı̂nregistrată ı̂n România, ı̂n perioada 2013 -
2016 este redată ı̂n seria cronologică de mai jos:

2013 2014 2015 2016
Y :
7,2 7,4 7,8 8,4
Calculaţi si interpretaţi diferenţele absolute, indicii statistici şi diferenţele relative cu bază fixă şi bază
ı̂n lanţ.
Rezolvare. Pentru simplificare, vom interpreta rezultatele doar pentru anul 2016. În mod analog,
se pot face interpretări şi pentru ceilalţi ani.
Seria diferenţelor absolute cu bază fixă este:

t/0 2013 2014 2015 2016 t/0 2013 2014 2015 2016
∆y : ⇔ ∆y :
7, 2 − 7, 2 7, 4 − 7, 2 7, 8 − 7, 2 8, 4 − 7, 2 0 0,2 0,6 1,2
Se observă că producţia din anul 2016 a fost cu 1, 2 mil. tone mai mare decât producţia din anul 2013.
Seria diferenţelor absolute cu bază ı̂n lanţ este:

t/t−1 2013 2014 2015 2016 t/t−1 2013 2014 2015 2016
∆y : ⇔ ∆y :
7, 2−? 7, 4 − 7, 2 7, 8 − 7, 4 8, 4 − 7, 8 − 0,2 0,4 0,6
Se observă că producţia din anul 2016 a fost cu 0, 6 mil. tone mai mare decât producţia din anul 2015.
Seria indicilor statistici cu bază fixă este:

2013 2014 2015 2016 2013 2014 2015 2016
Iyt/0 : 7,2 7,4 7,8 8,4 ⇔ Iy
t/0
:
7,2 7,2 7,2 7,2 1 1,03 1,08 1,17
Se observă că producţia din anul 2016 a fost de 1, 17 ori mai mare decât producţia din anul 2013.
Seria indicilor statistici cu bază ı̂n lanţ este:

2013 2014 2015 2016 2013 2014 2015 2016
Iyt/t−1 : 7,2 7,4 7,8 8,4 ⇔ I t/t−1
y :
? 7,2 7,4 7,8 − 1,028 1,054 1,077
Se observă că producţia din anul 2016 a fost de 1, 077 ori mai mare decât producţia din anul 2015.
Seria diferenţelor relative cu bază fixă este:

t/0 2013 2014 2015 2016 t/0 2013 2014 2015 2016
Ry : ⇔ Ry :
1 − 1 1, 03 − 1 1, 08 − 1 1, 17 − 1 0% 3% 8% 17%
Se observă că producţia din anul 2016 a fost cu 17% mai mare decât producţia din anul 2013.
Seria diferenţelor relative cu bază ı̂n lanţ este:

t/t−1 2013 2014 2015 2016 t/t−1 2013 2014 2015 2016
Ry : ⇔ Ry :
1−? 1, 028 − 1 1, 054 − 1 1, 077 − 1 − 2,8% 5,4% 7,7%
Se observă că producţia din anul 2016 a fost cu 7, 7% mai mare decât producţia din anul 2015.
1.2.4. Serii statistice de spaţiu (teritoriale)

Seria statistică de spaţiu este o construcţie statistică ce reflectă variaţia ı̂n spaţiu a unei mărimi. Se-
ria de spaţiu prezintă o importanţă din ce ı̂n ce mai mare, datorită dezvoltării sistemului informaţional,
a necesităţii comparaţiilor internaţionale şi a comparaţiilor ı̂ntre regiunile unei ţări.
În cadrul Anuarului Statistic al României există capitole distincte de Statistică teritorială şi Sta-
tistică internaţională. În capitolul de Statistică teritorială sunt cuprinse informaţii privind: populaţia,
forţa de muncă, condiţiile de muncă, veniturile populaţiei, cheltuielile şi consumul populaţiei, locuinţe,
asistenţă socială, sănătate, ı̂nvăţământ, cultură, sport, conturi naţionale, rezultate şi performanţe
ale ı̂ntreprinderilor, agricultură, silvicultură, industrie, transporturi, poştă, telecomunicaţii, turism,
finanţe, justiţie şi starea infracţională, pe cele 7 regiuni şi Bucureşti.
La baza seriei de spaţiu se găsesc atât mărimi absolute (indicator de nivel, diferenţa absolută), cât
şi mărimi relative (indicator relativ de intensitate, indicele statistic, diferenţa relativă).
Fie seria statistică Z, de forma următoare:

s0 s1 s2 . . . si . . . sK
Z: (1.13)
z 0 z1 z2 . . . z i . . . z K
unde:
si − este o stare a variabilei ce exprimă spaţiul, i = 0, K;

zi − exprimă o mărime (indicator de nivel sau relativ de intensitate), i = 0, K.
Plecând de la seria de forma (1.13) se pot deduce seriile formate cu:

• diferenţe absolute cu bază fixă
!
s/s0 s0 s1 s2 ... si ... sK
∆Z : s1 /s0 s /s0 si /s0 sK /s0 (1.14)
0 ∆z ∆z2 . . . ∆z . . . ∆z
s /s0
unde: ∆zi = zi − z0 , pentru orice i = 0, K.
• indicii statistici cu bază fixă
!
s/s s0 s1 s2 ... si ... sK
IZ 0 : s /s s /s0 s /s s /s (1.15)
1 Iz 1 0 Iz 2 . . . Iz i 0 . . . Iz K 0
s /s0 zi
unde: Iz i = (·100%), pentru orice i = 0, K.
z0
1.3. Observarea statistică 13
• diferenţe relative cu bază fixă

!
s/s0 s0 s1 s2 ... si ... sK
RZ : s1 /s0 s /s0 si /s0 sK /s0 (1.16)
0 Rz Rz2 . . . Rz . . . Rz
s /s0
s /s0 ∆zi zi − z 0 s /s
unde: Rzi = = = (Iz i 0 − 1)(·100%), pentru orice i = 0, K.
z0 z0
- Aplicaţie. Seria statistică de mai jos arată valorile PIB/loc (e) ı̂n unele state membre ale Uniunii
Europene ı̂n anul 2009.

România Cehia Ungaria Bulgaria Slovacia Slovenia
S:
5900 13000 9100 4600 12600 18200
Calculaţi şi interpretaţi parametrii specifici seriilor de spaţiu.
Rezolvare. Seria formată cu diferenţe absolute cu bază fixă este:

s/s0 România Cehia Ungaria Bulgaria Slovacia Slovenia
∆S :
0 7100 3200 -1300 6700 12300
Constatăm că PIB/loc al Bulgariei a fost mai mic cu 1300e faţă de PIB/loc al României.
Seria formată cu indicii statistici cu bază fixă este:

IS :
1 2,20 1,54 0,78 2,14 3,08
Constatăm că PIB/loc al Sloveniei a fost de 3, 08 ori mai mare faţă de PIB/loc al României.
Seria formată cu diferenţe relative cu bază fixă este:

RS :
0% 120% 54% -22% 114% 208%
Constatăm că PIB/loc al Sloveniei a fost cu 208% mai mare faţă de PIB/loc al României.
1.3 Observarea statistică

Observarea statistică constituie prima etapă ı̂n cadrul studierii fenomenelor sociale, economice sau
de altă natură, etapă ı̂n care se culeg datele statistice despre fenomenul supus cercetării. Cercetarea
fenomenelor respective presupune cunoaşterea populaţiei statistice ı̂n vederea surprinderii acţiunii
legilor care acţionează la nivelul acesteia. De calitatea acestei etape, ı̂ntr-un proces de cercetare
statistică, depinde şi calitatea rezultatelor obţinute ı̂n celelalte faze.
Observarea statistică presupune identificarea, urmărirea şi ı̂nregistrarea, după reguli unitare şi pre-
cise, a nivelului atins de variabilele statistice studiate pentru unităţile din care este formată populaţia
[Florea I., 1998].
Pentru asigurarea unor date, rezultate din observare, valide şi pertinente se impun câteva precizări.
În primul rând, observarea statistică presupune urmărirea şi ı̂nregistrarea unui număr mare de unităţi
statistice, ceea ce implică un volum mare de muncă. În al doilea rând, pentru ca cercetarea populaţiei
să-şi atingă scopul, trebuie precizate care sunt variabilele ı̂n raport cu care este studiată populaţia.
Variabilele statistice ce urmează să fie urmărite şi ı̂nregistrate la nivelul fiecărei unităţi din populaţie,
trebuie să fie esenţiale şi să prezinte interes din punct de vedere al studiului ı̂ntreprins. În al treilea
rând, trebuie stabilite criterii exacte pentru delimitarea corectă a unităţilor statistice care alcătuiesc
populaţia. Şi nu ı̂n ultimul rând, dacă observarea şi ı̂nregistrarea datelor este făcută de mai multe
persoane, este necesar ca acestea să se alinieze unei metodologii unitare pentru a asigura corectitudinea
necesară datelor rezultate.
Observarea statistică, ca primă etapă ı̂ntr-un studiu de cercetare, presupune: specificarea unităţilor
statistice care trebuie să fie urmărite şi ı̂nregistrate, alegerea variabilelor statistice care caracterizează
cel mai bine populaţia şi care răspund obiectivului urmărit, ı̂nregistrarea stărilor variabilelor statistice
considerate.
Atingerea scopului cercetării statistice presupune rezolvarea următoarelor probleme care să asigure
o pregătire ştiinţifică a observării statistice:
- delimitarea populaţiei supuse observării;
- definirea unităţilor statistice de observat;
- timpul şi locul unde va avea loc observarea;
- programul observării;
- alegerea purtătorilor de informaţie;
- pregătirea persoanelor ce urmează să facă observarea.
Fiecăreia din aceste probleme trebuie să i se acorde importanţa cuvenită, fiindcă fiecare dintre
ele conduce la o pregătire cât mai completă a observării, de rezultatele căreia depinde corectitudinea
celorlalte etape ale cercetării statistice.
Delimitarea populaţiei supuse observării faţă de alte populaţii statistice cu care aceasta se află ı̂n
legătură se realizează prin evidenţierea ı̂nsuşirilor şi trăsăturilor comune ce caracterizează populaţia
supusă studiului.
Definirea unităţilor statistice de observat presupune claritate şi precizie pentru a nu da loc confuzi-
ilor. În momentul observării trebuie cunoscut exact care sunt unităţile statistice ce trebuie ı̂nregistrate
ı̂n raport cu variabilele de studiat.
Stabilirea timpului şi a locului unde va avea loc observarea are importanţă din punct de vedere a
comparabilităţii datelor rezultate din observare. Noţiunea de timp al observării are ı̂n statistică două
accepţiuni:
- momentul sau perioada la care se referă datele ı̂nregistrate (timpul de referinţă);
- durata observării.
Locul observării reprezintă punctul din spaţiu ı̂n care se derulează procesul supus cercetării (incinta
unei ı̂ntreprinderi, a unui magazin, o localitate ı̂n cazul ı̂n care populaţia o reprezintă familiile, etc.).
În cadrul programului observării statistice trebuie stabilite variabilele statistice care urmează să fie
studiate ı̂n populaţia de cercetat. Alegerea şi definirea variabilelor statistice trebuie să fie ı̂n consens
cu natura populaţiei şi obiectivul cercetării statistice ı̂ntreprinse. Variabilele statistice care fac parte
din programul cercetării trebuie să surprindă aspectele esenţiale, să expliciteze fenomenul sau procesul
studiat, să permită prelucrarea şi generalizarea acestora la nivelul ı̂ntregii populaţii.
Alegerea purtătorilor de informaţie se face ı̂n funcţie de volumul datelor ce urmează a fi ı̂nregistrate.
Purtătorii de informaţie reprezintă suporţii materiali pe care se ı̂nregistrează datele din observarea
unităţilor statistice.
Observarea statistică se poate desfăşura ı̂n diverse forme ı̂n raport cu: natura proceselor social-
economice de studiat, obiectivul cercetării, formele de organizare cât şi posibilităţile practice de
urmărire şi ı̂nregistrare a unităţilor statistice din populaţie.
După cum se ştie, ı̂n raport cu gradul de cuprindere al populaţiei considerate avem: observarea
totală şi observarea parţială. Observarea totală permite ı̂nregistrarea, ı̂n raport cu variabilele statistice
a tuturor unităţilor statistice din populaţie. Implicând un volum mare de muncă, antrenează, de obicei,
un număr de persoane şi durează mult timp. Ca urmare se creează condiţii pentru apariţia de erori
de observare, ceea ce va conduce la micşorarea eficienţei observării. Forma cea mai frecventă de
observare totală o constituie recensământul populaţiei. Observarea totală se practică şi ı̂n domeniul
controlului tehnicii de calitate, ı̂n cazul produselor de ı̂naltă tehnicitate, cum ar fi: televizoare, maşini
de spălat, frigidere, automobile, etc. Este necesară o observare totală ı̂n acest caz, deoarece constatarea
defecţiunilor de către cumpărători ar implica cheltuieli mult mai mari cu remedierea acestora ı̂n
comparaţie cu organizarea unei observări totale a loturilor de produse ce urmează a fi scoase pe
piaţă.
În cazul altor produse, unde cheltuielile legate de remedierea defectelor sunt nesemnificative, este
suficientă realizarea unor observări parţiale prin care să se asigure că rebuturile nu depăşesc un anumit
procent admis. O astfel de observare, care include doar o parte din unităţile populaţiei supuse studiului
corespunde observării parţiale. Observarea parţială constituie o alternativă la observarea totală ı̂n
cazul populaţiilor infinite sau chiar dacă sunt finite prin observare are loc distrugerea acestora. Având
la bază procedeul observării parţiale se pot evalua rezervele de ţiţei, cărbune sau alte minerale, se
poate evalua masa de material lemnos din fondul silvic al unei zone sau la nivelul ı̂ntregii ţări. În
general, observarea parţială se recomandă ı̂n toate cazurile ı̂n care se consideră mai avantajoasă decât
observarea totală.
Eşantionul, ca rezultat al observării parţiale, presupune respectarea cu stricteţe a principiului
reprezentativităţii, ı̂n conformitate cu care fiecare unitate statistică din populaţia generală să aibă
aceeaşi şansă de a face parte din eşantion. Asigurarea respectării principiului reprezentativităţii ı̂n
formarea eşantionului de observat permite acestuia o structură foarte apropiată cu cea a populaţiei
din care a fost format. Aceasta ne asigură, cu o anumită probabilitate dinainte fixată, că rezultatele
obţinute la nivelul eşantionului pot fi extinse la nivelul ı̂ntregii populaţii. În raport cu legea de
probabilitate urmată de variabilele urmărite ı̂n populaţia generală sunt două tipuri de eşantioane:
eşantioane de volum mare şi eşantioane de volum redus.
Observarea statistică ı̂n raport cu procedeul folosit este de două feluri:
- observarea directă;
- observarea indirectă.
Observarea directă presupune o observare nemijlocită a unităţilor din populaţie, care sunt prevăzute
pentru cercetare. Acest mod de observare se realizează printr-un contact direct cu unităţile statistice,
fie prin măsurare, fie prin interogare, dacă unităţile sunt persoane. Acest procedeu permite observato-
rului perceperea nemijlocită a fenomenelor luate ı̂n studiu ı̂n vederea măsurării nivelelor ı̂nregistrate
de variabilele considerate.
Observarea indirectă presupune un intermediar ı̂ntre unităţile care urmează să fie supuse observării
şi observator. Intermediarul poate fi un document special conceput ı̂n vederea observării şi atunci
observarea este pe bază de document sau intermediarul poate fi o altă persoană decât observatorul,
caz ı̂n care avem observare prin interogare.
Suportul pentru culegerea datelor ı̂l reprezintă chestionarul.
Sistematizarea şi prezentarea datelor statistice

Sistematizarea constituie o etapă ı̂n cadrul prelucrării datelor statistice ı̂n vederea prezentării
acestora sub formă de serii statistice (tabele statistice).
Datele obţinute ca urmare a procesului de observare statistică, ı̂n forma lor brută, permit o ca-
racterizare amănunţită a fiecărei unităţi din populaţia considerată. Deoarece, datele rezultate din
observare se prezintă sub formă dezorganizată, nu permit o caracterizare a populaţiei ı̂n ansamblu.
În vederea atingerii scopului cercetării statistice ı̂ntreprinse şi anume acela de a da o caracterizare
de ansamblu populaţiei considerate, este necesar ca datele rezultate din observare să fie supuse unor
operaţii de sistematizare şi prezentare ı̂n vederea deducerii a ceea ce este esenţial, tipic şi general ı̂n
legătură cu populaţia.
Deoarece ı̂n prelucrarea statistică primul pas ı̂l constituie prezentarea datelor observate sub formă
de serie (tabel), pentru construirea seriilor statistice se aleg variabilele care trebuie să fie ı̂n strânsă
dependenţă cu scopul cercetării şi cu natura fenomenului cercetat. Odată precizate variabilele de la
baza seriei, se ştie care va fi conţinutul primului şir de date şi ca urmare este elucidat criteriul ı̂n
raport cu care informaţiile rezultate din observare vor fi ordonate, necunoscându-se ı̂nsă cum se face
propriu-zis ordonarea şi cum se completează primul şir al seriei.
Operaţia de stabilire a claselor presupune ı̂mpărţirea unităţilor unei populaţii ı̂n clase distincte ı̂n
raport cu una sau mai multe variabile şi aranjarea claselor rezultate ı̂ntr-o anumită ordine. În urma
unei asemenea operaţii, fiecare unitate trebuie să se găsească ı̂n una şi numai una din clasele rezultate.
Această operaţie nu trebuie să conducă la pierderi de unităţi, regăsindu-se ı̂nsa ı̂ntr-o altă ordine decât
cea după care s-a realizat observarea.
Omogenitatea constituie o proprietate de bază pe care trebuie să o aibă clasele. Se spune că o clasă
este omogenă dacă, pentru unităţile care fac parte din ea, variabila de grupare ı̂nregistrează variaţii
nesemnificative.
În cele ce urmează se va prezenta operaţia de stabilire a claselor ı̂n cazul unei serii unidimensionale.
Dacă la baza seriei avem o variabilă calitativă, atunci clasele se stabilesc ı̂n raport cu stările
acesteia. Pentru fiecare stare a variabilei se va construi o clasă. Ca urmare, ı̂n acest caz, ı̂ntr-o clasă
vor intra toate unităţile care au ı̂nregistrat aceeaşi stare ı̂n timpul observării ı̂n raport cu variabila
considerată.
În cazul unei serii care are la bază o variabilă cantitativă discretă (numărul stărilor nu este prea
mare), clasele se stabilesc ı̂n mod asemănător ca şi la variabilele calitative, respectiv:

x1 x2 . . . x R
X: .
N1 N2 . . . NR
În condiţiile ı̂n care cercetarea populaţiei presupune elaborarea unei serii care are la bază o variabilă
cantitativă continuă sau o variabilă cantitativă discretă, dar care ı̂n populaţia considerată ı̂nregistrează
un număr prea mare de stări, clasele nu se mai pot stabili cu ajutorul stărilor variabilei. Pentru
asemenea cazuri, gruparea unităţilor populaţiei ı̂n clase se face cu ajutorul intervalelor de grupare
(variaţie), fiecare interval cuprinzând un număr oarecare de valori ale variabilei. Ca urmare, pentru o
serie continuă, clasele se definesc cu ajutorul intervalelor de grupare.
Două probleme se pun ı̂n cazul elaborării unei serii care are la bază o variabilă cantitativă continuă:
• determinarea lungimii intervalelor de variaţie;
• stabilirea formei de scriere a intervalelor de variaţie.
Determinarea lungimii intervalelor de variaţie conduce la două situaţii:
• serii construite cu intervale de lungime egală;
• serii construite cu intervale de lungime diferită.
Stabilirea numărului de intervale de variaţie trebuie să asigure satisfacerea următoarelor condiţii:
- informaţia care se pierde ı̂n urma operaţiei de grupare să nu fie prea mare, iar populaţia să nu
fie prea farâmiţată ı̂n raport cu variabilele de grupare;
- media aritmetică a fiecarei grupe (ı̂n raport cu valorile ı̂nregistrate) sa fie cât mai aproape de
centrul intervalului de variaţie respectiv;
- să nu existe grupe vide;
- reprezentarea grafică a seriei rezultate să permită conturarea unei regularităţi a fenomenului de
studiat din cadrul populaţiei. Trebuie remarcat că acest lucru nu este posibil nici ı̂n cazul unui număr
mic de intervale deoarece se pierd prea multe date, nici ı̂n cazul unui număr prea mare de intervale,
populaţia farâmiţându-se prea tare.
Dacă se doreşte elaborarea unei serii cu intervale de lungime egală, mai ı̂ntâi se va calcula lungimea
unui interval (λ), raportând ı̂ntregul interval de variaţie ([xmin , xmax ]) la numărul de intervale (R), ce
se doresc a fi obţinute. Mai precis,
xmax − xmin
λ= .
R
Se stabilesc apoi intervalele având ca punct de pornire valoarea minimă. Se elaborează seria de
intervale de lungime egală după cum urmează:

[xmin , xmin + λ] . . . [xmin + (i − 1)λ, xmin + iλ] . . . [xmin + (R − 1)λ, xmin + Rλ]
X: .
N1 ... Ni ... NR
Nu ı̂ntotdeauna ı̂mpărţirea domeniului de variaţie al variabilei ı̂n intervale de lungime egală este
relevantă din punct de vedere al scopului urmărit ı̂n ceea ce priveşte reliefarea tipurilor calitative din
cadrul populaţiei cercetate. Numeroase sunt cazurile practice ı̂n care studiul unei populaţii ı̂n raport
cu o variabilă sau mai multe presupune ı̂mpărţirea domeniilor de variaţie ale acestora ı̂n intervale de
lungime neegală. În asemenea cazuri nu există o relaţie de calcul ı̂n acest sens. Stabilirea intervalelor
de variaţie se face ı̂n directă legătură cu variaţia variabilelor şi distribuirea unităţilor ı̂n raport cu
acestea.
Dacă la baza seriei ı̂n cauză stau două sau mai multe variabile calitative sau cantitative atunci
clasele se stabilesc ı̂n raport cu fiecare din variabilele considerate prin stările acestora (vezi seria (1.5)).
Nu este recomandat ca numărul variabilelor ı̂n raport cu care se studiază populaţia să fie prea
mare, deoarece aceasta duce la o divizare exagerată a populaţiei pierzându-se din vedere aspectele
principale.
După ce clasele au fost definite, are loc repartizarea unităţilor populaţiei ı̂n clasele respective,
folosind ı̂n acest scop un algoritm adecvat.
Pentru elaborarea şi prezentarea seriilor statistice se apelează la pachete de programe statistice
cum ar fi: S.P.S.S. (Statistical Package for the Social Sciences), STATISTICA, S.A.S. (Statistical
Analysis System), STATGRAPHICS, etc.
- Aplicaţie. Managerul unui site informatic a contorizat numărul de tranzacţii online efectuate de
utilizatori pentru achiziţionarea unor produse. În decursul unei luni, numărul de tranzacţii efectuate
pe zi a fost: 31, 27, 12, 32, 34, 33, 33, 22, 27, 15, 31, 37, 43, 23, 25, 27, 41, 39, 11, 14, 21, 37, 24,
19, 30, 28, 34, 20, 27, 33. Construiţi o serie unidimensională continuă, cu frecvenţe absolute, care să
grupeze tranzacţiile efectuate ı̂n patru clase.
Rezolvare. Pentru ı̂nceput, vom ordona crescător şirul tranzacţiilor efectuate. Fie X variabila
statistică ce indică numărul de tranzacţii efectuate ı̂ntr-o zi. Stările variabilei X, ordonate crescător,
sunt: 11, 12, 14, 15, 19, 20, 21, 22, 23, 24, 25, 27, 27, 27, 27, 28, 30, 31, 31, 32, 33, 33, 33, 34, 34, 37,
37, 39, 41, 43.
Dorim să construim o serie statistică formată cu R = 4 clase (intervale). Cunoaştem valoarea
minimă xmin = 11 şi valoarea maximă xmax = 43. Lungimea unui interval este:
xmax − xmin 43 − 11
λ= = = 8.
R 4
Obţinem seria unidimensională continuă

[11, 19) [19, 27) [27, 35) [35, 43]
X: , 30.
4 7 14 5

1.4 Reprezentări grafice

Reprezentarea grafică a unei serii ne dă o imagine geometrică (ı̂n plan sau spaţiu) cu privire la forma
statică sau evoluţia dinamică a fenomenului cuantificat de seria respectivă.
Graficul asociat unei serii constituie o imagine spaţială a fenomenului cercetat, permiţând evidenţi-
erea rapidă a structurii, dinamicii şi tendinţei de dezvoltare a acestuia. Reprezentările grafice sunt
folosite atât ı̂n scopul cunoaşterii populaţiei ı̂n cauză, cât şi pentru popularizarea unor rezultate din
diverse domenii de activitate.
Elaborarea completă şi corectă a unui grafic presupune elucidarea următoarelor elemente: titlul
graficului, scara de reprezentare, reţeaua graficului, semnele convenţionale şi notele.
Titlul graficului trebuie să fie scurt, clar şi semnificativ pentru conţinutul fenomenului reliefat prin
seria considerată.
Scara de reprezentare reuneşte mulţimea tuturor punctelor cotate. În cazul ı̂n care variabila
ı̂nregistrează valori mici, gradarea scării ı̂ncepe ı̂n principiu de la zero. Dacă variabila ı̂nregistrează
valori mari se consideră o altă origine stabilită cu aproximaţie. Pentru a nu ı̂ncărca prea mult desenul,
se recomandă reprezentarea pe scară doar a valorilor dispuse la un anumit interval convenabil ales.
Distanţele dintre doua puncte cotate consecutive se numeşte intervalul graficului. Când intervalele
sunt egale atunci avem scări uniforme. În caz contrar, avem scări neuniforme.
Reţeaua graficului permite identificarea cu uşurinţă ı̂n plan sau ı̂n spaţiu a punctelor cores-
punzătoare valorilor ı̂nregistrate de variabilele ı̂n cauză. Sistemul axelor rectangulare (ı̂n plan sau
spaţiu) constituie cea mai uzuală reţea ı̂n reprezentarea grafică a seriilor statistice.
Semnele convenţionale se pot materializa ı̂ntr-o reprezentare grafică fie prin inscripţii, fie printr-o
legendă. Inscripţia trebuie să fie scurtă şi semnificativă şi plasată cât mai bine ı̂n raport cu elementul
din grafic pe care ı̂l explicitează. Legenda se foloseşte pentru a explicita folosirea semnelor, culorilor
sau diverselor haşuri folosite ı̂n graficul ı̂n cauză. Legenda se plasează ı̂nafara graficului, ı̂n colţul din
stânga sau dreapta jos.
În cazul graficelor complexe, pentru o ı̂nţelegere mai bună, sunt necesare unele explicaţii, care se
dau sub formă de note. Notele generale privesc ı̂n ansamblu graficul şi se plasează chiar sub titlul
graficului. Notele speciale privesc porţiuni din grafic şi sunt legate de acestea prin diverse semne de
trimitere. Notele se plasează ı̂n partea de jos a diagramei, ı̂n colţul din stânga, sub reţea.
În continuare, vom prezenta principalele tehnici de construire a graficelor utilizate ı̂n reprezentarea
seriilor statistice.
Histograma
Graficul specific seriilor care au la bază o variabilă continuă (de intervale) este histograma. Aceasta
se construieşte ı̂ntr-un sistem de axe rectangulare după cum urmează: pe abscisă se trec intervalele de
variaţie, iar pe ordonată se trasează scara frecvenţelor. Scara frecvenţelor se construieşte ı̂n confor-
mitate cu respectarea principiului proporţionalităţii ı̂ntre frecvenţe şi segmentele delimitate pe scara
ordonatelor. Pentru fiecare interval de variaţie al seriei [xi−1 , xi ) se construieşte un dreptunghi a cărui
bază este chiar lungimea intervalului, iar cealaltă latură se determină din condiţia proporţionalităţii
ariei dreptunghiului cu mărimea indicatorului ı̂n clasa respectivă.
1.4. Reprezentări grafice 19
Latura necunoscută a dreptunghiului, notată

cu Li se determină din următoarea relaţie:
Li · li = k · Ni (1.17)
unde:
li = latura cunoscută a dreptunghiului cores-
punzător intervalului (xi−1 , xi );
Li = latura necunoscută a dreptunghiului co-
respunzător intervalului (xi−1 , xi );
Ni = frecvenţa absolută a clasei i;
k = coeficient de proporţionalitate care se
alege ı̂n raport cu scara de reprezentare.
Figura 1.1: Histograma
Din relaţia (1.17) găsim:

k · Ni
Li = , i = 1, R (1.18)
li
unde li = xi − xi−1 , adică diferenţa dintre limita superioară şi cea inferioară a intervalului de variaţie.
Mulţimea tuturor dreptunghiurilor astfel determinate, formează histograma ataşată seriei.
Poligonul frecvenţelor
Este o reprezentare grafică a seriilor statistice având la bază o variabilă atributivă cantitativă
continuă şi formată cu frecvenţe absolute sau relative, simple sau cumulate.
Trasarea acesteia presupune realizarea ı̂n prealabil a histogramei. Poligonul frecvenţelor se obţine
unind prin segmente de dreaptă mijloacele laturilor superioare ale dreptunghiurilor din care este
alcătuită histograma.
Poligonul frecvenţelor este un grafic important pentru aproximarea formei distribuţiei populaţiei
studiate, cât şi pentru compararea a două distribuţii pe aceeaşi diagramă.
- Aplicaţie. Se consideră repartiţia salariaţilor unei ı̂ntreprinderi ı̂n raport cu vechimea ı̂n muncă:

[0, 10) [10, 20) [20, 30) [30, 40) [40, 50]
V : , 50.
10 8 14 12 6
Construiţi histograma seriei de repartiţie, punând ı̂n evidenţă poligonul frecvenţelor.
Rezolvare. Pentru fiecare interval de variaţie a vechimii ı̂n muncă, vom calcula mai ı̂ntâi lungimea
intervalului. Avem: l1 = 10 − 0 = 10; l2 = 20 − 10 = 10; l3 = 30 − 20 = 10; l4 = 40 − 30 = 10;
l5 = 50 − 40 = 10.
Alegem factorul de proporţionalitate k = 10 şi folosind formula (1.18) găsim:
k · N1 10 · 10
L1 = = = 10
l1 10
k · N2 10 · 8
L2 = = =8
l2 10
k · N3 10 · 14
L3 = = = 14
l3 10
k · N4 10 · 12
L4 = = = 12
l4 10
k · N5 10 · 6
L5 = = =6
l5 10
Figura 1.2: Distribuţia salariaţilor ı̂n funcţie
de vechimea ı̂n muncă

Diagramele cu benzi sau coloane (barchart)

Acest tip de grafic utilizează benzile (barele) sau coloanele pentru a reprezenta distribuţia unei
populaţii ı̂n raport cu o variabilă cantitativă discretă sau calitativă. Benzile au aceeaşi lăţime (bază),
iar lungimea (ı̂nălţimea) lor este direct proporţională cu frecvenţa clasei reprezentate. Numărul ben-
zilor este egal cu numărul claselor ı̂n care este ı̂mpărţită populaţia studiată. De asemenea se pot lua
ı̂n considerare o variabilă sau două.
În reprezentări se utilizează benzi simple sau benzi grupate. Poziţia benzilor poate fi orizontală
sau verticală.
- Aplicaţie. La un magazin alimentar, ı̂n decursul unei luni, s-au ı̂nregistrat următoarele date
privind consumul de ciocolată: 32 clienţi au cumpărat ciocolată M ilka, 40 clienţi ciocolată P oiana
şi 17 clienţi ciocolată Heidi. De asemenea, privind consumul de cafea, s-a constatat că: 50 clienţi
au cumpărat cafea Jacobs, 20 clienţi cafea T schibo, 10 clienţi cafea Amaroy. Reprezentaţi grafic
distribuţia clienţilor ı̂n raport cu ciocolata, respectiv cafeaua cumpărată.
Rezolvare. Pentru distribuţia clienţilor ı̂n raport cu sortimentul de ciocolată ales vom utiliza dia-
grama cu coloane, iar pentru distribuţia clienţilor ı̂n raport cu sortimentul de cafea ales vom utiliza
diagrama cu benzi.
Fie X variabila statistică ce indică sortimentul

de ciocolată. Seria de distribuţie este:

Milka Poiana Heidi
X: , 89.
32 40 17
Diagrama cu coloane corespunzătoare

distribuţiei clienţilor ı̂n raport cu variabila
calitativă X este prezentată ı̂n figura 1.3.
Figura 1.3: Distribuţia clienţilor ı̂n funcţie de

sortimentul de ciocolată cumpărat
Fie Y variabila statistică ce indică sortimentul

de cafea. Seria de distribuţie este:

Jacobs Tschibo Amaroy
Y : , 70.
50 20 10
Diagrama cu benzi corespunzătoare

distribuţiei clienţilor ı̂n raport cu varia-
bila calitativă Y este prezentată ı̂n figura
1.4.
Figura 1.4: Distribuţia clienţilor ı̂n funcţie de
sortimentul de cafea cumpărat

Cercul de structură
Cercul de structură permite punerea ı̂n evidenţă sub formă grafică a structurii unei populaţii
statistice.
Se construieşte un cerc de rază oarecare, a cărui suprafaţă se consideră că reprezintă volumul
ı̂ntregii populaţii ı̂n cauză (exprimat ı̂n frecvenţe absolute sau relative).
Fiecare clasă ı̂n care este divizată populaţia supusă studiului este reprezentată printr-un sector de
cerc de arie direct proporţională cu volumul clasei. Trasarea sectorului de cerc presupune determinarea
măsurii ı̂n grade a unghiurilor la centru a fiecărui sector. Unghiul la centru de 360◦ corespunde
volumului ı̂ntregii populaţii. Unghiurile sectoarelor de cerc care reprezintă clase din populaţie trebuie
să fie proporţionale cu volumul acestora (exprimat ı̂n frecvenţe absolute sau relative). clasei respective.
Fie, de exemplu, seria de distribuţie unidimensională formată cu frecvenţe absolute:

x1 x2 . . . xi . . . xR
X: , N.
N1 N2 . . . Ni . . . NR
Fie αi unghiul la centru corespunzător sectorului aferent clasei i, de volum Ni . Atunci:
360◦ · Ni
αi = = 360◦ · fi , i = 1, R (1.19)
N
unde fi este frecvenţa relativă corespunzătoare clasei i.
- Aplicaţie. În urma alegerilor parlamentare pentru Camera Deputaţilor din anul 2016, partidele
politice din România au obţinut următoarele rezultate privind voturile valabil exprimate:
P SD PNL U SR U DM R ALDE PMP P RU P RM
45% 21% 10% 8% 6% 5% 3% 2%
Reprezentaţi grafic structura voturilor valabil exprimate pentru fiecare partid politic.
Rezolvare. Vom contrui cercul de structură folosind formula de calcul (1.19).
α1 = 360◦ · 45% = 162◦

α2 = 360◦ · 21% = 75, 6◦
α3 = 360◦ · 10% = 36◦
α4 = 360◦ · 8% = 28, 8◦
α5 = 360◦ · 6% = 21, 6◦
α6 = 360◦ · 5% = 18◦
α7 = 360◦ · 3% = 10, 8◦
α8 = 360◦ · 2% = 7, 2◦ .
Cercul de structură cu sectoarele aferente

fiecărui partid politic este prezentat ı̂n figura
1.5.
Figura 1.5: Structura Cemerei Deputaţilor

Cronograma (historiograma)
O categorie foarte importantă de serii o constituie seriile cronologice, a căror reprezentare grafică
se realizează prin intermediul cronogramei. Trasarea unei cronograme se realizează ı̂ntr-un sistem de
axe rectangulare.
Fie seria cronologică:
0 1 2 ... t ... T
Y : ,
y0 y1 y2 . . . yt . . . yT
unde: t = 0, T , reprezintă momentele (sau perioadele) de timp care se reprezintă pe axa absciselor, iar
mărimile yt se reprezintă pe axa ordonatelor. Fiecărei perechi de valori (t, yt ), t = 0, T ı̂i corespunde
un punct ı̂n planul axelor rectangulare. Unind prin segmente de dreaptă punctele consecutive astfel
determinate, se obţine ceea ce se numeşte cronogramă. În acelaşi sistem de axe pot fi reprezentate
una sau mai multe serii cronologice, care pot fi exprimate ı̂n aceeaşi unitate de măsură sau ı̂n unităţi
de măsură diferite. Cronogramele asociate unor serii cronologice ne permit compararea fenomenelor
surprinse de asemenea serii şi sesizarea perioadelor critice ı̂n evoluţia acestora.
- Aplicaţie. Conform datelor Institutului Naţional de Statistică (IN S), evoluţia producţiei de ţiţei
(mii tone) din România, ı̂n perioada 2010-2015, este redată ı̂n tabelul de mai jos:
An 2010 2011 2012 2013 2014 2015

Producţie ţiţei (mii tone) 4314 4255 4010 4151 4072 4070
Reprezentaţi grafic seria cronologică.
Rezolvare. Cronograma aferentă producţiei de ţiţei din România, ı̂n perioada 2010-2015 este următoarea:
Figura 1.6: Cronograma producţiei de ţiţei

Norul de puncte
Norul de puncte constituie o modalitate de reprezentare grafică a seriilor atributive de distribuţie
bidimensionale. Se consideră o serie bidimensională de repartiţie ı̂n raport cu variabilele discrete X şi
Y . În sistemul de axe rectangulare xOy se marchează toate punctele de coordonate (xi , yj ), i = 1, L,
j = 1, K pentru care frecvenţele Nij 6= 0. Mărimea acestor frecvenţe se poate marca pe grafic ı̂n două
moduri:
- dacă frecvenţele sunt mici, atunci pentru fiecare punct de pe grafic (xi , yj ), i = 1, L, j = 1, K
pentru care Nij 6= 0, se marchează atâtea puncte de câte ori se repetă perechea respectivă.
- dacă ı̂nsă frecvenţele sunt prea mari, pentru marcarea lor pe grafic se pot utiliza diagrame areale
prin cercuri ale căror arii trebuie sa fie proporţionale cu rădăcina pătrată a frecvenţelor pe care le
reprezintă.
În cazul ı̂n care cele două variabile X şi Y sunt continue, ı̂ntrucât la intersecţia a două intervale
se formează o rubrică (căsuţă), frecvenţele diferite de zero se reprezintă ı̂n interiorul acestei rubrici,
fie prin puncte, fie prin diagrame areale cu respectarea unuia din cele două moduri de elaborare mai
sus amintite.
- Aplicaţie. Un produs a fost lansat simultan pe 13 pieţe. Pe aceste pieţe, produsul a fost propus la
preţuri diferite (P ), veniturile consumatorilor fiind şi ele diferite. Pentru fiecare piaţă s-a ı̂nregistrat
un anumit nivel al cererii (C), rezultatele fiind sintetizate ı̂n tabelul următor:
N r. crt. 1 2 3 4 5 6 7 8 9 10 11 12 13
C 15, 4 3, 2 4, 9 10, 5 8, 0 5, 1 7, 6 11, 3 14, 0 6, 4 13, 2 8, 8 12, 1
P 1, 4 5, 1 2, 5 1, 7 1, 8 3, 4 2, 1 1, 6 3, 6 3, 5 1, 9 1, 8 1, 9
Construiţi norul de puncte ı̂n raport cu variabilele preţ şi cerere.

Rezolvare. Folosind datele ı̂nregistrate pentru preţ şi cerere, se poate construi următorul nor de
puncte:
Figura 1.7: Norul de puncte ı̂n raport cu preţul şi cererea

Cartograma şi cartodiagrama

Aceste tipuri de grafice se folosesc frecvent pentru reprezentarea grafică a seriilor statistice de
spaţiu.
Realizarea unei cartograme sau a unei cartodiagrame presupune conturarea spaţiului (sub formă
de hartă) ı̂n interiorul căruia se manifestă fenomenul care este cuantificat de seria de reprezentat. În
interiorul hărţii astfel realizate, prin diverse culori sau nuanţe ale aceleiaşi culori, prin haşuri sau prin
diferite diagrame, este evidenţiată intensitatea dezvoltării fenomenului cercetat precum şi mărimea
indicatorilor seriei.
Cartodiagrama constituie o modalitate de reprezentare grafică a seriilor de spaţiu, realizându-se
ca o ı̂mbinare ı̂ntre cartogramă şi diferite alte tipuri de diagrame, ca de exemplu diagrame prin benzi,
cerc, pătrat, dreptunghi, etc.
De exemplu, pentru a reprezenta
o serie de spaţiu ce exprimă volu-
mul investiţiilor străine pe judeţe,
la noi ı̂n ţară, se procedeaza
astfel: ı̂n primul rând se dese-
nează harta României, delimitându-
se judeţele; ı̂n cadrul fiecărui judeţ
se precizează volumul investiţiilor
străine sau se desenează o fi-
gură geometrică oarecare, convena-
bil aleasă, a cărei arie sau mărime
să fie direct proporţională cu volu-
mul investiţiilor străine din judeţul
respectiv. În figura alăturată
este reprezentată grafic cartograma
investiţiilor din judeţele României
ı̂n anul 2011.
(Sursa: https://www.gandul.info) Figura 1.8: Investiţiile din România ı̂n anul 2011
1.5. Teme de control 25
1.5 Teme de control

P1. Daţi cinci exemple de populaţii statistice a căror cercetare ar prezenta interes şi pentru fiecare
populaţie selectată precizaţi:
− denumirea populaţiei, a unităţii statistice şi volumul acesteia;

− scopul cercetării statistice;
− variabilele statistice ı̂n raport cu care s-ar face observarea statistică a populaţiei.
P2. Să se extragă din Anuarul Statistic sau alte surse informaţionale o serie statistică bidimensională
ce redă distribuţia unei populaţii ı̂n raport cu două variabile atributive, relativ la care se cere:
1. denumirea populaţiei ce a fost supusă observării şi volumul acesteia;

2. unitatea statistică;
3. caracterizarea variabilelor statistice ı̂n raport cu care a fost studiată populaţia;
4. caracterizarea seriei statistice ı̂n raport cu toate criteriile cunoscute;
5. elaborarea seriei bidimensionale formată cu frecvenţe relative, interpretare;
6. extragerea repartiţiilor unidimensionale marginale şi a celor condiţionate;
7. pornind de la o repartiţie marginală deduceţi celelalte serii statistice posibile, interpretare.
P3. Din Anuarul Statistic sau alte surse informaţionale extrageţi o serie statistică de repartiţie, având
la bază o variabilă de spaţiu, relativ la care se cere:
1. denumirea populaţiei statistice şi volumului ei;

2. unitatea statistică;
3. caracterizarea seriei după toate criteriile cunoscute;
4. deducerea seriei formată cu frecvenţe relative;
5. interpretare.
P4. Din Anuarul Statistic sau alte surse informaţionale extrageţi două serii cronologice având la bază
indicatorul de nivel, una de momente, alta de intervale şi deduceţi seriile formate cu diferenţe
absolute, indici statistici, diferenţe relative, cu bază fixă şi cu bază ı̂n lanţ (interpretări).
P5. Dati cinci exemple de serii cronologice având la bază indicatorul relativ de intensitate.
P6. Din Anuarul Statistic sau alte surse informaţionale extrageţi o serie de spaţiu formată cu indica-
tor de nivel sau indicator relativ de intensitate şi deduceţi seriile formate cu diferenţe absolute,
indici şi diferenţe relative, calculate cu bază fixă. Interpretare.
P7. Extrageţi cinci exemple de serii de spaţiu ce conţin informaţii importante pentru domeniul
economic.
P8. Luând ca exemplu o populaţie statistică studiată ı̂n raport cu un anumit număr de variabile
(stabilite ı̂n raport cu obiectivul studiului), se cere:
1. elaborarea tuturor seriilor statistice de repartiţie unidimensionale

2. elaborarea a trei serii statistice de repartiţie bidimensionale (una care are la bază două
variabile calitative, una care are la bază o variabilă calitativă şi o variabilă cantitativă,
respectiv una care are la bază două variabile cantitative)
3. reprezentarea grafică a: histogramei, poligonului frecvenţelor, cercului de structură, diagra-

mei cu benzi sau coloane, norul statistic, cronograma şi cartograma.
Bibliografie:
1. Buiga A., Metodologie de sondaj şi analiza datelor ı̂n studiile de piaţă, Ed. Presa Universitară
Clujeană, Cluj-Napoca, 2001;
2. Buiga A., Dragoş C., Lazăr D., Parpucea I., Todea A., Statistică I, Ed. Presa Universitară
4. Florea I., Parpucea I., Buiga A., Statistică descriptivă, Ed. Continental, Cluj-Napoca, 1998.
Capitolul 2
Parametrii repartiţiilor
unidimensionale
Secţiuni
2.1. Parametrii tendinţei centrale
2.2. Parametrii de structură
2.3. Parametrii variaţiei
2.4. Parametrii formei
2.5. Parametrii concentrării
Obiective
• Cunoaşterea şi ı̂nţelegerea modului de calcul şi a semnificaţiei parametrilor statistici
• Ilustrarea trăsăturilor esenţiale care caracterizează fenomenele social-economice
• Cunoaşterea şi măsurarea variaţiei unei mărimi ı̂n raport cu nivelul mediu al acesteia
Cuvinte cheie
• valoare medie, valoare mediană, valoare modală
• quantilă, quartilă, decilă, centilă
• variaţie, dispersie, abatere medie pătratică
• asimetrie, boltire
• energie informaţională
Cunoaşterea modului de calcul şi a semnificaţiei parametrilor tendinţei centrale, a gradului de
reprezentativitate a mediei, respectiv a medianei, analiza structurii unei populaţii şi formularea unei
concluzii privind forma distribuţiei unei populaţii.
27
28 Capitolul 2. Parametrii repartiţiilor unidimensionale
2.1 Parametrii tendinţei centrale

Parametrii din această grupă au menirea de a evidenţia poziţia ı̂n jurul căreia se grupează ansamblul
valorilor unei variabile X de la baza unei serii. Această poziţie exprimată printr-un număr se numeşte
poziţie centrală. Ea poate fi evidenţiată prin:
− valoarea medie (notată M (X) sau X);
− valoarea mediană (notată Me );
− valoarea modală (notată Mo ).
v Valoarea medie
Valoarea medie reprezintă principalul parametru care caracterizează tendinţa centrală a unei
repartiţii statistice.
În vederea definirii parametrului valoarea medie se consideră o populaţie statistică studiată ı̂n
raport cu variabila cantitativă X şi o funcţie G(x1 , x2 , . . . , xR ) unde xi , i = 1, R , reprezintă stările
variabilei X. Funcţia G exprimă o anumită ı̂nsuşire esenţială, un atribut al populaţiei ı̂n raport cu
variabila X. Această funcţie se numeşte funcţie determinantă.
Prin definiţie, valoarea medie X a variabilei X este parametrul care lasă invariantă funcţia deter-
minantă, adică:
G(x1 , x2 , . . . , xR ) = G(X, X, . . . , X) (2.1)

Această egalitate se ı̂ntâlneşte sub denumirea de relaţia lui Boiarski-Kisini. În funcţie de forma
analitică a funcţiei G, din relaţia (2.1) se deduce expresia analitică (indicatorul) de calcul al valorii
medii X.
Determinarea, pe această cale, a valorii medii X, este destul de anevoioasă. Utilizarea acesteia
presupune stabilirea conţinutului (semnificaţiei) şi a formei analitice a funcţiei determinante G, pentru
fiecare caz ı̂n parte. Dar, valoarea medie X poate fi definită ca un raport a două mărimi din care se
deduce aceeaşi expresie pentru X ca şi din (2.1).
Există, aşadar, două modalităţi echivalente de definire a valorii medii, criteriul relaţiei determinante
a lui Boiarski-Kisini şi criteriul raportului, ultima fiind mai accesibilă. Criteriul raportului presupune
raportarea volumului fenomenului cercetat la volumul populaţiei. Acesta presupune cuantificarea
volumului fenomenului ı̂n funcţie de natura lui. Pentru a exemplifica cele prezentate mai sus, se
consideră populaţia familiilor dintr-o localitate, cercetata ı̂n raport cu numărul de copii. Datele
rezultate din observare se prezintă ca o serie de repartiţie de forma:

x1 x2 . . . x R
X:
N1 N2 . . . NR
În acest caz, funcţia determinantă are următoarea formă:

R
X
G(x1 , x2 , . . . , xR ) = xi · Ni
i=1
semnificând numărul total de copii din localitatea respectivă. Pentru a găsi numărul mediu de copii
pe familie se particularizează relaţia (2.1) după cum urmează
R
X R
X
xi · Ni = X · Ni
i=1 i=1
2.1. Parametrii tendinţei centrale 29
de unde rezultă:
R
X
xi · Ni
i=1
X= R
X
Ni
i=1
La acelaşi rezultat se putea ajunge pornind de la faptul că numărul mediu de copii pe familie se
poate exprima ca un raport ı̂ntre numărul total de copii şi numărul de familii din localitatea respectivă,
adică:
N r. total de copii
X= (2.2)
N r. de f amilii
În acest exemplu, fenomenul fiind de natură demografică, volumul acestuia se cuantifică prin
numărul total de copii la nivelul populaţiei statistice considerate. Aceasta este ı̂n directă concordanţă
cu natura şi semnificaţia variabilei ı̂n raport cu care se face cercetarea statistică.
Cunoaşterea ”naturii” parametrului valoare medie, conduce la o definiţie mai completă şi plină de
semnificaţie.
Pentru a ı̂nţelege semnificaţia valorii medii X, trebuie subliniat faptul că, ı̂n general, variaţia unui
fenomen, de orice natură, şi ı̂n particular variaţia unei variabile X ı̂n raport cu care este cercetată
o populaţie, este determinată de acţiunea simultană a două categorii de factori: factori esenţiali şi
factori neesenţiali.
În categoria factorilor esenţiali intră acei factori care acţionează asupra tuturor unităţilor populaţiei
ı̂n mod continuu şi ı̂n acelaşi sens, determinând, ı̂n principal, nivelul de dezvoltare a variabilei pentru
fiecare unitate componentă din populaţie.
Factorii esenţiali se conjugă ı̂n acţiunea lor cu factorii neesenţiali, care, ı̂n general, au un caracter
aleator, sunt numeroşi şi neuniform raspândiţi printre unităţile populaţiei.
Fiecare din factorii consideraţi neesenţiali acţionează numai asupra unui anumit număr de unităţi
din populaţie. Ca urmare, aceştia pot contribui fie la creşterea nivelului variabilei (pentru unele unităţi
din populaţie), fie la scăderea nivelului variabilei (pentru alte unităţi din populaţie).
La rândul lor factorii esenţiali nu acţionează cu aceeaşi intensitate asupra tuturor unităţilor din
cadrul populaţiei considerate, determinând, ı̂n acest fel, variaţia neuniformă a variabilei respective ı̂n
cadrul populaţiei.
În consens cu cele subliniate mai sus, se poate afirma că parametrul valoarea medie a unei serii
statistice care are la bază variabila X, constituie acel nivel pe care l-ar putea ı̂nregistra variabila ı̂n
cadrul populaţiei cercetate ı̂n condiţiile ı̂n care factorii neesenţiali nu s-ar fi manifestat, iar factorii
esenţiali ar fi acţionat asupra unităţilor din populaţie cu aceeaşi intensitate.
Parametrul valoarea medie, calculat pentru o serie statistică, pune ı̂n evidenţă ceea ce este comun,
general şi esenţial sub aspectul nivelului de dezvoltare al variabilei, ı̂n raport cu care este studiată o
populaţie.
În raport cu natura variabilei ce stă la baza seriei, cât şi a formei de prezentare a indicatorilor cu
care aceasta este construită, există mai multe posibilităţi de calcul a valorii medii.
Funcţia determinata G, sub forma sa cea mai generală, are următoarea expresie analitică:
R
X 1
k
G(x1 , x2 , . . . , xR ) = xki · fi (2.3)
i=1
Pentru diverse valori ale lui k, ı̂n strictă concordanţă cu conţinutul şi semnificaţia functi̧ei G, se
ı̂ntâlnesc mai multe tipuri de medii:
− media armonică (k = −1);
− media aritmetică (k = 1);
− media pătratică (k = 2);
− media cubică (k = 3);
− media de ordinul k ı̂n general.
În caz concret, valoarea medie reală X este aceea care se obţine prin indicatorul (mediu) rezultat
fie prin aplicarea criteriului relaţiei determinante, fie criteriului raportului.
Modalităţi de calcul a valorii medii
1. Media aritmetică
Acesta este indicatorul cel mai utilizat ı̂n calculul parametrului valoare medie a unei serii statistice,
aşa cum rezultă din practica statistică.
Pentru o serie statistică de distribuţie cu frecvenţe absolute

x1 x2 . . . xi . . . xR
X:
N1 N2 . . . Ni . . . NR
valoarea medie este:

R
X
xi · Ni
i=1
X= R
(2.4)
X
Ni
i=1
ı̂n timp ce pentru o serie statistică de distribuţie cu frecvenţe relative

x1 x2 . . . xi . . . xR
X:
f1 f2 . . . fi . . . fR

R
X
X= xi · fi (2.5)
i=1
Pentru o serie statistică continuă de distribuţie cu frecvenţe absolute

[x1 , x2 ) [x2 , x3 ) . . . [xi , xi+1 ) . . . [xR , xR+1 ]
X:
N1 N2 ... Ni ... NR

R
X
mi · Ni
i=1
X= R
(2.6)
X
Ni
i=1
xi + xi+1
unde mi = , i = 1, R, este mijlocul intervalului i.
2
În mod analog, pentru o serie statistică continuă de distribuţie cu frecvenţe relative

[x1 , x2 ) [x2 , x3 ) . . . [xi , xi+1 ) . . . [xR , xR+1 ]
X:
f1 f2 ... fi ... fR

R
X
X= mi · fi (2.7)
i=1
2. Media armonică
Considerăm o serie de forma

x1 x2 . . . xi . . . xR
X: (2.8)
N1 N2 . . . Ni . . . NR
În cazul unei serii discrete de forma (2.8), media armonică notată cu X −1 se defineste prin:
R
X
Ni
i=1
X −1 = R
(2.9)
X 1
· Ni
xi
i=1
numită şi formula mediei armonice ponderate.

Dacă ponderile sunt egale ı̂ntre ele, adică N1 = N2 = . . . = NR = N ∗ , atunci relatia (2.9) devine:
R
X
N∗
i=1 R
X −1 = R
= R
(2.10)
X 1 X 1
· N∗
xi xi
i=1 i=1
care reprezintă formula mediei armonice simple.

În cazul unei serii care are la bază o variabilă continuă X, respectiv,

[x1 , x2 ) [x2 , x3 ) . . . [xi , xi+1 ) . . . [xR , xR+1 ]
X:
N1 N2 ... Ni ... NR
procedând ca la media aritmetică, pentru media armonică rezultă:

R
X
Ni
i=1
X −1 = R
(2.11)
X 1
· Ni
mi
i=1
unde mi reprezintă mijlocul intervalului i, i = 1, R.

Şi ı̂n acest caz, dacă ponderile sunt egale, se obţine relaţia de calcul a mediei armonice simple, de
forma:
R
X −1 = R (2.12)
X 1
mi
i=1
3. Media geometrică
Pentru o serie care are la bază variabila discretă X, formată cu frecvenţe absolute, media geometrică
notată cu Xg (sau Xo ) este definită prin expresia:
q
NR
xN N2
N
1 · x2 · . . . · xR
1
Xg = (2.13)
Din relaţia (2.13) pentru media geometrică ponderată exprimată cu frecvenţe relative se deduce:
q R
Y 1 R Ni R
N
xfi i
NR Ni
Y Y
N1
N N2
Xg = x1 · x2 · . . . · xR = xi = xiN = (2.14)
i=1 i=1 i=1
Dacă variabila X, de la baza seriei este de variaţie continuă, atunci relaţiile de calcul pentru diversele
variante de medie geometrică, rămân valabile cu singura modificare că valorile xi , i = 1, R, se ı̂nlocuiesc
cu mijloacele intervalelor de variaţie, calculate conform formulei:
xi + xi+1
mi = , i = 1, R. (2.15)
2
v Valoarea mediană
Valoarea mediană, notată cu Me este acea valoare a variabilei cantitative X care ı̂mparte repartiţia
ı̂n două parţi egale, respectiv:
N N
FN (Me ) = sau N (Me ) = (2.16)
2 2
Calculul valorii mediane se face diferenţiat, după cum seria are la bază o variabilă discretă sau continuă.
Pentru o repartiţie discretă, calculul medianei nu implică probleme deosebite şi nici un volum mare
de calcule.
Se consideră o repartiţie cu frecvenţe absolute:

x1 x2 . . . xi . . . xR
X:
N1 N2 . . . Ni . . . NR
În calculul valorii mediane a unei serii discrete, pot apărea două situaţii:
a) volumul N al populaţiei este un număr impar;
b) volumul N al populaţiei este un număr par.
În ambele cazuri, calculul medianei presupune, ı̂n prima fază, determinarea rangului medianei,
notat cu rMe , conform următoarei relaţii:
R
1 X
rMe = · Ni = N (Me ) (2.17)
2
i=1
a) Daca volumul populaţiei N este un număr impar, rangul medianei este un număr zecimal a
cărui parte ı̂ntreagă N2 indică numărul de unităţi din populaţie pentru care variabila X a ı̂nregistrat

valori
N
mai mici ca mediana. Ca urmare, Me trebuie să fie valoarea imediat următoare celei de rang
2 adică:
Me = x N (2.18)
2
+1
b) Daca volumul populaţiei este un număr par, rangul medianei este un număr ı̂ntreg şi ca urmare
la mijlocul seriei nu se mai află o valoare a variabilei X cu care să coincidă mediana, ci se găsesc
două valori, mediana calculându-se ı̂n acest caz ca medie aritmetică a acestora. Relaţia de calcul a
medianei, ı̂n acest caz, este:
x N + x N
2 2
+1
Me = (2.19)
2
Pentru o repartiţie continuă, calculul valorii mediane presupune verificarea egalităţii (2.16) şi ca
urmare, trebuie cunoscută densitatea de repartiţie f (x). Determinarea funcţiei f (x) implică un volum
mare de calcule şi deci, din acest motiv, ı̂n activitatea practică f (x) este aproximat. Acest lucru
va conduce la o expresie aproximativă de calcul a valorii mediane, care necesită un volum redus de
calcule.
Să considerăm o repartiţie continuă ı̂n raport cu variabila X, şi anume:

[x1 , x2 ) [x2 , x3 ) . . . [xi , xi+1 ) . . . [xR , xR+1 ]
X:
N1 N2 ... Ni ... NR
unde intervalele [xi , xi+1 ), i = 1, R, pot fi de lungime egală sau neegală. Calcularea rangului medianei
va permite stabilirea intervalului ı̂n care se află valoarea mediană, interval numit şi interval median.
Se cumulează frecvenţele absolute din aproape ı̂n aproape până ce este ı̂ndeplinită inegalitatea:
N
N1 + N2 + . . . + Ni ≥
2
Ultima frecvenţă Ni cumulată, ne permite să indicăm intervalul median [xi , xi+1 ).
Formula aproximativă de calcul a medianei este:
N (Me ) − N (xi−1 )
Me = x i + · (xi+1 − xi ) (2.20)
Ni
v Valoarea modală
Valoarea modală Mo (X) a unei repartiţii reprezintă aceea valoare a variabilei X căreia ı̂i corespunde
frecvenţa cea mai mare.
Acest parametru se mai numeşte modul, valoare dominantă sau modă şi se notează cu Mo .
Mod de calcul:
a) Pentru o serie de repartiţie discretă, dată sub forma

x1 x2 . . . xi . . . xR
X:
f1 f2 . . . fi . . . fR
valoarea modală se citeşte direct din serie, nefiind nevoie de nicio tehnică sau formulă de calcul. În
cazul acestui tip de serie, valoarea modală va fi acea valoare a variabilei X pentru care frecvenţa este
cea mai mare.
b) Pentru serii de repartiţie continue, respectiv:

[x1 , x2 ) [x2 , x3 ) . . . [xi , xi+1 ) . . . [xR , xR+1 ]
X:
N1 N2 ... Ni ... NR
modala nu poate fi determinată direct.

Intervalul căruia i corespunde frecvena̧ cea mai mare, se numeşte interval modal şi va conţine
modala. Să presupunem că intervalul modal este [xi , xi+1 ).
Formula de calcul a modalei este:
Ni − Ni−1
M o = xi + · (xi+1 − xi ) (2.21)
(Ni − Ni−1 ) + (Ni − Ni+1 )
O serie poate avea o singură valoare modală, caz ı̂n care seria se numeşte serie unimodală. Dacă o
serie are mai multe valori modale, atunci se numeşte serie plurimodală. O serie plurimodală evidenţiază
faptul că populaţia ı̂n cauză este neomogenă. Calculul valorii modale, ı̂n asemenea cazuri, presupune
o delimitare mai riguroasă a obiectului observării cât şi a populaţiei care urmează să fie studiată. O
altă cale, care poate duce la eliminarea unui asemenea neajuns, o constituie comasarea a două câte
două sau trei câte trei intervale, etc., până se ajunge la o serie unimodală.
În cazul unei serii simetrice valoarea modală coincide cu valoarea medie şi cu mediana. Pentru
serii uşor asimetrice, K. Pearson a stabilit următoarea relaţie ı̂ntre cei trei parametri:
Mo = X − 3(X − Me )
unde X este media aritmetică a variabilei X.

Calculul valorii modale reprezintă un deosebit interes pentru activitatea practică. Având ı̂n vedere
semnificaţia acestui parametru − indică acea valoare a variabilei ı̂nregistrată de cele mai multe unităţi
din populaţie − se poate afla: ora la care sunt solicitate cele mai multe convorbiri telefonice, ora de
vârf privind transportul ı̂n comun, mărimea cea mai solicitată la ı̂ncălţăminte, etc.
Dacă valoarea modală este identică cu valoarea medie, atunci se poate afirma că valoarea medie
se bucură de o mai mare reprezentativitate.
Dacă, ı̂n plus, avem Me = Mo = X, ţinând seama că valoarea mediană nu este influenţată de
valorile extreme ale variabilei, se poate afirma că mediana reprezintă un grad de reprezentativitate
mai mare decât valoarea medie.
- Aplicaţie. Numărul vizitatorilor unui muzeu, ı̂n mai multe zile consecutive ale unei luni, a fost:
12, 13, 32, 24, 31, 15, 17, 11, 42, 44, 19, 33, 15.
a) Identificaţi populaţia statistică, unitatea statistică şi volumul populaţiei statistice;
b) Calculaţi şi interpretaţi parametrii tendinţei centrale.
Rezolvare. a) Pentru ı̂nceput, să remarcăm faptul că valorile date ı̂n enunţul problemei sunt aferente
unei variabile statistice care indică numărul de vizitatori.
Populaţia statistică este reprezentată de mulţimea zilelor, unitatea statistică este ziua, iar volumul
populaţiei statistice este 13 (avem 13 valori ı̂n enunţul problemei, fiecare valoare fiind ı̂nregistrată
ı̂ntr-o anumită zi).
b) Fie X variabila care indică numărul de vizitatori.
Valoarea medie pentru X este :
12 + 13 + 32 + 24 + 31 + 15 + 17 + 11 + 42 + 44 + 19 + 33 + 15
X= = 23, 69.
13
În fiecare zi, numărul mediu de vizitatori ai muzeului a fost de 24 persoane.

Pentru a calcula valoarea mediană, ordonăm crescător şirul valorilor lui X:
11, 12, 13, 15, 15, 17, 19, 24, 31, 32, 33, 42, 44.
N 13
Calculăm rangul medianei RMe = 2 = 2 = 6, 5. Valoarea medianei este:
Me = x[rMe ]+1 = x[6,5]+1 = x7 = 19.
În jumătate din zile, numărul vizitatorilor a fost ı̂ntre 11 şi 19 persoane, ı̂n timp ce ı̂n restul zilelor,
muzeul a avut ı̂ntre 19 şi 44 vizitatori.
Pentru a calcula valoarea modală, căutăm valorile lui X care au frecvenţa de apariţie cea mai mare.
Observăm ca valoarea 15 apare de două ori, ı̂n timp ce restul valorilor au frecvenţa 1. Deci valoarea
modală este Mo = 15. În majoritatea zilelor, muzeul a avut 15 vizitatori.
- Aplicaţie. Distribuţia salariaţilor unei firme ı̂n funcţie de salariul lunar (sute lei) este redată ı̂n
seria statistică de mai jos:

[10, 20) [20, 40) [40, 80) [80, 100]
S: , 24
3 7 11 3
a) Caracterizaţi variabila statistică de la baza seriei de mai sus;
b) Calculaţi şi interpretaţi parametrii tendinţei centrale.
Rezolvare. a) Variabila statistică S, aflată la baza seriei din enunţul problemei, este o variabilă
atributivă, cantitativă, continuă, având ca valori intervalele de salar lunar ale salariaţilor firmei.
b) Pentru a determina valoarea medie, vom calcula mai intâi mijloacele intervalelor din seria de
salarii. Pentru un interval [a, b), mijlocul se obţine cu formula m = a+b 2 . Avem:
15 30 60 90
!
S : [10, 20) [20, 40) [40, 80) [80, 100] , 24
3 7 11 3
Valoarea medie este:
15 · 3 + 30 · 7 + 60 · 11 + 90 · 3
X= = 49, 37.
24
Fiecare angajat al firmei obţine lunar un venit mediu de 4937 lei.
Pentru a calcula valoarea mediană, parcurgem următoarele etape:
• calculăm rangul medianei: rM e = N2 = 24
2 = 12.
• căutăm frecvenţa Ni pentru care
N1 + N2 + . . . + Ni ≥ rMe . (2.22)
În cazul nostru, verificăm succesiv:
3 ≥ 12, fals
3 + 7 ≥ 12, fals
3 + 7 + 11 ≥ 12, adevărat
Deci, Ni = 11, adică este ultima frecvenţă pe care am adăugat-o ca să obţinem inegalitatea (2.22)
adevărată.
• Cu Ni astfel găsit, identificăm intervalul median.

În cazul nostru, frecvenţa Ni = 11 corespunde intervalului [40, 80). Deci Me ∈ [40, 80). Intervalul
[40, 80) se numeşte interval median.
• Calculăm valoarea medianei. Dacă Me ∈ [a, b) atunci
rMe − (N1 + N2 + . . . + Ni−1 )
Me = a + · (b − a).
Ni
În cazul nostru, Me ∈ [40, 80), deci

12 − (3 + 7)
Me = 40 + · (80 − 40) = 47, 27.
11
Deducem că 50% din angajaţii firmei au un venit lunar cuprins ı̂ntre 1000 şi 4727 lei, ı̂n timp ce restul
angajaţilor au un venit lunar cuprins ı̂ntre 4727 şi 10000 lei.
Pentru determinarea valorii modale, identificăm mai ı̂ntâi frecvenţa Ni maximă. Aceasta ne va indica
intervalul modal.
În cazul nostru Ni = 11 este cea mai mare frecvenţa dintre frecvenţele absolute ale seriei S. Deci
intervalul modal este [40, 80)
Găsim valoarea modală Mo ∈ [a, b) aplicând următoarea formulă:
(Ni − Ni−1 )
Mo = a + · (b − a).
(Ni − Ni−1 ) + (Ni − Ni+1 )
În cazul nostru, Mo ∈ [40, 80), deci

(11 − 7)
Mo = 40 + · (80 − 40) = 53, 33.
(11 − 7) + (11 − 3)
Majoritatea salariaţilor firmei au un venit lunar de 5333 lei.
2.2 Parametrii de structură
Frecvente sunt cazurile când este necesară studierea structurii unei populaţii ı̂n raport cu o variabilă
sau alta. Parametrii statistici, ı̂n forma cea mai generală, folosiţi ı̂n caracterizarea structurii unei
populaţii poartă denumirea de valori quantile.
Valorile quantile ale unei serii de repartiţie unidimensionale sunt acele mărimi ı̂nregistrate de
variabila X, care ı̂mpart seria ı̂n n părţi egale (mai precis ı̂mparte populaţia ı̂n n părţi egale). În acest
caz se vor calcula p quantile (p = n − 1).
Pentru o serie continuă, a cărei densitate de probabilitate f (x) este cunoscută, următoarea egalitate
este satisfăcută de cele p quantile:
Z q1 Z q2 Z xn
1
f (x)dx = f (x)dx = . . . = f (x)dx = (2.23)
x1 q1 qn−1 n
unde cele n − 1 quantile s-au notat cu q1 , q2 ,. . ., qn−1 .

Relatia (2.23) se particularizează pentru cazul seriilor discrete, când seria este construită cu
frecvenţe relative:
q1 q2 xn
X X X 1
fi = fi = . . . = fi = (2.24)
x q q
n
1 1 n−1
2.2. Parametrii de structură 37
Pentru o serie oarecare, quantila de ordinul p poate fi definită astfel:

1 N
FN (qp ) = p · sau N (qp ) = p · , pentru orice p = 1, n − 1
n n
Modul de calcul al valorilor quantile diferă ı̂n raport cu tipul seriei.
Fie o serie de repartiţie, care are la bază o variabilă X discretă, de următoarea formă:

x1 x2 . . . xi . . . xR
X:
N1 N2 . . . Ni . . . NR
Pentru calculul valorii quantile de ordinul p (p = 1, n − 1), ı̂n prima etapă trebuie determinat rangul
acesteia:
N
rqp = N (qp ) = p · (2.25)
n
Se disting două cazuri:
a) dacă p · N se divide cu n atunci quantila de ordin p se calculează ca o medie aritmetică simplă
a valorilor variabilei X, de ordinul rangului şi al rangului majorat cu o unitate, după cum urmează:
xrqp + xrqp +1
qp = (2.26)
2
b) dacă p · N nu se divide cu n atunci quantila de ordin p este egală cu acea valoare a variabilei X
corespunzătoare părţii ı̂ntregi a rangului majorat cu 1:
qp = xrqp +1 (2.27)
În cazul seriilor care au la bază o variabilă continuă, conform definiţiei, cele n − 1 quantile trebuie
să satisfacă relaţia (2.23). Determinarea quantilelor din asemenea egalităţi ar presupune cunoaşterea
densităţii de probabilitate f (x). Ori ı̂n activitatea practică f (x) se aproximează prin diverse procedee,
implicând un volum exagerat de calcule.
În vederea găsirii unor formule aproximative de calcul a quantilei de ordin p (p = 1, n − 1) se
consideră o serie de variaţie continuă, ale cărei intervale de variaţie nu trebuie să fie neapărat egale ca
lungime:
[x1 , x2 ) [x2 , x3 ) . . . [xi , xi+1 ) . . . [xR , xR+1 ]
X: (2.28)
N1 N2 ... Ni ... NR
În prima etapă se determină rangul quantilei de ordinul p (p = 1, n − 1) conform următoarei relaţii:
R
1 X
rqp = N (qp ) = p · · Ni (2.29)
n
i=1
Cunoscând rangul, se poate identifica intervalul ı̂n care se află quantila de ordinul p, numit şi intervalul
quantilei de ordinul p (p = 1, n − 1). Cumulând frecvenţele pe clase pâna la egalarea sau depăşirea
rangului, conform inegalităţii:
N1 + N2 + . . . + Ni ≥ rqp (2.30)
ultima frecvenţa adunată Ni va corespunde intervalului [xi , xi+1 ) ı̂n care se află quantila de ordinul p
(p = 1, n − 1). Prin urmare, quantila de ordinul p, notată qp , se calculează conform relaţiei:
rqp − N (xi−1 )
qp = xi + · (xi+1 − xi ) (2.31)
Ni
Procedeul de determinare a quantilei de ordinul p (p = 1, n − 1) este acelaşi şi ı̂n cazul ı̂n care
seria (2.28) este formată din frecvenţe relative.
Caracterizarea structurii unei serii se poate face utilizând diverse cazuri particulare de valori quantile.
Valoarea mediană (Me ) este şi un parametru de structură obţinându-se ca un caz particular de
quantilă, când n = 2. Dacă pentru o serie se cunoaşte Me (quantila de ordinul 2), atunci structura
populaţiei poate fi redată astfel:

xmin − Me Me − xmax
X: (2.32)
50% 50%
semnificând faptul că jumatate din populaţia supusă studiului a ı̂nregistrat pentru variabila X valori
cuprinse ı̂ntre valoarea minimă a lui X şi mediană, iar cealaltă jumătate din populaţie a ı̂nregistrat
pentru X valori cuprinse ı̂ntre mediană şi valoarea maximă a lui X.
Valorile quartile reprezintă acel caz particular al valorilor quantile pentru care n = 4. Cele trei
quartile, care se obţin, notate: Q1 , Q2 şi Q3 sunt acei parametri de structură care ı̂mpart populaţia
ı̂n patru părţi egale.
În raport cu mediana, quartila ı̂ntâi Q1 , se numeşte quartila mică (inferioară), quartila a doua Q2
coincide cu mediana şi se numeşte quartila mijlocie, iar quartila a treia Q3 se numeşte quartila mare
(superioară).
Cunoscându-se cele trei quartile, rezultă următoarea structură a populaţiei ı̂n raport cu variabila X:

xmin − Q1 Q1 − Q2 Q2 − Q3 Q3 − xmax
X: (2.33)
25% 25% 25% 25%
ceea ce semnifică o structurare a populaţiei supusă studiului ı̂n patru părţi egale. Aceasta ı̂nseamnă că
25% din unităţile populaţiei ı̂nregistrează valori pentru variabila X mai mici decât quartila mică, 25%
din unităţile populaţiei ı̂nregistrează valori, ı̂n raport cu aceeaşi variabilă X, cuprinse ı̂ntre quartila
mică şi cea mijlocie, 25% vor avea valori cuprinse ı̂ntre quartila mijlocie şi quartila mare, iar restul
de 25% din unităţile populaţiei vor avea valorile pentru variabila X cuprinse ı̂ntre quartila mare şi
valoarea maximă a lui X.
- Aplicaţie. Se consideră distribuţia unor hoteluri ı̂n funcţie de categoria de confort (număr de
stele):
a) Caracterizaţi structura hotelurilor folosind valorile quartile;
1 2 3 4 5 b) Calculaţi şi interpretaţi prima şi ultima decilă;
X: , 54
12 14 10 15 3 c) Calculaţi şi interpretaţi centila 78.
Rezolvare. a) Quartilele ı̂mpart populaţia statistică ı̂n 4 părti egale. Deci n = 4. Numărul hotelu-
rilor analizate este N = 54.
Rangul quartilei mici este rQ1 = p · N 54
n = 1 · 4 = 13, 5, iar valoarea quartilei mici este
Q1 = x[rq1 ]+1 = x[13,5]+1 = x14 = 2.
N 54
Rangul quartilei mijlocii este rQ2 = p · n =2· 4 = 27, iar valoarea quartilei mijlocii este
xrq2 + xrq2 +1 x27 + x28 3+3

Q2 = = = = 3.
2 2 2
2.3. Parametrii variaţiei 39
N 54
Rangul quartilei mari este rQ3 = p · n =3· 4 = 40, 5, iar valoarea quartilei mari este
Q3 = x[rq3 ]+1 = x[40,5]+1 = x41 = 4.
Avem deci următoarea structură a hotelurilor ı̂n funcţie de categoria de confort:

1−2 2−3 3−4 4−5
X: , 100%
25% 25% 25% 25%
Deducem că 25% din hoteluri au cel mult 2 stele categorie de confort, 50% din hoteluri au ı̂ntre 1 şi
3 stele categorie de confort, iar 75% din hoteluri au cel mult 4 stele categorie de confort.
b) Valorile decile ı̂mpart populaţia statistică ı̂n zece părţi egale, fiecare parte reprezentând 10% din
populaţia statistică. În total, sunt nouă decile, notate de obicei cu d1 , d2 , . . ., d9 .
Rangul primei decile este rd1 = p · N 54
n = 1 · 10 = 5, 4, iar valoarea primei decile este
d1 = x[rd1 ]+1 = x[5,4]+1 = x6 = 1.
Aşadar, 10% din hoteluri au cel mult o stea categorie de confort.

Rangul ultimei decile este rd9 = p · N 54
n = 9 · 10 = 48, 6, iar valoarea ultimei decile este
d9 = x[rd9 ]+1 = x[48,6]+1 = x49 = 4.
Aşadar, 90% din hoteluri au cel mult patru stele categorie de confort.
c) Valorile centile ı̂mpart populaţia statistică ı̂n o sută de părţi egale, fiecare parte reprezentând 1%
din populaţia statistică. În total, sunt 99 de centile, notate de obicei cu c1 , c2 , . . ., c99 .
Rangul centile 78 este rc78 = p · N 54
n = 78 · 100 = 42, 12, iar valoarea centilei 78 este
c78 = x[rc78 ]+1 = x[42,12]+1 = x43 = 4.
Aşadar, 78% din hoteluri au cel mult patru stele categorie de confort.
Observaţie: Avem următoarele egalităţi pentru valoarea mediană: Me = Q2 = d5 = c50 .
2.3 Parametrii variaţiei
Studiul unor populaţii statistice prezintă importanţă numai din punct de vedere al unor mărimi care
variază de la o unitate la alta sau de la un grup de unităţi la altul.
Valorile ı̂nregistrate de o variabilă cantitativă, ı̂n raport cu care este studiată o populaţie, se
datorează acţiunii diferiţilor factori esenţiali şi neesenţiali.
Intensitatea diferită cu care se pot manifesta factorii esenţiali cât şi sensul contrar cu care pot
acţiona factorii neesenţiali ı̂n raport cu fiecare unitate, provoacă nivele diferite ı̂nregistrate de variabile
ı̂n raport cu care este studiată populaţia.
Problema măsurării variaţiei unei variabile cantitative este importantă pentru a vedea ı̂n ce măsură
valoarea medie a acesteia poate reprezenta ı̂ntrega populaţie.
Dacă abaterile de la valoarea medie sunt neesenţiale atunci se poate afirma că populaţia este
omogenă şi că acest parametru poate reprezenta tendinţa centrală, iar dacă aceste abateri sunt mari
atunci populaţia este eterogenă şi valoarea medie nu are capacitatea de a reprezenta populaţia.
Pentru unele serii, valoarea medie nu se poate calcula. În asemenea cazuri, parametrul valoarea
mediăna poate să-i ia locul. Aceeaşi problemă se pune şi ı̂n acest caz, de a vedea ı̂n ce măsură valoarea
mediană este sau nu reprezentativă pentru populaţia ı̂n cauză.
O altă problemă care nu se poate rezolva fără a studia şi măsura variaţia ı̂nregistrată de o variabilă
ı̂n raport cu care este studiată o populaţie, o constituie verificarea de ipoteze. În activitatea practică,
de multe ori pornind de la valorile unor parametrii calculaţi pe baza datelor culese relativ la un număr
mic de unităţi, este necesar a fi extinşi la nivelul ı̂ntregii populaţii sau de a se verifica anumite ipoteze
statistice.
Parametrii variaţiei se pot calcula atât sub formă absolută cât şi relativă, şi măsoară ı̂mpraştierea
valorilor unei variabile cantitative faţă de valoarea medie sau valoarea mediană.
Ca urmare, ı̂n funcţie de elementul de referinţă folosit ı̂n măsurarea variaţiei, deosebim:
- parametrii variaţiei ı̂n raport cu valoarea medie;
- parametrii variaţiei ı̂n raport cu valoarea mediană.
v Parametrii variaţiei ı̂n raport cu valoarea medie
Abaterea medie liniară

Abaterea medie liniară, notată cu dx , reprezintă media aritmetică a abaterilor variabilei X de la
valoarea medie a acesteia, luate ı̂n valoare absolută:
dx = M |X − X| (2.34)
Relaţia (2.34) se particularizează ı̂n:

R
X
|xi − X| · Ni
i=1
dx = R
(2.35)
X
Ni
i=1
Dacă seria are la bază o variabilă continuă şi se cunoaşte f (x), atunci abaterea medie liniară se
calculează astfel: Z xR
dx = |x − X| · f (x)dx (2.36)
x1
Densitatea de probabilitate f (x) se poate aproxima cu densitatea empirică şi atunci pentru abaterea
medie liniară se pot obţine relaţii de calcul aproximativ, frecvent utilizate ı̂n activitatea practică, de
forma:
X R
|mi − X| · Ni R
i=1
X
dx = R
sau dx = |mi − X| · fi (2.37)
i=1
X
Ni
i=1
după cum seria ı̂n cauză este formată cu frecvenţe absolute sau relative, unde:
xi + xi+1
mi = , i = 1, R
2
este mijlocul intervalului i.
Acest parametru serveşte caracterizării sintetice a gradului de reprezentativitate a valorii medii,
aratând cu cât se abate ı̂n medie orice valoare a variabilei X de la valoarea medie X, ı̂ntr-un sens sau
altul.
2.3. Parametrii variaţiei 41
Sub formă relativă, acest indicator poartă denumirea de coeficient simplu de variaţie şi se calculează
conform relaţiei:
dx
Vx = · 100 (2.38)
X
Coeficientul simplu de variaţie (Vx ) arată cu cât se abate ı̂n medie orice valoare a variabilei X de la
valoarea medie echivalentă cu 1 sau 100%. Calculat pentru două serii diferite, se poate aprecia gradul
de reprezentativitate a celor două medii. Se apreciază ca fiind mai reprezentativă acea valoare medie
pentru care coeficientul simplu de variaţie este mai mic.
Parametrul abaterea medie liniară, ı̂n formă absolută sau relativă, prezintă unele deficienţe de-
oarece nu este suficient de sensibil la abaterile mici, adăugându-se şi unele inconveniente de natură
teoretică, generate de exprimarea abaterilor ı̂n valoarea absolută.
Înlăturarea acestor deficienţe se poate realiza apelând la un nou parametru privind măsurarea
variaţiei, numit abatarea medie pătratică.
Abaterea medie pătratică
Acest indicator este utilizat atât pentru caracterizarea gradului de reprezentativitate a valorii medii
cât şi ı̂n scopul estimării unor parametri necunoscuţi.
Abaterea medie pătratică, notată cu σx , se defineşte ca fiind media pătratică a abaterilor valorilor
variabilei X, de la valoarea medie X, adică:
q
σx = M (X − X)2 (2.39)
Un calcul intermediar ı̂n aflarea acestui parametru, ı̂l constituie calcularea pătratului abaterii medii
pătratice, care se numeşte dispersie sau varianţă şi care are următoarea expresie de calcul:
σx2 = M (X − X)2 = D2 (X) (2.40)
V (x) reprezintă o altă notaţie pentru varianţă, pe lângă σx2 .

Varianţa fiind un calcul intermediar ı̂n aflarea abaterii medii pătratice, ı̂n cele ce urmează se va
prezenta modul de calcul al acesteia.
Relaţia de calcul a varianţei se particularizează ı̂n raport cu tipul seriei. În cazul unei serii care
are la bază o variabilă X discretă, conform definiţiei, varianţa are expresia:
R
X
(xi − X)2 · Ni
i=1
σx2 = R
(2.41)
X
Ni
i=1
În cazul unei serii care are la bază o variabilă X continuă, varianţa se calculează conform următoarei
relaţii: Z xR
σx2 = (x − X)2 · f (x)dx (2.42)
x1
a cărei aplicare presupune cunoaşterea densităţii de repartiţie f (x).

Pentru o serie dată, varianţa calculată nu are interpretare, dar dacă se extrage rădăcina pătrată
din aceasta se obţine un număr care se exprimă ı̂n aceleaşi unităţi de măsură ca şi variabila de la
baza seriei. Acest număr (valoare) reprezintă abaterea medie pătratică, simbolizând cu cât se abate
ı̂n medie ı̂n plus sau minus orice valoare xi a variabilei X de la valoarea medie X.
Parametrul abatere medie pătratică se poate exprima şi sub formă relativă, caz ı̂n care se numeşte
coeficientul de variaţie a lui Pearson şi se notează cu Vx . Expresia de calcul este:
σx
Vx = · 100% (2.43)
X
şi reprezintă abaterea medie a oricărei valori a variabilei X de la valoarea medie, considerată egală cu
1 sau 100.
Coeficientul de variaţie a lui Pearson calculat pentru două sau mai multe serii, poate fi folosit ı̂n
aprecieri comparative privind gradul de reprezentativitate a valorii medii calculate.
Deoarece gradul de reprezentativitate a valorii medii este ı̂n raport invers cu mărimea coeficientului
de variaţie a lui Pearson, se poate afirma, ı̂n cazul mai multor serii, că este mai reprezentativă valoarea
medie a acelei serii pentru care Vx este mai mic.
În concluzie, trebuie reţinut că parametrul abatere medie pătratică sub forma absolută σx şi sub
formă relativă Vx sunt indicatori fundamentali utilizaţi ı̂n măsurarea variaţiei unei variabile.
Atât abaterea medie liniară, cât şi abaterea medie pătratică constituie o măsură a variaţiei medii,
primul o medie de ordinul unu, iar al doilea o medie de ordinul doi (dx ≤ σx ).
v Parametrii variaţiei ı̂n raport cu valoarea mediană
Abaterea interquartilă
Abaterea interquartilă, prin definiţie, este media aritmetică simplă a segmentelor Me − Q1 şi
Q3 − Me , respectiv:
Me − Q1 + Q3 − Me Q3 − Q1
Q= = (2.44)
2 2
şi arată cu cât se abat ı̂n medie, ı̂n plus sau ı̂n minus, de la mediană, cele 50% din valorile variabilei
cuprinse ı̂ntre Q1 şi Q3 .
Forma relativă a acestui indicator notat cu Qr este:
Q Q3 − Q1
Qr = · 100% = · 100% (2.45)
Me 2 · Me
Qr se numeşte coeficient de variaţie interquartilic şi arată cu cât se abat ı̂n medie de la mediană
(considerată egală cu 100), valorile variabilei ı̂nregistrate pentru cele 50% din unităţile populaţiei
cuprinse ı̂ntre Q1 şi Q3 .
Ca atare, se apreciază că ı̂mprăştierea unităţilor ı̂n cadrul populaţiei studiate este cu atât mai
mare, ı̂n raport cu variabila de studiat, cu cât abaterea interquartilă ı̂n valoarea absolută (2.44) sau
relativă (2.45) este mai mare.
Abaterea interquantilă
Pentru acest parametru, sub formă absolută, avem:

qn−1 − Me + Me − q1 qn−1 − q1
Q= = (2.46)
2 2
iar sub formă relativă denumită şi coeficient de variaţie interquantilic este:
q qn−1 − q1
Qr = · 100% = · 100% (2.47)
Me 2 · Me
2.4. Parametrii formei 43
Cu cât abaterea interquantilică (relativă sau absolută) este mai mică, cu atât valoarea mediană este
mai reprezentativă.
- Aplicaţie. În decursul unui an, veniturile (mii lei) ı̂nregistrate de mai multe magazine dintr-un
oraş au fost: 50, 45, 22, 13, 20.
a) În ce măsură se abat valorile veniturilor de la venitul mediu ?
b) Este venitul mediu reprezentativ pentru magazinele analizate ?
Rezolvare. Fie X variabila statistică pentru venit. Venitul mediu ı̂nregistrat de fiecare magazin
este:
50 + 45 + 22 + 13 + 20
X= = 30.
5
a) Calculăm dispersia veniturilor:
2 (50 − 30)2 + (45 − 30)2 + (22 − 30)2 + (13 − 30)2 + (20 − 30)2
σX = = 215, 6
5
iar abaterea medie pătratică este:
q p
σX 2 =
= σX 215, 6 = 14, 68.
Deci, veniturile magazinelor se abat de la venitul mediu cu 14, 68 mii lei.

b) Pentru a studia reprezentativitatea venitului mediu, respectiv omogenitatea distribuţiei magazinelor
ı̂n raport cu venitul mediu, calculăm coeficientul de variaţie al lui Pearson:
σX 14, 68
CVX = · 100% = · 100% = 48, 93%
X 30
Deoarece CVX ≥ 30%, deducem că venitul mediu, de 30000 lei, nu este reprezentativ pentru magazinele
analizate.

2.4 Parametrii formei
Din aplicaţiile practice, precum şi din alte surse, s-au constatat că graficele pot avea diverse forme,
dintre care: formă de clopot, forma literei U , J, L sau alte forme. Ceea ce prezintă importanţă,
nefiind surprins de niciun parametru prezentat, ı̂l constituie modul de repartizare a valorilor variabilei
de o parte şi de alta a valorii medii, considerată şi centrul de greutate al seriei. Acest lucru nu
ı̂nseamnă altceva decât evidenţierea acelei curbe care aproximează cel mai bine conturul poligonal al
seriei respective şi ı̂n acelaşi timp o imagine mai clară asupra gradului de reprezentativitate a valorii
medii.
În marea majoritate a cazurilor, distribuţia unităţilor unei populaţii se face după un clopot (după
legea normală a lui Gauss). Dar unităţile nu se distribuie uniform ı̂n jurul valorii medii, ceea ce poate
conduce la ı̂nclinaţii ı̂ntr-o direcţie sau alta a valorii medii. Această distribuire neuniformă poate
conduce la cazul când diferite serii (diferit distribuite ı̂n jurul valorii medii) să aibă aceeaşi medie,
acelaşi σ şi totuşi o curbă să fie mai aplatizată decât cealaltă, simetrică sau mai puţin simetrică.
Evidenţierea acestor diferenţe poate fi realizată cu ajutorul parametrilor formei.
Parametrii formei unei serii de repartiţie, după conţinut, se clasifică ı̂n două grupe:
- parametrii asimetriei;
- parametrii boltirii.
v Parametrii asimetriei
Asimetria unei serii se defineşte ı̂n raport cu dispunerea unităţilor ı̂ntr-o parte sau alta a valorii
medii.
În acest sens, o serie de repartiţie este simetrică ı̂n raport cu media sa dacă frecvenţele valorilor
variabilei X egal depărtate de valoarea medie sunt egale ı̂ntre ele, adică:
f (X − σ) = f (X + σ)
oricare ar fi σ astfel ı̂ncât X − σ şi X + σ să se afle printre valorile lui X.
Coeficientul de asimetrie al lui Fisher
Acest parametru se notează cu α3 , iar expresia sa de calcul este:

M (X − X)3
α3 = 3 (2.48)
σX
sau ı̂ntr-o formă echivalentă:
M (X − X)3
α3 = q (2.49)
(M (X − X)2 )3
Calculând valoarea acestui parametru, ı̂n funcţie de semnul ei, avem următoarele cazuri:
1. α3 = 0, ceea ce ı̂nseamnă că M (X − X)3 = 0, adică suma tuturor abaterilor cu semnul minus este
egală cu suma tuturor abaterilor cu semnul plus, ridicate la puterea a treia. Ca urmare, ı̂n acest caz
se poate spune ca seria este simetrică.
2. α3 > 0, ceea ce ı̂nseamnă că M (X − X)3 > 0. Aceasta ı̂nseamnă că pe total suma abaterilor cu
semnul plus de la valoarea medie este mai mare decât suma abaterilor cu semnul minus şi ca urmare
seria prezintă o asimetrie pozitivă.
3. α3 < 0, deci M (X − X)3 < 0. Aceasta ı̂nseamnă că pe total, suma abaterilor cu semnul minus este
mai mare decât suma abaterilor cu semnul plus de la valoarea medie. O astfel de serie se spune că
reprezintă o asimetrie negativă.
Observaţie: Un alt coeficient utilizat pentru studiul asimetriei distribuţiei valorilor unei variabile
statistice X, este coeficientul de asimetrie al lui Pearson
X − Mo
α= .
σX
Acest coeficient are aceleaşi interpretări ca şi cele ale coeficientului de asimetrie al lui Fisher.
v Parametrii boltirii
Aprecierea boltirii unei serii este utilă ı̂n caracterizarea gradului de reprezentativitate a valorii
medii cât şi pentru compararea reprezentativităţii a două sau mai multe valori medii ce reprezintă
serii diferite.
Parametrul M (X − X)4 oferă o caracterizare numerică sub formă absolută a gradului de boltire
al unei serii. Sub formă relativă, gradul de boltire se măsoară cu parametrul:
M (X − X)4
β4 = 4 (2.50)
σX
2.4. Parametrii formei 45
Pentru a ı̂nţelege semnificaţia boltirii unei serii, se consideră două serii statistice care au la bază
variabilele X şi Y , iar X = Y şi σX = σY .
Mai presupunem, ı̂n plus, că cele două distribuţii au formă de clopot pentru care α3X = α3Y , adica
ambele sunt simetrice. Deşi s-ar părea că cele două serii nu au nimic care să le deosebească, totuşi
reprezentându-le grafic rezultă două curbe de forma:
Figura 2.1: Distribuţii ı̂n formă de clopot pentru

variabilele X şi Y
unde graficul lui X este mai ı̂nalt, iar al lui Y mai plat. Ca urmare, se observă că cele două serii nu
sunt caracterizate de aceeaşi boltire.
Boltirea unei serii este utilă pentru a da o caracetrizare mai exactă reprezentativităţii valorii medii.
În cazul exemplului prezentat mai sus, atât mediile cât şi abaterile medii pătratice sunt egale şi
ca urmare, coeficientul de variaţie al lui Pearson este acelaşi pentru cele două serii. Deci rezultă că
ambele valori medii prezintă acelaşi grad de reprezentativitate. Cu toate acestea, graficele celor două
serii contrazic concluzia dedusă ı̂n urma comparării celor doi coeficienţi de variaţie.
Valoarea medie cea mai reprezentativă este ı̂n seria ı̂n care cele mai multe unităţi ale populaţiei
cercetate au ı̂nregistrat valori mai apropiate de valoarea medie. Pentru o astfel de serie, ı̂mprăştierea
faţă de valoarea medie fiind mică, graficul are o formă mai ascuţită ı̂n cazul seriei X şi mai plată ı̂n
cazul seriei Y .
Nivelul boltirii pentru o serie oarecare dată se măsoară cu ajutorul parametrului β4 , a cărui expresie
de calcul este dată de relaţia (2.50). Valoarea lui β4 pentru o distribuţie normală este egală cu 3. Pentru
orice altă curbă corespunzătoare unei serii date şi aproximată cu un clopot, raportul ı̂ntre momentul
centrat de ordinul patru şi pătratul momentului centrat de ordinul al doilea, este un număr diferit de
3, curba respectivă fiind mai ascuţită sau mai plată decât curba normală a lui Gauss.
Comparând gradul de boltire al unei serii oarecare şi gradul de boltire al clopotului lui Gauss,
Fisher a stabilit următoarea expresie de calcul al coeficientului boltirii, notat cu β40 :
M (X − X)4
β40 = 4 − 3 sau β40 = β4 − 3
σX
expresie cunoscută ı̂n literatura de specialitate sub denumirea de exces al seriei.
Următoarele cazuri sunt semnificative cu privire la aprecierea boltirii unei serii:
- dacă β40 = 0 (adică β4 = 3) atunci seria ı̂n cauză prezintă aceeaşi boltire cu a curbei normale
(excesul este nul);
- dacă β40 > 0 (adică β4 > 3) atunci boltirea corespunzătoare curbei respective este mai ı̂naltă şi
mai ascuţită decât curba normală (serie leptokurtică);
- dacă β40 < 0 (adică β4 < 3) atunci boltirea corespunzătoare curbei respective este mai plată (mai
joasă şi mai largă) decât curba normală (serie platikurtică).
Asimetria şi boltirea joacă un rol ı̂nsemnat ı̂n caracterizarea formei unei serii atributive de repartiţie.
Cu ajutorul parametrilor prezentaţi poate fi formată o imagine mai clară asupra unei serii deja con-
struite, asupra măsurii ı̂n care seria respectivă poate fi reprezentată de valoarea sa medie.
- Aplicaţie. Distribuţia apartamentelor unui imobil, ı̂n raport cu numărul de camere, este redată
ı̂n tabelul de mai jos. Calculaţi şi interpretaţi parametrii formei distribuţiei.
Tip apartament: 1 cameră 2 camere 3 camere

Nr. apartamente: 4 20 6
Rezolvare. Considerăm variabila cantitativă X, care indică numărul de camere. Distribuţia varia-
bilei X este:
1 2 3
X: , 30
4 20 6
1·4+2·20+3·6
Pentru variabila X avem valoarea medie: X = 30 = 2, 066, modala M o = 2, dispersia
2 (1 − 2, 066)2 · 4 + (2 − 2, 066)2 · 20 + (3 − 2, 066)2 · 6

σX = = 0, 3288
30
q
2 =
√
iar abaterea medie pătratică σX = σX 0, 3288 = 0, 5734.
Coeficientul de asimetrie al lui Pearson:
X − Mo 2, 066 − 2
α= = = 0, 1151.
σX 0, 5734
Observăm că α > 0, deci avem o asimetrie pozitivă (de dreapta).

Coeficientul de asimetrie al lui Fisher:
(1−2,066)3 ·4+(2−2,066)3 ·20+(3−2,066)3 ·6
M (X − X)3 30
α3 = 3 = = 0, 0066
σX 0, 57343
Observăm că α3 > 0, deci avem o asimetrie uşor pozitivă (de dreapta).
Coeficientul de boltire al lui Fisher:
(1−2,066)4 ·4+(2−2,066)4 ·20+(3−2,066)4 ·6
M (X − X)4 30
β4 = 4 = = 3, 0008
σX 0, 57344
iar β40 = β4 − 3 = 0, 0008 Observăm că β4 > 0, deci distribuţia este uşor leptokurtică.
0
Observaţie: În cazul aplicaţiei de mai sus, observăm că X = Me = Mo , iar α3 , β4 → 0. În acest caz,
spunem că distribuţia variabilei X urmează legea normală. Distribuţia are forma clopotului lui Gauss.
2.5. Parametrii concentrării 47
2.5 Parametrii concentrării
Energia informaţională
Acest parametru a fost introdus de Acad. Octav Onicescu. Prin definiţie:
R
X
E= fi2 (2.51)
i=1
unde s-a notat cu E energia informaţională. Este un parametru utilizat ı̂n cazul ı̂n care seria are la
bază o variabilă nenumerică.
În cazul unei populaţii caracterizată de un grad de concentrare maxim, va exista o clasă care va
avea frecvenţa relativă egală cu 1, iar celelalte vor avea frecvenţele relative 0 şi ca urmare: Emax = 1.
Dacă populaţia este caracterizată de o concentrare minimă, atunci:

x x . . . xR
X : 11 12
R R . . . R1
iar
1 1
Emax = R · = (2.52)
R2 R
Se observă că:
1
≤E≤1
R
Forma relativă a acestui parametru, notată cu Er , se deduce astfel:
R
X 1
1 fi2 −
E− R
Er = R = i=1
(2.53)
1 1
1− 1−
R R
de unde:
0 ≤ Er ≤ 1
Referitor la populaţia dată, studiată ı̂n raport cu o variabilă X, se calculează Er , iar dacă:
- Er se apropie de 1, atunci populaţia respectivă este caracterizată de un grad ı̂nalt de concentrare;
- Er se apropie de 0, populaţia ı̂n cauză se caracterizează printr-o concentrare minimă.
- Aplicaţie. În urma unui sondaj efectuat la un magazin privind calitatea unui anumit produs, s-au
obţinut următoarele rezultate: 20% din clienţi s-au declarat nesatisfăcuţi de produs, 50% satisfăcuţi,
ı̂n timp ce restul au fost foarte satisfăcuţi. Analizaţi gradul de concentrare al clienţilor ı̂n raport cu
nivelul de calitate al produsului.
Rezolvare. Fie variabila statistică S care indică nivelul de satisfacţie al clienţilor privind calitatea
produsului. În raport cu variabila S, distribuţia clienţilor este:

Nesatisfăcuţi Satisfăcuţi Foarte satisfăcuţi
S: , 100%
20% 50% 30%
Valoarea energiei informaţionale este:
E = (0, 20)2 + (0, 50)2 + (0, 30)2 = 0, 38.

Valoarea energiei relative este:
E − R1 0, 38 − 1
3
Er = 1 = = 0, 07.
1− R 1 − 13
Avem deci un grad minim de concentrare al clienţilor privind calitatea produsului.
2.6 Teme de control

Alegeţi o populaţie statistică observată ı̂n raport cu mai multe variabile. Se cere:
P1. Alegeţi două variabile (una cantitativă, cealaltă calitativă) şi construiţi repartiţia populaţiei ı̂n
raport cu fiecare dintre ele;
P2. Calculaţi şi interpretaţi corespunzător parametrii tendinţei centrale (valoarea medie, mediană,
modală) pentru seria care are la bază variabila cantitativă;
P3. Analizaţi reprezentativitatea parametrilor tendinţei centrale (sub formă absolută şi relativă);
P4. Folosind parametrii de structură analizaţi structura populaţiei ı̂n raport cu variabila cantitativă;
P5. Analizaţi gradul de dispersare al unităţilor populaţiei ı̂n raport cu variabila cantitativă;
P6. Caracterizaţi sintetic concentrarea unităţilor din populaţie folosind variabila nenumerică;
P7. Analizaţi statistic asimetria repartiţiei de la problema P1;
P8. Analizaţi comparativ rezultatele obţinute la problemele P5 şi P6.
Bibliografie:
1. Buiga A., Metodologie de sondaj şi analiza datelor ı̂n studiile de piaţă, Ed. Presa Universitară
4. Florea I., Parpucea I., Buiga A., Statisticıa descriptivă, Ed. Continental, Cluj-Napoca, 1998.
Capitolul 3
Analiza legăturii dintre variabile

statistice
Secţiuni
3.1. Analiza legăturii dintre variabile calitative
3.2. Analiza legăturii dintre variabile ordinale
3.3. Analiza legăturii dintre variabile cantitative
3.4. Funcţii de regresie
Obiective
• Însuşirea conceptelor de corelaţie şi regresie şi utilizarea lor ı̂n economie
• Cunoaşterea posibilităţilor de cuantificare a intensităţii legăturii dintre mărimi economice
• Însuşirea metodelor de stabilire a unei legături funcţionale ı̂ntre variabile
Cuvinte cheie
• Corelaţia dintre variabile, coeficienţi de asociere, coeficient de corelaţie
• Corelaţia rangurilor, coeficienţii lui Kendall şi Spearman
• Metoda celor mai mici pătrate, regresia liniară simplă
• Regresia liniară multiplă, regresii neliniare: hiperbolică, parabolică, exponenţială
După parcurgerea acestui modul se cere studentului să stăpânească noţiunile de corelaţie şi regresie,
să poată identifica existenţa unei eventuale legături ı̂ntre două mărimi. De asemenea, să ştie măsura
intensitatea legăturii dintre variabile, fie ele cantitative sau calitative. Se urmăreşte şi cunoaşterea
metodelor de modelare funcţională a legăturilor.
49
50 Capitolul 3. Analiza legăturii dintre variabile statistice
Ne propunem abordarea unor metode statistice caracteristice studiului seriilor multidimensionale.

Scopul acestora este de a identifica şi utiliza eventualele legături care se pot manifesta ı̂ntre două
sau mai multe variabile. Prezintă interes: existenţa legăturii, intensitatea acesteia, forma funcţională
a legăturii, parametrii şi reprezentativitatea ei privind fenomenul cercetat. Problematica legăturilor
dintre variabile este foarte curent ı̂ntâlnită ı̂n economie. Spunem că salariul unui angajat este ı̂n
funcţie de productivitatea muncii sale, vechimea ı̂n muncă, responsabilitatea activităţii sale, etc; sau
cererea pentru un produs este ı̂n funcţie de preţul produsului, venitul consumatorilor, etc. De fiecare
dată, atât ı̂n teoria economică, cât şi ı̂n aplicaţii se ı̂ntâlneşte expresia: Fie funcţia cererii .... În
realitatea economică ı̂nsă, această funcţie nu se dă, nu se cunoaşte, ci trebuie estimată pornind de la
o bază de date. Această problemă de estimare a unei funcţii şi alte probleme colaterale ei fac obiectul
acestui capitol.
Pentru a putea aborda studiul legăturilor dintre variabile trebuie să ştim ı̂n primul rând dacă există
sau nu o legătură ı̂ntre variabilele studiate (sau ı̂ntre fenomenele pe care acestea le reprezintă) şi care
este natura acestora. Putem clasifica legăturile dinte variabile astfel:
1. Legătura nulă. Semnifică lipsa oricărei legături ı̂ntre două sau mai multe fenomene sau
variabile care cuantifică fenomenele. De exemplu, o legătură nulă se manifestă ı̂ntre ı̂nălţimea unui
angajat şi salariul acestuia sau ı̂ntre produsul intern brut al unei ţări şi vârsta primului ministru. Din
punct de vedere statistic, spunem că ı̂ntre două variabile X şi Y există o legătură nulă, sau nu există
legătură, dacă cov(x, y) = 0.
2. Legătura deterministă. Spunem că ı̂ntre variabilele X şi Y există o legătură deterministă
dacă unei valori a lui X ı̂i corespunde o singură valoare a lui Y . Astfel de legături se ı̂ntâlnesc ı̂n
special ı̂n fizică, unde de exemplu viteza este egală cu distanţa ı̂mpărţită la timp: v = d/t, sau forţa
este egală cu masa ı̂nmulţită cu acceleraţia: F = m · a. Astfel de exemple există şi ı̂n economie, unde
rata profitului este egală cu profitul ı̂mpărţit la cifra de afaceri: tπ = π/C.A. · 100%. Legătura este
deterministă pentru că variabila rπ este perfect determinată de celelalte două: π şi C.A. Adică pentru
o anumită valoare a profitului şi o anumită valoare a cifrei de afaceri nu putem avea decât o singură
valoare a ratei profitului.
3. Legătura statistică. Se mai numeşte şi stocastică sau probabilistă. Este tipul de legătură cel
mai des ı̂ntâlnită ı̂n ştiinţele sociale, deci şi ı̂n economie. Fiecărei valori xi a variabilei X ı̂i corespunde o
distribuţie de valori ale variabilei Y . Matematic, o astfel de legătură se exprimă sub forma y = f (x)+ε,
unde am notat prin ε componenta aleatoare reziduală, datorata acţiunii asupra lui Y a celorlalţi factori
decât X. Deşi s-ar putea spune că prin luarea ı̂n considerare a tuturor factorilor care influenţează va-
riabila Y , legătura este intrinsec deterministă, ı̂n ştiinţele economice vom ı̂ntâlni aproape ı̂ntotdeauna
un număr foarte mare de factori, care nu pot fi identificaţi şi cuantificaţi ı̂n totalitatea lor. Asfel,
funcţia care ı̂l explicitează pe Y are două componente: una determnistă, f (x1 , x2 , . . . , xn ), cuprinzând
variabilele cuantificabile de care depinde Y , şi una aleatoare, ε, cuprinzând variabilele ce nu au putut
fi cuantificate.
Studiul legăturilor dintre variabile s-a dezvoltat ı̂ntr-o disciplină aparte, numită econometrie. În
capitolul de faţă nu ne propunem deci decât o introducere ı̂n această problematică, fără a aborda
elemente de inferenţă statistică specifice acestor legături. În cele ce urmează vom prezenta câteva
aspecte legate de variabile şi fenomenele reprezentate de acestea, probleme atât de natura aparatului
statistic utilizat, cât şi de aplicabilitatea lui ı̂n contextul economic.
Analiza legăturii dintre variabilele unei repartiţii multidimensionale presupune abordarea următoarelor
probleme, care se pot constitui şi ı̂n etape ce trebuie parcurse ı̂n demersul statistic necesar:
1. Organizarea rezultatelor observării populaţiei sau eşantionului ı̂n raport cu variabilele cercetate
2. Analiza statistică a existenţei legăturii

3.1. Analiza legăturii dintre variabile calitative 51
3. Analiza statistică a intensităţii legăturii sau a gradului de asociere dintre variabilele observate
4. Formularea unor ipoteze cu privire la forma matematică a legăturii
5. Estimarea parametrilor funcţiei de regresie
6. Analiza reprezentativităţii funcţiei de regresie
Aceste etape pot fi parcurse integral sau parţial, ı̂n funcţie de natura variabilelor. Pentru variabilele
calitative nu vor fi parcurse (ı̂n statistica descriptivă) decât primele trei, deoarece posibilităţile de
prelucrare sunt mai reduse. În schimb, toate cele şase etape pot fi parcurse ı̂n cazul variabilelor
cantitative.
În scopul utilizării facile a informaţiei culese la nivelul populaţiei sau eşantionului, rezultatele
observării vor fi sistematizate ı̂ntr-o formă convenabilă prelucrării lor. Se preferă de obicei o formă
tabelară a prezentării, care poate sugera unele idei de lucru pentru etapele următoare, prin unele
remarci cu privire la valorile pe care le-au ı̂nregistrat variabilele.
3.1 Analiza legăturii dintre variabile calitative

Considerăm o serie bidimensională care are la baza două variabile calitative X şi Y .
HH X
HH x1 ... xj ... xK T otal
Y H
H
y1 N11 ... N1j ... N1K N1·
.. .. .. .. ..
. . ... . ... . .
yi Ni1 ... Nij ... NiK Ni·
.. .. .. .. ..
. . ... . ... . .
yL NL1 ... NLj ... NLK NL·
T otal N·1 ... N·j ... N·K N
Pentru studiul existenţei legăturii dintre variabile X şi Y , aflate la baza seriei bidimensionale, calculăm
parametrul
L X K
X (Nij − Nij∗ )2
χ2 = (3.1)
Nij∗
i=1 j=1
Ni· · N·j
unde Nij∗ = , i = 1, L, j = 1, K.
N
Distingem două cazuri:
1) Dacă χ2 = 0, atunci nu există legatură ı̂ntre variabile;
2) Dacă χ2 0, atunci există legatură ı̂ntre variabile.
Pentru studiul intensităţii legăturii dintre variabilele X şi Y , calculăm:
Coeficientul de asociere (contingenţă) al lui Pearson
s
χ2
c= (3.2)
N + χ2
unde N este volumul populaţiei.

Interpretări:
1) Dacă c = 0, atunci nu există legătură ı̂ntre variabile (avem legătură nulă);
2) Dacă c ∈ (0; 0, 3), legătura este de intensitate slabă;
3) Dacă c ∈ [0, 3; 0, 7), legătura este de intensitate medie;
4) Dacă c ∈ [0, 7; 1), legătura este de intensitate puternică.
- Aplicaţie. Dintre societăţile comerciale cotate la Bursa de Valori Bucureşti (BVB) s-a ales un
eşantion de 18 societăţi ı̂n raport cu variabilele X - domeniul de activitate şi Y - riscul acţiunilor.
PP Finanţe Alte a) Studiaţi existenţa legăturii dintre do-
PP X
PP Industrie şi bănci domenii
Y PPP meniul de activitate al societăţilor şi ris-
M ic 3 1 7 cul acţiunilor.
b) În cazul existenţei legăturii, precizaţi
M are 2 5 − intensitatea ei.
Rezolvare. a) Calculăm totalurile ı̂n seria bidimensională de mai sus, si obţinem:

PP Finanţe Alte
PP X
PP Industrie şi bănci domenii T otal
Y P P
P
Mic 3 1 7 11
Mare 2 5 − 7
T otal 5 6 7 18
Ni· · N·j
Calculăm frecvenţele absolute teoretice Nij∗ = , i = 1, 2, j = 1, 3 şi găsim:
N
∗ 11 · 5 ∗ 11 · 6 ∗ 11 · 7
N11 = = 3, 06; N12 = = 3, 67; N13 = = 4, 28;
18 18 18
∗ 7·5 ∗ 7·6 ∗ 7·7
N21 = = 1, 94; N22 = = 2, 33; N23 = = 2, 72
18 18 18
iar rezulatele obţinute le trecem ı̂n tabelul de mai jos:
PP Finanţe Alte
PP X
PP Industrie şi bănci domenii T otal
Y P P
P
Mic 3, 06 3, 67 4, 28 11
Mare 1, 94 2, 33 2, 72 7
T otal 5 6 7 18
Calculăm numărul:
2 X
3
X (Nij − Nij∗ )2 (3 − 3, 06)2 (1 − 3, 67)2 (0 − 2, 72)2
χ2 = = + + . . . + = 9, 44.
Nij∗ 3, 06 3, 67 2, 72
i=1 j=1
Deoarece valoarea χ2 0 deducem că există legatură ı̂ntre domeniul de activitate al societăţilor şi
riscul acţiunilor.
3.2. Analiza legăturii dintre variabile ordinale 53
b) Pentru a studia intensitatea legăturii dintre variabilele X şi Y , calculăm coeficientul de contingenţă
(asociere) al lui Pearson:
s r
χ2 9, 44
c= 2
= = 0, 59 ∈ [0, 3; 0, 7)
N +χ 18 + 9, 44
deci avem o legătură de intensitate medie ı̂ntre variabile.

Observaţie: Un alt coeficient care se poate calcula
r pentru a stabili intensitatea legăturii este coeficientul
√ χ2
de contingenţă (asociere) al lui Ciuprov T = ∈ [0, 1]. Acest coeficient are aceleaşi
N· (L−1)(K−1)
interpretari ca şi coeficientul de contingenţă (asociere)
r al lui Pearson.
√ 9,44
În cazul aplicaţiei precedente, avem: T = = 0, 61 ∈ [0, 3; 0, 7) deci, din nou, este
18· (2−1)(3−1)
vorba despre o legătură de intensitate medie ı̂ntre variabile.
3.2 Analiza legăturii dintre variabile ordinale
Variabilele ordinale sunt tot variabile calitative, dar care, ı̂n plus, permit ierarhizări (clasificări) ale
unităţilor statistice. Legătura dintre variabilele ordinale se numeşte corelaţia rangurilor.
Studiul corelaţiei rangurilor se poate realiza prin intermediul următorilor coeficienţi:
v Coeficientul de corelaţie simplă a rangurilor al lui Kendall

Pentru a putea utiliza acest indicator toate unităţile populaţiei trebuie să poată fi ordonate ı̂n raport
cu variabilele pentru care cercetăm intensitatea legăturii. Presupunem că studiem o populaţie de
volum n ı̂n raport cu două variabile.
Pentru a putea construi coeficientul lui Kendall, vom defini mai ı̂ntâi indicatorul de concordanţa
(P ) şi respectiv, indicatorul de discordanţă (Q). Pe baza indicatorilor de concordanţă şi discordanţă
construim coeficientul de corelaţie simplă a rangurilor al lui Kendall, definit astfel:
P −Q
τ= (3.3)
P +Q
În cazul unei legături directe de intensitate maximă, P va lua valoare sa maximă, iar Q pe cea
minimă, adică: P = n(n−1)
2 , iar Q = 0, deci τ = 1.
În cazul unei legături inverse de intensitate maximă, P va lua valoare sa minimă, iar Q pe cea
maximă, adică: P = 0, iar Q = n(n−1) 2 , deci τ = −1.
În cazul lipsei legăturii, P = Q, iar τ = 0.
Putem determina astfel intervalul ı̂n care va fi cuprins τ , respectiv τ ∈ [−1, 1].
Coeficientul de corelaţie simplă a rangurilor al lui Kendall oferă informaţii legate de:
• intensitatea legăturii dintre cele două variabile ordinale:
- Dacă |τ | ∈ (0; 0, 3) legătura este de intensitate slabă;
- Dacă |τ | ∈ [0, 3; 0, 7) legătura este de intensitate medie;
- Dacă |τ | ∈ [0, 7; 1] legătura este de intensitate puternică.
• sensul legăturii dintre cele două variabile ordinale:
- Dacă τ > 0 legătura este directă;
- Dacă τ = 0 legătura este nulă;
- Dacă τ < 0 legătura este inversă.
v Coeficientul de corelaţie a rangurilor al lui Spearman

Ca şi coeficientul propus de Kendall, şi acesta se calculează pornind de la tabelul de concordanţa al
rangurilor. Ne vom folosi de diferenţele di dintre ranguri pentru aceeaşi unitate a populaţiei relativ la
cele două variabile. Coeficientul are următoarea expresie:
n
X
6 d2i
i=1
η =1− (3.4)
n(n2 − 1)
Limitele celor doi coeficienţi sunt aceleaşi, la fel şi interpretările valorilor numerice.
v Coeficientul de corelaţie multiplă a rangurilor al lui Kendall

Presupunem că studiem o populaţie de volum n ı̂n raport cu m variabile, iar unităţile populaţiei
sunt ordonate ı̂n raport ca variabilele pentru care cercetăm existenţa legăturii. Ne vom folosi de
sumele si ale rangurilor pentru aceeaşi unitate a populaţiei relativ la cele m variabile. Coeficientul
are următoarea expresie:
2
σS(efectivă)
K= 2 (3.5)
σS(maximă)
n
m2 (n2 −1)
X
2
unde: σS(efectivă) = 1
n (si − S)2 , iar σS(maximă)
2 = 12 .
i=1
Valorile coeficentului K se regăsesc ı̂n intervalul [0, 1], iar interpretările sunt:
- Dacă K ∈ (0; 0, 3) legătura este de intensitate slabă;
- Dacă K ∈ [0, 3; 0, 7) legătura este de intensitate medie;
- Dacă K ∈ [0, 7; 1] legătura este de intensitate puternică.
- Aplicaţie. Pentu un grup de ţări se cunosc:
- valoarea PIB/locuitor: 9, 5 10, 7 8, 3 7, 9 12, 8

- costul mediu lunar/angajat: 103 100 97 73 85
Caracterizaţi nivelul corelaţiei rangurilor, construind câte un clasament al ţărilor ı̂n raport cu
fiecare variabilă.
Rezolvare. Pentru stabilirea clasamentelor vom considera pe prima poziţie ţara cu cel mai mare
PIB/locuitor, respectiv ţara cu cel mai scăzut cost mediu lunar/angajat.
Obţinem următoarea ierarhie a ţărilor:
3 2 4 5 1
- valoarea PIB/locuitor: 9, 5 10, 7 8, 3 7, 9 12, 8
- costul mediu lunar/angajat: 103 100 97 73 85
5 4 3 1 2
şi tabelul rangurilor unităţilor statistice (ţărilor) ı̂n raport cu cele două variabile, fie aceastea X =
valoarea PIB/locuitor şi Y = costul mediu lunar/angajat
3.2. Analiza legăturii dintre variabile ordinale 55
Ţara T1 T2 T3 T4 T5
rang(X) 3 2 4 5 1 (3.6)
rang(Y ) 5 4 3 1 2
• Dacă dorim să calculăm coeficientul de corelaţie simplă a rangurilor al lui Kendall, atunci ordonăm
crescător valorile şirului rang(X).
rang(X) 1 2 3 4 5
rang(Y ) 2 4 5 3 1
Valoarea factorilor de concordanţă P , respectiv discordanţă Q se obţin din linia rang(Y ), astfel:
Xn
P = pi , unde pi este numărul rangurilor mai mari decât i, situate la dreapta lui i.
i=1
n
X
Q= qi , unde qi este numărul rangurilor mai mici decât i, situate la dreapta lui i.
i=1
Avem P = 3 + 1 + 0 + 0 + 0 = 4, iar Q = 1 + 2 + 2 + 1 + 0 = 6, deci coeficientul de corelaţie simplă
a rangurilor al lui Kendall este:
P −Q 4−6 −2
K= = = = −0, 2
P +Q 4+6 10
Deoarece K < 0 avem o legătură inversă intre PIB/locuitor şi costul mediu lunar/angajat. Adică,
ţările care au un cost mediu lunar/angajat mic, au o valoarea a PIB-ului/locuitor mare.
Pe de altă parte, |K| = 0, 2 ∈ [0; 0, 3), sugerează existenţa unei legături de intensitate slabă ı̂ntre
costul mediu lunar/angajat şi PIB-ul/locuitor.
• Dacă dorim să calculăm coeficientul de corelaţie a rangurilor al lui Spearman, atunci ı̂n tabelul
rangurilor (3.6), calculăm diferenţa rangurilor, di = rang(X) − rang(Y ), pentru fiecare i = 1, 5.
rang(X) 3 2 4 5 1
rang(Y ) 5 4 3 1 2
di −2 −2 1 4 −1
Valoarea coeficientul de corelaţie a rangurilor al lui Spearman este:

n
X
6 d2i
i=1 6 · [(−2)2 + (−2)2 + (1)2 + (4)2 + (−1)2 ]
η =1− =1− = −0, 3
n(n2 − 1) 5 · (52 − 1)
Deducem că avem o legătura inversă, de intensitate slabă ı̂ntre variabilele analizate.
• Dacă dorim să calculăm coeficientul de corelaţie multiplă a rangurilor al lui Kendall (atenţie: acesta
nu oferă informaţii legate de sensul legăturii, ci doar legate de intensitatea ei!), atunci ı̂n tabelul
rangurilor (3.6), calculăm suma rangurilor, si = rang(X) + rang(Y ), pentru fiecare i = 1, 5.
Xm
(Dacă am fi avut m variabile X1 , X2 , . . . , Xm , atunci si = rang(Xk ), pentru i = 1, n).
k=1
rang(X) 3 2 4 5 1
rang(Y ) 5 4 3 1 2
si 8 6 7 6 3
Folosind sumele si , i = 1, 5, construim seria sumelor:

3 6 7 8
S: ,5
1 2 1 1
Avem S = 3·1+6·2+7·1+8·1
5 = 6.
Dispersia efectivă a variabilei S este:
4
2 1X (3 − 6)2 · 1 + (6 − 6)2 · 2 + (7 − 6)2 · 1 + (8 − 6)2 · 1
σS(efectivă) = (si − S)2 · Ni = = 2, 8
n 5
i=1
Pentru m = 2 variabile şi n = 5 ţări, dispersia maximă a variabilei S este:
2 m2 (n2 − 1) 22 · (52 − 1)
σS(maximă) = = =8
12 12
Valoarea coeficientul de corelaţie multiplă a rangurilor al lui Kendall este:
2
σS(efectivă) 2, 8
K= 2 = = 0, 35
σS(maximă) 8
deci, potrivit acestui coeficient, am avem o legătură de intensitate medie ı̂ntre variabile.
3.3 Analiza legăturii dintre variabile cantitative
Dacă dispunem de o repartiţie bidimensională care are la bază variabilele cantitative X şi Y , putem
descompune varianţa totală a variabilei de explicat Y ca sumă a varianţei datorate variabilei explicative
X (varianţa explicită) şi respectiv a varianţei celorlalţi factori (varianţa reziduală), adică:
σY2 = σY2 /X + σY2 /X (3.7)

Vtotală Vexplicită Vreziduală
Dacă nu există legătură, adică X nu are nici o influenţă asupra lui Y , mediile condiţionate Y /X vor
fi identice, iar dispersia lor va fi nulă: σY2 /X = 0.
Putem reţine deci ca regulă de decizie ı̂n statistica descriptivă:
1) Dacă σY2 /X = 0, atunci nu există legătură ı̂ntre variabile;
2) Dacă σY2 /X 0, atunci există legătură ı̂ntre variabile.
Observaţie: Varianţa explicită σY2 /X este cu atât mai mare cu cât mediile condiţionate Y /X sunt mai
diferite ı̂ntre ele. Ceea ce le face să difere este numai influenţa lui X, deoarece am ı̂mpărţit populaţia
ı̂n grupe având ca unic criteriu valorile lui X. Este firesc deci să folosim varianţa explicită ca o mărime
absolută a intensităţii legăturii dintre X şi Y şi ponderea varianţei explicite ı̂n varianţa totală ca o
mărime relativă.
3.3. Analiza legăturii dintre variabile cantitative 57
Pentru a studia intensitatea legăturii dintre variabilele cantitative X şi Y , calculăm:

Raportul de corelaţie: r r
Vexp Vrez
RY X = = 1− (3.8)
Vtot Vtot
sau sub forma lui matematică:
v v
u 2 u
uσ
Y /X
u σY2 /X
RY X = = 1 − (3.9)
t t
σY2 σY2
Pentru a-i găsi limitele ne raportăm la cele două situaţii extreme:

- dacă nu există legătură ı̂ntre X şi Y , mediile condiţionate Y /X sunt egale ı̂ntre ele, deci σY2 /X = 0
şi RY X = 0;
- dacă legătura este de intensitate maximă, nu există influenţe ale altor factori decât X asupra lui
Y , nu există variaţie ı̂n cadrul grupelor, deci σY2 /X = 0 şi RY X = 1.
În consecinţă, raportul de corelaţie aparţine intervalului RY X ∈ [0, 1]. Interpretarea intensităţii
legăturii pe baza acestui coeficient se va face astfel:
- dacă RY X = 0 legătura este nulă;
- dacă RY X ∈ (0; 0, 3) legătura este de intensitate slabă;
- dacă RY X ∈ [0, 3; 0, 7) legătura este de intensitate medie;
- dacă RY X ∈ [0, 7; 1] legătura este de intensitate puternică.
- Aplicaţie. Se consideră distribuţia a 52 de societăţi comerciale cu acelaşi profil de activitate ı̂n

raport cu variabilele: X - cheltuielile cu publicitatea (mii lei) şi Y - volumul vânzărilor (mii lei).
PP a) Verificaţi regula de adunare a varianţelor.

X
3−5 5−7 7−9
PP
P b) Există legătură ı̂ntre variabilele X şi Y ? În caz
Y PP
P
P afirmativ, precizaţi intensitatea legăturii.
20 − 40 14 2 1
c) În ce măsură volumul vânzărilor este influenţat
40 − 60 3 10 5
de cheltuielile cu publicitatea?
60 − 80 2 7 8
d) În care grupă de cheltuieli cu publicitatea, volu-
mul mediu al vânzărilor este mai reprezentativ?
Rezolvare. Pentru ı̂nceput, calculăm totalurile şi mijloacele intervalelor:

PP
X 4 6 8
3−5 5−7 7−9
PP
PP T otal
Y P P
P
30
20 − 40 14 2 1 17
50
40 − 60 3 10 5 18
70
60 − 80 2 7 8 17
T otal 19 19 14 52
a) Regula de adunare a varianţelor pentru Y ı̂n funcţie de X este: σY2 = σY2 /X + σY2 /X
= σY2 .
• Varianţa totală pentru Y este Vtot
30 50 70 30·17+50·18+70·17
Pentru seria lui Y : , 52 avem Y = 52 = 50.
17 18 17
(30−50)2 ·17+(50−50)2 ·18+(70−50)2 ·17

Varianţa totală este: Vtot = σY2 = 52 = 261, 53.
• Varianţa explicită este Vexp = 2
σY /X .
Construim mai ı̂ntâi seria mediilor condiţionate

Y /X∈[3,5] Y /X∈[5,7] Y /X∈[7,9]
Y /X : , 52
19 19 14
Găsim valorile mediilor condiţionate:  
30·14+50·3+70·2 
Y /X∈[3,5] = 19 = 37, 37
  37,37 55,26 60,00 
30·2+50·10+70·7
Y /X∈[5,7] = = 55, 26⇒ Y /X :   , 52
 
19  Y /X∈[3,5] Y /X∈[5,7] Y /X∈[7,9] 
30·1+50·5+70·8 
Y /X∈[7,9] = 14 = 60
19 19 14
Valoarea medie a seriei Y /X este: M (Y /X) = M (Y ) = 50 (aici am folosit o propritate a valorii medii:
proprietatea de adiţiune a mediilor, ı̂nsă media seriei Y /X se poate determina şi prin calcul obişnuit).
Varianţa explicită este:
(37, 37 − 50)2 · 19 + (55, 26 − 50)2 · 19 + (60 − 50)2 · 14
Vexp = σY2 /X = = 95, 34.
52
• Varianţa reziduală este Vrez = σY2 /X .
Construim mai ı̂ntâi seria dispersiilor condiţionate
!
σY2 / σY2 / σY2 /
σY2 /X : X∈[3,5] X∈[5,7] X∈[7,9] , 52
19 19 14
Găsim valorile dispersiilor condiţionate:
(30 − 37, 37)2 · 14 + (50 − 37, 37)2 · 3 + (70 − 37, 37)2 · 2

σY2 /X∈[3,5] = = 177, 28
19
(30 − 55, 26)2 · 2 + (50 − 55, 26)2 · 10 + (70 − 55, 26)2 · 7
σY2 /X∈[5,7] = = 161, 77
19
(30 − 60)2 · 1 + (50 − 60)2 · 5 + (70 − 60)2 · 8
σY2 /X∈[7,9] = = 157, 14
14
 
 177,28 161,77 157,14 
 
Deci, seria dispersiilor condiţionate este: σY2 /X :
 2
 , 52
σY2 / σY2 /

σY / 
X∈[3,5] X∈[5,7] X∈[7,9]
19 19 14
Varianţa reziduală este:
177, 28 · 19 + 161, 77 · 19 + 157, 14 · 14
Vrez = σY2 /X = = 166, 19.
52
Verificăm dacă: Vtot = Vexp + Vrez , adică dacă: 261, 53 = 95, 34 + 166, 19. Observăm că regula de
adunare a varianţelor este verificată.
b) Deoarece Vexp = 95, 34 0, deducem că există legătură ı̂ntre volumul vânzărilor şi cheltuielile cu
publicitatea. Pentru a determina intensitatea legăturii, calculăm raportul de corelaţie:
r r
Vexp 95, 34
RY X = = = 0, 603.
Vtot 261, 53
3.4. Funcţii de regresie 59
Deci RY X ∈ [0, 3; 0, 7), de unde deducem că legătura este de intensitate medie.
c) Calculăm Raportul de determinare:
Vexp 95, 34
RY2 X = · 100% = · 100% = 36, 45%.
Vtot 261, 53
Deci volumul vânzărilor depinde de cheltuielile cu publicitatea ı̂n proporţie de 36, 45%, şi de 100% −
36, 45% = 63, 55% de alţi factori.
d) Calculăm coeficientul de variaţie al lui Pearson pentru volumul vânzărilor ı̂n raport cu fiecare
grupă de cheltuieli. Volumul mediu al vânzărilor va fi mai reprezentativ, pentru grupa de cheltuieli
cu publicitatea care are valoarea coeficientul de variaţie al lui Pearson
minimă.
30 50 70
• Pentru prima grupă de cheltuieli cu publicitatea: G1 = Y /X∈[3,5] : , 19 avem:
14 3 2
q
2
σG
p
σG1 1 177, 28
CVG1 = · 100% = · 100% = · 100% = 35, 63%.
G1 G1 37, 37

30 50 70
• Pentru a doua grupă de cheltuieli cu publicitatea: G2 = Y /X∈[5,7] : , 19 avem:
2 10 7
q
2
σG
p
σG2 2 161, 77
CVG2 = · 100% = · 100% = · 100% = 23, 02%.
G2 G2 55, 26

30 50 70
• Pentru a treia grupă de cheltuieli cu publicitatea: G3 = Y /X∈[7,9] : , 14 avem:
1 5 8
q
2
σG
p
σG3 3 157, 14
CVG3 = · 100% = · 100% = · 100% = 20, 89%.
G3 G3 60
Observăm că cel mai mic coeficient de variaţie al lui Pearson se obţine pentru a treia grupă de cheltuieli
cu publicitatea. Deci, volumul mediu al vânzărilor este mai reprezentativ pentru grupa de cheltuieli
cu publicitatea cuprinse ı̂ntre 7000 − 9000 lei.
3.4 Funcţii de regresie

Dacă ı̂ntre două variabile (ambele cantitative!) se constată existenţa unei legături de o anumită
intensitate, ne punem problema posibilităţii modelării legăturii printr-un model matematic. O primă
etapă ı̂n acest demers este formularea unei ipoteze cât mai verosimile cu privire la forma legăturii.
În acest scop, pe baza tabelului de corelaţie construim norul statistic şi linia poligonală a mediilor
condiţionate ale variabilei dependente.
Figura 3.1: Linia poligonală a mediilor condiţionate
În funcţie de forma liniei frânte obţinute şi a poziţiei punctelor norului faţă de ea se formulează o
ipoteză cu privire la forma funcţiei de regresie. Dacă dorim să studiem o legătură multiplă, respectiv
dependenţa lui Y faţă de variabilele factoriale X1 , X2 , . . ., Xn atunci pentru fiecare pereche (Y, X1 ),
(Y, X2 ), . . ., (Y, Xn ) desenăm câte un nor statistic. Forma generală a variabilei Y ı̂n funcţie de
variabilele factoriale X1 , X2 , . . ., Xn se scrie:
Y = f (X1 , X2 , . . . , Xn ) + ε
unde f (X1 , X2 , . . . , Xn ) reprezintă funcţia de regresie care aproximează cel mai bine forma legăturii,
iar ε reprezintă o variabilă aleatoare numită reziduală, care ı̂nsumează efectul altor factori decât cei
luaţi ı̂n calcul.
v Estimarea parametrilor funcţiilor de regresie

Este o etapă care se succede firesc alegerii formei funcţiei. În estimarea parametrilor va trebui să
ţinem cont de abaterea punctelor norului faţă de modelul matematic ales Y (X1 , X2 , . . . , Xn ), datorat
altor factori decât X1 , X2 , . . ., Xn , consideraţi neesenţiali, cuantificaţi prin variabila reziduală ε.
Principiul de la care se porneşte ı̂n estimarea parametrilor este cel al pătratelor minime. Minimizăm
suma pătratelor abaterilor valorilor observate ale lui Y de la nivelul calculat prin Y (X1 , X2 , . . . , Xn ).
Condiţia de minim a sumei este echivalentă cu condiţia de minim a mediei:
2
M Y − Y (X1 , X2 , . . . , Xn ) = M (ε2 ) minimă.

Ecuaţia Y (X1 , X2 , . . . , Xn ) care descrie legătura dintre Y şi factorii de influenţă X1 , X2 , . . ., Xn ,

se numeste ecuaţia de regresie. Metoda regresiei constă ı̂n modelarea legăturilor statistice prin ecuaţia
de regresie.
Deoarece problema de minim se poate rezolva doar cunoscând forma particulară a funcţiei, vom
aborda estimarea parametrilor separat, pe tipuri de funcţii.
• Regresia liniară multiplă

În ipoteza ı̂n care legătura dintre Y şi factorii săi de influenţă X1 , X2 , . . ., Xn , este liniară, ecuaţia de
regresie va fi de forma:
Y (X1 , X2 , . . . , Xn ) = a0 + a1 X1 + a2 X2 + . . . + an Xn (3.10)
Coeficienţii a0 , a1 , a2 , . . ., an se numesc parametrii modelului şi vor rezulta din minimizarea următoarei
funcţii cu (n + 1) necunoscute:
2
G(a0 , a1 , . . . , an ) = M Y − (a0 + a1 X1 + . . . + an Xn ) (3.11)
Condiţiile de minim constă ı̂n anularea celor (n + 1) derivate parţiale ale funcţiei G(a0 , a1 , . . . , an ) ı̂n
raport cu necunoscutele a0 , a1 , . . ., an ceea ce conduce la următorul sistem de ecuaţii:

∂G(a0 , a1 , . . . , an )
= −2M Y − (a0 + a1 X1 + . . . + an Xn ) = 0



∂a0 (3.12)
∂G(a0 , a1 , . . . , an )

 = −2M Y − (a0 + a X
1 1 + . . . + a X
n n ) · Xj = 0, ∀ j = 1, n
∂aj

sau ı̂ntr-o formă echivalentă:

(
M a0 + a1 X1 + . . . + an Xn = M (Y )

M a0 + a1 X1 + . . . + an Xn · Xj = M (Y ) · Xj , ∀ j = 1, n
de unde rezultă:
(
a0 + a1 M (X1 ) + . . . + an M (Xn ) = M (Y )
(3.13)
a0 M (Xj ) + a1 M (X1 Xj ) + . . . + an M (Xn Xj ) = M (Y Xj ), ∀ j = 1, n
Prin rezolvarea acestui sistem liniar de ecuaţii ı̂n raport cu necunoscutele a0 , a1 , . . ., an , se obţin
valorile parametrilor funcţiei de regresie liniare multiple. Astfel, legătura statistică dintre Y şi X1 ,
X2 , . . ., Xn este modelată prin aproximare cu o legătură funcţională.
• Regresia liniară simplă

În cazul cand variabila endogenă Y este influenţată de un singur factor X, iar norul de puncte al
mediilor condiţionate are forma din figura 3.2 vorbim de o regresie liniară simplă.
Funcţia de regresie liniară simplă are forma
Y = a + bX + ε,
ı̂n care parametrii reali a şi b se pot determina folosind

următoarele formule:
cov(X, Y ) M (XY ) − M (X)M (Y )
b= 2 = (3.14)
σX M (X 2 ) − M (X)2
Figura 3.2: Dreapta de regresie a = M (Y ) − b · M (X) (3.15)
Formulele (3.14) şi (3.15) se deduc din rezolvarea sistemului (3.13), pentru cazul când variabila endo-
genă Y depinde doar de factorul exogen X.
• Regresia parabolică
În economie sunt numeroase exemplele ı̂n care legătura dintre fenomene şi variabilele care le cuantifică
nu este liniară. Dacă Y reprezintă recolta la hectar dintr-un produs agricol, iar X cantitatea de
ı̂ngrăşăminte, ne vom da seama chiar şi intuitiv că o anumită creştere a lui X nu provoacă aceeaşi
creştere a lui Y pe tot intervalul de variaţie al celor două variabile. La valori mari ale cantităţii
de ı̂ngrăs.aminte, acestea provoacă saturaţie sau chiar nocivitate, ducând la o stagnare, respectiv
diminuare a producţiei. Alte exemple pot fi: legătura dintre vechimea ı̂n muncă şi mărimea salariului,
dintre cheltuielile cu publicitatea şi volumul vânzărilor, etc.
În cazul regresiei parabolice, norul de puncte al mediilor condiţionate are forma grafică prezentată
ı̂n figura 3.3
Funcţia de regresie parabolică are forma generală
Y = a + bX + cX 2 + ε
unde a, b şi c sunt parametrii reali ai funcţiei. Deter-

minarea parametrilor funcţiei parabolice de regresie se
poate face fie aplicând direct funcţiei metoda pătratelor
minime, fie prin reducerea la cazul liniar prezentat ante-
rior. În ambele cazuri vom exemplifica pentru parabola
Figura 3.3: Parabola de regresie de ordinul doi.
a) Estimarea parametrilor prin aplicarea directă a metodei pătratelor minime
Ecuaţia de regresie a modelului se scrie:
Y (X) = a0 + a1 X + a2 X 2
Din condiţia de minimizare a expresiei:

2
G(a0 , a1 , a2 ) = M Y − Y (X)
avem următoarele egalităţi:
∂G(a0 , a1 , a2 ) ∂G(a0 , a1 , a2 ) ∂G(a0 , a1 , a2 )

= 0, = 0, respectiv =0
∂a0 ∂a1 ∂a2
din care rezultă sistemul de ecuaţii:

2

−2M Y − (a0 + a1 X + a2 X ) = 0

−2M Y − (a0 + a1 X + a2 X 2 ) X = 0

−2M Y − (a0 + a1 X + a2 X 2 ) X 2 = 0

care este echivalent cu:


2
a0 + a1 M (X) + a2 M (X ) = M (Y )

a0 M (X) + a1 M (X 2 ) + a2 M (X 3 ) = M (Y X)

a0 M (X 2 ) + a1 M (X 3 ) + a2 M (X 4 ) = M (Y X 2 )

Rezolvând acest sistem ı̂n necunoscutele a0 , a1 , a2 , rezultă parametrii ecuaţiei de regresie parabolice.
În mod asemănător se poate proceda pentru orice regresie neliniară.
b) Estimarea parametrilor prin reducerea la cazul liniar
Având modelul parabolic de ecuaţie:
Y (X) = a + bX + cX 2
facem substituţiile X1 := X şi X2 := X 2 , dupa care ecuaţia devine:

Y (X1 , X2 ) = a + bX1 + cX2
care reprezintă un model liniar cu doi factori. Problema regresiei neliniare pentru cazul unei parabole
de gradul doi se reduce astfel la o problemă de regresie liniară, care se rezolvă conform cazului liniar.
Observaţie: În caz mai general, dacă ecuaţia de regresie este un polinom de gradul n:
Y (X) = a0 + a1 X + a2 X 2 + . . . + an X n
efectuând substituţiile: X1 := X, X2 := X 2 , . . . , Xn := X n obţinem cazul liniar ı̂n raport cu (n + 1)
variabile.
• Regresia exponenţială
În cazul regresiei exponenţiale, norul de puncte al mediilor condiţionate are forma grafică prezentată
ı̂n figura 3.4
Funcţia de regresie exponenţială are forma generală
Y = a · bX · eε (3.16)
unde a şi b sunt parametrii reali ai funcţiei.

Aducerea la forma liniară a ecuaţiei (3.16) presupune
logaritmarea ecuaţiei
ln Y = ln(a · bX · eε ) = ln a + ln b · X + ε
şi folosirea substituţiilor

Figura 3.4: Funcţia exponenţială de
regresie Z := ln Y, a∗ := ln a, b∗ := ln b.
Obţinem astfel modelul liniar simplu: Z = a∗ + b∗ X + ε.
• Regresia hiperbolică
În cazul regresiei hiperbolice, norul de puncte al mediilor condiţionate are forma grafică prezentată ı̂n
figura 3.5
Funcţia de regresie hiperbolică are forma generală
1
Y =a+b· +ε (3.17)
X
unde a şi b sunt parametrii reali ai funcţiei.
Aducerea la forma liniară a ecuaţiei (3.17) presupune
folosirea substituţiei:
1
Z := .
X
Figura 3.5: Hiperbola de regresie
Obţinem astfel modelul liniar simplu: Y = a + bZ + ε.
Alte tipuri de regresie

În practica economică se ı̂ntâlnesc frecvent şi alte tipuri de funcţii (unele chiar funcţii compuse).
Principiul de lucru pentru estimarea parametrilor va ramâne ı̂nsă ı̂ntotdeauna acelaşi: ı̂ncercarea de
a aduce funcţia la o formă liniară.
Foarte des ı̂ntâlnite sunt funcţiile de producţie. Forma generală a acestora este:
Y (X1 , X2 , . . . , Xn ) = a · X1m1 · X2m2 · . . . · Xnmn
Printr-o astfel de funcţie se defineşte o legătură ı̂ntre nivelul producţiei Y şi factorii de care aceasta
depinde: productivitatea muncii, calificarea forţei de muncă, gradul de ı̂nzestrare cu capital fix, etc.
Determinarea parametrilor se face prin reducere la cazul liniar prin logaritmare:
lg Y (X1 , X2 , . . . , Xn ) = lg a + m1 · lg X1 + . . . + mn · lg Xn
Dacă ı̂n această nouă ecuaţie facem substituţiile:
Z(X1 , X2 , . . . , Xn ) := lg Y (X1 , X2 , . . . , Xn )Xi0 := lg Xi , i = 1, n
reducem ecuaţia la una liniară multiplă.
Analiza reprezentativităţii funcţiei de regresie
Coeficientul de corelaţie
Construcţia lui este similară cu a raportului de corelaţie, cu deosebirea că varianţa ı̂n fiecare grupă
este calculată folosind suma pătratelor abaterilor faţă de valorile ajustate prin funcţia de regresie şi
nu faţă de media grupei. Ca urmare, coeficientul de corelaţie va fi specific fiecărei funcţii ı̂n parte.
Expresia lui de calcul (admisă aici fără demonstraţie) este:
r
det M
rY X = 1 − ∈ [0; 1] (3.18)
m00 M00
unde M este matricea de variaţie şi covariaţie aferentă fiecărui model de regresie, m00 este primul
elemenet al matricii M , iar M00 este complementul algebric al lui m00 . Interpretarea acestui coeficient
ı̂n functie de valorile pe care le poate lua este următoarea:
- dacă rY X ∈ [0; 0, 3] funcţia nu este reprezentativă pentru modelarea legăturii dintre variabile;
- dacă rY X ∈ (0, 3; 0, 7] funcţia are o reprezentativitate medie pentru modelarea legăturii dintre
variabile;
- dacă rY X ∈ (0, 7; 1] funcţia este foarte reprezentativă pentru modelarea legăturii dintre variabile.
Aceste limite nu trebuie interpretate foarte rigid. Valorile coeficienţilor este bine să fie comparate
cu ale altor coeficienţi, ai altor funcţii. Pentru aceeaşi repartiţie de exemplu, pentru funcţiile de regresie
alese ca fiind posibile calculam coeficienţii de corelaţie şi ı̂l reţinem pe cel mai mare, considerând acea
funcţie ca fiind cea mai reprezentativă.
În cazul regresiei liniare simple, formula coeficientului de corelaţie (3.18) poate fi adusă la o formă
echivalentă mai simplă:
r r
m00 m11 − m01 m10 m01 m10 m01 M (XY ) − M (X)M (Y )
rY X = 1 − = =√ √ =
m00 m11 m00 m11 m00 · m11 σY · σX
- Aplicaţie. Se cunosc valorile cererii şi preţului unui anumit produs pe opt pieţe:
Cerere (nr. buc) 15,4 11,3 10 6 20 17 9,4 8

Preţ (u.m.) 3,2 4,9 5 10 1,2 2,3 5,8 7,2
a) Pe un grafic adecvat, identificaţi formele posibile ale funcţiilor de regresie dintre cerere şi preţ;
b) Găsiţi parametrii funcţiilor de regresie identificate la punctul precedent şi analizaţi reprezenta-
tivitatea fiecărei funcţii.
Rezolvare. a) Pentru a identifica posibilele funcţii de regresie care ar modela legătura matematică
dintre cerere şi preţ, construim norul de puncte, reprezentând puncte de coordonate (preţ, cerere):
Figura 3.6: Dreapta şi hiperbola de regresie
Din graficele prezentate ı̂n figura 3.6 identificăm dreapta şi hiperbola de regresie ca fiind cele mai
”apropiate” grafice de punctele de coordonate (preţ, cerere).
b) Dorim să găsim parametrii dreptei şi hiperbolei de regresie, precum şi gradul lor de reprezentativi-
tate.
• Dreapta de regresie Y = a + bX + ε are ca parametrii numerele reale a (termen liber constant) şi b
(coeficient de regresie liniar). Pentru a determina aceşti parametrii, folosim formulele:
M (XY ) − M (X)M (Y )
b= (3.19)
M (X 2 ) − [M (X)]2
a = M (Y ) − b · M (X) (3.20)
Ţinând cont ca Y = cererea, iar X = preţul, avem următoarele medii:
3, 2 + 4, 9 + 5 + 10 + 1, 2 + 2, 3 + 5, 8 + 7, 2
M (X) = = 4, 95
8
15, 4 + 11, 3 + 10 + 6 + 20 + 17 + 9, 4 + 8
M (Y ) = = 12, 13
8
3, 2 · 15, 4 + 4, 9 · 11, 3 + . . . + 7, 2 · 8
M (XY ) = = 48, 73
8
3, 22 + 4, 92 + 52 + 102 + 1, 22 + 2, 32 + 5, 82 + 7, 22
M (X 2 ) = = 31, 43
8
M (X)2 = 4, 952 = 24, 50
Înlocuind aceste medii ı̂n relaţia (3.19) găsim:

48, 73 − 4, 95 · 12, 13
b= = −1, 63.
31, 43 − 24, 5
Utilizând acum ı̂n relaţia (3.20) găsim:
a = 12, 13 − (−1, 63) · 4, 95 = 20, 19

Deci ecuaţia dreptei de regresie este Y = 20, 19 − 1, 63 · X + ε .

Pentru a studia nivelul de reprezentativitate al dreptei de regresie calculăm coeficientul de corelaţie
liniară
cov(X, Y ) M (XY ) − M (X)M (Y )
rY X = =p p (3.21)
σX · σY M (X 2 ) − M (X)2 · M (Y 2 ) − M (Y )2
Avem ca şi calcule intermediare:
15, 42 + 11, 32 + 102 + 62 + 202 + 172 + 9, 42 + 82
M (Y 2 ) = = 167, 78
8
M (Y )2 = [M (Y )]2 = 12, 132 = 147, 14
Înlocuind valorile medii ı̂n formula (3.21) obţinem:

48, 73 − 4, 95 · 12, 13
rY X = √ √ = −0, 95.
31, 43 − 24, 5 · 167, 78 − 147, 14
Astfel, |rY X | = 0, 95 ∈ (0, 7; 1], deci dreapta de regresie este puternic reprezentativă pentru modelarea
legăturii dintre preţ şi cerere.
• Hiperbola de regresie Y = a + b X1 + ε are ca parametrii numerele reale a (termen liber constant) şi
b (coeficient de regresie hiperbolic). Pentru a determina aceşti parametrii, facem substituţia Z := X1
şi obţinem modelul de regresie liniar simplu Y = a + b · Z + ε. Formulele (3.19) şi (3.20) se rescriu
astfel:
M (ZY ) − M (Z)M (Y )
b= (3.22)
M (Z 2 ) − [M (Z)]2
a = M (Y ) − b · M (Z) (3.23)
1
Stările (valorile) variabilei Z le obţinem din tabelul iniţial, folosind transformarea Z = X. Avem:
Cerere (nr. buc) 15,4 11,3 10 6 20 17 9,4 8

1 1 1 1 1 1 1 1 1
Z = Preţ (u.m.) 3,2 4,9 5 10 1,2 2,3 5,8 7,2
Avem următoarele valori medii:

1 1 1 1 1 1 1 1
3,2 + 4,9 + 5 + 10 + 1,2 + 2,3 + 5,8 + 7,2
M (Z) = = 0, 29
8
M (Y ) = 12, 13
1 1 1
3,2 · 15, 4 + 4,9 · 11, 3 + . . . + 7,2 ·8
M (ZY ) = = 4, 56
8
1 1 1
3,22
+ 4,92
+ 52
+ 1012 + 1
1,22
+ 1
2,32
+ 1
5,82
+ 1
7,22
M (Z 2 ) = = 0, 13
8
2 2 2
M (Z) = [M (Z)] = 0, 29 = 0, 08.
Înlocuind valorile medii in relaţiile (3.22) şi (3.23), obţinem: b = 20, 84 şi a = 6, 08.
1
Deci, hiperbola de regresie este Y = 6, 08 + 20, 84 · +ε .
X
Pentru a studia nivelul de reprezentativitate al hiperbolei de regresie calculăm coeficientul de
corelaţie hiperbolică
cov(Z, Y ) M (ZY ) − M (Z)M (Y )
rY Z = =p p
σZ · σY M (Z ) − M (Z)2 · M (Y 2 ) − M (Y )2
2
Obţinem:
4, 56 − 0, 29 · 12, 13
rY Z = √ √ = 1.
0, 13 − 0, 08 · 167, 78 − 147, 14
Hiperbola este puternic reprezentativă pentru modelarea legăturii matematice dintre cerere şi preţ.
Deoarece |rY Z | > |rY X |, deducem că hiperbola de regresie este mai reprezentativă decât dreapta de
regresie.
3.5 Teme de control

P1. Pentru o distribuţie ı̂n raport cu două variabile calitative ı̂ntre care se presupune că ar putea
exista vreo legătură, se cere:
1. Verificarea existenţei legăturii dintre cele două variabile;

2. Dacă legătura există, cât de intensă este aceasta ?
P2. Pentru o populaţie observată ı̂n raport cu două variabile cantitative ı̂ntre care ar putea exista o
legătură, se cere:
1. Aprecierea existenţei şi a intensităţii legăturii dintre variabile;

2. Să se formuleze pe baza unui grafic adecvat ipoteze cu privire la forma posibilă a funcţiei
de regresie dintre ele;
3. Pentru funcţiile reţinute ca fiind posibile, să se calculeze parametrii;
4. Care din aceste funcţii este mai reprezentativă ?
5. Pentru funcţia aleasă să se facă câteva simulari ale valorilor previzionate prin aceasta.
P3. Cunoaştem următoarea distribuţie a 52 de societăţi comerciale cu acelaşi profil de activitate, ı̂n
raport cu variabilele X cheltuielile cu publicitatea (mil. lei) şi Y - volumul vânzărilor (mil. lei).
PP
PP X
PP [30; 50] (50; 70] (70; 90)
Y PPP
[200; 400] 14 2 1
(400; 600] 3 10 5
(600; 800] 2 7 8
1. Pe baza unui grafic adecvat să se emită ipoteze privind forma posibilă a funcţiei de regresie.
2. În ipoteza unei forme liniare a dependenţei dintre Y şi X, să se calculeze parametrii funcţiei
de regresie.
3. Să se studieze reprezentativitatea funcţiei de regresie pentru modelarea legăturii dintre cele
două variabile.
4. Care este valoarea medie a volumului vânzărilor pentru un nivel al cheltuielilor cu publici-
tatea de 55 milioane lei ?
5. Aceleaşi cerinţe de la punctele 2, 3 şi 4 pentru o formă parabolică a dependenţei dintre Y
şi X.
Bibliografie:
1. Drosbeke J.J., Éléments de statistiques, Ed. Ellipses, Bruxelles, 1988;
4. Goldfarb B., Pardoux C., Introduction à la méthode statistique, Ed. Dunod, Paris, 1995;
5. Py B., Statistique descriptive, Ed. Economica, 1990;
6. Roger P., Statistique pour la gestion, Ed. Management et société, Caen, 2000;
7. Tassi P., Méthodes Statistiques, Ed. Economica, Paris, 1991;
8. Wonnacott T.H., Wonnacott R.J., Statistique, Économie-Gestion-Sciences-Médecine, Ed. Eco-

nomica, Paris, 1991.
Capitolul 4
Serii cronologice
Secţiuni
4.1. Indici statistici
4.2. Indicatori medii specifici seriilor cronologice
4.3. Componentele unei serii cronologice
Obiective
• Înţelegerea şi aplicarea metodelor de calcul a indicilor factoriali ı̂n analiza dinamicii indicatorilor
economici;
• Cuantificarea dinamicii medii a unui indicator;
• Cunoaşterea şi utilizarea metodelor cantitative de previziune. Metoda clasică de descompunere
a unei serii de timp.
Cuvinte cheie
• Indice al variaţiei integrale, indice factorial, indice al preţului;
• Nivel mediu al unei serii de timp, indice mediu, ritm mediu, diferenţa medie absolută;
• Serie de timp, model dinamic, funcţii de tendinţă, coeficienţii sezonalităţii, ciclicitate
• Medii mobile, previziune, erori de previziune, netezire exponenţială.
Studentul ı̂nţelege noţiunile de indice factorial, nivel mediu, indice mediu, ritm mediu şi stăpâneşte
modalităţile de calcul ale acestora. Utilizează metode cantitative ı̂n previziune; ı̂n acest sens, identifică
componentele prezente ı̂ntr-o serie de timp, modelează şi extrapolează tendinţa, utilizează adecvat o
medie mobilă, modelează componenta sezonieră şi ciclică, utilizează metoda netezirii exponenţiale ı̂n
netezire şi previziune.
69
70 Capitolul 4. Serii cronologice
4.1 Indici statistici

Studiul fenomenelor economice şi sociale presupune ı̂n marea majoritate a cazurilor şi măsurarea
variaţiei unor mărimi. Această variaţie poate fi urmărita ı̂n timp, spaţiu sau relativ la nişte categorii.
Se va folosi termenul generic de stare, notându-se cu j starea luată ca bază de comparaţie şi cu k cea
cercetată ı̂n raport cu aceasta. Se va nota cu Z mărimea care constituie obiectul de studiu, variaţia
acesteia putând fi exprimată atât sub formă absolută, cât şi relativă.
Dintre exprimările sub formă relativă, un loc deosebit de important ı̂l ocupă indicele statistic.
În practică variaţia totală a variabilei Z este datorată variaţiei unor alte variabile a căror evoluţie
ı̂ntre două stări j şi k influenţează evoluţia lui Z. Avem de a face, aşadar, cu Z de forma Z =
f (X1 , X2 , . . . , Xm ). Un astfel de model este un model de tip determinist ı̂n care cei m factori determină
ı̂n totalitate nivelul lui Z. În cazul unui astfel de model se pot distinge trei categorii de indici:
1) indicele variaţiei totale (integrale) a mărimii Z:
k/j Z(k) f (X1 (k), X2 (k), . . . , Xm (k))

IZ = =
Z(j) f (X1 (j), X2 (j), . . . , Xm (j))
2) indici ai factorilor Xi (individuali sau elementari):
k/j Xi (k)
IXi =
Xi (j)
k/j
3) indici ai variaţiei parţiale ale lui Z sau indici factoriali: IZ/Xi - ne arată de câte ori s-a modificat
Z ı̂n starea k faţă de starea j sub influenţa exclusivă a factorului Xi .
În cele ce urmează prezentăm indicii factoriali.
• Indicii factoriali de tip Laspeyres.

Acest indice este cel mai cunoscut şi utilizat ı̂n practica economică. Mai poartă şi denumirea de
indicele preţurilor. Dacă se consideră un coş de r produse sau bunuri, volumul valoric al acestora (Z)
se va calcula dupa relaţia:
X r
Z= p i qi
i=1
Indicele factorial al preţurilor calculat prin metoda Laspeyres va avea expresia:
r
X
pi (k)qi (j)
k/j i=1
IZ/p (·L) = r
X
pi (j)qi (j)
i=1
iar indicele factorial al cantităţilor (volumului fizic), expresia:

r
X
pi (j)qi (k)
k/j i=1
IZ/q (L·) = r
X
pi (j)qi (j)
i=1
4.1. Indici statistici 71
unde pi (j) şi pi (k) sunt preţurile din perioada de bază şi perioada curentă, qi (j) sunt cantităţile din
perioada de bază, iar ki măsoară importanţa produsului sau bunului i ı̂n coşul indicelui la momentul
bază de comparaţie.
Pentru cazul general, când Z depinde de m factori de influenţă, iar forma funcţiei f este oarecare,
Florea (1986) deduce o regulă pentru elaborarea indicilor factoriali de tip Laspeyres.
• Indicii factoriali de tip Paasche.

Acest indice a apărut tot ca un indice al preţurilor, indicele factorial de preţ de tip Paasche având
expresia:
X r
pi (k)qi (k)
k/j i=1
IZ/p (·P ) = r
X
pi (j)qi (k)
i=1
iar cel factorial al cantităţilor (volumului fizic), expresia:
r
X
pi (k)qi (k)
k/j i=1
IZ/q (P ·) = r
X
pi (k)qi (j)
i=1
Pentru o funcţie oarecare f , ı̂n care mărimea Z depinde de m factori, in Florea (1986) este prezentată
o generalizare.
• Indicii factoriali de tip Fisher.

In 1922, I. Fisher propune o nouă expresie de calcul a indicelui preţurilor. Acesta se va obţine ca o
medie geometrică a indicilor de preţ de tip Laspeyres şi Paasche, astfel:
r
k/j k/j k/j
IZ/p (F ) = IZ/p (·L) · IZ/p (·P )
De aceeaşi manieră se obţine şi indicele de volum:

r
k/j k/j k/j
IZ/q (F ) = IZ/q (L·) · IZ/q (P ·)
- Aplicaţie. O societate hotelieră dispune de trei tipuri de locuri de cazare: camere cu un singur pat
(single), camere cu două paturi (double) şi apartamente. Numărul de camere ı̂nchiriate (X) şi tariful
practicat (Y) ı̂n două luni consecutive sunt date ı̂n tabelul următor:
Luna j Luna k
Tipul camerei X Y (e) X Y (e)
Single 80 30 110 35
Double 50 40 60 40
Apartament 20 50 25 45
Calculaţi volumul valoric al ı̂ncasărilor sub influenţa exclusivă a numărului de camere ı̂nchiriate,
respectiv sub influenţa exclusivă a tarifului practicat, folosind metoda Laspeyres.
Rezolvare. Volumul valoric al ı̂ncasărilor din ı̂nchirierea camerelor (Z) se va calcula dupa relaţia:
3
X
Z= Xi Yi
i=1
Indicii factoriali de tip Laspeyres vor fi:

3
X
Xi (k)Yi (j)
k/j i=1 110 · 30 + 60 · 40 + 25 · 50
IZ/X (·L) = = = 1, 287
X3 80 · 30 + 50 · 40 + 20 · 50
Xi (j)Yi (j)
i=1
Constatăm că volumul valoric al ı̂ncasărilor a crescut ı̂n luna k faţă de luna j de 1, 287 ori sub influenţa
exclusivă a modificării numărului de camere ı̂nchiriate.
3
X
Xi (j)Yi (k)
k/j i=1 80 · 35 + 50 · 40 + 20 · 45
IZ/Y (L·) = = = 1, 055
X3 80 · 30 + 50 · 40 + 20 · 50
Xi (j)Yi (j)
i=1
Deducem că volumul valoric al ı̂ncasărilor a crescut ı̂n luna k faţă de luna j de 1, 055 ori sub influenţa
exclusivă a modificării tarifului practicat.
- Aplicaţie. Se consideră mărimea Z ca fiind profitul brut al unei societăţi şi factorii: X - veniturile
totale, respectiv Y - cheltuielile totale ale aceleaşi societăţi. În doi ani consecutivi variabilele X şi Y
au ı̂nregistrat valorile:
Anul
t−1 t
X (mld. lei) 10 12
Y (mld. lei) 8 9
Calculaţi indicii factoriali de tip Laspeyres pentru variaţia profitul brut sub influenţa exclusivă a
veniturilor totale, respectiv a cheltuielilor totale şi interpretaţi rezultatele găsite.
Rezolvare. Modelul care leagă cele trei mărimi va fi de forma: Z = X − Y .

Expresiile şi valorile indicilor factoriali de tip Laspeyres sunt:
t/t−1 X(t) − Y (t − 1) 12 − 8
IZ/X (·L) = = =2
X(t − 1) − Y (t − 1) 10 − 8
- profitul brut a crescut ı̂n anul t faţă de anul t − 1 de 2 ori sub influenţa exclusivă a modificării
veniturilor totale;
t/t−1 X(t − 1) − Y (t) 10 − 9
IZ/Y (L·) = = = 0, 5
X(t − 1) − Y (t − 1) 10 − 8
- profitul brut a scăzut ı̂n anul t faţă de anul t − 1 de 0, 5 ori sub influenţa exclusivă a modificării
cheltuielilor totale.
4.2. Indicatori medii specifici seriilor cronologice 73
v Principalii indici utilizaţi ı̂n economie

Indicele preţurilor de consum este un indice de tip Laspeyres cu bază fixă:
n
X
pi (t)qi (0) n n
t/0 i=1
X pi (0)qi (0) pi (t) X
IZ/p (·L) = n = n · = ki (0) · Ipt/0
i
X X pi (0)
pi (0)qi (0) i=1 pi (0)qi (0) i=1
i=1 i=1
unde: n - reprezintă numărul de mărfuri şi servicii din coşul indicelui;

ki (0) - reprezintă structura de consum, fiind ponderea mărfii sau serviciului i ı̂n consumul populaţiei;
pi (0) şi pi (t) sunt preţurile ı̂nregistrate de marfa sau produsul i ı̂n perioada de bază şi perioada
curentă;
Ponderile ki (0) sunt obţinute prin Ancheta Integrată ı̂n Gospodării şi rezultă din structura cheltu-
ielilor medii lunare efectuate de o gospodărie pentru cumpărarea mărfurilor şi plata serviciilor necesare
satisfacerii nevoilor de trai; aceste ponderi se actualizează la intervale de câţiva ani. Preţurile cores-
punzătoare celor n mărfuri şi servicii din coşul indicelui se culeg lunar, ı̂n urma unei cercetări selective
organizate de Institutul Naţional de Statistică.
Indicele producţiei industriale măsoară evoluţia de ansamblu a preţurilor produselor şi serviciilor
industriale fabricate şi livrate de producătorii interni ı̂n perioada curentă faţă de perioada de bază, ı̂n
primul stadiu de comercializare a produselor sau serviciilor. Indicele utlizat este tot un indice de tip
Laspeyres.
Indicele salariilor măsoară evoluţia salariilor ı̂n perioada curentă faţă de perioada de bază. Alături de
indicele preţurilor de consum este folosit ı̂n evaluarea nivelului de trai. Se utilizează, de asemenea, un
indice de tip Laspeyres, care măsoară variaţia fondului de salarii total (Z) sub influenţa modificării
salariilor medii Si corespunzătoare ramurii i.
Indicii bursieri. Principalii indici bursieri se diferenţiază prin mai multe elemente: eşantionarea,
respectiv alegerea titlurilor din coşul indicelui, reprezentativitate, modul de calcul utilizat şi natura
variabilelor luate ı̂n calcul. Cei mai cunoscuţi şi urmăriţi indici bursieri, cu excepţia familiei de indici
Dow Jones se calculează ca şi indici Laspeyres.
4.2 Indicatori medii specifici seriilor cronologice
Pentru o serie cronologică

1 2 ... t ... n
Y :
y1 y2 . . . yt . . . yn
se pot definii următorii indicatori medii:
a) Nivelul mediu (valoarea medie). Nivelul mediu reprezintă nivelul teoretic atins de indicator ı̂n
condiţiile ı̂n care evoluţia sa ar fi constantă ı̂n timp, factorii ce-i determină evoluţia ar acţiona cu
aceeaşi intensitate pe ı̂ntreaga perioadă de timp analizată.
Modul de determinare a volumului fenomenului diferă după cum seria este de intervale, respectiv
de momente.
Pentru seriile cronologice de intervale nivelul mediu este:
y1 + y2 + . . . + yn
Y =
n
Pentru seriile cronologice de momente nivelul mediu este definit de următoarea relaţie:
Z tn
y(t)dt
t1
Y = Z tn
dt
t1
Dacă se aproximează evoluţia indicatorului y(t) ca fiind liniară ı̂ntre două momente consecutive de
timp, rezultă:
T1 T1 + T2 Tn−2 + Tn−1 Tn−1
y1 + y2 + . . . + yn−1 + yn
Y = 2 2 2 2
T1 + T2 + . . . + Tn−1
relaţie numită medie cronologică ponderată.
Dacă nivelul indicatorului se ı̂nregistrează la momente echidistante (T1 = T2 = . . . = Tn − 1),
atunci relaţia anterioară devine:
y1 yn
+ y2 + . . . + yn−1 +
Y = 2 2
n−1
si reprezintă media cronologică simplă.
b) Indicele mediu. Ritmul mediu

Pentru calculul acestui indicator se ı̂ntâlnesc ı̂n literatură mai multe abordări.
Indicele mediu este parametrul modelului autoregresiv :
yt = I y · yt−1 + εt , t = 2, 3, . . . , n
Utilizând metoda celor mai mici pătrate pentru estimarea parametrului I y , se obţine următoarea
expresie de calcul a indicelui mediu:
Xn
yt−1 · yt
t=2
Iy = n
X
2
yt−1
t=2
Metoda este ı̂ntâlnită ı̂n practică sub denumirea de metoda autoregresivă.
O altă expresie de calcul, adecvată pentru indicatori ce evoluează aproximativ exponenţial este
următoarea: r
yn
Iy = n−1
y1
Ritmul mediu Ry se determină pornind de la indicele mediu:
Ry = I y − 1 sau Ry (%) = I y · 100 − 100.
c) Diferenţa medie absolută

Expresia de calcul a diferenţei medii absolute:
n
X n
X
(yt − yt−1 ) ∆t/t−1
y
t=2 t=2
∆y = =
n−1 n−1
4.3. Componentele unei serii cronologice 75
sau echivalent:
yn − y1
∆y = .
n−1
- Aplicaţie. Cifra de afaceri a unei societăţi comerciale, a scăzut, ı̂ncepând cu anul 2013:
An 2013 2014 2015 2016 2017 2018

Cifra de afaceri (mil. lei) 136 107 67 42 28 22
a) Calculaţi şi interpretaţi indicele mediu anual şi ritmul mediu.

b) Previzionaţi cifra de afaceri pentru anul 2019, utilizând indicele mediu, dacă se menţine ritmul
din perioada 2013-2018.
Rezolvare. a) Indicele mediu anual este:

6
X
yt−1 · yt
t=2 136 · 107 + 107 · 67 + 67 · 42 + 42 · 28 + 28 · 22
Iy = = = 0, 712.
X6 1362 + 1072 + 672 + 422 + 282
2
yt−1
t=2
De la un an la altul, in perioada 2013-2018, cifra de afaceri a scăzut ı̂n medie de 0, 712 ori.
Ritmul mediu este:
Ry = (I y − 1) · 100% = (0, 712 − 1) · 100% = −28, 8%
De la un an la altul, in perioada 2013-2018, cifra de afaceri a scăzut ı̂n medie cu 28, 8%.
b) Cifra de afaceri anticipată pentru anul 2019, utilizând indicele mediu, este:
y2019 = y2018 · I y = 22 · 0, 712 = 15, 664 mii lei.
4.3 Componentele unei serii cronologice
O serie cronologică este o secvenţă de observaţii asupra unei variabile, ordonate după parametrul timp.
Frecvent, măsurătorile asupra variabilei sunt efectuate la intervale egale de timp, seria cronologica fiind
prezentată sub forma:
1 2 ... t ... n
Y :
y1 y2 . . . yt . . . yn
În abordarea tradiţională, fluctuaţiile din seriile cronologice sunt privite ca o rezultantă a suprapu-
nerii următoarelor componente: tendinţa T , componenta ciclică C, sezonieră S respectiv reziduală E.
Primele trei componente sunt considerate deterministe, sistematice, determinate de factori cu acţiune
continuă asupra fenomenului, ı̂n timp ce componenta reziduală are caracter aleator fiind efectul acţiunii
unor factori imprevizibili, accidentali.
Modelul clasic de descompunere al seriilor cronologice este de regulă:
• aditiv: Y = T + C + S + E sau
• multiplicativ: Y = T · C · S · E respectiv
• o combinaţie mixtă a componentelor seriei.

Tehnicile de analiză, ı̂n acest context, au ca obiective:
- separarea fiecărei componente şi modelarea comportamentului său, respectiv
- previziunea evoluţiei fiecărei componente, iar apoi compunerea acestora ı̂n scopul obţinerii de
previziuni privind evoluţia fenomenului Y . Principiul de la baza acestei tehnici este descompune
pentru a modela iar apoi recompune.
v Estimarea componentei de tendinţă

Cele mai uzuale funcţii utilizate pentru modelarea tendinţei indicatorilor din economie sunt redate ı̂n
tabelul de mai jos:
Tabelul 4.1: Funcţii elementare utilizate ı̂n modelarea tendinţei

Tendinţă Forma liniarizată Diferenţe aprox. constante
t/t−1
liniară ∆y = yt − yt−1
Tt = a + bt
parabolă T = a + bt + cX (2) ∆t/t−1 = ∆y
t/t−1
− ∆y
t−1/t−2
y
Tt = a + bt + ct2 unde: X = t2
t/t−1
hiperbolă T = a + bX ∆ty = tyt − (t − 1)yt−1
1 1
Tt = a + b unde: X =
t t
t/t−1
exponenţială Zt = A + Bt ∆ln y = ln yt − ln yt−1
Tt = a · bt unde: Zt = ln Tt ;
A = ln a; B = ln b
putere Z = A + bX
Tt = a · tb unde: Zt = ln Tt ;
A = ln a; X = ln t
logaritmică T = a + bX
Tt = a + b ln t unde: X = ln t
curba logistică
a
Tt = ,
1 + eb−ct
a, c > 0
Stabilirea funcţiei adecvate pentru modelarea tendinţei
În acest scop sunt utile următoarele precizări:

• cronograma seriei iniţiale sau a valorilor netezite sugerează funcţiile candidate, numite şi linii
posibile de tendinţă;
• cea mai adecvată funcţie pentru modelarea tendinţei

X poate fi considerată aceea pentru care se
realizează minimul sumei pătratelor reziduurilor min (yt − Tt )2 ;
t
t/t−1
• este adecvată tendinţa liniară atunci când diferenţele absolute cu bază ı̂n lanţ ∆y = yt −
yt−1 sunt aproximativ constante. De asemenea, precizări specifice ı̂n acest sens pentru parabolă,
exponenţială, respectiv hiperbolă găsim ı̂n tabelul 4.1.
Estimarea parametrilor tendinţei

Pentru estimarea parametrilor tendinţei liniare Tt = a + bt se utilizează metoda celor mai mici
pătrate, expresiile de calcul ale parametrilor a, b fiind deci următoarele:
n
X
(t − t)(yt − Y )
t=1
b= n , respectiv a = Y − bt,
X
2
(t − t)
t=1
sau echivalent
M (tY ) − M (t)M (Y )
b= , respectiv a = M (Y ) − bM (t).
M (t2 ) − [M (t)]2
Seria prezintă o tendinţă de creştere atunci când b > 0, respectiv de descreştere dacă b < 0.
Cu excepţia curbei logistice, celelalte funcţii neliniare din tabelul 4.1 pot fi aduse la o formă
liniarizată prin anumite substituţii, respectiv prin aplicarea operaţiei de logaritmare ı̂n cazul funcţiei
exponenţiale şi a funcţiei putere.
- Aplicaţie. Indicele lunar al preţului producţiei industriale pentru piaţa internă, ı̂n perioada ianu-
arie 1999 - iunie 2000, baza de comparaţie 1996, a avut o tendinţa crescătoare:
Luna 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
(t)
Indice 3,7 3,8 4,1 4,3 4,5 4,8 4,9 5,1 5,3 5,5 5,6 5,8 6,0 6,2 6,3 6,5 6,6 7,0
(yt )
Să se determine ecuaţia tendinţei.
Rezolvare. Construim mai ı̂ntâi cronograma seriei cronologice:
Cronograma seriei sugerează prezenţa unei

tendinţe liniare, peste care se suprapune o
componentă aleatoare de amplitudine redusă:
yt = a + bt + εt , t = 1, 2, . . . , 18.
Parametrii tendinţei se determină din relaţiile:
M (tY ) − M (t)M (Y )
b= ,
M (t2 ) − [M (t)]2
respectiv
Figura 4.1: Indicele preţului producţiei indus- a = M (Y ) − bM (t).

triale - Tendinţa
Exemplificăm din calculele intermediare:

1 + 2 + . . . + 18
M (t) = = 9, 5
18
3, 7 + 3, 8 + . . . + 7, 0
M (Y ) = = 5, 33
18
(1 · 3, 7) + (2 · 3, 8) + . . . + (18 · 7, 0)
M (tY ) = = 55, 72
18
12 + 22 + . . . + 182
M (t2 ) = = 117, 2
18
şi obţinem:
55.72 − 9, 5 · 5, 33
b= = 0, 19
117, 2 − (9, 5)2
a = 5, 33 − 0, 19 · 9, 5 = 3, 55.
Tendinţa seriei se estimează prin funcţia de gradul ı̂ntâi:
Tt = 3, 55 + 0, 19t
al cărei grafic este redat ı̂n figura 4.1.
v Estimarea componentelor deterministe ı̂n cazul seriilor sezoniere

Presupunem ı̂n acest paragraf că seria cronologică prezintă tendinţă, sezonalitate şi o componentă
aleatoare. Vom prezenta modul de estimare al tendinţei, respectiv a componentei sezoniere.
Modelul de descompunere. Perioada componentei sezoniere

Pentru alegerea modelului de descompunere este indicat a se analiza cronograma seriei.
În general, este adecvat un model aditiv atunci când amplitudinea oscilaţiilor este aproximativ
constantă, respectiv multiplicativ dacă amplitudinea creşte sau scade ı̂n timp. Frecvent ı̂n practică
este mai adecvat modelul multiplicativ.
Perioada componentei sezoniere, notată cu p, reprezintă numărul unităţilor de timp din cadrul
unui ciclu sezonier. Majoritatea seriilor sezoniere din domeniul economic au durata unui ciclu de un
an, p fiind egal cu 4 ı̂n cazul datelor trimestriale, respectiv 12 ı̂n cazul datelor lunare. Prin extensie,
pot fi studiate şi fenomene cu durata unui ciclu mai mică de un an.
Mediile mobile
Pentru eliminarea componentei sezoniere (desezonalizarea seriei) se aplică datelor o medie mobilă
de ordin p egal cu perioada componentei sezoniere.
Mediile mobile de ordin p, notate ı̂n continuare M M (p), sunt definite de următoarele relaţii:
• dacă p este impar, p = 2k + 1, mediile mobile de ordin p sunt:
yt−k + yt−k+1 + . . . + yt + . . . + yt+k−1 + yt+k
yt = , t = k + 1, k + 2, . . . , n − k;
p
• dacă p este par, p = 2k, mediile mobile se definesc analog
yt−k+0,5 + yt−k+1,5 + . . . + yt−0,5 + yt+0,5 + . . . + yt+k+0,5
yt = ,
p
t = k + 0, 5, k + 1, 5, . . . , n − k + 0, 5.
În cazul p par, se introduc mediile mobile centrate de ordin p definite prin:
1
y t−0,5 + y t+0,5 yt−k + yt−k+1 + . . . + yt + . . . + yt+k−1 + 12 yt+k
yt = = 2 .
2 p
Estimarea tendinţei ı̂n cazul seriilor cu componentă sezonieră

În cazul seriilor sezoniere se ı̂ntâlnesc preponderent ı̂n literatură două modalităţi de estimare a
tendinţei:
• desezonalizarea seriei, iar apoi estimarea tendinţei pornind de la valorile desezonalizate;
• modelarea tendinţei pornind de la mediile anuale.
Estimarea componentei sezoniere
Notaţii: t indice pentru an (ı̂n general pentru un ciclu sezonier), variind de la 1 la n; s indice
pentru sezon, variind de la 1 la p. Modelul de descompunere a seriei are forma:
yij = T Cij + Sj + εij , respectiv yij = T Cij · Sj · εij
Metoda comparării cu mediile mobile
În cazul modelului multiplicativ

yij = T Cij · Sj · εij
metoda se ı̂ntâlneşte ı̂n literatură şi sub denumirea de metoda raportării la mediile mobile şi constă ı̂n
următoarele:
• calculul mediilor mobile y ij de ordin p egal cu perioada componentei sezoniere;

yij
• calculul rapoartelor Sij = ce cuantifică abaterea datelor observate de la tendinţă. Dacă
y ij
fixăm indicele j (ne situăm ı̂n sezonul j), aceste diferenţe constituie estimaţii pentru Sj ;
• determinarea unui indice mediu pentru fiecare sezon ca o medie a estimaţiilor precedente:
n−1
1 X
Ij = Sij , j = 1, 2, . . . , p,
n−1
i=1
aceasta justificându-se prin necesitatea eliminării efectului aleator din Sij . Pentru a nu fi afectaţi
de valorile extreme, uneori ı̂nainte de calculul mediei, aceste valori se elimină, sau ı̂n loc de medie
se ia valoarea mediană a estimaţiilor Sij ;
• determinarea componentei sezoniere Sj , etapă ce constă ı̂ntr-o corecţie adusa indicilor medii Ij
astfel ı̂ncât media lor sa fie 1:
Ij
Sj = p , j = 1, 2, . . . , p.
1X
Ii
p
i=1
În cazul modelului aditiv

yij = T Cij + Sij + εij
determinarea componentei sezoniere decurge analog.
- Aplicaţie. Datele privind evoluţia trimestrială a producţiei de bere din ţara noastră (zeci mii hl)
ı̂n perioada 1996 − 2001 sunt indicate mai jos:
An/Trim. I II III IV
1996 124,1 263,2 252,4 124,5
1997 130,1 280,2 260,6 151,1
1998 157,5 301,2 353,3 185,0
1999 169,7 340,0 350,9 168,7
2000 177,5 407,6 417,2 224,1
2001 202,9 385,3 425,6 196,6
Determinaţi ecuaţia tendinţei. În cazul prezenţei componentei sezoniere, desezonalizaţi seria cronolo-
gică a producţiei de bere.
Rezolvare. Construim cronograma producţiei de bere din perioada 1996 − 2001
Figura 4.2: Produţia de bere din perioada 1996 − 2001

Graficul seriei indică prezenţa unei componente sezoniere predominante, de perioada p = 4. Mediile
mobile de ordin p = 4 sunt calculate conform relaţiei de definiţie a mediilor mobile centrate. Astfel,
spre exemplu:
0, 5 · y1 + y2 + y3 + y4 + 0, 5 · y5
y3 = =
4
0, 5 · 124, 1 + 263, 2 + 252, 4 + 124, 5 + 0, 5 · 130, 1
= = 191, 8
4
0, 5 · y2 + y3 + y4 + y5 + 0, 5 · y6
y4 = =
4
0, 5 · 263, 2 + 252, 4 + 124, 5 + 130, 1 + 0, 5 · 280, 2
= = 194, 7
4
..
.
0, 5 · y20 + y21 + y22 + y23 + 0, 5 · y24

y 22 = =
4
0, 5 · 224, 1 + 202, 9 + 385, 3 + 425, 6 + 0, 5 · 196, 6
= = 306, 0
4
Datele observate au fost numerotate aici ı̂n ordine cronologică y1 , y2 , . . ., y24 .
t MM(4) t MM(4)
1 - 13 261,7
2 - 14 259,4
3 191,8 15 258,3
4 194,7 16 267,7
5 197,8 17 284,5
6 202,2 18 299,7
7 208,9 19 309,8
8 214,9 20 310,2
9 229,2 21 308,4
10 245,0 22 306,0
11 250,8 23 -
12 257,1 24 -
Estimăm tendinţa pornind de la valorile desezonalizate.
Seria mediilor mobile prezentată grafic relevă o uşoară tendinţă de creştere a producţiei de bere.
Vom considera tendinţa liniară:
Tt = a + bt + εt
originea de măsurare a timpului trimestrul II al anului 1996, unitatea de măsură un trimestru. Astfel,
pentru trimestrul III 1996 avem t = 1, s.a.m.d:
t 1 2 3 ... 19 20
Valori desezonalizate (Z) 191,8 194,7 197,8 ... 308,4 306,0
M (tZ) − M (t)M (Z)

b=
M (t2 ) − [M (t)]2
a = M (Z) − bM (t)
Calcule intermediare:
M (t) = 10, 5; M (Z) = 252, 9; M (t2 ) = 143, 5; M (tZ) = 2884, 9; b = 6, 9; a = 180, 44
Tendinţa producţiei de bere ı̂n perioada ianuarie 1996 iunie 2000 este estimată prin:
Tt = 180, 44 + 6, 9 · t.

4.4 Teme de control

P1. Profiturile unei companii sunt redate ı̂n graficul de mai jos:
a) Construiţi seria cronologică aferentă profiturilor ı̂nregistrate ı̂n perioada 2010 - 2018.
b) Construiţi seriile cronologice cu diferenţe absolute, indici statistici şi diferenţe relative cu
bază fixă şi bază ı̂n lanţ.
c) Cu cât se modifică ı̂n medie profiturile de la un an la altul ?
d) De câte ori se modifică ı̂n medie profiturile de la un an la altul ?
e) Cu câte procente se modifică ı̂n medie profiturile de la un an la altul ?
f ) Găsiţi ecuaţia tendinţei care indică evoluţia profiturilor ı̂n timp.
g) Este tendinţa găsită la punctul precedent reprezentativă ?
h) Estimaţi profitul companiei ı̂n următorii trei ani (prin trei metode diferite).
i) De câte ori s-a modificat profitul ı̂n anul 2018 faţă de anul 2010 ?
j) Ştiind că ı̂n perioada 2010 - 1017 impozitul pe profit datorat statului a fost de 16%, iar
ı̂ncepând cu anul 2018 impozitul pe profit a fost de 10%, găsiţi seria cronologică a profitului
net. Reprezentaţi grafic seria cronologică aferentă profitului net.
P2. Veniturile unei cofetării obţinute din vânzările de prăjituri, cafea şi sucuri sunt redate ı̂n graficul
de mai jos:
a) Construiţi seriile cronologice aferente veniturilor obţinute din vânzările de prăjituri, sucuri
şi cafea ı̂n perioada 2012 - 2018.
b) Construiţi seria cronologică a veniturilor totale ale cofetăriei ı̂n perioada 2012 - 2018.
c) Cu cât la sută se modifică ı̂n medie veniturile totale de la un an la altul ?
d) De câte ori se modifică ı̂n medie veniturile obţinute din vânzarea prăjiturilor de la un an la
altul ?
e) Găsiţi ecuaţiile tendinţelor veniturilor obţinute din vânzările de prăjituri, cafea şi sucuri.
Care din ecuaţiile găsite este mai reprezentativă ?
f ) Folosind diferenţa absolută medie a veniturilor obţinute din vânzarea prăjiturilor, estimaţi
veniturile pentru prăjituri ı̂n următorii doi ani.
g) Folosind indicele statistic mediu al veniturilor obţinute din vânzarea sucurilor, estimaţi
veniturile pentru sucuri ı̂n următorii doi ani.
h) Indicele Laspeyres al veniturilor totale sub influenţa exclusivă a veniturilor obţinute din
vânzările de prăjituri ı̂n anul 2018 faţă de anul 2012. Calcul şi interpretare.
i) Indicele Paasche al veniturilor totale sub influenţa exclusivă a veniturilor obţinute din
vânzările de sucuri ı̂n anul 2018 faţă de anul 2012. Calcul şi interpretare.
j) Indicele Fisher al veniturilor totale sub influenţa exclusivă a veniturilor obţinute din vânzările
de cafea ı̂n anul 2018 faţă de anul 2012. Calcul şi interpretare.
k) Calculaţi şi interpretaţi nivelul mediu al veniturilor totale.
l) Cu cât la sută se abat ı̂n medie veniturile totale ı̂nregistrate ı̂n fiecare an faţă de venitul
total mediu ı̂nregistrat ı̂n perioada 2012 - 2018 ?
m) Reprezentaţi grafic cronograma veniturilor totale obţinute din vânzarea prăjiturilor şi sucu-
rilor. Precizaţi tendinţa pe grafic. Găsiţi parametrii tendinţei şi studiaţi reprezentativitatea
ei.
P3. În anul 2015 numărul de firme dintr-un judeţ a fost cu 17, 5% mai mic decât ı̂n 2018 şi cu 10%
mai mare decât ı̂n 2012. Ştiind că ı̂n 2011 ı̂n judeţ au fost 100 de firme, iar ı̂n 2012 numărul
firmelor a crescut de 1, 2 ori, se cere:
a) Reconstituiţi seria cronologică a numărului de firme ı̂n perioada 2011 - 2018.

b) De câte ori s-a modificat ı̂n medie numărul de firme de la un an la altul ?
c) Cu cât la sută s-a modificat ı̂n medie numărul de firme de la un an la altul ?
d) Nivelul mediu al firmelor ı̂n perioada 2011 - 2018. Calcul şi interpretare.
e) Găsiţi ecuaţia tendinţei care modelează evoluţia ı̂n timp a numărului de firme. Este tendinţa
reprezentativă?
f ) Folosind indicele statistic mediu, estimaţi numărul de firme ı̂n anul 2019.
g) Dacă ı̂n anul 2012, 20% din firme au avut profilul de activitate IT, iar ı̂n 2018 acest procent
s-a triplat, calculaţi şi interpretaţi indicele Fisher al numărului total de firme sub influenţa
exclusivă a firmelor de IT ı̂n 2018, faţă de 2012.
P4. Previzionaţi numărul zilnic de pacienţi ai unei clinici medicale private pentru săptămâna a cincea,
cunoscând evoluţia din primele patru săptămâni:
Săptămâna Ziua Nr. pacienţi

Luni 40
Marţi 49
1 Miercuri 55
Joi 38
Vineri 20
Luni 45
Marţi 50
2 Miercuri 58
Joi 35
Vineri 22
Luni 47
Marţi 49
3 Miercuri 60
Joi 39
Vineri 25
Luni 50
Marţi 60
4 Miercuri 68
Joi 50
Vineri 35
Pentru una din săptămâni calculaţi toţi indicatorii posibili.
Bibliografie:
1. Buiga A., Dragoş C., Lazăr D., Parpucea I., Statistică I, Presa Universitară Clujeană, 2003.
3. Florea I., Parpucea I., Buiga A., Statistică descriptivă. Teorie şi aplicaţii, ed. Continental, Alba
Iulia, 1998;
4. Florea I., Parpucea I., Buiga A., Lazăr D., Statistică inferenţială, Presa Universitară Clujeană,
Cluj-Napoca, 2000;
5. Melard G., Méthodes des prévisions à court terme, Ed. de l’Université de Bruxelles, 1970.

Management. Statistică Descriptivă

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Management. Statistică Descriptivă

Încărcat de

Drepturi de autor:

Formate disponibile

Management

2 Parametrii repartiţiilor unidimensionale 27

3 Analiza legăturii dintre variabile statistice 49

0.1 Date de contact ale titularilor de curs

 Prof. univ. dr. Cristian DRAGOŞ

 Prof. univ. dr. Dorina LAZĂR

 Conf. univ. dr. Gabriela BRENDEA

 Conf. univ. dr. Cristian LITAN

 Conf. univ. dr. Codruţa MARE

 Lect. univ. dr. Darius FILIP

0.3 Competenţe profesionale

• Utilizarea eficientă a resurselor sistemelor de calcul;

• Utilizarea adecvată a produselor software de birotică pentru soluţionarea de probleme specifice.

0.4 Competenţe transversale

• Conştientizarea nevoii de formare continuă;

0.5 Materiale bibliografice

8. Lethielleux M., Statistique descriptive, Ed. Dunod, Paris, 2007.

0.6 Elemente de deontologie academică

0.7 Studenţi cu dizabilităţi

1.1 Concepte de bază

Stare (realizare) a unei variabile statistice - reprezintă valoarea ı̂nregistrată de o variabilă

Variabilele statistice se pot clasifica astfel:

b) După modul de exprimare al stărilor, deosebim:

c) După modul de variaţie, variabila cantitativă poate fi:

X = {x1 = [15 − 20), x2 = [20 − 30), ...}

- frecvenţa de cumpărare: variabilă atributivă, calitativă

Y = {y1 - foarte rar; y2 - rar; ...}

- numărul de sortimente cumpărate relativ la produsul analizat: variabilă atributivă, cantitativă,

S = {s1 - cartierul C, s2 - strada S, ...}

- data ultimei cumpărări a produsului analizat: variabilă de timp, cantitativă

T = {t1 = 27.01.2017; t2 = 24.02.2017, ...}

1.2 Serii de distribuţie

1. În raport cu numărul variabilelor

• Serii statistice unidimensionale, au la bază o singură variabilă;

2. După natura variabilelor deosebim:

• Serii atributive, care au la bază variabile atributive;

3. După modul de exprimare al stărilor variabilei deosebim:

• Serii calitative, care au la bază variabile calitative;

• Serii de frecvenţa sau serii de distribuţie (repartiţie);

1.2.1. Serii statistice de distribuţie unidimensională

Fie seria X formată cu frecvenţe relative:

- Seria unidimensională cu frecvenţe relative:

- Seria unidimensională cu frecvenţe relative cumulate:

1.2.2. Serii statistice de distribuţie bidimensională

Din seria bidimensională se pot extrage următoarele serii unidimensionale:

• Serii de repartiţie condiţionate:

- seria de repartiţie unidimensională ı̂n raport cu X, condiţionată de Y = yi

- seria de repartiţie unidimensională ı̂n raport cu Y , condiţionată de X = xj

a) Precizaţi populaţia statistică, unitatea statistică şi volumul populaţiei statistice;

a) Populaţia statistică analizată este reprezentată de mulţimea angajaţilor, unitatea statistică ce

Seriile condiţionate ı̂n raport cu variabila X sunt:

Seriile condiţionate ı̂n raport cu variabila Y sunt:

sau, ı̂n procente:

1.2.3. Serii statistice de variaţie

Fie seriile cronologice formate cu:

∆t/0 1/0 2/1 t/t−1

Diferenţa absolută ne arată cu cât se modifică mărimea analizată de la un moment la altul. Se

Fie seriile cronologice formate cu:

• diferenţe relative cu bază fixă

1.2.4. Serii statistice de spaţiu (teritoriale)

si − este o stare a variabilei ce exprimă spaţiul, i = 0, K;

Plecând de la seria de forma (1.13) se pot deduce seriile formate cu:

• diferenţe relative cu bază fixă

Rezolvare. Seria formată cu diferenţe absolute cu bază fixă este:

Prof. univ. dr. Cristian DRAGOŞ

Prof. univ. dr. Dorina LAZĂR

Conf. univ. dr. Gabriela BRENDEA

Conf. univ. dr. Cristian LITAN

Conf. univ. dr. Codruţa MARE

Lect. univ. dr. Darius FILIP