Sunteți pe pagina 1din 90

Management

Statistică descriptivă

II III

2019
UNIVERSITATEA ”BABEŞ-BOLYAI” CLUJ-NAPOCA
FACULTATEA DE ŞTIINŢE ECONOMICE ŞI GESTIUNEA AFACERILOR
ANUL 2 ID
SEMESTRUL 3

Suport de curs ID
STATISTICĂ DESCRIPTIVĂ
Anul 2
Semestrul 3

Cluj-Napoca
Cuprins

Informaţii generale ii
0.1 Date de contact ale titularilor de curs . . . . . . . . . . . . . . . . . . . . . . . . . . . ii
0.2 Obiective . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
0.3 Competenţe profesionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
0.4 Competenţe transversale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
0.5 Materiale bibliografice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
0.6 Elemente de deontologie academică . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv
0.7 Studenţi cu dizabilităţi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv

1 Serii statistice 1
1.1 Concepte de bază . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Serii de distribuţie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Observarea statistică . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4 Reprezentări grafice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5 Teme de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2 Parametrii repartiţiilor unidimensionale 27


2.1 Parametrii tendinţei centrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2 Parametrii de structură . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.3 Parametrii variaţiei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.4 Parametrii formei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.5 Parametrii concentrării . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.6 Teme de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

3 Analiza legăturii dintre variabile statistice 49


3.1 Analiza legăturii dintre variabile calitative . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.2 Analiza legăturii dintre variabile ordinale . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.3 Analiza legăturii dintre variabile cantitative . . . . . . . . . . . . . . . . . . . . . . . . 56
3.4 Funcţii de regresie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.5 Teme de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

4 Serii cronologice 69
4.1 Indici statistici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.2 Indicatori medii specifici seriilor cronologice . . . . . . . . . . . . . . . . . . . . . . . . 73
4.3 Componentele unei serii cronologice . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.4 Teme de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

i
Informaţii generale

0.1 Date de contact ale titularilor de curs


 Prof. univ. dr. Anuţa BUIGA
Birou 346, sediul Facultăţii de Ştiinţe Economice şi Gestiunea Afacerilor
Str. Teodor Mihali 58-60, Telefon: 0264-418654
E-mail: anuta.buiga@econ.ubbcluj.ro

 Prof. univ. dr. Cristian DRAGOŞ


Birou 231, sediul Facultăţii de Ştiinţe Economice şi Gestiunea Afacerilor
Str. Teodor Mihali 58-60, Telefon: 0264-418654
E-mail: cristian.dragos@econ.ubbcluj.ro

 Prof. univ. dr. Dorina LAZĂR


Birou 527, sediul Facultăţii de Ştiinţe Economice şi Gestiunea Afacerilor
Str. Teodor Mihali 58-60, Telefon: 0264-418654
E-mail: dorina.lazar@econ.ubbcluj.ro

 Conf. univ. dr. Gabriela BRENDEA


Birou 527, sediul Facultăţii de Ştiinţe Economice şi Gestiunea Afacerilor
Str. Teodor Mihali 58-60, Telefon: 0264-418654
E-mail: gabriela.brendea@econ.ubbcluj.ro

 Conf. univ. dr. Cristian LITAN


Birou 231, sediul Facultăţii de Ştiinţe Economice şi Gestiunea Afacerilor
Str. Teodor Mihali 58-60, Telefon: 0264-418654
E-mail: cristian.litan@econ.ubbcluj.ro

 Conf. univ. dr. Codruţa MARE


Birou 346, sediul Facultăţii de Ştiinţe Economice şi Gestiunea Afacerilor
Str. Teodor Mihali 58-60, Telefon: 0264-418654
E-mail: codruta.mare@econ.ubbcluj.ro

 Lect. univ. dr. Darius FILIP


Birou 230, sediul Facultăţii de Ştiinţe Economice şi Gestiunea Afacerilor
Str. Teodor Mihali 58-60, Telefon: 0264-418654
E-mail: darius.filip@econ.ubbcluj.ro

ii
0.2. Obiective iii

0.2 Obiective
Disciplina Statistică descriptivă ı̂şi propune dobândirea unor cunoştinţe privind definirea unei populaţii
statistice, a variabilelor statistice, obţinerea de informaţii cu privire la fenomenul supus cercetării, or-
ganizarea datelor şi prezentarea acestora sub formă de serii statistice, evidenţierea structurii populaţiei
ı̂n raport cu variabilele observate, evidenţierea evoluţiei unui fenomen ı̂n timp sau spaţiu precum şi
reprezentarea grafică a datelor.

0.3 Competenţe profesionale


• Utilizarea conceptelor, teoriilor, principiilor şi metodelor de investigare statistică a fenomenelor
şi proceselor economice;

• Utilizarea eficientă a resurselor sistemelor de calcul;

• Utilizarea adecvată a produselor software de birotică pentru soluţionarea de probleme specifice.

0.4 Competenţe transversale


• Executarea responsabilă a sarcinilor profesionale, ı̂n condiţii de autonomie restrânsă şi asistenţă
calificată;

• Conştientizarea nevoii de formare continuă;

• Utilizarea eficientă a resurselor şi tehnicilor de ı̂nvăţare, pentru dezvoltarea personală şi profe-
sională.

0.5 Materiale bibliografice


1. Anderson D.R., Sweeney D.J., Williams T.A., Statistics for business and economics, South-
Western College Pub, 2008.

2. Andrei T., Stancu S., Statistică - teorie şi aplicaţii, Ed. ALL, Bucureşti, 1995.

3. Bailly P., Carrere C., Statistiques descriptives: Cours, Ed. PUG, Grenoble, 2007.

4. Bressoud E., Kahane J.C., Gillet R., Statistique descriptive: Applications avec Excel et la calcu-
latrice, Ed. Pearson Education, Paris, 2008.

5. Buiga A., Dragoş C., Lazăr D., Brendea G., Litan C., Mare C., Statistică Descriptivă, Ed.
Napoca Star, Cluj-Napoca, 2018;

6. Delmas B., Statistique descriptive pour l’économie et la gestion, Ed. Presses Universitaires du
Septentrion, Lille, 2009.

7. Jaba E., Statistică descriptivă. Teste grilă şi probleme, Ed. Sedcom Libris Iaşi, 2002.

8. Lethielleux M., Statistique descriptive, Ed. Dunod, Paris, 2007.


iv INTRODUCTION

0.6 Elemente de deontologie academică


Plagiatul este o problemă serioasă şi este pedepsită cu asprime. Orice student care este prins că
plagiază se poate aştepta să ı̂i fie anulată munca şi să se ı̂ntreprindă măsuri disciplinare din partea
organismelor de conducere ale facultăţii. Pentru clarificarea noţiunii de plagiat, propunem următoarele
exemple:
- realizarea proiectului de cercetare de către o altă persoană;
- copierea parţială sau totală a unui proiect de cercetare;
- copierea unui proiect de cercetare de pe internet şi răspândirea acestuia şi ı̂n rândul altor studenţi;
- conspectarea unor surse bibliografice fără citirea prealabilă a acestora.
Studenţii pot să utilizeze surse bibliografice aferente tematicii abordate, cu condiţia ca respectivele
surse să fie identificate şi prezentate ı̂n cadrul proiectului de cercetare. Un proiect care se constituie
ı̂n mare parte din compilarea unor idei ale unor autori, neavând o contribuţie proprie din partea
studentului va fi notat cu un calificativ inferior.

0.7 Studenţi cu dizabilităţi


În vederea oferirii de şanse egale studenţilor afectaţi de dizabilităţi motorii sau intelectuale, titularul de
curs ı̂şi manifestă disponibilitatea de a comunica cu studenţii prin intermediul sistemelor informatice
disponibile (spre exemplu: e-mail, website, blog, etc.). Astfel, studenţii cu dizabilităţi vor putea adresa
ı̂ntrebări legate de tematica cursului pe adresa de email a titularului de curs, menţionată la ı̂nceputul
acestui silabus, putând primi lămuririle necesare ı̂n maxim 48 de ore de la primirea mesajului.
Capitolul 1

Serii statistice

Secţiuni
1.1. Concepte de bază
1.2. Serii statistice
1.3. Observarea statistică
1.4. Reprezentări grafice
1.5. Teme de control

Obiective
• definirea unei populaţii statistice, a variabilelor statistice
• obţinerea de informaţii cu privire la fenomenul supus cercetării
• organizarea datelor şi prezentarea acestora sub formă de serii statistice
• evidenţierea structurii populaţiei ı̂n raport cu variabilele observate
• evidenţierea evoluţiei unui fenomen ı̂n timp

Cuvinte cheie
• populaţie statistică, unitate statistică, volum, eşantion, variabilă statistică, observare statistică,
indicator statistic, serie statistică
• observare statistică, serii statistice unidimensionale şi bidimensionale
• reprezentarea grafică a datelor relativ la o variabilă cantitativă, la o variabilă calitativă şi la
două variabile

Rezultate aşteptate
Cunoaşterea şi stăpânirea noţiunilor statistice de bază, cunoaşterea tehnicilor de culegere, grupare
şi prezentare a datelor. Utilizarea indicatorilor statistici cu scopul evidenţierii variaţiei unei mărimi
sau a structurii populaţiei supuse studiului.

1
2 Capitolul 1. Serii statistice

1.1 Concepte de bază


Statistica descriptivă este ştiinţa care se ocupă cu studiul fenomenelor de masă, punând ı̂n evidenţă
anumite particularităţi ale acestor fenomene. Dintre conceptele fundamentale cu care operează statis-
tica descriptivă, se remarcă ı̂n mod pregnant următoarele:
Populaţia statistică - reprezintă mulţimea elementelor de aceeaşi natură, care au una sau mai
multe ı̂nsuşiri comune.
Exemple de populaţii statistice: mulţimea studenţilor unei facultăţi, mulţimea angajaţilor unei
societăţi, mulţimea bibliotecilor din România, etc.
Populaţiile statistice le vom nota cu majusculele de la ı̂nceputul alfabetului: A, B, C, etc.
Unitatea statistică - constituie elementul component al populaţiei statistice.
În exemplele de mai sus, unităţile statistice sunt: studentul, angajatul, biblioteca, etc.
Unităţile statistice le vom nota cu minuscula corespunzătoare majusculei ce simbolizează populaţia
statistică, respectiv ai , bi , ci etc.
Volumul populaţiei - reprezintă numărul unităţilor statistice care alcătuiesc populaţia statistică.
Volumul unei populaţii statistice se notează cu N .
Dacă A este o populaţie statistică de volum N , atunci unităţile statistice care formează populaţia
A sunt: a1 , a2 , ..., aN .
Eşantion - reprezintă o submulţime a unei populaţii statistice, submulţime obţinută pe baza unor
anumite criterii. Volumul eşantionului ı̂l vom nota cu n.
Variabila statistică - reprezintă o ı̂nsuşire sau o trăsătură comună tuturor unităţilor unei populaţii.
În general, variabilele statistice se notează cu majusculele de la sfârşitul alfabetului: X, Y , Z, etc.

Stare (realizare) a unei variabile statistice - reprezintă valoarea ı̂nregistrată de o variabilă


statistică. Dacă se notează cu X o variabilă statistică oarecare, atunci cu x1 , x2 , ..., xN se vor nota
stările variabilei respective.

Variabilele statistice se pot clasifica astfel:

a) După natura lor, variabilele statistice pot fi atributive, de timp sau de spaţiu.

• Variabila atributivă exprimă un atribut sau ı̂nsuşire esenţială (alta, decât timpul sau
spaţiul) unităţilor populaţiei;
• Variabila de timp ne arată timpul ı̂n care au luat fiinţă unităţile populaţiei sau perioada
de timp ı̂n care au existat (există);
• Variabila de spaţiu ne arată spaţiul ı̂n care există sau au luat naştere unităţile populaţiei.

b) După modul de exprimare al stărilor, deosebim:

• Variabila cantitativă este variabila ale cărei stări se exprimă prin valori numerice. Se mai
numeşte şi variabilă metrică.
• Variabila calitativă este variabila ale cărei stări se exprimă prin cuvinte sau coduri. Se mai
numeşte variabilă nominală (stările se exprimă prin cuvinte) sau variabilă ordinală (stările
se exprimă prin coduri).

c) După modul de variaţie, variabila cantitativă poate fi:


1.2. Serii de distribuţie 3

• Variabilă discretă este acea variabilă care ı̂n intervalul său de definiţie ı̂nregistrează cel mult
valori raţionale.
• Variabilă continuă este acea variabilă care poate lua orice valoare reală din intervalul său
de variaţie.

Exemple de variabile statistice relativ la populaţia formată din mulţimea consumatorilor unui
produs:
- vârsta: variabilă atributivă, cantitativă, continuă

X = {x1 = [15 − 20), x2 = [20 − 30), ...}

- frecvenţa de cumpărare: variabilă atributivă, calitativă

Y = {y1 - foarte rar; y2 - rar; ...}

- numărul de sortimente cumpărate relativ la produsul analizat: variabilă atributivă, cantitativă,


discretă:
Z = {z1 = 1; z2 = 2, ...}
- localizarea magazinelor de unde se fac cumpărături: variabilă de spaţiu, calitativă

S = {s1 - cartierul C, s2 - strada S, ...}

- data ultimei cumpărări a produsului analizat: variabilă de timp, cantitativă

T = {t1 = 27.01.2017; t2 = 24.02.2017, ...}

Observarea statistică - constă ı̂n identificarea unităţilor populaţiei şi ı̂nregistrarea stărilor va-
riabilelor ı̂n raport cu care este studiată. Ansamblul stărilor variabilelor rezultate prin observare se
numesc statistici.
După gradul de cuprindere al populaţiei statistice, observarea statistică este de două feluri: totală
şi parţială.
• Observarea totală este acel tip de observare statistică ı̂n care are loc ı̂nregistrarea tuturor
unităţilor care fac parte din populaţia statistică supusă studiului. Recensământul populaţiei României
este un exemplu de observare totală.
• Observarea parţială presupune observarea şi ı̂nregistrarea unui anumit număr de unităţi din
populaţie, alese după criterii bine definite.
În cercetarea statistică a unei populaţii punctul de pornire ı̂l poate constitui fie statisticile exha-
ustive rezultate prin observarea populaţiei univers, fie statisticile rezultate din observarea parţială a
unui eşantion à ⊆ A, ı̂n ambele cazuri scopul final fiind acelaşi, respectiv obţinerea de informaţii la
nivelul populaţiei univers A.
Observarea statistică se realizează de obicei prin intermediul chestionarului.

1.2 Serii de distribuţie


Seria statistică este o construcţie care redă fie distribuţia unei populaţii ı̂n raport cu una sau mai
multe variabile, fie variaţia unei mărimi ı̂n timp, ı̂n spaţiu sau de la o categorie la alta.
Seriile statistice se clasifică ı̂n raport cu mai multe criterii, astfel:

1. În raport cu numărul variabilelor


4 Capitolul 1. Serii statistice

• Serii statistice unidimensionale, au la bază o singură variabilă;


• Serii statistice multidimensionale, care au la bază două sau mai multe variabile.

2. După natura variabilelor deosebim:

• Serii atributive, care au la bază variabile atributive;


• Serii cronologice (de timp sau istorice), care au la bază variabile de timp;
• Serii de spaţiu sau teritoriale, care au la bază o variabilă de spaţiu.

3. După modul de exprimare al stărilor variabilei deosebim:

• Serii calitative, care au la bază variabile calitative;


• Serii cantitative, care au la bază variabile cantitative şi care după modul de variaţie a
variabilei pot fi: discrete (când variabila este discretă) şi continue (când variabila este
continuă).

4. În raport cu natura indicatorului din care este alcătuită seria, avem:

• Serii de frecvenţa sau serii de distribuţie (repartiţie);


• Serii de variaţie.

Seria statistică redând distribuţia populaţiei ı̂n raport cu una sau mai multe variabile constituie
o descompunere a acesteia ı̂ntr-un număr R de clase. O astfel de serie este formată ı̂n exclusivitate
din frecvenţe (absolute cumulate sau necumulate, relative cumulate sau necumulate) şi de aceea se
numesc serii de frecvenţă, de distribuţie sau de repartiţie. Prescurtat se mai foloseşte şi denumirea de
repartiţie statistică sau distribuţie statistică.
Seria statistică ce redă variaţia unei mărimi ı̂n timp, ı̂n spaţiu sau de la o categorie la alta se
numeşte serie de variaţie.
Prezentăm ı̂n continuare cele mai importante serii statistice:

1.2.1. Serii statistice de distribuţie unidimensională


Conform definiţiei de mai sus, prin această serie se distribuie unităţile unei populaţii statistice ı̂n
raport cu una sau mai multe variabile.
Fie o serie statistică unidimensională având la bază variabila X, respectiv:
 
x1 x2 . . . x i . . . x R
X: ,N (1.1)
N1 N2 . . . Ni . . . NR

unde Ni este frecvenţa absolută a clasei i, i = 1, R şi reprezintă numărul de unităţi ale populaţiei
pentru care variabila X a ı̂nregistrat valoarea xi . Remarcăm faptul că volumul populaţiei se poate
exprima cu ajutorul frecvenţelor absolute

N = N1 + N2 + . . . + NR .

Clasa (grupa) de unităţi ı̂n raport cu o variabilă reuneşte acele unităţi din cadrul populaţiei care
ı̂nregistrează aceeaşi stare a variabilei sau stările variabilei aparţinând unui anumit interval de variaţie.
Ca urmare, ı̂n raport cu o variabilă statistică populaţia poate fi structurată ı̂ntr-un anumit număr
de clase.
De asemenea, relativ la seria statistică unidimensională având la bază variabila X, aceasta poate
fi formată cu frecveţe relative, frecvenţe absolute cumulate sau relative cumulate.
1.2. Serii de distribuţie 5

Fie seria X formată cu frecvenţe relative:


 
x1 x2 . . . xi . . . xR
X: , 100% (1.2)
f1 f2 . . . fi . . . fR

unde fi ne arată ponderea unităţilor din populaţie care au ı̂nregistrat pentru variabila X starea xi :
Ni
fi = , i = 1, R.
N
Pornind de la seria (1.1) se poate deduce seria formată cu frecvenţe absolute cumulate, respectiv:
 
x1 x2 . . . xi . . . xR
X: (1.3)
Nx1 Nx2 . . . Nxi . . . NxR

unde Nxi reprezintă numărul de unităţi din populaţia studiată pentru care variabila ı̂nregistrează
valori ce nu depăşesc valoarea xi . Avem că:

Nxi = N1 + N2 + . . . + Ni , i = 1, R.

Pornind de la seria (1.1) sau (1.2) se poate deduce seria formată cu frecvenţe relative cumulate,
respectiv:  
x1 x2 . . . xi . . . xR
X: (1.4)
Fx1 Fx2 . . . Fxi . . . FxR
unde Fxi exprimă ponderea unităţilor populaţiei studiate pentru care variabila a ı̂nregistrat valori ce
nu depăşesc valoarea xi . Avem că
Nxi
Fxi = f1 + f2 + . . . + fi sau Fxi = · 100%, i = 1, R.
N

- Aplicaţie. Distribuţia clienţilor ı̂n raport cu sortimentele de cafea servite ı̂ntr-o anumită zi la o
cafenea a fost:
a) Identificaţi populaţia statistică, unitatea statistică
Sortiment cafea Nr. clienţi şi volumul populaţiei statistice;
Naturală 21 b) Construiţi seriile de distribuţie unidimensionale cu
Cappuccino 32 frecvenţe derivate;
Espresso 43 c) Caracterizaţi variabila care stă la baza seriilor uni-
dimensionale.

Rezolvare. a) Populaţia statistică este reprezentată ı̂n acest caz de mulţimea clienţilor. Unitatea
statistică este clientul. Volumul populaţiei statistice este N = 21 + 32 + 43 = 96 clienţi.
b) Folosind tabelul de mai sus, se pot construi următoarele
 serii: 
Naturală Cappuccino Espresso
- Seria unidimensională cu frecvenţe absolute: X : , 96
21 32 43
- Seria unidimensională cu frecvenţe absolute cumulate:
   
Naturală Cappuccino Espresso Naturală Cappuccino Espresso
X: ⇔X:
21 21 + 32 21 + 32 + 43 21 53 96
6 Capitolul 1. Serii statistice

- Seria unidimensională cu frecvenţe relative:


   
Naturală Cappuccino Espresso Naturală Cappuccino Espresso
X: 21/96 32/96 43/96
⇔X: , 100%
21, 88% 33, 33% 44, 79%

- Seria unidimensională cu frecvenţe relative cumulate:


 
Naturală Cappuccino Espresso
X: .
21, 88% 55, 21% 100%

c) La baza seriilor unidimensionale de mai sus, se află variabila statistică X ce indică sortimentul
de cafea ales de clienţii cafenelei. Variabila X este atributivă şi calitativă. 

1.2.2. Serii statistice de distribuţie bidimensională


Seria statistică de distribuţie bidimensională este o construcţie ce reda distribuţia unei populaţii
ı̂n raport cu două variabile.
Astfel, fie populaţia statistică A studiată ı̂n raport cu variabilele X şi Y . Rezultatele observării se
pot grupa ı̂ntr-un tabel de forma următoare:
HH X
H x1 x2 ... xj ... xK T otal
Y HH
H
y1 N11 N12 ... N1j ... N1K N1·
y2 N21 N22 ... N2j ... N2K N2·
.. .. .. .. .. ..
. . . ... . ... . . (1.5)
yi Ni1 Ni2 ... Nij ... NiK Ni·
.. .. .. .. .. ..
. . . ... . ... . .
yL NL1 NL2 ... NLj ... NLK NL·
T otal N·1 N·2 ... N·j ... N·K N
unde:

Nij − reprezintă numărul de unităţi pentru care, variabila X ı̂nregistrează starea xj şi
variabila Y ı̂nregistrează starea yi ;
Ni· − reprezintă numărul de unităţi pentru care Y = yi , indiferent de nivelul ı̂nregistrat
de variabila X;
N·j − reprezintă numărul de unităţi pentru care X = xj , indiferent de nivelul ı̂nregistrat
de variabila Y ;
N − reprezintă numărul total de unităţi analizate, adică volumul populaţiei statistice.

Din seria bidimensională se pot extrage următoarele serii unidimensionale:


• Serii de repartiţie marginale ı̂n raport cu X şi Y :
   
x1 x2 . . . xj . . . xK y1 y2 . . . yi . . . yL
X: , respectiv Y : .
N·1 N·2 . . . N·j . . . N·K N1· N2· . . . Ni· . . . NL·

• Serii de repartiţie condiţionate:


1.2. Serii de distribuţie 7

- seria de repartiţie unidimensională ı̂n raport cu X, condiţionată de Y = yi


 
x1 x2 . . . xj . . . xK
X/Y =yi : , pentru orice i = 1, L;
Ni1 Ni2 . . . Nij . . . NiK

- seria de repartiţie unidimensională ı̂n raport cu Y , condiţionată de X = xj


 
y1 y2 . . . y i . . . y L
Y /X=xj : pentru orice j = 1, K.
N1j N2j . . . Nij . . . NLj

De asemenea se poate elabora sau deduce seria de repartiţie bidimensională formată cu frecvenţe
relative, unde:
Nij Ni· N·j
fij = , fi· = , f·j = , pentru orice i = 1, L, j = 1, K.
N N N

- Aplicaţie. Se consideră repartiţia angajaţilor unei firme de IT din Cluj-Napoca ı̂n funcţie de
venitul lunar (e) şi funcţia deţinută ı̂n firmă:
```
``` Venitul lunar
``` [100 − 500) [500 − 1000) [1000 − 3000)
Funcţia ```
``
Analist − 2 8
P rogramator 13 24 17

a) Precizaţi populaţia statistică, unitatea statistică şi volumul populaţiei statistice;


b) Extrageţi toate seriile de repartiţie unidimensionale cu frecvenţe absolute;
c) Construiţi seria bidimensională cu frecvenţe relative;
d) Care este procentul programatorilor cu venitul lunar de cel mult 1000e ?

Rezolvare. Pentru ı̂nceput, notăm variabilele statistice: X - venitul lunar şi Y - funcţia deţinută.
Rescriem tabelul de mai sus folosind notaţiile convenite şi totalurile aferente:
PP
X
[100 − 500) [500 − 1000) [1000 − 3000)
PP
PP T otal
Y P P
P
Analist − 2 8 10
P rogramator 13 24 17 54
T otal 13 26 25 64

a) Populaţia statistică analizată este reprezentată de mulţimea angajaţilor, unitatea statistică ce


formează populaţia este angajatul, iar volumul populaţiei statistice analizate este N = 64 angajaţi.
b) Seriile unidimensionale marginale sunt:
   
[100 - 500) [500 - 1000) [1000 - 3000) Analist Programator
X: , respectiv Y : .
13 26 25 10 54

Seriile condiţionate ı̂n raport cu variabila X sunt:


8 Capitolul 1. Serii statistice

 
[100 - 500) [500 - 1000) [1000 - 3000)
X/Y =Analist :
- 2 8
 
[100 - 500) [500 - 1000) [1000 - 3000)
respectiv, X/Y =P rogramator : .
13 24 17

Seriile condiţionate ı̂n raport cu variabila Y sunt:


   
Analist P rogramator Analist P rogramator
Y /X=[100−500) : , Y /X=[500−1000) :
- 13 2 24
 
Analist P rogramator
şi respectiv Y /X=[1000−3000) : .
8 17
c) Seria bidimensională cu frecvenţe relative se obţine din seria bidimensională cu frecvenţe abso-
N
lute, aplicând formula fij = Nij , pentru orice i = 1, 2 şi j = 1, 3. Obţinem seria bidimensională:
PP
X
[100 − 500) [500 − 1000) [1000 − 3000)
PP
PP T otal
Y P P
P
Analist − 0, 03 0, 13 0, 16
P rogramator 0, 20 0, 38 0, 26 0, 84
T otal 0, 20 0, 41 0, 39 1

sau, ı̂n procente:


PP
X
[100 − 500) [500 − 1000) [1000 − 3000)
PP
PP T otal
Y P P
P
Analist − 3% 13% 16%
P rogramator 20% 38% 26% 84%
T otal 20% 41% 39% 100%

d) Din seria bidimensională cu frecvenţe relative constatăm că 58% din programatori obţin un
venit lunar de cel mult 1000e. 

1.2.3. Serii statistice de variaţie


Conform definiţiei, seria de variaţie redă variaţia unei mărimi ı̂n timp, ı̂n spaţiu sau de la o
categorie la alta. Ca urmare, ı̂n continuare vom vorbi de serii cronologice (au la bază o variabilă de
timp), serii de spaţiu (au la bază o variabilă de spaţiu) şi serii categoriale (au la bază variabile
atributive). Cele mai des ı̂ntâlnite sunt seriile cronologice şi seriile de spaţiu.
Seriile de variaţie au la bază mărimi absolute şi relative. După unii autori, din cadrul mărimilor
absolute fac parte indicatorul de nivel şi diferenţa absolută a unei mărimi, iar din cadrul mărimilor
relative fac parte indicatorul relativ de intensitate, indicele statistic şi diferenţa relativă a unei mărimi.
Indicatorul de nivel (Y ) este o mărime ce reflectă nivelul unui fenomen analizat. De exemplu:
producţia diferitelor produse, veniturile populaţiei, suprafaţa cultivată cu principalele culturi agricole,
transportul, exportul, importul, etc.
1.2. Serii de distribuţie 9

Diferenţa absolută a unei mărimi (∆Y ) exprimă diferenţa dintre nivelul cercetat şi nivelul bază
de comparaţie al mărimii analizate. Se exprimă ı̂n aceeaşi unitate de măsură ı̂n care este cuantificat
fenomenul analizat şi ne arată cu cât s-a modificat acesta de la un nivel la altul.
Indicele statistic al unei mărimi (IY ) exprimă raportul dintre nivelul cercetat şi nivelul bază
de comparaţie al mărimii analizate. Ne arată de câte ori se modifică acea mărime, de la un nivel la
altul.
Diferenţa relativă a unei mărimi (RY ) exprimă raportul dintre diferenţa absolută a mărimii
respective şi nivelul bază de comparaţie al acesteia. Ne arată cu cât la sută se modifică mărimea de
la un nivel la altul.
Indicatorul relativ de intensitate (d) se defineşte ca raport ı̂ntre doi indicatori de nivel de
natură diferită şi arată gradul de răspândire a fenomenului cuantificat de indicatorul de la numărător
ı̂n raport cu fenomenul cuantificat de indicatorul de la numitor. De exemplu: producţia diferitelor
culturi/ha, densitatea populaţiei, producţia principalelor produse/locuitor, rata şomajului, etc.

Serii cronologice
Seria cronologică reflectă evoluţia ı̂n timp a unei mărimi.
Valorile variabilei ca funcţie de timp pot fi fixate la un anumit moment de timp sau să se refere la
un interval de timp.
Seria cronologică de momente este o serie de observaţii ordonate ı̂n timp, exprimând stocuri
[Trebici V., 1985]. De exemplu: volumul populaţiei, numărul de universităti, bănci, instituţii, fonduri
fixe, numărul salariaţilor, ı̂ntreprinderile mici şi mijlocii din diferite domenii de activitate, unităţile
de cazare turistică, etc. Într-o astfel de serie ı̂nsumarea mărimii analizate nu are sens din punct de
vedere al conţinutului, aceasta fiind permisă din considerente de calcul, ajustări etc.
Seria cronologică de intervale este o serie de observaţii ordonate ı̂n timp exprimând fluxuri. De
exemplu: născuţii vii, divorţurile, decesele, producţia diferitelor culturi sau produse, venituri, cheltu-
ieli, producţia industrială, agricolă, exportul, importul etc. Într-o astfel de serie are sens ı̂nsumarea
mărimii analizate.
Fie o serie cronologică de momente sau de intervale ce reflectă evoluţia ı̂n timp a nivelului unei
mărimi Y ,  
0 1 2 ... t ... T
Y : (1.6)
y0 y1 y2 . . . yt . . . yT
Pornind de la această serie se pot deduce seriile formate cu diferenţe absolute, indici statistici şi
diferenţe relative. În funcţie de modul de raportare a stărilor variabilei timp t, mărimile de mai sus
se pot calcula cu bază fixă (t/t0 ) (baza de comparaţie rămâne aceeaşi) sau cu bază ı̂n lanţ (t/t − 1)
(baza de comparaţie se schimbă, fiind considerată cea precedentă nivelului comparat).

Fie seriile cronologice formate cu:


• diferenţe absolute cu bază fixă:
!
0 1 2 ... t ... T
∆t/t
y
0
: 1/0 2/0 t/0 T /0 (1.7)
0 ∆y ∆y . . . ∆y . . . ∆y

t/0
unde ∆y = yt − y0 , pentru orice t = 0, T ;
• diferenţe absolute cu bază ı̂n lanţ:
!
0 1 2 ... t ... T
∆yt/t−1 : 1/0 2/1 t/t−1 T /T −1 (1.8)
− ∆y ∆y . . . ∆y . . . ∆y
10 Capitolul 1. Serii statistice

t/t−1
unde ∆y = yt − yt−1 , pentru orice t = 1, T .
Între cele două tipuri de diferenţe absolute cu bază fixă şi cu bază ı̂n lanţ, există relaţii de legătură
ce ne permit exprimarea unora ı̂n funcţie de celelalte. În acest context, ı̂nsumând diferenţele absolute
cu bază ı̂n lanţ se obţin diferenţele absolute cu bază fixă:

∆t/0 1/0 2/1 t/t−1


y = ∆y + ∆y + . . . + ∆y , pentru orice t = 1, T .

Scăzând diferenţele succesive cu bază fixă se obţin diferenţele cu bază ı̂n lanţ:

∆t/0 t−1/0
y − ∆y = yt − y0 − yt−1 + y0 = ∆t/t−1
y .

Diferenţa absolută ne arată cu cât se modifică mărimea analizată de la un moment la altul. Se


exprimă ı̂n aceeaşi unitate de măsură ı̂n care este cuantificat fenomenul studiat.
Dacă fenomenul analizat se exprimă valoric, atunci diferenţa absolută nu reflectă prea bine mo-
dificările ce intervin, impunându-se utilizarea mărimilor relative precum indicele statistic şi diferenţa
relativă.

Fie seriile cronologice formate cu:


• indici statistici cu bază fixă
!
0 1 2 ... t ... T
Iyt/t0 : 1/0 2/0 t/0 T /0 (1.9)
1 Iy Iy . . . Iy . . . Iy

t/0 yt
unde Iy = (·100%), pentru orice t = 0, T ;
y0
• indici statistici cu bază ı̂n lanţ
!
0 1 2 ... t ... T
Iyt/t−1 : 1/0 2/1 t/t−1 T /T −1 (1.10)
− Iy Iy . . . Iy . . . Iy

t/t−1 yt
unde Iy = (·100%), pentru orice t = 1, T .
yt−1
Între cele două tipuri de indici există următoarele relaţii de legătură:
- Facând produsul indicilor cu bază ı̂n lanţ până la o anumită stare a variabilei t, se obţine indicele
cu bază fixă al clasei respective.
y1 y2 yt
Iy1/0 · Iy2/1 · . . . · Iyt/t−1 = · · ... · = Iyt/0 , pentru orice t = 0, T .
y0 y1 yt−1

- Împărţind doi indici succesivi cu bază fixă se obţine un indice cu bază ı̂n lanţ:
t/0
Iy yt y0 yt
t−1/0
= · = = Iyt/t−1 , pentru orice t = 1, T .
Iy y0 yt−1 yt−1

Indicele statistic ne arată de câte ori se modifică fenomenul analizat. Este mărimea cel mai des
folosită ı̂n caracterizarea evoluţiei fenomenelor din economie.

Având ca bază de referinţa o serie cronologică de forma (1.7) se pot elabora serii formate cu:
1.2. Serii de distribuţie 11

• diferenţe relative cu bază fixă


!
0 1 2 ... t ... T
Ryt/t0 : 1/0 2/0 t/0 T /0 (1.11)
0 Ry Ry . . . Ry . . . Ry

t/0
t/0 ∆y yt − y0 yt
unde Ry = = = − 1 = (I t/0 − 1)(·100%), pentru orice t = 0, T ;
y0 y0 y0
• diferenţe relative cu baza ı̂n lanţ
!
0 1 2 ... t ... T
Ryt/t−1 : 1/0 2/1 t/t−1 T /T −1 (1.12)
− Ry Ry . . . Ry . . . Ry

t/t−1
t/t−1 ∆y yt − yt−1 yt
unde Ry = = = − 1 = (I t/t−1 − 1)(·100%), pentru orice t = 1, T .
yt−1 yt−1 yt−1
Această mărime la fel ca şi indicele statistic, se foloseşte frecvent ı̂n caracterizarea fenomenelor din
economie.

- Aplicaţie. Evoluţia producţiei de grâu (mil. tone) ı̂nregistrată ı̂n România, ı̂n perioada 2013 -
2016 este redată ı̂n seria cronologică de mai jos:
 
2013 2014 2015 2016
Y :
7,2 7,4 7,8 8,4
Calculaţi si interpretaţi diferenţele absolute, indicii statistici şi diferenţele relative cu bază fixă şi bază
ı̂n lanţ.

Rezolvare. Pentru simplificare, vom interpreta rezultatele doar pentru anul 2016. În mod analog,
se pot face interpretări şi pentru ceilalţi ani.
Seria diferenţelor absolute cu bază fixă este:
   
t/0 2013 2014 2015 2016 t/0 2013 2014 2015 2016
∆y : ⇔ ∆y :
7, 2 − 7, 2 7, 4 − 7, 2 7, 8 − 7, 2 8, 4 − 7, 2 0 0,2 0,6 1,2

Se observă că producţia din anul 2016 a fost cu 1, 2 mil. tone mai mare decât producţia din anul 2013.
Seria diferenţelor absolute cu bază ı̂n lanţ este:
   
t/t−1 2013 2014 2015 2016 t/t−1 2013 2014 2015 2016
∆y : ⇔ ∆y :
7, 2−? 7, 4 − 7, 2 7, 8 − 7, 4 8, 4 − 7, 8 − 0,2 0,4 0,6

Se observă că producţia din anul 2016 a fost cu 0, 6 mil. tone mai mare decât producţia din anul 2015.
Seria indicilor statistici cu bază fixă este:
   
2013 2014 2015 2016 2013 2014 2015 2016
Iyt/0 : 7,2 7,4 7,8 8,4 ⇔ Iy
t/0
:
7,2 7,2 7,2 7,2 1 1,03 1,08 1,17

Se observă că producţia din anul 2016 a fost de 1, 17 ori mai mare decât producţia din anul 2013.
Seria indicilor statistici cu bază ı̂n lanţ este:
   
2013 2014 2015 2016 2013 2014 2015 2016
Iyt/t−1 : 7,2 7,4 7,8 8,4 ⇔ I t/t−1
y :
? 7,2 7,4 7,8 − 1,028 1,054 1,077
12 Capitolul 1. Serii statistice

Se observă că producţia din anul 2016 a fost de 1, 077 ori mai mare decât producţia din anul 2015.
Seria diferenţelor relative cu bază fixă este:
   
t/0 2013 2014 2015 2016 t/0 2013 2014 2015 2016
Ry : ⇔ Ry :
1 − 1 1, 03 − 1 1, 08 − 1 1, 17 − 1 0% 3% 8% 17%

Se observă că producţia din anul 2016 a fost cu 17% mai mare decât producţia din anul 2013.
Seria diferenţelor relative cu bază ı̂n lanţ este:
   
t/t−1 2013 2014 2015 2016 t/t−1 2013 2014 2015 2016
Ry : ⇔ Ry :
1−? 1, 028 − 1 1, 054 − 1 1, 077 − 1 − 2,8% 5,4% 7,7%

Se observă că producţia din anul 2016 a fost cu 7, 7% mai mare decât producţia din anul 2015. 

1.2.4. Serii statistice de spaţiu (teritoriale)


Seria statistică de spaţiu este o construcţie statistică ce reflectă variaţia ı̂n spaţiu a unei mărimi. Se-
ria de spaţiu prezintă o importanţă din ce ı̂n ce mai mare, datorită dezvoltării sistemului informaţional,
a necesităţii comparaţiilor internaţionale şi a comparaţiilor ı̂ntre regiunile unei ţări.
În cadrul Anuarului Statistic al României există capitole distincte de Statistică teritorială şi Sta-
tistică internaţională. În capitolul de Statistică teritorială sunt cuprinse informaţii privind: populaţia,
forţa de muncă, condiţiile de muncă, veniturile populaţiei, cheltuielile şi consumul populaţiei, locuinţe,
asistenţă socială, sănătate, ı̂nvăţământ, cultură, sport, conturi naţionale, rezultate şi performanţe
ale ı̂ntreprinderilor, agricultură, silvicultură, industrie, transporturi, poştă, telecomunicaţii, turism,
finanţe, justiţie şi starea infracţională, pe cele 7 regiuni şi Bucureşti.
La baza seriei de spaţiu se găsesc atât mărimi absolute (indicator de nivel, diferenţa absolută), cât
şi mărimi relative (indicator relativ de intensitate, indicele statistic, diferenţa relativă).
Fie seria statistică Z, de forma următoare:
 
s0 s1 s2 . . . si . . . sK
Z: (1.13)
z 0 z1 z2 . . . z i . . . z K

unde:

si − este o stare a variabilei ce exprimă spaţiul, i = 0, K;


zi − exprimă o mărime (indicator de nivel sau relativ de intensitate), i = 0, K.

Plecând de la seria de forma (1.13) se pot deduce seriile formate cu:


• diferenţe absolute cu bază fixă
!
s/s0 s0 s1 s2 ... si ... sK
∆Z : s1 /s0 s /s0 si /s0 sK /s0 (1.14)
0 ∆z ∆z2 . . . ∆z . . . ∆z

s /s0
unde: ∆zi = zi − z0 , pentru orice i = 0, K.
• indicii statistici cu bază fixă
!
s/s s0 s1 s2 ... si ... sK
IZ 0 : s /s s /s0 s /s s /s (1.15)
1 Iz 1 0 Iz 2 . . . Iz i 0 . . . Iz K 0

s /s0 zi
unde: Iz i = (·100%), pentru orice i = 0, K.
z0
1.3. Observarea statistică 13

• diferenţe relative cu bază fixă


!
s/s0 s0 s1 s2 ... si ... sK
RZ : s1 /s0 s /s0 si /s0 sK /s0 (1.16)
0 Rz Rz2 . . . Rz . . . Rz

s /s0
s /s0 ∆zi zi − z 0 s /s
unde: Rzi = = = (Iz i 0 − 1)(·100%), pentru orice i = 0, K.
z0 z0

- Aplicaţie. Seria statistică de mai jos arată valorile PIB/loc (e) ı̂n unele state membre ale Uniunii
Europene ı̂n anul 2009.
 
România Cehia Ungaria Bulgaria Slovacia Slovenia
S:
5900 13000 9100 4600 12600 18200
Calculaţi şi interpretaţi parametrii specifici seriilor de spaţiu.

Rezolvare. Seria formată cu diferenţe absolute cu bază fixă este:


 
s/s0 România Cehia Ungaria Bulgaria Slovacia Slovenia
∆S :
0 7100 3200 -1300 6700 12300

Constatăm că PIB/loc al Bulgariei a fost mai mic cu 1300e faţă de PIB/loc al României.
Seria formată cu indicii statistici cu bază fixă este:
 
s/s0 România Cehia Ungaria Bulgaria Slovacia Slovenia
IS :
1 2,20 1,54 0,78 2,14 3,08

Constatăm că PIB/loc al Sloveniei a fost de 3, 08 ori mai mare faţă de PIB/loc al României.
Seria formată cu diferenţe relative cu bază fixă este:
 
s/s0 România Cehia Ungaria Bulgaria Slovacia Slovenia
RS :
0% 120% 54% -22% 114% 208%

Constatăm că PIB/loc al Sloveniei a fost cu 208% mai mare faţă de PIB/loc al României. 

1.3 Observarea statistică


Observarea statistică constituie prima etapă ı̂n cadrul studierii fenomenelor sociale, economice sau
de altă natură, etapă ı̂n care se culeg datele statistice despre fenomenul supus cercetării. Cercetarea
fenomenelor respective presupune cunoaşterea populaţiei statistice ı̂n vederea surprinderii acţiunii
legilor care acţionează la nivelul acesteia. De calitatea acestei etape, ı̂ntr-un proces de cercetare
statistică, depinde şi calitatea rezultatelor obţinute ı̂n celelalte faze.
Observarea statistică presupune identificarea, urmărirea şi ı̂nregistrarea, după reguli unitare şi pre-
cise, a nivelului atins de variabilele statistice studiate pentru unităţile din care este formată populaţia
[Florea I., 1998].
Pentru asigurarea unor date, rezultate din observare, valide şi pertinente se impun câteva precizări.
În primul rând, observarea statistică presupune urmărirea şi ı̂nregistrarea unui număr mare de unităţi
statistice, ceea ce implică un volum mare de muncă. În al doilea rând, pentru ca cercetarea populaţiei
să-şi atingă scopul, trebuie precizate care sunt variabilele ı̂n raport cu care este studiată populaţia.
Variabilele statistice ce urmează să fie urmărite şi ı̂nregistrate la nivelul fiecărei unităţi din populaţie,
14 Capitolul 1. Serii statistice

trebuie să fie esenţiale şi să prezinte interes din punct de vedere al studiului ı̂ntreprins. În al treilea
rând, trebuie stabilite criterii exacte pentru delimitarea corectă a unităţilor statistice care alcătuiesc
populaţia. Şi nu ı̂n ultimul rând, dacă observarea şi ı̂nregistrarea datelor este făcută de mai multe
persoane, este necesar ca acestea să se alinieze unei metodologii unitare pentru a asigura corectitudinea
necesară datelor rezultate.
Observarea statistică, ca primă etapă ı̂ntr-un studiu de cercetare, presupune: specificarea unităţilor
statistice care trebuie să fie urmărite şi ı̂nregistrate, alegerea variabilelor statistice care caracterizează
cel mai bine populaţia şi care răspund obiectivului urmărit, ı̂nregistrarea stărilor variabilelor statistice
considerate.
Atingerea scopului cercetării statistice presupune rezolvarea următoarelor probleme care să asigure
o pregătire ştiinţifică a observării statistice:
- delimitarea populaţiei supuse observării;
- definirea unităţilor statistice de observat;
- timpul şi locul unde va avea loc observarea;
- programul observării;
- alegerea purtătorilor de informaţie;
- pregătirea persoanelor ce urmează să facă observarea.
Fiecăreia din aceste probleme trebuie să i se acorde importanţa cuvenită, fiindcă fiecare dintre
ele conduce la o pregătire cât mai completă a observării, de rezultatele căreia depinde corectitudinea
celorlalte etape ale cercetării statistice.
Delimitarea populaţiei supuse observării faţă de alte populaţii statistice cu care aceasta se află ı̂n
legătură se realizează prin evidenţierea ı̂nsuşirilor şi trăsăturilor comune ce caracterizează populaţia
supusă studiului.
Definirea unităţilor statistice de observat presupune claritate şi precizie pentru a nu da loc confuzi-
ilor. În momentul observării trebuie cunoscut exact care sunt unităţile statistice ce trebuie ı̂nregistrate
ı̂n raport cu variabilele de studiat.
Stabilirea timpului şi a locului unde va avea loc observarea are importanţă din punct de vedere a
comparabilităţii datelor rezultate din observare. Noţiunea de timp al observării are ı̂n statistică două
accepţiuni:
- momentul sau perioada la care se referă datele ı̂nregistrate (timpul de referinţă);
- durata observării.
Locul observării reprezintă punctul din spaţiu ı̂n care se derulează procesul supus cercetării (incinta
unei ı̂ntreprinderi, a unui magazin, o localitate ı̂n cazul ı̂n care populaţia o reprezintă familiile, etc.).
În cadrul programului observării statistice trebuie stabilite variabilele statistice care urmează să fie
studiate ı̂n populaţia de cercetat. Alegerea şi definirea variabilelor statistice trebuie să fie ı̂n consens
cu natura populaţiei şi obiectivul cercetării statistice ı̂ntreprinse. Variabilele statistice care fac parte
din programul cercetării trebuie să surprindă aspectele esenţiale, să expliciteze fenomenul sau procesul
studiat, să permită prelucrarea şi generalizarea acestora la nivelul ı̂ntregii populaţii.
Alegerea purtătorilor de informaţie se face ı̂n funcţie de volumul datelor ce urmează a fi ı̂nregistrate.
Purtătorii de informaţie reprezintă suporţii materiali pe care se ı̂nregistrează datele din observarea
unităţilor statistice.
Observarea statistică se poate desfăşura ı̂n diverse forme ı̂n raport cu: natura proceselor social-
economice de studiat, obiectivul cercetării, formele de organizare cât şi posibilităţile practice de
urmărire şi ı̂nregistrare a unităţilor statistice din populaţie.
După cum se ştie, ı̂n raport cu gradul de cuprindere al populaţiei considerate avem: observarea
totală şi observarea parţială. Observarea totală permite ı̂nregistrarea, ı̂n raport cu variabilele statistice
a tuturor unităţilor statistice din populaţie. Implicând un volum mare de muncă, antrenează, de obicei,
un număr de persoane şi durează mult timp. Ca urmare se creează condiţii pentru apariţia de erori
1.3. Observarea statistică 15

de observare, ceea ce va conduce la micşorarea eficienţei observării. Forma cea mai frecventă de
observare totală o constituie recensământul populaţiei. Observarea totală se practică şi ı̂n domeniul
controlului tehnicii de calitate, ı̂n cazul produselor de ı̂naltă tehnicitate, cum ar fi: televizoare, maşini
de spălat, frigidere, automobile, etc. Este necesară o observare totală ı̂n acest caz, deoarece constatarea
defecţiunilor de către cumpărători ar implica cheltuieli mult mai mari cu remedierea acestora ı̂n
comparaţie cu organizarea unei observări totale a loturilor de produse ce urmează a fi scoase pe
piaţă.
În cazul altor produse, unde cheltuielile legate de remedierea defectelor sunt nesemnificative, este
suficientă realizarea unor observări parţiale prin care să se asigure că rebuturile nu depăşesc un anumit
procent admis. O astfel de observare, care include doar o parte din unităţile populaţiei supuse studiului
corespunde observării parţiale. Observarea parţială constituie o alternativă la observarea totală ı̂n
cazul populaţiilor infinite sau chiar dacă sunt finite prin observare are loc distrugerea acestora. Având
la bază procedeul observării parţiale se pot evalua rezervele de ţiţei, cărbune sau alte minerale, se
poate evalua masa de material lemnos din fondul silvic al unei zone sau la nivelul ı̂ntregii ţări. În
general, observarea parţială se recomandă ı̂n toate cazurile ı̂n care se consideră mai avantajoasă decât
observarea totală.
Eşantionul, ca rezultat al observării parţiale, presupune respectarea cu stricteţe a principiului
reprezentativităţii, ı̂n conformitate cu care fiecare unitate statistică din populaţia generală să aibă
aceeaşi şansă de a face parte din eşantion. Asigurarea respectării principiului reprezentativităţii ı̂n
formarea eşantionului de observat permite acestuia o structură foarte apropiată cu cea a populaţiei
din care a fost format. Aceasta ne asigură, cu o anumită probabilitate dinainte fixată, că rezultatele
obţinute la nivelul eşantionului pot fi extinse la nivelul ı̂ntregii populaţii. În raport cu legea de
probabilitate urmată de variabilele urmărite ı̂n populaţia generală sunt două tipuri de eşantioane:
eşantioane de volum mare şi eşantioane de volum redus.
Observarea statistică ı̂n raport cu procedeul folosit este de două feluri:
- observarea directă;
- observarea indirectă.
Observarea directă presupune o observare nemijlocită a unităţilor din populaţie, care sunt prevăzute
pentru cercetare. Acest mod de observare se realizează printr-un contact direct cu unităţile statistice,
fie prin măsurare, fie prin interogare, dacă unităţile sunt persoane. Acest procedeu permite observato-
rului perceperea nemijlocită a fenomenelor luate ı̂n studiu ı̂n vederea măsurării nivelelor ı̂nregistrate
de variabilele considerate.
Observarea indirectă presupune un intermediar ı̂ntre unităţile care urmează să fie supuse observării
şi observator. Intermediarul poate fi un document special conceput ı̂n vederea observării şi atunci
observarea este pe bază de document sau intermediarul poate fi o altă persoană decât observatorul,
caz ı̂n care avem observare prin interogare.
Suportul pentru culegerea datelor ı̂l reprezintă chestionarul.

Sistematizarea şi prezentarea datelor statistice


Sistematizarea constituie o etapă ı̂n cadrul prelucrării datelor statistice ı̂n vederea prezentării
acestora sub formă de serii statistice (tabele statistice).
Datele obţinute ca urmare a procesului de observare statistică, ı̂n forma lor brută, permit o ca-
racterizare amănunţită a fiecărei unităţi din populaţia considerată. Deoarece, datele rezultate din
observare se prezintă sub formă dezorganizată, nu permit o caracterizare a populaţiei ı̂n ansamblu.
În vederea atingerii scopului cercetării statistice ı̂ntreprinse şi anume acela de a da o caracterizare
de ansamblu populaţiei considerate, este necesar ca datele rezultate din observare să fie supuse unor
operaţii de sistematizare şi prezentare ı̂n vederea deducerii a ceea ce este esenţial, tipic şi general ı̂n
legătură cu populaţia.
16 Capitolul 1. Serii statistice

Deoarece ı̂n prelucrarea statistică primul pas ı̂l constituie prezentarea datelor observate sub formă
de serie (tabel), pentru construirea seriilor statistice se aleg variabilele care trebuie să fie ı̂n strânsă
dependenţă cu scopul cercetării şi cu natura fenomenului cercetat. Odată precizate variabilele de la
baza seriei, se ştie care va fi conţinutul primului şir de date şi ca urmare este elucidat criteriul ı̂n
raport cu care informaţiile rezultate din observare vor fi ordonate, necunoscându-se ı̂nsă cum se face
propriu-zis ordonarea şi cum se completează primul şir al seriei.
Operaţia de stabilire a claselor presupune ı̂mpărţirea unităţilor unei populaţii ı̂n clase distincte ı̂n
raport cu una sau mai multe variabile şi aranjarea claselor rezultate ı̂ntr-o anumită ordine. În urma
unei asemenea operaţii, fiecare unitate trebuie să se găsească ı̂n una şi numai una din clasele rezultate.
Această operaţie nu trebuie să conducă la pierderi de unităţi, regăsindu-se ı̂nsa ı̂ntr-o altă ordine decât
cea după care s-a realizat observarea.
Omogenitatea constituie o proprietate de bază pe care trebuie să o aibă clasele. Se spune că o clasă
este omogenă dacă, pentru unităţile care fac parte din ea, variabila de grupare ı̂nregistrează variaţii
nesemnificative.
În cele ce urmează se va prezenta operaţia de stabilire a claselor ı̂n cazul unei serii unidimensionale.
Dacă la baza seriei avem o variabilă calitativă, atunci clasele se stabilesc ı̂n raport cu stările
acesteia. Pentru fiecare stare a variabilei se va construi o clasă. Ca urmare, ı̂n acest caz, ı̂ntr-o clasă
vor intra toate unităţile care au ı̂nregistrat aceeaşi stare ı̂n timpul observării ı̂n raport cu variabila
considerată.
În cazul unei serii care are la bază o variabilă cantitativă discretă (numărul stărilor nu este prea
mare), clasele se stabilesc ı̂n mod asemănător ca şi la variabilele calitative, respectiv:
 
x1 x2 . . . x R
X: .
N1 N2 . . . NR

În condiţiile ı̂n care cercetarea populaţiei presupune elaborarea unei serii care are la bază o variabilă
cantitativă continuă sau o variabilă cantitativă discretă, dar care ı̂n populaţia considerată ı̂nregistrează
un număr prea mare de stări, clasele nu se mai pot stabili cu ajutorul stărilor variabilei. Pentru
asemenea cazuri, gruparea unităţilor populaţiei ı̂n clase se face cu ajutorul intervalelor de grupare
(variaţie), fiecare interval cuprinzând un număr oarecare de valori ale variabilei. Ca urmare, pentru o
serie continuă, clasele se definesc cu ajutorul intervalelor de grupare.
Două probleme se pun ı̂n cazul elaborării unei serii care are la bază o variabilă cantitativă continuă:
• determinarea lungimii intervalelor de variaţie;
• stabilirea formei de scriere a intervalelor de variaţie.
Determinarea lungimii intervalelor de variaţie conduce la două situaţii:
• serii construite cu intervale de lungime egală;
• serii construite cu intervale de lungime diferită.
Stabilirea numărului de intervale de variaţie trebuie să asigure satisfacerea următoarelor condiţii:
- informaţia care se pierde ı̂n urma operaţiei de grupare să nu fie prea mare, iar populaţia să nu
fie prea farâmiţată ı̂n raport cu variabilele de grupare;
- media aritmetică a fiecarei grupe (ı̂n raport cu valorile ı̂nregistrate) sa fie cât mai aproape de
centrul intervalului de variaţie respectiv;
- să nu existe grupe vide;
- reprezentarea grafică a seriei rezultate să permită conturarea unei regularităţi a fenomenului de
studiat din cadrul populaţiei. Trebuie remarcat că acest lucru nu este posibil nici ı̂n cazul unui număr
mic de intervale deoarece se pierd prea multe date, nici ı̂n cazul unui număr prea mare de intervale,
populaţia farâmiţându-se prea tare.
1.3. Observarea statistică 17

Dacă se doreşte elaborarea unei serii cu intervale de lungime egală, mai ı̂ntâi se va calcula lungimea
unui interval (λ), raportând ı̂ntregul interval de variaţie ([xmin , xmax ]) la numărul de intervale (R), ce
se doresc a fi obţinute. Mai precis,
xmax − xmin
λ= .
R
Se stabilesc apoi intervalele având ca punct de pornire valoarea minimă. Se elaborează seria de
intervale de lungime egală după cum urmează:

 
[xmin , xmin + λ] . . . [xmin + (i − 1)λ, xmin + iλ] . . . [xmin + (R − 1)λ, xmin + Rλ]
X: .
N1 ... Ni ... NR
Nu ı̂ntotdeauna ı̂mpărţirea domeniului de variaţie al variabilei ı̂n intervale de lungime egală este
relevantă din punct de vedere al scopului urmărit ı̂n ceea ce priveşte reliefarea tipurilor calitative din
cadrul populaţiei cercetate. Numeroase sunt cazurile practice ı̂n care studiul unei populaţii ı̂n raport
cu o variabilă sau mai multe presupune ı̂mpărţirea domeniilor de variaţie ale acestora ı̂n intervale de
lungime neegală. În asemenea cazuri nu există o relaţie de calcul ı̂n acest sens. Stabilirea intervalelor
de variaţie se face ı̂n directă legătură cu variaţia variabilelor şi distribuirea unităţilor ı̂n raport cu
acestea.
Dacă la baza seriei ı̂n cauză stau două sau mai multe variabile calitative sau cantitative atunci
clasele se stabilesc ı̂n raport cu fiecare din variabilele considerate prin stările acestora (vezi seria (1.5)).
Nu este recomandat ca numărul variabilelor ı̂n raport cu care se studiază populaţia să fie prea
mare, deoarece aceasta duce la o divizare exagerată a populaţiei pierzându-se din vedere aspectele
principale.
După ce clasele au fost definite, are loc repartizarea unităţilor populaţiei ı̂n clasele respective,
folosind ı̂n acest scop un algoritm adecvat.
Pentru elaborarea şi prezentarea seriilor statistice se apelează la pachete de programe statistice
cum ar fi: S.P.S.S. (Statistical Package for the Social Sciences), STATISTICA, S.A.S. (Statistical
Analysis System), STATGRAPHICS, etc.

- Aplicaţie. Managerul unui site informatic a contorizat numărul de tranzacţii online efectuate de
utilizatori pentru achiziţionarea unor produse. În decursul unei luni, numărul de tranzacţii efectuate
pe zi a fost: 31, 27, 12, 32, 34, 33, 33, 22, 27, 15, 31, 37, 43, 23, 25, 27, 41, 39, 11, 14, 21, 37, 24,
19, 30, 28, 34, 20, 27, 33. Construiţi o serie unidimensională continuă, cu frecvenţe absolute, care să
grupeze tranzacţiile efectuate ı̂n patru clase.

Rezolvare. Pentru ı̂nceput, vom ordona crescător şirul tranzacţiilor efectuate. Fie X variabila
statistică ce indică numărul de tranzacţii efectuate ı̂ntr-o zi. Stările variabilei X, ordonate crescător,
sunt: 11, 12, 14, 15, 19, 20, 21, 22, 23, 24, 25, 27, 27, 27, 27, 28, 30, 31, 31, 32, 33, 33, 33, 34, 34, 37,
37, 39, 41, 43.
Dorim să construim o serie statistică formată cu R = 4 clase (intervale). Cunoaştem valoarea
minimă xmin = 11 şi valoarea maximă xmax = 43. Lungimea unui interval este:
xmax − xmin 43 − 11
λ= = = 8.
R 4
Obţinem seria unidimensională continuă
 
[11, 19) [19, 27) [27, 35) [35, 43]
X: , 30.
4 7 14 5

18 Capitolul 1. Serii statistice

1.4 Reprezentări grafice


Reprezentarea grafică a unei serii ne dă o imagine geometrică (ı̂n plan sau spaţiu) cu privire la forma
statică sau evoluţia dinamică a fenomenului cuantificat de seria respectivă.
Graficul asociat unei serii constituie o imagine spaţială a fenomenului cercetat, permiţând evidenţi-
erea rapidă a structurii, dinamicii şi tendinţei de dezvoltare a acestuia. Reprezentările grafice sunt
folosite atât ı̂n scopul cunoaşterii populaţiei ı̂n cauză, cât şi pentru popularizarea unor rezultate din
diverse domenii de activitate.
Elaborarea completă şi corectă a unui grafic presupune elucidarea următoarelor elemente: titlul
graficului, scara de reprezentare, reţeaua graficului, semnele convenţionale şi notele.
Titlul graficului trebuie să fie scurt, clar şi semnificativ pentru conţinutul fenomenului reliefat prin
seria considerată.
Scara de reprezentare reuneşte mulţimea tuturor punctelor cotate. În cazul ı̂n care variabila
ı̂nregistrează valori mici, gradarea scării ı̂ncepe ı̂n principiu de la zero. Dacă variabila ı̂nregistrează
valori mari se consideră o altă origine stabilită cu aproximaţie. Pentru a nu ı̂ncărca prea mult desenul,
se recomandă reprezentarea pe scară doar a valorilor dispuse la un anumit interval convenabil ales.
Distanţele dintre doua puncte cotate consecutive se numeşte intervalul graficului. Când intervalele
sunt egale atunci avem scări uniforme. În caz contrar, avem scări neuniforme.
Reţeaua graficului permite identificarea cu uşurinţă ı̂n plan sau ı̂n spaţiu a punctelor cores-
punzătoare valorilor ı̂nregistrate de variabilele ı̂n cauză. Sistemul axelor rectangulare (ı̂n plan sau
spaţiu) constituie cea mai uzuală reţea ı̂n reprezentarea grafică a seriilor statistice.
Semnele convenţionale se pot materializa ı̂ntr-o reprezentare grafică fie prin inscripţii, fie printr-o
legendă. Inscripţia trebuie să fie scurtă şi semnificativă şi plasată cât mai bine ı̂n raport cu elementul
din grafic pe care ı̂l explicitează. Legenda se foloseşte pentru a explicita folosirea semnelor, culorilor
sau diverselor haşuri folosite ı̂n graficul ı̂n cauză. Legenda se plasează ı̂nafara graficului, ı̂n colţul din
stânga sau dreapta jos.
În cazul graficelor complexe, pentru o ı̂nţelegere mai bună, sunt necesare unele explicaţii, care se
dau sub formă de note. Notele generale privesc ı̂n ansamblu graficul şi se plasează chiar sub titlul
graficului. Notele speciale privesc porţiuni din grafic şi sunt legate de acestea prin diverse semne de
trimitere. Notele se plasează ı̂n partea de jos a diagramei, ı̂n colţul din stânga, sub reţea.
În continuare, vom prezenta principalele tehnici de construire a graficelor utilizate ı̂n reprezentarea
seriilor statistice.

Histograma
Graficul specific seriilor care au la bază o variabilă continuă (de intervale) este histograma. Aceasta
se construieşte ı̂ntr-un sistem de axe rectangulare după cum urmează: pe abscisă se trec intervalele de
variaţie, iar pe ordonată se trasează scara frecvenţelor. Scara frecvenţelor se construieşte ı̂n confor-
mitate cu respectarea principiului proporţionalităţii ı̂ntre frecvenţe şi segmentele delimitate pe scara
ordonatelor. Pentru fiecare interval de variaţie al seriei [xi−1 , xi ) se construieşte un dreptunghi a cărui
bază este chiar lungimea intervalului, iar cealaltă latură se determină din condiţia proporţionalităţii
ariei dreptunghiului cu mărimea indicatorului ı̂n clasa respectivă.
1.4. Reprezentări grafice 19

Latura necunoscută a dreptunghiului, notată


cu Li se determină din următoarea relaţie:

Li · li = k · Ni (1.17)

unde:
li = latura cunoscută a dreptunghiului cores-
punzător intervalului (xi−1 , xi );
Li = latura necunoscută a dreptunghiului co-
respunzător intervalului (xi−1 , xi );
Ni = frecvenţa absolută a clasei i;
k = coeficient de proporţionalitate care se
alege ı̂n raport cu scara de reprezentare.

Figura 1.1: Histograma

Din relaţia (1.17) găsim:


k · Ni
Li = , i = 1, R (1.18)
li
unde li = xi − xi−1 , adică diferenţa dintre limita superioară şi cea inferioară a intervalului de variaţie.
Mulţimea tuturor dreptunghiurilor astfel determinate, formează histograma ataşată seriei.
Poligonul frecvenţelor
Este o reprezentare grafică a seriilor statistice având la bază o variabilă atributivă cantitativă
continuă şi formată cu frecvenţe absolute sau relative, simple sau cumulate.
Trasarea acesteia presupune realizarea ı̂n prealabil a histogramei. Poligonul frecvenţelor se obţine
unind prin segmente de dreaptă mijloacele laturilor superioare ale dreptunghiurilor din care este
alcătuită histograma.
Poligonul frecvenţelor este un grafic important pentru aproximarea formei distribuţiei populaţiei
studiate, cât şi pentru compararea a două distribuţii pe aceeaşi diagramă.

- Aplicaţie. Se consideră repartiţia salariaţilor unei ı̂ntreprinderi ı̂n raport cu vechimea ı̂n muncă:
 
[0, 10) [10, 20) [20, 30) [30, 40) [40, 50]
V : , 50.
10 8 14 12 6

Construiţi histograma seriei de repartiţie, punând ı̂n evidenţă poligonul frecvenţelor.

Rezolvare. Pentru fiecare interval de variaţie a vechimii ı̂n muncă, vom calcula mai ı̂ntâi lungimea
intervalului. Avem: l1 = 10 − 0 = 10; l2 = 20 − 10 = 10; l3 = 30 − 20 = 10; l4 = 40 − 30 = 10;
l5 = 50 − 40 = 10.
Alegem factorul de proporţionalitate k = 10 şi folosind formula (1.18) găsim:
20 Capitolul 1. Serii statistice

k · N1 10 · 10
L1 = = = 10
l1 10
k · N2 10 · 8
L2 = = =8
l2 10
k · N3 10 · 14
L3 = = = 14
l3 10
k · N4 10 · 12
L4 = = = 12
l4 10
k · N5 10 · 6
L5 = = =6
l5 10
Figura 1.2: Distribuţia salariaţilor ı̂n funcţie
de vechimea ı̂n muncă


Diagramele cu benzi sau coloane (barchart)


Acest tip de grafic utilizează benzile (barele) sau coloanele pentru a reprezenta distribuţia unei
populaţii ı̂n raport cu o variabilă cantitativă discretă sau calitativă. Benzile au aceeaşi lăţime (bază),
iar lungimea (ı̂nălţimea) lor este direct proporţională cu frecvenţa clasei reprezentate. Numărul ben-
zilor este egal cu numărul claselor ı̂n care este ı̂mpărţită populaţia studiată. De asemenea se pot lua
ı̂n considerare o variabilă sau două.
În reprezentări se utilizează benzi simple sau benzi grupate. Poziţia benzilor poate fi orizontală
sau verticală.

- Aplicaţie. La un magazin alimentar, ı̂n decursul unei luni, s-au ı̂nregistrat următoarele date
privind consumul de ciocolată: 32 clienţi au cumpărat ciocolată M ilka, 40 clienţi ciocolată P oiana
şi 17 clienţi ciocolată Heidi. De asemenea, privind consumul de cafea, s-a constatat că: 50 clienţi
au cumpărat cafea Jacobs, 20 clienţi cafea T schibo, 10 clienţi cafea Amaroy. Reprezentaţi grafic
distribuţia clienţilor ı̂n raport cu ciocolata, respectiv cafeaua cumpărată.

Rezolvare. Pentru distribuţia clienţilor ı̂n raport cu sortimentul de ciocolată ales vom utiliza dia-
grama cu coloane, iar pentru distribuţia clienţilor ı̂n raport cu sortimentul de cafea ales vom utiliza
diagrama cu benzi.
1.4. Reprezentări grafice 21

Fie X variabila statistică ce indică sortimentul


de ciocolată. Seria de distribuţie este:
 
Milka Poiana Heidi
X: , 89.
32 40 17

Diagrama cu coloane corespunzătoare


distribuţiei clienţilor ı̂n raport cu variabila
calitativă X este prezentată ı̂n figura 1.3.

Figura 1.3: Distribuţia clienţilor ı̂n funcţie de


sortimentul de ciocolată cumpărat

Fie Y variabila statistică ce indică sortimentul


de cafea. Seria de distribuţie este:
 
Jacobs Tschibo Amaroy
Y : , 70.
50 20 10

Diagrama cu benzi corespunzătoare


distribuţiei clienţilor ı̂n raport cu varia-
bila calitativă Y este prezentată ı̂n figura
1.4.
Figura 1.4: Distribuţia clienţilor ı̂n funcţie de
sortimentul de cafea cumpărat


Cercul de structură
Cercul de structură permite punerea ı̂n evidenţă sub formă grafică a structurii unei populaţii
statistice.
Se construieşte un cerc de rază oarecare, a cărui suprafaţă se consideră că reprezintă volumul
ı̂ntregii populaţii ı̂n cauză (exprimat ı̂n frecvenţe absolute sau relative).
Fiecare clasă ı̂n care este divizată populaţia supusă studiului este reprezentată printr-un sector de
cerc de arie direct proporţională cu volumul clasei. Trasarea sectorului de cerc presupune determinarea
măsurii ı̂n grade a unghiurilor la centru a fiecărui sector. Unghiul la centru de 360◦ corespunde
volumului ı̂ntregii populaţii. Unghiurile sectoarelor de cerc care reprezintă clase din populaţie trebuie
să fie proporţionale cu volumul acestora (exprimat ı̂n frecvenţe absolute sau relative). clasei respective.
Fie, de exemplu, seria de distribuţie unidimensională formată cu frecvenţe absolute:
 
x1 x2 . . . xi . . . xR
X: , N.
N1 N2 . . . Ni . . . NR
Fie αi unghiul la centru corespunzător sectorului aferent clasei i, de volum Ni . Atunci:
360◦ · Ni
αi = = 360◦ · fi , i = 1, R (1.19)
N
22 Capitolul 1. Serii statistice

unde fi este frecvenţa relativă corespunzătoare clasei i.

- Aplicaţie. În urma alegerilor parlamentare pentru Camera Deputaţilor din anul 2016, partidele
politice din România au obţinut următoarele rezultate privind voturile valabil exprimate:
P SD PNL U SR U DM R ALDE PMP P RU P RM
45% 21% 10% 8% 6% 5% 3% 2%
Reprezentaţi grafic structura voturilor valabil exprimate pentru fiecare partid politic.

Rezolvare. Vom contrui cercul de structură folosind formula de calcul (1.19).

α1 = 360◦ · 45% = 162◦


α2 = 360◦ · 21% = 75, 6◦
α3 = 360◦ · 10% = 36◦
α4 = 360◦ · 8% = 28, 8◦
α5 = 360◦ · 6% = 21, 6◦
α6 = 360◦ · 5% = 18◦
α7 = 360◦ · 3% = 10, 8◦
α8 = 360◦ · 2% = 7, 2◦ .

Cercul de structură cu sectoarele aferente


fiecărui partid politic este prezentat ı̂n figura
1.5.
Figura 1.5: Structura Cemerei Deputaţilor


Cronograma (historiograma)
O categorie foarte importantă de serii o constituie seriile cronologice, a căror reprezentare grafică
se realizează prin intermediul cronogramei. Trasarea unei cronograme se realizează ı̂ntr-un sistem de
axe rectangulare.
Fie seria cronologică:  
0 1 2 ... t ... T
Y : ,
y0 y1 y2 . . . yt . . . yT
unde: t = 0, T , reprezintă momentele (sau perioadele) de timp care se reprezintă pe axa absciselor, iar
mărimile yt se reprezintă pe axa ordonatelor. Fiecărei perechi de valori (t, yt ), t = 0, T ı̂i corespunde
un punct ı̂n planul axelor rectangulare. Unind prin segmente de dreaptă punctele consecutive astfel
determinate, se obţine ceea ce se numeşte cronogramă. În acelaşi sistem de axe pot fi reprezentate
una sau mai multe serii cronologice, care pot fi exprimate ı̂n aceeaşi unitate de măsură sau ı̂n unităţi
de măsură diferite. Cronogramele asociate unor serii cronologice ne permit compararea fenomenelor
surprinse de asemenea serii şi sesizarea perioadelor critice ı̂n evoluţia acestora.

- Aplicaţie. Conform datelor Institutului Naţional de Statistică (IN S), evoluţia producţiei de ţiţei
(mii tone) din România, ı̂n perioada 2010-2015, este redată ı̂n tabelul de mai jos:

An 2010 2011 2012 2013 2014 2015


Producţie ţiţei (mii tone) 4314 4255 4010 4151 4072 4070
1.4. Reprezentări grafice 23

Reprezentaţi grafic seria cronologică.

Rezolvare. Cronograma aferentă producţiei de ţiţei din România, ı̂n perioada 2010-2015 este următoarea:

Figura 1.6: Cronograma producţiei de ţiţei




Norul de puncte
Norul de puncte constituie o modalitate de reprezentare grafică a seriilor atributive de distribuţie
bidimensionale. Se consideră o serie bidimensională de repartiţie ı̂n raport cu variabilele discrete X şi
Y . În sistemul de axe rectangulare xOy se marchează toate punctele de coordonate (xi , yj ), i = 1, L,
j = 1, K pentru care frecvenţele Nij 6= 0. Mărimea acestor frecvenţe se poate marca pe grafic ı̂n două
moduri:
- dacă frecvenţele sunt mici, atunci pentru fiecare punct de pe grafic (xi , yj ), i = 1, L, j = 1, K
pentru care Nij 6= 0, se marchează atâtea puncte de câte ori se repetă perechea respectivă.
- dacă ı̂nsă frecvenţele sunt prea mari, pentru marcarea lor pe grafic se pot utiliza diagrame areale
prin cercuri ale căror arii trebuie sa fie proporţionale cu rădăcina pătrată a frecvenţelor pe care le
reprezintă.
În cazul ı̂n care cele două variabile X şi Y sunt continue, ı̂ntrucât la intersecţia a două intervale
se formează o rubrică (căsuţă), frecvenţele diferite de zero se reprezintă ı̂n interiorul acestei rubrici,
fie prin puncte, fie prin diagrame areale cu respectarea unuia din cele două moduri de elaborare mai
sus amintite.

- Aplicaţie. Un produs a fost lansat simultan pe 13 pieţe. Pe aceste pieţe, produsul a fost propus la
preţuri diferite (P ), veniturile consumatorilor fiind şi ele diferite. Pentru fiecare piaţă s-a ı̂nregistrat
un anumit nivel al cererii (C), rezultatele fiind sintetizate ı̂n tabelul următor:

N r. crt. 1 2 3 4 5 6 7 8 9 10 11 12 13
C 15, 4 3, 2 4, 9 10, 5 8, 0 5, 1 7, 6 11, 3 14, 0 6, 4 13, 2 8, 8 12, 1
P 1, 4 5, 1 2, 5 1, 7 1, 8 3, 4 2, 1 1, 6 3, 6 3, 5 1, 9 1, 8 1, 9

Construiţi norul de puncte ı̂n raport cu variabilele preţ şi cerere.


24 Capitolul 1. Serii statistice

Rezolvare. Folosind datele ı̂nregistrate pentru preţ şi cerere, se poate construi următorul nor de
puncte:

Figura 1.7: Norul de puncte ı̂n raport cu preţul şi cererea




Cartograma şi cartodiagrama


Aceste tipuri de grafice se folosesc frecvent pentru reprezentarea grafică a seriilor statistice de
spaţiu.
Realizarea unei cartograme sau a unei cartodiagrame presupune conturarea spaţiului (sub formă
de hartă) ı̂n interiorul căruia se manifestă fenomenul care este cuantificat de seria de reprezentat. În
interiorul hărţii astfel realizate, prin diverse culori sau nuanţe ale aceleiaşi culori, prin haşuri sau prin
diferite diagrame, este evidenţiată intensitatea dezvoltării fenomenului cercetat precum şi mărimea
indicatorilor seriei.
Cartodiagrama constituie o modalitate de reprezentare grafică a seriilor de spaţiu, realizându-se
ca o ı̂mbinare ı̂ntre cartogramă şi diferite alte tipuri de diagrame, ca de exemplu diagrame prin benzi,
cerc, pătrat, dreptunghi, etc.
De exemplu, pentru a reprezenta
o serie de spaţiu ce exprimă volu-
mul investiţiilor străine pe judeţe,
la noi ı̂n ţară, se procedeaza
astfel: ı̂n primul rând se dese-
nează harta României, delimitându-
se judeţele; ı̂n cadrul fiecărui judeţ
se precizează volumul investiţiilor
străine sau se desenează o fi-
gură geometrică oarecare, convena-
bil aleasă, a cărei arie sau mărime
să fie direct proporţională cu volu-
mul investiţiilor străine din judeţul
respectiv. În figura alăturată
este reprezentată grafic cartograma
investiţiilor din judeţele României
ı̂n anul 2011.
(Sursa: https://www.gandul.info) Figura 1.8: Investiţiile din România ı̂n anul 2011
1.5. Teme de control 25

1.5 Teme de control


P1. Daţi cinci exemple de populaţii statistice a căror cercetare ar prezenta interes şi pentru fiecare
populaţie selectată precizaţi:

− denumirea populaţiei, a unităţii statistice şi volumul acesteia;


− scopul cercetării statistice;
− variabilele statistice ı̂n raport cu care s-ar face observarea statistică a populaţiei.

P2. Să se extragă din Anuarul Statistic sau alte surse informaţionale o serie statistică bidimensională
ce redă distribuţia unei populaţii ı̂n raport cu două variabile atributive, relativ la care se cere:

1. denumirea populaţiei ce a fost supusă observării şi volumul acesteia;


2. unitatea statistică;
3. caracterizarea variabilelor statistice ı̂n raport cu care a fost studiată populaţia;
4. caracterizarea seriei statistice ı̂n raport cu toate criteriile cunoscute;
5. elaborarea seriei bidimensionale formată cu frecvenţe relative, interpretare;
6. extragerea repartiţiilor unidimensionale marginale şi a celor condiţionate;
7. pornind de la o repartiţie marginală deduceţi celelalte serii statistice posibile, interpretare.

P3. Din Anuarul Statistic sau alte surse informaţionale extrageţi o serie statistică de repartiţie, având
la bază o variabilă de spaţiu, relativ la care se cere:

1. denumirea populaţiei statistice şi volumului ei;


2. unitatea statistică;
3. caracterizarea seriei după toate criteriile cunoscute;
4. deducerea seriei formată cu frecvenţe relative;
5. interpretare.

P4. Din Anuarul Statistic sau alte surse informaţionale extrageţi două serii cronologice având la bază
indicatorul de nivel, una de momente, alta de intervale şi deduceţi seriile formate cu diferenţe
absolute, indici statistici, diferenţe relative, cu bază fixă şi cu bază ı̂n lanţ (interpretări).

P5. Dati cinci exemple de serii cronologice având la bază indicatorul relativ de intensitate.

P6. Din Anuarul Statistic sau alte surse informaţionale extrageţi o serie de spaţiu formată cu indica-
tor de nivel sau indicator relativ de intensitate şi deduceţi seriile formate cu diferenţe absolute,
indici şi diferenţe relative, calculate cu bază fixă. Interpretare.

P7. Extrageţi cinci exemple de serii de spaţiu ce conţin informaţii importante pentru domeniul
economic.

P8. Luând ca exemplu o populaţie statistică studiată ı̂n raport cu un anumit număr de variabile
(stabilite ı̂n raport cu obiectivul studiului), se cere:

1. elaborarea tuturor seriilor statistice de repartiţie unidimensionale


2. elaborarea a trei serii statistice de repartiţie bidimensionale (una care are la bază două
variabile calitative, una care are la bază o variabilă calitativă şi o variabilă cantitativă,
respectiv una care are la bază două variabile cantitative)
26 Capitolul 1. Serii statistice

3. reprezentarea grafică a: histogramei, poligonului frecvenţelor, cercului de structură, diagra-


mei cu benzi sau coloane, norul statistic, cronograma şi cartograma.

Bibliografie:

1. Buiga A., Metodologie de sondaj şi analiza datelor ı̂n studiile de piaţă, Ed. Presa Universitară
Clujeană, Cluj-Napoca, 2001;

2. Buiga A., Dragoş C., Lazăr D., Parpucea I., Todea A., Statistică I, Ed. Presa Universitară
Clujeană, Cluj-Napoca, 2003;

3. Buiga A., Dragoş C., Lazăr D., Brendea G., Litan C., Mare C., Statistică Descriptivă, Ed.
Napoca Star, Cluj-Napoca, 2018;

4. Florea I., Parpucea I., Buiga A., Statistică descriptivă, Ed. Continental, Cluj-Napoca, 1998.
Capitolul 2

Parametrii repartiţiilor
unidimensionale

Secţiuni
2.1. Parametrii tendinţei centrale
2.2. Parametrii de structură
2.3. Parametrii variaţiei
2.4. Parametrii formei
2.5. Parametrii concentrării
2.6. Teme de control

Obiective
• Cunoaşterea şi ı̂nţelegerea modului de calcul şi a semnificaţiei parametrilor statistici
• Ilustrarea trăsăturilor esenţiale care caracterizează fenomenele social-economice
• Cunoaşterea şi măsurarea variaţiei unei mărimi ı̂n raport cu nivelul mediu al acesteia

Cuvinte cheie
• valoare medie, valoare mediană, valoare modală
• quantilă, quartilă, decilă, centilă
• variaţie, dispersie, abatere medie pătratică
• asimetrie, boltire
• energie informaţională

Rezultate aşteptate
Cunoaşterea modului de calcul şi a semnificaţiei parametrilor tendinţei centrale, a gradului de
reprezentativitate a mediei, respectiv a medianei, analiza structurii unei populaţii şi formularea unei
concluzii privind forma distribuţiei unei populaţii.

27
28 Capitolul 2. Parametrii repartiţiilor unidimensionale

2.1 Parametrii tendinţei centrale


Parametrii din această grupă au menirea de a evidenţia poziţia ı̂n jurul căreia se grupează ansamblul
valorilor unei variabile X de la baza unei serii. Această poziţie exprimată printr-un număr se numeşte
poziţie centrală. Ea poate fi evidenţiată prin:
− valoarea medie (notată M (X) sau X);
− valoarea mediană (notată Me );
− valoarea modală (notată Mo ).

v Valoarea medie
Valoarea medie reprezintă principalul parametru care caracterizează tendinţa centrală a unei
repartiţii statistice.
În vederea definirii parametrului valoarea medie se consideră o populaţie statistică studiată ı̂n
raport cu variabila cantitativă X şi o funcţie G(x1 , x2 , . . . , xR ) unde xi , i = 1, R , reprezintă stările
variabilei X. Funcţia G exprimă o anumită ı̂nsuşire esenţială, un atribut al populaţiei ı̂n raport cu
variabila X. Această funcţie se numeşte funcţie determinantă.
Prin definiţie, valoarea medie X a variabilei X este parametrul care lasă invariantă funcţia deter-
minantă, adică:

G(x1 , x2 , . . . , xR ) = G(X, X, . . . , X) (2.1)


Această egalitate se ı̂ntâlneşte sub denumirea de relaţia lui Boiarski-Kisini. În funcţie de forma
analitică a funcţiei G, din relaţia (2.1) se deduce expresia analitică (indicatorul) de calcul al valorii
medii X.
Determinarea, pe această cale, a valorii medii X, este destul de anevoioasă. Utilizarea acesteia
presupune stabilirea conţinutului (semnificaţiei) şi a formei analitice a funcţiei determinante G, pentru
fiecare caz ı̂n parte. Dar, valoarea medie X poate fi definită ca un raport a două mărimi din care se
deduce aceeaşi expresie pentru X ca şi din (2.1).
Există, aşadar, două modalităţi echivalente de definire a valorii medii, criteriul relaţiei determinante
a lui Boiarski-Kisini şi criteriul raportului, ultima fiind mai accesibilă. Criteriul raportului presupune
raportarea volumului fenomenului cercetat la volumul populaţiei. Acesta presupune cuantificarea
volumului fenomenului ı̂n funcţie de natura lui. Pentru a exemplifica cele prezentate mai sus, se
consideră populaţia familiilor dintr-o localitate, cercetata ı̂n raport cu numărul de copii. Datele
rezultate din observare se prezintă ca o serie de repartiţie de forma:
 
x1 x2 . . . x R
X:
N1 N2 . . . NR

În acest caz, funcţia determinantă are următoarea formă:


R
X
G(x1 , x2 , . . . , xR ) = xi · Ni
i=1

semnificând numărul total de copii din localitatea respectivă. Pentru a găsi numărul mediu de copii
pe familie se particularizează relaţia (2.1) după cum urmează
R
X R
X
xi · Ni = X · Ni
i=1 i=1
2.1. Parametrii tendinţei centrale 29

de unde rezultă:
R
X
xi · Ni
i=1
X= R
X
Ni
i=1

La acelaşi rezultat se putea ajunge pornind de la faptul că numărul mediu de copii pe familie se
poate exprima ca un raport ı̂ntre numărul total de copii şi numărul de familii din localitatea respectivă,
adică:
N r. total de copii
X= (2.2)
N r. de f amilii
În acest exemplu, fenomenul fiind de natură demografică, volumul acestuia se cuantifică prin
numărul total de copii la nivelul populaţiei statistice considerate. Aceasta este ı̂n directă concordanţă
cu natura şi semnificaţia variabilei ı̂n raport cu care se face cercetarea statistică.
Cunoaşterea ”naturii” parametrului valoare medie, conduce la o definiţie mai completă şi plină de
semnificaţie.
Pentru a ı̂nţelege semnificaţia valorii medii X, trebuie subliniat faptul că, ı̂n general, variaţia unui
fenomen, de orice natură, şi ı̂n particular variaţia unei variabile X ı̂n raport cu care este cercetată
o populaţie, este determinată de acţiunea simultană a două categorii de factori: factori esenţiali şi
factori neesenţiali.
În categoria factorilor esenţiali intră acei factori care acţionează asupra tuturor unităţilor populaţiei
ı̂n mod continuu şi ı̂n acelaşi sens, determinând, ı̂n principal, nivelul de dezvoltare a variabilei pentru
fiecare unitate componentă din populaţie.
Factorii esenţiali se conjugă ı̂n acţiunea lor cu factorii neesenţiali, care, ı̂n general, au un caracter
aleator, sunt numeroşi şi neuniform raspândiţi printre unităţile populaţiei.
Fiecare din factorii consideraţi neesenţiali acţionează numai asupra unui anumit număr de unităţi
din populaţie. Ca urmare, aceştia pot contribui fie la creşterea nivelului variabilei (pentru unele unităţi
din populaţie), fie la scăderea nivelului variabilei (pentru alte unităţi din populaţie).
La rândul lor factorii esenţiali nu acţionează cu aceeaşi intensitate asupra tuturor unităţilor din
cadrul populaţiei considerate, determinând, ı̂n acest fel, variaţia neuniformă a variabilei respective ı̂n
cadrul populaţiei.
În consens cu cele subliniate mai sus, se poate afirma că parametrul valoarea medie a unei serii
statistice care are la bază variabila X, constituie acel nivel pe care l-ar putea ı̂nregistra variabila ı̂n
cadrul populaţiei cercetate ı̂n condiţiile ı̂n care factorii neesenţiali nu s-ar fi manifestat, iar factorii
esenţiali ar fi acţionat asupra unităţilor din populaţie cu aceeaşi intensitate.
Parametrul valoarea medie, calculat pentru o serie statistică, pune ı̂n evidenţă ceea ce este comun,
general şi esenţial sub aspectul nivelului de dezvoltare al variabilei, ı̂n raport cu care este studiată o
populaţie.
În raport cu natura variabilei ce stă la baza seriei, cât şi a formei de prezentare a indicatorilor cu
care aceasta este construită, există mai multe posibilităţi de calcul a valorii medii.
Funcţia determinata G, sub forma sa cea mai generală, are următoarea expresie analitică:
R
X 1
k
G(x1 , x2 , . . . , xR ) = xki · fi (2.3)
i=1

Pentru diverse valori ale lui k, ı̂n strictă concordanţă cu conţinutul şi semnificaţia functi̧ei G, se
ı̂ntâlnesc mai multe tipuri de medii:
30 Capitolul 2. Parametrii repartiţiilor unidimensionale

− media armonică (k = −1);

− media aritmetică (k = 1);

− media pătratică (k = 2);

− media cubică (k = 3);

− media de ordinul k ı̂n general.

În caz concret, valoarea medie reală X este aceea care se obţine prin indicatorul (mediu) rezultat
fie prin aplicarea criteriului relaţiei determinante, fie criteriului raportului.

Modalităţi de calcul a valorii medii

1. Media aritmetică

Acesta este indicatorul cel mai utilizat ı̂n calculul parametrului valoare medie a unei serii statistice,
aşa cum rezultă din practica statistică.
Pentru o serie statistică de distribuţie cu frecvenţe absolute
 
x1 x2 . . . xi . . . xR
X:
N1 N2 . . . Ni . . . NR

valoarea medie este:


R
X
xi · Ni
i=1
X= R
(2.4)
X
Ni
i=1
ı̂n timp ce pentru o serie statistică de distribuţie cu frecvenţe relative
 
x1 x2 . . . xi . . . xR
X:
f1 f2 . . . fi . . . fR

valoarea medie este:


R
X
X= xi · fi (2.5)
i=1
Pentru o serie statistică continuă de distribuţie cu frecvenţe absolute
 
[x1 , x2 ) [x2 , x3 ) . . . [xi , xi+1 ) . . . [xR , xR+1 ]
X:
N1 N2 ... Ni ... NR

valoarea medie este:


R
X
mi · Ni
i=1
X= R
(2.6)
X
Ni
i=1
xi + xi+1
unde mi = , i = 1, R, este mijlocul intervalului i.
2
2.1. Parametrii tendinţei centrale 31

În mod analog, pentru o serie statistică continuă de distribuţie cu frecvenţe relative
 
[x1 , x2 ) [x2 , x3 ) . . . [xi , xi+1 ) . . . [xR , xR+1 ]
X:
f1 f2 ... fi ... fR

valoarea medie este:


R
X
X= mi · fi (2.7)
i=1

2. Media armonică

Considerăm o serie de forma


 
x1 x2 . . . xi . . . xR
X: (2.8)
N1 N2 . . . Ni . . . NR

În cazul unei serii discrete de forma (2.8), media armonică notată cu X −1 se defineste prin:
R
X
Ni
i=1
X −1 = R
(2.9)
X 1
· Ni
xi
i=1

numită şi formula mediei armonice ponderate.


Dacă ponderile sunt egale ı̂ntre ele, adică N1 = N2 = . . . = NR = N ∗ , atunci relatia (2.9) devine:
R
X
N∗
i=1 R
X −1 = R
= R
(2.10)
X 1 X 1
· N∗
xi xi
i=1 i=1

care reprezintă formula mediei armonice simple.


În cazul unei serii care are la bază o variabilă continuă X, respectiv,
 
[x1 , x2 ) [x2 , x3 ) . . . [xi , xi+1 ) . . . [xR , xR+1 ]
X:
N1 N2 ... Ni ... NR

procedând ca la media aritmetică, pentru media armonică rezultă:


R
X
Ni
i=1
X −1 = R
(2.11)
X 1
· Ni
mi
i=1

unde mi reprezintă mijlocul intervalului i, i = 1, R.


32 Capitolul 2. Parametrii repartiţiilor unidimensionale

Şi ı̂n acest caz, dacă ponderile sunt egale, se obţine relaţia de calcul a mediei armonice simple, de
forma:
R
X −1 = R (2.12)
X 1
mi
i=1

3. Media geometrică

Pentru o serie care are la bază variabila discretă X, formată cu frecvenţe absolute, media geometrică
notată cu Xg (sau Xo ) este definită prin expresia:
q
NR
xN N2
N
1 · x2 · . . . · xR
1
Xg = (2.13)

Din relaţia (2.13) pentru media geometrică ponderată exprimată cu frecvenţe relative se deduce:
q R
Y 1 R Ni R
N
xfi i
NR Ni
Y Y
N1
N N2
Xg = x1 · x2 · . . . · xR = xi = xiN = (2.14)
i=1 i=1 i=1

Dacă variabila X, de la baza seriei este de variaţie continuă, atunci relaţiile de calcul pentru diversele
variante de medie geometrică, rămân valabile cu singura modificare că valorile xi , i = 1, R, se ı̂nlocuiesc
cu mijloacele intervalelor de variaţie, calculate conform formulei:
xi + xi+1
mi = , i = 1, R. (2.15)
2

v Valoarea mediană

Valoarea mediană, notată cu Me este acea valoare a variabilei cantitative X care ı̂mparte repartiţia
ı̂n două parţi egale, respectiv:
N N
FN (Me ) = sau N (Me ) = (2.16)
2 2
Calculul valorii mediane se face diferenţiat, după cum seria are la bază o variabilă discretă sau continuă.
Pentru o repartiţie discretă, calculul medianei nu implică probleme deosebite şi nici un volum mare
de calcule.
Se consideră o repartiţie cu frecvenţe absolute:
 
x1 x2 . . . xi . . . xR
X:
N1 N2 . . . Ni . . . NR

În calculul valorii mediane a unei serii discrete, pot apărea două situaţii:
a) volumul N al populaţiei este un număr impar;
b) volumul N al populaţiei este un număr par.
În ambele cazuri, calculul medianei presupune, ı̂n prima fază, determinarea rangului medianei,
notat cu rMe , conform următoarei relaţii:
R
1 X
rMe = · Ni = N (Me ) (2.17)
2
i=1
2.1. Parametrii tendinţei centrale 33

a) Daca volumul populaţiei N este un număr impar, rangul medianei este un număr zecimal a
cărui parte ı̂ntreagă N2 indică numărul de unităţi din populaţie pentru care variabila X a ı̂nregistrat


valori
N
 mai mici ca mediana. Ca urmare, Me trebuie să fie valoarea imediat următoare celei de rang
2 adică:
Me = x  N   (2.18)
2
+1

b) Daca volumul populaţiei este un număr par, rangul medianei este un număr ı̂ntreg şi ca urmare
la mijlocul seriei nu se mai află o valoare a variabilei X cu care să coincidă mediana, ci se găsesc
două valori, mediana calculându-se ı̂n acest caz ca medie aritmetică a acestora. Relaţia de calcul a
medianei, ı̂n acest caz, este:
x  N  + x  N  
2 2
+1
Me = (2.19)
2
Pentru o repartiţie continuă, calculul valorii mediane presupune verificarea egalităţii (2.16) şi ca
urmare, trebuie cunoscută densitatea de repartiţie f (x). Determinarea funcţiei f (x) implică un volum
mare de calcule şi deci, din acest motiv, ı̂n activitatea practică f (x) este aproximat. Acest lucru
va conduce la o expresie aproximativă de calcul a valorii mediane, care necesită un volum redus de
calcule.
Să considerăm o repartiţie continuă ı̂n raport cu variabila X, şi anume:
 
[x1 , x2 ) [x2 , x3 ) . . . [xi , xi+1 ) . . . [xR , xR+1 ]
X:
N1 N2 ... Ni ... NR

unde intervalele [xi , xi+1 ), i = 1, R, pot fi de lungime egală sau neegală. Calcularea rangului medianei
va permite stabilirea intervalului ı̂n care se află valoarea mediană, interval numit şi interval median.
Se cumulează frecvenţele absolute din aproape ı̂n aproape până ce este ı̂ndeplinită inegalitatea:
N
N1 + N2 + . . . + Ni ≥
2
Ultima frecvenţă Ni cumulată, ne permite să indicăm intervalul median [xi , xi+1 ).
Formula aproximativă de calcul a medianei este:
N (Me ) − N (xi−1 )
Me = x i + · (xi+1 − xi ) (2.20)
Ni

v Valoarea modală

Valoarea modală Mo (X) a unei repartiţii reprezintă aceea valoare a variabilei X căreia ı̂i corespunde
frecvenţa cea mai mare.
Acest parametru se mai numeşte modul, valoare dominantă sau modă şi se notează cu Mo .
Mod de calcul:
a) Pentru o serie de repartiţie discretă, dată sub forma
 
x1 x2 . . . xi . . . xR
X:
f1 f2 . . . fi . . . fR

valoarea modală se citeşte direct din serie, nefiind nevoie de nicio tehnică sau formulă de calcul. În
cazul acestui tip de serie, valoarea modală va fi acea valoare a variabilei X pentru care frecvenţa este
cea mai mare.
34 Capitolul 2. Parametrii repartiţiilor unidimensionale

b) Pentru serii de repartiţie continue, respectiv:


 
[x1 , x2 ) [x2 , x3 ) . . . [xi , xi+1 ) . . . [xR , xR+1 ]
X:
N1 N2 ... Ni ... NR

modala nu poate fi determinată direct.


Intervalul căruia i corespunde frecvena̧ cea mai mare, se numeşte interval modal şi va conţine
modala. Să presupunem că intervalul modal este [xi , xi+1 ).
Formula de calcul a modalei este:
Ni − Ni−1
M o = xi + · (xi+1 − xi ) (2.21)
(Ni − Ni−1 ) + (Ni − Ni+1 )

O serie poate avea o singură valoare modală, caz ı̂n care seria se numeşte serie unimodală. Dacă o
serie are mai multe valori modale, atunci se numeşte serie plurimodală. O serie plurimodală evidenţiază
faptul că populaţia ı̂n cauză este neomogenă. Calculul valorii modale, ı̂n asemenea cazuri, presupune
o delimitare mai riguroasă a obiectului observării cât şi a populaţiei care urmează să fie studiată. O
altă cale, care poate duce la eliminarea unui asemenea neajuns, o constituie comasarea a două câte
două sau trei câte trei intervale, etc., până se ajunge la o serie unimodală.
În cazul unei serii simetrice valoarea modală coincide cu valoarea medie şi cu mediana. Pentru
serii uşor asimetrice, K. Pearson a stabilit următoarea relaţie ı̂ntre cei trei parametri:

Mo = X − 3(X − Me )

unde X este media aritmetică a variabilei X.


Calculul valorii modale reprezintă un deosebit interes pentru activitatea practică. Având ı̂n vedere
semnificaţia acestui parametru − indică acea valoare a variabilei ı̂nregistrată de cele mai multe unităţi
din populaţie − se poate afla: ora la care sunt solicitate cele mai multe convorbiri telefonice, ora de
vârf privind transportul ı̂n comun, mărimea cea mai solicitată la ı̂ncălţăminte, etc.
Dacă valoarea modală este identică cu valoarea medie, atunci se poate afirma că valoarea medie
se bucură de o mai mare reprezentativitate.
Dacă, ı̂n plus, avem Me = Mo = X, ţinând seama că valoarea mediană nu este influenţată de
valorile extreme ale variabilei, se poate afirma că mediana reprezintă un grad de reprezentativitate
mai mare decât valoarea medie.

- Aplicaţie. Numărul vizitatorilor unui muzeu, ı̂n mai multe zile consecutive ale unei luni, a fost:
12, 13, 32, 24, 31, 15, 17, 11, 42, 44, 19, 33, 15.
a) Identificaţi populaţia statistică, unitatea statistică şi volumul populaţiei statistice;
b) Calculaţi şi interpretaţi parametrii tendinţei centrale.

Rezolvare. a) Pentru ı̂nceput, să remarcăm faptul că valorile date ı̂n enunţul problemei sunt aferente
unei variabile statistice care indică numărul de vizitatori.
Populaţia statistică este reprezentată de mulţimea zilelor, unitatea statistică este ziua, iar volumul
populaţiei statistice este 13 (avem 13 valori ı̂n enunţul problemei, fiecare valoare fiind ı̂nregistrată
ı̂ntr-o anumită zi).
b) Fie X variabila care indică numărul de vizitatori.
Valoarea medie pentru X este :
12 + 13 + 32 + 24 + 31 + 15 + 17 + 11 + 42 + 44 + 19 + 33 + 15
X= = 23, 69.
13
2.1. Parametrii tendinţei centrale 35

În fiecare zi, numărul mediu de vizitatori ai muzeului a fost de 24 persoane.


Pentru a calcula valoarea mediană, ordonăm crescător şirul valorilor lui X:

11, 12, 13, 15, 15, 17, 19, 24, 31, 32, 33, 42, 44.
N 13
Calculăm rangul medianei RMe = 2 = 2 = 6, 5. Valoarea medianei este:

Me = x[rMe ]+1 = x[6,5]+1 = x7 = 19.

În jumătate din zile, numărul vizitatorilor a fost ı̂ntre 11 şi 19 persoane, ı̂n timp ce ı̂n restul zilelor,
muzeul a avut ı̂ntre 19 şi 44 vizitatori.
Pentru a calcula valoarea modală, căutăm valorile lui X care au frecvenţa de apariţie cea mai mare.
Observăm ca valoarea 15 apare de două ori, ı̂n timp ce restul valorilor au frecvenţa 1. Deci valoarea
modală este Mo = 15. În majoritatea zilelor, muzeul a avut 15 vizitatori. 

- Aplicaţie. Distribuţia salariaţilor unei firme ı̂n funcţie de salariul lunar (sute lei) este redată ı̂n
seria statistică de mai jos:
 
[10, 20) [20, 40) [40, 80) [80, 100]
S: , 24
3 7 11 3
a) Caracterizaţi variabila statistică de la baza seriei de mai sus;
b) Calculaţi şi interpretaţi parametrii tendinţei centrale.

Rezolvare. a) Variabila statistică S, aflată la baza seriei din enunţul problemei, este o variabilă
atributivă, cantitativă, continuă, având ca valori intervalele de salar lunar ale salariaţilor firmei.
b) Pentru a determina valoarea medie, vom calcula mai intâi mijloacele intervalelor din seria de
salarii. Pentru un interval [a, b), mijlocul se obţine cu formula m = a+b 2 . Avem:

15 30 60 90
!
S : [10, 20) [20, 40) [40, 80) [80, 100] , 24
3 7 11 3
Valoarea medie este:
15 · 3 + 30 · 7 + 60 · 11 + 90 · 3
X= = 49, 37.
24
Fiecare angajat al firmei obţine lunar un venit mediu de 4937 lei.
Pentru a calcula valoarea mediană, parcurgem următoarele etape:
• calculăm rangul medianei: rM e = N2 = 24
2 = 12.
• căutăm frecvenţa Ni pentru care

N1 + N2 + . . . + Ni ≥ rMe . (2.22)

În cazul nostru, verificăm succesiv:

3 ≥ 12, fals
3 + 7 ≥ 12, fals
3 + 7 + 11 ≥ 12, adevărat

Deci, Ni = 11, adică este ultima frecvenţă pe care am adăugat-o ca să obţinem inegalitatea (2.22)
adevărată.
36 Capitolul 2. Parametrii repartiţiilor unidimensionale

• Cu Ni astfel găsit, identificăm intervalul median.


În cazul nostru, frecvenţa Ni = 11 corespunde intervalului [40, 80). Deci Me ∈ [40, 80). Intervalul
[40, 80) se numeşte interval median.
• Calculăm valoarea medianei. Dacă Me ∈ [a, b) atunci
rMe − (N1 + N2 + . . . + Ni−1 )
Me = a + · (b − a).
Ni

În cazul nostru, Me ∈ [40, 80), deci


12 − (3 + 7)
Me = 40 + · (80 − 40) = 47, 27.
11
Deducem că 50% din angajaţii firmei au un venit lunar cuprins ı̂ntre 1000 şi 4727 lei, ı̂n timp ce restul
angajaţilor au un venit lunar cuprins ı̂ntre 4727 şi 10000 lei.
Pentru determinarea valorii modale, identificăm mai ı̂ntâi frecvenţa Ni maximă. Aceasta ne va indica
intervalul modal.
În cazul nostru Ni = 11 este cea mai mare frecvenţa dintre frecvenţele absolute ale seriei S. Deci
intervalul modal este [40, 80)
Găsim valoarea modală Mo ∈ [a, b) aplicând următoarea formulă:
(Ni − Ni−1 )
Mo = a + · (b − a).
(Ni − Ni−1 ) + (Ni − Ni+1 )

În cazul nostru, Mo ∈ [40, 80), deci


(11 − 7)
Mo = 40 + · (80 − 40) = 53, 33.
(11 − 7) + (11 − 3)
Majoritatea salariaţilor firmei au un venit lunar de 5333 lei. 

2.2 Parametrii de structură

Frecvente sunt cazurile când este necesară studierea structurii unei populaţii ı̂n raport cu o variabilă
sau alta. Parametrii statistici, ı̂n forma cea mai generală, folosiţi ı̂n caracterizarea structurii unei
populaţii poartă denumirea de valori quantile.
Valorile quantile ale unei serii de repartiţie unidimensionale sunt acele mărimi ı̂nregistrate de
variabila X, care ı̂mpart seria ı̂n n părţi egale (mai precis ı̂mparte populaţia ı̂n n părţi egale). În acest
caz se vor calcula p quantile (p = n − 1).
Pentru o serie continuă, a cărei densitate de probabilitate f (x) este cunoscută, următoarea egalitate
este satisfăcută de cele p quantile:
Z q1 Z q2 Z xn
1
f (x)dx = f (x)dx = . . . = f (x)dx = (2.23)
x1 q1 qn−1 n

unde cele n − 1 quantile s-au notat cu q1 , q2 ,. . ., qn−1 .


Relatia (2.23) se particularizează pentru cazul seriilor discrete, când seria este construită cu
frecvenţe relative:
q1 q2 xn
X X X 1
fi = fi = . . . = fi = (2.24)
x q q
n
1 1 n−1
2.2. Parametrii de structură 37

Pentru o serie oarecare, quantila de ordinul p poate fi definită astfel:


1 N
FN (qp ) = p · sau N (qp ) = p · , pentru orice p = 1, n − 1
n n
Modul de calcul al valorilor quantile diferă ı̂n raport cu tipul seriei.
Fie o serie de repartiţie, care are la bază o variabilă X discretă, de următoarea formă:
 
x1 x2 . . . xi . . . xR
X:
N1 N2 . . . Ni . . . NR

Pentru calculul valorii quantile de ordinul p (p = 1, n − 1), ı̂n prima etapă trebuie determinat rangul
acesteia:
N
rqp = N (qp ) = p · (2.25)
n
Se disting două cazuri:
a) dacă p · N se divide cu n atunci quantila de ordin p se calculează ca o medie aritmetică simplă
a valorilor variabilei X, de ordinul rangului şi al rangului majorat cu o unitate, după cum urmează:
xrqp + xrqp +1
qp = (2.26)
2
b) dacă p · N nu se divide cu n atunci quantila de ordin p este egală cu acea valoare a variabilei X
corespunzătoare părţii ı̂ntregi a rangului majorat cu 1:

qp = xrqp +1 (2.27)

În cazul seriilor care au la bază o variabilă continuă, conform definiţiei, cele n − 1 quantile trebuie
să satisfacă relaţia (2.23). Determinarea quantilelor din asemenea egalităţi ar presupune cunoaşterea
densităţii de probabilitate f (x). Ori ı̂n activitatea practică f (x) se aproximează prin diverse procedee,
implicând un volum exagerat de calcule.
În vederea găsirii unor formule aproximative de calcul a quantilei de ordin p (p = 1, n − 1) se
consideră o serie de variaţie continuă, ale cărei intervale de variaţie nu trebuie să fie neapărat egale ca
lungime:  
[x1 , x2 ) [x2 , x3 ) . . . [xi , xi+1 ) . . . [xR , xR+1 ]
X: (2.28)
N1 N2 ... Ni ... NR
În prima etapă se determină rangul quantilei de ordinul p (p = 1, n − 1) conform următoarei relaţii:
R
1 X
rqp = N (qp ) = p · · Ni (2.29)
n
i=1

Cunoscând rangul, se poate identifica intervalul ı̂n care se află quantila de ordinul p, numit şi intervalul
quantilei de ordinul p (p = 1, n − 1). Cumulând frecvenţele pe clase pâna la egalarea sau depăşirea
rangului, conform inegalităţii:
N1 + N2 + . . . + Ni ≥ rqp (2.30)
ultima frecvenţa adunată Ni va corespunde intervalului [xi , xi+1 ) ı̂n care se află quantila de ordinul p
(p = 1, n − 1). Prin urmare, quantila de ordinul p, notată qp , se calculează conform relaţiei:

rqp − N (xi−1 )
qp = xi + · (xi+1 − xi ) (2.31)
Ni
38 Capitolul 2. Parametrii repartiţiilor unidimensionale

Procedeul de determinare a quantilei de ordinul p (p = 1, n − 1) este acelaşi şi ı̂n cazul ı̂n care
seria (2.28) este formată din frecvenţe relative.
Caracterizarea structurii unei serii se poate face utilizând diverse cazuri particulare de valori quantile.

Valoarea mediană (Me ) este şi un parametru de structură obţinându-se ca un caz particular de
quantilă, când n = 2. Dacă pentru o serie se cunoaşte Me (quantila de ordinul 2), atunci structura
populaţiei poate fi redată astfel:
 
xmin − Me Me − xmax
X: (2.32)
50% 50%

semnificând faptul că jumatate din populaţia supusă studiului a ı̂nregistrat pentru variabila X valori
cuprinse ı̂ntre valoarea minimă a lui X şi mediană, iar cealaltă jumătate din populaţie a ı̂nregistrat
pentru X valori cuprinse ı̂ntre mediană şi valoarea maximă a lui X.
Valorile quartile reprezintă acel caz particular al valorilor quantile pentru care n = 4. Cele trei
quartile, care se obţin, notate: Q1 , Q2 şi Q3 sunt acei parametri de structură care ı̂mpart populaţia
ı̂n patru părţi egale.
În raport cu mediana, quartila ı̂ntâi Q1 , se numeşte quartila mică (inferioară), quartila a doua Q2
coincide cu mediana şi se numeşte quartila mijlocie, iar quartila a treia Q3 se numeşte quartila mare
(superioară).
Cunoscându-se cele trei quartile, rezultă următoarea structură a populaţiei ı̂n raport cu variabila X:
 
xmin − Q1 Q1 − Q2 Q2 − Q3 Q3 − xmax
X: (2.33)
25% 25% 25% 25%

ceea ce semnifică o structurare a populaţiei supusă studiului ı̂n patru părţi egale. Aceasta ı̂nseamnă că
25% din unităţile populaţiei ı̂nregistrează valori pentru variabila X mai mici decât quartila mică, 25%
din unităţile populaţiei ı̂nregistrează valori, ı̂n raport cu aceeaşi variabilă X, cuprinse ı̂ntre quartila
mică şi cea mijlocie, 25% vor avea valori cuprinse ı̂ntre quartila mijlocie şi quartila mare, iar restul
de 25% din unităţile populaţiei vor avea valorile pentru variabila X cuprinse ı̂ntre quartila mare şi
valoarea maximă a lui X.

- Aplicaţie. Se consideră distribuţia unor hoteluri ı̂n funcţie de categoria de confort (număr de
stele):
  a) Caracterizaţi structura hotelurilor folosind valorile quartile;
1 2 3 4 5 b) Calculaţi şi interpretaţi prima şi ultima decilă;
X: , 54
12 14 10 15 3 c) Calculaţi şi interpretaţi centila 78.

Rezolvare. a) Quartilele ı̂mpart populaţia statistică ı̂n 4 părti egale. Deci n = 4. Numărul hotelu-
rilor analizate este N = 54.
Rangul quartilei mici este rQ1 = p · N 54
n = 1 · 4 = 13, 5, iar valoarea quartilei mici este

Q1 = x[rq1 ]+1 = x[13,5]+1 = x14 = 2.

N 54
Rangul quartilei mijlocii este rQ2 = p · n =2· 4 = 27, iar valoarea quartilei mijlocii este

xrq2 + xrq2 +1 x27 + x28 3+3


Q2 = = = = 3.
2 2 2
2.3. Parametrii variaţiei 39

N 54
Rangul quartilei mari este rQ3 = p · n =3· 4 = 40, 5, iar valoarea quartilei mari este

Q3 = x[rq3 ]+1 = x[40,5]+1 = x41 = 4.

Avem deci următoarea structură a hotelurilor ı̂n funcţie de categoria de confort:


 
1−2 2−3 3−4 4−5
X: , 100%
25% 25% 25% 25%

Deducem că 25% din hoteluri au cel mult 2 stele categorie de confort, 50% din hoteluri au ı̂ntre 1 şi
3 stele categorie de confort, iar 75% din hoteluri au cel mult 4 stele categorie de confort.
b) Valorile decile ı̂mpart populaţia statistică ı̂n zece părţi egale, fiecare parte reprezentând 10% din
populaţia statistică. În total, sunt nouă decile, notate de obicei cu d1 , d2 , . . ., d9 .
Rangul primei decile este rd1 = p · N 54
n = 1 · 10 = 5, 4, iar valoarea primei decile este

d1 = x[rd1 ]+1 = x[5,4]+1 = x6 = 1.

Aşadar, 10% din hoteluri au cel mult o stea categorie de confort.


Rangul ultimei decile este rd9 = p · N 54
n = 9 · 10 = 48, 6, iar valoarea ultimei decile este

d9 = x[rd9 ]+1 = x[48,6]+1 = x49 = 4.

Aşadar, 90% din hoteluri au cel mult patru stele categorie de confort.
c) Valorile centile ı̂mpart populaţia statistică ı̂n o sută de părţi egale, fiecare parte reprezentând 1%
din populaţia statistică. În total, sunt 99 de centile, notate de obicei cu c1 , c2 , . . ., c99 .
Rangul centile 78 este rc78 = p · N 54
n = 78 · 100 = 42, 12, iar valoarea centilei 78 este

c78 = x[rc78 ]+1 = x[42,12]+1 = x43 = 4.

Aşadar, 78% din hoteluri au cel mult patru stele categorie de confort. 
Observaţie: Avem următoarele egalităţi pentru valoarea mediană: Me = Q2 = d5 = c50 .

2.3 Parametrii variaţiei

Studiul unor populaţii statistice prezintă importanţă numai din punct de vedere al unor mărimi care
variază de la o unitate la alta sau de la un grup de unităţi la altul.
Valorile ı̂nregistrate de o variabilă cantitativă, ı̂n raport cu care este studiată o populaţie, se
datorează acţiunii diferiţilor factori esenţiali şi neesenţiali.
Intensitatea diferită cu care se pot manifesta factorii esenţiali cât şi sensul contrar cu care pot
acţiona factorii neesenţiali ı̂n raport cu fiecare unitate, provoacă nivele diferite ı̂nregistrate de variabile
ı̂n raport cu care este studiată populaţia.
Problema măsurării variaţiei unei variabile cantitative este importantă pentru a vedea ı̂n ce măsură
valoarea medie a acesteia poate reprezenta ı̂ntrega populaţie.
Dacă abaterile de la valoarea medie sunt neesenţiale atunci se poate afirma că populaţia este
omogenă şi că acest parametru poate reprezenta tendinţa centrală, iar dacă aceste abateri sunt mari
atunci populaţia este eterogenă şi valoarea medie nu are capacitatea de a reprezenta populaţia.
Pentru unele serii, valoarea medie nu se poate calcula. În asemenea cazuri, parametrul valoarea
mediăna poate să-i ia locul. Aceeaşi problemă se pune şi ı̂n acest caz, de a vedea ı̂n ce măsură valoarea
mediană este sau nu reprezentativă pentru populaţia ı̂n cauză.
40 Capitolul 2. Parametrii repartiţiilor unidimensionale

O altă problemă care nu se poate rezolva fără a studia şi măsura variaţia ı̂nregistrată de o variabilă
ı̂n raport cu care este studiată o populaţie, o constituie verificarea de ipoteze. În activitatea practică,
de multe ori pornind de la valorile unor parametrii calculaţi pe baza datelor culese relativ la un număr
mic de unităţi, este necesar a fi extinşi la nivelul ı̂ntregii populaţii sau de a se verifica anumite ipoteze
statistice.
Parametrii variaţiei se pot calcula atât sub formă absolută cât şi relativă, şi măsoară ı̂mpraştierea
valorilor unei variabile cantitative faţă de valoarea medie sau valoarea mediană.
Ca urmare, ı̂n funcţie de elementul de referinţă folosit ı̂n măsurarea variaţiei, deosebim:
- parametrii variaţiei ı̂n raport cu valoarea medie;
- parametrii variaţiei ı̂n raport cu valoarea mediană.

v Parametrii variaţiei ı̂n raport cu valoarea medie

Abaterea medie liniară


Abaterea medie liniară, notată cu dx , reprezintă media aritmetică a abaterilor variabilei X de la
valoarea medie a acesteia, luate ı̂n valoare absolută:

dx = M |X − X| (2.34)

Relaţia (2.34) se particularizează ı̂n:


R
X
|xi − X| · Ni
i=1
dx = R
(2.35)
X
Ni
i=1

Dacă seria are la bază o variabilă continuă şi se cunoaşte f (x), atunci abaterea medie liniară se
calculează astfel: Z xR
dx = |x − X| · f (x)dx (2.36)
x1

Densitatea de probabilitate f (x) se poate aproxima cu densitatea empirică şi atunci pentru abaterea
medie liniară se pot obţine relaţii de calcul aproximativ, frecvent utilizate ı̂n activitatea practică, de
forma:
X R
|mi − X| · Ni R
i=1
X
dx = R
sau dx = |mi − X| · fi (2.37)
i=1
X
Ni
i=1

după cum seria ı̂n cauză este formată cu frecvenţe absolute sau relative, unde:
xi + xi+1
mi = , i = 1, R
2
este mijlocul intervalului i.
Acest parametru serveşte caracterizării sintetice a gradului de reprezentativitate a valorii medii,
aratând cu cât se abate ı̂n medie orice valoare a variabilei X de la valoarea medie X, ı̂ntr-un sens sau
altul.
2.3. Parametrii variaţiei 41

Sub formă relativă, acest indicator poartă denumirea de coeficient simplu de variaţie şi se calculează
conform relaţiei:
dx
Vx = · 100 (2.38)
X
Coeficientul simplu de variaţie (Vx ) arată cu cât se abate ı̂n medie orice valoare a variabilei X de la
valoarea medie echivalentă cu 1 sau 100%. Calculat pentru două serii diferite, se poate aprecia gradul
de reprezentativitate a celor două medii. Se apreciază ca fiind mai reprezentativă acea valoare medie
pentru care coeficientul simplu de variaţie este mai mic.
Parametrul abaterea medie liniară, ı̂n formă absolută sau relativă, prezintă unele deficienţe de-
oarece nu este suficient de sensibil la abaterile mici, adăugându-se şi unele inconveniente de natură
teoretică, generate de exprimarea abaterilor ı̂n valoarea absolută.
Înlăturarea acestor deficienţe se poate realiza apelând la un nou parametru privind măsurarea
variaţiei, numit abatarea medie pătratică.

Abaterea medie pătratică

Acest indicator este utilizat atât pentru caracterizarea gradului de reprezentativitate a valorii medii
cât şi ı̂n scopul estimării unor parametri necunoscuţi.
Abaterea medie pătratică, notată cu σx , se defineşte ca fiind media pătratică a abaterilor valorilor
variabilei X, de la valoarea medie X, adică:
q
σx = M (X − X)2 (2.39)

Un calcul intermediar ı̂n aflarea acestui parametru, ı̂l constituie calcularea pătratului abaterii medii
pătratice, care se numeşte dispersie sau varianţă şi care are următoarea expresie de calcul:

σx2 = M (X − X)2 = D2 (X) (2.40)

V (x) reprezintă o altă notaţie pentru varianţă, pe lângă σx2 .


Varianţa fiind un calcul intermediar ı̂n aflarea abaterii medii pătratice, ı̂n cele ce urmează se va
prezenta modul de calcul al acesteia.
Relaţia de calcul a varianţei se particularizează ı̂n raport cu tipul seriei. În cazul unei serii care
are la bază o variabilă X discretă, conform definiţiei, varianţa are expresia:
R
X
(xi − X)2 · Ni
i=1
σx2 = R
(2.41)
X
Ni
i=1

În cazul unei serii care are la bază o variabilă X continuă, varianţa se calculează conform următoarei
relaţii: Z xR
σx2 = (x − X)2 · f (x)dx (2.42)
x1

a cărei aplicare presupune cunoaşterea densităţii de repartiţie f (x).


Pentru o serie dată, varianţa calculată nu are interpretare, dar dacă se extrage rădăcina pătrată
din aceasta se obţine un număr care se exprimă ı̂n aceleaşi unităţi de măsură ca şi variabila de la
baza seriei. Acest număr (valoare) reprezintă abaterea medie pătratică, simbolizând cu cât se abate
ı̂n medie ı̂n plus sau minus orice valoare xi a variabilei X de la valoarea medie X.
42 Capitolul 2. Parametrii repartiţiilor unidimensionale

Parametrul abatere medie pătratică se poate exprima şi sub formă relativă, caz ı̂n care se numeşte
coeficientul de variaţie a lui Pearson şi se notează cu Vx . Expresia de calcul este:
σx
Vx = · 100% (2.43)
X
şi reprezintă abaterea medie a oricărei valori a variabilei X de la valoarea medie, considerată egală cu
1 sau 100.
Coeficientul de variaţie a lui Pearson calculat pentru două sau mai multe serii, poate fi folosit ı̂n
aprecieri comparative privind gradul de reprezentativitate a valorii medii calculate.
Deoarece gradul de reprezentativitate a valorii medii este ı̂n raport invers cu mărimea coeficientului
de variaţie a lui Pearson, se poate afirma, ı̂n cazul mai multor serii, că este mai reprezentativă valoarea
medie a acelei serii pentru care Vx este mai mic.
În concluzie, trebuie reţinut că parametrul abatere medie pătratică sub forma absolută σx şi sub
formă relativă Vx sunt indicatori fundamentali utilizaţi ı̂n măsurarea variaţiei unei variabile.
Atât abaterea medie liniară, cât şi abaterea medie pătratică constituie o măsură a variaţiei medii,
primul o medie de ordinul unu, iar al doilea o medie de ordinul doi (dx ≤ σx ).

v Parametrii variaţiei ı̂n raport cu valoarea mediană

Abaterea interquartilă

Abaterea interquartilă, prin definiţie, este media aritmetică simplă a segmentelor Me − Q1 şi
Q3 − Me , respectiv:
Me − Q1 + Q3 − Me Q3 − Q1
Q= = (2.44)
2 2
şi arată cu cât se abat ı̂n medie, ı̂n plus sau ı̂n minus, de la mediană, cele 50% din valorile variabilei
cuprinse ı̂ntre Q1 şi Q3 .
Forma relativă a acestui indicator notat cu Qr este:
Q Q3 − Q1
Qr = · 100% = · 100% (2.45)
Me 2 · Me
Qr se numeşte coeficient de variaţie interquartilic şi arată cu cât se abat ı̂n medie de la mediană
(considerată egală cu 100), valorile variabilei ı̂nregistrate pentru cele 50% din unităţile populaţiei
cuprinse ı̂ntre Q1 şi Q3 .
Ca atare, se apreciază că ı̂mprăştierea unităţilor ı̂n cadrul populaţiei studiate este cu atât mai
mare, ı̂n raport cu variabila de studiat, cu cât abaterea interquartilă ı̂n valoarea absolută (2.44) sau
relativă (2.45) este mai mare.

Abaterea interquantilă

Pentru acest parametru, sub formă absolută, avem:


qn−1 − Me + Me − q1 qn−1 − q1
Q= = (2.46)
2 2
iar sub formă relativă denumită şi coeficient de variaţie interquantilic este:
q qn−1 − q1
Qr = · 100% = · 100% (2.47)
Me 2 · Me
2.4. Parametrii formei 43

Cu cât abaterea interquantilică (relativă sau absolută) este mai mică, cu atât valoarea mediană este
mai reprezentativă.

- Aplicaţie. În decursul unui an, veniturile (mii lei) ı̂nregistrate de mai multe magazine dintr-un
oraş au fost: 50, 45, 22, 13, 20.
a) În ce măsură se abat valorile veniturilor de la venitul mediu ?
b) Este venitul mediu reprezentativ pentru magazinele analizate ?

Rezolvare. Fie X variabila statistică pentru venit. Venitul mediu ı̂nregistrat de fiecare magazin
este:
50 + 45 + 22 + 13 + 20
X= = 30.
5
a) Calculăm dispersia veniturilor:

2 (50 − 30)2 + (45 − 30)2 + (22 − 30)2 + (13 − 30)2 + (20 − 30)2
σX = = 215, 6
5
iar abaterea medie pătratică este:
q p
σX 2 =
= σX 215, 6 = 14, 68.

Deci, veniturile magazinelor se abat de la venitul mediu cu 14, 68 mii lei.


b) Pentru a studia reprezentativitatea venitului mediu, respectiv omogenitatea distribuţiei magazinelor
ı̂n raport cu venitul mediu, calculăm coeficientul de variaţie al lui Pearson:
σX 14, 68
CVX = · 100% = · 100% = 48, 93%
X 30
Deoarece CVX ≥ 30%, deducem că venitul mediu, de 30000 lei, nu este reprezentativ pentru magazinele
analizate.


2.4 Parametrii formei

Din aplicaţiile practice, precum şi din alte surse, s-au constatat că graficele pot avea diverse forme,
dintre care: formă de clopot, forma literei U , J, L sau alte forme. Ceea ce prezintă importanţă,
nefiind surprins de niciun parametru prezentat, ı̂l constituie modul de repartizare a valorilor variabilei
de o parte şi de alta a valorii medii, considerată şi centrul de greutate al seriei. Acest lucru nu
ı̂nseamnă altceva decât evidenţierea acelei curbe care aproximează cel mai bine conturul poligonal al
seriei respective şi ı̂n acelaşi timp o imagine mai clară asupra gradului de reprezentativitate a valorii
medii.
În marea majoritate a cazurilor, distribuţia unităţilor unei populaţii se face după un clopot (după
legea normală a lui Gauss). Dar unităţile nu se distribuie uniform ı̂n jurul valorii medii, ceea ce poate
conduce la ı̂nclinaţii ı̂ntr-o direcţie sau alta a valorii medii. Această distribuire neuniformă poate
conduce la cazul când diferite serii (diferit distribuite ı̂n jurul valorii medii) să aibă aceeaşi medie,
acelaşi σ şi totuşi o curbă să fie mai aplatizată decât cealaltă, simetrică sau mai puţin simetrică.
Evidenţierea acestor diferenţe poate fi realizată cu ajutorul parametrilor formei.
Parametrii formei unei serii de repartiţie, după conţinut, se clasifică ı̂n două grupe:
44 Capitolul 2. Parametrii repartiţiilor unidimensionale

- parametrii asimetriei;
- parametrii boltirii.

v Parametrii asimetriei

Asimetria unei serii se defineşte ı̂n raport cu dispunerea unităţilor ı̂ntr-o parte sau alta a valorii
medii.
În acest sens, o serie de repartiţie este simetrică ı̂n raport cu media sa dacă frecvenţele valorilor
variabilei X egal depărtate de valoarea medie sunt egale ı̂ntre ele, adică:
f (X − σ) = f (X + σ)
oricare ar fi σ astfel ı̂ncât X − σ şi X + σ să se afle printre valorile lui X.

Coeficientul de asimetrie al lui Fisher

Acest parametru se notează cu α3 , iar expresia sa de calcul este:


M (X − X)3
α3 = 3 (2.48)
σX
sau ı̂ntr-o formă echivalentă:
M (X − X)3
α3 = q (2.49)
(M (X − X)2 )3
Calculând valoarea acestui parametru, ı̂n funcţie de semnul ei, avem următoarele cazuri:
1. α3 = 0, ceea ce ı̂nseamnă că M (X − X)3 = 0, adică suma tuturor abaterilor cu semnul minus este
egală cu suma tuturor abaterilor cu semnul plus, ridicate la puterea a treia. Ca urmare, ı̂n acest caz
se poate spune ca seria este simetrică.
2. α3 > 0, ceea ce ı̂nseamnă că M (X − X)3 > 0. Aceasta ı̂nseamnă că pe total suma abaterilor cu
semnul plus de la valoarea medie este mai mare decât suma abaterilor cu semnul minus şi ca urmare
seria prezintă o asimetrie pozitivă.
3. α3 < 0, deci M (X − X)3 < 0. Aceasta ı̂nseamnă că pe total, suma abaterilor cu semnul minus este
mai mare decât suma abaterilor cu semnul plus de la valoarea medie. O astfel de serie se spune că
reprezintă o asimetrie negativă.

Observaţie: Un alt coeficient utilizat pentru studiul asimetriei distribuţiei valorilor unei variabile
statistice X, este coeficientul de asimetrie al lui Pearson
X − Mo
α= .
σX
Acest coeficient are aceleaşi interpretări ca şi cele ale coeficientului de asimetrie al lui Fisher.
v Parametrii boltirii

Aprecierea boltirii unei serii este utilă ı̂n caracterizarea gradului de reprezentativitate a valorii
medii cât şi pentru compararea reprezentativităţii a două sau mai multe valori medii ce reprezintă
serii diferite.
Parametrul M (X − X)4 oferă o caracterizare numerică sub formă absolută a gradului de boltire
al unei serii. Sub formă relativă, gradul de boltire se măsoară cu parametrul:
M (X − X)4
β4 = 4 (2.50)
σX
2.4. Parametrii formei 45

Pentru a ı̂nţelege semnificaţia boltirii unei serii, se consideră două serii statistice care au la bază
variabilele X şi Y , iar X = Y şi σX = σY .
Mai presupunem, ı̂n plus, că cele două distribuţii au formă de clopot pentru care α3X = α3Y , adica
ambele sunt simetrice. Deşi s-ar părea că cele două serii nu au nimic care să le deosebească, totuşi
reprezentându-le grafic rezultă două curbe de forma:

Figura 2.1: Distribuţii ı̂n formă de clopot pentru


variabilele X şi Y

unde graficul lui X este mai ı̂nalt, iar al lui Y mai plat. Ca urmare, se observă că cele două serii nu
sunt caracterizate de aceeaşi boltire.
Boltirea unei serii este utilă pentru a da o caracetrizare mai exactă reprezentativităţii valorii medii.
În cazul exemplului prezentat mai sus, atât mediile cât şi abaterile medii pătratice sunt egale şi
ca urmare, coeficientul de variaţie al lui Pearson este acelaşi pentru cele două serii. Deci rezultă că
ambele valori medii prezintă acelaşi grad de reprezentativitate. Cu toate acestea, graficele celor două
serii contrazic concluzia dedusă ı̂n urma comparării celor doi coeficienţi de variaţie.
Valoarea medie cea mai reprezentativă este ı̂n seria ı̂n care cele mai multe unităţi ale populaţiei
cercetate au ı̂nregistrat valori mai apropiate de valoarea medie. Pentru o astfel de serie, ı̂mprăştierea
faţă de valoarea medie fiind mică, graficul are o formă mai ascuţită ı̂n cazul seriei X şi mai plată ı̂n
cazul seriei Y .
Nivelul boltirii pentru o serie oarecare dată se măsoară cu ajutorul parametrului β4 , a cărui expresie
de calcul este dată de relaţia (2.50). Valoarea lui β4 pentru o distribuţie normală este egală cu 3. Pentru
orice altă curbă corespunzătoare unei serii date şi aproximată cu un clopot, raportul ı̂ntre momentul
centrat de ordinul patru şi pătratul momentului centrat de ordinul al doilea, este un număr diferit de
3, curba respectivă fiind mai ascuţită sau mai plată decât curba normală a lui Gauss.
Comparând gradul de boltire al unei serii oarecare şi gradul de boltire al clopotului lui Gauss,
Fisher a stabilit următoarea expresie de calcul al coeficientului boltirii, notat cu β40 :

M (X − X)4
β40 = 4 − 3 sau β40 = β4 − 3
σX
expresie cunoscută ı̂n literatura de specialitate sub denumirea de exces al seriei.
Următoarele cazuri sunt semnificative cu privire la aprecierea boltirii unei serii:
- dacă β40 = 0 (adică β4 = 3) atunci seria ı̂n cauză prezintă aceeaşi boltire cu a curbei normale
(excesul este nul);
46 Capitolul 2. Parametrii repartiţiilor unidimensionale

- dacă β40 > 0 (adică β4 > 3) atunci boltirea corespunzătoare curbei respective este mai ı̂naltă şi
mai ascuţită decât curba normală (serie leptokurtică);
- dacă β40 < 0 (adică β4 < 3) atunci boltirea corespunzătoare curbei respective este mai plată (mai
joasă şi mai largă) decât curba normală (serie platikurtică).
Asimetria şi boltirea joacă un rol ı̂nsemnat ı̂n caracterizarea formei unei serii atributive de repartiţie.
Cu ajutorul parametrilor prezentaţi poate fi formată o imagine mai clară asupra unei serii deja con-
struite, asupra măsurii ı̂n care seria respectivă poate fi reprezentată de valoarea sa medie.

- Aplicaţie. Distribuţia apartamentelor unui imobil, ı̂n raport cu numărul de camere, este redată
ı̂n tabelul de mai jos. Calculaţi şi interpretaţi parametrii formei distribuţiei.

Tip apartament: 1 cameră 2 camere 3 camere


Nr. apartamente: 4 20 6

Rezolvare. Considerăm variabila cantitativă X, care indică numărul de camere. Distribuţia varia-
bilei X este:  
1 2 3
X: , 30
4 20 6
1·4+2·20+3·6
Pentru variabila X avem valoarea medie: X = 30 = 2, 066, modala M o = 2, dispersia

2 (1 − 2, 066)2 · 4 + (2 − 2, 066)2 · 20 + (3 − 2, 066)2 · 6


σX = = 0, 3288
30
q
2 =

iar abaterea medie pătratică σX = σX 0, 3288 = 0, 5734.
Coeficientul de asimetrie al lui Pearson:
X − Mo 2, 066 − 2
α= = = 0, 1151.
σX 0, 5734

Observăm că α > 0, deci avem o asimetrie pozitivă (de dreapta).


Coeficientul de asimetrie al lui Fisher:
(1−2,066)3 ·4+(2−2,066)3 ·20+(3−2,066)3 ·6
M (X − X)3 30
α3 = 3 = = 0, 0066
σX 0, 57343

Observăm că α3 > 0, deci avem o asimetrie uşor pozitivă (de dreapta).
Coeficientul de boltire al lui Fisher:
(1−2,066)4 ·4+(2−2,066)4 ·20+(3−2,066)4 ·6
M (X − X)4 30
β4 = 4 = = 3, 0008
σX 0, 57344

iar β40 = β4 − 3 = 0, 0008 Observăm că β4 > 0, deci distribuţia este uşor leptokurtică. 
0
Observaţie: În cazul aplicaţiei de mai sus, observăm că X = Me = Mo , iar α3 , β4 → 0. În acest caz,
spunem că distribuţia variabilei X urmează legea normală. Distribuţia are forma clopotului lui Gauss.
2.5. Parametrii concentrării 47

2.5 Parametrii concentrării

Energia informaţională
Acest parametru a fost introdus de Acad. Octav Onicescu. Prin definiţie:
R
X
E= fi2 (2.51)
i=1

unde s-a notat cu E energia informaţională. Este un parametru utilizat ı̂n cazul ı̂n care seria are la
bază o variabilă nenumerică.
În cazul unei populaţii caracterizată de un grad de concentrare maxim, va exista o clasă care va
avea frecvenţa relativă egală cu 1, iar celelalte vor avea frecvenţele relative 0 şi ca urmare: Emax = 1.
Dacă populaţia este caracterizată de o concentrare minimă, atunci:
 
x x . . . xR
X : 11 12
R R . . . R1

iar
1 1
Emax = R · = (2.52)
R2 R
Se observă că:
1
≤E≤1
R
Forma relativă a acestui parametru, notată cu Er , se deduce astfel:
R
X 1
1 fi2 −
E− R
Er = R = i=1
(2.53)
1 1
1− 1−
R R
de unde:
0 ≤ Er ≤ 1
Referitor la populaţia dată, studiată ı̂n raport cu o variabilă X, se calculează Er , iar dacă:
- Er se apropie de 1, atunci populaţia respectivă este caracterizată de un grad ı̂nalt de concentrare;
- Er se apropie de 0, populaţia ı̂n cauză se caracterizează printr-o concentrare minimă.

- Aplicaţie. În urma unui sondaj efectuat la un magazin privind calitatea unui anumit produs, s-au
obţinut următoarele rezultate: 20% din clienţi s-au declarat nesatisfăcuţi de produs, 50% satisfăcuţi,
ı̂n timp ce restul au fost foarte satisfăcuţi. Analizaţi gradul de concentrare al clienţilor ı̂n raport cu
nivelul de calitate al produsului.

Rezolvare. Fie variabila statistică S care indică nivelul de satisfacţie al clienţilor privind calitatea
produsului. În raport cu variabila S, distribuţia clienţilor este:
 
Nesatisfăcuţi Satisfăcuţi Foarte satisfăcuţi
S: , 100%
20% 50% 30%
Valoarea energiei informaţionale este:

E = (0, 20)2 + (0, 50)2 + (0, 30)2 = 0, 38.


48 Capitolul 2. Parametrii repartiţiilor unidimensionale

Valoarea energiei relative este:

E − R1 0, 38 − 1
3
Er = 1 = = 0, 07.
1− R 1 − 13

Avem deci un grad minim de concentrare al clienţilor privind calitatea produsului. 

2.6 Teme de control


Alegeţi o populaţie statistică observată ı̂n raport cu mai multe variabile. Se cere:

P1. Alegeţi două variabile (una cantitativă, cealaltă calitativă) şi construiţi repartiţia populaţiei ı̂n
raport cu fiecare dintre ele;

P2. Calculaţi şi interpretaţi corespunzător parametrii tendinţei centrale (valoarea medie, mediană,
modală) pentru seria care are la bază variabila cantitativă;

P3. Analizaţi reprezentativitatea parametrilor tendinţei centrale (sub formă absolută şi relativă);

P4. Folosind parametrii de structură analizaţi structura populaţiei ı̂n raport cu variabila cantitativă;

P5. Analizaţi gradul de dispersare al unităţilor populaţiei ı̂n raport cu variabila cantitativă;

P6. Caracterizaţi sintetic concentrarea unităţilor din populaţie folosind variabila nenumerică;

P7. Analizaţi statistic asimetria repartiţiei de la problema P1;

P8. Analizaţi comparativ rezultatele obţinute la problemele P5 şi P6.

Bibliografie:

1. Buiga A., Metodologie de sondaj şi analiza datelor ı̂n studiile de piaţă, Ed. Presa Universitară
Clujeană, Cluj-Napoca, 2001;

2. Buiga A., Dragoş C., Lazăr D., Parpucea I., Todea A., Statistică I, Ed. Presa Universitară
Clujeană, Cluj-Napoca, 2003;

3. Buiga A., Dragoş C., Lazăr D., Brendea G., Litan C., Mare C., Statistică Descriptivă, Ed.
Napoca Star, Cluj-Napoca, 2018;

4. Florea I., Parpucea I., Buiga A., Statisticıa descriptivă, Ed. Continental, Cluj-Napoca, 1998.
Capitolul 3

Analiza legăturii dintre variabile


statistice

Secţiuni
3.1. Analiza legăturii dintre variabile calitative
3.2. Analiza legăturii dintre variabile ordinale
3.3. Analiza legăturii dintre variabile cantitative
3.4. Funcţii de regresie
3.5. Teme de control

Obiective
• Însuşirea conceptelor de corelaţie şi regresie şi utilizarea lor ı̂n economie
• Cunoaşterea posibilităţilor de cuantificare a intensităţii legăturii dintre mărimi economice
• Însuşirea metodelor de stabilire a unei legături funcţionale ı̂ntre variabile

Cuvinte cheie
• Corelaţia dintre variabile, coeficienţi de asociere, coeficient de corelaţie
• Corelaţia rangurilor, coeficienţii lui Kendall şi Spearman
• Metoda celor mai mici pătrate, regresia liniară simplă
• Regresia liniară multiplă, regresii neliniare: hiperbolică, parabolică, exponenţială

Rezultate aşteptate
După parcurgerea acestui modul se cere studentului să stăpânească noţiunile de corelaţie şi regresie,
să poată identifica existenţa unei eventuale legături ı̂ntre două mărimi. De asemenea, să ştie măsura
intensitatea legăturii dintre variabile, fie ele cantitative sau calitative. Se urmăreşte şi cunoaşterea
metodelor de modelare funcţională a legăturilor.

49
50 Capitolul 3. Analiza legăturii dintre variabile statistice

Ne propunem abordarea unor metode statistice caracteristice studiului seriilor multidimensionale.


Scopul acestora este de a identifica şi utiliza eventualele legături care se pot manifesta ı̂ntre două
sau mai multe variabile. Prezintă interes: existenţa legăturii, intensitatea acesteia, forma funcţională
a legăturii, parametrii şi reprezentativitatea ei privind fenomenul cercetat. Problematica legăturilor
dintre variabile este foarte curent ı̂ntâlnită ı̂n economie. Spunem că salariul unui angajat este ı̂n
funcţie de productivitatea muncii sale, vechimea ı̂n muncă, responsabilitatea activităţii sale, etc; sau
cererea pentru un produs este ı̂n funcţie de preţul produsului, venitul consumatorilor, etc. De fiecare
dată, atât ı̂n teoria economică, cât şi ı̂n aplicaţii se ı̂ntâlneşte expresia: Fie funcţia cererii .... În
realitatea economică ı̂nsă, această funcţie nu se dă, nu se cunoaşte, ci trebuie estimată pornind de la
o bază de date. Această problemă de estimare a unei funcţii şi alte probleme colaterale ei fac obiectul
acestui capitol.
Pentru a putea aborda studiul legăturilor dintre variabile trebuie să ştim ı̂n primul rând dacă există
sau nu o legătură ı̂ntre variabilele studiate (sau ı̂ntre fenomenele pe care acestea le reprezintă) şi care
este natura acestora. Putem clasifica legăturile dinte variabile astfel:
1. Legătura nulă. Semnifică lipsa oricărei legături ı̂ntre două sau mai multe fenomene sau
variabile care cuantifică fenomenele. De exemplu, o legătură nulă se manifestă ı̂ntre ı̂nălţimea unui
angajat şi salariul acestuia sau ı̂ntre produsul intern brut al unei ţări şi vârsta primului ministru. Din
punct de vedere statistic, spunem că ı̂ntre două variabile X şi Y există o legătură nulă, sau nu există
legătură, dacă cov(x, y) = 0.
2. Legătura deterministă. Spunem că ı̂ntre variabilele X şi Y există o legătură deterministă
dacă unei valori a lui X ı̂i corespunde o singură valoare a lui Y . Astfel de legături se ı̂ntâlnesc ı̂n
special ı̂n fizică, unde de exemplu viteza este egală cu distanţa ı̂mpărţită la timp: v = d/t, sau forţa
este egală cu masa ı̂nmulţită cu acceleraţia: F = m · a. Astfel de exemple există şi ı̂n economie, unde
rata profitului este egală cu profitul ı̂mpărţit la cifra de afaceri: tπ = π/C.A. · 100%. Legătura este
deterministă pentru că variabila rπ este perfect determinată de celelalte două: π şi C.A. Adică pentru
o anumită valoare a profitului şi o anumită valoare a cifrei de afaceri nu putem avea decât o singură
valoare a ratei profitului.
3. Legătura statistică. Se mai numeşte şi stocastică sau probabilistă. Este tipul de legătură cel
mai des ı̂ntâlnită ı̂n ştiinţele sociale, deci şi ı̂n economie. Fiecărei valori xi a variabilei X ı̂i corespunde o
distribuţie de valori ale variabilei Y . Matematic, o astfel de legătură se exprimă sub forma y = f (x)+ε,
unde am notat prin ε componenta aleatoare reziduală, datorata acţiunii asupra lui Y a celorlalţi factori
decât X. Deşi s-ar putea spune că prin luarea ı̂n considerare a tuturor factorilor care influenţează va-
riabila Y , legătura este intrinsec deterministă, ı̂n ştiinţele economice vom ı̂ntâlni aproape ı̂ntotdeauna
un număr foarte mare de factori, care nu pot fi identificaţi şi cuantificaţi ı̂n totalitatea lor. Asfel,
funcţia care ı̂l explicitează pe Y are două componente: una determnistă, f (x1 , x2 , . . . , xn ), cuprinzând
variabilele cuantificabile de care depinde Y , şi una aleatoare, ε, cuprinzând variabilele ce nu au putut
fi cuantificate.
Studiul legăturilor dintre variabile s-a dezvoltat ı̂ntr-o disciplină aparte, numită econometrie. În
capitolul de faţă nu ne propunem deci decât o introducere ı̂n această problematică, fără a aborda
elemente de inferenţă statistică specifice acestor legături. În cele ce urmează vom prezenta câteva
aspecte legate de variabile şi fenomenele reprezentate de acestea, probleme atât de natura aparatului
statistic utilizat, cât şi de aplicabilitatea lui ı̂n contextul economic.
Analiza legăturii dintre variabilele unei repartiţii multidimensionale presupune abordarea următoarelor
probleme, care se pot constitui şi ı̂n etape ce trebuie parcurse ı̂n demersul statistic necesar:

1. Organizarea rezultatelor observării populaţiei sau eşantionului ı̂n raport cu variabilele cercetate

2. Analiza statistică a existenţei legăturii


3.1. Analiza legăturii dintre variabile calitative 51

3. Analiza statistică a intensităţii legăturii sau a gradului de asociere dintre variabilele observate

4. Formularea unor ipoteze cu privire la forma matematică a legăturii

5. Estimarea parametrilor funcţiei de regresie

6. Analiza reprezentativităţii funcţiei de regresie

Aceste etape pot fi parcurse integral sau parţial, ı̂n funcţie de natura variabilelor. Pentru variabilele
calitative nu vor fi parcurse (ı̂n statistica descriptivă) decât primele trei, deoarece posibilităţile de
prelucrare sunt mai reduse. În schimb, toate cele şase etape pot fi parcurse ı̂n cazul variabilelor
cantitative.
În scopul utilizării facile a informaţiei culese la nivelul populaţiei sau eşantionului, rezultatele
observării vor fi sistematizate ı̂ntr-o formă convenabilă prelucrării lor. Se preferă de obicei o formă
tabelară a prezentării, care poate sugera unele idei de lucru pentru etapele următoare, prin unele
remarci cu privire la valorile pe care le-au ı̂nregistrat variabilele.

3.1 Analiza legăturii dintre variabile calitative


Considerăm o serie bidimensională care are la baza două variabile calitative X şi Y .
HH X
HH x1 ... xj ... xK T otal
Y H
H
y1 N11 ... N1j ... N1K N1·
.. .. .. .. ..
. . ... . ... . .
yi Ni1 ... Nij ... NiK Ni·
.. .. .. .. ..
. . ... . ... . .
yL NL1 ... NLj ... NLK NL·
T otal N·1 ... N·j ... N·K N

Pentru studiul existenţei legăturii dintre variabile X şi Y , aflate la baza seriei bidimensionale, calculăm
parametrul
L X K
X (Nij − Nij∗ )2
χ2 = (3.1)
Nij∗
i=1 j=1

Ni· · N·j
unde Nij∗ = , i = 1, L, j = 1, K.
N
Distingem două cazuri:
1) Dacă χ2 = 0, atunci nu există legatură ı̂ntre variabile;
2) Dacă χ2  0, atunci există legatură ı̂ntre variabile.
Pentru studiul intensităţii legăturii dintre variabilele X şi Y , calculăm:
Coeficientul de asociere (contingenţă) al lui Pearson
s
χ2
c= (3.2)
N + χ2
52 Capitolul 3. Analiza legăturii dintre variabile statistice

unde N este volumul populaţiei.


Interpretări:
1) Dacă c = 0, atunci nu există legătură ı̂ntre variabile (avem legătură nulă);
2) Dacă c ∈ (0; 0, 3), legătura este de intensitate slabă;
3) Dacă c ∈ [0, 3; 0, 7), legătura este de intensitate medie;
4) Dacă c ∈ [0, 7; 1), legătura este de intensitate puternică.

- Aplicaţie. Dintre societăţile comerciale cotate la Bursa de Valori Bucureşti (BVB) s-a ales un
eşantion de 18 societăţi ı̂n raport cu variabilele X - domeniul de activitate şi Y - riscul acţiunilor.
PP Finanţe Alte a) Studiaţi existenţa legăturii dintre do-
PP X
PP Industrie şi bănci domenii
Y PPP meniul de activitate al societăţilor şi ris-
M ic 3 1 7 cul acţiunilor.
b) În cazul existenţei legăturii, precizaţi
M are 2 5 − intensitatea ei.

Rezolvare. a) Calculăm totalurile ı̂n seria bidimensională de mai sus, si obţinem:


PP Finanţe Alte
PP X
PP Industrie şi bănci domenii T otal
Y P P
P
Mic 3 1 7 11
Mare 2 5 − 7
T otal 5 6 7 18

Ni· · N·j
Calculăm frecvenţele absolute teoretice Nij∗ = , i = 1, 2, j = 1, 3 şi găsim:
N
∗ 11 · 5 ∗ 11 · 6 ∗ 11 · 7
N11 = = 3, 06; N12 = = 3, 67; N13 = = 4, 28;
18 18 18
∗ 7·5 ∗ 7·6 ∗ 7·7
N21 = = 1, 94; N22 = = 2, 33; N23 = = 2, 72
18 18 18
iar rezulatele obţinute le trecem ı̂n tabelul de mai jos:
PP Finanţe Alte
PP X
PP Industrie şi bănci domenii T otal
Y P P
P
Mic 3, 06 3, 67 4, 28 11
Mare 1, 94 2, 33 2, 72 7
T otal 5 6 7 18

Calculăm numărul:
2 X
3
X (Nij − Nij∗ )2 (3 − 3, 06)2 (1 − 3, 67)2 (0 − 2, 72)2
χ2 = = + + . . . + = 9, 44.
Nij∗ 3, 06 3, 67 2, 72
i=1 j=1

Deoarece valoarea χ2  0 deducem că există legatură ı̂ntre domeniul de activitate al societăţilor şi
riscul acţiunilor.
3.2. Analiza legăturii dintre variabile ordinale 53

b) Pentru a studia intensitatea legăturii dintre variabilele X şi Y , calculăm coeficientul de contingenţă
(asociere) al lui Pearson:
s r
χ2 9, 44
c= 2
= = 0, 59 ∈ [0, 3; 0, 7)
N +χ 18 + 9, 44

deci avem o legătură de intensitate medie ı̂ntre variabile. 


Observaţie: Un alt coeficient care se poate calcula
r pentru a stabili intensitatea legăturii este coeficientul
√ χ2
de contingenţă (asociere) al lui Ciuprov T = ∈ [0, 1]. Acest coeficient are aceleaşi
N· (L−1)(K−1)
interpretari ca şi coeficientul de contingenţă (asociere)
r al lui Pearson.
√ 9,44
În cazul aplicaţiei precedente, avem: T = = 0, 61 ∈ [0, 3; 0, 7) deci, din nou, este
18· (2−1)(3−1)
vorba despre o legătură de intensitate medie ı̂ntre variabile.

3.2 Analiza legăturii dintre variabile ordinale

Variabilele ordinale sunt tot variabile calitative, dar care, ı̂n plus, permit ierarhizări (clasificări) ale
unităţilor statistice. Legătura dintre variabilele ordinale se numeşte corelaţia rangurilor.
Studiul corelaţiei rangurilor se poate realiza prin intermediul următorilor coeficienţi:

v Coeficientul de corelaţie simplă a rangurilor al lui Kendall


Pentru a putea utiliza acest indicator toate unităţile populaţiei trebuie să poată fi ordonate ı̂n raport
cu variabilele pentru care cercetăm intensitatea legăturii. Presupunem că studiem o populaţie de
volum n ı̂n raport cu două variabile.
Pentru a putea construi coeficientul lui Kendall, vom defini mai ı̂ntâi indicatorul de concordanţa
(P ) şi respectiv, indicatorul de discordanţă (Q). Pe baza indicatorilor de concordanţă şi discordanţă
construim coeficientul de corelaţie simplă a rangurilor al lui Kendall, definit astfel:
P −Q
τ= (3.3)
P +Q

În cazul unei legături directe de intensitate maximă, P va lua valoare sa maximă, iar Q pe cea
minimă, adică: P = n(n−1)
2 , iar Q = 0, deci τ = 1.
În cazul unei legături inverse de intensitate maximă, P va lua valoare sa minimă, iar Q pe cea
maximă, adică: P = 0, iar Q = n(n−1) 2 , deci τ = −1.
În cazul lipsei legăturii, P = Q, iar τ = 0.
Putem determina astfel intervalul ı̂n care va fi cuprins τ , respectiv τ ∈ [−1, 1].

Coeficientul de corelaţie simplă a rangurilor al lui Kendall oferă informaţii legate de:
• intensitatea legăturii dintre cele două variabile ordinale:
- Dacă |τ | ∈ (0; 0, 3) legătura este de intensitate slabă;
- Dacă |τ | ∈ [0, 3; 0, 7) legătura este de intensitate medie;
- Dacă |τ | ∈ [0, 7; 1] legătura este de intensitate puternică.
• sensul legăturii dintre cele două variabile ordinale:
- Dacă τ > 0 legătura este directă;
- Dacă τ = 0 legătura este nulă;
54 Capitolul 3. Analiza legăturii dintre variabile statistice

- Dacă τ < 0 legătura este inversă.

v Coeficientul de corelaţie a rangurilor al lui Spearman


Ca şi coeficientul propus de Kendall, şi acesta se calculează pornind de la tabelul de concordanţa al
rangurilor. Ne vom folosi de diferenţele di dintre ranguri pentru aceeaşi unitate a populaţiei relativ la
cele două variabile. Coeficientul are următoarea expresie:
n
X
6 d2i
i=1
η =1− (3.4)
n(n2 − 1)

Limitele celor doi coeficienţi sunt aceleaşi, la fel şi interpretările valorilor numerice.

v Coeficientul de corelaţie multiplă a rangurilor al lui Kendall


Presupunem că studiem o populaţie de volum n ı̂n raport cu m variabile, iar unităţile populaţiei
sunt ordonate ı̂n raport ca variabilele pentru care cercetăm existenţa legăturii. Ne vom folosi de
sumele si ale rangurilor pentru aceeaşi unitate a populaţiei relativ la cele m variabile. Coeficientul
are următoarea expresie:
2
σS(efectivă)
K= 2 (3.5)
σS(maximă)
n
m2 (n2 −1)
X
2
unde: σS(efectivă) = 1
n (si − S)2 , iar σS(maximă)
2 = 12 .
i=1
Valorile coeficentului K se regăsesc ı̂n intervalul [0, 1], iar interpretările sunt:
- Dacă K ∈ (0; 0, 3) legătura este de intensitate slabă;
- Dacă K ∈ [0, 3; 0, 7) legătura este de intensitate medie;
- Dacă K ∈ [0, 7; 1] legătura este de intensitate puternică.

- Aplicaţie. Pentu un grup de ţări se cunosc:

- valoarea PIB/locuitor: 9, 5 10, 7 8, 3 7, 9 12, 8


- costul mediu lunar/angajat: 103 100 97 73 85

Caracterizaţi nivelul corelaţiei rangurilor, construind câte un clasament al ţărilor ı̂n raport cu
fiecare variabilă.

Rezolvare. Pentru stabilirea clasamentelor vom considera pe prima poziţie ţara cu cel mai mare
PIB/locuitor, respectiv ţara cu cel mai scăzut cost mediu lunar/angajat.
Obţinem următoarea ierarhie a ţărilor:

3 2 4 5 1
- valoarea PIB/locuitor: 9, 5 10, 7 8, 3 7, 9 12, 8
- costul mediu lunar/angajat: 103 100 97 73 85
5 4 3 1 2

şi tabelul rangurilor unităţilor statistice (ţărilor) ı̂n raport cu cele două variabile, fie aceastea X =
valoarea PIB/locuitor şi Y = costul mediu lunar/angajat
3.2. Analiza legăturii dintre variabile ordinale 55

Ţara T1 T2 T3 T4 T5
rang(X) 3 2 4 5 1 (3.6)
rang(Y ) 5 4 3 1 2
• Dacă dorim să calculăm coeficientul de corelaţie simplă a rangurilor al lui Kendall, atunci ordonăm
crescător valorile şirului rang(X).

Ţara T5 T2 T1 T3 T4
rang(X) 1 2 3 4 5
rang(Y ) 2 4 5 3 1

Valoarea factorilor de concordanţă P , respectiv discordanţă Q se obţin din linia rang(Y ), astfel:
Xn
P = pi , unde pi este numărul rangurilor mai mari decât i, situate la dreapta lui i.
i=1
n
X
Q= qi , unde qi este numărul rangurilor mai mici decât i, situate la dreapta lui i.
i=1
Avem P = 3 + 1 + 0 + 0 + 0 = 4, iar Q = 1 + 2 + 2 + 1 + 0 = 6, deci coeficientul de corelaţie simplă
a rangurilor al lui Kendall este:
P −Q 4−6 −2
K= = = = −0, 2
P +Q 4+6 10

Deoarece K < 0 avem o legătură inversă intre PIB/locuitor şi costul mediu lunar/angajat. Adică,
ţările care au un cost mediu lunar/angajat mic, au o valoarea a PIB-ului/locuitor mare.
Pe de altă parte, |K| = 0, 2 ∈ [0; 0, 3), sugerează existenţa unei legături de intensitate slabă ı̂ntre
costul mediu lunar/angajat şi PIB-ul/locuitor.
• Dacă dorim să calculăm coeficientul de corelaţie a rangurilor al lui Spearman, atunci ı̂n tabelul
rangurilor (3.6), calculăm diferenţa rangurilor, di = rang(X) − rang(Y ), pentru fiecare i = 1, 5.

Ţara T1 T2 T3 T4 T5
rang(X) 3 2 4 5 1
rang(Y ) 5 4 3 1 2
di −2 −2 1 4 −1

Valoarea coeficientul de corelaţie a rangurilor al lui Spearman este:


n
X
6 d2i
i=1 6 · [(−2)2 + (−2)2 + (1)2 + (4)2 + (−1)2 ]
η =1− =1− = −0, 3
n(n2 − 1) 5 · (52 − 1)

Deducem că avem o legătura inversă, de intensitate slabă ı̂ntre variabilele analizate.
• Dacă dorim să calculăm coeficientul de corelaţie multiplă a rangurilor al lui Kendall (atenţie: acesta
nu oferă informaţii legate de sensul legăturii, ci doar legate de intensitatea ei!), atunci ı̂n tabelul
rangurilor (3.6), calculăm suma rangurilor, si = rang(X) + rang(Y ), pentru fiecare i = 1, 5.
Xm
(Dacă am fi avut m variabile X1 , X2 , . . . , Xm , atunci si = rang(Xk ), pentru i = 1, n).
k=1
56 Capitolul 3. Analiza legăturii dintre variabile statistice

Ţara T1 T2 T3 T4 T5
rang(X) 3 2 4 5 1
rang(Y ) 5 4 3 1 2
si 8 6 7 6 3

Folosind sumele si , i = 1, 5, construim seria sumelor:


 
3 6 7 8
S: ,5
1 2 1 1
Avem S = 3·1+6·2+7·1+8·1
5 = 6.
Dispersia efectivă a variabilei S este:

4
2 1X (3 − 6)2 · 1 + (6 − 6)2 · 2 + (7 − 6)2 · 1 + (8 − 6)2 · 1
σS(efectivă) = (si − S)2 · Ni = = 2, 8
n 5
i=1

Pentru m = 2 variabile şi n = 5 ţări, dispersia maximă a variabilei S este:

2 m2 (n2 − 1) 22 · (52 − 1)
σS(maximă) = = =8
12 12
Valoarea coeficientul de corelaţie multiplă a rangurilor al lui Kendall este:
2
σS(efectivă) 2, 8
K= 2 = = 0, 35
σS(maximă) 8

deci, potrivit acestui coeficient, am avem o legătură de intensitate medie ı̂ntre variabile. 

3.3 Analiza legăturii dintre variabile cantitative

Dacă dispunem de o repartiţie bidimensională care are la bază variabilele cantitative X şi Y , putem
descompune varianţa totală a variabilei de explicat Y ca sumă a varianţei datorate variabilei explicative
X (varianţa explicită) şi respectiv a varianţei celorlalţi factori (varianţa reziduală), adică:

σY2 = σY2 /X + σY2 /X (3.7)


Vtotală Vexplicită Vreziduală

Dacă nu există legătură, adică X nu are nici o influenţă asupra lui Y , mediile condiţionate Y /X vor
fi identice, iar dispersia lor va fi nulă: σY2 /X = 0.
Putem reţine deci ca regulă de decizie ı̂n statistica descriptivă:
1) Dacă σY2 /X = 0, atunci nu există legătură ı̂ntre variabile;
2) Dacă σY2 /X  0, atunci există legătură ı̂ntre variabile.

Observaţie: Varianţa explicită σY2 /X este cu atât mai mare cu cât mediile condiţionate Y /X sunt mai
diferite ı̂ntre ele. Ceea ce le face să difere este numai influenţa lui X, deoarece am ı̂mpărţit populaţia
ı̂n grupe având ca unic criteriu valorile lui X. Este firesc deci să folosim varianţa explicită ca o mărime
absolută a intensităţii legăturii dintre X şi Y şi ponderea varianţei explicite ı̂n varianţa totală ca o
mărime relativă.
3.3. Analiza legăturii dintre variabile cantitative 57

Pentru a studia intensitatea legăturii dintre variabilele cantitative X şi Y , calculăm:


Raportul de corelaţie: r r
Vexp Vrez
RY X = = 1− (3.8)
Vtot Vtot
sau sub forma lui matematică:
v v
u 2 u

Y /X
u σY2 /X
RY X = = 1 − (3.9)
t t
σY2 σY2

Pentru a-i găsi limitele ne raportăm la cele două situaţii extreme:


- dacă nu există legătură ı̂ntre X şi Y , mediile condiţionate Y /X sunt egale ı̂ntre ele, deci σY2 /X = 0
şi RY X = 0;
- dacă legătura este de intensitate maximă, nu există influenţe ale altor factori decât X asupra lui
Y , nu există variaţie ı̂n cadrul grupelor, deci σY2 /X = 0 şi RY X = 1.
În consecinţă, raportul de corelaţie aparţine intervalului RY X ∈ [0, 1]. Interpretarea intensităţii
legăturii pe baza acestui coeficient se va face astfel:
- dacă RY X = 0 legătura este nulă;
- dacă RY X ∈ (0; 0, 3) legătura este de intensitate slabă;
- dacă RY X ∈ [0, 3; 0, 7) legătura este de intensitate medie;
- dacă RY X ∈ [0, 7; 1] legătura este de intensitate puternică.

- Aplicaţie. Se consideră distribuţia a 52 de societăţi comerciale cu acelaşi profil de activitate ı̂n


raport cu variabilele: X - cheltuielile cu publicitatea (mii lei) şi Y - volumul vânzărilor (mii lei).

PP a) Verificaţi regula de adunare a varianţelor.


X
3−5 5−7 7−9
PP
P b) Există legătură ı̂ntre variabilele X şi Y ? În caz
Y PP
P
P afirmativ, precizaţi intensitatea legăturii.
20 − 40 14 2 1
c) În ce măsură volumul vânzărilor este influenţat
40 − 60 3 10 5
de cheltuielile cu publicitatea?
60 − 80 2 7 8
d) În care grupă de cheltuieli cu publicitatea, volu-
mul mediu al vânzărilor este mai reprezentativ?

Rezolvare. Pentru ı̂nceput, calculăm totalurile şi mijloacele intervalelor:


PP
X 4 6 8
3−5 5−7 7−9
PP
PP T otal
Y P P
P
30
20 − 40 14 2 1 17
50
40 − 60 3 10 5 18
70
60 − 80 2 7 8 17
T otal 19 19 14 52

a) Regula de adunare a varianţelor pentru Y ı̂n funcţie de X este: σY2 = σY2 /X + σY2 /X
= σY2 .
• Varianţa totală pentru Y este Vtot 
30 50 70 30·17+50·18+70·17
Pentru seria lui Y : , 52 avem Y = 52 = 50.
17 18 17
58 Capitolul 3. Analiza legăturii dintre variabile statistice

(30−50)2 ·17+(50−50)2 ·18+(70−50)2 ·17


Varianţa totală este: Vtot = σY2 = 52 = 261, 53.
• Varianţa explicită este Vexp = 2
σY /X .
Construim mai ı̂ntâi seria mediilor condiţionate
 
Y /X∈[3,5] Y /X∈[5,7] Y /X∈[7,9]
Y /X : , 52
19 19 14
Găsim valorile mediilor condiţionate:  
30·14+50·3+70·2 
Y /X∈[3,5] = 19 = 37, 37
  37,37 55,26 60,00 
30·2+50·10+70·7
Y /X∈[5,7] = = 55, 26⇒ Y /X :   , 52
 
19  Y /X∈[3,5] Y /X∈[5,7] Y /X∈[7,9] 
30·1+50·5+70·8 
Y /X∈[7,9] = 14 = 60
19 19 14
Valoarea medie a seriei Y /X este: M (Y /X) = M (Y ) = 50 (aici am folosit o propritate a valorii medii:
proprietatea de adiţiune a mediilor, ı̂nsă media seriei Y /X se poate determina şi prin calcul obişnuit).
Varianţa explicită este:
(37, 37 − 50)2 · 19 + (55, 26 − 50)2 · 19 + (60 − 50)2 · 14
Vexp = σY2 /X = = 95, 34.
52
• Varianţa reziduală este Vrez = σY2 /X .
Construim mai ı̂ntâi seria dispersiilor condiţionate
!
σY2 / σY2 / σY2 /
σY2 /X : X∈[3,5] X∈[5,7] X∈[7,9] , 52
19 19 14

Găsim valorile dispersiilor condiţionate:

(30 − 37, 37)2 · 14 + (50 − 37, 37)2 · 3 + (70 − 37, 37)2 · 2


σY2 /X∈[3,5] = = 177, 28
19
(30 − 55, 26)2 · 2 + (50 − 55, 26)2 · 10 + (70 − 55, 26)2 · 7
σY2 /X∈[5,7] = = 161, 77
19
(30 − 60)2 · 1 + (50 − 60)2 · 5 + (70 − 60)2 · 8
σY2 /X∈[7,9] = = 157, 14
14
 
 177,28 161,77 157,14 
 
Deci, seria dispersiilor condiţionate este: σY2 /X :
 2
 , 52
σY2 / σY2 /

σY / 
X∈[3,5] X∈[5,7] X∈[7,9]
19 19 14
Varianţa reziduală este:
177, 28 · 19 + 161, 77 · 19 + 157, 14 · 14
Vrez = σY2 /X = = 166, 19.
52
Verificăm dacă: Vtot = Vexp + Vrez , adică dacă: 261, 53 = 95, 34 + 166, 19. Observăm că regula de
adunare a varianţelor este verificată.
b) Deoarece Vexp = 95, 34  0, deducem că există legătură ı̂ntre volumul vânzărilor şi cheltuielile cu
publicitatea. Pentru a determina intensitatea legăturii, calculăm raportul de corelaţie:
r r
Vexp 95, 34
RY X = = = 0, 603.
Vtot 261, 53
3.4. Funcţii de regresie 59

Deci RY X ∈ [0, 3; 0, 7), de unde deducem că legătura este de intensitate medie.
c) Calculăm Raportul de determinare:

Vexp 95, 34
RY2 X = · 100% = · 100% = 36, 45%.
Vtot 261, 53

Deci volumul vânzărilor depinde de cheltuielile cu publicitatea ı̂n proporţie de 36, 45%, şi de 100% −
36, 45% = 63, 55% de alţi factori.
d) Calculăm coeficientul de variaţie al lui Pearson pentru volumul vânzărilor ı̂n raport cu fiecare
grupă de cheltuieli. Volumul mediu al vânzărilor va fi mai reprezentativ, pentru grupa de cheltuieli
cu publicitatea care are valoarea coeficientul de variaţie al lui Pearson
 minimă. 
30 50 70
• Pentru prima grupă de cheltuieli cu publicitatea: G1 = Y /X∈[3,5] : , 19 avem:
14 3 2
q
2
σG
p
σG1 1 177, 28
CVG1 = · 100% = · 100% = · 100% = 35, 63%.
G1 G1 37, 37
 
30 50 70
• Pentru a doua grupă de cheltuieli cu publicitatea: G2 = Y /X∈[5,7] : , 19 avem:
2 10 7
q
2
σG
p
σG2 2 161, 77
CVG2 = · 100% = · 100% = · 100% = 23, 02%.
G2 G2 55, 26
 
30 50 70
• Pentru a treia grupă de cheltuieli cu publicitatea: G3 = Y /X∈[7,9] : , 14 avem:
1 5 8
q
2
σG
p
σG3 3 157, 14
CVG3 = · 100% = · 100% = · 100% = 20, 89%.
G3 G3 60

Observăm că cel mai mic coeficient de variaţie al lui Pearson se obţine pentru a treia grupă de cheltuieli
cu publicitatea. Deci, volumul mediu al vânzărilor este mai reprezentativ pentru grupa de cheltuieli
cu publicitatea cuprinse ı̂ntre 7000 − 9000 lei. 

3.4 Funcţii de regresie


Dacă ı̂ntre două variabile (ambele cantitative!) se constată existenţa unei legături de o anumită
intensitate, ne punem problema posibilităţii modelării legăturii printr-un model matematic. O primă
etapă ı̂n acest demers este formularea unei ipoteze cât mai verosimile cu privire la forma legăturii.
În acest scop, pe baza tabelului de corelaţie construim norul statistic şi linia poligonală a mediilor
condiţionate ale variabilei dependente.
60 Capitolul 3. Analiza legăturii dintre variabile statistice

Figura 3.1: Linia poligonală a mediilor condiţionate

În funcţie de forma liniei frânte obţinute şi a poziţiei punctelor norului faţă de ea se formulează o
ipoteză cu privire la forma funcţiei de regresie. Dacă dorim să studiem o legătură multiplă, respectiv
dependenţa lui Y faţă de variabilele factoriale X1 , X2 , . . ., Xn atunci pentru fiecare pereche (Y, X1 ),
(Y, X2 ), . . ., (Y, Xn ) desenăm câte un nor statistic. Forma generală a variabilei Y ı̂n funcţie de
variabilele factoriale X1 , X2 , . . ., Xn se scrie:

Y = f (X1 , X2 , . . . , Xn ) + ε

unde f (X1 , X2 , . . . , Xn ) reprezintă funcţia de regresie care aproximează cel mai bine forma legăturii,
iar ε reprezintă o variabilă aleatoare numită reziduală, care ı̂nsumează efectul altor factori decât cei
luaţi ı̂n calcul.

v Estimarea parametrilor funcţiilor de regresie


Este o etapă care se succede firesc alegerii formei funcţiei. În estimarea parametrilor va trebui să
ţinem cont de abaterea punctelor norului faţă de modelul matematic ales Y (X1 , X2 , . . . , Xn ), datorat
altor factori decât X1 , X2 , . . ., Xn , consideraţi neesenţiali, cuantificaţi prin variabila reziduală ε.
Principiul de la care se porneşte ı̂n estimarea parametrilor este cel al pătratelor minime. Minimizăm
suma pătratelor abaterilor valorilor observate ale lui Y de la nivelul calculat prin Y (X1 , X2 , . . . , Xn ).
Condiţia de minim a sumei este echivalentă cu condiţia de minim a mediei:
2
M Y − Y (X1 , X2 , . . . , Xn ) = M (ε2 ) minimă.


Ecuaţia Y (X1 , X2 , . . . , Xn ) care descrie legătura dintre Y şi factorii de influenţă X1 , X2 , . . ., Xn ,


se numeste ecuaţia de regresie. Metoda regresiei constă ı̂n modelarea legăturilor statistice prin ecuaţia
de regresie.
Deoarece problema de minim se poate rezolva doar cunoscând forma particulară a funcţiei, vom
aborda estimarea parametrilor separat, pe tipuri de funcţii.

• Regresia liniară multiplă


În ipoteza ı̂n care legătura dintre Y şi factorii săi de influenţă X1 , X2 , . . ., Xn , este liniară, ecuaţia de
regresie va fi de forma:

Y (X1 , X2 , . . . , Xn ) = a0 + a1 X1 + a2 X2 + . . . + an Xn (3.10)
3.4. Funcţii de regresie 61

Coeficienţii a0 , a1 , a2 , . . ., an se numesc parametrii modelului şi vor rezulta din minimizarea următoarei
funcţii cu (n + 1) necunoscute:
 2
G(a0 , a1 , . . . , an ) = M Y − (a0 + a1 X1 + . . . + an Xn ) (3.11)

Condiţiile de minim constă ı̂n anularea celor (n + 1) derivate parţiale ale funcţiei G(a0 , a1 , . . . , an ) ı̂n
raport cu necunoscutele a0 , a1 , . . ., an ceea ce conduce la următorul sistem de ecuaţii:

∂G(a0 , a1 , . . . , an )  
= −2M Y − (a0 + a1 X1 + . . . + an Xn ) = 0



∂a0 (3.12)
∂G(a0 , a1 , . . . , an )  

 = −2M Y − (a0 + a X
1 1 + . . . + a X
n n ) · Xj = 0, ∀ j = 1, n
∂aj

sau ı̂ntr-o formă echivalentă:


( 
M a0 + a1 X1 + . . . + an Xn = M (Y )

M a0 + a1 X1 + . . . + an Xn · Xj = M (Y ) · Xj , ∀ j = 1, n

de unde rezultă:
(
a0 + a1 M (X1 ) + . . . + an M (Xn ) = M (Y )
(3.13)
a0 M (Xj ) + a1 M (X1 Xj ) + . . . + an M (Xn Xj ) = M (Y Xj ), ∀ j = 1, n

Prin rezolvarea acestui sistem liniar de ecuaţii ı̂n raport cu necunoscutele a0 , a1 , . . ., an , se obţin
valorile parametrilor funcţiei de regresie liniare multiple. Astfel, legătura statistică dintre Y şi X1 ,
X2 , . . ., Xn este modelată prin aproximare cu o legătură funcţională.

• Regresia liniară simplă


În cazul cand variabila endogenă Y este influenţată de un singur factor X, iar norul de puncte al
mediilor condiţionate are forma din figura 3.2 vorbim de o regresie liniară simplă.
Funcţia de regresie liniară simplă are forma

Y = a + bX + ε,

ı̂n care parametrii reali a şi b se pot determina folosind


următoarele formule:
cov(X, Y ) M (XY ) − M (X)M (Y )
b= 2 = (3.14)
σX M (X 2 ) − M (X)2
Figura 3.2: Dreapta de regresie a = M (Y ) − b · M (X) (3.15)

Formulele (3.14) şi (3.15) se deduc din rezolvarea sistemului (3.13), pentru cazul când variabila endo-
genă Y depinde doar de factorul exogen X.

• Regresia parabolică
În economie sunt numeroase exemplele ı̂n care legătura dintre fenomene şi variabilele care le cuantifică
nu este liniară. Dacă Y reprezintă recolta la hectar dintr-un produs agricol, iar X cantitatea de
ı̂ngrăşăminte, ne vom da seama chiar şi intuitiv că o anumită creştere a lui X nu provoacă aceeaşi
creştere a lui Y pe tot intervalul de variaţie al celor două variabile. La valori mari ale cantităţii
de ı̂ngrăs.aminte, acestea provoacă saturaţie sau chiar nocivitate, ducând la o stagnare, respectiv
62 Capitolul 3. Analiza legăturii dintre variabile statistice

diminuare a producţiei. Alte exemple pot fi: legătura dintre vechimea ı̂n muncă şi mărimea salariului,
dintre cheltuielile cu publicitatea şi volumul vânzărilor, etc.
În cazul regresiei parabolice, norul de puncte al mediilor condiţionate are forma grafică prezentată
ı̂n figura 3.3
Funcţia de regresie parabolică are forma generală

Y = a + bX + cX 2 + ε

unde a, b şi c sunt parametrii reali ai funcţiei. Deter-


minarea parametrilor funcţiei parabolice de regresie se
poate face fie aplicând direct funcţiei metoda pătratelor
minime, fie prin reducerea la cazul liniar prezentat ante-
rior. În ambele cazuri vom exemplifica pentru parabola
Figura 3.3: Parabola de regresie de ordinul doi.

a) Estimarea parametrilor prin aplicarea directă a metodei pătratelor minime

Ecuaţia de regresie a modelului se scrie:

Y (X) = a0 + a1 X + a2 X 2

Din condiţia de minimizare a expresiei:


 2
G(a0 , a1 , a2 ) = M Y − Y (X)

avem următoarele egalităţi:

∂G(a0 , a1 , a2 ) ∂G(a0 , a1 , a2 ) ∂G(a0 , a1 , a2 )


= 0, = 0, respectiv =0
∂a0 ∂a1 ∂a2
din care rezultă sistemul de ecuaţii:

2
 
−2M Y − (a0 + a1 X + a2 X ) = 0

−2M Y − (a0 + a1 X + a2 X 2 ) X = 0

−2M Y − (a0 + a1 X + a2 X 2 ) X 2 = 0
   

care este echivalent cu:



2
a0 + a1 M (X) + a2 M (X ) = M (Y )

a0 M (X) + a1 M (X 2 ) + a2 M (X 3 ) = M (Y X)

a0 M (X 2 ) + a1 M (X 3 ) + a2 M (X 4 ) = M (Y X 2 )

Rezolvând acest sistem ı̂n necunoscutele a0 , a1 , a2 , rezultă parametrii ecuaţiei de regresie parabolice.
În mod asemănător se poate proceda pentru orice regresie neliniară.

b) Estimarea parametrilor prin reducerea la cazul liniar

Având modelul parabolic de ecuaţie:

Y (X) = a + bX + cX 2
3.4. Funcţii de regresie 63

facem substituţiile X1 := X şi X2 := X 2 , dupa care ecuaţia devine:


Y (X1 , X2 ) = a + bX1 + cX2
care reprezintă un model liniar cu doi factori. Problema regresiei neliniare pentru cazul unei parabole
de gradul doi se reduce astfel la o problemă de regresie liniară, care se rezolvă conform cazului liniar.
Observaţie: În caz mai general, dacă ecuaţia de regresie este un polinom de gradul n:
Y (X) = a0 + a1 X + a2 X 2 + . . . + an X n
efectuând substituţiile: X1 := X, X2 := X 2 , . . . , Xn := X n obţinem cazul liniar ı̂n raport cu (n + 1)
variabile.

• Regresia exponenţială
În cazul regresiei exponenţiale, norul de puncte al mediilor condiţionate are forma grafică prezentată
ı̂n figura 3.4
Funcţia de regresie exponenţială are forma generală

Y = a · bX · eε (3.16)

unde a şi b sunt parametrii reali ai funcţiei.


Aducerea la forma liniară a ecuaţiei (3.16) presupune
logaritmarea ecuaţiei

ln Y = ln(a · bX · eε ) = ln a + ln b · X + ε

şi folosirea substituţiilor


Figura 3.4: Funcţia exponenţială de
regresie Z := ln Y, a∗ := ln a, b∗ := ln b.

Obţinem astfel modelul liniar simplu: Z = a∗ + b∗ X + ε.

• Regresia hiperbolică
În cazul regresiei hiperbolice, norul de puncte al mediilor condiţionate are forma grafică prezentată ı̂n
figura 3.5
Funcţia de regresie hiperbolică are forma generală
1
Y =a+b· +ε (3.17)
X
unde a şi b sunt parametrii reali ai funcţiei.
Aducerea la forma liniară a ecuaţiei (3.17) presupune
folosirea substituţiei:
1
Z := .
X
Figura 3.5: Hiperbola de regresie
Obţinem astfel modelul liniar simplu: Y = a + bZ + ε.

Alte tipuri de regresie


În practica economică se ı̂ntâlnesc frecvent şi alte tipuri de funcţii (unele chiar funcţii compuse).
Principiul de lucru pentru estimarea parametrilor va ramâne ı̂nsă ı̂ntotdeauna acelaşi: ı̂ncercarea de
a aduce funcţia la o formă liniară.
64 Capitolul 3. Analiza legăturii dintre variabile statistice

Foarte des ı̂ntâlnite sunt funcţiile de producţie. Forma generală a acestora este:

Y (X1 , X2 , . . . , Xn ) = a · X1m1 · X2m2 · . . . · Xnmn

Printr-o astfel de funcţie se defineşte o legătură ı̂ntre nivelul producţiei Y şi factorii de care aceasta
depinde: productivitatea muncii, calificarea forţei de muncă, gradul de ı̂nzestrare cu capital fix, etc.
Determinarea parametrilor se face prin reducere la cazul liniar prin logaritmare:

lg Y (X1 , X2 , . . . , Xn ) = lg a + m1 · lg X1 + . . . + mn · lg Xn

Dacă ı̂n această nouă ecuaţie facem substituţiile:

Z(X1 , X2 , . . . , Xn ) := lg Y (X1 , X2 , . . . , Xn )Xi0 := lg Xi , i = 1, n

reducem ecuaţia la una liniară multiplă.

Analiza reprezentativităţii funcţiei de regresie

Coeficientul de corelaţie
Construcţia lui este similară cu a raportului de corelaţie, cu deosebirea că varianţa ı̂n fiecare grupă
este calculată folosind suma pătratelor abaterilor faţă de valorile ajustate prin funcţia de regresie şi
nu faţă de media grupei. Ca urmare, coeficientul de corelaţie va fi specific fiecărei funcţii ı̂n parte.
Expresia lui de calcul (admisă aici fără demonstraţie) este:
r
det M
rY X = 1 − ∈ [0; 1] (3.18)
m00 M00
unde M este matricea de variaţie şi covariaţie aferentă fiecărui model de regresie, m00 este primul
elemenet al matricii M , iar M00 este complementul algebric al lui m00 . Interpretarea acestui coeficient
ı̂n functie de valorile pe care le poate lua este următoarea:
- dacă rY X ∈ [0; 0, 3] funcţia nu este reprezentativă pentru modelarea legăturii dintre variabile;
- dacă rY X ∈ (0, 3; 0, 7] funcţia are o reprezentativitate medie pentru modelarea legăturii dintre
variabile;
- dacă rY X ∈ (0, 7; 1] funcţia este foarte reprezentativă pentru modelarea legăturii dintre variabile.
Aceste limite nu trebuie interpretate foarte rigid. Valorile coeficienţilor este bine să fie comparate
cu ale altor coeficienţi, ai altor funcţii. Pentru aceeaşi repartiţie de exemplu, pentru funcţiile de regresie
alese ca fiind posibile calculam coeficienţii de corelaţie şi ı̂l reţinem pe cel mai mare, considerând acea
funcţie ca fiind cea mai reprezentativă.
În cazul regresiei liniare simple, formula coeficientului de corelaţie (3.18) poate fi adusă la o formă
echivalentă mai simplă:
r r
m00 m11 − m01 m10 m01 m10 m01 M (XY ) − M (X)M (Y )
rY X = 1 − = =√ √ =
m00 m11 m00 m11 m00 · m11 σY · σX

- Aplicaţie. Se cunosc valorile cererii şi preţului unui anumit produs pe opt pieţe:

Cerere (nr. buc) 15,4 11,3 10 6 20 17 9,4 8


Preţ (u.m.) 3,2 4,9 5 10 1,2 2,3 5,8 7,2

a) Pe un grafic adecvat, identificaţi formele posibile ale funcţiilor de regresie dintre cerere şi preţ;
b) Găsiţi parametrii funcţiilor de regresie identificate la punctul precedent şi analizaţi reprezenta-
tivitatea fiecărei funcţii.
3.4. Funcţii de regresie 65

Rezolvare. a) Pentru a identifica posibilele funcţii de regresie care ar modela legătura matematică
dintre cerere şi preţ, construim norul de puncte, reprezentând puncte de coordonate (preţ, cerere):

Figura 3.6: Dreapta şi hiperbola de regresie

Din graficele prezentate ı̂n figura 3.6 identificăm dreapta şi hiperbola de regresie ca fiind cele mai
”apropiate” grafice de punctele de coordonate (preţ, cerere).
b) Dorim să găsim parametrii dreptei şi hiperbolei de regresie, precum şi gradul lor de reprezentativi-
tate.
• Dreapta de regresie Y = a + bX + ε are ca parametrii numerele reale a (termen liber constant) şi b
(coeficient de regresie liniar). Pentru a determina aceşti parametrii, folosim formulele:
M (XY ) − M (X)M (Y )
b= (3.19)
M (X 2 ) − [M (X)]2
a = M (Y ) − b · M (X) (3.20)
Ţinând cont ca Y = cererea, iar X = preţul, avem următoarele medii:
3, 2 + 4, 9 + 5 + 10 + 1, 2 + 2, 3 + 5, 8 + 7, 2
M (X) = = 4, 95
8
15, 4 + 11, 3 + 10 + 6 + 20 + 17 + 9, 4 + 8
M (Y ) = = 12, 13
8
3, 2 · 15, 4 + 4, 9 · 11, 3 + . . . + 7, 2 · 8
M (XY ) = = 48, 73
8
3, 22 + 4, 92 + 52 + 102 + 1, 22 + 2, 32 + 5, 82 + 7, 22
M (X 2 ) = = 31, 43
8
M (X)2 = 4, 952 = 24, 50

Înlocuind aceste medii ı̂n relaţia (3.19) găsim:


48, 73 − 4, 95 · 12, 13
b= = −1, 63.
31, 43 − 24, 5
Utilizând acum ı̂n relaţia (3.20) găsim:

a = 12, 13 − (−1, 63) · 4, 95 = 20, 19


66 Capitolul 3. Analiza legăturii dintre variabile statistice

Deci ecuaţia dreptei de regresie este Y = 20, 19 − 1, 63 · X + ε .


Pentru a studia nivelul de reprezentativitate al dreptei de regresie calculăm coeficientul de corelaţie
liniară
cov(X, Y ) M (XY ) − M (X)M (Y )
rY X = =p p (3.21)
σX · σY M (X 2 ) − M (X)2 · M (Y 2 ) − M (Y )2
Avem ca şi calcule intermediare:
15, 42 + 11, 32 + 102 + 62 + 202 + 172 + 9, 42 + 82
M (Y 2 ) = = 167, 78
8
M (Y )2 = [M (Y )]2 = 12, 132 = 147, 14

Înlocuind valorile medii ı̂n formula (3.21) obţinem:


48, 73 − 4, 95 · 12, 13
rY X = √ √ = −0, 95.
31, 43 − 24, 5 · 167, 78 − 147, 14
Astfel, |rY X | = 0, 95 ∈ (0, 7; 1], deci dreapta de regresie este puternic reprezentativă pentru modelarea
legăturii dintre preţ şi cerere.

• Hiperbola de regresie Y = a + b X1 + ε are ca parametrii numerele reale a (termen liber constant) şi
b (coeficient de regresie hiperbolic). Pentru a determina aceşti parametrii, facem substituţia Z := X1
şi obţinem modelul de regresie liniar simplu Y = a + b · Z + ε. Formulele (3.19) şi (3.20) se rescriu
astfel:
M (ZY ) − M (Z)M (Y )
b= (3.22)
M (Z 2 ) − [M (Z)]2
a = M (Y ) − b · M (Z) (3.23)
1
Stările (valorile) variabilei Z le obţinem din tabelul iniţial, folosind transformarea Z = X. Avem:

Cerere (nr. buc) 15,4 11,3 10 6 20 17 9,4 8


1 1 1 1 1 1 1 1 1
Z = Preţ (u.m.) 3,2 4,9 5 10 1,2 2,3 5,8 7,2

Avem următoarele valori medii:


1 1 1 1 1 1 1 1
3,2 + 4,9 + 5 + 10 + 1,2 + 2,3 + 5,8 + 7,2
M (Z) = = 0, 29
8
M (Y ) = 12, 13
1 1 1
3,2 · 15, 4 + 4,9 · 11, 3 + . . . + 7,2 ·8
M (ZY ) = = 4, 56
8
1 1 1
3,22
+ 4,92
+ 52
+ 1012 + 1
1,22
+ 1
2,32
+ 1
5,82
+ 1
7,22
M (Z 2 ) = = 0, 13
8
2 2 2
M (Z) = [M (Z)] = 0, 29 = 0, 08.

Înlocuind valorile medii in relaţiile (3.22) şi (3.23), obţinem: b = 20, 84 şi a = 6, 08.
1
Deci, hiperbola de regresie este Y = 6, 08 + 20, 84 · +ε .
X
Pentru a studia nivelul de reprezentativitate al hiperbolei de regresie calculăm coeficientul de
corelaţie hiperbolică
cov(Z, Y ) M (ZY ) − M (Z)M (Y )
rY Z = =p p
σZ · σY M (Z ) − M (Z)2 · M (Y 2 ) − M (Y )2
2
3.5. Teme de control 67

Obţinem:
4, 56 − 0, 29 · 12, 13
rY Z = √ √ = 1.
0, 13 − 0, 08 · 167, 78 − 147, 14
Hiperbola este puternic reprezentativă pentru modelarea legăturii matematice dintre cerere şi preţ.
Deoarece |rY Z | > |rY X |, deducem că hiperbola de regresie este mai reprezentativă decât dreapta de
regresie. 

3.5 Teme de control


P1. Pentru o distribuţie ı̂n raport cu două variabile calitative ı̂ntre care se presupune că ar putea
exista vreo legătură, se cere:

1. Verificarea existenţei legăturii dintre cele două variabile;


2. Dacă legătura există, cât de intensă este aceasta ?

P2. Pentru o populaţie observată ı̂n raport cu două variabile cantitative ı̂ntre care ar putea exista o
legătură, se cere:

1. Aprecierea existenţei şi a intensităţii legăturii dintre variabile;


2. Să se formuleze pe baza unui grafic adecvat ipoteze cu privire la forma posibilă a funcţiei
de regresie dintre ele;
3. Pentru funcţiile reţinute ca fiind posibile, să se calculeze parametrii;
4. Care din aceste funcţii este mai reprezentativă ?
5. Pentru funcţia aleasă să se facă câteva simulari ale valorilor previzionate prin aceasta.

P3. Cunoaştem următoarea distribuţie a 52 de societăţi comerciale cu acelaşi profil de activitate, ı̂n
raport cu variabilele X cheltuielile cu publicitatea (mil. lei) şi Y - volumul vânzărilor (mil. lei).
PP
PP X
PP [30; 50] (50; 70] (70; 90)
Y PPP
[200; 400] 14 2 1
(400; 600] 3 10 5
(600; 800] 2 7 8

1. Pe baza unui grafic adecvat să se emită ipoteze privind forma posibilă a funcţiei de regresie.
2. În ipoteza unei forme liniare a dependenţei dintre Y şi X, să se calculeze parametrii funcţiei
de regresie.
3. Să se studieze reprezentativitatea funcţiei de regresie pentru modelarea legăturii dintre cele
două variabile.
4. Care este valoarea medie a volumului vânzărilor pentru un nivel al cheltuielilor cu publici-
tatea de 55 milioane lei ?
5. Aceleaşi cerinţe de la punctele 2, 3 şi 4 pentru o formă parabolică a dependenţei dintre Y
şi X.

Bibliografie:
68 Capitolul 3. Analiza legăturii dintre variabile statistice

1. Drosbeke J.J., Éléments de statistiques, Ed. Ellipses, Bruxelles, 1988;

2. Buiga A., Dragoş C., Lazăr D., Parpucea I., Todea A., Statistică I, Ed. Presa Universitară
Clujeană, Cluj-Napoca, 2003;

3. Buiga A., Dragoş C., Lazăr D., Brendea G., Litan C., Mare C., Statistică Descriptivă, Ed.
Napoca Star, Cluj-Napoca, 2018;

4. Goldfarb B., Pardoux C., Introduction à la méthode statistique, Ed. Dunod, Paris, 1995;

5. Py B., Statistique descriptive, Ed. Economica, 1990;

6. Roger P., Statistique pour la gestion, Ed. Management et société, Caen, 2000;

7. Tassi P., Méthodes Statistiques, Ed. Economica, Paris, 1991;

8. Wonnacott T.H., Wonnacott R.J., Statistique, Économie-Gestion-Sciences-Médecine, Ed. Eco-


nomica, Paris, 1991.
Capitolul 4

Serii cronologice

Secţiuni
4.1. Indici statistici
4.2. Indicatori medii specifici seriilor cronologice
4.3. Componentele unei serii cronologice
4.3. Teme de control

Obiective
• Înţelegerea şi aplicarea metodelor de calcul a indicilor factoriali ı̂n analiza dinamicii indicatorilor
economici;
• Cuantificarea dinamicii medii a unui indicator;
• Cunoaşterea şi utilizarea metodelor cantitative de previziune. Metoda clasică de descompunere
a unei serii de timp.

Cuvinte cheie
• Indice al variaţiei integrale, indice factorial, indice al preţului;
• Nivel mediu al unei serii de timp, indice mediu, ritm mediu, diferenţa medie absolută;
• Serie de timp, model dinamic, funcţii de tendinţă, coeficienţii sezonalităţii, ciclicitate
• Medii mobile, previziune, erori de previziune, netezire exponenţială.

Rezultate aşteptate
Studentul ı̂nţelege noţiunile de indice factorial, nivel mediu, indice mediu, ritm mediu şi stăpâneşte
modalităţile de calcul ale acestora. Utilizează metode cantitative ı̂n previziune; ı̂n acest sens, identifică
componentele prezente ı̂ntr-o serie de timp, modelează şi extrapolează tendinţa, utilizează adecvat o
medie mobilă, modelează componenta sezonieră şi ciclică, utilizează metoda netezirii exponenţiale ı̂n
netezire şi previziune.

69
70 Capitolul 4. Serii cronologice

4.1 Indici statistici


Studiul fenomenelor economice şi sociale presupune ı̂n marea majoritate a cazurilor şi măsurarea
variaţiei unor mărimi. Această variaţie poate fi urmărita ı̂n timp, spaţiu sau relativ la nişte categorii.
Se va folosi termenul generic de stare, notându-se cu j starea luată ca bază de comparaţie şi cu k cea
cercetată ı̂n raport cu aceasta. Se va nota cu Z mărimea care constituie obiectul de studiu, variaţia
acesteia putând fi exprimată atât sub formă absolută, cât şi relativă.
Dintre exprimările sub formă relativă, un loc deosebit de important ı̂l ocupă indicele statistic.
În practică variaţia totală a variabilei Z este datorată variaţiei unor alte variabile a căror evoluţie
ı̂ntre două stări j şi k influenţează evoluţia lui Z. Avem de a face, aşadar, cu Z de forma Z =
f (X1 , X2 , . . . , Xm ). Un astfel de model este un model de tip determinist ı̂n care cei m factori determină
ı̂n totalitate nivelul lui Z. În cazul unui astfel de model se pot distinge trei categorii de indici:

1) indicele variaţiei totale (integrale) a mărimii Z:

k/j Z(k) f (X1 (k), X2 (k), . . . , Xm (k))


IZ = =
Z(j) f (X1 (j), X2 (j), . . . , Xm (j))

2) indici ai factorilor Xi (individuali sau elementari):

k/j Xi (k)
IXi =
Xi (j)

k/j
3) indici ai variaţiei parţiale ale lui Z sau indici factoriali: IZ/Xi - ne arată de câte ori s-a modificat
Z ı̂n starea k faţă de starea j sub influenţa exclusivă a factorului Xi .

În cele ce urmează prezentăm indicii factoriali.

• Indicii factoriali de tip Laspeyres.


Acest indice este cel mai cunoscut şi utilizat ı̂n practica economică. Mai poartă şi denumirea de
indicele preţurilor. Dacă se consideră un coş de r produse sau bunuri, volumul valoric al acestora (Z)
se va calcula dupa relaţia:
X r
Z= p i qi
i=1
Indicele factorial al preţurilor calculat prin metoda Laspeyres va avea expresia:
r
X
pi (k)qi (j)
k/j i=1
IZ/p (·L) = r
X
pi (j)qi (j)
i=1

iar indicele factorial al cantităţilor (volumului fizic), expresia:


r
X
pi (j)qi (k)
k/j i=1
IZ/q (L·) = r
X
pi (j)qi (j)
i=1
4.1. Indici statistici 71

unde pi (j) şi pi (k) sunt preţurile din perioada de bază şi perioada curentă, qi (j) sunt cantităţile din
perioada de bază, iar ki măsoară importanţa produsului sau bunului i ı̂n coşul indicelui la momentul
bază de comparaţie.
Pentru cazul general, când Z depinde de m factori de influenţă, iar forma funcţiei f este oarecare,
Florea (1986) deduce o regulă pentru elaborarea indicilor factoriali de tip Laspeyres.

• Indicii factoriali de tip Paasche.


Acest indice a apărut tot ca un indice al preţurilor, indicele factorial de preţ de tip Paasche având
expresia:
X r
pi (k)qi (k)
k/j i=1
IZ/p (·P ) = r
X
pi (j)qi (k)
i=1
iar cel factorial al cantităţilor (volumului fizic), expresia:
r
X
pi (k)qi (k)
k/j i=1
IZ/q (P ·) = r
X
pi (k)qi (j)
i=1

Pentru o funcţie oarecare f , ı̂n care mărimea Z depinde de m factori, in Florea (1986) este prezentată
o generalizare.

• Indicii factoriali de tip Fisher.


In 1922, I. Fisher propune o nouă expresie de calcul a indicelui preţurilor. Acesta se va obţine ca o
medie geometrică a indicilor de preţ de tip Laspeyres şi Paasche, astfel:
r
k/j k/j k/j
IZ/p (F ) = IZ/p (·L) · IZ/p (·P )

De aceeaşi manieră se obţine şi indicele de volum:


r
k/j k/j k/j
IZ/q (F ) = IZ/q (L·) · IZ/q (P ·)

- Aplicaţie. O societate hotelieră dispune de trei tipuri de locuri de cazare: camere cu un singur pat
(single), camere cu două paturi (double) şi apartamente. Numărul de camere ı̂nchiriate (X) şi tariful
practicat (Y) ı̂n două luni consecutive sunt date ı̂n tabelul următor:

Luna j Luna k
Tipul camerei X Y (e) X Y (e)
Single 80 30 110 35
Double 50 40 60 40
Apartament 20 50 25 45

Calculaţi volumul valoric al ı̂ncasărilor sub influenţa exclusivă a numărului de camere ı̂nchiriate,
respectiv sub influenţa exclusivă a tarifului practicat, folosind metoda Laspeyres.
72 Capitolul 4. Serii cronologice

Rezolvare. Volumul valoric al ı̂ncasărilor din ı̂nchirierea camerelor (Z) se va calcula dupa relaţia:
3
X
Z= Xi Yi
i=1

Indicii factoriali de tip Laspeyres vor fi:


3
X
Xi (k)Yi (j)
k/j i=1 110 · 30 + 60 · 40 + 25 · 50
IZ/X (·L) = = = 1, 287
X3 80 · 30 + 50 · 40 + 20 · 50
Xi (j)Yi (j)
i=1

Constatăm că volumul valoric al ı̂ncasărilor a crescut ı̂n luna k faţă de luna j de 1, 287 ori sub influenţa
exclusivă a modificării numărului de camere ı̂nchiriate.
3
X
Xi (j)Yi (k)
k/j i=1 80 · 35 + 50 · 40 + 20 · 45
IZ/Y (L·) = = = 1, 055
X3 80 · 30 + 50 · 40 + 20 · 50
Xi (j)Yi (j)
i=1

Deducem că volumul valoric al ı̂ncasărilor a crescut ı̂n luna k faţă de luna j de 1, 055 ori sub influenţa
exclusivă a modificării tarifului practicat. 

- Aplicaţie. Se consideră mărimea Z ca fiind profitul brut al unei societăţi şi factorii: X - veniturile
totale, respectiv Y - cheltuielile totale ale aceleaşi societăţi. În doi ani consecutivi variabilele X şi Y
au ı̂nregistrat valorile:

Anul
t−1 t
X (mld. lei) 10 12
Y (mld. lei) 8 9

Calculaţi indicii factoriali de tip Laspeyres pentru variaţia profitul brut sub influenţa exclusivă a
veniturilor totale, respectiv a cheltuielilor totale şi interpretaţi rezultatele găsite.

Rezolvare. Modelul care leagă cele trei mărimi va fi de forma: Z = X − Y .


Expresiile şi valorile indicilor factoriali de tip Laspeyres sunt:

t/t−1 X(t) − Y (t − 1) 12 − 8
IZ/X (·L) = = =2
X(t − 1) − Y (t − 1) 10 − 8

- profitul brut a crescut ı̂n anul t faţă de anul t − 1 de 2 ori sub influenţa exclusivă a modificării
veniturilor totale;
t/t−1 X(t − 1) − Y (t) 10 − 9
IZ/Y (L·) = = = 0, 5
X(t − 1) − Y (t − 1) 10 − 8
- profitul brut a scăzut ı̂n anul t faţă de anul t − 1 de 0, 5 ori sub influenţa exclusivă a modificării
cheltuielilor totale. 
4.2. Indicatori medii specifici seriilor cronologice 73

v Principalii indici utilizaţi ı̂n economie


Indicele preţurilor de consum este un indice de tip Laspeyres cu bază fixă:
n
X
pi (t)qi (0) n n
t/0 i=1
X pi (0)qi (0) pi (t) X
IZ/p (·L) = n = n · = ki (0) · Ipt/0
i
X X pi (0)
pi (0)qi (0) i=1 pi (0)qi (0) i=1

i=1 i=1

unde: n - reprezintă numărul de mărfuri şi servicii din coşul indicelui;


ki (0) - reprezintă structura de consum, fiind ponderea mărfii sau serviciului i ı̂n consumul populaţiei;
pi (0) şi pi (t) sunt preţurile ı̂nregistrate de marfa sau produsul i ı̂n perioada de bază şi perioada
curentă;
Ponderile ki (0) sunt obţinute prin Ancheta Integrată ı̂n Gospodării şi rezultă din structura cheltu-
ielilor medii lunare efectuate de o gospodărie pentru cumpărarea mărfurilor şi plata serviciilor necesare
satisfacerii nevoilor de trai; aceste ponderi se actualizează la intervale de câţiva ani. Preţurile cores-
punzătoare celor n mărfuri şi servicii din coşul indicelui se culeg lunar, ı̂n urma unei cercetări selective
organizate de Institutul Naţional de Statistică.
Indicele producţiei industriale măsoară evoluţia de ansamblu a preţurilor produselor şi serviciilor
industriale fabricate şi livrate de producătorii interni ı̂n perioada curentă faţă de perioada de bază, ı̂n
primul stadiu de comercializare a produselor sau serviciilor. Indicele utlizat este tot un indice de tip
Laspeyres.
Indicele salariilor măsoară evoluţia salariilor ı̂n perioada curentă faţă de perioada de bază. Alături de
indicele preţurilor de consum este folosit ı̂n evaluarea nivelului de trai. Se utilizează, de asemenea, un
indice de tip Laspeyres, care măsoară variaţia fondului de salarii total (Z) sub influenţa modificării
salariilor medii Si corespunzătoare ramurii i.
Indicii bursieri. Principalii indici bursieri se diferenţiază prin mai multe elemente: eşantionarea,
respectiv alegerea titlurilor din coşul indicelui, reprezentativitate, modul de calcul utilizat şi natura
variabilelor luate ı̂n calcul. Cei mai cunoscuţi şi urmăriţi indici bursieri, cu excepţia familiei de indici
Dow Jones se calculează ca şi indici Laspeyres.

4.2 Indicatori medii specifici seriilor cronologice

Pentru o serie cronologică  


1 2 ... t ... n
Y :
y1 y2 . . . yt . . . yn
se pot definii următorii indicatori medii:
a) Nivelul mediu (valoarea medie). Nivelul mediu reprezintă nivelul teoretic atins de indicator ı̂n
condiţiile ı̂n care evoluţia sa ar fi constantă ı̂n timp, factorii ce-i determină evoluţia ar acţiona cu
aceeaşi intensitate pe ı̂ntreaga perioadă de timp analizată.
Modul de determinare a volumului fenomenului diferă după cum seria este de intervale, respectiv
de momente.
Pentru seriile cronologice de intervale nivelul mediu este:
y1 + y2 + . . . + yn
Y =
n
74 Capitolul 4. Serii cronologice

Pentru seriile cronologice de momente nivelul mediu este definit de următoarea relaţie:
Z tn
y(t)dt
t1
Y = Z tn
dt
t1

Dacă se aproximează evoluţia indicatorului y(t) ca fiind liniară ı̂ntre două momente consecutive de
timp, rezultă:
T1 T1 + T2 Tn−2 + Tn−1 Tn−1
y1 + y2 + . . . + yn−1 + yn
Y = 2 2 2 2
T1 + T2 + . . . + Tn−1
relaţie numită medie cronologică ponderată.
Dacă nivelul indicatorului se ı̂nregistrează la momente echidistante (T1 = T2 = . . . = Tn − 1),
atunci relaţia anterioară devine:
y1 yn
+ y2 + . . . + yn−1 +
Y = 2 2
n−1
si reprezintă media cronologică simplă.

b) Indicele mediu. Ritmul mediu


Pentru calculul acestui indicator se ı̂ntâlnesc ı̂n literatură mai multe abordări.
Indicele mediu este parametrul modelului autoregresiv :

yt = I y · yt−1 + εt , t = 2, 3, . . . , n

Utilizând metoda celor mai mici pătrate pentru estimarea parametrului I y , se obţine următoarea
expresie de calcul a indicelui mediu:
Xn
yt−1 · yt
t=2
Iy = n
X
2
yt−1
t=2
Metoda este ı̂ntâlnită ı̂n practică sub denumirea de metoda autoregresivă.
O altă expresie de calcul, adecvată pentru indicatori ce evoluează aproximativ exponenţial este
următoarea: r
yn
Iy = n−1
y1
Ritmul mediu Ry se determină pornind de la indicele mediu:

Ry = I y − 1 sau Ry (%) = I y · 100 − 100.

c) Diferenţa medie absolută


Expresia de calcul a diferenţei medii absolute:
n
X n
X
(yt − yt−1 ) ∆t/t−1
y
t=2 t=2
∆y = =
n−1 n−1
4.3. Componentele unei serii cronologice 75

sau echivalent:
yn − y1
∆y = .
n−1

- Aplicaţie. Cifra de afaceri a unei societăţi comerciale, a scăzut, ı̂ncepând cu anul 2013:

An 2013 2014 2015 2016 2017 2018


Cifra de afaceri (mil. lei) 136 107 67 42 28 22

a) Calculaţi şi interpretaţi indicele mediu anual şi ritmul mediu.


b) Previzionaţi cifra de afaceri pentru anul 2019, utilizând indicele mediu, dacă se menţine ritmul
din perioada 2013-2018.

Rezolvare. a) Indicele mediu anual este:


6
X
yt−1 · yt
t=2 136 · 107 + 107 · 67 + 67 · 42 + 42 · 28 + 28 · 22
Iy = = = 0, 712.
X6 1362 + 1072 + 672 + 422 + 282
2
yt−1
t=2

De la un an la altul, in perioada 2013-2018, cifra de afaceri a scăzut ı̂n medie de 0, 712 ori.
Ritmul mediu este:
Ry = (I y − 1) · 100% = (0, 712 − 1) · 100% = −28, 8%
De la un an la altul, in perioada 2013-2018, cifra de afaceri a scăzut ı̂n medie cu 28, 8%.
b) Cifra de afaceri anticipată pentru anul 2019, utilizând indicele mediu, este:

y2019 = y2018 · I y = 22 · 0, 712 = 15, 664 mii lei.

4.3 Componentele unei serii cronologice

O serie cronologică este o secvenţă de observaţii asupra unei variabile, ordonate după parametrul timp.
Frecvent, măsurătorile asupra variabilei sunt efectuate la intervale egale de timp, seria cronologica fiind
prezentată sub forma:  
1 2 ... t ... n
Y :
y1 y2 . . . yt . . . yn
În abordarea tradiţională, fluctuaţiile din seriile cronologice sunt privite ca o rezultantă a suprapu-
nerii următoarelor componente: tendinţa T , componenta ciclică C, sezonieră S respectiv reziduală E.
Primele trei componente sunt considerate deterministe, sistematice, determinate de factori cu acţiune
continuă asupra fenomenului, ı̂n timp ce componenta reziduală are caracter aleator fiind efectul acţiunii
unor factori imprevizibili, accidentali.
Modelul clasic de descompunere al seriilor cronologice este de regulă:
• aditiv: Y = T + C + S + E sau
• multiplicativ: Y = T · C · S · E respectiv
76 Capitolul 4. Serii cronologice

• o combinaţie mixtă a componentelor seriei.


Tehnicile de analiză, ı̂n acest context, au ca obiective:
- separarea fiecărei componente şi modelarea comportamentului său, respectiv
- previziunea evoluţiei fiecărei componente, iar apoi compunerea acestora ı̂n scopul obţinerii de
previziuni privind evoluţia fenomenului Y . Principiul de la baza acestei tehnici este descompune
pentru a modela iar apoi recompune.

v Estimarea componentei de tendinţă


Cele mai uzuale funcţii utilizate pentru modelarea tendinţei indicatorilor din economie sunt redate ı̂n
tabelul de mai jos:

Tabelul 4.1: Funcţii elementare utilizate ı̂n modelarea tendinţei


Tendinţă Forma liniarizată Diferenţe aprox. constante
t/t−1
liniară ∆y = yt − yt−1
Tt = a + bt
parabolă T = a + bt + cX (2) ∆t/t−1 = ∆y
t/t−1
− ∆y
t−1/t−2
y

Tt = a + bt + ct2 unde: X = t2
t/t−1
hiperbolă T = a + bX ∆ty = tyt − (t − 1)yt−1
1 1
Tt = a + b unde: X =
t t
t/t−1
exponenţială Zt = A + Bt ∆ln y = ln yt − ln yt−1
Tt = a · bt unde: Zt = ln Tt ;
A = ln a; B = ln b
putere Z = A + bX
Tt = a · tb unde: Zt = ln Tt ;
A = ln a; X = ln t
logaritmică T = a + bX
Tt = a + b ln t unde: X = ln t
curba logistică
a
Tt = ,
1 + eb−ct
a, c > 0

Stabilirea funcţiei adecvate pentru modelarea tendinţei

În acest scop sunt utile următoarele precizări:


• cronograma seriei iniţiale sau a valorilor netezite sugerează funcţiile candidate, numite şi linii
posibile de tendinţă;
4.3. Componentele unei serii cronologice 77

• cea mai adecvată funcţie pentru modelarea tendinţei


X poate fi considerată aceea pentru care se
realizează minimul sumei pătratelor reziduurilor min (yt − Tt )2 ;
t
t/t−1
• este adecvată tendinţa liniară atunci când diferenţele absolute cu bază ı̂n lanţ ∆y = yt −
yt−1 sunt aproximativ constante. De asemenea, precizări specifice ı̂n acest sens pentru parabolă,
exponenţială, respectiv hiperbolă găsim ı̂n tabelul 4.1.

Estimarea parametrilor tendinţei


Pentru estimarea parametrilor tendinţei liniare Tt = a + bt se utilizează metoda celor mai mici
pătrate, expresiile de calcul ale parametrilor a, b fiind deci următoarele:
n
X
(t − t)(yt − Y )
t=1
b= n , respectiv a = Y − bt,
X
2
(t − t)
t=1
sau echivalent
M (tY ) − M (t)M (Y )
b= , respectiv a = M (Y ) − bM (t).
M (t2 ) − [M (t)]2
Seria prezintă o tendinţă de creştere atunci când b > 0, respectiv de descreştere dacă b < 0.
Cu excepţia curbei logistice, celelalte funcţii neliniare din tabelul 4.1 pot fi aduse la o formă
liniarizată prin anumite substituţii, respectiv prin aplicarea operaţiei de logaritmare ı̂n cazul funcţiei
exponenţiale şi a funcţiei putere.

- Aplicaţie. Indicele lunar al preţului producţiei industriale pentru piaţa internă, ı̂n perioada ianu-
arie 1999 - iunie 2000, baza de comparaţie 1996, a avut o tendinţa crescătoare:

Luna 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
(t)
Indice 3,7 3,8 4,1 4,3 4,5 4,8 4,9 5,1 5,3 5,5 5,6 5,8 6,0 6,2 6,3 6,5 6,6 7,0
(yt )

Să se determine ecuaţia tendinţei.

Rezolvare. Construim mai ı̂ntâi cronograma seriei cronologice:

Cronograma seriei sugerează prezenţa unei


tendinţe liniare, peste care se suprapune o
componentă aleatoare de amplitudine redusă:

yt = a + bt + εt , t = 1, 2, . . . , 18.

Parametrii tendinţei se determină din relaţiile:

M (tY ) − M (t)M (Y )
b= ,
M (t2 ) − [M (t)]2

respectiv

Figura 4.1: Indicele preţului producţiei indus- a = M (Y ) − bM (t).


triale - Tendinţa
78 Capitolul 4. Serii cronologice

Exemplificăm din calculele intermediare:


1 + 2 + . . . + 18
M (t) = = 9, 5
18
3, 7 + 3, 8 + . . . + 7, 0
M (Y ) = = 5, 33
18
(1 · 3, 7) + (2 · 3, 8) + . . . + (18 · 7, 0)
M (tY ) = = 55, 72
18
12 + 22 + . . . + 182
M (t2 ) = = 117, 2
18
şi obţinem:
55.72 − 9, 5 · 5, 33
b= = 0, 19
117, 2 − (9, 5)2
a = 5, 33 − 0, 19 · 9, 5 = 3, 55.
Tendinţa seriei se estimează prin funcţia de gradul ı̂ntâi:

Tt = 3, 55 + 0, 19t

al cărei grafic este redat ı̂n figura 4.1. 

v Estimarea componentelor deterministe ı̂n cazul seriilor sezoniere


Presupunem ı̂n acest paragraf că seria cronologică prezintă tendinţă, sezonalitate şi o componentă
aleatoare. Vom prezenta modul de estimare al tendinţei, respectiv a componentei sezoniere.

Modelul de descompunere. Perioada componentei sezoniere


Pentru alegerea modelului de descompunere este indicat a se analiza cronograma seriei.
În general, este adecvat un model aditiv atunci când amplitudinea oscilaţiilor este aproximativ
constantă, respectiv multiplicativ dacă amplitudinea creşte sau scade ı̂n timp. Frecvent ı̂n practică
este mai adecvat modelul multiplicativ.
Perioada componentei sezoniere, notată cu p, reprezintă numărul unităţilor de timp din cadrul
unui ciclu sezonier. Majoritatea seriilor sezoniere din domeniul economic au durata unui ciclu de un
an, p fiind egal cu 4 ı̂n cazul datelor trimestriale, respectiv 12 ı̂n cazul datelor lunare. Prin extensie,
pot fi studiate şi fenomene cu durata unui ciclu mai mică de un an.

Mediile mobile
Pentru eliminarea componentei sezoniere (desezonalizarea seriei) se aplică datelor o medie mobilă
de ordin p egal cu perioada componentei sezoniere.
Mediile mobile de ordin p, notate ı̂n continuare M M (p), sunt definite de următoarele relaţii:
• dacă p este impar, p = 2k + 1, mediile mobile de ordin p sunt:
yt−k + yt−k+1 + . . . + yt + . . . + yt+k−1 + yt+k
yt = , t = k + 1, k + 2, . . . , n − k;
p
• dacă p este par, p = 2k, mediile mobile se definesc analog
yt−k+0,5 + yt−k+1,5 + . . . + yt−0,5 + yt+0,5 + . . . + yt+k+0,5
yt = ,
p
4.3. Componentele unei serii cronologice 79

t = k + 0, 5, k + 1, 5, . . . , n − k + 0, 5.
În cazul p par, se introduc mediile mobile centrate de ordin p definite prin:
1
y t−0,5 + y t+0,5 yt−k + yt−k+1 + . . . + yt + . . . + yt+k−1 + 12 yt+k
yt = = 2 .
2 p

Estimarea tendinţei ı̂n cazul seriilor cu componentă sezonieră


În cazul seriilor sezoniere se ı̂ntâlnesc preponderent ı̂n literatură două modalităţi de estimare a
tendinţei:
• desezonalizarea seriei, iar apoi estimarea tendinţei pornind de la valorile desezonalizate;
• modelarea tendinţei pornind de la mediile anuale.

Estimarea componentei sezoniere

Notaţii: t indice pentru an (ı̂n general pentru un ciclu sezonier), variind de la 1 la n; s indice
pentru sezon, variind de la 1 la p. Modelul de descompunere a seriei are forma:

yij = T Cij + Sj + εij , respectiv yij = T Cij · Sj · εij

Metoda comparării cu mediile mobile

În cazul modelului multiplicativ


yij = T Cij · Sj · εij
metoda se ı̂ntâlneşte ı̂n literatură şi sub denumirea de metoda raportării la mediile mobile şi constă ı̂n
următoarele:

• calculul mediilor mobile y ij de ordin p egal cu perioada componentei sezoniere;


yij
• calculul rapoartelor Sij = ce cuantifică abaterea datelor observate de la tendinţă. Dacă
y ij
fixăm indicele j (ne situăm ı̂n sezonul j), aceste diferenţe constituie estimaţii pentru Sj ;

• determinarea unui indice mediu pentru fiecare sezon ca o medie a estimaţiilor precedente:
n−1
1 X
Ij = Sij , j = 1, 2, . . . , p,
n−1
i=1

aceasta justificându-se prin necesitatea eliminării efectului aleator din Sij . Pentru a nu fi afectaţi
de valorile extreme, uneori ı̂nainte de calculul mediei, aceste valori se elimină, sau ı̂n loc de medie
se ia valoarea mediană a estimaţiilor Sij ;

• determinarea componentei sezoniere Sj , etapă ce constă ı̂ntr-o corecţie adusa indicilor medii Ij
astfel ı̂ncât media lor sa fie 1:
Ij
Sj = p , j = 1, 2, . . . , p.
1X
Ii
p
i=1
80 Capitolul 4. Serii cronologice

În cazul modelului aditiv


yij = T Cij + Sij + εij
determinarea componentei sezoniere decurge analog.

- Aplicaţie. Datele privind evoluţia trimestrială a producţiei de bere din ţara noastră (zeci mii hl)
ı̂n perioada 1996 − 2001 sunt indicate mai jos:

An/Trim. I II III IV
1996 124,1 263,2 252,4 124,5
1997 130,1 280,2 260,6 151,1
1998 157,5 301,2 353,3 185,0
1999 169,7 340,0 350,9 168,7
2000 177,5 407,6 417,2 224,1
2001 202,9 385,3 425,6 196,6

Determinaţi ecuaţia tendinţei. În cazul prezenţei componentei sezoniere, desezonalizaţi seria cronolo-
gică a producţiei de bere.

Rezolvare. Construim cronograma producţiei de bere din perioada 1996 − 2001

Figura 4.2: Produţia de bere din perioada 1996 − 2001


Graficul seriei indică prezenţa unei componente sezoniere predominante, de perioada p = 4. Mediile
mobile de ordin p = 4 sunt calculate conform relaţiei de definiţie a mediilor mobile centrate. Astfel,
spre exemplu:
0, 5 · y1 + y2 + y3 + y4 + 0, 5 · y5
y3 = =
4
0, 5 · 124, 1 + 263, 2 + 252, 4 + 124, 5 + 0, 5 · 130, 1
= = 191, 8
4
4.3. Componentele unei serii cronologice 81

0, 5 · y2 + y3 + y4 + y5 + 0, 5 · y6
y4 = =
4
0, 5 · 263, 2 + 252, 4 + 124, 5 + 130, 1 + 0, 5 · 280, 2
= = 194, 7
4
..
.

0, 5 · y20 + y21 + y22 + y23 + 0, 5 · y24


y 22 = =
4
0, 5 · 224, 1 + 202, 9 + 385, 3 + 425, 6 + 0, 5 · 196, 6
= = 306, 0
4
Datele observate au fost numerotate aici ı̂n ordine cronologică y1 , y2 , . . ., y24 .
t MM(4) t MM(4)
1 - 13 261,7
2 - 14 259,4
3 191,8 15 258,3
4 194,7 16 267,7
5 197,8 17 284,5
6 202,2 18 299,7
7 208,9 19 309,8
8 214,9 20 310,2
9 229,2 21 308,4
10 245,0 22 306,0
11 250,8 23 -
12 257,1 24 -
Estimăm tendinţa pornind de la valorile desezonalizate.
Seria mediilor mobile prezentată grafic relevă o uşoară tendinţă de creştere a producţiei de bere.
Vom considera tendinţa liniară:
Tt = a + bt + εt
originea de măsurare a timpului trimestrul II al anului 1996, unitatea de măsură un trimestru. Astfel,
pentru trimestrul III 1996 avem t = 1, s.a.m.d:
t 1 2 3 ... 19 20
Valori desezonalizate (Z) 191,8 194,7 197,8 ... 308,4 306,0

M (tZ) − M (t)M (Z)


b=
M (t2 ) − [M (t)]2
a = M (Z) − bM (t)
Calcule intermediare:
M (t) = 10, 5; M (Z) = 252, 9; M (t2 ) = 143, 5; M (tZ) = 2884, 9; b = 6, 9; a = 180, 44
Tendinţa producţiei de bere ı̂n perioada ianuarie 1996 iunie 2000 este estimată prin:
Tt = 180, 44 + 6, 9 · t.

82 Capitolul 4. Serii cronologice

4.4 Teme de control


P1. Profiturile unei companii sunt redate ı̂n graficul de mai jos:

a) Construiţi seria cronologică aferentă profiturilor ı̂nregistrate ı̂n perioada 2010 - 2018.
b) Construiţi seriile cronologice cu diferenţe absolute, indici statistici şi diferenţe relative cu
bază fixă şi bază ı̂n lanţ.
c) Cu cât se modifică ı̂n medie profiturile de la un an la altul ?
d) De câte ori se modifică ı̂n medie profiturile de la un an la altul ?
e) Cu câte procente se modifică ı̂n medie profiturile de la un an la altul ?
f ) Găsiţi ecuaţia tendinţei care indică evoluţia profiturilor ı̂n timp.
g) Este tendinţa găsită la punctul precedent reprezentativă ?
h) Estimaţi profitul companiei ı̂n următorii trei ani (prin trei metode diferite).
i) De câte ori s-a modificat profitul ı̂n anul 2018 faţă de anul 2010 ?
j) Ştiind că ı̂n perioada 2010 - 1017 impozitul pe profit datorat statului a fost de 16%, iar
ı̂ncepând cu anul 2018 impozitul pe profit a fost de 10%, găsiţi seria cronologică a profitului
net. Reprezentaţi grafic seria cronologică aferentă profitului net.

P2. Veniturile unei cofetării obţinute din vânzările de prăjituri, cafea şi sucuri sunt redate ı̂n graficul
de mai jos:
4.4. Teme de control 83

a) Construiţi seriile cronologice aferente veniturilor obţinute din vânzările de prăjituri, sucuri
şi cafea ı̂n perioada 2012 - 2018.
b) Construiţi seria cronologică a veniturilor totale ale cofetăriei ı̂n perioada 2012 - 2018.
c) Cu cât la sută se modifică ı̂n medie veniturile totale de la un an la altul ?
d) De câte ori se modifică ı̂n medie veniturile obţinute din vânzarea prăjiturilor de la un an la
altul ?
e) Găsiţi ecuaţiile tendinţelor veniturilor obţinute din vânzările de prăjituri, cafea şi sucuri.
Care din ecuaţiile găsite este mai reprezentativă ?
f ) Folosind diferenţa absolută medie a veniturilor obţinute din vânzarea prăjiturilor, estimaţi
veniturile pentru prăjituri ı̂n următorii doi ani.
g) Folosind indicele statistic mediu al veniturilor obţinute din vânzarea sucurilor, estimaţi
veniturile pentru sucuri ı̂n următorii doi ani.
h) Indicele Laspeyres al veniturilor totale sub influenţa exclusivă a veniturilor obţinute din
vânzările de prăjituri ı̂n anul 2018 faţă de anul 2012. Calcul şi interpretare.
i) Indicele Paasche al veniturilor totale sub influenţa exclusivă a veniturilor obţinute din
vânzările de sucuri ı̂n anul 2018 faţă de anul 2012. Calcul şi interpretare.
j) Indicele Fisher al veniturilor totale sub influenţa exclusivă a veniturilor obţinute din vânzările
de cafea ı̂n anul 2018 faţă de anul 2012. Calcul şi interpretare.
k) Calculaţi şi interpretaţi nivelul mediu al veniturilor totale.
l) Cu cât la sută se abat ı̂n medie veniturile totale ı̂nregistrate ı̂n fiecare an faţă de venitul
total mediu ı̂nregistrat ı̂n perioada 2012 - 2018 ?
m) Reprezentaţi grafic cronograma veniturilor totale obţinute din vânzarea prăjiturilor şi sucu-
rilor. Precizaţi tendinţa pe grafic. Găsiţi parametrii tendinţei şi studiaţi reprezentativitatea
ei.

P3. În anul 2015 numărul de firme dintr-un judeţ a fost cu 17, 5% mai mic decât ı̂n 2018 şi cu 10%
mai mare decât ı̂n 2012. Ştiind că ı̂n 2011 ı̂n judeţ au fost 100 de firme, iar ı̂n 2012 numărul
firmelor a crescut de 1, 2 ori, se cere:

a) Reconstituiţi seria cronologică a numărului de firme ı̂n perioada 2011 - 2018.


b) De câte ori s-a modificat ı̂n medie numărul de firme de la un an la altul ?
c) Cu cât la sută s-a modificat ı̂n medie numărul de firme de la un an la altul ?
d) Nivelul mediu al firmelor ı̂n perioada 2011 - 2018. Calcul şi interpretare.
e) Găsiţi ecuaţia tendinţei care modelează evoluţia ı̂n timp a numărului de firme. Este tendinţa
reprezentativă?
f ) Folosind indicele statistic mediu, estimaţi numărul de firme ı̂n anul 2019.
g) Dacă ı̂n anul 2012, 20% din firme au avut profilul de activitate IT, iar ı̂n 2018 acest procent
s-a triplat, calculaţi şi interpretaţi indicele Fisher al numărului total de firme sub influenţa
exclusivă a firmelor de IT ı̂n 2018, faţă de 2012.

P4. Previzionaţi numărul zilnic de pacienţi ai unei clinici medicale private pentru săptămâna a cincea,
cunoscând evoluţia din primele patru săptămâni:
84 Capitolul 4. Serii cronologice

Săptămâna Ziua Nr. pacienţi


Luni 40
Marţi 49
1 Miercuri 55
Joi 38
Vineri 20
Luni 45
Marţi 50
2 Miercuri 58
Joi 35
Vineri 22
Luni 47
Marţi 49
3 Miercuri 60
Joi 39
Vineri 25
Luni 50
Marţi 60
4 Miercuri 68
Joi 50
Vineri 35

Pentru una din săptămâni calculaţi toţi indicatorii posibili.

Bibliografie:

1. Buiga A., Dragoş C., Lazăr D., Parpucea I., Statistică I, Presa Universitară Clujeană, 2003.

2. Buiga A., Dragoş C., Lazăr D., Brendea G., Litan C., Mare C., Statistică Descriptivă, Ed.
Napoca Star, Cluj-Napoca, 2018;

3. Florea I., Parpucea I., Buiga A., Statistică descriptivă. Teorie şi aplicaţii, ed. Continental, Alba
Iulia, 1998;

4. Florea I., Parpucea I., Buiga A., Lazăr D., Statistică inferenţială, Presa Universitară Clujeană,
Cluj-Napoca, 2000;

5. Melard G., Méthodes des prévisions à court terme, Ed. de l’Université de Bruxelles, 1970.

S-ar putea să vă placă și