Sunteți pe pagina 1din 85

1

SUPORT DE CURS

ANUL II

Semestrul 1









Cluj Napoca
2010







UNIVERSITATEA BABE-BOLYAI, CLUJ-NAPOCA
Centrul de Formare Continu i nvmnt la Distan
Facultatea de tiine Economice i Gestiunea Afacerilor
Specializarea: Trunchi Comun
Disciplina: Statistic Descriptiv
























2
I. Informaii generale

1.1.Date de identificare a cursului
Date de contact ale titularilor de curs:

1. Nume: Prof.univ.dr. Ilie Parpucea
Birou: Birou 346 sediul Fac. de tiine Economice i Gestiunea Afacerilor,
str. Teodor Mihali 58-60
Telefon: 0264-418654
E-mail: ilie.parpucea@econ.ubbcluj.ro
Consultaii: Marti 10-11, Joi, 11-12
2. Nume: Conf.univ.dr. Anua Buiga
Birou: Birou 346 sediul Fac. de tiine Economice i Gestiunea Afacerilor,
str. Teodor Mihali 58-60
Telefon: 0264-418654
E-mail: anuta.buiga@econ.ubbcluj.ro
Consultaii: Miercuri, 11-12, Joi, 14-15
3. Nume: Conf.univ.dr. Drago Cristian
Birou: Birou 231 sediul Fac. de tiine Economice i Gestiunea Afacerilor,
str. Teodor Mihali 58-60
Telefon: 0264-418654
E-mail: cristian.dragos@econ.ubbcluj.ro
Consultaii: Marti 16-17, Miercuri, 10-11
4. Nume: Conf.univ.dr. Dorina Lazr
Birou: Birou 527 sediul Fac. de tiine Economice i Gestiunea Afacerilor,
str. Teodor Mihali 58-60
Telefon: 0264-418654
E-mail: dorina.lazar@econ.ubbcluj.ro
Consultaii: Marti 11-12, Joi 16-17









3


MODULUL 1

Concepte de baz. Obiectul statisticii.
Observarea, sistematizarea i prezentarea seriilor statistice.


Obiective
definirea unei populaii statistice, a variabilelor statistice
obinerea de informaii cu privire la fenomenul supus cercetarii
organizarea datelor i prezentarea acestora sub form de serii statistice
evidenierea structurii populaiei n raport cu variabilele observate
evidenierea evoluiei unui fenomen n timp sau spaiu
reprezentarea grafic a datelor

Concepte de baz
populaie statistic, unitate statistic, volum, eantion, variabil statistic, observare
statistic, indicator statistic, serie statistic
observare statistic, serii statistice unidimensionale i bidimensionale
reprezentarea grafic a datelor relativ la o variabil cantitativ, la o variabil calitativ
i la dou variabile

Rezultate ateptate
Cunoaterea i stpnirea noiunilor statistice de baz, cunoaterea tehnicilor de culegere,
grupare i prezentare a datelor. Utilizarea indicatorilor statistici cu scopul evidenierii
variaiei unei mrimi sau a structurii populaiei supuse studiului.

Sinteza

1. Concepte de baz
1.1. Populaia statistic

Populaia statistic reprezint mulimea elementelor simple sau complexe, de aceeai
natur, care au una sau mai multe nsuiri eseniale comune, proprii elementelor ct i
populaiei privit ca un tot unitar. [Florea I.,1998]
O populaie este finit dac include un numr determinat de elemente, dar ea poate fi
considerat drept reprezentativ pentru o populaie teoretic infinit. Ca urmare apare
necesitatea de a delimita o populaie n: coninut, spaiu i timp. Se mai denumete i
populaia univers.
Exemple de populaii statistice: mulimea persoanelor dintr-o anumit ar (localitate,
zon etc.) n anul t, mulimea gospodriilor din Romnia, la momentul t, mulimea
consumatorilor unui produs, mulimea societilor productoare sau concurente ale unui
produs, mulimea societilor distribuitoare, angajaii unei societi, etc.
Se noteaz cu majusculele de la nceputul alfabetului: A, B, C etc.
Unitatea statistic constituie elementul component, al populaiei statistice, asupra
cruia se va efectua nemijlocit observarea.
4
Unitatea statistic este purttorul originar de informaie sau subiectul logic al
informaiei statistice. Datorit varietii aspectelor sub care se poate prezenta n fapt, unitatea
statistic comport o definiie precis, care s exclud prin posibilitate de interpretare diferit
de ctre observatori i astfel orice eroare ce poate prejudicia valoarea investigaiei.
n exemplele citate mai sus, unitile statistice sunt: persoana, gospodria,
consumatorul, societatea productoare sau concurent, societatea distribuitoare, angajatul etc.
Se noteaz cu minusculele corespunztoare majusculei ce simbolizeaz populaia
statistic, respectiv a
i
, b
i
etc..
Volumul populaiei reprezint numrul unitilor statistice care alctuiesc populaia
statistic, Acesta poate fi finit sau infinit, n funcie de tipul populaiei care poate fi la fel
finit sau infinit.
Se noteaz cu N, iar pentru o populaie A, avem:
A : {a
1
, a
2
, ..., a
N
}
Eantion reprezint o submulime a unei populaii statistice, constituit dup criterii
bine stabilite. n raport cu procedeul de formare a eantionului avem eantioane aleatoare i
eantioane dirijate.
Eantionul aleator este format din unitile statistice care rezult printr-un procedeu
aleator: procedeul tragerii la sori, tabelul cu numere ntmpltoare, procedeul extragerilor
sistematice.
Eantionul dirijat este constituit pe baza unor informaii auxiliare existente la nivelul
populaiei studiate sau lsnd liber pe anchetator s aleag unitile respectnd doar realizarea
structurii eantionului n funcie de criteriile stabilite.
Se noteaz cu n.
Majoritatea studiilor au ca suport datele provenite de la nivel de eantion, de aici
importana constituirii acestuia i implicit, apelarea la inferena statistic, pentru a estima
parametrii la nivelul populaiei univers.


1.2. Variabila statistic

Variabila statistic reprezint o nsuire sau o trstur comun tuturor unitilor unei
populaii. Nivelul nregistrat de o variabil statistic la o unitate oarecare al populaiei se
numete realizare sau starea variabile. [Florea I., 1998].
n general se noteaz cu majusculele de la sfritul alfabetului, X, Y, Z etc. Dac se
noteaz cu X o variabil statistic oarecare, atunci cu x
1
, x
2
, ..., x
N
se vor nota strile variabilei
respective.
Variabilele statistice se clasific n raport cu natura, modul de exprimare i modul de
variaie.
a) Dup natura lor variabilele statistice pot fi atributive, de timp i de spaiu.
Variabila atributiv exprim un atribut sau nsuire esenial (alta, dect timpul
sau spaiul) unitilor populaiei;
Variabila de timp ne arat timpul n care au luat fiin unitile populaiei sau
perioada de timp n care au existat (exista);
Variabila de spaiu ne arat spaiul n care exist sau au luat natere unitile
populaiei.
b) Dup modul de exprimare a strilor deosebim:
Variabil cantitativ este variabila ale crei stri se exprim prin valori
numerice. Se mai numete i variabil metric.
5
Variabil calitativ este variabila ale crei stri se exprim prin cuvinte sau
coduri. Se mai numete variabil nominal (strile se exprim prin cuvinte) sau
variabil ordinal (strile se exprim prin coduri).
c) Dup modul de variaie variabila cantitativ poate fi:
Variabil discret este acea variabil care, n intervalul su de definiie
nregistreaz cel mult valori raionale, variaia are loc n salturi.
Variabil continu este acea variabil care poate lua orice valoare real din
intervalul su de variaie.
Exemple de variabile statistice relativ la populaia format din mulimea
consumatorilor unui produs:
- vrsta: variabil atributiv, cantitativ, continu
X = { x
1
= [15-20) [20-30) ... }
- frecvena de cumprare: variabil atributiv calitativ
Y = { y
1
- foarte rar; y
2
rar, ... }
- numr de sortimente cumprate relativ la produsul analizat: variabil atributiv,
cantitativ, discret:
Z = { z
1
= 1; z
2
= 2, ... }
- localizarea magazinelor de unde cumpr: variabil de spaiu, calitativ
S = { s
1
cartierul M sau s
2
strada P
1
, ... }
- data ultimei cumprri a produsului analizat: variabil de timp, cantitativ
T = { t
1
= 27.01.2002; t
2
= 24.02.2002, ... }

Variabila aleatoare
Variabila aleatoare este variabila care poate lua orice valoare din valorile unei mulimi
finite sau infinite, cu o anumit probabilitate, rezultat dintr-o funcie asociat variabilei,
numit lege de probabilitate.
Ca i variabila statistic, variabila aleatoare n raport cu valorile sale poate fi discret
sau continu.
n timp ce o variabil aleatoare nregistreaz valori la ntmplare, variabila statistic
constituie o nsuire cert a unitilor statistice din populaie. Valorile unei variabile aleatoare
sunt probabile i n strns legtur cu un anumit experiment. Strile unei variabile statistice
nu sunt probabile, ele cuantific o trstur proprie fiecrei uniti din populaie.

1.3. Observarea statistic

Observarea statistic const n identificarea unitilor populaiei i nregistrarea
strilor variabilelor n raport cu care este studiat. Ansamblul strilor variabilelor rezultate
prin observare se numesc statistici.
Dup gradul de cuprindere a populaiei statistice, observarea statistic este de dou
feluri: total i parial.
Observarea total este acel tip de observare statistic n care are loc nregistrarea
tuturor unitilor care fac parte din populaie statistic supus studiului. Recensmntul
populaiei Romniei este un exemplu de observare total.
Observarea parial presupune observarea i nregistrarea unui anumit numr de
uniti din populaie, alese dup criterii bine definite.
n cercetarea statistic a unei populaii punctul de pornire l poate constitui fie
statistice exhaustive rezultate prin observarea populaiei univers , fie statisticile rezultate din
observarea parial a unui eantion A, n ambele cazuri scopul final fiind acelai,
respectiv obinerea de informaii la nivelul populaiei univers A.

6
1.4. Seria statistic
Seria statistic este o construcie care red fie distribuia unei populaii n raport cu una
sau mai multe variabile, fie variaia unei mrimi n timp, n spaiu sau de la o categorie la alta.
Seriile statistice se clasific n raport cu mai multe criterii, astfel:
1. n raport cu numrul variabilelor
Serii statistice unidimensionale, au la baz o singur variabil;
Serii statistice multidimensionale, care au la baz dou sau mai multe variabile.
2. Dup natura variabilelor deosebim:
Serii atributive, care au la baz variabile atributive;
Serii cronologice (de timp sau istorice), care au la baz variabile de timp;
Serii de spaiu sau teritoriale, care au la baz o variabil de spaiu.
3. Dup modul de exprimare a strilor variabilei deosebim:
Serii calitative, care au la baz variabile calitative;
Serii cantitative, care au la baz variabile cantitative i care dup modul de variaie
a variabilei pot fi: discrete (cnd variabila este discret) i continue (cnd variabila
este continu).
4. n raport cu natura indicatorului din care este alctuit seria, avem:
Serii de frecven sau serii de distribuie (repartiie);
Serii de variaie.
Seria statistic rednd distribuia populaiei n raport cu una sau mai multe variabile
constituie o descompunere a acesteia ntr-un numr R de clase. O astfel de serie este format
n exclusivitate din frecvene (absolute cumulate sau necumulate, relative cumulate sau
necumulate) i de aceea se numesc serie de frecven, de distribuie sau de repartiie.
Prescurtat se mai folosete i denumirea de repartiie statistic sau distribuie statistic.
Seria statistic ce red variaia unei mrimi n timp, n spaiu sau de la o categorie la
alta se numete serie de variaie.

1.4.1. Seria statistic de repartiie

Conform definiiei de mai sus, prin aceast serie se distribuie unitile unei populaii
statistice n raport cu una sau mai multe variabile.
Fie o serie statistic unidimensional avnd la baz variabila X, respectiv:

R i
R i
N N N N
x x x x
X
... ...
... ...
:
2 1
2 1
(1.1)

N
i
este frecvena absolut a clasei i, R i , 1 = i reprezint numrul de uniti ale
populaiei din clasa pentru care variabila X a nregistrat valoarea
X
i
N
1
+ N
2
+ ... + N
R
= N.

Clasa (grupa) de uniti n raport cu o variabil reunete acele uniti din cadrul
populaiei care nregistreaz aceeai stare a variabilei sau strile variabilei aparinnd unui
anumit interval de variaie .
Ca urmare, n raport cu o variabil statistic populaia poate fi structurat ntr-un
anumit numr de clase.
De asemenea, relativ la seria statistic unidimensional avnd la baz variabila X,
poate fi format cu frecvene relative, frecvene cumulate absolute sau relative.
Fie seria X format cu frecvene relative:
7

R i
R i
f f f f
x x x x
X
... ...
... ...
:
2 1
2 1
(1.2.)

- f
i
- ne arat ponderea unitilor din populaie care au nregistrat pentru variabila X
starea x
i
:
R i
N
N
f
i
i
, 1 = =

Pornind de la seria (1.1) se poate deduce seria format cu frecvene absolute
cumulate, respectiv:

) N(x ... ) N(x ... ) N(x ) N(x


x ... x ... x x
X:
R i
R i
2 1
2 1
(1.3)
unde: N(x
i
) reprezint numrul de uniti din populaia studiat pentru care variabila
nregistreaz valori ce nu depesc valoarea x
i
.
Pornind de la seria (1.1) sau (1.2) se poate deduce seria format cu frecvene relative
cumulate, respectiv:

) ( ... ) ( ... ) ( ) (
... ...
:
2 1
2 1
R N i N N N
R i
x F x F x F x F
x x x x
X (1.4)
unde: F
N
(x
i
) - exprim ponderea unitii populaiei studiate pentru care variabila a nregistrat
valori ce nu depesc valoarea x
i
.
F
N
(x
i
) = f
1
+ f
2
+ ... + f
i

Sau R 1, i ) 100 (.
) (
) ( = =
N
x N
x F
i
i N


Seria statistic de repartiie bidimensional este o construcie ce red distribuia unei
populaii n raport cu dou variabile.
Astfel, fie populaia statistic A studiat n raport cu variabilele X i Y, rezultatele
observrii se pot grupa ntr-un tabel de forma urmtoare:

X
Y
x
1
x
2
... x
j
... x
J
Total
y
1
N
11
N
12
... N
1j
... N
1J
N
1.

y
2
N
21
N
22
... N
2j
... N
2J
N
2.

.
.
- - - - - - - (1.5)
y
i
N
i1
N
i2
... N
ij
... N
iJ
N
i
.
.
.
- - - - - - -
y
I
N
I1
N
I2
... N
Ij
... N
IJ
N
I.


Total

N
.1

N
.2

...

N
.j

...

N
.J

N


unde:

- N
ij
- reprezint numrul de uniti pentru care, variabila X nregistreaz starea x
j
i variabila
Y nregistreaz starea y
i
;
- N
i.
- numrul de uniti pentru care Y = y
i
, indiferent de nivelul nregistrat de variabila X;
8
- N
.j
- numrul de uniti pentru care X = x
j
, indiferent de nivelul nregistrat de variabila Y;
- N - numrul total de uniti analizate.
Din seria bidimensional se pot extrage serii unidimensionale de forma urmtoare:

J j
J j
N N N N
x x x x
X
. . 2 . 1 .
2 1
... ...
... ...
:

. . . 2 . 1
2 1
... ...
... ...
:
I i
I i
N N N N
y y y y
Y

denumite i serii de repartiie marginale, n raport cu X i Y


J 1, j
... ...
... ...
: /
2 1
2 1
=

=
Ij ij j j
I i
j
N N N N
y y y y
x X Y

denumit serie de repartiie unidimensional n raport cu Y condiionat de
X = x
j
, numrul acestora fiind egal cu numrul de stri a variabilei X.

I 1, i
... ...
... ...
: /
2 . 1
2 1
=

=
iJ ij i i
J j
i
N N N N
x x x x
y Y X

denumit serie de repartiie unidimensional n raport cu X condiionat de
Y = y
i
, numrul acestora fiind egal cu numrul de stri a variabilei Y.
De asemenea se poate elabora sau deduce seria de repartiie bidimensional format cu
frecvene relative, unde:
J
N
N
f
N
N
f
N
N
f
j
j
i
i
ij
ij
, 1 j I 1, i
.
.
.
.
= = = = =


1.4.2. Seria statistic de variaie

Conform definiiei seria de variaie red variaia unei mrimi, n timp, n spaiu sau de
la o categorie la alta. Ca urmare, n continuare vom vorbi de serii cronologice (au la baz o
variabil de timp), serii de spaiu (au la baz o variabil de spaiu) i serii categoriale (au la
baz variabile atributive). Cele mai des ntlnite sunt seriile cronologice i seriile de spaiu.
Seriile de variaie au la baz mrimi absolute i relative. Dup unii autori din cadrul
mrimilor absolute fac parte indicatorul de nivel i diferena absolut a unei mrimi, iar din
cadrul mrimilor relative fac parte: indicatorul relativ de intensitate, indicele statistic i
diferena relativ a unei mrimi.
Indicatorul de nivel (Y) este o mrime ce reflect nivelul unui fenomen analizat. De
exemplu: producia diferitelor produse, veniturile populaiei, suprafaa cultivat cu
principalele culturi, transportul, exportul, importul etc.
Diferena absolut a unei mrimi (
Y
) exprim diferena dintre nivelul cercetat i
nivelul baz de comparaie al mrimii analizate. Se exprim n aceeai unitate de msur n
care este cuantificat fenomenul analizat i ne arat cu ct s-a modificat acesta de la un nivel la
altul.
9
Indicele statistic al unei mrimi (
Y
I ) exprim raportul dintre nivelul cercetat i nivelul
baz de comparaie al mrimii analizate. Ne arat de cte ori se modific acea mrime, de la
un nivel la altul.
Diferena relativ a unei mrimi (
Y
R ) exprim raportul dintre diferena absolut a
mrimii respective i nivelul baz de comparaie al acesteia. Ne arat cu ct la sut se
modific mrimea de la un nivel la altul.
Indicatorul relativ de intensitate (d) se definete ca raport ntre doi indicatori de nivel
de natur diferit i arat gradul de rspndire a fenomenului cuantificat de indicatorul de la
numrtor n raport cu fenomenul cuantificat de indicatorul de la numitor. De exemplu:
producia diferitelor culturi / ha, densitatea populaiei, producia principalelor produse /
locuitor, rata omajului etc.
Greutatea specific (g) reflect structura fenomenului analizat n raport cu strile
variabile X, de la baza seriei.

Seriile cronologice
Seria cronologic reflect evoluia n timp a unei mrimi.
Valorile variabilei ca funcie de timp pot fi fixate la un anumit moment de timp sau s
se refere la un interval de timp.
Seria cronologic de momente este o serie de observaii ordonate n timp, exprimnd
stocuri [Trebici V., 1985]. De exemplu, volumul populaiei, numr de universiti, bnci,
instituii, fonduri fixe, numrul salariailor, ntreprinderile mici i mijlocii din diferite domenii
de activitate, unitile de cazare turistic etc. ntr-o astfel de serie nsumarea mrimii analizate
nu are sens din punct de vedere al coninutului, aceasta fiind permis din considerente de
calcul, ajustri etc.
Seria cronologic de intervale este o serie de observaii ordonate n timp exprimnd
fluxuri. De exemplu: nscuii vii, divorurile, decesele, producia diferitelor culturi sau
produse, venituri, cheltuieli, producia industrial, agricol, exportul, importul etc.ntr-o astfel
de serie are sens nsumarea mrimii analizate.
Fie o serie cronologic de momente sau de intervale ce reflect evoluia n timp a
nivelului unei mrimi Y,

T t
y y y y y
T t
Y
... ...
... ... 2 1 0
:
2 1 0
(1.6)
Pornind de la aceast serie se pot deduce seriile formate cu diferene absolute, indici i
diferene relative. n funcie de modul de raportare a strilor variabilei timp t, mrimile de mai
sus se pot calcula cu baz fix (t / t
0
) (baza de comparaie rmne aceeai) sau cu baz n lan
(t / t-1) (baza de comparaie se schimb, fiind considerat cea precedent nivelului comparat).

Fie seriile cronologice formate cu:
- diferene absolute cu baz fix:

0 / 0 / 0 / 2 0 / 1
/
... ... 0
... ... 2 1 0
:
0
T
y
t
y y y
t t
y
T t
(1.7)

) 0 ( ) (
0 /
y t y
t
y
=

- diferene absolute cu baz n lan
10

1 / 1 / 1 / 2 0 / 1
1 /
... ...
... ... 2 1 0
:
T T
y
t t
y y y
t t
y
T t
(1.8)

) 1 ( ) (
1 /
=

t y t y
t t
y


ntre cele dou tipuri de diferene absolute cu baza fix i cu baz n lan, exist relaii
de legtur ce ne permit exprimarea unora n funcie de celelalte. n acest context, nsumnd
diferenele absolute cu baza n lan se obin diferenele absolute cu baza fix.

1 / 2 / 3 1 / 2 0 / 1 0 /
...

+ + + + =
t t
y y y y
t
y


Scznd diferenele succesive cu baz fix se obin diferenele cu baz n lan.


1 / 0 / 1 0 /
) 1 ( ) ( ) 0 ( ) 1 ( ) 0 ( ) (

= = + =
t t
y
t
y
t
y
t y t y y t y y t y

Diferena absolut ne arat cu ct se modific mrimea analizat de la un moment la
altul. Se exprim n aceeai unitate de msur n care este cuantificat fenomenul studiat.
Dac fenomenul analizat se exprim valoric, atunci diferena absolut nu reflect prea
bine modificrile ce intervin, impunndu-se utilizarea mrimilor relative respective, indicele
statistic i diferena relativ.

Fie seriile cronologice formate cu:
- indici statistici cu baz fix

0 / 0 / 0 / 2 0 / 1
/
... ... 1
... ... 2 1 0
:
0
T
y
t
y y y
t t
y
I I I I
T t
I (1.9)

) 100 (
) 0 (
) (
0 /
x
y
t y
I
t
y
=

- indici statistici cu baz n lan

1 / 1 / 1 / 2 0 / 1
1 /
... ...
... ... 2 1 0
:
T T
y
t t
y y y
t t
y
I I I I
T t
I (1.10)

) 100 (
) 1 (
) (
1 /
x
t y
t y
I
t t
y



ntre cele dou tipuri de indici exist urmtoarele relaii de legtur:
Fcnd produsul indicilor cu baz n lan pn la o anumit stare a variabilei t, se
obine indicele cu baz fix al clasei respective.

0 / 1 / 1 / 2 0 / 1
) 0 (
) (
) 1 (
) (
. ... .
) 1 (
) 2 (
.
) 0 (
) 1 (
. ... . .
t
y
t t
y y y
I
y
t y
t y
t y
y
y
y
y
I I I = =


mprind doi indici succesivi cu baz fix se obine un indice cu baz n lan:

1 / 0 / 1 0 /
) 1 (
) (
) 0 (
) 1 (
:
) 0 (
) (
:

=

=
t t
y
t
y
t
y
I
t y
t y
y
t y
y
t y
I I
11
Indicele statistic ne arat de cte ori se modific fenomenul analizat. Este mrimea cel
mai des folosit n caracterizarea evoluiei fenomenelor din economie.
Avnd ca baz de referin o serie cronologic de forma (1.7) se pot elabora serii
formate cu:
- diferene relative cu baz fix

0 / 0 / 0 / 2 0 / 1
/
... ... 0
... ... 2 1 0
:
0
T
y
t
y y y
t t
y
R R R R
T t
R (1.11)

1 1
) 0 (
) (
) 0 (
) 0 ( ) (
) 0 (
0 /
0 /
0 /
= =

=
t
y
t
y t
y
I
y
t y
y
y t y
y
R


- diferene relative cu baz n lan

1 / 1 / 1 / 2 0 / 1
1 /
... ...
... ... 2 1 0
:
T T
y
t t
y y y
t t
y
R R R R
T t
R (1.12)

100 100 . sau 1
) 1 (
1 / 1 /
1 /
1 /
=

t t
y
t t
y
t t
y t t
y
I I
t y
R

Aceast mrime la fel ca i indicele statistice, se folosete frecvent n caracterizarea
fenomenelor din economie.
Dac seria cronologic analizat este de intervale, se poate deduce seria format cu
greutatea specific:

T t
y
g g g g g
T t
g
... ...
... ... 2 1 0
:
2 1 0
(1.13)

=
=
T
t
t y
t y
t g
1
) (
) (
) (


Seria statistic de spaiu (teritorial)

Seria statistic de spaiu este o construcie statistic ce reflect variaia n spaiu a unei
mrimi.
Seria de spaiu prezint o importan din ce n ce mai mare, datorit dezvoltrii
sistemului informaional, a necesitii comparaiilor internaionale i a comparaiilor ntre
regiunile unei ri.
n cadrul Anuarului Statistic al Romniei exist capitole distincte de Statistic
teritorial i Statistic internaional. n capitolul de Statistic teritorial sunt cuprinse
informaii privind: populaia, fora de munc, condiii de munc, veniturile populaiei,
cheltuielile i consumul populaiei, locuine, asisten social, sntate, nvmnt, cultur,
sport, conturi naionale, rezultate i performane ale ntreprinderilor, agricultur, silvicultur,
12
industrie, transporturi, pot, telecomunicaii, turism, finane, justiie i starea infracional, pe
cele 7 regiuni i Bucureti.
La baza seriei de spaiu se gsesc att mrimi absolute (indicator de nivel, diferena
absolut), ct i mrimi relative (indicator relativ de intensitate, indicele statistic, diferena
relativ).
Fie seria statistic Z, de forma urmtoare:

) ( ... ) ( ... ) 3 ( ) 2 ( ) 1 (
... ...
:
2 1 0
R Z i Z Z Z Z
s s s s s
Z
R i
(1.14)
unde:
s
i
este o stare a variabilei ce exprim spaiul, R i , 1 = ;
Z(i) exprim o mrime (indicator de nivel sau relativ de intensitate).
Plecnd de la seria de forma (1.15) se pot deduce seriile formate cu:
- diferene absolute cu baz fix:

0 0 0 2 0 1
0
/ / / /
2 1 0 /
... ... 0
... ...
:
s s
Z
s s
Z
s s
Z
s s
Z
R i s s
Z
R i
s s s s s
(1.15)
) 0 ( ) (
0
/
Z i Z
s s
Z
i
=
- indicii statistici cu baz fix

0 0 0 2 0 1
0
/ / / /
2 1 0 /
... ... 0
... ...
:
s s
Z
s s
Z
s s
Z
s s
Z
R i s s
Z
R i
I I I I
s s s s s
I (1.16)
) 100 .(
) 0 (
) (
0
/
Z
i Z
I
s s
Z
i
=
- diferene relative cu baz fix

0 0 0 2 0 1
0
/ / / /
2 1 0 /
... ... 0
... ...
:
s s
Z
s s
Z
s s
Z
s s
Z
R i s s
Z
R i
R R R R
s s s s s
R (1.17)
100
) 0 (
0
0
0
/
/
/
=

=
s s
Z
s s
Z s s
Z
i
i
i
I
Z
I


2. Observarea, sistematizarea i prezentarea seriilor statistice

2.1. Observarea statistic

Observarea statistic constituie prima etap n cadrul studierii fenomenelor sociale,
economice sau de alt natur, etap n care se culeg datele statistice despre fenomenul supus
cercetrii. Cercetarea fenomenelor respective presupune cunoaterea populaiei statistice n
vederea surprinderii aciunii legilor care acioneaz la nivelul acesteia. De calitatea acestei
etape, ntr-un proces de cercetare statistic, depinde i calitatea rezultatelor obinute n
celelalte faze.
Observarea statistic presupune identificarea, urmrirea i nregistrarea, dup reguli
unitare i precise, a nivelului atins de variabilele statistice studiate la unitile din care este
format populaia luat n studiu[Florea I., 1998].
Pentru asigurarea unor date, rezultate din observare, valide i pertinente se impun
cteva precizri. n primul rnd, observarea statistic presupune urmrirea i nregistrarea
unui numr mare de uniti statistice, ceea ce implic un volum mare de munc. n al doilea
rnd, pentru ca cercetarea populaiei s-i ating scopul, trebuie precizate care sunt variabilele
13
n raport cu care este studiat populaia. Variabilele statistice ce urmeaz s fie urmrite i
nregistrate la nivelul fiecrei uniti din populaie, trebuie s fie eseniale i s prezinte
interes din punct de vedere al studiului ntreprins. n al treilea rnd, trebuie stabilite criterii
exacte pentru delimitarea corect a unitilor statistice care alctuiesc populaia. i nu n
ultimul rnd, dac observarea i nregistrarea datelor este fcut de mai multe persoane este
necesar ca acestea s se alinieze unei metodologii unitare pentru a asigura corectitudinea
necesar datelor rezultate.
Observarea statistic, ca prim etap ntr-un studiu de cercetare presupune:
specificarea unitilor statistice care trebuie s fie urmrite i nregistrate, alegerea variabilelor
statistice care caracterizeaz cel mai bine populaia i care rspund obiectivului urmrit,
nregistrarea strilor variabilelor statistice considerate.
Atingerea scopului cercetrii statistice presupune rezolvarea urmtoarelor probleme
care s asigure o pregtire tiinific a observrii statistice:
- delimitarea populaiei supuse observrii;
- definirea unitilor statistice de observat;
- timpul i locul unde va avea loc observarea;
- programul observrii;
- alegerea purttorilor de informaie;
- pregtirea persoanelor ce urmeaz s fac observarea.
Fiecreia din aceste probleme trebuie s i se acorde importana cuvenit, fiindc
fiecare dintre ele conduce la o pregtire ct mai complet a observrii, de rezultatele creia
depinde corectitudinea celorlalte etape a cercetrii statistice.
Delimitarea populaiei supuse observrii fa de alte populaii statistice cu care aceasta
se afl n legtur se realizeaz prin evidenierea nsuirilor i trsturilor comune ce
caracterizeaz populaia supus studiului.
Definirea unitilor statistice de observat presupune claritate i precizie pentru a nu da
loc confuziilor. n momentul observrii trebuie cunoscut exact care sunt unitile statistice ce
trebuie nregistrate n raport cu variabilele de studiat.
Stabilirea timpului i a locului unde va avea loc observarea are importan din punct
de vedere a comparabilitii datelor rezultate din observare. Noiunea de timp a observrii are
n statistic dou accepiuni:
- momentul sau perioada la care se refer datele nregistrate (timpul de referin);
- durata observrii.
Locul observrii reprezint punctul din spaiu n care se deruleaz procesul supus
cercetrii (incinta unei ntreprinderi, a unui magazin, o localitate n cazul n care populaia o
reprezint familiile etc.).
n cadrul programului observrii statistice trebuie stabilite variabilele statistice care
urmeaz s fie studiate n populaia de cercetat. Alegerea i definirea variabilelor statistice
trebuie s fie n consens cu natura populaiei i obiectivul cercetrii statistice ntreprinse.
Variabilele statistice care fac parte din programul cercetrii trebuie s surprind aspectele
eseniale, s expliciteze fenomenul sau procesul studiat, s permit prelucrarea i
generalizarea acestora la nivelul ntregii populaii.
Alegerea purttorilor de informaie se face n funcie de volumul datelor ce urmeaz a
fi nregistrate. Purttorii de informaie reprezint suporii materiali pe care se nregistreaz
datele din observarea unitilor statistice.
Observarea statistic se poate desfura n diverse forme n raport cu: natura
proceselor social-economice de studiat, obiectivul cercetrii, formele de organizare ct i
posibilitile practice de urmrire i nregistrare a unitilor statistice din populaie.
Dup cum se tie, n raport cu gradul de cuprindere a populaiei considerate avem:
observarea total i observarea parial. Observarea total permite nregistrarea, n raport cu
14
variabilele statistice a tuturor unitilor statistice din populaie, implicnd un volum mare de
munc, antreneaz, de obicei, un numr de persoane i dureaz mult timp. Ca urmare se
creaz condiii pentru apariia de erori de observare, ceea ce va conduce la micorarea
eficienei observrii. Forma cea mai frecvent de observare total o constituie recensmntul
populaieiObservarea total se practic i n domeniul controlului tehnice de calitate, n cazul
produselor de nalt tehnicitate , aa cum ar fi: televizoare, maini de splat, frigidere,
automobile etc. Este necesar o observare total n acest caz, deoarece constatarea
defeciunilor de ctre cumprtori ar implica cheltuieli mult mai mari cu remedierea acestora
n comparaie cu organizarea unei observri totale a loturilor de produse ce urmeaz a fi
scoase pe pia.
n cazul altor produse, unde cheltuielile legate de remedierea defectelor sunt
nesemnificative, este suficient realizarea unor observri pariale prin care s se asigure c
rebuturile nu depesc un anumit procent admis. O astfel de observare, care include doar o
parte din unitile populaiei supuse studiului corespunde observrii pariale. Observarea
parial constituie o alternativ la observarea total n cazul populaiilor infinite sau chiar dac
sunt finite prin observare are loc distrugerea acestora. Avnd la baz procedeul observrii
pariale se pot evalua rezervele de iei, crbune sau alte minerale, se poate evalua masa de
material lemnos din fondul silvic a unei zone sau la nivelul ntregii ri. n general, observarea
parial se recomand n toate cazurile n care se consider mai avantajoas dect observarea
total.
Eantionul, ca rezultat al observrii pariale, presupune respectarea cu strictee a
principiului reprezentativitii, n conformitate cu care fiecare unitate statistic din populaie
general s aib aceeai ans de a face parte din eantion. Asigurarea respectrii principiului
reprezentativitii n formarea eantionului de observat permite acestora o structur foarte
apropiat cu cea a populaiilor din care sunt formate. Aceasta ne asigur, cu o anumit
probabilitate dinainte fixat, c rezultatele obinute la nivelul eantionului pot fi extinse la
nivelul ntregii populaii. n raport cu legea de probabilitate urmat de variabilele urmrite n
populaia general sunt dou tipuri de eantioane: eantioane de volum mare i eantioane de
volum redus.
Observarea statistic n raport cu procedeul folosit este de dou feluri:
- observarea direct;
- observarea indirect.
Observarea direct presupune o observare nemijlocit a unitilor din populaie, care
sunt prevzute pentru cercetare. Acest mod de observare se realizeaz printr-un contact direct
cu unitile statistice, fie prin msurare, fie prin interogare, dac unitile sunt persoane. Acest
procedeu permite observatorului perceperea nemijlocit a fenomenelor luate n studiu n
vederea msurrii nivelelor nregistrate de variabilele considerate.
Observarea indirect presupune un intermediar ntre unitile care urmeaz s fie
supuse observrii i observator. Intermediarul poate fi un document special conceput n
vederea observrii i atunci observarea este pe baz de document sau intermediarul poate fi o
alt persoan dect observatorul, caz n care avem observare prin interogare.
Suportul pentru culegerea datelor l reprezint chestionarul.

2.2. Sistematizarea i prezentarea datelor statistice

Sistematizarea constituie o etap n cadrul prelucrrii datelor statistice n vederea
prezentrii acestora sub form de serie statistic (tabele statistice).
Datele obinute ca urmare a procesului de observare statistic, n forma lor brut,
permit o caracterizare amnunit a fiecrei uniti din populaia considerat. Deoarece, datele
15
rezultate din observare se prezint sub form dezorganizat nu permit o caracterizare a
populaiei n ansamblu.
n vederea atingerii scopului cercetrii statistice ntreprinse i anume acela de a da o
caracterizare de ansamblu a populaiei considerate este necesar ca datele rezultate din
observare s fie supuse unor operaii de sistematizare i prezentare n vederea deducerii a ceea
ce este esenial, tipic i general n legtur cu populaia.
Deoarece n prelucrarea statistic primul pas l constituie prezentarea datelor observate
sub forma de serie (tabel), pentru construirea seriilor statistice se aleg variabilele care trebuie
s fie n strns dependen cu scopul cercetrii i cu natura fenomenului cercetat.
Odat precizate variabilele de la baza seriei, se tie care va fi coninutul primului ir de
date i ca urmare este elucidat criteriul n raport cu care informaiile rezultate din observare
vor fi ordonate, necunoscndu-se ns cum se face propriu-zis ordonarea i cum se
completeaz primul ir al seriei.
Operaia de stabilire a claselor presupune mprirea unitilor unei populaii n clase
distincte n raport cu una sau mai multe variabile i aranjarea claselor rezultate ntr-o anumit
ordine. n urma unei asemenea operaii, fiecare unitate trebuie s se gseasc n una i numai
una din clasele rezultate. Aceast operaie nu trebuie s conduc la pierderi de uniti,
regsindu-se ns ntr-o alt ordine dect cea dup care s-a realizat observarea.
Omogenitatea constituie o proprietate de baz pe care trebuie s o aib clasele. Se
spune c o clas este omogen dac, pentru unitile care fac parte din ea, variabila de
grupare nregistreaz variaii nesemnificative.
n cele ce urmeaz se va prezenta operaia de stabilire a claselor n cazul unei serii
unidimensionale.
Dac la baza seriei avem o variabil calitativ, atunci clasele se stabilesc n raport cu
strile acesteia. Pentru fiecare stare a variabilei se va construi o clas. Ca urmare, n acest caz,
ntr-o clas vor intra toate unitile care au nregistrat aceeai stare n timpul observrii n
raport cu variabila considerat.
n cazul unei serii care are la baz o variabil cantitativ discret (numrul strilor nu
este prea mare), clasele se stabilesc n mod asemntor ca i la variabilele calitative,
respectiv:

R
R
N N N
x x x
X
...
...
:
2 1
2 1


n condiiile n care cercetarea populaiei presupune elaborarea unei serii care are la
baz o variabil cantitativ continu sau o variabil cantitativ discret, dar care n populaia
considerat nregistreaz un numr prea mare de stri, clasele nu se mai pot stabili cu ajutorul
strilor variabilei. Pentru asemenea cazuri, gruparea unitilor populaiei n clase se face cu
ajutorul intervalelor de grupare (variaie), fiecare interval cuprinznd un numr oarecare de
valori ale variabilei. Ca urmare, pentru o serie continu, clasele se definesc cu ajutorul
intervalelor de grupare.
Dou probleme se pun n cazul elaborrii unei serii care are la baz o variabil
cantitativ continu:
determinarea lungimii intervalelor de variaie;
stabilirea formei de scriere a intervalelor de variaie.
Determinarea lungimii intervalelor de variaie conduce la dou situaii:
serii construire cu intervale de lungime egal;
serii construite cu intervale de lungime diferite.
Stabilirea numrului de intervale de variaie trebuie s asigure satisfacerea
urmtoarelor condiii:
16
- informaia care se pierde n urma operaiei de grupare s nu fie prea mare, iar
populaia s nu fie prea frmiat n raport cu variabilele de grupare;
- media aritmetic a fiecrei grupe (n raport cu valorile nregistrate) s fie ct mai
aproape de centrul intervalului de variaie respectiv;
- s nu existe grupe vide;
- reprezentarea grafic a seriei rezultate s permit conturarea unei regulariti a
fenomenului de studiat din cadrul populaiei. Trebuie remarcat c acest lucru nu
este posibil nici n cazul unui numr mic de intervale deoarece se pierd prea multe
date, nici n cazul unui numr prea mare de intervale, populaia frmindu-se
prea tare.
Statisticianul american H.A. Struges a stabilit pentru cazul n care populaia n raport
cu variabila X este normal, urmtoarea expresie:


N
x x
l
x
lg 322 , 3 1
min max
+

= (2.1)

(1+3,322 LgN, avnd semnificaia de numr de intervale), pentru celelalte cazuri rezultatul
fiind orientativ, servind la determinarea cu aproximaie a lungimii intervalelor de variaie n
cazul n care acestea vor fi de lungime egal. n expresia de calcul a lungimii intervalelor
intervine valoarea maxim i cea minim a variabilei, ct i volumul populaiei. n urma
stabilirii lungimii intervalelor. Se elaboreaz seria de intervale de lungime egal dup cum
urmeaz:

[ ) [ ) [ )

+ + + + +
R k
x x x x x
N N N
l R x l R x kl x l k x l x x
X
1
min min min min min min
) ( ; ) 1 ( ... ) ( ; ) 1 ( ... ) ( ;
:

dac se presupune c au rezultat R intervale, unde N
k
, R k , 1 = reprezint volumele claselor n
care s-a structurat populaia.
Numeroase sunt cazurile practice n care studiul unei populaii n raport cu o variabil
sau mai multe presupune mprirea domeniilor de variaie ale acestora n intervale de
lungime neegal. n asemenea cazuri nu exist o relaie de calcul n acest sens. Stabilirea
intervalelor de variaie se face n direct legtur cu variaia variabilelor i distribuirea
unitilor n raport cu acestea.
Dac la baza seriei n cauz stau dou sau mai multe variabile calitative sau cantitative
atunci clasele se stabilesc n raport cu fiecare din variabilele considerate prin strile acestora
(vezi seria 1.5), avem serii bidimensionale sau multidimensionale.
Nu este recomandat ca numrul variabilelor n raport cu care se studiaz populaia s
fie prea mare, deoarece aceasta duce la o divizare exagerat a populaiei pierzndu-se din
vedere aspectele principale.
Dup ce clasele au fost definite, are loc repartizarea unitilor populaiei n clasele
respective, folosind n acest scop un algoritm adecvat.
Pentru elaborarea i prezentarea seriilor statistice se apeleaz la pachete de programe
statistice cum ar fi: S.P.S.S. (Statistical Package for the Social Sciences), STATISTICA,
S.A.S. (Statistical Analysis System), STATGRAPHICS, etc.

2.3. Reprezentri grafice

Reprezentarea grafic a unei serii ne d o imagine geometric (n plan sau spaiu) cu
privire la forma static sau evoluia dinamic a fenomenului cuantificat de seria respectiv.
17
Graficul asociat unei serii constituie o imagine spaial a fenomenului de cercetat,
permind evidenierea rapid a structurii, dinamicii i tendinei de dezvoltare a acestuia.
Reprezentrile grafice sunt folosite att n scopul cunoaterii populaiei n cauz, ct i pentru
popularizarea unor rezultate din diverse domenii de activitate.
Elaborarea complet i corect n acelai timp a unui grafic presupune elucidarea
urmtoarelor elemente: titlul graficului, scara de reprezentare, reeaua graficului, semnele
convenionale i notele.
Titlul graficului trebuie s fie scurt, clar i semnificativ pentru coninutul
fenomenului reliefat prin seria considerat.
Scara de reprezentare reunete mulimea tuturor punctelor cotate. n cazul n care
variabila nregistreaz valori mici, gradarea scrii ncepe n principiu de la zero, dac variabila
nregistreaz valori mari se consider o alt origine stabilit cu aproximaie. Pentru a nu
ncrca prea mult desenul, se recomand reprezentarea pe scar doar a valorilor dispuse la un
anumit interval convenabil ales. Distanele dintre dou puncte cotate consecutive se numete
intervalul graficului. Cnd intervalele sunt egale atunci avem scri uniforme, n caz contrar
avem scri neuniforme.
Reeaua graficului permite identificarea cu uurin n plan sau n spaiu a punctelor
corespunztoare valorilor nregistrate de variabilele n cauz. Sistemul axelor rectangulare (n
plan sau spaiu) constituie cele mai uzuale reele n reprezentarea grafic a seriilor statistice.
Semnele convenionale se pot materializa ntr-o reprezentare grafic prin inscripii, fie
printr-o legend. Inscripia trebuie s fie scurt i semnificativ i plasat ct mai bine n
raport cu elementul din grafic pe care l expliciteaz. Legenda se folosete pentru a explicita
folosirea semnelor, culorilor sau diverselor hauri folosite n graficul n cauz. Legenda se
plaseaz nafara graficului, n colul din stnga sau dreapta jos.
n cazul graficelor complexe, pentru o nelegere mai bun, sunt necesare unele
explicaii, care se dau sub form de note. Notele generale privesc n ansamblu graficul i se
plaseaz chiar sub titlul graficului. Notele speciale privesc poriuni din grafic i sunt legate de
acestea prin diverse semne de trimitere. Notele se plaseaz n partea de jos a diagramei, n
colul din stnga sub reea.
n continuare se vor prezenta principalele tehnici de construire a graficelor utilizate n
reprezentarea seriilor statistice ce descriu fenomenele social-economice.




Histograma

Graficul specific seriilor care au la baz o variabil continu (de intervale) este
histograma. Aceasta se construiete ntr-un sistem de axe rectangulare dup cum urmeaz: pe
abscis se trec intervalele de variaie, iar pe ordonat se traseaz scara frecvenelor. Scara
frecvenelor se construiete n conformitate cu respectarea principiului proporionalitii ntre
frecvene i segmentele delimitate pe scara ordonatelor. Pentru fiecare interval de variaie a
seriei (x
i-1
x
i
) se construiete un dreptunghi a crui baz este chiar lungimea intervalului, iar
cealalt latur se determin din condiia proporionalitii ariei dreptunghiului cu mrimea
indicatorului n clasa respectiv.
Latura necunoscut a dreptunghiului, notat cu L
i
se determin din urmtoarea relaie:
L
i
. l
i
= k . N
i
(2.2)
unde:
l
i
= latura cunoscut a dreptunghiului corespunztor intervalului (x
i-1
- x
i
);
L
i
= latura necunoscut a dreptunghiului corespunztor intervalului (x
i-1
- x
i
);
18
N
i
= frecvena absolut a clasei i;
k = un coeficient de proporionalitate care se alege n raport cu scara de reprezentare.
Din relaia (2.2) se deduce L
i
:
R 1, i = == = = == = ,
l
N
k L
i
i
i

unde: l
i
= x
i
- x
i-1
, adic diferena dintre limita superioar i cea inferioar a intervalului de
variaie.
Mulimea tuturor dreptunghiurilor astfel determinate, formeaz histograma ataat
seriei.

Poligonul frecvenelor

Este o reprezentare grafic a seriilor statistice avnd la baz o variabil atributiv
cantitativ continu i format cu frecvene absolute sau relative, simple sau cumulate.
Trasarea acesteia presupune realizarea n prealabil a histogramei. Poligonul
frecvenelor se obine unind prin segmente de dreapt mijloacele laturilor superioare ale
dreptunghiurilor, din care este alctuit histograma.
Poligonul frecvenelor este un grafic important pentru aproximarea formei distribuiei
populaiei studiate, ct i pentru compararea a dou distribuii pe aceeai diagram.
Exemplu
Din Anuarul Statistic al Romniei din anul 2000, am extras o serie de repartiie
reprezentnd populaia Romniei sub 40 de ani pe grupe de vrst .


Grupa
de vrst (ani)
Populaia
0 4 1147065
5 9 1330733
10 14 1737153
15 19 1701881
20 24 1978835
25 29 1792822
30 34 1698268
35 39 1335039


19
Distributia populatiei Romaniei sub 40 ani pe grupe de varsta
0 4 5 9 10 14 15 19 20 24 25 29 30 34 35 39
grupa de varsta (ani)
p
o
p
u
l
a
t
i
a

Figura 2.1 Histograma si poligonul frecventelor

Diagramele de structur

Punerea n eviden sub form grafic a structurii unei populaii statistice este posibil
apelnd la diagramele de structur. n acest sens se prezint: dreptunghiul, ptratul, cercul i
semicercul de structur. Aceste tipuri de grafice permit reprezentarea grafic a seriilor
unidimensionale construite cu mrimi de structur( frecvene relative, greutate specific).
Cel mai des folosit este cercul de structur denumit i diagrama sectorial (piechart).

Cercul de structur

Se construiete un cerc de raz oarecare a crei suprafa se consider c reprezint
volumul ntregii populaii n cauz (exprimat n frecvene absolute sau relative).
Fiecare clas n care este divizat populaia supus studiului este reprezentat printr-un
sector de cerc de arie direct proporional cu volumul clasei. Trasarea sectorului de cerc
presupune determinarea msurii n grade a unghiurilor la centru a fiecrui sector. Unghiul la
centru de 360
o
corespunde volumului ntregii populaii. Unghiurile sectoarelor de cerc care
reprezint clase din populaie trebuie s fie proporionale cu volumul acestora (exprimat n
frecvene absolute sau relative). Unui procent i corespunde 3,6
o
cu procentul corespunztor
clasei respective.

100
360
(%).
o
i i
f = (2.3)

Exemplu
Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz, rednd
distribuia voturilor electoratului pentru Senat (dup redistribuire) la alegerile din 3 noiembrie
1996:

Formaiunea
Politic

CDR

PDSR

USD

UDMR

PRM

PUNR
Voturi
Obinute (%)

37,0

28,7

16,1

7,7

5,6

4,9

20
Rezultatele alegerilor parlamentare pentru Senat din 3 nov 1996
37%
28,70%
16,10%
7,70%
5,60%
4,90%
CDR
PDSR
USD
UDMR
PRM
PUNR

Figura 2.2 Cercul de structura

Diagramele prin benzi (barchart)

Acest tip de grafic utilizeaz benzile (barele), pentru a reprezenta distribuia unei
populaii n raport cu o variabil cantitativ discret sau calitativ. Benzile au aceeai lime
(baz), iar lungimea (nlimea) lor este direct proporional cu frecvena clasei reprezentate.
Numrul benzilor este egal cu numrul claselor n care este mprit populaia studiat. De
asemenea se pot lua n considerare o variabil sau dou.
n reprezentri se utilizeaz benzi simple sau benzi grupate. Poziia benzilor poate fi
orizontal sau vertical.

Exemplu

Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz, rednd
nivelul PNB/loc n $ calculat pe baza puterii de cumprare n Romnia i alte ri est-
europene, n 1998

ara Bulgaria Cehia Polonia Romnia Slovacia Ungaria
PNB/loc ($) 4683 12197 7543 6153 9624 9832

21
PNB/loc ($) in 1998
4683
12197
7543
6153
9624
9832
0
2000
4000
6000
8000
10000
12000
14000
Bulgaria Cehia Polonia Romnia Slovacia Ungaria

Figura 2.3 Diagram prin benzi simple


Cronograma (historiograma)

O categorie foarte important de serii o constituie seriile cronologice, a cror
reprezentare grafic se realizeaz prin cronograme. Trasarea unei cronograme se realizeaz
ntr-un sistem de axe rectangulare.
Se consider seria cronologic de forma (1.7):

T t
y y y y y
T t
Y
... ...
... ... 2 1 0
:
2 1 0


unde: T t , 0 = , reprezint momentele (sau perioadele) de timp care se reprezint pe axa
absciselor, iar mrimile y
t
se reprezint pe axa ordonatelor. Fiecrei perechi de valori (t, y
t
),
T t , 0 = i corespunde un punct n planul axelor rectangulare. Unind prin segmente de dreapt
punctele consecutive, astfel determinate, se obine ceea ce se numete cronogram.
n acelai sistem de axe pot fi reprezentate una sau mai multe serii cronologice, care
pot fi exprimate n aceeai unitate de msur sau n uniti de msur diferite. Cronogramele
asociate unor serii cronologice ne permit compararea fenomenelor surprinse de asemenea serii
i sesizarea perioadelor critice n evoluia acestora.

Exemplu.

Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz, rednd
numrul total ta autoturisme nscrise n circulaie la sfritul anului n Romnia n perioada
1994-1999.



22

Anul 1994 1995 1996 1997 1998 1999
Autoturisme
nmatriculate
2020017 2197477 2391869 2605465 2822254 2980014

Evolutia numarului de autoturisme inscrise in circulatie
in perioada 1994-1999
0
500000
1000000
1500000
2000000
2500000
3000000
3500000
1993 1994 1995 1996 1997 1998 1999 2000
anul
n
u
m
a
r

a
u
t
o
t
u
r
i
s
m
e

i
n

c
i
r
c
u
l
a
t
i
e

Figura 2.4 Cronograma

Norul statistic

Norul statistic constituie o modalitate de reprezentare grafic a seriilor atributive de
repartiie bidimensionale.
Se consider o serie bidimensional de repartiie n raport cu variabilele discrete X i
Y. n sistemul de axe rectangulare xOy se marcheaz toate punctele de coordonate (x
j
, y
i
);
J 1, j ; I 1, i = = pentru care frecvenele N
ij
0. Mrimea acestor frecvene se poate marca pe
grafic n dou moduri:
- dac frecvenele sunt mici, atunci pentru fiecare punct de pe grafic
(x
j
, y
i
); J 1, j ; I 1, i = = pentru care N
ij
0, se marcheaz attea puncte de cte ori
se repet perechea respectiv.
- dac ns frecvenele sunt prea mari, pentru marcarea lor pe grafic se pot utiliza
diagrame areale prin cercuri ale cror arii trebuie s fie proporionale cu rdcina
ptrat a frecvenelor pe care le reprezint.
n cazul n care cele dou variabile X i Y sunt continue, ntruct la intersecia a dou
intervale se formeaz o rubric (csu), frecvenele diferite de zero se reprezint n interiorul
acestei rubrici, fie prin puncte, fie prin diagrame areale cu respectarea unuia din cele dou
moduri de elaborare mai sus amintite.

Exemplu

Un produs a fost lansat simultan pe 13 piee. Pe aceste piee, produsul a fost propus la
preuri diferite (P), veniturile consumatorilor (V) fiind i ele diferite. Pentru fiecare piat s-a
nregistrat un anumit nivel al cererii (C), rezultatele fiind sintetizate n tabelul urmtor:
23
Nr.
Crt.
1 2 3 4 5 6 7 8 9 10 11 12 13
Cerere
(C)
15,4 3,2 4,9 10,5 8,0 5,1 7,6 11,3 14,0 6,4 13,2 8,8 12,1
Pre
(P)
1,4 5,1 2,5 1,7 1,8 3,4 2,1 1,6 3,6 3,5 1,9 1,8 1,9

0
2
4
6
8
10
12
14
16
18
0 1 2 3 4 5 6
pret
c
e
r
e
r
e

Figura 2.5 Norul de puncte n raport cu Pret i Cerere

Cartograma i cartodiagrama

Aceste tipuri de grafice se folosesc frecvent pentru reprezentarea grafic a seriilor
statistice de spaiu.
Realizarea unei cartograme sau a unei cartodiagrame presupune conturarea spaiului
(sub form de hart) n interiorul cruia se manifest fenomenul care este cuantificat de seria
de reprezentat. n interiorul hrii astfel realizat, prin diverse culori sau nuane ale aceleiai
culori, prin hauri sau prin diferite diagrame, este evideniat intensitatea dezvoltrii
fenomenului cercetat precum i mrimea indicatorilor seriei.
Cartodiagrama constituie o modalitate de reprezentare grafic a seriilor de spaiu,
realizndu-se ca o mbinare ntre cartogram i diferite alte tipuri de diagrame, ca de exemplu
diagrame prin benzi, cerc, ptrat, dreptunghi etc. De exemplu, pentru a reprezenta o serie de
spaiu ce exprim volumul investiiilor strine pe judee, la noi n ar, se procedeaz astfel: n
primul rnd se deseneaz harta Romniei, delimitndu-se judeele; n cadrul fiecrui jude se
deseneaz o figur geometric oarecare convenabil aleas, a crei arie sau mrime s fie direct
proporional cu volumul investiiilor strine din judeul respectiv.


Probleme propuse

P1. Dai 5 exemple de populaii statistice a cror cercetare ar prezenta interes i pentru fiecare
populaie selectat precizai:
- denumirea populaiei, a unitii statistice i volumul acesteia;
- scopul cercetrii statistice;
- variabilele statistice n raport cu care s-ar face observarea statistic a populaiei.
P2. S se extrag din Anuarul Statistic sau alte surse informaionale o serie statistic
bidimensional ce red distribuia unei populaii n raport cu dou variabile atributive,
relativ la care se cere:
24
1. denumirea populaiei ce a fost supus observrii i volumul acesteia;
2. unitatea statistic;
3. caracterizarea variabilelor statistice n raport cu care a fost studiat populaia;
4. caracterizarea seriei statistice n raport cu toate criteriile cunoscute;
5. elaborarea seriei bidimensionale format cu frecvene relative, interpretare;
6. extragerea repartiiilor unidimensionale marginale i a celor condiionate;
7. pornind de la o repartiie marginal deducei celelalte serii statistice posibile,
interpretare.
P3. Din Anuarul Statistic sau alte surse informaionale extragei o serie statistic de repartiie,
avnd la baz o variabil de spaiu, relativ la care se cere:
1. denumirea populaiei statistice i volumului ei;
2. unitatea statistic;
3. caracterizarea seriei dup toate criteriile cunoscute;
4. deducerea seriei format cu frecvene relative;
5. interpretare.
P4. Din Anuarul Statistic sau alte surse informaionale extragei dou serii cronologice avnd
la baz indicatorul de nivel, una de momente, alta de intervale i deducei seriile formate
cu diferene absolute, indici statistici, diferene relative, cu baz fix i cu baz n lan
(interpretri).
P5. Dai 5 exemple de serii cronologice avnd la baz indicatorul relativ de intensitate.
P6. Din Anuarul Statistic sau alte surse informaionale extragei o serie de spaiu format cu
indicator de nivel sau indicator relativ de intensitate i deducei seriile formate cu
diferene absolute, indici i diferene relative, calculate cu baz fix. Interpretare.
P7. Extragei 5 exemple de serii de spaiu ce conin informaii importante pentru domeniul
economic.
P8. Luand ca exemplu o populaie statistic studiat n raport cu un anumit numr de
variabile (stabilite n raport cu obiectivul studiului), se cere:
1. elaborarea tuturor seriilor statistice de repartiie unidimensionale
2. elaborarea a trei serii statistice de repartiie bidimensionale ( una are la baza dou
variabile calitative, una are la baz o variabila calitativ i o variabil cantitativ, una
are la baz dou variabile cantitative)
3. reprezentarea grafic a: histogramei, poligonului frecvenei, cercului de structur,
diagramei prin benzi sau coloane, norul statistic, cronograma i cartograma.


Bibliografie:

1. Buiga, A., Metodologie de sondaj i analiza datelor n studiile de pia, Ed. Presa
Universitar Clujean, Cluj-Napoca, 2001;
2. Buiga, A., Drago C., Lazr D., Parpucea I., Todea A., Statistic I, Ed. Presa
Universitar Clujean, Cluj-Napoca, 2003;
3. Florea I., Parpucea I., Buiga A., Statistic descriptiv, Ed. Continental,
Cluj-Napoca, 1998.





25

MODULUL 2

PARAMETRII REPARTIIILOR EMPIRICE UNIDIMENSIONALE


Obiective
cunoaterea i nelegerea modului de calcul precum i a semnificaiei parametrilor
statistici.
ilustrarea trsturilor eseniale care caracterizeaz fenomenele social - economice
cunoaterea i msurarea variaiei unei mrimi n raport cu nivelul mediu al acesteia

Concepte de baz
valoare medie, median, modal
parametrii de structur
variaie, abatere medie, dispersie
parametrii concentrrii
asimetrie i boltire

Rezultate ateptate

Cunoaterea modului de calcul i a semnificaiei parametrilor tendinei centrale, a gradului
de reprezentativitate a mediei, respectiv a medianei, analiza structurii unei populaii i
formularea unei concluzii privind forma distribuiei unei populaii.

Sinteza

2.1. Parametrii tendinei centrale

Parametrii din aceast grup au menirea de a evidenia poziia n jurul creia se
grupeaz ansamblul valorilor unei variabile de la baza unei serii. Aceast poziie exprimat
printr-un numr se numete poziie central. Ea poate fi evideniat prin:
- valoarea medie ( ) X ;
- valoarea median ( ) ( ) X M
e
;
- valoarea modal ( ) ( ) X M
o
.

A. Valoarea medie

Valoarea medie reprezint principalul parametru care caracterizeaz tendina central a
unei repartiii statistice.
n vederea definirii parametrului valoarea medie se consider o populaie statistic
studiat n raport cu variabila cantitativ X i o funcie G(x
1
,x
2
,,x
R
) unde x
i
, R i , 1 = ,
reprezint strile variabilei X. Funcia G exprim o anumit nsuire esenial, un atribut al
populaiei n raport cu variabila X. Aceast funcie se numete funcie determinant.
26
Prin definiie, valoarea medie X a variabilei X este parametrul care las invariant
funcia determinant, adic:

( ) ( ) X X X G x x x G
R
,..., , ,..., ,
2 1
= . (2.0)

Aceast egalitate se ntlnete sub denumirea de relaia lui BOIARSKI-KISINI. n
funcie de forma analitic a funciei G, din relaia (2.0) se deduce expresia analitic
(indicatorul) de calcul a valorii medii X .
Determinarea, pe aceast cale, a valorii medii X , este destul de anevoioas. Utilizarea
acesteia presupune stabilirea coninutului (semnificaiei) i a formei analitice a funciei
determinante G, pentru fiecare caz n parte. Dar, valoarea medie X poate fi definit ca un
raport a dou mrimi din care se deduce aceeai expresie pentru X ca i din (2.0).
Exist, aadar, dou modaliti echivalente de definire a valorii medii, criteriul relaiei
determinante a lui Boiarski-Kisini i criteriul raportului, ultima fiind mai accesibil. Criteriul
raportului presupune raportarea volumului fenomenului cercetat la volumul populaiei. Acesta
presupune cuantificarea volumului fenomenului n funcie de natura lui. Pentru a exemplifica
cele prezentate mai sus, se consider populaia familiilor dintr-o localitate, cercetat n raport
cu numrul de copii. Datele rezultate din observare se prezint ca o serie de repartiie de
forma:
R i
i
i
N
x
X
, 1 .
:
=


n acest caz, funcia determinant are urmtoarea form:

( )

=
=
R
i
i i R
N x x x x G
1
2 1
,..., ,

semnificnd numrul total de copii din localitatea respectiv. Pentru a gsi numrul mediu de
copii pe familie se particularizeaz relaia (2.0) dup cum urmeaz
i
R
i
R
i
i i
N X N x =

= = 1 1

de unde rezult:

=
=

=
R
i
i
R
i
i i
N
N x
X
1
1

La acelai rezultat se putea ajunge pornind de la faptul c numrul mediu de copii pe
familie se poate exprima ca un raport ntre numrul total de copii i numrul de familii din
localitatea respectiv, adic:

familii de Nr
copii de total Nr
X


=
.
.
(2.1)

n acest exemplu, fenomenul fiind de natur demografic, volumul acestuia se
cuantific prin numrul total de copii la nivelul populaiei statistice considerate. Aceasta este
27
n direct concordan cu natura i semnificaia variabilei n raport cu care se face cercetarea
statistic.
Cunoaterea naturii parametrului valoare medie, conduce la o definiie mai complet
i plin de semnificaie.
Pentru a nelege semnificaia valorii medii X , trebuie subliniat faptul c, n general,
variaia unui fenomen, de orice natur, i n particular variaia unei variabile X n raport cu
care este cercetat o populaie, este determinat de aciunea simultan a dou categorii de
factori: factori eseniali i factori neeseniali.
n categoria factorilor eseniali intr acei factori care acioneaz asupra tuturor
unitilor populaiei n mod continuu i n acelai sens, determinnd, n principal, nivelul de
dezvoltare a variabilei pentru fiecare unitate component din populaie.
Factorii eseniali se conjug n aciunea lor cu factorii neeseniali, care, n general, au
un caracter aleator, sunt numeroi i neuniform rspndii printre unitile populaiei.
Fiecare din factorii considerai neeseniali acioneaz numai asupra unui anumit numr
de uniti din populaie. Ca urmare, acetia pot contribiu fie la creterea nivelului variabilei
(pentru unele uniti din populaie), fie la scderea nivelului variabilei (pentru alte uniti din
populaie).
La rndul lor factorii eseniali nu acioneaz cu aceeai intensitate asupra tuturor
unitilor din cadrul populaie considerate, determinnd, n acest fel, variaia neuniform a
variabilei respective n cadrul populaiei.
n consens cu cele subliniate mai sus, se poate afirma c parametrul valoarea medie a
unei serii statistice care are la baz variabila X, constituie acel nivel pe care l-ar putea
nregistra variabila n cadrul populaiei cercetate n condiiile n care factorii neeseniali nu s-
ar fi manifestat, iar factorii eseniali ar fi acionat asupra unitilor din populaie cu aceeai
intensitate.
Parametrul valoarea medie, calculat pentru o serie statistic, pune n eviden ceea ce
este comun, general i esenial sub aspectul nivelului de dezvoltare al variabilei, n raport cu
care este studiat o populaie.
n raport cu natura variabilei ce st la baza seriei, ct i a formei de prezentare a
indicatorilor cu care aceasta este construit, exist mai multe posibiliti de calcul a valorii
medii.
Funcia determinat G, sub forma sa cea mai general, are urmtoarea expresie
analitic:
( )
K
i
R
i
K
i
R
f x x x G
x
1
1
2 1
,..., ,

=

=
(2.2)

Pentru diverse valori ale lui k, n strict concordan cu coninutul i semnificaia
funciei G, se ntlnesc mai multe tipuri de medii:
- media armonic (k = -1);
- media aritmetic (k = 1);
- media ptratic (k = 2);
- media cubic (k = 3);
- media de ordinul k n general.
n caz concret, valoarea medie real X este aceea care se obine prin indicatorul
(mediu) rezultat fie prin aplicarea criteriului relaiei determinante, fie criteriului raportului.

Modaliti de calcul a valorii medii

28
1. Media aritmetic

Acesta este indicatorul cel mai utilizat n calculul parametrului valoarea medie a unei serii
statistice, aa cum rezult din practica statistic.
Se consider acum dou serii statistice de repartiie, una format din frecvene absolute, iar
cealalt din frecvene relative:

R i
i
i
N
x
X
, 1 .
:
=

(2.3)

R i
i
i
f
x
X
, 1 .
:
=

(2.4)

Media aritmetic pt cele dou serii se calculeaz astfel:

= =
i i
j
i i
f x X ;
N
N x
X
Dac seria este de intevale, construit cu frecvene absolute avem:

=
j
i
'
i
N
N . x
X
Fie o serie de repartiie, care are la baz o variabil continu X, respectiv,


R i
i
i i
f
x x
X
, 1 .
1

:
=



Folosind notaiile:
' 1
2
i
i i
x
x x
=
+


unde
'
i
x reprezint mijlocul intervalului i, obinem relaia:

i
R
i
i
f x X =

=1
'


Relaia ne arat c media aritmetic a unei serii de intervale se reduce la media
aritmetic a unei serii discrete n care clasele sunt reprezentate prin mijloacele intervalelor de
variaie.







2. Media armonic
Se consider o serie de forma:
29

R i
i
i
N
x
X
, 1
:
=

(2.5)
n cazul unei serii discrete de forma (2.5), media armonic notat cu 1 X se definete prin:

=
=

=
R
i
i
i
R
i
i
N
x
N
X
1
1
1
1
(2.6)
numit i formula mediei armonice ponderate.
Dac ponderile sunt egale ntre ele, adic N
1
=N
2
==N
R
=N
*
, atunci relaia (2.6) devine:

= =
=

=
R
i i
R
i i
R
i
x
R
N
x
N
X
1 1
*
1
*
1
1 1
(2.7)
care reprezint formula mediei armonice simple.
n cazul unei serii care are la baz o variabil continu X, respectiv,
R i
i
i i
N
x x
X
, 1
1
:
=



procednd ca la media aritmetic, pentru media armonic rezult:

=
=

=
R
i
i
i
R
i
i
N
x
N
X
1
'
1
1
1
(2.8)
unde x
i

reprezint mijlocul intervalului i, R i , 1 = .


i n acest caz, dac ponderile sunt egale, se obine relaia de calcul a mediei armonice simple,
de forma:

=
R
i
i
x
R
X
1
'
1
1


3. Media geometric
Pentru o serie care are la baz variabila discret X, format cu frecvene absolute, media
geometric notat cu
g
X (sau
o
X ) este definit prin expresia:
N
N
R
N N
g
R
x x x X ...
2 1
2 1
= (2.9)
Din (2.9), pentru media geometric ponderat exprimat cu frecvene relative se deduce:
30

= = =
= =

= =
R
i
R
i
f
i
N N
i
N
R
i
N
i
N
N
R
N N
g x x x x x x
i i i R
X
1 1
/
/ 1
1
2 1
...
2 1
(2.10)
Dac variabila X, de la baza seriei este de variaie continu, atunci relaiile de calcul pentru
diversele variante de medie geometric, rmn variabile cu singura modificare c valorile x
i
,
R i , 1 = , se nlocuiesc cu mijloacele intervalelor de variaie, calculate conform formulei:
R i
x x
x
i i
i
, 1 ,
2
1 '
=
+
=

(2.11)

B. Valoarea median
Valoarea median, notat cu
e
M este acea valoare a variabilei cantitative X care mparte
repartiia n dou pri egale, respectiv:
2 / 1 ) (M F
N
=
e
sau
2
) (
N
M N
e
= (2.12)
Calculul valorii mediane se face difereniat, dup cum seria are la baz o variabil discret sau
continu.
Pentru o repartiie discret, calculul medianei nu implic probleme deosebite i nici un
volum mare de calcule.
Se consider o repartiie cu frecvene absolute:
.
...
...
...
...
:
2
2
1
1

R
R
i
i
N
x
N
x
N
x
N
x
X (2.13)
n calculul valorii mediane a unei serii discrete, pot aprea dou situaii:
a) volumul N al populaiei este un numr impar;
b) volumul N al populaiei este un numr par.
n ambele cazuri, calculul medianei presupune, n prima faz, determinarea rangului
medianei, notat cu
e
M
r , conform urmtoarei relaii:
) (
2
1
1
e
R
i
i M
M N N r
e
= =

=
(2.14)

a) Dac volumul populaiei N este un numr impar, rangul medianei este un numr zecimal a
crui parte ntreag

2
N
indic numrul de uniti din populaie pentru care variabila X a
nregistrat valori mai mici ca mediana. Ca urmare,
e
M trebuie s fie valoarea imediat
urmtoare celei de rang

2
N
adic:
1
1

\
|
+
1
]
1

=
1
2
N
e
x M (2.15)
31
b) Dac volumul populaiei este un numr par, rangul medianei este un numr ntreg i ca
urmare la mijlocul seriei nu se mai afl o valoare a variabilei X cu care s coincid mediana ci
se gsesc dou valori, mediana calculndu-se n acest caz ca media aritmetic a acestora.
Relaia de calcul a medianei, n acest caz, este:
2
1
2 2
1
1

\
|
+
1
]
1

1
]
1

+
=
N N
e
x x
M (2.16)
Pentru o repartiie continu, calculul valorii mediane presupune verificarea egalitii (2.12) i
ca urmare, trebuie cunoscut densitatea de repartiie f(x). Determinarea funciei f(x) implic
un volum mare de calcule i deci, din acest motiv, n activitatea practic f(x) este aproximat.
Acest lucru va conduce la o expresie aproximativ de calcul a valorii mediane, care necesit
un volum redus de calcule.
Pentru acesta se consider o repartiie continu n raport cu variabila X, i anume:
.
...
...
...
...
:
1 1
2
2 1
1
1 0



R
R R
i
i i
N
x x
N
x x
N
x x
N
x x
X (2.17)
unde intervalele x
i-1
-x
i
, R i , 1 = pot fi de lungime egal sau neegal. Calcularea rangului
medianei va permite stabilirea intervalului n care se afl valoarea median, interval numit i
interval median. Se cumuleaz frecvenele absolute din aproape n aproape pn ce este
ndeplinit inegalitatea:
N N N N
i
2
1
...
2 1
+ + +
Ultima frecven N
i
cumulat, ne permite s indicm intervalul median [ )
i i
x x
1
.
Formula aproximativ de calcul a medianei:

( )
1
1
1
) ( ) (

+ =
i i
i
i e
i e
x x
N
x N M N
x M (2.18)

e
M i
x x =
1
- limita inferioar a intervalului median;
e
M i
N N = - frecvena absolut a intervalului median;
e
M i i
l x x =
1
- lungimea intervalului median,

C. Valoare modal

Valoarea modal M
o
(X) a unei repartiii reprezint aceea valoare a variabilei X creia i
corespunde frecvena cea mai mare.
Acest parametru se mai numete modul, valoare dominant, sau mod se noteaz cu M
o
.

Mod de calcul:
32
a) Pentru o serie de repartiie discret, dat sub forma
.
...
...
...
...
:
2
2
1
1

R
R
i
i
f
x
f
x
f
x
f
x
X (2.19)
valoarea modal se citete direct din serie, nefiind nevoie de nici o tehnic sau formul de
calcul. n cazul acestui tip de serie, valoarea modal va fi acea valoare a variabilei X pentru
care frecvena este cea mai mare.
b) Pentru serii de repartiie continue, respectiv:



+
+


R
R R
i
i i
i
i i
i
i i
f
x x
f
x x
f
x x
f
x x
f
x x
f
x x
X
1
1
1 1
1
1 2
2
2 1
1
1 0
...
...
...
...
:
(2.20)
Modala nu poate fi determinat direct.
Intervalul cruia i corespunde frecvena cea mai mare, se numete intervalul modal i va
conine modala. S presupunem c intervalul modal este x
i-1
-x
i
.

Formula de calcul a modalei:
( )
o o
M M o
l x x M
+

+ =

1 1
1
(2.21)
unde:
M
o
- reprezint valoarea modal;
x
Mo
- reprezint limita inferioar a intervalului modal;
1
- reprezint diferena dintre frecvena intervalului modal i frecvena intervalului
precedent;
1
- reprezint diferena dintre frecvena intervalului modal i frecvena intervalului
urmtor;
l
Mo
- reprezint lungimea intervalului modal.

O serie poate avea o singur valoare modal, caz n care seria se numete unimodal. Dac o
serie are mai multe valori modale, atunci se numete plurimodal. O serie plurimodal
evideniaz faptul c populaia n cauz este neomogen. Calculul valorii modale, n
asemenea cazuri, presupune o delimitare mai riguroas a obiectului observrii ct i a
populaiei care urmeaz s fie studiat. O alt cale, care poate duce la eliminarea unui
asemenea neajuns, o constituie comasarea a dou cte dou sau trei cte trei intervale etc.,
pn se ajunge la o serie unimodal.
n cazul unei serii simetrice valoarea modal coincide cu valoarea medie i cu mediana.
Pentru serii uor asimetrice, K. Pearson a stabilit urmtoarea relaie ntre cei trei parametri:

( )
e o
M X X M = 3

unde X este media aritmetic a variabilei X.
33
Calculul valorii modale reprezint un deosebit interes pentru activitatea practic. Avnd n
vedere c semnificaia acestui parametru indic acea valoare a variabilei nregistrat de cele
mai multe uniti din populaie se poate afla: ora la care sunt solicitate cele mai multe
convorbiri telefonice, ora de vrf privind transportul n comun, mrimea cea mai solicitat la
nclminte etc.
Dac valoarea modal este identic cu valoarea medie, atunci se poate afirma c valoarea
medie se bucur de o mai mare reprezentativitate.
Dac, n plus, avem X M M
o e
= = , innd seama c valoarea median nu este influenat de
valorile extreme ale variabilei, se poate afirma c mediana reprezint un grad de
reprezentativitate mai mare dect valoarea medie.

2.2. Parametrii de structur

Frecvente sunt cazurile cnd este necesar studierea structurii unei populaii n raport cu o
variabil sau alta. Parametrii statistici, n forma cea mai general, folosii n caracterizarea
structurii unei populaii poart denumirea de valori quantile.
Valorile quantile ale unei serii de repartiie unidimensionale sunt acele mrimi nregistrate de
variabila X, care mpart seria n n pri egale (mai precis mparte populaia n n pri egale). n
acest caz se vor calcula p quantile (p = n-1).
Pentru o serie continu, a crei densitate de probabilitate f(x) este cunoscut, urmtoarea
egalitate este satisfcut de cele p quantile:

= = = =
1
1
2
1 1
1
) ( ... ) ( ) (
q
x
q
q
x
q
R
n
n
dx x f dx x f dx x f (2.22)
unde cele n-1 quantile s-au notat cu q
1
, q
2
, , q
n-1
.
Relaia (2.22) se particularizeaz pentru cazul seriilor discrete, cnd seria este construit cu
frecvene relative:
n
f f f
R
n
x
q
i
q
q
i
q
x
i
1
...
1
2
1
1
1
= = = =

(2.23)
Pentru o serie oarecare, quantila de ordinul p poate fi definit astfel:
( )
n
p q F
p N
1
= sau 1 - n 1, p , ) ( = =
n
N
p q N
p

Modul de calcul a valorilor quantile difer n raport cu tipul seriei.
Fie o serie de repartiie, care are la baz o variabil X discret, de urmtoarea form:
.
...
...
...
...
:
2
2
1
1

R
R
i
i
N
x
N
x
N
x
N
x
X (2.24)
Pentru calculul valorii quantile de ordinul ) 1 , 1 ( = n p p , n prima etap trebuie determinat
rangul acesteia:
34
n
N
p q N r
p q
p
= = ) ( (2.25)
Se disting dou cazuri:
a) dac p N se divide cu n atunci quantila de ordin p se calculeaz ca o medie aritmetic
simpl a valorilor variabilei X, de ordinul rangului i al rangului majorat cu o unitate, dup
cum urmeaz:
2
) 1 ( +
+
=
p
q
p
q
r r
p
x x
q (2.26)
b) dac p N nu se divide cu n atunci quantila de ordin p este egal cu acea valoare a variabilei
X corespunztoare pari ntregi a rangului majorat cu 1:

] 1 [ +
=
p
q
r p
x q (2.27)

n cazul seriilor care au la baz o variabil continu, conform definiiei, cele n-1
quantile trebuie s satisfac relaia (2.22). Determinarea quantilelor din asemenea egaliti ar
presupune cunoaterea densitii de probabilitate f(x). Ori n activitatea practic f(x) se
aproximeaz prin diverse procedee, implicnd un volum exagerat de calcule.
n vederea gsirii unor formule aproximative de calcul a quantilei de ordin
) 1 , 1 ( = n p p se consider o serie de variaie continu, ale crei intervale de variaie nu
trebuie s fie neaprat egale ca lungime:
.
...
...
...
...
:
1 1
2
2 1
1
1 0



R
R R
i
i i
N
x x
N
x x
N
x x
N
x x
X (2.28)
n prima etap se determin rangul quantilei de ordinul ) 1 , 1 ( = n p p conform
urmtoarei relaii:

=
= =
R
i
i p q
N
n
p q N r
p
1
1
) ( (2.29)

Cunoscnd rangul, se poate identifica intervalul n care se afl quantila de ordinul p, numit i
intervalul quantilei de ordinul ) 1 , 1 ( = n p p . Cumulnd frecvenele pe clase pn la egalarea
s-au depirea rangului, conform inegalitii:

=
+ + +
R
i
i i
N
n
p N N N
1
2 1
1
... (2.29)

ultima frecven adunat va corespunde intervalului quantilei de ordinul ) 1 , 1 ( = n p p . Prin
urmare, quantila de ordinul p, q
p
, se calculeaz conform relaiei:
) (
) ( ) (
1
1
1

+ =
i i
i
i p
i p
x x
N
x N q N
x q (2.30)
35

1
=
i q
x x
p
- reprezentnd limita inferioar a intervalului quantilei de ordinul p;
1
=
i i q
x x l
p
- reprezint lungimea intervalului quantilei de ordinul p;
i q
N N
p
= - reprezint frecvena absolut a intervalului quantilei q
p
,

Procedeul de determinare a quantilei de ordinul 1 , 1 = n p este acelai i n cazul n
care seria (2.28) este format din frecvene relative.
Caracterizarea structurii unei serii se poate face utiliznd diverse cazuri particulare de
valori quantile.
Valoarea median (M
e
) este i un parametru de structur obinndu-se ca un caz
particular de quantil, cnd n=2. Dac pentru o serie se cunoate M
e
(quantila de ordinul 2),
atunci structura populaiei poate fi redat astfel:


% 50 % 50
:
max min
x M M X
X
e e
(2.31)
semnificnd faptul c jumtate din populaia supus studiului a nregistrat pentru variabila X
valori cuprinse ntre valoarea minim a lui X i median, iar cealalt jumtate din populaie a
nregistrat pentru X valori cuprinse ntre median i valoarea maxim a lui X.
Valorile quartile reprezint acel caz particular al valorilor quantile pentru care n=4.
Cele trei quartile, care se obin, notate: Q
1
, Q
2
i Q
3
sunt acei parametri de structur care
mpart populaia n patru pri egale.
n raport cu mediana, quartila nti Q
1
, se numete quartila mic (inferioar), quartila
a doua Q
2
coincide cu mediana i se numete quartila mijlocie, iar quartila a treia Q
3
se
numete quartila mare (superioar).
Cunoscndu-se cele trei quartile, rezult urmtoarea structur a populaiei n raport cu
variabila X:


% 25 % 25

% 25 % 25
:
max 3 3 2 2 1 1 min
X Q Q Q Q Q Q x
X (2.32)
ceea ce semnific o structurare a populaiei supus studiului n patru pari egale.
Aceasta nseamn c 25% din unitile popupaiei nregistreaz valori pentru variabila
X mai mici dect quartila mic, 25% din unitile populaiei nregistreaz valori, n raport cu
aceeai variabil X, cuprinse ntre quartila mic i cea mijlocie, 25% vor avea valori cuprinse
ntre quartila mijlocie i quartila mare, iar restul 25% din unitile populaiei vor avea valorile
pentru variabila X cuprinse ntre quartila mare i valoarea maxim a lui X.


2.3. Parametrii variaiei
Studiul unor populaii statistice prezint importan numai din punct de vedere al unor mrimi
care variaz de la o unitatea la alta sau de la un grup de uniti la altul.
36
Valorile nregistrate de o variabil cantitativ, n raport cu care este studiat o populaie, se
datoresc aciunii diferiilor factori eseniali i neeseniali.
Intensitatea diferit cu care se pot manifesta factorii eseniali ct i sensul contrar cu care pot
aciona factorii neeseniali n raport cu fiecare unitate, provoac nivele diferite nregistrate de
variabile n raport cu care este studiat populaia.
Problema msurrii variaiei unei variabile cantitative este important pentru a vedea n ce
msur valoarea medie a acesteia poate reprezenta ntrega populaie.
Dac abaterile de la valoarea medie sunt neeseniale atunci se poate afirma c populaia este
omogen i c acest parametru poate reprezenta tendina central, iar dac aceste abateri sunt
mari atunci populaia este eterogen i valoarea medie nu are capacitatea de a reprezenta
populaia.
Pentru unele serii, valoarea medie nu se poate calcula. n asemenea cazuri, parametrul
valoarea median poate s-i ia locul. Aceeai problem se pune i n acest caz, de a vedea n
ce msur valoarea median este sau nu reprezentativ pentru populaia n cauz.
O alt problem care nu se poate rezolva fr a studia i msura variaia nregistrat de o
variabil n raport cu care este studiat o populaie, o constituie verificarea de ipoteze. n
activitatea practic, de multe ori pornind de la valorile unor parametrii calculai pe baza
datelor culese relativ la un numr mic de uniti, este necesar a fi extini la nivelul ntregii
populaii sau de a se verifica anumite ipoteze statistice.
Parametrii variaiei se pot calcula att sub form absolut ct i relativ, i msoar
mprtierea valorilor unei variabile cantitative fa de valoarea medie sau valoarea median.
Ca urmare, n funcie de elementul de referin folosit n msurarea variaiei, deosebim:
- parametrii variaiei n raport cu valoarea medie;
- parametrii variaiei n raport cu valoarea median.

2.3.1. Parametrii variaiei n raport cu valoarea medie

Abaterea medie liniar

Abaterea medie liniar, notat cu
x
d , reprezint media aritmetic a abaterilor variabilei X de
la valoarea medie a acesteia, luate n valoare absolut:
X X M d
x
= (2.33)
Relaia (2.33) se particularizeaz n :

=
=

=
R
i
i
i
R
i
i
x
N
N X x
d
1
1
(2.34)
Dac seria are la baz o variabil continu i se cunoate f(x), atunci abaterea medie liniar se
calculeaz astfel:
37
dx x f X x d
R
x
x
x
) (
1
=

(2.35)
Densitatea de probabilitate f(x) se poate aproxima cu densitatea empiric i atunci pentru
abaterea medie liniar se pot obine relaii de calcul aproximativ, frecvent utilizate n
activitatea practic, de forma:

i
R
i
x R
i
i
i
R
i
x
f X x d
N
N X x
d
i
i
=

=

=
=
=
1
'
1
1
'
sau (2.36)
dup cum seria n cauz este format cu frecvene absolute sau relative, unde:
R i
x x
x
i i
i
, 1 ,
2
1 '
=
+
=


este mijlocul intervalului i.
Acest parametru servete caracterizrii sintetice a gradului de reprezentativitate a valorii
medii, artnd cu ct se abate n medie orice valoare a variabilei X de la valoarea medie X ,
ntr-un sens sau altul.
Sub forma relativ, acest indicator poart denumirea de coeficient simplu de variaie i se
calculeaz conform relaiei:
100 =
X
d
V
x
x
(2.37)
Coeficientul simplu de variaie (V
x
) arat cu ct se abate n medie orice valoare a variabilei X
de la valoarea medie echivalent cu 1 sau 100%. Calculat pentru dou serii diferite, se poate
aprecia gradul de reprezentativitate a celor dou medii. Se apreciaz mai reprezentativ acea
valoare medie pentru care coeficientul simplu de variaie este mai mic.
Parametrul abaterea medie liniar, n forma absolut sau relativ, prezint unele deficiene
deoarece nu este suficient de sensibil la abaterile mici, adugndu-se i unele inconveniente
de natur teoretic, generate de exprimarea abaterilor n valoarea absolut.
nlturarea acestor deficiene se poate realiza apelnd la un nou parametru privind msurarea
variaiei, numit abatarea medie ptratic.




Abaterea medie ptratic

Acest indicator este utilizat att pentru caracterizarea gradului de reprezentativitate a valorii
medii ct i n scopul estimrii unor parametri necunoscui.
Abaterea medie ptratic, notat cu
x
, se definete ca fiind media ptratic a abaterilor
valorilor variabilei X, de la valoarea medie X , adic:
38
2
) ( X X M
x
= (2.38)
Un calcul intermediar n aflarea acestui parametru, l constituie calcularea ptratului abaterii
medii ptratice, care se numete dispersie sau varian i are urmtoarea expresie de calcul:
) ( ) (
2 2 2
X D X X M
x
= = (2.39)
V(x) reprezint o alt notaie pentru varian, pe lng
2
x
.
Variana fiind un calcul intermediar n aflarea abaterii medii ptratice, n cele ce urmeaz se
va prezenta modul de calcul al acesteia.
Relaia de calcul a varianei se particularizeaz n raport cu tipul seriei. n cazul unei serii care
are la baz o variabil X discret, conform definiiei, variana are expresia:

=
=

=
R
i
i
i
R
i
i
x
N
N X x
1
2
1 2
) (
(2.40)
n cazul unei serii care are la baz o variabil X continu, variana se calculeaz conform
urmtoarei relaii:
( ) dx x f X x
R
x
x
x
=

) (
1
2
2
(2.41)
a crei aplicare presupune cunoaterea densitii de repartiie f(x).
Pentru o serie dat, variana calculat nu are interpretare, dar dac se extrage rdcina ptrat
din acesta se obine un numr care se exprim n aceleai uniti de msur ca i variabila de
la baza seriei. Acest numr (valoare) reprezint abaterea medie ptratic, simboliznd cu ct
se abate n medie n plus sau minus orice valoare x
i
a variabilei X de la valoarea medie X .
Parametrul abaterea medie ptratic se poate exprima i sub form relativ, caz n care se
numete coeficientul de variaie a lui Pearson, i se noteaz cu V
x
. Expresia de calcul este:
100 =
X
V
x
x

(2.42)
i reprezint abaterea medie a orcrei valori a variabilei X de la valoarea medie, considerat
egal cu 1 sau 100.
Coeficientul de variaie a lui Pearson calculat pentru dou sau mai multe serii, poate fi folosit
n aprecieri comparative privind gradul de reprezentativitate a valorii medii calculate.
Deoarece gradul de reprezentativitate a valorii medii este n raport invers cu mrimea
coeficientului de variaie a lui Pearson, se poate afirma, n cazul mai multor serii, c este mai
reprezentativ valoarea medie a acelei serii pentru care V
x
este mai mic.
n concluzie, trebuie reinut c parametrul abaterea medie ptratic sub form absolut
x
i
sub form relativ V
x
sunt indicatori fundamentali utilizai n msurarea variaiei unei
variabile.
Att abaterea medie liniar, ct i abaterea medie ptratic constituie o msur a variaiei
medii, primul o medie de ordinul unu, iar al doilea o medie de ordinul doi ) (
x x
d .

39
2.3.2. Parametrii variaiei n raport cu valoarea median

Abaterea interquartil

Abaterea interquartil, prin definiie, este media aritmetic simpl a segmentelor M
e
Q
1
i
Q
3
M
e
, respectiv:
2 2
1 3 3 1
Q Q M Q Q M
Q
e e

=
+
= (2.43)
i arat cu ct se abat n medie, n plus sau n minus, de la median, cele 50% din valorile
variabilei cuprinse ntre Q
1
i Q
3
.
Forma relativ a acestui indicator notat cu Q
r
:
100
2
100
1 3

= =
e e
r
M
Q Q
M
Q
Q (2.44)
se numete coeficient de variaie interquartilic i arat cu ct se abat n medie de la median
(considerat egal cu 100), valorile variabilei nregistrate pentru cele 50% din unitile
populaiei cuprinse ntre Q
1
i Q
3
.
Ca atare, se apreciaz c mprtierea unitilor n cadrul populaiei studiate este cu
att mai mare, n raport cu variabila de studiat, cu ct abaterea interquartil n valoarea
absolut (2.43) sau relativ (2.44) este mai mare.

Abaterea interquantil

Pentru acest parametru, sub form absolut, avem:
2 2
1 1 1 1
q q q M M q
q
n e e n

=
+
=

(2.45)
iar sub form relativ denumit i coeficient de variaie interquantilic este:
100
2
100
1 1

= =

e
n
e
r
M
q q
M
q
q (2.46)
Cu ct abaterea interquantilic (relativ sau absolut) este mai mic, cu att valoarea median
este mai reprezentativ.

2.4. Parametrii concentrrii

Energia informaional

Acest parametru a fost introdus de Acad. Octav Onicescu. Prin definiie:

=
=
R
i
i
f E
1
2

40
unde s-a notat cu E energia informaional. Este un parametru utilizat n cazul n care seria are
la baz o variant nenumeric.
n cazul unei populaii caracterizat de un grad de concentrare maxim, va exista o
clas care va avea frecvena relativ egal cu 1, iar celelalte vor avea frecvenele relative 0 i
ca urmare: E
max
= 1.
Dac populaia este caracterizat de o concentrare minim, atunci:

R R R
x x x
X
R
/ 1 ... / 1 / 1
...
:
2 1

iar

R R
R E
1 1
2
min
= =
Se observ c:
1
1
E
R

Forma relativ a acestui parametru, notat cu E
r
, se deduce astfel:
R
R
f
R
R
E
E
R
i
i
r
1
1
1
1
1
1
1
2

=

de unde:
1 0
r
E
Referitor la populaia dat, studiat n raport cu o variabil X, se calculeaz E
r
, iar dac:
- E
r
se apropie de 1, atunci populaia respectiv este caracterizat de un grad nalt de
concentrare;
- E
r
se apropie de 0, populaia n cauz se caracterizeaz printr-o concentrare minim.

2.5. Parametrii formei
Din aplicaiile practice, precum i din alte surse, s-au constatat c graficele pot avea diverse
forme, dintre care: form de coplot, form de U, J, L sau alte forme. Ceea ce prezint
importan, nefiind surprins de nici un parametru prezentat, l constituie modul de repartizare
a valorilor variabilei de o parte i de alta a valorii medii, considerat i centrul de greutate a
seriei. Acest lucru nu nseamn altceva dect evidenierea acelei curbe care aproximeaz cel
mai bine conturul poligonal al seriei respective i n acelai timp o imagine mai clar asupra
gradului de reprezentativitate a valorii medii.
n marea majoritate a cazurilor, distribuia unitilor unei populaii se face dup un clopot
(dup legea normal a lui Gauss). Dar unittile nu se distribuie uniform n jurul valorii medii,
ceea ce poate conduce la nclinaii ntr-o direcie sau alta a valorii medii. Aceast distribuire
neuniform poate conduce la cazul cnd diferite serii (diferit distribuite n jurul valorii medii)
s aib aceeai medie, acelai i totui o curb s fie mai aplatizat dect cealalt, simetric
sau mai puin simetric. Evidenierea acestor diferene poate fi realizat cu ajutorul
parametrilor formei.
41
Parametrii formei unei serii de repartiie, dup coninut, se clasific n dou grupe:
- parametrii asimetriei;
- parametrii boltirii.

2.5.1. Parametrii asimetriei

Asimetria unei serii se definete n raport cu dispunerea unitilor ntr-o parte sau alta a valorii
medii.
n acest sens, o serie de repartiie este simetric n raport cu media sa dac frecvenele
valorilor variabilei X egal deprtate de valoarea medie sunt egale ntre ele, adic:
( ) ( ) + = X X f f
oricare ar fi astfel nct X i + X s se afle printre valorile lui X.

Coeficientul de asimetrie al lui Fisher

Acest parametru se noteaz cu
3
, iar expresia sa de calcul este:


( )
3
3
3
X
X X M


= (2.47)

sau ntr-o form echivalent:
( )
( )
3
2
3
3

=
X X M
X X M

Calculnd valoarea acestui parametru, n funcie de semnul ei, avem urmtoarele cazuri:
1.
3
= 0, ceea ce nseamn c ( )
3
X X M = 0, adic suma tuturor abaterilor cu semnul minus
este egal cu suma tuturor abaterilor cu semnul plus, ridicate la puterea a treia. Ca urmare n
acest caz se poate spune c seria este simetric.
2.
3
> 0, ceea ce nseamn c ( )
3
X X M > 0. Aceasta este echivalent cu faptul c pe total
suma abaterilor cu semnul plus de la valoarea medie este mai mare dect suma abaterilor cu
semnul minus i ca urmare seria prezint o asimetrie pozitiv.
3.
3
< 0, deci ( )
3
X X M < 0. Aceasta nseamn c pe total, suma abaterilor cu semnul
minus este mai mare dect suma abaterilor cu semnul plus de la valoarea medie. O astfel de
serie se spune c reprezint o asimetrie negativ.


42
2.5.2. Parametrii boltirii

Aprecierea boltirii unei serii este util n caracterizarea gradului de reprezentativitate a valorii
medii ct i pentru compararea reprezentativitii a dou sau mai multe valori medii ce
reprezint serii diferite.
Parametrul ( )
4
X X M d o caracterizare numeric sub form absolut a gradului de boltire a
unei serii. Sub form relativ, gradul de boltire se msoar cu parametrul:

( )
4
4
4
X
X X M
B

= (2.48)
Pentru a nelege semnificaia boltirii unei serii, se consider dou serii statistice care au la
baz variabilele X i Y, iar
Y X
Y X = = ;
Mai presupunem, n plus, c cele dou distribuii au form de clopot pentru care
3X
=
3Y
,
adic ambele sunt simetrice. Dei s-ar prea c cele dou serii nu au nimic care s le
deosebeasc, totui reprezentndu-le grafic rezult dou curbe de forma:


X


Y




Y X =
Y X
=
unde graficul lui X este mai nalt, iar al celeilalte mai plat. Ca urmate, se observ c cele dou
serii nu sunt caracterizate de aceeai boltire.
Boltirea unei serii este util pentru a da o caracetrizare mai exact reprezentativitii valorii
medii.
n cazul exemplului prezentat mai sus, att mediile ct i abaterile medii ptratice sunt egale i
ca urmare, coeficientul de variaie al lui Pearson este acelai pentru cele dou serii. Deci
rezult c ambele valori medii prezint acelai grad de reprezentativitate. Cu toate acestea,
graficele celor dou serii contrazic concluzia dedus n urma comparrii celor doi coeficieni
de variaie.
Valoarea medie cea mai reprezentativ n seria n care cele mai multe uniti ale populaiei
cercetate au nregistrat valori, mai apropiate de valoarea medie. Pentru o astfel de serie,
mprtierea fa de valoarea medie fiind mic, graficul are o form mai ascuit n cazul
seriei X i mai plat n cazul seriei Y.
43
Nivelul boltirii pentru o serie oarecare dat se msoar cu ajutorul parametrului B
4
, a crui
expresie de calcul este dat de relaia (2.48). Valoarea lui B
4
pentru o distribuie normal este
egal cu 3. Pentru orice alt curb corespunztoare unei serii date i aproximat cu un clopot,
raportul ntre momentul centrat de ordinul patru i ptratul momentului centrat de ordinul al
doilea, este un numr diferit de 3, curba respectiv fiind mai ascuit sau mai plat dect curba
normal a lui Gauss.
Comparnd gradul de boltire al unei serii oarecare i gradul de boltire al clopotului lui Gauss,
Fisher a stabilit urmtoarea expresie de calcul al coeficientului boltirii, notat cu B
4

:
( )
3
4
4
'
4

=
X
X X M
B

sau: B
4

= B
4
-3
expresie cunoscut n literatura de specialitate sub denumirea de exces al seriei.
Urmtoarele cazuri sunt semnificative cu privire la aprecierea boltirii unei serii:
- dac B
4

=0 (adic B
4
= 3) atunci seria n cauz prezint aceeai boltire cu a curbei normale
(excesul este nul);
- dac B
4

> 0 (adic B
4
> 3) atunci boltirea corespunztoare curbei respective este mai nalt
i mai ascuit dect curba normal (serie leptokurtic);
- dac B
4

< 0 (adic B
4
< 3) atunci boltirea corespunztoare curbei respective este mai plat
(mai joas i mai larg) dect curba normal (serie platikurtic).
Asimetria i boltirea joac un rol nsemnat n caracterizarea formei unei serii atributive de
repartiie. Cu ajutorul parametrilor prezentai poate fi format o imagine mai clar asupra unei
serii deja construite, asupra msurii n care seria respectiv poate fi reprezentat de valoarea
sa medie.

Bibliografie:
1. Buiga, A., Metodologie de sondaj i analiza datelor n studiile de pia, Ed. Presa
Universitar Clujean, Cluj-Napoca, 2001;
2. Buiga, A., Drago C., Lazr D., Parpucea I., Todea A., Statistic I, Ed. Presa Universitar
Clujean, Cluj-Napoca, 2003;
3. Florea I., Parpucea I., Buiga A., Statistic descriptiv, Ed. Continental,
Cluj-Napoca, 1998















44
MODULUL 3

ANALIZA LEGTURILOR DINTRE VARIABILELE
UNEI REPARTIII MULTIDIMENSIONALE


Obiective
nsuirea conceptelor de corelaie si regresie si utilizarea lor n economie
Cunoaterea posibilitilor de cuantificare a intensitii legturii dintre diversele
mrimi economice
nsuirea metodelor de stabilire a unei legturi funcionale ntre variabile

Concepte de baz
Corelaia dintre variabile, coeficieni de asociere, coeficient de corelaie
Corelaia rangurilor, coeficienii lui Kendall si Spearman
Metoda celor mai mici ptrate, regresia liniar simpl
Regresia liniar multipl, regresii neliniare: hiperbolic, parabolic, exponenial

Rezultate ateptate
Dup parcurgerea acestui modul se cere studentului s stpneasc noiunile de corelaie i
regresie, s poat identifica existena unei eventuale legturi ntre dou mrimi. De asemenea
s tie msura intensitatea legturii dintre variabile, fie ele cantitative sau calitative. Se
urmrete i cunoaterea metodelor de modelare funcional a legturilor.

Sinteza

Ne propunem abordarea unor metode statistice caracteristice studiului seriilor
multidimensionale. Scopul acestora este de a identifica i utiliza eventualele legturi care se
pot manifesta ntre dou sau mai multe variabile. Prezinta interes: existena legturii,
intensitatea acesteia, forma funcional a legturii, parametrii i reprezentativitatea ei privind
fenomenul cercetat. Problematica legturilor dintre variabile este foarte curent ntlnit n
economie. Spunem c salariul unui angajat este n funcie de productivitatea muncii sale,
vechimea n munc, responsabilitatea activitii sale, etc ; sau cererea dintr-un produs este n
funcie de preul produsului, venitul consumatorilor, etc. De fiecare dat, att n teoria
economic, ct i n aplicaii se ntlnete expresia fie funcia cererii. n realitatea
economic ns, aceast funcie nu se d, nu se cunoate, ci trebuie estimat pornind de la o
baz de date. Aceast problem de estimare a unei funcii i alte probleme colaterale ei fac
obiectul acestui capitol.
Pentru a putea aborda studiul legturilor dintre variabile trebuie s tim n primul rnd
dac exist sau nu o legtur ntre variabilele studiate (sau ntre fenomenele pe care acestea le
reprezint) i care este natura acestora. Putem clasifica legturile dinte variabile astfel :
1. Legtura nul. Semnific lipsa oricrei legturi ntre dou sau mai multe fenomene
sau variabile care cuantific fenomenele. De exemplu, o legtur nul se manifest ntre
nlimea unui angajat i salariul acestuia sau ntre produsul intern brut al unei ri i vrsta
primului ministru. Din punct de vedere statistic, spunem c ntre dou variabile X i Y exist o
legtur nul, sau nu exist legtur, dac 0 ) , cov( = y x .
2. Legtura determinist. Spunem c ntre variabilele X i Y exist o legtur
determinist dac unei valori a lui X i corespunde o singur valoare a lui Y. Astfel de legturi
45
se ntlnesc n special n fizic, unde de exemplu viteza este egal cu distana mprit la
timp: t d v / = , sau fora este egal cu masa nmulit cu acceleraia: a m F = . Astfel de
exemple exist i n economie, unde rata profitului este egal cu profitul mprit la cifra de
afaceri: % 100 . . / = A C r

. Legtura este determinist pentru c variabila

r este perfect
determinat de celelalte dou: i . .A C Adic pentru o anumit valoare a profitului i o
anumit valoare a cifrei de afaceri nu putem avea dect o singur valoare a ratei profitului.
3. Legtura statistic. Se mai numete i stocastic sau probabilist. Este tipul de
legtur cel mai des ntlnit n tiinele sociale, deci i n economie. Fiecrei valori
i
x a
variabilei X i corespunde o distribuie de valori ale variabilei Y. Matematic, o astfel de
legtur se exprim sub forma + = ) (x f y , unde am notat prin componenta aleatoare
rezidual, datorat aciunii asupra lui Y a celorlali factori dect X. Dei s-ar putea spune c
prin luarea n considerare a tuturor factorilor care influeneaz variabila Y, legtura este
intrinsec determinist, n tiinele economice vom ntlni aproape ntotdeauna un numr foarte
mare de factori, care nu pot fi identificai i cuantificai n totalitatea lor. Asfel, funcia care l
expliciteaz pe Y are dou componente: una determnist, ) ,..., , (
2 1 n
x x x f , cuprinznd
variabilele cuantificabile de care depinde Y, i una aleatoare, , cuprinznd variabilele ce nu
au putut fi cuantificate.
Sudiul legturilor dintre variabile s-a dezvoltat ntr-o disciplin aparte, numit
econometrie. n capitolul de fa nu ne propunem deci dect o introducere n aceast
problematic, fr a aborda elemente de inferen statistic specifice acestor legturi. n
cele ce urmeaz vom prezenta cteva aspecte legate de variabile i fenomenele
reprezentate de acestea, probleme att de natura aparatului statistic utilizat, ct i de
aplicabilitatea lui n contextul economic.

Analiza legturii dintre variabilele unei repartiii multidimensionale presupune
abordarea urmtoarelor probleme, care se pot constitui i n etape ce trebuie parcurse n
demersul statistic necesar:
1. Organizarea rezultatelor observrii populaiei sau eantionului n raport cu
variabilele cercetate
2. Analiza statistic a existenei legturii
3. Analiza statistic a intensitii legturii sau a gradului de asociere dintre variabilele
observate
4. Formularea unor ipoteze cu privire la forma matematic a legturii
5. Estimarea parametrilor funciei de regresie
6. Analiza reprezentativitii funciei de regresie
Aceste etape pot fi parcurse integral sau parial, n funcie de natura variabilelor. Pentru
variabilele calitative nu vor fi parcurse (n statistica descriptiv) dect primele trei,
46
deoarece posibilitile de prelucrare sunt mai reduse. n schimb, toate cele ase etape pot fi
parcurse n cazul variabilelor cantitative.

3.1. Organizarea rezultatelor observrii populaiei sau eantionului n raport cu
variabilele cercetate

n scopul utilizrii facile a informaiei culese la nivelul populaiei sau eantionului,
rezultatele observrii vor fi sistematizate ntr-o form convenabil prelucrrii lor. Se
prefer de obicei o form tabelar a prezentrii, care poate sugera unele idei de lucru
pentru etapele urmtoare, prin unele remarci cu privire la valorile pe care le-au nregistrat
variabilele.


3.2. Analiza statistic a existenei legturii

n studiul analizei existenei legturii vom folosi att elemente de statistic deja
abordate n capitolele anterioare, cum ar fi tabelele i graficele, ct i parametri
(coeficieni) specifici acestui capitol. Deoarece prezint particulariti distincte, vom
aborda separat problematica subcapitolului n funcie de tipul variabilelor.

3.2.1. Analiza statistic a existenei legturii pentru variabile calitative
47
Un prim instrument ce ne st la ndemn este tabelul de corelaie, un tabel cu dou
intrri, reprezentnd o repartiie bidimensional. Modul de construcie al unui astfel de
tabel se cunoate de la seriile statistice.

= =

=
I
i
J
j ij
ij ij
N
N N
1 1
2
2
) (

Ca o concluzie, distingem cele dou cazuri:
1) Dac 0
2
= nu exist legtur ntre variabile
2) Dac 0
2
>> exist legtur ntre variabile
Procedeul prezentat anterior ne permite identificarea existenei legturii dintre dou
variabile, dar nu i a intensitii acesteia. Totui, pornind de la el se pot construi
coeficieni care s ne permit i aprecierea intensitii legturii, aa cum se va vedea n
seciunile urmtoare.

3.2.2. Analiza statistic a existenei legturii pentru variabile cantitative
Aa cum s-a vzut n capitolul anterior, dac dispunem de o repartiie bidimensional,
putem descompune variana total a variabilei de explicat Y ca sum a varianelor datorate
variabilei explicative X i respectiv celorlali factori, adic:

2
/
2
/
2
X Y X Y Y
+ =
Dac nu exist legtur, adic X nu are nici o influen asupra lui Y, mediile condiionate
X Y / vor fi identice, iar dispersia lor va fi nul: 0
2
/
=
X Y
.
Putem reine deci ca regul de decizie n statistica descriptiv:
1) Dac 0
2
/
=
X Y
nu exist legtur ntre variabile
2) Dac 0
2
/
>>
X Y
exist legtur ntre variabile
48

3.3. Analiza statistic a intensitii legturii sau a gradului de asociere dintre variabilele
observate
Ca i n cazul existenei legturii, o prim apreciere a intensitii se poate face pe baza
tabelului de corelaie i a norului de puncte. Cu ct frecvenele mai mari sunt mai grupate
n jurul uneia din diagonalele tabelului de exemplu sau punctele norului sunt mai grupate
n jurul unei linii, cu att legtura este mai intens. n ceea ce privete metodele cantitative
de apreciere, ele sunt mult mai precise i ne pot oferi valori numerice ale intensitii sau
gradului de asociere. Aceste metode sunt ns diferite n funcie de tipul variabilelor i de
aceea le vom aborda separat.



3.3.1. Gradul de asociere sau intensitatea legturii dintre variabilele calitative

Coeficientul de asociere (contingen) al lui Pearson

Relaia de calcul a coeficientului este:

2
2

+
=
N
C
unde N este volumul populaiei.
- dac 0
2
= legtura este nul (lipsa legturii)
- dac ) 0,3 ; 0 (
2
legtura este de intensitate slab
49
- dac ) 0,7 ; 0,3 [
2
legtura este de intensitate medie
- dac ) 1 ; 0,7 [
2
legtura este de intensitate puternic

3.3.2. Gradul de asociere sau intensitatea legturii dintre variabilele ordinale

Coeficientul de corelaie a rangurilor al lui Kendall
Pentru a putea utiliza acest indicator toate unitile populaiei trebuie s poat fi
ordonate n raport cu variabilele pentru care cercetm intensitatea legturii. Presupunem o
populaie de volum n observat n raport cu m variabile.
Pentru a putea construi coeficientul, vom defini mai nti indicatorul de
concordan (P) i respectiv indicatorul de discordan (Q). Pe baza indicatorilor de
concordan i discordan construim coeficientul de corelaie simpl a rangurilor al lui
Kendall, definit astfel:

2
) 1 (

=
+

=
n n
Q P
Q P
Q P

n cazul unei legturi directe de intensitate maxim, P va lua valoare sa maxim,
iar Q pe cea minim, adic:
2
) 1 (
=
n n
P iar 0 = Q , deci 1 = .
n cazul unei legturi inverse de intensitate maxim, P va lua valoare sa minim,
iar Q pe cea maxim, adic: 0 = P iar,
2
) 1 (
=
n n
Q deci 1 = .
n cazul lipsei legturii, Q P = , iar 0 = .
Putem determina astfel intervalul n care va fi cuprins , respectiv 1] ; -1 [ .
Interpretarea intensitii legturii pe baza acestui coeficient se va face astfel:
50
- dac 0 > legtura este direct
- dac 0 = legtura este nul
- dac 0 < legtura este invers
- dac 0,3) ; 0 [ legtura este de intensitate slab
- dac 0,7) ; 3 , 0 [ legtura este de intensitate medie
- dac 1] ; 7 , 0 [ legtura este de intensitate puternic

Coeficientul de corelaie a rangurilor al lui Spearman
Ca i coeficientul similar propus de Kendall, i acesta se calculeaz pornind de la
tabelul de concordan a rangurilor. Ne vom folosi de diferenele
i
d dintre ranguri pentru
aceeai unitate a populaiei relativ la cele dou variabile. Coeficientul are urmtoarea
expresie:
) 1 (
6
1
2
1
2

=
n n
d
n
i
i

Limitele celor doi coeficieni sunt aceleai, la fel i interpretrile valorilor numerice.

3.3.3. Intensitatea legturii dintre variabilele cantitative

Raportul de corelaie

Folosind regula de adunare a varianelor descompunem variana total a variabilei de
explicat Y ca sum a varianelor datorate variabilei explicative X i respectiv celorlali
factori, adic:

2
/
2
/
2
X Y X Y Y
+ =
51
Variana explicit
2
/ X Y
este cu att mai mare cu ct mediile condiionate X Y / sunt mai
diferite ntre ele. Ceea ce le face s difere este numai influena lui X, deoarece am mprit
populaia n grupe avnd ca unic criteriu valorile lui X. Este firesc deci s folosim variana
explicit ca o mrime absolut a intensitii legturii dintre X i Y i ponderea varianei
explicite n variana total ca o mrime relativ. Raportul de corelaie are expresia:

tot
rez
tot
YX
V
V
V
V
R = = 1
exp

sau sub forma ei matematic:

2
2
/
2
2
/
1
Y
X Y
Y
X Y
YX
R

= =
Pentru a-i gsi limitele ne raportm la cele dou situaii extreme:
- dac nu exist legtur ntre X i Y, mediile condiionate X Y / sunt egale ntre ele,
deci 0
2
/
=
X Y
i 0 =
YX
R
- dac legtura este de intensitate maxim, nu exist influene ale altor factori dect
X asupra lui Y, nu exist variaie n cadrul grupelor, deci 0
2
/
=
X Y
i 1 =
YX
R .
n consecin, raportul de corelaie aparine intervalului 1] ; 0 [
YX
R . Interpretarea
intensitii legturii pe baza acestui coeficient se va face astfel:
- dac 0 =
YX
R legtura este nul
- dac 0,3) ; 0 [
YX
R legtura este de intensitate slab
- dac 0,7) ; 3 , 0 [
YX
R legtura este de intensitate medie
- dac 1] ; 7 , 0 [
YX
R legtura este de intensitate puternic.


3.4. Formularea unor ipoteze cu privire la forma matematic a legturii

Dac ntre dou variabile (ambele cantitative !) se constat existena unei legturi de o
anumit intensitate, ne punem problema posibilitii modelrii legturii printr-un model
matematic. O prim etap n acest demers este formularea unei ipoteze ct mai verosimile cu
privire la forma legturii. n acest scop, pe baza tabelului de corelaie construim norul statistic
i linia poligonal a mediilor condiionate ale variabilei dependente.


52





















n funcie de forma liniei frnte obinute i a poziiei punctelor norului fa de ea se
formuleaz o ipotez cu privire la forma funciei de regresie. Dac dorim s studiem o
legtur multipl, respectiv dependena lui Y fa de variabilele factoriale
n
X X X ,..., ,
2 1
atunci
pentru fiecare pereche ) , (
1
X Y , ) , (
2
X Y , ) , (
n
X Y desenm cte un nor statistic. Forma
general a variabilei Y n funcie de variabilele factoriale
n
X X X ,..., ,
2 1
se scrie:

+ = ) ,..., , (
2 1 n
X X X f Y

unde ) ,..., , (
2 1 n
X X X f reprezint funcia de regresie care aproximeaz cel mai bine forma
legturii, iar o variabil aleatoare numit rezidual, care nsumeaz efectul altor factori
dect cei luai n calcul.

3.5. Estimarea parametrilor funciei de regresie

Este o etap care se succede firesc alegerii formei funciei. n estimarea
parametrilor va trebui s inem cont de abaterea punctelor norului fa de modelul
matematic ales ) ,..., , (
2 1 n
X X X Y , datorat altor factori dect
n
X X X ,..., ,
2 1
, considerai
neeseniali, cuantificai prin variabila rezidual .
Principiul de la care se pornete n estimarea parametrilor este cel al patratelor
minime. Minimizm suma patratelor abaterilor valorilor observate ale lui Y de la nivelul
calculat prin ) ,..., , (
2 1 n
X X X Y . Condiia de minim a sumei este echivalent cu condiia de
minim a mediei:
[ ] ) ( ) ,..., , (
2
2
2 1
M X X X Y Y M
n
= minim
X
1
x

2
x
3
x

4
x
Y
1
/ x Y

2
/ x Y
3
/ x Y

4
/ x Y
53
Ecuaia ) ,..., , (
2 1 n
X X X Y care descrie legtura dintre Y i factorii de influen
n
X X X ,..., ,
2 1
se numete ecuaia de regresie. Metoda regresiei const n modelarea
legturilor statistice prin ecuaia de regresie.
Deoarece problema de minim se poate rezolva doar cunoscnd forma particular a
funciei, vom aborda estimarea parametrilor seprat, pe tipuri de funcii.

Regresia liniar

n ipoteza n care legtura dintre Y i factorii si de influen
n
X X X ,..., ,
2 1
este liniar,
ecuaia de regresie va fi de forma:
n n n
X a X a X a a X X X Y + + + =
2 2 1 1 0 2 1
) ,..., , (
Coeficienii
n
a a a a ,..., , ,
2 1 0
se numesc parametrii modelului i vor rezulta din minimizarea
urmtoarei funcii cu (n+1) necunoscute:
[ ]
2
1 1 0 1 0
) ... ( ) ,..., , (
n n n
X a X a a Y M a a a G + + + =
Condiiile de minim constau n anularea celor (n+1) derivate pariale ale funciei
) ,.., , (
1 0 n
a a a G n raport cu necunoscutele
n
a a a ,..., ,
1 0
, ceea ce conduce la urmtorul sistem
de ecuaii:


[ ]
[ ]

= + + + =

= + + + =

0 ) ... ( 2
) ,..., , (
0 ) ... ( 2
) ,..., , (
1 1 0
1 0
1 1 0
0
1 0
j n n
j
n
n n
n
X X a X a a Y M
a
a a a G
X a X a a Y M
a
a a a G

n j , 1 =
sau ntr-o form echivalent:

( )
( )

= + + +
= + + +
j n n n
n n
X Y M X X a X a a M
Y M X a X a a M
) ( ...
) ( ...
1 1 0
1 1 0
n j , 1 =

de unde rezult:

= + + +
= + + +
) ( ) ( ... ) (
) ( ) ( ... ) (
1 1 0
1 1 0
j j n n j
n n
YX M X X M a X X M a a
Y M X M a X M a a
n j , 1 =

Prin rezolvarea acestui sistem liniar de ecuaii n raport cu necunoscutele
n
a a a ,..., ,
1 0
, se
obin valorile parametrilor ecuaiei de regresie. Astfel, legtura statistic dintre Y i
54
n
X X X ,..., ,
2 1
este modelat prin aproximare cu o legtur funcional. Pentru cazul cu doi
factori
1
X i
2
X , ecuaia de regresie se scrie:

2 2 1 1 0 2 1
) , ( X a X a a X X Y + + =
iar sistemul de ecuaii devine:

= + +
= + +
= + +
) ( ) ( ) ( ) (
) ( ) ( ) ( ) (
) ( ) ( ) (
2
2
2 2 2 1 1 2 0
1 2 1 2
2
1 1 1 0
2 2 1 1 0
YX M X M a X X M a X M a
YX M X X M a X M a X M a
Y M X M a X M a a


Prin substituia lui
0
a din prima ecuaie i nlocuirea lui n celelalte, obinem:
[ ] [ ]
[ ] [ ]

= +
= +
) ( ) ( ) ( )] ( [ ) ( ) ( ) ( ) (
) ( ) ( ) ( ) ( ) ( ) ( )] ( [ ) (
2 2
2
2
2
2 2 2 1 2 1 1
1 1 2 1 2 1 2
2
1
2
1 1
X M Y M YX M X M X M a X M X M X X M a
X M Y M YX M X M X M X X M a X M X M a


Dac pentru a aduce la o form mai simpl notm cu:

[ ] ) ( ) ( ) ( )] ( [ )] ( [
j i j i j j i i ij
X M X M X X M X M X X M X M m = =

care reprezint covariaia dintre variabilele
i
X i
j
X , obinem:

= +
= +
02 22 2 12 1
01 12 2 11 1
m m a m a
m m a m a


de unde putem obine valorile parametrilor:


2
12 22 11
01 12 02 11
2
2
12 22 11
02 12 22 01
1
m m m
m m m m
a
m m m
m m m m
a

=


De aici l vom deduce i pe
0
a , care a fost substituit n prima ecuaie. Astfel,
2 1 0
, , a a a sunt valorile parametrilor modelului liniar cu trei variabile. nlocuind valorile
parametrilor n ecuaia de regresie se obine:
55

( ) ( )
( ) 0 ) (
) ( ) ( ) , (
2 2
21 20
11 10
1 1
22 20
12 10
2 1
22 21
12 11
= +
+
X M X
m m
m m
X M X
m m
m m
Y M X X Y
m m
m m

Pentru a face relaia mai accesibil, introducem matricea de variaie i covariaie:

=
22 21 20
12 11 10
02 01 00
) 3 (
m m m
m m m
m m m
M

i notnd complementul algebric al elementului
j
m
0
cu
) 3 (
oj
M , 2 , 1 , 0 = j ecuaia de regresie
devine:

( ) ( ) ( ) 0 ) ( ) ( ) ( ) , (
2 2
) 3 (
02 1 1
) 3 (
01 2 1
) 3 (
00
= + X M X M X M X M Y M X X Y M
Pentru cazul mai general al legturii liniare dintre Y i
n
X X X ,..., ,
2 1
, matricea de variaie
i covariaie este:

=
+
nn n n
n
n
n
m m m
m m m
m m m
M
...
... ... ... ...
...
...
1 0
1 11 10
0 01 00
) 1 (


iar ecuaia de regresie se poate scrie:

( ) ( ) ( ) 0 ) ( ... ) ( ) ( ) , (
) 1 (
0 1 1
) 1 (
01 2 1
) 1 (
00
= + +
+ + +
n n
n
n
n n
X M X M X M X M Y M X X Y M

Matricea de variaie i covariaie
) 1 ( + n
M este simetric n raport cu prima diagonal.
Elementele
ii
m de pe diagonala principal sunt varianele variabilelor
n
X X X Y ,..., , ,
2 1
, iar
elementele j i m
ij
, reprezint covarianele dintre variabilele corespunztoare.

Regresia liniar simpl
n cazul regresiei liniare simple, cu variabila endogen Y i factorul
1
X , matricea de
variaie i covariaie este:

56

=
11 10
01 00 ) 2 (
m m
m m
M

iar ecuaia de regresie devine:

( ) ( ) 0 ) ( ) ( ) (
1 1 10 11
= X M X m Y M X Y m

de unde l putem exprima pe ) ( X Y ca:

) ( ) ( ) (
1
11
10
1
11
10
X M
m
m
Y M X
m
m
X Y + =

de unde rezult coeficienii:


1
11
10
1
1
11
10
0
) ( ) (
X
m
m
a
X M
m
m
Y M a
=
=


Regresia parabolic

n economie sunt numeroase exemplele n care legtura dintre fenomene i deci
variabilele care le cuantific nu este liniar. Dac Y reprezint recolta la hectar dintr-un
produs agricol, iar X cantitatea de ngrminte, ne vom da seama chiar i intuitiv c o
anumit cretere a lui X nu provoac aceeai cretere a lui Y pe tot intervalul de variaie al
celor dou variabile. La valori mari ale cantitii de ngrminte, acestea provoac
saturaie sau chiar nocivitate, ducnd la o stagnare, respectiv diminuare a produciei. Alte
exemple pot fi: legtura dintre vechimea n munc i mrimea salariului, dintre cheltuielile
cu publicitatea i volumul vnzrilor, etc.
Determinarea parametrilor funciei parabolice de regresie se poate face fie aplicnd
direct funciei metoda patratelor minime, fie prin reducerea la cazul liniar prezentat
anterior. n ambele cazuri vom exemplifica pentru parabola de ordinul doi.

a) Estimarea parametrilor prin aplicarea direct a metodei patratelor minime

Ecuaia de regresie a modelului se scrie:

57
2
2 1 0
) ( X a X a a X Y + + =
Din condiia de minimizare a expresiei:

[ ]
2
2 1 0
) ( ) , , ( X Y Y M a a a G =

avem urmtoarele egaliti:


0
) , , (
0
) , , (
0
) , , (
2
2 1 0
1
2 1 0
0
2 1 0
=

a
a a a G
a
a a a G
a
a a a G


din care rezult sistemul de ecuaii:

[ ]
( ) [ ]
( ) [ ]

= + +
= + +
= + +
0 ) ( 2
0 ) ( 2
0 ) ( 2
2 2
2 1 0
2
2 1 0
2
2 1 0
X X a X a a Y M
X X a X a a Y M
X a X a a Y M


care este echivalent cu:

= + +
= + +
= + +
) ( ) ( ) ( ) (
) ( ) ( ) ( ) (
) ( ) ( ) (
2 4
2
3
1
2
0
3
2
2
1 0
2
2 1 0
YX M X M a X M a X M a
YX M X M a X M a X M a
Y M X M a X M a a


Rezolvnd acest sistem n necunoscutele
2 1 0
, , a a a , rezult parametrii ecuaiei de regresie
parabolice. n mod asemntor se poate proceda pentru orice regresie neliniar.

b) Estimarea parametrilor prin reducerea la cazul liniar
Avnd modelul parabolic de ecuaie:


2
2 1 0
) ( X a X a a X Y + + =

58
facem substituiile:


1
X X =

2
2
X X =

dup care ecuaia devine:


2 2 1 1 0 2 1
) , ( X a X a a X X Y + + =

care reprezint un model liniar cu doi factori. Elementele matricei de variaie i covariaie
vor arta astfel:


2 2 2
00
)) ( ( ) (
Y
Y M Y M m = =
) , cov( ) ( ) ( ) (
10 01
X Y X M Y M YX M m m = = =
) , cov( ) ( ) ( ) (
2 2 2
20 02
X Y X M Y M YX M m m = = =

2 2 2
11
)) ( ( ) (
X
X M X M m = =
) , cov( ) ( ) ( ) (
2 2 3
12
X X X M X M X M m = =

2 2 2 4
22
2
)) ( ( ) (
X
X M X M m = =

Problema regresiei neliniare pentru cazul unei parabole de gradul doi se reduce astfel la o
problem de regresie liniar, care se rezolv conform cazului liniar. n cazul mai general,
dac ecuaia de regresie este un polinom de gradul n:


n
n
X a X a X a a X Y + + + + = ... ) (
2
2 1 0


efectund substituiile:


n
n
X X X X X X = = = ; ... ; ;
2
2
1


obinem cazul liniar n raport cu (n+1) variabile.

Regresia exponenial
Dac ecuaia de regresie are form exponenial:

59

X
b a X Y = ) (
se ncearc aducerea la forma liniar. Mai nti se logaritmeaz ecuaia:

b X a X Y lg lg ) ( lg + =

iar apoi se fac substitiiile:


b a
a a
X Y X Z
lg
lg
) ( lg ) (
1
0
=
=
=


Rezult astfel modelul liniar simplu:

X a a X Z
1 0
) ( + =


Regresia hiperbolic

Dac ecuaia de regresie are form hiperbolic:


X
b a X Y
1
) ( + =

se face substituia:


X
X
1
1
=

de unde rezult modelul liniar:


1 1
) ( bX a X Y + =

n matricea de variaie i covariaie elementele vor fi:


2 2 2
00
)) ( ( ) (
Y
Y M Y M m = =
60

= =
X
Y
X
M Y M
X
Y M m m
1
, cov
1
) (
1
10 01


2
/ 1
2
2 11
1 1
X
X
M
X
M m =

=

Alte tipuri de regresie

n practica economic se ntlnesc frecvent i alte tipuri de funcii (unele chiar
funcii compuse). Principiul de lucru pentru estimarea parametrilor va rmne ns
ntotdeauna acelai: ncercarea de a aduce funcia la o form liniar.
Foarte des ntlnite sunt funciile de producie. Forma general a acestora este:

n
m
n
m m
n
X X X a X X X Y = ... ) ,..., , (
2 1
2 1 2 1

Printr-o astfel de funcie se definete o legtur ntre nivelul produciei Y i factorii de care
aceasta depinde: productivitatea muncii, calificarea forei de munc, gradul de nzestrare
cu capital fix, etc. Determinarea parametrilor se face prin reducere la cazul liniar prin
logaritmare:


n n n
X m X m a X X X Y lg ... lg lg ) ,..., , ( lg
1 1 2 1
+ + + =

Dac n aceast nou ecuaie facem substituiile:


n i X X
X X X Y X X X Z
i i
n n
, 1 , lg '
) ,..., , ( lg ) ,..., , (
2 1 2 1
= =
=


reducem ecuaia la una liniar multipl.

4.6. Analiza reprezentativitii funciei de regresie

Coeficientul de corelaie

Construcia lui este similar cu a raportului de corelaie, cu deosebirea c variana n
fiecare grup este calculat folosind suma patratelor abaterilor fa de valorile ajustate prin
funcia de regresie i nu fa de media grupei. Ca urmare, coeficientul de corelaie va fi
specific fiecrei funcii n parte. Expresia lui de calcul (admis aici fr demonstraie) este:
00 00
det
1
M m
M
r
YX
=
] 1 ; 0 [
YX
r
Interpretarea acestui coeficient n funcie de valorile pe care le poate lua este urmtoarea:
61
- dac ] 3 , 0 ; 0 [
YX
r funcia nu este reprezentativ pentru modelarea legturii dintre
variabile
- dac ] 7 , 0 ; 3 , 0 (
YX
r funcia are o reprezentativitate medie pentru modelarea
legturii dintre variabile
- dac ] 1 ; 7 , 0 (
YX
r funcia este foarte reprezentativ pentru modelarea legturii
dintre variabile
Aceste limite nu trebuie interpretate foarte rigid. Valorile coeficienilor este bine s fie
comparate cu ale altor coeficieni, ai altor funcii. Pentru aceeai repartiie de exemplu, pentru
funciile de regresie alese ca fiind posibilecalculm coeficienii de corelaie i l reinem pe cel
mai mare, considernd acea funcie ca fiind cea mai reprezentativ.
n cazul regresiei liniare simple, formula coeficientului poate fi adus la o form
echivalent mai simpl:

=
11 10
01 00 ) 2 (
m m
m m
M


X Y
YX
Y M X M XY M
m m
m
m m
m m
m m
m m m m
M m
M
r

=
= =

= =
) ( ) ( ) (

1
det
1
11 00
01
11 00
10 01
11 00
10 01 11 00
00 00


4.7. Corelaia parial

Prin corelaie simpl am studiat legtura liniar dintre doi factori neglijnd influena celorlali
factori, care acioneaz n acelai timp asupra variabilei endogene. n corelaia multipl am
msurat influena simultan a dou sau mai multe variabile exogene asupra celei endogene.
Ne punem ns problema de a msura influena unei variabile independente asupra celei
dependente, presupunnd celelalte variabile la un nivel constant.
Fr a recurge la demonstraii, vom da modul de calcul al coeficienilor de corelaie parial
pentru dou cazuri:
a) Cazul unei variabile dependente Y i dou variabile independente X
1
i X
2
:
- corelaia dintre Y i X
1
, neglijnd influena lui X
2
:
( ) ( )
2 2
2 1 2
2 1 2 1
2 1
1 1
X X YX
X X YX YX
X YX
r r
r r r
r


=


- corelaia dintre Y i X
2
, neglijnd influena lui X
1
:
( ) ( )
2 2
2 1 1
2 1 1 2
1 2
1 1
X X YX
X X YX YX
X YX
r r
r r r
r


=


b) Cazul unei variabile dependente Y i trei variabile independente X
1
, X
2
i X
3
:
- corelaia dintre Y i X
1
, neglijnd influena lui X
2
i X
3
:
62
( ) ( )
2 2
2 3 1 2 3
2 3 1 2 3 2 1
3 2 1
1 1
X X X X YX
X X X X YX X YX
X X YX
r r
r r r
r



=
- corelaia dintre Y i X
2
, neglijnd influena lui X
1
i X
3
:
( ) ( )
2 2
1 3 2 1 3
2 3 1 1 3 1 2
3 1 2
1 1
X X X X YX
X X X X YX X YX
X X YX
r r
r r r
r



=
- corelaia dintre Y i X
3
, neglijnd influena lui X
1
i X
2
:
( ) ( )
2 2
1 3 2 1 2
1 3 2 1 2 1 3
2 1 3
1 1
X X X X YX
X X X X YX X YX
X X YX
r r
r r r
r



=
Aceste formule ale coeficienilor de corelaie parial se pot generaliza i pentru cazul a k
variabile independente.


Probleme propuse

Problema 1

Cunoatem urmtoarea distribuie a 52 de societi comerciale cu acelai profil de activitate,
n raport cu variabilele X cheltuielile cu publicitatea (mil. lei) i Y - volumul vnzrilor (mil.
lei).

X
Y
[ 30 ; 50 ] ( 50 ; 70 ] ( 70 ; 90 ] Total
( 600 ; 800 ] 2 7 8 17
( 400 ; 600 ] 3 10 5 18
[ 200 ; 400 ] 14 2 1 17
Total 19 19 14 52

Se cere:
1) Pe baza unui grafic adecvat s se emit ipoteze privind forma posibil a funciei de
regresie.
2) n ipoteza unei forme liniare a dependenei dintre Y i X, s se calculeze parametrii
funciei de regresie.
3) S se studieze reprezentativitatea funciei de regresie pentru modelarea legturii dintre
cele dou variabile.
4) Care este valoarea medie a volumului vnzrilor pentru un nivel al cheltuielilor cu
publicitatea de 55 milioane lei ?
5) Aceleai cerine de la punctele 2, 3 i 4 pentru o form parabolic a dependenei dintre
Y i X.

Problema 2
63

Un produs a fost lansat simultan pe 13 piee. Pe aceste piee, produsul a fost propus la
preuri diferite (P), veniturile consumatorilor (V) fiind i ele diferite. Pentru fiecare piat s-
a nregistrat un anumit nivel al cererii (C), rezultatele fiind sintetizate n tabelul urmtor:

Nr.
crt.
Cerere (C) Pre (P) Venit (V)
1 15,4 1,4 620
2 3,2 5,1 530
3 4,9 2,5 490
4 10,5 1,7 800
5 8,0 1,8 630
6 5,1 3,4 410
7 7,6 2,1 670
8 11,3 1,6 920
9 14,0 3,6 990
10 6,4 3,5 320
11 13,2 1,9 520
12 8,8 1,8 700
13 12,1 1,9 730

Se cere:

1) S se formuleze ipoteze cu privire la forma legturii dintre cerere (C) i pre (P). Pentru
formele funciilor de regresie reinute ca fiind posibile, s se calculeze parametrii funciilor i
reprezentativitatea acestora.
2) Similar pentru legtura dintre cerere i venit.
3) S se calculeze parametrii funciei care modeleaz legtura liniar multipl dintre cerere i
factorii si e influen. Analizai reprezentativitatea acestei funcii n raport cu
reprezentativitatea funciilor de regresie simple. Care va fi valoarea estimat a cererii pe o
pia unde preul de vnzare va fi 3,2 iar venitul mediu al consumatorilor de 550 ?




64










Bibliografie:
1. DROSBEKE J. J., lments de statistiques , Ed. Ellipses , Bruxelles , 1988
2. BUIGA A., DRAGOS C., LAZAR D., PARPUCEA I., TODEA A., "Statistica I", Ed.
PUC, 2003
3. GOLDFARB B. , PARDOUX C. , Introduction la mthode statistique , Ed.
Dunod , Paris , 1995
4. PY B. , Statistique descriptive , Ed. Economica , 1990
5. ROGER P. , Statistique pour la gestion , Ed. Management et socit , Caen , 2000
6. TASSI P. , Mthodes Statistiques , Ed. Economica , Paris , 1991
7. WONNACOTT T.H. , WONNACOTT R.J. , Statistique. conomie-Gestion-
Sciences-Mdecine , Ed. Economica , Paris , 1991


65




























MODULUL 4
ANALIZA SI PREVIZIUNEA SERIILOR DE TIMP

Obiective
Intelegerea si aplicarea metodelor de calcul a indicilor factoriali in analiza dinamicii
indicatorilor economici;
Cuantificarea dinamicii medii a unui indicator;
Cunoasterea si utilizarea metodelor cantitative de previziune. Metoda clasica de
descompunere a unei serii de timp.
Concepte de baza
Indice al variatiei integrale, indice factorial, indice al pretului;
Nivel mediu al unei serii de timp, indice mediu, ritm mediu, diferenta medie absoluta;
Serie de timp, model dinamic, functii de tendinta, coeficientii sezonalitatii, ciclicitate
Medii mobile, previziune, erori de previziune, netezire exponentiala.

Rezultate asteptate
66
Studentul intelege notiunile de indice factorial, nivel mediu, indice mediu, ritm mediu si
stapaneste modalitatile de calcul a acestora. Utilizeaza metode cantitative in previziune; in
acest sens, identifica componentele prezente intr-o serie de timp, modeleaza si extrapoleaza
tendinta, utilizeaza adecvat o medie mobila, modeleaza componenta sezoniera si ciclica,
utilizeaza metoda netezirii exponentiale in netezire si previziune.

Sinteza

4.1. INDICII STATISTICI

4.1.1. Indicii statistici: definiii i tipologii
Studiul fenomenelor economice i sociale presupune n marea majoritate a cazurilor i
msurarea variaiei unor mrimi. Aceast variaie poate fi urmrit n timp, spaiu sau relativ
la nite categorii. Se va folosi termenul generic de stare, notndu-se cu j starea luat ca baz
de comparaie i cu k cea cercetat n raport cu aceasta. Se va nota cu Z mrimea care
constituie obiectul de studiu, variaia acesteia putnd fi exprimat att sub form absolut, ct
i relativ.
Dintre exprimrile sub form relativ un loc deosebit de important l ocup indicele
statistic. n practic variaia total a variabilei Z este datorat variaiei unor alte variabile a
cror evoluie ntre dou stri j i k influeneaz evoluia lui Z. Avem de a face, aadar, cu Z
de forma ) , , , (
2 1 m
X X X f Z K = . Un astfel de model este un model de tip determinist n care
cei m factori determin n totalitate nivelul lui Z . In cazul unui astfel de model se pot
distinge trei categorii de indici:
1) indicele variaiei totale (integrale) a mrimii Z :

( )
( ) ) ( , ), ( ), (
) ( , ), ( ), (
) (
) (
2 1
2 1 /
j X j X j X f
k X k X k X f
j Z
k Z
I
m
m j k
Z
K
K
= =
2) indici ai factorilor
i
X (individuali sau elementari):
) (
) (
/
j X
k X
I
i
i j k
X
i
=
3) indici ai variaiei partiale ale lui Z sau indici factoriali:
j k
X Z
i
I
/
/
- ne arat de cte ori s-a
modificat Z n starea k fa de starea j sub influena exclusiv a factorului
i
X .

4.1.2. Indicii factoriali
Indicii factoriali de tip Laspeyres. Acest indice este cel mai cunoscut i utilizat n practica
economic. Mai poart i denumirea de indicele preurilor. Dac se consider un co de r
produse sau bunuri, volumul valoric al acestora ( ) Z se va calcula dup relaia:

=
=
r
i
i i
q p Z
1
.
Indicele factorial al preurilor calculat prin metoda Laspeyres va avea expresia:

=
=
=
=

= =
r
i
i i
r
i
i i
i
i
r
i
i i
r
i
i i
j k
p Z
j q j p
j q j p
j p
k p
j q j p
j q k p
L I
1
1
1
1 /
/
) ( ) (
) ( ) (
) (
) (
) ( ) (
) ( ) (
) (

iar indicele factorial al cantitilor (volumului fizic), expresia:
67

=
=
=
r
i
i i
r
i
i i
j k
q Z
j q j p
k q j p
L I
1
1 /
/
) ( ) (
) ( ) (
) (
unde ) ( j p
i
i ) (k p
i
sunt preurile din perioada de baz i perioada curent, ) ( j q
i
sunt
cantitile din perioada de baz, iar
i
k msoar importana
1
produsului sau bunului i n coul
indicelui la momentul baz de comparaie.
Pentru cazul general, cnd Z depinde de m factori de influen, iar forma funciei f
este oarecare, Florea (1986) deduce o regul pentru elaborarea indicilor factoriali de tip
Laspeyres.
Indicii factoriali de tip Paasche. Acest indice a aprut tot ca un indice al preurilor,
indicele factorial de pre de tip Paasche avand expresia:

=
=
=
r
i
i i
r
i
i i
j k
p Z
k q j p
k q k p
P I
1
1 /
/
) ( ) (
) ( ) (
) ( ,
iar cel factorial al cantitilor (volumului fizic), expresia:

=
=
=
r
i
i i
r
i
i i
j k
q Z
j q k p
k q k p
P I
1
1 /
/
) ( ) (
) ( ) (
) (
Pentru o funcie oarecare f , n care mrimea Z depinde de m factori, in
Florea(1986) este prezentata o generalizare.
Indicii factoriali de tip Fisher. In 1922, I. Fisher propune o nou expresie de calcul a
indicelui preurilor. Acesta se va obine ca o medie geometric a indicilor de pre de tip
Laspeyres i Paasche, astfel:
) ( ) ( ) (
/
/
/
/
/
/
P I L I F I
j k
p Z
j k
p Z
j k
p Z
=
De aceeai manier se obine i indicele de volum:
) ( ) ( ) (
/
/
/
/
/
/
= P I L I F I
j k
q Z
j k
q Z
j k
q Z

Indicii factoriali generai prin Metoda Drumului Factorilor (MDF). Indicele factorial al
unei variabile ( )
m
X X f Z , ,
1
K = , n raport cu factorul
i
X , obinut prin MDF este dat de
relaia (Florea, 1989):
( )
( )
( )

=
k j
i
i
P P
i
m
m X
j k
X Z
dX
X X f
X X f
I
, 1
1
/
/
, ,
, , '
exp
K
K

unde ( )
k j
P P , reprezint poriunea arcului din drumul factorilor cuprins ntre punctele
( ) ) ( , ), (
1
j X j X P
m j
K i ( ) ) ( , ), (
1
k X k X P
m j
K , acest drum fiind descris de ecuaiile
parametrice ) ( , ), (
1 1

m m
X X X X = = K , fiind n general un parametru legat de timp.

Exemple. Indicii factoriali calculati prin metoda Laspeyres.


68
1. O societate hotelier dispune de 3 tipuri de locuri de cazare: camere cu un singur
pat(single), camere cu dou paturi(double) i apartamente. Numrul de camere nchiriate (X)
i tariful practicat (Y) n dou luni consecutive sunt date n tabelul urmtor:

Luna j Luna k
Tipul
camerei
X Y() X Y()
Single 80 30 110 35
Double 50 40 60 40
Apartament 20 50 25 45
Volumul valoric al ncasrilor din nchirierea camerelor (Z) se va calcula dup relaia:

=
=
3
1 i
i i
Y X Z . Indicii factoriali de tip Laspeyres vor fi:
=
+ +
+ +
= =

=
=
287 , 1
50 20 40 50 30 80
50 25 40 60 30 110
) ( ) (
) ( ) (
) (
3
1
3
1 /
/
i
i i
i
i i
j k
X Z
j Y j X
j Y k X
L I volumul valoric al
ncasrilor a crescut n luna k fa de luna j de 1,287 ori sub influena modificrii numrului
de camere nchiriate. =
+ +
+ +
= =

=
=
055 , 1
50 20 40 50 30 80
45 20 40 50 35 80
) ( ) (
) ( ) (
) (
3
1
3
1 /
/
i
i i
i
i i
j k
X Z
j Y j X
k Y j X
L I volumul
valoric al ncasrilor a crescut n luna k fa de luna j de 1,055 ori sub influena modificrii
tarifului practicat.

2. Se consider mrimea Z ca fiind profitul brut al unei societi i factorii X - veniturile
totale respectiv Y - cheltuielile totale ale aceleai societi. Modelul care leag cele trei
mrimi va fi de forma: Y X Z = . In doi ani consecutivi variabilele X i Y au nregistrat
valorile:

Variabila
Anul
1 t
t
X (mld lei)
10 12
Y (mld. Lei)
8 9

Expresiile i valorile indicilor factoriali de tip Laspeyres sunt:
- =

=


=

2
8 10
8 12
) 1 ( ) 1 (
) 1 ( ) (
) (
1 /
/
t Y t X
t Y t X
L I
t t
X Z
profitul brut a crescut n anul t fa de
anul 1 t de 2 ori sub influena modificrii veniturilor totale;
- =

=


=

5 , 0
8 10
9 10
) 1 ( ) 1 (
) ( ) 1 (
) (
1 /
/
t Y t X
t Y t X
L I
t t
Y Z
profitul brut a sczut n anul t fa
de anul 1 t de 0,5 ori sub influena modificrii cheltuielilor totale.

4.1.3. Indicii factoriali de tip Laspeyres, Paasche i Fisher prin prisma abordrii
axiomatice
Abordarea axiomatic se bazeaz pe stabilirea unor seturi de proprieti pe care un indice
statistic trebuie s le verifice (Buiga & all, 2003).

4.1.4. Principalii indici utilizai n economie
69
Indicele preurilor de consum este un indice de tip Laspeyres cu bazfixa:

= =
= =
=
= = =
n
i
t
p i
n
i i
i
n
i
i i
i i
n
i
i i
n
i
i i
t
p Z
i
I k
p
t p
q p
q p
q p
q t p
L I
1
0 /
1
1 1
1 0 /
/
) 0 (
) 0 (
) (
) 0 ( ) 0 (
) 0 ( ) 0 (
) 0 ( ) 0 (
) 0 ( ) (
) (
unde: n - reprezint numrul de mrfuri i servicii din coul indicelui;
) 0 (
i
k - reprezint structura de consum, fiind ponderea mrfii sau serviciului i
n consumul populaiei;
) 0 (
i
p i ) (t p
i
sunt preurile nregistrate de marfa sau produsul i n perioada
de baz i perioada curent;

Ponderile ) 0 (
i
k sunt obinute prin Ancheta Integrat n Gospodrii i rezult din
structura cheltuielilor medii lunare efectuate de o gospodrie pentru cumprarea mrfurilor i
plata serviciilor necesare satisfacerii nevoilor de trai; aceste ponderi se actualizeaz la
intervale de civa ani. Preurile corespunztoare celor n mrfuri i servicii din coul
indicelui se culeg lunar, n urma unei cercetri selective organizate de Institutul National de
Statistic.

Indicele produciei industriale msoar evoluia de ansamblu a preurilor produselor i
serviciilor industriale fabricate i livrate de productorii interni n perioada curent fa de
perioada de baz, n primul stadiu de comercializare a produselor sau serviciilor. ndicele
utlizat este tot un indice de tip Laspeyres.
Indicele salariilor msoar evoluia salariilor n perioada curent fa de perioada de
baz. Alturi de indicele preurilor de consum este folosit n evaluarea nivelului de trai. Se
utilizeaz, de asemenea, un indice de tip Laspeyres, care msoar variaia fondului de salarii
total ( ) Z sub influena modificrii salariilor medii
i
S corespunztoare ramurii i .
Indicii bursieri. Principalii indici bursieri se difereniaz prin mai multe elemente:
eantionarea, respectiv alegerea titlurilor din coul indicelui, reprezentativitate, modul de
calcul utilizat i natura variabilelor luate n calcul. Cei mai cunoscui i urmrii indici
bursieri, cu excepia familiei de indici Dow Jones se calculeaza ca si indici Laspeyres.

4.2. PREVIZIUNEA SERIILOR DE TIMP
n derularea activitii lor, frecvent agenii economici sunt pui n situaia de a anticipa
viitorul, iar apoi de a lua decizii n consecin. Oamenii de afaceri sunt nevoii s previzioneze
anual cifra de afaceri i alte elemente necesare ntocmirii unui plan de afaceri, investitorii sunt
interesai de profitul viitor degajat de investiie, respectiv guvernele de previziunea
consumului sau a cheltuielilor guvernamentale etc.. Obinerea rapid de previziuni utiliznd
modele cantitative de previziune este la ndemna analitilor, urmare i a softurile de statistic
accesibile i uor de exploatat.
Anticiparea, previziunea evoluiei viitoare a fenomenelor economice presupune n primul
rnd cunoaterea istoriei acestora, punerea n eviden a unor legiti privind comportamentul
lor trecut. Baza de date pe care se fundamenteaz analiza evoluiei fenomenelor n timp este
constituit din serii cronologice.

4.2.1. Indicatori medii specifici seriilor cronologice
a) Nivelul mediu (valoarea medie). Nivelul mediu reprezint nivelul teoretic atins de
indicator n condiiile n care evoluia sa ar fi constant n timp, factorii ce-i determin
evoluia ar aciona cu aceeai intensitate pe ntreaga perioad de timp analizat.
70
Modul de determinare a volumului fenomenului difer dup cum seria este de intervale
respectiv de momente.
Pentru serii cronologice de intervale nivelul mediu este:
n
y y y
Y
n
+ + +
=
...
2 1

Pentru serii cronologice de momente nivelul mediu este definit de urmtoarea relaie:

=
n
n
t
t
t
t
dt
dt t y
Y
1
1
) (
.
Daca se aproximeaz evoluia indicatorului ) (t y ca fiind liniar ntre dou momente
consecutive de timp, rezulta:

1 2 1
1 1 2
1
2 1
2
1
1
...
2 2
...
2 2

+ + +
+
+
+ +
+
+
=
n
n
n
n n
n
T T T
T
y
T T
y
T T
y
T
y
Y
relaie numit medie cronologic ponderat.
Daca nivelul indicatorului se nregistreaz la momente echidistante (
1 2 1
....

= = =
n
T T T ),
atunci relaia anterioar devine:
1
2
....
2
1 2
1

+ + + +
=

n
y
y y
y
Y
n
n

i reprezint media cronologic simpl.

b) Indicele mediu. Ritmul mediu
Pentru calculul acestui indicator se ntlnesc n literatur mai multe abordri.
Indicele mediu este parametrul modelului autoregresiv:
n t y I y
t t
y
t
,..., 3 , 2 ,
1
= + =


Utiliznd metoda celor mai mici ptrate pentru estimarea parametrului
y
I , se obine
urmtoarea expresie de calcul a indicelui mediu:


=
n
t
t
n
t
t t
y
y
y y
I
2
2
1
2
1

Metoda este ntlnit n practic sub denumirea de metoda autoregresiv.

O alta expresie de calcul, adecvat pentru indicatori ce evolueaz aproximativ
exponenial este urmatoarea:

1
1
= n
n
y
y
y
I

Ritmul mediu y R se determin pornind de la indicele mediu:
1 = y y I R sau 100 100 (%) = y y I R .

71
c) Diferena medie absolut
Expresia de calcul a diferenei medii absolute:
( )
1 1
2
1 /
2
1

=

=

n n
y y
n
t
t t
y
n
t
t t
y
sau echivalent:
1
1

=
n
y y
n
y .

4.2.2. Componentele unei serii cronologice. Modelul clasic de descompunere
O serie cronologic este o secven de observaii asupra unei variabile, ordonate dup
parametrul timp. Frecvent, msurtorile asupra variabilei sunt efectuate la intervale egale de
timp, seria cronologic fiind prezentat sub forma:

n t
y y y y
n t
Y
... ...
... ... 2 1
:
2 1

n abordarea tradiional, fluctuaiile din seriile cronologice sunt privite ca o rezultant a
suprapunerii urmtoarelor componente: tendina T, componenta ciclic C, sezonier S
respectiv rezidual E. Primele trei componente sunt considerate deterministe, sistematice,
determinate de factori cu aciune continu asupra fenomenului, n timp ce componenta
rezidual are caracter aleator fiind efectul aciunii unor factori imprevizibili, accidentali.

Modelul clasic de descompunere a seriilor cronologice este de regul:
aditiv: E S C T Y + + + = sau
multiplicativ: E S C T Y = respectiv
o combinaie mixt a componentelor seriei.

Tehnicile de analiz, in acest context, au ca obiective:
- separarea fiecrei componente i modelarea comportamentului su, respectiv
- previziunea evoluiei fiecrei componente, iar apoi compunerea acestora n scopul
obinerii de previziuni privind evoluia fenomenului Y. Principiul de la baza acestei tehnici
este descompune pentru a modela iar apoi recompune.

4.2.3. Estimarea componentei de tendin
Funcii elementare utilizate n modelarea tendinei
Cele mai uzuale funcii utilizate pentru modelarea tendinei indicatorilor din economie
sunt redate n tabelul 1..

Tabelul 1. Funcii elementare utilizate n modelarea tendinei
Tendin Forma liniarizat Diferene aprox. Constante
liniar
bt a T
t
+ =

1
1 /

=
t t
t t
y
y y
parabol
2
ct bt a T
t
+ + =

cX bt a T + + =
unde t X =
2 / 1 1 / 1 / ) 2 (
=
t t
y
t t
y
t t
y

hiperbol
t
b a T
t
1
+ =
bX a T + =
unde
t
X
1
=
1
1 /
) 1 (

=
t t
t t
ty
y t ty
72
exponenial
t
t
b a T =
Bt A Z + =
unde
b B a A
T Z
t t
ln ; ln
; ln
= =
=

1
1 /
ln
ln ln

=
t t
t t
y
y y
putere
b
t
t a T =
bX A Z + =
unde
t X a A
T Z
t t
ln ; ln
; ln
= =
=


logaritmic
t b a T
t
ln + =
bX a T + =
unde t X ln =

curba logistic
0 ,
,
1
>
+
=

c a
e
a
T
ct b
t



Stabilirea funciei adecvate pentru modelarea tendinei
n acest scop sunt utile urmtoarele precizri:
cronograma seriei iniiale sau a valorilor netezite sugereaz funciile candidate, numite
i linii posibile de tendina;
cea mai adecvat funcie pentru modelarea tendinei poate fi considerat aceea pentru
care se realizeaz minimul sumei ptratelor reziduurilor ( )
2
min


t
t t
T y ;
este adecvat tendina liniar atunci cnd diferenele absolute cu baza n lan
1
1 /

=
t t
t t
y
y y sunt aproximativ constante. De asemenea, precizri specifice n acest
sens pentru parabol, exponenial respectiv hiperbol gsim n tabelul 1.

Estimarea parametrilor tendinei. Pentru estimarea parametrilor tendinei liniare
bt a T
t
+ =
se utilizeaz metoda celor mai mici ptrate, expresiile de calcul a parametrilor a, b sunt deci
urmtoarele:

=
=


=
n
t
n
t
t
t t
Y y t t
b
1
2
1
) (
) )( (
,
t b Y a = ,
sau echivalent
.
,
)] ( [ ) (
) ( ) ( ) (
2 2
t b Y a
t M t M
Y M t M tY M
b
=

=

Seria prezint o tendin de cretere atunci cnd b > 0 respectiv de descretere dac b < 0.
Cu excepia curbei logistice, celelalte funcii neliniare din tabelul1 pot fi aduse la o form
liniarizat prin anumite substituii, respectiv prin aplicarea operaiei de logaritmare n cazul
funciei exponeniale i a funciei putere.

Exemplu. Estimarea tendinei liniare
73
Indicele lunar al preului produciei industriale pentru piaa intern, n perioada ianuarie
1999 iunie 2000 baza de comparaie 1996, a avut o tendin cresctoare:

Luna
(t)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Indice
(yt)
3.7 3.8 4.1 4.3 4.5 4.8 4.9 5.1 5.3 5.5 5.6 5.8 6.0 6.2 6.3 6.5 6.6 7.0

Cronograma seriei sugereaz prezena unei tendine liniare, peste care se suprapune o
component aleatoare de amplitudine redus:
. 18 ,..., 2 , 1 , = + + = t bt a y
t t

Parametrii tendinei se determin din relaiile:
[ ]
). ( ) (
) ( ) (
) ( ) ( ) (
2 2
t bM Y M a
t M t M
Y M t M tY M
b
=

=


Figura 1. ---- Indice pre productie industrial; ------ Tendina

Exemplificm din calculele intermediare:
5 . 9
18
18 2 1
) ( =
+ + +
=
L
t M
33 . 5
18
0 . 7 8 . 3 7 . 3
) ( =
+ + +
=
L
Y M
72 . 55
18
) 0 . 7 18 ( ) 8 . 3 2 ( ) 7 . 3 1 (
) ( =
+ + +
=
L
tY M
2 , 117
18
18 2 1
) (
2 2 2
2
=
+ + +
=
L
t M
rezultnd
. 55 . 3 5 . 9 19 . 0 33 . 5
, 19 . 0
) 5 . 9 ( 2 . 117
33 . 5 5 . 9 72 . 55
2
= =
=


=
a
b

Tendina seriei se estimeaz prin funcia de gradul nti:
, 19 . 0 55 . 3 t T
t
+ =
al crei grafic este redat n figura 1.

4.2.4. Estimarea componentelor deterministe n cazul seriilor sezoniere
74
Presupunem n acest paragraf c seria cronologic prezint tendin, sezonalitate i o
component aleatoare. Vom prezenta modul de estimare a tendinei respectiv a componentei
sezoniere.

4.2.4.1. Modelul de descompunere. Perioada componentei sezoniere
Pentru alegerea modelului de descompunere este indicat a se analiza cronograma seriei.
n general, este adecvat un model aditiv atunci cnd amplitudinea oscilaiilor este
aproximativ constant respectiv multiplicativ dac amplitudinea crete sau scade n timp.
Frecvent n practic este mai adecvat modelul multiplicativ.
Perioada componentei sezoniere, notat cu p, reprezint numrul unitilor de timp
din cadrul unui ciclu sezonier. Majoritatea seriilor sezoniere din domeniul economic au durata
unui ciclu de un an, p fiind egal cu 4 n cazul datelor trimestriale respectiv 12 n cazul datelor
lunare. Prin extensie pot fi studiate i fenomene cu durata unui ciclu mai mic de un an.



4.2.4.2. Mediile mobile
Pentru eliminarea componentei sezoniere (desezonalizarea seriei) se aplic datelor o
medie mobil de ordin p egal cu perioada componentei sezoniere.
Mediile mobile de ordin p, notate n continuare MM(p), sunt definite de urmtoare relaii:
daca p este impar 1 2 + = k p , mediile mobile de ordin p sunt
k n k k t
p
y y y y
y
k t t k t k t
t
+ + =
+ + + + +
=
+
,..., 2 , 1 ;
... ...
1
;
daca p este par k p 2 = se definesc analog
. 5 , 0 ; ... ; 5 , 1 ; 5 , 0
,
.... ...
5 , 0 5 , 0 5 , 0 5 , 1 5 , 0
+ + + =
+ + + + + +
=
+ + + + +
k n k k t
p
y y y y y
y
k t t t k t k t
t

In cazul p par, se introduc mediile mobile centrate de ordin p definite prin:
p
y y y y y
y y
y
k t k t t k t k t
t t
t
+ + +
+
+ + + + + +
=
+
=
5 , 0 ... ... 5 , 0
2
1 1
5 , 0 5 , 0
.

4.2.4.3. Estimarea tendinei n cazul seriilor cu component sezonier
n cazul seriilor sezoniere se ntlnesc preponderent n literatur doua modaliti de
estimare a tendinei:
desezonalizarea seriei iar apoi estimarea tendinei pornind de la valorile
desezonalizate (vezi 4.2.3.);
modelarea tendinei pornind de la mediile anuale.

4.2.4.4. Estimarea componentei sezoniere
Notaii: t indice pentru an (n general pentru un ciclu sezonier), variind de la 1 la n; s
indice pentru sezon, variind de la 1 la p. Modelul de descompunere a seriei are forma:
ij j ij ij
S TC y + + = respectiv
ij j ij ij
S TC y =

Metoda comparrii cu mediile mobile
n cazul modelului multiplicativ
ij j ij ij
S TC y =
75
metoda se ntlnete n literatur i sub denumire de metoda raportrii la mediile mobile i
const n urmtoarele:
calculul mediilor mobile
ij
y de ordin p egal cu perioada componentei sezoniere;
calculul rapoartelor
ij ij ij
y y S / = ce cuantific abaterea datelor observate de la tendin
- ciclu. Dac fixm indicele j (ne situm n sezonul j), aceste diferene constituie
estimaii pentru
j
S ;
determinarea unui indice mediu pentru fiecare sezon ca o medie a estimaiilor
precedente:
p j S
n
I
n
i
ij j
,..., 2 , 1 ;
1
1
1
1
=

=
,
aceasta justificndu-se prin necesitatea eliminrii efectului aleator din
ij
S . Pentru a nu
fi afectai de valorile extreme, uneori nainte de calculul mediei, aceste valori se
elimin, sau n loc de medie se ia valoarea median a estimaiilor
ij
S ;
determinarea componentei sezoniere
j
S , etap ce const ntr-o corecie adus indicilor
medii
j
I astfel nct media lor s fie 1:

=

=
p
i
i j j
I
p
I S
1
1
/ p j ,..., 2 , 1 = .
n cazul modelului aditiv
ij ij ij ij
S TC y + + =
determinarea componentei sezoniere decurge analog.

Exemplu. Estimarea componentelor deterministe n cazul seriilor sezoniere.
Datele privind evoluia trimestrial a produciei de bere din ara noastr (zeci mii hl) n
perioada 1996-2001 sunt indicate mai jos

An/Trim. I II III IV
1996 124.1 263.2 252.4 124.5
1997 130.1 280.2 260.6 151.1
1998 157.5 301.2 353.3 185.0
1999 169.7 340.0 350.9 168.7
2000 177.5 407.6 417.2 224.1


76
Figura 2. ---- Producia de bere; -- -- MM(4); ---- Tendina

a) Calculul mediilor mobile de ordin p=4
Graficul seriei indic prezena unei componente sezoniere predominante, de perioad
p = 4. Mediile mobile de ordin p = 4 sunt calculate conform relaiei de definiie a mediilor
mobile centrate. Astfel, spre exemplu:

8 . 191
4
1 . 130 5 . 0 5 . 124 4 . 252 2 . 263 1 . 124 5 . 0
4
5 . 0 5 . 0
5 4 3 2 1
3
=
+ + + +
=
=
+ + + +
=
y y y y y
y

L
7 . 194
4
2 . 280 5 . 0 1 . 130 5 . 124 4 . 252 2 . 263 5 . 0
4
5 . 0 5 . 0
6 5 4 3 2
4
=
+ + + +
=
=
+ + + +
=
y y y y y
y



. 0 . 306
4
6 . 196 5 . 0 6 . 425 3 . 385 9 . 202 1 . 224 5 . 0
4
5 . 0 5 . 0
24 23 22 21 20
22
=
+ + + +
=
=
+ + + +
=
y y y y y
y

Datele observate au fost numerotate aici n ordine cronologic y
1
, y
2
, ..., y
24
.

Mediile mobile de ordinul 4
t MM(4) t MM(4)
1 - 13 261.7
2 - 14 259.4
3 191.8 15 258.3
4 194.7 16 267.7
5 197.8 17 284.5
6 202.2 18 299.7
7 208.9 19 309.8
8 214.9 20 310.2
9 229.2 21 308.4
10 245.0 22 306.0
11 250.8 23 -
12 257.1 24 -
b) Estimarea tendinei pornind de la valorile desezonalizate
Seria mediilor mobile prezentat grafic relev o uoar tendin de cretere a produciei
de bere. Vom considera tendina liniar:
t t
bt a T + + = ,
originea de msurare a timpului trimestrul II al anului 1996, unitatea de msur un trimestru.
Astfel, pentru trimestrul III 1996 avem t = 1 .a.m.d:

t 1 2 3 ... 19 20
Valori desezonalizate (Z) 191.8 194.7 197.8 ... 308.4 306.0
[ ]
). ( ) (
,
) ( ) (
) ( ) ( ) (
2 2
t bM Z M a
t M t M
Z M t M tZ M
b
=

=

Calcule intermediare:
77
. 44 . 180 , 9 . 6
, 9 . 2884 ) ( , 5 . 143 ) ( , 9 . 252 ) ( , 5 . 10 ) (
2
= =
= = = =
a b
tZ M t M Z M t M

Tendina produciei de bere n perioada ianuarie 1996 iunie 2000 este estimat prin:
t T
t
+ = 9 . 6 44 . 180 .
c) Estimarea componentei sezoniere prin metoda raportrii la mediile mobile
Cum amplitudinea oscilaiilor crete uor n timp, cronograma seriei sugereaz luarea n
considerare a unui model multiplicativ:
ij j ij ij
S T y = ; 6 ,..., 2 , 1 = i iar 4 , 3 , 2 , 1 = j .
Datele sunt disponibile pentru 6 ani i sunt prezente aici 4 sezoane. innd seama de
notaiile specifice,
ij
y reprezint nivelul produciei de bere n anul i trimestrul j. Astfel, spre
exemplu 4 . 252
; 1996 13
= =
III
y y sau 0 . 185
; 1998 34
= =
IV
y y . Mediile mobile din tabelul anterior
vor fi transpuse ntr-un tabel analog cu cel de prezentare a datelor observate:
An/Trim. I II III IV
1996 - - 191.8 194.7
1997 197.8 202.2 208.9 214.9
1998 229.2 245.0 250.8 257.1
1999 261.7 259.4 258.3 267.7
2000 284.5 299.7 309.8 310.2
2001 308.4 306.0 - -
Rapoartele 100 =
ij
ij
ij
y
y
S , respectiv mediile acestora pentru fiecare sezon sunt indicate n
tabelul urmator
Calculul indicilor sezonalitii
An/Trim. I II III
INVE
STI(I
E

1996 - - 131.6 63.9
1997 65.8 138.6 124.7 70.3
1998 68.7 122.9 140.9 71.9
1999 64.8 131.1 135.8 63.0
2000 62.4 136.0 134.7 72.7
2001 65.8 125.9 - -
j
I
65.5 130.9 133.5 68.4 Media 99.6
j
S
65.6 131.4 134.0 68.8 Media 100

Explicaii privind calculele:
6 . 131 100
8 . 191
4 . 252
100
13
13
13
= = =
y
y
S , 9 . 63 100
7 . 194
5 . 124
100
14
14
14
= = =
y
y
S ,
8 . 65 100
8 . 197
1 . 130
100
21
21
21
= = =
y
y
S , .a.m.d.
Cum era de ateptat, aceste rapoarte ntre datele observate i mediile mobile sunt mai mici
dect 1 pentru trimestrele I i IV, cnd nivelul produciei a fost sistematic mai mic (sub
tendin).
, 9 . 130 , 5 . 65
4
2
51 41 31 21
1
= =
+ + +
= I
S S S S
I
78
. 4 . 68 , 5 . 133
4
4
43 33 23 13
3
= =
+ + +
= I
S S S S
I
Valoarea medie a acestor indici este 99.6, astfel c este necesar o corecie astfel nct
media s fie 100:
8 . 68 , 0 . 134 , 4 . 131 , 6 . 65 100
6 . 99
5 . 65
100
6 . 99
4 3 2
1
1
= = = = = = S S S
I
S .
Urmare a caracterului sezonier specific produciei de bere, n trimestrul I producia a
fost mai mic n medie cu 34.4% dect valorile corespunztoare de pe tendin. n trimestrul
II producia a fost n medie mai mare de 1.314 ori dect valorile de pe tendin. Analog se
interpreteaz S
3
i S
4
.
Componenta sezonier este dat de vectorul format cu indicii sezonalitii:
S=(S
1
, S
2
, S
3
, S
4
) = (0.656; 1.314; 1.340; 0.688).
4.2.5. Componenta ciclic. Componenta aleatoare
a) Componenta ciclic
Pentru separarea componentei ciclice se poate utiliza metoda comparrii cu tendina. Spre
exemplu n cazul modelului multiplicativ:
E C S T Y = ,
metoda const n calculul indicilor de ciclicitate. Astfel:
se estimeaz tendina printr-o funcie elementar. Dac seria prezint sezonalitate se
pornete de la datele desezonalizate sau de la mediile anuale;
se elimin componenta sezonier din datele observate, iar apoi se utilizeaz medii
mobile n scopul eliminrii i a componentei aleatoare rezultnd valorile netezite
t
y
(astfel C T y
t
= );
se calculeaz indicii de ciclicitate C
t
prin raportare la tendin:
t
t
t
T
y
C =
b) Componenta aleatoare:
j ij ij
ij
ij
S C T
y

= n cazul modelului multiplicativ, respectiv
) (
j ij ij ij ij
S C T y + + = n caz aditiv.

4.2.6. Previziuni utiliznd modelul de descompunere. Msurarea acurateii previziunilor
a) Previziuni utiliznd modelul de descompunere se obin prin compunerea previziunilor
realizate pentru fiecare component prezent n serie, innd seama de forma modelului:
S C T Y

+ + = respectiv S C T Y

= .
b) Msurarea acurateii previziunilor. Dac modelul elaborat conduce la previziunile
p
y y y ,..., ,
2 1
corespunztoare datelor
p
y y y ,..., ,
2 1
, pentru a msura calitatea acestuia de a
genera previziuni adecvate se utilizeaz o serie de indicatori sintetici ai erorilor de previziune,
cei mai frecvent ntlnii fiind:
- eroarea medie ptratic: ( )

=
=
p
h
h h
y y
p
MSE
1
2

1

- eroarea medie absolut:

=
=
p
h
h h
y y
p
MAE
1

1


79
- eroarea medie absolut exprimat procentual:

=
p
h h
h h
y
y y
p
MAPE
1

1


Exemplu (continuare). Previziunea produciei de bere
Tabelul urmtor conine previziunile, datele reale respectiv erorile de previziune privind
nivelul produciei de bere.

An Trim. Tendin Sezonalitate Previziune

Producie

Eroare

2001 III 325.34 1.34 435.95 425.6 -10.35
IV 332.24 0.688 228.58 196.6 -31.98
2002 I 339.14 0.656 217.9 203.2 -14.7

Prezentm modul de obinere a rezultatelor anterioare pentru trim. III an 2001. Valorile
tendinei respectiv a componentei sezoniere sunt:
T
)
(21) = 180.44 + 6.921 = 325.34 respectiv S
)
3
= 1.34.
Modelul de descompunere considerat a fost cel multiplicativ, astfel c valoarea
previzionat este:
95 . 435 34 . 1 34 . 325 = = y
)

iar eroarea de previziune aferent:
35 . 10 95 . 435 6 . 425 = = e
)

Exemplu (continuare). Previziunea indicelui lunar al preului produciei industriale.
Avnd n vedere tendina estimat privind evoluia acestui indicator:
T
t
= 3.55 + 0.19t
previziunile respectiv erorile de previziune pentru perioada Iulie - Decembrie 2000 sunt
indicate mai jos:

Luna I A S O N D
Indice y 7.40 7.66 7.96 8.26 8.47 8.65
Previziune
y
)

7.16 7.35 7.54 7.73 7.92 8.11
Eroare e
)
0.24 0.31 0.42 0.53 0.55 0.54

Pentru luna Iulie 2000 avem t = 19, extrapolarea tendinei conduce la:

19
y
)

=
19
T
)
=3.55 + 0.19 19 = 7.16
19
e
)

=
19
y -
19
y
)
= 0.24.

4.2.7. Alte metode de previziune
a) Previziuni utiliznd modele de regresie. Odat estimat i validat, un model de
regresie poate fi utilizat pentru previziunea variabilei dependente.
b) Netezirea seriei respectiv previziuni utiliznd modele de netezire exponenial
80
Varianta simpl a acestei tehnici, n care previziunile sunt obinute ca o medie ponderat
a datelor reprezentnd trecutul:
[ ]

=
1
0
1 , 0 , ) 1 ( ) (
n
j
j n
j
n
c y c c h y
este adecvat previziunii seriilor staionare.
Metoda generalizat n varianta Holt-Winters este adecvat pentru serii cu tendin i
sezonalitate, model multiplicativ. Previziunile sunt date de o funcie de previziune local
liniar, valorile de pe tendina liniar fiind corectate cu un indice sezonier aferent sezonului
pentru care se realizeaz previziunea.
Atunci cnd cronograma seriei nu ofer indicii foarte clare privind prezena respectiv
forma tendinei, este indicat a se utiliza n prealabil o tehnic de netezire ce atenueaz
amplitudinea fluctuaiilor aleatoare din serie, scopul fiind evidenierea tendinei. Tehnicile de
netezire general utilizate sunt mediile mobile sau tehnicii netezirii exponeniale.

Teme de control. Probleme propuse

Problema 1. Estimarea si extrapolarea tendintei
1.1. Indicele lunar al preului produciei industriale pentru piaa intern, n perioada ianuarie
1999 iunie 2000 baza de comparaie 1996, a avut o tendin cresctoare:

Luna (t) 1 2 3 4 5 6 7 8 9
Indice (y
t
) 3.7 3.8 4.1 4.3 4.5 4.8 4.9 5.1 5.3

Luna (t) 10 11 12 13 14 15 16 17 18
Indice (y
t
) 5.5 5.6 5.8 6.0 6.2 6.3 6.5 6.6 7.0
Se cere: a) estimarea parametrilor tendintei liniare
b) previziunea indicelui lunar al preului produciei industriale pentru urmatoarele doua luni.
1.2. Datele de mai jos redau evoluia vnzrilor dintr-un produs pe o perioad de 10 luni
consecutive:

Luna F M A M I I A S O N
Vnzri 20 32 40 47 52 60 62 63 65 67
Se cere: estimarea parametrilor parabolei de tendinta.
1.3. Populaia Romniei a crescut n perioada 1980-1988 ntr-un ritm destul de accelerat, dup
cum arat i datele de mai jos:
An 1980 1981 1982 1983 1984 1985 1986 1987 1988
Nr. pop.
(mil. Loc.)
22.20 22.35 22.48 22.55 22.62 22.72 22.82 22.94 23.15
Se cere: a) datele confirm ipoteza modelrii tendinei printr-o funcie exponenial?
b) estimarea parametrilor tendintei exponentiale;
c) previziunea populaiei Romniei pentru urmatorii cinci ani. Comparatii cu valorile reale.

Problema 2. Descompunerea si previziunea seriilor sezoniere
Datele privind evoluia trimestrial a produciei de bere din ara noastr (zeci mii hl) n
perioada 1996-2001 sunt indicate in tabelul urmtor:
An/Trim. I II III IV
1996 124.1 263.2 252.4 124.5
1997 130.1 280.2 260.6 151.1
1998 157.5 301.2 353.3 185.0
81
1999 169.7 340.0 350.9 168.7
2000 177.5 407.6 417.2 224.1
2001 202.9 385.3 425.6 196.6
Se cere: a) Estimarea tendinei pornind de la valorile desezonalizate;
b) estimarea componentei sezoniere;
c)determinarea componentei ciclice respectiv aleatoare. Descompunerea seriei pe
componente;
d) previziunea produciei de bere pentru urmatoarele patru trimestre.

Problema 3. Determinarea nivelului mediu
3.1. Populaia judeului Cluj la principalele recensminte a fost:
An 1930 1948 1956 1966 1977 1992
Nr. pop.

(mii loc.) 475.5 520 580.3 629.7 715.7 736.3
Se cere: calculul populaiei medii anuale, pe perioada 1930 1992.

3.2. Numrul navelor utilizate n transportul mrfurilor n perioada 1991-2000 a nregistrat
urmtoarea evoluie:
An 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Nr. nave 269 267 256 250 255 289 283 231 203 192
Se cere: calculul numrului mediu anual de nave utilizate in transportul marfurilor, in
perioada considerata.

Problema 4. Determinarea indicelui mediu, ritmului mediu respectiv a diferentei medii
4.1. Se cunoate populaia judeului Cluj la ultimele dou recensminte:
Recens. 5 ian 1977 7 ian 1992
Nr. pop. (mii loc.) 715.7 736.3
Se cere: indicele mediu anual. Interpretare
4.2. Producia de biciclete n Romnia a sczut dup 1989:
An 1990 1991 1992 1993 1994 1995
Prod. (mii buc.) 136 107 67 42 28 22
Se cere: a) calculul indicelui mediu prin metoda autoregresiv
b) ritmul mediu anual. Interpretare.
4.3. Fondul de locuine din ara noastr a nregistrat o cretere lent dup 1990:
An 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Fond de
loc. (mii)
7659 7683 7710 7749 7782 7811 7837 7860 7883 7907
Se cere: calculul si interpretarea diferenei medii absolute.

Problema 5. Cantitatile cumparate q respectiv preturile unitare de cumparare (mii lei) p,
pentru 3 produse aflate in consumul populatiei, in doua luni consecutive, au fost:

Luna k-1
Luna k

q p q p
Produs 1 8 kg 30 10 kg 35
Produs 2 20 buc 70 18 buc 67
Produs 3 4 litri 50 5 litri 45

Se cere: indicii factoriali ai pretului respectiv ai cantitatii prin toate metodele cunoscute.
Comparati rezultatele obtinute.
82

Problema 6. Indicele variatiei integrale si indicii variatiilor factoriale Cunoscnd seriile
cronologice cu privire la: numrul de omeri muncitori (X), numrul de omeri cu studii medii
(Y), numrul de omeri cu studii superioare (Z) din judeul Cluj n 10 luni consecutive,
respectiv:

mii persoane
luna
1 2 3 4 5 6 7 8 9 10
X 22,23 22,24 22,34 23,21 24,7 26,85 28,7 29,1 28,3 28,3
Y 3,86 3,87 3,98 4,52 4,1 4,53 4,91 5,28 6,18 6,2
W 0,396 0,395 0,419 0,437 0,357 0,406 0,455 0,487 0,5 0,5
Se cere: a) Relaia matematic ce exprim legtura dintre numrul total de omeri (Z) i X, Y,
W
b) indicii exprimnd variaia integral a numrului total de omeri, calculai cu baz fix;
c) indicii factoriali de tip Laspeyres, Paasche, Fisher afereni fiecrui factor care influeneaz
numrul total de omeri, n ultima luna fa de prima luna.

Bibliografie
1. Buiga A., Dragos C., Lazar D., Parpucea I., Statistica I, Presa Universitara Clujeana, 2003.
2. Florea I., Parpucea I., Buiga A., [1998] , Statistic descriptiv. Teorie i aplicaii, Editura
Continental, Alba Iulia, 1998.
3. Florea I., Parpucea I., Buiga A., Lazar D., [2000] , Statistic inferenial, Presa
Universitar Clujean, Cluj Napoca, 2000.
4. Melard G., Methodes des prevision a court terme, Ed. de Universite de Bruxelles, 1990.
























83


LUCRRI PRACTICE

LUCRAREA 1
P1. Dai 5 exemple de populaii statistice a cror cercetare ar prezenta interes i pentru fiecare
populaie selectat precizai:
1. denumirea populaiei, a unitii statistice i volumul acesteia;
2. scopul cercetrii statistice;
3. variabilele statistice n raport cu care s-ar face observarea statistic a populaiei.
P2. S se extrag din Anuarul Statistic sau alte surse informaionale o serie statistic
bidimensional ce red distribuia unei populaii n raport cu dou variabile atributive,
relativ la care se cere:
8. denumirea populaiei ce a fost supus observrii i volumul acesteia;
9. unitatea statistic;
10. caracterizarea variabilelor statistice n raport cu care a fost studiat populaia;
11. caracterizarea seriei statistice n raport cu toate criteriile cunoscute;
12. elaborarea seriei bidimensionale format cu frecvene relative, interpretare;
13. extragerea repartiiilor unidimensionale marginale i a celor condiionate;
14. pornind de la o repartiie marginal deducei celelalte serii statistice posibile,
interpretare.
P3. Din Anuarul Statistic sau alte surse informaionale extragei o serie statistic de repartiie,
avnd la baz o variabil de spaiu, relativ la care se cere:
6. denumirea populaiei statistice i volumului ei;
7. unitatea statistic;
8. caracterizarea seriei dup toate criteriile cunoscute;
9. deducerea seriei format cu frecvene relative;
10. interpretare.
P4. Din Anuarul Statistic sau alte surse informaionale extragei dou serii cronologice avnd
la baz indicatorul de nivel, una de momente, alta de intervale i deducei seriile formate
cu diferene absolute, indici statistici, diferene relative, cu baz fix i cu baz n lan
(interpretri).
P5. Dai 5 exemple de serii cronologice avnd la baz indicatorul relativ de intensitate.
P6. Din Anuarul Statistic sau alte surse informaionale extragei o serie de spaiu format cu
indicator de nivel sau indicator relativ de intensitate i deducei seriile formate cu
diferene absolute, indici i diferene relative, calculate cu baz fix. Interpretare.
P7. Extragei 5 exemple de serii de spaiu ce conin informaii importante pentru domeniul
economic.

LUCRAREA 2
Lund ca exemplu o populaie statistic studiat n raport cu un anumit numr de variabile
(stabilite n raport cu obiectivul studiului), se cere:
P1. Elaborarea tuturor seriilor statistice de repartiie unidimensionale
P2. Elaborarea a trei serii statistice de repartiie bidimensionale ( una are la baza dou
variabile calitative, una are la baz o variabila calitativ i o variabil cantitativ, una are
la baz dou variabile cantitative)
P3. Reprezentarea grafic a: histogramei, poligonului frecvenei, cercului de structur,
diagramei prin benzi sau coloane, norul statistic, cronograma i cartograma.


84
LUCRAREA 3
Considerm o populaie statistic din lucrrile anterioare observat n raport cu mai multe
variabile. Se cere:
1. Alegei dou variabile (una cantitativ, cealalt calitativ) i construii repartiia
populaiei n raport cu fiecare din ele;
2. Calculai i interpretai corespunztor parametrii tendinei centrale (valoarea medie,
median, modal) pentru seria care are la baz variabila cantitativ;
3. Analizai reprezentativitatea parametrilor tendinei centrale (sub form absolut i
relativ)
4. Folosind parametrii de structur analizai structura populaiei n raport cu variabila
cantitativ;
5. Analizai gradul de dispersare a unitilor populaiei n raport cu variabila cantitativ;
6. Caracterizai sintetic concentrarea unitilor din populaie folosind variabila
nenumeric;
7. Analiza statistic a asimetriei repartiiei de la punctul 1;
8. Analizai comparativ rezultatele obinute la punctele 5 i 6.


LUCRAREA 4
P1. Pentru o distribuie n raport cu dou variabile calitative ntre care se presupune c ar
putea exista vreo legtur, se cere :
1. Verificarea existenei legturii dintre cele dou variabile.
2. Dac legtura exist, ct de intens este aceasta ?

P2. Pentru o populaie observat n raport cu dou variabile cantitative ntre care ar putea
exista o legtur, se cere :
1. Aprecierea existenei i a intensitii legturii dintre variabile ;
2. S se formuleze pe baza unui grafic adecvat ipoteze cu privire la forma posibil a
funciei de regresie dintre ele ;
3. Pentru funciile reinute ca fiind posibile, s se calculeze parametrii ;
4. Care din aceste funcii este mai reprezentativa ?
5. Pentru funcia aleas s se fac cteva simulri ale valorilor previzionate prin
aceasta.

P3. Pentru o populaie observat n raport cu mai multe variabile, n care presupunem c una
din ele depinde de celelalte se cere :
1. Pe baza unui tip de grafic adecvat, s se stabileasc dac ar putea exista legtur
ntre variabila dependent i fiecare din celelalte variabile;
2. n ipoteza unei legturi liniare multiple, s se calculeze parametrii funciei;
3. S se stabileasc reprezentativitatea acestei funcii i s se compare cu
reprezentativitatea fiecreia dintre funciile liniare simple.


LUCRAREA 5
P1. Pentru trei produse, n dou luni consecutive se cunosc preul de vnzare i respectiv
cantitile vndute. Se cere :
1. Indicele variaiei integrale ;
2. Indicii factoriali ai preurilor i respectiv cantitilor vndute, prin metodele L, P,
F. Este verificat sau nu condiia de completitudine ?
85
P2. Din Anuarul Statistic al Romniei, extragei structura de consum a populaiei pentru trei
grupe de produse :
- mrfuri alimentare
- mrfuri nealimentare
- servicii
pentru dou luni consecutive. Se cere :
1. Indicii preurilor pe cele trei grupe ;
2. Calculai indicele preului (pe total) de tip L i P.

P3. Dac pentru un co bursier format din trei aciuni se cunoate :
- cursul fiecrei aciuni
- numrul de aciuni tranzacionate
s se calculeze indicele bursier.


Lucrarea 6
P1. Alegnd o serie cronologic din lucrarea 1, care manifest component de tendin, se
cere :
1. Diferena medie absolut, indicele mediu, ritmul mediu ;
2. Emiterea unor ipoteze privind forma tendinei ;
3. Estimarea parametrilor tendinei ;
4. Previziunea pentru urmtoarele trei perioade.

P2. Pentru o serie cronologic ce prezint component sezonier, se cere :
1. Cronograma i precizarea componentelor prezente ;
2. Calculul mediilor mobile de ordin p (p=perioada componentei sezoniere) ;
3. Calculul i interpretarea coeficienilor sezonalitii ;
4. Estimarea parametrilor tendinei ;
5. Previziuni pentru urmtoarele 4 perioade de timp.