Sunteți pe pagina 1din 105

UNIVERSITATEA BABE-BOLYAI, CLUJ-NAPOCA

Centrul de Formare Continu i nvmnt la Distan


Facultatea de tiine Economice i Gestiunea Afacerilor
Specializarea: Trunchi Comun
Disciplina: Statistic Descriptiv

SUPORT DE CURS
ANUL II
Semestrul 1

Cluj Napoca
2011

I. Informaii generale
1.1. Date de identificare a cursului
Date de contact ale titularilor de curs:
1. Nume: Conf. univ.dr. Anua Buiga
Birou: Birou 346 sediul Fac. de tiine Economice i Gestiunea Afacerilor,
str. Teodor Mihali 58-60
Telefon: 0264-418654
E-mail: anuta.buiga@econ.ubbcluj.ro
2. Nume: Conf.univ.dr. Drago Cristian
Birou: Birou 231 sediul Fac. de tiine Economice i Gestiunea Afacerilor,
str. Teodor Mihali 58-60
Telefon: 0264-418654
E-mail: cristian.dragos@econ.ubbcluj.ro
3. Nume: Conf.univ.dr. Dorina Lazr
Birou: Birou 527 sediul Fac. de tiine Economice i Gestiunea Afacerilor,
str. Teodor Mihali 58-60
Telefon: 0264-418654
E-mail: dorina.lazar@econ.ubbcluj.ro
4. Nume: Lect.univ.dr. Cristian Litan
Birou: Birou 231 sediul Fac. de tiine Economice i Gestiunea Afacerilor,
str. Teodor Mihali 58-60
Telefon: 0264-418654
E-mail: cristian.litan@econ.ubbcluj.ro
5. Nume: Lect.univ.dr. Codruta Mare
Birou: Birou 346 sediul Fac. de tiine Economice i Gestiunea Afacerilor,
str. Teodor Mihali 58-60
Telefon: 0264-418654
E-mail: codruta.mare@econ.ubbcluj.ro

MODULUL 1
Concepte de baz. Obiectul statisticii.
Observarea, sistematizarea i prezentarea seriilor statistice.

Obiective

definirea unei populaii statistice, a variabilelor statistice


obinerea de informaii cu privire la fenomenul supus cercetarii
organizarea datelor i prezentarea acestora sub form de serii statistice
evidenierea structurii populaiei n raport cu variabilele observate
evidenierea evoluiei unui fenomen n timp sau spaiu
reprezentarea grafic a datelor

Concepte de baz

populaie statistic, unitate statistic, volum, eantion, variabil statistic, observare


statistic, indicator statistic, serie statistic
observare statistic, serii statistice unidimensionale i bidimensionale
reprezentarea grafic a datelor relativ la o variabil cantitativ, la o variabil calitativ
i la dou variabile

Rezultate ateptate
Cunoaterea i stpnirea noiunilor statistice de baz, cunoaterea tehnicilor de culegere,
grupare i prezentare a datelor. Utilizarea indicatorilor statistici cu scopul evidenierii
variaiei unei mrimi sau a structurii populaiei supuse studiului.

Sinteza
1. Concepte de baz
1.1. Populaia statistic
Populaia statistic reprezint mulimea elementelor simple sau complexe, de aceeai
natur, care au una sau mai multe nsuiri eseniale comune, proprii elementelor ct i
populaiei privit ca un tot unitar. [Florea I.,1998]
O populaie este finit dac include un numr determinat de elemente, dar ea poate fi
considerat drept reprezentativ pentru o populaie teoretic infinit. Ca urmare apare
necesitatea de a delimita o populaie n: coninut, spaiu i timp. Se mai denumete i
populaia univers.
Exemple de populaii statistice: mulimea persoanelor dintr-o anumit ar (localitate,
zon etc.) n anul t, mulimea gospodriilor din Romnia, la momentul t, mulimea
consumatorilor unui produs, mulimea societilor productoare sau concurente ale unui
produs, mulimea societilor distribuitoare, angajaii unei societi, etc.
Se noteaz cu majusculele de la nceputul alfabetului: A, B, C etc.
Unitatea statistic constituie elementul component, al populaiei statistice, asupra
cruia se va efectua nemijlocit observarea.

Unitatea statistic este purttorul originar de informaie sau subiectul logic al


informaiei statistice. Datorit varietii aspectelor sub care se poate prezenta n fapt, unitatea
statistic comport o definiie precis, care s exclud prin posibilitate de interpretare diferit
de ctre observatori i astfel orice eroare ce poate prejudicia valoarea investigaiei.
n exemplele citate mai sus, unitile statistice sunt: persoana, gospodria,
consumatorul, societatea productoare sau concurent, societatea distribuitoare, angajatul etc.
Se noteaz cu minusculele corespunztoare majusculei ce simbolizeaz populaia
statistic, respectiv ai, bi etc..
Volumul populaiei reprezint numrul unitilor statistice care alctuiesc populaia
statistic, Acesta poate fi finit sau infinit, n funcie de tipul populaiei care poate fi la fel
finit sau infinit.
Se noteaz cu N, iar pentru o populaie A, avem:
A : {a1, a2, ..., aN}
Eantion reprezint o submulime a unei populaii statistice, constituit dup criterii
bine stabilite. n raport cu procedeul de formare a eantionului avem eantioane aleatoare i
eantioane dirijate.
Eantionul aleator este format din unitile statistice care rezult printr-un procedeu
aleator: procedeul tragerii la sori, tabelul cu numere ntmpltoare, procedeul extragerilor
sistematice.
Eantionul dirijat este constituit pe baza unor informaii auxiliare existente la nivelul
populaiei studiate sau lsnd liber pe anchetator s aleag unitile respectnd doar realizarea
structurii eantionului n funcie de criteriile stabilite.
Se noteaz cu n.
Majoritatea studiilor au ca suport datele provenite de la nivel de eantion, de aici
importana constituirii acestuia i implicit, apelarea la inferena statistic, pentru a estima
parametrii la nivelul populaiei univers.

1.2. Variabila statistic


Variabila statistic reprezint o nsuire sau o trstur comun tuturor unitilor unei
populaii. Nivelul nregistrat de o variabil statistic la o unitate oarecare al populaiei se
numete realizare sau starea variabile. [Florea I., 1998].
n general se noteaz cu majusculele de la sfritul alfabetului, X, Y, Z etc. Dac se
noteaz cu X o variabil statistic oarecare, atunci cu x1, x2, ..., xN se vor nota strile variabilei
respective.
Variabilele statistice se clasific n raport cu natura, modul de exprimare i modul de
variaie.
a) Dup natura lor variabilele statistice pot fi atributive, de timp i de spaiu.
Variabila atributiv exprim un atribut sau nsuire esenial (alta, dect timpul
sau spaiul) unitilor populaiei;
Variabila de timp ne arat timpul n care au luat fiin unitile populaiei sau
perioada de timp n care au existat (exista);
Variabila de spaiu ne arat spaiul n care exist sau au luat natere unitile
populaiei.
b) Dup modul de exprimare a strilor deosebim:
Variabil cantitativ este variabila ale crei stri se exprim prin valori
numerice. Se mai numete i variabil metric.

Variabil calitativ este variabila ale crei stri se exprim prin cuvinte sau
coduri. Se mai numete variabil nominal (strile se exprim prin cuvinte) sau
variabil ordinal (strile se exprim prin coduri).
c) Dup modul de variaie variabila cantitativ poate fi:
Variabil discret este acea variabil care, n intervalul su de definiie
nregistreaz cel mult valori raionale, variaia are loc n salturi.
Variabil continu este acea variabil care poate lua orice valoare real din
intervalul su de variaie.
Exemple de variabile statistice relativ la populaia format din mulimea
consumatorilor unui produs:
- vrsta: variabil atributiv, cantitativ, continu
X = { x1 = [15-20) [20-30) ... }
- frecvena de cumprare: variabil atributiv calitativ
Y = { y1 - foarte rar; y2 rar, ... }
- numr de sortimente cumprate relativ la produsul analizat: variabil atributiv,
cantitativ, discret:
Z = { z1 = 1; z2 = 2, ... }
- localizarea magazinelor de unde cumpr: variabil de spaiu, calitativ
S = { s1 cartierul M sau s2 strada P1, ... }
- data ultimei cumprri a produsului analizat: variabil de timp, cantitativ
T = { t1 = 27.01.2002; t2 = 24.02.2002, ... }
Variabila aleatoare
Variabila aleatoare este variabila care poate lua orice valoare din valorile unei mulimi
finite sau infinite, cu o anumit probabilitate, rezultat dintr-o funcie asociat variabilei,
numit lege de probabilitate.
Ca i variabila statistic, variabila aleatoare n raport cu valorile sale poate fi discret
sau continu.
n timp ce o variabil aleatoare nregistreaz valori la ntmplare, variabila statistic
constituie o nsuire cert a unitilor statistice din populaie. Valorile unei variabile aleatoare
sunt probabile i n strns legtur cu un anumit experiment. Strile unei variabile statistice
nu sunt probabile, ele cuantific o trstur proprie fiecrei uniti din populaie.
1.3. Observarea statistic
Observarea statistic const n identificarea unitilor populaiei i nregistrarea
strilor variabilelor n raport cu care este studiat. Ansamblul strilor variabilelor rezultate
prin observare se numesc statistici.
Dup gradul de cuprindere a populaiei statistice, observarea statistic este de dou
feluri: total i parial.
Observarea total este acel tip de observare statistic n care are loc nregistrarea
tuturor unitilor care fac parte din populaie statistic supus studiului. Recensmntul
populaiei Romniei este un exemplu de observare total.
Observarea parial presupune observarea i nregistrarea unui anumit numr de
uniti din populaie, alese dup criterii bine definite.
n cercetarea statistic a unei populaii punctul de pornire l poate constitui fie
statistice exhaustive rezultate prin observarea populaiei univers , fie statisticile rezultate din
observarea parial a unui eantion A, n ambele cazuri scopul final fiind acelai,
respectiv obinerea de informaii la nivelul populaiei univers A.

1.4. Seria statistic


Seria statistic este o construcie care red fie distribuia unei populaii n raport cu una
sau mai multe variabile, fie variaia unei mrimi n timp, n spaiu sau de la o categorie la alta.
Seriile statistice se clasific n raport cu mai multe criterii, astfel:
1. n raport cu numrul variabilelor
Serii statistice unidimensionale, au la baz o singur variabil;
Serii statistice multidimensionale, care au la baz dou sau mai multe variabile.
2. Dup natura variabilelor deosebim:
Serii atributive, care au la baz variabile atributive;
Serii cronologice (de timp sau istorice), care au la baz variabile de timp;
Serii de spaiu sau teritoriale, care au la baz o variabil de spaiu.
3. Dup modul de exprimare a strilor variabilei deosebim:
Serii calitative, care au la baz variabile calitative;
Serii cantitative, care au la baz variabile cantitative i care dup modul de variaie
a variabilei pot fi: discrete (cnd variabila este discret) i continue (cnd variabila
este continu).
4. n raport cu natura indicatorului din care este alctuit seria, avem:
Serii de frecven sau serii de distribuie (repartiie);
Serii de variaie.
Seria statistic rednd distribuia populaiei n raport cu una sau mai multe variabile
constituie o descompunere a acesteia ntr-un numr R de clase. O astfel de serie este format
n exclusivitate din frecvene (absolute cumulate sau necumulate, relative cumulate sau
necumulate) i de aceea se numesc serie de frecven, de distribuie sau de repartiie.
Prescurtat se mai folosete i denumirea de repartiie statistic sau distribuie statistic.
Seria statistic ce red variaia unei mrimi n timp, n spaiu sau de la o categorie la
alta se numete serie de variaie.
1.4.1. Seria statistic de repartiie
Conform definiiei de mai sus, prin aceast serie se distribuie unitile unei populaii
statistice n raport cu una sau mai multe variabile.
Fie o serie statistic unidimensional avnd la baz variabila X, respectiv:

x
X : 1
N1

x2
N2

... xi
... N i

... x R

... N R

(1.1)

Ni este frecvena absolut a clasei i, i = 1, R i reprezint numrul de uniti ale


populaiei
din
clasa
pentru
care
variabila
X
a
nregistrat
valoarea
N1 + N2 + ... + NR = N.
Xi
Clasa (grupa) de uniti n raport cu o variabil reunete acele uniti din cadrul
populaiei care nregistreaz aceeai stare a variabilei sau strile variabilei aparinnd unui
anumit interval de variaie .
Ca urmare, n raport cu o variabil statistic populaia poate fi structurat ntr-un
anumit numr de clase.
De asemenea, relativ la seria statistic unidimensional avnd la baz variabila X,
poate fi format cu frecvene relative, frecvene cumulate absolute sau relative.
Fie seria X format cu frecvene relative:

x
X : 1
f1
-

x2
f2

... xi
... f i

... x R

... f R

(1.2.)

fi - ne arat ponderea unitilor din populaie care au nregistrat pentru variabila X


starea xi:
N
fi = i
i = 1, R
N

Pornind de la seria (1.1) se poate deduce seria format cu frecvene absolute


cumulate, respectiv:
x2
...
xi
...
xR
x

X: 1
(1.3)
N(x1 ) N(x 2 ) ... N(x i ) ... N(x R )
unde: N(xi) reprezint numrul de uniti din populaia studiat pentru care variabila
nregistreaz valori ce nu depesc valoarea xi.
Pornind de la seria (1.1) sau (1.2) se poate deduce seria format cu frecvene relative
cumulate, respectiv:
x2
...
xi
...
xR
x1

X :
(1.4)
FN ( x1 ) FN ( x 2 ) ... FN ( xi ) ... FN ( x R )
unde: FN(xi) - exprim ponderea unitii populaiei studiate pentru care variabila a nregistrat
valori ce nu depesc valoarea xi.
FN(xi) = f1 + f2 + ... + fi
N ( xi )
(.100)
i = 1, R
Sau
FN ( x i ) =
N

Seria statistic de repartiie bidimensional este o construcie ce red distribuia unei


populaii n raport cu dou variabile.
Astfel, fie populaia statistic A studiat n raport cu variabilele X i Y, rezultatele
observrii se pot grupa ntr-un tabel de forma urmtoare:
X

x1

x2

...

xj

...

xJ

Total

y1
y2
.
.
yi
.
.
yI

N11
N21
-

N12
N22
-

...
...
-

N1j
N2j
-

...
...
-

N1J
N2J
-

N1.
N2.
-

Ni1
-

Ni2
-

...
-

Nij
-

...
-

NiJ
-

Ni .
-

NI1

NI2

...

NIj

...

NIJ

NI.

Total

N.1

N.2

...

N.j

...

N.J

(1.5)

unde:
- Nij - reprezint numrul de uniti pentru care, variabila X nregistreaz starea xj i variabila
Y nregistreaz starea yi ;
- Ni. - numrul de uniti pentru care Y = yi, indiferent de nivelul nregistrat de variabila X;

- N.j - numrul de uniti pentru care X = xj, indiferent de nivelul nregistrat de variabila Y;
- N - numrul total de uniti analizate.
Din seria bidimensional se pot extrage serii unidimensionale de forma urmtoare:

x1
X :
N .1

x2
N .2

y
Y : 1
N 1.

y 2 ... y i ... y I

N 2. ... N i. ... N I .

... x j
... N . j

... x J

... N . J

denumite i serii de repartiie marginale, n raport cu X i Y

y1
Y / X = x j :
N1 j

y2
N2 j

... y i
... N ij

... y I

... N Ij

j = 1, J

denumit serie de repartiie unidimensional n raport cu Y condiionat de


X = xj, numrul acestora fiind egal cu numrul de stri a variabilei X.

x1
X / Y = yi :
N i1

x2
N i .2

... x j
... N ij

... x J

... N iJ

i = 1, I

denumit serie de repartiie unidimensional n raport cu X condiionat de


Y = yi, numrul acestora fiind egal cu numrul de stri a variabilei Y.
De asemenea se poate elabora sau deduce seria de repartiie bidimensional format cu
frecvene relative, unde:
N ij
N. j
N
f ij =
f. j =
i = 1, I
j = 1, J
f i. = i.
N
N
N

1.4.2. Seria statistic de variaie


Conform definiiei seria de variaie red variaia unei mrimi, n timp, n spaiu sau de
la o categorie la alta. Ca urmare, n continuare vom vorbi de serii cronologice (au la baz o
variabil de timp), serii de spaiu (au la baz o variabil de spaiu) i serii categoriale (au la
baz variabile atributive). Cele mai des ntlnite sunt seriile cronologice i seriile de spaiu.
Seriile de variaie au la baz mrimi absolute i relative. Dup unii autori din cadrul
mrimilor absolute fac parte indicatorul de nivel i diferena absolut a unei mrimi, iar din
cadrul mrimilor relative fac parte: indicatorul relativ de intensitate, indicele statistic i
diferena relativ a unei mrimi.
Indicatorul de nivel (Y) este o mrime ce reflect nivelul unui fenomen analizat. De
exemplu: producia diferitelor produse, veniturile populaiei, suprafaa cultivat cu
principalele culturi, transportul, exportul, importul etc.
Diferena absolut a unei mrimi ( Y ) exprim diferena dintre nivelul cercetat i
nivelul baz de comparaie al mrimii analizate. Se exprim n aceeai unitate de msur n
care este cuantificat fenomenul analizat i ne arat cu ct s-a modificat acesta de la un nivel la
altul.
8

Indicele statistic al unei mrimi ( I Y ) exprim raportul dintre nivelul cercetat i nivelul
baz de comparaie al mrimii analizate. Ne arat de cte ori se modific acea mrime, de la
un nivel la altul.
Diferena relativ a unei mrimi ( RY ) exprim raportul dintre diferena absolut a
mrimii respective i nivelul baz de comparaie al acesteia. Ne arat cu ct la sut se
modific mrimea de la un nivel la altul.
Indicatorul relativ de intensitate (d) se definete ca raport ntre doi indicatori de nivel
de natur diferit i arat gradul de rspndire a fenomenului cuantificat de indicatorul de la
numrtor n raport cu fenomenul cuantificat de indicatorul de la numitor. De exemplu:
producia diferitelor culturi / ha, densitatea populaiei, producia principalelor produse /
locuitor, rata omajului etc.
Greutatea specific (g) reflect structura fenomenului analizat n raport cu strile
variabile X, de la baza seriei.

Seriile cronologice
Seria cronologic reflect evoluia n timp a unei mrimi.
Valorile variabilei ca funcie de timp pot fi fixate la un anumit moment de timp sau s
se refere la un interval de timp.
Seria cronologic de momente este o serie de observaii ordonate n timp, exprimnd
stocuri [Trebici V., 1985]. De exemplu, volumul populaiei, numr de universiti, bnci,
instituii, fonduri fixe, numrul salariailor, ntreprinderile mici i mijlocii din diferite domenii
de activitate, unitile de cazare turistic etc. ntr-o astfel de serie nsumarea mrimii analizate
nu are sens din punct de vedere al coninutului, aceasta fiind permis din considerente de
calcul, ajustri etc.
Seria cronologic de intervale este o serie de observaii ordonate n timp exprimnd
fluxuri. De exemplu: nscuii vii, divorurile, decesele, producia diferitelor culturi sau
produse, venituri, cheltuieli, producia industrial, agricol, exportul, importul etc.ntr-o astfel
de serie are sens nsumarea mrimii analizate.
Fie o serie cronologic de momente sau de intervale ce reflect evoluia n timp a
nivelului unei mrimi Y,
0 1 2 ... t ... T

Y :
(1.6)
y 0 y1 y 2 ... y t ... yT
Pornind de la aceast serie se pot deduce seriile formate cu diferene absolute, indici i
diferene relative. n funcie de modul de raportare a strilor variabilei timp t, mrimile de mai
sus se pot calcula cu baz fix (t / t0) (baza de comparaie rmne aceeai) sau cu baz n lan
(t / t-1) (baza de comparaie se schimb, fiind considerat cea precedent nivelului comparat).
Fie seriile cronologice formate cu:
- diferene absolute cu baz fix:

0 1
ty/ t0 :
1/ 0
0 y

2/ 0
y

... T

... Ty / 0

... t
... t y/ 0

t y/ 0 = y (t ) y (0)
- diferene absolute cu baz n lan

(1.7)

0 1
t y/ t 1 :
1/ 0
y

2 ...
t
...
T

2y/ 1 ... ty/ t 1 ... Ty/ T 1

(1.8)

ty/ t 1 = y (t ) y (t 1)
ntre cele dou tipuri de diferene absolute cu baza fix i cu baz n lan, exist relaii
de legtur ce ne permit exprimarea unora n funcie de celelalte. n acest context, nsumnd
diferenele absolute cu baza n lan se obin diferenele absolute cu baza fix.
ty/ 0 = 1y/ 0 + 2y/ 1 + 3y/ 2 + ... + ty/ t 1
Scznd diferenele succesive cu baz fix se obin diferenele cu baz n lan.

ty/ 0 t y1 / 0 = y (t ) y (0) y (t 1) + y (0) = y (t ) y (t 1) = ty/ t 1


Diferena absolut ne arat cu ct se modific mrimea analizat de la un moment la
altul. Se exprim n aceeai unitate de msur n care este cuantificat fenomenul studiat.
Dac fenomenul analizat se exprim valoric, atunci diferena absolut nu reflect prea
bine modificrile ce intervin, impunndu-se utilizarea mrimilor relative respective, indicele
statistic i diferena relativ.
Fie seriile cronologice formate cu:
- indici statistici cu baz fix
2 ... t
0 1
I yt / t0 :
1/ 0
2/0
Iy
... I yt / 0
1 I y
I yt / 0 =

... T

... I Ty / 0

y (t )
( x100)
y ( 0)

- indici statistici cu baz n lan


2 ...
t
...
T
0 1

I yt / t 1 :
1/ 0
2 /1
t / t 1
T / T 1

I
I
...
I
...
I
y
y
y
y

I yt / t 1 =

(1.9)

(1.10)

y (t )
( x100)
y (t 1)

ntre cele dou tipuri de indici exist urmtoarele relaii de legtur:


Fcnd produsul indicilor cu baz n lan pn la o anumit stare a variabilei t, se
obine indicele cu baz fix al clasei respective.
y (1) y (2)
y (t )
y (t )
I 1y / 0 .I y2 / 1 . ... .I yt / t 1 =
.
. ... .
=
= I yt / 0
y (0) y (1)
y (t 1) y (0)
mprind doi indici succesivi cu baz fix se obine un indice cu baz n lan:
y (t ) y (t 1)
y (t )
:
I yt / 0 : I yt 1 / 0 =
=
= I yt / t 1
y ( 0) y ( 0)
y (t 1)

10

Indicele statistic ne arat de cte ori se modific fenomenul analizat. Este mrimea cel
mai des folosit n caracterizarea evoluiei fenomenelor din economie.
Avnd ca baz de referin o serie cronologic de forma (1.7) se pot elabora serii
formate cu:
- diferene relative cu baz fix

1
0
R yt / t0 :
1/ 0
0 Ry

t/0
y

ty/ 0

y (0)

2
R

2/0
y

...
t
... R yt / 0

... T

... R Ty / 0

(1.11)

y (t ) y (0) y (t )
=
1 = I yt / 0 1
y (0)
y (0)

- diferene relative cu baz n lan

1
0
R yt / t 1 :
1/ 0
Ry

t / t 1
y

ty/ t 1
y (t 1)

2 ...
t
...
T

2 /1
t / t 1
T / T 1
Ry
... R y
... R y

= I yt / t 1 1

sau

(1.12)

I yt / t 1 .100 100

Aceast mrime la fel ca i indicele statistice, se folosete frecvent n caracterizarea


fenomenelor din economie.
Dac seria cronologic analizat este de intervale, se poate deduce seria format cu
greutatea specific:

0
g y :
g0
g (t ) =

1
g1

2
g2

... t
... g t

... T

... g T

(1.13)

y (t )
T

y(t )
t =1

Seria statistic de spaiu (teritorial)


Seria statistic de spaiu este o construcie statistic ce reflect variaia n spaiu a unei
mrimi.
Seria de spaiu prezint o importan din ce n ce mai mare, datorit dezvoltrii
sistemului informaional, a necesitii comparaiilor internaionale i a comparaiilor ntre
regiunile unei ri.
n cadrul Anuarului Statistic al Romniei exist capitole distincte de Statistic
teritorial i Statistic internaional. n capitolul de Statistic teritorial sunt cuprinse
informaii privind: populaia, fora de munc, condiii de munc, veniturile populaiei,
cheltuielile i consumul populaiei, locuine, asisten social, sntate, nvmnt, cultur,
sport, conturi naionale, rezultate i performane ale ntreprinderilor, agricultur, silvicultur,

11

industrie, transporturi, pot, telecomunicaii, turism, finane, justiie i starea infracional, pe


cele 7 regiuni i Bucureti.
La baza seriei de spaiu se gsesc att mrimi absolute (indicator de nivel, diferena
absolut), ct i mrimi relative (indicator relativ de intensitate, indicele statistic, diferena
relativ).
Fie seria statistic Z, de forma urmtoare:
s1
s 2 ... s i ... s R
s

Z : 0
Z (1) Z (2) Z (3) ... Z (i ) ... Z ( R)

(1.14)

unde:
si este o stare a variabilei ce exprim spaiul,
i = 1, R ;
Z(i) exprim o mrime (indicator de nivel sau relativ de intensitate).
Plecnd de la seria de forma (1.15) se pot deduce seriile formate cu:
- diferene absolute cu baz fix:
s1
s2
...
si
...
sR
s
(1.15)
sZ/ s0 : 0
s1 / s0
s2 / s0
si / s 0
s R / s0
Z
... Z
... Z
0 Z
sZi / s0 = Z (i ) Z (0)
- indicii statistici cu baz fix
s1
s2
s
I Zs / s0 : 0
s1 / s0
s2 / s0
IZ
0 IZ

...
si
si / s 0
... I Z

Z (i )
.(100)
Z ( 0)
- diferene relative cu baz fix
s1
s2
...
si
s
RZs / s0 : 0
s1 / s0
s 2 / s0
si / s 0
RZ
... RZ
0 RZ
si / s 0

I Zsi / s0 = Z = I Zsi / s0 100


Z (0)

... s R

... I Zs R / s0

(1.16)

I Zsi / s0 =

...
sR
(1.17)
... RZsR / s0

2. Observarea, sistematizarea i prezentarea seriilor statistice


2.1. Observarea statistic
Observarea statistic constituie prima etap n cadrul studierii fenomenelor sociale,
economice sau de alt natur, etap n care se culeg datele statistice despre fenomenul supus
cercetrii. Cercetarea fenomenelor respective presupune cunoaterea populaiei statistice n
vederea surprinderii aciunii legilor care acioneaz la nivelul acesteia. De calitatea acestei
etape, ntr-un proces de cercetare statistic, depinde i calitatea rezultatelor obinute n
celelalte faze.
Observarea statistic presupune identificarea, urmrirea i nregistrarea, dup reguli
unitare i precise, a nivelului atins de variabilele statistice studiate la unitile din care este
format populaia luat n studiu[Florea I., 1998].
Pentru asigurarea unor date, rezultate din observare, valide i pertinente se impun
cteva precizri. n primul rnd, observarea statistic presupune urmrirea i nregistrarea
unui numr mare de uniti statistice, ceea ce implic un volum mare de munc. n al doilea
rnd, pentru ca cercetarea populaiei s-i ating scopul, trebuie precizate care sunt variabilele

12

n raport cu care este studiat populaia. Variabilele statistice ce urmeaz s fie urmrite i
nregistrate la nivelul fiecrei uniti din populaie, trebuie s fie eseniale i s prezinte
interes din punct de vedere al studiului ntreprins. n al treilea rnd, trebuie stabilite criterii
exacte pentru delimitarea corect a unitilor statistice care alctuiesc populaia. i nu n
ultimul rnd, dac observarea i nregistrarea datelor este fcut de mai multe persoane este
necesar ca acestea s se alinieze unei metodologii unitare pentru a asigura corectitudinea
necesar datelor rezultate.
Observarea statistic, ca prim etap ntr-un studiu de cercetare presupune:
specificarea unitilor statistice care trebuie s fie urmrite i nregistrate, alegerea variabilelor
statistice care caracterizeaz cel mai bine populaia i care rspund obiectivului urmrit,
nregistrarea strilor variabilelor statistice considerate.
Atingerea scopului cercetrii statistice presupune rezolvarea urmtoarelor probleme
care s asigure o pregtire tiinific a observrii statistice:
- delimitarea populaiei supuse observrii;
- definirea unitilor statistice de observat;
- timpul i locul unde va avea loc observarea;
- programul observrii;
- alegerea purttorilor de informaie;
- pregtirea persoanelor ce urmeaz s fac observarea.
Fiecreia din aceste probleme trebuie s i se acorde importana cuvenit, fiindc
fiecare dintre ele conduce la o pregtire ct mai complet a observrii, de rezultatele creia
depinde corectitudinea celorlalte etape a cercetrii statistice.
Delimitarea populaiei supuse observrii fa de alte populaii statistice cu care aceasta
se afl n legtur se realizeaz prin evidenierea nsuirilor i trsturilor comune ce
caracterizeaz populaia supus studiului.
Definirea unitilor statistice de observat presupune claritate i precizie pentru a nu da
loc confuziilor. n momentul observrii trebuie cunoscut exact care sunt unitile statistice ce
trebuie nregistrate n raport cu variabilele de studiat.
Stabilirea timpului i a locului unde va avea loc observarea are importan din punct
de vedere a comparabilitii datelor rezultate din observare. Noiunea de timp a observrii are
n statistic dou accepiuni:
- momentul sau perioada la care se refer datele nregistrate (timpul de referin);
- durata observrii.
Locul observrii reprezint punctul din spaiu n care se deruleaz procesul supus
cercetrii (incinta unei ntreprinderi, a unui magazin, o localitate n cazul n care populaia o
reprezint familiile etc.).
n cadrul programului observrii statistice trebuie stabilite variabilele statistice care
urmeaz s fie studiate n populaia de cercetat. Alegerea i definirea variabilelor statistice
trebuie s fie n consens cu natura populaiei i obiectivul cercetrii statistice ntreprinse.
Variabilele statistice care fac parte din programul cercetrii trebuie s surprind aspectele
eseniale, s expliciteze fenomenul sau procesul studiat, s permit prelucrarea i
generalizarea acestora la nivelul ntregii populaii.
Alegerea purttorilor de informaie se face n funcie de volumul datelor ce urmeaz a
fi nregistrate. Purttorii de informaie reprezint suporii materiali pe care se nregistreaz
datele din observarea unitilor statistice.
Observarea statistic se poate desfura n diverse forme n raport cu: natura
proceselor social-economice de studiat, obiectivul cercetrii, formele de organizare ct i
posibilitile practice de urmrire i nregistrare a unitilor statistice din populaie.
Dup cum se tie, n raport cu gradul de cuprindere a populaiei considerate avem:
observarea total i observarea parial. Observarea total permite nregistrarea, n raport cu

13

variabilele statistice a tuturor unitilor statistice din populaie, implicnd un volum mare de
munc, antreneaz, de obicei, un numr de persoane i dureaz mult timp. Ca urmare se
creaz condiii pentru apariia de erori de observare, ceea ce va conduce la micorarea
eficienei observrii. Forma cea mai frecvent de observare total o constituie recensmntul
populaieiObservarea total se practic i n domeniul controlului tehnice de calitate, n cazul
produselor de nalt tehnicitate , aa cum ar fi: televizoare, maini de splat, frigidere,
automobile etc. Este necesar o observare total n acest caz, deoarece constatarea
defeciunilor de ctre cumprtori ar implica cheltuieli mult mai mari cu remedierea acestora
n comparaie cu organizarea unei observri totale a loturilor de produse ce urmeaz a fi
scoase pe pia.
n cazul altor produse, unde cheltuielile legate de remedierea defectelor sunt
nesemnificative, este suficient realizarea unor observri pariale prin care s se asigure c
rebuturile nu depesc un anumit procent admis. O astfel de observare, care include doar o
parte din unitile populaiei supuse studiului corespunde observrii pariale. Observarea
parial constituie o alternativ la observarea total n cazul populaiilor infinite sau chiar dac
sunt finite prin observare are loc distrugerea acestora. Avnd la baz procedeul observrii
pariale se pot evalua rezervele de iei, crbune sau alte minerale, se poate evalua masa de
material lemnos din fondul silvic a unei zone sau la nivelul ntregii ri. n general, observarea
parial se recomand n toate cazurile n care se consider mai avantajoas dect observarea
total.
Eantionul, ca rezultat al observrii pariale, presupune respectarea cu strictee a
principiului reprezentativitii, n conformitate cu care fiecare unitate statistic din populaie
general s aib aceeai ans de a face parte din eantion. Asigurarea respectrii principiului
reprezentativitii n formarea eantionului de observat permite acestora o structur foarte
apropiat cu cea a populaiilor din care sunt formate. Aceasta ne asigur, cu o anumit
probabilitate dinainte fixat, c rezultatele obinute la nivelul eantionului pot fi extinse la
nivelul ntregii populaii. n raport cu legea de probabilitate urmat de variabilele urmrite n
populaia general sunt dou tipuri de eantioane: eantioane de volum mare i eantioane de
volum redus.
Observarea statistic n raport cu procedeul folosit este de dou feluri:
- observarea direct;
- observarea indirect.
Observarea direct presupune o observare nemijlocit a unitilor din populaie, care
sunt prevzute pentru cercetare. Acest mod de observare se realizeaz printr-un contact direct
cu unitile statistice, fie prin msurare, fie prin interogare, dac unitile sunt persoane. Acest
procedeu permite observatorului perceperea nemijlocit a fenomenelor luate n studiu n
vederea msurrii nivelelor nregistrate de variabilele considerate.
Observarea indirect presupune un intermediar ntre unitile care urmeaz s fie
supuse observrii i observator. Intermediarul poate fi un document special conceput n
vederea observrii i atunci observarea este pe baz de document sau intermediarul poate fi o
alt persoan dect observatorul, caz n care avem observare prin interogare.
Suportul pentru culegerea datelor l reprezint chestionarul.
2.2. Sistematizarea i prezentarea datelor statistice
Sistematizarea constituie o etap n cadrul prelucrrii datelor statistice n vederea
prezentrii acestora sub form de serie statistic (tabele statistice).
Datele obinute ca urmare a procesului de observare statistic, n forma lor brut,
permit o caracterizare amnunit a fiecrei uniti din populaia considerat. Deoarece, datele

14

rezultate din observare se prezint sub form dezorganizat nu permit o caracterizare a


populaiei n ansamblu.
n vederea atingerii scopului cercetrii statistice ntreprinse i anume acela de a da o
caracterizare de ansamblu a populaiei considerate este necesar ca datele rezultate din
observare s fie supuse unor operaii de sistematizare i prezentare n vederea deducerii a ceea
ce este esenial, tipic i general n legtur cu populaia.
Deoarece n prelucrarea statistic primul pas l constituie prezentarea datelor observate
sub forma de serie (tabel), pentru construirea seriilor statistice se aleg variabilele care trebuie
s fie n strns dependen cu scopul cercetrii i cu natura fenomenului cercetat.
Odat precizate variabilele de la baza seriei, se tie care va fi coninutul primului ir de
date i ca urmare este elucidat criteriul n raport cu care informaiile rezultate din observare
vor fi ordonate, necunoscndu-se ns cum se face propriu-zis ordonarea i cum se
completeaz primul ir al seriei.
Operaia de stabilire a claselor presupune mprirea unitilor unei populaii n clase
distincte n raport cu una sau mai multe variabile i aranjarea claselor rezultate ntr-o anumit
ordine. n urma unei asemenea operaii, fiecare unitate trebuie s se gseasc n una i numai
una din clasele rezultate. Aceast operaie nu trebuie s conduc la pierderi de uniti,
regsindu-se ns ntr-o alt ordine dect cea dup care s-a realizat observarea.
Omogenitatea constituie o proprietate de baz pe care trebuie s o aib clasele. Se
spune c o clas este omogen dac, pentru unitile care fac parte din ea, variabila de
grupare nregistreaz variaii nesemnificative.
n cele ce urmeaz se va prezenta operaia de stabilire a claselor n cazul unei serii
unidimensionale.
Dac la baza seriei avem o variabil calitativ, atunci clasele se stabilesc n raport cu
strile acesteia. Pentru fiecare stare a variabilei se va construi o clas. Ca urmare, n acest caz,
ntr-o clas vor intra toate unitile care au nregistrat aceeai stare n timpul observrii n
raport cu variabila considerat.
n cazul unei serii care are la baz o variabil cantitativ discret (numrul strilor nu
este prea mare), clasele se stabilesc n mod asemntor ca i la variabilele calitative,
respectiv:
x 2 ... x R
x

X : 1
N 1 N 2 ... N R
n condiiile n care cercetarea populaiei presupune elaborarea unei serii care are la
baz o variabil cantitativ continu sau o variabil cantitativ discret, dar care n populaia
considerat nregistreaz un numr prea mare de stri, clasele nu se mai pot stabili cu ajutorul
strilor variabilei. Pentru asemenea cazuri, gruparea unitilor populaiei n clase se face cu
ajutorul intervalelor de grupare (variaie), fiecare interval cuprinznd un numr oarecare de
valori ale variabilei. Ca urmare, pentru o serie continu, clasele se definesc cu ajutorul
intervalelor de grupare.
Dou probleme se pun n cazul elaborrii unei serii care are la baz o variabil
cantitativ continu:
determinarea lungimii intervalelor de variaie;
stabilirea formei de scriere a intervalelor de variaie.
Determinarea lungimii intervalelor de variaie conduce la dou situaii:
serii construire cu intervale de lungime egal;
serii construite cu intervale de lungime diferite.
Stabilirea numrului de intervale de variaie trebuie s asigure satisfacerea
urmtoarelor condiii:

15

informaia care se pierde n urma operaiei de grupare s nu fie prea mare, iar
populaia s nu fie prea frmiat n raport cu variabilele de grupare;
- media aritmetic a fiecrei grupe (n raport cu valorile nregistrate) s fie ct mai
aproape de centrul intervalului de variaie respectiv;
- s nu existe grupe vide;
- reprezentarea grafic a seriei rezultate s permit conturarea unei regulariti a
fenomenului de studiat din cadrul populaiei. Trebuie remarcat c acest lucru nu
este posibil nici n cazul unui numr mic de intervale deoarece se pierd prea multe
date, nici n cazul unui numr prea mare de intervale, populaia frmindu-se
prea tare.
Statisticianul american H.A. Struges a stabilit pentru cazul n care populaia n raport
cu variabila X este normal, urmtoarea expresie:
lx =

xmax xmin
1 + 3,322 lg N

(2.1)

(1+3,322 LgN, avnd semnificaia de numr de intervale), pentru celelalte cazuri rezultatul
fiind orientativ, servind la determinarea cu aproximaie a lungimii intervalelor de variaie n
cazul n care acestea vor fi de lungime egal. n expresia de calcul a lungimii intervalelor
intervine valoarea maxim i cea minim a variabilei, ct i volumul populaiei. n urma
stabilirii lungimii intervalelor. Se elaboreaz seria de intervale de lungime egal dup cum
urmeaz:

[x ; (x + l )) ... [xmin + (k 1)lx ; (xmin + klx )) ... [xmin + (R 1)lx ; (xmin + R lx ))

X : min min x
N1
Nk
NR

dac se presupune c au rezultat R intervale, unde Nk, k = 1, R reprezint volumele claselor n


care s-a structurat populaia.
Numeroase sunt cazurile practice n care studiul unei populaii n raport cu o variabil
sau mai multe presupune mprirea domeniilor de variaie ale acestora n intervale de
lungime neegal. n asemenea cazuri nu exist o relaie de calcul n acest sens. Stabilirea
intervalelor de variaie se face n direct legtur cu variaia variabilelor i distribuirea
unitilor n raport cu acestea.
Dac la baza seriei n cauz stau dou sau mai multe variabile calitative sau cantitative
atunci clasele se stabilesc n raport cu fiecare din variabilele considerate prin strile acestora
(vezi seria 1.5), avem serii bidimensionale sau multidimensionale.
Nu este recomandat ca numrul variabilelor n raport cu care se studiaz populaia s
fie prea mare, deoarece aceasta duce la o divizare exagerat a populaiei pierzndu-se din
vedere aspectele principale.
Dup ce clasele au fost definite, are loc repartizarea unitilor populaiei n clasele
respective, folosind n acest scop un algoritm adecvat.
Pentru elaborarea i prezentarea seriilor statistice se apeleaz la pachete de programe
statistice cum ar fi: S.P.S.S. (Statistical Package for the Social Sciences), STATISTICA,
S.A.S. (Statistical Analysis System), STATGRAPHICS, etc.

2.3. Reprezentri grafice


Reprezentarea grafic a unei serii ne d o imagine geometric (n plan sau spaiu) cu
privire la forma static sau evoluia dinamic a fenomenului cuantificat de seria respectiv.

16

Graficul asociat unei serii constituie o imagine spaial a fenomenului de cercetat,


permind evidenierea rapid a structurii, dinamicii i tendinei de dezvoltare a acestuia.
Reprezentrile grafice sunt folosite att n scopul cunoaterii populaiei n cauz, ct i pentru
popularizarea unor rezultate din diverse domenii de activitate.
Elaborarea complet i corect n acelai timp a unui grafic presupune elucidarea
urmtoarelor elemente: titlul graficului, scara de reprezentare, reeaua graficului, semnele
convenionale i notele.
Titlul graficului trebuie s fie scurt, clar i semnificativ pentru coninutul
fenomenului reliefat prin seria considerat.
Scara de reprezentare reunete mulimea tuturor punctelor cotate. n cazul n care
variabila nregistreaz valori mici, gradarea scrii ncepe n principiu de la zero, dac variabila
nregistreaz valori mari se consider o alt origine stabilit cu aproximaie. Pentru a nu
ncrca prea mult desenul, se recomand reprezentarea pe scar doar a valorilor dispuse la un
anumit interval convenabil ales. Distanele dintre dou puncte cotate consecutive se numete
intervalul graficului. Cnd intervalele sunt egale atunci avem scri uniforme, n caz contrar
avem scri neuniforme.
Reeaua graficului permite identificarea cu uurin n plan sau n spaiu a punctelor
corespunztoare valorilor nregistrate de variabilele n cauz. Sistemul axelor rectangulare (n
plan sau spaiu) constituie cele mai uzuale reele n reprezentarea grafic a seriilor statistice.
Semnele convenionale se pot materializa ntr-o reprezentare grafic prin inscripii, fie
printr-o legend. Inscripia trebuie s fie scurt i semnificativ i plasat ct mai bine n
raport cu elementul din grafic pe care l expliciteaz. Legenda se folosete pentru a explicita
folosirea semnelor, culorilor sau diverselor hauri folosite n graficul n cauz. Legenda se
plaseaz nafara graficului, n colul din stnga sau dreapta jos.
n cazul graficelor complexe, pentru o nelegere mai bun, sunt necesare unele
explicaii, care se dau sub form de note. Notele generale privesc n ansamblu graficul i se
plaseaz chiar sub titlul graficului. Notele speciale privesc poriuni din grafic i sunt legate de
acestea prin diverse semne de trimitere. Notele se plaseaz n partea de jos a diagramei, n
colul din stnga sub reea.
n continuare se vor prezenta principalele tehnici de construire a graficelor utilizate n
reprezentarea seriilor statistice ce descriu fenomenele social-economice.

Histograma
Graficul specific seriilor care au la baz o variabil continu (de intervale) este
histograma. Aceasta se construiete ntr-un sistem de axe rectangulare dup cum urmeaz: pe
abscis se trec intervalele de variaie, iar pe ordonat se traseaz scara frecvenelor. Scara
frecvenelor se construiete n conformitate cu respectarea principiului proporionalitii ntre
frecvene i segmentele delimitate pe scara ordonatelor. Pentru fiecare interval de variaie a
seriei (xi-1 xi) se construiete un dreptunghi a crui baz este chiar lungimea intervalului, iar
cealalt latur se determin din condiia proporionalitii ariei dreptunghiului cu mrimea
indicatorului n clasa respectiv.
Latura necunoscut a dreptunghiului, notat cu Li se determin din urmtoarea relaie:
Li . li = k . Ni
(2.2)
unde:
li = latura cunoscut a dreptunghiului corespunztor intervalului (xi-1 - xi);
Li = latura necunoscut a dreptunghiului corespunztor intervalului (xi-1 - xi);

17

Ni = frecvena absolut a clasei i;


k = un coeficient de proporionalitate care se alege n raport cu scara de reprezentare.
Din relaia (2.2) se deduce Li:
N
Li = k i ,
i = 1, R
li
unde: li = xi - xi-1, adic diferena dintre limita superioar i cea inferioar a intervalului de
variaie.
Mulimea tuturor dreptunghiurilor astfel determinate, formeaz histograma ataat
seriei.
Poligonul frecvenelor
Este o reprezentare grafic a seriilor statistice avnd la baz o variabil atributiv
cantitativ continu i format cu frecvene absolute sau relative, simple sau cumulate.
Trasarea acesteia presupune realizarea n prealabil a histogramei. Poligonul
frecvenelor se obine unind prin segmente de dreapt mijloacele laturilor superioare ale
dreptunghiurilor, din care este alctuit histograma.
Poligonul frecvenelor este un grafic important pentru aproximarea formei distribuiei
populaiei studiate, ct i pentru compararea a dou distribuii pe aceeai diagram.
Exemplu
Din Anuarul Statistic al Romniei din anul 2000, am extras o serie de repartiie
reprezentnd populaia Romniei sub 40 de ani pe grupe de vrst .

Grupa
de vrst (ani)
04
59
10 14
15 19
20 24
25 29
30 34
35 39

Populaia
1147065
1330733
1737153
1701881
1978835
1792822
1698268
1335039

18

populatia

Distributia populatiei Romaniei sub 40 ani pe grupe de varsta

04

59

10 14

15 19

20 24

25 29

30 34

35 39

grupa de varsta (ani)

Figura 2.1 Histograma si poligonul frecventelor


Diagramele de structur
Punerea n eviden sub form grafic a structurii unei populaii statistice este posibil
apelnd la diagramele de structur. n acest sens se prezint: dreptunghiul, ptratul, cercul i
semicercul de structur. Aceste tipuri de grafice permit reprezentarea grafic a seriilor
unidimensionale construite cu mrimi de structur( frecvene relative, greutate specific).
Cel mai des folosit este cercul de structur denumit i diagrama sectorial (piechart).
Cercul de structur
Se construiete un cerc de raz oarecare a crei suprafa se consider c reprezint
volumul ntregii populaii n cauz (exprimat n frecvene absolute sau relative).
Fiecare clas n care este divizat populaia supus studiului este reprezentat printr-un
sector de cerc de arie direct proporional cu volumul clasei. Trasarea sectorului de cerc
presupune determinarea msurii n grade a unghiurilor la centru a fiecrui sector. Unghiul la
centru de 360o corespunde volumului ntregii populaii. Unghiurile sectoarelor de cerc care
reprezint clase din populaie trebuie s fie proporionale cu volumul acestora (exprimat n
frecvene absolute sau relative). Unui procent i corespunde 3,6o cu procentul corespunztor
clasei respective.
360o
i = f i (%).
(2.3)
100
Exemplu
Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz, rednd
distribuia voturilor electoratului pentru Senat (dup redistribuire) la alegerile din 3 noiembrie
1996:
Formaiunea
Politic
Voturi
Obinute (%)

CDR

PDSR

USD

UDMR

PRM

PUNR

37,0

28,7

16,1

7,7

5,6

4,9

19

Rezultatele alegerilor parlamentare pentru Senat din 3 nov 1996

5,60%

4,90%

7,70%
37%

CDR
PDSR
USD
UDMR
PRM
PUNR

16,10%

28,70%

Figura 2.2 Cercul de structura


Diagramele prin benzi (barchart)
Acest tip de grafic utilizeaz benzile (barele), pentru a reprezenta distribuia unei
populaii n raport cu o variabil cantitativ discret sau calitativ. Benzile au aceeai lime
(baz), iar lungimea (nlimea) lor este direct proporional cu frecvena clasei reprezentate.
Numrul benzilor este egal cu numrul claselor n care este mprit populaia studiat. De
asemenea se pot lua n considerare o variabil sau dou.
n reprezentri se utilizeaz benzi simple sau benzi grupate. Poziia benzilor poate fi
orizontal sau vertical.
Exemplu
Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz, rednd
nivelul PNB/loc n $ calculat pe baza puterii de cumprare n Romnia i alte ri esteuropene, n 1998
ara
PNB/loc ($)

Bulgaria
4683

Cehia
12197

Polonia
7543

20

Romnia
6153

Slovacia
9624

Ungaria
9832

PNB/loc ($) in 1998


14000
12197
12000
10000

9624

9832

Slovacia

Ungaria

7543

8000

6153
6000
4683
4000
2000
0

Bulgaria

Cehia

Polonia

Romnia

Figura 2.3 Diagram prin benzi simple

Cronograma (historiograma)
O categorie foarte important de serii o constituie seriile cronologice, a cror
reprezentare grafic se realizeaz prin cronograme. Trasarea unei cronograme se realizeaz
ntr-un sistem de axe rectangulare.
Se consider seria cronologic de forma (1.7):

0
Y :
y0

1
y1

2 ... t
y2 ... yt

... T

... yT

unde: t = 0, T , reprezint momentele (sau perioadele) de timp care se reprezint pe axa


absciselor, iar mrimile yt se reprezint pe axa ordonatelor. Fiecrei perechi de valori (t, yt),
t = 0, T i corespunde un punct n planul axelor rectangulare. Unind prin segmente de dreapt
punctele consecutive, astfel determinate, se obine ceea ce se numete cronogram.
n acelai sistem de axe pot fi reprezentate una sau mai multe serii cronologice, care
pot fi exprimate n aceeai unitate de msur sau n uniti de msur diferite. Cronogramele
asociate unor serii cronologice ne permit compararea fenomenelor surprinse de asemenea serii
i sesizarea perioadelor critice n evoluia acestora.
Exemplu.
Din Anuarul Statistic al Romniei din anul 2000 am extras seria care urmeaz, rednd
numrul total ta autoturisme nscrise n circulaie la sfritul anului n Romnia n perioada
1994-1999.

21

Anul
Autoturisme
nmatriculate

1994
2020017

1995
2197477

1996
2391869

1997
2605465

1998
2822254

1999
2980014

Evolutia numarului de autoturisme inscrise in circulatie


in perioada 1994-1999

numar autoturisme in circulatie

3500000
3000000
2500000
2000000
1500000
1000000
500000
0
1993

1994

1995

1996

1997

1998

1999

2000

anul

Figura 2.4 Cronograma


Norul statistic
Norul statistic constituie o modalitate de reprezentare grafic a seriilor atributive de
repartiie bidimensionale.
Se consider o serie bidimensional de repartiie n raport cu variabilele discrete X i
Y. n sistemul de axe rectangulare xOy se marcheaz toate punctele de coordonate (xj, yi );
i = 1, I; j = 1, J pentru care frecvenele Nij 0. Mrimea acestor frecvene se poate marca pe
grafic n dou moduri:
- dac frecvenele sunt mici, atunci pentru fiecare punct de pe grafic
(xj, yi ); i = 1, I; j = 1, J pentru care Nij 0, se marcheaz attea puncte de cte ori
se repet perechea respectiv.
- dac ns frecvenele sunt prea mari, pentru marcarea lor pe grafic se pot utiliza
diagrame areale prin cercuri ale cror arii trebuie s fie proporionale cu rdcina
ptrat a frecvenelor pe care le reprezint.
n cazul n care cele dou variabile X i Y sunt continue, ntruct la intersecia a dou
intervale se formeaz o rubric (csu), frecvenele diferite de zero se reprezint n interiorul
acestei rubrici, fie prin puncte, fie prin diagrame areale cu respectarea unuia din cele dou
moduri de elaborare mai sus amintite.
Exemplu
Un produs a fost lansat simultan pe 13 piee. Pe aceste piee, produsul a fost propus la
preuri diferite (P), veniturile consumatorilor (V) fiind i ele diferite. Pentru fiecare piat s-a
nregistrat un anumit nivel al cererii (C), rezultatele fiind sintetizate n tabelul urmtor:

22

Nr.
Crt.

Cerere
(C)

15,4

3,2

4,9

10,5

8,0

5,1

1,4

5,1

2,5

1,7

1,8

3,4

Pre
(P)

10

11

12

13

7,6

11,3

14,0

6,4

13,2

8,8

12,1

2,1

1,6

3,6

3,5

1,9

1,8

1,9

18
16
14

cerere

12
10
8
6
4
2
0
0

pret

Figura 2.5 Norul de puncte n raport cu Pret i Cerere


Cartograma i cartodiagrama
Aceste tipuri de grafice se folosesc frecvent pentru reprezentarea grafic a seriilor
statistice de spaiu.
Realizarea unei cartograme sau a unei cartodiagrame presupune conturarea spaiului
(sub form de hart) n interiorul cruia se manifest fenomenul care este cuantificat de seria
de reprezentat. n interiorul hrii astfel realizat, prin diverse culori sau nuane ale aceleiai
culori, prin hauri sau prin diferite diagrame, este evideniat intensitatea dezvoltrii
fenomenului cercetat precum i mrimea indicatorilor seriei.
Cartodiagrama constituie o modalitate de reprezentare grafic a seriilor de spaiu,
realizndu-se ca o mbinare ntre cartogram i diferite alte tipuri de diagrame, ca de exemplu
diagrame prin benzi, cerc, ptrat, dreptunghi etc. De exemplu, pentru a reprezenta o serie de
spaiu ce exprim volumul investiiilor strine pe judee, la noi n ar, se procedeaz astfel: n
primul rnd se deseneaz harta Romniei, delimitndu-se judeele; n cadrul fiecrui jude se
deseneaz o figur geometric oarecare convenabil aleas, a crei arie sau mrime s fie direct
proporional cu volumul investiiilor strine din judeul respectiv.

Probleme propuse
P1. Dai 5 exemple de populaii statistice a cror cercetare ar prezenta interes i pentru fiecare
populaie selectat precizai:
- denumirea populaiei, a unitii statistice i volumul acesteia;
- scopul cercetrii statistice;
- variabilele statistice n raport cu care s-ar face observarea statistic a populaiei.
P2. S se extrag din Anuarul Statistic sau alte surse informaionale o serie statistic
bidimensional ce red distribuia unei populaii n raport cu dou variabile atributive,
relativ la care se cere:

23

denumirea populaiei ce a fost supus observrii i volumul acesteia;


unitatea statistic;
caracterizarea variabilelor statistice n raport cu care a fost studiat populaia;
caracterizarea seriei statistice n raport cu toate criteriile cunoscute;
elaborarea seriei bidimensionale format cu frecvene relative, interpretare;
extragerea repartiiilor unidimensionale marginale i a celor condiionate;
pornind de la o repartiie marginal deducei celelalte serii statistice posibile,
interpretare.
P3. Din Anuarul Statistic sau alte surse informaionale extragei o serie statistic de repartiie,
avnd la baz o variabil de spaiu, relativ la care se cere:
1. denumirea populaiei statistice i volumului ei;
2. unitatea statistic;
3. caracterizarea seriei dup toate criteriile cunoscute;
4. deducerea seriei format cu frecvene relative;
5. interpretare.
P4. Din Anuarul Statistic sau alte surse informaionale extragei dou serii cronologice avnd
la baz indicatorul de nivel, una de momente, alta de intervale i deducei seriile formate
cu diferene absolute, indici statistici, diferene relative, cu baz fix i cu baz n lan
(interpretri).
P5. Dai 5 exemple de serii cronologice avnd la baz indicatorul relativ de intensitate.
P6. Din Anuarul Statistic sau alte surse informaionale extragei o serie de spaiu format cu
indicator de nivel sau indicator relativ de intensitate i deducei seriile formate cu
diferene absolute, indici i diferene relative, calculate cu baz fix. Interpretare.
P7. Extragei 5 exemple de serii de spaiu ce conin informaii importante pentru domeniul
economic.
P8. Luand ca exemplu o populaie statistic studiat n raport cu un anumit numr de
variabile (stabilite n raport cu obiectivul studiului), se cere:
1. elaborarea tuturor seriilor statistice de repartiie unidimensionale
2. elaborarea a trei serii statistice de repartiie bidimensionale ( una are la baza dou
variabile calitative, una are la baz o variabila calitativ i o variabil cantitativ, una
are la baz dou variabile cantitative)
3. reprezentarea grafic a: histogramei, poligonului frecvenei, cercului de structur,
diagramei prin benzi sau coloane, norul statistic, cronograma i cartograma.
1.
2.
3.
4.
5.
6.
7.

Bibliografie:
1. Buiga, A., Drago C., Lazr D., Parpucea I., Statistic descriptiva, Ed. Mediamira,
Cluj-Napoca, 2010;
2. Buiga, A., Metodologie de sondaj i analiza datelor n studiile de pia, Ed. Presa
Universitar Clujean, Cluj-Napoca, 2001;
3. Florea I., Parpucea I., Buiga A., Statistic descriptiv, Ed. Continental,
Cluj-Napoca, 1998.

24

MODULUL 2
PARAMETRII REPARTIIILOR EMPIRICE UNIDIMENSIONALE

Obiective

cunoaterea i nelegerea modului de calcul precum i a semnificaiei parametrilor


statistici.
ilustrarea trsturilor eseniale care caracterizeaz fenomenele social - economice
cunoaterea i msurarea variaiei unei mrimi n raport cu nivelul mediu al acesteia

Concepte de baz

valoare medie, median, modal


parametrii de structur
variaie, abatere medie, dispersie
parametrii concentrrii
asimetrie i boltire

Rezultate ateptate
Cunoaterea modului de calcul i a semnificaiei parametrilor tendinei centrale, a gradului
de reprezentativitate a mediei, respectiv a medianei, analiza structurii unei populaii i
formularea unei concluzii privind forma distribuiei unei populaii.

Sinteza
2.1. Parametrii tendinei centrale
Parametrii din aceast grup au menirea de a evidenia poziia n jurul creia se
grupeaz ansamblul valorilor unei variabile de la baza unei serii. Aceast poziie exprimat
printr-un numr se numete poziie central. Ea poate fi evideniat prin:
- valoarea medie X ;
- valoarea median (M e ( X )) ;

( )

- valoarea modal (M o ( X )) .

A. Valoarea medie

Valoarea medie reprezint principalul parametru care caracterizeaz tendina central a


unei repartiii statistice.
n vederea definirii parametrului valoarea medie se consider o populaie statistic
studiat n raport cu variabila cantitativ X i o funcie G(x1,x2,,xR) unde xi, i = 1, R ,
reprezint strile variabilei X. Funcia G exprim o anumit nsuire esenial, un atribut al
populaiei n raport cu variabila X. Aceast funcie se numete funcie determinant.

25

Prin definiie, valoarea medie X a variabilei X este parametrul care las invariant
funcia determinant, adic:

G ( x1 , x 2 ,..., x R ) = G X , X ,..., X .

(2.0)

Aceast egalitate se ntlnete sub denumirea de relaia lui BOIARSKI-KISINI. n


funcie de forma analitic a funciei G, din relaia (2.0) se deduce expresia analitic
(indicatorul) de calcul a valorii medii X .
Determinarea, pe aceast cale, a valorii medii X , este destul de anevoioas. Utilizarea
acesteia presupune stabilirea coninutului (semnificaiei) i a formei analitice a funciei
determinante G, pentru fiecare caz n parte. Dar, valoarea medie X poate fi definit ca un
raport a dou mrimi din care se deduce aceeai expresie pentru X ca i din (2.0).
Exist, aadar, dou modaliti echivalente de definire a valorii medii, criteriul relaiei
determinante a lui Boiarski-Kisini i criteriul raportului, ultima fiind mai accesibil. Criteriul
raportului presupune raportarea volumului fenomenului cercetat la volumul populaiei. Acesta
presupune cuantificarea volumului fenomenului n funcie de natura lui. Pentru a exemplifica
cele prezentate mai sus, se consider populaia familiilor dintr-o localitate, cercetat n raport
cu numrul de copii. Datele rezultate din observare se prezint ca o serie de repartiie de
forma:
xi
X :
N i i =.1, R

n acest caz, funcia determinant are urmtoarea form:


R

G ( x1 , x 2 ,..., x R ) = xi N i
i =1

semnificnd numrul total de copii din localitatea respectiv. Pentru a gsi numrul mediu de
copii pe familie se particularizeaz relaia (2.0) dup cum urmeaz
R

i =1

i =1

xi Ni = X Ni
de unde rezult:
R

X =

x
i =1

Ni

N
i =1

La acelai rezultat se putea ajunge pornind de la faptul c numrul mediu de copii pe


familie se poate exprima ca un raport ntre numrul total de copii i numrul de familii din
localitatea respectiv, adic:

X =

Nr. total de copii


Nr. de familii

(2.1)

n acest exemplu, fenomenul fiind de natur demografic, volumul acestuia se


cuantific prin numrul total de copii la nivelul populaiei statistice considerate. Aceasta este

26

n direct concordan cu natura i semnificaia variabilei n raport cu care se face cercetarea


statistic.
Cunoaterea naturii parametrului valoare medie, conduce la o definiie mai complet
i plin de semnificaie.
Pentru a nelege semnificaia valorii medii X , trebuie subliniat faptul c, n general,
variaia unui fenomen, de orice natur, i n particular variaia unei variabile X n raport cu
care este cercetat o populaie, este determinat de aciunea simultan a dou categorii de
factori: factori eseniali i factori neeseniali.
n categoria factorilor eseniali intr acei factori care acioneaz asupra tuturor
unitilor populaiei n mod continuu i n acelai sens, determinnd, n principal, nivelul de
dezvoltare a variabilei pentru fiecare unitate component din populaie.
Factorii eseniali se conjug n aciunea lor cu factorii neeseniali, care, n general, au
un caracter aleator, sunt numeroi i neuniform rspndii printre unitile populaiei.
Fiecare din factorii considerai neeseniali acioneaz numai asupra unui anumit numr
de uniti din populaie. Ca urmare, acetia pot contribiu fie la creterea nivelului variabilei
(pentru unele uniti din populaie), fie la scderea nivelului variabilei (pentru alte uniti din
populaie).
La rndul lor factorii eseniali nu acioneaz cu aceeai intensitate asupra tuturor
unitilor din cadrul populaie considerate, determinnd, n acest fel, variaia neuniform a
variabilei respective n cadrul populaiei.
n consens cu cele subliniate mai sus, se poate afirma c parametrul valoarea medie a
unei serii statistice care are la baz variabila X, constituie acel nivel pe care l-ar putea
nregistra variabila n cadrul populaiei cercetate n condiiile n care factorii neeseniali nu sar fi manifestat, iar factorii eseniali ar fi acionat asupra unitilor din populaie cu aceeai
intensitate.
Parametrul valoarea medie, calculat pentru o serie statistic, pune n eviden ceea ce
este comun, general i esenial sub aspectul nivelului de dezvoltare al variabilei, n raport cu
care este studiat o populaie.
n raport cu natura variabilei ce st la baza seriei, ct i a formei de prezentare a
indicatorilor cu care aceasta este construit, exist mai multe posibiliti de calcul a valorii
medii.
Funcia determinat G, sub forma sa cea mai general, are urmtoarea expresie
analitic:
1

R K
K
G ( x1 , x 2 ,..., x R ) = xi f i
i =1

(2.2)

Pentru diverse valori ale lui k, n strict concordan cu coninutul i semnificaia


funciei G, se ntlnesc mai multe tipuri de medii:
- media armonic (k = -1);
- media aritmetic (k = 1);
- media ptratic (k = 2);
- media cubic (k = 3);
- media de ordinul k n general.
n caz concret, valoarea medie real X este aceea care se obine prin indicatorul
(mediu) rezultat fie prin aplicarea criteriului relaiei determinante, fie criteriului raportului.

Modaliti de calcul a valorii medii

27

1. Media aritmetic
Acesta este indicatorul cel mai utilizat n calculul parametrului valoarea medie a unei serii
statistice, aa cum rezult din practica statistic.
Se consider acum dou serii statistice de repartiie, una format din frecvene absolute, iar
cealalt din frecvene relative:
xi
X :
N i i =.1, R

(2.3)

xi
X :
f i i =.1, R

(2.4)

Media aritmetic pt cele dou serii se calculeaz astfel:


xi N i
;
X = xi f i
Nj
Dac seria este de intevale, construit cu frecvene absolute avem:
X=

x'i .N i
Nj
Fie o serie de repartiie, care are la baz o variabil continu X, respectiv,
X=

xi 1 xi

X :
f i i =.1, R
xi + xi 1
= xi'
2
unde x i' reprezint mijlocul intervalului i, obinem relaia:

Folosind notaiile:

X = xi' fi
i =1

Relaia ne arat c media aritmetic a unei serii de intervale se reduce la media


aritmetic a unei serii discrete n care clasele sunt reprezentate prin mijloacele intervalelor de
variaie.

2. Media armonic
Se consider o serie de forma:

28

x
X : i
N i i =1, R

(2.5)

n cazul unei serii discrete de forma (2.5), media armonic notat cu X 1 se definete prin:
R

X 1 =

N
i =1

(2.6)

1
Ni
xi

i =1

numit i formula mediei armonice ponderate.


Dac ponderile sunt egale ntre ele, adic N1=N2==NR=N*, atunci relaia (2.6) devine:
R

X 1 =

i =1

i =1

1
N*
xi

R
R

i =1

(2.7)

1
xi

care reprezint formula mediei armonice simple.


n cazul unei serii care are la baz o variabil continu X, respectiv,
x x
X : i 1 i
Ni i =1, R
procednd ca la media aritmetic, pentru media armonic rezult:
R

X 1 =

N
i =1

i =1

(2.8)

1
Ni
x i'

unde xi reprezint mijlocul intervalului i, i = 1, R .


i n acest caz, dac ponderile sunt egale, se obine relaia de calcul a mediei armonice simple,
de forma:
X 1 =

R
R

x
i =1

'
i

3. Media geometric
Pentru o serie care are la baz variabila discret X, format cu frecvene absolute, media
geometric notat cu X g (sau X o ) este definit prin expresia:

X g = N x1N1 x2N 2 ...xRN R

(2.9)

Din (2.9), pentru media geometric ponderat exprimat cu frecvene relative se deduce:

29

1/ N

Xg =

N1

x 2 ... x R
N2

NR

R N
= xi i
i =1

= xi
i =1

Ni / N

= xi i
f

(2.10)

i =1

Dac variabila X, de la baza seriei este de variaie continu, atunci relaiile de calcul pentru
diversele variante de medie geometric, rmn variabile cu singura modificare c valorile xi,
i = 1, R , se nlocuiesc cu mijloacele intervalelor de variaie, calculate conform formulei:
xi' =

xi 1 + xi
,
2

i = 1, R

(2.11)

B. Valoarea median
Valoarea median, notat cu M e este acea valoare a variabilei cantitative X care mparte
repartiia n dou pri egale, respectiv:
FN (M e ) = 1 / 2 sau N ( M e ) =

N
2

(2.12)

Calculul valorii mediane se face difereniat, dup cum seria are la baz o variabil discret sau
continu.
Pentru o repartiie discret, calculul medianei nu implic probleme deosebite i nici un
volum mare de calcule.
Se consider o repartiie cu frecvene absolute:

x x2 ... xi ... xR
.
X : 1
N1 N 2 ... N i ... N R

(2.13)

n calculul valorii mediane a unei serii discrete, pot aprea dou situaii:
a) volumul N al populaiei este un numr impar;
b) volumul N al populaiei este un numr par.
n ambele cazuri, calculul medianei presupune, n prima faz, determinarea rangului
medianei, notat cu rM e , conform urmtoarei relaii:

1 R
rM e = N i = N ( M e )
2 i =1

(2.14)

a) Dac volumul populaiei N este un numr impar, rangul medianei este un numr zecimal a
N
crui parte ntreag indic numrul de uniti din populaie pentru care variabila X a
2
nregistrat valori mai mici ca mediana. Ca urmare, M e trebuie s fie valoarea imediat
N
urmtoare celei de rang adic:
2
M e = x N

+1
2

30

(2.15)

b) Dac volumul populaiei este un numr par, rangul medianei este un numr ntreg i ca
urmare la mijlocul seriei nu se mai afl o valoare a variabilei X cu care s coincid mediana ci
se gsesc dou valori, mediana calculndu-se n acest caz ca media aritmetic a acestora.
Relaia de calcul a medianei, n acest caz, este:

x N + x N
Me =

+1
2

(2.16)

Pentru o repartiie continu, calculul valorii mediane presupune verificarea egalitii (2.12) i
ca urmare, trebuie cunoscut densitatea de repartiie f(x). Determinarea funciei f(x) implic
un volum mare de calcule i deci, din acest motiv, n activitatea practic f(x) este aproximat.
Acest lucru va conduce la o expresie aproximativ de calcul a valorii mediane, care necesit
un volum redus de calcule.
Pentru acesta se consider o repartiie continu n raport cu variabila X, i anume:

x x1 x1 x 2 ... x i 1 x i ... x R 1 x R
.
X : 0
N2
Ni
N R
...
...
N1

(2.17)

unde intervalele xi-1-xi, i = 1, R pot fi de lungime egal sau neegal. Calcularea rangului
medianei va permite stabilirea intervalului n care se afl valoarea median, interval numit i
interval median. Se cumuleaz frecvenele absolute din aproape n aproape pn ce este
ndeplinit inegalitatea:
N 1 + N 2 + ... + N i

1
N
2

Ultima frecven Ni cumulat, ne permite s indicm intervalul median [x i 1 x i ) .


Formula aproximativ de calcul a medianei:

M e = xi 1 +

N ( M e ) N ( xi 1 )
( xi xi 1 )
Ni

xi 1 = xM e

- limita inferioar a intervalului median;

Ni = N M e

- frecvena absolut a intervalului median;

(2.18)

xi xi 1 = lM e - lungimea intervalului median,

C. Valoare modal
Valoarea modal Mo(X) a unei repartiii reprezint aceea valoare a variabilei X creia i
corespunde frecvena cea mai mare.
Acest parametru se mai numete modul, valoare dominant, sau mod se noteaz cu Mo.
Mod de calcul:

31

a)

Pentru o serie de repartiie discret, dat sub forma


x x ... x i ... x R
.
X : 1 2
f 1 f 2 ... f i ... f R

(2.19)

valoarea modal se citete direct din serie, nefiind nevoie de nici o tehnic sau formul de
calcul. n cazul acestui tip de serie, valoarea modal va fi acea valoare a variabilei X pentru
care frecvena este cea mai mare.
b) Pentru serii de repartiie continue, respectiv:
x x1 x1 x 2 ... x i 2 x i 1 x i 1 x i
X : 0
f2
f i 1
fi
...
f1

x i x i +1 ... x R 1 x R

f i +1
fR
...

(2.20)

Modala nu poate fi determinat direct.


Intervalul cruia i corespunde frecvena cea mai mare, se numete intervalul modal i va
conine modala. S presupunem c intervalul modal este xi-1-xi.
Formula de calcul a modalei:

M o (x ) = x M o +

1
lMo
1 + 1

(2.21)

unde:
Mo

- reprezint valoarea modal;

xMo

- reprezint limita inferioar a intervalului modal;

1
- reprezint diferena dintre frecvena intervalului modal i frecvena intervalului
precedent;
1 - reprezint diferena dintre frecvena intervalului modal i frecvena
urmtor;
lMo

intervalului

- reprezint lungimea intervalului modal.

O serie poate avea o singur valoare modal, caz n care seria se numete unimodal. Dac o
serie are mai multe valori modale, atunci se numete plurimodal. O serie plurimodal
evideniaz faptul c populaia n cauz este neomogen. Calculul valorii modale, n
asemenea cazuri, presupune o delimitare mai riguroas a obiectului observrii ct i a
populaiei care urmeaz s fie studiat. O alt cale, care poate duce la eliminarea unui
asemenea neajuns, o constituie comasarea a dou cte dou sau trei cte trei intervale etc.,
pn se ajunge la o serie unimodal.
n cazul unei serii simetrice valoarea modal coincide cu valoarea medie i cu mediana.
Pentru serii uor asimetrice, K. Pearson a stabilit urmtoarea relaie ntre cei trei parametri:

Mo = X 3 X Me

unde X este media aritmetic a variabilei X.


32

Calculul valorii modale reprezint un deosebit interes pentru activitatea practic. Avnd n
vedere c semnificaia acestui parametru indic acea valoare a variabilei nregistrat de cele
mai multe uniti din populaie se poate afla: ora la care sunt solicitate cele mai multe
convorbiri telefonice, ora de vrf privind transportul n comun, mrimea cea mai solicitat la
nclminte etc.
Dac valoarea modal este identic cu valoarea medie, atunci se poate afirma c valoarea
medie se bucur de o mai mare reprezentativitate.
Dac, n plus, avem M e = M o = X , innd seama c valoarea median nu este influenat de
valorile extreme ale variabilei, se poate afirma c mediana reprezint un grad de
reprezentativitate mai mare dect valoarea medie.
2.2. Parametrii de structur
Frecvente sunt cazurile cnd este necesar studierea structurii unei populaii n raport cu o
variabil sau alta. Parametrii statistici, n forma cea mai general, folosii n caracterizarea
structurii unei populaii poart denumirea de valori quantile.
Valorile quantile ale unei serii de repartiie unidimensionale sunt acele mrimi nregistrate de
variabila X, care mpart seria n n pri egale (mai precis mparte populaia n n pri egale). n
acest caz se vor calcula p quantile (p = n-1).
Pentru o serie continu, a crei densitate de probabilitate f(x) este cunoscut, urmtoarea
egalitate este satisfcut de cele p quantile:
q1

f ( x)dx =

x1

q2

f ( x)dx = ... =

q1

xR

f ( x)dx =

q n 1

1
n

(2.22)

unde cele n-1 quantile s-au notat cu q1, q2, , qn-1.


Relaia (2.22) se particularizeaz pentru cazul seriilor discrete, cnd seria este construit cu
frecvene relative:
q1

q2

f = f
i

x1

q1

xR

= ... = f i =
q n 1

1
n

(2.23)

Pentru o serie oarecare, quantila de ordinul p poate fi definit astfel:


FN (q p ) = p

1
N
sau N (q p ) = p , p = 1, n - 1
n
n

Modul de calcul a valorilor quantile difer n raport cu tipul seriei.


Fie o serie de repartiie, care are la baz o variabil X discret, de urmtoarea form:

x x2 ... xi ... xR
.
X : 1
N1 N 2 ... N i ... N R

(2.24)

Pentru calculul valorii quantile de ordinul p( p = 1, n 1) , n prima etap trebuie determinat


rangul acesteia:

33

rq p = N (q p ) = p

N
n

(2.25)

Se disting dou cazuri:


a) dac pN se divide cu n atunci quantila de ordin p se calculeaz ca o medie aritmetic
simpl a valorilor variabilei X, de ordinul rangului i al rangului majorat cu o unitate, dup
cum urmeaz:

qp =

x rq p + x ( rq p +1)

(2.26)

b) dac pN nu se divide cu n atunci quantila de ordin p este egal cu acea valoare a variabilei
X corespunztoare pari ntregi a rangului majorat cu 1:
q p = x[ rq

(2.27)

+1]

n cazul seriilor care au la baz o variabil continu, conform definiiei, cele n-1
quantile trebuie s satisfac relaia (2.22). Determinarea quantilelor din asemenea egaliti ar
presupune cunoaterea densitii de probabilitate f(x). Ori n activitatea practic f(x) se
aproximeaz prin diverse procedee, implicnd un volum exagerat de calcule.

n vederea gsirii unor formule aproximative de calcul a quantilei de ordin


p( p = 1, n 1) se consider o serie de variaie continu, ale crei intervale de variaie nu
trebuie s fie neaprat egale ca lungime:

x x1 x1 x 2 ... x i 1 x i ... x R 1 x R
.
X : 0
N2
Ni
N R
...
...
N1

(2.28)

n prima etap se determin rangul quantilei de ordinul p( p = 1, n 1) conform


urmtoarei relaii:

1 R
rq p = N (q p ) = p N i
n i =1

(2.29)

Cunoscnd rangul, se poate identifica intervalul n care se afl quantila de ordinul p, numit i
intervalul quantilei de ordinul p( p = 1, n 1) . Cumulnd frecvenele pe clase pn la egalarea
s-au depirea rangului, conform inegalitii:
1 R
N 1 + N 2 + ... + N i p N i
n i =1

(2.29)

ultima frecven adunat va corespunde intervalului quantilei de ordinul p( p = 1, n 1) . Prin


urmare, quantila de ordinul p, qp, se calculeaz conform relaiei:
q p = x i 1 +

N (q p ) N ( x i 1 )
Ni

( x i x i 1 )

34

(2.30)

x q p = x i 1 - reprezentnd limita inferioar a intervalului quantilei de ordinul p;


l q p = x i x i 1 - reprezint lungimea intervalului quantilei de ordinul p;
N q p = N i - reprezint frecvena absolut a intervalului quantilei qp,
Procedeul de determinare a quantilei de ordinul p = 1, n 1 este acelai i n cazul n
care seria (2.28) este format din frecvene relative.
Caracterizarea structurii unei serii se poate face utiliznd diverse cazuri particulare de
valori quantile.

Valoarea median (Me) este i un parametru de structur obinndu-se ca un caz


particular de quantil, cnd n=2. Dac pentru o serie se cunoate Me (quantila de ordinul 2),
atunci structura populaiei poate fi redat astfel:
X Me
X : min
50%

M e xmax

50%

(2.31)

semnificnd faptul c jumtate din populaia supus studiului a nregistrat pentru variabila X
valori cuprinse ntre valoarea minim a lui X i median, iar cealalt jumtate din populaie a
nregistrat pentru X valori cuprinse ntre median i valoarea maxim a lui X.
Valorile quartile reprezint acel caz particular al valorilor quantile pentru care n=4.
Cele trei quartile, care se obin, notate: Q1, Q2 i Q3 sunt acei parametri de structur care
mpart populaia n patru pri egale.
n raport cu mediana, quartila nti Q1, se numete quartila mic (inferioar), quartila
a doua Q2 coincide cu mediana i se numete quartila mijlocie, iar quartila a treia Q3 se
numete quartila mare (superioar).
Cunoscndu-se cele trei quartile, rezult urmtoarea structur a populaiei n raport cu
variabila X:

x Q1 Q1 Q2
X : min
25%
25%

Q2 Q3
25%

Q3 X max

25%

(2.32)

ceea ce semnific o structurare a populaiei supus studiului n patru pari egale.


Aceasta nseamn c 25% din unitile popupaiei nregistreaz valori pentru variabila
X mai mici dect quartila mic, 25% din unitile populaiei nregistreaz valori, n raport cu
aceeai variabil X, cuprinse ntre quartila mic i cea mijlocie, 25% vor avea valori cuprinse
ntre quartila mijlocie i quartila mare, iar restul 25% din unitile populaiei vor avea valorile
pentru variabila X cuprinse ntre quartila mare i valoarea maxim a lui X.

2.3. Parametrii variaiei


Studiul unor populaii statistice prezint importan numai din punct de vedere al unor mrimi
care variaz de la o unitatea la alta sau de la un grup de uniti la altul.

35

Valorile nregistrate de o variabil cantitativ, n raport cu care este studiat o populaie, se


datoresc aciunii diferiilor factori eseniali i neeseniali.
Intensitatea diferit cu care se pot manifesta factorii eseniali ct i sensul contrar cu care pot
aciona factorii neeseniali n raport cu fiecare unitate, provoac nivele diferite nregistrate de
variabile n raport cu care este studiat populaia.
Problema msurrii variaiei unei variabile cantitative este important pentru a vedea n ce
msur valoarea medie a acesteia poate reprezenta ntrega populaie.
Dac abaterile de la valoarea medie sunt neeseniale atunci se poate afirma c populaia este
omogen i c acest parametru poate reprezenta tendina central, iar dac aceste abateri sunt
mari atunci populaia este eterogen i valoarea medie nu are capacitatea de a reprezenta
populaia.
Pentru unele serii, valoarea medie nu se poate calcula. n asemenea cazuri, parametrul
valoarea median poate s-i ia locul. Aceeai problem se pune i n acest caz, de a vedea n
ce msur valoarea median este sau nu reprezentativ pentru populaia n cauz.
O alt problem care nu se poate rezolva fr a studia i msura variaia nregistrat de o
variabil n raport cu care este studiat o populaie, o constituie verificarea de ipoteze. n
activitatea practic, de multe ori pornind de la valorile unor parametrii calculai pe baza
datelor culese relativ la un numr mic de uniti, este necesar a fi extini la nivelul ntregii
populaii sau de a se verifica anumite ipoteze statistice.
Parametrii variaiei se pot calcula att sub form absolut ct i relativ, i msoar
mprtierea valorilor unei variabile cantitative fa de valoarea medie sau valoarea median.
Ca urmare, n funcie de elementul de referin folosit n msurarea variaiei, deosebim:
-

parametrii variaiei n raport cu valoarea medie;

parametrii variaiei n raport cu valoarea median.

2.3.1. Parametrii variaiei n raport cu valoarea medie


Abaterea medie liniar

Abaterea medie liniar, notat cu d x , reprezint media aritmetic a abaterilor variabilei X de


la valoarea medie a acesteia, luate n valoare absolut:
dx = M X X

(2.33)

Relaia (2.33) se particularizeaz n :


R

x
dx =

i =1

X Ni

(2.34)

N
i =1

Dac seria are la baz o variabil continu i se cunoate f(x), atunci abaterea medie liniar se
calculeaz astfel:

36

dx =

xR

x X f ( x)dx

(2.35)

x1

Densitatea de probabilitate f(x) se poate aproxima cu densitatea empiric i atunci pentru


abaterea medie liniar se pot obine relaii de calcul aproximativ, frecvent utilizate n
activitatea practic, de forma:
R

dx =

x
i =1

'
i

X Ni
R

N
i =1

sau

d x = x 'i X f i

(2.36)

i =1

dup cum seria n cauz este format cu frecvene absolute sau relative, unde:
x i' =

x i 1 + x i
, i = 1, R
2

este mijlocul intervalului i.


Acest parametru servete caracterizrii sintetice a gradului de reprezentativitate a valorii
medii, artnd cu ct se abate n medie orice valoare a variabilei X de la valoarea medie X ,
ntr-un sens sau altul.
Sub forma relativ, acest indicator poart denumirea de coeficient simplu de variaie i se
calculeaz conform relaiei:

Vx =

dx
X

100

(2.37)

Coeficientul simplu de variaie (Vx) arat cu ct se abate n medie orice valoare a variabilei X
de la valoarea medie echivalent cu 1 sau 100%. Calculat pentru dou serii diferite, se poate
aprecia gradul de reprezentativitate a celor dou medii. Se apreciaz mai reprezentativ acea
valoare medie pentru care coeficientul simplu de variaie este mai mic.
Parametrul abaterea medie liniar, n forma absolut sau relativ, prezint unele deficiene
deoarece nu este suficient de sensibil la abaterile mici, adugndu-se i unele inconveniente
de natur teoretic, generate de exprimarea abaterilor n valoarea absolut.
nlturarea acestor deficiene se poate realiza apelnd la un nou parametru privind msurarea
variaiei, numit abatarea medie ptratic.

Abaterea medie ptratic


Acest indicator este utilizat att pentru caracterizarea gradului de reprezentativitate a valorii
medii ct i n scopul estimrii unor parametri necunoscui.
Abaterea medie ptratic, notat cu x , se definete ca fiind media ptratic a abaterilor
valorilor variabilei X, de la valoarea medie X , adic:

x = M (X X )2

(2.38)

Un calcul intermediar n aflarea acestui parametru, l constituie calcularea ptratului abaterii


medii ptratice, care se numete dispersie sau varian i are urmtoarea expresie de calcul:

37

x2 = M ( X X ) 2 = D 2 ( X )

(2.39)

V(x) reprezint o alt notaie pentru varian, pe lng 2x .


Variana fiind un calcul intermediar n aflarea abaterii medii ptratice, n cele ce urmeaz se
va prezenta modul de calcul al acesteia.
Relaia de calcul a varianei se particularizeaz n raport cu tipul seriei. n cazul unei serii care
are la baz o variabil X discret, conform definiiei, variana are expresia:
R

x2 =

(x
i =1

X )2 Ni
(2.40)

N
i =1

n cazul unei serii care are la baz o variabil X continu, variana se calculeaz conform
urmtoarei relaii:

=
2
x

(x X )

xR

f ( x) dx

(2.41)

x1

a crei aplicare presupune cunoaterea densitii de repartiie f(x).


Pentru o serie dat, variana calculat nu are interpretare, dar dac se extrage rdcina ptrat
din acesta se obine un numr care se exprim n aceleai uniti de msur ca i variabila de
la baza seriei. Acest numr (valoare) reprezint abaterea medie ptratic, simboliznd cu ct
se abate n medie n plus sau minus orice valoare xi a variabilei X de la valoarea medie X .
Parametrul abaterea medie ptratic se poate exprima i sub form relativ, caz n care se
numete coeficientul de variaie a lui Pearson, i se noteaz cu Vx. Expresia de calcul este:
Vx =

x
X

100

(2.42)

i reprezint abaterea medie a orcrei valori a variabilei X de la valoarea medie, considerat


egal cu 1 sau 100.
Coeficientul de variaie a lui Pearson calculat pentru dou sau mai multe serii, poate fi folosit
n aprecieri comparative privind gradul de reprezentativitate a valorii medii calculate.
Deoarece gradul de reprezentativitate a valorii medii este n raport invers cu mrimea
coeficientului de variaie a lui Pearson, se poate afirma, n cazul mai multor serii, c este mai
reprezentativ valoarea medie a acelei serii pentru care Vx este mai mic.
n concluzie, trebuie reinut c parametrul abaterea medie ptratic sub form absolut x i
sub form relativ Vx sunt indicatori fundamentali utilizai n msurarea variaiei unei
variabile.
Att abaterea medie liniar, ct i abaterea medie ptratic constituie o msur a variaiei
medii, primul o medie de ordinul unu, iar al doilea o medie de ordinul doi (d x x ) .

2.3.2. Parametrii variaiei n raport cu valoarea median


Abaterea interquartil

38

Abaterea interquartil, prin definiie, este media aritmetic simpl a segmentelor Me Q1 i


Q3 Me, respectiv:
M e Q1 + Q3 M e Q3 Q1
=
2
2

Q=

(2.43)

i arat cu ct se abat n medie, n plus sau n minus, de la median, cele 50% din valorile
variabilei cuprinse ntre Q1 i Q3.
Forma relativ a acestui indicator notat cu Qr:

Qr =

Q
Q Q1
100 = 3
100
Me
2 Me

(2.44)

se numete coeficient de variaie interquartilic i arat cu ct se abat n medie de la median


(considerat egal cu 100), valorile variabilei nregistrate pentru cele 50% din unitile
populaiei cuprinse ntre Q1 i Q3.
Ca atare, se apreciaz c mprtierea unitilor n cadrul populaiei studiate este cu
att mai mare, n raport cu variabila de studiat, cu ct abaterea interquartil n valoarea
absolut (2.43) sau relativ (2.44) este mai mare.

Abaterea interquantil
Pentru acest parametru, sub form absolut, avem:
q=

qn 1 M e + M e q1 qn 1 q1
=
2
2

(2.45)

iar sub form relativ denumit i coeficient de variaie interquantilic este:


qr =

q
q q
100 = n 1 1 100
Me
2 Me

(2.46)

Cu ct abaterea interquantilic (relativ sau absolut) este mai mic, cu att valoarea median
este mai reprezentativ.

2.4. Parametrii concentrrii


Energia informaional
Acest parametru a fost introdus de Acad. Octav Onicescu. Prin definiie:
R

E = fi 2
i =1

unde s-a notat cu E energia informaional. Este un parametru utilizat n cazul n care seria are
la baz o variant nenumeric.

39

n cazul unei populaii caracterizat de un grad de concentrare maxim, va exista o


clas care va avea frecvena relativ egal cu 1, iar celelalte vor avea frecvenele relative 0 i
ca urmare: Emax = 1.
Dac populaia este caracterizat de o concentrare minim, atunci:
x2 ... xR
x

X : 1
1 / R 1 / R ... 1 / R
iar
Emin = R

1
1
=
2
R
R

Se observ c:
1
E 1
R
Forma relativ a acestui parametru, notat cu Er, se deduce astfel:
1
R =
Er =
1
1
R
E

1
R

i =1

1
R

de unde:

0 Er 1
Referitor la populaia dat, studiat n raport cu o variabil X, se calculeaz Er, iar dac:
- Er se apropie de 1, atunci populaia respectiv este caracterizat de un grad nalt de
concentrare;
- Er se apropie de 0, populaia n cauz se caracterizeaz printr-o concentrare minim.

2.5. Parametrii formei


Din aplicaiile practice, precum i din alte surse, s-au constatat c graficele pot avea diverse
forme, dintre care: form de coplot, form de U, J, L sau alte forme. Ceea ce prezint
importan, nefiind surprins de nici un parametru prezentat, l constituie modul de repartizare
a valorilor variabilei de o parte i de alta a valorii medii, considerat i centrul de greutate a
seriei. Acest lucru nu nseamn altceva dect evidenierea acelei curbe care aproximeaz cel
mai bine conturul poligonal al seriei respective i n acelai timp o imagine mai clar asupra
gradului de reprezentativitate a valorii medii.
n marea majoritate a cazurilor, distribuia unitilor unei populaii se face dup un clopot
(dup legea normal a lui Gauss). Dar unittile nu se distribuie uniform n jurul valorii medii,
ceea ce poate conduce la nclinaii ntr-o direcie sau alta a valorii medii. Aceast distribuire
neuniform poate conduce la cazul cnd diferite serii (diferit distribuite n jurul valorii medii)
s aib aceeai medie, acelai i totui o curb s fie mai aplatizat dect cealalt, simetric
sau mai puin simetric. Evidenierea acestor diferene poate fi realizat cu ajutorul
parametrilor formei.
Parametrii formei unei serii de repartiie, dup coninut, se clasific n dou grupe:

40

parametrii asimetriei;

parametrii boltirii.

2.5.1. Parametrii asimetriei


Asimetria unei serii se definete n raport cu dispunerea unitilor ntr-o parte sau alta a valorii
medii.
n acest sens, o serie de repartiie este simetric n raport cu media sa dac frecvenele
valorilor variabilei X egal deprtate de valoarea medie sunt egale ntre ele, adic:

) (

f X = f X +

oricare ar fi astfel nct X i X + s se afle printre valorile lui X.

Coeficientul de asimetrie al lui Fisher


Acest parametru se noteaz cu 3, iar expresia sa de calcul este:

3 =

M XX

X3

(2.47)

sau ntr-o form echivalent:

3 =

( )
M (X X )

M XX

2 3

Calculnd valoarea acestui parametru, n funcie de semnul ei, avem urmtoarele cazuri:

1. 3 = 0, ceea ce nseamn c M X X = 0, adic suma tuturor abaterilor cu semnul minus


este egal cu suma tuturor abaterilor cu semnul plus, ridicate la puterea a treia. Ca urmare n
acest caz se poate spune c seria este simetric.

2. 3 > 0, ceea ce nseamn c M X X > 0. Aceasta este echivalent cu faptul c pe total


suma abaterilor cu semnul plus de la valoarea medie este mai mare dect suma abaterilor cu
semnul minus i ca urmare seria prezint o asimetrie pozitiv.

3. 3 < 0, deci M X X < 0. Aceasta nseamn c pe total, suma abaterilor cu semnul


minus este mai mare dect suma abaterilor cu semnul plus de la valoarea medie. O astfel de
serie se spune c reprezint o asimetrie negativ.

2.5.2. Parametrii boltirii


41

Aprecierea boltirii unei serii este util n caracterizarea gradului de reprezentativitate a valorii
medii ct i pentru compararea reprezentativitii a dou sau mai multe valori medii ce
reprezint serii diferite.

Parametrul M X X d o caracterizare numeric sub form absolut a gradului de boltire a


unei serii. Sub form relativ, gradul de boltire se msoar cu parametrul:
B4 =

M XX

X4

(2.48)

Pentru a nelege semnificaia boltirii unei serii, se consider dou serii statistice care au la
baz variabilele X i Y, iar
X = Y ; X = Y
Mai presupunem, n plus, c cele dou distribuii au form de clopot pentru care 3X = 3Y ,
adic ambele sunt simetrice. Dei s-ar prea c cele dou serii nu au nimic care s le
deosebeasc, totui reprezentndu-le grafic rezult dou curbe de forma:

X =Y

X = Y

unde graficul lui X este mai nalt, iar al celeilalte mai plat. Ca urmate, se observ c cele dou
serii nu sunt caracterizate de aceeai boltire.
Boltirea unei serii este util pentru a da o caracetrizare mai exact reprezentativitii valorii
medii.
n cazul exemplului prezentat mai sus, att mediile ct i abaterile medii ptratice sunt egale i
ca urmare, coeficientul de variaie al lui Pearson este acelai pentru cele dou serii. Deci
rezult c ambele valori medii prezint acelai grad de reprezentativitate. Cu toate acestea,
graficele celor dou serii contrazic concluzia dedus n urma comparrii celor doi coeficieni
de variaie.
Valoarea medie cea mai reprezentativ n seria n care cele mai multe uniti ale populaiei
cercetate au nregistrat valori, mai apropiate de valoarea medie. Pentru o astfel de serie,
mprtierea fa de valoarea medie fiind mic, graficul are o form mai ascuit n cazul
seriei X i mai plat n cazul seriei Y.

42

Nivelul boltirii pentru o serie oarecare dat se msoar cu ajutorul parametrului B4, a crui
expresie de calcul este dat de relaia (2.48). Valoarea lui B4 pentru o distribuie normal este
egal cu 3. Pentru orice alt curb corespunztoare unei serii date i aproximat cu un clopot,
raportul ntre momentul centrat de ordinul patru i ptratul momentului centrat de ordinul al
doilea, este un numr diferit de 3, curba respectiv fiind mai ascuit sau mai plat dect curba
normal a lui Gauss.
Comparnd gradul de boltire al unei serii oarecare i gradul de boltire al clopotului lui Gauss,
Fisher a stabilit urmtoarea expresie de calcul al coeficientului boltirii, notat cu B4:
B =
'
4

M XX

4
X

sau:

B4 = B4-3

expresie cunoscut n literatura de specialitate sub denumirea de exces al seriei.


Urmtoarele cazuri sunt semnificative cu privire la aprecierea boltirii unei serii:
- dac B4 =0 (adic B4 = 3) atunci seria n cauz prezint aceeai boltire cu a curbei normale
(excesul este nul);
- dac B4 > 0 (adic B4 > 3) atunci boltirea corespunztoare curbei respective este mai nalt
i mai ascuit dect curba normal (serie leptokurtic);
- dac B4 < 0 (adic B4 < 3) atunci boltirea corespunztoare curbei respective este mai plat
(mai joas i mai larg) dect curba normal (serie platikurtic).
Asimetria i boltirea joac un rol nsemnat n caracterizarea formei unei serii atributive de
repartiie. Cu ajutorul parametrilor prezentai poate fi format o imagine mai clar asupra unei
serii deja construite, asupra msurii n care seria respectiv poate fi reprezentat de valoarea
sa medie.
Bibliografie:
1.Buiga, A., Drago C., Lazr D., Parpucea I., Statistic descriptiva, Ed. Mediamira, ClujNapoca, 2010;
2.Buiga, A., Metodologie de sondaj i analiza datelor n studiile de pia, Ed. Presa
Universitar Clujean, Cluj-Napoca, 2001;

3.Florea I., Parpucea I., Buiga A.,


Napoca, 1998

Statistic descriptiv, Ed. Continental, Cluj-

43

MODULUL 3
ANALIZA LEGTURILOR DINTRE VARIABILELE
UNEI REPARTIII MULTIDIMENSIONALE

Obiective

nsuirea conceptelor de corelaie si regresie si utilizarea lor n economie


Cunoaterea posibilitilor de cuantificare a intensitii legturii dintre diversele
mrimi economice
nsuirea metodelor de stabilire a unei legturi funcionale ntre variabile

Concepte de baz

Corelaia dintre variabile, coeficieni de asociere, coeficient de corelaie


Corelaia rangurilor, coeficienii lui Kendall si Spearman
Metoda celor mai mici ptrate, regresia liniar simpl
Regresia liniar multipl, regresii neliniare: hiperbolic, parabolic, exponenial

Rezultate ateptate
Dup parcurgerea acestui modul se cere studentului s stpneasc noiunile de corelaie i
regresie, s poat identifica existena unei eventuale legturi ntre dou mrimi. De asemenea
s tie msura intensitatea legturii dintre variabile, fie ele cantitative sau calitative. Se
urmrete i cunoaterea metodelor de modelare funcional a legturilor.

Sinteza
Ne propunem abordarea unor metode statistice caracteristice studiului seriilor
multidimensionale. Scopul acestora este de a identifica i utiliza eventualele legturi care se
pot manifesta ntre dou sau mai multe variabile. Prezinta interes: existena legturii,
intensitatea acesteia, forma funcional a legturii, parametrii i reprezentativitatea ei privind
fenomenul cercetat. Problematica legturilor dintre variabile este foarte curent ntlnit n
economie. Spunem c salariul unui angajat este n funcie de productivitatea muncii sale,
vechimea n munc, responsabilitatea activitii sale, etc ; sau cererea dintr-un produs este n
funcie de preul produsului, venitul consumatorilor, etc. De fiecare dat, att n teoria
economic, ct i n aplicaii se ntlnete expresia fie funcia cererii. n realitatea
economic ns, aceast funcie nu se d, nu se cunoate, ci trebuie estimat pornind de la o
baz de date. Aceast problem de estimare a unei funcii i alte probleme colaterale ei fac
obiectul acestui capitol.
Pentru a putea aborda studiul legturilor dintre variabile trebuie s tim n primul rnd
dac exist sau nu o legtur ntre variabilele studiate (sau ntre fenomenele pe care acestea le
reprezint) i care este natura acestora. Putem clasifica legturile dinte variabile astfel :
1. Legtura nul. Semnific lipsa oricrei legturi ntre dou sau mai multe fenomene
sau variabile care cuantific fenomenele. De exemplu, o legtur nul se manifest ntre
nlimea unui angajat i salariul acestuia sau ntre produsul intern brut al unei ri i vrsta
primului ministru. Din punct de vedere statistic, spunem c ntre dou variabile X i Y exist o
legtur nul, sau nu exist legtur, dac cov( x, y ) = 0 .
2. Legtura determinist. Spunem c ntre variabilele X i Y exist o legtur
determinist dac unei valori a lui X i corespunde o singur valoare a lui Y. Astfel de legturi
44

se ntlnesc n special n fizic, unde de exemplu viteza este egal cu distana mprit la
timp: v = d / t , sau fora este egal cu masa nmulit cu acceleraia: F = m a . Astfel de
exemple exist i n economie, unde rata profitului este egal cu profitul mprit la cifra de
afaceri: r = / C. A. 100% . Legtura este determinist pentru c variabila r este perfect
determinat de celelalte dou: i C.A. Adic pentru o anumit valoare a profitului i o
anumit valoare a cifrei de afaceri nu putem avea dect o singur valoare a ratei profitului.
3. Legtura statistic. Se mai numete i stocastic sau probabilist. Este tipul de
legtur cel mai des ntlnit n tiinele sociale, deci i n economie. Fiecrei valori xi a
variabilei X i corespunde o distribuie de valori ale variabilei Y. Matematic, o astfel de
legtur se exprim sub forma y = f (x) + , unde am notat prin componenta aleatoare
rezidual, datorat aciunii asupra lui Y a celorlali factori dect X. Dei s-ar putea spune c
prin luarea n considerare a tuturor factorilor care influeneaz variabila Y, legtura este
intrinsec determinist, n tiinele economice vom ntlni aproape ntotdeauna un numr foarte
mare de factori, care nu pot fi identificai i cuantificai n totalitatea lor. Asfel, funcia care l
expliciteaz pe Y are dou componente: una determnist, f ( x1 , x2 ,..., xn ) , cuprinznd
variabilele cuantificabile de care depinde Y, i una aleatoare, , cuprinznd variabilele ce nu
au putut fi cuantificate.
Sudiul legturilor dintre variabile s-a dezvoltat ntr-o disciplin aparte, numit
econometrie. n capitolul de fa nu ne propunem deci dect o introducere n aceast
problematic, fr a aborda elemente de inferen statistic specifice acestor legturi. n
cele ce urmeaz vom prezenta cteva aspecte legate de variabile i fenomenele
reprezentate de acestea, probleme att de natura aparatului statistic utilizat, ct i de
aplicabilitatea lui n contextul economic.

Analiza legturii dintre variabilele unei repartiii multidimensionale presupune


abordarea urmtoarelor probleme, care se pot constitui i n etape ce trebuie parcurse n
demersul statistic necesar:
1. Organizarea rezultatelor observrii populaiei sau eantionului n raport cu
variabilele cercetate
2. Analiza statistic a existenei legturii
3. Analiza statistic a intensitii legturii sau a gradului de asociere dintre variabilele
observate
4. Formularea unor ipoteze cu privire la forma matematic a legturii
5. Estimarea parametrilor funciei de regresie
6. Analiza reprezentativitii funciei de regresie
Aceste etape pot fi parcurse integral sau parial, n funcie de natura variabilelor. Pentru
variabilele calitative nu vor fi parcurse (n statistica descriptiv) dect primele trei,
45

deoarece posibilitile de prelucrare sunt mai reduse. n schimb, toate cele ase etape pot fi
parcurse n cazul variabilelor cantitative.

3.1. Organizarea rezultatelor observrii populaiei sau eantionului n raport cu


variabilele cercetate

n scopul utilizrii facile a informaiei culese la nivelul populaiei sau eantionului,


rezultatele observrii vor fi sistematizate ntr-o form convenabil prelucrrii lor. Se
prefer de obicei o form tabelar a prezentrii, care poate sugera unele idei de lucru
pentru etapele urmtoare, prin unele remarci cu privire la valorile pe care le-au nregistrat
variabilele.

3.2. Analiza statistic a existenei legturii

n studiul analizei existenei legturii vom folosi att elemente de statistic deja
abordate n capitolele anterioare, cum ar fi tabelele i graficele, ct i parametri
(coeficieni) specifici acestui capitol. Deoarece prezint particulariti distincte, vom
aborda separat problematica subcapitolului n funcie de tipul variabilelor.
3.2.1. Analiza statistic a existenei legturii pentru variabile calitative
Un prim instrument ce ne st la ndemn este tabelul de corelaie, un tabel cu dou
intrri, reprezentnd o repartiie bidimensional. Modul de construcie al unui astfel de
tabel se cunoate de la seriile statistice.

46

=
2

i =1 j =1

( N ij N ij ) 2
N ij

Ca o concluzie, distingem cele dou cazuri:


1) Dac 2 = 0 nu exist legtur ntre variabile
2) Dac 2 >> 0 exist legtur ntre variabile
Procedeul prezentat anterior ne permite identificarea existenei legturii dintre dou
variabile, dar nu i a intensitii acesteia. Totui, pornind de la el se pot construi
coeficieni care s ne permit i aprecierea intensitii legturii, aa cum se va vedea n
seciunile urmtoare.

3.2.2. Analiza statistic a existenei legturii pentru variabile cantitative


Aa cum s-a vzut n capitolul anterior, dac dispunem de o repartiie bidimensional,
putem descompune variana total a variabilei de explicat Y ca sum a varianelor datorate
variabilei explicative X i respectiv celorlali factori, adic:

Y2 = Y2 / X + Y2 / X
Dac nu exist legtur, adic X nu are nici o influen asupra lui Y, mediile condiionate
Y / X vor fi identice, iar dispersia lor va fi nul: Y2 / X = 0 .

Putem reine deci ca regul de decizie n statistica descriptiv:


1) Dac Y2 / X = 0 nu exist legtur ntre variabile
2) Dac Y2 / X >> 0 exist legtur ntre variabile

3.3. Analiza statistic a intensitii legturii sau a gradului de asociere dintre variabilele
observate

47

Ca i n cazul existenei legturii, o prim apreciere a intensitii se poate face pe baza


tabelului de corelaie i a norului de puncte. Cu ct frecvenele mai mari sunt mai grupate
n jurul uneia din diagonalele tabelului de exemplu sau punctele norului sunt mai grupate
n jurul unei linii, cu att legtura este mai intens. n ceea ce privete metodele cantitative
de apreciere, ele sunt mult mai precise i ne pot oferi valori numerice ale intensitii sau
gradului de asociere. Aceste metode sunt ns diferite n funcie de tipul variabilelor i de
aceea le vom aborda separat.

3.3.1. Gradul de asociere sau intensitatea legturii dintre variabilele calitative


Coeficientul de asociere (contingen) al lui Pearson
Relaia de calcul a coeficientului este:

C=

2
N + 2

unde N este volumul populaiei.


-

dac
dac
dac
dac

2 = 0 legtura este nul (lipsa legturii)


2 ( 0 ; 0,3 ) legtura este de intensitate slab
2 [ 0,3 ; 0,7 ) legtura este de intensitate medie
2 [ 0,7 ; 1 ) legtura este de intensitate puternic

3.3.2. Gradul de asociere sau intensitatea legturii dintre variabilele ordinale

Coeficientul de corelaie a rangurilor al lui Kendall

48

Pentru a putea utiliza acest indicator toate unitile populaiei trebuie s poat fi
ordonate n raport cu variabilele pentru care cercetm intensitatea legturii. Presupunem o
populaie de volum n observat n raport cu m variabile.
Pentru a putea construi coeficientul, vom defini mai nti indicatorul de
concordan (P) i respectiv indicatorul de discordan (Q). Pe baza indicatorilor de
concordan i discordan construim coeficientul de corelaie simpl a rangurilor al lui
Kendall, definit astfel:

P Q
P Q
=
P + Q n(n 1)
2

n cazul unei legturi directe de intensitate maxim, P va lua valoare sa maxim,


iar Q pe cea minim, adic: P =

n( n 1)
iar Q = 0 , deci = 1 .
2

n cazul unei legturi inverse de intensitate maxim, P va lua valoare sa minim,


iar Q pe cea maxim, adic: P = 0 iar, Q =

n( n 1)
deci = 1 .
2

n cazul lipsei legturii, P = Q , iar = 0 .


Putem determina astfel intervalul n care va fi cuprins , respectiv [-1 ; 1] .
Interpretarea intensitii legturii pe baza acestui coeficient se va face astfel:

> 0 legtura este direct


= 0 legtura este nul
< 0 legtura este invers
[0 ; 0,3) legtura este de intensitate slab

dac
dac
dac
dac

dac [0,3 ; 0,7) legtura este de intensitate medie

dac [0,7 ; 1] legtura este de intensitate puternic

Coeficientul de corelaie a rangurilor al lui Spearman

49

Ca i coeficientul similar propus de Kendall, i acesta se calculeaz pornind de la


tabelul de concordan a rangurilor. Ne vom folosi de diferenele d i dintre ranguri pentru
aceeai unitate a populaiei relativ la cele dou variabile. Coeficientul are urmtoarea
expresie:
n

=1

6 d i2
i =1
2

n(n 1)

Limitele celor doi coeficieni sunt aceleai, la fel i interpretrile valorilor numerice.

3.3.3. Intensitatea legturii dintre variabilele cantitative

Raportul de corelaie

Folosind regula de adunare a varianelor descompunem variana total a variabilei de


explicat Y ca sum a varianelor datorate variabilei explicative X i respectiv celorlali
factori, adic:

Y2 = Y2 / X + Y2 / X
Variana explicit Y2 / X este cu att mai mare cu ct mediile condiionate Y / X sunt mai
diferite ntre ele. Ceea ce le face s difere este numai influena lui X, deoarece am mprit
populaia n grupe avnd ca unic criteriu valorile lui X. Este firesc deci s folosim variana
explicit ca o mrime absolut a intensitii legturii dintre X i Y i ponderea varianei
explicite n variana total ca o mrime relativ. Raportul de corelaie are expresia:

50

RYX =

Vexp
Vtot

= 1

Vrez
Vtot

sau sub forma ei matematic:

RYX

Y2 / X
Y2 / X
=
= 1 2
Y2
Y

Pentru a-i gsi limitele ne raportm la cele dou situaii extreme:


-

dac nu exist legtur ntre X i Y, mediile condiionate Y / X sunt egale ntre ele,
deci Y2 / X = 0 i RYX = 0
dac legtura este de intensitate maxim, nu exist influene ale altor factori dect
X asupra lui Y, nu exist variaie n cadrul grupelor, deci Y2 / X = 0 i RYX = 1 .

n consecin, raportul de corelaie aparine intervalului RYX [0 ; 1] . Interpretarea


intensitii legturii pe baza acestui coeficient se va face astfel:
-

dac
dac
dac
dac

RYX
RYX
RYX
RYX

= 0 legtura este nul


[0 ; 0,3) legtura este de intensitate slab
[0,3 ; 0,7) legtura este de intensitate medie
[0,7 ; 1] legtura este de intensitate puternic.

3.4. Formularea unor ipoteze cu privire la forma matematic a legturii


Dac ntre dou variabile (ambele cantitative !) se constat existena unei legturi de o
anumit intensitate, ne punem problema posibilitii modelrii legturii printr-un model
matematic. O prim etap n acest demers este formularea unei ipoteze ct mai verosimile cu
privire la forma legturii. n acest scop, pe baza tabelului de corelaie construim norul statistic
i linia poligonal a mediilor condiionate ale variabilei dependente.

Y
Y / x4

Y / x3

Y / x2
Y / x1
51
X

n funcie de forma liniei frnte obinute i a poziiei punctelor norului fa de ea se


formuleaz o ipotez cu privire la forma funciei de regresie. Dac dorim s studiem o
legtur multipl, respectiv dependena lui Y fa de variabilele factoriale X 1 , X 2 ,..., X n atunci
pentru fiecare pereche (Y , X 1 ) , (Y , X 2 ) , (Y , X n ) desenm cte un nor statistic. Forma
general a variabilei Y n funcie de variabilele factoriale X 1 , X 2 ,..., X n se scrie:
Y = f ( X 1 , X 2 ,..., X n ) +
unde f ( X 1 , X 2 ,..., X n ) reprezint funcia de regresie care aproximeaz cel mai bine forma
legturii, iar o variabil aleatoare numit rezidual, care nsumeaz efectul altor factori
dect cei luai n calcul.
3.5. Estimarea parametrilor funciei de regresie
Este o etap care se succede firesc alegerii formei funciei. n estimarea
parametrilor va trebui s inem cont de abaterea punctelor norului fa de modelul
matematic ales Y ( X 1 , X 2 ,..., X n ) , datorat altor factori dect X 1 , X 2 ,..., X n , considerai
neeseniali, cuantificai prin variabila rezidual .
Principiul de la care se pornete n estimarea parametrilor este cel al patratelor
minime. Minimizm suma patratelor abaterilor valorilor observate ale lui Y de la nivelul
calculat prin Y ( X 1 , X 2 ,..., X n ) . Condiia de minim a sumei este echivalent cu condiia de
minim a mediei:
M [Y Y ( X 1 , X 2 ,..., X n )] = M ( 2 ) minim
2

Ecuaia Y ( X 1 , X 2 ,..., X n ) care descrie legtura dintre Y i factorii de influen


X 1 , X 2 ,..., X n se numete ecuaia de regresie. Metoda regresiei const n modelarea
legturilor statistice prin ecuaia de regresie.
Deoarece problema de minim se poate rezolva doar cunoscnd forma particular a
funciei, vom aborda estimarea parametrilor seprat, pe tipuri de funcii.
Regresia liniar
n ipoteza n care legtura dintre Y i factorii si de influen X 1 , X 2 ,..., X n este liniar,
ecuaia de regresie va fi de forma:
Y ( X 1 , X 2 ,..., X n ) = a0 + a1 X 1 + a2 X 2 + an X n

52

Coeficienii a0 , a1 , a2 ,..., an se numesc parametrii modelului i vor rezulta din minimizarea


urmtoarei funcii cu (n+1) necunoscute:

G (a0 , a1 ,..., an ) = M [Y (a0 + a1 X 1 + ... + an X n )]

Condiiile de minim constau n anularea celor (n+1) derivate pariale ale funciei
G (a0 , a1 ,.., an ) n raport cu necunoscutele a0 , a1 ,..., a n , ceea ce conduce la urmtorul sistem
de ecuaii:
G (a0 , a1 ,..., an )
= 2 M [Y (a0 + a1 X 1 + ... + an X n )] = 0

a0

G (a0 , a1 ,..., an ) = 2 M [Y (a0 + a1 X 1 + ... + an X n )] X j = 0

a j
j = 1, n

sau ntr-o form echivalent:

M (a0 + a1 X 1 + ... + an X n ) = M (Y )

M (a0 + a1 X 1 + ... + an X n ) X n = M (Y ) X j

j = 1, n

de unde rezult:

a0 + a1M ( X 1 ) + ... + an M ( X n ) = M (Y )

a0 + a1M ( X 1 X j ) + ... + an M ( X n X j ) = M (YX j )

j = 1, n

Prin rezolvarea acestui sistem liniar de ecuaii n raport cu necunoscutele a0 , a1 ,..., a n , se


obin valorile parametrilor ecuaiei de regresie. Astfel, legtura statistic dintre Y i
X 1 , X 2 ,..., X n este modelat prin aproximare cu o legtur funcional. Pentru cazul cu doi
factori X 1 i X 2 , ecuaia de regresie se scrie:
Y ( X 1 , X 2 ) = a0 + a1 X 1 + a 2 X 2

iar sistemul de ecuaii devine:


a0 + a1 M ( X 1 ) + a 2 M ( X 2 ) = M (Y )

2
a0 M ( X 1 ) + a1 M ( X 1 ) + a 2 M ( X 1 X 2 ) = M (YX 1 )

2
a0 M ( X 2 ) + a1 M ( X 1 X 2 ) + a 2 M ( X 2 ) = M (YX 2 )

Prin substituia lui a 0 din prima ecuaie i nlocuirea lui n celelalte, obinem:

53

a1 M ( X12 ) [M ( X1 )]2 + a2 [M ( X1 X 2 ) M ( X1 )M ( X 2 )] = M (YX1 ) M (Y )M ( X1 )

a1[M ( X1 X 2 ) M ( X1 )M ( X 2 )] + a2 M ( X 22 ) [M ( X 2 )]2 = M (YX2 ) M (Y )M ( X 2 )

Dac pentru a aduce la o form mai simpl notm cu:

mij = M [ X i M ( X i )] [ X j M ( X j )] = M ( X i X j ) M ( X i )M ( X j )

care reprezint covariaia dintre variabilele X i i X j , obinem:

a1m11 + a2 m12 = m01

a1m12 + a2 m22 = m02

de unde putem obine valorile parametrilor:

a1 =

m01m22 m12 m02


m11m22 m122

a2 =

m11m02 m12 m01


m11m22 m122

De aici l vom deduce i pe a 0 , care a fost substituit n prima ecuaie. Astfel,


a0 , a1 , a 2 sunt valorile parametrilor modelului liniar cu trei variabile. nlocuind valorile
parametrilor n ecuaia de regresie se obine:
m11

m12

m21

m22

(Y ( X 1 , X 2 ) M (Y ) )

m10

m11

m20

m21

m10

m12

m20

m22

( X 1 M ( X 1 )) +

( X 2 M ( X 2 )) = 0

Pentru a face relaia mai accesibil, introducem matricea de variaie i covariaie:

( 3)

m00

= m10
m
20

m01
m11
m21

m02

m12
m22

i notnd complementul algebric al elementului m0 j cu M oj(3) , j = 0,1,2 ecuaia de regresie


devine:

54

M 00(3) (Y ( X 1 , X 2 ) M (Y ) ) M 01(3) ( X 1 M ( X 1 ) ) + M 02(3) ( X 2 M ( X 2 ) ) = 0

Pentru cazul mai general al legturii liniare dintre Y i X 1 , X 2 ,..., X n , matricea de variaie
i covariaie este:

M ( n+1)

m00

m
= 10
...

m
n0

m01 ... m0 n

m11 ... m1n


... ... ...

mn1 ... mnn

iar ecuaia de regresie se poate scrie:


( n+1)
(Y ( X1, X 2 ) M (Y )) M01(n+1) ( X1 M ( X1)) + ... + M0(nn+1) ( X n M ( X n )) = 0
M 00

Matricea de variaie i covariaie M ( n+1) este simetric n raport cu prima diagonal.


Elementele mii de pe diagonala principal sunt varianele variabilelor Y , X 1 , X 2 ,..., X n , iar
elementele mij , i j reprezint covarianele dintre variabilele corespunztoare.

Regresia liniar simpl


n cazul regresiei liniare simple, cu variabila endogen Y i factorul X 1 , matricea de
variaie i covariaie este:

m
M ( 2) = 00
m10

m01

m11

iar ecuaia de regresie devine:


m11 (Y ( X ) M (Y ) ) m10 ( X 1 M ( X 1 ) ) = 0

de unde l putem exprima pe Y (X ) ca:

Y (X ) =

m10
m
X 1 + M (Y ) 10 M ( X 1 )
m11
m11

de unde rezult coeficienii:

55

a0 = M (Y )
a1 =

m10
M ( X1)
m11

m10
X1
m11

Regresia parabolic
n economie sunt numeroase exemplele n care legtura dintre fenomene i deci
variabilele care le cuantific nu este liniar. Dac Y reprezint recolta la hectar dintr-un
produs agricol, iar X cantitatea de ngrminte, ne vom da seama chiar i intuitiv c o
anumit cretere a lui X nu provoac aceeai cretere a lui Y pe tot intervalul de variaie al
celor dou variabile. La valori mari ale cantitii de ngrminte, acestea provoac
saturaie sau chiar nocivitate, ducnd la o stagnare, respectiv diminuare a produciei. Alte
exemple pot fi: legtura dintre vechimea n munc i mrimea salariului, dintre cheltuielile
cu publicitatea i volumul vnzrilor, etc.
Determinarea parametrilor funciei parabolice de regresie se poate face fie aplicnd
direct funciei metoda patratelor minime, fie prin reducerea la cazul liniar prezentat
anterior. n ambele cazuri vom exemplifica pentru parabola de ordinul doi.

a) Estimarea parametrilor prin aplicarea direct a metodei patratelor minime


Ecuaia de regresie a modelului se scrie:
Y ( X ) = a0 + a1 X + a2 X 2

Din condiia de minimizare a expresiei:

G (a0 , a1 , a2 ) = M [Y Y ( X )]

avem urmtoarele egaliti:

G (a0 , a1 , a2 )
=0
a0
G (a0 , a1 , a2 )
=0
a1
G (a0 , a1 , a2 )
=0
a 2

56

din care rezult sistemul de ecuaii:

[
[(
[(

]
) ]
) ]

2M Y (a0 + a1 X + a2 X 2 ) = 0

2
2M Y (a0 + a1 X + a2 X ) X = 0

2
2
2M Y (a0 + a1 X + a2 X ) X = 0

care este echivalent cu:

a0 + a1M ( X ) + a2 M ( X 2 ) = M (Y )

2
3
a0 M ( X ) + a1M ( X ) + a2 M ( X ) = M (YX )

2
3
4
2
a0 M ( X ) + a1M ( X ) + a2 M ( X ) = M (YX )

Rezolvnd acest sistem n necunoscutele a0 , a1 , a2 , rezult parametrii ecuaiei de regresie


parabolice. n mod asemntor se poate proceda pentru orice regresie neliniar.

b) Estimarea parametrilor prin reducerea la cazul liniar


Avnd modelul parabolic de ecuaie:
Y ( X ) = a0 + a1 X + a2 X 2

facem substituiile:

X = X1
X 2 = X2
dup care ecuaia devine:
Y ( X 1 , X 2 ) = a0 + a1 X 1 + a 2 X 2

care reprezint un model liniar cu doi factori. Elementele matricei de variaie i covariaie
vor arta astfel:
m00 = M (Y 2 ) ( M (Y )) 2 = Y2

57

m01 = m10 = M (YX ) M (Y ) M ( X ) = cov(Y , X )


m02 = m20 = M (YX 2 ) M (Y ) M ( X 2 ) = cov(Y , X 2 )

m11 = M ( X 2 ) ( M ( X )) 2 = X2
m12 = M ( X 3 ) M ( X ) M ( X 2 ) = cov( X , X 2 )

m22 = M ( X 4 ) ( M ( X 2 )) 2 = X2 2
Problema regresiei neliniare pentru cazul unei parabole de gradul doi se reduce astfel la o
problem de regresie liniar, care se rezolv conform cazului liniar. n cazul mai general,
dac ecuaia de regresie este un polinom de gradul n:
Y ( X ) = a0 + a1 X + a2 X 2 + ... + an X n

efectund substituiile:
X = X 1 ; X 2 = X 2 ; ... ; X n = X n

obinem cazul liniar n raport cu (n+1) variabile.


Regresia exponenial
Dac ecuaia de regresie are form exponenial:
Y (X ) = a bX
se ncearc aducerea la forma liniar. Mai nti se logaritmeaz ecuaia:
lg Y ( X ) = lg a + X lg b
iar apoi se fac substitiiile:
Z ( X ) = lg Y ( X )
a0 = lg a
a1 = lg b
Rezult astfel modelul liniar simplu:

58

Z ( X ) = a0 + a1 X

Regresia hiperbolic
Dac ecuaia de regresie are form hiperbolic:

Y (X ) = a + b

1
X

se face substituia:

X1 =

1
X

de unde rezult modelul liniar:


Y ( X 1 ) = a + bX 1
n matricea de variaie i covariaie elementele vor fi:
m00 = M (Y 2 ) ( M (Y )) 2 = Y2

1
m01 = m10 = M Y M (Y ) M
X
X

1 1
m11 = M 2 M
X X

1
= cov Y ,

2
= 1 / X

Alte tipuri de regresie


n practica economic se ntlnesc frecvent i alte tipuri de funcii (unele chiar
funcii compuse). Principiul de lucru pentru estimarea parametrilor va rmne ns
ntotdeauna acelai: ncercarea de a aduce funcia la o form liniar.
Foarte des ntlnite sunt funciile de producie. Forma general a acestora este:
Y ( X 1 , X 2 ,..., X n ) = a X 1m1 X 2m2 ... X nmn

Printr-o astfel de funcie se definete o legtur ntre nivelul produciei Y i factorii de care
aceasta depinde: productivitatea muncii, calificarea forei de munc, gradul de nzestrare

59

cu capital fix, etc. Determinarea parametrilor se face prin reducere la cazul liniar prin
logaritmare:
lg Y ( X 1 , X 2 ,..., X n ) = lg a + m1 lg X 1 + ... + mn lg X n

Dac n aceast nou ecuaie facem substituiile:

Z ( X 1 , X 2 ,..., X n ) = lg Y ( X 1 , X 2 ,..., X n )
X i ' = lg X i , i = 1, n
reducem ecuaia la una liniar multipl.
4.6. Analiza reprezentativitii funciei de regresie
Coeficientul de corelaie
Construcia lui este similar cu a raportului de corelaie, cu deosebirea c variana n
fiecare grup este calculat folosind suma patratelor abaterilor fa de valorile ajustate prin
funcia de regresie i nu fa de media grupei. Ca urmare, coeficientul de corelaie va fi
specific fiecrei funcii n parte. Expresia lui de calcul (admis aici fr demonstraie) este:
det M
rYX = 1
m00 M 00

rYX [0 ; 1]
Interpretarea acestui coeficient n funcie de valorile pe care le poate lua este urmtoarea:
- dac rYX [0 ; 0,3] funcia nu este reprezentativ pentru modelarea legturii dintre
variabile
- dac rYX (0,3 ; 0,7] funcia are o reprezentativitate medie pentru modelarea
legturii dintre variabile
- dac rYX (0,7 ; 1] funcia este foarte reprezentativ pentru modelarea legturii
dintre variabile
Aceste limite nu trebuie interpretate foarte rigid. Valorile coeficienilor este bine s fie
comparate cu ale altor coeficieni, ai altor funcii. Pentru aceeai repartiie de exemplu, pentru
funciile de regresie alese ca fiind posibilecalculm coeficienii de corelaie i l reinem pe cel
mai mare, considernd acea funcie ca fiind cea mai reprezentativ.
n cazul regresiei liniare simple, formula coeficientului poate fi adus la o form
echivalent mai simpl:
m
M ( 2) = 00
m10

m01

m11

60

rYX = 1
=

m m m01 m10
det M
= 1 00 11
=
m00 M 00
m00 m11
m01

m00 m11

m01 m10
=
m00 m11

M ( XY ) M ( X ) M (Y )
Y X

4.7. Corelaia parial


Prin corelaie simpl am studiat legtura liniar dintre doi factori neglijnd influena celorlali
factori, care acioneaz n acelai timp asupra variabilei endogene. n corelaia multipl am
msurat influena simultan a dou sau mai multe variabile exogene asupra celei endogene.
Ne punem ns problema de a msura influena unei variabile independente asupra celei
dependente, presupunnd celelalte variabile la un nivel constant.
Fr a recurge la demonstraii, vom da modul de calcul al coeficienilor de corelaie parial
pentru dou cazuri:
a) Cazul unei variabile dependente Y i dou variabile independente X1 i X2:
- corelaia dintre Y i X1, neglijnd influena lui X2:

rYX1 X 2 =

rYX1 rYX 2 rX 1 X 2

(1 r ) (1 r )
2
YX 2

2
X1 X 2

- corelaia dintre Y i X2, neglijnd influena lui X1:

rYX 2 X 1 =

rYX 2 rYX 1 rX 1 X 2

(1 r ) (1 r )
2
YX 1

2
X1 X 2

b) Cazul unei variabile dependente Y i trei variabile independente X1, X2 i X3:


- corelaia dintre Y i X1, neglijnd influena lui X2 i X3:

rYX1 X 2 X 3 =

rYX 1 X 2 rYX 3 X 2 rX1 X 3 X 2

(1 r

2
YX 3 X 2

) (1 r

2
X1 X 3 X 2

- corelaia dintre Y i X2, neglijnd influena lui X1 i X3:

rYX 2 X 1 X 3 =

rYX 2 X 1 rYX 3 X 1 rX 1 X 3 X 2

(1 r

2
YX 3 X 1

) (1 r

2
X 2 X 3 X1

- corelaia dintre Y i X3, neglijnd influena lui X1 i X2:

rYX 3 X 1 X 2 =

rYX 3 X 1 rYX 2 X 1 rX 2 X 3 X 1

(1 r

2
YX 2 X 1

) (1 r

2
X 2 X 3 X1

Aceste formule ale coeficienilor de corelaie parial se pot generaliza i pentru cazul a k
variabile independente.

Probleme propuse
61

Problema 1

Cunoatem urmtoarea distribuie a 52 de societi comerciale cu acelai profil de activitate,


n raport cu variabilele X cheltuielile cu publicitatea (mil. lei) i Y - volumul vnzrilor (mil.
lei).
X
Y
( 600 ; 800 ]
( 400 ; 600 ]
[ 200 ; 400 ]
Total

[ 30 ; 50 ]

( 50 ; 70 ]

( 70 ; 90 ]

Total

2
3
14
19

7
10
2
19

8
5
1
14

17
18
17
52

Se cere:
1)
Pe baza unui grafic adecvat s se emit ipoteze privind forma posibil a funciei de
regresie.
2)
n ipoteza unei forme liniare a dependenei dintre Y i X, s se calculeze parametrii
funciei de regresie.
3)
S se studieze reprezentativitatea funciei de regresie pentru modelarea legturii dintre
cele dou variabile.
4)
Care este valoarea medie a volumului vnzrilor pentru un nivel al cheltuielilor cu
publicitatea de 55 milioane lei ?
5)
Aceleai cerine de la punctele 2, 3 i 4 pentru o form parabolic a dependenei dintre
Y i X.
Problema 2

Un produs a fost lansat simultan pe 13 piee. Pe aceste piee, produsul a fost propus la
preuri diferite (P), veniturile consumatorilor (V) fiind i ele diferite. Pentru fiecare piat sa nregistrat un anumit nivel al cererii (C), rezultatele fiind sintetizate n tabelul urmtor:
Nr.
crt.

Cerere (C)

Pre (P)

Venit (V)

15,4

1,4

620

3,2

5,1

530

4,9

2,5

490

10,5

1,7

800

8,0

1,8

630

5,1

3,4

410

62

7,6

2,1

670

11,3

1,6

920

14,0

3,6

990

10

6,4

3,5

320

11

13,2

1,9

520

12

8,8

1,8

700

13

12,1

1,9

730

Se cere:
1) S se formuleze ipoteze cu privire la forma legturii dintre cerere (C) i pre (P). Pentru
formele funciilor de regresie reinute ca fiind posibile, s se calculeze parametrii funciilor i
reprezentativitatea acestora.
2) Similar pentru legtura dintre cerere i venit.
3) S se calculeze parametrii funciei care modeleaz legtura liniar multipl dintre cerere i
factorii si e influen. Analizai reprezentativitatea acestei funcii n raport cu
reprezentativitatea funciilor de regresie simple. Care va fi valoarea estimat a cererii pe o
pia unde preul de vnzare va fi 3,2 iar venitul mediu al consumatorilor de 550 ?

63

Bibliografie:
1. Buiga, A., Drago C., Lazr D., Parpucea I., Statistic descriptiva, Ed. Mediamira,
Cluj-Napoca, 2010;
2. DROSBEKE J. J., lments de statistiques , Ed. Ellipses , Bruxelles , 1988
3. BUIGA A., DRAGOS C., LAZAR D., PARPUCEA I., TODEA A., "Statistica I", Ed.
PUC, 2003
4. GOLDFARB B. , PARDOUX C. , Introduction la mthode statistique , Ed.
Dunod , Paris , 1995
5. PY B. , Statistique descriptive , Ed. Economica , 1990
6. ROGER P. , Statistique pour la gestion , Ed. Management et socit , Caen , 2000
7. TASSI P. , Mthodes Statistiques , Ed. Economica , Paris , 1991
8. WONNACOTT T.H. , WONNACOTT R.J. , Statistique. conomie-GestionSciences-Mdecine , Ed. Economica , Paris , 1991

64

MODULUL 4
ANALIZA SI PREVIZIUNEA SERIILOR DE TIMP

Obiective

Intelegerea si aplicarea metodelor de calcul a indicilor factoriali in analiza dinamicii


indicatorilor economici;
Cuantificarea dinamicii medii a unui indicator;
Cunoasterea si utilizarea metodelor cantitative de previziune. Metoda clasica de
descompunere a unei serii de timp.

Concepte de baza

Indice al variatiei integrale, indice factorial, indice al pretului;


Nivel mediu al unei serii de timp, indice mediu, ritm mediu, diferenta medie absoluta;
Serie de timp, model dinamic, functii de tendinta, coeficientii sezonalitatii, ciclicitate
Medii mobile, previziune, erori de previziune, netezire exponentiala.

Rezultate asteptate
Studentul intelege notiunile de indice factorial, nivel mediu, indice mediu, ritm mediu si
stapaneste modalitatile de calcul a acestora. Utilizeaza metode cantitative in previziune; in
acest sens, identifica componentele prezente intr-o serie de timp, modeleaza si extrapoleaza
tendinta, utilizeaza adecvat o medie mobila, modeleaza componenta sezoniera si ciclica,
utilizeaza metoda netezirii exponentiale in netezire si previziune.

Sinteza
4.1. INDICII STATISTICI
4.1.1. Indicii statistici: definiii i tipologii
Studiul fenomenelor economice i sociale presupune n marea majoritate a cazurilor i
msurarea variaiei unor mrimi. Aceast variaie poate fi urmrit n timp, spaiu sau relativ
la nite categorii. Se va folosi termenul generic de stare, notndu-se cu j starea luat ca baz
de comparaie i cu k cea cercetat n raport cu aceasta. Se va nota cu Z mrimea care
constituie obiectul de studiu, variaia acesteia putnd fi exprimat att sub form absolut, ct
i relativ.
Dintre exprimrile sub form relativ un loc deosebit de important l ocup indicele
statistic. n practic variaia total a variabilei Z este datorat variaiei unor alte variabile a
cror evoluie ntre dou stri j i k influeneaz evoluia lui Z. Avem de a face, aadar, cu Z
de forma Z = f ( X 1 , X 2 , K , X m ) . Un astfel de model este un model de tip determinist n care
cei m factori determin n totalitate nivelul lui Z . In cazul unui astfel de model se pot
distinge trei categorii de indici:
1) indicele variaiei totale (integrale) a mrimii Z :

Z (k ) f ( X 1 (k ), X 2 (k ),K, X m (k ) )
=
Z ( j ) f ( X 1 ( j ), X 2 ( j ),K, X m ( j ) )
2) indici ai factorilor X i (individuali sau elementari):
I Zk / j =

65

I Xk i/ j =

X i (k )
X i ( j)

3) indici ai variaiei partiale ale lui Z sau indici factoriali: I Zk // Xj i - ne arat de cte ori s-a
modificat Z n starea k fa de starea j sub influena exclusiv a factorului X i .
4.1.2. Indicii factoriali
Indicii factoriali de tip Laspeyres. Acest indice este cel mai cunoscut i utilizat n practica
economic. Mai poart i denumirea de indicele preurilor. Dac se consider un co de r
r

produse sau bunuri, volumul valoric al acestora (Z ) se va calcula dup relaia: Z = p i qi .


i =1

Indicele factorial al preurilor calculat prin metoda Laspeyres va avea expresia:


r
r
pi (k )
pi ( j ) qi ( j )
p
(
k
)
q
(
j
)

i
i
i =1 p i ( j )
k/ j
i =1
I Z / p (L) = r
=
r
pi ( j ) q i ( j )
pi ( j )q i ( j )
i =1

i =1

iar indicele factorial al cantitilor (volumului fizic), expresia:


r

k/ j
Z /q

( L) =

p ( j ) q (k )
i =1
r

p ( j )q ( j )
i =1

unde pi ( j ) i pi (k ) sunt preurile din perioada de baz i perioada curent, q i ( j ) sunt


cantitile din perioada de baz, iar k i msoar importana1 produsului sau bunului i n coul
indicelui la momentul baz de comparaie.
Pentru cazul general, cnd Z depinde de m factori de influen, iar forma funciei f
este oarecare, Florea (1986) deduce o regul pentru elaborarea indicilor factoriali de tip
Laspeyres.
Indicii factoriali de tip Paasche. Acest indice a aprut tot ca un indice al preurilor,
indicele factorial de pre de tip Paasche avand expresia:
r

k/ j
Z/p

(P ) =

p ( k )q ( k )
i =1
r

p ( j )q (k )
i =1

iar cel factorial al cantitilor (volumului fizic), expresia:


r

k/ j
Z /q

( P) =

p (k )q (k )
i =1
r

p (k )q ( j )
i =1

Pentru o funcie oarecare f , n care mrimea Z depinde de m factori, in


Florea(1986) este prezentata o generalizare.

66

Indicii factoriali de tip Fisher. In 1922, I. Fisher propune o nou expresie de calcul a
indicelui preurilor. Acesta se va obine ca o medie geometric a indicilor de pre de tip
Laspeyres i Paasche, astfel:
I Zk // pj ( F ) = I Zk // pj (L) I Zk // pj (P)
De aceeai manier se obine i indicele de volum:
I Zk // qj ( F ) = I Zk // qj ( L) I Zk // qj ( P)
Indicii factoriali generai prin Metoda Drumului Factorilor (MDF). Indicele factorial al
unei variabile Z = f ( X 1 , K , X m ) , n raport cu factorul X i , obinut prin MDF este dat de
relaia (Florea, 1989):
f ' X i ( X 1 , K, X m )
I Zk // Xj i = exp
dX i
(Pj , Pk ) f ( X 1 , K , X m )
unde

(P , P )
j

reprezint poriunea arcului din drumul factorilor cuprins ntre punctele

Pj ( X 1 ( j ), K , X m ( j ) ) i

Pj ( X 1 (k ), K , X m (k ) ) , acest drum fiind descris de ecuaiile

parametrice X 1 = X 1 ( ), K , X m = X m ( ) , fiind n general un parametru legat de timp.

Exemple. Indicii factoriali calculati prin metoda Laspeyres.


1. O societate hotelier dispune de 3 tipuri de locuri de cazare: camere cu un singur
pat(single), camere cu dou paturi(double) i apartamente. Numrul de camere nchiriate (X)
i tariful practicat (Y) n dou luni consecutive sunt date n tabelul urmtor:
Luna j
Luna k
X
Y()
X
Y()
Tipul
camerei
Single
Double
Apartament

80
50
20

30
40
50

110
60
25

35
40
45

Volumul valoric al ncasrilor din nchirierea camerelor (Z) se va calcula dup relaia:
3

Z = X i Yi . Indicii factoriali de tip Laspeyres vor fi:


i =1

k/ j
Z/X

(L) =

(k )Yi ( j )

( j )Yi ( j )

i =1
3

i =1

110 30 + 60 40 + 25 50
= 1,287 volumul valoric al
80 30 + 50 40 + 20 50

ncasrilor a crescut n luna k fa de luna j de 1,287 ori sub influena modificrii numrului
3

de camere nchiriate. I

k/ j
Z/X

( L) =

( j )Yi (k )

( j )Yi ( j )

i =1
3

i =1

80 35 + 50 40 + 20 45
= 1,055 volumul
80 30 + 50 40 + 20 50

valoric al ncasrilor a crescut n luna k fa de luna j de 1,055 ori sub influena modificrii
tarifului practicat.

2. Se consider mrimea Z ca fiind profitul brut al unei societi i factorii X - veniturile


totale respectiv Y - cheltuielile totale ale aceleai societi. Modelul care leag cele trei
mrimi va fi de forma: Z = X Y . In doi ani consecutivi variabilele X i Y au nregistrat
valorile:

67

Anul

t 1

Variabila
X (mld lei)
Y (mld. Lei)

10
8

12
9

Expresiile i valorile indicilor factoriali de tip Laspeyres sunt:


X (t ) Y (t 1)
12 8
=
= 2 profitul brut a crescut n anul t fa de
- I Zt //tX1 (L) =
X (t 1) Y (t 1) 10 8
anul t 1 de 2 ori sub influena modificrii veniturilor totale;
10 9
X (t 1) Y (t )
=
= 0,5 profitul brut a sczut n anul t fa
- I Zt //tY1 ( L) =
X (t 1) Y (t 1) 10 8
de anul t 1 de 0,5 ori sub influena modificrii cheltuielilor totale.

4.1.3. Indicii factoriali de tip Laspeyres, Paasche i Fisher prin prisma abordrii
axiomatice
Abordarea axiomatic se bazeaz pe stabilirea unor seturi de proprieti pe care un indice
statistic trebuie s le verifice (Buiga & all, 2003).
4.1.4. Principalii indici utilizai n economie
Indicele preurilor de consum este un indice de tip Laspeyres cu bazfixa:
n

t/0
Z/p

(L) =

p (t )q (0)
i =1
n

p ( 0) q ( 0)
i =1

p i ( 0) q i ( 0)

i =1

p ( 0) q ( 0)

i =1

n
p i (t )
= k i (0) I tpi/ 0
pi (0) i =1

unde: n - reprezint numrul de mrfuri i servicii din coul indicelui;


k i (0) - reprezint structura de consum, fiind ponderea mrfii sau serviciului i
n consumul populaiei;
pi (0) i pi (t ) sunt preurile nregistrate de marfa sau produsul i n perioada
de baz i perioada curent;
Ponderile k i (0) sunt obinute prin Ancheta Integrat n Gospodrii i rezult din
structura cheltuielilor medii lunare efectuate de o gospodrie pentru cumprarea mrfurilor i
plata serviciilor necesare satisfacerii nevoilor de trai; aceste ponderi se actualizeaz la
intervale de civa ani. Preurile corespunztoare celor n mrfuri i servicii din coul
indicelui se culeg lunar, n urma unei cercetri selective organizate de Institutul National de
Statistic.

Indicele produciei industriale msoar evoluia de ansamblu a preurilor produselor i


serviciilor industriale fabricate i livrate de productorii interni n perioada curent fa de
perioada de baz, n primul stadiu de comercializare a produselor sau serviciilor. ndicele
utlizat este tot un indice de tip Laspeyres.
Indicele salariilor msoar evoluia salariilor n perioada curent fa de perioada de
baz. Alturi de indicele preurilor de consum este folosit n evaluarea nivelului de trai. Se
utilizeaz, de asemenea, un indice de tip Laspeyres, care msoar variaia fondului de salarii
total (Z ) sub influena modificrii salariilor medii S i corespunztoare ramurii i .
Indicii bursieri. Principalii indici bursieri se difereniaz prin mai multe elemente:
eantionarea, respectiv alegerea titlurilor din coul indicelui, reprezentativitate, modul de

68

calcul utilizat i natura variabilelor luate n calcul. Cei mai cunoscui i urmrii indici
bursieri, cu excepia familiei de indici Dow Jones se calculeaza ca si indici Laspeyres.
4.2. PREVIZIUNEA SERIILOR DE TIMP
n derularea activitii lor, frecvent agenii economici sunt pui n situaia de a anticipa
viitorul, iar apoi de a lua decizii n consecin. Oamenii de afaceri sunt nevoii s previzioneze
anual cifra de afaceri i alte elemente necesare ntocmirii unui plan de afaceri, investitorii sunt
interesai de profitul viitor degajat de investiie, respectiv guvernele de previziunea
consumului sau a cheltuielilor guvernamentale etc.. Obinerea rapid de previziuni utiliznd
modele cantitative de previziune este la ndemna analitilor, urmare i a softurile de statistic
accesibile i uor de exploatat.
Anticiparea, previziunea evoluiei viitoare a fenomenelor economice presupune n primul
rnd cunoaterea istoriei acestora, punerea n eviden a unor legiti privind comportamentul
lor trecut. Baza de date pe care se fundamenteaz analiza evoluiei fenomenelor n timp este
constituit din serii cronologice.
4.2.1. Indicatori medii specifici seriilor cronologice
a) Nivelul mediu (valoarea medie). Nivelul mediu reprezint nivelul teoretic atins de
indicator n condiiile n care evoluia sa ar fi constant n timp, factorii ce-i determin
evoluia ar aciona cu aceeai intensitate pe ntreaga perioad de timp analizat.
Modul de determinare a volumului fenomenului difer dup cum seria este de intervale
respectiv de momente.
Pentru serii cronologice de intervale nivelul mediu este:
y + y 2 + ... + y n
Y= 1
n
Pentru serii cronologice de momente nivelul mediu este definit de urmtoarea relaie:

Y=

tn

t1

y (t )dt

tn

t1

.
dt

Daca se aproximeaz evoluia indicatorului y (t ) ca fiind liniar ntre dou momente


consecutive de timp, rezulta:

T + Tn 1
T
T1
T + T2
+ y2 1
+ ... + y n 1 n 2
+ y n n 1
2
2
2
2
Y=
T1 + T2 + ... + Tn 1
relaie numit medie cronologic ponderat.
Daca nivelul indicatorului se nregistreaz la momente echidistante ( T1 = T2 = .... = Tn 1 ),
atunci relaia anterioar devine:
y1
y
+ y 2 + .... + y n 1 + n
2
Y= 2
n 1
i reprezint media cronologic simpl.
y1

b) Indicele mediu. Ritmul mediu


Pentru calculul acestui indicator se ntlnesc n literatur mai multe abordri.
Indicele mediu este parametrul modelului autoregresiv:
yt = I y y t 1 + t , t = 2, 3,..., n

69

Utiliznd metoda celor mai mici ptrate pentru estimarea parametrului I y ,


urmtoarea expresie de calcul a indicelui mediu:
n

Iy =

y
t =2

t 1

se obine

yt

y
t =2

2
t 1

Metoda este ntlnit n practic sub denumirea de metoda autoregresiv.


O alta expresie de calcul, adecvat pentru indicatori ce evolueaz aproximativ
exponenial este urmatoarea:

I y = n 1

yn
y1

Ritmul mediu R y se determin pornind de la indicele mediu:


R y = I y 1 sau R y (%) = I y 100 100 .
c) Diferena medie absolut
Expresia de calcul a diferenei medii absolute:
n

y =

( yt yt 1 ) ty/ t 1
t =2

n 1

t =2

n 1

sau echivalent:
y =

y n y1
.
n 1

4.2.2. Componentele unei serii cronologice. Modelul clasic de descompunere


O serie cronologic este o secven de observaii asupra unei variabile, ordonate dup
parametrul timp. Frecvent, msurtorile asupra variabilei sunt efectuate la intervale egale de
timp, seria cronologic fiind prezentat sub forma:
1 2 ... t ... n

Y :
y1 y 2 ... y t ... y n
n abordarea tradiional, fluctuaiile din seriile cronologice sunt privite ca o rezultant a
suprapunerii urmtoarelor componente: tendina T, componenta ciclic C, sezonier S
respectiv rezidual E. Primele trei componente sunt considerate deterministe, sistematice,
determinate de factori cu aciune continu asupra fenomenului, n timp ce componenta
rezidual are caracter aleator fiind efectul aciunii unor factori imprevizibili, accidentali.
Modelul clasic de descompunere a seriilor cronologice este de regul:
aditiv: Y = T + C + S + E sau
multiplicativ: Y = T C S E respectiv
o combinaie mixt a componentelor seriei.
Tehnicile de analiz, in acest context, au ca obiective:
- separarea fiecrei componente i modelarea comportamentului su, respectiv

70

- previziunea evoluiei fiecrei componente, iar apoi compunerea acestora n scopul


obinerii de previziuni privind evoluia fenomenului Y. Principiul de la baza acestei tehnici
este descompune pentru a modela iar apoi recompune.
4.2.3. Estimarea componentei de tendin
Funcii elementare utilizate n modelarea tendinei
Cele mai uzuale funcii utilizate pentru modelarea tendinei indicatorilor din economie
sunt redate n tabelul 1..
Tabelul 1. Funcii elementare utilizate n modelarea tendinei
Tendin
Forma liniarizat
Diferene aprox. Constante
liniar
ty/ t 1 = y t y t 1
Tt = a + bt
t / t 1
( 2)
parabol
T = a + bt + cX
y
= t y/ t 1 ty1 / t 2
2
Tt = a + bt + ct unde X = t
hiperbol
Tt = a + b

1
t

exponenial
Tt = a b t

putere
Tt = a t b

logaritmic
Tt = a + b ln t

T = a + bX

tty/ t 1 = ty t (t 1) y t 1

1
t
Z = A + Bt
unde
Z t = ln Tt ;

tln/ ty1 = ln y t ln y t 1

unde X =

A = ln a; B = ln b
Z = A + bX
unde
Z t = ln Tt ;
A = ln a; X = ln t
T = a + bX
unde X = ln t

curba logistic
a
Tt =
,
1 + e b ct
a, c > 0

Stabilirea funciei adecvate pentru modelarea tendinei


n acest scop sunt utile urmtoarele precizri:
cronograma seriei iniiale sau a valorilor netezite sugereaz funciile candidate, numite
i linii posibile de tendina;
cea mai adecvat funcie pentru modelarea tendinei poate fi considerat aceea pentru
2
care se realizeaz minimul sumei ptratelor reziduurilor min ( y t Tt ) ;
t

este adecvat tendina liniar atunci cnd diferenele absolute cu baza n lan
ty/ t 1 = y t y t 1 sunt aproximativ constante. De asemenea, precizri specifice n acest
sens pentru parabol, exponenial respectiv hiperbol gsim n tabelul 1.

71

Estimarea parametrilor tendinei. Pentru estimarea parametrilor tendinei liniare


Tt = a + bt
se utilizeaz metoda celor mai mici ptrate, expresiile de calcul a parametrilor a, b sunt deci
urmtoarele:
n

b=

(t t )( y
t =1

Y)
,

(t t )

t =1

a = Y bt ,
sau echivalent
b=

M (tY ) M (t ) M (Y )
,
M (t 2 ) [ M (t )]2

a = Y bt .
Seria prezint o tendin de cretere atunci cnd b > 0 respectiv de descretere dac b < 0.
Cu excepia curbei logistice, celelalte funcii neliniare din tabelul1 pot fi aduse la o form
liniarizat prin anumite substituii, respectiv prin aplicarea operaiei de logaritmare n cazul
funciei exponeniale i a funciei putere.

Exemplu. Estimarea tendinei liniare


Indicele lunar al preului produciei industriale pentru piaa intern, n perioada ianuarie
1999 iunie 2000 baza de comparaie 1996, a avut o tendin cresctoare:
Luna
(t)
Indice
(yt)

10

11

12

13

14

15

16

17

18

3.7

3.8

4.1

4.3

4.5

4.8

4.9

5.1

5.3

5.5

5.6

5.8

6.0

6.2

6.3

6.5

6.6

7.0

Cronograma seriei sugereaz prezena unei tendine liniare, peste care se suprapune o
component aleatoare de amplitudine redus:
yt = a + bt + t , t = 1, 2,...,18.
Parametrii tendinei se determin din relaiile:
M (tY ) M (t ) M (Y )
b=
2
M (t 2 ) [M (t )]
a = M (Y ) bM (t ).

Figura 1. ---- Indice pre productie industrial; ------ Tendina

72

Exemplificm din calculele intermediare:


1 + 2 + L + 18
= 9 .5
M (t ) =
18
3 .7 + 3 .8 + L + 7 .0
= 5.33
M (Y ) =
18
(1 3.7) + (2 3.8) + L + (18 7.0)
M (tY ) =
= 55.72
18
12 + 2 2 + L + 18 2
2
M (t ) =
= 117,2
18
rezultnd
55.72 9.5 5.33
b=
= 0.19,
117.2 (9.5) 2
a = 5.33 0.19 9.5 = 3.55.
Tendina seriei se estimeaz prin funcia de gradul nti:
Tt = 3.55 + 0.19t ,
al crei grafic este redat n figura 1.
4.2.4. Estimarea componentelor deterministe n cazul seriilor sezoniere
Presupunem n acest paragraf c seria cronologic prezint tendin, sezonalitate i o
component aleatoare. Vom prezenta modul de estimare a tendinei respectiv a componentei
sezoniere.
4.2.4.1. Modelul de descompunere. Perioada componentei sezoniere
Pentru alegerea modelului de descompunere este indicat a se analiza cronograma seriei.
n general, este adecvat un model aditiv atunci cnd amplitudinea oscilaiilor este
aproximativ constant respectiv multiplicativ dac amplitudinea crete sau scade n timp.
Frecvent n practic este mai adecvat modelul multiplicativ.
Perioada componentei sezoniere, notat cu p, reprezint numrul unitilor de timp
din cadrul unui ciclu sezonier. Majoritatea seriilor sezoniere din domeniul economic au durata
unui ciclu de un an, p fiind egal cu 4 n cazul datelor trimestriale respectiv 12 n cazul datelor
lunare. Prin extensie pot fi studiate i fenomene cu durata unui ciclu mai mic de un an.

4.2.4.2. Mediile mobile


Pentru eliminarea componentei sezoniere (desezonalizarea seriei) se aplic datelor o
medie mobil de ordin p egal cu perioada componentei sezoniere.
Mediile mobile de ordin p, notate n continuare MM(p), sunt definite de urmtoare relaii:
daca p este impar p = 2k + 1 , mediile mobile de ordin p sunt
y + y t k 1 + ... + y t + ... + y t + k
yt = t k
; t = k + 1, k + 2,..., n k ;
p
daca p este par p = 2k se definesc analog
yt k + 0,5 + y t k +1,5 + ... + y t 0,5 + y t + 0,5 + .... + y t + k +0,5
yt =
,
p
t = k + 0,5; k + 1,5; ... ; n k + 0,5.

73

In cazul p par, se introduc mediile mobile centrate de ordin p definite prin:


y t 0,5 + y t + 0,5 0,5 y t k + y t k +1 + ... + y t + ... + y t + k 1 + 0,5 y t + k
=
yt =
.
2
p
4.2.4.3. Estimarea tendinei n cazul seriilor cu component sezonier
n cazul seriilor sezoniere se ntlnesc preponderent n literatur doua modaliti de
estimare a tendinei:
desezonalizarea seriei iar apoi estimarea tendinei pornind de la valorile
desezonalizate (vezi 4.2.3.);
modelarea tendinei pornind de la mediile anuale.
4.2.4.4. Estimarea componentei sezoniere
Notaii: t indice pentru an (n general pentru un ciclu sezonier), variind de la 1 la n; s
indice pentru sezon, variind de la 1 la p. Modelul de descompunere a seriei are forma:
yij = TC ij + S j + ij respectiv y ij = TC ij S j ij
Metoda comparrii cu mediile mobile
n cazul modelului multiplicativ
y ij = TC ij S j ij
metoda se ntlnete n literatur i sub denumire de metoda raportrii la mediile mobile i
const n urmtoarele:
calculul mediilor mobile y ij de ordin p egal cu perioada componentei sezoniere;

calculul rapoartelor Sij = yij / y ij ce cuantific abaterea datelor observate de la tendin


- ciclu. Dac fixm indicele j (ne situm n sezonul j), aceste diferene constituie
estimaii pentru S j ;

determinarea unui indice mediu pentru fiecare sezon ca o medie a estimaiilor


precedente:
1 n 1
Ij =
S ij ; j = 1, 2,..., p ,
n 1 i =1
aceasta justificndu-se prin necesitatea eliminrii efectului aleator din S ij . Pentru a nu
fi afectai de valorile extreme, uneori nainte de calculul mediei, aceste valori se
elimin, sau n loc de medie se ia valoarea median a estimaiilor S ij ;

determinarea componentei sezoniere S j , etap ce const ntr-o corecie adus indicilor


medii I j astfel nct media lor s fie 1:

1 p
S j = I j / I i j = 1, 2,..., p .
p i =1
n cazul modelului aditiv
yij = TC ij + S ij + ij
determinarea componentei sezoniere decurge analog.
Exemplu. Estimarea componentelor deterministe n cazul seriilor sezoniere.
Datele privind evoluia trimestrial a produciei de bere din ara noastr (zeci mii hl) n
perioada 1996-2001 sunt indicate mai jos

74

An/Trim.
1996
1997
1998
1999
2000

I
124.1
130.1
157.5
169.7
177.5

II
263.2
280.2
301.2
340.0
407.6

III
252.4
260.6
353.3
350.9
417.2

IV
124.5
151.1
185.0
168.7
224.1

Figura 2. ---- Producia de bere; -- -- MM(4); ---- Tendina


a) Calculul mediilor mobile de ordin p=4
Graficul seriei indic prezena unei componente sezoniere predominante, de perioad
p = 4. Mediile mobile de ordin p = 4 sunt calculate conform relaiei de definiie a mediilor
mobile centrate. Astfel, spre exemplu:
0.5 y1 + y2 + y3 + y4 + 0.5 y5
=
y3 =
4
0.5 124.1 + 263.2 + 252.4 + 124.5 + 0.5 130.1
=
= 191.8
4
0.5 y 2 + y3 + y 4 + y5 + 0.5 y6
y4 =
=
4
0.5 263.2 + 252.4 + 124.5 + 130.1 + 0.5 280.2
=
= 194.7
4
L
0.5 y20 + y 21 + y 22 + y23 + 0.5 y24
=
4
0.5 224.1 + 202.9 + 385.3 + 425.6 + 0.5 196.6
=
= 306.0.
4
Datele observate au fost numerotate aici n ordine cronologic y1, y2, ..., y24.
Mediile mobile de ordinul 4
t
MM(4)
t
MM(4)
y22 =

1
2
3
4
5
6

191.8
194.7
197.8
202.2

13
14
15
16
17
18

261.7
259.4
258.3
267.7
284.5
299.7

75

7
8
9
10
11
12

208.9
214.9
229.2
245.0
250.8
257.1

19
20
21
22
23
24

309.8
310.2
308.4
306.0
-

b) Estimarea tendinei pornind de la valorile desezonalizate


Seria mediilor mobile prezentat grafic relev o uoar tendin de cretere a produciei
de bere. Vom considera tendina liniar:
Tt = a + bt + t ,
originea de msurare a timpului trimestrul II al anului 1996, unitatea de msur un trimestru.
Astfel, pentru trimestrul III 1996 avem t = 1 .a.m.d:
t
Valori desezonalizate (Z)

1
2
3
191.8 194.7 197.8
M (tZ ) M (t ) M ( Z )
b=
,
2
M (t 2 ) [M (t )]
a = M ( Z ) bM (t ).

...
...

19
308.4

20
306.0

Calcule intermediare:
M (t ) = 10.5, M ( Z ) = 252.9, M (t 2 ) = 143.5, M (tZ ) = 2884.9,
b = 6.9, a = 180.44.
Tendina produciei de bere n perioada ianuarie 1996 iunie 2000 este estimat prin:
Tt = 180.44 + 6.9 t .
c) Estimarea componentei sezoniere prin metoda raportrii la mediile mobile
Cum amplitudinea oscilaiilor crete uor n timp, cronograma seriei sugereaz luarea n
considerare a unui model multiplicativ:
yij = Tij S j ij ; i = 1, 2,..., 6 iar j = 1, 2, 3, 4 .
Datele sunt disponibile pentru 6 ani i sunt prezente aici 4 sezoane. innd seama de
notaiile specifice, yij reprezint nivelul produciei de bere n anul i trimestrul j. Astfel, spre
exemplu y13 = y1996;III = 252.4 sau y34 = y1998;IV = 185.0 . Mediile mobile din tabelul anterior
vor fi transpuse ntr-un tabel analog cu cel de prezentare a datelor observate:
An/Trim.
1996
1997
1998
1999
2000
2001

Rapoartele S ij =

y ij
y ij

I
197.8
229.2
261.7
284.5
308.4

II
202.2
245.0
259.4
299.7
306.0

III
191.8
208.9
250.8
258.3
309.8
-

100 , respectiv mediile acestora pentru fiecare sezon sunt indicate n

tabelul urmator
An/Trim.

1996
1997

IV
194.7
214.9
257.1
267.7
310.2
-

Calculul indicilor sezonalitii


I
II
III
INVE
STI(I
E
65.8

138.6

131.6
124.7

76

63.9
70.3

1998
1999
2000
2001

Ij

68.7
64.8
62.4
65.8
65.5

122.9
131.1
136.0
125.9
130.9

140.9
135.8
134.7
133.5

71.9
63.0
72.7
68.4

Media

99.6

Sj

65.6

131.4

134.0

68.8

Media

100

Explicaii privind calculele:


y
y
252.4
124.5
S13 = 13 100 =
100 = 131.6 , S14 = 14 100 =
100 = 63.9 ,
y13
191.8
y14
194.7
y
130.1
S 21 = 21 100 =
100 = 65.8 , .a.m.d.
y 21
197.8
Cum era de ateptat, aceste rapoarte ntre datele observate i mediile mobile sunt mai mici
dect 1 pentru trimestrele I i IV, cnd nivelul produciei a fost sistematic mai mic (sub
tendin).
S + S 31 + S 41 + S 51
I 1 = 21
= 65.5, I 2 = 130.9,
4
S + S 23 + S 33 + S 43
I 3 = 13
= 133.5, I 4 = 68.4.
4
Valoarea medie a acestor indici este 99.6, astfel c este necesar o corecie astfel nct
media s fie 100:
I
65.5
S1 = 1 100 =
100 = 65.6, S 2 = 131.4, S 3= 134.0, S 4 = 68.8 .
99.6
99.6
Urmare a caracterului sezonier specific produciei de bere, n trimestrul I producia a
fost mai mic n medie cu 34.4% dect valorile corespunztoare de pe tendin. n trimestrul
II producia a fost n medie mai mare de 1.314 ori dect valorile de pe tendin. Analog se
interpreteaz S3 i S4.
Componenta sezonier este dat de vectorul format cu indicii sezonalitii:
S=(S1, S2, S3 , S4 ) = (0.656; 1.314; 1.340; 0.688).
4.2.5. Componenta ciclic. Componenta aleatoare
a) Componenta ciclic
Pentru separarea componentei ciclice se poate utiliza metoda comparrii cu tendina. Spre
exemplu n cazul modelului multiplicativ:
Y = T S C E ,
metoda const n calculul indicilor de ciclicitate. Astfel:
se estimeaz tendina printr-o funcie elementar. Dac seria prezint sezonalitate se
pornete de la datele desezonalizate sau de la mediile anuale;
se elimin componenta sezonier din datele observate, iar apoi se utilizeaz medii
mobile n scopul eliminrii i a componentei aleatoare rezultnd valorile netezite y t
(astfel y t = T C );

se calculeaz indicii de ciclicitate Ct prin raportare la tendin:


y
Ct = t
Tt
b) Componenta aleatoare:

77

ij =

y ij
Tij C ij S j

n cazul modelului multiplicativ, respectiv

ij = y ij (Tij + C ij + S j ) n caz aditiv.


4.2.6. Previziuni utiliznd modelul de descompunere. Msurarea acurateii previziunilor
a) Previziuni utiliznd modelul de descompunere se obin prin compunerea previziunilor
realizate pentru fiecare component prezent n serie, innd seama de forma modelului:
Y = T + C + S respectiv Y = T C S .
b) Msurarea acurateii previziunilor. Dac modelul elaborat conduce la previziunile
y1 , y 2 ,..., y p corespunztoare datelor y1 , y 2 ,..., y p , pentru a msura calitatea acestuia de a
genera previziuni adecvate se utilizeaz o serie de indicatori sintetici ai erorilor de previziune,
cei mai frecvent ntlnii fiind:
1 p
2
- eroarea medie ptratic:
MSE = ( y h y h )
p h=1

1 p
y h y h
p h =1

MAE =

- eroarea medie absolut:

- eroarea medie absolut exprimat procentual:

MAPE =

1 p y h y h

p h =1 y h

Exemplu (continuare). Previziunea produciei de bere


Tabelul urmtor conine previziunile, datele reale respectiv erorile de previziune privind
nivelul produciei de bere.
An
2001
2002

Trim.

Tendin

Sezonalitate

Previziune

Producie

Eroare

III
IV
I

325.34
332.24
339.14

1.34
0.688
0.656

435.95
228.58
217.9

425.6
196.6
203.2

-10.35
-31.98
-14.7

Prezentm modul de obinere a rezultatelor anterioare pentru trim. III an 2001. Valorile
tendinei respectiv a componentei sezoniere sunt:
)
)
T (21) = 180.44 + 6.9 21 = 325.34 respectiv S 3 = 1.34.
Modelul de descompunere considerat a fost cel multiplicativ, astfel c valoarea
previzionat este:
)
y = 325.34 1.34 = 435.95
iar eroarea de previziune aferent:
)
e = 425.6 435.95 = 10.35

Exemplu (continuare). Previziunea indicelui lunar al preului produciei industriale.


Avnd n vedere tendina estimat privind evoluia acestui indicator:
Tt = 3.55 + 0.19t

78

previziunile respectiv erorile de previziune pentru perioada Iulie - Decembrie 2000 sunt
indicate mai jos:
Luna
Indice y
Previziune
)
y
)
Eroare e

I
7.40
7.16

A
7.66
7.35

S
7.96
7.54

O
8.26
7.73

N
8.47
7.92

D
8.65
8.11

0.24

0.31

0.42

0.53

0.55

0.54

Pentru luna Iulie 2000 avem t = 19, extrapolarea tendinei conduce la:
)
)
y19 = T19 =3.55 + 0.19 19 = 7.16
)
)
e19 = y19 - y19 = 0.24.

4.2.7. Alte metode de previziune


a) Previziuni utiliznd modele de regresie. Odat estimat i validat, un model de
regresie poate fi utilizat pentru previziunea variabilei dependente.
b) Netezirea seriei respectiv previziuni utiliznd modele de netezire exponenial
Varianta simpl a acestei tehnici, n care previziunile sunt obinute ca o medie ponderat
a datelor reprezentnd trecutul:
n 1

y n (h) = c (1 c) j y n j , c [0,1]
j =0

este adecvat previziunii seriilor staionare.


Metoda generalizat n varianta Holt-Winters este adecvat pentru serii cu tendin i
sezonalitate, model multiplicativ. Previziunile sunt date de o funcie de previziune local
liniar, valorile de pe tendina liniar fiind corectate cu un indice sezonier aferent sezonului
pentru care se realizeaz previziunea.
Atunci cnd cronograma seriei nu ofer indicii foarte clare privind prezena respectiv
forma tendinei, este indicat a se utiliza n prealabil o tehnic de netezire ce atenueaz
amplitudinea fluctuaiilor aleatoare din serie, scopul fiind evidenierea tendinei. Tehnicile de
netezire general utilizate sunt mediile mobile sau tehnicii netezirii exponeniale.

Teme de control. Probleme propuse


Problema 1. Estimarea si extrapolarea tendintei
1.1. Indicele lunar al preului produciei industriale pentru piaa intern, n perioada ianuarie
1999 iunie 2000 baza de comparaie 1996, a avut o tendin cresctoare:
Luna (t)
Indice (yt)

1
3.7

2
3.8

3
4.1

4
4.3

5
4.5

6
4.8

7
4.9

8
5.1

9
5.3

Luna (t)
10
11
12
13
14
15
16
17
18
Indice (yt) 5.5
5.6
5.8
6.0
6.2
6.3
6.5
6.6
7.0
Se cere: a) estimarea parametrilor tendintei liniare
b) previziunea indicelui lunar al preului produciei industriale pentru urmatoarele doua luni.
1.2. Datele de mai jos redau evoluia vnzrilor dintr-un produs pe o perioad de 10 luni
consecutive:

79

Luna
F
M
A
M
I
I
A
S
O
N
Vnzri 20 32 40 47 52 60 62 63 65 67
Se cere: estimarea parametrilor parabolei de tendinta.
1.3. Populaia Romniei a crescut n perioada 1980-1988 ntr-un ritm destul de accelerat, dup
cum arat i datele de mai jos:
An
Nr. pop.
(mil. Loc.)

1980
22.20

1981
22.35

1982
22.48

1983
22.55

1984
22.62

1985
22.72

1986
22.82

1987
22.94

1988
23.15

Se cere: a) datele confirm ipoteza modelrii tendinei printr-o funcie exponenial?


b) estimarea parametrilor tendintei exponentiale;
c) previziunea populaiei Romniei pentru urmatorii cinci ani. Comparatii cu valorile reale.
Problema 2. Descompunerea si previziunea seriilor sezoniere
Datele privind evoluia trimestrial a produciei de bere din ara noastr (zeci mii hl) n
perioada 1996-2001 sunt indicate in tabelul urmtor:
An/Trim.
I
II
III
IV
1996
124.1 263.2 252.4 124.5
1997
130.1 280.2 260.6 151.1
1998
157.5 301.2 353.3 185.0
1999
169.7 340.0 350.9 168.7
2000
177.5 407.6 417.2 224.1
2001
202.9 385.3 425.6 196.6
Se cere: a) Estimarea tendinei pornind de la valorile desezonalizate;
b) estimarea componentei sezoniere;
c)determinarea componentei ciclice respectiv aleatoare. Descompunerea seriei pe
componente;
d) previziunea produciei de bere pentru urmatoarele patru trimestre.
Problema 3. Determinarea nivelului mediu
3.1. Populaia judeului Cluj la principalele recensminte a fost:
An
1930
1948 1956
1966
1977
1992
Nr. pop. (mii loc.) 475.5 520
580.3 629.7 715.7 736.3
Se cere: calculul populaiei medii anuale, pe perioada 1930 1992.
3.2. Numrul navelor utilizate n transportul mrfurilor n perioada 1991-2000 a nregistrat
urmtoarea evoluie:
An
Nr. nave

1991
269

1992
267

1993
256

1994
250

1995
255

1996
289

1997
283

1998
231

1999
203

2000
192

Se cere: calculul numrului mediu anual de nave utilizate in transportul marfurilor, in


perioada considerata.
Problema 4. Determinarea indicelui mediu, ritmului mediu respectiv a diferentei medii
4.1. Se cunoate populaia judeului Cluj la ultimele dou recensminte:
Recens.
5 ian 1977 7 ian 1992
Nr. pop. (mii loc.)
715.7
736.3
Se cere: indicele mediu anual. Interpretare
4.2. Producia de biciclete n Romnia a sczut dup 1989:
An
1990 1991 1992 1993 1994 1995
Prod. (mii buc.)
136
107
67
42
28
22

80

Se cere: a) calculul indicelui mediu prin metoda autoregresiv


b) ritmul mediu anual. Interpretare.
4.3. Fondul de locuine din ara noastr a nregistrat o cretere lent dup 1990:
An
Fond de
loc. (mii)

1991
7659

1992
7683

1993
7710

1994
7749

1995
7782

1996
7811

1997
7837

1998
7860

1999
7883

2000
7907

Se cere: calculul si interpretarea diferenei medii absolute.


Problema 5. Cantitatile cumparate q respectiv preturile unitare de cumparare (mii lei) p,
pentru 3 produse aflate in consumul populatiei, in doua luni consecutive, au fost:
Luna k-1
q
p
8 kg
30
20 buc
70
4 litri
50

Produs 1
Produs 2
Produs 3

Luna k
q
p
10 kg
35
18 buc
67
5 litri
45

Se cere: indicii factoriali ai pretului respectiv ai cantitatii prin toate metodele cunoscute.
Comparati rezultatele obtinute.
Problema 6. Indicele variatiei integrale si indicii variatiilor factoriale Cunoscnd seriile
cronologice cu privire la: numrul de omeri muncitori (X), numrul de omeri cu studii medii
(Y), numrul de omeri cu studii superioare (Z) din judeul Cluj n 10 luni consecutive,
respectiv:
mii persoane
1

10

22,23
3,86
0,396

22,24
3,87
0,395

22,34
3,98
0,419

23,21
4,52
0,437

24,7
4,1
0,357

26,85
4,53
0,406

28,7
4,91
0,455

29,1
5,28
0,487

28,3
6,18
0,5

28,3
6,2
0,5

luna
X
Y
W

Se cere: a) Relaia matematic ce exprim legtura dintre numrul total de omeri (Z) i X, Y,
W
b) indicii exprimnd variaia integral a numrului total de omeri, calculai cu baz fix;
c) indicii factoriali de tip Laspeyres, Paasche, Fisher afereni fiecrui factor care influeneaz
numrul total de omeri, n ultima luna fa de prima luna.

Bibliografie
1. Buiga, A., Drago C., Lazr D., Parpucea I., Statistic descriptiva, Ed. Mediamira, ClujNapoca, 2010;
2. Buiga A., Dragos C., Lazar D., Parpucea I., Statistica I, Presa Universitara Clujeana, 2003.
2. Florea I., Parpucea I., Buiga A., [1998] , Statistic descriptiv. Teorie i aplicaii, Editura
Continental, Alba Iulia, 1998.
3. Florea I., Parpucea I., Buiga A., Lazar D., [2000] , Statistic inferenial, Presa
Universitar Clujean, Cluj Napoca, 2000.
4. Melard G., Methodes des prevision a court terme, Ed. de Universite de Bruxelles, 1990.

81

APLICAII
Problema 1
Considernd rata omajului ca mrime analizat notat cu Z se cere:
1. Expresia de calcul a mrimii Z n funcie de factorii de influen;
2. Avnd seriile cronologice relativ la numrul de omeri X i populaia activ notat cu Y
n 10 luni consecutive respectiv:
- numrul de omeri
2
3
4
5
6
7
8
9
10
1

X :
330 420 370 480 520 550 600 580 630 635
- populaia activ
2
3
4
5
6
7
8
9
10
1

Y :
3882 4827 4302 5485 5843 6189 6593 6304 6702 6738
redai seria cronologic aferent ratei lunare a omajului;
3. Rata de omaj medie lunar;
4. De cte ori au crescut n medie de la o lun la alta numrul de omeri;
5. Exprimarea, calcularea i interpretarea urmtorilor indici:
I Z5 //1x ( F ) ; I Z5 //1y ( F ) ; I Z5 / 1 .
1) Z (rata omajului) este influenat de numrul de omeri direct proporional i de numrul
populaiei active invers proporional.

Z=

S
X
100 = 100
Pa
Y

2
3
4
5
6
7
8
9
10
1

2) Z :
8,5 8,7 8,6 8,75 8,90 8,90 9,1 9,2 9,4 9,42
3) Seria cronologic fiind de momente, nivelul mediu se determin dup urmtoarea relaie:
1
1
Z 1 + Z 2 + Z 3 + Z 4 + Z 5 + Z 6 + Z 7 + Z 8 + Z 9 + Z 10
2
Z= 2
=
10 1
1
1
8,5 + 8,7 + 8,6 + 8,75 + 8,90 + 8,90 + 9,1 + 9,2 + 9,4 + 9,42
2
2 = 8,945
=
9
Rata de omaj medie lunar din perioada analizat este de 8,945.
4)

IX =

X (t 1) X (t ) =
[X (t 1)]
2

82

330 420+ 420 370+ 370 480+ 480 520+ 520 550+ 550 600+ 600 580+ 580 630+ 630 635
3302 + 4202 + 3702 + 4802 + 5202 + 5502 + 6002 + 5802 + 6302

1386+1554+1776+ 2496+ 2860+ 3300+ 3490+ 3654+ 40005


=1,056
1089+1764+1369+ 2304+ 2704+ 3025+ 3600+ 3364+ 3969

Numrul de omeri au crescut n medie de 1,056 ori de la o lun la alta.

5) I Z5 / 1 =

Z 5 8,9
=
= 1,047 , rata omajului a crescut de 1,047 n luna a 5-a fa de luna 1.
I 1 8,5

I Z5 //1x (F ) = I Z5 //1x (L ) I Z5 //1x (P ) = 1,57 1,57 = 1,576


x5
y
520 3882
I Z5 //1x (L ) = 1 =

= 1,576
x1 3882 330
y1
x5
y
I Z5 //1x (P ) = 5 = 1,576
x1
y5
- rata omajului ar fi crescut de 1,576 datorit modificrii numrului de omeri, populaia
activ rmnnd constant;

I Z5 //1y (F ) = I Z5 //1y (L ) I Z5 //1y (P ) = 0,664


x1
y
y
3882
I Z5 //1y (L ) = 5 = 1 =
= 0,664
x1
y 5 5843
y1
x5
y
y
I Z5 //1y (P ) = 5 = 1 = 0,664
x5
y5
y1
- rata omajului ar fi sczut de 0,664 datorit modificrii populaiei active, numrul de omeri
rmnnd constant;
I Z5 //1x I Z5 //1y = 1,57 0,66 = 1,0465 = I Z5 / 1

83

Problema 2
Din mulimea autoturismelor vndute prin licitaie s-a constituit un eantion de 30 de uniti,
rezultatele observrii n raport cu variabilele X vechimea autoturismelor exprimat n ani i
y preul la care s-au vndut (n milioana lei) sunt prezentate n tabelul urmtor:
Nr. crt. X

Nr. crt.

Nr. crt. X

30

11

32

21

30

40

12

33

22

10 25

20

13

11 24

23

36

13 17

14

13 19

24

23

15 17

15

38

25

10 27

28

16

22

26

12 22

13 20

17

12

20

27

35

19 13

18

20 10

28

29

33

19

35

29

14 19

10

41

20

14 17

30

30

Se cere:
1. Elaborarea repartiiei bidimensionale tiind c numrul de intervale pentru variabila X =
4, iar lungimea unui interval pentru Y,ly = 8 intervalele fiind egale.
2. Parametrii tendinei centrale n raport cu preul de vnzare i interpretarea acestora;
3. Studierea reprezentativitii funciilor de regresie, liniar i hiperbolic i alegerea celei
mai reprezentative;
4. Pentru funcia aleas la punctul precedent calculai parametrii.

1) lungime interval =

[0;5)
X :
5

X max X min
20 0
=
=5
numar intervale
4

[5;10) [10;15) [15;20 )


12

[10;18)
Y :
5

10

[18;26) [26;34 ) [34;42)


10
X

Y
[10;18)
[18;26)
[26;34)
[34;42)
TOTAL

[0;5)

[5;10)

[10;15)

[15;20)

TOTAL

1
4
5

3
7
2
12

2
7
1
10

3
3

5
10
9
6
30

84

2) Media:
R

'

Ni

14 5 + 22 10 + 30 9 + 37,5 6 785
=
= 26,26
N
30
30
- preul mediu de vnzare al mainilor este de 26,26 mii lei
1
30
rMe = N =
= 15
Mediana:
2
2
5 + 10 = rMe = 15 Me [18;26 )
15 5
8 = 26
Me = 18 +
10
jumtate din maini se vnd cu un pre mai mic de 26.000 mii lei, iar cealalt jumtate
cu un pre mai mare de 26.000.000 lei.
Y=

Y
i =1

[10 26 )

15

[26;41)

15

Modala:
max(5, 10, 9, 6) = 10 Mo [18;26)
Cele mai multe autoturisme se vnd cu un pre cuprins ntre 18.000 i 26.000 mii lei.
10 5
5
Mo = 18 +
8 = 18 +
8 = 24,66
(10 5) + (10 9)
5 +1
- cea mai mare parte a autoturismelor se vnd la un pre n jur de 24.666,666 mii lei.

3) Din tabelul de corelaie se observ c frecvenele diferite de zero sunt grupate, rezult c
ntre cele dou variabile exist legtur, ce poate fi modelat cu ajutorul funciei de regresie.
Y ( X ) = a + bx
a. Dac funcia de regresie este o drept
1
b. Dac funcia de regresie este o hiperbol Y ( X ) = a + b
x
Mai reprezentativ este funcia care are coeficientul de regresie mai mare. Ca urmare trebuie
calculat acest coeficient pentru cele dou cazuri.
M ( XY ) M ( X ) M (Y )
a. RYX =
X Y
M (Y ) = 26,26
M (X ) =

2,5 5 + 7,5 12 + 12,5 10 + 17,5 3


= 9,33
30

X2

[
[

1
[2,5 30 1 + 2,5 38 4 + ... + 17,5 14 3] = 216
30
216 9,33 26,26
=
= 0,836
62,86 19,1389

M ( XY ) =

RYX

]
]

1
2
2
2
2
(14 26,26 ) 5 + (22 26,26 ) 10 + (30 26,26 ) 9 + (38 26,26 ) 6 = 62,86
30
1
2
2
2
2
=
(2,5 9,33) 5 + (7,5 9,33) 12 + (12,5 9,33) 10 + (17,5 9,33) 3 = 19,1389
30

Y2 =

85

1
M Y M M (Y )
X
X
=
1 Y

b. RYX '

1 1
M = (0,4 5 + 0,13312+ 0,0810+ 0,057 3) = 0,152
X 30

1 1
2
2
2
2
(0,4 0,152) 5 + (0,133,0152) 12+ (0,08 0,152) 10+ (0,057 0,152) 3 =
X 30
= 0,013

2 =

1 1
M Y = [0,4 301+ 0,4 38 4 +...+ 0,05714 3] = 4,632
X 30
4,632 0,152 26,26
RYX ' =
= 0,7218
0,013 62,86
RYX > RYX ' , rezult c dreapta de regresie este mai reprezentativ.
4) Y ( X ) = a + bX

Folosind metoda celor mai mici ptrate, unde M Y Y ( X ) - min, rezult:


2

a + bM ( X ) = M (Y )

2
aM ( X ) + bM ( X ) = M ( XY )
a = M (Y ) bM ( X )
b=

M (X 2) =

M ( XY ) M ( X ) M (Y ) M ( XY ) M ( X ) M (Y )
=
2
X2
M ( X 2 ) [M ( X )]

1
2,52 5 + 7,52 12 + 12,52 10 + 17,52 3 = 106,25
30

216 9,33 26,26


= 1,516
19,1389
a = 26,26 + 1,516 9,33 = 40,40

b=

Y ( X ) = 40,40 1,516 X

86

Problema 3
Preul unui produs a fost observat n 30 puncte de vnzare la un moment t dat. Valorile
nregistrate sunt urmtoarele: 21; 24; 26; 30; 25,9; 26; 20; 24,2; 27; 29; 25,6; 26,3; 27; 22;
24,5; 28; 25; 27,5; 22,5; 24,7; 26,6; 23,2; 25,1; 27,5; 23; 24,8; 23,7; 25; 22,8; 23.
Se cere:
1.
2.
3.
4.

elaborarea distribuiei statistice a punctelor de vnzare n raport cu preul;


analiza reprezentativitii preului mediu;
reprezentarea grafic a structurii repartiiei;
avnd seria cronologic ce red variaia preului produsului studiat n 6 luni consecutive
ca fiind urmtoarea:
2
3
4
5
6
1

Y :
25 25,7 26 26,5 26,8 28
Calculai i interpretai:
a) preul mediu lunar;
b) ritmul mediu lunar.

1) elaborarea distribuiei statistice a punctelor de vnzare n raport cu preul:


30 20 10
- calculm lungimea intervalului: l X =
=
=2
5
5
[20 22 )
X :
2

[22 24) [24 26) [26 28) [28 30)


7

10

- serie de repartiie unidimensional, avnd la baz o variabil atributiv, cantitativ continu


i frecvena absolut.

2) Analiza reprezentativitii preului mediu:


21 2 + 23 7 + 25 10 + 27 8 + 29 3 42 + 161 + 250 + 216 + 87 756
=
=
25,2
30
30
30
- preul mediu este 25,2;
X=

analizm reprezentativitatea mediei cu ajutorul varianei i a coeficientului de variaie a lui


Pearson:

(X
R

V (X ) =

2
X

i =1

'
i

Ni

( X ) = X2 = V ( X )

87

CV ( X ) =

X
X

100

- dac CV(X) 50% - media este nereprezentativ

X2 =

(21 25,2)2 2 + (23 25,2)2 7 + (25 25,2)2 10+ (27 25,2)2 8 + (29 25,2)2 3 = 4,63

30
- preul se abate n medie de la valoarea medie cu 2,15.

X = X2 = 4,63 = 2,15
CV ( X ) =

X
X

100 =

2,15
100 = 0,0853 100 = 8,53% < 30% media este reprezentativ.
25,2

3) Reprezentarea grafic a structurii repartiiei:


- reprezentarea grafic a structurii unei repartiii se face cu ajutorul diagramelor de structur;
fi =

Ni
100 frecvena relativ
N

2
100 = 0,0667 100 = 6,67%
30
7
=
100 = 0,2333 100 = 23,33%
30
10
=
100 = 0,3333 100 = 33,33%
30
8
=
100 = 0,2667 100 = 62,67%
30
8
=
100 = 0,1 100 = 10%
30

f1 =
f2
f3
f4
f5

i = f i 360 o

1 = 24,01o
2 = 83,99 o
3 = 119,99 o
4 = 96,01o
5 = 36 o
Titlu: Stuctura punctelor de vnzare n raport cu preul

10%

6,67%
1
23,33%

26,67%

2
3
4
5

33,33%

88

Legend:
1. 6,67% din punctele de vnzare au preuri cuprinse ntre 20 i 22;
2 . 23,33% din punctele de vnzare au preuri cuprinse n intervalul [22 - 24);
3 . 33,33% din punctele de vnzare au preuri cuprinse n intervalul [24 - 26);
4 . 26,67% din punctele de vnzare au preuri cuprinse n intervalul [26 - 28);
5 . 10% din punctele de vnzare au preuri cuprinse n intervalul [28 - 30);
2
3
4
5
6
1

4) Y :
25
25
,
7
26
26
,
5
26
,
8
28

Calculai i interpretai:
a) preul mediu lunar;
b) ritmul mediu lunar.
1
1
+ 25,7 + 26 + 26,5 + 26,8 + 28
2
2 = 26,33
a) Y / luna =
5
- preul mediu lunar este de 26,33
25

b) R Y = I Y 1 = I Y 100% 100%

25,7 25 + 26 25,7 + 26,5 26 + 26,8 26,5 + 28 26,5


=
252 + 25,72 + 262 + 26,52 + 26,82
642,5 + 668,2 + 689+ 710,2 + 750,4
=
=
625+ 660,49 + 676+ 702,25 + 718,24
3460,3
=
=1,0231
3381,98
IY =

R Y = I Y 1 100 = 0,0231 100 = 2,31%


- preul a crescut n medie de la o lun la alta cu 2,31%.

Problema 4
Se consider un eantion de 100 gospodrii i variabilele X-numr de membrii i Y-cantitatea
de pine consumat zilnic de o gospodrie (Kg), rezultatele fiind prezentate n tabelul
urmtor:
X

TOTAL

0,25
0,5
1
1,5
TOTAL

5
5
10

30
5
35

5
15
5
25

10
20
30

5
40
30
25
100

89

Se cere:
1. cantitatea medie, median i modal de pine consumat zilnic de o gospodrie (calcul i
interpretare);
2. n ce proporie cantitatea de pine depinde de numrul de membrii;
3. analiza numeric i caracterizarea intensitii legturii ntre cele dou variabile.
1)

0,25 0,5 1 1,5

Y :
40 30 25
5
Y - Media
0,25 5 + 0,5 40 + 1 30 + 1,5 25 1,25 + 20 + 30 + 37,5 88,75
Y=
=
= 0,89[kg ]
=
100
100
100

- 0,89 este cantitatea medie de pine consumat zilnic de o gospodrie.

Me Mediana
- variabila discret N=100

Y N + Y N
Me =

2 +1

N
= 50
2

Y50 + Y51 0,5 + 1


=
= 0,75
2
2

- jumtate din gospodrii consum zilnic pine ntre 0,25 i 0,75 kg, iar cealalt jumtate ntre
0,75 i 1,5 kg de pine pe zi.

Mo Modala
- variabila discret NMo = max(N1, N2, N3, N4) NMo = 40 Mo = 0,5
- cele mai multe gospodrii consum zilnic n jur de 0,5 kg de pine.
2) Se calculeaz: rxy2 =

VTOT (Y ) =

VEXP
VTOT

(2,25 0,89)2 5 + (0,5 0,89)2 40 + (1 0,89)2 30 + (1,5 0,89)2 25 = 0,18

(Y
r

VTOT =

i =1

100

N i.

(Y / x
J

V EXP =

j =1

N. j

90

Calculm mediile condiionate ale lui Y n funcie de X.

0,25 5 + 0,5 5
= 0,35
10
0,5 30 + 1 5
Y 2 = Y / x2 =
= 0,57
35
0,5 5 + 1 15 + 1,5 5
Y 3 = Y / x3 =
=1
25
1 10 + 1,5 20
Y 4 = Y / x4 =
= 1,33
30

Y 1 = Y / x1 =

VEXP (Y ) =

(0,35 0,89)2 10 + (0,57 0,89)2 35 + (1 0,89)2 25 + (1,33 0,89)2 30 =


100

2,9 + 3,5+,025+ 5,7 12,35


=
= 0,12
100
100
V
0,12
rxy2 = EXP =
= 0,66 66%
VTOT 0,18
- consumul zilnic de pine de gospodrie depinde de numrul de membrii al gospodriei n
proporie de 66%.
=

3) Analiza numeric i caracterizarea intensitii legturii ntre cele 2 variabile


- X, Y variabile cantitative
intensitatea legturii se studiaz cu ajutorul raportului de corelaie (rXY)
2
rXY = r XY
=

V EXP
[0;1]
VTOT

2
rXY = r XY
= 0,66 = 0,81 1 legtura intens ntre cele dou variabile.

Problema 5
Cunoscnd seriile cronologice cu privire la: numrul de omeri muncitori (X), numrul de
omeri cu studii medii (Y), numrul de omeri cu studii superioare (Z) din judeul Cluj n 10
luni consecutive, respectiv:

Lun
a
X

Y
W

mii persoane
10

22,2
3
3,86
0,39
6

22,2
4
3,87
0,39
5

22,3
4
3,98
0,41
9

23,2
1
4,52
0,43
7

24,7

26,8
5
4,53
0,40
6

28,7

29,1

28,3

28,3

4,91
0,45
5

5,28
0,48
7

6,18
0,5

6,2
0,5

4,1
0,35
7

91

Se cere:
1. Relaia matematic ce exprim legtura dintre numrul total de omeri (Z) i X, Y, W;
2. Seria cronologic avnd la baz numrul total de omeri din judeul Cluj;
3. Numrul mediu lunar de omeri;
4. Indicele mediu i ritmul mediu al numrului total de omeri;
5. Diferena medie absolut a numrului total de omeri;
6. Primii 4 indici exprimnd variaia integral a numrului total de omeri, calculai cu baz
fix;
7. Indicii factoriali de tip Paasche afereni fiecrui factor care influeneaz numrul total de
omeri n luna 4 fa de luna 1.

1. z(t) = x(t) + y(t) + w(t);

t = 1, 10

2.

Lun
a
z(t)

10

26,4
86

26,2
05

27,7
39

28,1
67

29,1
54

31,7
86

34,0
65

34,8
67

34,9
80

35,0
00

3. z(t) este o serie cronologic de momente


z(1)
z(10)
+ z(2) + z(3) + ..... + z(9) +
2 = 277 = 30,77
z= 2
9
9
Numrul mediu de omeri din Cluj n cele 10 luni este de 30,77 mii
4.
10

Iz =

z (t ) z(t 1)
i =1
10

[ z (t 1)]

i =1

26,505 26,486 + 26,739 26,505 + .... + 35 34,98


= 1,03
26,486 2 + 26,505 2 + .... + 34,98 2

n primele 10 luni, numrul de omeri a crescut n medie de 1,03 ori de la o lun la alta.
R z = I z 1 = 1,03 1 = 0,03 = 3%
Numrul total de omeri a crescut n medie cu 3% de la o lun la alta.

z(10) z(1)
= 0,945
9
Numrul total de omeri a crescut n medie cu 0,954 mii persoane de la un an la altul.

5. z =

92

6. I z2 / 1 =

z(2 ) 26,505
=
= 1,007
z(1) 26,486

Numrul total de omeri din judeul Cluj a crescut de 1,007 ori n luna a doua fa de prima.
z(3) 26,739
=
= 1,0095
z(1) 26,486
z(4 ) 28,167
=
=
= 1,063
z(1) 26,486
z(5) 29,154
=
=
= 1,1
z(1) 26,486

I 3z / 1 =
I 4z / 1
I 5z / 1

7. Numrul total de omeri z(t) depinde de factorii de influen astfel:


z(t) = x(t) + y(t) + w(t)
x (4 ) + y(4 ) + w (4 )
= 1,036
x (1) + y(4 ) + w (4 )
Numrul total de omeri ar fi crescut de 1,036 ori n luna 4 fa de luna 1 datorit modificrii
numrului de omeri muncitori.
I z4 // 1x (P ) =

I z4 // 1y (P ) =

x (4 ) + y(4 ) + w (4 )
= 1,023
x (4 ) + y(1) + w (4 )

Numrul total de omeri ar fi crescut de 1,023 ori n luna 4 fa de luna 1 datorit modificrii
numrului de omeri cu studii medii.
I z4 // 1w (P ) =

x (4 ) + y(4 ) + w (4 )
= 1,0014
x (1) + y(4 ) + w (1)

Numrul total de omeri ar fi crescut de 1,0014 ori


modificrii numrului de omeri cu studii superioare.

n luna 4 fa de luna 1 datorit

Problema 6
Evoluia numrului de contracte de vnzare ncheiate de o societate n zilele lucrtoare
ntr-o anumit perioad a fost urmtoarea:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Y :
20 21 22 21 19 21 22 24 23 22 23 24 25 24 23
Se cere:
1. Tendina mrimii analizate (dac se constat prezena factorilor sezonieri desezonalizai
serie).
2. Previziunea mrimii pe urmtoarele 5 zile.

93

Rezolvare:
1. Pentru a determina tendina, trebuie s reprezentm cronograma n vederea stabilirii
prezenei factorilor sezonieri:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Y :
20 21 22 21 19 21 22 24 23 22 23 24 25 24 23

30
24

25

21

21

21

23

20

22

20

22

19

15

25 24

22
23

24

23

10
5
0
1

9 10 11 12 13 14 15

Dup cum se observ din grafic, exist factori sezonieri, tendina fiind cresctoare. Deci,
variaia numrului de contracte este de forma:
y(t) = T(t) + S(t) + (t)
unde: T(t) tendina
S(t) componenta sezonier
(t) factori neeseniali
Ne organizm datele astfel:
Ziua
Spt.

II

III

IV

21
22
24

22
24
25

21
23
24

19
22
23

I
1
2
3

20
21
23

Folosind procedeul mediilor mobile calculm seria desezonalizat dup relaia:

94

Y11 + Y12 + Y13 + Y14 + Y15


5
Y + Y13 + Y14 + Y15 + Y21
Y14' = 12
5
.
.
.
.
Y + Y32 + Y33 + Y34 + Y35
Y33' = 31
5
Y13' =

Ziua
Spt.

II

III

IV

21,8
23,6

20,6
22,4
23,8

20,8
22,8
-

21
23,2
-

II

III

IV

1,01
1,02
1,015

1,07
1,07
1,05
1,063

1,01
1,01
1,01

0,90
0,95
0,925

I
1
2
3

21,4
23,4

Calculm coeficienii de sezonalitate:

Ziua
Spt.

I
1
2
3
K

K ts =
KI =

0,98
0,98
0,98

Yts
Yts'
K 2 I + K 3I

KV =

2
.
.
.
.
K 1V + K 2V

2
3
4
5
6
7
8
9
10
11
1

Y('t ) :
20,6 20,8 21 21,4 21,8 22,4 22,8 23,2 23,4 23,6 23,8

95

25
24
23
22,8

22

23,6 23,8

22,4

21
20

23,2

23,4

21,4
20,6

21,8

20,8

19
1

10

Din grafic se observ c tendina cea mai probabil este o dreapt. Deci: T(t) = a + bt
Punnd condiia ca: M[Y(t ) T (t )] =minim, obinem:
2

a = M [ y (t ] bM (t )
a + bM (t ) = M [ y (t )]

M [ y (t ) t ] M [ y (t )] M (t )

2
2
aM (t ) + bM (t ) = M [ y (t ) t ]
b =
M (t 2 ) [M (t )]

1 + 2 + ... + 11
=6
11
12 + 2 2 + ...112
M (t 2 ) =
= 4,61
11
20,6 + 20,8 + ... + 23,8
= 22,25
M ( y (t )) =
11
1 20,6 + 2 20,8 + ... + 11 23,8
M ( y (t ) t ) =
= 137,07
11
137,07 22,25 6
b=
= 0,357
46,1 36
a = 22,25 0,357 6 = 20,108
M (t ) =

6.1.1.1.1.1 T(t) = 20,108 + 0,357 t


2. Previziunea valorilor lui Y

96

Y4PI = T (14) K I = (20,108 + 0,357 14 ) 0,98 = 24,6 25


Y4PII = T (15) K II = (20,108 + 0,357 15) 1,015 = 25,8 26
Y4PIII = T (16) K III = (20,108 + 0,357 16 ) 1,063 = 27,44 27
Y4PIV = T (17) K IV = (20,108 + 0,357 17 ) 1,01 = 26,4 26
Y4PV = T (18) K V = (20,108 + 0,357 18) 1,925 = 24,54 25

Problema 7
O agenie imobiliar dorete s dispun de o funcie cu ajutorul creia s poat evalua rapid
valoarea de pia a apartamentelor. Pentru aceasta, are la dispoziie o baz de date cuprinznd
30 de apartamente observate n raport cu variabilele:
Y = preul de vnzare n mii euro
X 1 = suprafaa n metri ptrai
X 2 = numrul de camere
X 3 = finisaj*nr.camere. Se calculeaz prin nmulirea gradului de finisare (0 pentru
nefinisat, 1 pentru semifinisat i 2 pentru finisat) cu numrul de camere.

97

Nr.crt.
1
2
3
4
5
6
7
8
9
10
11

X1

X2

X3

15,3

22

42,0

74

13,0

21

20,0

32

25,8

52

46,6

88

24,7

48

18,9

35

41,5

78

47,5

80

24,0

45

12

22,3

39

13

33,5

68

14

20,7

42

15

49,5

92

16

26,6

50

17

16,0

26

18

32,7

60

19

38,1

64

20

15,1

28

15,6

30

39,8

83

27,0

44

35,0

71

17,3

28

25,5

49

25,0

46

14,5

22

39,5

65

41,5

69

21
22
23
24
25
26
27
28
29
30

Se cere:

98

1) Studiai grafic existena i forma legturii dintre pre i fiecare din variabilele
dependente.
2) Calculai parametrii funciei liniare multiple dintre pre i toate variabilele explicative.
3) Este reprezentativ aceast funcie ?
4) S se fac cteva simulri ale valorii de pia a apartamentelor pentru diferite valori
ale variabilelor explicative.
5) Comparai reprezentativitatea funciei obinute cu a funciilor de regresie simple.
Rezolvare
1) Graficul care ne poate indica existena sau forma legturii este diferit n funcie de natura
variabilei explicative: discret sau continu.
a) Legtura dintre pre i suprafa. Deoarece suprafaa este o variabil continu, putem
construi norul de puncte.

50
45

pret (mii euro)

40
35
30
25
20
15
10
5
0
0

20

40
60
suprafata (mp)

80

100

Se observ c legtura exist i este liniar.


b) Legtura dintre pre i numrul de camere. Norul statistic se prezint astfel:

99

50
45
40

pret (mii euro)

35
30
25
20
15
10
5
0
0

numar camere

Dac forma legturii nu pare evident prin norul de puncte se poate utiliza i un grafic care
folosete mediile condiionate, din grupe.
Procednd analog i pentru variabila rmas, concluzionm c putem modela
legturile dintre pre i fiecare din variabile prin funcii liniare.
2) Funcia de regresie liniar multipl se scrie :
Y = a1 X 1 + a 2 X 2 + a 3 X 3 +
Prin aplicarea metodei celor mai mici patrate ajungem la ecuaia scris sub form implicit :
M 00 [Y M (Y )] + M 01 [ X 1 M ( X 1 )] + M 02 [X 2 M ( X 2 )] +

+ M 03 [X 3 M ( X 3 )] = 0

Scriem matricea de variaie i covariaie :

M ( 4)

m00

m01
m11

m02
m12
m22

m03

m13
m23

m33

m00 = Y2 = 121,55
m01 = M (YX 1 ) M (Y ) M ( X 1 ) = 227
m02 = M (YX 2 ) M (Y ) M ( X 2 ) = 11,196
m03 = M (YX 3 ) M (Y ) M ( X 3 ) = 16,229

100

m11 = X2 1 = 443

m12 = M ( X 1 X 2 ) M ( X 1 ) M ( X 2 ) = 21,39
m13 = M ( X 1 X 3 ) M ( X 1 ) M ( X 3 ) = 23,19

m22 = X2 2 = 1,143
m23 = M ( X 2 X 3 ) M ( X 2 ) M ( X 3 ) = 1,2767

m33 = X2 3 = 5,41

M (4)

121,55 227 11,196 16,229

443 21,39 23,19

=
1,143 1,2767

5
,
41

Calculm complemenii algebrici:


M 00 = 193,92
M 01 = 82,58
M 02 = 135,4
M 03 = 195,79
Ecuaia de regresie devine :
193,92[Y M (Y )] 82,58[ X 1 M ( X 1 )] 135,4[X 2 M ( X 2 )]
195,79[ X 1 M ( X 3 )] = 0

Prin nlocuirea valorilor medii, avem:


193,92[Y 28,48] 82,58[ X 1 51,7 ] 135,4[ X 2 2,3]
195,79[ X 1 2,3] = 0

Dup efectuarea calculelor se obine ecuaia sub form explicit :


Y = 2,559 + 0,4258 X 1 + 0,698 X 2 + 1,01X 3 +

101

3) Reprezentativitatea funciei o apreciem prin coeficientul de corelaie liniar multipl:

RY , X1 X 2 X 3 = 1

det M ( 4)
131,75
= 1
= 0,997
m00 M 00
121,55 193,92

deci funcia este foarte reprezentativ.


4) Pentru un apartament de 65mp, cu 3 camere, semifinisat :

X 1 = 66

X2 = 3

X3 = 3

Y (66,3,3) = 2,559 + 0,4258 66 + 0,698 3 + 1,01 3 = 35,8 mii euro


Rezultatul este foarte realist dac privim baza de date iniial.
5) Rezolvarea acestui punct rmne la latitudinea cititorului.

102

LUCRRI PRACTICE
LUCRAREA 1
P1. Dai 5 exemple de populaii statistice a cror cercetare ar prezenta interes i pentru fiecare
populaie selectat precizai:
1. denumirea populaiei, a unitii statistice i volumul acesteia;
2. scopul cercetrii statistice;
3. variabilele statistice n raport cu care s-ar face observarea statistic a populaiei.
P2. S se extrag din Anuarul Statistic sau alte surse informaionale o serie statistic
bidimensional ce red distribuia unei populaii n raport cu dou variabile atributive,
relativ la care se cere:
8. denumirea populaiei ce a fost supus observrii i volumul acesteia;
9. unitatea statistic;
10. caracterizarea variabilelor statistice n raport cu care a fost studiat populaia;
11. caracterizarea seriei statistice n raport cu toate criteriile cunoscute;
12. elaborarea seriei bidimensionale format cu frecvene relative, interpretare;
13. extragerea repartiiilor unidimensionale marginale i a celor condiionate;
14.
pornind de la o repartiie marginal deducei celelalte serii statistice posibile,
interpretare.
P3. Din Anuarul Statistic sau alte surse informaionale extragei o serie statistic de repartiie,
avnd la baz o variabil de spaiu, relativ la care se cere:
6. denumirea populaiei statistice i volumului ei;
7. unitatea statistic;
8. caracterizarea seriei dup toate criteriile cunoscute;
9. deducerea seriei format cu frecvene relative;
10. interpretare.
P4. Din Anuarul Statistic sau alte surse informaionale extragei dou serii cronologice avnd
la baz indicatorul de nivel, una de momente, alta de intervale i deducei seriile formate
cu diferene absolute, indici statistici, diferene relative, cu baz fix i cu baz n lan
(interpretri).
P5. Dai 5 exemple de serii cronologice avnd la baz indicatorul relativ de intensitate.
P6. Din Anuarul Statistic sau alte surse informaionale extragei o serie de spaiu format cu
indicator de nivel sau indicator relativ de intensitate i deducei seriile formate cu
diferene absolute, indici i diferene relative, calculate cu baz fix. Interpretare.
P7. Extragei 5 exemple de serii de spaiu ce conin informaii importante pentru domeniul
economic.
LUCRAREA 2
Lund ca exemplu o populaie statistic studiat n raport cu un anumit numr de variabile
(stabilite n raport cu obiectivul studiului), se cere:
P1. Elaborarea tuturor seriilor statistice de repartiie unidimensionale
P2. Elaborarea a trei serii statistice de repartiie bidimensionale ( una are la baza dou
variabile calitative, una are la baz o variabila calitativ i o variabil cantitativ, una are
la baz dou variabile cantitative)
P3. Reprezentarea grafic a: histogramei, poligonului frecvenei, cercului de structur,
diagramei prin benzi sau coloane, norul statistic, cronograma i cartograma.

LUCRAREA 3

103

Considerm o populaie statistic din lucrrile anterioare observat n raport cu mai multe
variabile. Se cere:
1. Alegei dou variabile (una cantitativ, cealalt calitativ) i construii repartiia
populaiei n raport cu fiecare din ele;
2. Calculai i interpretai corespunztor parametrii tendinei centrale (valoarea medie,
median, modal) pentru seria care are la baz variabila cantitativ;
3. Analizai reprezentativitatea parametrilor tendinei centrale (sub form absolut i
relativ)
4. Folosind parametrii de structur analizai structura populaiei n raport cu variabila
cantitativ;
5. Analizai gradul de dispersare a unitilor populaiei n raport cu variabila cantitativ;
6. Caracterizai sintetic concentrarea unitilor din populaie folosind variabila
nenumeric;
7. Analiza statistic a asimetriei repartiiei de la punctul 1;
8. Analizai comparativ rezultatele obinute la punctele 5 i 6.

LUCRAREA 4
P1. Pentru o distribuie n raport cu dou variabile calitative ntre care se presupune c ar
putea exista vreo legtur, se cere :
1. Verificarea existenei legturii dintre cele dou variabile.
2. Dac legtura exist, ct de intens este aceasta ?
P2. Pentru o populaie observat n raport cu dou variabile cantitative ntre care ar putea
exista o legtur, se cere :
1. Aprecierea existenei i a intensitii legturii dintre variabile ;
2. S se formuleze pe baza unui grafic adecvat ipoteze cu privire la forma posibil a
funciei de regresie dintre ele ;
3. Pentru funciile reinute ca fiind posibile, s se calculeze parametrii ;
4. Care din aceste funcii este mai reprezentativa ?
5. Pentru funcia aleas s se fac cteva simulri ale valorilor previzionate prin
aceasta.
P3. Pentru o populaie observat n raport cu mai multe variabile, n care presupunem c una
din ele depinde de celelalte se cere :
1. Pe baza unui tip de grafic adecvat, s se stabileasc dac ar putea exista legtur
ntre variabila dependent i fiecare din celelalte variabile;
2. n ipoteza unei legturi liniare multiple, s se calculeze parametrii funciei;
3. S se stabileasc reprezentativitatea acestei funcii i s se compare cu
reprezentativitatea fiecreia dintre funciile liniare simple.

LUCRAREA 5
P1. Pentru trei produse, n dou luni consecutive se cunosc preul de vnzare i respectiv
cantitile vndute. Se cere :
1. Indicele variaiei integrale ;
2. Indicii factoriali ai preurilor i respectiv cantitilor vndute, prin metodele L, P,
F. Este verificat sau nu condiia de completitudine ?
P2. Din Anuarul Statistic al Romniei, extragei structura de consum a populaiei pentru trei
grupe de produse :

104

- mrfuri alimentare
- mrfuri nealimentare
- servicii
pentru dou luni consecutive. Se cere :
1. Indicii preurilor pe cele trei grupe ;
2. Calculai indicele preului (pe total) de tip L i P.
P3. Dac pentru un co bursier format din trei aciuni se cunoate :
- cursul fiecrei aciuni
- numrul de aciuni tranzacionate
s se calculeze indicele bursier.
Lucrarea 6
P1. Alegnd o serie cronologic din lucrarea 1, care manifest component de tendin, se
cere :
1. Diferena medie absolut, indicele mediu, ritmul mediu ;
2. Emiterea unor ipoteze privind forma tendinei ;
3. Estimarea parametrilor tendinei ;
4. Previziunea pentru urmtoarele trei perioade.
P2. Pentru o serie cronologic ce prezint component sezonier, se cere :
1. Cronograma i precizarea componentelor prezente ;
2. Calculul mediilor mobile de ordin p (p=perioada componentei sezoniere) ;
3. Calculul i interpretarea coeficienilor sezonalitii ;
4. Estimarea parametrilor tendinei ;
5. Previziuni pentru urmtoarele 4 perioade de timp.

105

S-ar putea să vă placă și