Sunteți pe pagina 1din 55

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

MATERIAL UTIL PENTRU ACOPERIREA TUTUROR ELEMENTELOR


NECESARE VERIFICRII (Disponibil n format electronic)

A. TEORIE (27p)

Etapele demersului econometric sunt:


Delimitarea ipotezelor din teoria economic ce urmeaz a fi testate;
Formularea matematic a ipotezelor economice;
Specificarea modelului econometric;
Culegerea datelor;
Estimarea parametrilor;
Predicia pe baza modelului;
Concluzii i recomandri.
Modelul econometric
Dei n domeniul economic exist o mare diversitate de modele, modelarea acestora la orice nivel
micro sau macro economic se poate interpreta cu ajutorul modelului de sistem Intrare/Ieire: unde Y = (

y i ) volumul ieirilor din sistem, i=1,...,n


X=(

x j ) factorii cantitativi i calitativi care influeneaz ieirile

S structura sistemului prin intermediul creia factorii

y i , j=1,...,m

x j determin ieirile

yi

Modelele pot fi:


Modele deterministe: y= f(x) se utilizeaz frecvent n practica economic n analiza pe
factori a variaiei, n timp sau spaiu, a fenomenelor social economice (de exemplu: Q =
wL, unde Q este producia, w este productivitatea muncii iar L este fora de munc).
Modele nedeterministe (econometrice) descriu legtura statistic sau stochastic dintre
intrrile sistemului factorii de influen X i ieirile acestuia , variabilele rezultative Y,
dup o relaie de forma: Y = f(x)+
unde: X sunt factorii de influen, Y este variabila rezultativ, f este legea de manifestare a unui fenomen
sau proces economic, este variabila aleatoare
Modelul econometric este instrumentul de cercetare tiinific ce st la baza econometriei.
Modelul econometric, prin definiie, este un model economic formulat astfel nct parametrii s poat fi
estimai dac se face presupunerea c modelul este corect.
Un model econometric poate fi format din una sau mai multe relaii statistice. Aceste relaii pot
fi:
relaii de identitate sau deterministe: sunt formulri logice cu privire la procesul economic descris
(exemplu: VND=C + I, unde VND reprezint Venitul Naional Disponibil, C reprezint consumul total, iar
I reprezint investiiile publice i private);
relaii de comportament: au n vedere modificrile tradiiilor, atitudinilor, nclinaiilor (sub raportul
satisfacie/efort) (exemplu: C = a + bV, unde C este consumul, iar V este venitul);
relaii tehnologice: restriciile impuse output-urilor n raport cu input-urile (exemplu: funcia Cobb

Douglas: Q= I L

,0<<1);

relaii instituionale: sunt relaii de apar n conformitate cu unele reglementri impuse de lege (exemplu:
amortizarea, impozitul pe venit etc.).
1

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


Structura modelului econometric este determinat de variabilele economice. Acestea pot fi:
endogene: variabile determinate n cadrul sistemului;
exogene: variabile determinate n afara sistemului, despre care modelul econometric nu are nimic de spus.
Din punct de vedere cronologic, observarea fenomenelor i proceselor se poate realiza static i
dinamic, datele primare putnd fi:
fie o imagine de tip static a populaiei statistice (datele fiind legate de starea populaiei la un moment
dat);
fie o imagine de tip dinamic, evolutiv n care datele ofer informaii despre evoluia n timp a uneia din
uniti sau a ntregii populaii.
Aceste dou modaliti de observare a unitilor unei populaii conduc la gruparea datelor n trei
categorii:
a) date de tip profil reprezint rezultatul unor msurtori efectuate la un anumit moment dat asupra uneia
sau mai multor variabile, pe mulimea unitilor populaiei.
Aceste date de profil se mai numesc date de tip secven sau date de tip seciune i reprezint
tieturi informaionale efectuate ntr-o populaie la un moment dat, tieturi care sunt de tip
transversal, n raport cu axa timpului.
Se remarc urmtoarele:
o observaie n contextul datelor de tip profil este reprezentat de valoarea sau valorile unei singure
entiti, ale unei singure uniti din populaie; numrul observaiilor coincide, n cazul datelor de tip
profil, cu numrul unitilor observate i investigate;
acest tip de date nu ncorporeaz, prin semnificaia pe care o poart, influena timpului asupra formrii
caracteristicilor (semnul scurgerii timpului) nici n mod explicit i nici n mod implicit;
ele se refer la starea pe care o au la un moment dat unitile populaiei statistice.
b) date de tip serii de timp numite i serii cronologice reprezint rezultate ale unor msurtori efectuate
asupra caracteristicilor, unitilor populaiei studiate, de-a lungul timpului, la momente succesive sau la
anumite intervale de timp.
Acestea sunt date de tip stoc sau de tip flux i reprezint seciuni informaionale de-a lungul
axei timpului, de-a lungul evoluiei; adic sunt seciuni longitudinale n raport cu axa timpului.
c) date de tip panel sunt combinaii, mixturi ale datelor de tip profil i ale datelor de tipul seriilor de timp.
Ele sunt rezultate ale msurtorilor efectuate asupra caracteristicilor unor uniti individuale, att
de-a lungul unitilor individuale, ct i de-a lungul timplui, sunt tieturi informaionale mixte
transversale i longitudinale, n raport cu axa timpului. Caracteristica esenial a acestor date este, deci,
simultaneitatea.
Dei tipologia modelelor econometrice este foarte variat, ele se pot ncadra n cteva tipuri sau
clase principale:
1. Dup numrul factorilor luai n considerare:
modelele unifactoriale: y = f(x)+ se fundamenteaz pe ipoteza c, n rndul factorilor de influen ai
variabilei rezultative Y, exist un factor determinant X, ceilali factori, cu excepia acestuia avnd o
influen ntmpltoare (exprimat prin intermediul variabilei reziduale ) sau fiind invariabili n perioada
analizat;
modele multifuncionale: y = f(

2.

3.

x 1 , x 2 , , x p )+ elimin deficiena modelului unifactorial, ns

trebuie ca numrul factorilor luai n considerare s nu fie foarte mare pentru a nu fi mult prea complex,
dificil de estimat etc.
Dup forma legturii dintre variabila rezultativ i variabilele cauz:
modele liniare: dac legtura este liniar;
modele neliniare: dac legtura este neliniar.
Dup includerea factorului timp n model:
2

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

X j se realizeaz

modele statice: dependena variabilei endogene Y fa de valorile variabilei exogene


n aceeai perioad de timp:
y = f(

x 1t , , x jt , , x kt )+ t

modele dinamice:
introducerea variabilei timp ca o variabil explicativ
y = f(

x t ,t )+ t ;

autoregresive: variabila rezultativ cu valori decalate este una din variabilele explicative
y = f(

x t , y t k )+ t

model cu decalaj: variabila explicativ X i exercit influena asupra variaiei variabilei rezultative pe
mai multe perioade de timp:
y = f(

x t , x t 1 , , xt k )+ t

4. Modele cu o ecuaie sau cu ecuaii multiple:


modele cu o singur ecuaie: toate modelele prezentate anterior
modele cu ecuaii multiple: sunt formate dintr-un sistem de ecuaii

Y 1+ b12 + +b 1n Y n +c 11 X 1 +c 12 X 2+ +c 1 m X m= 1
b21 Y 2 +Y 2 ++ b2 n Y n+ c 21 X 1 +c 22 X 2+ +c 2 m X m= 2

bn 1 Y 2 +b n 2 Y 2 ++Y n+ c n1 X 1 +c n 2 X 2+ +c nm X m= n
Y i ,i= 1, n variabile rezultative sau endogene
X j ,j= 1,m variabile explicative sau exogene

Transformarea datelor primare


Datele nregistrate, obinute prin msurarea pe o scal corespunztoare i nesupuse procesului de
transformare sau de prelucrare, se numesc date de intrare, date primare, date totale sau date originale.
a) Rafinarea datelor (purificarea datelor) primare este necesar deoarece le asigur acestora: consisten,
relevan, comparabilitate.
Aceste cerine sunt determinate de diveri factori: factori specifici, accidentali care conduc la date
aberante; datele exprimate valoric (mai ales ale indicatorilor macroeconomici) sunt afectate de influena
modificrii preurilor, modificarea structurilor i influeneaz n consecin comparabilitatea lor.
Rafinarea datelor se realizeaz n general prin: recalcularea datelor dup metodologii care au ca
ieire date comparabile; interpolarea sau completarea datelor omise; extrapolarea: completarea datelor
omise la capetele seriilor de timp; ajustarea datelor, netezirea datelor: pentru eliminarea perturbaiilor sau
zgomotelor (perturbaiile aleatoare sunt denumite i zgomote albe) i obinerea datelor care exprim
tendina (trendul evoluiei).
b) Prelucrarea primar a datelor se realizeaz prin operaii de centrare i standardizare.
Centrarea observaiilor. Operaia de centrare a datelor const n substituirea valorilor fiecrei
observaii aparinnd unei variabile numerice cu o valoare nou (transformat), reprezentnd abaterea
valorii originale fa de medie (calculat pe baza datelor iniiale), dup relaia:

xi

x cki=x ki xi , unde

este media variabilei i. Standardizarea observaiilor: presupune operaii prin care se substituie
3

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


valoarea individual a fiecrei variabile (observaie) cu o nou valoare (transformat) individual,
reprezentnd raportul individual dintre valoarea centrat i abaterea standard a respectivei variabile.
s

x cki x ki x i
=
, i=1,2,... , n .
Si
Si

Deci:

x ki=

Unde

x i este media variabilei i, iar s i este abaterea standard a variabilei i.

Variabile aleatoare
n activitatea economic se ntlnesc multe mrimi numerice care variaz ntmpltor (aleator).
Exemple:
1) Numrul calculatoarelor vndute la un magazin ntr-o zi este o variabil aleatoare care poate lua una din
valorile 0, 1 ,2 ,..., n, unde n este numrul total de calculatoare din magazin. Aici, mulimea valorilor
posibile este {0, 1 ,2 ,..., n}.
2) Timpul necesar servirii unui automobilist la o staie de benzin este o variabil aleatoare care poate lua o
valoare dintr-un interval dat (a, b). Aici, mulimea valorilor posibile este (a, b).
Variabila aleatoare reprezint o mrime care, n urma unei experiene, poate lua o valoare dintr-o
mulime bine definit, numit mulimea valorilor posibile. Nu se cunoate dinainte ce valoare ia variabila
aleatoare; aceast valoare va fi cunoscut numai dup efectuarea experimentului.
Dac mulimea valorilor posibile este discret, atunci variabila aleatoare se numete discret, iar dac
mulimea valorilor posibile este continu (un interval finit sau infinit din R), variabila aleatoare se
numete continu.
Variabilele aleatoare se noteaz, de regul, cu litere mari de la sfritul alfabetului, X, Y, Z etc., iar valorile
pe care le pot lua variabilele aleatoare cu litere mici , x, y, z etc.
3.1.1 Variabile aleatoare discrete
Pentru a defini o variabil aleatoare discret, trebuie s enumerm toate valorile posibile ale
variabilei aleatoare precum i probabilitile corespunztoare.
Exemplu. n cazul aruncrii unui zar, definim variabila aleatoare astfel:

1
X : 1

2
1
6

3
1
6

4
1
6

5
1
6

6
1

Se numete repartiie a unei variabile aleatoare discrete enumerarea tuturor valorilor posibile ale
variabilei aleatoare precum i a probabilitilor corespunztoare. n general, fie variabila aleatoare X i xi,

X xi

(i=1, 2, ..., n) valorile ei posibile. Fie Ei evenimentul ca variabila aleatoare

P Ei P X xi f xi pi

, probabilitatea corespunztoare unde

f xi

, i=1, 2, ..., n i fie


este funcia de

probabilitate. Atunci putem scrie:

x1
f x1

X :

x2
f x2

...
...

xn
f xn

xi , f xi
Mulimea perechilor ordonate (

) se numete repartiia variabilei aleatoare discrete X.

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


Din exemplele prezentate rezult c funcia de probabilitate trebuie s ndeplineasc urmtoarele dou
condiii:
n

f x 1

f xi 0, i 1,, n
1)

i 1

; 2)
n

UE

, deoarece Ei=(X=xi) este un sistem complet de

, Ei E j , i j, i, j 1, , n

i 1

evenimente, adic:

Exemple:

x x n x , x 0,1, , n
f x Cn p q

X :
1. Repartiia binomial (Bernoulli):

f x C p q
x
n

n x

arat probabilitatea ca din n extrageri, x s fie bile albe. Artm n continuare c f(x)
este o funcie de probabilitate.

f x 0

1) Evident,

x o

x0

f x C

x
n

p x q n x ( p q) n 1

2)
(binomul lui Newton).
2. Repartiia geometric (Pascal):
Fie X evenimentul ca extragerea bilei albe s se realizeze prima dat la extragerea de ordinul x:

A A
X :
x 1
x 1
P x pq
( x1 A )
f x p q
, deci
.
, x=1,2,3,...,n, unde p>0, q>0 i
X=

1
x 1
p

q x 1 p

f x 0
1 q
x 1
x 1

p+q=1. Evident :

p
1
p

, deoarece seria

1
1 q
seria geometric de raie 0<q<1, convergent, cu suma
.
Operaii cu variabile aleatoare discrete; variabile aleatoare independente

x1 ... xi
p1 ... pi

X :
Fie

...
...

xn

pn

y1 ... y j
q1 ... q j

X :
;

i 1

j 1

... ym

... qm

pi f xi 0; pi 1; q j f y j 0; q j 1
.
Evenimentul care const n faptul c:

x 1

x 1

este

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

X xi , i 1,, n, P X
X ia valoarea xi l notm

xi pi

Y y , j 1,, m, P Y y q
j

Y ia valoarea yj l notm

este

X xi Y y j , i 1,, n; j 1,, m

Y yj

X xi
Evenimentul

P[ X xi ; Y y j ] P[ X xi Y y j ]

are o probabilitate bine determinat, notat pij.

Y yj

X xi
Variabilele aleatoare X i Y se numesc independente dac evenimentele (

i 1, , n; j 1, , m

) i (

),

sunt independente. n acest caz:

P X xi ; Y y j P

X xi Y y j

pij pi q j
.

f x

X :

3.1.2 Variabile aleatoare continue. Fie Y variabila aleatoare


, unde x [a,b], iar f(x) este
probabilitatea de apariie a lui x. Funcia f(x) se numete densitatea de probabilitate a variabilei
aleatoare X.
Proprietile densitii de probabilitate:

f ( x) 0

1)

;
b

f ( x)dx 1
a

2)

.
Funcia de repartiie a unei variabile aleatoare:
Prezentarea unei variabile aleatoare prin funcia de probabilitate f(xi) sau prin densitatea de
probabilitate prezint aspecte diferite. Considerm evenimentul (X < x), x R.
Se numete funcie de repartiie a variabilei aleatoare X, funcia

F:RR

dat de

F ( x )=P( X < x) .
Variabila aleatoare X este discret (continu), dup cum funcia de repartiie F(x) este o funcie discret
(continu).

Concepte generale in testarea ipotezelor statistice


Procesul de luare a deciziilor presupune analiza, judecarea si interpretarea evidenelor oferite de datele pe
care le avem la dispoziie. Managerii trebuie s fie pregtii s ia decizii privind aciunile viitoare pe baza
informaiilor disponibile. Astfel, ei emit ipoteze pe care le pot testa tiinific utiliznd metodele si
6

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


tehnicile statistice. Testarea ipotezelor statistice reprezint o alt modalitate, alturi de estimaia pe
interval de ncredere, de a realiza inferen statistic. Scopul acestui tip de inferen statistic este s
determinm dac exist suficiente dovezi statistice care s ne permit s concluzionm c o afirmaie (sau
o ipotez) dspre un parametru este adevrat.
Exemplu. Sute de produse noi sunt lansate n fiecare an. Dintr-o varietate de motive, multe dintre
acestea nu reuesc s cucereasc piaa. De aceea, produsele care ajung in stagiul final de lansare pe pia
sunt evaluate de specialitii n marketing, care doresc s fac predicii asupra succesului (cu alte cuvinte,
ct de bine se vor vinde). Evident, informaii complete i sigure nu se pot obine i atunci specialitii vor
dori s trag concluzii valide, pe baza datelor disponibile din cercetri pariale. S presupunem c un lan
de magazine dorete s vnd un nou produs lansat pe pia i sper s aib succes. Dup o analiz
financiar, specialitii determin c, dac mai mult de 10% din potenialii cumprtori vor cumpra
produsul, lanul de magazine va obine profit. Un eantion aleator de clieni poteniali este selectat i
persoanele sunt ntrebate dac ar cumpra produsul. Procedeul de eantionare i de culegere a datelor este
cunoscut din capitolele precedente, iar parametrul reprezint proporia clienilor care ar cumpra
produsul. Testarea ipotezei statistice se refer, atunci, la a determina dac proporia cumprtorilor este
mai mare de 10%. n urma prelevrii unui eantion dintr-o populaie statistica, prin prelucrarea datelor
provenite din sondaj se obine un estimator al parametrului urmrit n populaia de origine. Se pune atunci
problema n ce msur parametrul estimat pe baza rezultatelor sondajului asigur credibilitatea
aprecierilor fcute asupra ntregii colectiviti. Estimatorul este, aadar, o presupunere asupra
parametrului, deci o ipotez statistic. Nu este nevoie s testm ipoteze statistice atunci cnd tim totul
despre un fenomen, ci doar cnd exist incertitudine.
Ipoteza statistic este ipoteza care se face cu privire la parametrul unei repartiii sau la legea de
repartiie pe care o urmeaz anumite variabile aleatoare. O ipoez statistic nu este neaprat adevrat.
Ea poate fi corect sau greit. n statistic, ipotezele apar ntotdeauna n perechi: ipoteza nul si ipoteza
alternativ. Ipoteza statistic ce urmeaz a fi testat se numete ipotez nul i este notat, uzual, H0. Ea
const ntotdeauna n admiterea caracterului ntmpltor al deosebirilor, adic n presupunerea c nu
exist deosebiri eseniale. Respingerea ipotezei nule care este testat implic acceptarea unei alte ipoteze.
Aceast alt ipotez este numit ipotez alternativ, notat H1. Cele dou ipoteze reprezint teorii,
mutual exclusive si exhaustive, asupra valorii parametrului populaiei sau legii de repartiie. Spunem c
ele sunt mutual exclusive deoarece este imposibil ca ambele ipoteze s fie adevrate. Spunem c ele sunt
exhaustive deoarece acoper toate posibilitile, adic ori ipoteza nul, ori ipoteza alternativ trebuie s
fie adevrat. Procedeul de verificare a unei ipoteze statistice se numete test sau criteriu de
semnificaie. O secven general de pai se aplic la toate situaiile de testare a ipotezelor statistice.
Exist patru componente principale ale unui test privind o ipotez:
ipoteza nul;
ipoteza alternativ;
testul statistic;
regiunea critic (de respingere).
Ipotezele se vor schimba, tehnicile statistice aplicate se vor schimba, dar procesul rmne acelai,
parcurgndu-se urmtorii pai:
1) Se identific ipoteza statistic special despre parametrul populaiei sau legea de
repartiie (H0). Ipoteza statistic numit i ipotez nul specific ntotdeauna o singur valoare a
parametrului populaiei i reprezint status-quo-ul, ceea ce este acceptat pn se dovedete a fi fals.
7

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


2) ntotdeauna, ipoteza nul este nsoit de ipoteza alternativ (de cercetat), H1, ce reprezint o
teorie care contrazice ipoteza nul. Ea va fi acceptat doar cnd exist suficiente dovezi, evidene,
pentru a se stabili c este adevrat.
Ipoteza alternativ este cea mai important, deoarece este ipoteza care ne rspunde la ntrebare.
Ipoteza alternativ poate cpta trei forme, care rspund la trei tipuri de ntrebri referitoare la parametrul
studiat: dac parametrul este diferit (mai mare sau mai mic) dect valoarea specificat n ipoteza nul;
dac parametrul este mai mare dect valoarea specificat n ipoteza nul; dac parametrul este mai mic
dect valoarea specificat n ipoteza nul.
3) Se calculeaz indicatorii statistici n eantion, utilizai pentru a accepta sau a respinge ipoteza
nul i se determin testul statistic ce va fi utilizat drept criteriu de acceptare sau de respingere a ipotezei
nule. Pentru cele mai multe testri statistice ale ipotezelor, testul statistic este derivat din estimatorul
punctual al parametrului ce va fi testat. Spre exemplu, deoarece media eantionului este un estimator
punctual al mediei din colectivitatea general, ea va fi utilizat n testarea ipotezelor privind parametrul
media colectivitii generale.
4) Se stabilete regiunea critic, Rc. Regiunea critic reprezint valorile numerice ale testului
statistic pentru care ipoteza nul va fi respins. Regiunea critic este astfel aleas nct probabilitatea ca
ea s conin testul statistic, cnd ipoteza nul este adevrat, s fie , cu mic ( = 0.01 etc). Verificarea
ipotezei nule se face pe baza unui eantion de volum n, extras din populaia X, care este o variabil
aleatoare. Dac punctul definit de vectorul de sondaj x1, x2, ..., xn cade n regiunea critic Rc, ipoteza H0 se
respinge, iar dac punctul cade n afara regiunii critice Rc, ipoteza H0 se accept. Regiunea critic este
delimitat de valoarea critic, C punctul de tietur n stabilirea acesteia. n baza legii numerelor mari,
numai ntr-un numr foarte mic de cazuri punctul rezultat din sondaj va cdea n Rc, majoritatea vor cdea
n afara regiunii critice. Nu este ns exclus ca punctul din sondaj s cad n regiunea critic, cu toate c
ipoteza nul despre parametrul populaiei este adevarat. Cu alte cuvinte, atunci cnd respingem ipoteza
nul, trebuie s ne gndim de dou ori, deoarece exist dou posibiliti: ea este fals ntr-adevr i ea este
totui adevrat, dei pe baza datelor din sondaj o respingem. La fel i pentru situaia n care acceptm
ipoteza nul H0. Cnd ipoteza nul nu poate fi respins (nu exist suficiente dovezi pentru a fi respins),
sunt dou posibiliti: ipoteza nul este adevrat si ipoteza nul este totui fals, greit, dei nu am
respins-o. De aceea, este mai corect s spunem c, pe baza datelor din eantionul studiat,nu putem
respinge ipoteza nul, dect s spunem c ipoteza nul este adevrat.Eroarea pe care o facem eliminnd
o ipotez nul, dei este adevrat, se numete eroare de genul nti. Probabilitatea comiterii unei astfel
de erori reprezint riscul de genul nti () i se numete nivel sau prag de semnificaie. Nivelul de
ncredere al unui test statistic este (1 ), iar n expresie procentual, (1 )100 reprezint probabilitatea
de garantare a rezultatelor. Eroarea pe care o facem acceptnd o ipotez nul, dei este fals, se numete
eroare de genul al doilea, iar probabilitatea (riscul) comiterii unei astfel de erori se noteaz cu .
Puterea testului statistic este (1 ).
Tabelul 6.1. ilustreaz legtura dintre decizia pe care o lum referitor la ipoteza nul i adevrul sau
falsitatea acestei ipoteze.
Tabelul 6.1. Erorile n testarea ipotezelor statistice
Ipoteza adevrat
Decizia de acceptare
H0
H1
Decizie corect
Eroare de gen II
H0
(probabilitate 1 )
(risc )
H1
Eroare de gen I
Decizie corect
8

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


(risc )

(probabilitate 1 )

Cu ct probabilitile comiterii erorilor de genul nti i de genul al doilea sunt mai mici, cu att
testul este mai bun. Acest lucru se poate realiza prin mrirea volumului eantionului, n. Nivelurile
riscurilor se stabilesc n funcie de considerente economice i de natura testului. Am vzut c:
= P (respingere H0| H0 este corect) = P (eroare de gen I);
= P (acceptare H0| H0 este fals) = P (eroare de gen II).
Alegerea nivelului (pragului) de semnificaie depinde i de costurile asociate cu producerea
unei erori de genul I.
Exemplu
Pragul de semnificaie ales de o firm ce fabric ngheat, interesat n reutatea medie a cutiilor
de ngheat, va putea fi diferit de pragul de semnificaie ales de o companie farmaceutic, interesat de
cantitatea medie a unui ingredient activ dintr-un tip de medicament. Evident, costul n prima situaie
prezentat este mult mai mic, comparativ cu costul asociat n cazul producerii unei erori de genul I pentru
compania farmaceutic: o cantitate prea mic de ingredient activ poate face medicamentul ineficient; o
cantitate prea mare de ingredient activ poate cauza efecte secundare, duntoare sau poate avea, chiar,
efecte letale. Similar, exist costuri asociate cu producerea unei erori de genul al II-lea. ntre eroarea de
genul I i eroarea de genul al II-lea exist o legatur, o condiionare. O modalitate de a vizualiza aceast
legtur este s presupunem c exist doar dou distribuii care ne intereseaz. O distribuie corespunde
ipotezei nule H0, iar cealalt corespunde ipotezei alternative H1. n acest caz, presupunem c i ipoteza
nul i cea alternativ sunt ipoteze simple. ntr-o manier uor de neles, considerm c ipoteza nul este
de forma H0: = 0, iar ipoteza alternativ este de forma H1: = 1 (figura 6.1.):

f(
X
)

X
Figura 6.1. Legtura dintre probabilitile i
Pe grafic se observ c cele dou distribuii se suprapun i, din procesul de testare a ipotezei nule, pot
rezulta dou tipuri de erori.
Eroarea de genul I apare atunci cnd respingem ipoteza nul H0, n situaia n care, de fapt,

x
aceasta este adevrat. Adic, dei distribuia lui
este cea corespunztoare ipotezei H0, respingem H0,
deoarece media de sondaj este mai mare dect valoarea critic, C, i se situeaz n regiunea critic.
Probabilitatea comiterii unei astfel de erori () este aria de sub curba de distribuie H0, care se situeaz la
dreapta valorii critice C. Deseori, cnd lucrm cu soft-ware specializat, ntlnim valoarea-p (p-value).

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


Aceasta reprezint nivelul observat de semnificaie, adic cel mai mic nivel la care H0 poate fi respins
pentru un set de valori date.
Eroarea de genul al doilea apare atunci cnd nu respingem (adic acceptm) H0, dei H1 n loc

x
de H0 este corect. n acest caz, dei distribuia lui
este cea corespunztoare ipotezei H1, acceptm H0
deoarece media de sondaj este mai mic dect valoarea critic, C (nu se afl n regiunea critic).
Probabilitatea comiterii unei astfel de erori () este aria de sub curba de distribuie H1, care se situeaz la
stnga valorii critice, C. Dac alegem un prag de semnificaie, , mai mic (adic reducem riscul comiterii
unei erori de genul nti), va crete (riscul comiterii unei erori de genul al doilea). Cu toate acestea, prin
creterea volumului n al eantionului, este posibil s reducem riscul , fr a crete riscul .

sx

sx

Cum
, o dat cu creterea volumului n al eantionului, abaterile medii ptratice ale
distribuiilor pentru H0 i H1 devin mai mici i, evident, att , ct i descresc (figura 6.2.).

f(
X
)

H
0

H
1

Figura 6.2. i cnd volumul eantionului n>n


5) Dup ce am stabilit pragul de semnificaie i regiunea critic, trecem la pasul urmtor, n care
vom face principalele presupuneri despre populaia sau populaiile ce sunt eantionate (normalitate
etc.).
6) Se calculeaz apoi testul statistic i se determin valoarea sa numeric, pe baza datelor din
eantion.
7) La ultimul pas, se desprind concluziile: ipoteza nul este fie acceptat, fie respins, astfel: a)
dac valoarea numeric a testului statistic cade n regiunea critic (Rc), respingem ipoteza nul i
concluzionm c ipoteza alternativ este adevrat. Vom ti c aceast decizie este incorect doar n 100
% din cazuri; b) dac valoarea numeric a testului nu cade n regiunea critic (Rc), se accept ipoteza
nul H0.
Ipoteza alternativ poate avea, aa cum am artat, una din trei forme (pe care le vom
exemplifica pentru testarea egalitaii parametrului media colectivitii generale, cu valoarea 0):
i) s testm dac parametrul din colectivitatea general (media ) este egal cu o anumit valoare
(inclusiv zero, 0), cu alternativa media diferit de valoarea 0. Atunci:

H 0 : 0 H1 : 0 0 sau 0
,

10

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


i acest test este un test bilateral;
ii) s testm poteza nul = 0, cu alternativa media este mai mare dect 0,
H0: = 0, H1: > 0,
care este un test unilateral dreapta;
iii) s testm ipoteza nul = 0, cu alternativa media este mai mic dect 0,
H0: = 0, H1: < 0,
care este un test unilateral stnga. Regiunea critic pentru testul bilateral difer de cea pentru testul
unilateral. Cnd ncercm s detectm o diferen fa de ipoteza nul, n ambele direcii, trebuie s
stabilim o regiune critic Rc n ambele cozi ale distribuiei de eantionare pentru testul statistic. Cnd
efectum un test unilateral, vom stabili o regiune critic ntr-o singur parte a distribuiei de eantionare,
astfel (figura 6.3.):
/
2

/
2

a)

b)
c)
Figura 6.3.Regiunea critic:
a) test bilateral; b) test unilateral dreapta; c) test unilateral stnga.

Modelul de analiz dispersional unifactorial


n modelul de

analiz dispesional unifactorial se testeaz ipoteza nul: mediile din populaii sunt

H 0 : y1 y 2 ... yr

egale

H1 : yi yj (i j )

, cu ipoteza alternativ: cel puin dou medii din populaie nu sunt egale

11

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

y1 y2 L yr

x1

x2

x
xr

x1

a)medii de grup;

x2

x
xr

b) mediile de grup inegale


Figura 7.1.

Se testeaz, cu alte cuvinte, dac diferenele dintre mediile de grup din eantion sunt prea mari pentru a
fi atribuite doar ntmplrii. Dac rezultatul testului indic faptul c mediile sunt semnificativ diferite, se
concluzioneaz c factorul X are un impact asupra variabilei Y. Testul statistic este dezvoltat n
concordan cu urmtorul raionament. Dac ipoteza nul este adevrat, mediile celor r populaii ar
trebui s fie, toate, egale. Ne ateptm atunci ca mediile celor r eantioane s fie aproximativ egale. Dac
ipoteza alternativ este adevrat exist diferene mari ntre unele medii ale eantioanelor. Setul de date
pentru analiza dispersional unifactorial const n valorile variabilei Y pentru cele r grupe independente.

n1 n2 ... nr

Volumele grupelor pot fi diferite

(tabelul 7.1.):
Tabelul 7.1. Sistematizarea datelor pentru ANOVA
Grupe dup factorul cauz
Gr. 2
.....
Gr. r
y21
.....
y11
y22
.....
y11

Gr. 1
y11
y12

y1 n

y2 n

y 1

Media

y 2

y12

y12

.....

y rn

.....

y r

.....

y12

Vol. grup
Presupunerile sub care se aplic testul F n analiza dispersional unifactorial ofer un cadru
solid pentru interfaa statistic pe baza datelor observate, anume: cele r grupe din eantion sunt extrase
aleator i independent din cele r grupe ale colectivitii generale; fiecare grup din colectivitatea general

1 2 ... r

are o distribuie normal, iar abaterile medii ptratice sunt egale


.
Testul statistic F pentru analiza dispersional unifactorial este raportul indicatorilor de
variabilitate pentru cele dou surse de variaie: variabilitatea dintre grupe mprit la variabilitatea din
interiorul grupelor. El poate fi interpretat ca msurnd de cte ori este mai mare variabilitatea mediilor de

12

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


grup, comparativ cu ce ne-am ateptat dac ele erau doar aleator diferite. Pentru testarea ipotezei nule,
vom estima mediile de grup i media total din colectivitatea general pe baza datelor din eantion.
ni

yi

j 1

ni

ni

yij
yi

i 1, r

y
i 1 j 1

yn

ij

i i

i 1

n ni

i 1

,
,
.
Variana dintre grupe, dat de influena factorului cauzal, numit i variana factorial, este
suma ptratelor abaterilor mediilor de grup de la media general:
r

S1 ( yi y ) 2 ni
i 1

y1 y2 ... yr y S1 0
Din relaie rezult c, dac
,
. Variana din interiorul grupelor, numit i
variana rezidual, este suma ptratelor abaterilor valorilor individuale de la mediile de grup:
ni

S 2 ( yij yi ) 2
i 1 j 1

y
mprtierea total a valorilor individuale fat de media general

este dat de variana total:

ni

S ( yij y ) 2
i 1 j 1

.
Raionamentul analizei dispersionale se bazeaz pe partiionarea sumei ptratelor abaterilor:

ni

i 1 j 1

yij y

ni

yi y ni yij y
i 1

i 1 j 1

S S1 S 2

Pentru a face comparabile aceste msuri ale variabilitii, le vom raporta pe fiecare la gradele de

S1
libertate, transformnd astfel suma de ptrate n media ptratelor abaterilor. Pentru variana factorial

r 1

numrul gradelor de libertate este


i acest lucru nseamn c msurm variabilitatea a r medii, dar se
pierde un grad de libertate, deoarece media total a fost estimat. Pentru variana rezidual (din interiorul

S2

nr

grupelor )
, numrul gradelor de libertate este
; acest lucru nseamn c msurm variabilitatea
tuturor celor n valori, dar pierdem r grade de libertate, deoarece au fost estimate mediile celor r grupe.
Obinem astfel dispersia factorial corect:

y y
r

S
s 1
r 1
2
1

i dispersia corectat rezidual:

13

i 1

r 1

ni

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

y
r

s22

S2

nr

ni

ij

i 1 j 1

yi

nr

Statistica F pentru analiza dispersional unifactorial are forma:

s12
s22
=

cu gradele de libertate (

r 1

variabilitatea dintre grupe


variabilitatea dininteriorul grupelor

) la numrtor i (

nr

) la numitor. Testul statistic F se realizeaz

F
comparnd valoarea calculat a statisticii F cu valoarea critic (tabelat)

pentru (

100(1 )%

grade de libertate i probabilitatea aleas

r 1

) i (

nr

de grantare a rezultatelor. Rezultatul este

F F ,( r 1),( n r )

semnificativ dac:
, deoarece acest lucru indic diferenele mai mari ntre mediile
grupelor dect cele datorate ntmplrii. Regiunea critic este dat deci de valorile lui F pentru care

F F ,( r 1),( n r )

F
. Astfel spus, dac valoarea F este mai mic dect maloarea critic

, atunci se pot

H0
face urmtoarele afirmaii echivalente: acceptm ipoteza nul

; nu acceptm ipoteza alternativ

H1
; mediile grupelor nu sunt semnificativ diferite una fa de alta; diferenele observate ntre mediile
grupelor pot fi datorate doar ntmplrii; rezultatul nu este semnificativ statistic. Dac valoarea F este

F
mai mare dect valoarea critic

H1
, atunci: accentum ipoteza alternativ

; respingem ipoteza nul

H0
; mediile grupelor sunt semnificativ diferite una fa de alta; diferenele observate ntre mediile
grupelor nu sunt datorate doar ntmplrii; rezultatul este semnificativ statistic.

Modelul unifactorial de regresie. Regresia liniar


Definiie, specificare, identificare
Deseori, apare necesitatea de a explica i controla, pe ct posibil, fenomenele i procesele din
economie, care pot reflecta situaii mai mult sau mai puin favorabile. De aceea, se elaboreaz o serie de
instrumente eficiente cu ajutorul crora s explicm situaiile existente i s eliminm (sau eventual s
diminum) efectele nedorite ce pot aprea ntr-un anumit context economic. n acest fel, se pot verifica
ipotezele teoriei economice, se poate renuna la unele care nu s-au dovedit viabile sau se pot elabora altele
14

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


noi, contribuind astfel la mbigirea sistemului informaional privind un anumit fenomen sau proces
economic. Modelul devine, astfel, o verig intermediar ntre teorie i practic, o oglind sintetic,
simplificat a realitii economice, ale crei componente principale sunt exprimate sintetic printr-un set de
variabile, precum i prin relaiile, intercondiionrile dintre aceste variabile. Modelul poate fi constituit
dintr-una sau mai multe ecuaii care exprim dependena variabilelor complexe de un ansamblu de factori
principali i secundari, sistematici i aleatori, care acioneaz n acelai sens sau n sensuri diferite, sistem
care exprim ntr-o form matematic, abstract, problema creia i trebuie gsit rezolvarea. Pentru
rezolvarea acestui sistem sunt enunate o serie de ipoteze raionale, n concordan cu teoria economic,
iar soluiile trebuie obinute n condiii de verosimilitate maxim, pe baza unui eantion de date privind
evoluia variabilelor factoriale i a variabilelor rezultative. n plus, modelele econometrice pot servi la
analiza i a altor aspecte ale realitii economice, precum: identificarea i msurarea efectului ntrziat al
unor factori economico-sociali, previzionarea evoluiei unor fenomene, sintetizate printr-un set de
variabile, oscilaiile sistematice, sezoniere sau ciclice ce pot nsoi evoluia acestora, simularea i
prognoza proceselor economico-sociale, identificarea i msurarea aciunii unor variabile dihotomice,
alternative sau binare.
Legturile care exist ntre dou variabile statistice pot fi studiate folosind dou tehnici: regresia
i corelaia. Corelaia va arta ct de puternic este legtura, dependena dintre variabile, n timp ce
regresia va ajuta n explicarea i previzionarea unui factor pe baza valorii altuia (altora), ceea ce, evident,
va reduce incertitudinea privitoare la fenomene importante, dar aleatoare. n sens statistic, termenul
regresie i aparine statisticianului englez F. Galton (1822-1911). Exist trei scopuri principale, atunci
cnd analiz, legturile dintre variabile statistice: s descriem i s nelegem relaiile de dependen;
s previzionm o nou valoare a variabilei efect; s ajustm i s controlm variabila efect,
prin intervenia asupra variabilei cauz. Un studiu econometric ncepe cu o serie de presupuneri teoretice
despre anumite aspecte ale economiei.
Definim modelul unifactorial de regresie printr-o relaie matematic construit pe baza teoriei
economice, care presupune c fenomenul economic Y (fenomenul efect) este rezultatul aciunii a dou
categorii de factori:
prima, constituit dintr-un singur factor principal, esenial, determinant X,
a doua format din toi ceilali factori considerai neeseniali, cu aciune ntmpltoare
(specificai prin variabila rezidual ) sau constant, invariabil, asupra lui Y (i deci nu au sens a fi
specificai n model).
Specificarea modelului unifactorial const n precizarea variabilei endogene Y i a celei exogene
X, pe baza teoriei economice; ca orice ipotez teoretic, ea poate fi adevrat sau fals.

y f ( x)

Identificarea modelului const n alegerea unei funii (sau a unui grup de funcii) matematice, cu
ajutorul creia se urmrete descrierea valorilor variabilei endogene, doar n funcie de variaia variabilei
exogene X. Identificarea modelului se poate face prin: procedeul grafic; procedeul conversrii ariilor;
procedeul calculelor algebrice.
Una dintre funciile matematice utilizate cel mai des o constituie funcia liniar. Relaia dintre
variabila efect (Y) i variabila cauz (X) studiat de regresia simpl liniar ntr-o populaie statistic

yi xi i

general poate fi descris prin modelul probabilistic liniar:

, n care:

( xi , yi )

reprezint valorile numerice ale variabilelor cauz (X) i efect (Y), nregistrate la

nivelul unitii statistice i;

reprezint parametrii ecuaiei de regresie (n literatura de


15

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

specialitate se mai noteaz


i ); reprezint punctul de intersecie al dreptei de regresie cu axa
Oy; reprezint panta dreptei, se mai numete i coeficient de regresie i arat cu cte uniti de
msur se modific Y dac X se modific cu o unitate de msur;
i reprezint componenta rezidual (eroare aleatoare) pentru unitatea statistic i.

Dup cum observm, modelul probabilistic conine: a) componenta deterministic, adic partea din

xi ( xi $
yi )

yi
valoarea lui

, care poate fi determinat cunoscnd valoarea

; b)

componenta

yi
rezidual este partea din valoarea lui

xi ( i )

, care nu poate fi determinat cunoscnd valoarea individual

yi $
yi i

yi

. Atunci:
= componenta predictual (deterministic) + eroarea aleatoare sau
.
Dac datele disponibile provin dintr-un eantion (aa cum se ntmpl n cele mai multe aczuri), avem la

( x1 , y1 ), ( x2 , y2 ),..., ( xn , yn )
dispoziie n perechi de observaii ,

iar modelul de regresie liniar n eantion

$
y i a bxi

yi a bxi ei
este:

cu componenta predictibil:

, unde a i b sunt estimatorii punctului

de intersecie () i ai pantei liniei de regresie ( ), obinui pe eantion, iar

ei
, estimatorul componentei

reziduale,

Ipotezele modelului de regresie liniar. Pentru a obine proprietile dorite ale estimatorilor regresiei, se
fac, de obicei, ase presupuneri (ipoteze) standard pentru modelul din populaia general. Ipotezele ce
trebuie verificate sunt formulate astfel:

16

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


1.
2.
3.
4.
5.
6.

yi xi i i 1, n

Formula funcional:
Media zero a erorilor:
Homoscedasticitatea:
Non-autocorelarea erorilor:
Necorelarea ntre regresor i erori:
Normalitatea erorilor.

E ( i ) 0i
Var ( i ) 2
constant

Cov( i , j ) 0i j
Cov( xi , j ) 0
i i j

j : N (0, )
2

1. Forma funcional
Ipoteza de liniaritate nu este att de restrictiv pe ct pare. Aceasta se refer la felul n care
parametrii intr n ecuaie, nu neaprat la relaia dintre variabilele X i Y. n exemplele prezentate n
continuare s-a procedat la transformarea unor variabile n vederea liniarizrii modelelor.

y a bx

a.

y a bz, z e x
b.
c.

y a br , r 1 x
y a bq, q ln( x)

d.
Y
a+ b

a + b ex

()

a+ bx

a+b ln(x)

Figura 8.2. Modele ce pot fi liniarizate

17

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


n exemplele anterioare, doar variabila X a fost transformat. Acelai lucru se poate ntmpla i cu

y Ax ln( y) ln( x)
variabila Y, aa cum este cazul modelului:

, forma general a acestuia

f ( yi ) g ( xi ) i

fiind:

1
x

Exist ns i modele ce nu pot fi liniarizat, cum este cel de forma:


.
Ipoteza de liniaritate a modelului include i aditivitatea erorilor. Modelul trebuie s fie de forma:

y x

, fie n variabilele iniiale, fie dup ce au fost fcute transformrile potrivite. De

y Ax e
exemplu,

modelul

se

transform

prin

logaritmare

modelul

liniar:

y Ax

ln( y ) ln( A) ln( x)

. ns modelul
nu mai poate fi transformat n model liniar.
Dac ipoteza de liniaritate este verificat, variabila dependent observat este suma a dou
elemente:

componenta predictibil:
o component aleatoare: .

( i ) 0i
2. Media erorilor este zero:
, este natural atta timp ct este vzut ca suma
efectelor individuale, cu semne diferite. Aceast presupunere indic faptul c media valorilor Y este

Y X Xi Xi

condiionat de ionat de X,
n populaie (vezi figura 8.3.):

, adic nu exist variabile omise asiciate cu regresia

(Y|
X=Xi)=+Xi

erori
pozitiv
e
X1
X3

erori
negative
X2

Figura 8.3. Distribuia de probabilitate pentru i

Var ( i ) 2
3. Ipoteza de homoscedasticitate:

constant

18

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

Variabilele aleatoare
au dispersia constant,
constant pentru toate valorile Xi (figurile 8.3. i 8.4.)

, adic dispersia reziduurilor n populaie este

y
y

a)
b)
Figura 8.4. Dispersia reziduurilor:a) constant; b) variabil;
o

o
x

E ( i j ) 0i j
4. Non-autocorelarea erorilor:

yi

yj

Aceast ipotez nu implic faptul c


i
sunt necorelate, ci faptul c deviaiile observaiilor
de la valorile de ateptare sunt necorelate.
De asemenea, este convenabil a considera c erorile sunt independente i normal distribuite cu
medie zero i variaie constant pentru obinerea de rezultate statistice exacte.
5. Variabila aleatoare i este normal distribuit (figura 8.3.)

Cov( xi , j ) 0
6. Necorelarea ntre regresor i erori:

i i j

xi
Chiar dac

sunt numere fixate (de exemplu: de cercettor) sau sunt variabile aleatoare, ele sunt

statistic independente de variabila aleatoare ;


Ipotezele modelului de regresie liniar vor fi analizate mai detaliat n capitolul 6.
8.1.3. Estimarea parametrilor modelului de regresie
Regresia simpl liniar
Modelul de regresie liniar n eantion este:

yi a bxi ei

cu componenta predictibil:

19

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

$
y i a bxi

ei
unde a i b sunt coeficienii funciei de regresie, iar

, valoarea rezidual (pentru unitatea i) n eantion:

ei yi (a bxi )

xi , yi
nu este altceva dect o msur a distanei de la un punct (
) la linia de regresie (figura 8.6.):
y
(xi,
y
e yi)
i
a+
y=
bxi
a+
xi

x
i

Figura 8.6. Abaterea ei de la linia de regresie


Procedeul de determinare a liniei de regresie n eantion urmrete s gseasc valorile lui a i b,

$
y

astfel nct valorile estimate ale variabilei dependente ( ) s fie ct mai aproape posibil de valorile
observate (y) (dreapta s treac ct mai aproape de toate punctele observate). Un criteriu pentru
determinarea valorilor a i b este metoda minimizrii sumei ptratelor deviaiilor (abaterilor sau

y
i

ei
reziduurilor) ei. Cu ct este mai mic valoarea , cu att este mai aproape
cunoscut ca metoda celor mai mici ptrate, nseamn minimizarea relaiei:

S ( a, b) min ei2 min yi a bxi


i

yi
de valoarea

Condiiile de ordin 1 de minimizare a funciei sunt:

S
a 0

S 0
b

2 y a b x 1 0
y na b x 0

2 y a b x x 0 x y a x b x
i

obinndu-se sistemul de ecuaii normale:

20

2
i

. Metoda,

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

na b xi yi

i 1

i 1

i 1

i 1

i 1

a x b x2 x y
i i ii
Rezolvarea sistemului poate fi realizat folosind metoda determinanilor, dup cum urmeaz:

a
b
b

y x
x y x
i

i
2
i

y
x y

, unde:

x
x

i
2
i

xi

y x x x y
n x x
b n x y x y
b

n x x

2
i

2
i

2
i

Sau

i 1

yi b

x x y y

a y bx

x
i 1

xi yi nxy
i

x
2
i

nx

i 1

x x
n

i 1

sxy
sx2

Rmne de verificat dac este ndeplinit condiia de ordin 2, adic soluia gsit este un punct
de minim. Matricea derivatelor pariale de ordin doi trebuie s fie pozitiv definit:

21

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

2 (S )
2a2
2
(S )
ba

2 ( S )
2n
ab

2
2 xi
( S )

i
2 2
b

2 xi

i
2
2 xi

2n 0

4n x 2 4( x ) 2 4n ( x x ) 2 0
i i
i

Deci matricea este pozitiv definit.


Coeficientul a (intercepia) poate lua valori negative sau pozitive. Coeficientul b (panta liniei

sxy
drepte) numit i coeficient de regresie are ntotdeauna semnul indicatorului
X i Y. Aadar, n cazul unei legturi directe rezult

b0

b0

b0

, numit i covariana ntre

(figura 8.7.a), iar n cazul unei legturi inverse,

(figura 8.7.b). dac


, acest lucru semnific lipsa legturii liniare ntre X la Y, iar linia de
regresie este paralel cu axa absciselor (figura 8.7.c)
y

$
y

$
y
o

$
y
x o

a)

b)
c)
Figura 8.7. Linii de regresie cu:
a) pant pozitiv; b) pant negativ; c) pant egal cu zero
n urma determinrii coeficienilor a i b ai ecuaiei de regresie, se calculeaz valorile ajustate

$
y i a bxi

date de

. Vom obine astfel:


n

y $y
i 1

i 1

.
Este de remarcat faptul c, dac datele au fost sistematizate utiliznd metoda gruprii, iar valorile

xi

yi

i
se ntlnesc cu frecvenele
coeficienilor a i b, devine:

ni
, atunci sistemul de ecuaii normale, pentru determinarea

22

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

i 1

i 1

a ni b xi ni yi ni

i 1

i 1

i 1

i 1

a x n b x2 n x y n
ii i i iii

n urma ajustrii vom obine:


r

i 1

i 1

yi ni $y i ni
.

xi
n cazul n care datele au fost sistematizate ntr-un tabel cu dubl intrare, iar valorile

yi
i

se

nij
ntlnesc cu frecvenele

, sistemul devine:

a nij b xi ni y j n j

i 1 j 1

i 1

i 1

i 1

j 1

a x n b x2n
i i. i i. xi yi nij

i 1 j 1

;
Determinarea coeficienilor ai b pe baza acestor sisteme de ecuaii se adapteaz corespunztor.
n urma ajustrii vom obine:
m

y n $y n
j 1

j 1

.
Reamintim c, n cazul legturii simple liniare, o msur relativ a dependenei dintre dou
variabile o constituie coeficientul de corelaie. Acest indicator al corelaiei standardizeaz media
produselor abaterilor, semnul lui indicnd direcia legturii, iar valoarea intensitatea legturii.

x x y y
n

s
cov( x, y )
rxy
xy
sx s y
sx s y

i 1

i 1

x x
n

i 1

yi y

sau, prin transformri elementare:

rxy

i 1

i 1

i 1

n xi yi xi yi
2

n x x
i
i 1
i 1
n

2
i


n y yi
i 1
i 1
n

2
i

b

,

23

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

n y

i 1

2
i

y
i 1

unde

rxy
Valoarea coeficientului de corelaie (
sau simplu, r) este situat ntre -1 i 1. O valoare 1 indic
o corelaie liniar direct i perfect (funcional), iar o valoare -1 indic o corelaie liniar invers
perfect. O valoare zero arat (de obicei) lips legturii ntre variabile. Totui, aceast interpretare trebuie
fcut cu precauie, deoarece o legtur neliniar, valorile extreme sau aberante pot distorsiona
interpretarea coeficientului de corelaie. Diagrama de mprtiere ne va ajuta, n plus, la interpretarea lui
r.
Aadar, coeficientul de corelaie, r, este un indicator ce caracterizeaz direcia i intensitatea

rxy
legturii liniare. De altfel, se observ c

b
este

sx y
s

2
x

r b

sx y
sx s y
, iar b, coeficientul de regresie (panta liniei drepte),

sx
sy

. Aadar
.
Coeficientul de corelaie (r) are, deci, acelai semn cu coeficientul de regresie (b) i anume

sy

sx
semnul dat de direcia legturii dintre variabile, deoarece

sunt ntotdeauna pozitive.

MODELAREA ECONOMETRIC A SERIILOR CRONOLOGICE


Componentele unei serii cronologice. tim c dac datele statistice sunt transversale (sau dinamice),
adic dac variabila este msurat n timp, n ordine secvenial, atunci, n urma sistematizrii, se obine o
serie cronologic de tipul:
1

y1

2 ... t
y2 ... yt

... n t

... y n yt

t 1, n
,

t 1, n
unde
reprezint unitile de timp (perioade sau momente), iar yt reprezint nivelurile variabilei
studiate, Y. Aadar, ntr-o serie cronologic, ordinea datelor ofer informaii importante. O serie
cronologic poate fi format din patru componente diferite i anume: 1. Componenta de lung durat
trend (YT); 2. Componenta sezonier (YS); 3. Componenta ciclic (YC); 4. Componenta rezidual (YR).
1. Tendina de lung durat (numit i trend, tendin secular sau tendin pe termen lung) se
manifest sub influena unor factori sistematici cu aciune ndelungat i confer o form aproximativ
neted i o direcie aproximativ stabil de evoluie a fenomenului. Tendina de lung durat se manifest
i se pune n eviden pe un numr mare de termeni, peste 10-15 termeni. Spre exemplu, populaia
Romniei (indicator de interes pentru multe din activitile sectorului teriar), a cunoscut urmtoarea
evoluie n perioada 1980-2005 (numr mediu de locuitori la 1 iulie):

24

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


23500000
23000000
22500000
Persoane 22000000
21500000

19
80
19
86
19
92
19
98
20
04

21000000

Figura 11.1. Populaia Romniei n perioada 1980-2005


Sursa: Anuarul Statistic al Romniei, 2006

Dup cum se observ (figura 11.1), tendina de lung durat nu trebuie ntotdeauna s fie liniar. n acest
exemplu, numrul populaiei a crescut pn n 1990, dup care se constat o tendin descresctoare, n
perioada 1990-2005. Cu toate acestea, multe variabile social-economice de interes pot avea o tendin
liniar pe termen lung, cresctoare ori descresctoare.
2. Componenta sezonier are tot o influen sistematic, sub forma unor valuri (cicluri)
repetitive, care apar la perioade calendaristice scurte i, prin definiie, au o durat mai mic de un an de
zile. Termenul de variaii sezoniere se poate referi, n mod tradiional, la cele patru anotimpuri (sau
trimestre), ori la fluctuaiile ce apar n timpul unei luni, unei zile sau chiar n cursul unei zile. Cererea de
produse turistice, producia i preul de vnzare al unor produse agroalimentare, tarifele unor servicii etc.
Pot prezenta astfel de variaii sezoniere. n general, industria turismului este afectat de sezonalitate. n
funcie de momentul de re-ferin anchetele statistice pot oferi date i informaii privind fie trimestrele
calendaristice, fie trimestrele sezoniere. Anchetele bazate pe trimestre sezoniere ofer date decalate cu o
lun fa de cele calendaristice (Sursa: CANSTAT, Statistical Bulletin, Bucharest, 2002, pg. 96).
Exemplu
Hotelul CREASTA dintr-o zon montan, cu o capacitate de cazare existent de 140 locuri a nregistrat,
n perioada 2003-2006, urmtorii indici trimestriali de utilizare net a capacitii n funciunee (%)
(tabelul 11.1.):

Anul
2003
2004
2005
2006

Tabelul 11.1. Indici de utilizare net a capacitii n funciune (%)


Trimestrul
I
II
III
30,0
21,2
62,8
30,8
22,4
64,4
32,2
22,8
66,2
32,8
23,0
68,0

IV
44,2
46,0
48,0
48,4

Din reprezentarea grafic (figura 11.2.) se observ cu uurin c, n trimestrul III, indicii de utilizare net
a capacitii n funciune sunt mai ridicai dect n celelalte trimestre.

25

Tr.
I

'0
3

0.
0

Indici de utilizare neta (%)

30
.0

60
.0

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

Figura 11.2. Indici de utilizare net a capacitii n


funciune la hotelul CREASTA, n perioada 2003-2006
3. Componenta ciclic are, de asemenea, o influen sistematic sub forma unor valuri, dar care
apar la un numr mai mare de ani (2-10 ani). Prin definiie, ciclurile au o durat mai mare de un an de zile
i sunt determinate de interaciunea unor factori ce influeneaz economia ori planul social (figura 11.3.).
Exemple de astfel de cicluri includ bine-cunoscutele cicluri de afaceri ce includ perioade de recesiune i
expansiune, ciclurile pe termen lung privind cererea unor mrfuri, ciclurile n sectorul monetar i
financiar. n practic, ciclurile apar rareori cu regularitate i adesea se manifest n combinaie cu alte
componente. n industria turismului, ntlnim cicluri de via ale destinaiilor turistice (vezi Stnciulescu,
Gabriela coord. Lexicon de termeni turistici, Editura Oscar Print, Bucureti, 2002).
y

A
nii
Figura 11.3. Variaie ciclic ntr-o serie cronologic
4. Componenta rezidual determin variaii ntmpltoare, manifestate ca devieri neregulate ntro serie cronologic i care nu sunt cauzate de nicio alt component. Uneori aceast component poate
ascunde existena altora, mai predictibile, dar trebuie s subliniem c variaiile aleatoare apar n aproape
toate seriile cronologice, ceea ce face necesar identificarea lor, n scopul efecturii cu acuratee a
previzionrilor. Dac examinm figurile anterioare, vom observa astfel de variaii reziduale i, tocmai de
aceea, chiar dac vom caracteriza precis i exact celelalte componente, nu vom putea previziona la fel de
exact evoluia viitoare a unei variabile.
Componentele unei serii cronologice pot fi prezentate, pe scurt, astfel (tabelul 11.2.):

Denumire
Tip
Definiie

Componenta de
lung durat
Sistematic
Tendina de
modificare pe
termen lung

Tabelul 11.2. Componentele unei serii cronologice


Componenta
Componenta
Componenta
sezonier
ciclic
rezidual
Sistematic
Sistematic
Nesistematic
Fluctuaii regulate
Fluctuaii
Fluctuaii reziduale
ce apar n
aproximativ
(ntmpltoare),
interiorul unei
regulate ce apar la
care rmn dup
26

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


perioade de 12 luni
i se repet an de
an

intervale de timp
mari de 1 an de
zile

evidena celorlalte
componente

Evenimente
neprevzute
Factori de
(greve, inundaii,
influena
rzboaie etc.) sau
variaii aleatoare
ale datelor
Un numr mare de Mai mic sau egal
Durat scurt i
Durat
De obicei 2-10 ani
termeni
cu 12 luni
care nu se repet
Modelul general al unei serii cronologice poate fi exprimat ca un model aditiv, unde valoarea variabilei la
Schimbri n
populaie,
tehnologie,
educaie, nivel de
trai etc.

Condiii climatice,
obiceiuri
religioase, sociale
etc.

Interaciunea unor
factori ce
influeneaz
economia

yt yTt ySt yCt yRt

momentul (n perioada) t poate fi descris ca:

yt yTt ySt yCt yRt

, sau ca un model multiplicativ,

dac valoarea variabilei este descris ca:


. Ambele modele sunt acceptabile. n
general, modelul multiplicativ se utilizeaz atunci cnd fluctuaiile (regulate i neregulate) se amplific
ori se diminueaz fa de tendina secular, iar modelul aditiv se utilizeaz atunci cnd fluctuaiile rmn
constante n amplitudine, fa de trend.
11.1.1. Estimarea componentei trend
Dac putem determina i caracteriza componentele care exist ntr-o serie cronologic, vom
putea, apoi, s efectum o previzionare valid a evoluiei viitoare. Caracterizarea i descrierea tendinei de
lung durat se poate face folosind metode statistice (simple) sau analitice. n alegerea uneia sau alteia
dintre metode un rol important l joac graficul statistic i modul n care reuim s descoperim existena i
forma diferitelor componente din reprezentarea seriei cronologice. Metodele mecanice de descriere a
trendului unei serii cronologice cuprind: metoda modificrii medii absolute, metoda indicelui mediu de
modificare i metoda mediilor mobile. Metodele analitice presupun utilizarea unei funcii analitice de
tendin. Tehnicile de netezire (sau ajustare) a seriei cronologice urmresc, aadar, eliminarea sau
atenuarea oscilaiilor (fluctuaiilor) sistematice i nesistematice. Prezentm, n continuare, modul de
estimare a tendinei de lung durat a unei serii cronologice prin metoda mediilor mobile. Metoda
mediilor mobile este utilizat cu deosebire atunci cnd seria cronologic prezint fluctuaii regulate
(sezoniere sau ciclice), pentru a netezi evoluia fenomenului. Tendina pe termen lung se determin sub
forma unor medii, calculate din atia termeni (m), la ci se manifest o oscilaie complet. Mediile se
numesc mobile, glisante, deoarece, n permanen, n calculul unei astfel de medii se las n afar primul
termen al mediei anterioare i se introduce urmtorul termen. Astfel, dac mediile mobile sunt calculate,
spre exemplu, din cinci termeni, fiecare valoare ajustat va cuprinde termenul din perioada respectiv, cei
doi termeni anteriori i cei doi termeni urmtori.

ytTMM

yt 2 yt 1 yt yt 1 yt 2
t 3, n 2
5

,
.
n general, dac mediile sunt calculate din m termeni (m, numr impar) se vor pierde, prin
calculul mediilor, (m 1) termeni i fiecare valoare ajustat va fi situat n dreptul unei valori nregistrate.
Dac, ns, mediile mobile se calculeaz din m termeni (m numr par), atunci valorile medii se situeaz
ntre termenii reali i vom centra nivelurile, astfel ajustate, prin calculul unor medii de medii (medii
pariale). Spre exemplu, dac o oscilaie complet are loc la 6 termeni, atunci calculm medii mobile
centrate:
27

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

ytTMM

yt 3
y
yt 2 yt 1 yt yt 1 yt 2 t 3
2
2
6

t 4, n 3

,
.
n acest caz se vor pierde, prin calculul mediilor centrate, m termeni. Prin calculul mediilor mobile,
abaterile sezoniere se compenseaz.
Exemplu. S considerm seria cronologic privind sosirile trimestriale de turiti la hotelul Creasta
dintr-o zon montan (tabelul 11.3.):

Anii
2003
2004
2005
2006

I
940
952
992
1026

Tabelul 11.3. Sosiri trimestriale de turiti la hotelul Creasta


Trimestre
II
III
IV
650
1934
1360
706
2072
1406
734
2088
1478
740
2190
1492

Pentru calcularea tendinei pe termen lung, folosind metoda mediilor mobile din 4 termeni (la ci
se manifest o oscilaie complet), putem sistematiza datele astfel (tabelul 11.4.):
Tabelul 11.4. Calculul mediilor mobile
Anul
Trimestrul
Perioada(t)
yt
ytT(MM)
0
1
2
3
4

I
1
940
II
2
650

2003
III
3
1934
1222
IV
4
1360
1231
I
5
952
1255
II
6
706
1278
2004
III
7
2072
1289
IV
8
1406
1297
I
9
992
1303
II
10
734
1314
2005
III
11
2088
1327
IV
12
1478
1332
1346
I
13
1026
1360
II
14
740
2006

III
15
2190
IV
16
1492

y3TMM

y
y1
y 2 y3 y 4 5
2
2
4

Prima medie mobil centrat este:

28

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

y3TMM

940
952
650 1934 1360
2 1222
2
4
persoane.

Cea de-a doua medie mobil centrat este:

y4TMM

650
706
1934 1360 952
2 1231
2
4

persoane. .a.m.d.
Reprezentarea grafic n figura 8.4. ilustreaz modul n care mediile mobile permit determinarea
tendinei de lung durat, prin eliminarea oscilaiilor sezoniere. S mai notm c mediile mobile pot fi
calculate i acolo unde nu exist devieri periodice, n scopul de a nltura variaiile reziduale. Cu ct
mediile mobile se vor calcula, dintr-un numr mai mare de termeni, cu att netezirea va fi mai accentuat;
pe de alt parte, calculul mediilor mobile dintr-un numr prea mic de termeni poate face ca variaiile
reziduale s nu se elimine din valorile reale.
2500
2000
1500
1000
persoaneValori observate

Medii mobile

500

Tr.
I

'0
Tr. 3
III
'0
3
Tr.
I'
0
Tr. 4
III
'0
4
Tr.
I'
0
Tr. 5
III
'0
5
Tr.
I'
0
Tr. 6
III
'0
6

Figura 11.4. Determinarea tendinei seculare folosind mediile mobile


11.1.2. Estimarea componentei sezoniere
Variaiile sezoniere pot s apar n interiorul unui an sau chiar al unui interval mai scurt de timp, cum ar fi
luna, sptmna sau ziua. Rezult deci c, pentru studiul statistic al componentei sezoniere, este necesar
s avem la dispoziie date sistematizate pe intervale de timp mai mici de un an de zile. Pentru a msura
efectul sezonier, putem determina devieri sezoniere sau indici de sezonalitate. Devierile sezoniere
msoar, n medie, abaterile fiecrui sezon de trend, iau valori pozitive i negative, astfel nct suma
devierilor sezoniere, pentru toate sezoanele, este egal cu zero. Indicii de sezonalitate msoar, n medie,
de cte ori se abate variabila, n fiecare sezon, de la trend, iau valori supraunitare sau subunitare, astfel
nct produsul lor este egal cu 1.
1. Determinarea devierilor sezoniere
Pentru determinarea devierilor sezoniere se parcurg urmtorii pai: 1. Se nltur din valorile
seriei cronologice (yt) componenta de trend (ytT) determinat prin metoda mediilor mobile sau printr-o

yt ytT ytS ytR

metod analitic (vom considera o serie fr componenta ciclic, Ct). Atunci:


29

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


2. Pentru fiecare sezon n parte, calculm media rezultatelor obinute la pasul 1. n felul acesta
(prin calculul mediei) se nltur cea mai mare parte din variaiile reziduale (dei foarte rar le putem
nltura n ntregime). Aceste medii, calculate pentru m sezoane, msoar diferenele fa de linia de
tendin, date de componenta sezonier.
3. Devierile sezoniere se vor calcula din valorile obinute la pasul al doilea, ajustate astfel nct

y
k 1

Sk

suma lor s fie egal cu zero

Exemplu. Dup cum se tie, industria turistic este subiectul unor serioase variaii sezoniere. Folosind
datele din tabelul 11.3., vom urmri s determinm devierile sezoniere ale variabilei, sosiri de turiti.
Pentru aceasta, vom nltura mai nti componenta de trend (col. 3 col. 4, tabelul 8.4), iar rezultatele (

ytS ytR

) le vom sistematiza n tabelul 11.5.

Anii
0
2003
2004
2005
2006
Media
Deviere sezonier

Tabelul 11.5. Determinarea devierilor sezoniere


Trimestrul
Suma
II
III
IV
2
3
4
5

712
129

572
783
109

761
746
580

620
590,7
752
128
22
585
758
133
0

I
1

303
311
320
311,3
306

Pentru fiecare sezon vom determina media abaterilor:


pentru trim. I:

303 (311) ( 320)


311,3
3

572 (580) ( 620)


590, 7
3

; pentru trim. II:


712 783 761
752
3

129 109 146


128
3

pentru trim. III:


; pentru trim. IV:
Cum suma acestor medii ale abaterilor este diferit de zero
4

y
k 1

Sk

.
22
5,5
4

( 311,3) (590, 7) 752 128 22

, vom ajusta mediile calculate cu valoarea

yS 1 311, 3 ( 5, 5) 305,8 306

, obinnd devieri sezoniere, astfel:

persoane

yS 2 590, 7 (5,5) 585, 2 585


yS 4 128 (5,5) 133, 5 134

yS 3 752 (5,5) 757,5 758

persoane,

persoane

persoane
Devierile sezoniere n trimestrele I i II sunt negative (niveluri sub trend), iar trimestrele III i IV
sunt pozitive (vrfuri de activitate). Rezultatele ne arat c factorul sezonier deviaz numrul sosirilor de
30

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


turiti n trimestrul I cu 306 persoane sub linia de trend, n trimestrul II cu 585 persoane sub trend, iar n
trimestrele III i IV cu 758, respectiv, cu 133 persoane peste tendina de lung durat.
Determinarea indicilor sezonieri. Pentru determinarea indicilor de sezonalitate, metodologia este
similar, parcurgndu-se urmtorii pai:
1. Se nltur componenta de trend:
yt
ytS ytR
ytT
.
2. Se calculeaz, pentru fiecare sezon, media rezultatelor obinute la punctul 1, eliminnd
astfel variaiile reziduale. 3. Indicii de sezonalitate se determin din mediile obinute la pasul 2,
ajustate astfel nct indicele mediu s fie egal cu 1. Cele mai exacte rezultate se obin dac vom folosi
n calcule media geometric. Cu toate acestea, pentru uurina calculelor, deseori se folosete media
aritmetic.

yt : ytT
Exemplu. Pe baza datelor din tabelul 8.3., vom nltura componenta de trend

ytS ytR

vom obine

(col. 3: col. 4) i

, valori sistematizate n tabelul 11.6.

Anii

Tabelul 11.6. Determinarea indicilor de sezonalitate


Trimestrul
Produsul
II
III
IV
2
3
4
5

1,583
1,105

1,607
1,084
0,552
1,573
1,112
0,559

0,554

0,555
1,588
1,099
0,737
0,599
1,714
1,186
0,000

I
1

0,759
0,761
0,762
0,761
0,821

1998
1999
2000
2001
Media
Indice de sezonalitate

Pentru fiecare sezon determinm media valorilor astfel obinute:


3

0, 759 0, 761 0, 762 0, 761

pentru trim I:

0,552 0,559
0,554 0,555

; pentru trim II:


3

1,583 1, 607 1,573

1,588

;
3

1,105 1, 084 1,112

1, 099

pentru trim III:


; pentru trim IV:
Cum produsul acestor medii (geometrice) este diferit de 1:
4

y
k 1

Sk

0, 761 0,555 1,588

1,099 0,
737

, vom ajusta mediile calculate cu media indicilor


sezonieri, obinnd indici de sezonalitate, astfel:
Media indicilor sezonieri este calculat ca o medie geometric:

yS

yS1 yS 2 yS 3 yS 4

0,9265

.
Indicii de sezonalitate vor fi subunitari n trimestrele I i II i supraunitari n trimestrele III i IV.

yS1 0, 761: 0,9265 0,821 yS 2 0,555 : 0,9265 0,599 yS 3 1,588 : 0,9265 1, 714

31

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

yS 4 1, 099 : 0,9265 1,186


4

y
k 1

Sk

Acum
.
Indicii de sezonalitate astfel obinui ne arat c, n medie, sosirile de turiti n trimestrele III i IV
se afl peste tendina de lung durat cu 71,4%, respectiv cu 18,6%, iar n trimestrele I i II, sosirile de
turiti se situeaz sub linia de trend cu 17,9%, respectiv cu 40,1%. n previzionarea sosirilor de turiti va
trebui s inem cont, pentru fiecare trimestru, de influena factorului sezonier, influen determinat sub
forma devierilor sezoniere sau a indicilor de sezonalitate. Dup ce am determinat devierile sezoniere ori

yt ySk

yt ySk

indicii de sezonalitate, vom desezonaliza seria cronologic (


) pentru devieri i
pentru
indici. Rezultatele astfel obinute vor conine doar componenta de tendin secular ( ytT) i componenta
rezidual (ytR). Putem acum s determinm tendina de lung durat, aplicnd o metod mecanic ori
analitic. S subliniem ns c, atunci cnd vom ajunge la etapa de previzionare, va trebui s inem cont i
de devierile sezoniere, ori de indicii de sezonalitate.

B. TC. EXEMPLU
Obiectivul Econometriei
A fost formulat de ctre statisticianul Ragnar Frisch, n chiar primul numr al revistei Econometrica,
astfel: experiena a artat c fiecare din urmtoarele trei puncte de vedere, al statisticii, a teoriei
economice i al matematicii, este o condiie necesar, dar nu i suficient pentru o nelegere
efectiv a relaiilor cantitative din economia modern; unificarea lor este aceea care asigur
eficiena. Econometria este tocmai aceast unificare. Altfel spus, econometria reprezint studierea
fenomenelor economice pe baza datelor statistice cu ajutorul modelelor matematice.
Definiia restrictiv: A fost propus de Cowles Comission for Research in Economics (Chicago,
1940-1950); n aceast viziune se consider c econometria presupune investigarea fenomenelor
economice numai cu ajutorul modelelor aleatoare (stochastice, probabilistice); ea include doar
cercetrile economice ce utilizeaz metodele induciei matematice la verificarea relaiilor cantitative
formulate n teoria economic cu privire la fenomenele sau procesele studiate.
Definiia extins: Aparine economitilor anglo-saxoni i consider c econometria n sens larg
nseamn econometria n sens restrns, la care se adaug metodele cercetrii operaionale.
n prezent, econometria cuprinde i tehnicile moderne de analiz a datelor (analiza marilor tabele, de
exemplu). Econometria poate fi folosit n dou moduri, care nu sunt mutual exclusive: Ca
instrument de previziune (date fiind valori ipotetice ale anumitor variabile, putem previziona valoarea
variabilei de interes). Ca metod explicativ (poate fi folosit pentru a confirma sau infirma o teorie
economic).
Modelul econometric este instrumentul de cercetare tiinific ce st la baza econometriei. Modelul
econometric, prin definiie, este un model economic formulat astfel nct parametrii s poat fi
estimai dac se face presupunerea c modelul este corect. Un model econometric poate fi format din
una sau mai multe relaii statistice.

Specificul disciplinei
32

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


Dei n domeniul economic exist o mare diversitate de modele, modelarea acestora la orice nivel micro
sau macro economic se poate interpreta ca sistem intrare/ieire unde Y = (
sistem, i=1,...,n, X = (

x j ) factorii cantitativi i calitativi care influeneaz ieirile

S structura sistemului prin intermediul creia factorii

y i ) volumul ieirilor din

x j determin ieirile

y i , j=1,...,m,

yi

Modelele pot fi:


Modele deterministe: y= f(x) se utilizeaz frecvent n practica economic n analiza pe
factori a variaiei, n timp sau spaiu, a fenomenelor social economice (de exemplu: Q =
wL, unde Q este producia, w este productivitatea muncii iar L este fora de munc).
Modele nedeterministe (econometrice) descriu legtura statistic sau stochastic dintre
intrrile sistemului factorii de influen X i ieirile acestuia , variabilele rezultative Y,
dup o relaie de forma: Y = f(x)+, unde:
X sunt factorii de influen
Y este variabila rezultativ
f este legea de manifestare a unui fenomen sau proces economic
este variabila aleatoare
Modelul econometric este instrumentul de cercetare tiinific ce st la baza econometriei. Modelul
econometric, prin definiie, este un model economic formulat astfel nct parametrii s poat fi estimai
dac se face presupunerea c modelul este corect.
Un model econometric poate fi format din una sau mai multe relaii statistice. Aceste relaii pot fi:
relaii de identitate sau deterministe: sunt formulri logice cu privire la procesul economic descris
(exemplu: VND=C + I, unde VND reprezint Venitul Naional Disponibil, C reprezint consumul total, iar
I reprezint investiiile publice i private);
relaii de comportament: au n vedere modificrile tradiiilor, atitudinilor, nclinaiilor (sub raportul
satisfacie/efort) (exemplu: C = a + bV, unde C este consumul, iar V este venitul);
relaii tehnologice: restriciile impuse output-urilor n raport cu input-urile (exemplu: funcia Cobb

Douglas: Q= I L

,0<<1);

relaii instituionale: sunt relaii de apar n conformitate cu unele reglementri impuse de lege (exemplu:
amortizarea, impozitul pe venit etc.).
Structura modelului econometric este determinat de variabilele economice. Acestea pot fi:
endogene: variabile determinate n cadrul sistemului;
exogene: variabile determinate n afara sistemului, despre care modelul econometric nu are nimic de spus.
Din punct de vedere cronologic, observarea fenomenelor i proceselor se poate realiza static i dinamic,
datele primare putnd fi:
fie o imagine de tip static a populaiei statistice (datele fiind legate de starea populaiei la un moment
dat);
fie o imagine de tip dinamic, evolutiv n care datele ofer informaii despre evoluia n timp a uneia din
uniti sau a ntregii populaii.
Aceste dou modaliti de observare a unitilor unei populaii conduc la gruparea datelor n trei categorii:
d) date de tip profil reprezint rezultatul unor msurtori efectuate la un anumit moment dat asupra uneia
sau mai multor variabile, pe mulimea unitilor populaiei.
Aceste date de profil se mai numesc date de tip secven sau date de tip seciune i reprezint tieturi
informaionale efectuate ntr-o populaie la un moment dat, tieturi care sunt de tip transversal, n
raport cu axa timpului.
Se remarc urmtoarele:
o observaie n contextul datelor de tip profil este reprezentat de valoarea sau valorile unei singure
entiti, ale unei singure uniti din populaie; numrul observaiilor coincide, n cazul datelor de tip
profil, cu numrul unitilor observate i investigate;
33

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


acest tip de date nu ncorporeaz, prin semnificaia pe care o poart, influena timpului asupra formrii
caracteristicilor (semnul scurgerii timpului) nici n mod explicit i nici n mod implicit;
ele se refer la starea pe care o au la un moment dat unitile populaiei statistice.
e) date de tip serii de timp numite i serii cronologice reprezint rezultate ale unor msurtori efectuate
asupra caracteristicilor, unitilor populaiei studiate, de-a lungul timpului, la momente succesive sau la
anumite intervale de timp.
Acestea sunt date de tip stoc sau de tip flux i reprezint seciuni informaionale de-a lungul axei
timpului, de-a lungul evoluiei; adic sunt seciuni longitudinale n raport cu axa timpului.
f) date de tip panel sunt combinaii, mixturi ale datelor de tip profil i ale datelor de tipul seriilor de timp.
Ele sunt rezultate ale msurtorilor efectuate asupra caracteristicilor unor uniti individuale, att de-a
lungul unitilor individuale, ct i de-a lungul timplui, sunt tieturi informaionale mixte transversale i
longitudinale, n raport cu axa timpului. Caracteristica esenial a acestor date este, deci, simultaneitatea.
Dei tipologia modelelor econometrice este foarte variat, ele se pot ncadra n cteva tipuri sau clase
principale:
5. Dup numrul factorilor luai n considerare:
modelele unifactoriale: y = f(x)+ se fundamenteaz pe ipoteza c, n rndul factorilor de influen ai
variabilei rezultative Y, exist un factor determinant X, ceilali factori, cu excepia acestuia avnd o
influen ntmpltoare (exprimat prin intermediul variabilei reziduale ) sau fiind invariabili n perioada
analizat;
modele multifuncionale: y = f(

6.

7.

x 1 , x 2 , , x p )+ elimin deficiena modelului unifactorial, ns

trebuie ca numrul factorilor luai n considerare s nu fie foarte mare pentru a nu fi mult prea complex,
dificil de estimat etc.
Dup forma legturii dintre variabila rezultativ i variabilele cauz:
modele liniare: dac legtura este liniar;
modele neliniare: dac legtura este neliniar.
Dup includerea factorului timp n model:

modele statice: dependena variabilei endogene Y fa de valorile variabilei exogene


n aceeai perioad de timp:
y = f(

X j se realizeaz

x 1t , , x jt , , x kt )+ t

modele dinamice:
introducerea variabilei timp ca o variabil explicativ
y = f(

x t ,t )+ t ;

autoregresive: variabila rezultativ cu valori decalate este una din variabilele explicative
y = f(

x t , y t k )+ t

model cu decalaj: variabila explicativ X i exercit influena asupra variaiei variabilei rezultative pe
mai multe perioade de timp:
y = f(

x t , x t 1 , , xt k )+ t

8. Modele cu o ecuaie sau cu ecuaii multiple:


modele cu o singur ecuaie: toate modelele prezentate anterior
modele cu ecuaii multiple: sunt formate dintr-un sistem de ecuaii

34

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

Y 1+ b12 + +b 1n Y n +c 11 X 1 +c 12 X 2+ +c 1 m X m= 1
b21 Y 2 +Y 2 ++ b2 n Y n+ c 21 X 1 +c 22 X 2+ +c 2 m X m= 2

bn 1 Y 2 +b n 2 Y 2 ++Y n+ c n1 X 1 +c n 2 X 2+ +c nm X m= n
Y i ,i= 1, n variabile rezultative sau endogene

X j ,j= 1,m variabile explicative sau exogene


Procesul de luare a deciziilor presupune analiza, judecarea si interpretarea evidenelor oferite de datele pe
care le avem la dispoziie. Managerii trebuie s fie pregtii s ia decizii privind aciunile viitoare pe baza
informaiilor disponibile. Astfel, ei emit ipoteze pe care le pot testa tiinific utiliznd metodele si
tehnicile statistice.
Testarea ipotezelor statistice reprezint o alt modalitate, alturi de estimaia pe interval de ncredere, de
a realiza inferen statistic. Scopul acestui tip de inferen statistic este s determinm dac exist
suficiente dovezi statistice care s ne permit s concluzionm c o afirmaie (sau o ipotez) dspre un
parametru este adevrat. n urma prelevrii unui eantion dintr-o populaie statistica, prin prelucrarea
datelor provenite din sondaj se obine un estimator al parametrului urmrit n populaia de origine. Se
pune atunci problema n ce msur parametrul estimat pe baza rezultatelor sondajului asigur
credibilitatea aprecierilor fcute asupra ntregii colectiviti. Estimatorul este, aadar, o presupunere
asupra parametrului, deci o ipotez statistic. Nu este nevoie s testm ipoteze statistice atunci cnd tim
totul despre un fenomen, ci doar cnd exist incertitudine.
Ipoteza statistic este ipoteza care se face cu privire la parametrul unei repartiii sau la legea de repartiie
pe care o urmeaz anumite variabile aleatoare. O ipoez statistic nu este neaprat adevrat. Ea poate fi
corect sau greit. n statistic, ipotezele apar ntotdeauna n perechi: ipoteza nul si ipoteza alternativ.
Ipoteza statistic ce urmeaz a fi testat se numete ipotez nul i este notat, uzual, H0. Ea const
ntotdeauna n admiterea caracterului ntmpltor al deosebirilor, adic n presupunerea c nu exist
deosebiri eseniale. Respingerea ipotezei nule care este testat implic acceptarea unei alte ipoteze.
Aceast alt ipotez este numit ipotez alternativ, notat H1. Cele dou ipoteze reprezint teorii,
mutual exclusive si exhaustive, asupra valorii parametrului populaiei sau legii de repartiie. Spunem c
ele sunt mutual exclusive deoarece este imposibil ca ambele ipoteze s fie adevrate. Spunem c ele sunt
exhaustive deoarece acoper toate posibilitile, adic ori ipoteza nul, ori ipoteza alternativ trebuie s
fie adevrat. Procedeul de verificare a unei ipoteze statistice se numete test sau criteriu de
semnificaie. O secven general de pai se aplic la toate situaiile de testare a ipotezelor statistice.
Exist patru componente principale ale unui test privind o ipotez: ipoteza nul; ipoteza alternativ; testul
statistic; regiunea critic (de respingere). Ipotezele se vor schimba, tehnicile statistice aplicate se vor
schimba, dar procesul rmne acelai, parcurgndu-se urmtorii pai:
1) Se identific ipoteza statistic special despre parametrul populaiei sau legea de repartiie (H0).
Ipoteza statistic numit i ipotez nul specific ntotdeauna o singur valoare a parametrului
populaiei i reprezint status-quo-ul, ceea ce este acceptat pn se dovedete a fi fals.
2) ntotdeauna, ipoteza nul este nsoit de ipoteza alternativ (de cercetat), H1, ce reprezint o teorie
care contrazice ipoteza nul. Ea va fi acceptat doar cnd exist suficiente dovezi, evidene, pentru a
se stabili c este adevrat.
Ipoteza alternativ este cea mai important, deoarece este ipoteza care ne rspunde la ntrebare. Ipoteza
alternativ poate cpta trei forme, care rspund la trei tipuri de ntrebri referitoare la parametrul studiat:
dac parametrul este diferit (mai mare sau mai mic) dect valoarea specificat n ipoteza nul;
dac parametrul este mai mare dect valoarea specificat n ipoteza nul;
dac parametrul este mai mic dect valoarea specificat n ipoteza nul.
35

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


3) Se calculeaz indicatorii statistici n eantion, utilizai pentru a accepta sau a respinge ipoteza nul i se
determin testul statistic ce va fi utilizat drept criteriu de acceptare sau de respingere a ipotezei nule.
Pentru cele mai multe testri statistice ale ipotezelor, testul statistic este derivat din estimatorul punctual
al parametrului ce va fi testat. Spre exemplu, deoarece media eantionului este un estimator punctual al
mediei din colectivitatea general, ea va fi utilizat n testarea ipotezelor privind parametrul media
colectivitii generale.
4) Se stabilete regiunea critic, Rc. Regiunea critic reprezint valorile numerice ale testului statistic
pentru care ipoteza nul va fi respins. Regiunea critic este astfel aleas nct probabilitatea ca ea s
conin testul statistic, cnd ipoteza nul este adevrat, s fie , cu mic ( = 0.01 etc). Verificarea
ipotezei nule se face pe baza unui eantion de volum n, extras din populaia X, care este o variabil
aleatoare. Dac punctul definit de vectorul de sondaj x1, x2, ..., xn cade n regiunea critic Rc, ipoteza H0 se
respinge, iar dac punctul cade n afara regiunii critice Rc, ipoteza H0 se accept. Regiunea critic este
delimitat de valoarea critic, C punctul de tietur n stabilirea acesteia. n baza legii numerelor mari,
numai ntr-un numr foarte mic de cazuri punctul rezultat din sondaj va cdea n Rc, majoritatea vor cdea
n afara regiunii critice. Nu este ns exclus ca punctul din sondaj s cad n regiunea critic, cu toate c
ipoteza nul despre parametrul populaiei este adevarat. Cu alte cuvinte, atunci cnd respingem ipoteza
nul, trebuie s ne gndim de dou ori, deoarece exist dou posibiliti: ea este fals ntr-adevr i ea este
totui adevrat, dei pe baza datelor din sondaj o respingem.
La fel i pentru situaia n care acceptm ipoteza nul H0. Cnd ipoteza nul nu poate fi respins (nu exist
suficiente dovezi pentru a fi respins), sunt dou posibiliti: ipoteza nul este adevrat si ipoteza nul
este totui fals, greit, dei nu am respins-o. De aceea, este mai corect s spunem c, pe baza datelor
din eantionul studiat,nu putem respinge ipoteza nul, dect s spunem c ipoteza nul este adevrat.
Eroarea pe care o facem eliminnd o ipotez nul, dei este adevrat, se numete eroare de genul nti.
Probabilitatea comiterii unei astfel de erori reprezint riscul de genul nti () i se numete nivel sau
prag de semnificaie.
Nivelul de ncredere al unui test statistic este (1 ), iar n expresie procentual, (1 )100 reprezint
probabilitatea de garantare a rezultatelor. Eroarea pe care o facem acceptnd o ipotez nul, dei este
fals, se numete eroare de genul al doilea, iar probabilitatea (riscul) comiterii unei astfel de erori se
noteaz cu . Puterea testului statistic este (1 ).

OBSERVAIE. Se poate opta i pentru alte aspecte specifice econometriei.

Studiu de caz (variante)


1.

Un cercettor face un studiu asupra unor firme, privind ansele pe care acestea le ofer tinerilor
angajai de a promova repede i de a avansa n carier. Pentru aceasta el a cuprins n studiu un numr de
20 de companii productoare de tehnologie de vrf i a nregistrat timpul scurs de la angajarea iniial a
unui salariat n firm pn la prima promovare a acestuia. Firmele au fost grupate dup mrime, iar datele
nregistrate sunt:
Mrimea firmelor
Numr de sptmni de la angajare pn la prima promovare
Mici
30; 26; 30; 32; 38; 24; 32; 28;
Medii
34; 32; 25; 36; 33;
Mari
47; 41; 43; 48; 40; 49; 40.
Se cere s se determine, folosind testul F de analiz dispersional, dac variaia timpului scurs pn la
prima promovare este influenat semnificativ de mrimea firmei.
Rezolvare:
Notm cu X caracteristica mrimea firmelor factorul de grupare i cu Y caracteristica numr de
sptmni de la angajare pn la prima promovare. Se formuleaz urmtoarele ipoteze:

H 0 : 1 2 3

36

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

H 1 : i j , i j
Unde i reprezint timpul mediu de promovare pentru firma din grupa i, la nivelul colectivitii

i 1,3

yi
generale. Calculm, la nivelul eantionului, mediile pentru fiecare grup i (
reprezint grupa (mrimea firmei):

), cu

, unde i

y1

1j

j 1

n1

30 26 30 38 32 24 32 28
30, 00
8

sptmni;
5

y2

y
j 1

2j

n2

34 32 25 36 33
32
5
sptmni;

y3

3j

j 1

n3

47 41 43 48 40 49 40
44
7

sptmni.
Numrul mediu de sptmni pentru ntreaga colectivitate de 20 de firme poate fi calculat ca medie a
mediilor pariale:

yn
n

i i

30 8 32 5 44 7
35, 4
20
sptmni.

si2
Determinm dispersia fiecrei grupe i (

y
8

s12

j 1

1j

y1

):

n1

(26 30) 2 (32 30) 2 (38 30)2

(24 30) 2 (32 30) 2 (28 30) 2 128

16
8
8

y
5

s22

j 1

2j

y2

n2

(34 32) 2 (25 32) 2 (36 32) 2 (33 32) 2

70
14
5

37

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

y
7

s32

3j

j 1

y3

n3

(47 44) 2 (41 44) 2 (43 44) 2

(48 44)2 2(40 44) 2 (49 44) 2 92

13,14
7
7

Variana sistematic va fi:


r

S1 y i y ni (30 35, 4) 2
8 (32 35, 4) 2 5
i 1

(44 35, 4) 2 7 808,8


Variana rezidual este:
r

ni

S2 yij y i
i 1 j 1

s
2

i 1

2
i

ni 128 70 92 290

Dispersia corectat sistematic este:

s12

S1
808,8

404, 4
r 1
2

Dispersia corectat rezidual este:

s22

S2
290

17, 06
n r 17

Testul F:

s12 404, 4
F 2
23, 7
s2 17, 06
Ftabelar Fcritic F ,r 1,n r F0,05;2;17 3,59

Fcalculat Fcritic
Cum
, rezult c se respinge ipoteza nul, acceptndu-se ca adevrat ipoteza alternativ.
Timpul mediu de promovare pe fiecare tip de firm difer semnificativ, n consecin se poate afirma, cu o
probabilitate de 95%, c mrimea firmei influeneaz semnificativ variaia timpului de promovare a
tinerilor.

2.

n vederea fundamentrii deciziei de nlocuire a unor utilaje din dotarea unei fabrici, managerul
acesteia solicit o analiz a vechimii utilajelor i a costului de ntreinere anual al acestora. Astfel, cele
110 utilaje din dotarea fabricii sunt grupate dup vechime (ani) i dup costul de ntreinere (mii lei):
Costul de ntreinere (mii lei)
Total
Vechime(ani)
57
79
911
1113
Mic (< 5 ani)
10
8
5

23
Medie (510 ani)

15
20
7
42
Mare (> 10 ani)

2
25
18
45
Total
10
25
50
52
110
38

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


Se cere s se determine dac influena vechimii asupra variaiei costului de ntreinere este semnificativ,
utiliznd testul F de analiz dispersional.
Rezolvare: Notm cu X caracteristica vechime factorul de grupare i cu Y caracteristica costul de
ntreinere. n vederea calculrii indicatorilor necesari determinrii statisticii F datele vor fi sistematizate
pentru fiecare categorie de vechime conform tabelelor de mai jos.
i = 1 (grupa vechime mic)
Cost de ntreinere (mii
RON)
57
79
911
1113
Total

y1

y n

j 1j
1j

n1j

yj

yjn1j

y j y1

10
8
5

6
8
10
12

60
64
50

-1,56
0,44
2,44

24,336
1,549
29,768

174

55,653

23

174

7,56 mii RON s12


23
;

y y
n
j

n1 j

1j

y1

n1 j

55, 653
2, 42
23
.
i = 2 (grupa vechime medie)

Cost de ntreinere (mii


RON)

n2j

yj

yjn2j

y j y2

57
79
911
1113
Total

15
20
7
42

6
8
10
12

120
200
84
404

-1,62
0,38
2,38

y2

y n

j 2j
2j

y2

n2 j

39,366
2,888
39,6508
81,9048

y j y 2 n2 j 81,9048 1,95
404

9, 62 mii RON s22


42
42
n2 j
;

i = 3 (grupa vechime mare)


Cost de ntreinere (mii
RON)

n3j

yj

yjn3j

y j y3

57
79
911
1113
Total

2
25
18
45

6
8
10
12

16
250
216
482

-2,7
-0,7
1,3

39

y3

14,58
12,25
30,42
57,25

n3 j

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

y3

y j n3 j
n

3j

485
10, 7 mii RON s32
45
;

y y

n
j

n3 j

3j

57, 25
1, 27
45
.

Media dispersiilor grupelor va fi:


Variana rezidual este:
r

ni

S 2 yij y i
i 1 j 1

si2 ni 2, 42 23
1,95 42
1,27 45 194,
7
i 1

Costul mediu de ntreinere pentru ntreaga colectivitate de 110 utilaje poate fi calculat ca medie a
mediilor pariale:

yn
n

i i
i

7,56 23 9, 62 42
10, 7 45

9, 64 mii RON
110
.

Variana sistematic va fi:


r

S1 y i y ni (7,56 9, 64) 2 23 (9, 62 9, 64) 2 42

i 1

(10, 7 9, 64) 2 45 150,15


Dispersia corectat sistematic este:

s12

S1
150,15

75, 075
r 1
2

Dispersia corectat rezidual este:

s22

S2
194, 7

1,82
nr
107

Testul F:

s12 75, 075

41, 25
s22
1,82

Ftabelar Fcritic F ,r 1,n r F0,05;2;107 3, 07

Fcalculat Fcritic
Cum
, rezult c se respinge ipoteza nul, acceptndu-se ca adevrat ipoteza alternativ.
n consecin se poate afirma, cu o probabilitate de 95%, c vechimea utilajelor influeneaz semnificativ
variaia costului de ntreinere.
3. Pentru un magazin de mobil s-au cules date privind numrul de spoturi publicitare difuzate i numrul
vizitatorilor (mii pers.) timp de 14 zile:
Ziua
1

Nr. spoturi
publicitare
7
40

Nr. vizitatori
(mii pers.)
41

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


2
3
4
5
6
7
8
9
10
11
12
13
14

5
1
8
10
2
6
7
9
3
12
8
4
11

32
10
40
61
8
35
34
45
11
64
37
30
55

Se cere:
a) Reprezentai grafic datele. Comentai graficul.
b) Pe baza datelor de la nivelul eantionului, determinai ecuaia de regresie care modeleaz
legtura dintre cele dou variabile i calculai numrul zilnic previzionat de vizitatori.
c) Verificai dac modelul de regresie identificat este valid statistic.
d) Testai semnificaia statistic a parametrilor modelului, determinnd i intervalele de ncredere
pentru acetia.
e) Msurai intensitatea legturii dintre cele dou variabile cu ajutorul coeficientului i a
raportului de corelaie; testai semnificaia indicatorilor utilizai.
f) n ce msur variaia numrului de vizitatori este determinat de numrul spoturilor publicitare,
pe baza modelului de regresie determinat?
g) Previzionai numrul vizitatorilor ateptai ntr-o zi, n ipoteza c se vor difuza 15 spoturi n
acea zi.
h) Previzionai numrul mediu zilnic de vizitatori, n ipoteza c se vor difuza 8 spoturi publicitare
n medie pe zi.
Rezolvare:
a) Notm cu X variabila factorial, independent nr. spoturi publicitare i cu Y variabila
dependent nr. vizitatori.
Pentru a identifica existena, forma i sensul legturii dintre variabilele analizate, construim
corelograma (figura 4.10.).

41

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

70
60
50
40
Nr. vizitatori 30
20
10
0
0

10

12

14

Nr. spoturi

Figura 4.10. Corelograma (diagrama de mprtiere)


Se observ c legtura dintre variabile este direct i liniar (ntruct dreapta de regresie are pant
pozitiv), iar ecuaia de regresie va avea forma:

yi a bxi

b) Pentru a determina estimatorii a i b, rezolvm sistemul de ecuaii normale, folosind datele din
tabelul de lucru 4.5.:

na b xi yi

2
a xi b xi xi yi

n 14

(numrul observaiilor).

xi

yi

xi2

xi yi

yi2

7
5
1
8
10
2
6
7
9
3
12
8
4

42
32
10
40
61
8
35
34
45
11
64
37
30

49
25
1
64
100
4
36
49
81
9
144
64
16

294
160
10
320
610
16
210
238
405
33
768
296
120

1764
1024
100
1600
3721
64
1225
1156
2025
121
4096
1369
900

yi 2, 2858
5, 0753 xi
37,81
27,66
7,36
42,89
53,04
12,44
32,74
37,81
47,96
17,51
63,19
42,89
22,59
42

yi yi
17,53
18,82
6,96
8,34
63,39
19,68
5,12
14,54
8,78
42,40
0,66
34,67
54,96

yi y
3,29
69,52
820,19
47,44
290,31
555,25
10,64
3,29
143,12
341,82
739,24
47,44
179,91

xi x
0,13
2,70
31,84
1,84
11,27
21,56
0,41
0,13
5,56
13,27
28,70
1,84
6,98

504

9,69

489,01

18,98
145,21

58,11

3740,47

3025

305,53

605

y2i = 763

121

xiyi = 504

55

x2i = 763

xi = 93

11

yi = 504

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

14a 93b 504

93a 763b 4085


a

a 504 763 93 4085 4647

2, 2858

14 763 (93) 2
2033

b 14 4085 93
504 10318

5, 0753

14 763 (93) 2
2033

yi 2, 2858 5, 0753 xi
Ecuaia de regresie este:
c) Testarea validitii modelului de regresie determinat.
Pentru testarea validitii modelului se formuleaz cele dou ipoteze: H0: model nevalid statistic,
cu alternativa H1: model valid statistic. Se completeaz tabelul:
Grade de
Media
Suma ptratelor
Sursa
libertate (df- ptratelor (MS(SS-Sum of
Testul Fisher (testul F)
variaiei
degree of
Mean of
Squares)
freedom)
Squares)
Datorat
regresiei
Rezidual

Total

2y x 3740, 465

e2 305,535
2y 4046, 000

k 1

s 2y x 3740, 465

n k 1

Fcalc

3740, 465
146,908
25, 461

se2 25, 461

14 2 12
n 1
14 1 13

Valoarea teoretic pentru un prag de semnificaie = 0,005 i 1, respectiv 12 grade de libertate,

F ;k ;n k 1 4, 75

preluat din tabelul repartiiei Fisher, este

Fcalc F ;k ;n k 1

ntruct
se respinge H0, adic se concluzioneaz c modelul este valid.
Calculele intermediare se gsesc n tabelul 4.5.
d) Ecuaia de regresie liniar la nivelul colectivitii generale se scrie:

yi xi i

,
iar la nivelul eantionului:
43

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

yi a bxi ei
Pentru testarea semnificaiei parametrilor modelului de regresie liniar i estimarea lor pe
intervalele de ncredere se procedeaz astfel:
1) pentru parametrul
Ipotezele testate sunt:

H 0 : 0( b 0)

H1 : 0
.

Deoarece volumul eantionului este mic (

tcalc

n 30

b b b 0

sb
sb

), vom utiliza testul t:

, statistic ce urmeaz o distribuie t cu (

se

sb

(x x )
i 1

n2

) grade de libertate.

5, 046
0, 4187
145, 21

Unde
n

n2
2
e

se
Iar

( y y )
i 1

n2

305,53
5, 046
12

tcalc 12,1206

Se obine

t 2;13 2,179

Pentru un prag de semnificaie de 5%, valoarea teoretic a testului este

tcalc t 2;13

. Deoarece

vom concluziona c este foarte improbabil ca estimatorul b s provin dintr-o populaie cu


(adic este semnificativ diferit de zero), deci parametru este semnificativ statistic.
Intervalul de ncredere pentru parametrul , coeficientul de regresie din colectivitatea general,

este:

b t 2, n 2 sb b t

2, n 2

sb

4,1629 5,9876
, adic

2) pentru parametrul a
Ipotezele testate sunt:

H0 : 0
H1 : 0

.
Statistica t este:
44

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

tcalc

a a a 0

sa
sa
.
n

sa se

x
i 1

2
i

n ( xi x ) 2

5,046

763
3,0912
14 145, 21

i 1

Unde

tcalc 0, 7394
t 2;13 2,179

Pentru un prag de semnificaie de 5%, valoarea teoretic a testului este

. Deoarece

tcalc t 2;13

vom concluziona c este foarte probabil ca estimatorul a s provin dintr-o populaie cu


(adic nu este semnificativ diferit de zero).
Intervalul de ncredere pentru parametrul este dat de:

a t 2, n 2 sa a t 2, n 2 sa

4, 4495 9,0210

, adic
.
Un argument suplimentar pentru concluzia c parametrul este nesemnificativ statistic este acela
c intervalul de ncredere include i valoarea zero.
e) Pentru a msura intensitatea legturii dintre cele dou variabile, se va calcula mai nti
coeficientul de corelaie liniar:
r

n xi yi xi yi

n x2 x
i
i
10318

n y2 y 2
n yi2 yi
i i

10318

0,9615
2
2033(14 22190 504 ) 10731
2

Acest indicator ne arat o legtur direct i foarte puternic (r este pozitiv i apropiat de valoarea
unitar).
Pentru testarea semnificaiei coeficientului de corelaie liniar simpl, se procedeaz astfel:
Ipotezele testate sunt:

H0 : 0

( nu este semnificativ statistic)

H1 : 0
( este semnificativ statistic).
Statistic t este:

tcalc

r r n 2 0,9615 12

12,12
sr
1 r2
1 0,96152

.
Cum valoarea tabelar a testului t, pentru un prag de semnificaie de 5% i 12 grade de libertate

tcalc t ;n 2

este 2,179 rezult

,deci coeficientul de corelaie este semnificativ statistic.


45

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


Un alt indicator utilizat att n cazul legturilor liniare, ct i al celor neliniare este raportul de
corelaie R:

( y y )
1
( y y)

R Ry / x

305,53
0,9615
4046

Calculele necesare determinrii raportului de corelaie sunt redate n 4.5.

504
36
14
mii pers.

Ry / x ry / x 0,9615

, deci exist o legtur liniar, puternic i direct ntre cele dou variabile.
Testarea semnificaiei raportului de corelaie se face cu testul F:

n k 1 R2

146,9
k
1 R2

Valoarea teoretic pentru un prag de semnificaie = 0,05 i 1, respectiv 12 grade de libertate,

F ;k ;n k 1 4, 75

preluat din tabelul repartiiei Fisher, este

Fcalc F ;k ;n k 1

ntruct
se respinge H0, adic se concluzioneaz c R este semnificativ statistic.
f) Pentru a determina n ce msur variaia numrului de vizitatori este explicat de influena
numrului de spoturi publicitare difuzate zilnic, se calculeaz coeficientul de determinaie:

Ry2 x 0, 96152 0,9245


sau 92,45% arat c aproximativ 92% din variaia variabilei Y este
explicat de variabila X.
g) Dac numrul spoturilor publicitare difuzate va fi de 15, atunci numrul previzionat al
vizitatorilor pe baza acestei ecuaii de regresie este:

y / x 15 2, 2858 5, 0753 15 78

mii pers. (estimare punctual)

$
y n 1 yn 1,i

Pentru estimarea pe interval de ncredere, trebuie s determinm dispersia diferenei


adic dispersia erorii de previzionare. Dispersia n eantion este:

xn 1 x

1
1 (15 6, 64) 2
25, 461 1
s2y s 2$y y se2 1 n
39,534
n1,i
n1 n1,i
n
14
145, 21

( xi x)

i 1

Intervalul de ncredere este:

xn 1 x
1
$
y n 1,i t /2, n 2 se 1 n
n
( xi x)2
i 1

, adic (64,71; 92,11) mii persoane.


46

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

xn 1 x
h) Suntem n cazul determinrii intervalului de ncredere pentru media de rspuns, cnd
Pentru aceasta se determin:

$
y n 1 y b xn 1 x 36 5, 0753 (8 6, 64) 42,9
$
y n 1

iar estimatorul dispersiei pentru

este:

s2yn1

2
1

x
1 (8 6, 64) 2
n 1
25, 461
se2 n

2,14
14
145, 21
2
n

( xi x)

i 1

Intervalul de ncredere pentru media de rspuns este:

$
y n 1 t /2,n 2 se

xn 1 x
1
n
n
( xi x)2
i 1

, adic (39,71; 46,08) mii persoane.


4. Vnzrile trimestriale realizate de o fabric de jucrii electronice n perioada 2002-2005 se prezint astfel:
(tabelul 8.11.) (mii buci):
Tabelul 8.11.
Vnzrile trimestriale n anul
Trimestrul
2002
2003
2004
2005
0
1
2
3
4
I
10
11
14
13
II
14
16
18
16
III
11
10
13
9
IV
21
22
22
25
a)
b)
c)
d)

Se cere:
S se determine mediile mobile din cte 4 termeni consecutivi.
S se determine abaterile sezoniere i coeficienii (indicii) sezonieri.
S se determine trendul pentru seria desezonalizat.
S se extrapoleze seria de date privind volumul vnzrilor de jucrii electronice pentru trimestrul III, anul
2006, folosindu-se cea mai bun metod de ajustare.
Rezolvare:
a) Datele fiind trimestriale, se vor calcula medii mobile din numr par de termeni ( p = 4).
Mecanismul de calcul i mediile mobile pariale i finale sunt prezentate n tabelul 8.12., coloanele 2 i 3.
Tabelul 8.12.
Anul i trimestrul
Termenii seriei
Medii mobile pariale
Medii mobile centrate
0
1
2
3
I
10

II
14

2002
III
11
14
14,125
47

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

2003
2004

2005

IV
I
II
III
IV
I
II
III
IV
I
II
III
IV

21
11
16
10
22
14
18
13
22
13
16
9
25

14,25
14,75
14,5
14,75
15,5
16
16,75
16,75
16,5
16
15
15,75

Prima medie mobil:

10
11
14 11 21
2 14,125
MM 1 2
4
A doua medie mobil va fi:

14
16
11 21 11
2 14,5
MM 2 2
4
Etc.
Ultima medie mobil va fi:

22
25
13 16 9
2 15,375
MM 12 2
4

48

14,5
14,625
14,625
15,125
15,75
16,375
16,75
16,625
16,25
15,5
15,375

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

30
25
20
15
mii buc.

10

Valori observate

Medii mobile

5
0

Figura 8.11. Vnzrile trimestriale de jucrii electronice n perioada 2002-2005


b) Se vor folosi datele din tabelul 8.11., pentru care s-au calculat mediile mobile din tabelul 8.12.
Pentru analiza sezonalitii vom aplica, pe rnd, modelul aditiv i cel multiplicativ.
I) Modelul aditiv

y t
Se elimin din termenii reali yt valorile de trend ( ), determinate prin metoda mediilor mobile.
Rezultaele se gsesc n coloana 3 a tabelului 8.13., ncepnd cu trimestrul III/2002:

( yt yt ) III /'02 11 14,125 3,125 mii buc.


( yt yt ) IV /'02 21 14, 5 6,5 mii buc.

etc.

S 'j
Aceste diferene se trec n tabelul 8.14., n care se calculeaz devierile sezoniere brute (
coloana 5 i corectate (sj) coloana 6.
Devierile sezoniere brute:

S I'

3,125 2,375 2,5


2, 667 mii buc.
3

S II'
S III'

1,375 1, 25 0, 625
1, 083 mii buc.
3

3,125 5,125 3, 625


3,958 mii buc.
3

49

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

S IV'

6,5 6, 25 5, 75
6,167 mii buc.
3

Media devierilor sezoniere brute:

S'

'
S I' S II' S III
S IV'
2, 667 1, 083 3,958 6,167

0,15625
4
4

Devierile sezoniere corectate:

S I S I' S ' 2, 667 0,15625 2,823 3 mii buc.


S II S II' S ' 1, 083 0,15625 0,927 1 mii buc.
'
S III S III
S ' 3,958 0,15625 4,114 4 mii buc.

S IV S IV' S ' 6,167 0,15625 6, 011 6 mii buc.


Se calculeaz termenii seriei cronologice corectate, eliminndu-se din valorile termenilor reali
devierile sezoniere corectate (coloana 5/tabelul 8.13.):

( yt S I ) I /'02 10 (3) 13 mii buc.


( yt S II ) II /'02 14 1 13 mii buc.

etc.
Se determin componenta aleatoare, scznd din valorile termenilor reali trendul i
sezonalitatea (coloana 6/tabelul 8.13.):

( t ) III /'02 11 14,125 4 0,989


( t ) IV /'02 21 14,5 6 0, 489

etc.
n trimestrul I al fiecrui an, factorul sezonier a determinat o scdere a valorii produciei vndute
cu aproximativ 3 mii buci fa de linia de trend; n trimestrul II al fiecrui an, factorul sezonier a
determinat o cretere a valorii produciei vndute cu circa 1 mii buci fa de linia de trend; n trimestrul
III al fiecrui an, factorul sezonier a dus la o scdere a valorii produciei vndute cu 4 mii buci fa de
linia de trend, iar n trimestrul IV al fiecrui an, factorul sezonier a determinat o cretere a valorii
produciei cu circa 6 mii buci fa de linia de trend.
Tabelul 8.13.
Trendul (medii
Anul i trimestrul
0
2002

1
I
II
III
IV

y t

yt
2
10
14
11
21

mobile)
3

14,125
14,5

yt y t
4

-3,125
6,5

50

SCR
corectat yt
- sj
5
13
13
15
15

Componenta
aleatoare t
6

0,989
0,489

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

2003

2004
2005

I
II
III
IV
I
II
III
IV
I
II
III
IV

11
16
10
22
14
18
13
22
13
16
9
25

14,625
14,625
15,125
15,75
16,375
16,75
16,625
16,25
15,5
15,375

-3,125
1,375
-5,125
6,25
-2,375
1,25
-3,625
5,75
-2,5
0,625

14
15
14
16
17
17
17
16
16
15
13
19

-0,802
0,448
-1,011
0,239
0,448
0,323
0,489
-0,261
0,323
-0,302

Tabelul 8.14.

Devieri
sezoniere

Diferene sezoniere
Trim.
0
I
II
III
IV

2002

2003

2004

2005

-3,125
6,5

2
-3,125
1,375
-5,125
6,25

3
-2,375
1,25
-3,625
5,75

4
-2,5
0,625

S 'j
brute
5
-2,667
1,083
-3,958
6,167

Devieri
sezoniere
corectate
(Sj)
6
-2,823 ~ -3
0,927 ~ 1
-4,144 ~ -4
6,011 ~ 6

S ' 0,15625

Total
II) Modelul multiplicativ

y t
Se mparte termenii reali (yt) la trend (

) (coloana 4/tabelul 8.15)

( yt / yt ) III /'02 11:14,125 0, 779


( yt / yt ) IV /'02 21:14,5 1, 448

etc.
Rapoartele rezultate la pasul anterior se trec n tabelul 8.16., n care se calculeaz indicii de
sezonalitate brui (coloana 5) i cei corelai (coloana 6).
Indicii de sezonalitate brui:

'
S I* 3 0, 779 0,885 0,839 0,824
'
S II* 3 1,094 1, 075 1,
041 1, 07
*'
S III
3 0,779 0, 661 0, 792 0, 741

51

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


*'
S IV
3 1, 448 1,397 1,354

1, 400

Media indicilor de sezonalitate brui:

' 4 '
*
*
S * S I* S II* S III
SIV

0,824 ' 1,07 0,


741 1, 400
1, 00875

Indicii de sezonalitate corectai:

'
S I*
0,824
S

0,817
1, 00875
*'
S

'
S II*
1, 07
S

1, 061
1, 00875
*'
S

*
I

*
III

*
II

*'
S III
0, 741

0, 734
1, 00875
*'
S

*
IV

*'
S IV
1, 4

1,388
1, 00875
*'
S

Se calculeaz termenii seriei cronologice corectate, mprindu-se termenii reali la indicii de


sezonalitate brui (coloana 5/tabelul 8.15.).
Se determin componenta aleatoare, mprindu-se termenii reali la produsul dintre trend i
indicii de sezonalitate (coloana 6/tabelul 8.15.).
Trendul (medii
Anul i trim.
0
2002

2003

2004

2005

Trim.

1
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV

y t

yt
2
10
14
11
21
11
16
10
22
14
18
13
22
13
16
9
25

mobile)
3

14,125
14,5
14,625
14,625
15,125
15,75
16,375
16,75
16,625
16,25
15,5
15,375

yt / y t
4

0,779
1,448
0,779
1,094
0,661
1,397
0,855
1,075
0,782
1,354
0,839
1,041

Indici de sezonalitate

52

SCR
corectat
yt / sj*
5
12,240 ~ 12
13,195 ~ 13
14,986 ~ 15
15,130 ~ 15
13,464 ~ 13
15,080 ~ 15
13,624 ~ 14
15,850 ~ 16
17,136 ~ 17
16,965 ~ 17
17,711 ~ 18
15,850 ~ 16
15,912 ~ 16
15,080 ~ 15
12,261 ~ 12
18,011 ~ 18

Indici de
sezonalitate

Tabelul 8.15.
Componenta

t*
aleatoare
6

1,061
1,043
0,921
1,031
0,901
1,006
1,046
1,013
1,065
0,975
1,026
0,981

Tabelul 8.16.
Indici de
sezonalitat
e corectai

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

'
S *j
brui
2002
1

0,779
1,448

0
I
II
III
IV

2003
2
0,799
1,094
0,661
1,397

2004
3
0,855
1,075
0,782
1,354

2005
4
0,839
1,041

5
0,824
1,07
0,741
1,400

Total

S *j
(

6
0,817
1,061
0,734
1,388

1,00875

n trimestrul I al fiecrui an, factorul sezonier a determinat o scdere a valorii produciei vndute
cu aproximativ 81,7 100 = 18,3%; n trimestrul II al fiecrui an, factorul sezonier a determinat o
cretere a valorii produciei vndute cu 106,1 100 = 6,1% fa de linia de trend; n trimestrul III al
fiecrui an, factorul sezonier a dus la o scdere a valorii produciei cu 73,4 100 = 26,6% fa de linia
de trend, iar n trimestrul IV al fiecrui an, factorul sezonier a determinat o cretere a valorii produciei cu
138,8 100 = 38,8% fa de linia de trend.
c) Pentru seria corectat de sezonalitate cu ajutorul indicilor de sezonalitate (tabelul 8.15.,
coloana 5), determinarea trendului se poate face prin metode mecanice sau analitice.
Tabelul 8.17.
Anul i trim.
0
2002

2003

2004

2005
Total

1
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV

yt
2
12
13
15
15
13
15
14
16
17
17
18
16
16
15
12
18
242

yt ( )

yt ( I )

3
12,0
12,4
12,8
13,2
13,6
14,0
14,4
14,8
15,2
15,6
16,0
16,4
16,8
17,2
17,6
18,0

4
12,00
12,32
12,66
13,00
13,35
13,71
14,08
14,46
14,85
15,25
15,66
16,09
16,52
16,97
17,42
18,00

I. Metoda modificrii medii absolute

53

t2

ty

5
-15
-13
-11
-9
-7
-5
-3
-1
1
3
5
7
9
11
13
15
0

6
225
169
121
81
49
25
9
1
1
9
25
49
81
121
169
225
1360

7
-180
-169
-165
-135
-91
-75
-42
-16
+17
+51
+90
+112
+144
+165
+156
+270
132

yt

lin

8
13,67
13,86
14,06
14,25
14,45
14,64
14,83
15,03
15,22
15,42
15,61
15,80
16,00
16,19
16,39
16,58

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)


n

t 2

t / t 1

n 1

n /1 yn y1 18 12

0, 4 mii.buc.
n 1
n 1
15

yt ( ) y1 (t 1)
yt ( ) 12 (t 1) 0, 4; t 1,16
; (tabelul 8.17. coloana 3)
II. Metoda indicelui mediu de modificare

I n 1 It / t 1 n 1 I n /1 15

yt ( I ) y1 I

18
1, 027
12
;

t 1

yt ( I ) 12 1.027

t 1

; t 1,16
(tabelul 8.17. coloana 4)

III. Metoda trendului liniar

yt a b t

na b t y

a t b t ty
2

a
b

y y 15,125

n
ty

t2

132
0, 097
1360

yt 15,125 0, 097 t

(tabelul 8.17. coloana 8)


d) Alegem cea mai bun metod de ajustare a seriei cronologice, ca fiind cea pentru care se obine

yt

minimul expresiei:
. Conform tabelului 8.18. valoarea minim a expresiei se obine pentru
metoda trendului liniar (42,958).
Tabelul 8.18.
2
2
yt yt yt yt yt yt 2
Anul i trim.

yt

yt ( )

yt ( I )

yt

2
12
13
15
15
13

3
12,0
12,4
12,8
13,2
13,6

4
12,00
12,32
12,66
13,00
13,35

8
13,67
13,86
14,06
14,25
14,45

2002
2003

1
I
II
III
IV
I

54

lin

9
0
0,36
4,84
3,24
0,36

10
0
0,4624
5,4756
4,0000
0,1225

liniar

11
2,7889
0,7396
0,8836
0,5625
2,1025

Econometrie 2009 AAI / Ghid practic (teorie, probleme, TC)

2004

2005

II
III
IV
I
II
III
IV
I
II
III
IV

Total

15
14
16
17
17
18
16
16
15
12
18
242

14,0
14,4
14,8
15,2
15,6
16,0
16,4
16,8
17,2
17,6
18,0

13,71
14,08
14,46
14,85
15,25
15,66
16,09
16,52
16,97
17,42
18,00

14,64
14,83
15,03
15,22
15,42
15,61
15,80
16,00
16,19
16,39
16,58

1,00
0,16
1,44
3,24
1,96
4,00
0,16
0,64
4,84
31,36
0
57,60

1,6641
0,0064
2,3716
4,6225
3,0625
5,4756
0,0081
0,2704
3,8809
29,3764
0
60,7990

0,1296
0,6889
0,9409
3,1684
2,4964
5,7121
0,0400
0
1,4161
19,2721
2,0164
42,9580

Determinm nti valoarea de trend pentru trimestrul III 2006, pe baza metodei trendului liniar.

y III 2006 15,125 0, 097 21 17,162

mii buc.
Se calculeaz apoi volumul previzionat al vnzrilor pentru trimestrul III 2006, inndu-se cont i de

yIIIp 2006 17,162 4,114 13, 048


influena factorului sezonier: pe baza modelului aditiv:

mii buc.; pe

yIIIp 2006 17,162 0, 734 12,597


baza modelului multiplicativ:

mii buc.

OBSERVAII FINALE
1. Se va alege un singur exemplu pentru aplicaia din TC (punctul 3) din cele de mai sus.
2. TC se va utiliza n timpul lucrrii de verificare.
3. ntrebrile la Verificare (lucrarea scris) vor fi din TC, astfel:
a. Definii ob. de studiu al econometriei (1 punct)
b. Precizai i exemplificai noiunea de model econometric (2 puncte)
c. Specificul econometriei (2puncte)
d. Dai un exemplu cu elementele definitorii (nu cu tot cu calcule). (4 puncte).
e. 1 punct din oficiu.Total 10puncte. Timp de lucru 60 minute. Rezultatele se dau dup
o or de la finalul lucrri (adic la ora 19,30).

Verificarea va avea loc pe data de 19 iunie ora 17,30.


Data: 23.05.2009

55

S-ar putea să vă placă și