Sunteți pe pagina 1din 71

ECONOMETRIE

Constantin Chilarescu, Ovidiu Ciorc,


Ciprian ipo, Ciprian Preda i Ioana Viau

Prefat

In coul de discipline ce se pred la orice universitate de economie din lume, o


disciplin este nelipsit sau, cel puin, ar trebui sa e nelipsit. Este vorba despre Econometrie. De ce este att de importanta nct s nu lipseasc din bagajul
de cunotine al oricrui student ce se pregtete n tiinele economice? Pentru
simpul motiv c Econometria permite msurarea fenomenelor economice. Astfel, este posibil ca intuiia economic s e dublat de o "msura" cantitativ,
riguroas. Aceasta este capabil s argumenteze cu mijloace tiinice ceea ce
doar intuim. Astfel, "cred" este dublat i de "de ce cred"! Econometria este un
instrument foarte puternic de validare al teoriilor economice.
Avnd n vedere importana stpnirii acestui instrument de masur de ctre
orice economist, salut i apreciez apariia acestei cri de referin n domeniu.
Aceast carte, intitulat "Econometrie", este extrem de util comunitii universitare, cercettorilor, profesorilor i studenilor. Prin excelenta argumentaie,
limbajul clar, logica prezentrii, cartea are marele avantaj c reuete s-l fac
pe cititor s-i nsueasc relativ uor noiunile complexe cu care se opereaz n
econometrie.
Cartea "Econometrie" scris de Constantin Chilarescu, Ovidiu Ciorc, Ciprian Preda, Ciprian Sipo i Ioana Viau, este un excelent reper de metode,
tehnici i modele econometrice. Cartea este o foarte buna mbinare a teoriei
econometrice cu aplicaii numerice i exemple obinute din manipularea datelor economice i nanciare. Fiecare capitol se ncheie cu o serie de exerciii
rezolvate, n care autorii explic cum trebuie interpretate rezultatele numerice
obinute. Acest lucru este extrem de benec pentru cititor, n sensul c va 
mult mai uor pentru acesta s neleag ntregul demers trecnd de la teorie la
practic.
Cartea este structurat pe cinci capitole pe parcursul crora se analizeaz
modelele liniare cu doua sau mai multe variabile, modelele neliniare (log-liniar,
exponenial, logistic sau logaritmic) la care se adaug exemple de estimare a
funciei Cobb-Douglas sau modele de serii temporale precum modelul autoregresiv. Toate modelele econometrice sunt prezentate cu o argumentaie matematic
complet i riguroas.
Consider c "Econometrie" scris de onstantin Chilarescu, Ovidiu Ciorc,
Ciprian Preda, Ciprian Sipo i Ioana Viau, este o carte ce trebuie s fac parte
obligatoriu din biblioteca economistului ce analizeaz i cerceteaz fenomenele
economice.
Profesor doctor Bogdan Negrea, Academia de Studii Economice.

Capitolul 1

Introducere
Econometria este adesea descris ca o parte a stiinei economice care studiaz
relaiile cantitative din economie, facnd apel att la analiza statistic ct i la
cea matematic. Ea face uz de modele economice pe care le confrunt cu datele
de observaie i, aplicnd metode statistice acestor date empirice provenite din
economie, vizeaz a estima parametrii modelelor i a le verica valabilitatea
lor. Teoria economic furnizeaz deci idei privind procesele care determin
variabilele economice, iar econometria asigur vericarea statistic i stabilete
de manier cantitativ, corelaiile care pot aprea valide.
Dei tiina economic a apelat n mod constant i continuu la matematic
pentru a nelege mai bine obiectul su de studiu, putem considera c ea ncepe s se dezvolte n forma sa modern n anii 1920. Economistul norvegian
Ragnar Frisch va juca un rol important n actul de natere al econometriei.
Paternitatea termenului i este de altfel lui atribuit. In anul 1930, mpreun
cu Irving Fisher a fondat Societatea de Econometrie (Econometric Society), al
crui demers principal a fost acela de a promova studii cu caracter cantitativ cu
scopul de a apropia punctele de vedere teoretice de cele empirice n explorarea
problemelor economice. Apoi, n anul 1933 a fondat revista Econometrica ce va
 principalul vehicul de gndire econometric. Dup al doilea rzboi mondial,
econometria se dezvolt rapid i aceasta se va efectua pe mai multe niveluri.
- A dobndit nainte de toate o mare reputaie graie atribuirii a numeroase
premii Nobel n economie, unor economitii reputai pentru formalismul
matematic din lucrrile lor.
- A ctigat teren n domeniul economic, acesta devenind din ce n ce mai
dependent de matematic.
- A primit un statut instituional din ce n ce mai important, ind obiect
de studiu n multe universiti.
- Tehnicile econometrice se perfecioneaz continuu, ceea ce le confer mai
mult operaionalitate i le face elemente utile extrem de preioase n
luarea deciziilor economice.
3

CAPITOLUL 1.

INTRODUCERE

Putem distinge dou perioade majore n cercetare econometric modern. Pn


la sfritul anilor 1970, activitatea este orientat spre construcia i rezolvarea
modelelor macroeconomice. Apoi, odat cu introducerea teoriei anticipaiilor
raionale i a criticii lui Lucas, cercetarea se orienteaz spre microeconomie i
spre analiza seriilor de timp. Lucas pune n eviden n anul 1972 relaia ce
exist ntre anticipaiile agenilor economici i variaiile coecienilor modelelor
macroeconometrice. Concluzia sa este c orice msur de politic economic
conduce la o schimbare n comportamentul agenilor i, drept urmare, acetia
sunt capabili chiar de a contracara politicile guvernamentale, anticipndu-le.
Tehnicile matematice extrem de riguroase utilizate n econometrie nu pot
masca faptul c economia nu poate revendica dreptul de a deveni: pe de o
parte o tiin experimental n acelai fel ca i zica, chimia sau psihologia
experimental, i pe de alt parte o tiin de observaie att de precis i neutr
precum demograa. Anumite teorii i predicii economice nu pot  testate direct
prin experiment, deoarece nu este posibil de a reproduce fenomenele economice
n condiii de laborator, n special atunci cnd obiectul de studiu este prea vast
precum dimensiunea unei naiuni sau chiar mai mult. Pe de alt parte, de ndat
ce agenii economici iau cunotin de legile economice, acetia i pot modica
comportamentul lor. In plus, comportamentul social este extrem de complex,
ntotdeauna supus unui caracter aleator, de iraionalitate precum i de liber
arbitru. Mai mult dect att, realitatea economic este adesea modicabil,
ind deci dicil comparaia variabilelor economice pe perioade lungi de timp,
deoarece condiiile economice pot varia complet.
Iniial economitii au dezvoltat o varietate de tehnici econometrice doar cu
scopul de a face s coincid teoriile economice cu datele statistice. Scopul lor
a fost de a determina ce model economic ar putea  considerat cel mai verosimil. Astfel, bazndu-se pe un proces de selecie a modelului de tip Popperian
(modelele cel mai puin verosimile s e eliminate treptat), ei au sperat s se
poat apropia ct mai bine de realitatea economic, fr a  nevoie s intervin
asupra ei. Si totui, aceast mbuntire a fost departe de a  sistematic, n
ciuda perfecionrii continue a tehnicilor econometrice.
Pe de alt parte, se poate observa c succesul econometriei nu face neaprat
unanimitatea printre economiti. Anumii gnditori, n special cei din coala
Austriac precum von Mises, contest orice interes n formalizarea matematic a
comportamentului economic. In plus, aa cum nsui Galbraith noteaz, tiina
economic este structurat ierarhic: economia heterodox la baz, neoliberalii
n vrf iar partea cea mai matematizat a economiei neoliberale n avangard.
Fr ndoial, aceast clasicare creeaz o anumit scindare n snul comunitii
economitilor. Mai mult chiar anumii membrii ai acestei comuniti refuz s
adopte formalismul matematic pe care de altfel l apreciaz ca ind excesiv i
uneori chiar superuu.
Tehnicile i metodele econometrice provin din statistica matematic. Testele
econometrice au oferit o claricare interesant teoriilor economice ce au stat la
baza anumitor politici economice. De exemplu, unii monetariti au pus sub
semnul ntrebrii relevana curbei lui Phillips pe baza statisticilor pe termen
lung. De asemenea, testele econometrice vor slbi foarte mult relaia, crucial

5
pentru keynesieni ntre consum i venit. Anumite modele macroeconometrice au
fost introduse n anul 1950 pentru a previziona impactul politicilor economice.
Teoria economic face adesea apel la reprezentrile logice pentru a descrie
comportamentul fenomenelor observate. Acestea sunt armaii ce se bazeaz pe
ipoteze mai mult sau mai puin realiste, dar care pot conduce la concluzii a cror
impact poate  uneori chiar i normativ. Ele trebuie s se confrunte cu realitatea
datelor statistice, s e validate sau invalidate. Econometriei i revine rolul de a
face aceast confruntare prin aplicarea unor metode statistice, ce-i au originea
n teoria probabilitilor, metode statistice pentru a estima i testa relaiile i
teoriile economice. O caracteristic important a econometriei este c ea se
bazeaz pe date neexperimentale, nerepetabile. Demersul econometric const
n a reprezenta comportamentul fenomenului observat cu ajutorul ecuaiilor i
n a estima coecienii acestor ecuaii recurgnd la istoria fenomenului i aceasta
n scopul de a-l nelege, explica, reproduce i prevedea. Econometria este astfel
o ramur a statisticii i matematicii aplicate n economie.
In concluzie, putem deci arma c econometria este un ansamblu de metode
matematice i statistice aplicate n analiza datelor economice. Ea are dou
funcii eseniale:
- de a testa teoriile economice sau mai modest exprimat, anumite armaii
din teoria economic;
- de a evalua (estima) parametrii necunoscui ce apar n relaiile economice
formalizate matematic.
De manier general, demersul unui econometru este urmtorul:
- utilizeaz ca punct de plecare o teorie economic;
- formalizeaz un model matematic ce-i va permite s testeze aceast teorie
cu ajutorul datelor statistice disponibile;
- examineaz n ce msura teoria economic este validat prin rezultatele
obinute;
- evalueaz parametrii modelului, evident dac teoria a fost validat.
Pentru a evalua parametrii ce intervin n modelele econometrice, se calculeaz
estimatori ai acestora utiliznd date statistice disponibile pentru fenomenele
studiate. Acestea se a n centrul ateniei oricrei abordri econometrice. In
fapt ele vor permite msurarea fenomenele studiate precum i a factorilo ce
le determin. Modelele econometrice ncearc de fapt s reprezinte realitatea
economic. Exist evident tipuri diferite de date statistice ce vor permite diferite
tipuri de analize statistice:
- seriile cronologice sau de timp, corespund la observaii asupra variabilelor
la intervale de timp regulate Xt , t = 1 T unde t desemneaz anul,
semestru, trimestru, luna, etc., corespunztor observaiei considerate;

CAPITOLUL 1.

INTRODUCERE

- seriile transversale corespund la observaii asupra variabilelor economice la


un moment dat, privind diferite elemente individuale precum: gospodrii,
rme, societi comerciale, sectoare sau chiar state, Xi , i = 1 n unde i
desemneaz acele elemente individuale considerate;
- seriile sau datele de tip panel, integreaz cele dou dimensiuni, individuale
i temporale. Datele statistice sunt dublu indexate Xit , i = 1 n i
t = 1 T.
Prima i ultima categorie de date statistice vor face obiectul unor tehnici de
analiz statistic specice. Anumite date precum cele nanciare, pot s nu
e obinute la intervale de timp regulate. Ele vor  de asemenea supuse unor
tehnici speciale de analiz statistic. De asemenea, unele variabile din economie
pot  msurate la nivel individual sau la nivel agregat.
- Datele individuale se refer la indivizi: rme sau gospodrii. Aceste date
de observaie sunt pertinente pentru a studia fenomene i comportamente
la nivel microeconomic.
- Datele agregate se refer la state, regiuni sau sectoare i sunt pertinente
pentru a studia comportamente i fenomene la nivel macroeconomic.
Variabilele economice pot  cantitative, adic msoar fenomene ce iau valori
numerice reale, sau calitative, adic msoar fenomene economice crora li se
pot atribui eventual valori numerice ntregi. Modelele econometrice studiate n
acest curs consider doar cazul variabilelor cantitative precum venit, consum,
salariu, productivitate, pre, etc. Anumite modele pot ns ncorpora i variabile
calitative precum: a  de sex masculin sau feminin, a avea serviciu sau a  n
omaj, etc. Aceste variabile fac obiectul unui codaj, lund n general valorile
zero sau unu.
S considerm acum cazul a dou variabile Y i X , i s presupunem c
deinem date statistice referitoare la acestea pentru n indivizi, notai generic
cu i. Putem arma c exist trei tipuri de relaii posibile ntre aceste variabile.
Prima este relaia determinist: la o valoare xi a lui X corespunde o singur
valoare yi pentru Y . A doua const n absena oricrei relaii ntre cele dou
variabile. Vorbim atunci despre independena lor. Al treilea tip de relaie se
situeaz ntre cele dou. Facem ipoteza unei relaii deterministe, dar aceasta nu
este perfect vericat de ecare observaie deoarece realitatea economic este
mult prea complex pentru a o accepta. Spunem atunci c cele dou variabile
sunt corelate, sau c ele au un anumit grad de dependen. Exist dou tipuri
de grade de dependen sau de corelaie: liniar si neliniar. Vom arta mai
trziu n acest curs maniera de a msura corelaia dintre cele dou variabile.
Pentru exemplicare vom presupune acum exemplul funciei de consum, ce
pune n relaie consumul, notat cu C , cu venitul disponibil al gospodriilor,
notat cu Y . Econometrul dispune de un model economic de forma urmtoare:

C = Ca + cY.

7
Scopul su este de a evalua parametrii Ca i c. In fapt, pentru a aa dac venitul gospodriilor Y inueneaz efectiv consumul lor, trebuie determinat dac
parametrul c este sau nu egal cu zero. Dac aceast teorie simpl a consumului
este acceptat, atunci evident interesul cade asupra celor doi parametrii Ca i
c. Pentru cunoaterea valorii acestora, econometrul va utiliza date statistice
privind consumul si venitul a n gospodrii. Fiecare gospodrie i este astfel caracterizat prin consumul su Ci si prin venitul su disponibil Yi , i = 1 n.
Dac ar exista o relaie determinist ntre consum i venit, atunci funcia de
consum ar  vericat de manier exact pentru ecare gospodrie:

Ci = Ca + cYi , i = 1 n.
In acest caz, toate observaiile ar aparine aceleai drepte C = Ca +cY . Aceast
situatie nu se ntmpl ns niciodat, cci realitatea economic este ntotdeauna
mult mai complex. Nici o gospodrie, sau aproape nici una, nu veric exact
funcia consumului deoarece, de exemplu, o gospodrie este mai cheltuitoare,
alta este foarte expus riscului de omaj i deci este mai puin cheltuitoare,
etc. Ali factori ar putea  nc evocai, precum existena unor venituri excepionale neanticipate, schimbarea locului de munc sau a domiciliului, etc. In
fapt, pentru funcia consumului, exist o innitate de factori ce-l pot inuena
i deci apare imposibil de a-i putea integra pe toi n acest model. Putem deci
lua n considerare doar anumii factori ce pot inuena consumul, adic acele
variabilele pe care le considerm relevante i, la nal, includem restul ntr-o
singur variabil numit perturbaie aleatoare sau variabil rezidual, ce reprezint aspectul de incertitudine n raport cu modelul teoretic. Aceasta este de
fapt distincia ntre modelul economic i cel econometric. Un model econometric
const n:
- un ansamblu de relaii obinute pe baza unui model economic. Aceste
ecuaii implic att variabile observate ct i variabile reziduale;
- o specicare a legii de probabilitate ce guverneaz variabilele reziduale. De
exemplu, pentru funcia consumului, un model econometric simplu este:

yi = 0 + 1 xi + i , i = 1 n
unde i est o variabil aleatoare (variabila rezidual). Ipoteza cea mai
simpl privind variabilele reziduale este de a presupune c (acestea
) sunt
normale, independente i identic distribuite adic, i N 0, 2 , i =
1 n.
- y este n general numit variabil endogen (poate  determinat din
model), iar x variabil exogen (poate  determinat n afara modelului).
Att modelele economice ct i cele econometrice, i propun s fac o descriere
a funcionrii economiei cu ajutorul unui ansamblu de relaii ntre variabilele
economice. Odat aceast formalizare matematic propus, mai multe ntrebri
se pot nate. De exemplu:

CAPITOLUL 1.

INTRODUCERE

- Relaiile propuse de aceste modele, exist ele n realitate?


- Presupunnd c rspunsul este pozitiv, care sunt proprietile acestora?
- Dac dou variabile X i Y sunt puse ntr-o relaie, putem noi presupune
c aceast relaie este una liniar sau una neliniar?
- Variabilele X i Y variaz ele n acelai sens sau n sensuri contrare?
Rspunsurile la aceste ntrebri sunt determinate. Se poate uor nelege c este
extrem de important s cunoatem dac un model econometric reuete s in
cont de manier corect de realitatea unei relaii economice. Utilizarea unor
metode de inferen statistic completeaz formalismul unui model teoretic sau
econometric i vizeaz s aduc rspunsuri la ntrebrile de tipul celor mai sus
menionate, furniznd estimatori ai parametrilor diverselor relaii ce apar n
modele, permind de a testa validitatea modelului teoretic cu realitatea.
Rezumnd cele de mai sus, putem arma c un model econometric este o
ecuaie a crui rol este de a explica un fenomen graie variabilelor pe care le
judecm determinante. Obiectivul este de a captura faptul sau faptele cele mai
marcante ale realitii pe care el ncearc s o reprezinte. Parametrii necunoscui ai modelului msoar impactul variabilelor exogene asupra variabilei
endogene. Un model econometric este deci o reprezentare simplicat a unui
fenomen economic real. Aceast abordare simplicat depinde deasemenea de
manier crucial de datele statistice de care dispunem sau de care putem dispune. Trebuie s includem n model doar acele variabile despre care tim c
joac un rol cu adevrat important i s le ignorm pe toate celelalte. Acestea
din urm vor  incluse n ceea ce numim variabil rezidual.

Capitolul 2

Modelul liniar de dou


variabile
2.1 Relaii de dependen
In aceast parte a cursului studiem unul dintre cele mai simple modele, modelul
liniar de dou variabile sau regresia liniar simpl, destinat pentru a analiza dependena liniar ntre dou fenomene a cror msur se efectueaz cu ajutorul
variabilelor notate X i respectiv Y . Modelele liniare i gsesc aplicaii n domenii foarte variate din micro i macroeconomie. Mai mult, numeroase modele a
priori neliniare pot  studiate cu ajutorul unui model liniar. S lum ca exemplu
funcia de producie Cobb-Douglas, ce exprim o relaie neliniar ntre ceea ce
numim generic output, notat cu Y , capitalul uman notat cu L i capitalul zic
notat cu K , Y = AK L . Acest model este echivalentul unui model liniar n
care variabilele sunt exprimate la scar logaritmic: ln Y = ln A+ ln K + ln L.
Fie X i Y dou variable descriind ecare cte un fenomen din economie.
Vom seleciona, printr-un procedeu presupus aleatoriu, n indivizi din economie
i, pentru ecare din acetia vom considera cuplul de variabile (X, Y ), msurnd
cele dou fenomene studiate. Pentru un individ i, vom nota acest cuplu prin
(Xi , Yi ). Utiliznd convenia de notaie ce distinge variabilele de valorile lor,
vom nota cu (xi , yi ) cuplul de valori observate ale lui Xi i Yi . Aa cum am
explicat deja, dac dorim s modelm o relaie de form liniara ntre o variabil
endogen i o variabil exogen, trebuie s ncorporm n modelul reinut faptul
c nivelul variabilei endogene nu este exclusiv determinat doar de cel al variabilei
exogene. O alternativ simpl de a completa ecare din aceste relaii, const n
introducerea termenilor notai 1 , 2 , , n astfel nct vom putea scrie

yi = 0 + 1 xi + i , i = 1 n.

(2.1)

Introducerea acestor termeni presupune urmtoarea interpretare: Pentru orice


individ i, nivelul variabileI endogene yi se descompune de manier aditiv n
dou componente (doi termeni):
9

10

CAPITOLUL 2.

MODELUL LINIAR DE DOU VARIABILE

- Componenta 0 + 1 xi exprim ideea de plecare privind existena unei


relaii liniare n care variabila exogen X inueneaz variabila endogen
Y . In descompunerea lui yi , acest termen este deci partea din nivelul lui
Yi care este determinat prin valoarea xi a variabilei exogene Xi .
- Componenta i exprim faptul c valoarea xi nu determin doar ea nivelul
variabilei endogene yi . In descompunerea lui yi , acest termen este deci
partea din nivelul lui Yi care este determinat de ctre ali factori dect
variabila exogen Xi .
Cu formalizarea dat de ecuaia (2.1) i interpretrile de mai sus, am exprimat
de fapt ideea unei relaii liniare n care o variabil determin o alta, lsnd totui
posibilitatea unor factori, alii dect variabila exogen, s aibe un efect asupra
variabilei endogene. Rmne totui s se gseasc un mijloc de a formaliza
ideea c variabila exogen joac un rol preponderent n determinarea variabilei
endogene, i c ceilali factori, a cror existen este recunoscut, nu au dect
un impact neglijabil asupra acesteia i, n consecin interesul asupra lor este
minor. Faptul c impactul acestor factori asupra variabilei endogene ar putea
 neglijabil introduce o nou ipotez. Vom presupune n continuare c pentru
orice individ i, observnd c Xi = xi ne putem atepta c valoarea variabilei
endogene Yi s e egal cu 0 + 1 xi . Aceast ipotez semnic faptul c
factorii, alii dect variabila exogen, nu contribuie cu nimic la valoarea la care
ne asteptm s e luat de ctre variabila endogen.
Un exemplu simplu ne permite s ilustrm aceast ipotez. Considerm
cazul unui studiu statistic n care cei n indivizi sunt angajaii unui supermaket
ocupnd posturi similare. Pentru un individ i, Xi desemneaz vechimea n
munc (exprimat n luni) i Yi este salariul lunar al acestui individ. Dac
adoptm ipoteza c pentru orice individ i avem yi = 0 + 1 xi , atunci toi
indivizii avnd aceeai vechime n munc ar trebui s aibe n mod necesar exact
acelai salar lunar. Ori n realitate, aceast situaie nu are loc aproape niciodat.
Dac la vechimi n munc egale, indivizii pot avea salarii diferite, aceasta revine
la a spune c ali factori dect vechimea n munc ar putea avea vreun efect n
determinarea nivelului salariului lunar. In acest sens, cele n relaii exprimate
prin yi = 0 +1 xi sunt incomplete i nu pot deci reprezenta fenomenul observat,
adic relaia dintre salariul lunar i vechimea n munc pentru toi indivizii.
Conform exemplului de mai sus, cu relaia dintre vechimea n munc i salariul
lunar, acest tip de ipotez semnic de fapt a presupune c dac doi indivizi au o
vechime n munc identic, notat cu x, atunci ne putem atepta ca salariile lor
s e egale, chiar dac valorile observate nu sunt n mod necesar egale. Valoarea
comun ateptat pentru aceti doi salariai este 0 + 1 x.

2.1.1 Corelaia liniar


O foarte bun manier de a observa relaia existent ntre dou variabile este
de a construi o diagram, sau ceea ce se mai numete norul de puncte. Aceast
diagram prezint suciente informaii asupra comportamentului comun al celor dou variabile. Dac o relaie liniar exist ntre acestea, suntem evident

2.2.

11

DEFINIREA MODELULUI.

interesai de a o cuantica cu ajutorul unei msuri numerice unice care s permit stabilirea forei acestei legturi. Msura ce poate cuantica intensitatea
acestei legturi liniare se numete coecient de corelaie. Acest coecient, notat
de regul cu r, este egal cu raportul dintre covarianele celor dou variabile i
produsul abaterilor lor medii ptratice:
n

r=

(yi y) (xi x
)

n
n

2
2
(yi y)
(xi x
)
i=1

i=1

i=1

yi xi

xi

yi

.
= v[
u
( n )2 ]
( n )2 ] [ n
n
u

t n
y2
yi
n
x2
xi
i=1

i=1

i=1

i=1

i=1

i=1

(2.2)

i=1

Coecientul de corelaie este independent de unitile de msur, are acelai


semn ca i covariana i ia valori n intervalul (1, 1). Deci putem i compara
doi coecieni de corelaie calculai pe date statistice diferite. Interpretarea
coecientului de corelaie nu este ns att de simpl pe ct am putea crede.
O relaie statistic detectat prin coecientul de corelaie, nu arat implicit o
relaie de cauzalitate ntre acele variabile. Cauzalitatea nu poate  dedus dect
urmare a unei analize de alt natur dect cea statistic.

Proprietile coecientului de corelaie:


a. dac r este aproape de 1, atunci exist o legtur liniar puternic ntre
cele dou variabile i ele variaz n acelai sens;
b. dac r este aproape de 0, atunci nu exist o legtur liniar ntre cele dou
variabile;
c. dac r este aproape de 1, atunci exist o legtur liniar puternic ntre
cele dou variabile i ele variaz n sensuri contrare.
Putem deci arma c r este cu att mai aproape de 1 sau de 1, cu ct punctele
sunt mai aproape de o dreapt. Din contr, dac coecientul de corelat.ie este
nul sau foarte aproape de zero, atunci relaia dintre cele dou variabile nu este
liniar, dar ar putea  una neliniar. Altfel spus, absena corelat.iei liniare nu
implic independena variabilelor. Dac coecientul de corelaie este departe
att de zero ct i de 1 atunci, n general nu putem arma nimic.

2.2 Denirea modelului.


Dac o relaie de cauzalitate a fost dedus sau ea este justicat de ctre o teorie
economic, atunci coecientul de corelaie, determinat cu ajutorul datelor de

12

CAPITOLUL 2.

MODELUL LINIAR DE DOU VARIABILE

observaie, poate  considerat un bun argument n construcia unui model liniar.


Elementele prezentate n seciunea precedent, ne permit s dm o deniie
modelului econometric liniar.

Deniia 1. Fie X i Y dou variabile, n general aleatoare, descriind ecare


un fenomen economic, ale crui observaii sunt notate astfel:
(x1 , y1 ), (x2 , y2 ), , (xn , yn ).

Modelul econometric liniar de parametrii necunoscui 0 i 1 , ai cror valori


vom ncerca s le determinm,
yi = 0 + 1 xi + i , i = 1 n,

numit de asemenea model de regresie liniar simpl al variabilelor Y i X , este


un model pentru care urmtoarele ipoteze sunt adevrate:
H1. Media condiional a lui Yi tiind c Xi = xi , este o funcie liniar de xi :
E [Yi /Xi = xi ] = 0 + 1 xi , i = 1 n.

H2. Media condiional a lui i tiind c Xi = xi , este nul.


E [i /Xi = xi ] = 0, i = 1 n.

Variabila exogen nu aduce nici o informaie asupra variabilei reziduale


i deci avem deasemenea: Cov [i , xi ] = 0, i = 1 n.
H3. Variana conditional a lui i tiind c Xi = xi , este constant.
V ar [i /Xi = xi ] = 2 , i = 1 n.

Aceasta revine a spune c amploarea reziduurilor realizate de model este


constant pentru toate observaiile.
H4. Covariana lui Yi cu Yj este egal cu covariana lui i cu j :
Cov [Yi , Yj ] = Cov [i , j ] , i, j = 1 n.

Dac i = j , atunci avem


Cov [Yi , Yi ] = V ar [Yi ] = y2 = Cov [i , i ] = V ar [i ] = 2 .

Ipoteza c pentru orice i = 1 n, V ar [Yi ] = y2 impune varianelor variabilelor aleatoare Y1 , Y2 , , Yn s e identice. Aceast proprietate este
numit homoscedasticitate. Dac i = j , atunci avem
Cov [Yi , Yj ] = Cov [i , j ] = 0.

Aceasta revine a arma c o eroare efectuat asupra unei observaii nu


depinde liniar de nici o alt eroare efectuat asupra unei alte observaii.
H5. Variabila rezidual urmeaz o lege normal centrat, (de medie zero i
varian constant 2 ).

2.3.

13

ESTIMAREA PARAMETRILOR

2.3 Estimarea parametrilor


Fie modelul liniar de dou variabile, descris n cadrul demersului econometric
enunat anterior.
yi = 0 + 1 xi + i , i = 1 n.
(2.3)
Obiectivul acestei seciuni este de a furniza estimatori pentru parametrii modelului. Estimarea celor doi parametrii (0 , 1 ) poate  obinut, sub ipoteza c
reziduurile sunt gausiene, prin metoda verosimilitii maxime (M V M ) sau, sub
ipoteza c variana rezidual este constant, prin metoda celor mai mici ptrate
M CM P a crui principiu este de a minimiza suma ptratelor erorilor reziduale
sau, n ali termeni, suma ptratelor ecarturilor ntre valorile observate i cele
produse de ctre model. Cele dou metode conduc la aceleai rezultate (estimatori), doar c metoda (M V M ) are o justicare teoretic i genereaz proprieti
mai bune estimatorilor.
Principiul M CCM P este relativ simplu. Intr-o prim abordare a problemei,
cutm valori ale parametrilor 0 i 1 pentru care partea din y1 , y2 , , yn care
nu este explicat de x1 , x2 , , xn este minim posibil. Pentru aceasta, alegem
acele valori ale lui 0 i 1 pentru care ecartul ntre yi i 0 + 1 xi este minim.
Formal, la orice alegere a cuplului de valori reale (0 , 1 ), asociem ecartul dintre
2
yi i 0 + 1 xi i pe care-l msurm prin [yi (0 + 1 xi )] . A alege cupluri de
valori reale (0 , 1 ) pentru care suma ecarturilor este minim posibil, revine la
a minimiza funcia S = S(0 , 1 ) denit prin

S(0 , 1 ) =

[yi (0 + 1 xi )] =

i=1

2i

(2.4)

i=1

Estimatorii lui 0 i 1 obinuti n aceast manier sunt numii estimatori de


ptrat minim M CM P i sunt notai prin 0 i 1 .

Propoziia 1. Relaiile de calcul pentru aceti estimatori sunt urmtoarele:

0 =

1 =

yi

i=1

i=1
n

i=1

x2i

i=1

xi

i=1
[ n

x2i

xi yi

i=1
n

i=1
]2

xi

i=1

xi

xi yi

(2.5)
yi

i=1
]2
[ n i=1

xi
x2i
i=1

Demonstraie.

In primul rnd remarcm c funcia S este o funcie ptratic,


strict convex, deci ea admite un minim ntr-un unic punct (0 , 1 ). Pentru a
obine ecuaiile normale sau condiiile de ordinul nti, trebuie egalate cu zero
derivatele pariale de ordinul nti. Aceste ecuaii pot  scrise astfel:

n

(yi 0 1 xi ) = 0,

i=1
(2.6)

x (y x ) = 0
i

i=1

1 i

14

CAPITOLUL 2.

MODELUL LINIAR DE DOU VARIABILE

i n nal obinem spre rezolvare sistemul urmtor

n
n

xi =
yi ,
0 n + 1

i=1
i=1

n
n
n

0
xi + 1
x2i =
xi yi
i=1

i=1

i=1

de unde rezult valorile estimatorilor 0 i 1 , date de (2.5).

Observaia 1. Soluiile date de sistemul (2.5) mai pot  deasemenea scrise:


n

1 =

(xi x
) (yi y)

i=1

et 0 = y 1 x,

(xi x
)

(2.7)

i=1

unde:

1
1
xi , y =
yi ,
n i=1
n i=1
n

x
=

(2.8)

Demonstraie. La ecare valoare a lui xi corespunde valoarea estimat a lui


i , notat i i dat de:
i = yi 0 1 xi , i = 1 n.
Estimatorii astfel obtinui trebuie s verice prima ecuaie a sistemului (2.6),
adic:
n (
)

yi 0 1 xi = 0.
i=1

Aceast ecuaie mai poate  scris:


n (

n
)
yi 0 1 xi =
i = 0 = 0,

i=1

i=1

adic, media reziduurilor (variabilei reziduale) este egal cu zero. Dac notm
cu yi valoarea estimat prin model, atunci:

yi = 0 + 1 xi

(2.9)

i deci obinem:
n (

n
n
n
)

yi 0 1 xi =
(yi yi ) = 0
yi =
yi

i=1

i=1

1
n

i=1

yi =

i=1

1
n

i=1

yi y = y,

i=1

2.4.

15

PROPRIETI STATISTICE ALE ESTIMATORILOR

adic, media observaiilor variabilei y este egal cu media valorilor estimate,


determinate cu ajutorul modelului liniar. Relaia (2.9) ne permite atunci s
scriem c
y
= 0 + 1 x
y = 0 + 1 x
.
Cele dou expresii din formula lui 1 (numrtorul i numitorul) din ecuaia
(2.7), pot  deci scrise
n

(xi x
) (yi y) =

i=1

(xi yi x
yi yxi + x
y)

i=1

xi yi y

i=1

xi x

i=1

yi + n
xy =

i=1

xi yi n
xy

i=1

[ n
]
n
n
n
n

1
1 1
xi
yi =
n
xi yi
xi
yi .
=
xi yi n
n i=1 n i=1
n
i=1
i=1
i=1
i=1
n

(xi x
) =

i=1

i=1

n
]
x2i 2
xxi + x
2 =
x2i n
x2

i=1

(
x2i n

1
xi
n i=1
n

)2

i=1

1
x2i
= n
n
i=1

)2
xi

i=1

i deci obinem rezultatul dat de (2.5).

Remarca 1. Ecuaiile (2.2) si (2.7) ne permit s armm c ntre coecientul


de corelaie i estimatorul 1 a parametrului 1 exist relaia urmtoare:
sx
r = 1 .
sy

(2.10)

sau

1
1
2
2
(xi x
) , s2y =
(yi y) i sx = s2x , sy = s2y .
n 1 i=1
n 1 i=1
n

s2x =

Demonstraia rezult imediat i se face prin calcul direct.

2.4 Proprieti statistice ale estimatorilor


Estimatorii parametrilor necunoscui sunt interesani pentru proprietile pe
care le posed. Astfel:
a. Atta timp ct ei furnizeaz, n medie valoarea parametrului necunoscut,
spunem(c)sunt nedeplasai. Un estimator a lui se zice a  nedeplasat
dac E = . (Mai corect ar trebui numii estimatori de ecart zero.)

16

CAPITOLUL 2.

MODELUL LINIAR DE DOU VARIABILE

b. Estimatorii parametrilor necunoscui sunt obinui cu diverse marje de


eroare datorate impreciziei asociate incertitudinii modelului. Aceste marje
de eroare se reduc odat cu dimensiunea eantionului i putem chiar spune
c atunci cnd dimensiunea acestuia tinde ctre innit, am putea chiar
cunoate valoarea real a parametrilor necunoscui. Armm atunci c

estimatorii( sunt
) convergeni. Estimatorul a lui se zice convergent
dac V ar 0 atunci cnd n .
c. Dac doi estimatori 1 i 2 al aceluiai parametru , unul posed o marj
de eroare inferioar celuilalt, spunem atunci c el este un estimator mai
bun. Estimatorul 1 a lui este mai bun dect estimatorul 2 a lui ,
dac:
( )
( )
V ar 1 < V ar 2 .
d. Dac ntr-o clas de estimatori, un estimator posed cea mai mic varian
posibil, spunem atunci c el este ecient.
Estimatorii parametrilor necunoscui ai unui model liniar, depind de datele de
observaie sau de eantioanele disponibile. In consecin ei nu sunt mrimi
constante, ci mai degrab sunt variabile aleatoare. tim c 0 i 1 , estimatorii
lui 0 i 1 , obinui cu ajutorul unui eantion dat i utiliznd M CO, sunt dai
de sistemul (2.5).

Propoziia 2. Estimatorii 0 i 1 sunt nedeplasai, adic:


( )
( )
E 0 = 0 et E 1 = 1 .

Demonstraie.

(2.11)

S considerm expresia urmtoare a estimatorului 0


n

yi

i=1

x2i

i=1

xi

i=1

xi yi .

i=1

Inlocuind n aceast expresie yi prin (2.3), obinem:


n

(0 + 1 xi + i )

i=1

(
n0 + 1

x2i

i=1

xi +

i=1

= n0

)
i

i=1
n

x2i

+ 1

i=1

xi

i=1

xi

i=1

x2i

(
xi

x2i

xi (0 + 1 xi + i )

i=1
n

i=1

i=1

i=1

xi

i=1

x2i

i=1

xi + 1

i=1
n

(
x2i

i=1

xi

i=1

x2i +

i=1

i=1

i=1

i=1

xi i

i=1

)2
xi

)
x i i

2.4.

17

PROPRIETI STATISTICE ALE ESTIMATORILOR

= 0 n

(
x2i

i=1

)2
n
n
n
n

xi
+
i
xi
xi
x i i .

i=1

i=1

i=1

i=1

i=1

Inlocuind aceast expresie n prima ecuaie a sistemului (2.5) obinem:


n

0 = 0 +

x2i

i=1

i=1

i=1

xi i

i=1
)2

i=1

(
x2i

xi

(2.12)

xi

i=1

Sub ipoteza c valorile xi sunt xe, independente de reziduurile i i c E (i ) =


0, pentru orice i = 1 n obinem n cele din urm:

E 0 = 0 +

E (i )

i=1

x2i

i=1

i=1

x2i

i=1

xi

xi E (i )

i=1
)2

= 0

xi

i=1

i deci estimatorul 0 este nedeplasat. De manier similar putem demonstra c


estimatorul 1 este de asemenea nedeplasat. S considerm expresia urmtoare
a estimatorului 1
n
n
n

n
xi yi
xi
yi .
i=1

i=1

i=1

Inlocuind n aceast expresie yi prin (2.3), obinem:

xi (0 + 1 xi + i )

i=1

xi

i=1

(
= n 0

xi + 1

i=1

= 1 n

i=1

(
x2i

n0

xi i

i=1

)2

xi

i=1
n

x2i

i=1

(0 + 1 xi + i )

i=1

)2

i=1

xi

i=1
n

xi

i=1

+n

xi

i=1

x i i

i=1

i=1

xi

i .

i=1

Inlocuind aceast expresie n a doua ecuaie a sistemului (2.5) obinem:

n
1 = 1 +

xi i

i=1

i=1

xi

i=1

(
x2i

i=1

i=1
)2

xi

(2.13)

18

CAPITOLUL 2.

MODELUL LINIAR DE DOU VARIABILE

Sub aceleai ipoteze ca mai sus adic, valorile xi sunt xe, independente de
reziduurile i i c E (i ) = 0, pentru orice i = 1 n obinem:
n

i=1

E 1 = 1 +

xi E (i )

i=1

x2i

E (i )

i=1
)2

i=1

xi

= 1

xi

i=1

i deci i estimatorul 1 este nedeplasat.

Observaia 2. Ipoteza c valorile xi , i = 1 n sunt xe nu este necesar.


Pentru a asigura aceast calitate a estimatorilor, ipoteza c valorile xi i i ,
i = 1 n sunt independente este sucient, deoarece
E

( n

xi i

i=1

E (xi i ) =

i=1

E (xi ) E (i ) = 0.

i=1

Putem acum trece s examinm celelalte trei caliti ale unui estimator.

Propoziia 3. Varianele estimatorilor sunt date de:

( )

V ar 0 = n1 +

( )

V
ar
1 =

(xi
x)2

2 ,
(2.14)

i=1

2
(xi
x)2

i=1

iar covariana lor este:


(
)
x
2
Cov 0 , 1 =
,
n
2
(xi x
)

(2.15)

i=1

i deci putem arma c estimatorii 0 i 1 posed cea mai mic varian posibil, adic ei sunt ecieni.

Demonstraie.

Utiliznd expresiile date de (2.12) i (2.13) putem scrie:


( n
)
( n )2 n
n

2 2

2
V
ar
(
)
x

xi
xi V ar (i )
i
( )
i
i=1
i=1
i=1
i=1

V ar 0 =
[
( n )2 ]2
n

n
x2i
xi
i=1

i=1

[
x2i n

[
n

i=1

i=1

(
x2i
(

x2i

i=1

i=1

xi

)2 ]2

xi

i=1

)2 ]
2

i=1

=
n

i=1

x2i

x2i
(

i=1

)2 .
xi

2.4.

19

PROPRIETI STATISTICE ALE ESTIMATORILOR

n2

i=1

V ar 1 =

x2i V ar (i )
[
n

i=1

n2

i=1

=[
n

x2i n
(
x2i

i=1

tiind c:

i=1

i=1

i=1

)2
xi

=n

x2i

i=1

(xi x
) ,

i=1

x2i
(

xi

n
2
( n )2 .

x2i
xi

i=1

i=1

i c:

xi

i=1

2
)2 ]2 =

( n

V ar (i )

i=1
)2 ]2

i=1

xi

i=1

x2i

)2

x2i

xi

i=1

)2

)2 =
xi

1
+
n
n

x
2

(xi x
)

i=1

i=1

cele dou variane vor  deci date de:

( ) 1
( )
2
x
2
2
i V ar 1 =
V ar 0 =
+
.
n
n
n

2
2
(xi x
)
(xi x
)
i=1

i=1

In ne, pentru a evalua covariana celor doi estimatori utilizm relaia urmtoare:
(
)
(
)
(
)
( )
Cov 0 , 1 = Cov y 1 x
, 1 = Cov y, 1 x
V ar 1 .

(
)
In prealabil avem nevoie de a cunoate Cov y, 1 . Pentru facilitarea calculelor,
relaia (2.13), ce d pe 1 se scrie:
n
1 = 1 +

xi i

i=1

xi

i=1

i=1

(
x2i
n

n
= 1 +

i=1
)2

i=1

i=1

i=1

(xi x
)

(
x2i

i=1

i=1
n

i=1

(xi x
) i

= 1 + i=1
n

xi i n
x

i=1

= 1 +
n

xi

(xi x
) i

i=1
n

(xi x
)

)2

xi

20

CAPITOLUL 2.

MODELUL LINIAR DE DOU VARIABILE

i deci

yi

(
)
i=1
i=1
Cov y, 1 = Cov
n
n , 1 +

(xi x
)

i=1

(xi x
) i

y
(x x
) i
(x x
) 2
i=1 i i=1 i
i=1 i
=
= Cov
=0
n
n
n ,

2
2
(xi x
)
n
(xi x
)
i=1

i=1

i n nal obinem

(
)
( )
x
2
Cov 0 , 1 =
xV ar 1 =
.
n
2
(xi x
)
i=1

Observaia 3. De aceast dat, pentru a asigura aceast calitate estimatorilor,


cele dou ipoteze sunt ambele necesare: ipoteza c valorile xi , i = 1 n sunt xe
i ipoteza c valorile xi i i , i = 1 n sunt independente.

Observm aici c varianele i covariana celor doi estimatori 0 i 1 stabilite


mai sus, nu sunt practic utilizabile deoarece ele conin variana rezidual 2 care,
n general este necunoscut. Totui, putem determina un estimator nedeplasat
al acesteia cu ajutorul reziduurilor estimate.

Propoziia 4. Un estimator nedeplasat al lui 2 va  dat de


1 2
.
n 2 i=1 i
n

s2 =

(2.16)

Demonstraie.

Rescriind ecuaia reziduurilor i constatnd c 0 = y 1 x

i 0 = y 1 x
, ceea ce d, pentru orice i = 1 n:

i = yi yi = 0 + 1 xi + i 0 1 xi
= y 1 x
+ 1 xi + i y + 1 x
1 xi
n
(
)
1
= 1 1 (xi x
) + (i ) sau =
i .
n i=1
Suma ptratelor reziduurilor va deveni

1 1

n
)2

(xi x
) +

i=1

= 1 1

n
(
)
2
(i ) + 2 1 1
(xi x
) (i )

i=1

n
)2
i=1

(xi x
) +

i=1
n

i=1

(i ) + 2 1 1

n
)
i=1

(xi x
) i

2.4.

21

PROPRIETI STATISTICE ALE ESTIMATORILOR

2
1 1

n
)

(xi x
)

i=1
n
n
n
(
)
(
)2

2
2
(xi x
) i .
(i ) + 2 1 1
= 1 1
(xi x
) +
i=1

i=1

i=1

tiind c
n

(xi x
) i

1 = 1 + i=1
n

(xi x
)

n
(
)
2
(xi x
) i = 1 1
(xi x
)

i=1

i=1

i=1

i nlocuind acest rezultat n expresia sumei ptratelor reziduurilor obinem:


n

n
n
n
(
)2
(
)2

2
2
2
2i = 1 1
(xi x
) +
(i ) 2 1 1
(xi x
) ,

i=1

i=1

adic

2i =

i=1

i=1

i=1

n
(
)2
2
2
(i ) 1 1
(xi x
) .

i=1

i=1

Considernd acum operatorul mediei:


n

[(
n
n
[
]
)2 ]
( 2)
2
2

E i =
E (i ) E 1 1
(xi x
)

i=1

i=1

n1
i=1

i=1

( )
2
(xi x
) V ar 1 = (n 1)2 2 = (n 2)2

i=1

i deci putem concluziona c s2 dat de relaia (2.16) este un estimator nedeplasat al 2 .


Utiliznd acum relaiile (2.14) - (2.16), putem scrie estimatorii varianelor lui
0 i 1 , precum i estimatorul covarianei lui 0 cu 1 .

( )

x
2

s2,
s20 = V ar 0 = n1 +

(x

x
)
i

i=1

( )
s2
(2.17)
s21 = V ar 1 =
,
n

(xi
x)2

i=1

(
)

x
s2

.
s201 = Cov 0 , 1 =
n

(xi
x)2
i=1

22

CAPITOLUL 2.

MODELUL LINIAR DE DOU VARIABILE

2.5 Analiza varianei


Propoziia 5. Suma total a ptratului variaiilor este egal cu suma ptrat
a variaiilor explicate prin model plus suma ptrat a reziduurilor.

(2.18)

SCT = SCE + SCR,

unde
SCT =

(yi y) , SCE =

i=1

)2
yi y , SCR =
2i .

i=1

i=1

Demonstraie.

Utiliznd faptul c yi = yi + i i scznd y


= y din ecare
membru al acestei relaii obinem, pentru orice i = 1 n:

(
)2
(
)
2
yi y = yi y
+ i (yi y) = yi y + 2i + 2 yi y i .
Suma total a ptratului variaiilor va  dat de:
n

(yi y) =

i=1

n
n
n

(
)2
(
)
yi y +
2i + 2
yi y i .
i=1

i=1

i=1

Ultimul termen din partea dreapt a acestei ecuaii poate  nc scris:


n

n
n
n
n (
)

)
yi y
i =
yi i y
i =
yi i =
0 + 1 xi i

i=1

= 0

i=1
n

i=1

i + 1

i=1

i=1

xi i = 1

i=1

i=1

xi i = 1

i=1
n

(
)
xi yi 0 1 xi

i=1

i conform celei de-a doua ecuaii a sistemului (2.6), aceast sum este egal
cu zero. Deci, suma total a ptratului variaiilor poate  scris n maniera
urmtoare:
n
n
n

(
)2
2
(yi y) =
yi y +
2i ,
i=1

i=1

i=1

i astfel demonstraia este complet.


Graie ecuaiei analizei varianei putem deni un indicator masurnd procentul din variaia lui y , explicat prin modelul liniar. Acest indicator, numit
coecient de determinaie, notat cu R2 este denit prin:

R2 =

SCE
SCR
=1
0 R2 1.
SCT
SCT

(2.19)

Propoziia urmtoare ne d relaia care exist ntre coecientul de determinaie


i coecientul de corelaie.

Propoziia 6. In cazul modelului de dou variabile, coecientul de determinaie


este egal cu ptratul coecientului de corelaie, adic: R2 = r2 .

2.6.

23

TESTE STATISTICE UZUALE

Demonstraie.

Pentru orice i = 1 n avem c

yi = 0 + 1 xi et y = 0 + 1 x
.
Scznd membru cu membru, obinem:
2

) .
yi y = 1 (xi x
) i (
yi y) = 12 (xi x
Deci, suma ptratelor variaiilor explicate poate  scris de maniera urmtoare:

SCE =

(
yi y) = 12

i=1

(xi x
) .

i=1

Substituia lui din ecuaia (2.7) ne permite s scriem:

(xi x
) (yi y)

i=1
SCE =
n

(xi x
)

2
n

2

(xi x
)

i=1

i=1

2
2

(yi y) n

(xi x
) (yi y)

i=1
2
i=1

=
(xi x
)

n
n
n


2
2
2 i=1
(xi x
)
(yi y)
(xi x
)
i=1

i=1

i=1

2
2

(yi y) n


i=1
2
2
2

(x

)
=
r
(yi y) = r2 SCT.
= r
i

n

2 i=1
i=1
(xi x
)
2

i=1

de unde obinem rezultatul dorit.

2.6 Teste statistice uzuale


Orice procedur de estimare trebuie completat prin teste statistice. In fapt,
rezultatele obinute sunt estimatori, adic ele sunt de fapt variabile aleatoare i
deci nu ne ofer nici o certitudine asupra valorilor necunoscute ale parametrilor
modelelor liniare. Vom prezenta succint cele mai utilizate teste de evaluare a
estimatorilor, bazai pe metoda celor mai mici ptrate i anume: testul Fisher,
testul Student, testul Jarque-Berra i testul de Durbin-Watson.

24

CAPITOLUL 2.

MODELUL LINIAR DE DOU VARIABILE

2.6.1 Testul Fisher


In cazul modelului liniar de dou variabile, n procesul de formalizare a testului
Fisher, se poate face apel la coecientul de determinaie R2 . Este vorba de fapt
de a testa nulitatea parametrului 1 a modelului. Valoarea calculat a statisticii
testului este urmtoarea:

Fc =

(n 2)R2
SCE
=
1 R2
SCR

(2.20)

Valoarea Fc urmeaz legea lui Fisher cu (1, n 2) grade de libertate. Fie


riscul asumat, n general = 0.05. F1 se citete din tabelul lui Fisher, cu
1 grad de libertate la numrtor i n 2 grade de libertate la numitor pentru
riscul , sau de manier echivalent pentru probabilitatea 1 . Avem atunci:
- dac Fc < F1 , admitem cu probabilitatea p c 1 este egal cu zero sau,
altfel spus c variabila exogen x nu inueneaz variabila endogen y ;
- dac Fc > F1 , admitem cu probabilitatea p c 1 este diferit de zero
sau, altfel spus c variabila exogen x inueneaz variabila endogen y .

2.6.2 Testul Student


Intrebarea care se pune este de a ti dac trebuie inclus n model att termenul
constant ct i variabila x sau, n ali termeni, dac n realitate coecienii 0 i
1 sunt sau nu diferii de zero. Sub ipoteza normalitii reziduurilor, estimatorii
0 i 1 ai parametrilor 0 et 1 urmeaz legi normale, notate simbolic:

2
x
2 2
2
, 1 N 1 ,
.
0 N

,
+
0
n
n

n
2
2
(xi x
)
(xi x
)
i=1

i=1

Cum variana rezidual este necunoscut, nlocuind 2 prin estimatorul su s2,


n aceste condiii statisticile:

t0 =

0 0
1
n

i=1

x
2
(xi
x)2

i t1 =

1
1
s

(xi
x)2

i=1

urmeaz o lege Student cu n 2 grade de libertate. In particular, cnd se


pune problema nulitii lui 0 sau 1 , armm c testm semnicativitatea
coecientului 0 sau 1 . Dac urmare a testului concluzionm c 0 = 0 sau
1 = 0, armm de fapt ca 0 sau 1 sunt nesemnicativi. In acest caz, dac
concluzionm de exemplu c 1 = 0, atunci variabila x nu inueneaz de
manier semnicativ variabila y . In aceste condiii, cele dou statistici ale

2.6.

25

TESTE STATISTICE UZUALE

testului sunt urmtoarele:

t0 =

|
|
0
1
n

x
2

i t1 =

(xi
x)2

|1 |
n

(2.21)

(xi
x)2

i=1

i=1

Fie riscul asumat, n general = 0.05. t1 2 se citete din tabelul repatitiei


Student cu n 2 grade de libertate pentru riscul , sau de manier echivalent,
pentru probabilitatea 1 . Avem atunci:
- Dac t0 < t1 2 , atunci admitem ipoteza c 0 este egal cu zero. Dac
t1 < t1 2 , atunci admitem ipoteza ca 1 este egal cu zero i deci variabila
exogen x nu inueneaz variabila endogen y .
- Dac t0 > t1 2 , atunci coecientul 0 este diferit de zero. Dac t1 >
t1 2 , atunci coecientul 1 este diferit de zero adic, variabila exogen x
inueneaz variabila endogen y .

Remarca 2. In cazul modelului liniar simplu, cele dou teste sunt echivalente,
adic, putem cu uurin demonstra c Fc = t21 i deci un singur test este necesar
i sucient.

2.6.3 Test de normalitate a reziduurilor


Ipoteza normalitii reziduurilor trebuie conrmat prin teste. Vom prezenta
aici testul lui Jarque i Berra care utilizeaz estimatorii coecientului de asimetrie i ai coecientului de aplatizare pentru a judeca normalitatea reziduurilor.
Estimatorii momentelor centrate de ordinul 2, 3 si 4 ale variabilei reziduale,
utilizai n cazul testului lui Jarque i Bera sunt urmtorii:

1 2
1 3
1 4
i , 3 =
i i 4 =
.
n i=1
n i=1
n i=1 i
n

s2 =

Coecientul de asimetrie notat SK i coecientul de aplatizare, notat KT se


estimeaz astfel:

3
4
SK =
KT
=
,
unde
s
=
s2.
(2.22)

3
4
(s)
(s)
Statistica lui Jarque i Berra este dat de:
[
]
n1
1
2
JB =
SK 2 + (KT 3)
6
4

(2.23)

s.i urmeaz o lege 2 cu dou grade de libertate. Fie riscul asumat, n general
= 0.05. 21 se citete din tabelul repartiiei lui Helmert cu dou grade de
libertate pentru riscul , sau de manier echivalent pentru probabilitatea 1.
Avem atunci:

26

CAPITOLUL 2.

MODELUL LINIAR DE DOU VARIABILE

- dac JB < 21 , atunci armm c ipoteza de normalitate a reziduurilor


poate  acceptat;
- dac JB > 21 , atunci armm c ipoteza de normalitate a reziduurilor
trebuie respins.

Remarca 3. Coecienii de asimetrie i de aplatizare furnizai prin relaiile


anterioare sunt deplasai. Iat de ce ei necesit anumite corecii. In practic se
utilizeaz coecienii corectai dai de relaiile urmtoare:
1 2
, s =
n 2 i=1 i
n

s2 =

s2, SK =

n(n + 1)
(n 1)(n 2)(n 3) i=1
n

KT =

n
(n 1)(n 2) i=1

i
s

)4

i
s

)3

3(n 1)2
(n 2)(n 3)

(2.24)

(2.25)

i deci statistica lui Jarque i Berra va deveni:


JB =

[
]
n1
1
SK 2 + KT 2 .
6
4

(2.26)

2.6.4 Test de autocorelaie a reziduurilor


Dac datele utilizate pentru estimarea parametrilor unui model liniar de dou
variabile sunt serii temporale, atunci aplicarea unui test Durbin-Watson este necesar pentru vericarea prezenei sau absenei autocorelaiei reziduurilor. Testul
Durbin-Watson permite detectarea autocorelaiei reziduurilor. El se bazeaz pe
estimarea unui model autoregresiv (ce va  ulterior studiat) de ordinul nti
pentru reziduurile estimate.
(2.27)

t =
t1 + et

unde et este o variabil rezidual de medie zero i varian constant. Prin


deniie, valoarea statisticii lui Durbin-Watson este dat de:
n

DW =

t=2

(
t t1 )
n

t=1

(2.28)

2t

Statistica DW ia valori n intervalul (0, 4). Ipoteza absenei autocorelaiei reziduurilor este acceptat atunci cnd valoarea acestei statistici este apropiat de
doi. Interpretarea testului Durbin-Watson este urmtoarea:
- dac valoarea calculatDW este inferioar valorii tabelate dl atunci exist
o autocorelaie pozitiv, sau > 0;
- dac valoarea calculat DW este cuprins ntre du i 4 du , atunci reziduurile nu sunt autocorelate, sau = 0;

2.7.

27

PREVIZIUNI UTILIZND MODELUL LINIAR

- dac valoarea calculat DW este superioar valorii tabelate 4 dl atunci


exist o autocorelaie negativ, sau < 0;
- celelalte situaii, dl < DW < du sau 4 du < DW < 4 dl corespund
zonelor de nedeterminare.
Valorile critice dl si du , cu dl < du , pentru un risc = 0.05 au fost tabelate
i sunt date att n funcie de numrul de variabile exogene ct i de numrul
de observaii. Se poate uor demonstra c existena (autocorelaiei
nu afecteaz
)
termenul 1 , ci doar termenul 0 , care va deveni 0 1 2 .

2.7 Previziuni utiliznd modelul liniar


Unul din scopurile utilizrii modelelor liniare este i acela de a putea face previziuni, adic de a prevedea valoarea variabilei endogene pentru o nou valoare
a variabilei exogene x. Fie deci xn+1 o nou valoare, pentru care dorim s
prevedem yn+1 . Modelul utilizat este acelai :

yn+1 = 0 + 1 xn+1 + n+1


cu E (n+1 ) = 0, V ar (n+1 ) = 2 i Cov (n+1 , i ) = 0 pentru i = 1, 2, , n.
Apare natural s prevedem valoarea corespunztoare utiliznd modelul ajustat:

yn+1 = 0 + 1 xn+1 .
Dou tipuri de erori vor afecta previziunea fcut: prima este datorat necunoaterii lui n+1 , iar a doua incertitudinii ce exist asupra estimatorilor 0 i
1 (parametrii 0 i 1 au fost estimai fr a lua n considerare valoarea xn+1 ).
Propoziia urmtoare ne d o evaluare a erorii de previziune.

Propoziia 7. Eroarea de previziune n+1 = yn+1 yn+1 satisface proprietile

urmtoare:

E (
n+1 ) = 0,

2
= V ar (
n+1 ) = 2 n+1

n +

n+1

(xn+1
x)
n

(xi
x)2
2

(2.29)

i=1

i
n+1 =

2n+1 .

(2.30)

Demonstraie.

(
)
(
)
E (
n+1 ) = E 0 0 + E 1 1 xn+1 + E (n+1 ) = 0.

V ar (
n+1 ) = V ar (yn+1 yn+1 ) = V ar (yn+1 ) + V ar (
yn+1 ) = 2 + V ar (
yn+1 )
(
)
( )
( )
V ar (
yn+1 ) = V ar 0 + 1 xn+1 = V ar 0 + x2n+1 V ar 1

28

CAPITOLUL 2.

MODELUL LINIAR DE DOU VARIABILE

2 2
2
2
+ xn+1 2xn+1 x
n
n

2
2
2
(xi x
)
(xi x
)
(xi x
)
i=1
i=1
i=1

1
+2xn+1 Cov 0 , 1 =
n
n +

2
1

x
2 + x2n+1 2xn+1 x

)
= 1 + (xn+1 x
2
= 2
+
n
n
n
n

2
2
(xi x
)
(xi x
)
i=1

i=1

i deci obinem ntr-adevr valoarea lui V ar (


n+1 ) dat de ecuaia (2.30). Variana 2 este necunoscut i deci ea trebuie nlocuit prin estimatorul su dat de
relaia (2.16). Astfel, variana crete odat ce xn+1 se deprteaz de x
. Altfel
spus, a face previziuni pentru valori ale lui xn+1 departe de x
este periculos,
deoarece variana erorii de previziune poate deveni foarte mare. Aceasta se
explic, de manier intuitiv prin faptul c o observaie xn+1 , cu ct este mai
departe de media x
cu att avem mai puine informaii despre ea.

2.8 Modele liniare cu variabile centrate


Relaiile (2.7), ne sugereaz o metod simplicat pentru estimarea parametrilor
unui model liniar de dou variabile. Putem proceda n dou maniere diferite:
- pentru ecare cuplu de date (yi , xi ), scdem media, adic, yi y i xi x
,
iar variabilele se numesc pur i simplu centrate;
- pentru ecare cuplu de date (yi , xi ), scdem media i apoi mprim difey
x
rena la abaterea medie ptratic adic, yis
i xis
, iar variabilele sunt
y
x
numite n acest caz centrate i reduse.
Fie modelul liniar de dou variabile:

yi = 0 + 1 xi + yi y = 1 (xi x
) +
sau

yi = 0 + 1 xi +
Dac notm

yi = yi y sau yi =

yi y
sx xi x

= 1
+
.
sy
sy sx
sy

yi y
xi x

, x
i = xi x
sau x
i =
sy
sx

i = i sau i =


sx
i 1 = 1 ,
sy
sy

atunci vom obine modelele liniare urmtoare yi = 1 x


i + i sau yi = 1 x
i + i .
Estimatorul obinut prin M CO este:
n

yi x
i
i=1
.
n

x
2i
i=1

2.9.

29

EXEMPLE.

Utiliznd prima transformare, valoarea sa este egal cu 1 i utiliznd cea de-a


doua transformare, valoarea sa este egal cu r. Estimatorul 1 poate  obinut
utiliznd relaia (2.10). Putem deci facil observa c cele dou transformri nu
schimb nici coecientul de corelaie i nici pe cel de determina tie. Pentru
raiuni de simplitate, n practic se utilizeaz de regul prima transformare.

2.9 Exemple.
Exemplul 1.

Conform lui Keynes, exist o lege psihologic fundamental care


spune c omul are tendina de a crete consumul su pe msur ce crete venitul,
dar cu o cantitate mai mic dect creterea venitului. Plecnd de la acest
principiu, funcia consumului poate  de forma: C = cY + C0 unde: C0 este
consumul autonom i c este nclinaia marginal ctre consum. Modelul liniar
de mai sus va  estimat cu ajutorul unor date statistice la nivelul anului 2007,
privind consumul gospodriilor y i venitul disponibil al acestora (x) pentru 16
state dezvoltate. Datele sunt prezentate n tabelul urmtor.

Tara
AUS
AUT
BEL
CAN
DNK
FIN
FRA
GER
ITA
NLD
NOR
ESP
CHE
SWE
GBR
USA

26512.23
27892.19
27175.94
27630.41
37065.99
29043.77
28043.06
26467.10
24340.41
29746.41
49719.41
20671.71
40634.60
31658.03
33531.79
37489.81

35232.59
39501.45
37511.16
36182.91
49554.91
40712.85
34982.13
36009.62
31263.49
41877.42
67804.55
27136.09
54897.82
43649.96
40027.05
43635.59

1. Cea mai bun manier de a verica dac exist o relaie liniar ntre
cele dou variabile este de a evalua coecientul de corelaie. Utiliznd
datele din tabelul de mai sus i relaia (2.2) obinem r = 0.9677 i cum r
este foarte aproape de unu putem arma c exist o relaie liniar foarte
puternic ntre cele dou variabile i c ele variaz n acelai sens. Valoarea
coecientului de determinaie, dat de relaia R2 = r2 este egal cu 0.9364.
Putem deci arma c 93.64% din variaia lui y este explicat prin modelul
liniar, adic prin variaia lui x.
2. Aplicarea relaiilor (2.5) ne permit s obinem: 0 = 1688.3 i 1 = 0.7131
i deci funcia de consum a lui Keynes este dat de: C = 0.7131Y +

30

CAPITOLUL 2.

MODELUL LINIAR DE DOU VARIABILE

1688.33. Interpretarea este urmtoarea: 71.31% din creterea venitului


este destinat consumului, iar consumul autonom este egal cu 1688.33.
3. Aplicarea relaiilor date de (2.18) ne permit s scriem SCT = 770323021,
SCE = 721311606 i SCR = 49011415. Aceste rezultate ne permit s
analizm calitatea modelului liniar cu ajutorul testului Fisher, utiliznd
relaia (2.20). Valoarea calculat este Fc = 206.04 iar F1 se citete din
tabelul repartiiei lui Fisher cu un grad de libertate la numrtor i 14
grade de libertate la numitor pentru un risc = 0.05 i aceast valoare
este F0.95 = 4.60. Cum Fc > F0.95 , putem arma c 1 este diferit de zero
adic, venitul disponibil inueneaz de manier determinant consumul.
4. Relaiile (2.17) ne permit s abordm
( ) testul Student pentru
( ) estimatorii

0 i 1 . Obt.inem atunci: V ar 0 = 441763, V ar 1 = 0.049677,


(
)
Cov 0 , 1 = 101.8 i s2 = 3500815. Covariana celor doi estimatori
este ntotdeauna negativ, dac x
este pozitiv (aceast ipotez este n general valabil pentru fenomenele economice). Interpretarea posibil este
c cei doi estimatori nu pot , n acelai timp, subestimai sau supraestimai. Relaiile (2.21) furnizeaz valorile: t0 = 0.80 i t1 = 14.35. Valoarea
t0.975 se citete din tabelul repartiiei Student cu 14 grade de libertate pentru riscul = 0.05 i este egal cu 2.145. Observm c t1 > t0.975 i astfel
putem arma c venitul disponibil inueneaz de manier determinant
consumul gospodariilor. Mai mult, constatm c Fc = t21 . In ceea ce privete t0 observm c t0 < t0.975 i n consecin putem arma c termenul
0 nu este sensibil diferit de zero. Mai precis, armaia corect este c
partea autonom a consumului nu este sucient de precis estimat prin
modelul liniar.
5. In ne, ultimul test necesar pentru a naliza analiza noastr, este testul
privind normalitatea reziduurilor. Relaiile (2.24), (2.25) i (2.26) ne furnizeaz rezultatele urmtoare: SK = 1.54, KT = 2.30 et JB = 9.21.
Valoarea 20.95 se citete din tabelul repartiiei lui Helmert cu dou grade
de libertate pentru riscul = 0.05 i este egal cu 5.99. Deci, deoarece
JB > 20.95 , putem concluziona c reziduurile nu sunt normal distribuite.
6. S presupunem acum c valoarea consumului trebuie s e previzionat
pentru urmtoarele dou valori ale venitului: x = 48000 i x = 70000.
Utiliznd estimatorii parametrilor, aceste valori sunt:

1688.3 + 0.7131 48000 = 35916 i 1688.3 + 0.7131 70000 = 51603.


Erorile de previziune, date de relaiile (2.30) sunt: 1958 pentru prima
valoare previzionat i 2400 pentru a doua valoare previzionat. Putem
cu uurin constata c eroarea de previziune crete odat ce x este mai
departe de x
= 41243.
In exemplul de mai sus am utilizat date transversale i deci, n aceste condiii
testul Durbin-Watson este inaplicabil.

2.9.

31

EXEMPLE.

Exemplul 2.

Exemplul urmtor ncearc s rezolve aceeai problem, dar


de data aceasta utiliznd date istorice pentru perioada 1991 2007, pentru
economia Germaniei. Datele statistice sunt prezentate n tabelul de mai jos.

An
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007

22575.6
23173.4
23086.6
23495.5
23873.4
24128.6
24293.6
24659.4
25161.1
25636.1
25881.4
25810.1
25868.2
25923.3
26001.2
26384.3
26467.1

29113.2
29445.1
28959.0
29572.1
29979.8
30129.5
30608.1
31173.3
31736.0
32662.1
33101.0
33048.8
32906.5
33295.8
33542.8
34823.1
36009.6

De aceast dat vom prezenta mai schematic analiza statistic. Rezultatele sunt
urmtoarele:
1. Coecientul de corelaie este egal cu 0.9606 i cum el este foarte aproape
de unu, putem arma c exist o puternic legtur liniar ntre cele
dou variabile i c ele variaz n acelai sens. Valoarea coecientului de
determinaie este egal cu 0.9227. Putem deci arma c 93.27% din variaia
lui y este explicat prin modelul liniar, adic prin variaia lui x.
2. 0 = 6408.8 i 1 = 0.5804 iar funcia Keynesian a consumului este dat
de: C = 0.5804Y + 6408.8. Astfel, putem arma c 58.04% din creterea
venitului este consacrat consumului i c partea autonom a acestuia este
egal cu 6408.8.
3. SCT = 25942234, SCE = 23936204 i SCR = 2006029. Valoarea calculat este Fc = 178.98, iar F1 se citete din tabelul repartiiei lui
Fisher cu un grad de libertate la numrtor i 15 grade de libertate la
numitor pentru riscul = 0.05 i aceast valoare este egal cu 4.54. Cum
Fc > F0.95 , putem arma c 1 este diferit de zero, adic venitul disponibil
inueneaz de manier determinant consumul gospodriilor.
( )
( )
(
)
4. V ar 0 = 1907529, V ar 1 = 0.001882, Cov 0 , 1 = 10702 i

s2 = 133735. t0 = 4.64 i t1 = 13.38. Observm din nou c cei doi


estimatori au covariana negativ i deci cei doi estimatori nu pot  n

32

CAPITOLUL 2.

MODELUL LINIAR DE DOU VARIABILE

acelai timp supraestimai sau subestimai. Valoarea t0.975 se citete din


tabelul repartiiei Student cu 15 grade de libertate pentru riscul = 0.05
i este egal cu 2.131. Observm c t1 > t0.975 i astfel putem arma c
venitul disponibil inueneaza de manier determinant consumul gospodariilor. Mai mult, constatm c Fc = t21 . In ceea ce privete t0 observm
c t0 > t0.975 i n consecin putem deasemenea arma c 0 este sensibil
diferit de zero i deci partea autonom a consumului este sucient de bine
estimat prin modelul liniar.
5. Valoarea calculat DW a testului Durbin-Watson, dat de (2.28) este
egal cu 0.425, iar cele dou valori tabelate se citesc din tabelul repartiiei
Durbin-Watson, pentru un risc = 0.05, o singur variabil exogen i
17 observaii i sunt dl = 1.13 i du = 1.38. Cum DW se situeaz ntre
0 i 1.13, putem arma c exist o autocorelaie pozitiv de ordinul unu.
Relaia (2.27) ne permite s obinem = 0.74 i astfel 0 devine 2911,
valoare considerat mai rezonabil pentru partea autonom a consumului.
6. In ne, ultimul test necesar pentru a naliza analiza statistic, este testul
privind normalitatea reziduurilor. Relaiile (2.24), (2.25) i (2.26) furnizeaz rezultatele urmtoare: SK = 1.39, KT = 1.24 i JB = 6.21.
Valoarea 20.95 se citete din tabelul repartiie lui Helmert cu 2 grade de
libertate pentru un risc = 0.05 i este egal cu 5.99. Deci, deoarece
JB > 20.95 , putem concluziona c reziduurile nu sunt normal distribuite.
7. Presupunem acum c valoarea consumului trebuie previzionat pentru
urmtoarele dou valori ale venitului: x = 32000 i x = 38000. Utiliznd
estimatorii parametrilor, aceste valori sunt:

6408.8 + 0.5804 32000 = 24981 i 6408.8 + 0.5804 38000 = 28463.


Erorile de previziune, date de (2.30) sunt: 377 pentru prima valoare previzionat i 464 pentru a doua valoare previzionat. Putem din nou constata
c eroarea de previziune crete odata cu deprtarea lui x de x
= 31771.

Capitolul 3

Modelul liniar de k + 1
variabile
3.1 Dependena ntre mai multe variabile
Modelul liniar de k + 1 variabile, sau modelul de regresie liniar multipl este o
generalizare a modelului liniar de dou variabile, destinat a studia dependena
ntre mai multe fenomene a cror msur se efectueaz cu ajutorul variabilelor
notate Y i (X1 , X2 , , Xk ). Vom seleciona, printr-un procedeu presupus
aleator, n indivizi dintr-o populaie, i, pentru ecare vom introduce (k + 1)upletul de variabile msurnd k + 1 fenomene studiate: pentru individul i,
notm acest (k +1)-uplet (Yi , X1i , X2i , , Xki ). Utiliznd convenia de notaie
ce distinge variabilele de realizarile lor, vom nota (yi , x1i , x2i , , xki ) (k + 1)upletul valorilor observate. Aa cum am explicat deja pentru cazul modelului de
dou variabile, dac dorim s modelm o relaie de form liniar ntre o variabil
endogen i k variabile exogene, trebuie ncorporat n modelul reinut faptul
c nivelul variabilei endogene nu este exclusiv determinat de cele k variabile
exogene. Maniera simpl de a completa ecare din aceste relaii consta n a
introduce termenii notai {1 , 2 , , n } astfel

yi = 0 + 1 x1i + 2 x2i + + k xki + i , i = 1 n.

(3.1)

Introducerea acestor termeni presupune urmtoarea interpretare. Pentru orice


individ i, nivelul variabile endogene yi se descompune de manier aditiv n
dou componente (doi termeni):
1. componenta 0 + 1 x1i + 2 x2i + + k xki exprim ideea de plecare
privind existena unei relaii liniare n care variabilele exogene inueneaz
variabila endogen Y . In descompunerea lui yi , acest termen este deci
partea din nivelul lui Yi care este determinat prin combinaia liniar a
valorilor xji , j = 1 k a variabilelor exogene Xj , j = 1, k ;
33

34

CAPITOLUL 3.

MODELUL LINIAR DE

K +1

VARIABILE

2. componenta i exprim faptul c, aceast combinaie liniar a valorilor


xji , j = 1 k nu determin doar ea nivelul variabilei endogene Yi . Acest
termen este deci partea din nivelul lui Yi care este determinat de ctre ali
factori dect variabilele exogene Xji , j = 1 k .
Cu formalizarea dat de ecuaia (3.1) i cu interpretrile date mai sus, am
exprimat de fapt ideea unei relaii liniare n care k variabile determin o alta,
lasnd totui posibilitatea i altor factori, alii dect variabilele exogene, de
a avea un anumit efect asupra variabilei endogene. Rmne totui s se gseasc un mijloc de a formaliza ideea c variabilele exogene joac un rol preponderent n determinarea variabilei endogene, i c ceilali factori, a cror
existen este recunoscut, nu au dect un impact neglijabil asupra acesteia
i, n consecin interesul asupra lor este minor. Faptul c impactul acestor
factori asupra variabilei endogene ar putea  neglijabil introduce o nou ipotez. Vom presupune n continuare c pentru orice individ i, observnd c
X1i = x1i , X2i = x2i , , Xki = xki ne putem atepta c valoarea variabilei
endogene Yi s e egal cu 0 + 1 x1i + 2 x2i + + k xki . Aceast ipotez
semnic faptul c factorii, alii dect variabilele exogene, nu contribuie cu nimic
la valoarea la care ne ateptm s e luat de ctre variabila endogen.

3.2 Denirea modelului


Elementele prezentate n seciunea precedent, ne permit s dm o deniie
modelului econometric liniar de k variabile.

Deniia 2. Fie Y ; X1 , X2 , , Xk , k + 1 variabile aleatoare, descriind ecare


un fenomen economic, a cror observaii sunt

(yi , x1i , x2i , , xki ) , i = 1 n.

Modelul econometric liniar de parametrii necunoscui 0 , 1 , , k


yi = 0 + 1 x1i + 2 x2i + + k xki + i , i = 1 n

(3.2)

ce urmeaz a  estimai cu ajutorul acestor date statistice, numit de asemenea


model de regresie liniar de k variabile, este un model pentru care urmtoarele
ipoteze sunt adevrate:
H1. Media condiional a lui Yi tiind c X1i = x1i , X2i = x2i , , Xki = xki ,
este o funcie liniar de (x1i , x2i , , xki ):
E [Yi / {Xji = xji , j = 1 k}] = 0 + 1 x1i + 2 x2i + + k xki , i = 1 n.

H2. Variabilele exogene sunt mutual independente sau, n ali termeni, admitem absena coliniaritii ntre variabilele exogene.
Cov (xji , xli ) = 0, pentru orice j, l = 1 k, l = j, i = 1 n.

3.3.

ESTIMAREA PRIN MCMP

35

H3. Media condiional a lui i tiind c X1i = x1i , X2i = x2i , , Xki = xki ,
este nul.
E [i / {Xji = xji , j = 1 k}] = 0, i = 1 n.

Variabilele exogene nu aduc nici o informaie asupra reziduurilor, i deci


avem de asemenea:
Cov [i , xji ] = 0, j = 1 k, i = 1 n.

H4. Variana condiional a lui i tiind c X1i = x1i , X2i = x2i , , Xki =
xki , este constant.
V ar [i / {Xji = xji , j = 1 k}] = 2 , i = 1 n.

Aceasta revine la a spune c amploarea reziduurilor generate de model este


constant pentru toate observaiile.
H5. Covariana lui Yi cu Yj este egal cu covariana lui i cu j :
Cov [Yi , Yj ] = Cov [i , j ] , i, j n.

Dac i = j , atunci avem


Cov [Yi , Yi ] = V ar [Yi ] = y2 = Cov [i , i ] = V ar [i ] = 2 .

Ipoteza c pentru orice i = 1 n, V ar [Yi ] = y2 , impune varianelor


variabilelor aleatoare Y1 , Y2 , , Yn de a  identice. Aceast proprietate
mai este numit homoscedasticitate. Dac i = j , atunci avem
Cov [Yi , Yj ] = Cov [i , j ] = 0.

Aceasta revine la a spune c o eroare fcut asupra unei observaii nu


depinde liniar de nici o alt eroare fcut asupra oricrei alte observaii.
H6. Variabila rezidual urmeaz o lege normal, centrat, de medie zero i
varian 2 constant.

3.3 Estimarea prin MCMP


Fie modelul liniar de k + 1 variabile denit mai sus, adic

yi = 0 + 1 x1i + 2 x2i + + k xki + i , i = 1 n

(3.3)

Obiectivul acestei seciuni de curs este de a furniza estimatori pentru parametrii


modelului. Estimarea parametrilor 0 , 1 , , k va  efectuat prin metoda
celor mai mici ptrate, al crui principiu este de a minimiza suma ptratelor
erorilor reziduale sau, n ali termeni, suma ecarturilor la ptrat ntre valorile
observate i cele produse de ctre model. A alege (k + 1)-uplurile de valori

36

CAPITOLUL 3.

MODELUL LINIAR DE

K +1

VARIABILE

reale (0 , 1 , , k ) pentru care suma ecarturilor este cea mai mic revine la
a minimiza funcia S = S (0 , 1 , , k ) denit prin:

S=

2i =

i=1

yi

i=1

2
j xji , unde x0i = 1, i = 1 n

(3.4)

j=0

Estimatorii lui 0 , 1 , , k astfel obinui sunt numii estimatori de ptrat


minim (M CO) i sunt notai prin 0 , 1 , , k . Pentru a simplica scrierea
dar i pentru a facilita calculele preferm s utilizm alternativa matricial a
ecuaiei (3.3) i astfel obinem deniia urmtoare:

Deniia 3. Un model liniar de

k + 1 variabile este denit prin urmtoarea

ecuaie matricial:

(3.5)

Y = X +

unde:
- Y este un vector cunoscut, de dimensiune n,
- X este o matrice cunoscut, de dimensiune (n k + 1),
- este vectorul parametrilor necunoscui ai modelului, de dimensiune k +1,
- este vectorul reziduurilor necunoscute, de dimensiune n,

y1
1 x11
y2
1 x12

Y = . ,X = .
..
..
..
.
yn
1 x1n

x21
x22

x2n

..
.

xk1
0
1
xk2

.. , = ..

.
.
xkn
k

, = .. .

.
n

Utiliznd aceste notaii, funcia (3.4) poate  scris

(
)
T
S() = T = (Y X) (Y X) = Y T Y 2Y T X + T X T X , (3.6)
unde X T este matricea transpus a matricii X .
Aceast funcie este continu i derivabil n raport cu ecare din elementele
vectorului = (0 , 1 , , k ) i minimizarea sa face apel la derivatele pariale
de ordinul nti i doi.

Propoziia 8. Vectorul estimator de ptrat minim al vectorului necunoscut


este dat de expresia:

(
)1 T
= X T X
X Y

(3.7)

iar vectorul estimat prin model, notat Y va  dat de


(
)1 T
X Y.
Y = X = X X T X

Demonstraie.
(
)

(3.8)

Putem observa c S() este o funcie ptratic de , cu


X T X matrice simetric i pozitiv denit, iar problema de minim admite
(vectorul ale
o unic soluie , care este deci punctul unde gradientul lui S()

3.4.

PROPRIETI STATISTICE ALE ESTIMATORILOR

37

crui componente sunt derivatele pariale de ordinul nti) este nul. Aceasta se
scrie
[(
]
)
S ( )
S () =
= 0 2 X T X X T Y = 0
(3.9)

(
)
(
)1 T
X T X = X T Y = X T X
X Y,
( T )
deoarece matricea X X este inversabil. Multiplicnd cu X relaia de mai
sus obinem
(
)1 T
Y = X = X X T X
X Y
i astfel demonstraia este complet.

3.4 Proprieti statistice ale estimatorilor


Ca i n cazul modelului liniar de dou variabile, estimatorul obinut pentru
modelul de k + 1 variabile este nedeplasat. Mai mult chiar, obinem o expresie
foarte
pentru matricea de varian-covarian a vectorului , notat
( simpl
)
V ar . Aceast matrice este prin deniie:

{[
( )
( )] [
( )]T }
V ar = E E
E
.

(3.10)

Estimatorii ai parametrilor necunoscui ai modelului liniar de k + 1 variabile,


dai de ecuaiile (3.7), depind de datele de observaie. In consecin, ei sunt
variabile aleatoare.

Propoziia
9. Vectorul obinut prin metoda M CM P este nedeplasat, adic
( )
E = , iar matricea sa de varian-covarian este:
( ) (
)1 2
V ar = X T X
.

Demonstraie.
scriem:

(3.11)

Pentru a demonstra c este nedeplasat, este sucient s

( )
[(
[(
]
)1 T ]
)1 T
E = E X T X
X Y = E XT X
X (X + )
(
)1 ( T )
(
)1 T
= XT X
X X + XT X
X E () =

deoarece, prin ipoteza (H3) avem c E () = 0. Pentru varian procedm n


aceeai manier:
[(
( )
)(
)T ]
V ar = E
.
Substituia lui din ecuaia (3.7) ne permite s scriem
{[
( )
] [(
]T }
( T )1 T
)1 T
V ar = E
X X
X Y
XT X
X Y

38

CAPITOLUL 3.

=E

K +1

VARIABILE

{[
] [(
]T }
( T )1 T
)1 T
X X
X (X + )
XT X
X (X + )
.
=E

=E

MODELUL LINIAR DE

[(

XT X

)1

{[
(

X X

)1

}
] [(
)1 T ]T
T
X X
X
X
T

(
)1 ] ( T )1 T
(
)1
X T T X X T X
= X X
X V ar () X X T X
(
)1 2
= XT X

deoarece

(
)
E T = V ar() I

i astfel demonstraia este complet.


(
)1
In relaia (3.10) intervin att 2 , variana variabilei reziduale ct i X T X
,
cantitatea de informaie adus de X . Intuitiv, expresia (3.10) are urmtoarea
semnicaie: (informaia
despre adus de estimatorul su va  cu att mai
)
precis (V ar mic) cu ct cantitatea de informaie adus de X va  mai
mare, comparativ cu variana variabilei reziduale. Observm c relaia varianei
lui , stabilit mai sus, nu este util n practic deoarece folosete variana
rezidual 2 , care este necunoscut. Totui, putem da un estimator nedeplasat
al acesteia, graie reziduurilor estimate. Acest estimator este dat prin propoziia
urmtoare.

Propoziia 10. Un estimator nedeplasat al lui 2 va  dat de

1
2 .
n k 1 i=1 i
n

s2 =

(3.12)

Demonstraie. Pentru orice i = 1 n, i = yi yi . Atunci suma ptratelor


reziduurilor poate  scris dup cum urmeaz.
n

(
)T (
)
2i = T = Y Y
Y Y .

i=1

Ecuaia (3.8) i notaia

(
)1 T
M = I X XT X
X
ne permit s scriem

[
(
)1 T ]
(
)1 T
X Y
X Y = I X XT X
= Y Y = Y X X T X

[
(
)1 T ]
X X + M = M
= M (X + ) = M X + M = X X X T X
i deci obinem

i=1

2i = T M M T = T M 2 = T M

3.5.

39

ANALIZA VARIANEI

deoarece M T = M i M 2 = M . In primul rnd observm c termenul T M ,


al ecuaiei de mai sus este un scalar. Aplicnd acum operatorul mediei obinem
( n
)

(
)
[ (
)]
[ (
)]
2
E
i = E T M = E T r T M = T r E T M
i=1

(
)1 T
= 2 T r (M ) = 2 T r (I P ) = 2 (n k 1), P = X X T X
X ,
unde I este matricea identitate de ordinul n, T r este suma numrului de elemente situate pe diagonala principal a matricii, iar P este o matrice de ordinul
k + 1. Ultima egalitate rezult din urmtoarele dou proprieti.
- Media unei matrici a crei elemente sunt variabile aleatoare este matricea
mediilor acestora;
- Media este un operator liniar.

Remarca 4. Utiliznd relaiile

(3.11) i (3.12), putem scrie estimatorii varianelor ecrui j , pentru orice j = 0, 1, , k


( )

s2j = V ar j = Cj+1,j+1 s2 sj = Cj+1,j+1 s,

(3.13)

i deasemenea estimatorii covarianelor lui l cu j , pentru orice l = j ; l, j =


0, 1, , k ,
(
)
s2lj = Cov l , j = Cl+1,j+1 s2,

)1

(3.14)

unde C = X T X . Cum matricea X T X este simetric i pozitiv denit,


(
)1
matricea inversa X T X , este deasemenea simetric i pozitiv denit, i n
consecin, s2lj = s2jl .

3.5 Analiza varianei


Propoziia 11. Suma total a ptratului variaiilor este egal cu suma ptratului variaiilor explicate prin model plus suma ptratului reziduurilor.
(3.15)

SCT = SCE + SCR,

unde
SCT =

i=1

Demonstraie.

(yi y) , SCE =

(
i=1

)2

yi y , SCR =
2i .
i=1

Utiliznd faptul c i = 1 n, yi = yi + i si ca y
= y obinem:

(
)
(
)2
2
yi y = yi y
+ i (yi y) = yi y + 2i + 2 yi y i .

40

CAPITOLUL 3.

MODELUL LINIAR DE

K +1

VARIABILE

Suma total a ptratului variaiilor va  dat de :


n

(yi y) =

i=1

n
n
n

(
)
(
)2
yi y i .
yi y +
2i + 2
i=1

i=1

i=1

Pentru a simplica scrierea vom utiliza notaiile matriciale i obinem


)T (
)
(
)T
(
)T (
) (
Y Y
Y Y = Y Y
Y Y + T + 2 Y Y
,

(3.16)

unde Y este un vector, ale crui componente sunt egale cu y. Ultimul termen
din partea dreapt a acestei ecuaii mai poate  scris:
(
)T
Y Y
= Y T Y T = Y T
deoarece

Y T = y

i = 0.

i=1

Inlocuind vectorul estimat prin model, dat de ecuaia (3.8) obinem:


(
)T (
)
[
(
) ]
Y T = X
Y X = T X T Y X T X

= T

[(

]
)
X T X X T Y = 0.

Acest rezultat este o consecin imediata a ecuaiei (3.9) i deci ultimul termen
al ecuaiei (3.16) este egal cu zero i astfel demonstraia este complet.
In aceeai manier ca i pentru cazul modelului liniar de dou variabile,
graie ecuaiei analizei varianei, putem deni coecientul de determinaie ce
msoar procentajul din variaia lui y explicat prin modelul liniar de k + 1
variabile. El este dat de:

R2 =

SCE
SCR
=1
0 R2 1.
SCT
SCT

(3.17)

Coecientul de determinaie este un indicator ce permite evaluarea calitii


unui model liniar, simplu sau multiplu (model de dou sau k + 1 variabile). Are
o valoare cuprins ntre 0 i 1 i msoar adecvarea ntre model i datele de
observaie. Cu certitudine, R2 are imprefeciunile sale, dar utilitatea sa nu este
egalat dect de simplitatea sa. In ne, dac R2 este cu certitudine un indicator
pertinent, el prezint totui un defect contrariant, i anume c el crete odat cu
numrul de variabile exogene. Din acest motiv el este innoperant dac dorim s
comparm dou modele liniare cu numr diferit de variabile exogene. In acest
caz, este indicat de a utiliza coecientul de determinaie ajustat Ra2 , care este
ntotdeauna inferior lui R2 . Coecientul de determinaie ajustat ine cont de
numrul de variabile exogene i este dat de:

Ra2 = 1

)
n1 (
1 R2 .
nk1

(3.18)

3.6.

TESTE ASUPRA MODELULUI DE

K +1

41

VARIABILE

3.6 Teste asupra modelului de k + 1 variabile


Aa cum am subliniat deja n studiul modelului liniar de dou variabile, orice
procedeu de estimare trebuie completat de teste statistice. In fapt, rezultatele
obinute sunt estimatori, adic realizri ale unor variabile aleatoare i deci ele
nu dau informaii certe asupra valorilor coecienilor modelului liniar. Testele
cele mai utilizate n evaluarea estimatorilor obinui prin metoda M CO sunt,
aa cum am precizat deja: testul Student, testul Fisher, testul de Jarque-Berra
i testul Durbin-Watson.

3.6.1 Testul de semnicativitate global sau testul Fisher


Esena acestui test const n a verica, care din cele dou ipoteze este adevrat.

H0 : 1 = 2 = = k = 0
sau

H1 : ! j = 0, j = 1, 2, , k.

Dac H0 este adevrat, atunci variabilele exogene nu au nici o inuen asupra


variabilei endogene. Pentru a testa semnicativitatea global a parametrilor,
statistica lui Fisher se determin astfel

Fc =

n k 1 R2
,
k
1 R2

(3.19)

unde R2 este coecientul de determinaie. Acest rezultat ne permite s dm


o justicare suplimentar coecientului de determinaie. Reamintim c acesta
estimeaz puterea explicativ a variabilor exogene asupra variabilei endogene.
Valoarea Fc urmeaz legea lui Fisher cu (k, n k 1) grade de libertate. Fie
riscul asumat, n general = 0.05. F1 se citete din tabelul repartiiei lui
Fisher cu k grade de libertate la numrtor i (n k 1) grade de libertate
la numitor, pentru un risc , sau de manier echivalent, pentru probabilitatea
1 . Avem atunci:
- Dac Fc < F1 , atunci admitem ipoteza c parametrii 1 = 2 = =
k = 0 i deci variabilele exogene x1 , x2 , , xk nu inueneaz variabila
endogen y .
- DacFc > F1 , atunci cel puin un parametru j , j = 1 k este diferit
de zero, adic, cel puin o variabil exogen xj , j = 1 k inueneaz
variabila endogen y .

3.6.2 Testul Student


Intrebarea ce se pune acum este de a ti dac trebuie sau nu inclus variabila
xj n modelul nostru sau, n ali termeni, dac variabila xj inueneaz sau nu
variabila y sau, i mai precis, dac n realitate parametrul j = 0 sau j = 0,

42

CAPITOLUL 3.

MODELUL LINIAR DE

K +1

VARIABILE

j = 0k . Sub ipoteza normalitii reziduurilor, estimatorii j ai parametrilorj ,


j = 0 k , urmeaz legi normale, notate simbolic:
(
)
j N j , Cj+1,j+1 2 .
Cum variana variabilei reziduale nu este cunoscut, nlocuind 2 prin estimatorul su s2, n aceste condiii:

tj =

j
j
, j = 0 k,
s Cj+1,j+1

urmeaz legea lui Student cu n k 1 grade de libertate. In particular, cnd ne


punem ntrebarea nulitii lui j spunem de fapt c testm semnicativitatea
parametrului j . Dac urmare a testului concluzionm c j = 0, armm de
fapt c parametrul j este nesemnicativ. In acest caz, dac concluzionm de
exemplu c j = 0, atunci variabila xj nu inueneaza semnicativ variabila y .
In aceste condiii, cele k + 1 valori statistice ale testului sunt urmtoarele:

tj =

|
|
j
, j = 0 k.
s Cj+1,j+1

(3.20)

Fie riscul asumat, n general = 0.05. t1 2 se citete din tabelul repartiiei Student cu n k 1 grade de libertate pentru riscul , sau de manier
echivalent, pentru probabilitatea 1 . Atunci avem:
- dac tj < t1 2 , atunci admitem ipoteza c parametrul j este egal cu
zero i deci variabila exogen xj nu inueneaza variabila endogen y ;
- dac tj > t1 2 , atunci parametrul j este diferit de zero adic, variabila
exogen xj inueneaza variabila endogen y .
Celelalte dou teste statistice prezentate n partea rezervat modelului liniar
de dou variabile, adic testul Jarque-Berra i testul Durbin-Watson, au aceeai
utilitate, i deci nu vor  reprezentate aici. Singura diferen existent const n
calculul estimatorului varianei reziduale. Relaia ce trebuie utilizat aici este
dat prin ecuaia (3.12).

3.7 Previziuni utiliznd modelul liniar


Aa cum am precizat n cazul modelului de dou variabile, unul din scopurile
utilizrii modelelor liniare este i acela de a face previziuni, adic de a prevedea valoarea variabilei endogene y n prezena unor noi valori ale variabilelor
exogene x1,n+1 , x2,n+1 , , xk,n+1 . Pentru a simplica scrierea utilizm notaia
matricial i deci e Xn+1 noua valoare a vectorului X , pentru care dorim s
previzionm pe yn+1 . Dou tipuri de erori vor complica previziunea noastr:
prima este datorat necunoaterii lui n+1 , iar a doua incertitudinii asupra estimatorilor j , j = 0 k (parametrii j au fost estimai fr a ine cont de
valoarea Xn+1 . Propoziia urmtoare ne d o evaluare a erorii de previziune.

3.8.

MODELE LINIARE CU VARIABILE CENTRATE

43

Propoziia 12. Eroarea de previziune n+1 = yn+1 yn+1 satisface proprietile

urmtoare:
{

E (
n+1 ) = 0,

[
]
( T )1
T
2n+1 = V ar (
n+1 ) = 2 1 + Xn+1
X X
Xn+1

i
n+1 =

2n+1 .

(3.21)

(3.22)

Demonstraie.

Cum E (n+1 ) = 0 i deoarece este un estimator nedeplasat


a lui , este clar c
(
)
T
T
E (
n+1 ) = E (yn+1 yn+1 ) = E Xn+1
+ n+1 Xn+1

[
(
)
]
[
( )]
T
T
+ n+1 = Xn+1
E + E (n+1 ) = 0.
= E Xn+1
Altfel spus, n medie, estimatorul este corect. S calculm acum variana erorii
de previziune. Deoarece depinde doar de variabilele aleatoare (i , i = 1 n),
cu care n+1 nu este corelat, rezult c:
[
(
)
]
( )
T
T
V ar (
n+1 ) = V ar Xn+1
+ n+1 = 2 + Xn+1
V ar Xn+1

[
]
( T )1
T
= 2 1 + Xn+1
X X
Xn+1
i deci obinem V ar (
n+1 ) dat de ecuaia (3.22). Variana 2 este necunoscut
i deci ea trebuie nlocuit prin estimatorul su dat de relaia (3.12). In ne,
ca i pentru modelul liniar de dou variabile, putem demonstra c aceast incertitudine este minimal n centrul de gravitaie al variabilelor exogene, adic
T
= [
=X
x1 , x
2 , , x
k ]. Astfel, variana crete odat ce Xn+1
atunci cnd Xn+1

se deprteaz de X . Aceasta se explic, intuitiv, prin faptul c pe msur ce o


avem mai puine informaii despre
observaie Xn+1 se deprteaz de media X
ea.

3.8 Modele liniare cu variabile centrate


Utilitatea modelului liniar cu variabile centrate este mai comprehensibil pentru
cazul unei relaii de dependen ntre mai multe variabile. Pentru o mai buna
nelegere a acestei transformri de variabile vom prezenta mai jos, de manier
detaliat, toate etapele necesare n succesiunea lor logic.
1. Fie modelul liniar de k + 1 variabile:

yi = 0 + 1 x1i + 2 x2i + + k xki + i , i = 1 n


i

y = 0 + 1 x
1 + 2 x
2 + + k x
k + .

44

CAPITOLUL 3.

MODELUL LINIAR DE

K +1

VARIABILE

2. Notm, pentru orice j = 0 k i i = 1 n

yi =

yi y
xji x
j
et x
ji =
.
a
bj

(3.23)

- Dac pentru toi j = 0 k , a = bj = 1 atunci suntem n cazul


variabilelor centrate.
- Dac a = sy i pentru toi j = 0 k , bj = sj atunci suntem n cazul
variabilelor centrate reduse,
unde

1
1
2
(xji x
j ) , sj = s2j , x
j =
xji ,
n 1 i=1
n i=1
n

s2j =

1
2
(yi y) , sy = s2y .
n 1 i=1
n

s2y =

Observm c valorile coecienilor unui model liniar depind de unitile


de msur ale variabilelor. Anumii autori arm c interesul pentru
transformarea variabilelor este de a elimina inuena unitilor de msur
a variabilelor asupra valorii coecienilor i de a adopta pentru toate aceste
variabile o unitate comun msurat prin ecartul tip al ecrei variabile.
Aceast armaie este cel puin chestionabil. Interesul econometriei este
unul primordial economic, de a pune n eviden relaiile ntre variabilele
economice, conform unitilor de msur n care ele sunt exprimate i
nu unul matematic. Simplicarea procedurilor de calcul nu trebuie s
afecteze adevrata dependen ntre variabile. Deci, chiar dac cele dou
transformri sunt ambele acceptabile din punct de vedere matematic, noi
preferm s utilizm doar pe prima dintre ele.
3. Pentru toi j = 0 k , i = 1 n i a = bj = 1, ecuaiile (3.23) pot  scrise:

yi = yi y i x
ji = xji x
j .
Dac notm ui = i i observnd c E (ui ) = 0, atunci modelul liniar
poate  scris
yi = 1 x
1i + 2 x
2i + + k x
ki + ui
(3.24)
4. Ecuaia de mai sus ne permite s claricm faptul c nu este n mod
necesar egal cu zero. Printre consecinele aplicrii metodei M CO avem

= 0 = 0 =
y
= y = 0 i u
i astfel este clar c nu este n mod necesar egal cu zero.
5. Pentru simplicarea scrierii dar i pentru a facilita calculele, vom adopta
notaia matricial i astfel obinem modelul liniar urmtor

+ U,
Y = X
unde, de data aceasta, componentele vectorului sunt 1 , 2 , , k .

3.8.

45

MODELE LINIARE CU VARIABILE CENTRATE

6. Vectorul estimator obinut prin metoda M CO pentru noul model liniar


va  deci dat prin
)1
(

T Y i 0 = y 1 x
T X
1 2 x
2 k x
k .
(3.25)
X
= X

Demonstraie.

Utiliznd notaia matricial, funcia S() poate  scris:


)T (
)
(
)
T

T X
.
S() = U T U = Y X
Y X
= Y T Y 2Y T X+
X

[(
)
]
S
T X
X
T Y = 0.
() = 0 2 X

Aceast ecuaie mai poate  scris


(
)
=X
T Y
T X
X
S () =

(3.26)

i astfel rezultatul este obinut.


7. In ceea ce privete analiza varianei, de manier evident rezultatul este
identic celui obinut utiliznd variabilele necentrate, adic
n

yi2 =

i=1

i2 +
y

i=1

u
2i

i=1

(yi y) =

i=1

n
n

(
)2
yi y +
u
2i . (3.27)
i=1

i=1

Demonstraie.

yi y
= y
i y u
i yi = yi u
i
n

yi2

i=1

i=1

yi2 +

u
2i

i=1

yi u
i .

i=1

Ultimul termen al ecuaiei de mai sus se scrie


n
n [
]

y
i u
i =
1 x
1i + 2 x
2i + + k x
ki u
i
i=1

i=1

n [
][
]

=
1 x
1i + 2 x
2i + + k x
ki yi 1 x
1i 2 x
2i k x
ki
i=1

care este de fapt prima ecuaie a sistemului (3.26), i deci este egal cu
n

zero. De manier evident, termenii


(xji x
j ) , j = 1 k sunt toi
i=1

egali cu zero. Relaia (3.27) ne permite s armm c, R2 este acelai ca


cel obinut utiliznd variabilele necentrate.
8. Aceast metod modic estimatorul varianei reziduale i el va  dat de

s2u =

n
1 2
nk1 2
s
u
s2u =
n k i=1 i
n k

(3.28)

Aplicarea modelului cu variabile centrate are drept consecin esenial reducerea dimensiunii matricilor. In cazul nostru, obinem matrici de ordinul k n loc
de matrici de ordinul k + 1.

46

CAPITOLUL 3.

MODELUL LINIAR DE

K +1

VARIABILE

3.9 Exemple
Exemplul 3.

Un studiu statistic a fost efectuat de ctre asociaia productorilor de ampanie a crui scop este de a pune n eviden principalii factori care
inueneaz consumul acesteia. Printre variabilele exogene considerate, au fost
alese urmtoarele: venitul pe o persoan, preul buteliei de ampanie i preul
unei buteli de aperitiv, toate exprimate n Euro, iar ca variabil endogen a
fost considerat consumul de ampanie pe o persoan. Datele sunt prezentate
n tabelul de mai jos.

142.53
138.73
140.00
145.39
151.74
165.39
172.38
159.04
161.26
175.55
182.53
190.47
195.42
210.47
227.93
239.04
243.80

X1

87.02
89.11
91.47
94.03
97.60
101.71
105.50
106.16
108.01
111.91
116.64
123.04
128.08
135.36
139.76
145.03
150.53

X2

76.60
80.65
86.76
85.35
84.11
81.74
80.95
91.73
96.46
95.41
96.16
98.40
99.10
99.30
97.84
95.96
104.27

X3

83.60
82.91
76.97
73.20
65.08
69.20
75.60
69.54
66.80
71.25
83.02
98.91
101.23
121.42
133.31
146.91
160.62

Studii statistice preliminare au sugerat o dependen liniar ntre aceste variabile i n consecin, modelul ales a fost unul liniar de patru variabile, de
forma:
y = 0 + 1 x1 + 2 x2 + 3 x3 + .
Aplicarea metodei M CO pentru cazul modelului liniar de mai multe variabile
a produs rezultatele urmtoare:
a. 0 = 43.212, 1 = 1.965, 2 = 1.014 i 3 = 0.053, adic, modelul
descriind consumul de ampanie n funcie de cele trei variabile este:

y = 43.212 + 1.965x1 1.014x2 + 0.053x3 .


b. Coecientul de determinaie R2 = 0.994, semnic faptul c 99.4% din
variaia variabilei endogene y este determinat de variaiile variabilelor
exogene considerate. Coecientul de determinaie ajustat este Ra2 = 0.993.
c. Statistica lui Fisher Fc = 727.21, ind superioar valorii date de tabelul
repartiiei Fisher Ft = 3.41, pentru un risc = 0.05 i (3, 13) grade de

3.9.

EXEMPLE

47

libertate, semnic faptul c, cel puin una din cele trei variabile exogene
considerate are o inuen determinant asupra variabile endogene y .
d. Cele patru valori ale statisticilor testului Student sunt: t0 = 4.39, t1 =
15.01, t2 = 5.16, t3 = 0.91. Valoarea t0.975 este citit din tabelul repartiiei Student cu 13 grade de libertate pentru un risc = 0.05 i este
egal cu 2.16. Observm c t0 , t1 i t2 sunt superioare lui t0.975 i deci
variabilele x1 i x2 au o inuen determinant asupra variabilei endogene
y . Din contr, t3 < t0.975 i deci aici putem concluziona c efectul variabilei x3 asupra variabilei endogene y este neglijabil. Sau, n ali termeni,
preul aperitivului nu inueneaz de manier semnicativ consumul de
ampanie. In aceste condiii, variabila respectiv trebuie eliminat din
model.
e. Vom proceda la reestimarea parametrilor modelului, de data aceasta considernd doar cele trei variabile, iar rezultatele obinute sunt urmtoarele: 0 = 44.907, 1 = 2.066 i 2 = 1.103 adic, modelul descriind consumul de ampanie n funcie de variabilele considerate este:
y = 44.907 + 2.066x1 1.103x2 . Prezena termenului 0 poate  explicat prin faptul c ampania este un produs tradiional n Frana, i deci
o cantitate din consumul acesteia, zis autonom, exist ntotdeauna i ea
nu este semnicativ inuenat nici de venit i nici de preul buteliei de
ampanie.
f. O alt observaie este de asemenea important a  subliniat i anume:
ariaia venitului va determina o variaie n acelai sens a consumului de
ampanie. Din contr, variaia preului buteliei de ampanie va  urmat
de o variaie n sens contrar a consumului de ampanie.
g. Coecientul de determinaie R2 = 0.994, semnic faptul c 99.4% din
variaia variabilei endogene y este determinat de variaiile variabilelor
exogene. Coecientul de determinaie ajustat este Ra2 = 0.993.
h. Statistica lui Fisher Fc = 1104.163, ind net superioar valorii date de
tabelul repatiiei lui Fisher Ft = 3.74, pentru riscul = 0.05 i (2, 14)
grade de libertate, semnic faptul c cel puin una din variabilele exogene
considerate are o inuen determinant asupra variabilei endogene y .
i. Cele trei valori ale statisticilor testului Student sunt: t0 = 4.68, t1 =
29.69, t2 = 6.53. Valoarea t0.975 se citete din tabelul repartiiei Student
cu 14 grade de libertate i un risc = 0.05 i este egal cu 2.15. Observm
c t0 , t1 i t2 sunt superioare lui t0.975 i deci variabilele x1 i x2 au
o inuen determinant asupra variabilei endogene y . In ali termeni,
putem arma c nivelul consumului de ampanie este puternic inuenat
att de nivelul venitului ct i de preul buteliei de ampanie.
j. Un estimator nedeplasat al varianei variabilei reziduale, determinat cu
ajutorul relaiei (3.12) este s2 = 8.505 al crui ecart tip este s = 2.916.

48

CAPITOLUL 3.

MODELUL LINIAR DE

K +1

VARIABILE

Pentru a pune n eviden varianele parametrilor estimai, avem nevoie


de matricea de varian-covarian C , care este dat de:

10.82730
0.04320 0.17180
0.00057 0.00120 .
C = 0.04320
0.17180 0.00120 0.00336
Utiliznd relaiile (3.13) i (3.14) obinem:
( )
s20 = V ar 0 = 10.82730 8.505 = 92.0888 s0 = 9.5963,

( )
s21 = V ar 1 = 0.00057 8.505 = 0.00484 s1 = 0.0696,
( )
s22 = V ar 2 = 0.00336 8.505 = 0.028542 s2 = 0.1689,
(
)
s201 = Cov 0 , 1 = 0.0432 8.505 = 0.367389,
(
)
s202 = Cov 0 , 2 = 0.1718 8.505 = 1.461461,
(
)
s212 = Cov 1 , 2 = 0.0012 8.505 = 0.01001.
(
)
Putem cu usurin observa c valoarea covarianei 0 , 1 este pozitiv
(
) (
)
i c celelalte dou covariane 0 , 2 i 1 , 2 sunt ambele negative.
Semnicaia este urmtoarea: parametrii 0 si 1 pot  n acelai timp e
subestimai, e supraestimai, dar, din contr, parametrii 0 i 1 nu pot
, n acelai timp nici subestimai i nici supraestimai, cu parametrul 2 .
k. In ne, ultimul test necesar pentru a naliza analiza noastr, este testul
privind normalitatea reziduurilor. Relaiile (2.24), (2.25) i (2.26) ne furnizeaz rezultatele urmtoare: SK = 0.325, KT = 2.456 i JB = 4.302.
Valoarea 20.95 se citete din tabelul repartiiei lui Helmert cu dou grade
de libertate, cu riscul = 0.05 i este egal cu 5.99. Deci, deoarece
JB < 20.95 , putem concluziona c reziduurile sunt normal distribuite.
l. S presupunem acum c trebuie s previzionm consumul de ampanie
pentru urmtoarele valori ale venitului i ale preului buteliei de ampanie:
x1 = 120, x2 = 90 i x1 = 140, x2 = 100. Utiliznd parametrii estimai,
aceste valori sunt:

44.91+2.071201.1090 = 193.52 i 44.91+2.071401.10100 = 223.80.


Pentru a pune n eviden eroarea de previziune, dat de relaia (3.22)
avem nevoie de estimatorul varianei reziduale, dat de (3.12). Aceast
valoare este egal cu 8.505. Avem de asemenea nevoie de a evalua mrimea

( T )1
T
W = Xn+1
Xn+1 .
X X

3.9.

49

EXEMPLE

Pentru prima previziune, aceast mrime (W ), este egal cu 0.10581 i


deci eroarea de previziune este

(1 + 0.10581) 8.505 = 9.405 = 3.07.


Pentru a doua previziune, aceast mrime (W ), este egal cu 0.16630 i
deci eroarea de previziune este

(1 + 0.16630) 8.505 = 9.917 = 3.15.


m. Aplicarea modelului liniar cu variabile centrate pentru cazul unei relaii de
dependen de trei variabile are ca prim consecin reducerea dimensiunii
matricilor i vom obine matrici de ordinul doi n loc de matrici de ordinul
trei. Aplicnd succesiv etapele descrise n seciunea consacrat acestei
metode obinem:

10983
(
)1 [ 0.00057 0.0012 ]

T Y =
T X

X
=
i X
0.0012 0.00336
3541
i n nal rezult deci aceeai estimatori 1 = 2.066 i 2 = 1.103.
Valoarea estimatorului 0 se obine cu ajutorul relaiei

0 = y 1 x
1 2 x
2 = 178.92 2.066 113.59 + 1.103 91.22 = 44.907.
n. Coecientul de determinaie i coecientul de determinaie ajustat nu s-au
schimbat: R2 = 0.994 i Ra2 = 0.993.
o. Statistica lui Fisher Fc = 1183.03, ind net superioar valorii tabelare dat
de repartiia Fisher Ft = 3.74, pentru un risc = 0.05 i (2, 15) grade de
libertate, semnic faptul c cel puin una din variabilele exogene are o
inuen major asupra variabilei endogene y .
p. Cele dou valori ale statisticilor testului Student sunt: t1 = 30.73 i t2 =
6.76. Valoarea t0.975 se citete din tabelul repartiiei Student cu 15 grade
de libertate pentru riscul = 0.05 i este egal cu 2.13. Observm c
t1 i t2 sunt ambele superioare lui t0.975 i deci variabilele x
1 i x
2 au o
inuen determinant asupra variabilei endogene y.
q. Un estimator nedeplasat al varianei variabilei reziduale, determinat cu
ajutorul relaiei (3.28) este s2u = 7.938 a crui ecart tip este su = 2.817.
Observm c aceast valoare este inferioar valorii determinate utiliznd
variabile necentrate. Varianele parametrilor vor  determinate dup cum
urmeaz:

s21 = 0.00057 7.938 = 0.0045, i s22 = 0.00336 7.938 = 0.0266


s12 = 0.0094, s1 = 0.0672 i s2 = 0.1632.

50

CAPITOLUL 3.

MODELUL LINIAR DE

K +1

VARIABILE

Putem observa c ecarturile parametrilor determinate utiliznd metoda


cu variabile centrate sunt inferioare celor determinate utiliznd variabile
necentrate. In ne, o ultim remarc se refer la calitatea covarianei
parametrilor 1 i 2 de a  negativ, ea rmnnd neschimbat.
In exemplul de mai sus am utilizat date transversale i n aceste condiii testul
Durbin-Watson este inaplicabil.

Capitolul 4

Modele neliniare
4.1 Introducere
De civa ani, modelarea neliniar a modicat profund abordrile econometriei
aplicate, att n macro i microeconomie ct i n nane. Aa cum am armat
deja n capitolul consacrat modelului liniar de dou variabile, relaiile de dependen n economie nu sunt n mod necesar liniare. Numeroase exemple conrm
aceast armaie. Printre relaiile cele mai cunoscute de dependen neliniar
putem remarca funciile de producie. Uneori tim c relaia de dependen
ntre dou sau mai multe variabile nu este liniar, e pentru c avem cunotine
prealabile asupra problemei examinate, e pentru c putem constata aceasta
cu ajutorul gracelor. Suntem atunci confruntai cu o dubl problem: de a
determina forma relaiei, adic funcia ce leag variabila endogen de variabilele
exogene i de a estima parametrii necunoscui utiliznd datele disponibile. Cele
dou probleme sunt mai mult dect complicate.
Nu vom insista aici asupra manierei de rezolvare a primei probleme. Acest
rspuns nu poate  dat de ctre econometrie, ci ma degrab de cunotinele sau
intuiia noastr asupra fenomenului studiat. Parametrii unui model liniar pot
 direct estimai cu ajutorul metodei celor mai mici ptrate, aa cum am putut
constata n cele dou capitole precedente. Aceast abordare nu este ntotdeauna
posibil pentru modelele neliniare. Din fericire, pentru cea de-a doua problem,
econometria poate avea rspunsuri relativ simple dar, doar pentru anumite situaii cnd funciile neliniare pot  liniarizate. In general, dac printr-o anumit
transformare este posibil s convertim un model neliniar n unul liniar, atunci
estimarea parametrilor devine posibil. Exemplul cel mai cunoscut n acest sens
este cel al estimrii parametrilor unei funcii de producie.
Seciunea urmtoare va  consacrat studiului ctorva modele neliniare care
pot  liniarizate prin anumite transformri.
51

52

CAPITOLUL 4.

MODELE NELINIARE

4.2 Modele neliniare de dou variabile


1. Modelul log-liniar.

Relaia log-liniar, numit de asemenea transformarea


log-log este denit n maniera urmtoare

Yi = AXi ei , unde =

dY
Y
dX
X

(4.1)

i deci coecientul poate  interpretat ca elasticitatea lui Y n raport cu


X . Modelul cu elasticitate constant este adesea utilizat de ctre economiti
pentru a pune n eviden relaia existent ntre capitalul zic sau uman i
venit (producie), cerere i pre, etc. Relaia de mai sus poate  liniarizat prin
logaritmare.
ln (Yi ) = ln (A) + ln (Xi ) + i .
(4.2)
Dac notm yi = ln (Yi ), = ln (A) i xi = ln (Xi ), atunci obinem urmtorul
modelul liniar de dou variabile:

yi = + xi + i .
In acest fel, cu ajutorul metodei M CM P , putem obine cu uurin estimatorii
parametrilor i .

2. Modelul exponenial.
este denita astfel

Relatia exponentiala, numita adesea si geometrica,

Yi = e+xi +i , unde =

dY
Y

.
(4.3)
dx
Parametrul a unui astfel de model, este o semi-elasticitate. El reprezint
variaia, n procente a variabile endogene Y n raport cu o variaie de o unitate
a variabilei exogene x. Deoarece aceste semi-elasticiti depind de unitile de
msura ale variabilei exogene, ele nu sunt direct comparabile, utiliznd diverse
variabile exogene. Acest tip de model este n principal utilizat n macroeconomie
pentru a modela ratele de cretere stabile i, n aceste condiii variabila exogen
x corespunde timpului. Relaia de mai sus poate  deasemenea liniarizat prin
logaritmare.
ln (Yi ) = + xi + i .
(4.4)
Dac notm yi = ln (Yi ), atunci obinem urmtorul model liniar de dou variabile
yi = + xi + i ,
i, precum n cazul precedent, putem obine estimatorii parametrilor i cu
ajutorul metodei M CM P .

3. Modelul logaritmic.

In cazul modelului logaritmic, variaia variabilei endogene y este proporional cu rata de variaie a variabilei exogene X . In aceste
condiii, parametrul al acestui model este deasemenea o semi-elasticitate, iar
modelul este denit de maniera urmtoare:

yi = + ln (Xi ) + i , unde =

dy
dX
X

(4.5)

4.2.

MODELE NELINIARE DE DOU VARIABILE

53

Dac notm xi = ln (Xi ), atunci obinem din nou un model liniar de dou
variabile, i anume
yi = + xi + i ,
iar estimatorii parametrilor i pot  obinui cu ajutorul metodei celor mai
mici ptrate. Modelul logaritmic este arhetipul traiectoriei care se epuizeaz
lent (cresctor sau descresctor) i este utilizat pentru a pune n eviden, de
exemplu, relaia existent ntre salariu i vechimea n munc sau ntre valoarea
vnzrilor i cheltuielile de publicitate.

4. Modelul logistic. Cele trei modele neliniare propuse mai sus au ca proprietate comun faptul c sunt de concavitate constant. In anumite situaii,
traiectoriile fenomenelor pot  succesiv convexe i concave, n funcie de vitezele
lor de variaie, ce pot  diferite. De exemplu, pentru vnzrile unui produs, pe
parcursul duratei lui de via, putem distinge trei faze. Faza de debut, unde
produsul este puin cunoscut i deci vnzarile progreseaz lent, faza de cretere,
posibil de manier accelerat, unde produsul cunoate o cerere substanial pe
pia i, n ne faza de declin unde piaa devine saturat. Modelul logistic este
denit astfel:
Ymax + Ymin e+xi +i
Yi =
.
(4.6)
1 + e+xi
In general, valorile Ymin i Ymax sunt furnizate prin cunoterea fenomenului, iar
de nu ele pot  estimate cu ajutorul datelor statistice. Relaia de mai sus poate
 scris de maniera urmtoare:
(
)
Ymax Yi
ln
= + xi + i ,
Yi Ymin
Dac notm:

(
yi = ln

Ymax Yi
Yi Ymin

)
,

atunci obinem urmtorul model liniar de dou variabile:

yi = + xi + i ,
iar estimatorii parametrilor i pot  obinui cu ajutorul metodei celor mai
mici ptrate.
Modelele prezentate mai sus sunt interesante deoarece ele corespund unor
fenomene economice bine cunoscute. Alte modele neliniare sunt de asemenea
posibil de a  considerate pentru a pune n eviden relaii ntre diverse fenomene
din economie, precum modelul numit i de tip putere y = axb , sau modelul
numit i hiperbolic y = a + xb , iar transformarea lor ntr-un model liniar se face
de manier foarte simpl i deci nu vor  prezentatate aici. Mai mult, aplicaiile
fcnd apel la aceste modele sunt relativ restrnse.
Analiza statistic a modelelor neliniare prezentate n aceast prima parte a
capitolului este similar modelelor liniare de dou variabile dar, totui, anumite
circumstane particulare le difereniaz. Faptul c scara ortogonal a fost nlocuit cu cea logaritmic sau semi-logaritmic, nu ne permite s interpretm

54

CAPITOLUL 4.

MODELE NELINIARE

de aceeai manier diferitele elemente de analiz statistic, n primul rnd coecientul de corelaie i cel de determinaie. Calculul acestor coecieni este
absolut necesar pentru a justica dependena liniar, dar interpretarea se face
n funcie de scara aleas. Mai mult, aceste limite de interpretare vin, n primul rnd din faptul c noi suntem familiarizai de a judeca aceste relaii ntre
variabile, mai degrab utiliznd scara ortogonal dect cea logaritmic. Pentru
a evita diversele particulariti de interpretare, preferm s prezentm detaliat
analiza statistic considernd dou exemple de utilizare a modelelor neliniare.

4.3 Exemple.
1. Exemplu de model logaritmic.

Un fabricant de aparate menajere dorete


s analizeze relaia ce exist ntre vzri i cheltuielile de publicitate. Datele
sunt exprimate n milioane de Euro i sunt prezentate n tabelul urmtor.

344.0
352.5
359.4
365.5
371.5
376.2
378.5
381.4
385.2
387.5
389.1
392.2
394.2
396.7
398.3
399.6
400.9
401.8
402.6
402.8

15.4
17.6
18.3
18.8
18.8
19.0
19.3
21.8
22.1
22.4
23.5
25.8
27.4
29.6
32.2
36.6
38.8
41.5
43.8
45.7

x = ln(X)
2.7344
2.8679
2.9069
2.9339
2.9339
2.9444
2.9601
3.0819
3.0956
3.1091
3.1570
3.2504
3.3105
3.3878
3.4720
3.6000
3.6584
3.7257
3.7796
3.8221

Rezultatele analizei statistice sunt urmtoarele.


1. Coecientul de corelaie, egal cu 0.89 semnic o buna relaie de dependen liniar ntre valorile variabilei endogene i valorile variabilei exogene, msurate pe scara logaritmic. Valoarea coecientului de determinaie, egal cu 0.7935 semnic faptul c 79.35% din variaiile variabilei
endogene sunt explicate prin variaiile logaritmice ale variabilei exogene.
Aceast armaie este echivalent faptului c variaia variabilei y este pro-

4.3.

55

EXEMPLE.

porional cu rata de variaie a variabilei x. In fapt, variaia logaritmic


semnic rata de variaie.
2. Aplicarea relaiilor (2.5) ne permite s obinem:

= 233.78 i = 46.41
i deci funcia vnzrilor este dat de:

y = 233.78 + 46.41 ln(X).


Interpretarea este urmtoarea. Partea independent de variaiile cheltuielilor de publicitate se ridic la 233.78 euro. Putem de asemenea observa
c o cretere de un procent a cheltuielilor de publicitate poate genera o
cretere a vnzrilor de 46.41 euro.
3. Valoarea calculat este Fc = 69.18, iar F1 se citete din tabelul repartiiei Fisher cu 1 grad de libertate la numrtor i 18 grade de libertate la
numitor pentru un risc = 0.05 i aceast valoare este egal cu 4.41. Cum
Fc > F0.95 , putem deci arma c parametrul este diferit de zero, adic,
variabila exogen x (logaritmul cheltuielilor de publicitate) inueneaz
de manier determinant variabila endogen y (valoarea vnzrilor).
( )
(
)
4. V ar (
) = 329.56, V ar = 31.14, Cov
, = 100.78 i s2 = 67.85.
t = 12.88 i t = 8.32. Putem observa nc o dat c valoarea covarianei
celor doi estimatori este negativ i deci ei nu pot  n acelai timp sub
sau supraestimai. Valoarea t0.975 se citete din tabelul repartiiei Student
cu 18 grade de libertate pentru un risc = 0.05 i este egal cu 2.101.
Observm c t > t0.975 i astfel putem arma c logaritmul cheltuielilor
de publicitate x inueneaz de manier determinant valoarea vnzrilor
y . Mai mult, constatm c Fc = t2 . In ceea ce privete t constatm
c t > t0.975 i n consecin putem de asemenea arma c parametrul
este sensibil diferit de zero i deci partea autonom a vnzrilor este
sucient de precis estimat prin modelul liniar.
5. In ne, ultimul test necesar pentru a naliza analiza statistic, este testul
asupra normalitii reziduurilor. Relaiile (2.24), (2.25) i (2.26) ne furnizeaza rezultetele urmatoare: SK = 0.668, KT = 0.671 i JB = 1.77.
Valoarea 20.95 se citete din tabelul repartiiei lui Helmert cu 2 grade de
libertate, pentru un risc = 0.05 i este egal cu 5.99. Deci, deoarece
JB < 20.95 , putem concluziona c reziduurile sunt normal distribuite.
6. S presupunem acum c valoarea vnzrilor trebuie previzionat pentru
dou valori ale cheltuielilor de publicitate: X = 25, x = 3.2189 i X =
47, x = 3.8502. Utiliznd estimatorii parametrilor, aceste valori sunt:

233.78 + 46.41 3.2189 = 383.17 i 233.78 + 46.41 3.8502 = 412.47


Erorile de previziune date de relaiile (2.30) sunt: 8.44 pentru prima valoare previzionat i 9.11 pentru a doua valoare previzionat.

56

CAPITOLUL 4.

MODELE NELINIARE

2. Exemplu de model logistic.

Exemplul urmtor ncearc de a modela


dinamica vnzrilor unui produs. Datele de mai jos reprezint numrul de telefoane portabile clasice, adic cele ale generaiei fr acces la internet, vndute
de un productor pe perioada de timp 1988 2007.

45, 61, 81, 106, 134, 166, 200, 237, 275, 315, 355,
395, 435, 474, 510, 545, 578, 607, 624, 634.
Rezultatele analizei statistice sunt urmtoarele.
1. In cazul de fa, Ymin = 0, telefoanele portabile nu au existat din totdeauna, ele au aprut la un moment dat t, iar Ymax = 800 prin analogie cu
un produs similar deja cunoscut. Aceste informaii permit simplicarea
modelului al cror parametrii, i vor trebui estimai.
(
)
Ymax
yi = ln
1 = + ti + i , t1 = 1, t2 = 2, , t20 = 20.
Yi
2. De aceast dat este dicil de a interpreta coecientul de corelaie, prin
natura complicat a variabilei yi . Coecientul de determinaie, egal cu
0.989, sugereaz existena unui model liniar de excelent calitate. Modelul
liniar este evident semnicativ avnd n vedere valoarea lui Fc = 1664.9.
3. Aplicarea metodei celor mai mici ptrate furnizeaz urmtorii estimatori:
= 2.7449 i = 0.2184 i deci modelul se scrie:
(
)
Ymax
yi = ln
1 = 2.7449 0.2184ti + i .
Yi
4. Relaiile (2.21) produc urmtoarele valori: t = 42.81 i t = 40.80.
Valoarea t0.975 se citete din tabelul repartiiei Student cu 18 grade de
libertate pentru riscul = 0.05 i este egal cu 2.101. Observm c
t > t0.975 i t > t0.975 i astfel putem arma c cei doi parametrii sunt
semnicativ diferii de zero.
5. S incercm acum s vedem care ar  numrul de telefoane portabile ce
vor  vandute n anul 2008. Pentru a face aceasta, aplicm direct modelul
i obinem:
(
)
Ymax
y2008 = ln
1 = 2.7449 0.2184 21 = 1.8418 x2008 = 691.
Y2008

4.4 Modele neliniare de mai multe variabile


Asa cum am armat deja, numeroase modele apriori neliniare pot  studiate n
cadrul unui model liniar. Exemplul cel mai cunoscut este funcia de producie
care stabilete o relaie ntre producia observat pe de o parte i, fora de munc

4.5.

ESTIMAREA FUNCIEI COBB-DOUGLAS.

57

i capitalul zic pe de alt parte. Funciile de producie au fost elaborate nc


de la nele secolului XIX , n acelai timp cu dezvoltarea teoriei echilibrului
i a productivitii marginale. Existena unei relaii ntre cele trei variabile
prezenta un interes n msura n care se spera s se dea un rspuns la anumite
probleme teoretice precum rolul progresului tehnic n producie, inuena muncii
i capitalului, msurarea productivitii marginale a acestor factori, vericarea
statistic a teoriei randamentelor descresctoare i, n ne, adecvarea la realitate
a teoriilor marginaliste a repartiiei.
Intr-un articol publicat n anul 1928 n revista American Economic Review,
C. W. Coob i P. H. Douglas, ambii profesori la Universitatea din Chicago, primul matematician i al doilea economist, prezint publicului primele rezultate
ale muncii lor. Studiind curbele trasate cu ajutorul seriilor cronologice ale produciei, capitalului i forei de munc pentru economia Statelor Unite, pentru
perioada 1899 1922, P. H. Douglas constat c ntotdeauna curba pruduciei
este situat ntre cele dou curbe ale celor doi factori, deasupra celei a forei
de munc i la o distan ce rmne sensibil egal la un sfert din distana care
separ cele dou curbe ale factorilor. Aceast observaie l ndeamn pe P. H.
Douglas s solicite lui C. W. Cobb s caute o formul matematic a produciei,
iar acesta propune s e testat urmtoarea:

Y = AK L ,
unde Y este producia observat, L este fora de munc i K este capitalul zic
iar coecienii i pot  interpretai ca ind elasticitatea lui Y n raport cu
K i elasticitatea lui Y n raport cu L. Alternativa econometric a modelului
este
i
Yi = AKi L
i e , i = 1, 2, , n
Acest model este echivalentul unui model liniar de trei variabile, exprimat la
scar logaritmic:

ln Yi = ln A + ln Ki + ln Li + i .
Dac notm = ln A, yi = ln Yi , xi = ln Ki i zi = ln Li , atunci obinem
urmtorul model liniar de trei variabile:

yi = + xi + zi + i ,
i astfel putem determina estimatorii parametrilor , i cu ajutorul metodei
celor mai mici ptrate.

4.5 Estimarea funciei Cobb-Douglas.


Datele din tabelul urmtor reprezint evoluia celor trei variabile: P IB , capitalul zic i fora de munc pentru economia Statelor Unite, pe perioada
1919 1960.

58

CAPITOLUL 4.

58985
59734
58698
62084
71285
74284
75481
81366
81833
83097
88562
79817
73021
60665
57772
65041
74221
83278
90884
83743
91530
101313
116415
127434
136274
146470
145052
140288
142022
149895
147122
163260
173398
178864
186264
184482
200993
205730
210125
205700
221385
227593

20943
18983
21668
21087
24050
24497
25352
26559
26428
25181
29427
27671
23718
24032
20917
23065
26045
29757
30959
27750
31678
36216
43888
45307
46722
48528
45564
43894
46448
49671
47844
59269
59714
56854
58002
56132
66006
65596
65442
61807
69956
70504

38088
40687
37015
41071
47229
49736
50117
54777
55365
55036
59138
52141
49295
36559
36871
41972
48197
53528
59960
56016
59804
65110
72492
82109
89640
97821
99476
96478
95569
100088
99204
103965
113604
122199
128304
128161
134835
140132
144769
143756
151481
157305

MODELE NELINIARE

y = ln Y x = ln K z = ln L
10.9850
10.9977
10.9802
11.0362
11.1744
11.2157
11.2316
11.3067
11.3124
11.3278
11.3915
11.2875
11.1985
11.0131
10.9643
11.0828
11.2148
11.3299
11.4173
11.3355
11.4244
11.5260
11.6649
11.755 4
11.8224
11.8946
11.8848
11.8515
11.8637
11.9177
11.8990
12.0031
12.0633
12.0944
12.1349
12.1253
12.2110
12.2343
12.2555
12.2342
12.3077
12.3353

9.9496
9.8513
9.9836
9.9564
10.0879
10.1063
10.1406
10.1871
10.1822
10.1339
10.2897
10.2281
10.0740
10.0871
9.9483
10.0461
10.1676
10.3008
10.3404
10.2310
10.3634
10.4973
10.6894
10.7212
10.7520
10.7899
10.7269
10.6895
10.7461
10.8132
10.7757
10.9898
10.9973
10.9482
10.9682
10.9355
11.0975
11.0913
11.0889
11.0318
11.1556
11.1634

Rezultatele analizei statistice sunt prezentate mai jos.

10.5477
10.6137
10.5191
10.6231
10.7628
10.8145
10.8221
10.9110
10.9217
10.9158
10.9876
10.8617
10.8056
10.5067
10.5152
10.6448
10.7830
10.8880
11.0014
10.9334
10.9988
11.0838
11.1912
11.3158
11.4036
11.4909
11.5077
11.4771
11.4676
11.5138
11.5049
11.5518
11.6405
11.7134
11.7622
11.7610
11.8118
11.8503
11.8829
11.8759
11.9282
11.9659

4.5.

ESTIMAREA FUNCIEI COBB-DOUGLAS.

59

1. Valoarea coecientului de determinaie, egal cu 0.9998 semnic faptul


c 99.98% din variaiile logaritmice ale variabilei endogene (P IB) sunt
explicate prin variaiile logaritmice ale variabilelor exogene, (K) i (L).
Coecientul de determinaie ajustat este egal cu 0.9998.
2. Aplicarea relaiilor (3.7) ne permit s obinem:

= 0.6614 A = 1.9375, = 0.3251 i


= 0.6723
i deci funcia de producie este dat prin: Y = 1.9375K 0.3251 L0.6723 .
Interpretarea este urmtoarea. Elasticitatea lui Y n raport cu K , egal
cu 0.3251 semnic faptul c o cretere cu 1% a capitalului va produce
o cretere cu 0.3251% a P IB . Elasticitatea lui Y n raport cu L, egal
cu 0.6723 semnic faptul c la o cretere cu 1% a forei de munc va
produce o cretere cu 0.6723% a P IB .
3. Valoarea calculat este Fc = 124908 iar F0.95 (1; 39) este egal cu 4.1. Cum
Fc > F0.95 , putem arma c parametrii i sunt diferii de zero. Deci,
variabilele exogene, exprimate la scara logaritmic, inueneaza de manier determinant variabila endogen Y (P IB ), exprimat i ea la scar
logaritmic.
4. Estimatorii varianelor parametrilor modelului sunt:

s2 = 0.00052, s2 = 0.000139, s2 = 0.000112 i s2 = 0.000033


i deci estimatorii ecarturilor acestora vor  dai de:

s = 0.022798, s = 0.011789, s = 0.010574 et s = 0.00574.


Aceste valori ne permit s punem n eviden rezultatele testului Student.
t = 29.01, t = 27.58 i t = 63.58. Valoarea t0.975;39 este egal cu 2.021.
Observm c t > t0.975 , t > t0.975 i t > t0.975 i deci cei trei parametrii
ai modelului sunt toi trei semnicativ diferii de zero.
5. In ne, ultimul test necesar pentru a naliza analiza statistic, este testul
privind normalitatea reziduurilor. Relaiile (2.24), (2.25) i (2.26) furnizeaz valorile urmtoare: SK = 5.17, KT = 29.94 i JB = 1713.43.
Valoarea 20.95 se citete din tabelul repatiiei lui Helmert cu 2 grade de
libertate pentru riscul = 0.05 i este egal cu 5.99. Deci, deoarece
JB > 20.95 , putem concluziona c reziduurile nu sunt normal distribuite.
O remarc este absolut necesar aici. Deoarece valorile reziduurilor sunt
distribuite foarte aproape de zero, iar valoarea varianei acestora este relativ mic, rezultatul testului Jarque i Bera nu sunt foarte semnicative.
6. Pentru simplicarea calculelor, putem de asemenea face apel la modelul
liniar cu variabile centrate. Ca o prim consecin este reducerea dimensiunii matricilor i obinem astfel matrici de ordinul doi n loc de ordinul

60

CAPITOLUL 4.

MODELE NELINIARE

trei. Aplicnd succesiv etapele descrise n seciunea consacrat acestei


metode, avem:
]
[
]
(
)1 [
4.21924 3.7211
7.62199
T
T

=
X X
i X Y =
3.7211 3.39392
8.55492
i n cele din urm obinem aceeai estimatori

= 0.3251 i
= 0.6723.
Valoarea estimatorului rezult din relaia

= y x

z = 11.6025 0.3251 10.5077 0.6723 11.1923 = 0.6614.


7. Coecientul de determinaie i coecientul de determinaie ajustat au rmas neschimbai: R2 = 0.9998 i Ra2 = 0.9998.
8. Statistica lui Fisher Fc = 128111, ind net superioar celei date de tabelul
repatiiei lui Fisher Ft = 3.23, pentru un risc = 0.05 i (2, 40) grade de
libertate, semnic faptul c cel puin o variabil din cele dou variabile
exogene are o inuen determinant asupra variabilei endogene y .
9. Cele dou valori ale statisticilor testului Student sunt: t = 27.93 i t =
64.39. Valoarea t0.975 se citete din tabelul repartiiei Student cu 40 grade
de libertate pentru un risc = 0.05 i este egal cu 2.021. Observm c
att t ct i t sunt superioare valorii t0.975 i deci variabilele x
i z au
ambele o inuen determinant asupra lui y.
10. Un estimator nedeplasat al varianei variabilei reziduale, determinat cu
ajutorul relaiei (3.28) este s2u = 0.000032 a crui ecart tip este su =
0.0057. Observm c aceast valoare este inferioar valorii determinate
utiliznd variabilele necentrate. Ecarturile parametrilor vor  deci date
dup cum urmeaz:

s2 = 4.21924 0.000032 = 0.000136, i s2 = 3.39392 0.000032 = 0.000109


s = 0.0116 i s = 0.0104.
Putem constata c ecarturile parametrilor determinate cu ajutorul metodei variabilelor centrate sunt inferioare celor determinate utiliznd variabile necentrate.

Capitolul 5

Serii temporale
5.1 Introducere
Teoria seriilor temporale abordat n acest capitol este aplicat n zilele noastre
n domenii extrem de diverse. Suntem interesai de evoluia unui fenomen de-a
lungul timpului cu scopul de a-l descrie, explica i apoi pentru a-i previziona
valorile viitoare. Pentru aceasta dispunem de observaii la diverse momente de
timp, adic de un ir de valori numerice indexate temporal. Putem s avem n
vedere de exemplu, variaiile relative lunare ale indicelui preurilor, sau evoluia
numrului de persoane ce utilizeaz transportul feroviar sau cotaiile bursiere.
Acest ir de observaii {Xt1 , Xt2 , , Xtn }, notat pur i simplu cu Xt pentru
orice t > 0 este numit serie temporal sau proces temporal cu valori reale n
timp discret.
In general o serie temporal Xt este rezultanta unor diferite componente
fundamentale:
1. tendint.a, notat cu Zt reprezint evoluia pe termen lung a seriei studiate.
Ea exprima comportamentul mediu al acesteia;
2. componenta sezonier, notat cu St corespunde unui fenomen care se repet la intervale de timp relativ regulate (periodice);
3. Componenta rezidual, notat cu t exprim uctuaiile neregulate, n
general de slab intensitate, dar de natur aleatoare.
4. o alt component studiat uneori n manier specic are caracteristica
unui fenomen ciclic. Este vorba despre un fenomen ce se repet, dar
contrar duratei celui sezonier, durata acestuia nu este x i, n general
este mult mai lung. Fr informaii specice, este n general foarte dicil
s disociem tendina de componenta ciclic;
Studiul unei serii temporale permite s analizm, descriem i explicm un fenomen de-a lungul timpului i de s discernem consecinele pentru deciziile luate.
61

62

CAPITOLUL 5.

SERII TEMPORALE

Pentru a modela seriile temporale, putem distinge cel puin dou tipuri de modele: cele zise deterministe i cele stochastice.
1. In modelele zise deterministe (termenul nu este cel mai potrivit) teoria probabilitilor intervine doar de manier complementar. Modelarea const
n a presupune c valorile observate la momentele de timp t > 0 sunt
funcii de timp i de o variabil t centrat, fcnd ociu de variabil rezidual de repartiie normal, reprezentnd diferena ntre valoarea real
i cea propus de model.
2. Modelele stochastice sunt de acelai tip cu modelele zise deterministe doar
c aici, variabila rezidual t nu este normal distribuit i posed o structur de corelaie nenul. t este o funcie de propriile valori anterioare i
de un termen rezidual ut , de repartiie normal.
In acest capitol vom studia doar modelele zise deterministe. Pentru simplicarea
studiului presupunem c realizrile {Xt1 , Xt2 , , Xtn } sunt variabile aleatoare
independente i distribuite conform legii normale. Proprietatea de staionaritate
joac un rol esenial n studiul seriilor temporale. Dac considerm o serie
temporal atunci, prima etap a fazei modelrii const n a determina dac
ea este staionar. Noiunea de staionaritate pe care o reinem aici const
pur i simplu n a determina dac momentele variabilelor aleatoare Xt , sunt
independente de timp.

Deniia 4. Fie {xt

1 , xt2 , , xtn }, o serie temporal cu valori reale i n timp


discret. Ea se zice slab staionar sau de ordinul doi dac;

a. E (xt ) = .
b. V (xt ) = 2 < = constant.
c. Cov (xt , xth ) = (h) adic, covariana dintre variabila xt i variabila
xth depinde doar de h i este independent de t.
Conform acestei deniii, o serie temporal este staionar dac ansamblul momentelor sale de ordinul unu i doi sunt independente de timp. Prin opoziie,
o serie temporal se zice nestaionar dac ea nu satisface cel puin una din
condiiile de mai sus. Acest termen reliefeaz totui numeroase tipuri de nonstaionaritate, dintre care dou le vom preciza aici.

Deniia 5. O serie este staionar n tendin dac seria obinut eliminnd


tendina temporal din seria iniial este staionar.
Exemplu: Fie urmtoarea serie temporal : Xt = 0.75t + xt .

Deniia 6. O serie temporal este staionar n diferen dac seria diferen-

elor valorilor seriei iniiale este staionar. Operatorul de diferen este notat
prin xti = xti xti1 .

Printre seriile temporale, exist dou particulare i anume seria cu variaii independente i seria numit zgomot alb. Aceste serii sunt adesea utilizate n analiza
seriilor temporale deoarece ele sunt componentele elementare ale acestora.

5.1.

63

INTRODUCERE

Deniia 7. O serie temporal

xt se zice a  cu variaii independente, dac


pentru orice succesiune de timp t1 < t2 < < tn , variabilele aleatoare reale
xt2 xt1 , , xtn xtn1 sunt independente.
Seria temporala xt este o serie staionar cu variaii independente dac legea
de probabilitate a variaiilor (xt+h xt ) este independent de t. Un zgomot alb
este o serie temporal staionar cu variaii independente i este denit astfel.

Deniia 8. O serie temporal xt este un zgomot alb dac ea satisface urmtoarele dou condiii:

(5.1)

E (xt ) = 0
(h) = E (xt xth ) = (h = 0) i (h) = E (xt xth ) = 0 (h = 0).
2

(5.2)

Seria zgomot alb este numit gaussian dac legea ei de probabilitate este legea
lui Gauss, adica xt N(0, ). In fapt, vom vedea n continuare c, n conformitate cu teorema lui Wold, orice serie temporal stationar poate  scris
ca o sum ponderat de serii zgomot alb. Aceast teorem este fundamental
n analiza seriilor temporale staionare. Din acest motiv o vom prezenta n
continuare, urmnd a  utilizat n diferite aplicaii.

Teorema 1. Orice serie temporal staionar de ordinul doi {xt , t IN } poate


 reprezentat sub forma:

xt =

j tj +

(5.3)

j=0

unde parametrii j au proprietile: 0 = 1, j IR pentru orice j IN ,

j=0

j2 < i pentru orice t IN , t este un zgomot alb gaussian.

Teorema lui Wold nu este direct aplicabil n practic deoarece presupune c putem exprima o serie temporal staionar ca o sum ponderat innit de ocuri
(tj ) istorice. In practic, nu este posibil de manipulat cu obiecte matematice de dimensiune innit. Totui, se poate demonstra c exist ntotdeauna,
pentru orice serie temporal staionar, un ordin nit, astfel nct aceast serie
s poat  aproximat printr-o sum ponderat de ocuri istorice pn la acel
ordin.
q
q

xt = +
j tj = +
j tj + t ,
(5.4)
j=0

j=1

unde j , j = 1, 2, , q sunt constante reale i este media seriei. Constanta


corespunde mediei deoarece seriile zgomot alb sunt prin deniie de medie zero,
E (tj ) = 0, j = 1, 2, , q .

q
q

E (xt ) = E +
j tj = +
j E (tj ) = .
(5.5)
j=0

j=0

Rmne n continuare a estima coecienii de ponderare j , variana zgomotului


alb 2 i de a propune o previziune procesului studiat.

64

CAPITOLUL 5.

SERII TEMPORALE

5.2 Modelul autoregresiv.


Printre modelele cele mai frecvent utilizate n studiul seriilor temporale, cele
autoregresive de ordinul p, notate A(p) sunt cele mai cunoscute. Aceste modele
sunt construite plecnd de la ideea c observaia la momentul de timp t se poate
explica, de manier liniar, prin observaiile precedente. Ele sunt denite astfel:

xt = +

j xtj + t ,

(5.6)

j=1

unde j , j = 1, 2, , p sunt constante reale. Prin deniie E (tj ) = 0.


Dac presupunem acum c media lui {xt , t IN }, pe care o vom nota cu , nu
depinde de timp:
E (xtj ) = , j = 1, 2, , p
(5.7)
putem atunci obine

E (xt ) = =

c
.
1 1 2 p

(5.8)

Modelul xt = 0.8 + 0.7xt1 + 0.25xt2 + t este un AR(2) de medie = 0.8/(1


0.7 0.25) = 16.
Dei modelele AR(p) pentru p > 1 sunt posibil de a  considerate, n practic
utilitatea lor este relativ redus. In seciunea urmtoare, ne vom interesa doar
de modelele AR(1). Fie deci Xt un AR(1). Putem atunci scrie

xt = + xt1 + t , t = 1, 2,

(5.9)

unde seria t este un zgomot alb gaussian, t N(0, ). Putem remarca faptul
c avem de fapt un model liniar unde intervine seria la momentul t, ca variabil
endogen, seria la momentul t 1 ca variabil exogen i reziduurile zgomot alb
gaussiene. Dac = 1 i = E (xt ) atunci avem

E (xt ) = =

.
1

Dac = 1 atunci rezult c = 0 i obinem astfel o serie staionar n


diferen. Subliniem de asemenea c, ipoteza = 1 implic de manier necesar
c = 0.

xt = +xt1 +t E (xt ) = +E (xt1 )+E (t ) = ++0 = 0.


Nu putem deci avea pe de o parte = 1 i = 0. Cum n general valoarea x0
a seriei este cunoscut, putem atunci scrie:

x1 = + x0 + 1 , x2 = + x1 + 2 x2 = + ( + x0 + 1 ) + 2
x2 = + + 2 x0 + 1 + 2 .

5.3.

65

TESTUL DE STAIONARITATE DICKEY-FULLER

De manier similar avem

(
)
x3 = + x2 + 3 x3 = + + + 2 x0 + 1 + 2 + 3
x3 = + + 2 + 3 x0 + 2 1 + 2 + 3 .
Aceast relaie ne permite de a generaliza pentru a obine n cele din urm

xt =

t1

j=1

j + t x0 +

t1

j tj + t .

j=1

Dac = 1 rezultatul obinut mai poate  scris:

xt =

t1

1 t
+ t x0 +
j tj + t .
1
j=1

Acum este clar c seria xt nu poate  staionar dect dac < 1 i n aceste
condiii t tinde la zero cnd t tinde spre innit i deci obinem rezultatul
urmtor
q

xt = +
j tj + t , =
1

j=1
deoarece t este practic egal cu zero pentru toate valorile lui j > q de unde
obinem exact rezultatul teoremei lui Wold. Relaia de mai sus ne permite de
a evalua variana seriei xt .

q
q

V ar (xt ) =
2j V ar (tj ) + V ar (t ) x2t = 2
2j + 1
j=1

[
]
x2t = 2 1 + 2 + 4 + + 2q

j=1

2
.
1 2

5.3 Testul de staionaritate Dickey-Fuller


Proprietatea de staionaritate sau de nestaionaritate a unei serii temporale,
determin att tipul de modelare ct i proprietile asimptotice ale metodei
econometrice utilizate. Cu alte cuvinte, faptul c seria este staionar sau nestaionar, dar staionar n diferen (DS) sau n tendin (T S), condiioneaz
alegerea modelului econometric care trebuie utilizat. Dac seria este staionar,
regsim proprietile standard, dar dac ea este nestaionar, (DS) sau (T S),
atunci avem proprieti asimptotice particulare. In macroeconomia aplicat este
adesea avut n vedere descompunerea unei serii, precum P IB sau rata omajului, n componenta de tendin i cea conjunctural. In plan teoretic, aceast
descompunere este justicat prin relativa independen a teoriilor tradiionale
ale creterii economice fa de cele ale uctuaiilor conjuncturale. Toate acestea
arat importana unei bune alegeri a metodei de staionarizare a seriei n funcie

66

CAPITOLUL 5.

SERII TEMPORALE

de sursa nestaionaritii sale, DS sau T S . Este cazul deci s prezentm unele


teste care s ne permit s vericm, pe de o parte dac seriile sunt nestaionare
i, pe de alt parte, s putem discerne ntre cele dou surse de nestaionaritate,
DS sau T S . Printre testele posibil de aplicat, vom prezenta aici testul cel mai
cunoscut, numit testul Dickey-Fuller.
Testul Dickey Fuller este un test de rdcin unitate a crui ipotez nul
este nestaionaritatea unui model autoregresiv de ordinul unu. S considerm
o serie temporal {xt , t 1} i un model AR(1):

xt = xt1 + t , t N(0, ), IR.

(5.10)

Principiul general al testului Dickey-Fuller const n a testa ipoteza (H0) de


prezen a unei rdcini unitare, = 1 contra ipotezei (Ha) de absen a unei
rdcini unitare, adic || < 1. Statistica testului este urmtoarea:

DF =

1
.
s

Testul este unul nesimetric i deci tehnica testului Student nu poate  aplicat.
Mai mult, distribuia asimptotic a statisticii Student asociate ipotezei (H0),
nu ramane aceeai dac n modelul (5.10) includem sau nu o constant i un
trend determinist. De altfel, deoarece apriori nici nu tim dac trebuie inclus
aceast constant sau acest trend, este convenabil s aplicm nu un simplu test,
ci mai de grab o adevarat strategie de teste, numite ca un ansamblu testul
Dickey-Fuller. Ceea ce vom propune aici este deci o strategie de teste de tip
Dickey-Fuller ce ne va permite s testm nestaionaritatea, n funcie de tipul
modelului utilizat. Cele trei modele alternative sunt urmtoarele:

xt = xt1 + + t + t ,

(5.11)

xt = xt1 + + t ,

(5.12)

xt = xt1 + t ,

(5.13)

unde = 1 i xt = xt xt1 . Principiul strategiei acestor teste este


urmtorul. Alegem ca punct de plecare modelul cel mai general, aplicm apoi
testul de rdcina unitar acestui model, apoi vericm printr-un test adecvat
dac modelul ales este cel bun. Tabelele tuturor valorilor tabelate de ctre
Dickey i Fuller, respectiv valorile notate cu DF i , sunt prezentate la nele
acestei seciuni. Derularea strategiei testului este prezentat mai jos.
1. Prima etap const n a testa rdcina unitar a modelului (5.11). Comparm valoarea statisticii Student t cu valoarea lui Dickey i Fuller pentru
modelul (5.11), notat cu DF 3.
a. Dac t > DF 3, atunci acceptm ipoteza de nestaionaritate, adic
= 1. Totui, seria xt ar putea  staionar n diferen.
b. Dac t < DF 3, atunci < 1 i deci seria xt poate  staionar, sau
staionar n tendin (T S).

5.3.

TESTUL DE STAIONARITATE DICKEY-FULLER

67

In funcie de diagnosticul stabilit, vom determina dac modelul (5.11) este


compatibil cu datele de observaie. Vom testa deci tendina determinist,
adic nulitatea coecientului . Putem avea dou posibiliti.
2. Dac am acceptat ipoteza c < 1, atunci vom testa nulitatea lui
printr-un test Student.
a. Dac acceptm ipoteza c = 0, atunci modelul (5.11) este modelul
cel bun pentru a testa rdcina unitar.
b. In schimb, dac acceptm ipoteza c = 0, atunci modelul (5.11) nu
este adaptat datelor de observaie i deci trebuie s refacem testul de
rdcin unitar utiliznd modelul (5.12).
3. Dac am acceptat ipoteza c = 1, atunci vom testa dubla ipotez = 0
i = 0 printr-un test Fisher nestandard, cu scopul de a ne asigura c
testul de rdcin unitar a fost utilizat n modelul cel bun. Statistica
acestui test este dat de relaia:

F3 =

(n 3) (SP R10 SP R1)


,
2 SP R1

unde SP R10 este la suma ptratelor reziduurilor modelului xt = + t


i SP R1 este la suma ptratelor reziduurilor modelului (5.11).
a. Dac valoare F3 este superioar valorii 3 citit n tabelul lui Dickey
i Fuller, respingem ipoteza de nulitate a tendinei. In acest caz,
modelul (5.13) este modelul cel bun pentru seria xt .
b. Dac n schimb valoarea F3 este inferioar valorii 3 citit n tabelul
lui Dickey i Fuller, atunci acceptm ipoteza de nulitate a tendinei.
Deci, modelul (5.13) nu este modelul cel bun i va trebui s efectum
din nou testul de nestaionaritate n modelul (5.12).
4. Dac am acceptat ipoteza de nulitate a coecientului a tendinei, atunci
trebuie s efectum din nou testul de nestaionaritate plecnd de data
aceasta de la modelul (5.12). Vom compara valoarea statisticii Student t
cu valoare dat de Dickey i Fuller pentru modelul (5.12), notat cu DF 2.
a. Dac t > DF 2, atunci acceptm ipoteza de nestaionaritate, dar
seria xt va  o serie stationar n diferent cu = 0.
b. Dac t < DF 2, atunci < 1 i deci seria va  staionar.
In funcie de diagnosticul stabilit, vom verica dac modelul (5.12) este
compatibil cu datele de observaie, testnd nulitatea constantei .
5. Dac am respins ipoteza de rdcin unitar, adic < 1, nulitatea lui
va  testat printr-un simplu test Student.
a. Dac am acceptat ipoteza c = 0, atunci modelul (5.12) este modelul cel bun pentru a testa rdcina unitar i seria este deci stationar.

68

CAPITOLUL 5.

SERII TEMPORALE

b. Dac am acceptat ipoteza c = 0, atunci modelul (5.12) nu este


adaptat datelor de observaie i deci va trebui s refacem testul de
rdcin unitar plecnd de la modelul (5.13).
6. Dac din contr, am acceptat ipoteza de rdcin unitar = 1, atunci
vom testa dubla ipotez = 0 i = 0 printr-un test Fisher cu scopul de
a ne asigura c testul de rdcin unitar a fost efectuat pe modelul cel
bun. Statistica acestui test este dat de relaia:

F2 =

(n 2) (SP R20 SP R2)


,
2 SP R2

unde SP R20 este suma ptratelor reziduurilor modelului xt = t i


SP R2 este suma ptratelor reziduurilor modelului (5.12).
a. Dac F2 > 2 , atunci constanta = 0. In acest caz modelul (5.12)
este modelul cel bun.
b. Dac n schimb F2 < 2 , atunci constanta = 0, modelul (5.12)
nu este modelul cel bun i deci va trebui efectuat din nou testul de
nestaionaritate plecnd de la modelul (5.13).
7. In ne, dac am acceptat ipoteza nulitii constantei , atunci va trebui s
efectum din nou testul de nestaionaritate plecnd de data aceasta de la
modelul (5.13). Vom compara valoarea statisticii Student t cu valoarea
tabelat de Dickey i Fuller pentru modelul (5.13), notat cu DF 1.
a. Dac t > DF 1, atunci < 1 i deci seria xt este nestaionar, dar
staionar n diferen adic, xt xt1 = t .
b. Dac t < DF 1, atunci < 1 i deci seria va  staionar. In acest
caz, modelul (5.13) este modelul cel bun.

Valori critice pentru statistica DF a lui


Fuller: 1976, Tabela 8.5.2, p. 373).
DF3 . Modelul xt = xt1 + + t + t .
N

25
50
100
250
500

DF2 .

Modelul

Dickey i Fuller.

0.01 0.05 0.10

-4.38
-4.15
-4.04
-3.99
-3.98

-3.60
-3.50
-3.45
-3.43
-3.42

-3.24
-3.18

-315
-3.13
-3.13

xt = xt1 + + t .

25
50
100
250
500

0.01 0.05 0.10

-3.75
-3.58
-3.51
-3.46
-3.44

-3.00
-2.93
-2.89
-2.88
-2.87

-2.62
-2.60
-2.58
-2.57
-2.57

(Sursa: W. A.

5.4.

STUDIU DE CAZ PE O SERIE TEMPORAL

DF1 .

Modelul

69

xt = xt1 + t .

25
50
100
250
500

0.01 0.05 0.10

-2.66
-2.62
-2.60
-2.58
-2.58

-1.95
-1.95
-1.95
-1.95
-1.95

-1.60
-1.61
-1.61
-1.62
-1.62

Valorile critice pentru statistica

a lui Dickey i Fuller.


(Sursa: D. A. Dickey and W. A. Fuller: 1981, Likelihood Ratio Statistics for
Autoregressive Time Series with a Unit Root, Econometrica, 49, p. 10571072.)

Valorile critice pentru statistica 3 a lui Dickey i Fuller.


N
0.01 0.05 0.10
25
50
100
250
500

10.61
9.31
8.73
8.43
8.27

7.24
6.73
6.49
6.34
6.25

5.91
5.61
5.47
5.39
5.34

Valorile critice pentru statistica 2 a lui Dickey i Fuller.


N
0.01 0.05 0.10
25
50
100
250
500

7.88
7.06
6.70
6.52
6.43

5.18
4.86
4.71
4.63
4.59

4.12
3.94
3.86
3.81
3.78

5.4 Studiu de caz pe o serie temporal


Seria temporal considerat aici este indicele lunar al preurilor bunurilor de
consum. Datele sunt urmtoarele:

yt = {104.2; 105.4; 106.6; 104.1; 107.3; 105.1; 107.2; 105.2; 104.4; 106.5
103.5; 106.8; 104.5; 106.8; 105.9; 104.2; 106.9; 104.3; 107.1; 105.5; 104.7} .
Incepem studiul acesteia prin a estima modelul (5.11.) Vom testa deci prezena
unei rdcini unitare prin a verica nulitatea parametrului = 1 cu ajutorul statisticii lui Student t, unde desemneaz estimatorul obinut prin
metoda celor mai mici ptrate. Aceast procedur ne va da valorile estimatorilor parametrilor modelului (5.11) precum i statisticile Student asociate acestor
parametrii.
xt = 1.6593xt1 0.00115t + 175.2202 + t .
(5.14)
Ceea ce ne intereseaz aici n mod particular este evident statistica Student t
asociat variabilei endogene decalat. Aceasta este gal cu 9.3904. Pentru

70

CAPITOLUL 5.

SERII TEMPORALE

a testa ipoteza = 0, vom utiliza valoarea tabelar a lui Dickey i Fuller


pentru modelul (5.11) i pentru dimensiunea eantionului n = 21. La un risc de
0.05, valoarea critic DF3 este egal cu 3.60. Astfel, n acest caz, pentru un
risc de 0.05, t < DF3 , vom respinge ipoteza nul de rdcin unitar i deci
< 0 < 1.
Trebuie acum evaluat validitatea diagnosticului dat vericnd dac modelul (5.11), pentru care am efectuat testul, este modelul cel bun. Va trebui s
testm nulitatea coecientului de tendint, condiionat de absena unei rdcini unitare. Vom efectua pentru aceasta un test Student pentru coecientul .
Statistica Student t asociat tendinei este egal cu 0.031. La un risc de 0.05,
valoarea critic tS este egal cu 2.08 i cum t < tS , vom accepta ipoteza nul
a coecientului tendinei, adic, = 0. Aceasta semnic faptul c modelul
(5.11) nu este modelul cel bun i deci testul de nestaionaritate trebuie aplicat
modelului (5.12).
Trebuie deci s refacem testul plecnd de data aceasta de la modelul (5.12).
Statistica Student t asociat variabile endogene decalate este aici egal cu
9.7088. Pentru a testa ipoteza = 0, vom utiliza valorile tabelate de ctre
Dickey i Fuller pentru modelul (5.12) i pentru o dimensiune a eantionului
de n = 21. La un risc de 0.05, valoarea critic DF2 este egal cu 3.00.
Astfel, pentru un risc de 0.05, t < DF2 , respingem ipoteza nul de rdcin
unitar i deci < 0 < 1. Cum decizia a fost de respingere a ipotezei
de rdcin unitar < 1, nulitatea lui va  testat printr-un simplu test
Student. Statistica Student t asociat constantei este egal cu 9.71. La un
risc de 0.05, valoarea critic tS este egal cu 2.08 i cum t > tS , vom respinge
ipoteza de nulitate a constantei, i deci = 0. In cele din urm, conform testului
lui Dickey i Fuller, concluzionm c (5.12) este ntr-adevr modelul cel bun,
seria temporal xt privind indicele lunar al bunurilor de consum este o serie
staionar i poate  reprezentat astfel:

xt = 1.6598xt1 + 175.2625 + t , 1 = 1.6598 = 0.6598


sau

xt = 0.6598xt1 + 175.2625 + t
E (xt ) = 0.6598E (xt1 ) + 175.2625 = 0.6598 + 175.2625.
=

175.2625
= 105.59
1.6598

x2t = V ar (xt ) =

2
0.863319
=
= 1.529047 xt = 1.2365.
1 2
1 0.65982

Bibliograe
[1] Amemiya T., (1985). Advanced Econometrics. Harvard University Press.
[2] Bercu B. and D. Chafa, (2007). Modlisation stochastique et simulation.
Dunod, Paris.
[3] Delsart V., A. Rys et N. Vaneecloo (2009). Economtrie thorie et application sous SAS. Septentrion.
[4] Dickey D. and W. Fuller, (1979). Distribution of the Estimator for the
autoregressive Time Series with a Unit Root. Journal of the American
Statistical Association, 74, 427 431.
[5] Dickey D. and W. Fuller, (1981). Likelihood Statistics for Autoregressive
Time Series with a Unit Root. Econometrica, 49, 1057 1072.
[6] Dodge Y. and V. Rousson, (2004). Analyse de rgression applique. Dunod.
[7] Fuller W., (1976). Introduction to Statistical Time Series. John Wiley and
Sons.
[8] Greene W., (2007). Econometric Analysis, sixth edition, Pearson - Prentice
Hall.
[9] Johnston J. et J. DiNardo, (1999). Mthodes Economtriques, Economica,
4 dition.
[10] Pelgrin F., (2010) Lecture notes Advanced Econometrics, HEC Lausanne.
[11] Ruud P., (2000) An introduction to Classical Econometric Theory, Oxford
University Press

71

S-ar putea să vă placă și