Sunteți pe pagina 1din 6

CURS IX FINAL

MODELUL REGRESIEI SIMPLE


Modelele econometrice pot fi
Nr. variabilelor factoriale
Modele unifactoriale
Modele multifactoriale
Forma legturii
Modele liniare
Modele neliniare
Sfera de cuprindere
Modele pariale
Modele globale (agregate)
Considerarea timpului, ca factor
Modele statice
Modele dinamice
Modelele econometrice pot avea
Nr. de ecuaii
Cu o singur ecuaie
Cu ecuaii multiple
Scopul utilizrii
Modele euristice, raionale n teoria economic
Modele decizionale, operaionale n practica economic
Modelele dinamice
Introducerea n mod explicit
a variabilei timp
Modele autoregresive
Modele cu lag (decalaj)
distribuit
Modelul econometric al regresiei simple
Terminologie:
Dac Y = f(X) + , atunci
Y variabila dependent (endogen)
X variabila independent (exogen)
variabila aleatoare
Ex: consumul = f(venit) +
consumul variabila dependent
venitul variabila independent
Rolul unui model de regresie simpl:
1. De a explica relaia de dependen ntre dou variabile, una dependent, i una independent.
Ex.: relaia dintre cererea pentru un bun i preul acestuia
Rolul unui model de regresie simpl:
2. De a realiza previziuni privind mrimea variabilei dependente, pentru un nivel dat al variabilei
independente
Ex. Care va fi nivelul cererii pentru un bun, dac preul acestuia va fi de 3 u.m.?
Modelul econometric al regresiei simple
3. De a realiza simulri privind impactul modificrii variabilei independente asupra celei dependente.
1
u x f y + ) (
u x x x f y
n
+ ) ,..., , (
2 1
u bV a C + +
u aV C
b

t kt t t t
u x x x f y + ) ,..., , (
2 1
t kt t t t
u t x x x f y + ) , ,..., , (
2 1
t k t t t t t
u y y y x f y +

) ,..., , , (
2 1
t k t t t t t
u x x x x f y +

) ..., , , (
2 1
Ex. Cu ct va crete cererea pentru un bun, dac preul acestuia va scdea cu o unitate?
Modelul unifactorial (de regresie simpl) se prezint deci astfel:
Y = variabila endogen;
X = variabila exogen;
= variabila rezidual, aleatoare.
Iniial modelul este doar o ipotez teoretic ea poate fi adevrat sau fals X poate fi sau nu
factorul hotrtor, ce explic cel mai bine evoluia fenomenului Y
validarea sau invalidarea unei astfel de ipoteze se face n urma unor teste statistice.
Elaborarea model ului econometric axat pe regresie
presupune parcurgerea urmtoarelor etape:
1. Identificarea modelului
2. Estimarea (calculul) parametrilor modelului
3. Testarea respectrii ipotezelor referitoare la model
4. Utilizarea modelului pentru realizarea de previziuni.
Etapa 1. Identificarea modelului
const n alegerea unei funcii matematice, f(X), cu ajutorul creia se aproximeaz valorile variabilei
endogene Y numai n funcie de variaia variabilei exogene X.
Care este forma funciei f(X)?
- funcia liniar y = a + bx
- funcia putere, y = axb ;
- funcia exponenial, y = ea+bx ;
- funcia de gradul doi,trei, patru etc
y = a+bx+cx2 ; y = a+bx+cx2 +dx3; y = a+bx+cx2 +dx3 +ex4
- funcia logistic, y = .
Metode de identificare a formei funciei de regresie
Cum gsim cea mai potivit form a funciei f(X)?
Cea mai important metod de identificare metoda norului de puncte.
n funcie de numrul de factori a cror variaie se consider
n explicarea variaiei fenomenului efect, y, exist:
- regresie simpl: cnd se consider variaia unui singur factor: y=f(x) i
- regresie multipl: cnd se consider variaia mai multor variabile explicative: y=f(x1, x2, ,
xk).
Metoda regresiei analizeaz relaiile existente ntre variabila explicat i variabilele explicative, pe
baza datelor observate pentru aceste variabile.
Se poate stabili care din factori au o influen semnificativ, gradul lor de esenialitate i cunoscnd
influena variabilelor factoriale asupra variaiei fenomenului explicat, se pot face previziuni ale valorilor
variabilei y pentru anumite valori date ale variabilelor x.
Regresia liniar simpl
yt = axt + b + t, t = l, 2,...,T
Y - variabila endogen;
X - variabila exogen, factorul esenial ce determin variaia lui Y;
- variabil aleatoare, sintetiznd efectul unor factori neeseniali asupra variabilei Y.
Termenul grupeaz urmtoarele categorii de erori :
o eroare de specificaie exist variabile independente omise din model;
Ex.: cererea = a pre + b +
dac modelul este corect specificat, modelul ar include aceste variabile;
2
Y = f (X) +
t
a+bx
c
1+e
unele relaii de dependen dintre variabile nu sunt cunoscute;
unele date nu sunt disponibile;
n evoluia variabilei dependente pot interveni evenimente ce nu au loc n mod regulat
greve, cataclisme, etc.
eroare de observare (msurare) a variabilei dependente;
Ex.: cererea = a pre + b +
nivelul cererii nu poate fi msurat cu exactitate
se folosesc estimatori ai cererii
include diferena dintre cererea real i cea estimat
o eroare de fluctuaie a eantionrii.
Ex.: cererea = a pre + b +
Utilizarea de eantioane diferite conduce la rezultate diferite n ceea ce privete valoarea
calculat a parametrilor a i b.
Etapa 2. Estimarea parametrilor modelului
nainte de a estima parametri se emit ipoteze cu privire la variabilele din model
Ipoteze fundamentale ale modelului de regresie liniar simpl
H0 : Ipoteza de liniaritate: modelul este liniar n X;
relaia dintre Y i X este liniar, de forma Y = aX + b +
H1 : Ipoteze asupra variabilelor X i Y:
(i) xt i yt reprezint valori numerice ale variabilelor X i Y rezultate prin observarea statistic, neafectate
de erori sistematice;
(ii) Y este variabila endogen aleatoare, pentru c este funcie de ;
(iii) X, variabila explicativ, este considerat ca fiind o variabil determinist n model, nealeatoare;
H2 : Ipoteze asupra erorilor :
(i) are o distribuie independent de timp, de speran matematic nul, respectiv:
E (t) = 0, () t = 0, 1, 2, , T
V (t) = E[t E(t)]2 = =
altfel spus, modelul este homoscedastic.
(ii) Independena erorilor. Dou erori t i t sunt independente liniar ntre ele, adic
(iii) Variabila are o distribuie normal N(0,1).
H3: Ipoteze privind variabila exogen X
(i) cov(xt, t) = 0, t erorile sunt independente de X;
(ii) se presupune c pentru T , E(X) i V(X) sunt finite.
Estimarea parametrilor ecuaiei de regresie liniar simpl
Metoda celor mai mici ptrate -minimizarea funciei
n ipoteza avansat a unei legturi liniare
(yi depinznd liniar de xi), respectiv
yi = y(xi) = axi + b,
atunci condiia impus de aplicarea metodei celor mai mici ptrate este:
= minim, care devine echivalent cu:
Apelnd la metoda determinanilor, sistemul capt urmtoarele soluii redactate simplificat, fr a se mai
preciza limitele operatorului sum ():
3
( )
2
t
E
2

, t
( )
t t'
cov , 0
( ) ( )
1 1
cov( , )
n n
x y i i
i i
d d x x y y
x y
n n




2
( )
( )
i
i x
y y

2 2
2 2
2
det
( )
det
y x
i i
x y x y x x x y
i i i i i i i i
b
n x
i n x x
i i
x x
i i
_



,

_




,
2 2
2
det
( )
det
n y
i
x x y n x y x y
i i i i i i i
a
n x
i n x x
i i
x x
i i



_

,
_


,
Ecuaia de regresie cutat yi = axi + b este identic, n final, cu:
Estimarea parametrilor ecuaiei de regresie liniar simpl
Metoda celor mai mici ptrate -minimizarea funciei
V (X) = E[xt E(xt)]2
Testarea validitii modelului
presupune parcurgerea urmtoarelor etape:
testarea validitii modelului de regresie folosind metoda descompunerii varianei;
calculul raportului de corelaie i testarea semnificaiei lui;
inferena statistic pentru parametrii modelului de regresie;
verificarea ipotezelor modelului de regresie.
Testarea validitii modelului de regresie - ANOVA
Metoda analizei varianei pornete de la relaiile
Etapa 3. Testarea validitii modelului
- Raportul de corelaie
Raportul de corelaie la nivel de eantion este:
La nivel de populaie:
H0: RY/X = 0 (raportul de corelaie nu este semnificativ din punct de vedere statistic), cu alternativa
H1: RY/X 0.
Metoda celor mai mici ptrate - ipoteze
Metoda celor mai mici ptrate, atribuit matematicianului german Carl Friederich
Gauss, este una din cele mai des utilizate metode de estimare a ecuaiilor de regresie statistica. Principiul
acestei metode const n minimizarea sumei ptratelor abaterilor valorilor empirice fa de cele teoretic
estimate, adic minimizarea sumei ptratelor reziduurilor.
4
2
2 2
( )
i i i i i
i i
y x x x y
n x x
_
+



,


2 2
( )
i i i i
i i
i i
n x y x y
Y X
n x x
_




,


( ) [ ]
2
T
1 t
t t
T
1 t
2
t
b ax y b , a



2 2
i i i

(Y- Y)
0
a
a a

0
b
b

( )( )
( )
( )
( ) X V
Y , X cov
X x
X x Y y
X T x
X Y T x y
a
2
t
t t
2
2
t
t t

X a Y b


( ) ( )
1 1
cov( , )
n n
x y i i
i i
d d x x y y
x y
n n




2 2
t t t t
(y - Y) = (y - y + y - Y)
( ) ( ) ( )
2
T T
2
t t t t
t = 1 t = 1
y -Y = y - Y + y -y
1
]


( )
( )
T
2
i
i = 1
Y/X
T
2
i
i = 1
y -Y
R =
y -Y

Aplicarea acestei metode se bazeaz pe urmtoarele ipoteze presupuse adevrate:


1. Modelul este liniar n xi (sau n oricare transformare a lui xi).
2. Valorile lui xi sunt observate fr erori (xi este nealeator).
3. Media (operatorul E) erorilor este zero: E( i / xi)=0
Aceast ipotez spune de fapt c toi factorii neexplicitai de model, i dealtfel cuprini n
i, nu afecteaz n mod sistematic valoarea medie a lui y, adic valorile lor pozitive se
anuleaz cu cele negative astfel nct efectul lor mediu asupra lui y este zero.
4. Homoscedasticitatea sau variaia (V dispersia, varian) egal a erorilor 2.
Variana erorilor pentru fiecare xi (variana condiionat a lui i) este un numr
pozitiv constant i egal cu 2 sau altfel spus, populaiile lui y, corespunztoare valorilor
xi, au aceeai varian. Situaia opus se numete heteroscedasticitate i se poate nota:
,
i unde variana nu mai este constant, i=1,n.
5. Nu exist corelaia (covariana) erorilor.
pentru oricare i j.
Pentru anumite valori date xi, abaterile oricror dou valori y de la valoarea
lor medie nu prezint nici o tendin.
6. Erorile sunt independente de variabila explicativ. Nu exist corelaie ntre erori i valorile x.
pentru c din ipoteza 3.
7. Modelul de regresie este corect specificat. O investigaie econometric ncepe prin specificarea
modelului econometric.
Problemele sunt: ce variabile ar trebui incluse n model, care este forma funcional a modelului (este
liniar n parametri, n variabile sau ambele?)
Proprietile estimatorilor metodei celor mai mici ptrate
Estimatorii metodei celor mai mici ptrate au urmtoarele proprieti:
liniari, adic o funcie liniar a unei variabile aleatoare, cum ar fi variabila y n modelul de regresie;
nedeplasai, media estimatorului din toate eantioanele posibile, de volum n sau valoarea ateptat a
estimatorului este egal cu valoarea adevrat a parametrului, ;
eficieni, adic se obtine o variana minim.
Teorema lui Gauss-Markov se enun astfel:
Date fiind ipotezele modelului liniar clasic de regresie, estimatorii celor mai mici ptrate, din clasa
estimatorilor liniari nedeplasai, au varian minim; se poate spune c sunt BLUE (Best Linear Unbiased
Estimators).
Liniaritatea
liniaritatea n variabile - cu un neles natural nseamn c media condiional (n sensul de
valoarea medie ateptat - n econometrie, apare termenul de speran matematic) a variabilei y este
o funcie liniar a lui xi. Operatorul de speran matematic se noteaz cu litera E. Dreapta de regresie
a populaiei reprezint tendina medie i se scrie: E(y/xi)=a0 + a1xi.
liniaritatea n parametrii este cnd distribuia condiional a variabilei y, E(y/xi) este o funcie liniar
a parametrilor, adic toi sunt la puterea 1, in timp ce variabilele x pot sau nu s fie liniare.
Termenul de regresie liniar nsemn ntotdeauna, liniaritatea n parametrii necunoscui; indiferent
dac exist liniaritate n variabilele explicative.
5
( ) ( ) [ ] ( )
2 2 2
/
i i i i i
E E E x V
( )
2
/
i i i
x V
0 ) ( )] ( )][ ( [ ) , cov(
j i j j i i j i
E E E E
0
cov
) ( ) ( ) ( ) (
))] ( ( [ )] ( )][ ( [ ) , (


i i i i i i
i i i i i i i i i
x E E x E x E
x E x E x E x E E x


( ) 0
i
E
Astfel, exemple de modele liniare sunt:
E(y/xi)=a0 + a1xi, liniar n parametrii i n variabile i
E(y/xi)=a0 + a1xi2, liniar n parametrii i neliniar n variabile.
Un model neliniar n parametrii este: .
Pentru regresia liniar este relevant termenul de liniaritate n parametrii.
Liniaritatea estimatorului
Estimatorul este o funcie liniar a variabilei y, valorile ki servind ca ponderi ale valorilor centrate fa de
medie ale variabilei y.
Tabelul de analiz a varianei pentru regresia simpl
Testul Fisher este un test de verificare a semnificaiei globale a regresiei, n cazul regresiei multiple. n
cazul regresiei simple, aceast semnificaie se reduce la semnificaia influenei variabilei x asupra variaiei
caracteristicii variabilei y.
Dac , se respinge ipoteza de egalitate a varianelor (H0 ipoteza nul), variabila x fiind
semnificativ pentru variaia variabilei y. n caz contrar se accept aceast ipotez de egalitate a varianelor.
Informaiile despre estimatorii coeficienilor modelului
n coloana Coefficients - valorile estimate ale coeficienilor modelului liniar , i=1,k,
Intercept - estimatorul termenului constant, 0, care poate fi zero dac s-a optat pentru
Constant is Zero i
estimatorii coeficienilor variabilelor explicative: 1, ..., n la X Variable 1, X Variable 2, ...
n ordinea declarrii variabilelor explicative;
Standard Error, abaterile standard ale estimatorilor; arat cu ct variaz n medie, n plus sau n
minus valorile estimate ale coeficienilor fa de parametrii pe care i estimeaz
valorile Student, t*, pentru fiecare estimator, pentru verificarea semnificaiei acestuia fa de 0;
P-value, corespunztoare pragului de semnificaie , ncepnd de la care valoarea estimatorului este
semnificativ diferit de zero,
limitele intervalului de ncredere ale estimatorilor: inferioar Lower 95% i superioar Upper 95%,
cu o probabilitate de 95%, implicit, iar la cerere se pot solicita i alte valori ale probabilitii: 99%,
90%, etc.
6
1
a
( )
( )
( )
( )

n
i
i i
n
i
i n
i
i
i
n
i
i
n
i
i i
y k y
x x
x x
x x
y x x
a
1 1
1
2
1
2
1
1

) 2 /(
1 /
*

n SSR
SSE
F
) 2 /( ) 1 (
2
2
*

n R
R
F
05 . 0
2 , 1
*

>
n
F F

S-ar putea să vă placă și