Sunteți pe pagina 1din 9

IE ECONOMETRIE Suport-Seminar 3 (18-20 oct.

2016)

Modelul unifactorial de regresie liniar.


Estimarea parametrilor prin MCMMP (metoda celor mai mici ptrate).
Exemplul 1. Consumul unei familii n funcie de Venitul disponibil
Considerm o populaie format din 60 familii. Dorim s studiem relaia dintre Cheltuielile sptmnale
de Consum ale unei familii (variabila Y) i Venitul sptmnal disponibil al familiei (variabila X). Mai
precis, dorim s previzionm media lui Y (media Cheltuielile sptmnale de Consum ale unei familii)
cunoscnd valorile lui X (valorile Venitului sptmnal disponibil al familiei). Presupunem c mprim
cele 60 de familii n 10 grupe cu aproximativ acelai Venit i nregistrm Cheltuielile sptmnale de
Consum pentru fiecare grup. Datele sunt prezentate n Tabelul 1.
Tabelul 1.

Interpretare: n populaie exist 5 familii cu un Venit de 80 $. Aceste familii au Consumul cuprins ntre
55 i 75 $. Media condiionat este E (Y | X = 80) = (55 + 60 + 65 + 70 + 75)(1 / 5) = 65 .
Dac unim toate mediile condiionate obinem funcia de regresie a populaiei.

Populaia cunoscut: nseamn c folosim toat informaia din cele 60 de familii.


n general nu avem informaiile despre toat populaia. Avem doar un eantion extras aleator din
populaie.

1
Presupunem c, n scopul evalurii influenei Venitului disponibil asupra Cheltuielilor de Consum ale
unei familii, au fost obinute, pentru 10 familii, valorile urmtoare:
X 80 100 120 140 160 180 200 220 240 260
Y 70 65 90 95 110 115 120 140 155 150
X Venitul Disponibil al familiei, n dolari.
Y Cheltuielile de Consum ale familiei, n dolari.
Prima familie ctig sptmnal 80 $ i consum 70$.

a) S se reprezinte grafic datele de observaie i s se comenteze legtura dintre cele dou variabile.
b) Pe baza datelor de la nivelul eantionului, s se determine ecuaia de regresie liniar care modeleaz
legtura dintre cele dou variabile. Dup estimarea parametrilor modelului, s se interpreteze rezultatele
obinute.
c) S se verifice dac modelul de regresie identificat este valid statistic (valoare tabelar: 5,32 pentru un
nivel de semnificaie de 0,05).
d) S se testeze semnificaia statistic a parametrilor modelului i s se determine intervalele de
ncredere pentru parametrii modelului (valoare tabelar: 2,306 pentru un nivel de semnificaie de 0,05).
e) S se msoare intensitatea legturii dintre cele dou variabile cu ajutorul coeficientului de corelaie i
al raportului de corelaie; s se testeze semnificaia indicatorilor utilizai.
f) n ce msur, variaia cheltuielilor de consum este influenat de venitul disponibil al familiei, pe baza
modelului de regresie determinat?
g) S se previzioneze cheltuielile medii de consum ale unei familii, n ipoteza c venitul disponibil este
egal cu 100 sau 280 .
h) S se previzioneze cheltuielile de consum ale unei familii, n ipoteza c venitul este 100 sau 280.
Rezolvare:
a) Pentru a identifica existena unei relaii de dependen ntre variabilele analizate, ca i forma i sensul
relaiei de dependen, construim diagrama mprtierii datelor. n analiza de regresie, variabila
explicativ X apare totdeauna pe axa orizontal iar variabila explicat Y pe axa vertical.
Folosim Excel pentru a efectua calculele pentru estimarea unui model de regresie.
Valorile observate pentru variabilele Y i X sunt introduse n coloanele B i C.

2
Reprezentm grafic perechile de puncte observate ( xi , y i ) .
n Excel, selectm: Insert/Chart/XY(Scatter)
Se observ c ntre variabilele X i Y exist o legtur direct i liniar.
Calculm coeficientul de corelaie liniar: = rX ,Y =0,9808. Exist o legtur direct foarte puternic.

b) Rezult c putem considera c ntre cele dou variabile exist o relaie de forma:
yi = 0 + 1 xi + i , i = 1,2,..., n
Pentru a determina estimatorii a i b (sau 0 i 1 ) ai parametrilor 0 i 1 , rezolvm sistemul de
ecuaii normale ale lui Gauss.
an + b xi = yi 10a + 1700b = 1110

a xi + b x i = x i y i
2
1700a + 322000b = 205500
Soluiile sistemului se pot obine folosind metoda determinanilor:
y i xi xi xi y i
2
(1 110)(322 000) (1700)(205 500)
a= a= 24,4545
n xi ( xi )
2 2
(10)(322 000) (1 700) 2
n x i y i xi y i (10)( 205 500) (1700)(1110)
b= b= 0,5091
n xi ( xi )
2 2
(10)(322 000) (1 700) 2
sau
( xi x )( y i y ) (16800)
b= b= 0,5091
( xi x )
2
(33000)(8890)
a = y bx a = 111 (0,5091)(170) 24,4545
Dreapta de regresie estimat este y i = 24,4545 + 0,5091 xi
Fiecare punct de pe dreapta de regresie este o estimaie a valorii medii a lui Y, corespunztor valorii
alese pentru X. Deci yi este o estimaie pentru E (Y | X i ) .

Interpretarea parametrilor obinui:


Valoarea b 0,5091 msoar panta dreptei de regresie i arat c, n cazul unor Venituri cuprinse ntre
80$ i 260$, atunci cnd Venitul crete cu 1$ (o unitate), Consumul va crete, n medie, cu 0,5091 $.

Valoarea a 24,4545 arat nivelul Consumului, atunci cnd Venitul este 0.


n general, parametrul de interceptare nu are semnificaie economic.
Interpretm pe a ca fiind efectul mediu asupra lui Y, al tuturor factorilor care nu sunt luai n
considerare n modelul de regresie.

3
Exemplul 2. Cererea n funcie de Pre
Legea cererii postuleaz o relaie invers ntre cantitatea cerut dintr-un produs i preul su, toate
celelalte variabile care afecteaz cererea fiind considerate constante.
O editur dorete s studieze legtura dintre numrul de albume vndute i preul unui anumit album (de
pictur). n acest scop, au fost nregistrate urmtoarele 10 perechi de valori:
X 1 2 3 4 5 6 7 8 9 10
Y 49 45 44 39 38 37 34 33 30 29
X preul albumului (n uniti monetare u.m.).
Y numrul de albume vndute;

a) S se reprezinte grafic datele de observaie i s se comenteze legtura dintre cele dou variabile.
Se observ c ntre variabilele X i Y exist o legtur liniar invers.

b) Pe baza datelor de la nivelul eantionului, s se determine ecuaia de regresie liniar care modeleaz
legtura dintre cele dou variabile. S se estimeze parametrii modelului i s se interpreteze rezultatele
obinute.
Considerm modelul:
yi = 0 + 1 xi + i , i = 1,2,..., n .
Pentru a determina estimatorii a i b (sau i ) ai parametrilor i , rezolvm sistemul de
0 1 0 1
ecuaii normale ale lui Gauss.
an + b xi = yi 10a + 55b = 378

a xi + b x i = x i y i 55a + 385b = 1901
2

Obinem: a 49,6667 i b 2,1575


Dreapta de regresie estimat este y i = 49,6667 2,1575 xi
Fiecare punct de pe dreapta de regresie este o estimaie a valorii medii a lui Y, corespunztor valorii
alese pentru X. Deci yi este o estimaie pentru E (Y | X i ) .

Interpretarea parametrilor obinui:


Valoarea b 2,1575 msoar panta dreptei de regresie i arat c, atunci cnd Preul (X) crete cu o
unitate monetar, numrul de albume vndute (Y) scade, n medie, cu dou buci.

Valoarea a 49,6667 arat numrul de albume vndute, atunci cnd preul unui album este 0.
Interpretm pe a 49,6667 ca fiind efectul mediu asupra lui Y, al tuturor factorilor care nu sunt luai n
considerare n modelul de regresie.

4
Estimarea parametrilor modelului n Excel
Microsoft Excel conine un instrument pentru a efectua regresii folosind MCMMPOLS (Ordinary
Least Squares). Selectm: Data Analysis i apoi Regression din lista de instrumente de analiz afiate.

5
Ce facem dac nu apare Data Analysis n menu?
Deschidem fiierul din Excel.
Selectm File Options Add-Ins Go bifm opiunea Analysis ToolPak OK.

Estimarea parametrii modelului cu ajutorul pachetului EViews.


Exemplul 1. Consum Venit
Se va selecta EViews4.1.exe din Folder-ul EViews4.1
Clic pe Eviews4.1.exe
Ferestra Eviews iniial conine:
opiunile meniului principal (File, Edit, Object, View,...)
zona alb, de sub MainMenu, este fereastra pentru comenzi
aria de lucru, unde Eviews afieaz ferestrele obiect pe care le creaz.
Pas1. Crearea unui fiier de tip Workfile
Din meniul principal selectm File/New/Workfile.

n urma selectrii comenzii File/New/Workfile se afieaz fereastra de mai jos, n care vor fi definite:
frecvena datelor i domeniul valorilor seriei de date. Se specific prima i ultima valoare din serie.

Bifm Undated ca tip de structur dac datele sunt de tip seciune.


Introducem apoi nr.de observaii (10 n ex1). Clic OK.

6
EViews va crea un fiier fr nume i va afia o fereastr cu domeniul observaiilor i selecia curent
(putem selecta doar o parte din date). Nu avem date , dar EViews va anticipa necesitatea de a avea
Vectorul c
Seria resid
EViews poate importa date dintr-o pagin Excel. Se foloseste comanda
Procs/Import/Read Text-Lotus-Excel...

Va fi deschis fereastra de dialog pentru import din Excel. Introducem numrul de serii din fiier (2) i
csua de nceput a seriilor (B2 este valoarea implicit).
Atenie: Fiierul din care se import seriile de date trebuie s fie compatibil Excel 97-2003, s fie nchis,
iar informaiile s se gseasc pe prima pagin(foaie) a fiierului.

Valorile observate pentru cele 2 variabile X i Y sunt date n fiierul Ex1.ConsumVenit (din folder-ul
Example Files) i ncep din csua B3. Vom completa Numrul de serii importate: 2.

7
Pas2.Verificarea datelor
Vom crea un grup care ne permite s examinm ambele variabile.
inem apsat tasta CTRL i selectm nti variabila Y, apoi variabila X. Plasm cursorul n zona
albastr i dm dublu clic. EViews deschide un meniu i selectm Open Group.

Dac datele sunt corecte se poate salva fiierul (SAVE).


Bara de titlu se schimb pentru a aprea noul nume. Noul fiier poate fi deschis cu File/Open/Workfile.

Pas3. Specificarea ecuaiei de estimat i estimarea parametrilor

Dorim o regresie a var.dependente Y n raport cu X, folosind datele din fiier.


Selectm Procs/Make equation
Apare o fereastr de dialog pentru estimare :
Y spaiu C spaiu X (sau: yi c xi sau yi xi c)
Method LS, OK.
n loc de Procs/Make equation putem selecta Quick/Estimate Equation...

8
Rezultatele estimrii sunt n ecuaia EQ01:

Apar coeficienii de regresie estimai, erorile standard ale estimatorilor parametrilor, statisticile t i
Pvalue. Apar, de asemenea, media i abaterea standard a variabilei dependente Y, eroarea standard a
estimaiei, coeficientul de determinare RSquared, statistica F i Pvalue asociat.
Exist i alte statistici despre care vom discuta n curnd.

Vizualizarea valorilor reziduurilor din regresie


Selectm variabila resid, apoi clic pe View, Show i OK; sau dublu clic pe resid.

Tem: Pentru seminarul urmtor, pentru Ex1, v rog s listai output-ul obinut din Excel,
pe o singur pagin.

S-ar putea să vă placă și