Sunteți pe pagina 1din 8

Prlitu Anamaria Raluca, grupa 1036, Seria A

16 dec 2013

Proiect Econometrie
1. Formularea problematicii analizate, descrierea datelor si a sursei datelor.(Cel puin 15 observaii, valori specifice caracteristicilor Y, X1 si X2, ntre care exist o legtur logic.) n cadrul urmtoarei analize dispunem de un eantion cu un volum de 30 de informaii privind consumul real, venitul real i nivelul preurilor nregistrate n perioada 1955-1984 la nivelul Marii Britanii. Datele au fost preluate de pe siteul http://epp.eurostat.ec.europa.eu.
Anul 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 Consum 77133 77825 79425 81331 84836 88086 90025 92056 96274 99203 100711 102481 104989 107913 108503 111508 114956 121956 128228 126374 125678 126067 125455 132397 137957 137938 137837 138915 144445 147524 Venit 79929 81975 83266 84495 88718 94441 98289 99349 103779 108074 110215 112639 114270 116238 117309 121859 123392 133625 142018 140998 141801 141674 138491 148360 156472 158777 156746 156361 159827 164111 Pre 0,1762 0,1831 0,1888 0,1929 0,1945 0,1984 0,2058 0,2121 0,2167 0,2270 0,2379 0,2491 0,2536 0,2691 0,2836 0,3022 0,3266 0,3512 0,3874 0,4646 0,5743 0,6557 0,7330 0,8009 0,9360 1,0761 1,2037 1,2965 1,3567 1,4245 Log Cons 11,25329 11,26222 11,28257 11,30628 11,34848 11,38607 11,40784 11,43015 11,47495 11,50492 11,52001 11,53743 11,56161 11,58908 11,59453 11,62185 11,65230 11,71142 11,76157 11,74700 11,74148 11,74457 11,73970 11,79356 11,83470 11,83456 11,83383 11,84162 11,88065 11,90175 Log Venit 11,28889 11,31417 11,32980 11,34445 11,39322 11,45573 11,49567 11,50640 11,55001 11,59057 11,61019 11,63194 11,64631 11,66339 11,67256 11,71062 11,72312 11,80279 11,86371 11,85650 11,86218 11,86128 11,83856 11,90740 11,96063 11,97525 11,96238 11,95992 11,98185 12,00830 Log Pre -1,73634 -1,69795 -1,66695 -1,64539 -1,63742 -1,61751 -1,58085 -1,55081 -1,52921 -1,48282 -1,43588 -1,38982 -1,37181 -1,31273 -1,26022 -1,19661 -1,11901 -1,04641 -0,94825 -0,76659 -0,55463 -0,42208 -0,31067 -0,22206 -0,06616 0,07337 0,18542 0,25970 0,30508 0,35385

Dup cum se poate observa, datele ce prezint informaiile reale sunt prea mari, lucru care duce la o distribuie asimetric i, de aceea, acestea au fost logaritmate pentru e le putea folosi n modelul de regresie. Scopul acestei analize este de a pune n eviden relaia dintre consum, venit i pre, ma precis de a identifica n ce msur este consumul dependent e veniturile oamenilor i de preurile nregistrate.

Prlitu Anamaria Raluca, grupa 1036, Seria A

16 dec 2013

2. S se specifice modelul unifactorial.


Pentru modelul de regresie unifactorial am luat n vedere urmtoarele variabile: - Y variabila dependent, reprezentat de consum - X1 variabila independent, reprezentat de venit Ecuaia de regresie va avea urmtoarea form: Y = 0 + 1* X1 + i a) Reprezentai grafic datele de observaie si comentai legtura dintre variabile.
12.100 12.000 11.900 11.800 Consum 11.700 11.600 11.500 11.400 11.300 11.200 11.200 11.300 11.400 11.500 11.600 Venit
Figura 1

11.700

11.800

11.900

12.000

Dup cum se poate observa n figur, putem spune c ntre cele dou variabile exist o legtur direct, punctele fiind grupate n direcia primei bisectoare. n plus, se mai poate observa i c erorile tind s aib o dispersie constant. b) Estimai parametrii modelului si interpretai rezultatele obinute. Pentru a estima funcia de regresie care exprim dependena ntre cele 2 variabile se va folosi modelul de regresie liniar, tot cu ajutorul aplicaiei Microsoft Excel. Rezultatele regresiei sunt urmtoarele:

Prlitu Anamaria Raluca, grupa 1036, Seria A

16 dec 2013

Cu ajutorul tabelului Summary Output i a indicatorilor calculai se va putea determina bonitatea modelului. Raportul de corelaie(Multiple R) ne arat tipul de legtur dintre consum si venit. Cum acest indicator este egal cu 0,9984, un numr foarte apropiat de valoarea 1, se poate afirma faptul c ntre cele dou variabile exist o legtur de dependen foarte puternic. Coeficientul de corelaie, sau R Square ne arat faptul c 99,69% din variaia consumului este determinat de nivelul venitului, deci venitul reprezint un factor determinant. Abaterea medie patratic a erorilor este un indicator care, cu ct valorea lui este mai apropiat de 0, cu att datele sunt mai apropiate de dreapta regresiei. La noi, acest indicator are valoarea 0,011, lucru ce ne confirm faptul c modelul de regresie liniar simpl este bun. Ecuaia noastr de regresie unifactorial va fi: Y = 1,206865 + 0,889175* X1

Interpretarea parametrilor:
Intercept reprezint termenul liber(0), care este in valoare de 1,206865. Acest numr reprezint valoarea consumului n condiiile n care venitul este egal cu 0, adic o valoare medie a consumului care este determinat de ali factori dect venitul. Log Venit, n funcia noastr reprezentat de 1, ne arat c la creterea cu o unitate a valorii venitului, valoarea consumului va crete n medie cu 0,889. c) Testai semnificaia statistic a parametrului pant i determinai intervalul de ncredere 95% pentru acest parametru. Pentru a testa semnificaia statistic a parametrului pant vom folosi Testul t(Student) i vom avea urmtoarele ipoteze: H0 : 1 = 0 (Parametrul 1 nu este semnificativ statistic) H1 : 1 0 (Parametrul 1 este semnificativ statistic) Vom compara tcalculat(sau t Stat) cu tcritic pentru a putea decide pe care ipotez o acceptm i pe care o respingem. Avem urmtorele valori: tcalculat=95,98594 Cum tcalculat> tcritic => Vom respinge H0 i acceptm H1, ceea ce nseamn tcritic= t;n-2=t0,05;28=2,048 c parametrul pant este semnificativ statistic. Intervalul de ncredere al acestui parametru este 0,870199<= 1<=0,908150. Fiind un parametru semnificativ, acest interval ne arat cu o probabilitate de 95% c, n 95 din 100 de cazuri valoarea real a lui 1 va fi cuprins n acest interval. d) Testai validitatea modelului de regresie. Pentru a testa validitatea modelului de regresie unifactorial vom volofi testul F. Vom avea 2 ipoteze: H0 : Modelul nu este valid statistic ( MSR = MSE). H1 : Modelul este valid statistic (MSR > MSE). Vom compara Fcalculatat cu Fcritic pentru a accepta una dintre cele 2 ipoteze formulate.

Fcalc=9213,30153; Fcritic=F;k;n-2= F0,05;1;28=4,195971;

Cum Fcalc este cu mult mai mare dect Fcritic , vom accepta faptul c modelul ales ajusteaz bine datele din eantion, deci respingem ipoteza nul i acceptm H1.

e) Verificai ndeplinirea ipotezelor modelului clasic de regresie liniar(heteroscedasticitatea, autocorelarea, normalitatea erorilor aleatoare). Lund n considerare modelul liniar de regresie unifactorial menionat mai sus, vom forma n Eviews ecuatia EQ1: Y X1 C pentru a putea determina legtura dintre consum i venit.

Prlitu Anamaria Raluca, grupa 1036, Seria A

16 dec 2013 =0,8891*X1+1,2068 R2=0,9969 se (0,0092) (1,1083) t (95,985) (11,1404) p (0,0000) (0,0000)

Pentru a vedea dac exist heteroscedasticitate, ne vom uita pe graficul alturat, care prezint consumul n funcie de venit. Dup cum se poate observa, valorile nu se abat aproape deloc de la dreapta regresiei, ceea ce nseamn c nu exist heteroscedasticitate la acest model.

Homoscedasticitatea modelului mai poate fi remarcat i din faptul c rezidurile(aproximaii ale variabilelor de perturbaie) sunt distribuite uniform, dup cum se poate vedea n Figura 3.

Prlitu Anamaria Raluca, grupa 1036, Seria A

16 dec 2013

Pentru a ne asigura de existena homoscedasticitii vom aplica n continuare Testul White. Testul solicit ca dup determinarea rezidurilor din ecuaia de regresie original, s se calculeze o regresie auxiliar, a ptratelor rezidurilor n raport cu o constant, variabilelel explicative ale modelului original, ptratele lor i produsele lor ncruciate.

ei2 = 0+1Xi+2Xi2+ i
n urma determinrii ecuaiei de regresie auxiliar vom putea calcula coeficientul de determinaie multipl(W), care are urmtoarea formul: W=n*R2 2. Vom avea urmtoarele 2 ipoteze: H0 : 1= 2=0 (Nu exist heteroscedasticitate) H1 : () i 0, i =1,2 (Exist heteroscedasticitate) Conform rezultatelor obinute, Wcalculat=1,5237, 2 iar 42,56. Deoarece Wcalculat< ;1 , vom accepta H0 i vom respinge H1, deci nu avem heteroscedasticitate. O alt modalitate de a verifica existena heteroscedasticitii este cu ajutorul probabilitii statisticii W. La noi, aceasta are valoarea 0,466, care este mai mare dect 0,05; De aceea, modelul nostru prezint homoscedasticitate.
2 ;1 =

Pentru a verifica autocorelarea erorilor aleatoare vom aplica testul Durbin-Watson, care verific dac exist autocorelare de ordinul I n seria rezidurilor. Acest test se bazeaz pe urmtoarele ipoteze: 1) Modelul de regresie trebuie s conin termen liber. 2) Marticea X, a variabilelor independente, s nu fie stochastic. 3) Valoarea perturbaiei la timpul t depinde de valoarea sa n perioada (t-1), i un termen pur aleator u. Intensitatea dependenei de valoarea trecut este msurat prin coeficientul de corelaie . Erorile fiind generate printr-un proces autoregresiv de ordinul nti. 4) Erorile aleatoare sunt normal distribuite. 5) Modelul de regresie nu conine, ca variabil exogen, variabila endogen cu decalaj. Statistica DW nu urmeaz o distribuie clasic. Valorile sale critice sunt tabelate. Pentru un nivel de semnificaie dat, tabelul conine dou valori critice: limita inferioar d1 si limita superioar d2 (notate si dL si dU ). Vom avea urmtoarele 2 ipoteze: H0 : = 0 (Nu exist autocorelarea erorilor aleatoare). H1 : 0 (Exist autocorelarea erorilor aleatoare). n cazul ecuaiei noastre, valoarea statisticii DW este DW=0,904699. Avem un nivel de semnificaie =0,05, n=30 i k=1 => vom avea urmtoarele 2 limite d1=1,35 i d2=1,49. Comparm valorea calculat cu valorile critice din tabele i avem urmtorul caz 0<=DW<=d1, ceea ce nseamn c seria rezidurilor prezint autocorelare de ordinul I pozitiv. Vom accepta ipoteza H1, exist autocorelare. Deoarece erorile nu sunt independente, ele nu urmeaz o distribuie normal.

Prlitu Anamaria Raluca, grupa 1036, Seria A

16 dec 2013

f)

Previzionai valoarea variabilei dependente Y dac variabila X crete cu 10% fa de ultima valoare nregistrat. Ultima valoare nregistrat a venitului este 12,00830, deci noi vom calcula valoarea consumului pentru un

venit n valoare de 13,20913. Y=1,206865 + 0,889175*13,20913=12,95209

3. S se specifice modelul econometric multifactorial; s se estimeze parametrii modelului i s se interpreteze valorile obinute. Verificai existena multicoliniaritii variabilelor explicative.
Pentru modelul de regresie multifactorial am luat n vedere urmtoarele variabile: - Y variabila dependent, reprezentat de consum - X1 variabila independent, reprezentat de venit - X2 variabila independent, reprezentat de pre Ecuaia de regresie va avea urmtoarea form: Y = 0 + 1* X1 + 2 * X2 + i Pentru cel de-al doilea model de regresie dorim s aflm legtura dintre valoarea consumului i cea a venitului, respectiv a indicelui preului. De aceast dat vom avea tot o singur variabil dependent, consumul, ns ne vom folosi de dou variabile independente, adic venitul i preul, estimndu-se astfel o funcie de regresie multipl. Avem urmtoarele rezultate:

Prlitu Anamaria Raluca, grupa 1036, Seria A

16 dec 2013

2 2 Dup cum se observ din tabel i de aceast dat avem o regresie bun, deoarece valorile lui R i R sunt

foarte apropiate de 1( R = 0,99699 i R = 0,99670). De asemenea, dependena dintre consum si celelalte dou variabile rmne n continuare una puternic, raportul de corelaie(Multiple R) avnd valoarea 0,998497. Cei doi factori inclui n model sunt determinani, avnd un grad de determinare a variaiei consumului n valoare de 99,69%. Mai departe, vom aplica testul F pentru a vedea dac modelul este valid sau nu, aceste informaii fiind extrase din tabelul ANOVA. Fcalc=4483,671; Cum Fcalc este cu mult mai mare dect Fcritic , vom accepta faptul Fcritic=F;k;n-2= F0,05;2;28=3,34; c modelul ales ajusteaz bine datele din eantion, deci respingem ipoteza nul i acceptm H1. Ecuaia noastr de regresie unifactorial va fi: Y = 1,3357 + 0,8784* X1 + 0,0037* X2 Modelul nostru de funcie va avea un termen liber 0 cu o valoare de 1,3357, mrime ce indic valoarea consumului n condiiile n care celelalte dou variabile sunt egale 0. Acest coeficient este semnificativ, avnd ca rezultat al testului t o valoare de 4,78 , iar cea a lui P-value una extrem de mic. Intervalul de ncredere n care se situeaz acest parametru este ntre 0,76 si 1,90. Valoarea coeficientului variabilei venit(1) este egal cu 0,878, iar cea a coeficientului pentru indicele preului(2) este 0,0037. La acest model ns,pentru un nivel de ncredere tot de 95%, cel de-al doilea coeficient nu mai este unul semnificativ, deoarece are valoarea lui P-value egal cu 0,619, aceasta fiind mai mare de 0,05. n interpretare economic, putem spune c atunci cnd venitul crete cu o unitate consumul crete n medie cu 0,87 , iar cnd indicele preului crete cu o unitate, consumul crete n medie cu 0,003, informaie din care putem deduce faptul c variabila dependent nu este att de mult determinat de valoarea indicelui preului.

Se observ c ntre variabilele X1 i X2 exist o legtur direct aproape perfect, deoarece rx1,x2=0,9155, deci cele 2 variabile sunt aproape perfect corelate. Vom regresa X 2 n funcie de X1 i obinem rezultatele:
2i=2,8664*x1i-34,4621 se (0,2380) (2,7837) t (12,0413) (-12,3798) p (0,0000) (0,0000) R2=0,838162

Aceast regresie arat c exist coliniaritate aproape perfect ntre X1 i X2.

Prlitu Anamaria Raluca, grupa 1036, Seria A

16 dec 2013

Pentru verificarea dependenelor liniare dintre 2 variabile exogene vom folosi criteriul lui Klein. Vom verifica dac Ry2 < r2x1,x2. Avem Ry2=0,996998, rx1,x2=0,9155, deci r2x1,x2=0,8381.

Pentru acest model nu exist dependen ntre variabilele exogene. n continuare vom calcula factorul de inflaie a varianei pentru X2. Avem urmtoarea valoare:
VIFX2=6,17903, ceea ce nseamn c variabila X2 nu induce multicoliniaritate sever.