Sunteți pe pagina 1din 6

UNIVERSITATEA BABE-BOLYAI FACULTATEA DE TIINE ECONOMICE I GESTIUNEA AFACERILOR CLUJ-NAPOCA

Proiect Bazele Econometriei

Coordonator proiect:

Student: Secia: Statistic i previziune economic Anul III

Am luat in considerare variabilele:

Populaia la 1 Ianuarie n funcie de vrst , sex(Population on 1 January by age and sex;) Numrul de vehicule (Stock of vehicles by category; All vehicles (except trailers and motorcycles), unit: 1000) Ca i an de referin am luat anul 2001.

Am analizat rile: Belgia, Bulgaria, Republica Ceh, Germania, Estonia, Irlanda, Grecia, Spania, Italia, Cipru, Lituania, Luxemburg, Ungaria, Malta, Polonia, Romnia, Slovenia, Slovacia, Finlanda, Turcia.

Cerine: 1. Generai i interpretai valorile descriptive pentru cele 2 variabile. 2. Interpretai corelaie dintre cele 2 variabile. 3. n ipoteza existenei unei corelaii, estimai un model liniar de regresie prin precizarea variabilei dependente i variabilei independente. 4. Testai nulitatea parametrului variabilei independente. 5. Testai intervalul de ncredere de 95% pentru parametrul variabilei independente 6. Interpretai valoarea lui R2 7. Generai seria variabilei dependente previzionate i listai aceast serie. 8. Verificai liniaritatea modelului. 9. Verificai normalitatea reziduurilor. 10. Dac modelul este heteroscedastic, corelati-l.

Rezolvare: 1. Pentru a genera valorile descriptive ale variabilelor am folosit comanda Summarize. Deasemenea puteam efectua aceast operaiune din Statistics-Summaries, tables, &tests-Summary statistics-Summary statistics, alegerea variabilelor de la MainVariables Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------Populatie | 20 1.97e+07 2.56e+07 414372 8.18e+07 Masini | 20 14418.9 27827.68 288 117732
Sursa: Operaii efectuate n programul STATA. Obs=numrul valorilor observate Mean=Media valorilor observate Std. Dev.=Abaterea standard Min=Valoare minim Max=Valoarea maxim

Interpretare:

Pentru variabila populaie: avem 20 valori observate. Media valorilor variabilei populaie este de 1,97*107(19.700.000) locuitori. Abaterea standard este 2,56*107( valorile observate se abat n media de la medie cu 2,56*107). Valoare minim observat este de 414372 locuitori, iar cea maxim este de 8,18*107 (81.700.000) locuitori. Pentru variabila maini: exist 20 valori observate. Media valorilor observate este de 14418,9 (aproximativ 14419 mii vehicule). Valorile observate se abat n medie de la medie cu 27827,68 (aproximativ 27828 mii vehicule). Cel mai mic numr vehicule de este 288 mii maini, iar cel mai mare este de 117732 mii vehicule.

2. Pentru a vizualiza corelaia dintre cele dou variabile folosim comanda correlate var1 var2. Se poate deasemenea s se redea corelaia dintre cele dou variabile din Statsitics-Summaries, tables, &tests-Summary Statistics-Correlations & covariances. | Populatie Masini -------------+-----------------Populatie | 1.0000 Masini | 0.5711 1.0000
Sursa: Operaii efectuate n programul STATA.

Observm c ntre variabilele analizate exist o corelaie de 0,5711. Astfel putem preciza c ntre variabila populaie i variabila maini exist o corelaie direct (avem valoare pozitiv) i de insensitate medie (0,5771 0,3;0,7 ).

3. Deoarece ntre variabilele analizate exist corelaie vom estima un model liniar de regresie. Astfel vom folosi comanda regres variabil dependent variabil independent. n cazul de fa variabila dependent este maini, iar cea independent populaie. Estimarea modelului liniar de regresie se poate face i prin urmarea pasilor Statistics-Summaries,tables, &tests-Linear models and related-Linear regression. -regres Masini Populatie Source | SS df MS -------------+-----------------------------Model | 4.7992e+09 1 4.7992e+09 Residual | 9.9140e+09 18 550779753 -------------+-----------------------------Total | 1.4713e+10 19 774380044 Number of obs = 20 F( 1, 18) = 8.71 Prob > F = 0.0085 R-squared = 0.3262 Adj R-squared = 0.2887 Root MSE = 23469

-----------------------------------------------------------------------------Masini | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+---------------------------------------------------------------Populatie | .0006204 .0002102 2.95 0.009 .0001788 .001062 _cons | 2188.877 6686.167 0.33 0.747 -11858.24 16235.99 -----------------------------------------------------------------------------Sursa: Operaii efectuate n programul STATA.

4. Ipoteza nul pentru testarea nulitii parametrului variabilei independente este c acesta este egal cu 0, deci nu este statistic semnificativ. Ipoteza alternativ este c parametrul variabilei independente este statistic semnificativ, deci este diferit de 0. Din analizarea tabelului rezult faptul c p(=0,009)<0,05 (pragul de ncredere fixat) de unde rezult respingerea ipotezei nule i acceptarea alternative. Deci coeficientul variabilei independente este semnificativ pentru modelul liniar de regresie estimat. 5. Parametrul variabilei independente Populaie se afl n intervalul [0,0001788; 0,001062] cu o probabilitate de 95%. Sau probabilitatea ca parametrul variabilei independente s se afle n afara intervalului [0,0001788; 0,001062] este de 5%.

6. Valoarea lui R2 =R squared este de 0,3262. Aceast evideniaz faptul c 32,62% din variana variabilei dependente Maini este explicat de variabila independent Populaie.

7. Pentru generarea seriei variabilei dependente previzionate- maini, vom folosi comanda predict variabil dependent previzionat. Astfel se genereaz o nou variabil cu numele ales de noi(masini). Pentru a vedea valorile variabilei nou generate vom folosi comanda list variabil dependent previzionat. Generarea seriei variabilei dependente se poate face i prin urmrirea pailor Statistics-Postestimation-Predictions, residuals etc.i bifarea opiunii Fitted values. Listarea seriei nou create se poate efectua i de la Data-Describe data-List data. predict masini (option xb assumed; fitted values) . list masini +----------+ | masini | |------------| 1. | 8914.198 | 2. | 6881.573 | 3. | 8707.54 | 4. | 52940.84 | 5. | 3020.322 |

|------------| 6. | 4960.834 | 7. | 9202.826 | 8. | 30721.5 | 9. | 39625.37 | 10. | 2697.09 | |-------------|

11. | 4254.288 | 12. | 2500.37 | 13. | 8401.989 | 14. | 2445.963 | 15. | 25868.75 | |------------|

16. | 15504.5 | 17. | 3458.867 | 18. | 5554.623 | 19. | 5509.023 | 20. | 47207.54 | +----------+

8. nainte de a efectua verificarea liniaritii trebuie s generm reziduurile modelului. Aceast operaie se efectueaz prin comanda predict R sau de la StatisticsPostestimation-Predictions, residuals etc.i bifarea opiunii Residuals. Verificarea liniaritii modelului se face prin comanda rvfplot sau urmrirea pailor: Statistics-Linear models and related-Regression diagnostics-Residual versus fitted plot. Astfel se observ un grafic ntre reziduuri-R- i valorile previzionate-maini-.
100000 Residuals 50000 -50000 0
0

10000

20000 30000 Fitted values

40000

50000

9. Verificarea liniaritii reziduurilor se face prin comanda kdensity R, normal. Astfel se realizeaz un grafic care red evoluia reziduurilor comparativ cu o distribuie normal a lor. Din analiza graficului se observ c reziduurile sunt normal distribuite.
.00004 .00001 Density .00002 .00003

20000 Fitted values

40000

60000

Kernel density estimate Normal density

10. n vederea testrii homoscedasticitii, respectiv a heteroscedasticitii. Formulm ipoteza nul cum c modelul este homoscedastic, deci are varian constant. Ipoteza alternativ este c modelul nu este homoscedastic, deci este heteroscedastic. Verificarea homoscedasticitii, respectiv a heteroscedasticitii se folosete comanda hettest. chi2(1) = 7.92

Prob > chi2 = 0.0049 Din datele rezultate n urma analizei putem spune c respingem ipoteza nul ntruct prob=0,0049<0,05(nivel de ncredere fixat). Astfel acceptm ipoteza alternativa H1 cum c modelul este heteroscedastic. 11. n urma analizei homoscedasticitii i a heteroscedasticitii am observant ca modelul este heterocedastic urmnd ca n continuare s l corelm.
Linear regression Number of obs = 20 F( 1, 18) = 8.42 Prob > F = 0.0095 R-squared = 0.3262 Root MSE = 23469

| Robust Masini | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------Populatie | .0006204 .0002138 2.90 0.010 .0001712 .0010697 _cons | 2188.877 2571.171 0.85 0.406 -3212.953 7590.708 ------------------------------------------------------------------------------

Comanda de regresie din cadrul programului STATA conine i opiunea robust. Cu ajutorul acesteia punctele estimate ale coeficieniilor sunt exact aceleai cu cele din cadrul unei regresii simple, dar erorile standard iau n considerare aspecte legate de heteroscedasticitate sau lipsa normalitii. Analiznd comparativ cele dou tabele de regresie simpl, respectiv cu opiunea robust vom observa c la nivelul erorilor standard i la testul t exist diferene n timp ce la nivelul coeficieniilor valorile rmn neschimbate. Std. Err pentru regresie simpl este 0,0002102, iar pentru regresia cu opiunea robust este 0,0002138. Valoarea testului t n cazul regresiei simple este 2,95, iar n cazul regresiei cu opiunea robust este de 2,95.
-----------------------------------------------------------------------------Masini | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------Populatie | .0006204 .0002102 2.95 0.009 .0001788 .001062 _cons | 2188.877 6686.167 0.33 0.747 -11858.24 16235.99