Documente Academic
Documente Profesional
Documente Cultură
Aplicație +Ghid proiecte analiză econometrie - Conf. univ. dr. Din Marilena Aura
Econometrie
Aplicație + ghid empirical paper
În cele ce urmează vă prezint un ghid pentru proiectele la econometrie (Empirical Paper).
De remarcat că munca voastră trebuie să se finalizeze cu două livrabile:
1. Lucrarea – redactată în Word, după planulși standard ele de expunere, redactare
și comunicare indicate mai jos, salvată cu numele Variabila Y vs variabila X.
2. Fișierul de lucru (Workfile Excel sau Eviews)
Atenție:
Nu se așteaptă nimeni la rezultate de cercetare științifică, ci la o abordare la nivelul
cunoștințelor predate la curs.
Data limită de transmitere a proiectelor: decembrie 2013 (se transmit la și de pe adresele
de e-mail ale universită ții ... @profesor.rau.ro. , precizați nume și prenume pentru
identificare; subiectul e-mailului va conține de asemenea nume, prenume, spec ializarea și
grupa).
Plan lucrare
Tema proiectului:
Exemplu “Analiza relației de legătură dintre veniturile realizate de o firmă şi taxele
plătite de către aceasta”
Autor: nume şi prenume, specializare, grupa
1
UNIVERSITATEA ROMÂNO-AMERICANĂ 2013-2014
Aplicație +Ghid proiecte analiză econometrie - Conf. univ. dr. Din Marilena Aura
I. INTRODUCERE
I.1 Scopul studiului
De exemplu: Este cunoscut faptul că printre obiectivele unui manager se află
probleme legate de optimizarea planificării resurselor financiare. Managerul este
interesat să estimeze nivelul taxelor care se vor plăti dacă veniturile realizate de
firmă vor atinge o anumită valoare.
Lucrarea de față fundamentează un studiu empiric privind legătura dintre variabilele
venit și taxe, la nivelul înregistrărilor realizate de o firmă pe perioada anterioară de
20 de ani, cu scopul de a identifica, specifica și valida un model econometric pe baza
căruia managerul să poată predicționa nivelul taxelor de plătit.
I.2 Formularea întrebării de cercetare
De exemplu: Analiza econometrică din lucrarea de ță fa își propune să răspundă pe
baza analizei datelor empirice la întrebarea aflată sub cercetare „Care este influenţa
pe care o au veniturile realizate de firmă asupra nivelului taxelor de plată?”.
I.3 Formularea obiectivelor
De exemplu: Prin acest studiu econometric s-a urmărit:
1) determinarea relațiilor de legătură între variabila „taxe” ca variabilă dependentă și
variabila „venit” ca variabilă independentă/explicativă.
2) construirea unui model econometric liniar pentru a analiza în ce măsură acesta
poate răspunde la întrebarea de cercetare formulată.
3) validarea rezultatelor prin teste specifice pentru a vedea în ce măsură rapoartele
de tip „Output” răspund la întrebarea de cercetare formulată.
4) predicția variabilei dependente „taxe” în funcţie de variabila „venit” ca variabilă
independentă/explicativă.
5) explicarea efectului pe care îl are variabila independentă (explicativă) aleasă,
„venit”, asupra variabilei dependente (rezultative) studiate, respectiv „taxe”.
I.4 Rezultate așteptate
De exemplu: Ne așteptăm ca din concluziile desprinse pe baza analizei econometrice
a modelului specificat să se confirme ipoteza conform căreia nivelul taxelor de plătit
este explicat de o relație de legătură directă între acesta și variabila „venit” realizat.
I.5 Explicaţii despre organizarea lucrării
Câte secțiuni și ce se tratează în fiecare, foarte pe scurt.
2
UNIVERSITATEA ROMÂNO-AMERICANĂ 2013-2014
Aplicație +Ghid proiecte analiză econometrie - Conf. univ. dr. Din Marilena Aura
1
Recenzia nu va depăşi o pagină.
2
Se va folosi stilul Chicago2 ca format standard de referinţe bibliografice; pentru citări se va folosi notaţia
nume [an]; De exemplu, „în lucrarea sa, asupra cursului valutar, Popescu [2006] susţine că …” Citarea
întreagă, cu titlul articolului, editură, etc. se va trece la referinţe bibliografice.
3
Sursele mass media nu sunt potrivite cu misiunea acestui proiect.
3
UNIVERSITATEA ROMÂNO-AMERICANĂ 2013-2014
Aplicație +Ghid proiecte analiză econometrie - Conf. univ. dr. Din Marilena Aura
4
UNIVERSITATEA ROMÂNO-AMERICANĂ 2013-2014
Aplicație +Ghid proiecte analiză econometrie - Conf. univ. dr. Din Marilena Aura
Atenție: pentru date de tip cross section, datele colectate corespund aceluia și moment de
timp, iar pentru datele de tip serii de timp, datele sunt istorice, observate la diferite
intervale de timp/frecven ța lunar, trimestrial, anual, etc. Diferența esențială între cross
section și serii de timp este că datele de tip serii de timp au ordonare fixă în timp și sunt
indexate în ordinea derulării timpului.
III.5 Surse de date 1
Se descrie modul în care au fost selectate valorile observate din colectivitatea generală,
respectiv baze de date sau observate din sondaje asupra populaţiei cercetate.
1
Exemple de surse de date: EUROSTAT http://epp.eurostat.ec.europa.eu/
http://epp.eurostat.ec.europa.eu/portal/page/portal/statistics/themes
OECD http://www.oecd.org ; http://stats.oecd.org/
Banca Mondială http://www.worldbank.org
Fondul Monetar Internaţional http://www.imf.org
BNR http://www.bnr.ro/Baza-de-date-interactiva-604.aspx
Institutul Naţional de Statistică www.insse.ro
Institutul de Economie Naţională www.ien.ro
UNdata http://data.un.org /
Free Economic, Demographic & Financial Data http://www.economy.com/freelunch/default.asp
2
Vezi imaginea de la anexa 1 la acest ghid.
3
Unele teorii sunt bine fundamentate economic, cum ar fi funcţia câstig pentru care se utilizează forme
functionale semilogaritmice.
5
UNIVERSITATEA ROMÂNO-AMERICANĂ 2013-2014
Aplicație +Ghid proiecte analiză econometrie - Conf. univ. dr. Din Marilena Aura
Teoria economică este principalul ghid în orientarea alegerii variabilelor care sunt
relevante pentru întrebarea formulată 1. Teoria poate ajuta şi la verificarea autocorelării
sau heteroscedasticităţii ca parte a procesului de generare a datelor.
La definirea modelului şi identificarea sa, se va explica apariţia termenului rezidual prin
existența unor presupuse variabile neobservate în această etapă.Totodată aici se poate
încerca propunerea unui alt factor de influenţă, verificând mai multe variante de alegere.
200
160
120
Y
80
40
0
10 20 30 40 50 60 70 80
1
Pura intuiţie sau bunul simţ nu sunt motive suficiente pentru includerea sau excluderea variabilelor în
model
2
Datele și analiza vor fi disponibile într-un fişier Excel sau Eviews denumit identic cu wordul, pentru a
putea fi verificate.
3
Seriile de Date se găsesc în fi șierul Excel atașat, cu aceeași denumire.
6
UNIVERSITATEA ROMÂNO-AMERICANĂ 2013-2014
Aplicație +Ghid proiecte analiză econometrie - Conf. univ. dr. Din Marilena Aura
Din grafic se poate observa că distribuţia punctelor (xi, yi) poate fi aproximată cu o
dreaptă, deci se poate presupune că modelul econometric care descrie legătura dintre cele
două variabile este un model liniar: y =E (Y | X ) =α + β x + ε , unde α , β – parametrii
modelului. Se observă că β > 0 (slope/panta dreptei) ceea ce confirmă ipoteza din teoria
economică asupra unei legături directe între cele două variabile: creșterea veniturilor
atrage creșterea taxelor de plătit.
Pentru estimarea parametrilor modelului de regresie utilizăm metoda celor mai mici
pătrate.
Modelul de regresie este: yi =α + β xi + ε i , i =
1, 20 iar ecuaţia de regresie estimată este:
yˆ = aˆ + bx
i
ˆ
i
Metoda celor mai mici pătrate presupune minimizarea erorilor prin minimizarea sumei
pătratelor reziduurilor:
20 ⋅ aˆ + 733,1⋅ bˆ =
( )
1557,5
min ∑ ( yi − yˆ i ) ⇔ min ∑ yi − aˆ − bx
20 20 2
ˆ ⇔
2
i
733,1 ⋅ aˆ + 31991,53 ⋅ bˆ =
=i 1 =i 1
68864
Atunci avem că:
n ∑ yi 20 1557,5
∑ xi ∑ xi yi 733,1 68864
= 2, 2997 , aˆ =y − b ⋅ x =−6, 4201
=bˆ =
ˆ
n ∑ xi 20 733,1
∑ xi ∑ xi
2
733,1 31991,53
aˆ = −6, 4201
Deci ˆ iar ecuaţia de regresie este: yˆ =
−6, 4201 + 2, 2997 x
b = 2, 2997
Interpretare: Panta dreptei (slope), respectiv coeficientul de regresie estimat punctual
b̂ =2,2997 sugerează că la fiecare 1000 euro înregistraţi ca venit pe an, taxele cresc în
medie cu 2,2997 euro.
Observație: Punctul de intercep ț ie (interception) â = - 6,4201 este punctul în care
dreapta de regresie intersecteaza axa Oy, acest lucru însemnand că atunci cand x = 0 (nu
există venit), taxa este de -6,4201 euro. Deoarece eșantionul nostru nu include ani cu 0
euro venit înregistrat, nu avem nici o bază pentru a-l interpreta pe â . Ca regulă generală,
nu putem determina valoarea lui ŷ pentru o valoare x care are o valoare mult prea
diferită de valorile din eș antion corespunzatoare lui x (intervalul în care ia valori seria de
date pentru x nu conține pe zero).
În partea superioară a tabelului 1, se pot verifica estimările punctuale pentru coeficienții
regresiei (în coloana coefficient, C este pentru estimatorul punctual intercept, iar X este
pentru estimatorul coeficientului de regresie, slope).
7
UNIVERSITATEA ROMÂNO-AMERICANĂ 2013-2014
Aplicație +Ghid proiecte analiză econometrie - Conf. univ. dr. Din Marilena Aura
Included observations: 20
Variable Coefficient Std. Error t-Statistic Prob.
C -6.420142 9.353375 -0.686398 0.5012
X 2.299690 0.233865 9.833395 0.0000
R-squared 0.843063 Mean dependent var 77.87500
Adjusted R-squared 0.834344 S.D. dependent var 41.11373
S.E. of regression 16.73363 Akaike info criterion 8.567358
Sum squared resid 5040.259 Schwarz criterion 8.666931
Log likelihood -83.67358 F-statistic 96.69566
Durbin-Watson stat 1.489529 Prob(F-statistic) 0.000000
Analog, parametrul b̂ estimat pe baza selecției este o variabilă aleatoare care urmează o
repartiţie normală cu media egală cu parametrul corespunzător pentru populația statistică,
n
∑ ( yi − yˆi )
2
i =1
∑ ( yi − yˆi )
2
8
UNIVERSITATEA ROMÂNO-AMERICANĂ 2013-2014
Aplicație +Ghid proiecte analiză econometrie - Conf. univ. dr. Din Marilena Aura
9
UNIVERSITATEA ROMÂNO-AMERICANĂ 2013-2014
Aplicație +Ghid proiecte analiză econometrie - Conf. univ. dr. Din Marilena Aura
1 Jarque-Bera 0.369928
Probability 0.831134
0
-30 -20 -10 0 10 20 30 40
i =1
0, 21 − 0
o coadă mai „voluminoasă” la dreapta). Statistica testului τS = =0,383 <
6
20
zα /2 =1,645 pentru un test bilateral, de unde rezultă că ipoteza nulă H0 : S=0 este
acceptată la un prag de semnificație de 10% și deci distribuția variabiei aleatoare eroare
este simetrică.
K - coeficientul de aplatizare (kurtosis) măsoară boltirea distributiei, cât de aplatizată sau
ascuţită este distribţia faţă de distribuţia normală.
10
UNIVERSITATEA ROMÂNO-AMERICANĂ 2013-2014
Aplicație +Ghid proiecte analiză econometrie - Conf. univ. dr. Din Marilena Aura
E ( X − m) 4
24
Momentul teoretic este K = ~ N 3, , unde m = E ( X ) iar în
( )
2
σ 2
( X ) n
n
∑ ( ei − e )
4
n
i =1
eșantionul pentru reziduuri K= 2
ției
=2,48 < 3 (curba distribu
n
∑ ( ei − e ) n
2
i =1
0, 48 − 3
reziduurilor este platikurtică). Statistica testului τK = = -0,47 și cum
24
20
τK <1,645 pentru un test bilateral, rezultă că ipoteza nulă H0 : K = 3 este acceptată la un
prag de semnificatie de 10% ceea ce înseamnă că aplatizarea curbei de distribu ție a
erorilor coincide cu cea pentru distribuț ia normală.
Cumulat, cele două teste pentru verificarea simetriei și apla tizării conduc la acceptarea
ipotezei de normalitate a erorilor.
În locul celor două teste anterioare pentru verificarea ipotezei de normalitate a erorilor se
poate folosi un singur test, numit Jarque-Bera.
Statistica Jarque-Bera (JB) este dată de suma pătratelor statisticilor anterioare, care
devine o variabilă distribuită după legea hi-pătrat: JB= τ S2 + τ K2 χα2 ,2
n n
2 2
( K − 3) = n S 2 + ( K − 3) = 0,369928
1 1
JB= S +
2
6 24 6 24
Cele două ipoteze ale testului JB:
H0: ε ~ N (0,1) (JB = 0 i.e. S = 0 şi K = 3)
H1: ε nu urmeaza o repartitie N (0,1) ( JB ≠ 0)
Regula de decizie:
• Daca JBcalculat > χα2 ;2 atunci ipoteza nulă H0 de normalitate este respinsă la un prag
de semnificaţie de ( α ⋅ 100 )%.
• Daca p-value < α , atunci respingem ipoteza nula H0 de normalitate a rezidurilor
la un prag de semnificaţie de ( α ⋅ 100 )%.
Cum statistica test Jarque-Bera = 0,369928 < χ 0,1;2 2
=4,605 pentru testul unilateral
dreapta iar p-value = 0,831134 > 0,6, atunci ipoteza nulă H0 de normalitate a erorilor este
acceptată la un prag de semnificaţie de 10%.
Depistarea heteroscedasticităţii (dispersia lui ε nu este aceeaşi pentru toate valorile lui x)
se poate face prin procedeul grafic, adică se construieşte corelograma ce conţine valorile
variabilei independente x pe axa OX şi ale variabilei reziduale ε pe axa OY. Dacă
valorile celor două variabile cresc(scad) concomitent, atunci cele două variabile sunt
corelate şi deci nu sunt independente.
11
UNIVERSITATEA ROMÂNO-AMERICANĂ 2013-2014
Aplicație +Ghid proiecte analiză econometrie - Conf. univ. dr. Din Marilena Aura
40
30
20
10
RESID
0
-10
-20
-30
10 20 30 40 50 60 70 80
30
20
10
RESID
-10
-20
-30
0 40 80 120 160 200 240
Pe graficul din imagie se observă că distribuţia erorilor este oscilantă, deci putem accepta
ipoteza că erorile sunt independente, adică nu sunt autocorelate (seria reziduurilor nu
traverseaza axa timpului de prea multe ori sau de prea puţine ori).
Testul Durbin – Watson se foloseşte pentru a testa autocorelarea de prim ordin, adică se
ε t ρε t −1 + vt ,
testează doar dacă există o legătură dintre o eroare şi cea de dinaintea sa:=
unde vt ~ N (0, σ v2 )
Pentru testarea ipotezei de necorelare a erorilor cu ajutorul testului Durbin-Watson:
12
UNIVERSITATEA ROMÂNO-AMERICANĂ 2013-2014
Aplicație +Ghid proiecte analiză econometrie - Conf. univ. dr. Din Marilena Aura
i =1 27076,18
unde =2
=
sx MSE = = 27076,18 .
k 1
20
∑ ( yi − yˆi )
2
5040.25
= = i =1
sε2 MSR = = 280.014
n − k −1 18
• se compară Fcalculat cu Fα; k; n-k-1 = F0,1; 1; 18 = 8,28 şi cum Fcalc = 96,69 > F0,1;1;18 și
pvalue (significance F)< α (tabel 1 și tabel 3) ⇒ se respinge ipoteza nulă şi se
acceptă alternativa, deci modelul este valid.
13
UNIVERSITATEA ROMÂNO-AMERICANĂ 2013-2014
Aplicație +Ghid proiecte analiză econometrie - Conf. univ. dr. Din Marilena Aura
1. Coeficientul de corelaţie:
n ∑ xi yi − ∑ xi ⋅ ∑ yi
=r = i i i
0,918
( )
n x2 − x n y 2 − y
( )
2 2
∑i i ∑ i ∑ i
i
i
∑ i
i
Deoarece r = 0,918 → 1, apreciem că între cele două variabile există o legătură liniară,
directă, foarte puternică.
Testarea semnificaţiei coeficientului de corelaţie pentru colectivitatea generală:
• se stabilesc ipoteza nulă H0: ρ = 0 (ρ nu este semnificativ statistic)și ipoteza
alternativă H1: ρ ≠ 0 (ρ este semnificativ statistic), unde ρ - coeficientul de
corelaţie la nivelul colectivităţii generale
r n − 2 0,918 ⋅ 18
• se calculează statistica test t:=tcalculat = = 9,82
1− r2 1 − 0,9182
• se compară t calc cu t α;n −2 = t 0,1; 18 = 2,878 . Deoarece tcalculat > t0,1;18 ⇒ respingem
ipoteza nulă şi acceptăm alternativa, deci coeficientul de corelaţie este
semnificativ statistic.
2. Raportul de corelaţie R:
∑ (y i − ŷ i )2
5040,26
R = 1 − i =1 = 1− = 0,918
∑ (y i − y )
2 32116,44
i =1
Deoarece R = r, apreciem că între cele două variabile există o legătură liniară.
Coeficientul de determinare (a calităţii ajustării) R-squared (R2) este un indicator relativ
pentru măsurarea intensității legăturii dintre variabile şi deci cu cât punctele vor fi mai
apropiate de linia de regresie estimată cu atât va fi mai bună “potrivirea” (goodness of fit).
Cum coeficientul de determinare este R 2 = 0,84 , rezultă că intensitatea legăturii este mare,
respectiv că că 84,3% din variaţia taxelor este explicată de variaţia veniturilor înregistrate.
Testarea semnificaţiei raportului de corelaţie:
• se stabilesc ipoteza nulă H0: R nu este semnificativ statisticși ipoteza alternativă
H1: R este semnificativ statistic;
• se calculează statistica test F:
n − k −1 R2 18 0,9182
Fcalculat = ⋅ =⋅ = 94,5
k 1 − R 2 1 1 − 0,9182
14
UNIVERSITATEA ROMÂNO-AMERICANĂ 2013-2014
Aplicație +Ghid proiecte analiză econometrie - Conf. univ. dr. Din Marilena Aura
• se compară Fcalc cu . Deoarece Fcalc > F0,1; 1; 18 = 8,28 ⇒ se respinge ipoteza nulă
şi se acceptă alternativa, deci raportul de corelaţie este semnificativ statistic.
Tabel 4 Tabelul Regression Statistics din Summary output generat de Excel
Regression Statistics
Multiple R 0.9181846
R Square 0.8430629
Adjusted R Square 0.8343442
Standard Error 16.733631
Observations 20
1
Eviews, Excel sau Minitab sunt unelte de lucru recomandate în acest proiect, unde facilităţile grafice şi de
calcul sunt relativ uşor de accesat. Calculele efectuate cu Eviews sau Excel vor fi disponibile într-un fişier
atașat pentru a putea fi urmărite și verificate. Pentru utilizarea software-ului Eviews, dacă se aplează
butonul Help din meniu, un ghid de utilizare Eviews este disponibil în format pdf.
15
UNIVERSITATEA ROMÂNO-AMERICANĂ 2013-2014
Aplicație +Ghid proiecte analiză econometrie - Conf. univ. dr. Din Marilena Aura
Pentru un model valid, se va încerca adăugarea unui nou factor explicativ pentru a vedea
în ce măsură se îmbunătăţeşte similitudinea modelului prin trecere la un model
multifactorial.
V. CONCLUZII
Exemplu de scriere
GREENWOOD, M. J. (1997): “Internal Migration in Developed Countries,” in Handbook of
Population and Family Economics, Vol. 1B, ed. by M. R. Rosenzweig and O. Stark. North
Holland.
KENNAN,J.,AND J. R. WALKER (2010): “Wages, Welfare Benefits and Migration,” Journal of
Econometrics, 156, 229–238.
ANEXE
Aici puteți pune calculele mai detaliate care conțin formule, sau tabelele (numerotate,
pentru a putea face trimitere la ele)
16
UNIVERSITATEA ROMÂNO-AMERICANĂ 2013-2014
Aplicație +Ghid proiecte analiză econometrie - Conf. univ. dr. Din Marilena Aura
Anexa 1
17