Explorați Cărți electronice
Categorii
Explorați Cărți audio
Categorii
Explorați Reviste
Categorii
Explorați Documente
Categorii
Aplicaie +Ghid proiecte analiz econometrie - Conf. univ. dr. Din Marilena Aura
Econometrie
Exemplu de aplicaie (pag. 7 15) + ghid empirical paper
n cele ce urmeaz v prezint un ghid pentru proiectele la econometrie (Empirical Paper).
De remarcat c munca voastr trebuie s se finalizeze cu dou livrabile:
1. Lucrarea redactat n Word, dup planuli standardele de expunere, redactare
i comunicare indicate mai jos, salvat cu numele Variabila Y vs variabila X.
2. Fiierul de lucru (Workfile Excel sau Eviews)
Atenie:
Nu se ateapt nimeni la rezultate de cercetare tiinific, ci la o abordare la nivel ul
cunotinelor predate la curs.
Data limit de transmitere a proiectelor: decembrie 2014 (se transmit la i de pe adresele
de e-mail ale universit
ii ... @profesor.rau.ro. , precizai nume i prenume pentru
identificare; subiectul e-mailului va conine de asemenea nume, prenume, specializarea i
grupa).
Plan lucrare
Tema proiectului:
Exemplu Analiza relaiei de legtur dintre veniturile realizate de o firm i taxele
pltite de ctre aceasta
Autor: nume i prenume, specializare, grupa
Rezumat: Pe cteva rnduri se va descrie contribuia studentului la dezvoltarea temei i
concluziile desprinse n urma elaborrii i validrii modelului econometric construit.
(rezumatul se completeaz ultimul, dup definitivarea analizei)
Exemplu Scopul lucrrii de fa este de a determina dac i n ce proporie veniturile
(mii euro) realizate de o firm pot fi considerate ca factor explicativ pentru taxele
pltite (mii euro) de ctre aceasta. Se tie c ecuaia regresiei nu va stabili n nici un
caz relaia de cauzalitate, ci numai modelul teoretic propus pentru a explica variaia
variabilei studiate, care, n cazul nostru este nivelul taxelor pltite.
Pentru aceasta se probeaz pe unantion
e
de 2 0 de ani ipoteza conform creia
veniturile medii anuale realizate de firm (exprimate n mii euro) influeneaz direct
nivelul mediu anual al taxelor pltile (exprimate n mii euro). Totodat, se dorete a
se previziona pentru o probabilitate de 95% nivelul taxelor care trebuie pltite dac
venitul total realizat de firm atinge valoarea de 40 mii euro.
(La Rezumat revenim dup ce am terminat lucrarea; la nceput nu tim exact la ce
eantion ne vom stabili, pentru cte variabile explicative, cte modele...)
I. INTRODUCERE
I.1 Scopul studiului
De exemplu: Este cunoscut faptul c printre obiectivele unui manager se afl
probleme legate de optimizarea planificrii resurselor financiare. Managerul este
interesat s estimeze nivelul taxelor care se vor plti dac veniturile realizate de
firm vor atinge o anumit valoare.
Lucrarea de fa fundamenteaz un studiu empiric privind legtura dintre variabilele
venit i taxe, la nivelul nregistrri lor realizate de o firm pe perioada anterioar de
20 de ani, cu scopul de a identifica, specifica i valida un model econometric pe baza
cruia managerul s poat prediciona nivelul taxelor de pltit.
ARGUMENTAIA ECONOMIC
(pentru a evidenia motivele alegerii acestui subiect/de ce ar putea interesa
studiul din lucrare)
De exemplu: Tema de
fa referitoare la
efectul veniturilor realizate asupra
impoziltelor i taxelor de plat ale unei firme este util pentru analiza economicofinanciar a firmei. n acest sens, pentru optimizarea planificrii bugetare a
Dac tema aleas este inspirat de articole recenzate, atunci se specific acest lucru
(citare corect a autorilori an ului) i se face trimitere prin note de subsol la sursa
articolului (link). De asemenea se trece la bibliografie 2 articolul recenzat.
Se pot prezenta texte sau articole care trateaz fie aceeai ntrebare, fie aceeai relaie de
dependen dintre variabile, sau chiar ali factori de influen asupra variabilei
dependente propus a fi studiat. Se va explica n acest fel intenia studentului de a
verifica concluziile obinute de el nsui prin comparaie cu rezultatelr recenzate.
Se va ntocmi un sumar cu ceea ce studentul a lecturat din alte resurse 3 n demersul su
de a documenta tiinific ntrebarea aleas. (Un tabel care ine
con trei coloane: Autori
[an]/Scopul cercetrii-tema studiat/Rezultate-concluzii obinute).
II.2 Analiza critic i valorificare
Se pot relata diferite teorii economice ntlnite (teoria consumatorului, teoria produciei,
alte teorii economice) dac se preteaz la tema aleas, teorii pe care studentul le poate
aplica n constuirea modelului su.
Prin urmare, se va urmri valorificarea lucrrilor lecturate n propriul proiect, printr-o
analiz critic, fr a utiliza pasaje de la al
i autori necitate corespunztor . Plagiatul este
interzis i pedepsit prin lege.
Dup o munc de documentare n prealabil, chiar dac tema aleas/ntrebarea de
cercetare este inspirat de articole recenzate, proiectul va fi realizat cu mijloace proprii,
datele proprii de observaie i interpretri proprii ale rezultatelor.
III.
METODOLOGIA CERCETRII
Atenie: pentru date de tip cross section, datele colectate corespund aceluia
i moment de
timp, iar pentru datele de tip serii de timp, datele sunt istorice, observate la diferite
intervale de timp/frecvena lunar, trimestrial, anual, etc. Diferena esenial ntre cross
section i serii de timp este c datele de tip serii de timp au ordonare fix n timp i sunt
indexate n ordinea derulrii timpului.
III.5 Surse de date 1
Se descrie modul n care au fost selectate valorile observate din colectivitatea general,
respectiv baze de date sau observate din sondaje asupra populaiei cercetate.
Recomandare: Pentru seriile de date necesare lucrrii la econometrie, avei dou
posibiliti, la aleger e:
i) selectarea seriilor de date dintr-o baz de date pentru care se indic sursa de (nume,
data i link). Sugerez pentru temele care se refer la date macro, utilizarea bazei de date a
Comisiei Europene EUROSTAT > Statistics > Statistics by theme
ii) generarea seriilor de date care s corespund unei legturi de dependen
de tip liniar
y=a+bx+u utiliznd instrumentul de analiz Generator de numere aleatoare (Random
Number Generation) din Data Analysis, astfel 2: Pentru setul de date corespunztoare
variabilei y se genereaz valorile variabilei aleatoare u (numere independente aleatoare
derivate din distribuia normal i normat, de medie zero i abatere medie ptratic 1).
Acestea se adun cu valorile calculate pentru partea determinist a modelului, pe baza
relaiei de dependen de tip liniar dorit a+bx, unde valorile variabilei x se aleg n
prealabil.
III.6 Prezentarea teoretic a analizei propuse
(Se va prezenta pe scurt modelul identificat, specificat
i definit
funcionale 3)
- alegerea formei
Teoria economic este principalul ghid n orientarea alegerii variabilelor care sunt
relevante pentru ntrebarea formulat 1. Teoria poate ajuta i la verificarea autocorelrii
sau heteroscedasticitii ca parte a procesului de generare a datelor.
La definirea modelului i identificarea sa, se va explica apariia termenului rezidual prin
existena unor presupuse variabile neobservate n aceast etap.Totodat aici se poate
ncerca propunerea unui alt factor de influen, verificnd mai multe variante de alegere.
IV.
ANALIZA DATELOR
(Analiza pe baza datelor empirice 2 - este partea principal a lucrrii )
160
120
80
40
0
10
20
30
40
50
60
70
80
Pura intuiie sau bunul sim nu sunt motive suficiente pentru includerea sau excluderea variabilelor n
model
2
Datele i analiza vor fi disponibile ntr-un fiier Excel sau Eviews denumit identic cu wordul, pentru a
putea fi verificate.
3
Seriile de Date se gsesc n fi ierul Excel ataat, cu aceeai denumire.
1
Din grafic se poate observa c distribuia punctelor (xi, yi) poate fi aproximat cu o
dreapt, deci se poate presupune c modelul econometric care descrie legtura dintre cele
dou variabile este un model liniar: y =E (Y | X ) = + x + , unde , parametrii
modelului. Se observ c > 0 (slope/panta dreptei) ceea ce confirm ipoteza din teoria
economic asupra unei legturi directe ntre cele dou variabile: creterea veniturilor
atrage creterea taxelor de pltit.
IV.2.2 Estimarea parametrilor modelului
Pentru estimarea parametrilor modelului de regresie utilizm metoda celor mai mici
ptrate.
Modelul de regresie este: yi =
+ xi + i , i =
1, 20 iar ecuaia de regresie estimat este:
y = a + bx
i
Metoda celor mai mici ptrate presupune minimizarea erorilor prin minimizarea sumei
ptratelor reziduurilor:
20 a + 733,1 b =
2
20
20
1557,5
2
min ( yi y i ) min yi a bx
i
=i 1 =i 1
68864
733,1 a + 31991,53 b =
Atunci avem c:
yi
xi xi yi
=
n
xi
2
xi xi
n
=
b
Deci
20
1557,5
733,1 68864
a = 6, 4201
iar ecuaia de regresie este: y =
6, 4201 + 2, 2997 x
b = 2, 2997
t-Statistic
Prob.
C
X
-6.420142 9.353375
2.299690 0.233865
-0.686398
9.833395
0.5012
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.843063
0.834344
16.73363
5040.259
-83.67358
1.489529
77.87500
41.11373
8.567358
8.666931
96.69566
0.000000
i
cu
dispersia
egal
cu:
n
xi2
x2
,
2
21
2
i
=
1
=
sa =
se
se n
+
n n
( xi x )2 ( xi x )2
i 1=
i 1
=
Analog, parametrul b estimat pe baza seleciei este o variabil aleatoare care urmeaz o
repartiie normal cu media egal cu parametrul corespunztor pentru populaia statistic,
n
2
sb=
se2
1
n
( xi x )
unde se2 =
( yi yi )
i =1
este un
n2
i =1
( yi yi )
i
=
16,73 ,
n2
2
xi
sa =
s
2
( xi x )
2
=
sb
9,35 ;
=
s2
=
0, 23
20
2
xi x
i =1
,n 2
Deoarece tcalculat =0.68 < t0,05;18 =2,101 , iar probabilitatea p-value este 0.50 > 0,1 (mai
mare dect pragul de semnificaie ales) nseamn c acest coeficient este nesemnificativ
statistic, adic pentru un risc asumat de 10%, decidem c estimatorul a provine dintr-o
colectivitate cu = 0, deci nu este semnificativ diferit de zero.
Analog testm semnificaia parametrului :
se stabilesc ipoteza nul: H0: = 0 i ipoteza alternativ: H1: 0
b 2, 2997
se calculeaz statistica testului t: tcalculat
= =
= 9,83
sb
0, 23
se compar tcalculat cu t
,n 2
= t0,05;18 = 2,101
Deoarece tcalculat > t0,05;18 iar probabilitatea p-value este 1.16E-08<0,05 nseamn c
coeficientul de regresie este semnificativ statistic, adic pentru un risc asumat de 10%,
putem decide c estimatorul b provine dintr-o colectivitate cu parametrul
semnificativ diferit de zero.
Intervalul de ncredere pentru parametrul este:
b t
s b + t
s , adic
/2;n 2
/2;n 2
y 3s y < yi < y + 3s y
Unde mediile i dispersiile de selecie se calculeaz cu formulee cunoscute:
n
20
xi xi 733,1
=i 1 =i 1
655 ; sx
x = =
=
= 36,
=
20
20
n
20
yi
1557,5
1
; sy
=
y i ==
=
= 77,875
20
20
Atunci avem c:
( xi x )
i =1
=
n 1
2
( yi y )
i =1
=
n 1
5119, 74
= 16, 4152
19
32116, 44
= 41,11373
19
36, 655 3 16, 4152 < xi < 36, 655 + 3 16, 4152 12,5906 < xi < 85,900 (adevrat)
77,875 3 41,11373 < yi < 77,875 + 3 41,11373 45, 466 < yi < 201, 216 (adevrat)
9
7
6
Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis
5
4
3
2
1
Jarque-Bera
Probability
0
-30
-20
-10
10
20
30
-2.56E-14
0.975255
33.94338
-29.46963
16.28732
0.213892
2.489201
0.369928
0.831134
40
~ N 0, 6 , unde m = E ( X ) , iar n
Momentul teoretic este S =
3
n
( 2 ( X ) )
2
3
( ei e ) n
=0,21 (curba distribuiei rezidurilor are
eantionul pentru reziduuri S = i =1
3
n
2
( ei e ) n
i =1
0, 21 0
o coad mai voluminoas la dreapta). Statistica testului
=0,383 <
S =
6
20
z /2 =1,645 pentru un test bilateral, de unde rezult c ipoteza nul H0 : S=0 este
acceptat la un prag de semnificaie de 10% i deci distribuia variabiei aleatoare eroare
este simetric.
K - coeficientul de aplatizare (kurtosis) msoar boltirea distributiei, ct de aplatizat sau
ascuit este distribia fa de distribuia normal.
10
E ( X m) 4
24
(
)
(
)
n
K=
( ei e )
i =1
2
( ei e ) n
i =1
0, 48 3
= -0,47 i cum
24
20
<1,645 pentru un test bilateral, rezult c ipoteza nul H0 : K = 3 este acceptat la un
K =
K
prag de semnificatie de 10% ceea ce nseamn c aplatizarea curbei de distribu
ie a
erorilor coincide cu cea pentru distribu ia normal.
Cumulat, cele dou teste pentru verificarea simetriei
i aplatiz rii conduc la acceptarea
ipotezei de normalitate a erorilor.
n locul celor dou teste anterioare pentru verificarea ipotezei de normalitate a erorilor se
poate folosi un singur test, numit Jarque-Bera.
Statistica Jarque-Bera (JB) este dat de suma ptratelor statisticilor anterioare, care
devine o variabil distribuit dup legea hi-ptrat: JB
= S2 + K2 2 ,2
n n
2
1
1
JB=
S +
( K 3) = n S 2 + ( K 3) = 0,369928
24
6
6 24
11
RESID
20
10
0
-10
-20
-30
10
20
30
60
50
40
70
80
RESID
20
10
0
-10
-20
-30
0
40
80
120
160
200
240
Pe graficul din imagie se observ c distribuia erorilor este oscilant, deci putem accepta
ipoteza c erorile sunt independente, adic nu sunt autocorelate (seria reziduurilor nu
traverseaza axa timpului de prea multe ori sau de prea puine ori).
Testul Durbin Watson se folosete pentru a testa autocorelarea de prim ordin, adic se
testeaz doar dac exist o legtur dintre o eroare i cea de dinaintea sa:=
t t 1 + vt ,
unde vt ~ N (0, v2 )
Pentru testarea ipotezei de necorelare a erorilor cu ajutorul testului Durbin-Watson:
12
dcalc = t >2
2
t
t 1
7508,87
= 1, 48
5040, 26
et et 1
709, 41
1
=
= 0,14
r1 t ==
n
2
5040, 26
et
t =1
unde
20
20
MSR
280, 01
( yi y )
27076,18
2
i =1
sx MSE
=
=
=
= 27076,18 .
k
1
( yi yi )
5040.25
=
s2 MSR
= i =1
=
= 280.014
n k 1
18
se compar Fcalculat cu F; k;
n-k-1
13
n xi yi xi yi
i
i
i
0,918
=
2
2
n x2 x n y 2 y
i i
i
i i
i
i
i
( )
( )
Deoarece r = 0,918 1, apreciem c ntre cele dou variabile exist o legtur liniar,
direct, foarte puternic.
Testarea semnificaiei coeficientului de corelaie pentru colectivitatea general:
se stabilesc ipoteza nul H0: = 0 ( nu este semnificativ statistic)i ipoteza
alternativ H1: 0 ( este semnificativ statistic), unde - coeficientul de
corelaie la nivelul colectivitii generale
r n 2 0,918 18
se calculeaz statistica test t:=
tcalculat =
= 9,82
1 r2
1 0,9182
se compar t calc cu t ;n 2 = t 0,1; 18 = 2,878 . Deoarece tcalculat > t0,1;18 respingem
ipoteza nul i acceptm alternativa, deci coeficientul de corelaie este
semnificativ statistic.
2. Raportul de corelaie R:
(y i y i )2
R = 1 i =1
(y i y )
= 1
5040,26
= 0,918
32116,44
i =1
=
=
94,5
k
1 R 2 1 1 0,9182
14
se compar Fcalc cu . Deoarece Fcalc > F0,1; 1; 18 = 8,28 se respinge ipoteza nul
i se accept alternativa, deci raportul de corelaie este semnificativ statistic.
Tabel 4 Tabelul Regression Statistics din Summary output generat de Excel
Regression Statistics
Multiple R 0.9181846
R Square 0.8430629
Adjusted R Square 0.8343442
Standard Error 16.733631
Observations
20
unde
xn +1 x
1
s 1 + + n
n xi x
i =1
)
)
= 294,59
2
5119, 75
20
Deci intervalul de ncredere pentru taxele pltite pentru un venit de 40 mii euro este:
41, 77 (euro) yn +1 129,36 (euro) .
IV.3 Se scrie raportul de cercetare 1.
Calculele se verific rulnd unul din programele informatice specifice (Eviews/Excel).
Se prezint i se interpreteaz rezultatele (Summary Output) asistate de unul din
programele informatice.
Pentru Excel, accesai instrumentul de analizare a datelor Analysis ToolPak. Pentru
aceasta facei clic pe Analiz date (Data Analysis) din meniul Instrumente (Tools).
n cazul n care comanda Analiz date nu este disponibil, este necesar s ncrca
i
programul de completare Analysis ToolPak (Excel Options, Add-ins).
La sfritul prii de analiz empiric a datelor se vor desprinde concluzii, chiar dac
acestea nu coincid cu cele ateptate. De exemplu, s-ar putea gsi c nu exist nici o relaie
de dependen ntre variabilele presupuse a fi ntr-o relaie de dependen. Se va raporta
acest lucru care este destul de important pentru justificarea lurii n considerare a unui alt
factor de influen pentru variabila studiat.
Eviews, Excel sau Minitab sunt unelte de lucru recomandate n acest proiect, unde facilitile grafice i de
calcul sunt relativ uor de accesat. Calculele efectuate cu Eviews sau Excel vor fi disponibile ntr-un fiier
ataat pentru a putea fi urmrite i verificate. Pentru utilizarea software-ului Eviews, dac se apleaz
butonul Help din meniu, un ghid de utilizare Eviews este disponibil n format pdf.
15
Pentru un model valid, se va ncerca adugarea unui nou factor explicativ pentru a vedea
n ce msur se mbuntete similitudinea modelului prin trecere la un model
multifactorial.
V.
CONCLUZII
REFERINE BIBLIOGRAFICE
Exemplu de scriere
GREENWOOD, M. J. (1997): Internal Migration in Developed Countries, in Handbook of
Population and Family Economics, Vol. 1B, ed. by M. R. Rosenzweig and O. Stark. North
Holland.
KENNAN,J.,AND J. R. WALKER (2010): Wages, Welfare Benets and Migration, Journal of
Econometrics, 156, 229238.
ANEXE
Aici putei pune calculele mai detaliate care conin formule, sau tabelele (numerotate,
pentru a putea face trimitere la ele)
16
Anexa 1
17