Sunteți pe pagina 1din 17

UNIVERSITATEA ROMNO-AMERICAN 2014-2015

Aplicaie +Ghid proiecte analiz econometrie - Conf. univ. dr. Din Marilena Aura

Econometrie
Exemplu de aplicaie (pag. 7 15) + ghid empirical paper
n cele ce urmeaz v prezint un ghid pentru proiectele la econometrie (Empirical Paper).
De remarcat c munca voastr trebuie s se finalizeze cu dou livrabile:
1. Lucrarea redactat n Word, dup planuli standardele de expunere, redactare
i comunicare indicate mai jos, salvat cu numele Variabila Y vs variabila X.
2. Fiierul de lucru (Workfile Excel sau Eviews)
Atenie:
Nu se ateapt nimeni la rezultate de cercetare tiinific, ci la o abordare la nivel ul
cunotinelor predate la curs.
Data limit de transmitere a proiectelor: decembrie 2014 (se transmit la i de pe adresele
de e-mail ale universit
ii ... @profesor.rau.ro. , precizai nume i prenume pentru
identificare; subiectul e-mailului va conine de asemenea nume, prenume, specializarea i
grupa).

Plan lucrare
Tema proiectului:
Exemplu Analiza relaiei de legtur dintre veniturile realizate de o firm i taxele
pltite de ctre aceasta
Autor: nume i prenume, specializare, grupa
Rezumat: Pe cteva rnduri se va descrie contribuia studentului la dezvoltarea temei i
concluziile desprinse n urma elaborrii i validrii modelului econometric construit.
(rezumatul se completeaz ultimul, dup definitivarea analizei)
Exemplu Scopul lucrrii de fa este de a determina dac i n ce proporie veniturile
(mii euro) realizate de o firm pot fi considerate ca factor explicativ pentru taxele
pltite (mii euro) de ctre aceasta. Se tie c ecuaia regresiei nu va stabili n nici un
caz relaia de cauzalitate, ci numai modelul teoretic propus pentru a explica variaia
variabilei studiate, care, n cazul nostru este nivelul taxelor pltite.
Pentru aceasta se probeaz pe unantion
e
de 2 0 de ani ipoteza conform creia
veniturile medii anuale realizate de firm (exprimate n mii euro) influeneaz direct
nivelul mediu anual al taxelor pltile (exprimate n mii euro). Totodat, se dorete a
se previziona pentru o probabilitate de 95% nivelul taxelor care trebuie pltite dac
venitul total realizat de firm atinge valoarea de 40 mii euro.
(La Rezumat revenim dup ce am terminat lucrarea; la nceput nu tim exact la ce
eantion ne vom stabili, pentru cte variabile explicative, cte modele...)

Cuvinte cheie: (maximum cinciase cuvinte reprezentative pentru sub iect)


De exemplu: taxe, venit, model de regresie liniar, predicia taxelor
1

UNIVERSITATEA ROMNO-AMERICAN 2014-2015


Aplicaie +Ghid proiecte analiz econometrie - Conf. univ. dr. Din Marilena Aura

I. INTRODUCERE
I.1 Scopul studiului
De exemplu: Este cunoscut faptul c printre obiectivele unui manager se afl
probleme legate de optimizarea planificrii resurselor financiare. Managerul este
interesat s estimeze nivelul taxelor care se vor plti dac veniturile realizate de
firm vor atinge o anumit valoare.
Lucrarea de fa fundamenteaz un studiu empiric privind legtura dintre variabilele
venit i taxe, la nivelul nregistrri lor realizate de o firm pe perioada anterioar de
20 de ani, cu scopul de a identifica, specifica i valida un model econometric pe baza
cruia managerul s poat prediciona nivelul taxelor de pltit.

I.2 Formularea ntrebrii de cercetare


De exemplu: Analiza econometric din lucrarea de
fa i propune s rspund pe
baza analizei datelor empirice la ntrebarea aflat sub cercetare Care este influena
pe care o au veniturile realizate de firm asupra nivelului taxelor de plat?.

I.3 Formularea obiectivelor


De exemplu: Prin acest studiu econometric s-a urmrit:
1) determinarea relaiilor de legtur ntre variabila taxe ca variabil dependent i
variabila venit ca variabil independent/explicativ.
2) construirea unui model econometric liniar pentru a analiza n ce msur acesta
poate rspunde la ntrebarea de cercetare formulat.
3) validarea rezultatelor prin teste specifice pentru a vedea n ce msur rapoartele
de tip Output rspund la ntrebarea de cercetare formulat.
4) predicia variabilei dependente taxe n funcie de variabila venit ca variabil
independent/explicativ.
5) explicarea efectului pe care l are variabila independent (explicativ) aleas,
venit, asupra variabilei dependente (rezultative) studiate, respectiv taxe.

I.4 Rezultate ateptate


De exemplu: Ne ateptm ca din concluziile desprinse pe baza analizei econometrice
a modelului specificat s se confirme ipoteza conform creia nivelul taxelor de pltit
este explicat de o relaie de legtur direct ntre acesta i variabila venit realizat.

I.5 Explicaii despre organizarea lucrrii


Cte seciuni i ce se trateaz n fiecare, foarte pe scurt.
II.

ARGUMENTAIA ECONOMIC
(pentru a evidenia motivele alegerii acestui subiect/de ce ar putea interesa
studiul din lucrare)
De exemplu: Tema de
fa referitoare la
efectul veniturilor realizate asupra
impoziltelor i taxelor de plat ale unei firme este util pentru analiza economicofinanciar a firmei. n acest sens, pentru optimizarea planificrii bugetare a

UNIVERSITATEA ROMNO-AMERICAN 2014-2015


Aplicaie +Ghid proiecte analiz econometrie - Conf. univ. dr. Din Marilena Aura
ntreprinderii, managerul poate prediciona pe baza modelului validat, nivelul
taxelor de plat pentru alte valori de venituri pe care planific s le realizeze.

II.1 Scurt recenzie pe aceeai tem 1 (literature review)


Cine ce i cum a mai abordat ceva asemntor? L a ce concluzii au ajuns ei? Cum art
diversele modele asociate?
De exemplu, n cadrul teoriilor microeconomice se pot gsi studii ale
comportamentului economic al firmei care trateaz problematica veniturilor vs
impozite i taxe.

Dac tema aleas este inspirat de articole recenzate, atunci se specific acest lucru
(citare corect a autorilori an ului) i se face trimitere prin note de subsol la sursa
articolului (link). De asemenea se trece la bibliografie 2 articolul recenzat.
Se pot prezenta texte sau articole care trateaz fie aceeai ntrebare, fie aceeai relaie de
dependen dintre variabile, sau chiar ali factori de influen asupra variabilei
dependente propus a fi studiat. Se va explica n acest fel intenia studentului de a
verifica concluziile obinute de el nsui prin comparaie cu rezultatelr recenzate.
Se va ntocmi un sumar cu ceea ce studentul a lecturat din alte resurse 3 n demersul su
de a documenta tiinific ntrebarea aleas. (Un tabel care ine
con trei coloane: Autori
[an]/Scopul cercetrii-tema studiat/Rezultate-concluzii obinute).
II.2 Analiza critic i valorificare
Se pot relata diferite teorii economice ntlnite (teoria consumatorului, teoria produciei,
alte teorii economice) dac se preteaz la tema aleas, teorii pe care studentul le poate
aplica n constuirea modelului su.
Prin urmare, se va urmri valorificarea lucrrilor lecturate n propriul proiect, printr-o
analiz critic, fr a utiliza pasaje de la al
i autori necitate corespunztor . Plagiatul este
interzis i pedepsit prin lege.
Dup o munc de documentare n prealabil, chiar dac tema aleas/ntrebarea de
cercetare este inspirat de articole recenzate, proiectul va fi realizat cu mijloace proprii,
datele proprii de observaie i interpretri proprii ale rezultatelor.
III.

METODOLOGIA CERCETRII

(pentru a descrie metoda de cercetare utilizat, selectarea variabilelor, descrierea lor,


colectarea seriilor de date care exprim valorile observate ale variabilelor, sursele de
date)
III.1 Selectarea metodei de cercetare
Recenzia nu va depi o pagin.
Se va folosi stilul Chicago2 ca format standard de referine bibliografice; pentru citri se va folosi notaia
nume [an]; De exemplu, n lucrarea sa, asupra cursului valutar, Popescu [2006] susine c Citarea
ntreag, cu titlul articolului, editur, etc. se va trece la referine bibliografice.
3
Sursele mass media nu sunt potrivite cu misiunea acestui proiect.
1
2

UNIVERSITATEA ROMNO-AMERICAN 2014-2015


Aplicaie +Ghid proiecte analiz econometrie - Conf. univ. dr. Din Marilena Aura

Analiz uni/multifactorial pentru date cross-sectional/serii de timp/panel (recomandare:


date cross section).
De exemplu: Metoda propus n aceast lucrare pentru a rspunde ntrebrii aflate
sub cercetare este analiza unui model econometric unifactorial pentru date crosssection (chiar dac seriile de date sunt inute
ob pentru o perioad de 20 de ani,
ordinea istoric a lor este neimportant, deci nu se consider serii de timp).

III.2 Selectarea variabilelor


Se motiveaz alegerea variabilelor modelului (variabila dependent aleas pentru a fi
explicat i respectiv variabilele independente/explicative, alese pentru a explica). Se
denumesc variabilele modeluluii abrevierile lor.
Exemplu: Din punct de vedere economic, ambele variabile, venit i tax e pot fi
considerate variabile de interes n calitate de variabile dependente. Aici ne punem
problema ntr-un singur sens: cum afecteaz veniturile realizate asupra variaiei
taxelor, la nivelul firmei.
Y variabila dependent: Taxe exprimat prin volumul mediu anual al tuturor
tipurilor de taxe de pltit, msurat prin mii euro.
X variabila independent/explicativ: Venituri exprimat prin veniturile totale
anuale realizate de firm, msurat prin mii euro.

III.3 Descrierea variabilelor


Se definesc variabilele i indicatorul statistic care le msoar. Nu este cazul pentru tema
de fa. Aceast seciune este potrivit pentru teme macroeconomice. De exemplu,
indicatorul rata deomaj exprim numrul de persoane neangajate ca procent din
populaia aflat n cmpul muncii. Rataomajului se calculeaz dup formula:
[(numrul de persoane neangajate)/( numrul de persoane n cmpul muncii)] X 100.
Ca o sugestie, la portalul Eurostat, calea Eurostat> Statistics > Statistics by
theme>National accounts (including GDP) > Data > Main tables> poi gsi nu doar
indicatorul i datele gata de exportat n orice fel de fiier, inclusiv excel, dar poi gsi
i definiia acestuia i ce variabil msoar.
III.4 Colectarea seriilor de date
Ce fel de date s-ar putea folosi ca s exprime semnifica
ia variabilelor alese? (indicatori
economici existeni sau procente/ponderi calculate)
Este locul unde se ofer informaii despre seriile de date utilizate. Se vor preciza
eventualele limitri, se va descrie procedeul de obinere a datelor, precum i de formare a
eantionului. Se va meniona momentul de timp (dac datele sunt cross section) sau
perioada de timp (dac sunt serii de timp), dac cum este cazul.
Datele (valori observate ale variabilelor) sunt colectate
anti
n e
oane (selecii) din
colectiviti generale (populaii statistice). Astfel, ntr-o analiz pe date cross section,
fiecare dat observat poate fi realizarea unei variabile la un moment dat de timp, cum ar
fi venitul personal, produc
ia unei companii, v nzrile unei firme dintr-un sector
economic, PIB-ul unei ri.

UNIVERSITATEA ROMNO-AMERICAN 2014-2015


Aplicaie +Ghid proiecte analiz econometrie - Conf. univ. dr. Din Marilena Aura

Atenie: pentru date de tip cross section, datele colectate corespund aceluia
i moment de
timp, iar pentru datele de tip serii de timp, datele sunt istorice, observate la diferite
intervale de timp/frecvena lunar, trimestrial, anual, etc. Diferena esenial ntre cross
section i serii de timp este c datele de tip serii de timp au ordonare fix n timp i sunt
indexate n ordinea derulrii timpului.
III.5 Surse de date 1
Se descrie modul n care au fost selectate valorile observate din colectivitatea general,
respectiv baze de date sau observate din sondaje asupra populaiei cercetate.
Recomandare: Pentru seriile de date necesare lucrrii la econometrie, avei dou
posibiliti, la aleger e:
i) selectarea seriilor de date dintr-o baz de date pentru care se indic sursa de (nume,
data i link). Sugerez pentru temele care se refer la date macro, utilizarea bazei de date a
Comisiei Europene EUROSTAT > Statistics > Statistics by theme
ii) generarea seriilor de date care s corespund unei legturi de dependen
de tip liniar
y=a+bx+u utiliznd instrumentul de analiz Generator de numere aleatoare (Random
Number Generation) din Data Analysis, astfel 2: Pentru setul de date corespunztoare
variabilei y se genereaz valorile variabilei aleatoare u (numere independente aleatoare
derivate din distribuia normal i normat, de medie zero i abatere medie ptratic 1).
Acestea se adun cu valorile calculate pentru partea determinist a modelului, pe baza
relaiei de dependen de tip liniar dorit a+bx, unde valorile variabilei x se aleg n
prealabil.
III.6 Prezentarea teoretic a analizei propuse
(Se va prezenta pe scurt modelul identificat, specificat
i definit
funcionale 3)

- alegerea formei

Rspunsul la ntrebarea aflat sub cercetarea econometric a datelor empirice trebuie s


se bazeze pe teoria economic i pe date de observare. nainte de redactarea lucrrii se
vor ncerca mai multe specificri ale modelului i de asemenea mai multe serii de date
care exprim variabilele alese.
Aici se vor povesti pe scurt diferitele ncercri de identificare i specificare a funciei de
regresie pentru a putea face un comentariu asupra alegerii finale a modelului.
1

Exemple de surse de date: EUROSTAT


http://epp.eurostat.ec.europa.eu/
http://epp.eurostat.ec.europa.eu/portal/page/portal/statistics/themes
http://www.oecd.org ; http://stats.oecd.org/
OECD
Banca Mondial http://www.worldbank.org
http://www.imf.org
Fondul Monetar Internaional
http://www.bnr.ro/Baza-de-date-interactiva-604.aspx
BNR
www.insse.ro
Institutul Naional de Statistic
Institutul de Economie Naional www.ien.ro
UNdata http://data.un.org /
Free Economic, Demographic & Financial Data http://www.economy.com/freelunch/default.asp
2
Vezi imaginea de la anexa 1 la acest ghid.
3
Unele teorii sunt bine fundamentate economic, cum ar fi funcia cstig pentru care se utilizeaz forme
functionale semilogaritmice.
5

UNIVERSITATEA ROMNO-AMERICAN 2014-2015


Aplicaie +Ghid proiecte analiz econometrie - Conf. univ. dr. Din Marilena Aura

Teoria economic este principalul ghid n orientarea alegerii variabilelor care sunt
relevante pentru ntrebarea formulat 1. Teoria poate ajuta i la verificarea autocorelrii
sau heteroscedasticitii ca parte a procesului de generare a datelor.
La definirea modelului i identificarea sa, se va explica apariia termenului rezidual prin
existena unor presupuse variabile neobservate n aceast etap.Totodat aici se poate
ncerca propunerea unui alt factor de influen, verificnd mai multe variante de alegere.
IV.

ANALIZA DATELOR
(Analiza pe baza datelor empirice 2 - este partea principal a lucrrii )

IV.1 Se analizeaz seriile de date pentru toate variabilele observate


Se alctuiete un tabel care s ofere sumarul statisticilor (Summary Statistics: max, min,
average, and SD values) pentru fiecare variabil adus n discuie i se interpreteaz
valorile calculate. Se folosesc facilitile grafice pentru validarea/legitimarea
datelor/interpretarea datelor outliers, missing data. Se reprezint histogramele, mai ales
pentru distribuiile asimetrice.
IV.2 Se detaliaz etapele analizei
La fiecare etap se urmresc pas cu pas punctarea cu claritate a urmtoarelor aspecte:
- denumirea fiecreia din etapele de analiz econometric parcurse
- scopul fiecrei etape
- precizarea mijloacelor de realizare
- interpretarea rezultatelor
- concluziile desprinse
IV.2.1 Specificarea modelului econometric ce descrie legtura dintre cele dou
variabile
Se va reprezenta grafic legtura dintre venit (x) i nivelul taxelor (y) pentru cele 20 de
perechi de date (xi,yi) 3 prin corelogram sau diagrama norului de puncte:
240
200

160
120
80
40
0
10

20

30

40

50

60

70

80

Pura intuiie sau bunul sim nu sunt motive suficiente pentru includerea sau excluderea variabilelor n
model
2
Datele i analiza vor fi disponibile ntr-un fiier Excel sau Eviews denumit identic cu wordul, pentru a
putea fi verificate.
3
Seriile de Date se gsesc n fi ierul Excel ataat, cu aceeai denumire.
1

UNIVERSITATEA ROMNO-AMERICAN 2014-2015


Aplicaie +Ghid proiecte analiz econometrie - Conf. univ. dr. Din Marilena Aura

Din grafic se poate observa c distribuia punctelor (xi, yi) poate fi aproximat cu o
dreapt, deci se poate presupune c modelul econometric care descrie legtura dintre cele
dou variabile este un model liniar: y =E (Y | X ) = + x + , unde , parametrii
modelului. Se observ c > 0 (slope/panta dreptei) ceea ce confirm ipoteza din teoria
economic asupra unei legturi directe ntre cele dou variabile: creterea veniturilor
atrage creterea taxelor de pltit.
IV.2.2 Estimarea parametrilor modelului
Pentru estimarea parametrilor modelului de regresie utilizm metoda celor mai mici
ptrate.
Modelul de regresie este: yi =
+ xi + i , i =
1, 20 iar ecuaia de regresie estimat este:

y = a + bx
i

Metoda celor mai mici ptrate presupune minimizarea erorilor prin minimizarea sumei
ptratelor reziduurilor:
20 a + 733,1 b =
2
20
20
1557,5
2

min ( yi y i ) min yi a bx

i
=i 1 =i 1
68864
733,1 a + 31991,53 b =
Atunci avem c:

yi
xi xi yi
=
n
xi
2
xi xi
n

=
b

Deci

20
1557,5
733,1 68864

= 2, 2997 , a =y b x =6, 4201


20
733,1
733,1 31991,53

a = 6, 4201
iar ecuaia de regresie este: y =
6, 4201 + 2, 2997 x

b = 2, 2997

Interpretare: Panta dreptei (slope), respectiv coeficientul de regresie estimat punctual


b =2,2997 sugereaz c la fiecare 1000 euro nregistrai ca venit pe an, taxele cresc n
medie cu 2,2997 euro.
Observaie: Punctul de intercep
ie (interception) a = - 6,4201 este punctul n care
dreapta de regresie intersecteaza axa Oy, acest lucru nsemnand c atunci cand x = 0 (nu
exist venit), taxa este de -6,4201 euro. Deoarece eantionul nostru nu include ani cu 0
euro venit nregistrat, nu avem nici o baz pentru a-l interpreta pe a . Ca regul general,
nu putem determina valoarea lui y pentru o valoare x care are o valoare mult prea
diferit de valorile din e antion corespunzatoare lui x (intervalul n care ia valori seria de
date pentru x nu conine pe zero).
n partea superioar a tabelului 1, se pot verifica estimrile punctuale pentru coeficienii
regresiei (n coloana coefficient, C este pentru estimatorul punctual intercept, iar X este
pentru estimatorul coeficientului de regresie, slope).
Tabel 1 Tabelul coeficienilor din Summary output generat de Eviews
Dependent Variable: Y
Method: Least Squares
Sample: 1991 2010
7

UNIVERSITATEA ROMNO-AMERICAN 2014-2015


Aplicaie +Ghid proiecte analiz econometrie - Conf. univ. dr. Din Marilena Aura
Included observations: 20
Variable

Coefficient Std. Error

t-Statistic

Prob.

C
X

-6.420142 9.353375
2.299690 0.233865

-0.686398
9.833395

0.5012
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.843063
0.834344
16.73363
5040.259
-83.67358
1.489529

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

77.87500
41.11373
8.567358
8.666931
96.69566
0.000000

Tabel 2 Tabelul coeficienilor din Summary output generat de Excel


P-value
Lower 90.0% Upper 90.0%
Coefficients Standard Error t Stat
9.353374888
-0.6864
0.501209 -22.6394893 9.799204379
Intercept -6.420142
2.2996902
0.233865325
9.833395 1.16E-08 1.894152806 2.705227496
x(venit)

IV.2.3 Verificarea semnificaiei parametrilor modelului de regresie pentru = 0,1


Din teorie tim c parametrul a estimat pe baza seleciei este o variabil aleatoare care
urmeaz o distribuie normal cu media egal cu parametrul corespunztor pentru
populaia
statistic,
respectiv

i
cu
dispersia
egal
cu:
n

xi2

x2
,
2
21
2
i
=
1
=
sa =
se
se n
+
n n

( xi x )2 ( xi x )2

i 1=
i 1
=

Analog, parametrul b estimat pe baza seleciei este o variabil aleatoare care urmeaz o
repartiie normal cu media egal cu parametrul corespunztor pentru populaia statistic,
n

respectiv i cu dispersia egal cu:

2
sb=
se2

1
n

( xi x )

unde se2 =

( yi yi )

i =1

este un

n2

i =1

( yi yi )
i
=
16,73 ,
n2
2

estimator nedeplasat al dispersiei reziduurilor . Prin=


urmare se
2

xi

sa =
s
2
( xi x )
2

=
sb
9,35 ;
=

s2
=
0, 23
20
2
xi x
i =1

Testm semnificaia parametrului din modelul corespunztor colectivit


ii statistice
pentru un prag de semnificaie = 0,1:
se stabilesc ipoteza nul: H0: = 0 i ipoteza alternativ: H1: 0
a 6, 4201
se calculeaz statistica testului t: tcalculat =
=
= 0, 68
sa
9,35

UNIVERSITATEA ROMNO-AMERICAN 2014-2015


Aplicaie +Ghid proiecte analiz econometrie - Conf. univ. dr. Din Marilena Aura

se compar tcalculat cu valoarea critic tabelat pentru un test bilateral:


= t0,05;18 = 2,101
t
2

,n 2

Deoarece tcalculat =0.68 < t0,05;18 =2,101 , iar probabilitatea p-value este 0.50 > 0,1 (mai
mare dect pragul de semnificaie ales) nseamn c acest coeficient este nesemnificativ
statistic, adic pentru un risc asumat de 10%, decidem c estimatorul a provine dintr-o
colectivitate cu = 0, deci nu este semnificativ diferit de zero.
Analog testm semnificaia parametrului :
se stabilesc ipoteza nul: H0: = 0 i ipoteza alternativ: H1: 0
b 2, 2997
se calculeaz statistica testului t: tcalculat
= =
= 9,83
sb
0, 23
se compar tcalculat cu t

,n 2

= t0,05;18 = 2,101

Deoarece tcalculat > t0,05;18 iar probabilitatea p-value este 1.16E-08<0,05 nseamn c
coeficientul de regresie este semnificativ statistic, adic pentru un risc asumat de 10%,
putem decide c estimatorul b provine dintr-o colectivitate cu parametrul
semnificativ diferit de zero.
Intervalul de ncredere pentru parametrul este:
b t
s b + t
s , adic
/2;n 2

/2;n 2

2, 299 2,101 0, 23 2, 299 + 2,101 0, 23 1,816 2, 782

IV.2.4 Verificarea ipotezelor metodei celor mai mici ptrate


Pentru verificarea ipotezelor de fundamentare a metodei celor mai mici patrate se vor
folosi mai multe procedee i teste de diagnostic.
Ipoteza 1. Variabilele observate nu sunt afectate de erori de msurare
Aceast ipotez se verific cu regula celor 3 : x ( x 3 x ) i y ( y 3 y ) .
Se utilizeaz datele de selecie (xi,yi) pentru verificarea urmtoarelor relaii:
x 3sx < xi < x + 3sx

y 3s y < yi < y + 3s y
Unde mediile i dispersiile de selecie se calculeaz cu formulee cunoscute:
n

20

xi xi 733,1
=i 1 =i 1
655 ; sx
x = =
=
= 36,
=
20
20
n
20

yi
1557,5
1
; sy
=
y i ==
=
= 77,875
20
20

Atunci avem c:

( xi x )
i =1
=
n 1
2

( yi y )
i =1
=
n 1

5119, 74
= 16, 4152
19

32116, 44
= 41,11373
19

36, 655 3 16, 4152 < xi < 36, 655 + 3 16, 4152 12,5906 < xi < 85,900 (adevrat)

77,875 3 41,11373 < yi < 77,875 + 3 41,11373 45, 466 < yi < 201, 216 (adevrat)
9

UNIVERSITATEA ROMNO-AMERICAN 2014-2015


Aplicaie +Ghid proiecte analiz econometrie - Conf. univ. dr. Din Marilena Aura

i deci ipoteza poate fi acceptat fr nici un dubiu.


Ipoteza 2. Valorile variabilei aleatoare eroare (disturban) sunt normal distribuite, mai
exact legea de probabilitate a variabilei eroare t este legea normal, de medie nul i
p
abatere medie patratic , adica: t
N (0, ) .
Ipoteza normalitii erorilor implic faptul c metoda celor mai mici ptrate este o
metod de estimare optimal, fiind att consistent ct i eficient, adic echivalent
metodei verosimilitii maxime.
Ipoteza normalitii erorilor se testeaz prin compararea momentelor statistice din
eantion (asimetria i boltirea) cu momentele teoretice ale erorilor n ipoteza nul a
normalitii.
8
Series: RESID
Sample 2001 2020
Observations 20

7
6

Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis

5
4
3
2
1

Jarque-Bera
Probability

0
-30

-20

-10

10

20

30

-2.56E-14
0.975255
33.94338
-29.46963
16.28732
0.213892
2.489201
0.369928
0.831134

40

S - coeficientul de asimetrie (skewness) msoar simetria distribuiei n jurul mediei sale.


3
E 2 ( X m )

~ N 0, 6 , unde m = E ( X ) , iar n
Momentul teoretic este S =

3
n

( 2 ( X ) )
2

3
( ei e ) n
=0,21 (curba distribuiei rezidurilor are
eantionul pentru reziduuri S = i =1
3
n

2
( ei e ) n
i =1

0, 21 0
o coad mai voluminoas la dreapta). Statistica testului
=0,383 <
S =
6
20
z /2 =1,645 pentru un test bilateral, de unde rezult c ipoteza nul H0 : S=0 este
acceptat la un prag de semnificaie de 10% i deci distribuia variabiei aleatoare eroare
este simetric.
K - coeficientul de aplatizare (kurtosis) msoar boltirea distributiei, ct de aplatizat sau
ascuit este distribia fa de distribuia normal.

10

UNIVERSITATEA ROMNO-AMERICAN 2014-2015


Aplicaie +Ghid proiecte analiz econometrie - Conf. univ. dr. Din Marilena Aura

E ( X m) 4

24

Momentul teoretic este K =


~ N 3,
, unde m = E ( X ) iar n
2
2
n
X

(
)

(
)
n

eantionul pentru reziduuri

K=

( ei e )

i =1

2
( ei e ) n
i =1

=2,48 < 3 (curba distribu


iei

0, 48 3
= -0,47 i cum
24
20
<1,645 pentru un test bilateral, rezult c ipoteza nul H0 : K = 3 este acceptat la un

reziduurilor este platikurtic). Statistica testului

K =

K
prag de semnificatie de 10% ceea ce nseamn c aplatizarea curbei de distribu
ie a
erorilor coincide cu cea pentru distribu ia normal.
Cumulat, cele dou teste pentru verificarea simetriei
i aplatiz rii conduc la acceptarea
ipotezei de normalitate a erorilor.
n locul celor dou teste anterioare pentru verificarea ipotezei de normalitate a erorilor se
poate folosi un singur test, numit Jarque-Bera.
Statistica Jarque-Bera (JB) este dat de suma ptratelor statisticilor anterioare, care
devine o variabil distribuit dup legea hi-ptrat: JB
= S2 + K2 2 ,2
n n

2
1
1
JB=
S +
( K 3) = n S 2 + ( K 3) = 0,369928
24
6

6 24

Cele dou ipoteze ale testului JB:


H0: ~ N (0,1) (JB = 0 i.e. S = 0 i K = 3)
H1: nu urmeaza o repartitie N (0,1) ( JB 0)
Regula de decizie:
Daca JBcalculat > 2 ;2 atunci ipoteza nul H0 de normalitate este respins la un prag
de semnificaie de ( 100 )%.
Daca p-value < , atunci respingem ipoteza nula H0 de normalitate a rezidurilor
la un prag de semnificaie de ( 100 )%.
2
Cum statistica test Jarque-Bera = 0,369928 < 0,1;2
=4,605 pentru testul unilateral
dreapta iar p-value = 0,831134 > 0,6, atunci ipoteza nul H0 de normalitate a erorilor este
acceptat la un prag de semnificaie de 10%.
2

Ipoteza 3. Variabila aleatoare eroare este de medie nul E ( ) = 0 i aceeai dispersie


constant pentru toate valorile lui x (ipoteza de homoscedasticitate).
Depistarea heteroscedasticitii (dispersia lui nu este aceeai pentru toate valorile lui x)
se poate face prin procedeul grafic, adic se construiete corelograma ce conine valorile
variabilei independente x pe axa OX i ale variabilei reziduale pe axa OY. Dac
valorile celor dou variabile cresc(scad) concomitent, atunci cele dou variabile sunt
corelate i deci nu sunt independente.
2

11

UNIVERSITATEA ROMNO-AMERICAN 2014-2015


Aplicaie +Ghid proiecte analiz econometrie - Conf. univ. dr. Din Marilena Aura
40
30

RESID

20
10
0
-10
-20
-30
10

20

30

60

50

40

70

80

Deoarece graficul punctelor prezint o evoluie oscilant putem accepta ipoteza c


variabila factorial x i cea rezidual sunt independente.
Ipoteza 4. Valorile variabilei reziduale sunt necorelate, adic nu exista fenomenul de
autocorelare a erorilor : Cov(et, ek) = 0, t ,=
k 1, n , t < k , i.e. sunt independente ntre
ele.
Verificarea acestei ipoteze se poate face prin:
metoda grafic (corelograma);
testul Durbin-Warson.
Pentru a testa autocorelarea prin metoda grafic se construiete corelograma trecndu-se
pe axa OX valorile variabilei rezultative yi, iar pe axa OY valorile variabilei reziduale i
se cerceteaz dac exist o relaie ntre valorile curente ale erorilor estimate la momentul
t, et , i valorile precedente et 1 , et 2 ,.... :
40
30

RESID

20
10
0
-10
-20
-30
0

40

80

120

160

200

240

Pe graficul din imagie se observ c distribuia erorilor este oscilant, deci putem accepta
ipoteza c erorile sunt independente, adic nu sunt autocorelate (seria reziduurilor nu
traverseaza axa timpului de prea multe ori sau de prea puine ori).
Testul Durbin Watson se folosete pentru a testa autocorelarea de prim ordin, adic se
testeaz doar dac exist o legtur dintre o eroare i cea de dinaintea sa:=
t t 1 + vt ,
unde vt ~ N (0, v2 )
Pentru testarea ipotezei de necorelare a erorilor cu ajutorul testului Durbin-Watson:

12

UNIVERSITATEA ROMNO-AMERICAN 2014-2015


Aplicaie +Ghid proiecte analiz econometrie - Conf. univ. dr. Din Marilena Aura

se stabilesc ipoteza nul H0: variabila rezidual nu este autocorelat H 0 : = 0 i

ipoteza alternativ H1: variabila rezidual este autocorelat H 1 : 0 .


se calculeaz statistica test Durbin-Watson:
(et et 1 )

dcalc = t >2

2
t

t 1

7508,87
= 1, 48
5040, 26

se compar d cu cele dou valori dL i dU din tabelul testului Durbin-Watson


pentru pragul de semnificaie = 0,05 pentru numrul variabilelor exogene k = 1
i
pentru
n
= 2 0 dL: =
1,20,
dU
=
1,41
i
cum
d 2 < d calc < 4 d 2 1,41 < 1,48 < 2,59 erorile sunt independente.
Tot pentru testarea ipotezei privind autocorelarea erorilor poate fi utilizat i coeficientul
de autocorelaie de ordinul I:

et et 1
709, 41
1
=
= 0,14
r1 t ==
n
2
5040, 26
et
t =1

-1, autocorelaie strict negativ

Deoarece r1=0,14 este apropiat de 0 putem aprecia c


r1 = 0, independen

+1, autocorelaie strict pozitiv

valorile variabilei reziduale nu sunt autocorelate, adic sunt independente.


IV.2.5 Testarea validitii modelului de regresie
se stabilesc ipoteza nul H0: modelul nu este valid
i
modelul este valid;

sx2 MSE 27076,18


se calculeaz statistica test F: Fcalculat
= =
=
= 96, 69
2
s

unde

ipoteza alternativ H1:

20

20

MSR

280, 01

( yi y )
27076,18
2
i =1
sx MSE
=
=
=
= 27076,18 .
k
1
( yi yi )
5040.25
=
s2 MSR
= i =1
=
= 280.014
n k 1
18

se compar Fcalculat cu F; k;

n-k-1

= F0,1; 1; 18 = 8,28 i cum Fcalc = 96,69 > F0,1;1;18 i

pvalue (significance F)< (tabel 1 i tabel 3) se respinge ipoteza nul i se


accept alternativa, deci modelul este valid.
Tabel 3 Tabelul ANOVA din Summary output generat de Excel
df
SS
MS
F
Significance F
Regression 1 27076.17814 27076.18 96.69566
1.15588E-08
Residual 18 5040.259363 280.0144
Total 19 32116.4375

13

UNIVERSITATEA ROMNO-AMERICAN 2014-2015


Aplicaie +Ghid proiecte analiz econometrie - Conf. univ. dr. Din Marilena Aura

IV.2.6 Testarea intensitii legturii dintre cele dou variabile i testarea


semnificaiei indicatorilor utilizai
Intensitatea legturii dintre cele dou variabile se apreciaz cu ajutorul:
1. coeficientului de corelaie;
2. raportului de corelaie (coeficientul de determinare).
1. Coeficientul de corelaie:
=
r

n xi yi xi yi
i
i
i
0,918
=
2
2
n x2 x n y 2 y
i i
i
i i
i
i
i

( )

( )

Deoarece r = 0,918 1, apreciem c ntre cele dou variabile exist o legtur liniar,
direct, foarte puternic.
Testarea semnificaiei coeficientului de corelaie pentru colectivitatea general:
se stabilesc ipoteza nul H0: = 0 ( nu este semnificativ statistic)i ipoteza
alternativ H1: 0 ( este semnificativ statistic), unde - coeficientul de
corelaie la nivelul colectivitii generale
r n 2 0,918 18
se calculeaz statistica test t:=
tcalculat =
= 9,82
1 r2
1 0,9182
se compar t calc cu t ;n 2 = t 0,1; 18 = 2,878 . Deoarece tcalculat > t0,1;18 respingem
ipoteza nul i acceptm alternativa, deci coeficientul de corelaie este
semnificativ statistic.
2. Raportul de corelaie R:

(y i y i )2

R = 1 i =1

(y i y )

= 1

5040,26
= 0,918
32116,44

i =1

Deoarece R = r, apreciem c ntre cele dou variabile exist o legtur liniar.


Coeficientul de determinare (a calitii ajustrii) R-squared (R2) este un indicator relativ
pentru msurarea intensitii legturii dintre variabile i deci cu ct punctele vor fi mai
apropiate de linia de regresie estimat cu att va fi mai bun potrivirea (goodness of fit).
Cum coeficientul de determinare este R 2 = 0,84 , rezult c intensitatea legturii este mare,
respectiv c c 84,3% din variaia taxelor este explicat de variaia veniturilor nregistrate.
Testarea semnificaiei raportului de corelaie:
se stabilesc ipoteza nul H0: R nu este semnificativ statistici ipoteza alternativ
H1: R este semnificativ statistic;
se calculeaz statistica test F:
n k 1 R2
18 0,9182
Fcalculat =

=
=
94,5
k
1 R 2 1 1 0,9182

14

UNIVERSITATEA ROMNO-AMERICAN 2014-2015


Aplicaie +Ghid proiecte analiz econometrie - Conf. univ. dr. Din Marilena Aura

se compar Fcalc cu . Deoarece Fcalc > F0,1; 1; 18 = 8,28 se respinge ipoteza nul
i se accept alternativa, deci raportul de corelaie este semnificativ statistic.
Tabel 4 Tabelul Regression Statistics din Summary output generat de Excel
Regression Statistics
Multiple R 0.9181846
R Square 0.8430629
Adjusted R Square 0.8343442
Standard Error 16.733631
Observations
20

IV.2.7 Estimarea punctual i pe interval de ncredere a taxelor care trebuie pltite


dac venitul este de 40 mii euro, pentru o probabilitate de 95%.
Pentru estimarea punctual vom avea y n +1 = 6,4201 + 2,2997 40 = 85,5679 euro
Pentru estimarea pe interval de ncredere vom avea:
y n +1 t /2;n k 1 s y n+1 yn +1 y n +1 + t /2;n k 1 s y n+1
adic

unde

85,5679 t0,05;18 17,16 yn +1 85,5679 + t0,05;18 17,16


s 2y n+=
1

xn +1 x
1
s 1 + + n
n xi x
i =1

)
)

1 (40 36, 655) 2


=
+
+
280,
01
1

= 294,59
2
5119, 75
20

Deci intervalul de ncredere pentru taxele pltite pentru un venit de 40 mii euro este:
41, 77 (euro) yn +1 129,36 (euro) .
IV.3 Se scrie raportul de cercetare 1.
Calculele se verific rulnd unul din programele informatice specifice (Eviews/Excel).
Se prezint i se interpreteaz rezultatele (Summary Output) asistate de unul din
programele informatice.
Pentru Excel, accesai instrumentul de analizare a datelor Analysis ToolPak. Pentru
aceasta facei clic pe Analiz date (Data Analysis) din meniul Instrumente (Tools).
n cazul n care comanda Analiz date nu este disponibil, este necesar s ncrca
i
programul de completare Analysis ToolPak (Excel Options, Add-ins).
La sfritul prii de analiz empiric a datelor se vor desprinde concluzii, chiar dac
acestea nu coincid cu cele ateptate. De exemplu, s-ar putea gsi c nu exist nici o relaie
de dependen ntre variabilele presupuse a fi ntr-o relaie de dependen. Se va raporta
acest lucru care este destul de important pentru justificarea lurii n considerare a unui alt
factor de influen pentru variabila studiat.

Eviews, Excel sau Minitab sunt unelte de lucru recomandate n acest proiect, unde facilitile grafice i de
calcul sunt relativ uor de accesat. Calculele efectuate cu Eviews sau Excel vor fi disponibile ntr-un fiier
ataat pentru a putea fi urmrite i verificate. Pentru utilizarea software-ului Eviews, dac se apleaz
butonul Help din meniu, un ghid de utilizare Eviews este disponibil n format pdf.

15

UNIVERSITATEA ROMNO-AMERICAN 2014-2015


Aplicaie +Ghid proiecte analiz econometrie - Conf. univ. dr. Din Marilena Aura

Pentru un model valid, se va ncerca adugarea unui nou factor explicativ pentru a vedea
n ce msur se mbuntete similitudinea modelului prin trecere la un model
multifactorial.
V.

CONCLUZII

V.1 Se furnizeaz propriile concluzii


Se reamintete subiectul, respectiv ntrebarea analizat. Dac este cazul, se reformuleaz
ntrebarea de cercetare.
Se furnizeaz propriile concluzii i rspunsul gsit la ntrebare i se compar cu
eventualele rezultate descrise de alte articole. Concluziile vor fi personale, rezultate din
calcule statistice i testri, indiferent dac acestea coincid sau nu cu rspunsurile ntlnite.
V.2 Atingerea obiectivelor
Se va urmri s se puncteze atingerea obiectivelor metodei econometrice din practica
economic: explicarea variaiei fenomenului considerat ca efect datorat variaiei
variabilei factor, estimarea valorilor probabile ale fenomenului studiat (simularea
acestuia) n funcie de posibile valori pe care le poate lua factorul economic, prognoza
fenomenului n funcie de valorile variabilei explicative, pe intervale de prognoz, etc.
V.3 Confirmarea rezultatelor
Se vor compara rezultatele obinute cu cele din literatura consultat, dac este cazul. Se
va rspunde dac ele sprijin sau vin n contradicie cu teoria economic.
Care dintre rezultatele obinute ar putea genera o mai mare confiden i cum s-ar extinde
acestea la rspunsurile raportate n alte articolele similare?
V.4 Sugestii privind continuarea cercetrilor
Se va sugera o viitoare cercetare asupra subiectului dezvoltat, ca o continuare a acestui
demers.
VI.

REFERINE BIBLIOGRAFICE

Exemplu de scriere
GREENWOOD, M. J. (1997): Internal Migration in Developed Countries, in Handbook of
Population and Family Economics, Vol. 1B, ed. by M. R. Rosenzweig and O. Stark. North
Holland.
KENNAN,J.,AND J. R. WALKER (2010): Wages, Welfare Benets and Migration, Journal of
Econometrics, 156, 229238.

ANEXE
Aici putei pune calculele mai detaliate care conin formule, sau tabelele (numerotate,
pentru a putea face trimitere la ele)

16

UNIVERSITATEA ROMNO-AMERICAN 2014-2015


Aplicaie +Ghid proiecte analiz econometrie - Conf. univ. dr. Din Marilena Aura

Anexa 1

17