Sunteți pe pagina 1din 25

SUPORTUL DE SEMINAR

ÎN VEDEREA ELABORĂRII PROIECTULUI

ECONOMETRIE
1. Pregătirea bazei de date în format Excel

Numirea celor două variabile analizate în proiect (exemplu):

a) Producția de floarea soarelui în Constanța (AGR109A - Productia agricola vegetala la principalele culturi, pe
forme de proprietate, macroregiuni, regiuni de dezvoltare si judete)

b) Suprafața cultivată cu floarea soarelui în Constanța (AGR108A - Suprafata cultivata cu principalele culturi, pe
forme de proprietate, macroregiuni, regiuni de dezvoltare si judete)

Se extrag valorile din TEMPO și se prelucrează în format Excel, precum în următorul slide (date cât mai recente, minim
15 observații).
Producția de floarea soarelui în Constanța Suprafața cultivată cu floarea soarelui în Constanța
Anul
(unitatea de măsură: tone) (unitatea de măsură: hectare)

1990 39,834 31,432


1991 48,358 40,647
1992 59,173 51,793
1993 70,289 58,996
1994 70,524 58,804
1995 98,304 74,059
1996 103,936 91,333
1997 91,140 67,750
1998 125,740 100,976
1999 146,607 109,717
2000 104,737 103,947
2001 41,942 93,038
2002 91,940 107,878
2003 159,285 150,955
2004 181,995 118,406
2005 171,658 103,367
2006 254,171 141,731
2007 92,961 96,489
2008 136,164 89,870
2009 101,623 95,274
2010 119,958 78,014
2011 145,219 108,108
2012 125,186 111,214
2013 149,567 100,068
2014 164,826 89,884
2015 151,939 95,124
2016 115,414 76,854
2017 258,610 81,318
2018 296,518 79,822
2019 230,976 86,828
2020 100,194 82,320
350,000 160,000

140,000
Suprafața cultivatvă cu floarea soarelui în Constanța (u.m.: hecatare)

300,000

Producția de cereale boabe în Constanța (u.m.: tone)


120,000
250,000

100,000

200,000

80,000

150,000

60,000

100,000
40,000

50,000
20,000

0 0
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020

Producția de floarea soarelui în Constanța Suprafața cultivată cu floarea soarelui în Constanța


2. Importarea bazei de date din Microsoft Excel în EViews 12 Student Lite
Selectarea perioadei prin atribuirea seriei referitoare la an date de tipul „date”.
3. Formatarea indicatorilor

Redenumirea variabilelor (rename):


4. Prezentarea statisticii descriptive şi discutarea normalităţii distribuţie pe productia de tone

• distribuția normală este simetrică în


ambele părți ale graficului variabilei
analizate și are valoarea 0 pentru
Skewness (tendința către dreapta:
Skewness este pozitiv, și tendinta către
stânga: Skewness este negativ)
• [-0.5-+0.5] interval moderat Skweness.
• Kurtosis indică aplatizarea sau
înălțimea ridicată a vârfului graficului
variabilei analizate și are valoarea 3
pentru distribuția normală.
4. Prezentarea statisticii descriptive şi discutarea normalităţii distribuţie pe productia de tone

În Eviews, opţiunea Histogram and Stats afişează distribuţia de frecvenţă a seriei analizate sub forma unei histograme.
Histograma împarte diametrul seriei (i.e. distanţa între valorile maxime şi minime), în mai multe intervale de lungime egală şi
afişează numărul de observaţii care se încadrează în fiecare interval. Lângă histogramă sunt afişate o serie de statistici
descriptive, care numere care oferă o imagine de ansamblu asupra distribuţiei seriei analizate.

• Mean reprezintă media seriei de date, obţinută prin însumarea tuturor valorilor şi împărţirea la numărul de observaţii.
• Median reprezintă mediana seriei de date, definită ca fiind valoarea din mijlocul seriei atunci când valorile acesteia sunt
ordonate în ordine crescătoare. Mediana este o măsură robustă a „tendinţei centrale”, fiind mai puţin sensibilă faţă de valori
aberante decât media.
• Max şi Min reprezintă valoarea maximă şi, respectiv, minimă înregistrată de serie pentru eşantionul curent.
• Std. Dev. reprezintă abaterea standard, care, aşa cum s-a mai discutat, este o măsură a dispersiei sau a „împrăştierii” valorilor
seriei faţă de medie.
• Skewness este o măsură a asimetriei funcţiei de densitate de repartiţie a seriei în jurul valorii sale medie. Statistica skewness
pentru o distribuţie simetrică, cum ar fi distribuţia normală, este întotdeauna zero. O valoare pozitivă semnifică faptul că
distribuţia are „coada” din partea dreaptă mai lungă, iar o valoare negativă implică faptul că distribuţia are „coada” din partea
stângă mai lungă.
• Kurtosis este o măsură a amplitudinii funcţiei de densitate, a aplatizării acesteia în raport cu funcţia de densitate a distribuţiei
normale. Valoarea acestei statistici pentru o serie distribuită normal este 3. Dacă statistica înregistrează o valoare mai mare decât
3, se spune că distribuţia este leptokurtică, iar dacă are o valoare mai mică decât 3, distribuţia este platikurtică.
• Jarque-Bera: cu H0 (distributie normală) și H1 (distribuție anormală). Daca p-value este mai mare decât 0.05, ipoteza nulă este
acceptată. Dacă probabilitatea este mai mică decât 0.05, ipoteza nula este respinsă și datele trebuie transformate pentru a prezenta
o distribuție normală.
5. Scatter Regression Line Graph în EViews

Selectati variabilele -> click dreapta -> Open -> as Group -> View -> Graph -> Graph options -> Specific: Scatter ->
Details, Fit lines: selectati Regression line.
6. Elaborarea corelogramelor pentru cele două variabile alese
Date: 03/08/22 Time: 11:23 Date: 03/08/22 Time: 11:25
Sample: 1990 2020 Sample: 1990 2020
Included observations: 31 Included observations: 31
Autocorrelation Partial Correlation AC PAC Q-Stat Prob Autocorrelation Partial Correlation AC PAC Q-Stat Prob

1 0.553 0.553 10.426 0.001 1 0.625 0.625 13.329 0.000


2 0.252 -0.077 12.670 0.002 2 0.462 0.116 20.851 0.000
3 0.096 -0.016 13.009 0.005 3 0.468 0.233 28.854 0.000
4 0.112 0.117 13.485 0.009 4 0.261 -0.219 31.444 0.000
5 0.052 -0.077 13.590 0.018 5 0.119 -0.090 31.999 0.000
6 0.038 -0.114 32.059 0.000
6 0.075 0.091 13.821 0.032
7 0.020 0.112 32.076 0.000
7 0.110 0.066 14.338 0.045
8 -0.085 -0.127 32.397 0.000
8 0.056 -0.085 14.477 0.070
9 -0.194 -0.120 34.144 0.000
9 0.010 0.014 14.481 0.106
10 -0.213 -0.103 36.345 0.000
10 -0.017 -0.023 14.495 0.152 11 -0.285 -0.101 40.507 0.000
11 0.101 0.160 15.015 0.182 12 -0.375 -0.132 48.083 0.000
12 0.073 -0.071 15.302 0.225 13 -0.375 -0.045 56.095 0.000
13 0.066 0.030 15.553 0.274 14 -0.301 0.072 61.551 0.000
14 -0.030 -0.096 15.606 0.338 15 -0.242 0.077 65.292 0.000
15 -0.038 -0.006 15.700 0.402 16 -0.217 -0.029 68.506 0.000
16 -0.191 -0.211 18.176 0.314

Corelograma indică trendul şi sezonalitatea evoluţiei datelor. Pentru a nu înregistra sezonalitate coloanele indicate de
corelogramă nu trebuie să depăşească liniile punctate din stânga şi din dreapta. Astfel, dacă se încadrează în limitele
impuse de liniile punctate nu există sezonalitate.
În plus, este indicată autocorelaţia faţă de 12 laguri (adică perioada de timp, ani în cazul vostru). În exemplele de
mai sus (cei doi indicatori analizați în slide-urile anterioare), nu se observă prezenţa autocorelării valorilor.
7. Testarea staționarității variabilelor modelului – ipoteză necesară a fi îndeplinită pentru
validitatea modelului

Selectați variabila → click dreapta → Open → View → Unit Root Test → selectăm opțiunea Augumented Dickey-Fuller → testăm
exisțenta unei rădacini unitate pentru cele 3 niveluri – Level, 1st difference, 2nd difference – și includem în testare existența unei
constante (intercept) sau a unui trend împreuna cu constanta (trend and intercept) sau inexistența ambelor (none), până identificam
nivelul la care apare staționaritatea → OK.

Rezultatele testului și interpretarea lor:


• H0 Variabila are o unitate rădacina (ipoteza nula) și, deci, datele NU sunt staționare
• H1 Datele sunt stationare

Dacă probabilitatea aferenta testului t-statistics (Prob.) are o valoare sub 0.05 și valoarea în modul a testului Dickey-Fuller este mai
mare decât cele 3 valori critice în modul ale testului (Test critical values) de pe coloana t-statistics, atunci ipoteza nulă de existență a
unei rădacini unitate poate fi respinsă și, deci, datele sunt staționare. În caz contrar, dacă probabilitatea aferentă testului t-statistics
(Prob.) are o valoare mai mare de 0.05 și/sau valoarea în modul a testului Dickey-Fuller este mai mică decât cele 3 valori critice în
modul ale testului (Test critical values) de pe coloana t-statistics, atunci ipoteza nulă este confirmată și, deci, datele NU sunt
staționare. Astfel, în acest caz, trebuie testat nivelul diferentelor până când staționaritatea este identificată.

Odată identificată staționaritatea, datele inițiale trebuie transformate astfel încat să devina staționare: Selectati meniul Genr / Quick
+ Generate Series → introduceți ecuația de logaritmare.
7. Testarea staționarității variabilelor modelului – ipoteză necesară a fi îndeplinită pentru
validitatea modelului
7. Testarea staționarității variabilelor modelului – ipoteză necesară a fi îndeplinită pentru
validitatea modelului

Null Hypothesis: PRODUCTIA has a unit root


Exogenous: Constant
Lag Length: 0 (Automatic - based on SIC, maxlag=7) Prin aplicarea testului Augmented Dickey-Fuller
t-Statistic Prob.* pentru verificarea staționarității datelor, se poate
observa că datele privind suprafața cultivată cu
Augmented Dickey-Fuller test statistic -2.962443 0.0502
Test critical values: 1% level -3.670170 floarea soarelui în Constanța sunt staţionare,
5% level -2.963972 deoarece probabilitatea aferentă t-statistic
10% level -2.621007
înregistrează valoarea 0.0465 (în cazul
*MacKinnon (1996) one-sided p-values. suprafeței), mai mică decât pragul de 0.05 necesar
pentru confirmarea staționarității datelor. Opusul
Null Hypothesis: SUPRAFATA has a unit root
îl observăm în cazul producției de floarea soarelui
Exogenous: Constant în județul Constanța (Prob. 0.0502, mai mare
Lag Length: 0 (Automatic - based on SIC, maxlag=7)
decât pragul de 0.05). Valorile critice ale lui t-
t-Statistic Prob.* statistic de 5% și 10% în modul sunt mai mici
Augmented Dickey-Fuller test statistic -2.998291 0.0465
decât valorile în modul ale testului Augumented
Test critical values: 1% level -3.670170 Dickey fuller în cazul suprafeței, și doar 10% în
5% level -2.963972
10% level -2.621007 cazul producției.
7. Testarea staționarității variabilelor modelului – ipoteză necesară a fi îndeplinită pentru
validitatea modelului

Datele inițiale trebuie transformate astfel încat să devina staționare: Selectati meniul Genr / Quick + Generate Series → introduceți
ecuația de logaritmare (de exemplu: lproductie=log(productie) pentru a obține logaritmul natural pentru seria productie). Seria nou-
obținută o vom utiliza în continuare, deoarece modelul trebuie construit cu date staționare.
8. Stabilirea modelului care va fi testat:
Testarea cauzalităţii dintre variabile:
Pentru testarea cauzalităţii dintre variabile, adică a direcţiei de influenţă regăsită între cele două variabile se
aplică testul Granger. Selectarea variabilelor modelului → click dreapta → Open → View → Granger
causality → lag specification (rămâne implicit 2) → apare fereastra cu rezultate.
Interpretare rezultate: Dacă probabilitatea aferentă lui F-statistic este mai MICĂ decât 0,05, atunci există o
relaţie cauzală între cele două variabile, cu referire la faptul că prima variabilă menţionată influenţează a
doua variabilă. Contrar, dacă probabilitatea aferentă lui F-statistic este mai MARE decât 0,05, atunci NU
există o relaţie cauzală între cele două variabile, adică prima variabilă menţionată NU influenţează a doua
variabilă. !Atenţie! Există posibilitatea cauzalităţii doar într-o singură direcţie, adică doar o variabilă poate
influenţa a doua variabilă fără a exista situaţia viceversă.

În funcție de rezultate, stabilim variabila endogenă (dependentă) și a variabilei(-lor) exogenă(e)/independentă(-e).

a) Producția de floarea soarelui în Constanța (AGR109A - Productia agricola vegetala la principalele culturi, pe forme de
proprietate, macroregiuni, regiuni de dezvoltare si judete) = Variabila dependentă

b) Suprafața cultivată cu floarea soarelui în Constanța (AGR108A - Suprafata cultivata cu principalele culturi, pe forme de
proprietate, macroregiuni, regiuni de dezvoltare si judete) = Variabila independentă
8. Stabilirea modelului care va fi testat :

Pairwise Granger Causality Tests


Date: 03/13/22 Time: 22:08
Sample: 1990 2020
Lags: 2

Null Hypothesis: Obs F-Statistic Prob.

PRODUCTIA does not Granger Cause SUPRAFATA 29 1.20341 0.3176


SUPRAFATA does not Granger Cause PRODUCTIA 3.38688 0.0506

Observăm că probabilitatea aferenta testului F-statistic este în ambele cazuri mai mare decat 0,05 → ceea ce
demonstrează că modificarea suprafeței nu cauzează producția de floarea soarelui în județul Constanța, situație
similară și în dinamica producție → suprafață. Totuși, observăm că Prob. este la o mică diferența peste valoarea
de 0,05 → așadar vom considera suprafața cultivată cu floarea soarelui ca fiind variabila dependentă, iar
suprafața cultivată o vom considera variabila independentă.
8. Stabilirea modelului care va fi testat:
Aplicarea modelului liniar al regresiei simple și interpretarea rezultatelor:
Selectarea variabilelor modelului → Open → as Equation → se deschide fereastra Equation Estimation
9. Aplicarea modelului liniar al regresiei simple și interpretarea rezultatelor
Aplicarea modelului liniar al regresiei simple și interpretarea rezultatelor:

 Testul t-statistics:
Dacă probabilitatea aferenta acestui test este mai mică decât 0.05,
Dependent Variable: PRODUCTIA
Method: Least Squares atunci variabila introdusă în model este bine aleasă și produce
Date: 03/14/22 Time: 10:40 efecte asupra variabilei endogene.
Sample: 1990 2020
 R-squared (R2), coeficientul de determinație ∊ [0,1]:
Included observations: 31
-> 1 ⇒ modelul indică o influență puternică a variabilei
Variable Coefficient Std. Error t-Statistic Prob. independente/exogene asupra variabilei dependente/endogene.

C 23860.32 37273.09 0.640149 0.5271 -> 0 ⇒ variabila dependentă/endogenă este explicată foarte puțin
SUPRAFATA 1.192039 0.400469 2.976607 0.0058 de variabila independentă/exogenă, ceea ce înseamnă că există
alţi factori care contribuie la evoluţia variabilei endogene.
R-squared 0.234024 Mean dependent var 130606.1
Adjusted R-squared 0.207611 S.D. dependent var 63550.77  F-statistics:
S.E. of regression 56570.50 Akaike info criterion 24.78670 Dacă probabilitatea aferentă acestui test este mai mică decât 0.05,
Sum squared resid 9.28E+10 Schwarz criterion 24.87922
atunci modelul este valid.
Log likelihood -382.1939 Hannan-Quinn criter. 24.81686
F-statistic 8.860192 Durbin-Watson stat 0.791055  Durbin-Watson:
Prob(F-statistic) 0.005829
Acest test indică corelația între erorile modelului. Acesta ar
trebui să se situeaza în jurul valorii 2 pentru ca erorile să NU fie
corelate și una din ipotezele modelul să fie validă.
9. Aplicarea modelului liniar al regresiei simple și interpretarea rezultatelor
Analiza parametrilor modelului:
a) Identificarea parametrilor modelului (Fereastra Equation → View → Representation sau
Fereastra Equation → View → Coefficient diagnostics → Scaled coefficients → coloana
Coefficient)
Pentru fiecare hectar suplimentar
Estimation Command:
=========================
cultivat cu floarea soarelui obținut,
LS PRODUCTIA C SUPRAFATA estimăm că producția agricolă este
de +1.19 ori mai mare. Notăm de
Estimation Equation: asemenea coeficientul liber 23,860
=========================
PRODUCTIA = C(1) + C(2)*SUPRAFATA hectare cultivate cu floarea soarelui
în Constanța.
Substituted Coefficients:
=========================
PRODUCTIA = 23860 + 1.19203856841*SUPRAFATA

b) Stabilirea intervalului de încredere (Fereastra Equation → View


→ Coefficient diagnostics → Confidence intervals → ok)
Interpretare: Valoarea parametrului real a se găsește în intervalul
aCoefficient
∊ […;…] cu o probabilitate de 99%/95%/90%.
Confidence Intervals
Date: 03/14/22 Time: 10:42
Sample: 1990 2020
Included observations: 31

90% CI 95% CI 99% CI


Variable Coefficient Low High Low High Low High

C 23860.32 -39471.40 87192.04 -52371.72 100092.4 -78878.71 126599.3


SUPRAFATA 1.192039 0.511591 1.872486 0.372988 2.011089 0.088192 2.295885
10. Testarea validităţii modelului (analiza reziduurilor)
Pentru ca modelul să fie valid, reziduurile trebuie să fie homoscedastice, neliniare și distribuite normal.

Fereastra Equation → View → Actual, fitted, residual → Actual, fitted, residual table/graph

Coloana Residual se afla prin diferenta dintre Actual si Fitted. Residual plot arata valorile valorilor
reziduurilor in functie de linia de regresie.
10. Testarea validităţii modelului (analiza reziduurilor)
1990 39834.0 61328.5 -21494.5
1991 48358.0 72313.1 -23955.1
1992 59173.0 85599.6 -26426.6
1993 70289.0 94185.8 -23896.8
1994 70524.0 93957.0 -23433.0
1995 98304.0 112142. -13837.5
1996 103936. 132733. -28796.8 300,000
1997 91140.0 104621. -13480.9 250,000
1998 125740. 144228. -18487.6
1999 146607. 154647. -8040.21
200,000
2000 104737. 147769. -43032.2 150,000
2001 41942.0 134765. -92823.2 200,000
100,000
2002 91940.0 152455. -60515.1 150,000
2003 159285. 203805. -44519.5 50,000
100,000
2004 181995. 165005. 16990.2 0
2005 171658. 147078. 24580.2 50,000
2006 254171. 192809. 61361.9 0
2007 92961.0 138879. -45917.9 -50,000
2008 136164. 130989. 5175.18
2009 101623. 137431. -35807.6 -100,000
90 92 94 96 98 00 02 04 06 08 10 12 14 16 18 20
2010 119958. 116856. 3101.99
2011 145219. 152729. -7510.22
Residual Actual Fitted
2012 125186. 156432. -31245.7
2013 149567. 143145. 6421.77
2014 164826. 131006. 33820.5
2015 151939. 137252. 14687.2
2016 115414. 115473. -59.2502
2017 258610. 120795. 137815.
2018 296518. 119011. 177507.
2019 230976. 127363. 103613.
2020 100194. 121989. -21794.9
10. Testarea validităţii modelului (analiza reziduurilor)

Testarea heteroscedasticităţii reziduurilor


Fereastra Equation → View → Residual diagnostics → Heteroskedasticity tests → White test.
Interpretare: Probabilitatile Test White trebuie sa fie ≥0,05 pentru a indica homoscedasticitatea reziduurilor,
care este una dintre ipotezele de validitate a reziduurilor și, implicit, a modelului.

Heteroskedasticity Test: White


Null hypothesis: Homoskedasticity

F-statistic 0.313655 Prob. F(2,28) 0.7333


Obs*R-squared 0.679303 Prob. Chi-Square(2) 0.7120
Scaled explained SS 1.403336 Prob. Chi-Square(2) 0.4958

→ Probabilitatea lui F-statistic de 0,7333 este >0,05. Prin


urmare, apare caracterul homoscedastic al reziduurilor,
motiv pentru care, din perspectiva acestui test, modelul
este validat. Homosce-dasticitatea reziduurilor este
necesară pentru validarea modelului (Prob. F ≥ 0,05).
10. Testarea validităţii modelului (analiza reziduurilor)

Testarea normalităţii reziduurilor


Fereastra Equation → View → Residual diagnostics → Histogram – normality test → apare fereastra cu
histograma, care trebuie interpretată conform specificațiilor din primele diapozitive privind statisticile descriptive.

12
Series: Residuals
Sample 1990 2020
10
Observations 31

8 Mean 2.82e-12
Median -13837.50
6 Maximum 177506.8
Minimum -92823.20
4 Std. Dev. 55619.67
Skewness 1.602665
2 Kurtosis 5.721235

Jarque-Bera 22.83571
0
-100000 -50000 0 50000 100000 150000 200000 Probability 0.000011
11. Concluzii

Sunt reluate principalele idei și rezultate din cadrul analizelor econometrice desfășurate anterior.
Nu sunt prezentate idei noi.
Menționăm dacă modelul este valid și care sunt motivele pentru care am ajuns la această concluzie.
Propunem direcții de cercetare pentru viitor, teme de cercetare similare pe care ne dorim să le abordăm.
Explicăm cum se poate extinde studiul curent, cum ar putea alți cercetători să îl îmbunătățească.
MULT SUCCES!
PENTRU ÎNTREBĂRI, VĂ ROG SĂ MĂ CONTACTAȚI
LA URMĂTOAREA ADRESĂ DE E-MAIL:

madalina.deaconu@eam.ase.ro

S-ar putea să vă placă și