Documente Academic
Documente Profesional
Documente Cultură
ECONOMETRIE
1. Pregătirea bazei de date în format Excel
a) Producția de floarea soarelui în Constanța (AGR109A - Productia agricola vegetala la principalele culturi, pe
forme de proprietate, macroregiuni, regiuni de dezvoltare si judete)
b) Suprafața cultivată cu floarea soarelui în Constanța (AGR108A - Suprafata cultivata cu principalele culturi, pe
forme de proprietate, macroregiuni, regiuni de dezvoltare si judete)
Se extrag valorile din TEMPO și se prelucrează în format Excel, precum în următorul slide (date cât mai recente, minim
15 observații).
Producția de floarea soarelui în Constanța Suprafața cultivată cu floarea soarelui în Constanța
Anul
(unitatea de măsură: tone) (unitatea de măsură: hectare)
140,000
Suprafața cultivatvă cu floarea soarelui în Constanța (u.m.: hecatare)
300,000
100,000
200,000
80,000
150,000
60,000
100,000
40,000
50,000
20,000
0 0
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020
În Eviews, opţiunea Histogram and Stats afişează distribuţia de frecvenţă a seriei analizate sub forma unei histograme.
Histograma împarte diametrul seriei (i.e. distanţa între valorile maxime şi minime), în mai multe intervale de lungime egală şi
afişează numărul de observaţii care se încadrează în fiecare interval. Lângă histogramă sunt afişate o serie de statistici
descriptive, care numere care oferă o imagine de ansamblu asupra distribuţiei seriei analizate.
• Mean reprezintă media seriei de date, obţinută prin însumarea tuturor valorilor şi împărţirea la numărul de observaţii.
• Median reprezintă mediana seriei de date, definită ca fiind valoarea din mijlocul seriei atunci când valorile acesteia sunt
ordonate în ordine crescătoare. Mediana este o măsură robustă a „tendinţei centrale”, fiind mai puţin sensibilă faţă de valori
aberante decât media.
• Max şi Min reprezintă valoarea maximă şi, respectiv, minimă înregistrată de serie pentru eşantionul curent.
• Std. Dev. reprezintă abaterea standard, care, aşa cum s-a mai discutat, este o măsură a dispersiei sau a „împrăştierii” valorilor
seriei faţă de medie.
• Skewness este o măsură a asimetriei funcţiei de densitate de repartiţie a seriei în jurul valorii sale medie. Statistica skewness
pentru o distribuţie simetrică, cum ar fi distribuţia normală, este întotdeauna zero. O valoare pozitivă semnifică faptul că
distribuţia are „coada” din partea dreaptă mai lungă, iar o valoare negativă implică faptul că distribuţia are „coada” din partea
stângă mai lungă.
• Kurtosis este o măsură a amplitudinii funcţiei de densitate, a aplatizării acesteia în raport cu funcţia de densitate a distribuţiei
normale. Valoarea acestei statistici pentru o serie distribuită normal este 3. Dacă statistica înregistrează o valoare mai mare decât
3, se spune că distribuţia este leptokurtică, iar dacă are o valoare mai mică decât 3, distribuţia este platikurtică.
• Jarque-Bera: cu H0 (distributie normală) și H1 (distribuție anormală). Daca p-value este mai mare decât 0.05, ipoteza nulă este
acceptată. Dacă probabilitatea este mai mică decât 0.05, ipoteza nula este respinsă și datele trebuie transformate pentru a prezenta
o distribuție normală.
5. Scatter Regression Line Graph în EViews
Selectati variabilele -> click dreapta -> Open -> as Group -> View -> Graph -> Graph options -> Specific: Scatter ->
Details, Fit lines: selectati Regression line.
6. Elaborarea corelogramelor pentru cele două variabile alese
Date: 03/08/22 Time: 11:23 Date: 03/08/22 Time: 11:25
Sample: 1990 2020 Sample: 1990 2020
Included observations: 31 Included observations: 31
Autocorrelation Partial Correlation AC PAC Q-Stat Prob Autocorrelation Partial Correlation AC PAC Q-Stat Prob
Corelograma indică trendul şi sezonalitatea evoluţiei datelor. Pentru a nu înregistra sezonalitate coloanele indicate de
corelogramă nu trebuie să depăşească liniile punctate din stânga şi din dreapta. Astfel, dacă se încadrează în limitele
impuse de liniile punctate nu există sezonalitate.
În plus, este indicată autocorelaţia faţă de 12 laguri (adică perioada de timp, ani în cazul vostru). În exemplele de
mai sus (cei doi indicatori analizați în slide-urile anterioare), nu se observă prezenţa autocorelării valorilor.
7. Testarea staționarității variabilelor modelului – ipoteză necesară a fi îndeplinită pentru
validitatea modelului
Selectați variabila → click dreapta → Open → View → Unit Root Test → selectăm opțiunea Augumented Dickey-Fuller → testăm
exisțenta unei rădacini unitate pentru cele 3 niveluri – Level, 1st difference, 2nd difference – și includem în testare existența unei
constante (intercept) sau a unui trend împreuna cu constanta (trend and intercept) sau inexistența ambelor (none), până identificam
nivelul la care apare staționaritatea → OK.
Dacă probabilitatea aferenta testului t-statistics (Prob.) are o valoare sub 0.05 și valoarea în modul a testului Dickey-Fuller este mai
mare decât cele 3 valori critice în modul ale testului (Test critical values) de pe coloana t-statistics, atunci ipoteza nulă de existență a
unei rădacini unitate poate fi respinsă și, deci, datele sunt staționare. În caz contrar, dacă probabilitatea aferentă testului t-statistics
(Prob.) are o valoare mai mare de 0.05 și/sau valoarea în modul a testului Dickey-Fuller este mai mică decât cele 3 valori critice în
modul ale testului (Test critical values) de pe coloana t-statistics, atunci ipoteza nulă este confirmată și, deci, datele NU sunt
staționare. Astfel, în acest caz, trebuie testat nivelul diferentelor până când staționaritatea este identificată.
Odată identificată staționaritatea, datele inițiale trebuie transformate astfel încat să devina staționare: Selectati meniul Genr / Quick
+ Generate Series → introduceți ecuația de logaritmare.
7. Testarea staționarității variabilelor modelului – ipoteză necesară a fi îndeplinită pentru
validitatea modelului
7. Testarea staționarității variabilelor modelului – ipoteză necesară a fi îndeplinită pentru
validitatea modelului
Datele inițiale trebuie transformate astfel încat să devina staționare: Selectati meniul Genr / Quick + Generate Series → introduceți
ecuația de logaritmare (de exemplu: lproductie=log(productie) pentru a obține logaritmul natural pentru seria productie). Seria nou-
obținută o vom utiliza în continuare, deoarece modelul trebuie construit cu date staționare.
8. Stabilirea modelului care va fi testat:
Testarea cauzalităţii dintre variabile:
Pentru testarea cauzalităţii dintre variabile, adică a direcţiei de influenţă regăsită între cele două variabile se
aplică testul Granger. Selectarea variabilelor modelului → click dreapta → Open → View → Granger
causality → lag specification (rămâne implicit 2) → apare fereastra cu rezultate.
Interpretare rezultate: Dacă probabilitatea aferentă lui F-statistic este mai MICĂ decât 0,05, atunci există o
relaţie cauzală între cele două variabile, cu referire la faptul că prima variabilă menţionată influenţează a
doua variabilă. Contrar, dacă probabilitatea aferentă lui F-statistic este mai MARE decât 0,05, atunci NU
există o relaţie cauzală între cele două variabile, adică prima variabilă menţionată NU influenţează a doua
variabilă. !Atenţie! Există posibilitatea cauzalităţii doar într-o singură direcţie, adică doar o variabilă poate
influenţa a doua variabilă fără a exista situaţia viceversă.
a) Producția de floarea soarelui în Constanța (AGR109A - Productia agricola vegetala la principalele culturi, pe forme de
proprietate, macroregiuni, regiuni de dezvoltare si judete) = Variabila dependentă
b) Suprafața cultivată cu floarea soarelui în Constanța (AGR108A - Suprafata cultivata cu principalele culturi, pe forme de
proprietate, macroregiuni, regiuni de dezvoltare si judete) = Variabila independentă
8. Stabilirea modelului care va fi testat :
Observăm că probabilitatea aferenta testului F-statistic este în ambele cazuri mai mare decat 0,05 → ceea ce
demonstrează că modificarea suprafeței nu cauzează producția de floarea soarelui în județul Constanța, situație
similară și în dinamica producție → suprafață. Totuși, observăm că Prob. este la o mică diferența peste valoarea
de 0,05 → așadar vom considera suprafața cultivată cu floarea soarelui ca fiind variabila dependentă, iar
suprafața cultivată o vom considera variabila independentă.
8. Stabilirea modelului care va fi testat:
Aplicarea modelului liniar al regresiei simple și interpretarea rezultatelor:
Selectarea variabilelor modelului → Open → as Equation → se deschide fereastra Equation Estimation
9. Aplicarea modelului liniar al regresiei simple și interpretarea rezultatelor
Aplicarea modelului liniar al regresiei simple și interpretarea rezultatelor:
Testul t-statistics:
Dacă probabilitatea aferenta acestui test este mai mică decât 0.05,
Dependent Variable: PRODUCTIA
Method: Least Squares atunci variabila introdusă în model este bine aleasă și produce
Date: 03/14/22 Time: 10:40 efecte asupra variabilei endogene.
Sample: 1990 2020
R-squared (R2), coeficientul de determinație ∊ [0,1]:
Included observations: 31
-> 1 ⇒ modelul indică o influență puternică a variabilei
Variable Coefficient Std. Error t-Statistic Prob. independente/exogene asupra variabilei dependente/endogene.
C 23860.32 37273.09 0.640149 0.5271 -> 0 ⇒ variabila dependentă/endogenă este explicată foarte puțin
SUPRAFATA 1.192039 0.400469 2.976607 0.0058 de variabila independentă/exogenă, ceea ce înseamnă că există
alţi factori care contribuie la evoluţia variabilei endogene.
R-squared 0.234024 Mean dependent var 130606.1
Adjusted R-squared 0.207611 S.D. dependent var 63550.77 F-statistics:
S.E. of regression 56570.50 Akaike info criterion 24.78670 Dacă probabilitatea aferentă acestui test este mai mică decât 0.05,
Sum squared resid 9.28E+10 Schwarz criterion 24.87922
atunci modelul este valid.
Log likelihood -382.1939 Hannan-Quinn criter. 24.81686
F-statistic 8.860192 Durbin-Watson stat 0.791055 Durbin-Watson:
Prob(F-statistic) 0.005829
Acest test indică corelația între erorile modelului. Acesta ar
trebui să se situeaza în jurul valorii 2 pentru ca erorile să NU fie
corelate și una din ipotezele modelul să fie validă.
9. Aplicarea modelului liniar al regresiei simple și interpretarea rezultatelor
Analiza parametrilor modelului:
a) Identificarea parametrilor modelului (Fereastra Equation → View → Representation sau
Fereastra Equation → View → Coefficient diagnostics → Scaled coefficients → coloana
Coefficient)
Pentru fiecare hectar suplimentar
Estimation Command:
=========================
cultivat cu floarea soarelui obținut,
LS PRODUCTIA C SUPRAFATA estimăm că producția agricolă este
de +1.19 ori mai mare. Notăm de
Estimation Equation: asemenea coeficientul liber 23,860
=========================
PRODUCTIA = C(1) + C(2)*SUPRAFATA hectare cultivate cu floarea soarelui
în Constanța.
Substituted Coefficients:
=========================
PRODUCTIA = 23860 + 1.19203856841*SUPRAFATA
Fereastra Equation → View → Actual, fitted, residual → Actual, fitted, residual table/graph
Coloana Residual se afla prin diferenta dintre Actual si Fitted. Residual plot arata valorile valorilor
reziduurilor in functie de linia de regresie.
10. Testarea validităţii modelului (analiza reziduurilor)
1990 39834.0 61328.5 -21494.5
1991 48358.0 72313.1 -23955.1
1992 59173.0 85599.6 -26426.6
1993 70289.0 94185.8 -23896.8
1994 70524.0 93957.0 -23433.0
1995 98304.0 112142. -13837.5
1996 103936. 132733. -28796.8 300,000
1997 91140.0 104621. -13480.9 250,000
1998 125740. 144228. -18487.6
1999 146607. 154647. -8040.21
200,000
2000 104737. 147769. -43032.2 150,000
2001 41942.0 134765. -92823.2 200,000
100,000
2002 91940.0 152455. -60515.1 150,000
2003 159285. 203805. -44519.5 50,000
100,000
2004 181995. 165005. 16990.2 0
2005 171658. 147078. 24580.2 50,000
2006 254171. 192809. 61361.9 0
2007 92961.0 138879. -45917.9 -50,000
2008 136164. 130989. 5175.18
2009 101623. 137431. -35807.6 -100,000
90 92 94 96 98 00 02 04 06 08 10 12 14 16 18 20
2010 119958. 116856. 3101.99
2011 145219. 152729. -7510.22
Residual Actual Fitted
2012 125186. 156432. -31245.7
2013 149567. 143145. 6421.77
2014 164826. 131006. 33820.5
2015 151939. 137252. 14687.2
2016 115414. 115473. -59.2502
2017 258610. 120795. 137815.
2018 296518. 119011. 177507.
2019 230976. 127363. 103613.
2020 100194. 121989. -21794.9
10. Testarea validităţii modelului (analiza reziduurilor)
12
Series: Residuals
Sample 1990 2020
10
Observations 31
8 Mean 2.82e-12
Median -13837.50
6 Maximum 177506.8
Minimum -92823.20
4 Std. Dev. 55619.67
Skewness 1.602665
2 Kurtosis 5.721235
Jarque-Bera 22.83571
0
-100000 -50000 0 50000 100000 150000 200000 Probability 0.000011
11. Concluzii
Sunt reluate principalele idei și rezultate din cadrul analizelor econometrice desfășurate anterior.
Nu sunt prezentate idei noi.
Menționăm dacă modelul este valid și care sunt motivele pentru care am ajuns la această concluzie.
Propunem direcții de cercetare pentru viitor, teme de cercetare similare pe care ne dorim să le abordăm.
Explicăm cum se poate extinde studiul curent, cum ar putea alți cercetători să îl îmbunătățească.
MULT SUCCES!
PENTRU ÎNTREBĂRI, VĂ ROG SĂ MĂ CONTACTAȚI
LA URMĂTOAREA ADRESĂ DE E-MAIL:
madalina.deaconu@eam.ase.ro