Sunteți pe pagina 1din 8

ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI, FACULTATEA DE

CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

PROIECT ECONOMETRIE
Analiza influenței variabilelor “Populatia rurala” și “Suprafata terenurilor
arabile” asupra “Ratei angajarii in domeniul agricol”

PROF. COORDONATOR: STUDENT:


Conf. univ. dr. SPĂTARU SILVIA Tuliga Mihai-Alexandru
Grupa 1085, Seria D

București, 2019
Capitolul 1 - Prezentarea problemei
Problema aleasa presupune analiza datelor legate de populatia rurala, suprafata terenurilor
arabile si rata angajarii in domeniul agricol pentru 30 de valori (tari) diferite. Localizarea pe
glob a tarilor a fost selectata in mod aleatoriu, rezultand in tari alese din diverse parti ale
lumii. Perioada selectata a fost 2016-2019, intrucat unii indicatori nu sunt recalculati anual.
Datele selectate pot fi observate in tabelul de mai jos. Analizarea acestor date reprezinta un
factor important in generarea unei imagini de ansamblu asupra legaturilor dinte populatia
rurala, suprafata terenurilor arabile si rata angajarii in domeniul agricol, elemente
importante in contextul economic al unei tari.
X1 X2 Y
27695,00 11,80 38
1137,00 26,60 38
Variabele independente sunt X1 si X2 si reprezinta: 11558,00 3,10 9
10625,00 3,90 40
X1 - populatia rurala (mii)
2736,00 2,90 72
X2 - suprafata terenurilor arabile (%) 1087,00 15,70 33
3495,00 6,00 3
Varibila dependenta Y este reprezentata de rata angajarii in 3689,00 16,30 4
domeniul agricol (%). 4406,00 24,20 36
65,00 0,80 3
168,00 2,10 1
102248,00 59,60 40
Sursa X1: https://data.worldbank.org/indicator/SP.RUR.TOTL?view=chart
197,00 16,30 3
Sursa X2: 2030,00 28,00 10
https://data.worldbank.org/indicator/AG.LND.ARBL.ZS?view=chart 228,00 28,10 1
207,00 3,40 17
Sursa Y:
6051,00 23,90 41
https://data.worldbank.org/indicator/SL.AGR.EMPL.ZS?view=chart
445,00 2,60 56
3471,00 4,10 28
1720,00 20,00 16
688,00 0,50 23
28133,00 9,70 9
95,00 0,90 1
1755,00 32,20 7
13952,00 21,90 28
9719,00 46,70 92
186,00 12,40 13
12449,00 21,50 30
11000,00 13,10 46
6888,00 4,80 1
Output Excel (ANOVA):

Regression Statistics
Multiple R 0,313560012
R Square 0,098319881
Adjusted R Square 0,031528761
Standard Error 22,32100459
Observations 30

ANOVA
df SS MS F Significance F
Regression 2 1466,831028 733,415514 1,47205 0,247291204
Residual 27 13452,13564 498,227246
Total 29 14918,96667

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 17,00882343 6,107576496 2,78487276 0,009668 4,477111591 29,5405353

X Variable 1 2,86882E-05 0,000261381 0,10975621 0,913414 -0,000507621 0,000565

X Variable 2 0,477312325 0,351055424 1,35964948 0,185188 -0,242993907 1,19761856

Output EViews (ANOVA):


Capitolele 2 + 3 - Modelul de regresie si estimarea parametrilor modelului prin metoda
celor mai mici pătrate
y = 17.00882 + 2.87E-05x1 + 0.477312x2
a. Interpretați valoarea obținută pentru parametrul pantă
̂ =17,00882343 - termen liber, nu are interpretare economica
𝜷𝟎
̂𝟏 =2,86882E-05= 2.87E-05 < 1 Arată că mentinand celelalte variabile constante, atunci cand populatia
𝜷
rurala creste cu 1 unitate (1000 locuitori), rata angajarii in domeniul agricol creste in medie cu 2,87%.
Panta dreptei de regresie b1 arată cu câte puncte procentuale se modifică, în medie, rata angajarii in
domeniul agricol, daca procentul suprafetei arabile creste cu 1 punct procentual.
𝜷𝟐 = 0.477312 Arata ca mentinand celelate variabile constante, atunci cand procentul suprafetei
terenurilor arabile creste cu 1%, rata angajarii in domeniul agricol creste in medie cu 0.477312%
b. Testați semnificația statistică a paramentrului pantă.
HO: β0 = 0 (β1 nu este semnificativ statistic)
H1: β0 ≠ 0 (β1 este semnificativ statistic)
Statistica t urmează o distribuție Student cu (n-3) grade de libertate dacă H0 este adevărată.
ttabelat=tα/2;n-k-1=tα/2;n-3=t0.025;27= 2.373417200913. Pentru a determina valoarea tabelară a lui tcritic am folosit
funcția din Excel T.INV(0.025,27)
𝑏0−0 𝑏0 17.00882
tclaculat= = 𝑠𝑏0= 6.107576 =2.78
𝑠𝑏0

unde: b0 este valoarea coeficientului și sb0 este valoarea erorii standard.


Deoarece 2.78> 2.373, adica tcalculat aparține Rc, exista suficiente dovezi pentru a respinge ipoteza nula și a
accepta ipoteza alternativă 𝐻1 , rezultând că parametrul pantă este semnificativ statistic, unde:
Rc = (-∞; tcritic) U (tcritic; +∞)

HO: β1 = 0 (β1 nu este semnificativ statistic)


H1: β1 ≠ 0 (β1 este semnificativ statistic)
Statistica t urmează o distribuție Student cu (n-3) grade de libertate dacă H0 este adevărată.
ttabelat=tα/2;n-k-1=tα/2;n-3=t0.025;27= 2.373417200913. Pentru a determina valoarea tabelară a lui tcritic am folosit
funcția din Excel T.INV(0.025,27)
𝑏1−0 𝑏1 2.87E−05
tclaculat= = 𝑠𝑏1= 0.000261 =10996.16
𝑠𝑏1

unde: b1 este valoarea coeficientului și sb1 este valoarea erorii standard.

Deoarece 10996.16> 2.373, adica tcalculat aparține Rc, exista suficiente dovezi pentru a respinge ipoteza nula
și a accepta ipoteza alternativă 𝐻1 , rezultând că parametrul pantă este semnificativ statistic, unde:
Rc = (-∞; tcritic) U (tcritic; +∞)
c. Testați validitatea modelului de regresie. Modelul trebuie să fie valid statistic.
Pentru testarea validității modelului se formulează ipotezele:

H0: MSR=MSE (modelul de regresie nu este valid sau nu este semnificativ statistic), cu alternativa:
H1: MSR>MSE (modelul de regresie este valid sau semnificativ statistic).

Statistica utilizată pentru a decide care dintre ipoteze se acceptă este:

k - număr de variabile explicative din modelul de regresie ( pentru exemplul prezentat, k=2
deoarece avem doua variabile explicative).
α - nivelul sau pragul de semnificație al testului, unde α=5%=0.05.

Pentru calculul statisticii Fcalculat se va folosi tabelul ANOVA

Fcritic = Fα;k;n-k-1= 3.354130828543. Pentru a determina valoarea tabelară a lui Fcritic am folosit funcția
din Excel F.INV.RT(0.05,2,27)

Fcritic = Fα;k;n-k-1= 3.354130828543


Fcalculat = 1.47205
Fcalculat < Fcritic => respingem 𝐻1 , acceptam 𝐻0 => Modelul nu este valid statistic pentru un nivel de
semnificatie α=5%.
Capitolul 4 - Verificarea ipotezelor clasice formulate asupra modelului de regresie liniară
1. Testarea homoscedasticității/heteroscedasticității erorilor aleatoare (testul White)

𝐻0 : 𝑎1 = 𝑎2 (erorile aleatoare sunt homoscedastice)


̅̅̅̅ (erorile aleatoare sunt heteroscedastice)
𝐻1 : (∃) j a.i. 𝑎𝑗 ≠ 0, i = 1,2

Prob (Chi-Square) = 0.0311


Deoarece 0.0311 < 𝛼 = 0.05 => acceptăm 𝐻1 și respingem 𝐻0 , ceea ce inseamna ca erorile aleatoare
sunt heteroscedastice.

2. Testarea distribuției normale a erorilor aleatoare (testul Jarque-Bera)


𝑯𝟎 : reziduurile au distributie normal (S=0, K=3)
𝑯𝟏 : reziduurile nu au distributie normal
Statistica Jarque-Bera = 5.013615
Probability (JB) = 0.081528
Deoarece probabilitatea asociată statisticii JB > 0.05, acceptam 𝐻0 și respingem H1=> Reziduurile au
distributie normală.

3. Testul BREUSCH-GODFREY
H0: nu există Autocorelarea de oridin r a erorilor aleatoare
H1: există Autocorelarea de ordin r a erorilor aleatoare

F-statistic = 1.549034

Prob. F (2,25) = 0.2322 > ∝ = 5%=0.05


 respingem H1 și acceptăm H0, ceea ce înseamnă că nu există autocorelare de ordin I

Capitolul 5 - Previzionarea valorii variabilei dependente Y pentru anumite valori ale


variabilelor explicative
y = 17.00882 + 2.87E-05 * 2 + 0.477312 * 3
y = 24,18
Atunci cand variabilei X1 i se atribuie valoarea 2, iar variabilei X2 valoarea 3, rezulta ca variabila dependenta
Y va lua valoarea de 24,18, reprezentand rata angajarii in domeniul agricol de 24,18%.

In cazul in care variabilei X2 (suprafata terenurilor arabile) valoarea negativa -3, atunci se va observa o
scadere a ratei angajarii in domeniul agricol.
y = 17.00882 + 2.87E-05 * 2 + 0.477312 * (-3)
y = 21,31

Pentru X2 = 2 =>
y = 17.00882 + 2.87E-05 * 2 + 0.477312 * 2
y = 23,70
Diferenta de un procent al suprafetei terenurilor arabile in conditia in care celelalte variabile raman
constante, duce la urmatoarea schimbare:
X2 = 3 => y = 24,18
X2 = 2 => y = 21,31 (scadere cu 2,87 puncte procentuale a ratei angajarii in domeniul agricol)

S-ar putea să vă placă și