Sunteți pe pagina 1din 14

ACADEMIA DE STUDII ECONOMICE DIN BUCUREŞTI

FACULTATEA DE CIBERNETICĂ, STATISTICĂ ŞI INFORMATICĂ ECONOMICĂ

PROIECT ECONOMETRIE

Coordonator: Student:
Spătaru Silvia Necula Alexandra-Georgiana, grupa 1071, seria A

BUCUREŞTI
2018
1. Definirea temei economice
Am ales dezvoltarea unei analize în domeniul demografic și economic pentru anul 2016, ce
constă în identificarea influenței ratei de angajare și a venitului mediu asupra ratei natalității pentru
30 de țări, pe baza unor modele statistice.
Natalitatea reprezintă frecvența nașterilor de copii vii în cadrul unei populații, exprimată prin
raportul dintre numărul de nașteri dintr-un an și efectivul populației. Rata natalității raportează
numărul nașterilor din cursul anului la populația medie din anul respectiv. Valoarea este exprimata la
1000 locuitori, în procente.
Rata de angajare sau de ocupare a forței de muncă, cu alte cuvinte procentajul de persoane
angajate din totalul populației în vârstă de muncă, este un indicator social cheie utilizat în scopuri
analitice pentru studiul evoluțiilor de pe piețele muncii.
Venitul reprezintă sursa de finanțare pentru fiecare țară, fiind exprimat în euro.
Așadar, în cadrul modelelor ne vom aștepta ca la o creștere a ratei de angajare, dar și a
venitului mediu, rata natalității să înregistreze de asemenea o dezvoltare.
În tabelul de mai jos sunt prezentate datele asupra cărora vor fi aplicate modelele (30 de
observații), acestea fiind preluate de pe ec.europa.eu/eurostat.
Modelul econometric are urmatoarea forma: Y = β0 + β1 * X1 + β2 * X2 + εt , unde:
Y- rata burtă a natalității; X1- rata de angajare; X2- venitul mediu.

2. Modelul unifactorial de regresie


Coeficientul de corelaţie: calculat în Excel:

rxy=0.67346929 se află în intervalul (0,1) și este mai apropiat de 1=> legătura este puternică și

directă.

Estimarea parametrilor modelului în Excel prin MCMMP


Am ales să aplic Regresia pentru variabila Y (rata brută a natalității) și X2(rata de angajare)
pentru a afla dacă există o influență a ratei de angajare asupra ratei natalității.
OUTPUT:
Estimarea parametrilor modelului cu ajutorul EViews
OUTPUT:

a) Interpretarea valoarii obținute pentru parametrul pantă.


Între Rata bruta a natalității (variabila Y) și rata de angajare (variabila X) există o relație de
forma: yi=β0+β1xi+εi

Pentru a determina estimatorii parametrilor β0 și β1 ( a, respectiv b) s-a realizat regresia în


Excel și în Eviews.

Astfel, funcţia de regresie a modelului: yi =2.440 + 0.1075 x1


b = ^β 1 ≈ 0.1075 măsoară panta dreptei de regresie şi arată că, în cazul unei rate de angajare (X1)
cuprinse intre 56.2 mii% şi 87.8%, atunci când X1 creşte cu 1%, rata natalității(Y) va crește, în
medie, cu 10.75%.

a = ^β 0 ≈ 2.440 arată nivelul ratei natalității(Y), atunci când rata de angajare(X1) este 0. Acest
parametru de interceptare nu are semnificație economică, ci se interpretează ca fiind efectul mediu asupra lui
Y, al tuturor factorilor care nu sunt luați în considerare în modelul de regresie.

b) Testarea semnificației statistice a parametrului pantă.


Ipoteze:
 H0:b=0 (parametrul pantă ^β 1 nu este semnificativ statistic)
 H1:b ≠0 (parametrul pantă ^β 1 este semnificativ statistic)
b 0.1075
Statistica folosită este t= = , care urmează o distribuție de tip Student cu 28 (n-2)
sb 8.9039
grade de libertate. În urma efectuării calculelor în Excel, se obțin: se=0.8084, sb≈8.9039, ceea ce
înseamnă o valoare a testului t calculat de 0.0120. Această valoare se compară cu valoarea tabelară
ce corespunde( la un prag de semnificație de 5%) unei valori de: t0,025,28=2.0484.

tcalc =0.0120 < ttab = 2.0484 => respingem H1 și acceptăm ipoteza alternativă => parametrul pantă
nu este semnificativ din punct de vedere statistic

Interval de încredere pentru parametrul pantă β1

(b − tα / 2;n−2* sb) ≤ β1 ≤ ( b + tα / 2;n−2 * sb)

0.1075 - 2.0484 * 8.9039 ≤ β1 ≤ 0.1075 + 2.0484 * 8.9039

-18.1312 ≤ β1 ≤ 18.3462

Intervalul de încredere obținut pentru parametrul pantă arată că pentru un coeficient de


încredere de 95%, în 95 de situații din 100, valoarea totală a ratei de angajare se va afla în
intervalul (-18.1312 ≤ β1 ≤ 18.3462).

c) Testarea validității modelului de regresie


Ipoteze:
 H0: MSR=MSE (modelul nu este valid statistic)
 H1: MSR>MSE (modelul este valid statistic)

MSR=15.2258
MSE=0.6551
Deci, MSR>MSE si rezulta ca modelul este valid statistic.
Statistica folosită este testul F, care în acest caz, în urma calculelor efectuate cu ajutorul
Excel are valoarea de 23.2408. Această valoare se compară cu valoarea tebelară: F 0.05;1;28=4.20. Cum
valoarea obținută este mai mare decât valoarea tabelară( teoretică), respingem ipoteza nulă,
acceptăm ipoteza alternativă, modelul este valid statistic.
Fcalculat = 23.2408 > Fcritic = 4.20

d) Verificarea îndeplinirii celor mai importante ipoteze ale modelului de regresie pe


baza analizei reziduurilor (Ataşați rezultatele obținute folosind Eviews).

1. Testarea homoscedasticității/heteroscedasticității erorilor aleatoare (testul White);


Ipoteze:

 H0: β1= β = 0 (erorile aleatoare sunt homoscedastice)


 H1: :(Ǝ) βi ≠0, i =1,2 i (erorile aleatoare sunt heteroscedastice)

Testul White solicită ca, după determinarea reziduurilor din regresia originală, să se calculeze o
regresie auxiliară a pătratelor reziduurilor în raport cu o constantă, variabilele explicative ale
modelului original, pătratele lor si produsele lor încrucișate.
Prin aplicarea directă a Testului White în Eviews obținem următoarele rezultate:

Observăm că Prob. (F-statistic) = 0,6228, iar Prob. (Chi-square statistic) = 0,5963.


Deoarece P-value > α (0.5963 > 0.05) respingem H1 şi acceptăm H0 ⇒ erorile aleatoare sunt
homoscedastice.

2. Testarea autocorelării erorilor aleatoare;


Ipoteze:

 H0: ρ = 0 (: nu există autocorelarea erorilor aleatoare)


 H1: ρ ≠ 0 (există corelare de ordin 1 a erorilor aleatoare)

Se calculează valoarea statisticii DW=1.31(luata din modelul de regresie) .

Analizând tabelul distribuției Durbin-Watson obținem valorile critice d1= 1.35 și d2= 1.49( pentru
un prag de semnificație de 5%, n=30, k=1). Se observă că valoarea obținută se încadrează în
intervalul 0-d1 (0<1.31<1.35) ceea ce înseamnă că acceptăm ipoteza H1- există autocorelare de
ordinul I pozitivă a erorilor aleatoare(ρ > 0). Această autocorelare trebuie eliminată prim MCMP
generalizată. Aplicând această metodă în Eviews, se obțin următoarele rezultate:

Quick/Estimate Equation: y c x ⇒ Salvăm ecuația cu numele EQ01

genr et=resid

scalar ro1=1-@dw/2 (ro1=-0,197132)


genr dy= y___rata_brut__a_natalit-ro1* y___rata_brut__a_natalit (-1)

genr dx= x1___rata_de_angajare__p-ro1* x1___rata_de_angajare__p (-1)

Quick/Estimate Equation: dy c dx ⇒ Salvăm ecuația cu numele EQ03


scalar beta0=c(1)/(1-ro1) (beta0=1.709173)

Din analiza rezultatelor se observă că am obținut modelul: yi= 2.0461+ 0.1172*xi, ce are
valoarea pentru R-squared mai mare decât modelul anterior și o valoare a testului Durbin-Watson de
2.0486, valoare ce se încadrează în intervalul [d2,4-d2] (1.35 < 2.0486 > 1.49) ceea ce arată că
autocorelarea erorilor aleatoare nu a fost eliminată, acestea sunt dependente.

3. Testarea distribuției normale a erorilor aleatoare (testul Jarque-Bera).

Acest test calculează mai întâi coeficientul de asimetrie (Skewness) si coeficientul de


boltire(Kurtosis) pentru reziduurile obținute. Ipoteze:

 H0: Reziduurile au distribuție normală ( S = 0 si K = 3 )


 H1: Reziduurile nu au distribuție normală
Interpretarea rezultatelor:

Jarque-Bera = 0,059527

Probability = 0,970675

Deoarece Probabilitatea asociată statisticii JB este > 0,05 acceptăm H0. =>Reziduurile au
distribuție normală.

e) Determinarea unei prognoză pe interval de încredere pentru variabila dependentă Y


dacă variabila X creşte cu 20% față de ultima valoare înregistrată.

x20= 77.1+ 77.1*20%= 77.1+15.42= 92.52 (din tabelul excel)

Valoarea previzionată:

yi=a+bxi y20= 10.1+ 0.1075 *x20 y20= 83.7113

3. Modelul multifactorial de regresie


Modelul folosit este: yi=β0+β1xi+ β2zi+εi , unde Y este rata brută a natalității, X1 este rata de
angajare, iar X2 este valoarea venitul mediu.

Estimarea parametrilor în Excel:


Estimarea parametrilor în EViews:

Din analiza celor două figuri se observă că obținem ecuația de regresie:

Y = β0 + β1 * X1 + β2 * X2 + εt

Y=2.437188+0.107631*X1+(-0,000124)*X2+ εt

a) Interpretarea valorilor obținute pentru parametrii pantă.

 β1= 0.107631 arată că, în perioada analizată, menținând celelalte variabile constante, atunci
când rata de angajare(X1) creste cu o unitate, rata brută a natalității crește, în medie, cu
0.107631 procente.
 β2= -0,000124 arată că, în perioada analizată, menținând celelalte variabile constante, atunci
când venitul mediu(X2) scade cu un euro, rata brută a natalității scade, în medie, cu 0,000124
procente.
 β0= 2.437188 arată că, dacă cele două variabile explicative, X1 si X2 au valoarea 0, rata
brută a natalității este estimată la 2.437188 procente.

b) Verificarea existenței multicoliniarității variabilelor explicative.

Pentru a analiza multicoliniaritatea variabilelor explicative am calculat matricea de corelație


dintre rata de angajare si venitul mediu:

Între variabilele X1 şi X2 există o legătură directă perfectă.

rx1,x2=0.366606 => Variabilele X1 și X2 au o legatura slabă și directă

Criteriul lui Klein.

Se foloseste pentru identificarea dependențelor liniare dintre 2 variabile exogene. Variabilele xi , xj


sunt coliniare dacă Ry2<r2xi , xj.

Pas1. Se estimează modelul complet si se reține R-Squared, notat Ry2.

Regresăm variabila X2 în raport cu var. X1:


Pas2. Se calculează matricea de corelații liniare ale variabilelor explicative r (xi , xj )
1<=i,j<=k

Pas3. Dacă Ry2<r 2xi , xj se identifică perechile de variabile puternic corelate (xi , xj )

Ry2=0,4535 , r2x1 , x2=0,1344, Ry2 > r 2x1, x2 => variabilele sunt slab corelate => nu există
multicoliniaritate.

4.Concluzii
În urma testelor efectuate se poate observa că Venitul mediu are o influență mare asupra ratei
brute a natalității, având o legătura puternică și directă, distribuția reziduurilor fiind nomală, iar
fenomeul de multicoliniaritate intre Venitul mediu si rata brută a natalității nu există.

În urma analizelor și testelor efectuate asupra modelului unifactorial, se constată Rata brută
a natalității este explicată în tr-o mica masura de variabila rata de angajare.

Ecuația de regresie a modelului unifactorial este: : Y=2.440 + 0.1075. Parametrul panta nu


este semnificativ statistic.

Testele asupra reziduurilor arată faptul că erorile sunt homoscedastice.

În concluzie, putem afirma că modelul este valid.

În urma analizelor și testelor efectuate asupra modelului multifactorial, se constata ca rata


brută a natalității din 30 țări este explicată in mare măsură de variabilele exogene rata de angajare si
venitul mediu si ca exista o legatura liniara intre cele 3 variabile.
Legatura dintre variabile este modelata de urmatoarea ecuatie de regresie:

Y=2.437188+0.107631*X1+(-0,000124)*X2+ εt

Testele asupra reziduurilor arata faptul ca variabilele sunt slab corelate.

5.Bibliografie
 http://ec.europa.eu/eurostat

 Seminariile de Econometrie

S-ar putea să vă placă și