Sunteți pe pagina 1din 10

Realizatori:

Bucuresti
Modelul simplu de regresie

Produsul intern brut (PIB) este un indicator macroeconomic care reflecta suma valorii
de piata a tuturor marfurilor si serviciilor destinate consumului final, produse in toate ramurile
economiei in interiorul unui stat in decurs de un an.
Dupa asa numitul calcul dupa intrebuintare, PIB-ul este suma cheltuielilor pentru
consum a gospodariilor private si a organizatiilor private non-profit, a cheltuielilor brute
pentru investitii, a cheltuielilor statului, a investitiilor in scopul depozitarii ca si castigurile din
export din care se scad cheltuielile pentru importuri.
PIB = consum + investitii + exporturi – importuri
Exportul reprezinta o cheltuiala pe care strainatatea o face pentru achizitionarea de
bunuri produse de economia nationala.
Astfel, calculul PIB-ului prin aceasta metoda dezvaluie faptul ca exportul poate
influenta o modificare a nivelului produsului intern brut.
In tabelul de mai jos sunt inscrise date statistice referitoare la valorile PIB si
exporturile Romaniei in perioada 1990-2005 (in miliarde USD).
Exporturile au fost evaluate la pretul FOB (Free On Board), acesta reprezentand pretul
la frontiera tarii exportatoare, care include valoarea marfii, toate cheltuielile de transport pana
la punctual de imbarcare, precum si toate taxele suportate pentru ca marfa sa fie imbarcata la
bord.

Y X
Anul PIB (mld USD) Export (mld USD)
1991 28,9 4,266
1992 19,6 4,363
1993 26,3 4,892
1994 30 6,151
1995 35,4 7,91
1996 35,3 8,084
1997 35,2 8,431
1998 38,1 8,302
1999 35,6 8,487
2000 37 10,367
2001 40,1 11,385
2002 45,8 13,876
2003 56,9 17,618
2004 73,1 23,485
2005 98,6 27,73

Pornind de la aceste date vom incerca sa aratam influenta variabilei independente


Export (X) asupra variabile dependente, PIB (Y).

Pentru a putea intui forma modelului de regresie am realizat un grafic de tipul XY


(Scatter), cu ajutorul aplicatiei Excel.

2
Evolutia PIB in raport cu exporturile FOB in
Romania

120
100
PIB (mld USD)

80
y = 2,8397x + 11,091
60 R2 = 0,9595
40
20
0
0 10 20 30
Export (mld USD)

Dupa cum putem observa din graficul de mai sus legatura dintre cele doua variabile
este liniara si directa, iar termenul liber este diferit de zero.
Consideram ecuatia de regresie de forma Y = α0 + α1*X+ε

In urma introducerii datelor in modelul Regression din aplicatia Excel, vom obtine
SUMMARY OUTPUT urmatoarele date:

Regression Statistics
Multiple R ( Ry/x ) 0,979543429
R Square ( R² ) 0,959505329
Adjusted R Square 0,956390354
Standard Error 4,209357488
Observations 15

Un prim tabel de rezultate, prezentat mai sus, contine statisticile generale ale ecuatiei
de regresie.
• Coeficientul multiplu de corelatie ( Multiple R )
R=0.9795 arata ca intre cele doua variabile exista o legatura liniara puternica
• Coeficientul de determinare ( R Square ) – exprimat procentual arata
proportia din variatia variabilei dependente explicata de variatia variabilelor
independente: 95.95% din variatia lui Y este explicata de variabilele X.

3
Testarea validitatii modelului

Al doilea tabel de rezultate cuprinde tabloul de analiza a variantei asociat regresiei


estimate.
ANOVA
Df SS MS Significance
F F
Regression 1 5457,886357 5457,886357 308,0299 1,96098E-10
Residual 13 230,342976 17,71869046
Total 14 5688,229333

Sursa de variatie – arata descompunerea variatiei totale in variatia explicata de regresie si


cea reziduala (neexplicata).
• Df – numarul gradelor de libertate: 1 = p-1; 13 = n-p; 14 = n-1, unde p = 2 este
numarul parametrilor modelului ( o variabila X plus termenul liber ) iar n=15 este
numarul de observatii.

Formularea ipotezelor
H0: Modelul este nevalid
H1: Modelul este valid
Statistica testului
Valoarea acestei statistici este caluclata de Excel si o regasim in tabelul de mai sus –
F = 308.0299
Decizia testului
Se compara valoarea calculata a testului F cu valoarea teoretica pentru un prag de
semnificatie α=0.05 si 1 respectiv 13 grade de libertate. Valoarea gasita in tabelul lui
Fisher este Ftab=4.667
Cum Fstat>Ftab putem concluziona ca ipoteza H0 este respinsa, deci modelul ales este
valid.
• Significance F – este probabilitatea critica unilaterala. Daca valoarea afisata este mai
mica decat pragul de semnificatie fixat, atunci se respinge ipoteza nula in favoarea
ipotezei alternative.
Regula de decizie privind acceptarea modelului este: valori mari pentru statistica test F si
valori mici pentru Significance F (valoarea erorii pe care o facem prin respingerea ipotezei
nule cand de fapt ea este adevarata)
Intrucat F=308,0299 iar Significance F = 1,96098E-10 < α=0.05 , ceea ce arata ca se
respinge ipoteza nula in favoarea ipotezei alternative, modelul de regresie ales este valid si
poate fi utilizat pentru analiza dependentei celor doua variabile.

Estimarea parametrilor

Al treilea tabel contine valorile estimate pentru coeficientii modelului, precum si


statisticile necesare verificarii ipotezelor uzuale asupra coeficientilor. De remarcat ca, spre
deosebire de testul F, testele asupra coeficientilor sunt individuale.

4
Coefficient Standard Lower Upper
s Error t Stat P-value 95% 95%
Intercept
(termenul
liber) 11,0911878 2,088584465 5,31038508 0,000141 6,57907537 15,6033
X Variable
1 2,83967767 0,1617978 17,5507805 1,96E-10 2,49013477 3,189221

• Coefficients – contine valorile estimate ale coeficientilor. Din valorile afisate rezulta
ca modelul estimat in exemplu este:
Y = 11.0911878 + 2.83967767*X
2.83967767 > 0  legatura directa

Interpretarea parametrilor

Daca va creste exportul cu 1 miliard USD, PIB-ul va creste cu 2.83967767


miliarde USD.

Testarea parametrilor

• Pentru αo
Definim ipotezele: H0: αo =0
H1: αo ≠0
t-Stat =-9,96278
Se fixeaza un prag de semnificatie α=0,05 pentru care se determina t tab cu n-2 grade de
libertate din tabelul repartitiei Student, ttab =1,714
t-Stat < - 1,714  parametrul difera semnificativ de 0.

• Pentru α1
Definim ipotezele: H0: α1 =0
H1: α1 ≠0
t-Stat = 13,07466
Se fixeaza un prag de semnificatie α=0,05 pentru care se determina t tab cu n-2 grade de
libertate din tabelul repartitiei Student, ttab =1,714
t-Stat >1,714  se espinge ipoteza de nulitate, deci parametrul difera semnificativ de 0.

5
Modelul multiplu de regresie

In continuare vom adauga la modelul initial o a doua variabila si anume Populatia.

PIB (mld Export(mld Populatie


Anul USD) USD) (mil)
1991 28,9 4,266 23,172
1992 19,6 4,363 23,083
1993 26,3 4,892 22,956
1994 30 6,151 22,816
1995 35,4 7,91 22,681
1996 35,3 8,084 22,555
1997 35,2 8,431 22,435
1998 38,1 8,302 22,323
1999 35,6 8,487 22,217
2000 37 10,367 22,117
2001 40,1 11,385 22,025
2002 45,8 13,876 21,942
2003 56,9 17,618 21,866
2004 73,1 23,485 21,79
2005 98,6 27,73 21,714

Astfel vom considera noul model de regresie de forma : Y=β 1+β 2*X1+β 3*X2.
Dupa introducerea datelor in programul Eviews, am obtinut urmatoarele rezultate:

6
Dupa cum se observa, gradul de determinare (R squared) din cadrul modelului de
regresie bifactoriala a crescut de la 95.95% la 96.89%.
Astfel actiunea simultana a celor 2 factori inclusi in model (import si export)
determina in proportie de 96.89% variatia PIB, cresterea de 0.94% fiind pusa pe seama celui
de-al doilea factor inclus in model.

Estimarea parametrilor

Pe coloana Coefficient din figura de mai sus se regasesc valorile calculate de Eviews
pentru paramaetrii modelului, astfel :
Y = -166.4742+3.292986*X1+7.711021*X2

Interpretarea parametrilor
Daca exporturile cresc cu o unitate, toate celelalte elemente ramanand constante, PIB
-ul creste cu 3.292986 unitati.
Daca populatia creste cu o unitate, PIB-ul creste cu 7.711021, restul elementelor
ramanand constante constante.

Testarea parametrilor

Pentru β 1:

Definirea ipotezelor: H0: β 1=0


H1: β 1≠0
Statistica t t-Stat =-1.787803
Se fixeaza un prag de semnificatie α=0,05 pentru care se determina t tab cu n-3 grade de
libertate din tabelul repartitiei Student, ttab =1.782
t-Stat < 1,782  parametrul difera semnificativ de 0.

Pentru β 2:
Definirea ipotezelor : H0: β 2=0
H1: β 2≠0
Statistica t t-Stat = 11.772
Se fixeaza un prag de semnificatie α=0,05 pentru care se determina t tab cu n-3 grade de
libertate din tabelul repartitiei Student, ttab =1.782
t-Stat > 1,782  parametrul difera semnificativ de 0.

Pentru β 3:
Definirea ipotezelor : H0: β 3=0
H1: β 3≠0
Statistica t t-Stat = 1.907312
Se fixeaza un prag de semnificatie α=0,05 pentru care se determina ttab cu n-3 grade
de libertate din tabelul repartitiei Student, ttab =1.782
t-Stat > 1,782  parametrul difera semnificativ de 0.

7
Testarea autocorelarii erorilor

In analiza autocorelarii variabilelor reziduale testul cel mai utilizat este testul Durbin-
Watson.

Ipotezele testului
H0: ρ =0, deci nu exista autocorelare la nivelul seriei reziduurilor
H1: ρ ≠0, exista autocorelare
Statistica testului
Din figura de mai sus observam ca Eviews a calculat implicit si statistica Durbin
Watson:
Durbin Watson stat = 1.765746
Valorile critice ale statisticii depind de numarul de variabile exogene din cadrul
modelului (2), de numarul de observatii (15) si de pragul de semnificatie ales (0.05).
Tabelele de valori critice cuprind pentru elementele specificate cate o pereche de valori d1 si
d2, unde d1=0.95 si d2=1.54.

Decizia testului
Observam ca DW stat apartine intervalului (d2,4-d2), motiv pentru care putem afirma
ca nu exista autocorelare a erorilor, deci este admisa ipoteza H0.

8
Testarea heteroscedasticitatii

Pentru testarea heteroscedasticitatii am aplicat in Eviews testul White (Cross Terms)


dupa cum putem observa in figura de mai jos.

Definirea ipotezelor
H0: Modelul este homoscedastic
H1: Modelul este heteroscedastic
Statisca testului
W = n* R-squared = 15*0.572532= 8.58798
Decizia testului
Valoarea critica a statisticii depinde de numarul de parametri ce apar in urma aplicarii
testului White in Eviews (6) si de pragul de semnificatie α=0.05. Astfel vom determina din
tabelul repartitiei χ ² pentru 6 grade de libertate si α=0.05 valoarea critica de 12.592.
Comparand valorile observam ca W<12.592 ceea ce inseamna ca se accepta ipoteza nula, iar
modelul ales este homoscedastic.

9
Testarea multicoliniaritatii

Definirea ipotezelor
H0: r²x1/x2 < R-squared, modelul nu prezinta fenomenul de multicoliniaritate
H1: r²x1/x2 > R-squared, este suspectata prezenta multicoliniaritatii la nivelul
modelului

Pentru verificarea existentei multicoliniaritatii la nivelul modelului vom aplica testul


Klein.
Pentru aceasta am calculat matricea coeficientilor liniari de corelatie ai variabilelor
explicative, dupa cum se poate observa din figura de mai sus, din care am extras valoarea
rx1/x2.
Decizia testului
Deoarece r²x1/x2 =0.72187 < R-squared=0.968926 putem afirma ca fenomenul de
multicoliniaritate nu este prezent la nivelul modelului de regresie ales.

10