Sunteți pe pagina 1din 11

Tema Seminar 14 – Verificarea ipotezelor modelului de regresie (2)

Model de regresie liniar simplu


Variables Entered/Removedb
Model Summaryb
Variables Variables
Model Entered Removed Method Adjusted Std. Error of Durbin-
1 Horsepow Model R R Square R Square the Estimate Watson
a . Enter 1 .771a .595 .594 4.974 .964
er
a. All requested variables entered. a. Predictors: (Constant), Horsepower
b. Dependent Variable: Miles per Gallon b. Dependent Variable: Miles per Gallon

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 14169.756 1 14169.756 572.709 .000a
Residual 9649.237 390 24.742
Total 23818.993 391
a. Predictors: (Constant), Horsepower
b. Dependent Variable: Miles per Gallon

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 39.855 .730 54.578 .000
Horsepower -.157 .007 -.771 -23.931 .000
a. Dependent Variable: Miles per Gallon

C. Verificarea normalităţii erorilor

Distributia normala este perfect simetrica (asimetria = skewness = 0) si are boltirea medie
(boltirea = kurtosis = 0).

Legea normală este definită de funcţia de densitate de probabilitate care este reprezentată grafic prin
curba densităţii de probabilitate, curbă cu alură de clopot (clopotul Gauss-Laplace).

1
Diagrama Boxplot
-20

-10

20
10
0
Unstandardized Residual

35

333
317
337
330
162

1. Să se verifice dacă erorile sunt normal distribuite, folosind procedeul box-plot.

Distributia erorilor prezinta o usoara asimetrie la dreapta, dar putem accepta ipoteza de normalitate a
erorilor.

2
Histograma şi curba frecvenţelor
50

40
Frequency

30

20

10

Mean = 3.6082248E-16
Std. Dev. = 4.96773143
N = 392
0
-20.00000 -10.00000 0.00000 10.00000 20.00000

Unstandardized Residual

2. Să se verifice dacă erorile sunt normal distribuite, folosind curba frecvenţelor.

Curba frecventelor are forma clopotului Gauss-Laplace, deci admitem ca erorile urmeaza o lege normala
de distributie.

Diagrama PP-Plot Diagrama QQ-Plot

Normal P-P Plot of Unstandardized Residual Normal Q-Q Plot of Unstandardized Residual

1.0 15

10
0.8
Expected Normal Value
Expected Cum Prob

0.6

0.4

-5

0.2
-10

0.0 -15
0.0 0.2 0.4 0.6 0.8 1.0 -20 -10 0 10 20

Observed Cum Prob Observed Value

3. Să se verifice dacă erorile sunt normal distribuite, folosind procedeele QQ plot şi PP plot.

Distributia reala a erorilor (punctele) se suprapune pe dreapta Henry care corespunde distributiei
teoretice – normale (cele mai multe puncte sunt pe dreapta sau apropriate de dreapta), deci erorile
urmeaza o lege de repartitie normala.

3
Testul Kolmogorov Smirnov
One-Sample Kolmogorov-Smirnov Test

Unstandardiz
ed Residual
N 392
Normal Parameters a,b Mean .0000000
Std. Deviation 4.96773143
Most Extreme Absolute .058
Differences Positive .058
Negative -.034
Kolmogorov-Smirnov Z 1.146
Asymp. Sig. (2-tailed) .144
a. Test distribution is Normal.
b. Calculated from data.

4. Să se verifice normalitatea erorilor folosind testul KSL.

H0: erorile urmeaza o lege de repartitie normala:


H1: erorile nu urmeaza o lege de repartitie normala:

Statistics test: KS
zcalc = 1,146
zteoretic = 1,96 (Tabelul Laplace)
Pt ϕ(z) = 0,95/2 = 0,475  z = 1,96

Decizia:

|zcalc| < zteoretic  Nu se respinge ip nula

Sig. = 0.144 > α = 0,05  Nu se respinge ip nula, cu o probabilitate de 95%.


Deci, erorile urmeaza o lege de repartitie normala: .

Testul Jarque-Bera
Statistics

Unstandardized Residual
N Valid 392
Missing 14
Skewness .411
Std. Error of Skewness .123
Kurtosis .450
Std. Error of Kurtosis .246

n  2 k2 
JB   s   ~  2 (2)
6 4
5. Să se verifice normalitatea erorilor folosind testul Jarque-Bera.

4
H0: erorile urmeaza o lege de repartitie normala:
H1: erorile nu urmeaza o lege de repartitie normala:

Statistics test: JB
Skweness = sk = s = 0,411 (> 0)  distributia erorilor este asimetrica la dreapta.
Kurtosis = k = 0,450 (> 0)  distributia erorilor este leptocurtica (mai boltita decat distributia
normala).

Valoarea teoretica se citeste din tabelul repartitiei Hi patrat pt riscul α= 0,05 si df = 2 grade de libertate
(skweness si kurtosis).

χα; df = χ0,05; 2 = 5,991

Decizia:

JB = 14,3 > χteoretic = 5,991  se respinge ipoteza nula, cu un risc de 5%.


Deci, erorile nu urmeaza o lege de repartitie normala, cu un risc de 5%.

5
D. Verificarea autocorelării erorilor

1. Testul Runs

Runs Test

Unstandardiz
ed Residual
Test Valuea -.31137
Cases < Test Value 195
Cases >= Test Value 197
Total Cases 392
Number of Runs 106
Z -9.204
Asymp. Sig. (2-tailed) .000
a. Median

6. Să se verifice independenta erorilor folosind testul Runs.

H0: erorile sunt independente (erorile nu sunt autocorelate); k este normal distribuit; succesiunea runs-urilor
este aleatoare; cov(εi, εj)=0
H1: erorile nu sunt independente (erorile sunt autocorelate); k nu este normal distribuit; succesiunea runs-urilor
nu este aleatoare; cov(εi, εj)≠0
Statistica test: Runs Test

zcalc = -9,204
zteoretic = 1,96

Decizia:

|zcalc| > zteoretic  Se respinge ip nula

Sig. = 0,000 < α = 0,05  Se respinge ip nula, cu un risc de 5%.


Deci, erorile sunt autocorelate; este incalcata ipoteza de independenta a erorilor.

2. Testul Durbin-Watson

DW = dcalculat = 0,964
Valorile critice:
dL=1.36
dU=1.6

H1 ? H0 H0 ? H1

6
7. Să se verifice independenta erorilor folosind testul Durbin-Watson.

H0: erorile sunt independente (erorile nu sunt autocorelate); ρ=0


H1: erorile nu sunt independente (erorile sunt autocorelate); ρ≠0

Statistica test: Durbin-Watson

DW = dcalculat = 0,964

Valorile critice:
• Valorile teoretice ale statisticii DW sunt calculate şi tabelate în funcţie de:
– pragul de semnificaţie (α),
– volumul eşantionului (n)
– numărul parametrilor modelului de regresie (k).
• În tabele se determină două valori critice, notate cu dL (limita inferioară) şi dU (limita
superioară).
Din Tabelul teoretic DW, citim:
dL=1.36
dU=1.6

Decizia:
0--0,964--1,36-------1,6------------------------2--------------------2,4--------2,64-----------4

Decizia: Deoarece (0<dcalc<dL)  se respinge ipoteza H0, erorile înregistrează o autocorelare pozitivă.

7
E. Lipsa coliniaritatii variabilelor independente dintr-un model de regresie multipla

Pentru un model de regresie liniara multipla cu doua variabile independente, se doreste sa se verifice
grafic existenta coliniaritatii variabilelor independente.
Y = f(X1, X2) + e

c.1. Procedee grafice: Scatter plot

8. Sa se interpreteze graficele

Fig. 1 – Coliniaritate perfecta intre variabilele independente.


X2 este determinat in totalitate de X1.
Model de regresie auxiliar: X2 = f(X1)
R2 = 100%

Fig. 2 – Coliniaritate imperfecta intre variabilele independente.


X2 este determinat in proportie de 90,2% de X1.
Model de regresie auxiliar: X2 = f(X1) + u
R2 = 90,2%

8
În analiza coliniarităţii variabilelor independente dintr-un model de regresie liniara multipla, s-au obţinut
următoarele rezultate:
Coefficientsa

Unstandardized Standardized
Mode Coefficients Coefficients Collinearity Statistics
l B Std. Error Beta t Sig. Tolerance VIF
1 (Constant) -20978,3 3087,258 -6,795 ,000
Educational Level (years) 4020,343 210,650 ,679 19,085 ,000 ,936 1,068
Previous Experience
12,071 5,810 ,074 2,078 ,038 ,936 1,068
(months)
a. Dependent Variable: Current Salary

Y = f(X1, X2) + e

Y – Salariul curent
X1 – Educatia (ani)
X2 – Experienta (luni)

9. Sa se interpreteze indicatorii TOL si VIF.

Modelul auxiliar:
X1 = f(X2) + u

Modelul auxiliar:
X2 = f(X1) + u

TOL1 = TOL2 = 0,936

TOL = 1-R2  R2 = 0,064

unde: este raportul de determinaţie multiplă dintre variabila independeta Xi şi celelalte variabile
independente.

Variabila Educatie (X1) este explicata in proprtie de 6,4% de variabila independenta Experienta (X2).
Deci, variabilele independente nu sunt coliniare. (TOL  1, VIF  1)

Variabila Experienta (X2) este explicata in proportie de 6,4% de variabila independenta Educatie (X1).

9
În analiza coliniarităţii variabilelor independente, s-au obţinut următoarele rezultate:

Y = f(X1, X2, X3, X4) + e

Y – Aportul caloric
X1 – GDP
X2 – Rata de alfabetizare
X3 – Speranta de viata a pop feminine
X4 – Pop urban

10. Sa se interperteze raportul de determinaţie pentru modelul auxiliar:

Interpretarea lui : arată cât la sută din variaţia variabilei independente este explicată
de variaţia simultană a celorlalte variabile independente.

Modelul auxiliar:
X2 = f(X1, X3, X4) + u

10
11. Sa se afle valoarea TOL1

48,4 % din variatia variabilei indep X1 este explicata de variatia simultana a celorlalte variabile
independente din model.

11

S-ar putea să vă placă și