Sunteți pe pagina 1din 22

APLICAȚIE_REGRESIE BIFACTORIALĂ

Un analist de credite din cadrul unei bănci studiază nivelul datoriei clienţilor băncii
pe credit-card (lei), în funcţie de vechimea la locul de muncă (ani) şi de venitul
gospodăriei din care aceştia fac parte (lei). Pentru 30 de clienţi ai băncii, selectaţi
aleator s-au înregistrat următoarele date:
Vechime loc de muncă actual (ani)
X1 Venit gospodărie (lei) X2 Datorie pe Credit-card (lei) Y
17 29920 1931,2
10 5270 231,2
15 9350 146,2
15 20400 452,2
2 4760 304,3
5 4250 66,3
20 11390 651,1
12 6460 22,1
3 3230 231,2
0 4250 472,6
0 2720 30,6
4 3910 42,5
24 10880 668,1
6 4930 292,4
22 17000 629
9 8330 139,4
13 6970 496,4
23 12240 200,6
6 10370 95,2
0 4420 17
22 8840 195,5
17 7310 100,3
3 4420 73,1
8 4590 68
1 2720 40,8
0 5440 363,8
9 11730 120,7
25 10880 161,5
12 9860 523,6
2 6290 34

În ipoteza unei dependenţe liniare între cele trei variabile, se cere:


a. Identificaţi modelul de regresie în eşantion şi interpretaţi valorile coeficienţilor de
regresie parţială;
b. Stabiliți intervalele de încredere pentru parametrii pantă ai modelului de regresie
determinat (nivel de semnificație α = 0,05);
c. Testaţi semnificaţia parametrilor pantă ai modelului de regresie pentru un nivel de
semnificație α = 0,05
d. Decideţi dacă modelul este valid, pentru o probabilitate garantare a rezultatelor de
95%. (nivel de semnificație α = 0,05)
e. Apreciaţi intensitatea legăturii dintre cele trei variabile, folosind un indicator
adecvat şi testaţi semnificaţia acestuia.
f. Determinaţi influenţa procentuală a vechimii la locul de muncă şi a venitului
gospodăriei asupra variaţiei datoriei pe credit-card.
g. Verificaţi dacă sunt îndeplinite ipotezele modelului de regresie liniară bifactorială:
g.1. Normalitatea erorilor;
g.2. Homoscedasticitatea erorilor;
g.3. Non-autocorelarea erorilor;
g.4. Multicoliniaritatea variabilelor exogene .
Utilizarea funcției Regression: Data- Data Analysis - Regression

Utilizarea funcției Regression: etape


Output – cerințe a-f

Output – cerințe g (g.1.-g.4.)


Cerințe g (g.1.-g.4.)

Normal Probability Plot


Datorie Credit-card (lei) Y

2500
2000
1500
1000
500
0
0 20 40 60 80 100 120
Sample Percentile

Vechime (ani) X1 Residual Plot Venit (lei) X2 Residual Plot


600 600
400 400
200 200
Residuals

0 Residuals 0
-200 0 5 10 15 20 25 30 -200 0 00 00 00 00 00 00 00
50 10
0
15
0
20
0
25
0
30
0
35
0
-400 -400
-600 -600
Vechime (ani) X1 Venit (lei) X2

Vechime (ani) X1 Line Fit Plot Venit (lei) X2 Line Fit Plot
2500.00 2500.00
Datorie Credit-card (lei) Y

Datorie Credit-card (lei) Y

2000.00 2000.00

1500.00 Datorie Credit-card 1500.00 Datorie Credit-


(lei) Y card (lei) Y
1000.00 Predicted Datorie 1000.00 Predicted Datorie
Credit-card (lei) Y Credit-card (lei) Y
500.00 500.00

0.00 0.00
0 5 10 15 20 25 30 0 20000 40000
Vechime (ani) X1 Venit (lei) X2
REZOLVARE

Volumul eșantionului: n = 30 clienți


yi = variabila rezultativă/dependentă = Datorie pe credit-card (lei)
x1i = variabilă factorială / independentă = Vechime (ani)
x2i = variabilă factorială / independentă = Venit (lei)
k = 2 (numărul factorilor = 2 factori = două variabile independente = Vechime, Venit)

yi = f ( x 1i , x 2i ) + alti factori
Datorie Credit Card = f ( Vechime, Venit ) + alți factori( erori/reziduuri)
(lei) (ani) (lei)

a. Identificaţi modelul de regresie în eşantion şi interpretaţi valorile


coeficienţilor de regresie parţială;

Modelul teoretic de regresie bifactorială (multiplă):


y i=b0 +b1 x 1i +b 2 x2 i +e i
Ecuația / funcția de regresie de regresie teoretică: i ^y =b +b x +b 2 x2 i
0 1 1i
Coefficient Standard P Lower Upper
t Stat
  s Error -value 95% 95%

Intercept
b0 -103.55 78.21 -1.32 0.197 -264.02 56.92
Vechime (ani)
b1 -8.03 6.69 -1.20 0.241 -21.75 5.70
Venit (lei)
b2 0.06 0.01 6.02 2E-06 0.04 0.08

Ecuația / funcția de regresie de regresie :


^y i=−103,55−8,03x 1 i +0,06 x 2i
Modelul de regresie bifactorială (multiplă):
y i=−103 ,55−8,03 x 1 i +0,06 x 2i +e i
Datorie Credit Card = f ( Vechime, Venit ) + alți factori( erori/reziduuri)
(lei) (ani) (lei)

b0 =-103,55 – intercept – valoarea medie a datoriei în condițiile în care factorii


(vechime,venit) sunt nuli
b1 = - 8,03 – este estimator coeficient de regresie parțial care arată că, între vechime și
datorie există o legătură indirectă (b 1 < 0), a.î. creșterea vechimii cu un an determină o
scădere a datoriei cu 8,03 lei, în condițiile în care venitul rămâne constant (nu se
modifică);
b2 = + 0,06 – este estimator coeficient de regresie parțial care arată că, între venit și
datorie există o legătură directă (b2 > 0), a.î. creșterea venitului cu un leu determină o
creștere a datoriei cu 0,06 lei, în condițiile în care vechimea rămâne constantă (nu se
modifică);
b. Stabiliți intervalele de încredere pentru parametrii pantă ai modelului de
regresie determinat (nivel de semnificație α = 0,05);

Coefficient
  s Standard Error t Stat P-value Lower 95% Upper 95%
Intercept -103.55 78.21 -1.32 0.197 -264.02 56.92

b1 sb …….. ………
Vechime (ani) X1 -8.03 1 6.69 -1.20 0.241

b2 sb ……… ….….
Venit (lei) X2 0.06 2 0.01 6.02 2E-06

Intervale de încredere
Parametrul pantă β1 Parametrul pantă β2
L b ≤ β1 ≤ U b 1 L b ≤ β2 ≤ U b 2
1 2

b1 −t crit⋅s b ≤ β1 ≤ b 1 +t crit ¿ s b1 b2 −t crit⋅s b ≤ β 2 ≤ b 2 +t crit ¿ s b2


1 2
−8 , 03−2 , 052⋅6 , 69≤ β 1 ≤ −8 ,03+2, 052⋅6 , 69 0 , 06−2, 052⋅0 ,01≤ β 2 ≤ 0 , 06+2 , 052⋅0 , 01
−21 ,75≤ β1 ≤ 5 ,70 0 , 04≤ β2 ≤ 0 , 08

Pentru o probabilitate de garantare a rezultatelor de 95% (nivel de semnificație α= 0,05)


t crit .=±t α =±t 0 , 05 =±t bilateral 0 , 05 ; 27 =±2 ,052
; n−k −1 ; 30−2−1
2 2
c. Testaţi semnificaţia parametrilor pantă ai modelului de regresie pentru un
nivel de semnificație α = 0,05
Tabel 3   Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
b0 Pvb Lb Ub
Intercept sb tb 0 0,2 - 0 0 56,9
-103,55 0 78,21 0 -1,32 0 264,02 2
Pvb Lb Ub
Vechime (ani) b1 -8,03
sb tb 1 0,2 1 1
1 6,69 1 -1,20 4 -21,75 5,70
Pvb Ub
Venit (lei) b2 0,06
sb tb 2 2E- Lb
0,04
2
2 0,01 2 6,02 06
2
0,08

Testarea semnificației
Parametrului
β1 Parametrului β 2
Ipoteze: Ipoteze:
H0 :
β
1 = 0, β1 nu este semnificativ H0 :
β 2 = 0, β 2 nu este semnificativ statistic
statistic H : β 2  0, 1
β 2 este semnificativ statistic
H1 :
β 1  0, β 1 este semnificativ statistic
Criteriul 1 – Test Student
 valoarea critică:  valoarea critică:
tcrit = +/- tα/2; 30-2-1=+/- t bilateral 0,05;27 =+/- 2,052 tcrit = +/- tα/2; 30-2-1=+/- t bilateral 0,05;27 =+/- 2,052

 Statistica testului:
b1 − 8 , 03  Statistica testului:
t c=t calc =t b 1= = =−1 ,20 b2 0 ,06
sb 6 ,69
1 t c=t calc =t b 2= = ≃6 , 02
sb2 0 , 01

−t crit. (−2 ,052 )<t c (−1 , 20)<t crit .(2 , 052)


Decizia: Deoarece
t b2 (6 , 02 )>t crit (+2, 052 )

H0
Decizia:
H 0 se acceptă, deci parametrul pantă se respinge, deci H 1 este adevărată  parametrul

β 2 ESTE semnificativ statistic  modelul este
β 1 NU este semnificativ statistic pentru
valid pentru α=0,05
α=0,05
Pvb
Criteriul 2 – Compararea lui P-value (
j ) cu pragul de semnificație α

Pvb1 (0,24) > α (0,05) parametrul pantă 1


β Pvb2 (0,000002) < α (0,05) parametrul β 2 ESTE
NU este semnificativ statistic pentru α=0,05 semnificativ statistic  modelul este valid pentru
(H0 se acceptă) α=0,05 (H0 se respinge, H1 se acceptă)
Lb ≤ β j ≤ U b
Criteriul 3 – Compararea semnelor limitelor intervalului de încredere j j
L (−21 , 75)≤ β 1 ≤ U b (+5 , 70 ) Lb (+0 , 04 )≤ β 2 ≤ U b (+0 , 08 )
Deoarece b1 1  Deoarece 2 2 
semne diferite parametrul  parametrul pantă β
aceleași semne  parametrul 2 ESTE
β 1 NU este semnificativ statistic pentru semnificativ statistic  modelul este valid pentru
α=0,05 α=0,05
Probabilitatea maximă pentru care putem susține că
--------------------------------------- parametrul β 2 este semnificativ statistic:
100-Pvb2% = 100 – 0,0002 = 99,9998% > 95%
d. Decideţi dacă modelul este valid, pentru o probabilitate garantare a
rezultatelor de 95%. (nivel de semnificație α = 0,05)
Tabel 2 - ANOVA df SS MS F Sig. F*
1256151.12
Regression ( 2 2512302.24 SSR
R ) df R =k SSR MSR=
df R
23.12 1,41E-06
54326.07371  =
Residual - erori 27 1466803.99 MSR
SSE F c= 0,0000014
( E ) df E =n−k −1 SSE MSE= MSE
df E 1
   
29 3979106.23
Total df T =n−1 SST =SSR+SSE
df T =df R+df E  

 Ipoteze
H0: MSR=MSE modelul nu este valid statistic
H1: MSR> MSE modelul este valid statistic
 Valoarea critică:
Vcrit = Fcrit=Fα;k;n-k-1=F0,05;2;30-2-1=F0,05;2;27=3,35

 Valoare calculată (Statistica testului) adică calculat F=F =F c are la bază relaţia:
SSR SSR 2512302 ,24
MSR df R k 2 1256151 ,12
F c= = = = = ≃23 ,12
MSE SSE SSE 1466803 , 99 54326 , 07
df E n−k −1 27

 Decizia: Deoarece
F
c (23,12)  F
crit. (3,35)  H
0 se respinge, deci H 1 este adevărată 
modelul este valid pentru un nivel de semnificație α=0,05
TOTODATĂ, deoarece Signifiance F (0,00000414) < α (0,05) 
H0 se respinge, deci H1 este
adevărată  modelul este valid pentru un nivel de semnificație α=0,05

Probabilitatea maximă pentru care putem susține că modelul este valid va fi:
100-Sig F% = 100 – 0,000141 = 99,999859% > 95%

e. Apreciaţi intensitatea legăturii dintre cele trei variabile, folosind un indicator


adecvat şi testaţi semnificaţia acestuia (α = 0,05).
Regression Statistics
Multiple R 0.79
R Square 0.63
Adjusted R Square 0.60
Standard Error 233.08
Observations 30

Datorie Credit Card = f ( Vechime, Venit ) + alți factori( erori/reziduuri)


(lei) (ani) (lei)
Interpretarea intensității legăturii dintre variabilele yi și xi:
Foarte Slabă de intensitate medie Foarte Puternică
0 0,2 0,5 0,75 0,95 1
Slabă Puternică

Interpretare:
R=0,79 legătura dintre datorie și cei doi factori de influență (vechime și venit) este puternică deoarece
R ∈ [ 0,75 ; 0,95 ]
Testarea semnificației Raportului de corelație
 Ipoteze
H0: R∗¿ 0 Raportul de corelație nu este semnificativ statistic (modelul nu e valid)
H1: R∗¿ 0 Raportul de corelație este semnificativ statistic (modelul este valid)

 Valoarea critică: Vcrit = Fcrit=Fα;k;n-k-1=F0,05;2;30-2-1=F0,05;2;27=3,35

F calculat =F calc=F c are la bază relaţia:


 Valoare calculată (Statistica testului) adică
R 2 n−k −1 0 , 792 30−2−1 0 , 63 27
F c= 2
⋅ = 2
⋅ = ⋅ ≃22 , 95≃23
1−R k 1−0 ,79 2 1−0 , 63 2
 Decizia: deoarece
F ( 23 )> F
c ( 3 ,35 )
crit 
H 0 se respinge, deci H 1 este adevărată  Raportul
de corelație este semnificativ statistic (modelul este valid) pentru un nivel de semnificație α=0,05

f. Determinaţi influenţa procentuală a vechimii la locul de muncă şi a venitului


gospodăriei asupra variaţiei datoriei pe credit-card.

Regression Statistics
Multiple R 0.79
R Square 0.63
Adjusted R Square 0.60
Standard Error 233.08
Observations 30

R2 = 0,63 rezultă că, 63% reprezintă influența conjugată a celor doi factori (vechime și venit) în
variația datoriei credit-card.

g. Verificaţi dacă sunt îndeplinite ipotezele modelului de regresie liniară bifactorială:


g.1. Normalitatea erorilor;
g.2. Homoscedasticitatea erorilor;
g.3. Non-autocorelarea erorilor;
g.4. Multicoliniaritatea variabilelor exogene .

g.1. Verificarea ipotezei de normalitate a erorilor


I. Procedeul grafic:

Normal Probability Plot:

Normal Probability Plot


Datorie pe Credit-card (lei) Y

2500
2000 Graficul realizat în Excel arată că,
1500 punctele sunt dispuse aproximativ pe
1000
o linie, deci reziduurile sunt normal
500
0 repartizate
0 20 40 60 80 100 120
Sample Percentile

I. Procedeul numeric:
Testul Jarque-Bera
Ipoteze
H0: erorile sunt normal distribuite
H1: erorile nu sunt normal distribuite
χ 2critic =7 ,81
Valoarea critică:
χ 2crit = χ 2α ; k+1= χ 20, 05 ; 2+1 = χ 20 , 05 ;3 =7, 81
Statistica testului:
n 2 K2
JB=
6 [
S +
4 ]
Pentru obținerea coeficientului de asimetrie S (Skewness) și a coeficientului de
boltire/aplatizare K (Kurtosis) se aplică funcția Descriptive Statistics pe Residuals (Excel:
Data/Data Analysis/Descriptive Statistics):

Din tabel se observă că:


S=Skewness = 0,076, iar K=Kurtosis = -0,229.

2
n 2 K 2 30 2 (−0 , 229 )
JB= S +
6 4[=
6 ] [
0 , 076 +
4
= 0 , 0945]
Decizia:
2
Deoarece JB (0 , 0945)< χ critic (7 ,81 ) rezultă
că H0 adevărată deci, erorile sunt normal distribuite

g.2 Verificarea ipotezei de homoscedasticitate a erorilor


I. Procedeul grafic:
- Se alcătuiesc 2 corelograme:
o Una între variabilele X1 și Residuals
o Una între variabilele X2 și Residuals.
Observație!
Cele 2 corelograme sunt deja obținute dacă în fereastra Regression s-a bifat: Residual
Plots.

În continuare se interpretează cele 2 corelograme, analizând legătura dintre X1 și erori


(din prima corelogramă) și dintre X2 și erori (din a doua corelogramă).
Interpretare grafice:
Deoarece punctele la ambele grafice prezintă o distribuție destul de oscilantă, am
presupune că cele două perechi de variabile ( x 1i , ei ) și ( x 2i , ei ) sunt independente și nu
corelate. Totuşi, pentru confirmarea/infirmarea acestei presupuneri, se aplică un procedeu
numeric: spre exemplu, Testul White.

II. Procedeul numeric -- Testul White pentru modelul bifactorial


Aplicarea testului presupune realizarea unei REGRESII AUXILIARE obținute pe baza
2
interdependenței dintre variabila endogenă (dependentă) ei și factorii (variabilele
2 2 2 2 2
interdependente) x 1 , x 2 , x 1 , x2 , x 1 x 2 de tipul e i =f ( x 1i , x 2i , x1 i , x 2 i , x 1i x 2i )+ui
Baza de date a REGRESIEI AUXILIARE
2 2 2
x ⋅x
X1i X2i X1i ^ 2( x 1i ) X2 ^ 2( x 2i ) X1X2 ( 1i 2 i ) ei^2( e i )
17 29920 289 895206400 508640 225050,87
10 5270 100 27772900 52700 13488,6176
15 9350 225 87422500 140250 25635,6851
15 20400 225 416160000 306000 231137,639
2 4760 4 22657600 9520 23702,7675
5 4250 25 18062500 21250 963,673631
20 11390 400 129732100 227800 72483,1391
12 6460 144 41731600 77520 20849,6373
3 3230 9 10432900 9690 30853,1275
0 4250 0 18062500 0 112310,85
0 2720 0 7398400 0 404,174698
4 3910 16 15288100 15640 1899,83708
24 10880 576 118374400 261120 120584,343
6 4930 36 24304900 29580 27066,568
22 17000 484 289000000 374000 3021,71489
9 8330 81 69388900 74970 24718,3917
13 6970 169 48580900 90610 95486,6405
23 12240 529 149817600 281520 42189,2105
6 10370 36 107536900 62220 116409,597
0 4420 0 19536400 0 16929,3291
22 8840 484 78145600 194480 660,930276
17 7310 289 53436100 124270 5515,96868
3 4420 9 19536400 13260 2493,55193
8 4590 64 21068100 36720 602,582065
1 2720 1 7398400 2720 3,52815083
0 5440 0 29593600 0 25230,7966
9 11730 81 137592900 105570 135967,827
25 10880 625 118374400 272000 22898,25
12 9860 144 97219600 118320 26990,7597
2 6290 4 39564100 12580 41253,9816
Rezultatele aplicării funcției Regression
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,83
R Square 0,69
Adjusted R
Square 0,63
Standard Error 38620,99
Observations 30

ANOVA  df SS MS F Significance F
7996199129
Regression 5 7 1,5992E+10 10,72178 1,68E-05
3579793428
Residual 24 7 1491580595
Total 29 1,1576E+11      
Coefficient Standard Lower Upper
t Stat P-value
  s Error 95% 95%
- -
-67878,4 29632,23 -2,29 0,03
Intercept 129036 6720,46
-
-1681,36 3735,29 -0,45 0,66 6027,91
X1i 9390,64
X2i 23,41 6,86 3,41 0,002 9,26 37,57
X1i ^ 2 334,99 215,31 1,56 0,13 -109,39 779,38
X2 ^ 2 0,000179 0,0002 0,72 0,48 -0,0003 0,0007
X1X2 -1,21 0,56 -2,16 0,04 -2,38 -0,05

Pe regresia auxiliară formată se parcurg 2 etape :


a.- se formează modelul de regresie auxiliară
b.- se aplică testul LM

Parcurgerea etapelor presupune aplicarea metodologiilor corespunzătoare:


a. - se formează modelul de regresie auxiliară

Modelul de regresie auxiliară teoretic pe colectivitate:


2 2 2
Colectivitate: ε i =β e 0 + β e 1 x 1i +β e 2 x 2i + β e 3 x1 i + β e 4 x 2i + β e 5 x 1i x 2i + U i

Standard Lower Upper


Coefficients t Stat P-value
  Error 95% 95%
be 0 -
29632,23 -2,29 0,03 -129036
Intercept -67878,4 6720,46
be 1 -
3735,29 -0,45 0,66 6027,91
X1i -1681,36 9390,64
be 2 23,41 6,86 3,41 0,002 9,26 37,57
X2i
be 3 334,99 215,31 1,56 0,13 -109,39 779,38
X1i ^ 2
be 4 0,000179 0,0002 0,72 0,48 -0,0003 0,0007
X2 ^ 2
be 5
0,56 -2,16 0,04 -2,38 -0,05
X1X2 -1,21

Modelul de regresie
2 auxiliară teoretic pe eșantion:2 2
e i =be 0 +be 1 x 1 i +be 2 x 2 i +b e 3 x1 i +b e 4 x 2 i +be 5 x1 i x2 i +ui

Modelul de regresie auxiliară al aplicației:


e 2i =−67878 , 4−1681, 36 x 1i +23 , 41 x 2i +334 , 99 x 21 i+0 , 000179 x 22 i−1 , 21 x 1i x 2i +u i

b. - se aplică testul LM

SUMMARY OUTPUT
Regression Statistics
Multiple R 0,83
2
Raux
R Square 0,69
Adjusted R Square 0,63
Standard Error 38620,99
n
Observations 30

Ipoteze
H0: erorile sunt homoscedastice
H1: erorile sunt heteroscedastice
χ 2critic =7 ,81
Valoarea critică:
χ 2crit = χ 2α ; k+1= χ 20, 05 ; 2+1 = χ 20 , 05 ;3 =7, 81
Statistica testului:
LM =n⋅R 2aux =30⋅0 ,69=20 , 72
Decizia:
Deoarece LM (20 ,72 )> χ 2critic (7 , 81) rezultă că, H0 se respinge, H1 deci se verifică ipoteza de

heteroscedasticitate a erorilor.

g.3. Verificarea ipotezei de non- autocorelare a erorilor


Se verifică autocorelarea de ordinul întâi a erorilor, realizată între erorile ei si erorile cu
decalaj ei-1
ei ei-1
474,40 --------
116,14 474,40
-160,11 116,14
-480,77 -160,11
153,96 -480,77
-31,04 153,96
269,23 -31,04
-144,39 269,23
175,65 -144,39
335,13 175,65
-20,10 335,13
-43,59 -20,10
347,25 -43,59
164,52 347,25
-54,97 164,52
-157,22 -54,97
309,01 -157,22
-205,40 309,01
-341,19 -205,40
-130,11 -341,19
-25,71 -130,11
-74,27 -25,71
-49,94 -74,27
-24,55 -49,94
-1,88 -24,55
158,84 -1,88
-368,74 158,84
-151,32 -368,74
164,29 -151,32
-203,11 164,29
I. Procedeul grafic:
Pe baza valorilor din tabelul de mai
sus, se alcătuiește corelograma între
ei și ei-1.
Cum punctele sunt împrăștiate oscilant
pe grafic, se poate deduce că nu există
corelare între ei şi ei-1
II. Procedeul numeric:
Testul Durbin Watson

Varianta 1 – DW în SPSS
Ipoteze: Ho: Erorile sunt non-autocorelate (erorile sunt independente)
H1: Erori sunt autocorelate
Model Summaryb
Adjusted R Std. Error of the
Model R R Square Durbin-Watson
Square Estimate
1 ,795a ,631 ,604 233,07954 1,807
a. Predictors: (Constant), Venit, Vechime
b. Dependent Variable: Datorie_credit
Valori critice:
În funcție de n=30, pragul de semnificație de 0,05 și k=2 variabile exogene, se stabilesc valorile
critice ca limite: d1= dLower =dL = 0,35 și d2= dUpper =dU=1,48
Statistica testului:
DW = 1,807

0  DW  d1 d1  DW  d 2 d 2  DW  4  d 2 4  d 2  DW  4  d1 4  d1  DW  4
0<DW <0 , 35 0,35≤DW≤1,48 1,48<DW <2,52 2,52≤DW≤3,65 3,65<DW <4
Autocorelare Indecizie Erori Indecizie Autocorelare
pozitivă spre A. pozitivă INDEPENDENTE spre A. negativă negativă
1,48<1,807<2,52
Decizia:
Rezultatul din tabel: 1,48 <DW (1,807 ) < 2,52 conduce la concluzia că, erorile sunt
independente deci, nu sunt autocorelate (H0 este adevărată)

Varianta 2 – DW calculat cu relația:


n
∑ ( e i−ei −1 )2
DW = i=2 n
∑ e 2i
i=1
Ipoteze: Ho: Erorile sunt non-autocorelate (erorile sunt independente)
H1: Erori sunt autocorelate

Valori critice:
În funcție de n=30, pragul de semnificație de 0,05 și k=2 variabile exogene, se stabilesc limitele
d1=0,35 și d2=1,48

Statistica testului:
n
∑ (e i−ei−1 )2
2651229 , 755
DW = i=2 n
= =1, 807
1466803 , 99
∑ e 2i
i=1

0  DW  d1 d1  DW  d 2 d 2  DW  4  d 2 4  d 2  DW  4  d1 4  d1  DW  4
0<DW <0 , 35 0,35≤DW≤1,48 1,48<DW <2,52 2,52≤DW≤3,65 3,65<DW <4
Autocorelare Indecizie Erori Indecizie Autocorelare
pozitivă spre A. pozitivă INDEPENDENTE spre A. negativă negativă
1,48<1,807<2,52
Decizia:
Rezultatul din tabel: 1,48 <DW (1,807 ) < 2,52 conduce la concluzia că, erorile sunt
independente deci, nu sunt autocorelate (H0 este adevărată).

Varianta 3 – DW calculat prin coeficientul de corelație:


DW =2 (1−r e ;e i −1 )
i
Ipoteze: Ho: Erorile sunt non-autocorelate (erorile sunt independente)
H1: Erori sunt autocorelate

Valori critice:
În funcţie de n=10, pragul de semnificaţie α=0,05 şi k=2 variabile exogene, se stabilesc
valorile critice d1=0,35 şi d2=1,48.

Statistica testului:
DW =2 (1−r e )
i ;e i −1

Matricea de corelație
Coeficientul de corelație este:
Residuals ei Residuals ei-1
r e ;e =0 , 0086
Residuals ei 1 i i−1

Residuals ei-1 0,00856879 1

DW =2 (1−r e , ei− 1 )=2 (1−0 , 0086 )=1 , 9828


i

0  DW  d1 d1  DW  d 2 d 2  DW  4  d 2 4  d 2  DW  4  d1 4  d1  DW  4
0<DW <0 , 35 0,35≤DW≤1,48 1,48<DW <2,52 2,52≤DW≤3,65 3,65<DW <4
Autocorelare Indecizie Erori Indecizie Autocorelare
pozitivă spre A. pozitivă INDEPENDENTE spre A. negativă negativă
1,48<1,98<2,52

Rezultatul din tabel: 1,48<1,98<2,52 conduce la concluzia că, erorile sunt independente deci,
nu sunt autocorelate (H0 este adevărată).

OBSERVAȚIE!!!!!
Diferența rezultatelor apare deoarece, metoda de determinare a DW prin
intermediul coeficientului de corelație, se aplică la un volum foarte mare de
date (un eșantion de volum foarte mare).
g.4. Verificarea ipotezei de multicoliniaritate a variabilelor exogene
Observație!!! - pentru obținerea unor estimatori de calitate ridicată nu trebuie să existe
coliniaritate între aceste variabilele exogene.
Se verifică dacă există coliniaritate între variabilele exogene X1 și X2.

Ipotezele: Ho: Între variabilele exogene X1 și X2 nu există coliniaritate.


H1: Între variabilele exogene X1 și X2 există coliniaritate

Regression Statistics
Multiple R 0,79
2
R Square R 0,63
Adjusted R Square 0,60
Standard Error 233,08
Observations 30

Se obține matricea de corelație:


Vechimea la locul Venitul Datoria pe
de muncă actual gospodăriei Credit-card
  (ani) X1 (lei) X2 (lei) Y
Vechimea la locul de muncă actual (ani) X1 1
Venitul gospodăriei (lei) X2 rX ,X
1 2 0,614 1
Datoria pe Credit-card (lei) Y 0,369563 0,782129 1

a. Criteriul Klein
r 2x ¿ R2
Observație! Dacă 1 , x2 atunci variabilele exogene nu sunt coliniare

Din matricea de corelație de mai sus se reține coeficientul de corelație parțială între X 1
2
rx , x =0 , 614 , x2 rx =0 , 376
şi X2: 1 2 și se calculează 1

Se compară pătratul acestui coeficient cu raportul de corelație al modelului inițial de


regresie (R Square = R2 = 0,631).
r 2x ( 0 , 376)< R 2
( 0 , 631)
Deoarece 1 , x2 : rezultă că, variabilele exogene X1 și X2
nu sunt coliniare.
b. Criteriul factorului de inflație al dispersiei (VIF)

Teoria:
0<VIF <4 4≤VIF≤10 10<VIF <∞
există multicoliniaritate dar există multicoliniaritate care
NU există multicoliniaritate
NU afectează modelul afectează modelul

1 1
VIF= = =1, 605 < 4
1−r X1 X 2 1−0 ,376
2
, deci nu există multicoliniaritate în modelul utilizat

0<VIF <4 4≤VIF≤10 10<VIF <∞


există multicoliniaritate dar există multicoliniaritate care
NU există multicoliniaritate
NU afectează modelul afectează modelul
0<1, 605<4

S-ar putea să vă placă și