EX Regresie Bifactoriala

APLICAȚIE_REGRESIE BIFACTORIALĂ
Un analist de credite din cadrul unei bănci studiază nivelul datoriei clienţilor băncii
pe credit-card (lei), în funcţie de vechimea la locul de muncă (ani) şi de venitul
gospodăriei din care aceştia fac parte (lei). Pentru 30 de clienţi ai băncii, selectaţi
aleator s-au înregistrat următoarele date:
Vechime loc de muncă actual (ani)
X1 Venit gospodărie (lei) X2 Datorie pe Credit-card (lei) Y
17 29920 1931,2
10 5270 231,2
15 9350 146,2
15 20400 452,2
2 4760 304,3
5 4250 66,3
20 11390 651,1
12 6460 22,1
3 3230 231,2
0 4250 472,6
0 2720 30,6
4 3910 42,5
24 10880 668,1
6 4930 292,4
22 17000 629
9 8330 139,4
13 6970 496,4
23 12240 200,6
6 10370 95,2
0 4420 17
22 8840 195,5
17 7310 100,3
3 4420 73,1
8 4590 68
1 2720 40,8
0 5440 363,8
9 11730 120,7
25 10880 161,5
12 9860 523,6
2 6290 34
În ipoteza unei dependenţe liniare între cele trei variabile, se cere:

a. Identificaţi modelul de regresie în eşantion şi interpretaţi valorile coeficienţilor de
regresie parţială;
b. Stabiliți intervalele de încredere pentru parametrii pantă ai modelului de regresie
determinat (nivel de semnificație α = 0,05);
c. Testaţi semnificaţia parametrilor pantă ai modelului de regresie pentru un nivel de
semnificație α = 0,05
d. Decideţi dacă modelul este valid, pentru o probabilitate garantare a rezultatelor de
95%. (nivel de semnificație α = 0,05)
e. Apreciaţi intensitatea legăturii dintre cele trei variabile, folosind un indicator
adecvat şi testaţi semnificaţia acestuia.
f. Determinaţi influenţa procentuală a vechimii la locul de muncă şi a venitului
gospodăriei asupra variaţiei datoriei pe credit-card.
g. Verificaţi dacă sunt îndeplinite ipotezele modelului de regresie liniară bifactorială:
g.1. Normalitatea erorilor;
g.2. Homoscedasticitatea erorilor;
g.3. Non-autocorelarea erorilor;
g.4. Multicoliniaritatea variabilelor exogene .
Utilizarea funcției Regression: Data- Data Analysis - Regression
Utilizarea funcției Regression: etape

Output – cerințe a-f
Output – cerințe g (g.1.-g.4.)

Cerințe g (g.1.-g.4.)
Normal Probability Plot

Datorie Credit-card (lei) Y
2500
2000
1500
1000
500
0
0 20 40 60 80 100 120
Sample Percentile
Vechime (ani) X1 Residual Plot Venit (lei) X2 Residual Plot

600 600
400 400
200 200
Residuals
0 Residuals 0
-200 0 5 10 15 20 25 30 -200 0 00 00 00 00 00 00 00
50 10
0
15
0
20
0
25
0
30
0
35
0
-400 -400
-600 -600
Vechime (ani) X1 Venit (lei) X2
Vechime (ani) X1 Line Fit Plot Venit (lei) X2 Line Fit Plot
2500.00 2500.00
2000.00 2000.00
1500.00 Datorie Credit-card 1500.00 Datorie Credit-

(lei) Y card (lei) Y
1000.00 Predicted Datorie 1000.00 Predicted Datorie
Credit-card (lei) Y Credit-card (lei) Y
500.00 500.00
0.00 0.00
0 5 10 15 20 25 30 0 20000 40000
Vechime (ani) X1 Venit (lei) X2
REZOLVARE
Volumul eșantionului: n = 30 clienți

yi = variabila rezultativă/dependentă = Datorie pe credit-card (lei)
x1i = variabilă factorială / independentă = Vechime (ani)
x2i = variabilă factorială / independentă = Venit (lei)
k = 2 (numărul factorilor = 2 factori = două variabile independente = Vechime, Venit)
yi = f ( x 1i , x 2i ) + alti factori
Datorie Credit Card = f ( Vechime, Venit ) + alți factori( erori/reziduuri)
(lei) (ani) (lei)
a. Identificaţi modelul de regresie în eşantion şi interpretaţi valorile

coeficienţilor de regresie parţială;
Modelul teoretic de regresie bifactorială (multiplă):

y i=b0 +b1 x 1i +b 2 x2 i +e i
Ecuația / funcția de regresie de regresie teoretică: i ^y =b +b x +b 2 x2 i
0 1 1i
Coefficient Standard P Lower Upper
t Stat
s Error -value 95% 95%
Intercept
b0 -103.55 78.21 -1.32 0.197 -264.02 56.92
Vechime (ani)
b1 -8.03 6.69 -1.20 0.241 -21.75 5.70
Venit (lei)
b2 0.06 0.01 6.02 2E-06 0.04 0.08
Ecuația / funcția de regresie de regresie :

^y i=−103,55−8,03x 1 i +0,06 x 2i
Modelul de regresie bifactorială (multiplă):
y i=−103 ,55−8,03 x 1 i +0,06 x 2i +e i
(lei) (ani) (lei)
b0 =-103,55 – intercept – valoarea medie a datoriei în condițiile în care factorii

(vechime,venit) sunt nuli
b1 = - 8,03 – este estimator coeficient de regresie parțial care arată că, între vechime și
datorie există o legătură indirectă (b 1 < 0), a.î. creșterea vechimii cu un an determină o
scădere a datoriei cu 8,03 lei, în condițiile în care venitul rămâne constant (nu se
modifică);
b2 = + 0,06 – este estimator coeficient de regresie parțial care arată că, între venit și
datorie există o legătură directă (b2 > 0), a.î. creșterea venitului cu un leu determină o
creștere a datoriei cu 0,06 lei, în condițiile în care vechimea rămâne constantă (nu se
modifică);
b. Stabiliți intervalele de încredere pentru parametrii pantă ai modelului de
regresie determinat (nivel de semnificație α = 0,05);
Coefficient
s Standard Error t Stat P-value Lower 95% Upper 95%
Intercept -103.55 78.21 -1.32 0.197 -264.02 56.92
b1 sb …….. ………
Vechime (ani) X1 -8.03 1 6.69 -1.20 0.241
b2 sb ……… ….….
Venit (lei) X2 0.06 2 0.01 6.02 2E-06
Intervale de încredere
Parametrul pantă β1 Parametrul pantă β2
L b ≤ β1 ≤ U b 1 L b ≤ β2 ≤ U b 2
1 2
b1 −t crit⋅s b ≤ β1 ≤ b 1 +t crit ¿ s b1 b2 −t crit⋅s b ≤ β 2 ≤ b 2 +t crit ¿ s b2

1 2
−8 , 03−2 , 052⋅6 , 69≤ β 1 ≤ −8 ,03+2, 052⋅6 , 69 0 , 06−2, 052⋅0 ,01≤ β 2 ≤ 0 , 06+2 , 052⋅0 , 01
−21 ,75≤ β1 ≤ 5 ,70 0 , 04≤ β2 ≤ 0 , 08
Pentru o probabilitate de garantare a rezultatelor de 95% (nivel de semnificație α= 0,05)

t crit .=±t α =±t 0 , 05 =±t bilateral 0 , 05 ; 27 =±2 ,052
; n−k −1 ; 30−2−1
2 2
c. Testaţi semnificaţia parametrilor pantă ai modelului de regresie pentru un
nivel de semnificație α = 0,05
Tabel 3 Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
b0 Pvb Lb Ub
Intercept sb tb 0 0,2 - 0 0 56,9
-103,55 0 78,21 0 -1,32 0 264,02 2
Pvb Lb Ub
Vechime (ani) b1 -8,03
sb tb 1 0,2 1 1
1 6,69 1 -1,20 4 -21,75 5,70
Pvb Ub
Venit (lei) b2 0,06
sb tb 2 2E- Lb
0,04
2
2 0,01 2 6,02 06
2
0,08
Testarea semnificației
Parametrului
β1 Parametrului β 2
Ipoteze: Ipoteze:
H0 :
β
1 = 0, β1 nu este semnificativ H0 :
β 2 = 0, β 2 nu este semnificativ statistic
statistic H : β 2  0, 1
β 2 este semnificativ statistic
H1 :
β 1  0, β 1 este semnificativ statistic
Criteriul 1 – Test Student
 valoarea critică:  valoarea critică:
tcrit = +/- tα/2; 30-2-1=+/- t bilateral 0,05;27 =+/- 2,052 tcrit = +/- tα/2; 30-2-1=+/- t bilateral 0,05;27 =+/- 2,052
 Statistica testului:
b1 − 8 , 03  Statistica testului:
t c=t calc =t b 1= = =−1 ,20 b2 0 ,06
sb 6 ,69
1 t c=t calc =t b 2= = ≃6 , 02
sb2 0 , 01
−t crit. (−2 ,052 )<t c (−1 , 20)<t crit .(2 , 052)

Decizia: Deoarece
t b2 (6 , 02 )>t crit (+2, 052 )

H0
Decizia:
H 0 se acceptă, deci parametrul pantă se respinge, deci H 1 este adevărată  parametrul

β 2 ESTE semnificativ statistic  modelul este
β 1 NU este semnificativ statistic pentru
valid pentru α=0,05
α=0,05
Pvb
Criteriul 2 – Compararea lui P-value (
j ) cu pragul de semnificație α
Pvb1 (0,24) > α (0,05) parametrul pantă 1

β Pvb2 (0,000002) < α (0,05) parametrul β 2 ESTE
NU este semnificativ statistic pentru α=0,05 semnificativ statistic  modelul este valid pentru
(H0 se acceptă) α=0,05 (H0 se respinge, H1 se acceptă)
Lb ≤ β j ≤ U b
Criteriul 3 – Compararea semnelor limitelor intervalului de încredere j j
L (−21 , 75)≤ β 1 ≤ U b (+5 , 70 ) Lb (+0 , 04 )≤ β 2 ≤ U b (+0 , 08 )
Deoarece b1 1  Deoarece 2 2 
semne diferite parametrul  parametrul pantă β
aceleași semne  parametrul 2 ESTE
β 1 NU este semnificativ statistic pentru semnificativ statistic  modelul este valid pentru
α=0,05 α=0,05
Probabilitatea maximă pentru care putem susține că
--------------------------------------- parametrul β 2 este semnificativ statistic:
100-Pvb2% = 100 – 0,0002 = 99,9998% > 95%
d. Decideţi dacă modelul este valid, pentru o probabilitate garantare a
rezultatelor de 95%. (nivel de semnificație α = 0,05)
Tabel 2 - ANOVA df SS MS F Sig. F*
1256151.12
Regression ( 2 2512302.24 SSR
R ) df R =k SSR MSR=
df R
23.12 1,41E-06
54326.07371 =
Residual - erori 27 1466803.99 MSR
SSE F c= 0,0000014
( E ) df E =n−k −1 SSE MSE= MSE
df E 1

29 3979106.23
Total df T =n−1 SST =SSR+SSE
df T =df R+df E
 Ipoteze
H0: MSR=MSE modelul nu este valid statistic
H1: MSR> MSE modelul este valid statistic
 Valoarea critică:
Vcrit = Fcrit=Fα;k;n-k-1=F0,05;2;30-2-1=F0,05;2;27=3,35
 Valoare calculată (Statistica testului) adică calculat F=F =F c are la bază relaţia:
SSR SSR 2512302 ,24
MSR df R k 2 1256151 ,12
F c= = = = = ≃23 ,12
MSE SSE SSE 1466803 , 99 54326 , 07
df E n−k −1 27
 Decizia: Deoarece
F
c (23,12)  F
crit. (3,35)  H
0 se respinge, deci H 1 este adevărată 
modelul este valid pentru un nivel de semnificație α=0,05
TOTODATĂ, deoarece Signifiance F (0,00000414) < α (0,05) 
H0 se respinge, deci H1 este
adevărată  modelul este valid pentru un nivel de semnificație α=0,05
Probabilitatea maximă pentru care putem susține că modelul este valid va fi:
100-Sig F% = 100 – 0,000141 = 99,999859% > 95%
e. Apreciaţi intensitatea legăturii dintre cele trei variabile, folosind un indicator

adecvat şi testaţi semnificaţia acestuia (α = 0,05).
Regression Statistics
Multiple R 0.79
R Square 0.63
Adjusted R Square 0.60
Standard Error 233.08
Observations 30

(lei) (ani) (lei)
Interpretarea intensității legăturii dintre variabilele yi și xi:
Foarte Slabă de intensitate medie Foarte Puternică
0 0,2 0,5 0,75 0,95 1
Slabă Puternică
Interpretare:
R=0,79 legătura dintre datorie și cei doi factori de influență (vechime și venit) este puternică deoarece
R ∈ [ 0,75 ; 0,95 ]
Testarea semnificației Raportului de corelație
 Ipoteze
H0: R∗¿ 0 Raportul de corelație nu este semnificativ statistic (modelul nu e valid)
H1: R∗¿ 0 Raportul de corelație este semnificativ statistic (modelul este valid)
 Valoarea critică: Vcrit = Fcrit=Fα;k;n-k-1=F0,05;2;30-2-1=F0,05;2;27=3,35
F calculat =F calc=F c are la bază relaţia:

 Valoare calculată (Statistica testului) adică
R 2 n−k −1 0 , 792 30−2−1 0 , 63 27
F c= 2
⋅ = 2
⋅ = ⋅ ≃22 , 95≃23
1−R k 1−0 ,79 2 1−0 , 63 2
 Decizia: deoarece
F ( 23 )> F
c ( 3 ,35 )
crit 
H 0 se respinge, deci H 1 este adevărată  Raportul
de corelație este semnificativ statistic (modelul este valid) pentru un nivel de semnificație α=0,05
f. Determinaţi influenţa procentuală a vechimii la locul de muncă şi a venitului

gospodăriei asupra variaţiei datoriei pe credit-card.
Multiple R 0.79
R Square 0.63
Adjusted R Square 0.60
Standard Error 233.08
Observations 30
R2 = 0,63 rezultă că, 63% reprezintă influența conjugată a celor doi factori (vechime și venit) în
variația datoriei credit-card.
g. Verificaţi dacă sunt îndeplinite ipotezele modelului de regresie liniară bifactorială:

g.1. Normalitatea erorilor;
g.2. Homoscedasticitatea erorilor;
g.3. Non-autocorelarea erorilor;
g.4. Multicoliniaritatea variabilelor exogene .
g.1. Verificarea ipotezei de normalitate a erorilor

I. Procedeul grafic:
Normal Probability Plot:
Normal Probability Plot

Datorie pe Credit-card (lei) Y
2500
2000 Graficul realizat în Excel arată că,
1500 punctele sunt dispuse aproximativ pe
1000
o linie, deci reziduurile sunt normal
500
0 repartizate
0 20 40 60 80 100 120
Sample Percentile
I. Procedeul numeric:
Testul Jarque-Bera
Ipoteze
H0: erorile sunt normal distribuite
H1: erorile nu sunt normal distribuite
χ 2critic =7 ,81
Valoarea critică:
χ 2crit = χ 2α ; k+1= χ 20, 05 ; 2+1 = χ 20 , 05 ;3 =7, 81
Statistica testului:
n 2 K2
JB=
6 [
S +
4 ]
Pentru obținerea coeficientului de asimetrie S (Skewness) și a coeficientului de
boltire/aplatizare K (Kurtosis) se aplică funcția Descriptive Statistics pe Residuals (Excel:
Data/Data Analysis/Descriptive Statistics):
Din tabel se observă că:

S=Skewness = 0,076, iar K=Kurtosis = -0,229.
2
n 2 K 2 30 2 (−0 , 229 )
JB= S +
6 4[=
6 ] [
0 , 076 +
4
= 0 , 0945]
Decizia:
2
Deoarece JB (0 , 0945)< χ critic (7 ,81 ) rezultă
că H0 adevărată deci, erorile sunt normal distribuite
g.2 Verificarea ipotezei de homoscedasticitate a erorilor

- Se alcătuiesc 2 corelograme:
o Una între variabilele X1 și Residuals
o Una între variabilele X2 și Residuals.
Observație!
Cele 2 corelograme sunt deja obținute dacă în fereastra Regression s-a bifat: Residual
Plots.
În continuare se interpretează cele 2 corelograme, analizând legătura dintre X1 și erori

(din prima corelogramă) și dintre X2 și erori (din a doua corelogramă).
Interpretare grafice:
Deoarece punctele la ambele grafice prezintă o distribuție destul de oscilantă, am
presupune că cele două perechi de variabile ( x 1i , ei ) și ( x 2i , ei ) sunt independente și nu
corelate. Totuşi, pentru confirmarea/infirmarea acestei presupuneri, se aplică un procedeu
numeric: spre exemplu, Testul White.
II. Procedeul numeric -- Testul White pentru modelul bifactorial

Aplicarea testului presupune realizarea unei REGRESII AUXILIARE obținute pe baza
2
interdependenței dintre variabila endogenă (dependentă) ei și factorii (variabilele
2 2 2 2 2
interdependente) x 1 , x 2 , x 1 , x2 , x 1 x 2 de tipul e i =f ( x 1i , x 2i , x1 i , x 2 i , x 1i x 2i )+ui
Baza de date a REGRESIEI AUXILIARE
2 2 2
x ⋅x
X1i X2i X1i ^ 2( x 1i ) X2 ^ 2( x 2i ) X1X2 ( 1i 2 i ) ei^2( e i )
17 29920 289 895206400 508640 225050,87
10 5270 100 27772900 52700 13488,6176
15 9350 225 87422500 140250 25635,6851
15 20400 225 416160000 306000 231137,639
2 4760 4 22657600 9520 23702,7675
5 4250 25 18062500 21250 963,673631
20 11390 400 129732100 227800 72483,1391
12 6460 144 41731600 77520 20849,6373
3 3230 9 10432900 9690 30853,1275
0 4250 0 18062500 0 112310,85
0 2720 0 7398400 0 404,174698
4 3910 16 15288100 15640 1899,83708
24 10880 576 118374400 261120 120584,343
6 4930 36 24304900 29580 27066,568
22 17000 484 289000000 374000 3021,71489
9 8330 81 69388900 74970 24718,3917
13 6970 169 48580900 90610 95486,6405
23 12240 529 149817600 281520 42189,2105
6 10370 36 107536900 62220 116409,597
0 4420 0 19536400 0 16929,3291
22 8840 484 78145600 194480 660,930276
17 7310 289 53436100 124270 5515,96868
3 4420 9 19536400 13260 2493,55193
8 4590 64 21068100 36720 602,582065
1 2720 1 7398400 2720 3,52815083
0 5440 0 29593600 0 25230,7966
9 11730 81 137592900 105570 135967,827
25 10880 625 118374400 272000 22898,25
12 9860 144 97219600 118320 26990,7597
2 6290 4 39564100 12580 41253,9816
Rezultatele aplicării funcției Regression
SUMMARY OUTPUT
Multiple R 0,83
R Square 0,69
Adjusted R
Square 0,63
Standard Error 38620,99
Observations 30
ANOVA df SS MS F Significance F
7996199129
Regression 5 7 1,5992E+10 10,72178 1,68E-05
3579793428
Residual 24 7 1491580595
Total 29 1,1576E+11
Coefficient Standard Lower Upper
t Stat P-value
s Error 95% 95%
- -
-67878,4 29632,23 -2,29 0,03
Intercept 129036 6720,46
-
-1681,36 3735,29 -0,45 0,66 6027,91
X1i 9390,64
X2i 23,41 6,86 3,41 0,002 9,26 37,57
X1i ^ 2 334,99 215,31 1,56 0,13 -109,39 779,38
X2 ^ 2 0,000179 0,0002 0,72 0,48 -0,0003 0,0007
X1X2 -1,21 0,56 -2,16 0,04 -2,38 -0,05
Pe regresia auxiliară formată se parcurg 2 etape :

a.- se formează modelul de regresie auxiliară
b.- se aplică testul LM
Parcurgerea etapelor presupune aplicarea metodologiilor corespunzătoare:

a. - se formează modelul de regresie auxiliară
Modelul de regresie auxiliară teoretic pe colectivitate:

2 2 2
Colectivitate: ε i =β e 0 + β e 1 x 1i +β e 2 x 2i + β e 3 x1 i + β e 4 x 2i + β e 5 x 1i x 2i + U i
Standard Lower Upper

Coefficients t Stat P-value
Error 95% 95%
be 0 -
29632,23 -2,29 0,03 -129036
Intercept -67878,4 6720,46
be 1 -
3735,29 -0,45 0,66 6027,91
X1i -1681,36 9390,64
be 2 23,41 6,86 3,41 0,002 9,26 37,57
X2i
be 3 334,99 215,31 1,56 0,13 -109,39 779,38
X1i ^ 2
be 4 0,000179 0,0002 0,72 0,48 -0,0003 0,0007
X2 ^ 2
be 5
0,56 -2,16 0,04 -2,38 -0,05
X1X2 -1,21
Modelul de regresie
2 auxiliară teoretic pe eșantion:2 2
e i =be 0 +be 1 x 1 i +be 2 x 2 i +b e 3 x1 i +b e 4 x 2 i +be 5 x1 i x2 i +ui
Modelul de regresie auxiliară al aplicației:

e 2i =−67878 , 4−1681, 36 x 1i +23 , 41 x 2i +334 , 99 x 21 i+0 , 000179 x 22 i−1 , 21 x 1i x 2i +u i
b. - se aplică testul LM
SUMMARY OUTPUT
Multiple R 0,83
2
Raux
R Square 0,69
Adjusted R Square 0,63
n
Observations 30
Ipoteze
H0: erorile sunt homoscedastice
H1: erorile sunt heteroscedastice
χ 2critic =7 ,81
Valoarea critică:
χ 2crit = χ 2α ; k+1= χ 20, 05 ; 2+1 = χ 20 , 05 ;3 =7, 81
LM =n⋅R 2aux =30⋅0 ,69=20 , 72
Decizia:
Deoarece LM (20 ,72 )> χ 2critic (7 , 81) rezultă că, H0 se respinge, H1 deci se verifică ipoteza de
heteroscedasticitate a erorilor.
g.3. Verificarea ipotezei de non- autocorelare a erorilor

Se verifică autocorelarea de ordinul întâi a erorilor, realizată între erorile ei si erorile cu
decalaj ei-1
ei ei-1
474,40 --------
116,14 474,40
-160,11 116,14
-480,77 -160,11
153,96 -480,77
-31,04 153,96
269,23 -31,04
-144,39 269,23
175,65 -144,39
335,13 175,65
-20,10 335,13
-43,59 -20,10
347,25 -43,59
164,52 347,25
-54,97 164,52
-157,22 -54,97
309,01 -157,22
-205,40 309,01
-341,19 -205,40
-130,11 -341,19
-25,71 -130,11
-74,27 -25,71
-49,94 -74,27
-24,55 -49,94
-1,88 -24,55
158,84 -1,88
-368,74 158,84
-151,32 -368,74
164,29 -151,32
-203,11 164,29
Pe baza valorilor din tabelul de mai
sus, se alcătuiește corelograma între
ei și ei-1.
Cum punctele sunt împrăștiate oscilant
pe grafic, se poate deduce că nu există
corelare între ei şi ei-1
II. Procedeul numeric:
Testul Durbin Watson
Varianta 1 – DW în SPSS
Ipoteze: Ho: Erorile sunt non-autocorelate (erorile sunt independente)
H1: Erori sunt autocorelate
Model Summaryb
Adjusted R Std. Error of the
Model R R Square Durbin-Watson
Square Estimate
1 ,795a ,631 ,604 233,07954 1,807
a. Predictors: (Constant), Venit, Vechime
b. Dependent Variable: Datorie_credit
Valori critice:
În funcție de n=30, pragul de semnificație de 0,05 și k=2 variabile exogene, se stabilesc valorile
critice ca limite: d1= dLower =dL = 0,35 și d2= dUpper =dU=1,48
DW = 1,807
0  DW  d1 d1  DW  d 2 d 2  DW  4  d 2 4  d 2  DW  4  d1 4  d1  DW  4
0<DW <0 , 35 0,35≤DW≤1,48 1,48<DW <2,52 2,52≤DW≤3,65 3,65<DW <4
Autocorelare Indecizie Erori Indecizie Autocorelare
pozitivă spre A. pozitivă INDEPENDENTE spre A. negativă negativă
1,48<1,807<2,52
Decizia:
Rezultatul din tabel: 1,48 <DW (1,807 ) < 2,52 conduce la concluzia că, erorile sunt
independente deci, nu sunt autocorelate (H0 este adevărată)
Varianta 2 – DW calculat cu relația:

n
∑ ( e i−ei −1 )2
DW = i=2 n
∑ e 2i
i=1
Valori critice:
În funcție de n=30, pragul de semnificație de 0,05 și k=2 variabile exogene, se stabilesc limitele
d1=0,35 și d2=1,48
n
∑ (e i−ei−1 )2
2651229 , 755
DW = i=2 n
= =1, 807
1466803 , 99
∑ e 2i
i=1
0<DW <0 , 35 0,35≤DW≤1,48 1,48<DW <2,52 2,52≤DW≤3,65 3,65<DW <4
1,48<1,807<2,52
Decizia:
Rezultatul din tabel: 1,48 <DW (1,807 ) < 2,52 conduce la concluzia că, erorile sunt
independente deci, nu sunt autocorelate (H0 este adevărată).
Varianta 3 – DW calculat prin coeficientul de corelație:

DW =2 (1−r e ;e i −1 )
i
Valori critice:
În funcţie de n=10, pragul de semnificaţie α=0,05 şi k=2 variabile exogene, se stabilesc
valorile critice d1=0,35 şi d2=1,48.
DW =2 (1−r e )
i ;e i −1
Matricea de corelație
Coeficientul de corelație este:
Residuals ei Residuals ei-1
r e ;e =0 , 0086
Residuals ei 1 i i−1
Residuals ei-1 0,00856879 1
DW =2 (1−r e , ei− 1 )=2 (1−0 , 0086 )=1 , 9828

i
0<DW <0 , 35 0,35≤DW≤1,48 1,48<DW <2,52 2,52≤DW≤3,65 3,65<DW <4
1,48<1,98<2,52
Rezultatul din tabel: 1,48<1,98<2,52 conduce la concluzia că, erorile sunt independente deci,
nu sunt autocorelate (H0 este adevărată).
OBSERVAȚIE!!!!!
Diferența rezultatelor apare deoarece, metoda de determinare a DW prin
intermediul coeficientului de corelație, se aplică la un volum foarte mare de
date (un eșantion de volum foarte mare).
g.4. Verificarea ipotezei de multicoliniaritate a variabilelor exogene
Observație!!! - pentru obținerea unor estimatori de calitate ridicată nu trebuie să existe
coliniaritate între aceste variabilele exogene.
Se verifică dacă există coliniaritate între variabilele exogene X1 și X2.
Ipotezele: Ho: Între variabilele exogene X1 și X2 nu există coliniaritate.

H1: Între variabilele exogene X1 și X2 există coliniaritate
Multiple R 0,79
2
R Square R 0,63
Adjusted R Square 0,60
Observations 30
Se obține matricea de corelație:

Vechimea la locul Venitul Datoria pe
de muncă actual gospodăriei Credit-card
(ani) X1 (lei) X2 (lei) Y
Vechimea la locul de muncă actual (ani) X1 1
Venitul gospodăriei (lei) X2 rX ,X
1 2 0,614 1
Datoria pe Credit-card (lei) Y 0,369563 0,782129 1
a. Criteriul Klein
r 2x ¿ R2
Observație! Dacă 1 , x2 atunci variabilele exogene nu sunt coliniare
Din matricea de corelație de mai sus se reține coeficientul de corelație parțială între X 1
2
rx , x =0 , 614 , x2 rx =0 , 376
şi X2: 1 2 și se calculează 1
Se compară pătratul acestui coeficient cu raportul de corelație al modelului inițial de

regresie (R Square = R2 = 0,631).
r 2x ( 0 , 376)< R 2
( 0 , 631)
Deoarece 1 , x2 : rezultă că, variabilele exogene X1 și X2
nu sunt coliniare.
b. Criteriul factorului de inflație al dispersiei (VIF)
Teoria:
0<VIF <4 4≤VIF≤10 10<VIF <∞
există multicoliniaritate dar există multicoliniaritate care
NU există multicoliniaritate
NU afectează modelul afectează modelul
1 1
VIF= = =1, 605 < 4
1−r X1 X 2 1−0 ,376
2
, deci nu există multicoliniaritate în modelul utilizat
0<VIF <4 4≤VIF≤10 10<VIF <∞

există multicoliniaritate dar există multicoliniaritate care
NU există multicoliniaritate
NU afectează modelul afectează modelul
0<1, 605<4

EX Regresie Bifactoriala

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

EX Regresie Bifactoriala

Încărcat de

Drepturi de autor:

Formate disponibile

APLICAȚIE_REGRESIE BIFACTORIALĂ

În ipoteza unei dependenţe liniare între cele trei variabile, se cere:

Utilizarea funcției Regression: etape

Output – cerințe g (g.1.-g.4.)

Normal Probability Plot

Vechime (ani) X1 Residual Plot Venit (lei) X2 Residual Plot

Datorie Credit-card (lei) Y

1500.00 Datorie Credit-card 1500.00 Datorie Credit-

Volumul eșantionului: n = 30 clienți

a. Identificaţi modelul de regresie în eşantion şi interpretaţi valorile

Modelul teoretic de regresie bifactorială (multiplă):

Ecuația / funcția de regresie de regresie :

b0 =-103,55 – intercept – valoarea medie a datoriei în condițiile în care factorii

b1 −t crit⋅s b ≤ β1 ≤ b 1 +t crit ¿ s b1 b2 −t crit⋅s b ≤ β 2 ≤ b 2 +t crit ¿ s b2

Pentru o probabilitate de garantare a rezultatelor de 95% (nivel de semnificație α= 0,05)

−t crit. (−2 ,052 )<t c (−1 , 20)<t crit .(2 , 052)

Pvb1 (0,24) > α (0,05) parametrul pantă 1

e. Apreciaţi intensitatea legăturii dintre cele trei variabile, folosind un indicator

Datorie Credit Card = f ( Vechime, Venit ) + alți factori( erori/reziduuri)

 Valoarea critică: Vcrit = Fcrit=Fα;k;n-k-1=F0,05;2;30-2-1=F0,05;2;27=3,35

F calculat =F calc=F c are la bază relaţia:

f. Determinaţi influenţa procentuală a vechimii la locul de muncă şi a venitului

g. Verificaţi dacă sunt îndeplinite ipotezele modelului de regresie liniară bifactorială:

g.1. Verificarea ipotezei de normalitate a erorilor

Normal Probability Plot:

Normal Probability Plot

Din tabel se observă că:

g.2 Verificarea ipotezei de homoscedasticitate a erorilor

În continuare se interpretează cele 2 corelograme, analizând legătura dintre X1 și erori

II. Procedeul numeric -- Testul White pentru modelul bifactorial

Pe regresia auxiliară formată se parcurg 2 etape :

Parcurgerea etapelor presupune aplicarea metodologiilor corespunzătoare:

Modelul de regresie auxiliară teoretic pe colectivitate:

Standard Lower Upper

Modelul de regresie auxiliară al aplicației:

g.3. Verificarea ipotezei de non- autocorelare a erorilor

Varianta 2 – DW calculat cu relația:

Varianta 3 – DW calculat prin coeficientul de corelație:

Residuals ei-1 0,00856879 1

DW =2 (1−r e , ei− 1 )=2 (1−0 , 0086 )=1 , 9828

Ipotezele: Ho: Între variabilele exogene X1 și X2 nu există coliniaritate.

Se obține matricea de corelație:

Se compară pătratul acestui coeficient cu raportul de corelație al modelului inițial de

0<VIF <4 4≤VIF≤10 10<VIF <∞

S-ar putea să vă placă și