Documente Academic
Documente Profesional
Documente Cultură
Un analist de credite din cadrul unei bănci studiază nivelul datoriei clienţilor băncii
pe credit-card (lei), în funcţie de vechimea la locul de muncă (ani) şi de venitul
gospodăriei din care aceştia fac parte (lei). Pentru 30 de clienţi ai băncii, selectaţi
aleator s-au înregistrat următoarele date:
Vechime loc de muncă actual (ani)
X1 Venit gospodărie (lei) X2 Datorie pe Credit-card (lei) Y
17 29920 1931,2
10 5270 231,2
15 9350 146,2
15 20400 452,2
2 4760 304,3
5 4250 66,3
20 11390 651,1
12 6460 22,1
3 3230 231,2
0 4250 472,6
0 2720 30,6
4 3910 42,5
24 10880 668,1
6 4930 292,4
22 17000 629
9 8330 139,4
13 6970 496,4
23 12240 200,6
6 10370 95,2
0 4420 17
22 8840 195,5
17 7310 100,3
3 4420 73,1
8 4590 68
1 2720 40,8
0 5440 363,8
9 11730 120,7
25 10880 161,5
12 9860 523,6
2 6290 34
2500
2000
1500
1000
500
0
0 20 40 60 80 100 120
Sample Percentile
0 Residuals 0
-200 0 5 10 15 20 25 30 -200 0 00 00 00 00 00 00 00
50 10
0
15
0
20
0
25
0
30
0
35
0
-400 -400
-600 -600
Vechime (ani) X1 Venit (lei) X2
Vechime (ani) X1 Line Fit Plot Venit (lei) X2 Line Fit Plot
2500.00 2500.00
Datorie Credit-card (lei) Y
2000.00 2000.00
0.00 0.00
0 5 10 15 20 25 30 0 20000 40000
Vechime (ani) X1 Venit (lei) X2
REZOLVARE
yi = f ( x 1i , x 2i ) + alti factori
Datorie Credit Card = f ( Vechime, Venit ) + alți factori( erori/reziduuri)
(lei) (ani) (lei)
Intercept
b0 -103.55 78.21 -1.32 0.197 -264.02 56.92
Vechime (ani)
b1 -8.03 6.69 -1.20 0.241 -21.75 5.70
Venit (lei)
b2 0.06 0.01 6.02 2E-06 0.04 0.08
Coefficient
s Standard Error t Stat P-value Lower 95% Upper 95%
Intercept -103.55 78.21 -1.32 0.197 -264.02 56.92
b1 sb …….. ………
Vechime (ani) X1 -8.03 1 6.69 -1.20 0.241
b2 sb ……… ….….
Venit (lei) X2 0.06 2 0.01 6.02 2E-06
Intervale de încredere
Parametrul pantă β1 Parametrul pantă β2
L b ≤ β1 ≤ U b 1 L b ≤ β2 ≤ U b 2
1 2
Testarea semnificației
Parametrului
β1 Parametrului β 2
Ipoteze: Ipoteze:
H0 :
β
1 = 0, β1 nu este semnificativ H0 :
β 2 = 0, β 2 nu este semnificativ statistic
statistic H : β 2 0, 1
β 2 este semnificativ statistic
H1 :
β 1 0, β 1 este semnificativ statistic
Criteriul 1 – Test Student
valoarea critică: valoarea critică:
tcrit = +/- tα/2; 30-2-1=+/- t bilateral 0,05;27 =+/- 2,052 tcrit = +/- tα/2; 30-2-1=+/- t bilateral 0,05;27 =+/- 2,052
Statistica testului:
b1 − 8 , 03 Statistica testului:
t c=t calc =t b 1= = =−1 ,20 b2 0 ,06
sb 6 ,69
1 t c=t calc =t b 2= = ≃6 , 02
sb2 0 , 01
Ipoteze
H0: MSR=MSE modelul nu este valid statistic
H1: MSR> MSE modelul este valid statistic
Valoarea critică:
Vcrit = Fcrit=Fα;k;n-k-1=F0,05;2;30-2-1=F0,05;2;27=3,35
Valoare calculată (Statistica testului) adică calculat F=F =F c are la bază relaţia:
SSR SSR 2512302 ,24
MSR df R k 2 1256151 ,12
F c= = = = = ≃23 ,12
MSE SSE SSE 1466803 , 99 54326 , 07
df E n−k −1 27
Decizia: Deoarece
F
c (23,12) F
crit. (3,35) H
0 se respinge, deci H 1 este adevărată
modelul este valid pentru un nivel de semnificație α=0,05
TOTODATĂ, deoarece Signifiance F (0,00000414) < α (0,05)
H0 se respinge, deci H1 este
adevărată modelul este valid pentru un nivel de semnificație α=0,05
Probabilitatea maximă pentru care putem susține că modelul este valid va fi:
100-Sig F% = 100 – 0,000141 = 99,999859% > 95%
Interpretare:
R=0,79 legătura dintre datorie și cei doi factori de influență (vechime și venit) este puternică deoarece
R ∈ [ 0,75 ; 0,95 ]
Testarea semnificației Raportului de corelație
Ipoteze
H0: R∗¿ 0 Raportul de corelație nu este semnificativ statistic (modelul nu e valid)
H1: R∗¿ 0 Raportul de corelație este semnificativ statistic (modelul este valid)
Regression Statistics
Multiple R 0.79
R Square 0.63
Adjusted R Square 0.60
Standard Error 233.08
Observations 30
R2 = 0,63 rezultă că, 63% reprezintă influența conjugată a celor doi factori (vechime și venit) în
variația datoriei credit-card.
2500
2000 Graficul realizat în Excel arată că,
1500 punctele sunt dispuse aproximativ pe
1000
o linie, deci reziduurile sunt normal
500
0 repartizate
0 20 40 60 80 100 120
Sample Percentile
I. Procedeul numeric:
Testul Jarque-Bera
Ipoteze
H0: erorile sunt normal distribuite
H1: erorile nu sunt normal distribuite
χ 2critic =7 ,81
Valoarea critică:
χ 2crit = χ 2α ; k+1= χ 20, 05 ; 2+1 = χ 20 , 05 ;3 =7, 81
Statistica testului:
n 2 K2
JB=
6 [
S +
4 ]
Pentru obținerea coeficientului de asimetrie S (Skewness) și a coeficientului de
boltire/aplatizare K (Kurtosis) se aplică funcția Descriptive Statistics pe Residuals (Excel:
Data/Data Analysis/Descriptive Statistics):
2
n 2 K 2 30 2 (−0 , 229 )
JB= S +
6 4[=
6 ] [
0 , 076 +
4
= 0 , 0945]
Decizia:
2
Deoarece JB (0 , 0945)< χ critic (7 ,81 ) rezultă
că H0 adevărată deci, erorile sunt normal distribuite
ANOVA df SS MS F Significance F
7996199129
Regression 5 7 1,5992E+10 10,72178 1,68E-05
3579793428
Residual 24 7 1491580595
Total 29 1,1576E+11
Coefficient Standard Lower Upper
t Stat P-value
s Error 95% 95%
- -
-67878,4 29632,23 -2,29 0,03
Intercept 129036 6720,46
-
-1681,36 3735,29 -0,45 0,66 6027,91
X1i 9390,64
X2i 23,41 6,86 3,41 0,002 9,26 37,57
X1i ^ 2 334,99 215,31 1,56 0,13 -109,39 779,38
X2 ^ 2 0,000179 0,0002 0,72 0,48 -0,0003 0,0007
X1X2 -1,21 0,56 -2,16 0,04 -2,38 -0,05
Modelul de regresie
2 auxiliară teoretic pe eșantion:2 2
e i =be 0 +be 1 x 1 i +be 2 x 2 i +b e 3 x1 i +b e 4 x 2 i +be 5 x1 i x2 i +ui
b. - se aplică testul LM
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,83
2
Raux
R Square 0,69
Adjusted R Square 0,63
Standard Error 38620,99
n
Observations 30
Ipoteze
H0: erorile sunt homoscedastice
H1: erorile sunt heteroscedastice
χ 2critic =7 ,81
Valoarea critică:
χ 2crit = χ 2α ; k+1= χ 20, 05 ; 2+1 = χ 20 , 05 ;3 =7, 81
Statistica testului:
LM =n⋅R 2aux =30⋅0 ,69=20 , 72
Decizia:
Deoarece LM (20 ,72 )> χ 2critic (7 , 81) rezultă că, H0 se respinge, H1 deci se verifică ipoteza de
heteroscedasticitate a erorilor.
Varianta 1 – DW în SPSS
Ipoteze: Ho: Erorile sunt non-autocorelate (erorile sunt independente)
H1: Erori sunt autocorelate
Model Summaryb
Adjusted R Std. Error of the
Model R R Square Durbin-Watson
Square Estimate
1 ,795a ,631 ,604 233,07954 1,807
a. Predictors: (Constant), Venit, Vechime
b. Dependent Variable: Datorie_credit
Valori critice:
În funcție de n=30, pragul de semnificație de 0,05 și k=2 variabile exogene, se stabilesc valorile
critice ca limite: d1= dLower =dL = 0,35 și d2= dUpper =dU=1,48
Statistica testului:
DW = 1,807
0 DW d1 d1 DW d 2 d 2 DW 4 d 2 4 d 2 DW 4 d1 4 d1 DW 4
0<DW <0 , 35 0,35≤DW≤1,48 1,48<DW <2,52 2,52≤DW≤3,65 3,65<DW <4
Autocorelare Indecizie Erori Indecizie Autocorelare
pozitivă spre A. pozitivă INDEPENDENTE spre A. negativă negativă
1,48<1,807<2,52
Decizia:
Rezultatul din tabel: 1,48 <DW (1,807 ) < 2,52 conduce la concluzia că, erorile sunt
independente deci, nu sunt autocorelate (H0 este adevărată)
Valori critice:
În funcție de n=30, pragul de semnificație de 0,05 și k=2 variabile exogene, se stabilesc limitele
d1=0,35 și d2=1,48
Statistica testului:
n
∑ (e i−ei−1 )2
2651229 , 755
DW = i=2 n
= =1, 807
1466803 , 99
∑ e 2i
i=1
0 DW d1 d1 DW d 2 d 2 DW 4 d 2 4 d 2 DW 4 d1 4 d1 DW 4
0<DW <0 , 35 0,35≤DW≤1,48 1,48<DW <2,52 2,52≤DW≤3,65 3,65<DW <4
Autocorelare Indecizie Erori Indecizie Autocorelare
pozitivă spre A. pozitivă INDEPENDENTE spre A. negativă negativă
1,48<1,807<2,52
Decizia:
Rezultatul din tabel: 1,48 <DW (1,807 ) < 2,52 conduce la concluzia că, erorile sunt
independente deci, nu sunt autocorelate (H0 este adevărată).
Valori critice:
În funcţie de n=10, pragul de semnificaţie α=0,05 şi k=2 variabile exogene, se stabilesc
valorile critice d1=0,35 şi d2=1,48.
Statistica testului:
DW =2 (1−r e )
i ;e i −1
Matricea de corelație
Coeficientul de corelație este:
Residuals ei Residuals ei-1
r e ;e =0 , 0086
Residuals ei 1 i i−1
0 DW d1 d1 DW d 2 d 2 DW 4 d 2 4 d 2 DW 4 d1 4 d1 DW 4
0<DW <0 , 35 0,35≤DW≤1,48 1,48<DW <2,52 2,52≤DW≤3,65 3,65<DW <4
Autocorelare Indecizie Erori Indecizie Autocorelare
pozitivă spre A. pozitivă INDEPENDENTE spre A. negativă negativă
1,48<1,98<2,52
Rezultatul din tabel: 1,48<1,98<2,52 conduce la concluzia că, erorile sunt independente deci,
nu sunt autocorelate (H0 este adevărată).
OBSERVAȚIE!!!!!
Diferența rezultatelor apare deoarece, metoda de determinare a DW prin
intermediul coeficientului de corelație, se aplică la un volum foarte mare de
date (un eșantion de volum foarte mare).
g.4. Verificarea ipotezei de multicoliniaritate a variabilelor exogene
Observație!!! - pentru obținerea unor estimatori de calitate ridicată nu trebuie să existe
coliniaritate între aceste variabilele exogene.
Se verifică dacă există coliniaritate între variabilele exogene X1 și X2.
Regression Statistics
Multiple R 0,79
2
R Square R 0,63
Adjusted R Square 0,60
Standard Error 233,08
Observations 30
a. Criteriul Klein
r 2x ¿ R2
Observație! Dacă 1 , x2 atunci variabilele exogene nu sunt coliniare
Din matricea de corelație de mai sus se reține coeficientul de corelație parțială între X 1
2
rx , x =0 , 614 , x2 rx =0 , 376
şi X2: 1 2 și se calculează 1
Teoria:
0<VIF <4 4≤VIF≤10 10<VIF <∞
există multicoliniaritate dar există multicoliniaritate care
NU există multicoliniaritate
NU afectează modelul afectează modelul
1 1
VIF= = =1, 605 < 4
1−r X1 X 2 1−0 ,376
2
, deci nu există multicoliniaritate în modelul utilizat