Documente Academic
Documente Profesional
Documente Cultură
Grupa 1037
Tem
O agenie imobiliar dorete s previzioneze preul de vnzare al unor case pe baza
unui model de regresie unifactorial liniar (
i i i
x y c | | + + =
1 0
), n funcie de suprafaa
locuibil a caselor. Rezultatele obinute n urma prelucrrii n Excel, a datelor nregistrate
pentru un eantion de 15 case, sunt:
Regression Statistics
Multiple R 0,903581
R Square 0,81646
Adjusted R Square 0,802305
Standard Error 6,39372
Observations 15=n
ANOVA
df SS MS F
Regression 1 2363,497774 2363,497774 57,815998
Residual n-2=13 531,435559 40,87965
Total n-1=14 2894,93333
Coefficients Stand.Error t Stat P-value Lower 95% Upper 95%
Intercept 21,23556 7,99711 2,65540 0.0002
X Variab.1 1,025824 0,134911 7,6037 0.0007 0,66830985 1,38333815
tiind c suprafaa medie a caselor din eantion este 58 mp iar dispersia (variana) de
selecie este 160,4286 se cer urmtoarele:
a) Testai validitatea modelului de regresie. Se va utiliza nivelul de semnificaie de 5%
(valoarea tabelar este 4,67).
b) Interpretai valorile obinute pentru coeficienii modelului de regresie.
c) Testai semnificaia coeficientului pant (
1
| ). Se va utiliza nivelul de semnificaie de 5%
(valoarea tabelar este 2,65).
d) S se determine un interval de ncredere 95% pentru parametrul pant
1
| .
e) Pentru o cas cu suprafaa de 120 mp, previzionai preul de vnzare al acesteia.
Treptat, completai spaiile punctate cu informaiile care lipsesc i comentai (pe scurt)
valorile indicatorilor ce apar n tabele.
Timofte Alexandra
Grupa 1037
Rezolvare:
n primul tabel am calculat Multiple R ca fiind =
= 0,903581.
n tabelul ANOVA:
-avem SST=SSR+SSE (SST= variaia total a valorilor variabilei Y) de unde rezult c:
SSR=SST-SSE= 2894,93333-531,435559 = 2363,497774 (SSR= variaia explicat prin
factorul de regresie);
SSE=531,435559 (SSE=
= =
n SSE
SSR
MSE
MSR
F despre care tim c
are o distribuie
2 , 1 ; n
F
o
.
815998 , 57 87965 , 40 / 497774 , 2363
calculat
= = F
67 , 4
13 , 1 ; 05 , 0 2 , 1 ; critic tabelat
= = = =
F F F F
n o
Se observ c
>
= =
2
2
) (
) ( )
(
x x
b Var Var
i
o
| i
=
|
|
.
|
\
|
+ = =
2
2 2
2
2
2
) ( ) (
1
) ( ) (
x x n
x
x x
x
n
a Var Var
i
i
i
o
o o ;
Timofte Alexandra
Grupa 1037
2
2
2 2
= =
n
e
s
i
e
o =
= 40,87965, deci
= 6,3937;
Din enunul problemei tim c dispersia de selecie este 160,4286=
, deci
2
) ( x x
i
= 160, 4286 x 14= 2246,0004
Estimaiile erorilor standard ale estimatorilor parametrilor modelului sunt:
= =
2
2
) (
1
) (
x x
s b se s
i
e b
=
= 0,134911
=
|
|
.
|
\
|
+ = =
2
2
2
) (
1
) (
x x
x
n
s a se s
i
e a
2
) ( x x
i
) =
) =
7,99711
Testarea semnificaiei parametrului pant |:
0 :
0
= | H , (parametrul | nu este semnificativ statistic; modelul nu este valid)
0 :
0
= | H , (parametrul | este semnificativ statistic; modelul este valid).
Sub ipoteza nul avem statistica:
) (b se
b
t = care urmeaz o distribuie Student cu (n-2)
grade de libertate dac H
0
este adevrat.
6037 , 7 134911 , 0 / 025824 , 1
calc
= = t ; 65 , 2
13 ; 025 , 0 tabela critic
= = = t t t
t
Se observ c 7,6037>2,65, deci respingem H
0
i acceptm H
1
parametrul | este
semnificativ statistic.
De asemenea din tabel avem probabilitatea asociat de 0,0007<0,05, deci respingem
H
0
i acceptm H
1
.
Pentru a completa tabelul vom face i testarea semnificaiei parametrului de
interceptare :
0 :
0
= o H , (parametrul o nu este semnificativ statistic)
0 :
0
= o H , (parametrul o este semnificativ statistic).
Sub ipoteza nul avem statistica:
) (a se
a
t = care urmeaz o distribuie Student cu (n-2) grade
de libertate :
65540 , 2 99711 , 7 / 23556 , 21
calc
= = t
65 , 2
13 ; 025 , 0 tabela critic
= = = t t t
t
Timofte Alexandra
Grupa 1037
Deoarece 2,65540>2,65 respingem H
0
i acceptm H
1
parametrul o este
semnificativ statistic(de asemenea probabilitatea asociat este 0,0002<0,05, deci respingem
H
0
i acceptm H
1
.).
d) Determinarea unui interval de ncredere pentru parametrul pant | :
Un interval de ncredere )% 1 ( 100 o pentru parametrul | este:
)) ( ) ( ( b se t b b se t b
crt crt
+ s s | ; )) ( ) ( (
2 ; 2 / 2 ; 2 /
b se t b b se t b
n n
+ s s
o o
|
) 134911 , 0 )( 65 , 2 ( 025824 , 1 ) 134911 , 0 )( 65 , 2 ( 025824 , 1 + s s | ;
38333815 , 1 66830985 , 0 s s | avnd un coeficient de ncredere de 95%, pe termen lung,
n 95 din 100 de cazuri, intervale precum intervalul 38333815 , 1 66830985 , 0 ( s s | , vor
include valoarea real a lui | . Mai observm c intervalul construit nu conine valoarea 0,
deci avem nc un argument n favoarea ipotezei H
1
c 0 = | (spunem c X are putere
explicativ semnificativ pentru Y sau c | este semnificativ diferit de zero).
e) Avem dreapta de regresie :
i i
x y + = 025824 , 1 23556 , 21 , cu