Sunteți pe pagina 1din 4

Timofte Alexandra

Grupa 1037
Tem
O agenie imobiliar dorete s previzioneze preul de vnzare al unor case pe baza
unui model de regresie unifactorial liniar (
i i i
x y c | | + + =
1 0
), n funcie de suprafaa
locuibil a caselor. Rezultatele obinute n urma prelucrrii n Excel, a datelor nregistrate
pentru un eantion de 15 case, sunt:

Regression Statistics
Multiple R 0,903581
R Square 0,81646
Adjusted R Square 0,802305
Standard Error 6,39372
Observations 15=n
ANOVA
df SS MS F
Regression 1 2363,497774 2363,497774 57,815998
Residual n-2=13 531,435559 40,87965
Total n-1=14 2894,93333
Coefficients Stand.Error t Stat P-value Lower 95% Upper 95%
Intercept 21,23556 7,99711 2,65540 0.0002
X Variab.1 1,025824 0,134911 7,6037 0.0007 0,66830985 1,38333815

tiind c suprafaa medie a caselor din eantion este 58 mp iar dispersia (variana) de
selecie este 160,4286 se cer urmtoarele:
a) Testai validitatea modelului de regresie. Se va utiliza nivelul de semnificaie de 5%
(valoarea tabelar este 4,67).
b) Interpretai valorile obinute pentru coeficienii modelului de regresie.
c) Testai semnificaia coeficientului pant (
1
| ). Se va utiliza nivelul de semnificaie de 5%
(valoarea tabelar este 2,65).
d) S se determine un interval de ncredere 95% pentru parametrul pant
1
| .
e) Pentru o cas cu suprafaa de 120 mp, previzionai preul de vnzare al acesteia.
Treptat, completai spaiile punctate cu informaiile care lipsesc i comentai (pe scurt)
valorile indicatorilor ce apar n tabele.

Timofte Alexandra
Grupa 1037
Rezolvare:
n primul tabel am calculat Multiple R ca fiind =

= 0,903581.
n tabelul ANOVA:
-avem SST=SSR+SSE (SST= variaia total a valorilor variabilei Y) de unde rezult c:
SSR=SST-SSE= 2894,93333-531,435559 = 2363,497774 (SSR= variaia explicat prin
factorul de regresie);
SSE=531,435559 (SSE=

= variaia rezidual, msurnd aciunea factorilor nenregistrai);


MSE=SSE/(n-2)= 531,435559/13=40,87965;
a) Pentru testarea validitii modelului de regresie se vor formula 2 ipoteze:
H0: modelul nu este valid statistic (MSR=MSE)
H1: modelul este valid statistic (MSR>MSE)
Tabelul ANOVA l-am completat cu valorile calculate mai sus.
Astfel :
Testul statistic pe care l vom folosi este testul
) 2 /(
1 /

= =
n SSE
SSR
MSE
MSR
F despre care tim c
are o distribuie
2 , 1 ; n
F
o
.
815998 , 57 87965 , 40 / 497774 , 2363
calculat
= = F
67 , 4
13 , 1 ; 05 , 0 2 , 1 ; critic tabelat
= = = =

F F F F
n o

Se observ c

>

( 815998 , 57 > 4,67), deci respingem H0 i acceptm H1, adic


modelul este valid statistic.
b) Dreapta de regresie estimat este
i i
x y + = 025824 , 1 23556 , 21 ;
Valoarea 025824 , 1 ~ b ,msoar panta dreptei de regresie i arat c atunci cnd suprafaa
locuibil a caselor crete cu o unitate( metru patrat), preul de vnzare va crete, n medie, cu
1,025824 uniti ( uniti monetare).
Valoarea 23556 , 21 ~ a arat nivelul preului de vnzare atunci cnd suprafaa locuibil
este 0. l interpretm pe 23556 , 21 ~ a ca fiind efectul mediu asupra lui Y, al tuturor
factorilor care nu sunt luai n considerare n modelul de regresie.


c) Calculm erorile standard ale estimatorilor parametrilor modelului. Varianele
estimatorilor b i a (sau |

i o ) sunt date de urmtoarele relaii:


= =
2
2
) (
) ( )

(
x x
b Var Var
i
o
| i


=
|
|
.
|

\
|

+ = =
2
2 2
2
2
2
) ( ) (
1
) ( ) (
x x n
x
x x
x
n
a Var Var
i
i
i
o
o o ;
Timofte Alexandra
Grupa 1037
2

2
2 2

= =

n
e
s
i
e
o =

= 40,87965, deci

= 6,3937;
Din enunul problemei tim c dispersia de selecie este 160,4286=

, deci


2
) ( x x
i
= 160, 4286 x 14= 2246,0004
Estimaiile erorilor standard ale estimatorilor parametrilor modelului sunt:


= =
2
2
) (
1
) (
x x
s b se s
i
e b
=

= 0,134911
=
|
|
.
|

\
|

+ = =

2
2
2
) (
1
) (
x x
x
n
s a se s
i
e a


2
) ( x x
i
) =

) =
7,99711
Testarea semnificaiei parametrului pant |:
0 :
0
= | H , (parametrul | nu este semnificativ statistic; modelul nu este valid)
0 :
0
= | H , (parametrul | este semnificativ statistic; modelul este valid).
Sub ipoteza nul avem statistica:
) (b se
b
t = care urmeaz o distribuie Student cu (n-2)
grade de libertate dac H
0
este adevrat.
6037 , 7 134911 , 0 / 025824 , 1
calc
= = t ; 65 , 2
13 ; 025 , 0 tabela critic
= = = t t t
t

Se observ c 7,6037>2,65, deci respingem H
0
i acceptm H
1
parametrul | este
semnificativ statistic.
De asemenea din tabel avem probabilitatea asociat de 0,0007<0,05, deci respingem
H
0
i acceptm H
1
.

Pentru a completa tabelul vom face i testarea semnificaiei parametrului de
interceptare :
0 :
0
= o H , (parametrul o nu este semnificativ statistic)
0 :
0
= o H , (parametrul o este semnificativ statistic).

Sub ipoteza nul avem statistica:
) (a se
a
t = care urmeaz o distribuie Student cu (n-2) grade
de libertate :
65540 , 2 99711 , 7 / 23556 , 21
calc
= = t
65 , 2
13 ; 025 , 0 tabela critic
= = = t t t
t

Timofte Alexandra
Grupa 1037
Deoarece 2,65540>2,65 respingem H
0
i acceptm H
1
parametrul o este
semnificativ statistic(de asemenea probabilitatea asociat este 0,0002<0,05, deci respingem
H
0
i acceptm H
1
.).

d) Determinarea unui interval de ncredere pentru parametrul pant | :
Un interval de ncredere )% 1 ( 100 o pentru parametrul | este:
)) ( ) ( ( b se t b b se t b
crt crt
+ s s | ; )) ( ) ( (
2 ; 2 / 2 ; 2 /
b se t b b se t b
n n
+ s s
o o
|
) 134911 , 0 )( 65 , 2 ( 025824 , 1 ) 134911 , 0 )( 65 , 2 ( 025824 , 1 + s s | ;
38333815 , 1 66830985 , 0 s s | avnd un coeficient de ncredere de 95%, pe termen lung,
n 95 din 100 de cazuri, intervale precum intervalul 38333815 , 1 66830985 , 0 ( s s | , vor
include valoarea real a lui | . Mai observm c intervalul construit nu conine valoarea 0,
deci avem nc un argument n favoarea ipotezei H
1
c 0 = | (spunem c X are putere
explicativ semnificativ pentru Y sau c | este semnificativ diferit de zero).

e) Avem dreapta de regresie :
i i
x y + = 025824 , 1 23556 , 21 , cu

= 120mp( din enunul problemei)


120 025824 , 1 23556 , 21 + =
i
y = 144,33444 (pentru o cas cu uprafaa locuibil de 120 mp,
preul de vnzare va fi de 144,33444 uniti monetare).