Documente Academic
Documente Profesional
Documente Cultură
Ex1 Consum-Venit Regresie Simpla Spataru
Ex1 Consum-Venit Regresie Simpla Spataru
b A rezultat c putem considera c ntre cele dou variabile exist o relaie de forma:
yi = + xi + i , i = 1,2,..., n .
Pentru a determina estimatorii a i b (sau i ) ai parametrilor i , rezolvm
sistemul de ecuaii normale ale lui Gauss.
an + b xi = yi
2
a x i + b x i = xi y i
yi xi2 xi xi yi
n xi2 ( xi ) 2
a=
a
=
b=
b n xi y i x i y i
(10)(205 500) (1700)(1110)
=
b=
0,5091
2
2
a=
24,4545
sau
b=
( xi x )( y i y )
( xi x ) 2
b=
(16800)
(33000)(8890)
a = y bx a = 111 (0,5091)(170) 24,4545
0,5091
Nr grade
libertate
(df)
1
n-2=8
n-1=9
Suma ptratelor
abaterilor
(SS)
SSR=8552,73
SSE=337,27
SST=8890,0
Media ptratelor
(MS)
Statistica
F
MSR=SSR/1=8552,73
MSE=SSE/(n-2)=42,159
F=MSR/MSE
=202,87
Avem SST=SSR+SSE
MSE = SSE /( n 2) = s e2 =337,27/8=42,159
Testul statistic folosit este:
F=
SSR / 1
care urmeaz o distribuie F ;1,n 2 .
SSE /( n 2)
(x
x)2
1
2 xi2
x2
Var ( ) = Var (a ) =
=
+
n ( x x ) 2 n ( x x ) 2
i
i
2
Variana erorilor aleatoare este dar este necunoscut i trebuie estimat.
Un estimator nedeplasat pentru 2 este:
ei2 = 42,159.
2 = s e2 =
n2
s e = 42,159 = 6,493
Estimaiile erorilor standard ale estimatorilor parametrilor modelului sunt:
1
sb = se(b) = s e
=0,0357
2
( xi x )
2
s a = se(a ) = s e
x
n ( x x )
2
i
1
x2
= se
+
=6,4138
n ( xi x ) 2
b
care urmeaz o distribuie Student cu (n-2) grade de libertate dac H0 este
se(b)
adevrat.
Dac | t calc |> t critic = t
atunci respingem H 0 la un nivel de semnificaie de % .
t=
;n 2
;n 2
( xi x )( y i y )
[ ( xi x ) 2 ][ ( yi y ) 2 ]
n xi y i xi y i
[n xi2 ( xi )2 ] [n yi2 ( yi )2 ]
S xy
cov( x, y )
=
=
SxSy
SxSy
sau
rxy 0
se(rxy )
rxy
1 rxy2
n2.
Dac t calculat > t critic , respingem H 0 i acceptm H 1 , adic este semnificativ statistic.
t calculat =
0,980847
1 (0,980847) 2
10 2 = 14,25039
Deoarece 14,25039 > 2,306 , deci avem t calculat > t critic rezult c vom respinge H 0 i vom
accepta H 1 ; coeficientul de corelaie este semnificativ statistic.
Raportul de corelaie dintre cele dou variabile este:
SSR
=
SST
R=
( y i y ) 2
( yi y) 2
sau R = 1
SSE
= 1
SST
( y i y i ) 2
( yi y) 2
2
SSE
SSR ( y i y )
=
=1
sau R 2 = 1
2
SST
SST ( y i y )
( y i y i ) 2
( yi y) 2
R2
(n 2) ~ F ;1, n 2
1 R2
Cea mai bun estimaie a valorii medii reale este estimaia punctual 75,3645.
Determinarea Intervalului de ncredere pentru media de rspuns necesit
cunoaterea distribuiei i a varianei estimatorului y 0 .
1
( x0 x ) 2
.
Avem: Var ( y 0 ) = se2 +
n (x x)2
i
1
n
( x 0 x ) 2
.
( xi x ) 2
1 (100 170) 2
se( y 0 ) = 42,159 +
33000
10
= 10,4759 = 3,2366
,n 2
,n 2
valorii individuale y0 = + x0 + 0
Determinarea Intervalului de ncredere pentru un rspuns individual necesit
cunoaterea distribuiei i a varianei erorii de previzionare y 0 y 0 .
Pentru nivelul de semnificaie fixat, ( = 0,05 ), se poate construi un interval de ncredere
(1 )% pentru predicia individual y0 , de forma:
y 0 t
se( y0 y 0 ) y0 y 0 + t
se( y0 y 0 )
2
,n 2
,n 2
1
( x0 x ) 2
Var ( y 0 y 0 ) = s e2 1 + +
n (x x)2
i
( x0 x ) 2
1
se( y 0 y 0 ) = s e2 1 + +
n ( xi x ) 2
Dup
efectuarea
calculelor,
am
obinut
valorile
Var ( y 0 y 0 ) = 52,6349
Trebuie remarcat faptul c se obine un interval de lungime mai mare pentru y 0 dect
pentru E ( y0 ) . Banda de ncredere este mai mic atunci cnd valoarea lui x 0 se apropie
de media de selecie x .
se = (6,4138)
t = (3,8128)
p = (0,0051)
R 2 = 0,9621
df = 8
F = 202,8679
(0,0357)
(14,2432)
(0,0000)
SUMMARY OUTPUT
Regression Statistics
Multiple R
0,98084737
R Square
0,96206156
Adjusted R
Square
0,95731926
Standard Error
6,49300323
Observations
10
ANOVA
df
SS
Regression
1 8552,72727
Residual
8 337,272727
Total
9
8890
Intercept
X Variable1
Coefficients
24,45454545
0,509090909
MS
8552,727273
42,15909091
Standard
Error
6,413817299
0,035742806
F
202,8679
t Stat
3,8127911
14,243171
Significance F
5,75275E-07
P-value
0,00514
5,8E-07
Lower
95%
9,6642467
0,4266678
Upper
95%
39,244844
0,591514