Documente Academic
Documente Profesional
Documente Cultură
01
ANLISI DE REGRESIN
ROLDA ESCOBEDO JORDAN
09140057
Ejercicio 0.1.
Siendo:
X: Temperatura
Y: Dureza
a) Muestre los datos en un grfico de dispersin.
x<c(220,220,220,220,220,225,225,225,225,225,230,230,230,230,230,235,235,235,
235,235)
y<c(137,137,137,136,135,135,133,132,133,133,128,124,126,129,126,122,122,122,
119,122)
x
y
plot(x,y)
0 y 1 . Muestre la
1=1.032
estB0<-mean(y)-estB1*mean(x)
estB0
0=364.18
est<-estB1*x+estB0
est
lines(x,est,col="red",type="l",pch=1)
La suma de los errores y la suma de los errores por la temperatura son cero,
adems de que las medias de Dureza y los ajustes son iguales.
sum(res);sum(res*x)
[1] 1.705303e-13
[1] 3.831246e-11
mean(y);mean(est)
[1] 129.4
[1] 129.4
Suma de cuadrados de los residuos (SCR)
res<-y-est
SCR<-sum(res^2);SCR
SCT<-sum((y-mean(y))^2);SCT
SCE<-SCT-SCR;SCE
estvar<-SCR/18
estvar
SCR =41.16
2
^ =2.28667
Coef det=0.9417657
El coeficiente de correlacin es:
coef_corr<-SP_xy/(SC_y*SC_x)^0.5;coef_corr
Coef correlacin=0.9704461
Ejercicio 0.2.
X: edad
Y: tsis
a) Verifique los supuestos de la regresin lineal simple.
-Linealidad:
plot(x,y)
No hay relacin entre la varianza y los ajustes, por lo tanto la varianza no vara
con respecto a la edad. Hay homocedasticidad.
Usaremos el test de Durbin-Watson. Pero antes instalaremos unos paquetes:
install.packages('car')
library(car)
install.packages('lmtest')
library(lmtest)
Aplicando el test:
durbinWatsonTest(m2)
0 y 1 . Haga las
SC_y<-sum((y-mean(y))^2)
SP_xy<-sum((x-mean(x))*(y-mean(y)))
Estimacion de
1 :
estB1<-SP_xy/SC_x;estB1
[1] 0.9262238
Estimacion de
0 :
estB0<-mean(y)-mean(x)*estB1;estB0
[1] 104.5483
c) Halle la descomposicin de la varianza de Y en varianza explicada por la
regresin y varianza residual.
est<-estB0+estB1*x
res<-y-est
SCR<-sum(res^2);SCR
[1] 14740.35
SCT<-sum((y-mean(y))^2);SCT
[1] 28011.77
SCE<-SCT-SCR;SCE
[1] 13271.42
estvar<-SCR/67;estvar
[1] 220.0052
d) Halle el coeficiente de determinacin y el coeficiente de correlacin
El Coeficiente de determinacin es:
coef_det<-SCE/SCT;coef_det
Coef det=0.4737801
El coeficiente de correlacin es:
coef_corr<-SP_xy/(SC_y*SC_x)^0.5;coef_corr
Coef correlacin=0.6883169
Ejercicio 0.3.
X: Renta
Y:Gasto
a) Verifique los supuestos de la regresin lineal simple
-Linealidad
plot(x,y)
m3<-lm(y~x)
-Homocedasticida
plot(fitted(m3),residuals(m3))
abline(h=0)
Abline(h=-4);abline(h=4)
A nivel que aumenta el valor del ajuste, los residuos tienden a aumentar
ligeramente, por tanto no se puede afirmar la homocedasticidad.
-Independencia de los errores
0 y 1 . Haga las
1 :
estB1<-SP_xy/SC_x;estB1
[1] 0.005288256
Estimacion de
0 :
estB0<-mean(y)-mean(x)*estB1;estB0
[1] 4.012284
Segn el grfico de dispersin, se debe hacer un modelo potencial (se proceder
a transformar)
xt<-log(x)
yt<-log(y)
Modelo transformado:
mt<-lm(yt~xt)
Los ajustes y los residuos
t_est<-fitted(mt)
t_res<-residuals(mt)
El coeficiente de determinacin
sum((t_est-mean(t_est))^2)/sum((yt-mean(yt))^2)
0.518989
Luego se comparar con el coeficiente de determinacin contra el del modelo
lineal simple
Coef det=0.4583666
El coeficiente de correlacin es:
coef_corr<-SP_xy/(SC_y*SC_x)^0.5;coef_corr
Coef correlacin=0.6770277
Ejercicio 0.4.
1)
-Linealidad
plot(x1,y1)
Se observa que no hay ningn patrn en los datos, con ello no se puede concluir
la linealidad.
m4.1<-lm(y1~x1)
-Homocedasticidad
plot(fitted(m4.1),residuals(m4.1))
abline(h=0)
abline(h=-1);abline(h=1)
No se encuentra la forma de embudo, se concluye que existe homocedasticidad.
-Independencia de los errores
durbinWatsonTest(m4.1)
Existe evidencia significativa para afirmar la presencia de autocorrelacin de los
residuos.
Normalidad
shapiro.test(residuals(m4.1))
Se acepta la hiptesis nula, por lo tanto existe normalidad en los residuos.
0 y 1 . Haga las
1 :
estB1<-SP_xy/SC_x;estB1
0.5000909
Estimacion de
0 :
estB0<-mean(y1)-mean(x1)*estB1;estB0
3.000091
Segn el grfico de dispersin, se debe hacer un modelo potencial (se proceder
a transformar)
xt<-log(x1)
yt<-log(y1)
Modelo transformado:
mt<-lm(yt~xt)
Los ajustes y los residuos
t_est<-fitted(mt)
t_res<-residuals(mt)
El coeficiente de determinacin
sum((t_est-mean(t_est))^2)/sum((yt-mean(yt))^2)
0.7051859
Luego se comparar con el coeficiente de determinacin contra el del modelo
lineal simple
Coef det=0.6665425
El coeficiente de correlacin es:
coef_corr<-SP_xy/(SC_y*SC_x)^0.5;coef_corr
Coef correlacin=0.8164205
Anlisis de residuos
Grfica y1 vs Residuos/desviacin
plot(y1,res/(estvar)^0.5)
No tienen ningn patrn, el modelo es adecuado.
2)
-Linealidad
plot(x2,y2)
Se observa que no hay ningn patrn en los datos, con ello no se puede concluir
la linealidad.
m4.2<-lm(y2~x2)
-Homocedasticidad
plot(fitted(m4.2),residuals(m4.2))
abline(h=0)
abline(h=-1);abline(h=1)
No se encuentra la forma de embudo, se concluye que existe homocedasticidad.
-Independencia de los errores
durbinWatsonTest(m4.2)
Existe evidencia significativa para afirmar la presencia de autocorrelacin de los
residuos.
Normalidad
shapiro.test(residuals(m4.2))
Se acepta la hiptesis nula, por lo tanto existe normalidad en los residuos.
0 y 1 . Haga las
1 :
estB1<-SP_xy/SC_x;estB1
Estimacion de
0 :
estB0<-mean(y2)-mean(x2)*estB1;estB0
Segn el grfico de dispersin, se debe hacer un modelo potencial (se proceder
a transformar)
xt<-log(x2)
yt<-log(y2)
Modelo transformado:
mt<-lm(yt~xt)
Los ajustes y los residuos
t_est<-fitted(mt)
t_res<-residuals(mt)
El coeficiente de determinacin
sum((t_est-mean(t_est))^2)/sum((yt-mean(yt))^2)
Luego se comparar con el coeficiente de determinacin contra el del modelo
lineal simple
Anlisis de residuos
Grfica y1 vs Residuos/desviacin
plot(y2,res/(estvar)^0.5)
No tienen ningn patrn, el modelo es adecuado.