Sunteți pe pagina 1din 14

SOLUCIONARIO DEL LABORATORIO 1.

01
ANLISI DE REGRESIN
ROLDA ESCOBEDO JORDAN
09140057

Ejercicio 0.1.
Siendo:
X: Temperatura
Y: Dureza
a) Muestre los datos en un grfico de dispersin.
x<c(220,220,220,220,220,225,225,225,225,225,230,230,230,230,230,235,235,235,
235,235)
y<c(137,137,137,136,135,135,133,132,133,133,128,124,126,129,126,122,122,122,
119,122)
x
y
plot(x,y)

b) Halle la estimacin mnimos cuadrticos de los parmetros

0 y 1 . Muestre la

grfica de la recta estimada en el grfico de dispersin


SC_x<-sum((x-mean(x))^2)
SC_y<-sum((y-mean(y))^2)
SP_xy<-sum((x-mean(x))*(y-mean(y)))
estB1<-SP_xy/SC_x
estB1

1=1.032
estB0<-mean(y)-estB1*mean(x)
estB0

0=364.18

est<-estB1*x+estB0
est
lines(x,est,col="red",type="l",pch=1)

c) Muestre las propiedades de los estimadores por mnimos cuadrados, halle la


suma de cuadrados de los residuos y el estimador de la varianza
Propiedades de los estimadores

La suma de los errores y la suma de los errores por la temperatura son cero,
adems de que las medias de Dureza y los ajustes son iguales.
sum(res);sum(res*x)
[1] 1.705303e-13
[1] 3.831246e-11
mean(y);mean(est)
[1] 129.4
[1] 129.4
Suma de cuadrados de los residuos (SCR)
res<-y-est
SCR<-sum(res^2);SCR
SCT<-sum((y-mean(y))^2);SCT
SCE<-SCT-SCR;SCE
estvar<-SCR/18
estvar

SCR =41.16
2
^ =2.28667

d) Halle la descomposicin de la varianza de Y en varianza explicada por la


regresin y varianza residual
Anova(lm(y~x))

e) El Coeficiente de determinacin es:


coef_det<-SCE/SCT;coef_det

Coef det=0.9417657
El coeficiente de correlacin es:
coef_corr<-SP_xy/(SC_y*SC_x)^0.5;coef_corr

Coef correlacin=0.9704461

Ejercicio 0.2.
X: edad
Y: tsis
a) Verifique los supuestos de la regresin lineal simple.
-Linealidad:
plot(x,y)

Se generar el siguiente modelo lineal:


m2<-lm(y~x)
-Homocedasticidad:
plot(fitted(m2),residuals(m2))
abline(h=0)
abline(h=-20);abline(h=20)

No hay relacin entre la varianza y los ajustes, por lo tanto la varianza no vara
con respecto a la edad. Hay homocedasticidad.
Usaremos el test de Durbin-Watson. Pero antes instalaremos unos paquetes:
install.packages('car')
library(car)
install.packages('lmtest')
library(lmtest)
Aplicando el test:
durbinWatsonTest(m2)

No existe evidencia significativa para afirmar la presencia de autocorrelacin de


los residuos.
-Normalidad
Debemos instalar un paquete para el test de kolmogorov(n>50)
install.packages('nortest')
library(nortest)
Luego:
lillie.test(residuals(m2))

Sal rechazar la H0 se observa no hay normalidad en los residuos.


b) Halle la estimacin mnimos cuadrticos de los parmetros
transformaciones que fuese posible para mejorar el ajuste.
SC_x<-sum((x-mean(x))^2)

0 y 1 . Haga las

SC_y<-sum((y-mean(y))^2)
SP_xy<-sum((x-mean(x))*(y-mean(y)))
Estimacion de

1 :

estB1<-SP_xy/SC_x;estB1
[1] 0.9262238
Estimacion de

0 :

estB0<-mean(y)-mean(x)*estB1;estB0
[1] 104.5483
c) Halle la descomposicin de la varianza de Y en varianza explicada por la
regresin y varianza residual.
est<-estB0+estB1*x
res<-y-est
SCR<-sum(res^2);SCR
[1] 14740.35
SCT<-sum((y-mean(y))^2);SCT
[1] 28011.77
SCE<-SCT-SCR;SCE
[1] 13271.42
estvar<-SCR/67;estvar
[1] 220.0052
d) Halle el coeficiente de determinacin y el coeficiente de correlacin
El Coeficiente de determinacin es:
coef_det<-SCE/SCT;coef_det

Coef det=0.4737801
El coeficiente de correlacin es:
coef_corr<-SP_xy/(SC_y*SC_x)^0.5;coef_corr

Coef correlacin=0.6883169

e) Haga un anlisis de residuos


Grfica Edad vs Residuos/desviacin
plot(y,res/(estvar)^0.5)

Ejercicio 0.3.
X: Renta
Y:Gasto
a) Verifique los supuestos de la regresin lineal simple
-Linealidad
plot(x,y)

m3<-lm(y~x)
-Homocedasticida
plot(fitted(m3),residuals(m3))
abline(h=0)
Abline(h=-4);abline(h=4)

A nivel que aumenta el valor del ajuste, los residuos tienden a aumentar
ligeramente, por tanto no se puede afirmar la homocedasticidad.
-Independencia de los errores

No existe evidencia significativa para afirmar la presencia de autocorrelacin de


los residuos.
Normalidad
shapiro.test(residuals(m3))

Se rechaza la hiptesis nula, por lo tanto no existe normalidad en los residuos.

b) Halle la estimacin mnimos cuadrticos de los parmetros

0 y 1 . Haga las

transformaciones que fuese posible para mejorar el ajuste.


SC_x<-sum((x-mean(x))^2)
SC_y<-sum((y-mean(y))^2)
SP_xy<-sum((x-mean(x))*(y-mean(y)))
Estimacion de

1 :

estB1<-SP_xy/SC_x;estB1
[1] 0.005288256
Estimacion de

0 :

estB0<-mean(y)-mean(x)*estB1;estB0
[1] 4.012284
Segn el grfico de dispersin, se debe hacer un modelo potencial (se proceder
a transformar)
xt<-log(x)
yt<-log(y)
Modelo transformado:
mt<-lm(yt~xt)
Los ajustes y los residuos
t_est<-fitted(mt)
t_res<-residuals(mt)
El coeficiente de determinacin
sum((t_est-mean(t_est))^2)/sum((yt-mean(yt))^2)
0.518989
Luego se comparar con el coeficiente de determinacin contra el del modelo
lineal simple

c) Halle la descomposicin de la varianza de Y en varianza explicada por la


regresin y varianza residual.
est<-estB0+estB1*x
res<-y-est
SCR<-sum(res^2);SCR
[1] 398.7808
SCT<-sum((y-mean(y))^2);SCT
[1] 736.2558
SCE<-SCT-SCR;SCE
[1] 337.475
estvar<-SCR/38;estvar
[1] 10.49423
d) Halle el coeficiente de determinacin y el coeficiente de correlacin
El Coeficiente de determinacin es:
coef_det<-SCE/SCT;coef_det

Coef det=0.4583666
El coeficiente de correlacin es:
coef_corr<-SP_xy/(SC_y*SC_x)^0.5;coef_corr

Coef correlacin=0.6770277

e) Haga un anlisis de residuos


Grfica Edad vs Residuos/desviacin
plot(y,res/(estvar)^0.5)
El patrn de los residuos presenta un patrn en forma de embudo.

Ejercicio 0.4.
1)
-Linealidad
plot(x1,y1)
Se observa que no hay ningn patrn en los datos, con ello no se puede concluir
la linealidad.
m4.1<-lm(y1~x1)

-Homocedasticidad
plot(fitted(m4.1),residuals(m4.1))
abline(h=0)
abline(h=-1);abline(h=1)
No se encuentra la forma de embudo, se concluye que existe homocedasticidad.
-Independencia de los errores
durbinWatsonTest(m4.1)
Existe evidencia significativa para afirmar la presencia de autocorrelacin de los
residuos.
Normalidad
shapiro.test(residuals(m4.1))
Se acepta la hiptesis nula, por lo tanto existe normalidad en los residuos.

Estimacin mnimos cuadrticos de los parmetros

0 y 1 . Haga las

transformaciones que fuese posible para mejorar el ajuste.


SC_x<-sum((x1-mean(x1))^2)
SC_y<-sum((y1-mean(y1))^2)
SP_xy<-sum((x1-mean(x1))*(y1-mean(y1)))
Estimacion de

1 :

estB1<-SP_xy/SC_x;estB1
0.5000909
Estimacion de

0 :

estB0<-mean(y1)-mean(x1)*estB1;estB0
3.000091
Segn el grfico de dispersin, se debe hacer un modelo potencial (se proceder
a transformar)
xt<-log(x1)
yt<-log(y1)
Modelo transformado:
mt<-lm(yt~xt)
Los ajustes y los residuos

t_est<-fitted(mt)
t_res<-residuals(mt)
El coeficiente de determinacin
sum((t_est-mean(t_est))^2)/sum((yt-mean(yt))^2)
0.7051859
Luego se comparar con el coeficiente de determinacin contra el del modelo
lineal simple

Descomposicin de la varianza de Y en varianza explicada por la regresin y


varianza residual.
est<-estB0+estB1*x1
res<-y1-est
SCR<-sum(res^2);SCR
13.76269
SCT<-sum((y1-mean(y1))^2);SCT
41.27269
SCE<-SCT-SCR;SCE
27.51
estvar<-SCR/11;estvar
1.251154
Coeficiente de determinacin y el coeficiente de correlacin

El Coeficiente de determinacin es:


coef_det<-SCE/SCT;coef_det

Coef det=0.6665425
El coeficiente de correlacin es:
coef_corr<-SP_xy/(SC_y*SC_x)^0.5;coef_corr

Coef correlacin=0.8164205

Anlisis de residuos
Grfica y1 vs Residuos/desviacin
plot(y1,res/(estvar)^0.5)
No tienen ningn patrn, el modelo es adecuado.

2)
-Linealidad
plot(x2,y2)
Se observa que no hay ningn patrn en los datos, con ello no se puede concluir
la linealidad.
m4.2<-lm(y2~x2)
-Homocedasticidad
plot(fitted(m4.2),residuals(m4.2))
abline(h=0)
abline(h=-1);abline(h=1)
No se encuentra la forma de embudo, se concluye que existe homocedasticidad.
-Independencia de los errores
durbinWatsonTest(m4.2)
Existe evidencia significativa para afirmar la presencia de autocorrelacin de los
residuos.
Normalidad
shapiro.test(residuals(m4.2))
Se acepta la hiptesis nula, por lo tanto existe normalidad en los residuos.

Estimacin mnimos cuadrticos de los parmetros

0 y 1 . Haga las

transformaciones que fuese posible para mejorar el ajuste.


SC_x<-sum((x2-mean(x2))^2)
SC_y<-sum((y2-mean(y2))^2)
SP_xy<-sum((x2-mean(x2)*(y2-mean(y2)))
Estimacion de

1 :

estB1<-SP_xy/SC_x;estB1

Estimacion de

0 :

estB0<-mean(y2)-mean(x2)*estB1;estB0
Segn el grfico de dispersin, se debe hacer un modelo potencial (se proceder
a transformar)
xt<-log(x2)
yt<-log(y2)

Modelo transformado:
mt<-lm(yt~xt)
Los ajustes y los residuos
t_est<-fitted(mt)
t_res<-residuals(mt)
El coeficiente de determinacin
sum((t_est-mean(t_est))^2)/sum((yt-mean(yt))^2)
Luego se comparar con el coeficiente de determinacin contra el del modelo
lineal simple

Descomposicin de la varianza de Y en varianza explicada por la regresin y


varianza residual.
est<-estB0+estB1*x2
res<-y2-est
SCR<-sum(res^2);SCR
SCT<-sum((y2-mean(y2))^2);SCT
SCE<-SCT-SCR;SCE
estvar<-SCR/11;estvar
Coeficiente de determinacin y el coeficiente de correlacin

El Coeficiente de determinacin es:


coef_det<-SCE/SCT;coef_det
El coeficiente de correlacin es:
coef_corr<-SP_xy/(SC_y*SC_x)^0.5;coef_corr

Anlisis de residuos
Grfica y1 vs Residuos/desviacin
plot(y2,res/(estvar)^0.5)
No tienen ningn patrn, el modelo es adecuado.

S-ar putea să vă placă și