Sunteți pe pagina 1din 2

En primer lugar procederemos a la SELECCI´ON DE VARIABLES EXPLICATIVAS

mediante SELECCI´ON PASO A PASO (STEPWISE). Es una combinación de la


forward y backward.
Va incorporando variables significativas paso a paso como en el método de
forward pero si al incorporar esta variable, otra paso a ser menos significativa,
repite el paso sacándola y comportándose como backward, por eso se dice que es
una combinación de ambos procedimientos.
> #Regresion sin variables explicativas
> RLM.Vacio<-lm(formula=Infarto~1,infarto)
> summary(RLM.Vacio)

Call:
lm(formula = Infarto ~ 1, data = infarto)

Residuals:
Min 1Q Median 3Q Max
-0.84 0.16 0.16 0.16 0.16

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.84000 0.03685 22.8 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.3685 on 99 degrees of freedom

RLM.COMPLETO<-lm(formula = Infarto~.,infarto)
> summary(RLM.COMPLETO)

Esto es el extremo izquierdo, un modelo sin variables

RLM.Stepwise<-step(RLM.Vacio,scope = list(lower=RLM.Vacio,upper=RLM.COMPL
ETO),direction = "both")
Start: AIC=-198.69
Infarto ~ 1

Df Sum of Sq RSS AIC


+ Colesterol 99 13.4400 0.00 -Inf
+ Horas 96 13.4400 0.00 -7215
+ Peso 98 12.9400 0.50 -332
<none> 13.44 -199
+ Edad 1 0.0204 13.42 -197

Step: AIC=-Inf
Infarto ~ Colesterol

Df Sum of Sq RSS AIC


<none> 0.00 -Inf
- Colesterol 99 13.44 13.44 -199
Warning messages:
1: attempting model selection on an essentially perfect fit is nonsense
2: attempting model selection on an essentially perfect fit is nonsense

Observacion:

Como se ha indicado previamente, las variables candidatas a entrar en el modelo


son todas aquellas para las que el contraste es significativo (p − valor ≤ _1). En la
tabla, las variables para las que el constraste es significativo aparecen por encima
de la fila <none> mientras que aquellas para las que el contraste es no
significativo aparecen por debajo.
el nivel de significaci´on usualmente fijado para la entrada de t´erminos (_alfa1 =
0.1), el test es significativo

Calculo de p:
> 1-pchisq(13.44,1)
[1] 0.0002463156 = p

Stepwise
> Ajuste.Estudio.0<-glm(Infarto~1,family=binomial,data=infarto)
> lower=Infarto~1
> upper=Infarto~Edad+Colesterol+Peso+Horas
> Ajuste.Estudio.step<-step(Ajuste.infarto.0,scope=list(lower=Infarto~1,
upper=Infarto~Edad+Colesterol+Peso+Horas), direction="both")

Start: AIC=89.93
Infarto ~ 1

Df Deviance AIC
<none> 87.934 89.934
+ Edad 1 87.782 91.782
+ Horas 96 0.000 194.000
+ Colesterol 99 0.000 200.000
+ Peso 98 2.773 200.773
> 1-pchisq(87.934,1)
[1] 0

Por lo tanto el valor de p es igual a cero que es menor a alfa = 0,1 , entonces se descarta la
hipótesis nula.
https://www.youtube.com/watch?v=tCXc2zl3dew

S-ar putea să vă placă și