Sunteți pe pagina 1din 20

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-1

UNIVERSIDAD DE JAN

Material del curso Recursos metodolgicos y estadsticos para la docencia e investigacin


Manuel Miguel Ramos lvarez,

ndice 4.

M T P G E L R R I E I C S A A I L C I N N O N A X E T P G E L R R I E I C S A A I L C I N N C O N MA A IV V E EX X RE E T P G E L R R I E I C S A A I LI C I N NC C O NR

Acercamiento con el fin explicativo: anlisis inferencial orientado a Regresin. ................ 2 4.1. Anlisis de Regresin para investigaciones correlacionales/covariacionales............ 3 4.1.1. Introduccin a regresin ............................................................................ 3 4.1.2. Anlisis global de la regresin lineal ............................................................. 5 4.1.3. Resumen del Modelo.................................................................................. 6 4.2. El anlisis de mltiples variables predictoras cuantitativas o perspectiva de Regresin Mltiple ..................................................................................................... 7 4.2.1. Resumen del Modelo.................................................................................. 8 4.2.2. La especificacin de la interaccin en el Modelo ............................................. 9 4.2.3. Anlisis detallado mediante regresin. Las tendencias curvilneas ................... 10 4.2.4. El caso general: anlisis de regresin de modelos complejos ......................... 11 4.3. Alternativas robustas y No paramtricas de regresin ...................................... 12 4.4. Opciones de Regresin Lineal en los paquetes de Anlisis ................................. 13 4.4.1. Opciones de Regresin Lineal en SPSS 12.0/15.0......................................... 14 4.4.2. Opciones de Regresin Lineal en Statistica.................................................. 15 4.4.3. Opciones de Regresin Lineal en R............................................................. 17 4.5. Realizacin de los supuestos de prcticas....................................................... 19 4.5.1. Ejemplificacin del anlisis de Regresin mediante el Supuesto 1 ................... 20

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-2

4. Acercamiento con el fin explicativo: anlisis inferencial orientado a Regresin.


o 2 Aproximaciones: Basada en el contraste de Hiptesis Estadsticas. Basada en la potencia estadstica y en los intervalos confidenciales. Tener presente el repaso sobre el contraste de Hiptesis y en general el mdulo inicial sobre Modelizacin.

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-3

4.1. Anlisis de Regresin correlacionales/covariacionales


4.1.1. Introduccin a regresin

para

investigaciones

Interpretacin bsica a partir del Diagrama de dispersin


Figura adaptada a partir de Ramos, M.M.; Catena, A. y Trujillo, H. (2004). Manual de Mtodos y Tcnicas de Investigacin en Ciencias Del Comportamiento. Madrid: Biblioteca Nueva.

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-4

Bases de la estimacin lineal Todas las predicciones del modelo, Yi , descansan sobre la lnea recta. Los errores de prediccin residuales, ei = Yi Yi , se definen como la distancia vertical entre los puntos de datos y la recta. El parmetro de interseccin B0 corresponde al valor de Yi cuando Xi es cero punto de origen de la recta. La pendiente B1 cuantifica el cambio en Yi por cada incremento unitario en Xi. Positiva, lo que expresa un crecimiento en el criterio conforme aumenta el predictor negativa, expresando decrementos en el criterio correspondiendo a incrementos en el predictor. A partir de la Suma de Cuadrados Error, y teniendo en cuenta el modelo ampliado completo en comparacin al restringido, podemos reconstruir el proceso de contrastacin de Hiptesis tal y como vimos en el Modelo General. Proceso de anlisis general. Se ajustan los modelos correspondientes a los datos con objeto de estimar los parmetros correspondientes Se estima la medida de Reduccin Proporcional del Error (RPE) del modelo Ampliado en referencia a un modelo Compacto Entonces, La medida RPE y su complementaria, 1-RPE, se transforman en Medias Cuadrticas dividiendo por los grados de libertad correspondientes. El cociente entre ambas MMCC nos lleva a un estadstico F que nos proporciona informacin sobre lo que ganamos con el modelo Ampliado por parmetro aadido. Finalmente comparamos el valor de F con un valor crtico obtenido a partir del modelo de distribucin F segn el nivel de significacin que imponemos. Si el valor de F asociado a la magnitud RPE supera el valor crtico, entonces nos inclinamos en contra de la Hiptesis Nula, o lo que es equivalente, a favor del modelo Ampliado frente al modelo Compacto y al contrario si el valor es inferior.

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-5

4.1.2.

Anlisis global de la regresin lineal

Tabla Resumen de la perspectiva de Modelizacin en el contexto de Regresin.


Cuadro 8.1 Adaptado a partir de de Ramos, M.M.; Catena, A. y Trujillo, H. (2004). Manual de Mtodos y
Tcnicas de Investigacin en Ciencias Del Comportamiento. Madrid: Biblioteca Nueva.

Fuente Regres. Err. o Residual Total

SC SCR= SCe(COM)SCe(SAT) SCe(SAT) SCe(COM)

gl ( ) 1 N-2 N-1

MC

Fk

MCR =
MC =

SCR 1

SCR MCR * MC SCE (COM )

p ( Fk )

SC ( SAT ) N 2
*p

Supuesto 1 Analizar Regresin lineal Dependiente: FreqY; Independientes: X1; Estadsticos Estimaciones Continuar Aceptar Statistics Multiple Regression Variables: Dependent: FreqY; Independent: X1 OK AceptarPestaa Advanced Summary ANOVA Pestaa Residuals

Interpretacin:

Anlisis de los parmetros Si deseamos probar la significacin del parmetro B0 entonces, segn la perspectiva de modelizacin tendramos que comparar los modelos:

AMP : Yi = 0 + 1 X i + i 0 : 0 = 0 COM 1: Yi = 1 X i + i 1 : 0 0
Para probar la significacin del parmetro B1 entonces compararamos los modelos:

AMP : Yi = 0 + 1 i X i + i 0 : 1 = 0 COM 2 : Yi = 0 + i 1 : 1 0

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-6

4.1.3.

Resumen del Modelo

Los Intervalos Cofidenciales: Interseccin.

F1;n 2

MC SC X

X
n

en escala directa

F1;n 2

MC n

en

escala diferencial respecto a la media del predictor. Pendiente.

F1;n 2

MC SC X

Donde SC X =

(X X )

Para estimar la potencia estadstica nos basaremos en RPE como medida del efecto de tratamiento, o mejor la medida ajustada, y a partir del mismo buscaremos en las curvas de potencia o mediante un programa especializado.

Mejorar la interpretacin de las predicciones En ocasiones interesa cambiar la escala de la ecuacin de regresin, bsicamente refiriendo todos los puntos con respecto al promedio de las variables.
* Y = 0 + 1 ( X i X ) .

Donde

( X ,Y ) .

0* = Y .

En otras palabras, el parmetro de origen recoge ahora la coordenada

INTERVALOS CONFIDENCIALES Supuesto 1 Analizar Regresin lineal Dependiente: FreqY; Independientes: X1; Estadsticos Estimaciones, Intervalos de confianza Continuar Aceptar Statistics Advanced Linear/NonLinearGeneral Linear Models General Linear Models OK Variables: Dependent: FreqY; Continuous pred: X1 OK AceptarPestaa Summary Coefficients

POTENCIA Supuesto 1 Statistics Power Analysis Power Calculation One Correlation, t-Test OK Rho: 0,44 (es RAdj ); N: 18 Alpha: 0,05 OK Calculate Power start N: 10; End N: 100 Power vs. N; Power vs. Rho; Power vs. Alpha Opciones del programa Statistica:
Power Calculation. Clculo de la potencia y Funciones de Potencia para estimar la potencia a partir del tamao del efecto, alfa y tamao muestral. Sample Size Calculation. Clculo del tamao muestral a requerido para lograr un determinado nivel de potencia y tambin en function del resto de parmetros. Interval Estimation. Estimacin por Intervalos a partir de variantes analticas especializadas que no suelen aparecer en los programas de anlisis convencionales. Probability Distributions. Modelos No centralizados que estn implicados en las estimaciones de Potencia y del tamao muestral.
2

Interpretacin:

Interpretacin:

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-7

4.2. El anlisis de mltiples variables predictoras cuantitativas o perspectiva de Regresin Mltiple


Evaluar la significacin de cada uno de los predictores a travs de su pendiente asociada y se corresponde con la vertiente condicional de modelizacin.

AMP : Yi = 0 + 1 X 1i + 2 X 2i + + p 1 XP 1i + p XPi + i 0 : P = 0 COM 1: Yi = 0 + 1 X 1i + 2 X 2i + + p 1 XP 1i + i 1 : P 0

la correlacin que interviene en la estimacin del parmetro es bsicamente una correlacin semiparcial en la que se controla el influjo del resto de predictores secundarios. En definitiva, para un modelo de regresin mltiple con por ejemplo dos predictores,

Cuadro 8.6 Adaptado a partir de Ramos, M.M.; Catena, A. y Trujillo, H. (2004). Manual de Mtodos y Tcnicas de Investigacin en Ciencias Del Comportamiento. Madrid: Biblioteca Nueva.
Fuente SC SCR= SCe(COM)SCe(SAT) SCR1= SCe(COM1)SCe(SAT) SCRp= SCe(COMp)SCe(SAT) gl ( ) MC Fk 2 p

Extensin de la Tabla Resumen de la perspectiva de Modelizacin a Regresin Mltiple

Regres

MCR * MC

SCR SCE (COM )


SCR1 SCE (COM 1)

p ( Fk )

X1

MCR1 * MC MC = SC gl

p( Fk )

Xp

MCRp * MC

SCRp SCE (COMp )

p( Fk )

Err. Residual Total

SCe(SAT) SCe(COM)

N-(p+1) N-1

*p

RPE equivale directamente al coeficiente R2 Supuesto 1 Analizar Regresin lineal Dependiente: Y; Independientes: X1, X2, X3, X4; Estadsticos Estimaciones Continuar Aceptar Statistics Multiple Regression Variables: Dependent: FreqY; Independent: X1-X4 OK AceptarPestaa Advanced Summary ANOVA Pestaa Residuals. Interpretacin: (evitar comparaciones entre variables a partir de los parmetros B, mejor a partir de RPE).

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-8

4.2.1.

Resumen del Modelo

La correlacin global mltiple ahora expresa un ndice general de relacin entre el conjunto de predictores y el criterio, que por ejemplo para dos predictores se puede calcular mediante la frmula:

RY 12 =

rY21 + rY22 2 rY 1 rY 2 r12 2 1 r12

Nuevamente la regresin general llevar asociado un Error Tpico de Estimacin, pero basado ahora en la correlacin mltiple:

SY X = SY 1 R 2
La Correlacin parcial que controla el influjo de una variable relevante sobre el predictor focal y sobre el criterio de manera simultnea: Similar al anterior, la Correlacin Semiparcial controla el influjo de una variable relevante sobre el predictor objetivo de manera selectiva.

Estimacin de intervalos confidenciales, tambin son vlidas las frmulas de regresin simple pero incluyendo una medida de redundancia. En general, para la pendiente de cada predictor p, la ecuacin es la siguiente:

F1;n 2 MC

1 SC Xp

1 2 (1 R p .1... p 1 )
2

La correlacin R p.1... p 1 que abreviaremos en adelante como R p y es la medida RPE obtenida cuando se emplea a todos los predictores p-1 restantes en la prediccin del predictor focal p, a modo de asociacin entre predictores. Una medida de redundancia A veces se expresa, su complementaria: medida de tolerancia, lo que es nico para Xp en la prediccin. Incluso la inversa de la tolerancia, exactamente lo que entra en el intervalo, recibe un nombre: el factor de inflacin de la varianza (VIF: Variance Inflation Factor).

Respecto a la estimacin de la potencia, bastara intercambiar las estimaciones del efecto de tratamiento propias de regresin mltiple con las que aparecan dentro del planteamiento de regresin simple Analizar Estadsticos Estimaciones, Intervalos de confianza, Correlaciones parcial y semiparcial, Diagnsticos Colinealidad Statistics Pestaa AdvancedPartial Correlations & Redundancy & Current sweep matrix. Para los Intervalos Confidenciales y la Potencia seguir las indicaciones de Regresin Simple Interpretacin:

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-9

4.2.2.

La especificacin de la interaccin en el Modelo

Supongamos una investigacin con dos predictores (X1 y X2) de un criterio. Para evaluar el efecto principal/aditivo de la variable X1 de manera independiente:

SAT : Yi = 0 + 1 i X 1i + 2 i X 2i + 3 i X 1i X 2i + i COM : Yi = 0 + 2 i X 2i + 3 i X 1i X 2i + i
Para el efecto principal de la segunda variable predictora, X2:

SAT : Yi = 0 + 1 i X 1i + 2 i X 2i + 3 i X 1i X 2i + i COM : Yi = 0 + 1 i X 1i + 3 i X 1i X 2i + i
Y finalmente, para evaluar la interaccin o efecto conjunto de los dos predictores:

SAT : Yi = 0 + 1 i X 1i + 2 i X 2i + 3 i X 1i X 2i + i COM : Yi = 0 + 1 i X 1i + 2 i X 2i + i
Como consecuencia, volveramos a replantear el anlisis de regresin de manera que el modelo final incluyera exclusivamente los parmetros que son significativos. Primero Creamos nosotros la interaccin: Transformar Calcular Interacc = X1 * X2; Aceptar. Entonces Anlisis regresin: Analizar Regresin lineal Dependiente: FreqY; Independientes: X1, X2, Interacc,; Estadsticos Estimaciones Continuar Aceptar Analizar Estadsticos Estimaciones, Intervalos de confianza, Correlaciones parcial y semiparcial, Diagnsticos Colinealidad Statistics Advanced Linear/NonLinearGeneral Linear Models Factorial Regression OK Variables: Dependent: FreqY; Predictor: X1, X2 OK AceptarPestaa Summary Coefficients Pestaa Advanced Summary ANOVA Pestaa Residuals Pestaa AdvancedPartial Correlations & Redundancy & Current sweep matrix. Alternativamente se puede hacer a travs del mdulo convencional Multiple Regression si creamos nosotros la variable interaccin (Aadir nueva variable Interacc y Pulsar sobre su Nombre e incluir la frmula =X1*X2 en la ventana Functions). Interpretacin: Se gana en ajuste R2 al cambiar a un modelo ms complejo?

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-10

4.2.3. Anlisis curvilneas

detallado

mediante

regresin.

Las

tendencias

Supongamos que nos interesase evaluar una tendencia ms compleja, como por ejemplo de orden-3 cbica. El anlisis mediante modelizacin implicara, entonces los siguientes pasos:
2 3 2 0 : R = 0 AMP : Yi = 0 + 1 X i + 2 X i + 3 X i Perspectiva global: 2 1 : R 0 COM : Yi = 0

Perspectiva Condicional: Lineal u orden-1


2 3 AMP : Yi = 0 + 1 X i + 2 X i + 3 X i 0 : 1 = 0 2 3 : = + + COM Y X X 0 2 i 3 i i 1 : 1 0

AMP : Yi = 0 + 1 X i + 2 X i2 + 3 X i3 0 : 2 = 0 Cuadrtica u orden-2 3 COM : Yi = 0 + 1 X i + 3 X i 1 : 2 0


Cbica u orden-3:
2 3 AMP : Yi = 0 + 1 X i + 2 X i + 3 X i 0 : 3 = 0 2 = + + COM : Y X X i 0 1 i 2 i 1 : 3 0

Analizar Regresin Estimacin curvilnea Dependientes: Y; Independiente: X1; Modelos: Lineal, Cuadrtico, Cbico Aceptar. Statistics Advanced Linear/NonLinearGeneral Linear Models Polynomial Regression Una vez definidas las variables, el Botn Between Effects permite ampliar la complejidad del modelo polinmico.

Interpretacin: Se gana en ajuste R2 al cambiar a un modelo ms complejo? Tener presentes indicaciones sobre especificidad de la Hiptesis (crear los modelos mediante opcin de Datos, Calcular).

Conclusin: Probar con los diferentes Modelos, omitiendo predictores no significativos o problemticos hasta dejar un Modelo Final.

Interpretacin: Especifique el modelo final:

10

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-11

4.2.4.

El caso general: anlisis de regresin de modelos complejos

En concreto, se usa un mtodo de regresin interactivo regresin paso a paso (stepwise regression) que va incorporando (forward) o eliminando (backward) sucesivamente variables. El objetivo general es explicar un porcentaje de varianza del criterio similar al explicado por el total de predictores. Se fija un nivel de significacin, lo que impone un umbral de inclusin de variables. En el mtodo incremental, se calculan las correlaciones de todos los predictores con el criterio y se selecciona la variable con mayor correlacin, siempre que supera el umbral de inclusin. A continuacin se elige el siguiente mejor predictor pero segn la correlacin semiparcial para controlar la influencia del predictor que ya estaba en el modelo y siempre que vuelva a superar el umbral. As sigue el procedimiento hasta que el incremento en correlacin mltiple deja de ser significativo, es decir no sobrepasa el umbral. La otra variante opera a la inversa. El problema es que si los predictores son redundantes (recordar los conceptos asociados como tolerancia o tasa de Inflacin), entonces el algoritmo implementado por algunos programas especializados no lleva a modelos realmente ptimos. Adems, la interpretacin del modelo resultante puede ser difcil. Siempre es preferible realizar un anlisis guiado por hiptesis de investigacin que doten de sentido a los resultados del anlisis estadstico. Si la investigacin incluye muchos predictores estar claramente enfocada desde el punto de vista correlacional y ser preferible realizar los anlisis dentro de la perspectiva especializada de anlisis causal, en la que se corrige el problema de colinealidad. Adems de lo anterior, existe la posibilidad de plantear modelos complejos con interacciones y polinomios, lo que se analiza mediante Modelos de regresin de superficie (i.e. Response Surface Regression dentro del mdulo GLM de Statistica).
Interpretacin: Hacia delante y hacia atrs consideran las variables una a una. En los mtodos introducir y borrar se consideran bloques de variables. Pasos sucesivos realiza convergentemente la introduccin y la eliminacin.

Supuesto 1 Analizar Regresin lineal Dependiente: Y; Independientes: X1, X2, X3, X4; Mtodo: Hacia adelante Aceptar Statistics Multiple Regression Variables: Dependent: FreqY; Independent: X1-X4 Pestaa Advanced Marcar Advanced options (stepwise ) OK Method: Forward stepwise OK. Probar con otras variantes buscando convergencia, i.e. Hacia atrs (backward).

11

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-12

4.3. Alternativas robustas y No paramtricas de regresin


9 Linea resistente de Tukey y Reajuste de los parmetros mediante un mtodo iterativo de Emerson y Hoaglin (1985)

Figura 4-1: Interpretacin grfica del parmetro de tasa de cambio en regresin robusta

9 9

Alternativa basada en los MM-Estimadores de regression Alternativa No paramtrica basada en la prueba de Brown-Mood

Ver para todas ellas el manual general recomendado y se ilustrarn en la ltima sesin.

12

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-13

4.4. Opciones de Regresin Lineal en los paquetes de Anlisis


Probablemente, paquetes como SPSS tienen ventajas en cuanto al anlisis de Modelos complejos a partir de la opcin de regresin por pasos. En cambio, paquetes como Statistica son preferibles desde el punto de vista de la Modelizacin. Otros paquetes como S-Plus son la opcin para Regresin Robusta.

13

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-14

4.4.1.

Opciones de Regresin Lineal en SPSS 12.0/15.0

14

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-15

4.4.2.

Opciones de Regresin Lineal en Statistica

A) Aproximacin clsica

B) Aproximacin Modelizacin

15

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-16

A) Aproximacin clsica (Regresin Mltiple):

B) Aproximacin Modelizacin (Modelo Lineal General GLM-):

16

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-17

4.4.3.

Opciones de Regresin Lineal en R

# Regresin Lineal # 1) Definir el Modelo ModeloLin <- lm(FreqY~X2, data=Sup1Marip) # 2) Obtener resultados de Regresin summary(ModeloLin) # show results # 3) Modelo Completo ModeloLin <- lm(FreqY~ X1+X2+ X3+ X4, data=Sup1Marip) #Ver R2 # 4) Comparacin Modelos segn Modelizacin AMP-COM ModeloLinAMP <- lm(FreqY~ X1+X2+ X3+ X4, data=Sup1Marip) ModeloLinCOM <- lm(FreqY~ X1+X2, data=Sup1Marip) anova(ModeloLinAMP, ModeloLinCOM) Resumen de anlisis de regression lineal ----------------------------------------------------------------lm(FreqY~ X1+X2+ X3+ X4, data=Sup1Marip) cor(FreqY, X1), cor.test(FreqY, X1): calcular y probar significacin de correlaciones coef(ModeloLin), coefficients(ModeloLin) # Coeficientes predict(ModeloLin), fitted(ModeloLin) # Predicciones del Modelo residuals(ModeloLin) # Residuales confint(ModeloLin, level=0.95) # Intervalos Confianza anova(ModeloLin) # Tabla ANOVA para regresin vcov(ModeloLin) # Matriz Var-Covar para los parmetros modelo influence(ModeloLin) # Diagnsticos Regresin basados en las medidas de Influencia plot(ModeloLin) # Grficos diagnsticos summary(ModeloLin) #Compendio de resultados df.residual(ModeloLin) #Grados Libertad Modelo deviance(ModeloLin) #Desvianza ----------------------------------------------------------------# Stepwise Regression # Basado en la medida AIC library(MASS) ModeloLin <- lm(FreqY~ X1+X2+ X3+ X4, data=Sup1Marip) step <- stepAIC(ModeloLin, direction="both") step$anova # display results #o bien step(ModeloLin) update(ModeloLin,. ~ . -X1 -X2) #para ir alterando el Modelo (ver http://www.stat.ucla.edu/~fredphoa/Spring2007_Stat120B/Note3.pdf) #Al estilo de SPSS a partir de las p-entrar o p-salir. source("http://bioconductor.org/biocLite.R") biocLite("maSigPro") library(maSigPro) dise <- as.data.frame(cbind(X1, X2, X3, X4)) stepback(y=FreqY, d=dise, alfa = 0.05) stepfor(y=FreqY, d=dise, alfa = 0.05)

17

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos #Modelos mas complejos #Polinmicos ModeloLin2 <- lm(FreqY~ X1+ X2+ X3+ X4 + poly(X1,2), data=Sup1Marip) #Con interacciones ModeloLin2 <- lm(FreqY~ X1*X2 + X3+ X4, data=Sup1Marip) #Colinealidad library(car) vif(ModeloLin) tolerance = 1/vif # pcor Rutina de clculo de la Corr Parcial # Calcula el Coef Corr Parcial v1 and v2 # controlando la influencia de v3 pcor <- function(v1, v2, v3) { c12 <- cor(v1, v2) c23 <- cor(v2, v3) c13 <- cor(v1, v3) partial <- (c12-(c13*c23))/(sqrt(1-(c13^2)) * sqrt(1-(c23^2))) return(partial) } pcor(FreqY, X1, X2) #Coef Corr Parcial X1-Y controlando X2 Especificacin de tipos de Efectos en los Modelos X1+X2 X1+X2 Aditivo X Efecto adictivo de sus columnas Xi X1:X2 X1xX2 Interaccin X1*X2 X1 + X2 + X1xX2 Interacc y aditivos poly(X1, n) X1n polinomio de grado n ^n Todas Interacciones hasta nivel n. (X1+X2+ X3)^2 = X1+X2+X3+X1xX2+ X1xX3+X2xX3 X2 %in% X1 Efecto de X2 anidado en X1 (X1+X1xX2 X1/X2) -X2 Elimina el Efecto de X2, (X1+X2+X3)^2-X1:X2 = X1+X2+X3+X1xX3+X2xX3

IV-18

18

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-19

4.5.

Realizacin de los supuestos de prcticas

Gua del anlisis en Regresin Anlisis exploratorio de los diagramas de dispersin Anlisis del modelo SATURADO de referencia Anlisis de los residuales (estandarizados) y de las distancias de influencia indebida para decidir sobre los posibles puntos extremos. Confirmar conclusiones de significacin para cada predictor mediante regresin por pasos. Si grficos de residuales sugieren funciones curvilneas entonces pasar al anlisis polinmico (regresin curvilnea). Incluir interacciones si estn justificadas desde el punto de vista terico.

19

Manuel Miguel Ramos lvarez

Curso de Recursos metodolgicos y estadsticos

IV-20

4.5.1. Ejemplificacin del anlisis de Regresin mediante el Supuesto 1


[Grficos|Dispersin] o mejor [Grficos|Interactivos|Dispersin ] para ajustar la linea de regresin lineal. Los diagramas de dispersin de cada predictor frente al criterio Anlisis del modelo SATURADO de referencia, es decir el que incluye todos los predictores (X1 a X4) y de manera lineal. [Analizar|Regresin lineal] Seleccionamos las opciones de Estadsticos, Grficos y Guardar que aparecen en las ventanas precedentes Anlisis de los residuales Observar al menos los grficos de RRESID frente a ADJPRED, incluyendo los grficos parciales y el de probabilidad normal Confirmarlo a partir de las Distancias de Cook. El caso 8 parece tener un error estandarizado muy elevado pero puesto que est justificado, entonces no se omitira Confirmar las conclusiones de los parmetros significativos (nicamente la inversa de la variable predoctora X1) mediante regresin por pasos, por ejemplo introduciendo variables en pasos sucesivos. Probar Modelo polinmico [Analizar|Regresin|Estimacin curvilnea ] La pregunta clave es Se gana en ajuste R2 al cambiar a un modelo ms complejo que el lineal? Centrar el modelo significativo y resumirlo adecuadamente.

Volver Principio

20

S-ar putea să vă placă și