Sunteți pe pagina 1din 41

REGRESIÓN MÚLTIPLE

R. Pérez Juste
Catedrático emérito de la UNED
INTRODUCCIÓN
EL TALLER DE DATOS CUANTITATIVOS
—  Módulo básico
—  Módulo multivariable:
Ø  Regresión múltiple
Ø  Análisis discriminante
Ø  Análisis factorial
Ø  Metaanálisis
© R. Pérez Juste
PRESENTACIÓN
0. PUNTO DE PARTIDA: UN CASO
1.  Contexto metodológico de la investigación
2.  Qué es el Análisis de regresión (AR)
3.  Qué es el AR múltiple (ARM)
4.  Para qué tipo de problemas se utiliza
5.  Qué exigencias presenta
6.  Cómo se lleva a cabo
7.  Cómo se interpreta
© R. Pérez Juste
0.
PUNTO DE PARTIDA:
Un caso
Punto de partida:
un problema pedagógico a investigar

La mejor terapia es la de carácter preventivo.

Una pedagogo, un orientador escolar, se


sentiría satisfecho de poder actuar
preventivamente sobre los alumnos con
riesgo de fracaso escolar, de rechazo
social, de exclusión.
Supongamos un caso con alumnos de 1º de
ESO © R. Pérez Juste
Punto de partida:
un problema pedagógico a investigar. 2

Primera fase (investigación)


—  Los profesores de Matemáticas desean intervenir
preventivamente para reducir los fracasos en su
asignatura
—  A partir de su experiencia y lecturas hipotetizan las
variables que pueden estar detrás de tal fracaso. (Estado
de la cuestión)
—  Desean identificar las variables que más contribuyen al
éxito académico en Matemáticas
—  También tratan de conocer el peso de cada una de ellas
© R. Pérez Juste
Punto de partida:
un problema pedagógico a investigar. 3

Segunda fase (aplicación)


—  Conocidas tales variables y su peso, las aplican a nuevos
alumnos para identificar los que tienen riesgo de fracaso.
—  Actúan preventivamente sobre ellos, tratando de evitar que
se cumpla el pronóstico
—  En etapas sucesivas podrá mejorarse la predicción en
función de los resultados alcanzados.
Ø  Instrumentos más fiables y válidos
Ø  Muestras más representativas
Ø  Mejores predictores (correlaciones más elevadas)
© R. Pérez Juste
1.
CONTEXTO METODOLÓGICO DE
LA INVESTIGACIÓN
DOS GRANDES EXTRATEGIAS DE INVESTIGACIÓN:
A) Estrategia experimental
Trata de probar hipótesis “hacia delante”

§  ¿Qué ocurre en una variable dependiente cuando se actúa sobre


una o varias independientes?. Sigue los rigurosos pasos del
denominado método científico (Dewey)

§  Atribuir los efectos de la “actuación” -en términos técnicos


“manipulación”- a las variables independientes exige control de
otras posibles variables (variables extrañas, hipótesis rivales).

§  El diseño experimental está orientado a lograr ese control en sus


diversas manifestaciones. Si se logra, el diseño tiene validez
interna
© R. Pérez Juste
DOS GRANDES EXTRATEGIAS DE INVESTIGACIÓN:
B) Estrategia correlacional
§  En general, trata de establecer la relación existente entre
dos o más variables que ya han actuado:
•  Investigación “ex - post - facto”.
§  A partir de la correlación se puede proceder a su utilización
práctica:
•  Predicción
•  Identificación de variables que deben ser sometidas a
control en un experimento.

§  Al no pretender atribuir efectos a causas, no precisa del


control.
§  Se puede trabajar con dos variables -correlación simple- o
más: correlación parcial y múltiple. © R. Pérez Juste
2.
QUÉ ES EL ANÁLISIS DE
REGRESIÓN (AR)
QUÉ ES EL ANÁLISIS DE REGRESIÓN (AR)

•  Técnica basada en la correlación (r xy)


•  Dos grandes objetivos:
§  Identificar las variables antecedentes (X) que mejor
predicen la variable criterio (Y)
§  Aplicarlas a la predicción para tomar
preventivamente las medidas que correspondan
•  La regresión permite predecir Y a partir de los
valores de X, con cierta probabilidad

© R. Pérez Juste
QUÉ ES EL ANÁLISIS DE REGRESIÓN (AR)

•  Ecuación de regresión simple: Y = bX + a.


o  Donde b es el peso del predictor X; y a es una constante. Si se
predice en puntuaciones típicas, a = 0
•  La precisión de la predicción depende de la intensidad de la
correlación rxy
•  Habitualmente esos valores son bajos en Educación (raramente son
mayores que 0,6)
•  En tales casos la parte no predicha de Y alcanza hasta el 64 % de la
varianza del criterio.
•  Una solución es acudir a más variables predictoras mediante la
correlación múltiple (R1.23..n)
© R. Pérez Juste
ANÁLISIS DE REGRESIÓN SIMPLE (AR)
Datos de N = 41 sujetos en X = inteligencia e Y = rendimiento
X Y X
64
Y5
✽  95
92
90
8
9
7
61
58
4
7
55 6
90 7
54 4
87 7
43 6
84 6
40 6
82 8
39 7
82 6
37 5
80 8
37 4
79 9
35 6
79 9
35 6
76 5
34 5
75 6
34 5
74 7
32 3
74 8
30 3
73 7
30 6
71 7
28 4
70 5
28 3
69 6
25 3
66 5
20 5

∑ 2407 243

Media: 58,71 5,93


DT 22,96 1,66
© R. Pérez Juste
QUÉ ES EL ANÁLISIS DE REGRESIÓN (AR)
10

7
RENDIMIENTO

0
0   10   20   30   40   50   60   70   80   90   100  
iNTELIGENCIA

y = 0,0505; a = 2,964; r = 0,696; R² = 0,4848 © R. Pérez Juste


3.
QUÉ ES EL ANÁLISIS DE
REGRESIÓN MÚLTIPLE (ARM)
ANÁLISIS DE REGRESIÓN MÚLTIPLE

Variables: CRITERIO = rendimiento


Predictores: “locus” de control = 1; inteligencia = 2;
No se puede mostrar la imagen. Puede que su equipo no tenga suficiente memoria para abrir la imagen o que ésta esté dañada. Reinicie el equipo y, a continuación, abra el archivo de nuevo. Si sigue apareciendo la x roja, puede que tenga que borrar la imagen e
insertarla de nuevo.

técnicas de estudio = 3; conocimientos básicos = 4; motivación= 5.


Rc.12345 = 0,85; d2 = R2 x 100 = 0,85 x 100 = 72,25 %

Predictor 4 Predictor 3

Criterio
Criterio
Predictor 5
Predictor 1

Predictor 2

© R. Pérez Juste
QUÉ ES EL ANÁLISIS DE REGRESIÓN MÚLTIPLE (ARM)
Ecuación de regresión múltiple:
• Y = b1 X1 + b2 X2 +… + bn Xn + a
ü  X: valores de las variables seleccionadas
ü  b: coeficientes de regresión; peso de la variable en
la predicción
ü  a = constante; igual para todos los casos
• El valor de b es: b = R (sy / sx)

•  El valor de a es el punto en que la recta de regresión


corta al eje de ordenadas. En el caso de ecuaciones de
regresión en puntuaciones típicas a = 0

© R. Pérez Juste
4.

EXIGENCIAS QUE PLANTEA

D
EXIGENCIAS QUE PLANTEA EL ARM
—  La base: selección inicial de buenos predictores.
* Lo que no entre en el estudio, nunca podrá salir.
— Cumplimiento de los supuestos paramétricos
§  Independencia entre los predictores
§  Evitar la multicolinealidad
• Relación lineal entre las variables
•  En ocasiones, solo es un supuesto no probado
• Homoscedasticidad
• Nivel de medida de intervalo
• Tema polémico, ya estudiado en otros análisis
© R. Pérez Juste
EXIGENCIAS QUE PLANTEA EL ARM

— Para generalizar la aplicación, muestras representativas


(tamaño suficiente y selección imparcial)
— Fundamental en los estudios de investigación.
— En el caso de aplicación de los resultados, es una “conditio
sine qua, non”

© R. Pérez Juste
5.
PARA QUÉ TIPO DE
PROBLEMAS
PARA QUÉ TIPO DE PROBLEMAS
INVESTIGACIÓN
•  Identificar las variables antecedentes que mejor
predicen una variable criterio
• Seleccionar el conjunto de variables que
optimizan la predicción del criterio.

APLICACIÓN
• Identificar sujetos en riesgo por medio de la
predicción
•  Utilidad: aplicar tratamientos pedagógicos
adecuados
© R. Pérez Juste
6.
CÓMO SE REALIZA EL
PROCESO
CÓMO SE REALIZA EL PROCESO
INVESTIGACIÓN
• Documentarse para la selección inicial de variables
predictoras del criterio (estado de la cuestión)
•  Medirlas con instrumentos fiables y válidos
•  Comprobar que se cumplen los supuestos
•  Obtener la matriz de correlaciones entre las variables

© R. Pérez Juste
CÓMO SE REALIZA EL PROCESO
INVESTIGACIÓN
•  Seleccionar los mejores predictores (procedimiento
paso a paso -“stepwise regression” )

•  El primer predictor es el que mantiene con el criterio la


correlación más elevada.

•  Seguir seleccionado predictores mientras el valor de R


aumente.

•  Obtener la ecuación de regresión múltiple:


Y = b1 X1 + b2 X2 +… + bn Xn + a
© R. Pérez Juste
CÓMO SE REALIZA EL PROCESO
APLICACIÓN
•  Obtener las puntuaciones predichas en el criterio
•  Comprobar los límites entre los que se encontrará la
verdadera puntuación en el criterio para una
determinada probabilidad (intervalo confidencial)
• Calcular el intervalo confidencial
•  Tomar las medidas pedagógicas adecuadas

© R. Pérez Juste
7.
CÓMO SE INTERPRETA
CÓMO SE INTERPRETA
•  R² = D; coeficiente de determinación
•  D x 100 = % de varianza del Criterio explicada
•  R² tiende a sobreestimar el verdadero valor en la población. Por ello
se recomienda Ra² (R² ajustado)
Ra² = (n-1)R² - p / n – p - 1
• p = número de variables predictoras
•  n = número de sujetos de la muestra
•  Alternativa a R²= análisis de las distancias a los valores
predichos con la ecuación de regresión
• Tomar las medidas pedagógicas adecuadas
© R. Pérez Juste
CÓMO SE INTERPRETA
• Primer objetivo: el ARM nos informa:
•  Sobre la calidad de las variables inicialmente hipotetizadas como
predictoras del criterio
•  Podemos haber seleccionado variables que no están suficientemente
correlacionadas
•  Podemos haber dejado fuera variables altamente relacionadas
•  De las que mejor predicen el criterio
•  Del peso de estas variables predictoras

•  Segundo objetivo: el ARM nos informa:


•  Del valor predicho para cada sujeto
•  De los sujetos sobre los que intervenir
•  Del nivel de riesgo en la predicción
© R. Pérez Juste
CONCLUYENDO
Concluyendo
La correlación es un índice del grado de relación entre dos o más variables. Oscila
entre ± 1. Los valores de 1 indican correlación perfecta (una función); 0
indica ausencia de relación y los demás representan correlaciones
imperfectas, positivas o negativas.
La relación entre variables es la que es, pero cuando se desea utilizar para
predecir una en función de los valores de la otra, debemos tratar de
alcanzar valores tan elevados como sea posible.
Para ello podemos mejorar la relación utilizando instrumentos de calidad (válidos y
fiables), seleccionar las variables que mantienen las correlaciones más
elevadas o utilizar más de un predictor.
En este caso estamos ante la correlación múltiple, a partir de la cual podemos
predecir mediente la regresión múltiple.

© R. Pérez Juste
Concluyendo
La regresión múltiple permite seleccionar los mejores predictores de un criterio y
construir la mejor ecuación de regresión a partir de los predictores
inicialmente seleccionados.
Mediante la correlación múltiple podemos predecir los valores de la variable
criterio.
Esta predicción nunca será perfecta, pero mejorará la realizada por la correlación
simple.
Cualquier predicción implica aceptar que el valor predicho es una estimación del
verdadero valor para un determinado grado de seguridad, y debe ser
interpretado en términos de probabilidad.
De ahí la necesaria prudencia al utilizar estas técnicas para la toma de decisiones
sobre las personas.
© R. Pérez Juste
AUTOCONTROL
AUTOCRONTROL
1.  Entre las actuaciones que pueden mejorar la predicción, aquí
nos hemos centrado en:

2.  En la misma línea, nos hemos referido a la calidad de los


predictores. En concreto, a que estos sean:

3.  La modalidad de investigación en la que se estudian las


variables que ya han actuado se denomina:

4.  Dada la naturaleza del tipo de investigación anterior, es


fundamental poder controlar tales variables (V/F)

5.  La correlación múltiple, representada por R, indica la relación


entre:
© R. Pérez Juste
AUTOCRONTROL
6.  La precisión en la predicción aumenta en función de la
intensidad de la correlación, siempre que esta sea positiva (V/F)
7.  Dado que las correlaciones entre dos variables raramente
superan valores de 0.6, se recomienda acudir a la:
8.  En la correlación múltiple, el valor de R resulta de la suma de los
valores de “d” de los diferentes predictores. V/F
9.  Si el coeficiente de determinación tiene un valor de 36 %, el
valor de rxy será:
10.  Entre los supuestos necesarios para el cálculo de la correlación
y la regresión, hemos citado, en lo referente a la medida:

© R. Pérez Juste
AUTOCRONTROL
11.  Entre los supuestos exigibles por esta técnica hemos citado un tipo
de relación entre las variables, en concreto:

12.  Entre los problemas para los que se aplica la regresión múltiple
hemos citado el de la identificación de:

13.  La ecuación de regresión múltiple nos indica la______ del criterio a


partir del inicial conjunto de posibles variables predictoras.

14.  El procedimiento de selección de variables que hemos recomendado


se denomina:

15.  En el proceso de selección de predictores, el primero de ellos es:

© R. Pérez Juste
AUTOCRONTROL
16. En principio, la inclusión de predictores en la ecuación de regresión
continua mientras el valor de R:

17. Se considera que el valor R² :

18. Ante el hecho anterior se recomienda:

19. Si el valor de R es bajo (no significativo) se debe a que ha habido


errores en los cálculos (V/F)

20. De la selección inicial de predictores dependerá el éxito o fracaso en la


regresión múltiple (V/F)

© R. Pérez Juste
BIBLIOGRAFÍA
RECOMENDADA
BIBLIOGRAFIA RECOMENDADA
MARTÍNEZ ARIAS, R (1999) El análisis multivariante en la
investigación científica. Madrid: Editorial La Muralla
ETXEBERRIA, J y otros (1999) Regresión múltiple. Madrid:
Editorial La Muralla
LEWIS-BECK,M.S. (1980) Applied regression. An
Introduction. A Sage University Paper
BISQUERRA ALZINA, R. (1989) Introducción conceptual al
análisis multivariable, Barcelona: PPU
SÁNCHEZ CARRIÓN, J.J. (1984) Introducción a las técnicas
de análisis multivariable aplicadas a las ciencias sociales.
Madris: CIS

© R. Pérez Juste
© R. Pérez Juste

S-ar putea să vă placă și