Documente Academic
Documente Profesional
Documente Cultură
2
___________________
Regresin lineal mltiple
1. Introduccin.
En el tema anterior estudiamos la correlacin entre dos variables y las predicciones que
pueden hacerse de una de ellas a partir del conocimiento de los valores de la otra, es
decir, se pronosticaban valores determinados de una variable criterio (Y) en funcin de
segn qu valores se obtenan de una variable predictora (X).
Sin embargo, la prediccin de una variable (Y) a partir del conocimiento de otra nica
puede resultar un anlisis extremadamente simple de la realidad en la cual existen
mltiples factores que afectan a cualquier fenmeno que pretenda explicarse. En
Psicologa diremos que la conducta de los sujetos, en sus diversas manifestaciones,
constituye funcin de mltiples variables que la condicionan y/o determinan. Por
ejemplo, el comportamiento de un sujeto en una situacin conflictiva puede depender de
su temperamento, del nivel de conflictividad de la situacin, de su experiencia en
situaciones de este tipo por las que haya pasado previamente, etc... Es importante, pues,
estudiar con un modelo de anlisis ms complejo que el de la regresin simple, de qu
manera se producen estas relaciones entre la conducta y una serie ms o menos
numerosa de factores que la condicionan. El modelo de la regresin mltiple va a
permitirnos acometer esta tarea.
1.1.Ecuacin de regresin mltiple y supuestos.
Centrmonos, por ejemplo, en la variable xito acadmico. Intentemos identificar las
variables de las que depende la calificacin final de un sujeto que ha cursado la
enseanza secundaria y se presenta inminentemente a la selectividad. Explicar de forma
exclusiva dicha nota a partir del nivel de inteligencia de los sujetos puede resultar
demasiado simplista e incompleto. Posibles condicionantes adicionales que influyen
sobre la misma pueden ser: el nivel social o contexto cultural en el que se desenvuelve
el sujeto, la motivacin que siente por el estudio, el tiempo que emplea en dicho estudio
o la calidad de los profesores que haya tenido en su trayectoria estudiantil...
Seleccionemos, de todas estas, dos variables para confeccionar un modelo explicativo
del xito acadmico (la nota en una prueba final): La inteligencia y la motivacin por el
estudio. Formalizamos este modelo, de manera similar a como lo hacamos en regresin
simple, con una ecuacin del tipo:
Y = a + b1 X 1 + b2 X 2 + e
donde X1 y X2 son las variables predictoras contempladas, inteligencia y motivacin,
respectivamente. Sus coeficientes correspondientes representan el cambio previsto en Y
por cada unidad de cambio en cada X, manteniendo la otra variable X constante. As
25
R2 =
SC regresin
SCtotal
(Y Y )
1
N
(Y Y )
SC residual
1 R2 =
=
SCtotal
(Y Y )
1
N
(Y Y )
27
d
a
X1
a+b+c
a+b+c+d
d
1 RY2.12 =
a+b+c+d
RY2.12 =
X2
28
29
Modelo
1
2
Rajus
= 1 (1 R 2 )
( N 1)
( N k 1)
siendo, pues, una funcin del nmero de sujetos de la muestra y del nmero de
predictores contemplados en la ecuacin; por tanto ser mayormente minimizado cuanto
mayor es N y mayor el nmero de predictores contemplados. En nuestro caso:
2
Rajus
= 1 (1 .849)
(12 1)
= .816
(12 2 1)
(Y Y )
S res =
N k 1
Por otro lado, el siguiente cuadro nos proporciona informacin sobre la ecuacin de
regresin y sus coeficientes:
Coeficientes(a)
Coeficientes no
estandarizados
Modelo
B
1,737
,019
,109
a Variable dependiente: nota
(Constante)
Inteligencia
motivacin
Error tp.
,885
,009
,022
Coeficientes
estandarizados
Sig.
Beta
,320
,721
1,964
2,153
4,847
,081
,060
,001
Hay que tener en cuenta que las escalas en que se miden estas variables (inteligencia y motivacin) son bastante diferentes en su
amplitud (mayor en inteligencia que en motivacin) por lo que es previsible hasta cierto punto que una unidad de cambio en la
primera ejerza un efecto menor sobre la Y que una unidad de cambio en la segunda.
31
(nota)Y
c
a b
(inteligencia)X1
(motivacin) X2
( rY22 = .878 2 = .7709)
32
a+b+c
.
a+b+c+d
RY21.2 =
RY21.2 =
RY2.12 RY2 2
1 RY2 2
33
rY 1 rY 2 r12
1 rY22 1 r122
= 0.583
Desde el punto de vista analtico, pues, las correlaciones que presenta cada una de las
variables predictoras con la variable criterio (correlaciones bivariadas) no se
corresponden con las correlaciones de tipo parcial sobre las que se basa el clculo de los
coeficientes en la ecuacin mltiple. Es decir, en las correlaciones bivaridas, de
predictora y criterio entre s, no queda excluida la posible correlacin existente entre
ellas y otra tercera variable.
Para confirmar esto que decimos basta analizar cules son los valores de las
correlaciones bivariadas para nuestros datos:
Correlaciones
Inteligencia
Inteligencia
motivacin
nota
Correlacin de
Pearson
Sig. (bilateral)
N
Correlacin de
Pearson
Sig. (bilateral)
N
Correlacin de
Pearson
Sig. (bilateral)
N
motivacin
nota
,493
,675(*)
12
,104
12
,016
12
,493
,878(**)
,104
12
12
,000
12
,675(*)
,878(**)
,016
12
,000
12
12
Se observa que la variable inteligencia muestra con la nota una correlacin de .675
(estadsticamente significativa al .05) lo cual supone que el 45% (.6752 x 100) de la
variabilidad de la nota se explica por el efecto de la inteligencia. A qu es debido
entonces que el coeficiente parcial- asociado a dicha variable en la ecuacin mltiple
sea tan pequeo y no significativo (p=.06)? Pues precisamente a la correlacin
compartida entre inteligencia y motivacin (segn la tabla anterior igual a .493). Esta
correlacin (.493) resulta eliminada para estimar el coeficiente de correlacin parcial de
la inteligencia sobre la nota en la ecuacin mltiple, lo que hace que el valor de la
correlacin restante parcial- no resulte significativo. Dicho de otra forma: El
coeficiente asociado a la relacin entre inteligencia y nota se refiere al efecto exclusivo
de la inteligencia sobre la nota una vez eliminada la correlacin que sta mantiene con
la motivacin. As, podemos afirmar que cuanto mayor sea la correlacin que mantienen
entre s dos predictores en una ecuacin mltiple, ms cambio se aprecia en los valores
de los coeficientes de correlacin parcial respecto a los coeficientes de correlacin
simple. Un anlisis similar puede realizarse respecto a la variable motivacin para
comprobar que su correlacin bivariada con las notas no coincide con su correlacin
parcial con la misma.
Si hubisemos probado en una ecuacin de regresin simple el efecto de la inteligencia
sobre la nota los resultados hubieran sido:
34
Modelo
B
1,897
,040
a Variable dependiente: nota
(Constante)
Inteligencia
Error tp.
1,594
,014
Coeficientes
estandarizados
Sig.
Beta
,675
1,190
2,896
,261
,016
35
los coeficientes son directamente comparables. En este caso diremos que el efecto
esperado (en desviaciones tpicas) de la nota a cargo de la motivacin (X2) es de 0.401
(0.721-0.32) desviaciones tpicas ms que el cambio esperado por el efecto exclusivo de
la variable inteligencia.
2.4. Validez del modelo.
El ANOVA y su correspondiente ndice F es otra de las informaciones proporcionadas
por el comando regresin en el SPSS para el modelo mltiple. La tabla de resultados
obtenida para nuestros datos es:
ANOVA(b)
Suma de
Media
Modelo
Gl
cuadrados
cuadrtica
1
Regresin
36,238
2
18,119
Residual
6,428
9
,714
Total
42,667
11
a Variables predictoras: (Constante), motivacin, Inteligencia
b Variable dependiente: nota
F
25,368
Sig.
,000(a)
Como vemos, el modelo se muestra claramente vlido para representar los datos. El
valor de significacin obtenido (p=.000) indica que la probabilidad de que el conjunto
de variables predictoras introducidas no sea suficiente para aportar explicacin de los
valores predichos de Y es nula. Es decir, las variaciones en la variable nota se explican
significativamente por el conjunto de efectos predictivos identificados.
Sin embargo, un anlisis ms pormenorizado sobre cada uno de estos predictores (como
se tiene en la tabla anterior de coeficientes) nos conduce a afirmar que no todos ellos
resultan igualmente relevantes. Si es as, quizs sea conveniente llevar a cabo una
depuracin del modelo de regresin mltiple eliminando aquellos regresores que por sus
poderes predictivos no significativos- no expliquen mucho ms sobre Y que lo que ya
explican aquellos que s lo son. Veamos a continuacin cmo puede llevarse a cabo
esta tarea.
2.5. Depuracin del modelo.
2.5.1. Mtodo introducir.
Sabemos por los resultados obtenidos anteriormente (mediante el mtodo introducir)
que en nuestro modelo slo la variable motivacin ha resultado significativa en la
ecuacin para predecir la nota. Si en base a esta informacin eliminsemos del modelo
la variable inteligencia y calculsemos la ecuacin de regresin simple de la motivacin
sobre la nota tendramos:
36
Coeficientes(a)
Coeficientes no
estandarizados
Modelo
B
3,295
,133
a Variable dependiente: nota
(Constante)
Motivacin
Coeficientes
estandarizado
s
Error tp.
,595
,023
Sig.
Beta
,878
5,536
5,814
,000
,000
Y = 3.295 + .133 X
lo que indica que en esta ecuacin de regresin simple la nota se incrementa .133 puntos
por cada unidad incrementada en la variable motivacin (recurdese que cuando dicha
variable comparta la explicacin de la nota junto con la inteligencia en la ecuacin
mltiple su coeficiente parcial era .109, menor que el de ahora).
Y la validez de dicho modelo se prueba en la siguiente tabla de ANOVA donde el valor
de p asociado al ndice F nos indica una significacin de este coeficiente:
ANOVA(b)
Suma de
cuadrados
Gl
Regresin
32,927
1
Residual
9,740
10
Total
42,667
11
a Variables predictoras: (Constante), motivacin
b Variable dependiente: nota
Modelo
1
Media
cuadrtica
32,927
,974
F
33,807
Sig.
,000(a)
37
Variables
introducidas
Variables
eliminadas
Motivacin
Mtodo
.
Modelo
1
Error tp. de la
estimacin
,98690
El modelo adems resulta significativo con una p=.000 (el mismo del ANOVA de antes
calculado con la ecuacin simple motivacin-nota):
ANOVA(b)
Suma de
cuadrados
gl
Regresin
32,927
1
Residual
9,740
10
Total
42,667
11
a Variables predictoras: (Constante), motivacin
b Variable dependiente: nota
Modelo
1
Media
cuadrtica
32,927
,974
F
33,807
Sig.
,000(a)
Modelo
B
3,295
,133
a Variable dependiente: nota
(Constante)
motivacin
Coeficientes
estandarizados
Error tp.
,595
,023
Sig.
Beta
,878
5,536
5,814
,000
,000
Ntese que la ecuacin de regresin es, tal y como estimbamos antes a travs del
modelo de regresin simple al eliminar la inteligencia:
Y = 3.295 + 0.133 X
38
Beta dentro
Sig.
Inteligencia
,320(a)
2,153
,060
a Variables predictoras en el modelo: (Constante), motivacin
b Variable dependiente: nota
Correlacin
parcial
,583
Estadsticos de
colinealidad
Tolerancia
,757
39
d
a
Primer paso
RY2 .( 2.1) =
c
a+b+c+d
c
b
X1
Segundo paso
X2
RY2 ( 2.1) =
a+b
R =
a+b+c+d
2
Y1
c
a+b+c+d
RY2 ( 2.1) =
a+b+c
a+b
c
=
RY2.2 = .772
RY2.12 = .849
Por lo que el incremento en la variabilidad explicada de Y al introducir como nueva la
variable X1 (inteligencia) es:
40
K1 K
1 RY2.12
N K 1
Los grados de libertad asociados a esta F son: los de la diferencia entre el nmero total
de variables contempladas en el modelo y aqulla o aqullas incorporadas de nuevo
(para numerador) y el nmero total de variables (en el denominador).
En nuestro caso tendramos:
.849 .772
.077
2 1
F=
=
= 4.61
1 .849
.0167
12 2 1
Comparando esta F emprica con su correspondiente terica para 1 y 9 grados de
libertad y =.05 que es igual a 5.12, nos conduce a aceptar la hiptesis nula (.509<5.12)
y concluir que la correlacin semiparcial de la inteligencia con la nota no es
estadsticamente significativa. Es decir, la incorporacin de la variable inteligencia al
modelo en el que ya se contemplaba la motivacin no aumenta significativamente la
explicacin de Y.
En el SPSS podemos solicitar el clculo de la correlacin semiparcial de cualquier
variable con la Y marcando esta opcin dentro del apartado de estadsticos. Si as lo
hacemos, la salida correspondiente para nuestros datos sera la siguiente:
41
Coeficientes(a)
Coeficientes no
estandarizados
Modelo
1
(Constante)
Inteligencia
motivacin
B
1,737
,019
,109
Error tp.
,885
,009
,022
Coef.
Estandari
zados
Beta
,320
,721
Correlaciones
Orden
cero
Sig.
1,964
2,153
4,847
,081
,060
,001
Parcial
Semiparcial
,583
,850
,279
,627
,675
,878
Estadsticos de cambio
Modelo
1
R
cuadrado
R cuadrado
corregida
Error tp.
de la
estimacin
R
,878(
,772
,749
,98690
a)
2
,922(
,849
,816
,84514
b)
a Variables predictoras: (Constante), motivacin
b Variables predictoras: (Constante), motivacin, Inteligencia
Cambio
en R
cuadrado
Cambio en F
gl1
gl2
Sig. del
cambio en F
,772
33,807
10
,000
,078
4,636
,060
42
43