Sunteți pe pagina 1din 17

AYUDA SPSS

INSERCIÓN DE LA RECTA DE REGRESIÓN EN EL


DIAGRAMA DE DISPERSIÓN 1

PROF. RUBÉN JOSÉ RODRÍGUEZ

15 DE AGOSTO DE 2018

AYUDA SPSS_Diagrama de Dispersión e Inserción Recta de Regresión

Introducción

Este documento de Ayuda se refiere a la representación gráfica bi-dimensional de los pares


de valores de una tabla bivariada con la finalidad de observar la dispersión de los puntos en el
plano y trazar la recta de regresión que atraviese dicha nube y minimice los máximos desvíos
(recta de los cuadrados mínimos). .

En la Ayuda se muestra paso a paso el procedimiento en SPSS para graficar un diagrama de


dispersión. Así mismo, se utiliza el Fichero MUNDO 95 para calcular la ecuación de
regresión lineal simple entre indicadores socio-demográficos, estimando la esperanza de
vida femenina a partir de la alfabetización en una muestra de indicadores de 109 países del
mundo correspondientes a 1995.
Así mismo, se obtienen el coeficiente de correlación, los coeficientes “a” y “b”, el error
típico de estimación, con la finalidad formular la ecuación de estimación del puntaje
verdadero, obteniendo los límites inferior y superior del intervalo de confianza (IC.95)
Se realiza la graficación de la recta de regresión utilizando el Diagrama de
dispersión/puntos con las opciones Cuadro de diálogos antiguos y Generador de
gráficos del menú Gráficos.

Por último, se insertan las fórmulas de la Ecuación de Regresión y se realizan los cálculos
para estimar el Intervalo de Confianza del 95% (IC.95 ). También se inserta la Curva Normal
para visualizar el Y’ (Ycalculado) sobre la recta de regresión e identificar los límites del
intervalo de confianza.

1
Hasta la versión 14.0 de SPSS existía en el menú Gráficos dos grandes opciones de graficación:
Galería de gráficos, y Gráficos interactivos. Estos últimos tipos de gráficos desaparecieron a partir de
dicha versión y se introdujeron dos nuevas opciones: Generador de gráficos y Cuadro de diálogos
antiguos, en esta última opción se incorporaron parte de la galería de gráficos de las versiones
anteriores del SPSS. La versión SPSS 20.0 es la utilizada en la presente Ayuda.

1
MENÚ > GRÁFICOS

(A) CUADRO DE DIÁLOGOS ANTIGUOS

2
DIAGRAMA DE DISPERSIÓN SIMPLE

DEFINICIÓN DE VARIABLES

DIAGRAMA DE DISPERSIÓN

ESPERANZA DE VIDA FEMENINA SEGÚN ALFABETIZACIÓN (%)

3
A continuación se indican los pasos a seguir con la versión 20.0 de SPSS para insertar la
Recta de Regresión en el gráfico de Dispersión y trazar la banda de confianza del 95% o
Intérvalo de Confianza del 95% (IC.95)

- Hacer doble click en el diagrama de dispersión. Se abrirá el Editor de gráficos.

Añadir una línea


de referencias
desde la ecuación

- En la barra de íconos hacer click en el ícono , se abrirá un cuadro de diálogo donde


se debe tildar Adjuntar etiqueta a línea y se insertará la recta de regresión con la respectiva
ecuación de regresión lineal simple:

4
- Se debe hacer click fuera del gráfico para salir del Editor de gráficos.

5
- Otra alternativa para insertar la Línea de regresión es hacer click en el menú Opciones en
el menú Editor de gráficos y en la opción Línea de referencia desde la ecuación.

Y se insertará la recta de regresión como en la vista del diagrama de dispersión anterior

- O bien, en el menú Elementos, haciendo click con la opción Línea de ajuste total

- y se abrirá un nuevo cuadro de diálogo donde se debe indicar Método de ajuste: Lineal y
para insertar el Intervalo de Confianza del 95% (IC.95) en el diagrama de dispersión tildar
individuos.

- Por último, se oprime el botón Aplicar, y se aplicarán las funcionalidades pedidas.

6
- Haciendo click fuera del Editor del gráficos se visualizará el diagrama de dispersión
con inserción de la recta de regresión y la banda de confianza al 95% o Intervalo de
Confianza al 95% (IC.95), en el Visor de resultados. Las líneas del intervalo de
confianza se ubicarán a ± 1,96z de la recta de regresión.

7
MENÚ > GRÁFICOS

(B) GENERADOR DE GRÁFICOS2

Se abre una ventana interactiva que permite visualizar el aspecto general que tendrá el
gráfico al generarlo.

Lienzo del generador.


Previsualización del gráfico

- En la pestaña Galería elegimos el gráfico deseado, en nuestro caso diagrama de


Dispersión/Puntos (scater plot).

- Se arrastra el ícono del tipo de diagrama de dispersión deseado al ‘lienzo’ del generador
de gráficos.

2
Ver tutorial en YouTube: Diagrama de dispersión y correlación de Pearson con SPSS.
Recuperado de https://www.youtube.com/watch?v=qZaVtGXN3I0 4:37’

8
Arrastrar al lienzo

- El generador de gráfico muestra una representación preliminar del gráfico en el lienzo.

9
- Del listado de variables arrastre, la variable independiente al eje X (alfabet) y al eje Y
(espvidaf). Y en el campo Establecer color, arrastramos la variable Región económica.

Oprimir el botón Aceptar y se aplicarán las instrucciones dadas al Gestor de gráficos:

10
- Para editar el gráfico de dispersión e insertar la Recta de regresión, título, subtítulos y notas al pie,
hacer doble click en el gráfico, y se abrirá el Editor de gráficos como en el caso de opción Cuadro de
diálogos antiguos, y hacer click en Anadir línea de ajuste total:

- Al insertarse la Recta de regresión en el diagrama de dispersión se abrirá la ventana de diálogo


Propiedades, desde donde se puede insertar el Intérvalo de confianza para el 95%.

11
- Al aplicar, se verá en el Editor de gráficos, el diagrama de dispersión con la recta de
regresión y la banda de confiabilidad insertada a ± 1,96z

- Para visualizar el diagrama de dispersión en el Visor de resultados hacer click fuera del Editor de
gráficos:

12
Indicadores Socio-Demográficos:

Esperanza de Vida femenina según Alfabetización (%)

Límites inferior y superior el Intervalo de Confianza (IC.95)

- Como se ve en el diagrama de dispersión se ha insertado el Coeficiente de determinación (r2) un


valor de 0,749, interpretándose que el 75% de la variación de la esperanza de vida femenina está
explicada por el porcentaje de alfabetización de la población, por lo que la diferencia al 100% se
denomina Coeficiente de indeterminación (K2), es decir que el 25% está explicado por otras
variables que no son la Alfabetización,pudiendose atribuir la variación a otras variables no incluídas
en el modelo, por ejemplo: PBI per capita, Ingesta diaria de calorías, Tasa de natalidad (por 1.000
habitantes), Número promedio de hijos, Mujeres alfabatizadas (%). Pero las correlaciones bivariadas
individuales de cada una de estas variables con la Alfabetización (%) son menores que la
correlación obtenida de ésta con la Esperanza de vida femenina (R = 0,865, R2 = 0,749 o 75%,
redondendo a dós decímales).

Correlación Esperanza de Vida Femenina (Y= Espvidaf) según Alfabetización (%) (X= Alfabet)

Espvidaf by Alfabet

Esperanza de Alfabetizació
vida femenina n (%)
Esperanza de vida Correlación de
1 ,865(**)
femenina (Y) Pearson
Sig. (bilateral) . ,000
N 109 107
Alfabetización Correlación de
,865(**) 1
(%)(X) Pearson
Sig. (bilateral) ,000 .
N 107 107

13
CÁLCULO DE LA RECTA DE REGRESIÓN

Ecuación de Regresión de Y en función de X

Estimar la Esperanza de vida femenina (Yc) conociendo la


Alfabetización (Xo)

Y = f (X)

Y=a+b*X

Yc = a + b * Xo

Y ’ = b0 + b 1 * X o

espvidaf = a + b * alfabet

Resumen del modelo (b)

R cuadrado Error típ. de la


Modelo R R cuadrado corregida estimación
1 ,865(a) ,749 ,747 5,361
a Variables predictoras: (Constante), Alfabetización (%): alfabet
b Variable dependiente: Esperanza de vida femenina: espvidaf

3
Coeficientes (a)

Coeficientes no Coeficientes Intervalo de confianza para


Modelo estandarizados estandarizados t Sig. B al 95%
Límite Límite
B Error típ. Beta inferior superior
1 (Constante) a 38,541 1,857 20,760 ,000 34,860 42,222
Alfabetización b 0,403 ,023 ,865 17,699 ,000 ,358 ,448
a Variable dependiente: Esperanza de vida femenina
Statistics
Esperanza de vida femenina
Valid 109
N
Missing 0
Std. Deviation 10,572

3
En azul se resalta los coeficiente a (ordenada al origen) y b (pendiente de la recta) que arroja SPSS
bajo el nombre de Constante (a) y Alfabetización (b) e indican que la recta corta a la ordenada Y
(espvidaf) en el punto 38,541 años, y que para incremento unitarios de X (alfabet) la variable Y
aumentará “b” unidades. Es decir, que cuando alfabet aumenta un punto porcentual, espvidaf
aumentará “b” unidades, esto es, 0,403 puntos porcentuales.

14
ECUACIÓN DE REGRESIÓN LINEAL SIMPLE

Y’ = a + b* Xo
YCalculado = a + b * XObservado
Y’ = b0 + b1 * X1
XObservado = alfabet = 95% (Argentina)

espvidaf = 38,541 + (0,403 * alfabet)

espvidaf = 38,541 + (0,403 * 95)

76,826 = 38,541+38,285

Y’ = Yc = espvidafcalculado = 76,826 años

SY : Desviación típica espvidaf : S espvidaf = 10,572

 y  s y  1  r 2 x, y
x

Y
x
: ES est : Error Típico de la estimación4 = S espvidaf * 1  R 2Corregido

ES est: Error Típico de la estimación = 10,572 * 1  r 2 corregido =

ESest: = 10,572 * 1  0, 747 =

ESest: = 10,572 * 0,253 =

ESest: = 10,572 * 0, 50229 =

ESest: = 5,31

44
Se utiliza el Error Típico de Estimación o Error Estándar de Estimación (ESest) “…para señalar la
amplitud admisible en un pronóstico hecho en virtud de la ecuación de regresión…La amplitud de
fluctuación admisible en la predicción de cualquier Y’ está dada por el ESest y es la misma para todos
los Xo, suponiendo homoscedasticidad [‘…que la variación en torno a la línea de regresión sea
constante para todos los valores de X’. (Berenson & Levine, 1992: 624)] las probabilidades son de
aproximadamente 95 entre 100 de que una Y pronosticada no implique un error de más de ± 1,96
ESest”. (Garrett, 1966: 191-192).

15
INTERVALO DE CONFIANZA DEL PUNTAJE VERDADERO (IC.95)

Nivel de significación: Pα  0, 05
Estimación bilateral: P / 2  0, 025  A0,975=  1,96z

Y  Yc  z *[ s y * 1  r 2 ]
Y  Yc  z * S yx
Li  Yc  z * S yx
Ls  Yc  z * S yx


IC(1 ) Yc  z * S yx  Y  Yc  z * S yx 

IC.95  Yc  z * S yx  Y  Yc  z * S yx 
Yc e  Y  Yc e

IC.95 Yc  z  s yx  Y  Yc  z  s yx 
Reemplazando:

IC.95 = {76,826 –(1,96* 5,31) ≤ Y∞ ≥ 76,826 +(1,96* 5,31)}

IC.95 = {76,826 -10,41 ≤ Y∞ ≥ 76,826 +10,41}

IC.95 = {66.42 ≤ Y∞ ≥ 87,24}

Li = 66.42
Ls = 87,24

Interpretación: Se puede predecir - con un 0,95 (95%) de confianza- que la


Esperanza de Vida Femenina de la población se encontrará en un intervalo que
tendrá como límite inferior de 66,42 años y como límite superior de 87,24 años,
para un 95% de Alfabetización. Con el riesgo de equivocarnos de 0,05 (5%), es decir,
5 veces de cada 100. La amplitud entre los límites inferior y superior define la banda
de confiabilidad del Y’.

16
Indicadores Socio-Demográficos:

Esperanza de Vida femenina según Alfabetización (%)

Límites inferior y superior del Intervalo de Confianza (IC.95)

Ls = Y’ + 1,96z * SYx
Ls = 76,826 + 1,96z * 5,31
Ls = 87,24

Y’ = 76,826

Li = Y’ – 1,96z * SYx
Li = 76,826 – 1,96z * 5,31
Li = 66,42

Referencias bibliográficas

Garrett, Henry (1966). Estadística en Psicología y Educación. Buenos Aires: Editorial Paidós

Berenson, Mark L. & Levine, David M. (1992). Estadística Básica en Administración. Conceptos y
Aplicaciones. México: Prentice-Hall Hispanoamericana.



17

S-ar putea să vă placă și