Documente Academic
Documente Profesional
Documente Cultură
ANÁLISIS BIVARIADO
I. Tablas de contingencia
Menú: Analizar
Estadísticos descriptivos
Tablas de contingencia...
Si lo desea, puede:
Permiten establecer si existe relación entre las variables, Para ello podemos utilizar:
1
Fuente: Tutorial del programa SPSS y documentos pdf entregados en el curso.
1
Para las tablas con dos filas y dos columnas, seleccione Chi-cuadrado para
calcular el chi-cuadrado de Pearson, el chi-cuadrado de la razón de
verosimilitud, la prueba exacta de Fisher y el chi-cuadrado corregido de Yates
(corrección por continuidad). Para las tablas 2 × 2, se calcula la prueba exacta de
Fisher cuando una tabla (que no resulte de perder columnas o filas en una tabla
mayor) presente una casilla con una frecuencia esperada menor que 5. Para las
restantes tablas 2 × 2 se calcula el chi-cuadrado corregido de Yates.
Para las tablas con cualquier número de filas y columnas, seleccione Chi-
cuadrado para calcular el chi-cuadrado de Pearson y el chi-cuadrado de la razón
de verosimilitud. Cuando ambas variables de tabla son cuantitativas, Chi-
cuadrado da como resultado la prueba de asociación lineal por lineal.
Correlaciones. Para las tablas en las que tanto las columnas como las filas contienen
valores ordenados, Correlaciones da como resultado rho, el coeficiente de correlación
de Spearman (sólo datos numéricos). La rho de Spearman es una medida de asociación
entre órdenes de rangos. Cuando ambas variables de tabla (factores) son cuantitativas,
Correlaciones da como resultado r, el coeficiente de correlación de Pearson, una medida
de asociación lineal entre las variables.
Nominal. Para los datos nominales (sin orden intrínseco, como católico, protestante o
judío), puede seleccionar el coeficiente Phi y V de Cramér, el Coeficiente de
contingencia, Lambda (lambdas simétricas y asimétricas y tau de Kruskal y Goodman)
y el Coeficiente de incertidumbre.
Ordinal: Para las tablas en las que tanto las filas como las columnas contienen
variables ordinales, seleccione Gamma (orden cero para tablas de doble clasificación y
condicional para tablas cuyo factor de clasificación va de 3 a 10), Tau-b de Kendall y
2
Tau-c de Kendall. Para pronosticar las categorías de columna de las categorías de fila,
seleccione d de Somers.
Kappa. Mide el acuerdo entre las evaluaciones de dos jueces cuando ambos están
valorando el mismo objeto. Un valor igual a 1 indica un acuerdo perfecto. Un valor
igual a 0 indica que el acuerdo no es mejor que el que se obtendría por azar. Kappa sólo
está disponible para las tablas cuadradas (tablas en las que ambas variables tienen el
mismo número de categorías).
3
Riesgo. Pata tablas 2x2, una medida del grado de asociación entre la presencia de un
factor y la ocurrencia de un evento. Si el intervalo de confianza para el estadístico
incluye un valor de 1, no se podrá asumir que el factor está asociado con el evento.
Cuando la ocurrencia del factor es rara, se puede utilizar la razón de las ventajas (odds
ratio) como estimación del riesgo relativo.
Para ayudarle a descubrir las tramas en los datos que contribuyen a una prueba de chi-
cuadrado significativa, el procedimiento Tablas de contingencia muestra las frecuencias
esperadas y tres tipos de residuos (desviaciones) que miden la diferencia entre las
frecuencias observadas y las esperadas. Cada casilla de la tabla puede contener
cualquier combinación de recuentos, porcentajes y residuos seleccionados.
Porcentajes. Los porcentajes se pueden sumar a través de las filas o a lo largo de las
columnas. También se encuentran disponibles los porcentajes del número total de casos
representados en la tabla (una capa).
Residuos. Los residuos brutos no tipificados presentan la diferencia entre los valores
observados y los esperados. También se encuentran disponibles los residuos tipificados
y tipificados corregidos.
4
Tipificados corregidos. El residuo de una casilla (valor observado menos valor
pronosticado) dividido por una estimación de su error típico. El residuo
tipificado resultante viene expresado en unidades de desviación típica, por
encima o por debajo de la media.
Ponderaciones no enteras. Los recuentos de las casillas suelen ser valores enteros, ya
que representan el número de casos de cada casilla. Sin embargo, si el archivo de datos
está ponderado en un momento determinado por una variable de ponderación con
valores fraccionarios (por ejemplo, 1,25), los recuentos de las casillas pueden que
también sean valores fraccionarios. Puede truncar o redondear estos valores antes o
después de calcular los recuentos de las casillas o bien utilizar recuentos de casillas
fraccionarios en la presentación de las tablas y los cálculos de los estadísticos.
Puede ordenar las filas en orden ascendente o descendente de los valores de la variable
de fila.
Las correlaciones miden cómo están relacionadas las variables o los órdenes de los
rangos. Antes de calcular un coeficiente de correlación, inspeccione los datos para
detectar valores atípicos (que pueden generar resultados equívocos) y evidencias de una
relación lineal. El coeficiente de correlación de Pearson es una medida de asociación
lineal. Dos variables pueden estar perfectamente relacionadas, pero si la relación no es
lineal, el coeficiente de correlación de Pearson no será un estadístico adecuado para
medir su asociación.
Estadísticos.
Para cada variable: número de casos sin valores perdidos, desviación típica y
media.
Para cada pareja de variables: coeficiente de correlación de Pearson, rho de
Spearman, tau-b de Kendall, productos cruzados de las desviaciones y
covarianzas.
5
Consideraciones sobre los datos
Menú: Analizar…
Correlaciones…
Bivariadas...
…Seleccione dos o más variables numéricas.
Coeficientes de correlación.
Peason: Es una medida de la asociación lineal entre dos variables. Los valores
del coeficiente de correlación van de -1 a 1. El signo del coeficiente indica la
dirección de la relación y su valor absoluto indica la fuerza. Los valores mayores
indican que la relación es más estrecha.
Valores e interpretación:
Los coeficientes de correlación pueden estar entre –1 (una relación negativa perfecta) y
+1 (una relación positiva perfecta).
Un valor 0 indica que no existe una relación lineal. Al interpretar los resultados, se debe
evitar extraer conclusiones de causa-efecto a partir de una correlación significativa.
6
Tabla N° 1
Interpretación de los coeficientes de correlación
Correlación Interpretación Correlación
positiva correlación negativa
+1 Máxima/Perfecta -1
+0,7 a +0,99 Muy fuerte -0,7 a -0,99
+0,5 a +0,69 Fuerte -0,5 a -0,69
+0,3 a +0,49 Moderada -0,3 a -0,49
+0,1 a +2,9 Baja -0,1 a -2,9
+0,1 a +0,9 Muy baja -0,1 a -0,9
0 Nula 0
Fuente: Elaboración propia basada en distintas fuentes.
III.- REGRESIONES
La regresión lineal estima los coeficientes de la ecuación lineal, con una (regresión
lineal simple bivariada) o más variables independientes (regresión múltiple o
multivariadda), que mejor prediga el valor de la variable dependiente. Por ejemplo,
puede intentar predecir el total de votos por un partido (la variable dependiente) a partir
de variables independientes tales como el gasto electoral en campaña, el nivel de
aprobación o conocimiento de los candidatos y la cantidad de minutos que han
aparecido en los medios de comunicación masivos (radio y/o tv. abierta).
Estadísticos.
7
Para cada variable: número de casos válidos, media y desviación típica.
Menú: Analizar…
Regresión…
Lineal...
Si lo desea, puede:
8
significa que las observaciones con varianzas grandes tienen menor impacto en
el análisis que las observaciones asociadas a varianzas pequeñas.
…de la VD que
“medida de la calidad de ajuste buscamos predecir.
de los diversos puntos de datos
Sin valor crítico
en torno a la línea de regresión”
determinado.
Reg: Q explicada 1°
Res: Q no explicada Menor
a 0,05
Reg mayor que Res
ANOVAb
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 641,048 1 641,048 976,328 ,000a
Residual 101,772 155 ,657
Total 742,820 156
a. Variables predictoras: (Constante), Gov ernment Ef f ect iv eness
b. Variable dependient e: Indice percepción corrupción 2005 Transp. Internacional
9
Punto de intersección
de la gradiente con el
eje vertical (Y)
Coeficientesa
Coef icientes
Coef icientes no estandarizad
estandarizados os
Modelo B Error típ. Beta t Sig.
1 (Constante) 4,140 ,065 64,001 ,000
Gov ernment
1,992 ,064 ,929 31,246 ,000
Ef f ectiv eness
a. Variable dependiente: Indice percepción corrupción 2005 Transp. Int ernacional
2. Evitar multicolinealidad
Generalmente, 1 (No menor que
0,2 ni cercano a 10)
Coefici entesa
Coef icientes
Coef icientes no estandarizad Estadí sticos de
estandarizados os colinealidad
Modelo B Error típ. Beta t Sig. Tolerancia FI V
1 (Constante) 4,140 ,065 64,001 ,000
Gov ernment
1,992 ,064 ,929 31,246 ,000 1,000 1,000
Ef f ect iv eness
a. Variable dependient e: Indice percepción corrupción 2005 Transp. Internacional
10
Evitar
heterocedasticidad:
Valores agrupados en
torno a 0 (-1 y + 1):
Residuos no
relacionados
11