Material elaborado en el marco de la Convocatoria de
Innovacin de 2010 del Vicerectorat de Convergncia
Europea i Qualitat de la Universitat de Valncia
SPSS: DESCRIPTIVOS
PROCEDIMIENTO DE ANLISIS INICIAL DE DATOS:
FRECUENCIAS Y ESTADSTICOS
Cuando analizamos los datos, lo primero que tenemos que
hacer es formar una idea sobre las caractersticas de las variables. Para eso hay que fijarse en los aspectos bsicos de las variables, como tendencia central, dispersin y forma de distribucin.
Tiene mucha importancia el tipo de variable que estamos
analizando,
Variable categrica: las medidas de tendencia central y de
dispersin carecen de importancia comparadas con la utilidad de una distribucin de frecuencias o un grfico de sobre la forma de distribucin.
Variable continua: distribucin de frecuencias pierde importancia
comparada con la capacidad informativa de las medidas de tendencia central y de dispersin.
Los diagramas de distribucin tambin tienen que ser diferentes
dependiendo de que la variable estudiada sea categrica o continua.
FRECUENCIAS:
Informa sobre los valores de la variable y el nmero de veces
(porcentajes) que se repiten esos valores.
Bakieva, M.; Gonzlez Such, J.; Garca-Bellido, R.; y Jornet, J.M.
Podemos activar opciones para poder calcular algunos de los estadsticos descriptivos ms utilizados (tendencia central, posicin, dispersin, asimetra, curtosis). Construir algunos grficos (de barras, sectores, histogramas). Controlar el formato.
La utilizacin de las opciones depende del hecho de que la
variable sea categrica o continua.
Para obtener distribucin de frecuencias:
Men: Analizar
- Estadsticos Descriptivos
- Frecuencias
En el primer cuadro que aparece seleccionamos las variables
que nos interesa describir.
La opcin Mostrar tablas de frecuencias est activada por
defecto, y nos permite decidir si se desea o no obtener la distribucin de frecuencias. Puede desactivarse si slo queremos ver algn grfico y algn estadstico descriptivo, los resultados mostrarn slo el nmero total de casos y de valores perdidos. Bakieva, M.; Gonzlez Such, J.; Garca-Bellido, R.; y Jornet, J.M. ESTADISTICOS. Podemos obtener informacin adicional utilizando los botones especficos del cuadro de dilogo Frecuencias. Para obtener estadsticos descriptivos:
Men: Analizar
- Estadsticos
En el subcuadro de dilogo Frecuencias: Estadsticos
Bakieva, M.; Gonzlez Such, J.; Garca-Bellido, R.; y Jornet, J.M.
Ejemplo de tabla de Frecuencias para una variable categrica:
Estas tablas son las que se generan de forma automtica (con
la casilla Mostrar tablas de frecuencias activada) y nos muestra 2 tablas: Estadsticos, que incluye Nmero de casos vlidos y perdidos y otra tabla que nos presenta datos de Frecuencias, Porcentajes, Porcentajes vlidos y Porcentajes acumulados (en este caso para la variable numero de cilindros).
Bakieva, M.; Gonzlez Such, J.; Garca-Bellido, R.; y Jornet, J.M.
En este caso la columna de la izquierda nos indica las categoras de la variable y las siguientes columnas presentan datos de Frecuencias, Porcentajes, Porcentajes vlidos y Porcentajes acumulados para cada categora de la variable.
Frecuencia es el nmero de veces que se repite un valor;
Porcentaje la frecuencia porcentual del valor en relacin con otros valores de la variable; Porcentaje vlido la frecuencia porcentual, calculada sin tener en cuenta los casos perdidos; Porcentaje acumulado la frecuencia porcentual, sumando el valor del porcentaje de la categora anterior; La ltima lnea muestra el nmero total de casos.
De forma adicional podemos solicitar siguientes estadsticos:
Valores percentiles (slo tiene sentido si las variables son
ordinales): podemos solicitar cuantiles: cuartiles, deciles, percentiles, etc.
Bakieva, M.; Gonzlez Such, J.; Garca-Bellido, R.; y Jornet, J.M.
- Cuartiles: percentiles 25, 50 y 75, es decir, los valores por debajo de los cuales se encuentra 25%, 50% y 75% de los casos respectivamente. - Puntos de corte para k grupos iguales: calcula valores que dividen la muestra en grupos de mismo tamao. El valor marcado por defecto es de 10, pero puede escribirse cualquier valor entre 2 y 100. - Percentiles: podemos solicitar percentiles concretos (en nuestro ejemplo hemos solicitado percentiles 5, 16 y 76).
Tendencia central: podemos seleccionar uno o ms de los
siguientes estadsticos:
- Media: media aritmtica. Requiere variables cuantitativas (de
intervalo o razn, aunque tambin podemos calcularla con datos ordinales).
Bakieva, M.; Gonzlez Such, J.; Garca-Bellido, R.; y Jornet, J.M.
- Mediana: percentil 50. Si el nmero de casos es par, la mediana se calcula como el promedio de los dos casos centrales cuando stos se encuentran ordenados. Si el nmero de casos es impar, la mediana es el valor del caso central de la distribucin. La mediana es un estadstico tpicamente ordinal (requiere variables ordinales al menos). - Moda. El valor que ms se repite. Si existen 2 o ms valores empatados en el nmero de repeticiones, solo se muestra el ms pequeo de ellos. Sirve para todo tipo de variables, pero es ms apropiada para datos categricos (es el estadstico que slo aprovecha la informacin nominal y con las variables continuas es esperable que todos los valores tengan una frecuencia igual a 1). - Suma. Suma de todos los valores.
Dispersin: podemos seleccionar uno o ms de los estadsticos:
Bakieva, M.; Gonzlez Such, J.; Garca-Bellido, R.; y Jornet, J.M.
- Desviacin tpica (apropiado para variables cuantitativas): raz cuadrada de la varianza. Mide el grado en que las puntuaciones de la variable se alejan de su media. - Varianza (apropiado para variables cuantitativas): medida de dispersin que se obtiene dividiendo por n-1 la suma de los cuadrados de las diferencias entre cada puntuacin y la media. - Amplitud (no apropiado para las variables nominales): diferencia entre el valor mximo y mnimo. - Mnimo. - Mximo. - E.T. media (apropiado para variables cuantitativas): Error tpico de la media: desviacin tpica de la distribucin muestral de la media. Se obtiene dividiendo la desviacin tpica de la variable por la raz cuadrada del nmero de casos.
Distribucin. Podemos seleccionar uno o ms estadsticos.
- Asimetra (slo tiene sentido para variables cuantitativas):
ndice que expresa el grado de asimetra de la distribucin. La asimetra positiva indica que los valores ms extremos se encuentran por encima de la media. La asimetra negativa
Bakieva, M.; Gonzlez Such, J.; Garca-Bellido, R.; y Jornet, J.M.
indica que los valores ms extremos se encuentran por debajo de la media. Los ndices de asimetra prximos a cero indican simetra. Los resultados tambin recogen el error tpico del ndice de asimetra - la desviacin tpica de la distribucin muestral del ndice de asimetra, el cual permite tipificar el valor del ndice de asimetra e interpretarlo como una puntuacin z con distribucin aproximadamente N (0,1). ndices tipificados mayores que 1,96 en valor absoluto permiten afirmar que existe asimetra (positiva o negativa, dependiendo del signo del ndice). - Curtosis (slo tiene sentido para variables cuantitativas): ndice que expresa el grado en que una distribucin acumula casos en sus colas en comparacin con los casos acumulados en las colas de una distribucin normal con la misma varianza. La curtosis positiva indica que en las colas de la distribucin hay acumulados ms casos que en las colas de una distribucin normal (lo cual suele coincidir con distribuciones ms puntiagudas que una distribucin normal). Los ndices de curtosis prximos a cero indican semejanza con la curva normal. Los resultados tambin recogen el error tpico del ndice de curtosis, el cual puede utilizarse para tipificar el valor del ndice de curtosis y poder interpretarlo como una puntuacin z distribuida aproximadamente N (0,1). ndices mayores que 1,96 en valor absoluto permiten afirmar que la distribucin se aleja de la distribucin normal.
Los valores son puntos medios de grupos: si la variable
que deseamos estudiar se encuentra agrupada en intervalos, esta opcin permite calcular la mediana y los percentiles, considerando que los valores de la variable son los puntos medios de intervalos uniformemente distribuidos. Esta opcin afecta a todas las variables de la lista Variables, no debera marcarse si una o ms variables de las listadas no se encuentran agrupadas en intervalos.
El material de este manual fue adaptado a partir de la informacin del Tutorial
de SPSS15.
Bakieva, M.; Gonzlez Such, J.; Garca-Bellido, R.; y Jornet, J.M.