Sunteți pe pagina 1din 9

Ignacio Martn Tamayo

11

Tema: ESTADSTICA DESCRIPTIVA BSICA CON SPSS 8.0 NDICE ------------------------------------------------------------1. Introduccin 2. Frecuencias 3. Descriptivos 4. Explorar 5. Tablas de contingencia -------------------------------------------------------------1.- Introduccin En el programa SPSS existen varios procedimientos con los que abordar un estudio descriptivo de los datos. Hay diversas opciones que debemos conocer para establecer una primara aproximacin a los datos. Los procedimientos fundamentales para esta descripcin se encuentran en la opcin Resumir del men Estadstica y son: Frecuencias Descriptivos Explorar Tablas de contingencia

2.- Frecuencias El procedimiento Frecuencias proporciona estadsticos y representaciones grficas que resultan tiles para describir muchos tipos de variables. Es un buen procedimiento para una inspeccin inicial de los datos. Supongamos que deseamos estudiar una muestra de 50 sujetos a los que hemos medido cinco variables: edad, sexo, peso y altura. Veamos que salida nos proporciona el procedimiento frecuencias. En primer lugar, al ejecutar este procedimiento, nos aparece una ventana en la que hemos de seleccionar qu variables, son sobre las que deseamos obtener la informacin. Supongamos que en nuestro caso, deseamos ver que ocurre si seleccionamos las variables edad y sexo.

Ignacio Martn Tamayo

12

Si pulsamos aceptar sin modificar ninguna otra opcin la salida que proporciona el programa es la siguiente, para cada variable seleccionada EDAD Frecuencia Porcentaje Porcentaje Porcentaje vlido acumulado Vlidos 25 1 2,0 2,0 2,0 26 2 4,0 4,0 6,0 27 3 6,0 6,0 12,0 28 5 10,0 10,0 22,0 29 5 10,0 10,0 32,0 30 7 14,0 14,0 46,0 31 5 10,0 10,0 56,0 32 8 16,0 16,0 72,0 33 6 12,0 12,0 84,0 34 3 6,0 6,0 90,0 35 4 8,0 8,0 98,0 36 1 2,0 2,0 100,0 Total 50 100,0 100,0 Sexo Frecuencia Porcentaje Porcentaje vlido Hombre 23 46,0 46,0 Mujer 27 54,0 54,0 Total 50 100,0 100,0

Vlidos

Porcentaje acumulado 46,0 100,0

Adems, en el procedimiento frecuencias podemos establecer una serie de opciones. As, si en la ventana de Frecuencias elegimos el botn de Estadsticos podemos elegir un conjunto de ellos sobre las variables seleccionadas (valores percentiles, estadsticos de posicin, de dispersin o sobre la forma de la distribucin)

Ignacio Martn Tamayo

13

Si en ese cuadro seleccionamos, por ejemplo, media, mediana, desviacin tpica y varianza y lo ejecutamos para la variable edad, los resultados proporcionados, adems del cuadro referente a las frecuencias, son: EDAD N Vlidos 50 Perdidos 0 Media 30,80 Mediana 31,00 Desv. tp. 2,68 Varianza 7,18 Igualmente, en el procedimiento frecuencias existe una opcin para dibujar grficos. Si seleccionamos esa opcin aparecer la siguiente ventana:

Si seleccionamos la opcin Histogramas, por ejemplo, la salida ser:


EDAD
14 12

10

8 6

Fr ec ue nci a

4 Desv. tp. = 2,68 Media = 30,8 N = 50,00 26,0 28,0 30,0 32,0 34,0 36,0

2 0

EDAD

Igualmente, en el procedimiento frecuencias podemos abrir un cuadro de dilogo para establecer las opciones de formato, que son tres: Ordenar por: la tabla de frecuencias se puede ordenar respecto a los valores o respecto a la frecuencia de aparicin. Por defecto muestra los datos por valores de forma ascendente. Mltiples variables: Si desea generar tablas de estadsticos para mltiples variables podr mostrarlas, bien por separado, bien conjuntamente. Suprimir tablas con ms de n categoras: esta opcin impide que se muestren tablas que contengan ms valores que el nmero especificado.

Ignacio Martn Tamayo

14

3.- Descriptivos El procedimiento descriptivos muestra estadsticos de resumen univariados para variables en una nica tabla y calcula puntuaciones tipificadas (puntuaciones z).

Si se ejecuta el procedimiento para el conjunto de variables seleccionadas, la salida que proporciona el programa es la siguiente: Estadsticos descriptivos N Mnimo Mximo Media Desv. tp. EDAD 50 25 36 30,80 2,68 PESO 50 43,00 103,00 70,9200 14,3226 ALTURA 50 1,52 2,00 1,7088 ,1040 TASACARD 50 37,00 96,00 69,1600 11,2855 N vlido (segn lista) 50 Adems de los estadsticos que aparecen en el cuadro anterior es posible aadirles otros. Simplemente en el cuadro de Descriptivos hay que pulsar sobre el botn Opciones y aparecer la siguiente ventana:

En ella se pueden seleccionar ms estadsticos y elegir el orden de visualizacin de las variables (alfabtico o por el valor ascendente o descendente de las medias) 4.- Explorar Explorar genera estadsticos de resumen y representaciones grficas, bien para todos los casos o bien de forma separada para grupos de casos. Por ejemplo, si nosotros quisiramos saber las diferencias de tasa cardaca separadamente para hombres y mujeres de la muestra con la que venimos trabajando este sera el procedimiento adecuado. Cuando se ejecuta el procedimiento Explorar la ventana que aparece en pantalla es la siguiente:

Ignacio Martn Tamayo

15

En el cuadro de Dependientes, se deben incluir las variables a las que pretendemos calcular los estadsticos. En el cuadro Factores debemos incluir Las variables que utilizaremos para definir los grupos de casos. Por ejemplo, ahora el procedimeinto calcular los estadsticos separadamente para los grupos realizados en la variable sexo, esto es, hombres y mujeres. En el cuadro Etiquetar los casos mediante se pueden etiquetar los casos con sus valores en una variable, como puede ser una variable identificadora de caso. Por defecto, los casos se identifican mediante su nmero secuencial dentro del archivo de datos. Veamos la salida: Descriptivos TASACARD Sexo Hombre Media Intervalo al 95% Estadstico Error tp. 69,9565 2,2611 65,2673 74,6458 69,8406 70,0000 117,589 10,8438 46,00 96,00 50,00 11,0000 ,211 ,481 ,743 ,935 68,4815 2,2729 63,8094 73,1536 68,7078 66,0000 139,490 11,8106 37,00 92,00 55,00 15,0000 -,174 ,448 ,868 ,872

Lmite inferior Lmite superior

Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis Mujer Media Intervalo al 95% Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis

Lmite inferior Lmite superior

Adems, la salida proporciona dos grficos, de tallo y hojas (stem and leaf) y de caja (box) para cada grupo.

Ignacio Martn Tamayo

16

TASACARD Stem-and-Leaf Plot for SEXO= Hombre Frequency Stem & Leaf (=<46) 789 0 555569 0023 5568 04 5 (>=96)

100
38

90

1,00 Extremes 3,00 5 . 1,00 6 . 6,00 6 . 4,00 7 . 4,00 7 . 2,00 8 . 1,00 8 . 1,00 Extremes Stem width: Each leaf:

80

70

60

50

T ASAC ARD

40
32

30
N= 23 27

10,00 1 case(s)

Hombre

Mujer

Sexo

Dentro del cuadro de dilogo Explorar hay varios botones con los que podemos acceder a nuevas ventanas. As el botn Estadsticos nos abre la siguiente ventana:

En esta ventana aparecen varias opciones: Descriptivos: Por defecto se muestran los estadsticos que han aparecido en la salida anterior: media, intervalo de confianza al 95%, media recortada, mediana, varianza, desviacin tpica, mnimo y mximo, rango, amplitud intercualtil, asimetra y curtosis. Estimadores robustos centrales: Permite calcular alternativas robustas a la mediana y a la media muestral para calcular el centro de localizacin. Se muestran los siguientes: el estimador M de Huber, el estimador en onda de Andrew, el estimador M redescente de Hampel y el estimador biponderado de Tukey. Valores atpicos: Muestra los cinco valores mayores y los cinco menores, con las etiquetas de caso. Percentiles: Muestra los valores de los percentiles 5, 10, 25, 50, 75, 90 y 95.

En el botn Grficos tambin existen varias opciones:

Ignacio Martn Tamayo

17

Diagramas de caja: Estas alternativas controlan la presentacin de los diagramas de caja cuando existe ms de una variable dependiente. Niveles de los factores juntos genera una presentacin para cada variables dependiente, en cada una se muestran diagramas de caja para cada uno de los grupos definidos por una variable de factor. Dependientes juntas genera una presentacin para cada grupo definido por una variable de factor, en cada una se muestran juntos los diagramas de caja de cada variable dependiente. Descriptivos: permite seleccionar grficos de tallo y hojas e histogramas Grficos con pruebas de normalidad: Muestra los diagramas de probabilidad normal y de probabilidad sin tendencia. Se muestra el estadstico de Kolmogorov-Smirnov con un nivel de significacin de Lilliefors para contrastar la normalidad. El estadstico de Shapiro-Wilk se calcula para las muestras con 50 o menos observaciones. Dispersin por nivel con prueba de Levene: Controla la transformacin de los datos para los diagramas de dispersin por nivel. Para todos los diagramas de dispersin por nivel se muestra la pendiente de la lnea de regresin y las pruebas robustas de Levene sobre la homogeneidad de la varianza. Si selecciona una transformacin, las pruebas de Levene se basarn en los datos transformados. Si no selecciona ninguna variable de factor, no se generar ningn diagrama de dispersin por nivel.

Por ltimo, en el procedimiento Explorar puede seleccionarse el botn Opciones

En esta ventana podemos: Excluir casos segn la lista: Los casos con valores perdidos para cualquier variable de factor o variable dependiente se excluyen de todos los anlisis. Es el valor por defecto. Excluir los casos segn pareja: Los casos que no tengan valores perdidos para las variables de un grupo (casilla) se incluyen en el anlisis de ese grupo. Mostrar valores: Los valores perdidos para las variables de factor se tratan como una categora diferente. Todos los resultados se generan para esa categora adicional.

Ignacio Martn Tamayo

18

5.- Tablas de contingencia El procedimiento Tablas de contingencia crea tablas de clasificacin doble y mltiple y adems proporciona 22 pruebas y medidas de asociacin para tablas de doble clasificacin. La estructura de la tabla y el hecho de que las categoras estn ordenadas o no determinan las pruebas o medidas que se utilizan.

Los estadsticos de tablas de contingencia y las medidas de asociacin slo se calculan para las tablas de doble clasificacin. Si se especifica una fila, una columna y un factor de capa (variable de control), el procedimiento tablas de contingencia crea un panel de medidas y estadsticos asociados para cada valor del factor capa. En nuestro ejemplo vamos a realizar una tabla de contingencia para las variables edad en filas y sexo en columnas. Veamos la salida que proporciona: Tabla de contingencia EDAD * Sexo Sexo Total Hombre Mujer EDAD 25 1 1 26 1 1 2 27 1 2 3 28 3 2 5 29 1 4 5 30 3 4 7 31 4 1 5 32 3 5 8 33 2 4 6 34 2 1 3 35 2 2 4 36 1 1 Total 23 27 50 El procedimiento Tablas de contingencia tiene tres posibilidades. Como siempre para acceder a ellas debemos pulsar los botones de la parte inferior de la ventana de Tablas de contingencia. La primera opcin es Estadsticos. Esta opcin proporciona distintos estadsticos que hemos de seleccionar en funcin del tipo de variables con las que estamos trabajando (dicotmicas, nominales, ordinales, etc.).

Ignacio Martn Tamayo

19

Adems, el procedimiento permite acceder a la ventana Casillas. Esta ventana permite ayudarle a descubrir las tramas en los datos que contribuyen a una prueba chi-cuadrado significativa. As permite mostrar las frecuencias esperadas y tres tipos de residuos que miden la diferencia entre las frecuencias observadas y las esperadas. Cada casilla de la tabla puede contener cualquier combinacin de recuentos, porcentajes y residuos seleccionados.

Por ltimo, la opcin Formato permite, como en otros procedimientos del programa, elegir las filas en orden ascendente o descendente.

S-ar putea să vă placă și