Sunteți pe pagina 1din 55

Estadı́stica

Dept. Estadı́stica e Inv. Operativa


Universidad de Sevilla

() Estadı́stica 2005-2006 1 / 45
Introducción a SPSS

() Estadı́stica 2005-2006 2 / 45
Presentación de SPSS

Contenido

1 Presentación de SPSS

2 Introducción a SPSS
Inferencia estadı́stica sobre una muestra
Comparación de dos muestras independientes
Comparación de dos muestras dependientes
Función de Distribución y Puntos Crı́ticos con SPSS

() Estadı́stica 2005-2006 3 / 45
Presentación de SPSS

SPSS es uno de los programas informáticos para el cálculo estadı́stico con más
prestigio internacional.

Podrı́amos resaltar:

La gran cantidad de procedimientos estadı́sticos que nos permite manejar.


Resaltando también sus continuas actualizaciones.

Es uno de los programas que más usuarios tiene a nivel mundial.

Se utiliza en sistemas operativos Windows.

Es uno de los pocos que está traducido al español.

() Estadı́stica 2005-2006 4 / 45
Introducción a SPSS

Contenido

1 Presentación de SPSS

2 Introducción a SPSS
Inferencia estadı́stica sobre una muestra
Comparación de dos muestras independientes
Comparación de dos muestras dependientes
Función de Distribución y Puntos Crı́ticos con SPSS

() Estadı́stica 2005-2006 5 / 45
Introducción a SPSS

A través de tres sencillos ejemplos vamos a aprender a usar de forma básica SPSS.

1 Inferencia estadı́stica sobre una muestra.


2 Comparación de dos muestras independientes.
3 Comparación de dos muestras dependientes.

() Estadı́stica 2005-2006 6 / 45
Introducción a SPSS

A través de tres sencillos ejemplos vamos a aprender a usar de forma básica SPSS.

1 Inferencia estadı́stica sobre una muestra.


2 Comparación de dos muestras independientes.
3 Comparación de dos muestras dependientes.

En esos tres ejemplos vamos a conocer:

Cómo introducir datos en diferentes condiciones en SPSS.

Cómo hacer un estudio descriptivo de la muestra.

Cómo realizar inferencia estadı́stica: tanto paramétrica (construcción de


intervalos de confianza como de contrastes de hipótesis) como no
paramétrica (estudiar si la muestra procede de una variable aleatoria
Normal). Interpretación de los resultados en SPSS.

() Estadı́stica 2005-2006 6 / 45
Introducción a SPSS Inferencia estadı́stica sobre una muestra

Contenido

1 Presentación de SPSS

2 Introducción a SPSS
Inferencia estadı́stica sobre una muestra
Comparación de dos muestras independientes
Comparación de dos muestras dependientes
Función de Distribución y Puntos Crı́ticos con SPSS

() Estadı́stica 2005-2006 7 / 45
Introducción a SPSS Inferencia estadı́stica sobre una muestra

En el siguiente ejemplo vamos a hacer Inferencia estadı́stica sobre una muestra.

Veremos como introducir los datos de una muestra en SPSS.

Estudiaremos si la muestra procede de una variable aleatoria X Normal.


Además obtendremos un estudio descriptivo de la muestra, incluyendo alguna
representación gráfica.

Si la variable aleatoria X es Normal, utilizaremos la inferencia paramétrica


para construir intervalos de confianza y contrastes de hipótesis sobre X .
Aprenderemos a interpretar las salidas.

() Estadı́stica 2005-2006 8 / 45
Introducción a SPSS Inferencia estadı́stica sobre una muestra

Ejemplo
Se mide el tiempo de duración (en segundos) de un proceso quı́mico realizado 20
veces en condiciones similares, obteniéndose los siguientes resultados:

93, 90, 97, 90, 93, 91, 96, 94, 91, 91,
88, 93, 95, 91, 89, 92, 87, 88, 90, 86

Suponiendo que la duración sigue una distribución Normal, hallar un intervalo de


confianza al 95% para la media.
Hacer también un contraste de hipótesis para ver si la media poblacional es 90.

() Estadı́stica 2005-2006 9 / 45
Introducción a SPSS Inferencia estadı́stica sobre una muestra

En primer lugar ejecutamos SPSS, y seleccionamos “Introducir datos”:

() Estadı́stica 2005-2006 10 / 45
Introducción a SPSS Inferencia estadı́stica sobre una muestra

Accedemos a una hoja de cálculo donde tenemos que introducir los datos. Hay
dos vistas: vistas de variables y vistas de datos.

() Estadı́stica 2005-2006 11 / 45
Introducción a SPSS Inferencia estadı́stica sobre una muestra

Accedemos a una hoja de cálculo donde tenemos que introducir los datos. Hay
dos vistas: vistas de variables y vistas de datos.

Vistas de variables: . Aquı́ introducimos el nombre de las


variables (duracion.proceso) y las caracterı́sticas que tendrán.

() Estadı́stica 2005-2006 11 / 45
Introducción a SPSS Inferencia estadı́stica sobre una muestra

Accedemos a una hoja de cálculo donde tenemos que introducir los datos. Hay
dos vistas: vistas de variables y vistas de datos.

Vistas de variables: . Aquı́ introducimos el nombre de las


variables (duracion.proceso) y las caracterı́sticas que tendrán.

Vistas de datos: . Aquı́ introducimos los datos de la variable en la


columna asociada (duracion.proceso).

() Estadı́stica 2005-2006 11 / 45
Introducción a SPSS Inferencia estadı́stica sobre una muestra

Una vez introducidos los datos pasamos a estudiar en primer lugar si la muestra
procede de una distribución Normal. Para ello, vamos a realizar un contraste No
Paramétrico del tipo:
H0 : X Normal
H1 : X 6 Normal
Vamos a realizarlo con el test de Shapiro-Wilks. En SPSS, haremos lo siguiente:

() Estadı́stica 2005-2006 12 / 45
Introducción a SPSS Inferencia estadı́stica sobre una muestra

Seleccionamos la variable “duración.proceso”

() Estadı́stica 2005-2006 13 / 45
Introducción a SPSS Inferencia estadı́stica sobre una muestra

Seleccionamos la variable “duración.proceso”

Y pinchamos en gráficos y estadı́sticos, y seleccionamos las opciones que vemos


en los siguientes gráficos (Histograma no es necesario para la Normalidad), para
después pinchar en Continuar y luego Aceptar:

() Estadı́stica 2005-2006 13 / 45
Introducción a SPSS Inferencia estadı́stica sobre una muestra

Los resultados en SPSS se recogen en el siguiente gráfico:

() Estadı́stica 2005-2006 14 / 45
Introducción a SPSS Inferencia estadı́stica sobre una muestra

Nos fijamos en primer lugar en el primer cuadro:

Aparece resaltado en amarillo, el intervalo de confianza para le media (suponiendo


normalidad) con varianza desconocida: IC (µ, 95%) = (89.88, 92.62).

() Estadı́stica 2005-2006 15 / 45
Introducción a SPSS Inferencia estadı́stica sobre una muestra

El siguiente cuadro nos da la información sobre el contraste de Normalidad. En


particular nos fijamos en el test de Shapiro-Wilks:

Resaltado en amarillo, vemos el p-valor asociado a este contraste de Normalidad,


0.9276≤ 0.05, lo que nos indica que aceptamos H0 , o mejor dicho no existen
evidencias de que no proceda de una distribución Normal.

() Estadı́stica 2005-2006 16 / 45
Introducción a SPSS Inferencia estadı́stica sobre una muestra

El gráfico Normal Q-Q es una representación gráfica que nos indica que estamos
cerca de la Normalidad cuando los puntos se encuentran cerca de la lı́nea.

Como podemos apreciar están muy cerca, y como nos indicaba el test de
Shapiro-Wilks, podemos suponer Normalidad.

() Estadı́stica 2005-2006 17 / 45
Introducción a SPSS Inferencia estadı́stica sobre una muestra

También en la salida obtenemos el histograma y el diagrama de caja y bigotes de


la variable “duración.proceso”:

Se aprecia cierto parecido con la distribución Normal.

() Estadı́stica 2005-2006 18 / 45
Introducción a SPSS Inferencia estadı́stica sobre una muestra

Pasamos ahora a realizar un contraste de hipótesis sobre la media de la variable.


Para ello, en SPSS, seleccionamos:

() Estadı́stica 2005-2006 19 / 45
Introducción a SPSS Inferencia estadı́stica sobre una muestra

Pasamos ahora a realizar un contraste de hipótesis sobre la media de la variable.


Para ello, en SPSS, seleccionamos:

Seleccionamos la variable e indicamos el valor 90, ya que queremos realizar el


contraste de hipótesis siguiente:

H0 : µ = 90
H1 : µ 6= 90

() Estadı́stica 2005-2006 19 / 45
Introducción a SPSS Inferencia estadı́stica sobre una muestra

Pasamos a comentar los resultados que se obtienen:

La desviación tı́pica es realmente la cuasidesviación tı́pica muestral. El p-valor,


nos indica que 0.072 6≤ 0.05, luego aceptamos H0 , o mejor dicho no podemos
rechazar la hipótesis (aunque ha estado cerca a ese nivel de significación).
También, construye un intervalo de confianza para
IC (µ − 90, 95%) = (−0.12, 2.62), que deja el valor cero como uno de los posibles.

() Estadı́stica 2005-2006 20 / 45
Introducción a SPSS Comparación de dos muestras independientes

Contenido

1 Presentación de SPSS

2 Introducción a SPSS
Inferencia estadı́stica sobre una muestra
Comparación de dos muestras independientes
Comparación de dos muestras dependientes
Función de Distribución y Puntos Crı́ticos con SPSS

() Estadı́stica 2005-2006 21 / 45
Introducción a SPSS Comparación de dos muestras independientes

En el siguiente ejemplo vamos a hacer Comparación de dos muestras


independientes.

Veremos como introducir los datos para realizar una comparación entre dos
muestras independientes en SPSS.

Estudiaremos si cada una de las muestras proceden de una variable aleatoria


Normal. Además obtendremos un estudio descriptivo de cada muestra.

Si para las dos variables aleatorias se puede suponer que provienen de una
variable aleatoria Normal, utilizaremos la inferencia paramétrica para
construir contrastes de hipótesis sobre la diferencia de medias (o construir
intervalos de confianza para la diferencia de medias). Aprenderemos a
interpretar las salidas.

() Estadı́stica 2005-2006 22 / 45
Introducción a SPSS Comparación de dos muestras independientes

Ejemplo
Con objeto de estudiar si las pulsaciones en los hombres puede considerarse
menores que en las mujeres, se tomaron muestras de 16 hombres y 16 mujeres,
obteniéndose los siguientes datos:
Hombres (X ) 74 77 71 76 79 74 83 79 83 72 79 77 81 79 84 80
Mujeres (Y ) 81 84 80 73 78 80 82 84 80 84 75 82 79 82 79 85
¿Qué se puede decir al respecto?

() Estadı́stica 2005-2006 23 / 45
Introducción a SPSS Comparación de dos muestras independientes

En primer lugar vamos a introducir los datos. En el caso de que queramos


comparar dos muestras independientes la forma de introducir la información se
harı́a:
1 Introducir todos los datos en una sola columna “pulsaciones”, y
2 en otra segunda columna “sexo”, introducimos códigos que identifiquen a
cada una de las dos muestras (1=hombre, 0=mujer).

() Estadı́stica 2005-2006 24 / 45
Introducción a SPSS Comparación de dos muestras independientes

Una vez introducidos los datos de esta forma, pasamos a estudiar la Normalidad
de las dos muestras. Para ello accedemos, como ya hicimos en el primer ejemplo, a
Analizar - Estadı́sticos Descriptivos - Explorar
En la pantalla que aparece, debemos hacer la siguiente elección con las variables:

Para estudiar la Normalidad, accedemos a Gráficos y elegimos las mismas


opciones que en el primer ejemplo.

() Estadı́stica 2005-2006 25 / 45
Introducción a SPSS Comparación de dos muestras independientes

Los resultados que nos devuelve SPSS son:

Como observamos, el p-valor asociado a las pulsaciones de las mujeres (sexo=0)


es 0.258 6≤ 0.05, por lo que aceptamos H0 , es decir la Normalidad, y el p-valor
asociado a las pulsaciones de los hombres (sexo=1) es 0.631 6≤ 0.05, por lo que
también aceptamos la Normalidad.

() Estadı́stica 2005-2006 26 / 45
Introducción a SPSS Comparación de dos muestras independientes

SPSS también nos muestra el contraste de Normalidad de las dos muestras con el
gráfico de Normalidad Q-Q.

Podemos observar, para las mujeres (sexo=0), como existen algunos valores que
se alejan de la recta y además en los extremos, pero estas discrepancias no son lo
suficientemente significativas como para rechazar la Normalidad, como hemos
visto con Shapiro-Wilks (p-valor=0.258).
Sin embargo, para los hombres (sexo=1), las discrepancias son menores que para
las mujeres (p-valor=0.631).

() Estadı́stica 2005-2006 27 / 45
Introducción a SPSS Comparación de dos muestras independientes

Pasamos ahora a realizar el contraste de comparación de medias poblacionales:

H0 : µ1 − µ2 = 0 H0 : µ1 = µ2

H1 : µ1 − µ2 6= 0 H1 : µ1 6= µ2

En SPSS, haremos lo siguiente:

() Estadı́stica 2005-2006 28 / 45
Introducción a SPSS Comparación de dos muestras independientes

Haremos las siguientes elecciones:

Definimos los grupos y las opciones para este ejemplo como:

() Estadı́stica 2005-2006 29 / 45
Introducción a SPSS Comparación de dos muestras independientes

Haremos las siguientes elecciones:

Definimos los grupos y las opciones para este ejemplo como:

() Estadı́stica 2005-2006 29 / 45
Introducción a SPSS Comparación de dos muestras independientes

En primer lugar, tenemos que estudiar si las varianzas son iguales o no


(varianzas desconocidas). H0 : σ12 = σ22 , H1 : σ12 6= σ22 . Para ello debemos
realizar el contraste de igualdad de varianzas, cuyos resultados tenemos
resaltados bajo la columna Prueba de Levene. Observamos que el p-valor es
0.406 6≤ 0.05, luego aceptamos la igualdad de varianzas.

() Estadı́stica 2005-2006 30 / 45
Introducción a SPSS Comparación de dos muestras independientes

En primer lugar, tenemos que estudiar si las varianzas son iguales o no


(varianzas desconocidas). H0 : σ12 = σ22 , H1 : σ12 6= σ22 . Para ello debemos
realizar el contraste de igualdad de varianzas, cuyos resultados tenemos
resaltados bajo la columna Prueba de Levene. Observamos que el p-valor es
0.406 6≤ 0.05, luego aceptamos la igualdad de varianzas.
El contraste de igualdad de medias con varianzas desconocidas pero iguales,
aparece su p-valor en la primera fila (resaltado en amarillo) y es
0.059 6≤ 0.05, por lo que podemos aceptar la igualdad de medias (no existen
razones suficientes para rechazar la igualdad de medias).
() Estadı́stica 2005-2006 30 / 45
Introducción a SPSS Comparación de dos muestras dependientes

Contenido

1 Presentación de SPSS

2 Introducción a SPSS
Inferencia estadı́stica sobre una muestra
Comparación de dos muestras independientes
Comparación de dos muestras dependientes
Función de Distribución y Puntos Crı́ticos con SPSS

() Estadı́stica 2005-2006 31 / 45
Introducción a SPSS Comparación de dos muestras dependientes

En este último ejemplo vamos a hacer Comparación de dos muestras dependientes.

Veremos como introducir los datos para realizar una comparación entre dos
muestras dependientes en SPSS.

Estudiaremos si la muestra diferencia procede de una variable aleatoria


Normal.

Si para la variable aleatoria diferencia se puede suponer que proviene de una


variable aleatoria Normal, utilizaremos la inferencia paramétrica para
construir un contraste de hipótesis sobre la diferencia de medias (o construir
intervalos de confianza para la diferencia de medias). Aprenderemos a
interpretar las salidas.

() Estadı́stica 2005-2006 32 / 45
Introducción a SPSS Comparación de dos muestras dependientes

Ejemplo
Se tienen algunos indicios de que el consumo de tabaco tiende a provocar
problemas de trombosis debidos a un aumento en la capacidad de coagulación.
Para estudiar esta hipótesis, Levine (1973) extrajo muestras de sangre de 11
individuos antes y después de que fumasen un cigarrillo y midió la capacidad de
agregación de las plaquetas, obteniendo los datos siguientes (correspondientes al
máximo porcentaje de plaquetas que se agregaron después de haber sido
sometidas a un estı́mulo adecuado):
Antes 25 25 27 44 30 67 53 53 52 60 28
Después 27 29 37 56 46 82 57 80 61 59 43

¿Hay suficiente evidencia estadı́stica (al nivel de significación 0.05) a favor de la


hipótesis de que los fumadores presentan una mayor tendencia a la formación de
coágulos?

() Estadı́stica 2005-2006 33 / 45
Introducción a SPSS Comparación de dos muestras dependientes

En primer lugar vamos a introducir los datos. En el caso de que queramos


comparar dos muestras dependientes la forma de introducir la información se harı́a:
1 Introducir cada muestra en una columna distinta “sangre.antes” y
“sangre.despues”.

() Estadı́stica 2005-2006 34 / 45
Introducción a SPSS Comparación de dos muestras dependientes

En primer lugar vamos a introducir los datos. En el caso de que queramos


comparar dos muestras dependientes la forma de introducir la información se harı́a:
1 Introducir cada muestra en una columna distinta “sangre.antes” y
“sangre.despues”.
2 A continuación calcular una nueva variable (muestra), cuyos valores son la
diferencia de las dos muestras (hay el mismo número de observaciones en las
dos muestras).

() Estadı́stica 2005-2006 34 / 45
Introducción a SPSS Comparación de dos muestras dependientes

Para obtener esa nueva variable hemos utilizado la siguiente opción de SPSS:

En la que solicitamos las operaciones que se muestran a continuación:

() Estadı́stica 2005-2006 35 / 45
Introducción a SPSS Comparación de dos muestras dependientes

Una vez introducidos los datos de esta forma, pasamos a estudiar la Normalidad
de la muestra diferencia (“diferencia.sangre”). Para ello accedemos, como ya
hicimos en el primer ejemplo, a
Analizar - Estadı́sticos Descriptivos - Explorar
En la pantalla que aparece, debemos hacer la siguiente elección con las variables:

Para estudiar la Normalidad, accedemos a Gráficos y elegimos las mismas


opciones que en el primer ejemplo.

() Estadı́stica 2005-2006 36 / 45
Introducción a SPSS Comparación de dos muestras dependientes

Los resultados que nos devuelve SPSS son:

Como observamos, el p-valor asociado a la “diferencia.sangre” es 0.653 6≤ 0.05,


por lo que aceptamos H0 , es decir la Normalidad de la muestra diferencia.

() Estadı́stica 2005-2006 37 / 45
Introducción a SPSS Comparación de dos muestras dependientes

SPSS también nos muestra el contraste de Normalidad de la muestra diferencia


con el gráfico de Normalidad Q-Q.

Las distancias a la recta de los puntos representados no son lo suficientemente


significativas como para rechazar la Normalidad, como hemos visto con
Shapiro-Wilks (p-valor=0.653).

() Estadı́stica 2005-2006 38 / 45
Introducción a SPSS Comparación de dos muestras dependientes

Pasamos ahora a realizar el contraste de comparación de medias poblacionales


para muestras dependientes o relacionadas:

H0 : µd = µ1 − µ2 = 0 H0 : µ1 = µ2

H1 : µd = µ1 − µ2 6= 0 H1 : µ1 6= µ2

En SPSS, haremos lo siguiente:

() Estadı́stica 2005-2006 39 / 45
Introducción a SPSS Comparación de dos muestras dependientes

Haremos las siguientes elecciones para realizar el contraste:

() Estadı́stica 2005-2006 40 / 45
Introducción a SPSS Comparación de dos muestras dependientes

Haremos las siguientes elecciones para realizar el contraste:

() Estadı́stica 2005-2006 40 / 45
Introducción a SPSS Comparación de dos muestras dependientes

Observamos que el p-valor obtenido es 0.002 ≤ 0.05, lo que significa que podemos
rechazar la hipótesis nula, es decir las medias no son iguales (antes y después de
fumar).
El IC (µd ; 95%) = (−15.631, −4.914) nos indica que la media de la diferencia es
negativa, es decir es mayor la media después que la media antes.
() Estadı́stica 2005-2006 41 / 45
Introducción a SPSS Función de Distribución y Puntos Crı́ticos con SPSS

Contenido

1 Presentación de SPSS

2 Introducción a SPSS
Inferencia estadı́stica sobre una muestra
Comparación de dos muestras independientes
Comparación de dos muestras dependientes
Función de Distribución y Puntos Crı́ticos con SPSS

() Estadı́stica 2005-2006 42 / 45
Introducción a SPSS Función de Distribución y Puntos Crı́ticos con SPSS

Para terminar, señalar que con SPSS es posible calcular de los modelos aleatorios
más conocidos:
las funciones de densidad o funciones de probabilidad (PDF),
las funciones de distribución (F (x) = P [X ≤ x]) (CDF), y
los puntos crı́ticos o inversa de la función de distribución (x = F −1 (y ) tal
que F (x) = y ) (IDF).
Para ello debemos acceder a:

() Estadı́stica 2005-2006 43 / 45
Introducción a SPSS Función de Distribución y Puntos Crı́ticos con SPSS

Para obtener la función de distribución (CDF) elegimos en el cuadro “Grupo de


funciones” FDA y FDA no centrada y en el cuado “Funciones y variables
especiales” la variable aleatoria que queramos y rellenamos la variable de destino y
la expresión numérica, observando la ayuda facilitada por SPSS.
En este ejemplo, calculamos el valor de la función de distribución en 0 de una
variable aleatoria Normal(0,1) (Φ(0)), que sabemos que será igual a 0.5:

() Estadı́stica 2005-2006 44 / 45
Introducción a SPSS Función de Distribución y Puntos Crı́ticos con SPSS

Para obtener los puntos crı́ticos o la inversa de la función de distribución (IDF)


elegimos en el cuadro “Grupo de funciones” GL inversos y en el cuado “Funciones
y variables especiales” la variable aleatoria que queramos y rellenamos la variable
de destino y la expresión numérica, observando la ayuda facilitada por SPSS.
En este ejemplo, calculamos el punto crı́tico de nivel 0.975 de una variable
aleatoria Normal(0,1) (z0.975 = 1.96):

() Estadı́stica 2005-2006 45 / 45
Introducción a SPSS Función de Distribución y Puntos Crı́ticos con SPSS

Para obtener los puntos crı́ticos o la inversa de la función de distribución (IDF)


elegimos en el cuadro “Grupo de funciones” GL inversos y en el cuado “Funciones
y variables especiales” la variable aleatoria que queramos y rellenamos la variable
de destino y la expresión numérica, observando la ayuda facilitada por SPSS.
En este ejemplo, calculamos el punto crı́tico de nivel 0.975 de una variable
aleatoria Normal(0,1) (z0.975 = 1.96):

() Estadı́stica 2005-2006 45 / 45

S-ar putea să vă placă și