Sunteți pe pagina 1din 5

Tema: Contrastes de hipótesis con SPSS danielmavila@yahoo.

es
1. Análisis de una y dos muestras con el SPSS
Ejemplo
La duración de una determinada componente electrónica sigue una distribución normal. Los
resultados de una muestra aleatoria de esta clase de componentes son: 1200; 1350; 1275; 890;
1125; 1520 y 1100 horas. Realiza con  = 0,05 el contraste de hipótesis:

H 0 :   1100

 H1 :   1100

Propuesta de solución:
1. Crea el fichero de datos con la variable: duración
2. Selecciona el procedimiento Prueba T para una muestra, eligiendo el menú
Analizar/Comparar medias/Prueba T para una muestra.
3. Selecciona la variable ‘duración’ e introducir el valor 1100 en la ventana
correspondiente a ‘Valor de prueba’
4. Pulsa ‘Aceptar’ y observarás los siguientes cuadros:
Es tadísticos para una m ues tra

Desv iación Error típ. de


N Media típ. la media
DURA CION 7 1208,5714 200,7219 75,8658

Prue ba para una m ues tra

Valor de prueba = 1100


95% Intervalo de
conf ianz a para la
Dif erenc ia dif erencia
t gl Sig. (bilateral) de medias Inf erior Superior
DURACION 1,431 6 ,202 108,5714 -77,0654 294,2082

Para interpretar el contraste de hipótesis hay que usar el valor que aparece en la
casilla ‘Sig. (bilateral)’. En esta casilla está representada la significación o p-valor.
En este caso este p-valor es la probabilidad de que |T| > t = 1,431. La interpretación
se resume en lo siguiente: Si el p-valor es menor que el tamaño del test α es porque
el valor del estimador usado para el contraste pertenece a la región crítica y, por
tanto, se rechaza la hipótesis nula. Si, por el contrario, el p-valor es mayor que α
dicho valor no está en la región crítica y se acepta la hipótesis nula. En este
ejemplo, se debe aceptar la hipótesis nula.

Relación entre intervalos de confianza y contrastes de hipótesis


La región de aceptación (complementario de la región crítica) de un contraste de hipótesis
para un parámetro con tamaño coincide con un intervalo de confianza para al
(1-x100 %.

En el caso del contraste visto anteriormente, la región de no rechazo (o aceptación)


es:
 S S 
 X  t n -1 , /2    X  t n -1 , /2 
 n n
InfExcel
Otra forma de interpretar el contraste es ver si el 0 está contenido en el intervalo de
confianza al 95% para la diferencia de medias, que también lo proporciona el
programa. Si esto es así (como en el ejemplo) se acepta la hipótesis nula y se
rechaza en caso contrario.
La prueba T es válida siempre que el tamaño muestral sea suficientemente grande
o, en caso contrario, cuando la muestra provenga de una población con distribución
normal.

2. Prueba t para dos muestras independientes

H :    2
Para el contraste  0 1 (con varianzas poblacionales desconocidas)
 H 1 : 1   2

Dependiendo de si las desviaciones típicas son iguales o diferentes se tienen


diferentes valores para m y S*. Para distinguir entre ambos casos se hace un
H :  2   22
contraste previo  0 12 .
 H1 :  1   2
2

H :  2 /  2  1
En realidad el que se hace es  0 12 22
 H1 :  1 /  2  1

Este se resuelve usando la región crítica R = { F  ( Fn1 1,n2 1;1 / 2 , Fn1 1,n2 1; / 2 )}
S12
siendo F  que sigue una distribución F de Fisher-Snedecor con n1 - 1 y n2 - 1
S 22
grados de libertad. (n1 y n2 son los tamaños muestrales correspondientes y S12 , S 22
las respectivas cuasivarianzas muestrales)

1 1
Si las varianzas son iguales m = n1 + n2 – 2 y S* =  Sp
n1 n2
( n1  1) S12  ( n2  1) S 22
siendo Sp =
n1  n2  1
En caso contrario m se estima mediante una expresión un poco complicada
 
 ( S1 / n1  S 2 / n2 )
2 2 2  S2 S2
(Smith-Satterhwaite) m =   y S*= 1  2
 1 (S 2 / n ) 2  1 (S 2 / n ) 2  n1 n2
 n1  1 1 1 n2  1
2 2 
 

Ejemplo
2. Se quiere comparar la calidad de dos máquinas que fabrican un cierto componente
eléctrico. Se han tomado datos sobre la cantidad de componentes estropeados en diferentes
lotes obteniéndose para la máquina 1 los siguientes datos: 15, 16, 17, 12, 13, 15, 16, 13, 17,
15, 16, 17, 15, 13 y para la máquina 2: 8, 9, 5, 7, 9 , 11, 15, 13, 9, 8.
Contrasta la igualdad de medias con 0,05

Para poder efectuar la prueba T para muestras independientes, SPSS necesita una
columna en el editor de datos que contenga los valores de la variable cuyas medias
InfExcel
en las dos poblaciones se desea comparar, y otra que indica la población o grupo a
que pertenece cada individuo.
Propuesta de solución:
1. Crea el fichero EJEMPLO2.SAV, con las variables ‘fallos’ (15; 16; …) y
‘máquina’ (1 u 2).
2. Selecciona Analizar/Comparar medias/Prueba T para muestras
independientes.
3. Selecciona la variable numérica ‘fallos’ y situarla en la ventana de Contrastar
variables. A continuación, selecciona la variable de agrupación ‘maquina’ y
pulsa Definir grupos.
4. Especifica los dos valores de la variables de agrupación que definen cada
máquina:
 Usar valores especificados. Escribir un valor (1) para el Grupo 1 y otro
(2) para el Grupo 2.
Los casos con otros valores (si existen) quedarán excluidos.
 Punto de corte. Escribir un número que divida los valores de la variable
de agrupación en dos conjuntos. Todos los códigos menores que el punto
de corte forman un grupo y los mayores o iguales que el punto de corte
forman el otro grupo.
5. Pulsa ‘Aceptar’

Es tadísticos de grupo

Desv iación Error típ. de


MAQUINA N Media típ. la media
FALLOS 1,00 14 15,0000 1,6641 ,4447
2,00 10 9,4000 2,9136 ,9214

Prue ba de m ues tras independie nte s

Prueba de Levene
para la igualdad de
varianzas Prueba T para la igualdad de medias
95% Intervalo de
conf ianz a para la
Dif erencia Error típ. de dif erencia
F Sig. t gl Sig. (bilateral) de medias la dif erenc ia Inf erior Superior
FA LLOS Se han asumido
2,303 ,143 5,984 22 ,000 5,6000 ,9359 3,6591 7,5409
varianzas iguales
No se han as umido
5,474 13,187 ,000 5,6000 1,0231 3,3930 7,8070
varianzas iguales

Para la interpretación de este contraste, primero se observa la columna ‘Prueba de


Levene para la igualdad de varianzas’. En este caso, con α = 0,05 se acepta que las
varianzas son iguales.

Posteriormente, en la fila inferior aparecen los dos contrastes sobre la igualdad de


medias para la variable ‘fallos’: uno con varianzas iguales y otro con diferentes. En
este caso, hay que fijarse en la fila correspondiente a varianzas iguales. El p-valor
es menor que 0,05 por lo que se rechaza la hipótesis nula.

Esta prueba T es válida siempre que los tamaños muestrales sean suficientemen-te
grandes o cuando las muestras provengan de poblaciones con distribuciones
normales.

InfExcel
3. Prueba t para dos muestras dependientes

En este caso, se tienen dos distribuciones normales apareadas. Esto ocurre, por
ejemplo, cuando se miden dos variables sobre una muestra de individuos.

Se tiene una variable D = X-Y que sigue una distribución N(µD, σD)

El contraste a efectuar es:


H 0 :  D  0

 H1 :  D  0

Ejemplo
3. Se quiere comparar la rapidez de dos programas informáticos A y B para la resolución de
cierta clase de problemas de ingeniería hidráulica. Para ello se analizan 9 casos utilizando
tanto el programa A como el B. Los tiempos obtenidos para resolver estos casos fueron:

Caso 1 2 3 4 5 6 7 8 9
Programa A 11.5 13.2 15.7 9.8 12.6 10.5 11.3 12.6 14.1
Programa B 12.3 12.9 13.1 10.9 11.2 12.1 9.9 11.8 12.3

Contrasta con 0,05 si la diferencia de los tiempos medios de resolución es 0.

Para efectuar la Prueba T para muestras emparejadas, a diferencia de las muestras


independientes, se necesita una columna en los datos para cada una de las
variables a comparar.
Propuesta de solución:
1. Crea el archivo EJEMPLO3.SAV con las variables Programa y Programb
2. Selecciona Analizar/Comparar medias/Prueba T para muestras
relacionadas
3. Selecciona las dos variables en cuya diferencia estamos interesados. Al
hacer la primera selección en la columna de variables, esta aparece en el
recuadro selecciones actuales como variable 1, y al realizar la segunda
selección aparecerá como variable 2. En ese momento, ya seleccionadas las
dos es cuando se pueden introducir en la columna variables relacionadas.
4. Pulsa Aceptar.
Es tadísticos de m ue str as re lacionadas

Desv iación Error típ. de


Media N típ. la media
Par 1 PROGRAMA 12,3667 9 1,8330 ,6110
PROGRAMB 11,8333 9 1,0161 ,3387

Prue ba de m ues tras relacionadas

Dif erencias relac ionadas


95% Intervalo de
conf ianz a para la
Desv iación Error típ. de dif erencia
Media típ. la media Inf erior Superior t gl Sig. (bilateral)
Par 1 PROGRAMA -
,5333 1,4361 ,4787 -,5706 1,6372 1,114 8 ,298
PROGRAMB

InfExcel
Se observa el p-valor en la columna ‘Sig. (bilateral)’. Como es mayor que 0,05 se
acepta la igualdad de medias.
Esta prueba T es válida siempre que el tamaño muestral sea suficientemente grande
o cuando las muestra provenga de poblaciones con distribución normal.

Tareas. En todas las tareas debes identificar los principales valores de las
pruebas emitidas por el SPSS señalando su respectivo significado, además de
indicar tus conclusiones. PD = Penúltimo dígito de tu matrícula. Entrega tu
informe y envía el archivo de Resultados identificado con tu apellido antes de las
11:50 horas.
1. Durante los últimos 5 años el número de ordenadores que vende por semana la empresa
Darth Vader Helado Oscuro es aproximadamente normal N(). En una muestra
aleatoria simple de 10 semanas de los últimos cinco años, dicha empresa vendió 175,
168, 171, 169, 183, 165, 188, 177, 167 y (180 + UD) ordenadores. Contrasta si el valor
medio de las ventas es 200 con 0,1
2. Contrasta si el peso medio de un cierto tipo de piezas mecánicas difiere según sean
fabricados en dos lugares diferentes A y B con un nivel de significación igual a 0,01. Los
datos obtenidos son los siguientes, A: 80, 97, 85, 73, 92, 97, 100 y 94; B: 99, 92, 85, 79,
91, 96 y 105.
3. Estudia si un cierto tipo de componente mecánico es simétrico o no en base a la medida
de sus lados izquierdo y derecho con un nivel de significación 0,05. Los datos que se han
obtenido en las medidas son:
Pieza 1 2 3 4 5
Izquierdo 11.5 13.2 15.7 9.8 12.6
Derecho 12.3 12.9 13.1 10.9 11.2

InfExcel

S-ar putea să vă placă și