Documente Academic
Documente Profesional
Documente Cultură
UNIDAD 3
PRUEBAS DE HIPÓTESIS
X Y D0
Z ~ N (0,1)
X2 Y2
n m
Esta estadística la utilizaremos para buscar diferencias significativas entre X Y y D0. Con
base en esta estadística se tiene que las regiones críticas de tamaño α y los valores p para
los tres contrastes anteriores son las siguientes:
70
Prueba bilateral.
H 0 : X Y D0
vs
H : D
a X Y 0
R.C. z / z z 2 o z z 2
Entonces, rechazamos H0 a favor de Ha y concluimos que X Y D0 cuando
( x y ) D0
zc R.C.
X2 Y2
n m
p valor 2P Z zc
Prueba unilateral derecha.
H 0 : X Y D0
vs
H : D
a X Y 0
R.C. z / z z
( x y ) D0
zc R.C.
X2 Y2
n m
71
El valor p es:
p valor P Z zc
R.C. z / z z
( x y ) D0
zc R.C.
X2 Y2
n m
El valor p es:
p valor P Z zc
Observaciones:
a) Los contrastes anteriores siguen siendo válidos aun cuando las poblaciones no sean
normales, siempre que los tamaños muestrales son grandes.
b) Los contrastes anteriores siguen siendo válidos aun cuando las varianzas poblacionales
sean desconocidas, en este caso las reemplazamos por las varianzas muestrales S X2 y
SY2 , pero se requiere que los tamaños muestrales sean grandes. En este caso, la
estadística de prueba es
X Y D0
Z ~ N (0,1)
S X2 SY2
n m
Las regiones críticas y los valores p son los mismos que antes.
72
Ejemplo 4. Se cree que el promedio verbal para el número de respuestas correctas para la
prueba SAT para los hombres es mayor que el de las mujeres por más de 10 puntos. Las
muestras aleatorias para ambos sexos arrojaron los siguientes resultados:
Hombres Mujeres
Tamaño muestral = 125 100
Media muestral = 480 460
Desviación estándar muestral = 60 52
Asuma normalidad.
Solución:
Sea X = Calificación en la prueba verbal SAT para los hombres esta variable tiene una
media poblacional X y una varianza X2 desconocida. De una muestra aleatoria de
tamaño n = 125 se obtiene X 480, SX 60
Se cree que el promedio para los hombres está por encima del de las mujeres por más de 10
puntos. Lo anterior lo podemos indicar como X Y 10 , pues la cantidad X Y nos
indica en qué cantidad la media poblacional de X está por encima de la de Y. Entonces
a) Utilizar un nivel de significancia del 5% para probar la creencia; para ello, debemos
realizar la siguiente prueba de hipótesis:
H 0 : X Y 10
vs
H : 10
a X Y
Esta es una prueba unilateral derecha para la diferencia de medias poblacionales de dos
poblaciones independientes con varianzas poblacionales desconocidas y tamaños
muestrales grandes, entonces la estadística de prueba para el contraste es
X Y D0
Z ~ N (0,1)
S X2 S2
Y
n m
73
La región crítica es
X Y 10
Zc
S X2 SY2
n m
Entonces,
X Y 10
Potencia P 1.645 / X Y 11
S2 S2
X
Y
n m
Como la verdadera media no es 10 sino que es 11, entonces la estadística anterior está
mal estandarizada. Para corregir este problema restamos 1 en el numerador de la parte
izquierda de la expresión anterior y esta misma cantidad se resta al lado derecho, y así se
obtiene que
74
X Y 10 1 1
Potencia P 1.645
S X2 SY2 S X2 SY2
n m n m
1
P Z 1.645 1.51 0.0655
602 522
125 100
Ejemplo 4.1. Un fabricante afirma que la tensión de ruptura promedio del hilo A excede a
las hilo B en al menos 12 kilogramos. Para probar esta afirmación se pusieron a prueba 50
hilos de cada tipo bajo condiciones controladas. El hilo tipo A tuvo una tensión promedio
de 86.7 kilogramos con una desviación estándar de 6.28; mientras que el hilo tipo B tuvo
una tensión promedio de 77.8 kilogramos con una desviación estándar de 5.61. Utilice un
nivel de significancia del 5% para probar la afirmación del fabricante. Encuentre el valor p
de la prueba.
Solución:
Sea X = La tensión de ruptura del hilo tipo A y X es la tensión de ruptura promedio de
hilo.
El fabricante afirma que la resistencia promedio del hilo tipo A excede a la del hilo tipo B
en al menos 12 kilogramos y esto quiere decir que X Y 12 , entonces debemos probar
a un nivel de significancia 0.05 lo siguiente:
H 0 : X Y 12
vs
H : 12
a X Y
Esta es una prueba unilateral izquierda para la diferencia entre dos medias poblacionales de
poblaciones independientes con varianzas poblaciones desconocidas y tamaños muestrales
grandes; por lo tanto, la estadística de prueba es:
X Y D0
Z ~ N (0,1)
S X2 SY2
n m
75
X Y D0
t ~ t( nm2)
1 1
Sp
n m
Donde,
(n 1)S x2 (m 1)SY2
Sp
nm2
Entonces, las regiones críticas y los valores p para los contrastes alternativos son las
siguientes:
Prueba bilateral:
R.C. t / t t( 2,nm2) o t t( 2,nm2) p valor 2P tnm2 tc
x y D0
tc
1 1
Sp
n m
Ejemplo 5. A finales de la década de los setenta se descubrió que la sustancia
carcionogénica NDMA se formaba durante el proceso de secado de la malta verde, la cual
se empleaba para fabricar cerveza. A principios de los ochenta se desarrolló un nuevo
proceso para el secado de la malta, el cual minimizaba la formación de NDMA. Se tomaron
muestras aleatorias de una cerveza doméstica que se fabricó empleando ambos procesos, y
se midieron los niveles de NDMA en partes por billón. Los resultados están en la tabla
adjunta:
Proceso 6 4 5 5 6 5 5 6 4 6 7 4
Anterior
Proceso 2 1 2 2 1 0 3 2 1 0 1 1
propuesto
Si se supone que se muestrearon dos poblaciones normales e independientes con varianzas
iguales, ¿existe alguna razón para creer, a un nivel de significancia del 5% que ha
disminuido la cantidad de NDMA en más de dos partes por billón con el empleo del nuevo
proceso? Encuentre el p – valor para el contraste.
Solución:
Sea X = Cantidad NDMA que se forma en el secado de la malta verde en el proceso
anterior. Entonces, se puede afirmar que X ~ N (X , 2 )
Sea Y = Cantidad NDMA que se forma en el secado de la malta verde en el proceso nuevo.
Entonces, se puede afirmar que Y ~ N (Y , 2 )
En lo anterior se asume que las varianzas poblacionales son iguales. Además, podemos
asumir independencia entre las poblaciones X e Y.
Ahora bien, X Y representa la reducción promedio verdadera en partes por billón por el
empleo del nuevo proceso. Entonces nos piden contrastar que la reducción es superior a dos
partes por billón; esto es hay que realizar el siguiente contraste de hipótesis:
H 0 : X Y 2
vs
H : 2
a X Y
77
Summary Statistics
X Y
------------------------------------------------------------
Count 12 12
Average 5.25 1.33333
Variance 0.931818 0.787879
Standard deviation 0.965307 0.887625
Sum 63.0 16.0
------------------------------------------------------------
Dado que las poblaciones son normales, independientes con varianzas desconocidas pero
iguales, entonces la estadística de prueba para el contraste es:
X Y D0
t ~ t( nm2) t(20202) t(18)
1 1
Sp
n m
Donde
11 Sx2 11 SY2 11 0.931818 11 0.787879
Sp 0.92728
22 22
x y D0 5.25 1.33 2
tc 5.071845
1 1 1 1
Sp 0.92728
n m 12 12
Ahora, como
tc 5.071845 R.C.
Entonces, rechazamos H0 y concluimos que con el empleo del nuevo proceso de secado de
la malta verde se produce una reducción en NDMA en más de dos partes por billón.
D D0 X Y D0
t ~ t( n 1)
SD / n SD / n
Entonces, las regiones criticas de tamaño α y el p – valor para las tres pruebas anteriores
son las siguientes:
Prueba bilateral:
H 0 : D X Y D0
vs
H : D
a D X Y 0
H 0 : D X Y D0
vs
H : D
a D X Y 0
H 0 : D X Y D0
vs
H : D
a D X Y 0
D ( X Y ) X Y ( X Y )
t ~ t( n1)
SD / n SD / n
Se obtiene que el intervalo de confianza del 100(1 )% para ( X Y ) es
s s
d t( / 2,n1) d X Y d t( / 2,n1) d
n n
Suponiendo que los tiempos antes y después se pueden modelar por una distribución
normal, ¿puede concluirse a un nivel de significancia del 5% que el tiempo después es
mayor que el tiempo promedio “antes” por más de 10 minutos? Encuentre el p – valor
para el contraste. Construya un intervalo de confianza del 95% para la diferencia entre los
tiempos promedio después menos antes.
es el tiempo antes. Los resultados muestrales para la variable D están en la tabla anterior y
nos muestran que d 14 y sd 5.14 .
Observe se está suponiendo que el tiempo promedio después es mayor que el tiempo
promedio antes; entonces D Y X representa en cuanto el tiempo promedio después
supera al tiempo promedio antes y se espera que lo supere en más de 10 minutos. Por lo
tanto, debemos contrastar a un nivel de significancia del 5% las siguientes hipótesis:
H 0 : D Y X 10
vs
H : 10
0 D Y X
D D0 D 10
t ~ t(10)
SD / n SD / 10
La región crítica de tamaño α = 0.05 es
RC = t / t t(0.05,9) 1.833
El valor calculado de la estadística a partir de la información muestral es
d 10 14 10
tc 2.461
Sd / 10 5.14 / 10
H 0 : 2
02 H 0 : 2
02
1) vs ; 2) vs y 3) vs
H : 2 2 H : 2 2 H : 2 2
a 0
a 0
a 0
(n 1) S X2
2
~ n21
2
0
Prueba bilateral:
H 0 : 2 02
vs
H : 2 2
a 0
R.C. 2 / 2 2( 2,n1) 2 2(1 2,n1)
(n 1) s X2
Si c2 R.C rechazamos H0 en favor de la alternativa.
02
H 0 : 2
02
vs
H : 2 2
a 0
R.C. 2 / 2 2( ,n1)
82
(n 1) s X2
Si
2
R.C rechazamos H0 en favor de la alternativa.
c
02
El p – valor para esta prueba es: Valor – p = P( n21 c2 )
Ejemplo 7.1.: El gerente de una planta sospecha que el número de piezas que produce un
trabajador en particular por día, fluctúa más allá del valor normal esperado. El gerente
decide observar el número de piezas que produce este trabajador durante diez días,
seleccionados éstos al azar. Los resultados son: 15, 12, 8, 13, 12, 15, 16, 9, 8, y 14. Si se
sabe que la desviación estándar para todos los trabajadores es de 2 unidades y si el número
de éstas que se produce diariamente, se encuentra modelado en forma adecuada por una
distribución normal, a un nivel de significancia del 5%, ¿tiene apoyo la sospecha del
gerente? Obtener el p – valor para el contraste.
Solución:
Sea X = Número de piezas que produce un trabajador particular por día ~ Normal.
83
De la muestra aleatoria dada se obtiene x 12.2 y sX2 8.84444 . El gerente sospecha que σ
= desviación estándar de X > 2. Dada la información anterior nos piden contrastar a un
nivel de significancia del 5% (α = 0.05) la sospecha. Esto es, hay que realizar con α = 0.05
la siguiente prueba de hipótesis:
H0 : 2 H0 : 2 4
vs vs
H : 2 H : 2 4
a a
R.C. 2 / 2 2(0.05,9) 16.92
El valor calculado de la estadística de prueba es
9s 2 9 8.84444
2
c 19.8999
4 4
concluimos que el número de piezas que produce este trabajador por día fluctúa más allá
del valor normal esperado.
El p – valor = P 2
9
18.8999 . De la tabla se concluye que 0.01 < p – valor <
0.02. Entonces, para un nivel de significancia del 5% se rechaza H0, pues el p – valor <
0.05.
Y2 S X2
~ F( n1,m1)
X2 SY2
H 0 : X2 Y2
0 X Y
2 2
H :
1) vs 2) vs
H : 2 2 H : 2 2
a X Y
a X Y
S X2
F ~ F( n1,m1)
SY2
Entonces, rechazaremos H0 cuando haya “mucha” diferencia entre las varianzas muestrales
y esto quiere decir que S X2 es mucho mayor o mucho menor que SY2 ; entonces las regiones
las regiones críticas de tamaño α y los valores p para los dos contrates anteriores son:
Prueba bilateral:
1
R.C. F / F F( 2,n1,m1) o F F(1 2, n 1, m 1)
F( 2, m 1, n 1)
2P( F( n1,m1) Fc ) si Fc 1
p valor
2P( F( n1,m1) Fc ) si Fc 1
Prueba unilateral derecha:
R.C. F / F F( ,n1,m1)
p valor P(F(n1,m1) Fc )
También se tiene que las poblaciones son independientes. De las muestras aleatorias se
obtiene
H 0 : Y2 X2
vs
H : 2 2
a Y X
SY2
F 2 ~ F( m1,n1) F(15,20)
SX
Ejemplo 8.1: Se conjetura que las acciones de una compañía sufrirían más variación en una
industria con competencia en precios que una en las que existiera un duopolio o colusión
tácita. En un estudio sobre la industria de generadores, se halló que en cuatro años de
competencia en precios, la variación en las acciones fue de 114.09. En los siguientes siete
años, en los cuales hubo duopolio y colusión tácita, esta variación fue de 16.08. Asumir que
los datos pueden considerarse como muestras aleatorias independientes de dos poblaciones
normales. Contrastar a un nivel de significancia del 5% la conjetura. Encontrar el p – valor
para esta pueda.
H 0 : 0 H 0 : 0 H 0 : 0
1) vs , 2) vs 3) vs
H : H : H :
a
0 a 0 a 0
ˆ 0
Z ~ N (0,1)
0 (1 0 ) a
n
Usando la estadística anterior se obtiene que las regiones críticas de tamaño y el p valor
para las pruebas anteriores son las siguientes:
87
Prueba bilateral: En este caso rechazamos H0 cuando el valor observado para la proporción
muestral ˆ X / n sea suficientemente diferente del valor propuesto 0 para ; por lo
tanto,
R.C. z / z z 2 z z 2
Si zc (ˆ 0 ) 0 (1 0 ) n RC , entonces rechazamos H0 a favor de la hipótesis
alternativa. Además, el p – valor para esta prueba es
p – valor = 2P(Z zc )
R.C. Z / Z z 2
Si zc (ˆ 0 ) 0 (1 0 ) n RC , entonces rechazamos H0 a favor de la hipótesis
alternativa. Además, el p – valor para esta prueba es
p – valor = P(Z zc )
Prueba unilateral derecha: En este caso rechazamos H0 cuando la proporción muestral
estimada ˆ X / n sea suficientemente menor que el valor 0 propuesto para la proporción
poblacional, entonces la región crítica es
R.C. Z / Z z 2
Si zc (ˆ 0 ) 0 (1 0 ) n RC , entonces rechazamos H0 a favor de la hipótesis
alternativa. Además, el p – valor para esta prueba es
p – valor = P(Z zc )
H 0 : X Y H : Y H : Y
0 X 0 X
1) 1)
vs 2) vs 3) vs
H : H : H :
a X Y
a X Y
a X Y
Para tamaños muestrales grandes, la estadística de prueba para los tres contrastes anteriores
es la siguiente:
ˆX ˆY
Z ~ N (0,1)
ˆ0 (1 ˆ0 ) ˆ0 (1 ˆ0 ) a
nX nY
Donde,
ˆ nX ˆX nYˆY X Y
0
nX nY nX nY
Entonces, en virtud de la estadística anterior se tiene que las regiones críticas de tamaño α
y los valores p son los siguientes:
Prueba bilateral.
R.C. Z / Z z 2 o Z z 2 p valor 2P(Z zc )
H 0 : X Y H 0 : X Y 0
vs vs
H : H : 0
a X Y a X Y
ˆX ˆY
Z ~ N (0,1)
ˆ0 (1 ˆ0 ) ˆ0 (1 ˆ0 ) a
nX nY
nX ˆX nYˆY = X Y 35 25
ˆ0 0.06
nX nY nX nY 500 500
90