Sunteți pe pagina 1din 22

69

DEPARTAMENTO DE ESTADÍSTICA Y MATEMÁTICAS

UNIDAD 3
PRUEBAS DE HIPÓTESIS

2.2. Dos muestras: Pruebas para diferencia de medias


Se dispone de una muestra aleatoria de tamaño n de una población normal X que tiene
media  X y varianza X2 ; también se dispone de una muestra aleatoria de tamaño m de
una población normal Y que tiene media Y y varianza  Y2 . Queremos comparar las
medias poblacionales. Para ello vamos a realizar las siguientes pruebas
  
 
 H0 :  X  Y  D0  H 0 :  X  Y  D0  H 0 :  X  Y  D0
 
1)  vs 2)  vs 3)  vs
H :     D H :     D H :     D
 a X Y 0
 a X Y 0
 a X Y 0

La estadística de prueba es X  Y . Aceptamos H0 cuando la diferencia entre el valor


observado de la estadística de prueba en la muestra no sea “muy diferente” del valor
propuesto D0 para  X  Y . Para buscar diferencias significativas entre estas cantidades
utilizamos la distribución de X  Y para ello es necesario saber la manera en que se
tomaron las muestras; es decir, es necesario saber si las muestras son dependientes o
independientes; también se requiere conocer como son las distribuciones poblacionales,
saber si las varianzas son o no conocidas y los tamaños muestrales.

2.2.1. Contrastes basados en muestras independientes:


Supongamos que se tienen muestra aleatorias independientes de tamaños n y m de dos
poblaciones X e Y que son normales con medias  X y Y y varianzas de una muestra X2
y  Y2 conocidas. En este caso, la distribución de la estadística de prueba es:

X  Y  D0
Z ~ N (0,1)
 X2  Y2

n m

Esta estadística la utilizaremos para buscar diferencias significativas entre X  Y y D0. Con
base en esta estadística se tiene que las regiones críticas de tamaño α y los valores p para
los tres contrastes anteriores son las siguientes:
70

Prueba bilateral.
 H 0 :  X  Y  D0

 vs
H :     D
 a X Y 0

En este caso parece razonable rechazar H0 cuando el valor observado para X  Y en la


muestra sea suficientemente diferente del valor propuesto D0 para  X  Y . Entonces,
valores grandes de la estadística Z en cualquier dirección nos conducen a rechazar H0; por
esta razón,


R.C.  z / z  z 2 o z  z 2 
Entonces, rechazamos H0 a favor de Ha y concluimos que  X  Y  D0 cuando

( x  y )  D0
zc   R.C.
 X2  Y2

n m

El valor p para la prueba es:

p  valor  2P  Z  zc 
Prueba unilateral derecha.
 

 H 0 :  X  Y  D0
 vs
H :     D
 a X Y 0

En este caso parece razonable rechazar H0 cuando el valor observado para X  Y en la


muestra sea suficientemente mayor que el valor propuesto D0 para  X  Y ; por lo tanto,
valores extremos en la cola derecha de la estadística Z nos conducen a rechazar H0. Por esta
razón, la región crítica de tamaño  y el valor p son:

R.C.  z / z  z 

Entonces, rechazamos H0 a favor de Ha y concluimos que  X  Y  D0 cuando

( x  y )  D0
zc   R.C.
 X2  Y2

n m
71

El valor p es:
p  valor  P  Z  zc 

Prueba unilateral izquierda.


 H 0 :  X  Y  D0

 vs
H :     D
 a X Y 0

En este caso parece razonable rechazar H0 cuando el valor observado para X  Y en la


muestra sea suficientemente menor que el valor propuesto D0 para  X  Y ; por esta
razón, la región crítica y el valor p para un nivel de significancia  preestablecido para
esta prueba son:

R.C.  z / z   z 

Entonces, rechazamos H0 a favor de Ha y concluimos que  X  Y  D0 cuando

( x  y )  D0
zc   R.C.
 X2  Y2

n m

El valor p es:
p  valor  P  Z  zc 

Observaciones:
a) Los contrastes anteriores siguen siendo válidos aun cuando las poblaciones no sean
normales, siempre que los tamaños muestrales son grandes.
b) Los contrastes anteriores siguen siendo válidos aun cuando las varianzas poblacionales
sean desconocidas, en este caso las reemplazamos por las varianzas muestrales S X2 y
SY2 , pero se requiere que los tamaños muestrales sean grandes. En este caso, la
estadística de prueba es
X  Y  D0
Z ~ N (0,1)
S X2 SY2

n m

Además, el valor calculado de la estadística es:


( x  y )  D0
zc 
sX2 sY2

n m

Las regiones críticas y los valores p son los mismos que antes.
72

Ejemplo 4. Se cree que el promedio verbal para el número de respuestas correctas para la
prueba SAT para los hombres es mayor que el de las mujeres por más de 10 puntos. Las
muestras aleatorias para ambos sexos arrojaron los siguientes resultados:

Hombres Mujeres
Tamaño muestral = 125 100
Media muestral = 480 460
Desviación estándar muestral = 60 52
Asuma normalidad.

a) Utilizar un nivel de significancia del 5% para determinar si se encuentra apoyada la


creencia por la evidencia muestral. ¿Cuál es el p – valor?
b) Suponga que la verdadera diferencia es de –11 puntos. ¿Cuál es la potencia de la prueba
anterior?

Solución:
Sea X = Calificación en la prueba verbal SAT para los hombres esta variable tiene una
media poblacional  X y una varianza X2 desconocida. De una muestra aleatoria de
tamaño n = 125 se obtiene X  480, SX  60

De una muestra aleatoria de tamaño m = 100 de Y que representa la calificación en la


prueba verbal SAT para los mujeres. Esta variable tiene una media poblacional Y y una
varianza  Y2 desconocida. De de la muestra se obtiene Y  460, SY  52

Se cree que el promedio para los hombres está por encima del de las mujeres por más de 10
puntos. Lo anterior lo podemos indicar como  X  Y  10 , pues la cantidad  X  Y nos
indica en qué cantidad la media poblacional de X está por encima de la de Y. Entonces

a) Utilizar un nivel de significancia del 5% para probar la creencia; para ello, debemos
realizar la siguiente prueba de hipótesis:

 H 0 :  X  Y  10

 vs
 H :     10
 a X Y

Esta es una prueba unilateral derecha para la diferencia de medias poblacionales de dos
poblaciones independientes con varianzas poblacionales desconocidas y tamaños
muestrales grandes, entonces la estadística de prueba para el contraste es

X  Y  D0
Z ~ N (0,1)
S X2 S2
 Y
n m
73

La región crítica es

R.C.  z / z  z  z0.05  1.645

Usando la información muestral se obtiene que el valor calculado de la estadística de


prueba es:

480  460  (10)


zc   1.34
602 522

125 100
Como zc  1.34  R.C. entonces no es posible rechazar H0 y esto nos permite inferir que
posible que los hombres superen a las mujeres en esa prueba pero no lo hacen por más
de 10 puntos.

El valor p para la prueba es:

p  valor  P  Z  1.34  0.0901    0.05


Entonces rechazamos H0.

b) Si la verdadera diferencia es  X  Y  11  10 , entonces la hipótesis nula es falsa y para


este valor la potencia de la prueba es:

Potencia  P  Rechazar H0 / H0 es falsa 


 P  Zc  1.645 /  X  Y  11

Para encontrar esta probabilidad hay que tener en cuenta

X  Y  10
Zc 
S X2 SY2

n m
Entonces,
 
 
 X  Y  10
Potencia  P  1.645 /  X  Y  11
 S2 S2 
 X
 Y 
 n m 

Como la verdadera media no es 10 sino que es 11, entonces la estadística anterior está
mal estandarizada. Para corregir este problema restamos 1 en el numerador de la parte
izquierda de la expresión anterior y esta misma cantidad se resta al lado derecho, y así se
obtiene que
74

 
 
X  Y  10  1 1
Potencia  P   1.645  
 S X2 SY2 S X2 SY2 
   
 n m n m 
 
 
1
 P  Z  1.645   1.51  0.0655
 602 522 
  
 125 100 

Ejemplo 4.1. Un fabricante afirma que la tensión de ruptura promedio del hilo A excede a
las hilo B en al menos 12 kilogramos. Para probar esta afirmación se pusieron a prueba 50
hilos de cada tipo bajo condiciones controladas. El hilo tipo A tuvo una tensión promedio
de 86.7 kilogramos con una desviación estándar de 6.28; mientras que el hilo tipo B tuvo
una tensión promedio de 77.8 kilogramos con una desviación estándar de 5.61. Utilice un
nivel de significancia del 5% para probar la afirmación del fabricante. Encuentre el valor p
de la prueba.

Solución:
Sea X = La tensión de ruptura del hilo tipo A y  X es la tensión de ruptura promedio de
hilo.

Sea Y = La tensión de ruptura del hilo tipo B y Y es la tensión de ruptura promedio de


hilo.

En la muestra aleatoria de tamaño n = 50 de X se obtiene x  86.7 y S X  6.28 y en la


muestra de tamaño m = 50 de Y se obtiene y  77.8 y SY  5.61

El fabricante afirma que la resistencia promedio del hilo tipo A excede a la del hilo tipo B
en al menos 12 kilogramos y esto quiere decir que  X  Y  12 , entonces debemos probar
a un nivel de significancia   0.05 lo siguiente:

 H 0 :  X  Y  12

 vs
 H :     12
 a X Y

Esta es una prueba unilateral izquierda para la diferencia entre dos medias poblacionales de
poblaciones independientes con varianzas poblaciones desconocidas y tamaños muestrales
grandes; por lo tanto, la estadística de prueba es:

X  Y  D0
Z ~ N (0,1)
S X2 SY2

n m
75

Entonces, la región critica de para es

R.C.  z / z  z0.05  1.645

Para tomar la decisión buscamos

x  y 12 86.7  77.8 12


zc    2.6031
2 2
S S 6.282 5.612
X
 Y

n m 50 50

Como zc  2.6031 R.C. , entonces rechazamos H0 y concluimos que la afirmación de


fabricante no es cierta.

Ahora bien, el valor p para esta prueba es:

p  valor  P(Z  zc  2.6031)  0.0046    0.05

Entonces, rechazamos H0.

El caso de varianzas poblacionales desconocidas pero iguales:


Un caso de particular interés es en el que las varianzas poblacionales son desconocidas,
pero podemos suponer que son iguales. En este caso, la estadística de prueba es:

X  Y  D0
t ~ t( nm2)
1 1
Sp 
n m
Donde,
(n 1)S x2  (m 1)SY2
Sp 
nm2
Entonces, las regiones críticas y los valores p para los contrastes alternativos son las
siguientes:

Prueba bilateral:
 
R.C.  t / t  t( 2,nm2) o t  t( 2,nm2)  p  valor  2P tnm2  tc 

Prueba unilateral derecha.


R.C.  t / t  t( ,nm2)   p  valor  P tnm2  tc 

Prueba unilateral izquierda.


76

R.C.  t / t  t( ,nm2)   p  valor  P tnm2  tc 

En cualquiera de los tres casos anteriores se rechaza H0 cuando tc  R.C. donde

x  y  D0
tc 
1 1
Sp 
n m
Ejemplo 5. A finales de la década de los setenta se descubrió que la sustancia
carcionogénica NDMA se formaba durante el proceso de secado de la malta verde, la cual
se empleaba para fabricar cerveza. A principios de los ochenta se desarrolló un nuevo
proceso para el secado de la malta, el cual minimizaba la formación de NDMA. Se tomaron
muestras aleatorias de una cerveza doméstica que se fabricó empleando ambos procesos, y
se midieron los niveles de NDMA en partes por billón. Los resultados están en la tabla
adjunta:
Proceso 6 4 5 5 6 5 5 6 4 6 7 4
Anterior
Proceso 2 1 2 2 1 0 3 2 1 0 1 1
propuesto
Si se supone que se muestrearon dos poblaciones normales e independientes con varianzas
iguales, ¿existe alguna razón para creer, a un nivel de significancia del 5% que ha
disminuido la cantidad de NDMA en más de dos partes por billón con el empleo del nuevo
proceso? Encuentre el p – valor para el contraste.

Solución:
Sea X = Cantidad NDMA que se forma en el secado de la malta verde en el proceso
anterior. Entonces, se puede afirmar que X ~ N (X , 2 )

Sea Y = Cantidad NDMA que se forma en el secado de la malta verde en el proceso nuevo.
Entonces, se puede afirmar que Y ~ N (Y , 2 )

En lo anterior se asume que las varianzas poblacionales son iguales. Además, podemos
asumir independencia entre las poblaciones X e Y.

Ahora bien,  X  Y representa la reducción promedio verdadera en partes por billón por el
empleo del nuevo proceso. Entonces nos piden contrastar que la reducción es superior a dos
partes por billón; esto es hay que realizar el siguiente contraste de hipótesis:

 H 0 :  X  Y  2

 vs
H :     2
 a X Y
77

Para la realización de la prueba se toman dos muestras aleatorias independientes de


tamaños n  12 y m  12 de las poblaciones X e Y, respectivamente. Ahora, de las muestras
se obtiene que:

Summary Statistics
X Y
------------------------------------------------------------
Count 12 12
Average 5.25 1.33333
Variance 0.931818 0.787879
Standard deviation 0.965307 0.887625
Sum 63.0 16.0
------------------------------------------------------------

Dado que las poblaciones son normales, independientes con varianzas desconocidas pero
iguales, entonces la estadística de prueba para el contraste es:

X  Y  D0
t ~ t( nm2)  t(20202)  t(18)
1 1
Sp 
n m

Donde
11 Sx2  11 SY2 11 0.931818  11 0.787879
Sp    0.92728
22 22

Entonces, la región crítica de tamaño   0.05 es:

R.C.  t / t  t(0.05,22)  1.717


Ahora, el valor calculado de la estadística de prueba es:

x  y  D0 5.25  1.33  2
tc    5.071845
1 1 1 1
Sp  0.92728 
n m 12 12
Ahora, como

tc  5.071845  R.C.

Entonces, rechazamos H0 y concluimos que con el empleo del nuevo proceso de secado de
la malta verde se produce una reducción en NDMA en más de dos partes por billón.

2.2.2. Contrastes basados en muestras dependiente (datos pareados):


En este caso suponemos que se tiene una muestra aleatoria de n pares de observaciones de
la forma ( X1 , Y1 ),( X 2 , Y2 ), ,( X n , Yn ) de dos poblaciones normales dependientes X e Y que
tienen medias  X y Y . Queremos determinar si  X  Y  D0 o no lo es. Para realizar
78

la prueba definimos la v.a D  X  Y ~ N (D , D2 ) con D   X  Y y  D2 es


desconocida. Las pruebas para determinar si D   X  Y  D0 se basan en la estadística

D  D0 X  Y  D0
t  ~ t( n 1)
SD / n SD / n

donde D  X  Y  SD son media y desviación estándar de las diferencia entre X e Y.

Entonces, las regiones criticas de tamaño α y el p – valor para las tres pruebas anteriores
son las siguientes:

Prueba bilateral:
 H 0 : D   X  Y  D0

 vs
H :       D
 a D X Y 0

La región crítica y el p – valor son:



R.C.  t / t  t( /2,n1)  t  t( /2,n1)   p  valor  2P tn1  tc 
Prueba unilateral derecha:
 

 H 0 :  D   X  Y  D0
 vs
H :       D
 a D X Y 0

La región crítica y el p – valor son:


R.C.  t / t  t( ,n1)   p  valor  P tn1  tc 

Prueba unilateral izquierda:


 

 H 0 :  D   X  Y  D0
 vs
H :       D
 a D X Y 0

La región crítica y p valor son


R.C.  t / t  t( /2,n1)   p  valor  P tn1  tc 

En cualquiera de los tres casos anteriores se rechaza H0 cuando tc  RC donde


d  D0
tc 
Sd / n
79

Donde d  sd son media y desviación estándar muestral de las diferencias muestrales.

Observación: Usado la estadística

D  (  X  Y ) X  Y  (  X  Y )
t  ~ t( n1)
SD / n SD / n
Se obtiene que el intervalo de confianza del 100(1 )% para ( X  Y ) es
s s
d  t( / 2,n1) d   X  Y  d  t( / 2,n1) d
n n

Ejemplo 6: Se llevó a cabo un estudio para determinar el grado en el cual el alcohol


entorpece la habilidad de pensamiento para llevar a cabo una tarea. Se seleccionaron al
azar diez personas de distintas características y se les pidió que participaran en el
experimento. Después de proporcionarles la información pertinente, cada persona llevó a
cabo el experimento sin nada de alcohol en su organismo. Entonces, la tarea volvió a
llevarse a cabo, después de que cada persona había consumido una cantidad suficiente de
alcohol para tener un contenido en su organismo de 0.1%. Los tiempos antes y después
(en minutos) están en la siguiente tabla.

Participante Antes (X) Después (Y) Después – Antes = D


1 28 39 11
2 22 45 23
3 55 67 12
4 45 61 16
5 32 46 14
6 35 58 23
7 40 51 11
8 25 34 9
9 37 48 11
10 20 30 10
Media - muestral 33.9 47.9 14

Desviación estándar muestral 10.90 11.80 5.14

Suponiendo que los tiempos antes y después se pueden modelar por una distribución
normal, ¿puede concluirse a un nivel de significancia del 5% que el tiempo después es
mayor que el tiempo promedio “antes” por más de 10 minutos? Encuentre el p – valor
para el contraste. Construya un intervalo de confianza del 95% para la diferencia entre los
tiempos promedio después menos antes.

Solución: Sea D = Y – X = Diferencia de tiempos después – antes ~ N (D   y   X , D2 )


con varianza desconocida, donde Y ~ N ( y ,  y2 ) es el tiempo después y X ~ N (X , X2 )
80

es el tiempo antes. Los resultados muestrales para la variable D están en la tabla anterior y
nos muestran que d  14 y sd  5.14 .

Observe se está suponiendo que el tiempo promedio después es mayor que el tiempo
promedio antes; entonces D  Y   X representa en cuanto el tiempo promedio después
supera al tiempo promedio antes y se espera que lo supere en más de 10 minutos. Por lo
tanto, debemos contrastar a un nivel de significancia del 5% las siguientes hipótesis:

 H 0 : D  Y   X  10

 vs
 H :       10
 0 D Y X

La estadística de prueba para este contraste es

D  D0 D 10
t  ~ t(10)
SD / n SD / 10
La región crítica de tamaño α = 0.05 es
RC = t / t  t(0.05,9)  1.833
El valor calculado de la estadística a partir de la información muestral es

d 10 14 10
tc    2.461
Sd / 10 5.14 / 10

Como tc = 2.461 pertenece a la región crítica, entonces se rechaza H0 y podemos concluir


que el tiempo promedio después es mayor que el tiempo promedio antes por más de 10
minutos.

2.3. PRUEBAS PARA VARIANZAS.


Caso 1. Una sola muestra: Pruebas para la varianza de una población normal.
Se quiere probar el valor  02 para la varianza  2 de una población normal. Para la prueba
usaremos la estadística muestral S X2 proveniente de una muestra aleatoria de tamaño n
tomada de la población de interés. Los contrastes que vamos realizar son los siguientes:
 H 0 :  2   02  
 

 H 0 :  2
  02  H 0 :  2
  02
 
1)  vs ; 2)  vs y 3)  vs
H :   2 2 H :   2 2 H :  2   2
 a 0
 a 0
 a 0

En cualquiera de los casos, la estadística de prueba bajo H0 cierta es


81

(n  1) S X2
 
2
~  n21
 2
0

Con esta estadística pretendemos buscar diferencias significativas entre la varianza


muestral S X2 y el valor propuesto  02 para la varianza poblacional y de esta forma
rechazaremos la hipótesis nula. Ahora, para un nivel de significancia  preestablecido, las
regiones críticas y los valores p para los contrastes anteriores son:

Prueba bilateral:
 H 0 :  2   02

 vs
H :  2   2
 a 0

Rechazaremos la hipótesis nula cuando el valor observado de la varianza muestral sea


“suficientemente” diferente del valor propuesto y esto ocurre cuando el valor muestral de la
estadística de prueba sea un valor extremo de la distribución n21 . Por lo tanto, la región
crítica de tamaño α es:


R.C.   2 /  2   2( 2,n1)   2   2(1 2,n1) 
(n  1) s X2
Si  c2   R.C rechazamos H0 en favor de la alternativa.
 02

El valor p para esta prueba viene dado como:


2P( n21  X c2 ) si X c2  1
p  valor  
2P( n1  X c ) si X c  1
2 2 2

Prueba unilateral derecha:


 

 H 0 :  2
  02
 vs
H :  2   2
 a 0

Rechazaremos la hipótesis nula cuando el valor observado de la varianza muestral sea


“suficientemente” mayor que el valor propuesto para ésta y esto ocurre cuando el valor
muestral de la estadística de prueba sea un valor extremo en la cola derecha de la
distribución n21 . Por lo tanto, la región crítica de tamaño α es:


R.C.   2 /  2   2( ,n1) 
82

(n  1) s X2
Si  
2
 R.C rechazamos H0 en favor de la alternativa.
c
 02
El p – valor para esta prueba es: Valor – p = P( n21  c2 )

Prueba unilateral izquierda:


 
H
 0 :  2
  02
 vs
H :  2   2
 a 0

Rechazaremos la hipótesis nula cuando el valor observado de la varianza muestral sea


“suficientemente” menor que el valor propuesto para ésta. Por lo tanto, la región crítica de
tamaño α es:

R.C.   2 /  2   2(1 ,n1) 
(n  1) s 2
Si  c   R.C rechazamos H0 en favor de la alternativa.
2 X
 02
El p – valor para esta prueba es: Valor – p 
 P n21  c2 
Ejemplo 7: (Ejercicio 9.43 del texto de Canavos) En un proceso de llenado, la tolerancia
para el peso de los recipientes es de ocho gramos. Para reunir este requisito, la desviación
estándar en el proceso debe ser de dos gramos. Los pesos de 25 recipientes seleccionados
al azar dieron una desviación estándar de 2.8 gramos.

a) Si los pesos se encuentran normalmente distribuidos, determine si la varianza de éstos es


diferente del valor necesario. Empléese un nivel de significancia del 2%.
b) ¿Para qué valores de la varianza muestral no puede rechazarse la hipótesis nula del
apartado anterior? ¿Se encuentran estos valores equidistantes del valor necesario de la
varianza? ¿Cómo deberían ser? Comente.

Ejemplo 7.1.: El gerente de una planta sospecha que el número de piezas que produce un
trabajador en particular por día, fluctúa más allá del valor normal esperado. El gerente
decide observar el número de piezas que produce este trabajador durante diez días,
seleccionados éstos al azar. Los resultados son: 15, 12, 8, 13, 12, 15, 16, 9, 8, y 14. Si se
sabe que la desviación estándar para todos los trabajadores es de 2 unidades y si el número
de éstas que se produce diariamente, se encuentra modelado en forma adecuada por una
distribución normal, a un nivel de significancia del 5%, ¿tiene apoyo la sospecha del
gerente? Obtener el p – valor para el contraste.

Solución:
Sea X = Número de piezas que produce un trabajador particular por día ~ Normal.
83

De la muestra aleatoria dada se obtiene x  12.2 y sX2  8.84444 . El gerente sospecha que σ
= desviación estándar de X > 2. Dada la información anterior nos piden contrastar a un
nivel de significancia del 5% (α = 0.05) la sospecha. Esto es, hay que realizar con α = 0.05
la siguiente prueba de hipótesis:

 H0 :   2  H0 :  2  4
 
 vs   vs
H :   2 H :  2  4
 a  a

La estadística de prueba para este contraste es


(n  1) S 2 9S 2
 
2
 ~ 92
 02 4

La región crítica de tamaño α = 0.05 es


R.C.   2 /  2   2(0.05,9)  16.92 
El valor calculado de la estadística de prueba es

9s 2 9  8.84444
 
2
c   19.8999
4 4

Ahora, como c  19.8999  RC (19.8999  16.92) , entonces rechazamos H0 y


2

concluimos que el número de piezas que produce este trabajador por día fluctúa más allá
del valor normal esperado.

El p – valor = P  2
9 
 18.8999 . De la tabla se concluye que 0.01 < p – valor <
0.02. Entonces, para un nivel de significancia del 5% se rechaza H0, pues el p – valor <
0.05.

Caso 2: Pruebas para la igualdad de varianzas de dos poblaciones normales.


Sean SX2 y SY2 las varianzas muestrales de dos muestras aleatorias independientes de
tamaños n y m de dos poblaciones X e Y que tienen varianzas poblacionales  X2 y Y2 ,
respectivamente. Queremos comparar las varianzas poblacionales; para ello utilizaremos
las varianzas muestrales y la estadística de prueba es:

 Y2 S X2
~ F( n1,m1)
 X2 SY2

Usando esta estadística vamos a realizar los siguientes contrastes:


84

 H 0 :  X2   Y2  

 0 X  Y
 
2 2
H :

1)  vs 2)  vs
H :  2   2 H :  2   2
 a X Y
 a X Y

Bajo H0 cierta, la estadística de prueba se reduce a

S X2
F ~ F( n1,m1)
SY2
Entonces, rechazaremos H0 cuando haya “mucha” diferencia entre las varianzas muestrales
y esto quiere decir que S X2 es mucho mayor o mucho menor que SY2 ; entonces las regiones
las regiones críticas de tamaño α y los valores p para los dos contrates anteriores son:

Prueba bilateral:

 1 

R.C.   F / F  F( 2,n1,m1) o F  F(1 2, n 1, m 1)  

 F( 2, m 1, n 1) 

2P( F( n1,m1)  Fc ) si Fc  1
p  valor  
2P( F( n1,m1)  Fc ) si Fc  1
Prueba unilateral derecha:
R.C.  F / F  F( ,n1,m1) 
p  valor  P(F(n1,m1)  Fc )

En cualquiera de los dos casos rechazamos H0 a favor de la alternativa Ha cuando


s X2
Fc  2 caiga en la región crítica.
sY

Ejemplo 8: Un inversionista desea comparar el riesgo asociado con dos diferente


mercados, A y B. El riesgo de un mercado se mide por la variación en los cambios diarios
de precios. El inversionista piensa que el riesgo asociado con el mercado B es mayor que
el del mercado A. Se obtienen muestras aleatorias independientes de 21 cambios diarios de
precios para el mercado A y de 16 para el mercado B. Se obtienen los siguientes
resultados:
Mercado A Mercado B
Tamaño 21 16
Media 0.3 0.3
Desviación estándar 0.25 0.45
85

a) Si se supone que las muestras provienen de dos poblaciones normales e independientes a


un nivel de significancia del 5% ¿encuentra apoyo la creencia del inversionista?
Encuentre el p – valor de la prueba.
b) Si la varianza muestral de A es la dada, ¿cuál es el máximo valor de la varianza muestral
de B con base en n = 16 que no llevará al rechazo de la hipótesis nula del apartado
anterior?
Solución:
Sean X = Cambios diarios de precios en el mercado A ~ Normal y  X2 la variación en los
cambios diarios de precios en este mercado; por lo tanto,  X2 representa el riesgo en el
mercado A.

Sea también Y = Cambios diarios de precios en el mercado B ~ Normal y  Y2 la variación


en los cambios diarios de precios en este mercado; por lo tanto,  Y2 representa el riesgo en
el mercado B.

También se tiene que las poblaciones son independientes. De las muestras aleatorias se
obtiene

n  21, SX  0.25, m  16, S y  0.45


Nos piden usar el nivel de significancia del   0.05 y la información anterior, para
contrastar la creencia del inversionista de que el riesgo asociado con el mercado B es
mayor que el del mercado A. Esto es, hay que realizar el contraste siguiente:

 H 0 :  Y2   X2

 vs
H :  2   2
 a Y X

La estadística de prueba para este contraste es:

SY2
F  2 ~ F( m1,n1)  F(15,20)
SX

Entonces, la región crítica de tamaño   0.05 es:

R.C.  F / F  F(0.05,15,20)  F(0.05,15,20)  2.20

El valor calculado de la estadística de prueba es


sY2 0.452 0.2025
Fc  2    3.24
sX 0.252 0.0625
86

Ahora, como Fc  3.24  R.C. entonces rechazamos H0 :  X2  Y2 y concluimos que el


riesgo asociado al mercado A es menor que el del mercado B.

Finalmente, el valor – p de la prueba es

p  valor  P(F(15,20)  3.24)  0.05

Ejemplo 8.1: Se conjetura que las acciones de una compañía sufrirían más variación en una
industria con competencia en precios que una en las que existiera un duopolio o colusión
tácita. En un estudio sobre la industria de generadores, se halló que en cuatro años de
competencia en precios, la variación en las acciones fue de 114.09. En los siguientes siete
años, en los cuales hubo duopolio y colusión tácita, esta variación fue de 16.08. Asumir que
los datos pueden considerarse como muestras aleatorias independientes de dos poblaciones
normales. Contrastar a un nivel de significancia del 5% la conjetura. Encontrar el p – valor
para esta pueda.

2.4. PRUEBAS CONCERNIENTES A PROPORCIONES.

PRUEBAS PARA UNA PROPORCIÓN.


En muchos problemas prácticos se requiere realizar contrastes sobre la proporción
poblacional  . Estos contrastes tienen la forma:

 
 
 H 0 :   0  H 0 :    0  H 0 :   0
  
1)  vs , 2)  vs  3)  vs
H :    H :    H :   
 a  
 
0 a 0 a 0

La estadística de prueba para estos contrastes es:

ˆ  X / n = proporción de éxitos en la muestra de tamaño n observada.

La hipótesis nula será rechazada a favor de la alternativa cuando haya diferencias


significativas entre ˆ  X / n sea suficientemente diferente del valor propuesto  0 , para
buscar diferencias significativas entre estas dos cantidades, utilizaremos la siguiente
estadística

ˆ  0
Z ~ N (0,1)
0 (1  0 ) a
n
Usando la estadística anterior se obtiene que las regiones críticas de tamaño  y el p valor
para las pruebas anteriores son las siguientes:
87

Prueba bilateral: En este caso rechazamos H0 cuando el valor observado para la proporción
muestral ˆ  X / n sea suficientemente diferente del valor propuesto  0 para  ; por lo
tanto,


R.C.  z / z  z 2  z  z 2 
Si zc  (ˆ  0 ) 0 (1  0 ) n  RC , entonces rechazamos H0 a favor de la hipótesis
alternativa. Además, el p – valor para esta prueba es

p – valor = 2P(Z  zc )

Prueba unilateral derecha: En este caso rechazamos H0 cuando la proporción muestral


estimada ˆ  X / n sea suficientemente mayor que el valor  0 propuesto para  ; por lo
tanto, la región crítica es


R.C.  Z / Z  z 2 
Si zc  (ˆ  0 ) 0 (1  0 ) n  RC , entonces rechazamos H0 a favor de la hipótesis
alternativa. Además, el p – valor para esta prueba es

p – valor = P(Z  zc )
Prueba unilateral derecha: En este caso rechazamos H0 cuando la proporción muestral
estimada ˆ  X / n sea suficientemente menor que el valor  0 propuesto para la proporción
poblacional, entonces la región crítica es


R.C.  Z / Z  z 2 
Si zc  (ˆ  0 ) 0 (1  0 ) n  RC , entonces rechazamos H0 a favor de la hipótesis
alternativa. Además, el p – valor para esta prueba es

p – valor = P(Z  zc )

Ejemplo 9: Una organización de salud se interesa en actualizar su información con


respecto a la proporción de hombres que fuman. Con base en estudios previos, se cree que
la proporción es de 40%. La organización lleva a cabo una encuesta en la que se selecciona
en forma aleatoria 1200 hombres a los cuales se les pregunta sus hábitos de fumador. De
los 1200, 420 son fumadores. ¿Será que la evidencia anterior apoya la noción de que la
proporción de hombres que fuman es diferente del 40%? Emplee un nivel de significancia
del 1% (α = 0.01). Encuentre el p – valor para esta prueba
88

PRUEBAS PARA DOS PROPORCIONES


Queremos comparar dos proporciones poblacionales; para ello, supondremos que se tienen
dos muestras aleatorias independientes. La primera muestra es de nX observaciones de una
población X que tiene una proporción poblacional es  X y la proporción muestral resultante
es ˆ  X n . La segunda muestra consta de n observaciones de una población Y cuya
X X Y

proporción poblacional es Y y la proporción muestral resultante es ˆY  Y nY .

Para comparar las proporciones poblacionales realizaremos los siguientes contrastes


alternativos:

 
 
 H 0 :  X  Y H :   Y H :   Y
 
0 X 0 X
1) 1) 
 vs 2)  vs 3)  vs
H :    H :    H :   
 a X Y
 a X Y
 a X Y

Para tamaños muestrales grandes, la estadística de prueba para los tres contrastes anteriores
es la siguiente:

ˆX  ˆY
Z ~ N (0,1)
ˆ0 (1  ˆ0 ) ˆ0 (1  ˆ0 ) a

nX nY
Donde,

ˆ nX ˆX  nYˆY X Y
0  
nX  nY nX  nY
Entonces, en virtud de la estadística anterior se tiene que las regiones críticas de tamaño α
y los valores p son los siguientes:

Prueba bilateral.
 
R.C.  Z / Z  z 2 o Z  z 2  p  valor  2P(Z  zc )

Prueba unilateral derecha.


R.C.  Z / Z  z   p  valor  P(Z  zc )

Prueba unilateral izquierda.


R.C.  Z / Z  z   p  valor  P(Z  zc )
89

En cualquiera de los tres casos, cuando zc , que es el valor calculado de la estadística de


prueba a partir de la información muestral, caiga en la región crítica rechazamos la
hipótesis nula H0 en favor de la alternativa.

Ejemplo 10: Un economista al servicio del estado desea determinar si la frecuencia de


desempleo en dos áreas urbanas del estado son diferentes. Con base en muestras aleatorias
de tamaño 500 de cada ciudad, el economista encuentra 35 personas desempleadas en un
área y 25 en la otra. Bajo las suposiciones apropiadas y con un nivel de significancia del
5% ¿existe alguna razón para creer que las frecuencias de desempleo en las dos áreas son
diferentes? ¿Cuál es el valor – p?
Solución:

En la primera región se tiene que:


X = Número de desempleados en la primera región
 X = la proporción de desempleo en la primera región.

A partir de la información muestral se obtiene que la proporción muestral resultante para


esta región es ˆX  35/ 500  0.07 .

En la segunda región se tiene que:


Y = Número de desempleados en la segunda región
Y = la proporción de desempleo en la segunda región.

A partir de la información muestral se obtiene que la proporción muestral resultante para la


segunda región es ˆY  25/ 500  0.05 .

Nos piden contrastar al 5% (α = 0.05) de significancia si la frecuencia de desempleo en


estas regiones es diferente. Esto es, debemos realizar el siguiente contraste de hipótesis

 H 0 :  X  Y  H 0 :  X  Y  0
 
 vs  vs
H :    H :     0
 a X Y  a X Y

La estadística de prueba para este contraste es

ˆX  ˆY
Z ~ N (0,1)
ˆ0 (1  ˆ0 ) ˆ0 (1  ˆ0 ) a

nX nY

Donde la proporción común estimada es

nX ˆX  nYˆY = X  Y 35  25
ˆ0    0.06
nX  nY nX  nY 500  500
90

Entonces, la región crítica de tamaño α = 0.05 para el contraste es

R.C.  Z / Z  z0.025 0 Z  z0.025  Z / Z  1.96 0 Z  1.96

El valor calculado de la estadística es

ˆX  ˆY 0.07  0.05


Z   8.8652
ˆ0 (1  ˆ0 ) ˆ0 (1  ˆ0 ) 0.06(1  0.06) 0.06(1  0.06)
 
nX nY 500 500

Como zc  8.8652  RC , entonces rechazamos H0 a favor de H1 y concluimos que las


frecuencias de desempleo en las dos regiones es diferente.

El p – valor = 2P(Z  zc )  2P(Z  8.8652)  0 . Por lo tanto, la hipótesis nula se rechaza


a cualquier nivel de significancia.

S-ar putea să vă placă și