Sunteți pe pagina 1din 10

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

37

El uso de valores P en la prueba de hiptesis

Una manera de reportar los resultados de una prueba de hiptesis es estableciendo que la hiptesis nula
fue rechazada o no para un valor de a o nivel de significacin especfico. Por ejemplo, en el experimento
del mortero de cemento portland anterior puede decirse que H O:f-l1 = f-l2 se rechaz con el nivel de significacin 0.05. Esta enunciacin de las conclusiones es con frecuencia inadecuada porque no le ofrece al responsable de la toma de decisiones idea alguna de si el valor calculado del estadstico de prueba apenas
rebas la regin de rechazo o si se adentr bastante en la misma. Adems, al darse los resultados de esta
manera se les impone a otros usuarios de la informacin el nivel de significacin predefinido. Este enfoque puede ser insatisfactorio porque algunos responsables de la toma de decisiones podran sentirse incmodos con los riesgos que implica el valor a = 0.05.
Para evitar estas dificultades, en la prctica se ha adoptado extensivamente el enfoque del valor P. El
valor P es la probabilidad de que el estadstico de prueba asuma un valor que sea al menos tan extremo
como el valor observado del estadstico cuando la hiptesis nula Ha es verdadera. Por lo tanto, un valor P
transmite mucha informacin acerca del peso de la evidencia en contra de Ha y, por consiguiente, el responsable de la toma de decisiones puede llegar a una conclusin con cualquier nivel de significacin especificado. En trminos ms formales, el valor P se define como el nivel de significacin menor que llevara
a rechazar la hiptesis nula Ha.
Se acostumbra decir que el estadstico de prueba (y los datos) es significativo cuando se rechaza la hiptesis nula; por lo tanto, el valor P puede considerarse como el menor nivel a en el que los datos son significativos. Una vez que se conoce el valor P, el responsable de la toma de decisiones puede determinar la
medida en que los datos son significativos sin que el analista de los datos imponga formalmente un nivel
de significacin preseleccionado.
No siempre es sencillo calcular el valor P exacto de una prueba. Sin embargo la mayora de los programas de computacin modernos para realizar anlisis estadsticos reportan valores P, y pueden obtenerse
tambin en algunas calculadoras porttiles. A continuacin se indicar cmo obtener una aproximacin
del valor P para el experimento del mortero de cemento portland. Por la tabla II del apndice, para una
distribucin l con 18 grados de libertad, la probabilidad menor en el rea de la cola es 0.0005, para la cual
lO.0005, 18 = 3.922. Ahora bien, Ilo I = 9.13 > 3.922, de donde, ya que la hiptesis alternativa es de dos colas,
se sabe que el valor P debe ser menor que 2(0.0005) = 0.001. Algunas calculadoras porttiles tienen la capacidad para calcular valores P. Una de ellas es la HP-48. Utilizando esta calculadora se obtiene el valor P
para el valor lo = -9.13 del experimento de la formulacin del mortero de cemento portland como
P = 3.68 X 10-8 Por lo tanto, la hiptesis nula Ho:f-l 1 = f-l2 se rechazara con cualquier nivel de significacin
a 2:: 3.68 X 10-8.
Solucin por computadora

Hay muchos paquetes de software de estadstica que cuentan con la capacidad para probar hiptesis estadsticas. En la tabla 2-2 se presenta la salida del procedimiento para la prueba l de dos muestras de Minitab aplicado al experimento de la formulacin del mortero de cemento portland. Observe que la salida
incluye algunos estadsticos concisos acerca de las dos muestras (la abreviatura "SE Mean" ["SE media"]
se refiere al error estndar de la media, s / J1i.), as como alguna informacin sobre los intervalos de confianza para la diferencia en las dos medias (los cuales se revisan en las secciones 2-4.3 y 2-6). El programa
tambin prueba la hiptesis de inters, permitiendo que el analista especifique la naturaleza de la hiptesis alternativa ("not =" ["no ="] significa H 1:f-l1 :t: f-l2) Y la eleccin de a (a = 0.05 en este caso).
La salida incluye el valor calculado de lo, el valor P (llamado el nivel de significacin) y la decisin que
debera tomarse dado el valor especificado de a. Observe que el valor calculado del estadstico l difiere ligeramente del valor que se calcul manualmente aqu y que el valor P que se reporta es P = 0.0000. Mu-

38

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

Tabla 2-2

Prueba t de dos muestras usando Minitab para el experimento del mortero de cemento portland
Prueba t de dos muestras e intervalo de confianza

Two sample T for Modified vs Unmod


N

Mod if i ed
Unmod

10
10

Mean
16.774
17.922

StDev
0.309
0.248

SE Mean
0.098
0.078

mu Unmod: (-1.411, -0.885)


95% el for mu Modified
t-Test mu Modified = mu Unmod (vs not =): T = -9.16
p = 0.0000 DF = 18
Both use Pooled StDev = 0.280
chos paquetes de software no reportarn un valor P real menor que 0.0001 y en su lugar presentan un
valor "por omisin". ste es el caso aqu.

Verificacin de los supuestos en la prueba t

Para utilizar el procedimiento de la prueba t se establecen los supuestos de que ambas muestras se toman
de poblaciones independientes que pueden describirse con una distribucin normal, que las desviaciones
estndar o las varianzas de ambas poblaciones son iguales, y que las observaciones son variables aleatorias independientes. El supuesto de independencia es crtico, pero si el orden de las corridas est aleatorizado (y, de ser apropiado, se seleccionan al azar otras unidades y materiales experimentales), este
supuesto por lo general se satisfar. Los supuestos de la igualdad de las varianzas y la normalidad son fciles de verificar utilizando una grfica de probabilidad normal.
En general, la graficacin de probabilidades es una tcnica para determinar si los datos muestrales se
ajustan a una distribucin hipotetizada con base en un examen visual subjetivo de los datos. El procedimiento general es muy simple y puede realizarse rpidamente con la mayora de los paquetes de software
de estadstica. En el material suplementario del texto se analiza la construccin manual de las grficas de
probabilidad normal.
Para construir una grfica de probabilidad, primero se ordenan de menor a mayor las observaciones
de la muestra. Es decir, la muestraYl,Yz, ... ,Yn se ordena como Y(1)'Y(2)' ...,Y(n)' donde Y(1) es la observacin
menor'Y(2) es la segunda observacin menor, y as sucesivamente, conY(Il) la mayor. Las observaciones ordenadas Y() se grafican entonces contra sus respectivas frecuencias acumuladas observadas (j - 0.5)/n. La
escala de la frecuencia acumulada se ha dispuesto de tal modo que si la distribucin hipotetizada describe
de manera adecuada los datos, los puntos graficados estarn aproximadamente sobre una lnea recta; si
los puntos graficados muestran una desviacin significativa de una recta, el modelo hipotetizado no es
apropiado. Generalmente, determinar si los datos graficados pertenecen o no a una recta es una decisin
subjetiva.
Para ilustrar el procedimiento, suponga que quiere verificarse el supuesto de que la fuerza de la tensin de adhesin en el experimento de la formulacin del mortero de cemento portland sigue una distribucin normal. Inicialmente slo se consideran las observaciones de la formulacin del mortero sin
modificar. En la figura 2-11a se ilustra una grfica de probabilidad normal generada por computadora. La
mayora de las grficas de probabilidad normal muestran 100(j - O.5)/n en la escala vertical izquierda (yen
ocasiones se muestra 100[1- (j - O.5)/n] en la escala vertical derecha), con el valor de la variable graficado
en la escala horizontal. Algunas grficas de probabilidad normal convierten la frecuencia acumulada en
un valor z normalizado. Una lnea recta, elegida de manera subjetiva, se ha trazado en medio de los pun-

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

~
~

99.9
99

ro
ro

95

E
:o

80

"O

39

:i
u

ro

ro

50

c:

20

E
o

"O

ro

32

:aro

.o
~

O-

0.1
Fuerza de la tensin de adhesin
a) Mortero sin modificar

_ 99.9 r-r--,--,--,--,--,--,--,--,--,--,----r---r---r---r---r--------,--,-,

o
o
~

99

ro
ro

95

E
:o

80

"O

:i
u

ro

ro

50

c:

20

E
o

"O

ro

:cro

.o
o

c::

0.1

16.3

16.5

16.7

16.9

Fuerza de la tensin de adhesin


b) Mortero modificado

Figura 2-11 Grficas de probabilidad normal de la fuerza de la tensin de


adhesin eu el experimento del cemento portland.

tos graficados. Al trazar la lnea recta, uno deber guiarse ms por los puntos de la parte media de la grfica que por los puntos extremos. Una buena regla emprica es trazar la recta aproximadamente entre los
puntos de los cuartiles 25 y 75. As se determin la recta de la figura 2-11a. Para evaluar la "proximidad"
de los puntos a la lnea recta, imagine un lpiz grueso colocado sobre la recta. Si este lpiz imaginario cubre todos los puntos, entonces una distribucin normal describe de manera adecuada los datos. Puesto
que los puntos de la figura 2-11a pasaran la prueba del lpiz grueso, se concluye que la distribucin normal es un modelo apropiado para la fuerza de la tensin de adhesin del mortero sin modificar. En la figura 2-11b se presenta la grfica de probabilidad normal para las 10 observaciones de la fuerza de la
tensin de adhesin del mortero modificado. De nueva cuenta, se concluira que es razonable el supuesto
de una distribucin normal.
Es posible obtener una estimacin de la media y la desviacin estndar directamente de la grfica de
probabilidad normal. La media se estima como el percentil50 de la grfica de probabilidad y la desviacin
estndar se estima como la diferencia entre los percentiles 84 y 50. Esto significa que el supuesto de la
igualdad de las varianzas poblacionales en el experimento del cemento portland puede verificarse comparando las pendientes de las dos rectas de las figuras 2-lla y 2-llb. Ambas rectas tienen pendientes muy si-

40

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

milares, por lo que el supuesto de la igualdad de las varianzas es razonable. Si se viola este supuesto,
deber usarse la versin de la prueba t que se describe en la seccin 2-4.4. En el material suplementario
del texto hay ms informacin acerca de la verificacin de los supuestos de la prueba t.
Cuando ocurren violaciones importantes de los supuestos, se afectar el desempeo de h. prueba t.
En general, las violaciones de pequeas a moderadas no son motivo de preocupacin particular, pero no
deber ignorarse cualquier falla del supuesto de independencia, as como los indicios claros de que no se
satisface el supuesto de normalidad. Tanto el nivel de significacin de la prueba como la capacidad para
detectar diferencias entre las medias sern afectados adversamente por el incumplimiento de estos supuestos. Un recurso para resolver este problema son las transformaciones. Este tema se analiza con mayor detalle en el captulo 3. Tambin es posible utilizar procedimientos no paramtricos para la prueba de
hiptesis cuando las observaciones provienen de poblaciones no normales. Referirse a Montgomery y
Runger [83d] para ms detalles.
Una justificacin alternativa de la prueba t

La prueba t de dos muestras que acaba de presentarse depende en teora del supuesto fundamental de
que las dos poblaciones de las que se seleccionaron las muestras al azar son normales. Aun cuando el supuesto de normalidad es necesario para desarrollar formalmente el procedimiento de prueba, como ya
se mencion, las desviaciones moderadas de la normalidad no afectarn seriamente los resultados. Puede
argumentarse (por ejemplo, ver Box, Hunter y Hunter [18]) que el uso de un diseo aleatorizado
permite probar hiptesis sin ningn supuesto respecto de la forma de la distribucin. En resumen, el razonamiento es el siguiente. Si los tratamientos no tienen ningn efecto, todas las [20!/(1O!l0!)] = 184,756
formas posibles en que podran ocurrir las 20 observaciones son igualmente posibles. Hay un valor de t o
para cada uno de estos 184,756 posibles arreglos. Si el valor de to que se obtiene en realidad de los datos es
inusualmente grande o inusualmente pequeo con referencia al conjunto de los 184,756 valores posibles,
es una indicacin de que #1 :; #2'
A este tipo de procedimiento se le llama prueba de aleatorizacin. Puede demostrarse que la prueba
t es una buena aproximacin de la prueba de aleatorizacin. Por lo tanto, se usarn aqu pruebas t (y otros
procedimientos que pueden considerarse aproximaciones de pruebas de aleatorizacin) sin prestar demasiada atencin al supuesto de normalidad. sta es una de las razones por las que un procedimiento
simple, como las grficas de probabilidad normal, es adecuado para verificar el supuesto de normalidad.
2~4.2

Eleccin del tamao de la muestra

La eleccin de un tamao de la muestra apropiado es uno de los aspectos ms importantes de cualquier


problema de diseo experimental. La eleccin del tamao de la muestra y la probabilidad/3 del error tipo
11 guardan una estrecha relacin. Suponga que se estn probando las hiptesis
H O:#1=#2
H 1 : #1

:;

#2

Yque las medias no son iguales, por lo que o = #1 -#2' Puesto que H O:#1 = #2 no es verdadera, la preocupacin principal es cometer la equivocacin de no rechazar H o. La probabilidad del error tipo 11 depende de
la verdadera diferencia en las medias o. A una grfica de /3 contra opara un tamao particular de la muestra se le llama la curva de operacin caracterstica, o curva OC, de la prueba. El error f3 tambin es una
funcin del tamao de la muestra. En general, para un valor dado de o, el error /3 se reduce cuando el tamao de la muestra se incrementa. Es decir, es ms fcil detectar una diferencia especificada en las medias para tamaos grandes de la muestra que para los tamaos pequeos.

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

41

En la figura 2-12 se muestra un juego de curvas de operacin caracterstica para las hiptesis
H o :fll = fl2
H 1 : fll :; fl2
para el caso en que las dos varianzas poblacionales o~ yo; son desconocidas pero iguales (o~ = o; = 0 2 )
Ypara un nivel de significacin de a = 0.05. Las curvas tambin parten del supuesto de que los tamaos de
las muestras de las dos poblaciones son iguales; es decir, nI = n 2 = n. El parmetro del eje horizontal de la
figura 2-12 es

d)fll-fl21=~
20
20
La divisin de 1<3 I por 20 permite al experimentador usar el mismo juego de curvas, independientemente
del valor de la varianza (la diferencia en las medias se expresa en unidades de desviacin estndar). Por
otra parte, el tamao de la muestra usado para construir las curvas es en realidad n * = 211 - 1.
Al examinar estas curvas, se observa lo siguiente:
Entre ms grande sea la diferencia en las medias, /11 -1.(,20 menor ser la probabilidad del error tipo TI
para un tamao de la muestra y un valor de a dados. Es decir, para un tamao de la muestra y un valor
de a especificados, la prueba detectar con mayor facilidad las diferencias grandes que las pequeas.
2. Cuando el tamao de la muestra se hace ms grande, la probabilidad del error tipo TI se hace ms pequea para una diferencia en las medias y un valor de a dados. Es decir, para detectar una diferencia
<3 especificada, puede aumentarse la potencia de la prueba incrementando el tamao de la muestra.
1.

Las curvas de operacin caracterstica son con frecuencia tiles para seleccionar el tamao de la
muestra que debe usarse en un experimento. Por ejemplo, considere el problema del mortero de cemento
portland comentado antes. Suponga que si las dos formulaciones difieren en la fuerza promedio hasta en
0.5 kgf/cm2, sera deseable detectarlo con una probabilidad alta. Por lo tanto, puesto que fll - fl2 =
1.0 .------r------------r---~--....---__

0.8

lO

E.
~

0.6

lO

al

"C
"C
lO

"C

:5

O.4I--Hffi-t\-t--\--\--.,.-t~.--t--~d----

13

J:

0.21--IrH!H\---\-\----*--:-~_+~...---p...-----+_--_

Figura 212 Curvas de operacin caracterstica para la prueba t de dos


colas con a = 0.05. (Reproducida con permiso de "Operating Characteristics Curves for the Common Statistical Tests of Significance", c.L. Ferris, EE. Grubbs y C.L. Weaver, Annals of Mathematical Statistics.)

42

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

0.5 kgf/cm2es la diferencia "crtica" en las medias que quiere detectarse, se encuentra que d, el parmetro
del eje horizontal de la curva de operacin caracterstica de la figura 2-12, es
d=

Ifl l-fl21=
2a

0.5= 0.25

2a

Desafortunadamente, d incluye al parmetro desconocido a. Sin embargo, suponga que con base en la experiencia previa se piensa que es altamente improbable que la desviacin estndar de cualquiera de las
observaciones de la fuerza exceda 0.25 kgf/cm 2. Entonces al usar a = 0.25 en la expresin anterior para d
se obtiene d = 1. Si quiere rechazarse la hiptesis nula 95% de las veces cuandofll -fl2 = 0.5, entoncesf3 =
0.05, Y en la figura 2-12 conf3 = 0.05 Y d = 1 se obtiene n* = 16, aproximadamente. Por lo tanto, puesto
que n * = 2n - 1, el tamao de la muestra requerido es
n= n*+l = 16+1 = 8.5=9
2
2

y se usaran los tamaos de las muestras n 1 = n 2 = n = 9.


En el ejemplo que se ha venido considerando, el experimentador utiliz en realidad un tamao de la
muestra de 10. Quizs el experimentador decidi incrementar ligeramente el tamao de la muestra a fin
de prevenir la posibilidad de que la estimacin previa de la desviacin estndar comn a haya sido demasiado conservadora y quiz fuera un poco mayor que 0.25.
Las curvas de operacin caracterstica desempean con frecuencia un papel importante en la eleccin del tamao de la muestra en los problemas de diseo experimental. Su utilizacin a este respecto se
revisa en captulos subsecuentes. Para un anlisis de los usos de las curvas de operacin caracterstica en
otros experimentos comparativos simples similares a la prueba t de dos muestras, vase Montgomery y
Runger [83d].
2~4.3

Intervalos de confianza

Aun cuando la prueba de hiptesis es un procedimiento til, en ocasiones no cuenta la historia completa.
Muchas veces es preferible proporcionar un intervalo dentro del cual cabra esperar que estara incluido
el valor del parmetro o los parmetros en cuestin. A las declaraciones de estos intervalos se les llama intervalos de confianza. En m~chos experimentos de ingeniera e industriales, el experimentador sabe de
antemano que las medias fll y fl2 difieren; por consiguiente, la prueba de la hiptesis fll = fl2 es de escaso
inters. Por lo general el experimentador estara ms interesado en un intervalo de confianza para la diferencia en las medias fll - fl2'
Para definir un intervalo de confianza, suponga que e es un parmetro desconocido. Para obtener
una estimacin del intervalo de e, es necesario encontrar dos estadsticos L y U tales que la declaracin de
probabilidad
P(L::5 e::5 U) = 1- a

(2-27)

sea verdadera. Al intervalo


(2-28)
se le llama intervalo de confianza de 100(1- a) por ciento para el parmetro e. La interpretacin de este
intervalo es que si, en muestreos aleatorios repetidos, se construye gran nmero de estos intervalos, 100(1
-a) por ciento de ellos contendrn el verdadero valor de e. Alos estadsticosL y U se les llama los lmites

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

43

de confianza inferior y superior, respectivamente, y a 1- a se le llama el coeficiente de confianza. Si a ==


0.05, a la ecuacin 2-28 se le llama intervalo de confianza de 95% para e. Observe que los intervalos de
confianza tienen una interpretacin de frecuencia; es decir, no se sabe si la declaracin es verdadera para
esta muestra especfica, pero s se sabe que el mtodo usado para generar el intervalo de confianza produce declaraciones correctas en 100(1 - a) por ciento de las veces.
Suponga que quiere encontrarse un intervalo de confianza de 100(1 - a) por ciento para la verdadera
diferencia de las medias f.-lI - f.-lz en el problema del cemento portland. El intervalo puede deducirse de la
siguiente manera. El estadstico

se distribuye como t /11 +112 -Z' Por lo tanto,

== 1-a

(2-29)

(2-30)
es un intervalo de confianza de 100(1 - a) por ciento para f.-lI - f.-lz.
La estimacin real del intervalo de confianza de 95% para la diferenCia en la fuerza de la tensin de
adhesin promedio de las formulaciones del mortero de cemento portland se encuentra haciendo la siguiente sustitucin en la ecuacin 2-30:

16.76-17.92- (2.101)0.284~fa-+fa-'5. f.-lI - f.-lz


'5.16.76 -17. 92 + (2.101 )0.284~fa- + fa-1.16-0.27'5.f.-lI-f.-lZ '5.-1.16+0.27
-1.43'5. f.-lI - f.-lz '5. -0.89
Por lo tanto, el intervalo de confianza de 95% estimado para la diferencia en las medias se extiende de
-1.43 kgf/cm z a -0.89 kgf/cmz. Expresado en otros trminos, el intervalo de confianza es f.-lI - f.-lz == -1.16
kgf/cm z 0.27 kgflcmz, o la diferencia enlasfuerzas promedio es -1.16 kgf/cmz, y la precisin de esta estimacin es de 0.27 kgf/cmz. Observe que como f.-lI - f.-lz == Ono est incluida en este intervalo, los datos no
apoyan la hiptesis de que f.-lI == f.-lz con el nivel de significacin de 5%. Es probable que la fuerza media de
la formulacin sin modificar exceda la fuerza media de la formulacin modificada. Observe que en la ta-

44

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

bla 2-2 Minitab tambin report este intervalo de confianza cuando se llev a cabo el procedimiento de la
prueba de hiptesis.
2~4.4

Caso en que

a :;z!: a;

Si se est probando
H o : /11

= /12

H 1 : /11

:;z!:

/12

y no hay bases para suponer que las varianzas a~ ya; son iguales, entonces es necesario hacer ligeras modificaciones en la prueba t de dos muestras. En este caso el estadstico de prueba es

J\ - Y2
S2 S;
_1_+_nI

(2-31)

n2

Este estadstico no se distribuye exactamente como t. No obstante, t es una buena aproximacin de la distribucin de to si se usa

(2-32)

para los grados de libertad. Una indicacin clara de la desigualdad de las varianzas en una grfica de probabilidad normal sera una situacin que requerira esta versin de la prueba t. El lector no deber encontrar problemas para desarrollar una ecuacin para encontrar ese intervalo de confianza para la diferencia
en las medias en el caso de varianzas desiguales.
2~4.5

Caso en que se conocen

a ya;

Si las varianzas de ambas poblaciones se conocen, entonces las hiptesis


H o : /11

= /12

H 1 : /11

:;z!:

/12

pueden probarse utilizando el estadstico

z - Y Y2
1-

0-

2
2
_1 + _ 2

nI

n2

(2-33)

Si ambas poblaciones son normales, o si los tamaos de las muestras son lo suficientemente grandes para
aplicar el teorema del lmite central, la distribucin de Zo es N(O, 1) si la hiptesis nula es verdadera. Por
lo tanto, la regin crtica se encontrara utilizando la distribucin normal en lugar de la distribucin t.
Especficamente, H ose rechazara si IZo I > Za12' donde Zal2 es el punto porcentual a/2 superior de la distribucin normal estndar.

r
1:

l:
1.

i:

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

45

A diferencia de la prueba t de las secciones anteriores, en la prueba de las medias con varianzas conocidas no se requiere el supuesto de que el muestreo se haga de poblaciones normales. Puede aplicarse el
teorema del lmite central para justificar una distribucin normal aproximada para la diferencia en las
medias muestrales Yl - YZ.
El intervalo de confianza de 100(1-a) por ciento para#l-#Z cuando las varianzas se conocen es
(2-34)

Como ya se seal, el intervalo de confianza es con frecuencia un complemento til del procedimiento de
prueba de hiptesis.

2,4.6

Comparacin de una sola media con un valor especificado

Algunos experimentos incluyen la comparacin de la media# de una sola poblacin con un valor especificado, por ejemplo #0. Las hiptesis son
H o:#

= #0

H 1 :W:;. #0

Si la poblacin es normal con varianza conocida, o si la poblacin no es normal pero el tamao de la muestra es lo suficientemente grande para aplicar el teorema del lmite central, entonces la hiptesis puede
probarse utilizando una aplicacin directa de la distribucin normal. El estadstico de prueba es

Z - Y-#o
0-

a/.Jii

(2-35)

Si H o:# = #0 es verdadera, entonces la distribucin de Zo es N(O, 1). Por lo tanto, la regla de decisin para
H o:# = #0 es rechazar la hiptesis nula si IZo I > ZaIZ. El valor de la media #0 especificado en la hiptesis
nula se determina por lo general mediante una de las tres formas siguientes. Puede ser resultado de evidencia, conocimientos o experimentacin previos. Puede ser resultado de alguna teora o modelo que
describe la situacin bajo estudio. Por ltimo, puede ser resultado de especificaciones contractuales.
El intervalo de confianza de 100(1 - a) por ciento para la verdadera media poblacional es

Y- ZalZ a /.Jii :5 # :5 y+ ZalZ a / .Jii


EJEMPLO 2,1

(2-36)

Un proveedor ofrece lotes de tela a un fabricante de textiles. El fabricante desea saber si la resistencia a la
ruptura promedio excede 200 psi. De ser as, el fabricante aceptar el lote. La experiencia pasada indica
que un valor razonable para la varianza de la resistencia a la ruptura es 100(psif Las hiptesis que debern probarse son
HO:Jl

= 200

H 1 : # > 200

Observe que se trata de una hiptesis alternativa de una cola. Por lo tanto, el lote se aceptara slo si la hiptesis nula H o:# = 200 pudiera rechazarse (es decir, si Zo > Za).

46
ji

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

Se seleccionan cuatro ejemplares aleatoriamente, y la resistencia a la ruptura promedio observada es


El valor del estadstico de prueba es

= 214 psi.

= y- f10 = 214- 200 = 2.80

Z
o

a /.Jii

10/..J4

Si se especifica un error tipo 1 de a = 0.05, en la tabla 1 del apndice se encuentra que Za = ZO.05 = 1.645.
Por lo tanto, H ose rechaza y se concluye que la resistencia a la ruptura promedio del lote excede 200 psi.

Cuando no se conoce la varianza de la poblacin, es necesario establecer el supuesto adicional de que


la poblacin sigue una distribucin normal, aunque las desviaciones moderadas de la normalidad no afectarn seriamente los resultados.
Para probar H o:f1 = f10 en el caso de la varianza desconocida, se usa la varianza muestral 52 para estimar if. Al sustituir a con 5 en la ecuacin 2-35, se obtiene el estadstico de prueba
t _Y-f1o
0-

(2-37)

5/.Jii

La hiptesis nula H o:1-1 = f10 se rechazara si Ito I > ta /2,1l-1' donde ta/2,1l-1 denota el punto porcentual a/2
superior de la distribucin t con n -1 grados de libertad. El intervalo de confianza de 100(1-a) por ciento
es en este caso
(2-38)

2~4.7

Resumen

En las tablas 2-3 y 2-4 se resumen los procedimientos de prueba estudiados aqu para las medias muestrales. Se muestran las regiones crticas para hiptesis alternativa tanto de una como de dos colas.
Tabla 2-3

Hiptesis

Pruebas para medias con varianza conocida

Estadstico de prueba Criterios de rechazo

H O:# = #0

H:# ~ #0
H o:# = #0
H:Jl < #0
H o:# = #0
H:#> #0

H o:# = Jlz
H:#z ~ #z
H o:# = #z
H:Jl < #z
H o:# = #z
H:# > Jlz

Z - y - #0
o-a/.J

Zo < -Za

S-ar putea să vă placă și