Sunteți pe pagina 1din 24

Universidad de Guayaquil

Facultad de Ciencias Administrativas


Escuela de Contaduría Pública Autorizada

Materia:
Estadística

Título:
Prueba de hipótesis de una y dos colas

Integrantes:
Vasconez Cueva Nathaly
Guzmán Valdez Alberto
Alejandro del Rosario Genesis
Zambrano Mera Jefferson

Profesor:
Casquete Baidal Nubia Elizabeth

Año 2018-2019

CICLO II
2

Tabla de Indice
TABLA DE INDICE ------------------------------------------------------------------------------ 2
ESTIMACIÓN E INTERVALOS DE CONFIANZA-------------------------------------- 3
Objetivos de la unidad ---------------------------------------------------------------------------- 3
Desviación estándar poblacional desconocida ----------------------------------------------- 3
Intervalo de confianza de una proporción --------------------------------------------------- 6
Elección del tamaño adecuado de una muestra --------------------------------------------- 7
¿Cómo determinar el tamaño de una muestra? --------------------------------------------- 7
¿De qué depende el tamaño muestral? -------------------------------------------------- 7
Tamaño de la muestra para calcular una media poblacional -------------------------- 10
Tamaño de la muestra para calcular la proporción de una población --------------- 10
Factor de corrección de una población finita ---------------------------------------------- 11
PRUEBAS DE HIPÓTESIS DE UNA MUESTRA --------------------------------------- 12
Cinco pasos para probar una hipótesis ----------------------------------------------------- 13
Pruebas de significancia de una y dos colas ------------------------------------------------ 14
Pruebas de la media de una población: se conoce la desviación estándar
poblacional ---------------------------------------------------------------------------------------- 16
Prueba de una cola ------------------------------------------------------------------------------ 19
Valor p en la prueba de hipótesis ------------------------------------------------------------ 20
Prueba de la media poblacional: desviación estándar de la población desconocida
------------------------------------------------------------------------------------------------------- 22
3

Estimación e intervalos de confianza

Objetivos de la unidad

 Construir el intervalo de confianza de una media poblacional cuando no se conoce


la desviación estándar de la población.
 Construir el intervalo de confianza de una proporción de la población.
 Calcular el tamaño de la muestra necesario para estimar una proporción de la
población o una media poblacional.
 Ajustar el intervalo de confianza de poblaciones finitas.

Desviación estándar poblacional desconocida

Las circunstancias específicas para la construcción de este intervalo son los siguientes:

Intervalo para µ

Desconocida σ (o la varianza) dado que n es pequeña no podemos tomar S como σ

Distribución poblacional normal.

Nivel de confianza dado 1-α

Las siguientes características de la distribución t se basan en el supuesto de que la


población de interés es de naturaleza normal, o casi normal.

• Como en el caso de la distribución z, es una distribución continua.

• Como en el caso de la distribución z, tiene forma de campana y es simétrica.

• No existe una distribución t, sino una familia de distribuciones t. Todas las


distribuciones t tienen una media de 0, y sus desviaciones estándares difieren de acuerdo
con el tamaño de la muestra, n. Existe una distribución t para un tamaño de muestra de
20, otro para un tamaño de muestra de 22, etc. La desviación estándar de una distribución
t con 5 observaciones es mayor que en el caso de una distribución t con 20 observaciones.
4

• La distribución t se extiende más y es más plana por el centro que la distribución normal
estándar (vea la gráfica 9-1). Sin embargo, conforme se incrementa el tamaño de la
muestra, la distribución t se aproxima a la distribución normal estándar, pues los errores
que se cometen al utilizar s para estimar disminuyen con muestras más grandes.

Para crear un intervalo de confianza de la media poblacional con una desviación estándar

desconocida:

1. Suponga que la población muestreada es normal o aproximadamente normal. De


acuerdo con el teorema central del límite, sabemos que este supuesto es cuestionable en
el caso de muestras pequeñas, y es más válida en el de muestras más grandes.

2. Estime la desviación estándar de la población () con la desviación estándar de la


muestra (s).

3. Utilice la distribución t en lugar de la distribución z

Ejemplo

Un fabricante de llantas desea investigar la durabilidad de sus productos. Una muestra de


10 llantas que recorrieron 50 000 millas reveló una media muestral de 0.32 pulgadas de
cuerda restante con una desviación estándar de 0.09 pulgadas. Construya un intervalo de
confianza de 95% de la media poblacional. ¿Sería razonable que el fabricante concluyera
que después de 50 000 millas la cantidad media poblacional de cuerda restante es de 0?30
pulgadas?
5

Para comenzar, se supone que la distribución de la población es normal. En este caso no


hay muchas evidencias, pero tal vez la suposición sea razonable. No se conoce la
desviación estándar de la población, pero sí la desviación estándar de la muestra, que es
de 0.09 pulgadas. Se aplica la fórmula (9-2): De acuerdo con la información dada, s 0.09
y n 10. Para hallar el valor de t, utilice el apéndice B.2, una parte del cual se reproduce en
la tabla 9-1. El primer paso para localizar t consiste es desplazarse a lo largo de las
columnas identificadas como “Intervalos de confianza” hasta el nivel de confianza que se
requiere. En este caso, desea el nivel de confianza de 95%, así que vaya a la columna con
el encabezamiento “95%”. La columna del margen izquierdo se identifica como “gl”.
Estas palabras se refieren al número de grados de libertad, esto es, el número de
observaciones incluidas en la muestra menos el número de muestras, el cual se escribe n
1. En este caso es de 10 1 9. ¿Por qué se decidió que había 9 grados de libertad? Cuando
se utilizan estadísticas de la muestra, es necesario determinar el número de valores que se
encuentran libres para variar. Para ilustrarlo, suponga que la media de cuatro números es
de 5. Los cuatro números son 7, 4, 1 y 8. Las desviaciones respecto de la media de estos
números deben sumar 0. Las desviaciones de 2, 1, 4 y 3 suman 0. Si se conocen las
desviaciones de 2, 1 y 4, el valor de 3 se fija (se restringe) con el fin de satisfacer la
condición de que la suma de las desviaciones debe totalizar 0. Por consiguiente, 1 grado
de libertad se pierde en un problema de muestreo que implique la desviación estándar de
la muestra, pues se conoce un número (la media aritmética). En el caso de un nivel de
confianza de 95% y 9 grados de libertad, seleccione la fila con 9 grados de libertad. El
valor de t es 2.262. Para determinar el intervalo de confianza se sustituyen los valores en
la fórmula

Los puntos extremos del intervalo de confianza son 0.256 y 0.384. ¿Cómo interpretar este
resultado? Si repitiéramos este estudio 200 veces, calculando el intervalo de confianza de
95% con cada media de la muestra y la desviación estándar, 190 intervalos incluirían la
media poblacional. Diez intervalos no la incluirían. Éste es el efecto del error muestral.
Otra interpretación es concluir que la media poblacional se encuentra en este intervalo.
El fabricante puede estar seguro (95% seguro) de que la profundidad media de las cuerdas
6

oscila entre 0.256 y 0.384 pulgadas. Como el valor de 0.30 se encuentra en este intervalo,
es posible que la media de la población sea de 0.30 pulgadas.

Intervalo de confianza de una proporción

PROPORCIÓN Fracción, razón o porcentaje que indica la parte de la muestra de la


población que posee un rasgo de interés particular.

PROPORCIÓN MUESTRAL p =X /n

La proporción de la población se define por medio de  . Por consiguiente, se refiere al


porcentaje de éxitos en la población. Recuerde, del capítulo 6, que es la proporción de
éxitos en una distribución binomial. Esto permite continuar la práctica de utilizar letras
griegas para identificar parámetros de población y letras latinas para identificar
estadísticas muestrales. Para crear el intervalo de confianza de una proporción, es
necesario cumplir con los siguientes supuestos: 1. Las condiciones binomiales, estudiadas
en el capítulo 6, han quedado satisfechas. En resumen, estas condiciones son: a) Los datos
de la muestra son resultado de conteos.

b) Sólo hay dos posibles resultados (lo normal es referirse a uno de los resultados como
éxito y al otro como fracaso).

c) La probabilidad de un éxito permanece igual de una prueba a la siguiente.

d) Las pruebas son independientes. Esto significa que el resultado de la prueba no influye
en el resultado de otra. 2. Los valores n y n(1 -  ) deben ser mayores o iguales que 5.
Esta condición permite recurrir al teorema central del límite y emplear la distribución
normal estándar, es decir, z, para completar un intervalo de confianza.

Ejemplo:

El sindicato que representa a Bottle Blowers of America (BBA) considera la propuesta


de fusión con Teamsters Union. De acuerdo con el reglamento del sindicato de BBA, por
lo menos tres cuartas partes de los miembros del sindicato deben aprobar cualquier fusión.
Una muestra aleatoria de 2 000 miembros actuales de BBA revela que 1 600 planean votar
por la propuesta. ¿Qué es el estimador de la proporción poblacional? Determine el
7

intervalo de confianza de 95% de la proporción poblacional. Fundamente su decisión en


esta información de la muestra:

¿Puede concluir que la proporción necesaria de miembros del BBA favorece la fusión?

¿Por qué?

Solución Primero calcule la proporción de la muestra de acuerdo con la fórmula (9-3).


Ésta es de 0.80,

Que se calcula de la siguiente manera:

Por consiguiente, se calcula que 80% de la población favorece la propuesta de fusión.


Determine el intervalo de confianza de 95% con ayuda de la fórmula

Los puntos extremos del intervalo de confianza son 0.782 y 0.818. El punto extremo más
bajo es mayor que 0.75. Así, es probable que se apruebe la propuesta de fusión, pues el
estimador del intervalo incluye valores superiores a 75% de los miembros del sindicato.

Elección del tamaño adecuado de una muestra

¿Cómo determinar el tamaño de una muestra?


Determinar el tamaño de la muestra que se va a seleccionar es un paso importante en
cualquier estudio de investigación de mercados, se debe justificar convenientemente de
acuerdo al planteamiento del problema, la población, los objetivos y el propósito de la
investigación.
¿De qué depende el tamaño muestral?

El tamaño muestral dependerá de decisiones estadísticas y no estadísticas, pueden incluir


por ejemplo la disponibilidad de los recursos, el presupuesto o el equipo que estará en
campo.

Antes de calcular el tamaño de la muestra necesitamos determinar varias cosas:


8

1. Tamaño de la población. Una población es una colección bien definida de objetos o


individuos que tienen características similares. Hablamos de dos tipos: población
objetivo, que suele tiene diversas características y también es conocida como la población
teórica. La población accesible es la población sobre la que los investigadores aplicaran
sus conclusiones.
2. Margen de error (intervalo de confianza). El margen de error es una estadística que
expresa la cantidad de error de muestreo aleatorio en los resultados de una encuesta, es
decir, es la medida estadística del número de veces de cada 100 que se espera que los
resultados se encuentren dentro de un rango específico.
3. Nivel de confianza. Son intervalos aleatorios que se usan para acotar un valor con una
determinada probabilidad alta. Por ejemplo, un intervalo de confianza de 95% significa
que los resultados de una acción probablemente cubrirán las expectativas el 95% de las
veces.
La desviación estándar. Es un índice numérico de la dispersión de un conjunto de datos
(o población). Mientras mayor es la desviación estándar, mayor es la dispersión de la
población.
Una variable importante cuando se trabaja con intervalos de confianza es el tamaño de la
muestra. Sin embargo, en la práctica, no es una variable, sino una decisión que se toma
para que la estimación del parámetro de población sea bueno. Esta decisión se basa en
tres variables:

1. El margen de error que tolerará el investigador.

2. El nivel de confianza deseado.

3. La variabilidad o dispersión de la población que se estudia.

La primera variable es el margen de error. El máximo error admisible, designado E, es la


magnitud que se suma y resta de la media muestral (o proporción muestral) para
determinar los puntos extremos del intervalo de confianza. Por ejemplo, en un estudio de
salarios, podemos decidir que deseamos estimar el salario promedio de la población con
un margen de error de más o menos $1 000. O en una encuesta de opinión, podemos
decidir que deseamos calcular la proporción de la población con un margen de error de
más o menos 5%. El margen de error es la magnitud del error que se tolerará al estimar
un parámetro poblacional. Quizás se pregunte por qué no elegir márgenes pequeños de
error. Existe una compensación entre el margen de error y el tamaño de la muestra. Un
9

margen de error pequeño requiere de una muestra más grande y de más tiempo y dinero
para recolectarla. Un margen de error más grande permitirá tener una muestra más
pequeña y un intervalo de confianza más amplio.

La segunda elección es el nivel de confianza. Al trabajar con un intervalo de confianza,


lógicamente se elegirán niveles de confianza relativamente altos como de 95 y 99%, que
son los más comunes. Para calcular el tamaño de la muestra, se necesitará un estadístico
z que corresponda al nivel de confianza elegido. El nivel de confianza de 95%
corresponde al valor z de 1.96, y el nivel de confianza de 99%, a un valor z de 2.58. Note
que las muestras más grandes (con su consecuente requerimiento de más tiempo y dinero
para recolectarlas) corresponden a niveles de confianza más altos. Asimismo, observe que
utilizamos un estadístico z.

El tercer factor en la determinación del tamaño de una muestra es la desviación estándar


de la población. Si la población se encuentra muy dispersa, se requiere una muestra
grande. Por el contrario, si se encuentra concentrada (homogénea), el tamaño de muestra
que se requiere será menor. No obstante, puede ser necesario utilizar un estimador de la
desviación estándar de la población. He aquí algunas sugerencias para determinar dicho
estimador.

1. Realice un estudio piloto. Éste es el método más común. Suponga que desea un
cálculo aproximado de la cantidad de horas que trabajan a la semana los estudiantes
matriculados en la Facultad de Administración de la University of Texas. Para probar la
validez del cuestionario, se aplica a una pequeña muestra de estudiantes. A partir de esta
pequeña muestra se calcula la desviación estándar de la cantidad de horas que trabajan y
se utiliza este valor como la desviación estándar de la población.

2. Utilice un estudio comparativo. Aplique este enfoque cuando se encuentre disponible


un estimador de la dispersión de otro estudio. Suponga que quiere calcular la cantidad de
horas semanales que trabajan los recolectores de basura. La información de ciertas
dependencias estatales o federales que normalmente estudian la fuerza de trabajo puede
ser útil para obtener un cálculo aproximado de la desviación estándar.

3. Emplee un enfoque basado en el intervalo. Para aplicar este enfoque necesita conocer
o contar con un cálculo de los valores máximo y mínimo de la población. Recuerde, del
capítulo 3, en el que se explicó la regla empírica, que se podía esperar que casi todas las
observaciones se encontraran a más o menos 3 desviaciones estándares de la media, si la
10

distribución seguía la distribución normal. Por consiguiente, la distancia entre los valores
máximo y mínimo es de 6 desviaciones estándares. Puede calcular la desviación estándar
como un sexto del rango. Por ejemplo, la directora de operaciones del University Bank
desea un cálculo aproximado del número de cheques que expiden cada mes los estudiantes
universitarios. Ella cree que la distribución del número de cheques es normal. La cantidad
mínima de cheques expedidos cada mes es de 2, y la máxima, de 50. El rango de la
cantidad de cheques que se expiden por mes es de 48, que se determina al restar 50 - 2.
El estimador de la desviación estándar es entonces de 8 cheques mensuales: 48/6.

Tamaño de la muestra para calcular una media poblacional

Para calcular una media poblacional, se puede expresar la interacción entre estos tres
factores y el tamaño de la muestra se expresa con la fórmula siguiente. Note que esta
fórmula es el margen de error que se utiliza para calcular los puntos extremos de los
intervalos de confianza para estimar una media poblacional.

donde:

n es el tamaño de la muestra.

z es el valor normal estándar correspondiente al nivel de confianza deseado.

es la desviación estándar de la población.

E es el error máximo admisible.

El resultado de este cálculo no siempre es un número entero. Cuando el resultado no es


un entero, se acostumbra redondear cualquier resultado fraccionario. Por ejemplo, 201.21
se redondearía a 202.

Tamaño de la muestra para calcular la proporción de una población

Para determinar el tamaño de la muestra en el caso de una proporción, es necesario


especificar estas mismas tres variables:

1. El margen de error.

2. El nivel de confianza deseado.

3. La variación o dispersión de la población a estudiar.

En el caso de la distribución binomial, el margen de error es:


11

Si se resuelve la ecuación para despejar n se obtiene lo siguiente:

donde:

n es el tamaño de la muestra.

z es el valor normal estándar correspondiente al nivel de confianza deseado.

es la proporción de la población.

E es el máximo error tolerable.

Las elecciones del estadístico z y el margen de error E son las mismas que para calcular
la media poblacional. Sin embargo, en este caso la desviación estándar de la población de
una distribución normal está representada por (1 ). Para encontrar el valor de una
proporción de la población, podemos hallar un estudio similar o conducir un estudio
piloto. Si no se puede encontrar un valor confiable, entonces se debe usar un valor de de
0.50. Observe que (1 ) tiene el mayor valor utilizando 0.50 y, por lo tanto, sin una buena
estimación de la proporción de la población, se sobrestima el tamaño de la muestra. Esta
diferencia no afectará el estimador de la proporción de la población.

Factor de corrección de una población finita

Las poblaciones de las que se han tomado muestras hasta ahora han sido muy grandes o
infinitas. ¿Qué sucedería si la población de la que se toma la muestra no fuera muy
grande? Es necesario realizar algunos ajustes en la forma de calcular el error estándar de
las medias muéstrales y del error estándar de las proporciones muéstrales.

Una población con un límite superior es finita. Por ejemplo, hay 12 179 estudiantes en la
matrícula de la Eastern Illinois University; hay 40 empleados en Spence Sprockets;
Chrysler ensambló 917 Jeeps Wrangler en la planta de Alexis Avenue el día de ayer; o
había 65 pacientes programados para cirugía en St. Rose Memorial Hospital en Sarasota
el día de ayer. Una población finita puede ser muy pequeña; puede constar de todos los
12

estudiantes registrados para este curso. También puede ser muy grande, como todas las
personas de la tercera edad que viven en Florida.

En el caso de una población finita, en la que el número total de objetos o individuos es N


y el número de objetos o individuos incluidos en la muestra es n, es necesario ajustar los
errores muestrales en las fórmulas de los intervalos de confianza. En otras palabras, para
determinar el intervalo de confianza de la media, se ajusta el error estándar de la media
en las fórmulas (9-1) y (9-2). Si quiere determinar el intervalo de confianza de una
proporción, necesita ajustar el error estándar de la proporción en la fórmula (9-3).

Este ajuste recibe el nombre de factor de corrección de una población finita. Con
frecuencia se le abrevia FCP, el cual es:

Pruebas de hipótesis de una muestra

Una hipótesis es una declaración relativa a una población. A continuación, se utilizan los
datos para verificar lo razonable del enunciado.

En el análisis estadístico se establece una afirmación, una hipótesis, se recogen datos que
posteriormente se utilizan para probar la aserción. Entonces, una hipótesis estadística es:
Afirmación relativa a un parámetro de la población sujeta a verificación.

El término prueba de hipótesis y probar una hipótesis se utilizan indistintamente. La


prueba de hipótesis comienza con una afirmación, o suposición, sobre un parámetro de la
población, como la media poblacional.

Prueba de hipótesis Procedimiento basado en evidencia de la muestra y la teoría de la


probabilidad para determinar si la hipótesis es una afirmación razonable.
13

Cinco pasos para probar una hipótesis

Paso 1: Se establece la hipótesis nula (H0) y la hipótesis alternativa (H1)

El primer paso consiste en establecer la hipótesis que se debe probar. Ésta recibe el
nombre de hipótesis nula, la cual se designa H0, y se lee “H subíndice cero”. La letra
mayúscula H representa la hipótesis, y el subíndice cero implica que “no hay diferencia”.
Por lo general se incluye un término no en la hipótesis nula, que significa que “no hay
cambio”.

Hipótesis nula Enunciado relativo al valor de un parámetro poblacional que se formula


con el fin de probar evidencia numérica.

La hipótesis alternativa describe lo que se concluirá si se rechaza la hipótesis nula. Se


representa H1 y se lee “H subíndice uno”. También se le conoce como hipótesis de
investigación.

La hipótesis alternativa se acepta si la información de la muestra ofrece suficiente


evidencia estadística para rechazar la hipótesis nula.

Paso 2: Se selecciona un nivel de significancia

Nivel de significancia es la probabilidad de rechazar la hipótesis nula cuando es


verdadera.

Se acostumbra elegir el nivel de 0.05 en el caso de los proyectos de investigación


relacionados con los consumidores; el nivel de 0.01 en relación con el del control de
calidad, y el de 0.10 en el de las encuestas políticas. Usted, como investigador, debe elegir
el nivel de significancia antes de formular una regla de decisión y recopilar los datos de
la muestra.

Paso 3: Se selecciona el estadístico de prueba


14

Estadístico de prueba valor, determinado a partir de la información de la muestra, para


determinar si se rechaza la hipótesis nula.

Paso 4: Se formula la regla de decisión

Una regla de decisión es un enunciado sobre las condiciones específicas en que se rechaza
la hipótesis nula y aquellas en las que no se rechaza. La región o área de rechazo define
la ubicación de todos esos valores que son tan grandes o tan pequeños que la probabilidad
de que ocurran en una hipótesis nula verdadera es muy remota.

Valor crítico Punto de división entre la región en que se rechaza la hipótesis nula y
aquella en la que se acepta.

Paso 5: Se toma una decisión

El quinto y último paso en la prueba de hipótesis consiste en calcular el estadístico de la


prueba, comparándola con el valor crítico, y tomar la decisión de rechazar o no la
hipótesis nula.

Pruebas de significancia de una y dos colas

En la gráfica 10-1 se describe una prueba de una cola. La región de rechazo se localiza
sólo en la cola derecha (superior) de la curva. Por ejemplo, suponga que el departamento
de empaque de General Foods Corporation se preocupa porque algunas cajas de Grape
Nuts exceden considerablemente el peso. El cereal se empaca en cajas de 453 gramos,
por lo que la hipótesis nula es H0: µ ≤ 453, que se lee: “la media poblacional (µ) es igual
o menor que 453”. Por consiguiente, la hipótesis alternativa es H0: ˃ 453, que se lee: “µ
15

es mayor que 453”. Observe que la condición de igualdad siempre aparece en H0 y jamás
en H1.

La gráfica 10-2 representa un caso en el que la región de rechazo se encuentra en la cola


izquierda (inferior) de la distribución normal. Como ejemplo, considere el problema de
los fabricantes de automóviles. Por ejemplo, las grandes compañías de renta de autos y
otras empresas que compran grandes cantidades de neumáticos desean que duren un
promedio de

60 000 millas en condiciones normales. Por consiguiente, rechazarán un envío de


neumáticos si las pruebas revelan que la vida de éstas es mucho menor a 60 000 millas
en promedio. Con gusto aceptarán el envío si la vida media es mayor a 60 000 millas.

En este caso, las hipótesis nula y alternativa se escriben H0: µ ≥ 60 000 y H1: µ ˂ 60 000.

Una manera para determinar la ubicación de la región de rechazo consiste en mirar en la


dirección en la que señala el signo de desigualdad en la hipótesis alternativa ( ≥ o ≤ ). En
este problema, señala a la izquierda, y, por consiguiente, la región de rechazo se localiza
en la cola izquierda.

En resumen, una prueba es de una cola cuando la hipótesis alternativa, H1, indica una
dirección, como:

H0: el ingreso medio anual de las corredoras de bolsa es menor o igual a $65 000.

H1: el ingreso medio anual de las corredoras de bolsa es mayor a $65 000 anuales.

Si no se especifica dirección alguna en la hipótesis alternativa, utilice una prueba de dos


colas.Si cambia el problema anterior con fines de ilustración, puede decir lo siguiente:
16

H0: el ingreso medio anual de las corredoras de bolsa es de $65 000 anuales.

H1: el ingreso medio anual de las corredoras de bolsa no es igual a $65 000 anuales.

Si se rechaza la hipótesis nula y se acepta H1 en el caso de las dos colas, el ingreso medio
puede ser significativamente mayor o inferior a $65 000 anuales. Para dar cabida a estas
dos posibilidades, el área de 5% de rechazo se divide con equidad en las dos colas de la
distribución muestral (2.5% cada una).

Pruebas de la media de una población: se conoce la desviación estándar


poblacional
Jamestown Steel Company fabrica y arma escritorios y otros muebles para oficina en
diferentes plantas en el oeste del estado de Nueva York. La producción semanal del
escritorio modelo A325 en la planta de Fredonia tiene una distribución normal, con una
media de 200 y una desviación estándar de 16. Hace poco, con motivo de la expansión
del mercado, se introdujeron nuevos métodos de producción y se contrató a más
empleados. El vicepresidente de fabricación pretende investigar si hubo algún cambio en
la producción semanal del escritorio modelo A325. En otras palabras, ¿la cantidad media
de escritorios que se produjeron en la planta de Fredonia es diferente de 200 escritorios
semanales con un nivel de significancia de 0.01?

Paso 1: Se establecen las hipótesis nula y alternativa. La hipótesis nula es: “la media de
la población es de 200”. La hipótesis alternativa es: “la media es diferente de 200” o “la
media no es de 200”. Estas dos hipótesis se expresan de la siguiente manera:
17

H0: µ = 200

H1: µ ≠ 200

Ésta es una prueba de dos colas, pues la hipótesis alternativa no indica dirección alguna.
En otras palabras, no establece si la producción media es mayor o menor a 200. El
vicepresidente sólo desea saber si la tasa de producción es distinta de 200.

Paso 2: Se selecciona el nivel de significancia. Como ya se indicó, se utiliza el nivel de


significancia de 0.01. Éste es α, la probabilidad de cometer un error tipo I, que es la
probabilidad de rechazar una hipótesis nula verdadera.

Paso 3: Se selecciona el estadístico de prueba. El estadístico de prueba de una muestra


grande es z. La transformación de los datos de producción en unidades estándares (valores
z) permite que se les utilice no sólo en este problema, sino en otros relacionados con la
prueba de hipótesis.

Paso 4: Se formula la regla de decisión. La regla de decisión se formula al encontrar los


valores críticos de z con ayuda del apéndice B.1. Como se trata de una prueba de dos
colas, la mitad de 0.01, o 0.005, se localiza en cada cola. Por consiguiente, el área en la
que no se rechaza H0, que se ubica entre las dos colas, es 0.99.El apéndice B.1 se basa en
la mitad del área bajo la curva, o 0.5000. Entonces, 0.50000-0.0050 es 0.4950, por lo que
0.4950 es el área entre 0 y el valor crítico. Se localiza 0.4950 en el cuerpo de la tabla. El
valor más cercano a 0.4950 es 0.4951. En seguida se lee el valor crítico en el renglón y
columna correspondientes a 0.4951. Éste es de 2.58. Por conveniencia, se repite el
apéndice B.1, Áreas

bajo la curva normal, en la tercera de forros.


18

Por lo tanto, la regla de decisión es: rechazar la hipótesis nula y aceptar la hipótesis
alternativa (que indica que la media de la población no es 200) si el valor z calculado no
se encuentra entre 2.58 y -2.58. La hipótesis nula no se rechaza si z se ubica entre 2.58 y
-2.58.

Paso 5: Se toma una decisión y se interpreta el resultado. Se toma una muestra de la


población (producción semanal), se calcula z, se aplica la regla de decisión y se llega a la
decisión de rechazar o no H0. La cantidad media de escritorios que se produjeron el año
pasado (50 semanas, pues la planta cerró 2 semanas por vacaciones) es de 203.5. La
desviación estándar de la población es de 16 escritorios semanales. Al calcular el valor z
a partir de la fórmula (, se obtiene:

Como 1.55 no cae en la región de rechazo, H0 no se rechaza. La conclusión es: la media


de la población no es distinta de 200. Por lo tanto, se informa al vicepresidente de
fabricación que la evidencia de la muestra no indica que la tasa de producción en la planta
de Fredonia haya cambiado de 200 semanales. La diferencia de 3.5 unidades entre la
producción semanal histórica y la del año pasado puede atribuirse razonablemente al error
de muestreo. Esta información se resume en el siguiente diagrama:
19

Prueba de una cola

Para ilustrar la prueba de una cola, suponga que el vicepresidente desea saber si hubo un
incremento de la cantidad de unidades que se armaron. ¿Puede concluir, debido al
mejoramiento de los métodos de producción, que la cantidad media de escritorios que se
ensamblaron en las pasadas 50 semanas fue superior a 200? Observe la diferencia al
formular el problema. En el primer caso deseaba conocer si había una diferencia en la
cantidad media armada; en cambio, ahora desea saber si hubo un incremento. Como se
investigan diferentes cuestiones, se plantea la hipótesis de otra manera. La diferencia más
importante se presenta en la hipótesis alternativa. Antes se enunció la hipótesis alternativa
como “diferente de”; ahora se enuncia como “mayor que”. En símbolos:

Los valores críticos en una prueba de una cola son diferentes a los de una prueba de dos
colas en el mismo nivel de significancia. En el ejemplo anterior, se dividió el nivel de
significancia a la mitad y se colocó una mitad en la cola inferior y la otra en la cola
superior. En una prueba de una cola, toda la región de rechazo se coloca en una cola. Vea
la gráfica 10-5. En el caso de la prueba de una cola, el valor crítico es de 2.33, que se
calcula:

1) se resta 0.01 de 0.5000 y

2) se determina el valor z correspondiente a 0.4900.


20

Valor p en la prueba de hipótesis

Cuando se desea probar una hipótesis, se compara el estadístico de la prueba con un valor
crítico. Se toma la decisión de rechazar la hipótesis nula o de no hacerlo. Así, por ejemplo,
si el valor crítico es de 1.96 y el valor calculado del estadístico de prueba es de 2.19, la
decisión consiste en rechazar la hipótesis nula.

En años recientes, debido a la disponibilidad del software de computadora, con frecuencia


se da información relacionada con la seguridad del rechazo o aceptación. Es decir, ¿cuánta
confianza hay en el rechazo de la hipótesis nula? Este enfoque indica la probabilidad (en
el supuesto de que la hipótesis nula sea verdadera) de obtener un valor del estadístico de
la prueba por lo menos tan extremo como el valor real que se obtuvo. Este proceso
compara la probabilidad, denominada valor p, con el nivel de significancia. Si el valor p
es menor que el nivel de significancia, H0 se rechaza. Si es mayor que el nivel de
significancia, H0 no se rechaza.

La determinación del valor p no sólo da como resultado una decisión respecto de H0, sino
que brinda la oportunidad de observar la fuerza de la decisión. Un valor p muy pequeño,
como 0.0001, indica que existe poca probabilidad de que H0 sea verdadera. Por otra parte,
un valor p de 0.2033 significa que H0 no se rechaza y que existe poca probabilidad de
que sea falsa. ¿Cómo calcular el valor p? Para ilustrarlo se recurre al ejemplo en el que
se probó la hipótesis nula relativa a que la cantidad de escritorios producidos a la semana
en Fredonia fue de 200. No se rechazó la hipótesis nula, pues el valor z de 1.55 cayó en
la región comprendida entre 2.58 y 2.58. Se decidió no rechazar la hipótesis nula si el
valor calculado de z caía en esta región. La probabilidad de hallar un valor z de 1.55 o
21

más es de 0.0606, que se calcula mediante la diferencia de 0.5000 0.4394. En otras


palabras, la probabilidad de obtener una mayor de 203.5 si 200 es de 0.0606. Para calcular
el valor p, es necesario concentrarse en la región menor a 1.55, así como en los valores
superiores a 1.55 (pues la región de rechazo se localiza en ambas colas). El valor p de dos
colas es de 0.1212, que se calcula así: 2(0.0606). El valor p de 0.1212 es mayor que el
nivel de significancia de 0.01 que se estableció al inicio, así que no se rechaza H0. En la
siguiente gráfica se muestran los detalles. En general, el área se duplica en una prueba de
dos colas. Entonces, el valor p se compara con facilidad con el nivel de significancia. Se
aplica la misma regla de decisión en el caso de una prueba de una cola.

Un valor p es una manera de expresar la probabilidad de que H0 sea falsa. Pero, ¿cómo
interpretar un valor p? Ya se mencionó que si el valor p es menor que el nivel de
significancia, se rechaza H0; si es mayor que el nivel de significancia, no se la rechaza.
Asimismo, si el valor p es muy grande, es probable que H0 sea verdadera. Si el valor p es
pequeño, es probable que H0 no lo sea. El siguiente recuadro permite interpretar los
valores p.

Ejemplo:

En el momento en que fue contratada como mesera en el Grumney Family Restaurant, a


Beth Brigden le dijeron: “Puedes ganar en promedio más de $80 al día en propinas.”
22

Suponga que la desviación estándar de la distribución de población es de $3.24. Los


primeros 35 días de trabajar en el restaurante, la suma media de sus propinas fue de $82.
Con el nivel de significancia de 0.01, ¿la señorita Brigden puede concluir que gana un
promedio de más de $80 en propinas?

Establezca la hipótesis nula y la hipótesis alternativa

Ho: u <= 80

H1: u > 80

b) Cuál es la regla de decisión?

se rechaza Ho si Zc > Zt es decir se rechaza si Zc > 2,33

c) Cuál es el valor del estadístico de prueba?

Zc = (x –u)/(σ/Ѵn) = (82 - 80)/(2/Ѵ35) = 3,65

Prueba de la media poblacional: desviación estándar de la población desconocida

En el ejemplo anterior se conocía σ, la desviación estándar de la población. No obstante,


en la mayoría de los casos, la desviación estándar de la población es desconocida. Por
consiguiente, σ debe basarse en estudios previos o calcularse por medio de la desviación
estándar de la muestra, s. La desviación estándar poblacional en el siguiente ejemplo no
se conoce, por lo que se emplea la desviación estándar muestral para estimar σ.

Para determinar el valor del estadístico de la prueba utilice la distribución t y modifique


la fórmula (10.1) de la siguiente manera:

con n - 1 grados de libertad, donde:

X representa la media de la muestra.

µ, la media poblacional hipotética.

s, la desviación estándar de la muestra.

n, el número de observaciones incluidas en la muestra.


23

La longitud media de una pequeña barra de contrapeso es de 43 milímetros. Al supervisor


de producción le preocupa que hayan cambiado los ajustes de la máquina de producción
de barras. Solicita una investigación al departamento de ingeniería, que selecciona una
muestra aleatoria de 12 barras y las mide. Los resultados aparecen en seguida, expresados
en milímetros.

¿Es razonable concluir que cambió la longitud media de las barras? Utilice el nivel de
significancia 0.02.

Primero formule la hipótesis nula y la hipótesis alternativa.

H0: µ = 43

H1: µ ≠ 43

La hipótesis alternativa no señala una dirección, así que se trata de una prueba de dos
colas. Hay 11 grados de libertad, que se calculan por medio de n - 1 = 12 - 1 = 11. El
valor t es de

2.718, que se determina con el apéndice B.2 en el caso de una prueba de dos colas con un
nivel de significancia de 0.02 y 11 grados de libertad. La regla de decisión es: se rechaza
la hipótesis nula si el valor calculado de t se localiza a la izquierda de -2.718 o a la derecha
de

2.718. Esta información se resume en la gráfica 10-7.


24

Se calcula la desviación estándar de la muestra con la fórmula (3-11). La media, es de


41.5 milímetros, y la desviación estándar, s, 1.784 milímetros. Los detalles aparecen en
la tabla 10-2.

Ahora puede calcular el valor de t con la fórmula

La hipótesis nula que afirma que la media poblacional es de 43 milímetros se rechaza


porque

el valor calculado de t de -2.913 se encuentra en el área a la izquierda de -2.718. Se


acepta la hipótesis alternativa y se concluye que la media poblacional no es de 43
milímetros. La máquina está fuera de control y necesita algunos ajustes.

S-ar putea să vă placă și