Sunteți pe pagina 1din 26

1

Universidad Nororiental Privada “Gran Mariscal de Ayacucho”


Estadística II
Competencia Específica N° 2: Inferencia Estadística

Introducción a la Inferencia Estadística

La inferencia estadística es el conjunto de métodos y técnicas que permiten


inducir, a partir de la información empírica proporcionada por una muestra,
cual es el comportamiento de una determinada población con un riesgo de
error medible en términos de probabilidad.

Los métodos paramétricos de la inferencia estadística se pueden dividir,


básicamente, en dos: métodos de estimación de parámetros y métodos de
contraste (pruebas) de hipótesis. Ambos métodos se basan en el
conocimiento teórico de la distribución de probabilidad del estadístico
muestral que se utiliza como estimador de un parámetro.

ESTIMACIÓN DE PARÁMETROS

La estimación de parámetros, que a su vez se divide en dos partes:


Estimación Puntual y Estimación por Intervalos de Confianza. La Estimación
Puntual consiste en asignar un valor concreto al parámetro o parámetros que
caracterizan la distribución de probabilidad de la población. Cuando se
estima un parámetro poblacional, aunque el estimador que se utiliza posea
todas las propiedades deseables, se comete un error de estimación que es la
diferencia entre la estimación y el verdadero valor del parámetro. El error
de estimación es desconocido por lo cual es imposible saber en cada caso
cual ha sido la magnitud o el signo del error; para valorar el grado de
precisión asociado con una estimación puntual se parte de dicha estimación
para construir un intervalo de confianza.

Anteriormente vimos cómo manejar información de muestras aleatorias


tomadas de una población conocida; pero lo más importante es inferir
información sobre la población a partir de muestras suyas. Eso es lo que se
conoce como estimación.

A un valor calculado con los datos de una muestra se le llama


ESTADÍSTICO. A la estadística que se usa para predecir el valor de un
parámetro de la población se le llama ESTIMADOR; si para estimar el
parámetro se usa un valor único dicho estimador es llamado ESTIMADOR
PUNTUAL.
2

Propiedades de los estimadores puntuales

1. Insesgo: Si el valor esperado del estadístico muestral es igual al parámetro


poblacional que se estima, se dice que ese estadístico es un estimador
insesgado del parámetro poblacional.
Por consiguiente, el valor esperado o media de todos los valores posibles de
un estadístico insesgado es igual al parámetro poblacional que se
estima. En el caso de un estimador sesgado, se tiene una gran
probabilidad de sobreestimar o subestimar el parámetro poblacional.
A continuación se presentan algunos estimadores insesgado:
 La proporción muestral ( p̂ ) como estimador de la proporción poblacional
(p)
 La media muestral ( X ) como estimador del valor esperado poblacional
(µ)
 La varianza de la muestra (S ) como estimador de la varianza de la
2

población (σ2)
Sin embargo, puede demostrarse que la desviación estándar muestral es un
estimador sesgado de la desviación estándar poblacional; para muestras
grandes, este sesgo es poco significativo. Esa es la razón por la cual al
encontrar una desviación estándar muestral se divide por n-1 y no por n, ya
que lo último haría que el estimador fuese sesgado porque tendería a
subestimar un poco la varianza poblacional.
2. Eficiencia: Si se tienen dos estimadores puntuales para estimar un mismo
parámetro poblacional, se prefiere usar el estimador con la menor
desviación estándar porque tiende a proporcionar estimados más cercanos al
parámetro. Al tomar muestras de una población con distribución normal, la
desviación estándar de las medias muestrales es menor que la de las
medianas muestrales. Por consiguiente, la media muestral es más eficiente
que la mediana muestral.
3. Consistencia: Un estimador puntual es consistente si sus valores tienden a
acercarse al parámetro poblacional conforme se incrementa el tamaño de la
muestra. Se puede afirmar que la media de la muestra es un estimador
consistente de la media poblacional y que la proporción muestral es un
estimador consistente de la proporción poblacional.
Una estimación puntual no proporciona información sobre la variabilidad
inherente del estimador. En consecuencia, se opta por un segundo método
de estimación denominado estimación por intervalos, que indica la precisión
de una estimación; dicha idea de precisión es definida por el error estándar.

ESTIMACIÓN POR INTERVALO DE CONFIANZA:


3

Un intervalo de confianza está formado por un conjunto de valores


numéricos tal que la probabilidad de que éste contenga al verdadero valor
del parámetro puede fijarse tan grande como se quiera. Esta probabilidad
se denomina grado de confianza (o nivel de confianza: 1 - α) del intervalo, y
la amplitud de éste constituye una medida del grado de precisión con el que
se estima el parámetro.

“Una estimación por intervalo indica un rango dentro del cual se espera
encontrar el valor de algún parámetro”. El intervalo que se estime
recibe el nombre de intervalo de confianza.

Un intervalo de confianza se expresa mediante dos valores: L (límite


inferior) y U (límite superior), de tal manera que la siguiente
proposición de probabilidad es verdadera:

P( L    U )  1  

Donde α es un número entre 0 y 1 (preferiblemente pequeño).

El intervalo de confianza resultante se conoce como intervalo de confianza


de 100(1-α) % para el parámetro desconocido θ. Las cantidades L y
U reciben los nombres de límites de confianza inferior y
superior, respectivamente, y 1-α es el nivel de confianza.

Se tiene una probabilidad de 1 – α de seleccionar una muestra que produzca


un intervalo que contiene el valor verdadero de θ.

Interpretación de un intervalo de confianza: Si se recopila un número


infinito de muestras aleatorias y se calcula un intervalo de confianza del
100(1 – α)% para θ para cada una de las muestras, entonces el 100(1 – α)%
de esos intervalos contiene el verdadero valor de θ.
4

En la práctica se obtiene sólo una muestra aleatoria y se calcula un intervalo


de confianza. Puesto que ese intervalo puede o no contener el valor
verdadero de θ, no es razonable asociar un nivel de probabilidad a este
evento específico. La proposición adecuada es que el intervalo observado
[l,u] contiene el verdadero valor de θ con una confianza de 100(1-α). Esta
proposición tiene una interpretación de frecuencia, es decir, no se sabe si
es correcta para la muestra en particular, pero el método usado para
obtener ese intervalo proporciona proposiciones correctas el 100(1-α) % de
las veces.

En algunas ocasiones, puede resultar más apropiado un intervalo de


confianza unilateral.
Un intervalo de confianza unilateral inferior del 100(1-α) para θ está dado
por el intervalo
L 

Donde el límite de confianza L se elige de modo que

P (L   )  1  

De manera similar, un intervalo de confianza unilateral superior para θ está


dado por

 U

Y el límite U se escoge de modo que

P (  U )  1  

Entre más amplio sea el intervalo de confianza, mayor es la seguridad de que


realmente el intervalo contenga el verdadero valor de θ, pero menor
información se tiene acerca de ese valor. Lo ideal es, entonces, un intervalo
de confianza relativamente pequeño con una confianza grande, lo que se
logra aumentando el tamaño de la muestra evaluada.
En esta unidad se presentan métodos para encontrar intervalos de
confianza para medias, varianzas y proporciones.

1. ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN (µ),


muestras grandes(n >= 30) o muestras pequeñas (n < 30)
A. Varianza o desviación estándar conocida: Este caso que se plantea es
más a nivel teórico que práctico porque difícilmente vamos a poder conocer
5

con exactitud mientras que µ es desconocido. Sin embargo nos aproxima


del modo más simple a la estimación de medias.
Para estimar µ, el estadístico que mejor nos va a ayudar es , del que
conocemos su distribución muestral (referenciada en la unidad anterior).
Este es el modo más conveniente para hacer una estimación: Buscar una
relación en la que intervengan el parámetro desconocido junto con su
estimador, de modo que estos se distribuyan según una ley de probabilidad
que es bien conocida y a ser posible tabulada.
De este modo, fijado α (valor arbitrario y cercano a 1), se toma un intervalo
que contenga una masa de probabilidad de 1 - α. Lo ideal es que este
intervalo sea lo más pequeño posible; por ello lo mejor es tomarlo simétrico
con respecto a la media ya que allí es donde se acumula más masa en una
distribución normal. Así, las dos colas de la distribución (zonas más alejadas
de la media) tendrán áreas iguales.

P (  Z / 2  Z  Z / 2 )  1  

X   
Como Z   X  Z / 2    X  Z / 2
/ n n n

Si la muestra tomada es grande y se desconoce σ, un procedimiento


aceptable consiste en reemplazar σ por el valor calculado de la desviación
estándar muestral (S).
S S
X  Z / 2    X  Z / 2
n n

Ejemplo 1
La empresa que produce ciertos chips asegura que estos soportan, en
promedio, 50 horas de funcionamiento, con una desviación estándar de 3
horas y una distribución aproximadamente normal. Para verificar esa
6

información, otra empresa que utiliza esos chips en grandes cantidades tomó una
muestra aleatoria de 25 unidades y registró sus tiempos de duración; las observaciones
fueron:
41,3 49,2 48,9 43,2 52,0 41,5 51,2 46,1 49,3 49,2 44,7 43,4 50,0
46,8 45,0 46,7 48,8 47,7 51,5 49,8 44,0 49,6 51,0 47,5 51,2
Construir un intervalo de confianza del 95% para μ, si se supone que la
desviación estándar de la población es la proporcionada por la empresa
vendedora.

Tamaño de la muestra para estimar parámetros poblacionales

Algo muy importante es la elección del tamaño apropiado de la muestra que


se ha de tomar, porque si es demasiado grande se desperdicia tiempo y
dinero y si es muy pequeña, las conclusiones resultantes no son muy
confiables.
Si se quiere establecer qué tan grande debe ser una muestra para asegurar
que el error al estimar μ sea menor a un error predeterminado, debe
despejarse n del intervalo de confianza, teniendo en cuenta que el error es
la parte que se suma o resta de la media muestral. Por lo tanto:
2
Z  
n   /2 
 e 

De esa relación, puede deducirse que:


 A medida que disminuye la longitud del intervalo (2e), el tamaño
requerido de la muestra (n) aumenta para un valor fijo de σ y una
confianza especificada.
 A medida que σ aumenta, el tamaño requerido de la muestra aumenta
para una longitud deseada y una longitud especificada. Dicho de otra
forma, si la población tiene una dispersión grande se requerirá una
muestra mayor que si la población es homogénea.
 Conforme aumenta el nivel de confianza, el tamaño requerido de la
muestra aumenta para una longitud fija deseada y una desviación
estándar determinada.

Ejemplo 2
¿Qué tan grande se requiere una muestra en el ejemplo 1, si queremos tener
95% de confianza de que el error de estimación no excederá de 0.5 horas?

En algunas situaciones puede que lo importante sea plantear un límite


superior para μ o un límite inferior para ella, pero no ambos.
7

Es posible obtener intervalos de confianza unilaterales para μ haciendo


l   o u   y reemplazando Z / 2 por Zα.
El intervalo de confianza superior del 100(1-α) % para μ es:

  X  Z / n

Y el intervalo de confianza inferior del 100(1-α) % para μ es:

X  Z / n  

Ejemplo 3
Determine los intervalos de confianza inferior y superior de 95% para μ en
el ejercicio 1.
El intervalo de confianza superior de 95% para μ es:

1.645 * 3
  47.58     48.57 Horas
5

El intervalo de confianza inferior de 95% para μ es:

1.645 * 3
  47.58     46.59 Horas
5

2. ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN (µ),


muestras pequeñas (n < 30)
B. Varianza o desviación estándar poblacional desconocida: Como se ha
mencionado, el caso anterior se presentará poco en la práctica, ya que lo
usual es que el valor exacto de los parámetros µ y no sean conocidos; de
lo contrario, no interesaría en buscar intervalos de confianza para ellos.
Cuando el tamaño de la muestra es pequeño debe emplearse otro
procedimiento. Para producir un intervalo de confianza válido debe hacerse
una hipótesis más fuerte con respecto a la población de interés y es que ella
está distribuida normalmente. Esto conduce a intervalos de confianza
basados en la distribución t de Student, que es una distribución continua
que tiene una forma muy similar a la distribución normal estándar (tiene
forma de campana y es simétrica con una media de 0); una distribución t
específica depende de un parámetro llamado grados de libertad, que para
efectos de esta unidad equivale a n – 1. A medida que aumenta la cantidad
de grados de libertad, la diferencia entre la distribución t y la distribución
normal estándar se hace más y más pequeña.
8

Si se asume que la población está distribuida normalmente los intervalos de


confianza se basan en la distribución t de Student.
Cuando se revisaron las distribuciones muestrales se determinó que

X 
T  Con n – 1 grados de libertad.
S/ n

Si se escoge un intervalo central en la distribución t, -t α/2,n-1 y tα/2,n-1 son los


puntos críticos y, por lo tanto:

P (t / 2, n 1  T  t / 2, n 1 )  1  
De allí se obtiene un intervalo de confianza dado por:

s s
X  t / 2 , n 1    X  t / 2, n 1
n n

Ejemplo 4
Se va a considerar un programa de adiestramiento en cierta empresa; su
director de manufactura desea contar con un software determinado para
adiestrar a los empleados de mantenimiento en las operaciones de
reparación de máquinas. Se estima que con el software se reduzca el tiempo
necesario para el adiestramiento; para evaluarlo, el director de manufactura
pide un estimado del tiempo promedio de adiestramiento necesario con el
programa.
La gerencia aceptó adiestrar a 15 empleados con el nuevo método. A
continuación se ven los días necesarios de adiestramiento por cada
empleado de la muestra:
19 26 22 15 18 23 12 16 19 21 15 14 18 26 21
Estime el promedio poblacional con una confianza de 90% y con una de 95%.
9

Así, se tiene una confianza del 90% que el promedio poblacional de tiempo
de adiestramiento de los empleados esta entre 17.13 a 20.87 días.

Haciendo un cálculo similar se obtiene que el estimado para el promedio


poblacional con un nivel de confianza de 95% está entre 16.7 y 21.3 días.

Lo anterior demuestra que, a mayor nivel de confianza, mayor amplitud


del intervalo de confianza y, por ende, menor precisión en la
estimación.

Para determinar el tamaño apropiado de la muestra a utilizar es necesario


encontrar una estimación preliminar de la desviación estándar de la
población. Una forma posible consiste en disponer de la dispersión de otro
estudio relacionado (obviamente, si se considera confiable); el método más
común para hacerlo consiste en la realización de un estudio piloto, basado en
la utilización de una muestra a la cual se le determina su desviación
estándar y ese valor es usado para determinar el tamaño apropiado de la
muestra.

El tamaño de la muestra para estimar una media poblacional es:


2
Z  
n    /2  (Si la población es infinita o muy grande)
 e 

Z 2 2 N
ó n (si la población es finita)
( N  1)e 2  z 2 2

Ejemplo 5
En el caso del ejemplo 4, ¿De qué tamaño debe ser una muestra para poder
tener el 95% de confianza de que el error muestral sea de 1,5 o menor?
Suponga que la desviación estándar hallada para la muestra es una buena
aproximación para la poblacional.

3. ESTIMACIÓN DE LA PROPORCIÓN POBLACIONAL (p)

Un estimador puntual para la proporción de la población se encuentra al


dividir el número de éxitos en la muestra entre el número de elementos que
se muestrearon ( pˆ  x / n ).
10

Recuerde que n y p son los parámetros de una distribución binomial. Se sabe


también que p̂ tiene una distribución aproximadamente normal con

pˆ  p
Z 
pq
n

Si se conocen p y q no tendría sentido hacer una estimación, pero estas se


pueden sustituir por los respectivos estadísticos muestrales, así:

Por consiguiente, un intervalo de confianza para p está dado por:

pˆ qˆ pˆ qˆ
pˆ  Z / 2  p  pˆ  Z / 2
n n

Se debe tener presente que lo anterior es razonable si np y nq son mayores


o iguales a 5.
Un uso práctico al construir un intervalo de confianza basado en la
información de una muestra se basa en la comparación de dicho valor con el
valor propuesto para el parámetro poblacional; si el valor propuesto está
dentro del intervalo, se llega a la conclusión de que el valor propuesto puede
ser verdadero.

Ejemplo 6
Se sigue con el software planteado en el problema 4. Para evaluar el
programa desde una perspectiva diferente, la gerencia ha pedido
determinar alguna medida de la calidad del programa; para ello, se pensó en
un examen practicado al final del adiestramiento. Se tiene una muestra de
45 empleados que se puede usar para establecer un estimado para la
proporción de empleados que aprueban el examen.
De los 45 empleados, 36 aprobaron el examen. Construya un intervalo del
90% de confianza para la proporción poblacional.

En este caso tiene un interés particular la selección del tamaño apropiado


de la muestra.
11

Como el error es la parte que se suma y se resta a p̂ en el intervalo de


confianza, el tamaño apropiado de la muestra es:

2
Z 
n    / 2  pq (Si la población es infinita o muy grande)
 e 

Z 2 pqN
ó n (si la población es finita)
( N  1)e 2  Z 2 pq

Para utilizar la anterior ecuación se debe hacer una estimación de p. Para


ello debemos basarnos en un valor p̂ de una muestra anterior o en el
establecimiento de p̂ a partir de una muestra piloto (y se determina
cuántas observaciones adicionales se necesitan para estimar p con una
exactitud predeterminada) o haciendo una estimación subjetiva (en este
caso, debe conocerse muy bien lo que se hace).
El margen de error para estimar una proporción poblacional es casi siempre
0,1 o menor. En las grandes encuestas, generalmente se establece un
margen de error de 0,03 a 0,04: el empleo de esos márgenes de error
siempre da un tamaño de muestra suficientemente grande como para
satisfacer los requisitos del teorema del límite central (np y nq ≥ 5).

Otro enfoque para seleccionar el tamaño de muestra consiste en maximizar


la ecuación, teniendo en cuenta que pq es máximo cuando p = q = 0.5. Si este
es el caso, el tamaño de la muestra que se requiere está dado por:

2
Z 
n    / 2  (0.25)
 e 

En cualquier caso, al usar p = 0.5 se garantiza que el tamaño de la muestra


será suficiente para obtener el margen de error deseado.

Ejemplo 7
Un fabricante produce chips para computador; cada chip es
independientemente aceptable con una probabilidad p desconocida. Para
obtener un intervalo de confianza aproximado de 90% para p, cuya longitud
sea aproximadamente 0,05, se toma una muestra inicial de 30 chips. Si de
estos 30 chips, 26 tienen una calidad aceptable.
Luego se evalúa una muestra de tamaño apropiado (los adicionales) y se
encuentra que de ellos 404 fueron aceptables. Estime p.

4. ESTIMACIÓN DE LA VARIANZA
12

Por ser una variable cuadrática debe emplearse la distribución chi cuadrado.
Recordemos que si S2 es la varianza de una muestra aleatoria de tamaño n
que se toma de una población normal con varianza σ2, entonces:

(n  1) S 2
2  , Con n – 1 grados de libertad
2

Por lo tanto, el intervalo de confianza correspondiente está dado por:

(n  1) S 2 (n  1) S 2
  2

 / 2
2
1   / 2
2

 / 2 y 1 / 2 son los puntos críticos que corresponden al


2 2
Donde
porcentaje α/2 de la distribución χ2 con n – 1 grados de libertad.

Ejercicio 8
Una empresa tiene cierto proveedor de chips. Para verificar la información
que suministró el proveedor, antes de firmar el contrato se tomó una muestra aleatoria
de 25 unidades y se registraron sus tiempos de duración; las observaciones fueron:
41,3 49,2 48,9 43,2 52,0 41,5 51,2 46,1 49,3 49,2 44,7 43,4 50,0
46,8 45,0 46,7 48,8 47,7 51,5 49,8 44,0 49,6 51,0 47,5 51,2
Es absolutamente necesario que la desviación estándar de los tiempos de
duración de los chips sea menor de 2 horas. A partir de la construcción de
un intervalo de confianza para σ de 95%. ¿Podría decir que los datos apoyan
el cumplimiento del requisito?

PROBLEMAS PROPUESTOS

1. La American Management Association desea información acerca del


ingreso medio de los gerentes de la industria del menudeo. Una
muestra aleatoria de 256 gerentes revela una media muestral de
$45420. La desviación estándar de esta muestra es de $2050. A la
asociación le gustaría responder las siguientes preguntas:
a. ¿Cuál es la media de la población?
b. ¿Cuál es un conjunto de valores razonable de la media
poblacional, al 95%?
c. ¿Cómo se deben interpretar estos resultados?
2. Una compañía dulcera llena un paquete de 20 onzas de dulces de
Halloween con piezas de dulces envueltas individualmente. El número
13

promedio de piezas de dulce por paquete varía porque el paquete se


vende por peso. La compañía desea estimar el número de piezas por
paquete. Unos inspectores muestrea al azar 120 paquetes de este
dulce y cuentan el número de piezas por cada paquete. Encuentran
que la media muestral del número de piezas es 18,72, con una
desviación estándar de 0,8735. ¿Cuál es la estimación puntual del
número de piezas por paquete? Construya el intervalo de confianza de
99% para estimar el número medio de piezas por paquete para la
población.
3. Un Ingeniero hace una prueba sobre la duración de un equipo. Para ello examina
30 equipos y obtiene los siguientes tiempos de duración, en días:
215 182 295 242 175 199 222 246 201 184
295 196 208 255 180 196 235 262 186 198
205 225 214 232 222 200 185 295 206 185
a) Hallar los límites de confianza de 80 y 95% para la duración
promedio. ¿Qué puede concluir acerca de la relación entre el nivel de
confianza y la precisión?
b) Si se quiere determinar un intervalo de confianza del 95% con un
error que no sobrepase los 10 días, qué tamaño mínimo de muestra
habría que emplear ¿Qué puede concluir al comparar con la muestra
de 30?
4. Determinado banco encontró que el uso de cajeros automáticos ATM
reduce el costo de las transacciones bancarias de rutina. Dicho banco
instaló varios ATM en puntos estratégicos de la ciudad; después de
varios meses de operación, una muestra de 100 usuarios reveló que en
un mes usaron las máquinas ATM así:
Nº de veces que usan ATM 0 1 2 3 4 5
Frecuencia 25 30 20 10 10 5
a) Establezca un intervalo de confianza del 90% para la proporción de
usuarios que no emplearon los cajeros en el mes. Interprete.
b) ¿Cuántas transacciones al mes realiza un usuario promedio?
c) Establezca un intervalo de confianza del 90% para el promedio de
transacciones durante un mes. Interprete.
d) Si se sabe que los usuarios de los cajeros ATM en la ciudad son
3850, ¿qué tan grande debe ser la muestra para tener una confianza
del 90% de que la proporción muestral de usuarios que emplean ATM
no varíe en más de 0.05 respecto a la estimación puntual? ¿Cuál
sería la respuesta si considera que la población es infinita?
5. Un ingeniero hace una prueba sobre la duración de un equipo. Para ello examina
12 equipos y obtiene los siguientes datos –en días-:
235 196 295 242 335 175 192 250 184 295 303 205
14

a) Hallar intervalos de confianza de 85 y 95% para la duración promedio.


¿Qué se observa al aumentar el nivel de confianza?
b) Si se quiere determinar un intervalo de confianza de 85% con un error
que no supere los 15 días, ¿qué tamaño de muestra habría que
emplear?
6. Se toma una muestra de 50 dispositivos necesarios para el
funcionamiento de computadores y se someten a una exigente
prueba de duración, 6 de ellos no pasan la prueba.
a) Encontrar un intervalo de confianza de 90% para la proporción
poblacional de dispositivos que pasan la prueba.
b) Dar una explicación estadístico-matemática de dicho intervalo.
c) Al utilizar la estimación puntual de p obtenida a partir de la muestra
preliminar de 50 dispositivos, ¿cuántos dispositivos deben probarse
para tener una confianza del 90% de que el error al estimar el
verdadero valor de p no exceda 0.05?
7. Las siguientes son las calificaciones obtenidas por los estudiantes de
Estadística Aplicada en el tercer parcial durante el segundo
semestre de 2015
1,9 2,7 1,3 2,9 2,9 2,7 2,2 3,0 2,5 4,2 2,7 2,2 1,5
3,6 3,5 2,3 2,7 3,3 2,6 2,5 3,6 2,6 1,2 2,5 2,8 1,6
a) Calcular intervalos de confianza de 90% para la media poblacional a
partir de 10 muestras aleatorias de tamaño 6.
b) Elaborar un gráfico donde se muestren los intervalos de confianza y
.
c) ¿Qué proporción de los intervalos de confianza contienen a ?. Si no
es 90%, explicar.
8. Como parte de un experimento, una gran empresa manufacturera
encontró que el tiempo promedio requerido por 16 empleados
escogidos al azar para completar una tarea determinada era 26
minutos, con una desviación estándar de 5 minutos.
a. Construir un intervalo de confianza del 90% para μ
b. ¿De qué tamaño es el error al construir ese intervalo si se
toma una muestra de ese tamaño?
b) Si ese error se quiere reducir a 1 minuto, ¿qué tan grande debe ser la
muestra que se tome?
c) Si esa empresa tiene 500 empleados, ¿qué tan grande debe ser la
muestra que se tome para que el error no sea mayor de 1 minuto?
9. Se toma una muestra aleatoria de 12 alfileres para costura en un
estudio de dureza de Rockwell en la cabeza de los alfileres. Se
realizaron mediciones de la dureza de Rockwell para cada una de las
12, lo cual dio un valor promedio de 48,50 con una desviación estándar
15

de 1,5. Suponiendo que las mediciones se distribuyen de forma


normal, construya un intervalo de confianza de 90% para la dureza de
Rockwell media.
10. Las siguientes mediciones se registraron para el tiempo de secado, en
horas, de cierta marca de pintura látex:
3,4 2,5 4,8 2,9 3,6 2,8 3,3 5,6 3,7 2,8 4,4 4,0 5,2 3,0 4,8
Suponiendo que las mediciones representan una muestra aleatoria de
una población normal, encuentre los límites de tolerancia de 99% que
contendrán 95% de los tiempos desecado.
11. Un fabricante de baterías para automóviles afirma que sus baterías
durarán, en promedio, 3 años con una varianza de 1 año. Si 5 de estas
baterías tienen duraciones de 1,9; 2,4; 3,0; 3,5 y 4,2 años, construya
un intervalo de confianza de 95% para σ 2 y decida si es válida la
afirmación del fabricante de que σ 2 = 1. Suponga que la población de
duraciones de las baterías se distribuye de forma aproximadamente
normal.
12. Calcule un intervalo de confianza de 98% para la proporción de
artículos defectuosos en un proceso cuando se encuentra que una
muestra de tamaño 100 da como resultado 8 defectuosos. ¿Qué tan
grande se necesita la muestra, si deseamos tener una confianza de
98% de que nuestra proporción de la muestra esté dentro del 0,05 de
la proporción real de defectuosos?
13. Un artículo publicado en el Journal of Heat Transfer, describe un
nuevo método para medir la conductividad térmica del hierro Armco.
Al utilizar una temperatura de 100ºF y una potencia de entrada de
550 W, se obtienen las 10 mediciones siguientes de conductividad
térmica (en Btu/hr-ft-ºF):
41,60 41,48 42,34 41,95 41,86 42,18 41,72 42,26 41,81 42,04
Encontrar un intervalo de confianza de 95% para la conductividad
térmica promedio de este material, y se sabe que la desviación
estándar de la conductividad térmica es 0,30 Btu/hr-ft-ºF.
14. Supóngase que se desea que el error en la estimación de la
conductividad térmica promedio del hierro Armco del ejercicio
anterior sea menor que 0,05 Btu/hr-ft-ºF, con una confianza del 95%
y σ = 0,10. Determine el tamaño requerido de la muestra.

MÉTODOS DE CONTRASTES DE HIPÓTESIS O PRUEBAS


DE HIPÓTESIS

Introducción
16

Los métodos de contraste de hipótesis tienen como objetivo comprobar si


determinado supuesto referido a un parámetro poblacional, o a parámetros
análogos de dos o más poblaciones, es compatible con la evidencia empírica
contenida en la muestra. Los supuestos que se establecen respecto a los
parámetros se llaman hipótesis paramétricas. Para cualquier hipótesis
paramétrica, el contraste se basa en establecer un criterio de decisión, que
depende en cada caso de la naturaleza de la población, de la distribución de
probabilidad del estimador de dicho parámetro y del control que se desea
fijar a priori sobre la probabilidad de rechazar la hipótesis contrastada en
el caso de ser ésta cierta.

En todo contraste intervienen dos hipótesis. La hipótesis nula (Ho) es


aquella que recoge el supuesto de que el parámetro toma un valor
determinado y es la que soporta la carga de la prueba. La decisión de
rechazar la hipótesis nula, que en principio se considera cierta, está en
función de que sea o no compatible con la evidencia empírica contenida en la
muestra. El contraste clásico permite controlar a priori la probabilidad de
cometer el error de rechazar la hipótesis nula siendo ésta cierta; dicha
probabilidad se llama nivel de significación del contraste ( ) y suele fijarse
en el 1%, 5% o 10%.

La proposición contraria a la hipótesis nula recibe el nombre de hipótesis


alternativa (Ha) y suele presentar un cierto grado de indefinición: si la
hipótesis alternativa se formula simplemente como 'la hipótesis nula no es
cierta', el contraste es bilateral o a dos colas; por el contrario cuando se
indica el sentido de la diferencia, el contraste es unilateral o a una sola cola.

Cuando se realiza un contraste con el SPSS no se fija el nivel de


significación deseado, el programa calcula el valor-p o significación
asintótica, que es la probabilidad de que el estadístico de prueba tome un
valor igual o superior al muestral bajo el supuesto de que la hipótesis nula es
cierta. Por tanto, si el valor-p es menor o igual que el nivel de significación
deseado se rechazará Ho. Un valor-p próximo a cero indica que se rechazará
la Ho para cualquier nivel de significación.

¿Qué es una hipótesis?


Una prueba puede ser un ensayo, un experimento, una evaluación o una
muestra: su acepción depende del contexto en el que se utiliza. Hipótesis,
por su parte, es una conjetura o una presunción que tiene una cierta
probabilidad de ser cierta o real. Por lo general, se considera que una
hipótesis no puede probarse como falsa o verdadera. Lo que se hace es
apoyar un argumento a partir de evidencias que surgen de investigaciones
17

científicas. A mayor cantidad de evidencias científicas, habrá mayores


certezas acerca de la condición de una hipótesis. En otras palabras: si se
realizan veinte o treinta experimentos que avalan que una hipótesis es
verdadera, hay muchas probabilidades de que realmente sea verdadera.
Pruebas de Hipótesis
Otra manera de hacer inferencia es haciendo una afirmación acerca del
valor que el parámetro de la población bajo estudio puede tomar. Esta
afirmación puede estar basada en alguna creencia o experiencia pasada que
será contrastada con la evidencia que nosotros obtengamos a través de la
información contenida en la muestra. Esto es a lo que llamamos Prueba de
Hipótesis

Una prueba de hipótesis comprende cinco componentes principales:


1. Hipótesis Nula e Hipótesis Alternativa
2. Estadística de Prueba
3. Región de Rechazo, Valores Críticos y Regla de Decisión
4. Tomar una decisión
5. Establecer una conclusión

La Hipótesis Nula, denotada como H0 siempre especifica un solo valor del


parámetro de la población si la hipótesis es simple o un conjunto de valores
si es compuesta (es lo que queremos desacreditar)
H0: μ = μ0 H0: μ μ0 H0: μ μ0
La Hipótesis Alternativa, denotada como Ha es la que responde nuestra
pregunta, la que se establece en base a la evidencia que tenemos. Puede
tener tres formas:
Ha: μ μ0 Ha: μ > μ0 Ha: μ < μ0
Como las conclusiones a las que lleguemos se basan en una muestra, hay
posibilidades de que nos equivoquemos.
Dos decisiones correctas son posibles:
Rechazar H0 cuando es falsa
No Rechazar H0 cuando es verdadera.
Dos decisiones incorrectas son posibles:
Rechazar H0 cuando es verdadera
No Rechazar H0 cuando es falsa.
Tamaño de los errores al tomar una decisión incorrecta en una Prueba de Hipótesis
H0 Verdadera Ho Falsa
Error Tipo I
Rechazamos Ho Decisión Correcta
P(error) = α
Error Tipo II
No Rechazamos Ho Decisión Correcta
P(error Tipo II) = β
18

La Probabilidad de cometer un error Tipo I se conoce como Nivel de


Significancia, se denota como α y es el tamaño de la región de rechazo.
El complemento de la región de rechazo es 1−α y es conocido como el
Coeficiente de Confianza.
En una prueba de Hipótesis de dos colas la región de no rechazo
corresponde a un intervalo de confianza (1-α) para el parámetro en cuestión.
La Región de Rechazo es el conjunto de valores tales que si la prueba
estadística cae dentro de este rango, decidimos rechazar la Hipótesis Nula.
Su localización depende de la forma de la Hipótesis Alternativa:
Si Ha: μ > μ0 entonces la región se encuentra en la cola derecha de la
distribución de la estadística de prueba.
Si μ < μ0 entonces la región se encuentra en la cola izquierda de la
distribución de la estadística de prueba.
Si μ μ0 entonces la región se divide en dos partes, una parte estará en la
cola derecha de la distribución de la estadística de prueba y la otra en la
cola izquierda de la distribución de la estadística de prueba.
Conclusiones de una Prueba de Hipótesis
Si rechazamos la Hipótesis Nula, concluimos que “hay suficiente evidencia
estadística para inferir que la hipótesis nula es falsa”
Si no rechazamos la Hipótesis Nula, concluimos que “no hay suficiente
evidencia estadística para inferir que la hipótesis nula es falsa”.
La Estadística de Prueba es una estadística que se deriva del estimador
puntual del parámetro que estemos probando y en ella basamos nuestra
decisión acerca de si rechazar o no rechazar la Hipótesis Nula.
Ejemplo:

Siempre se calcula considerando la Hipótesis Nula como si fuera verdadera.

PRUEBA DE HIPOTESIS CON MUESTRA GRANDE PARA UNA MEDIA


POBLACIONAL μ
Para el caso específico de la media poblacional μ, el estimador es cuya
varianza es .
Supondremos que conocemos la varianza poblacional σ2 y la muestra es
grande (n 30).
1. Hipótesis Nula: H0: μ = μ0 H0: μ μ0 H0: μ μ0
Hipótesis Alternativa: Ha: μ μ0 Ha: μ > μ0 Ha: μ < μ0
2. Estadística de Prueba
19

Si n es grande y σ es conocida:

Si n es grande y σ desconocida:

Si n es pequeña y σ es conocida:

3. Región de Rechazo, Valores Críticos y Regla de Decisión


Región de Rechazo
Se establece las condiciones específicas en la que se rechaza la
hipótesis nula y las condiciones en que no se rechaza la hipótesis nula.
La región de rechazo define la ubicación de todos los valores que son
tan grandes o tan pequeños, que la probabilidad de que se presenten
bajo la suposición de que la hipótesis nula es verdadera.

Valores Críticos
Es el punto de división entre la región en la que se rechaza la
hipótesis nula y la región en la que no se rechaza la hipótesis nula.

Regla de Decisión
Si la prueba es de doble cola
Se rechaza H0 si:
Z calculado es < a – Zcrítico o Z calculado es > a Zcrítico.

Regla de Decisión
Si la prueba es de cola izquierda
20

Se rechaza H0 si:
Z calculado es < a –Zcrítico.

Regla de Decisión
Si la prueba es de cola izquierda
Se rechaza H0 si:
Z calculado es > a Zcrítico.

4. Tomar una decisión: En este penúltimo paso de la prueba de hipótesis,


se compara el estadístico de prueba con el valor crítico y se toma la
decisión de rechazar o no la hipótesis nula. Tenga presente que en una
prueba de hipótesis solo se puede tomar una de dos decisiones: no
rechazar o rechazar la hipótesis nula. Debe subrayarse que siempre
existe la posibilidad de rechazar la hipótesis nula cuando no debería
haberse rechazado (error tipo I). También existe la posibilidad de
que la hipótesis nula se acepte cuando debería haberse rechazado
(error de tipo II).
5. Establecer una conclusión.

PRUEBA DE HIPOTESIS CON MUESTRA GRANDE PARA UNA


PROPORCION BINOMIAL p (proporción poblacional)
Si nuestro propósito está en la proporción de éxitos p, el estimador será

que tiene distribución aproximadamente normal con media p y varianza

p0(1-p0), donde p0 toma el valor propuesto por la hipótesis nula.


1. Hipótesis Nula: H0: p = p0 H0: p p0 H0: p p0
Hipótesis Alternativa: Ha: p p0 Ha: p > p0 Ha: p < p0
2. Estadística de Prueba

3. Región de Rechazo, Valores Críticos y Regla de Decisión


Región de Rechazo
Se establece las condiciones específicas en la que se rechaza la
hipótesis nula y las condiciones en que no se rechaza la hipótesis nula.
La región de rechazo define la ubicación de todos los valores que son
tan grandes o tan pequeños, que la probabilidad de que se presenten
bajo la suposición de que la hipótesis nula es verdadera.
21

Valores Críticos
Es el punto de división entre la región en la que se rechaza la
hipótesis nula y la región en la que no se rechaza la hipótesis nula.

Regla de Decisión
Si la prueba es de doble cola
Se rechaza H0 si:
Z calculado es < a – Zcrítico o Z calculado es > a Zcrítico.

Regla de Decisión
Si la prueba es de cola izquierda
Se rechaza H0 si:
Z calculado es < a –Zcrítico.

Regla de Decisión
Si la prueba es de cola derecha
Se rechaza H0 si:
Z calculado es > a Zcrítico.

4. Tomar una decisión: En este penúltimo paso de la prueba de hipótesis,


se compara el estadístico de prueba con el valor crítico y se toma la
decisión de rechazar o no la hipótesis nula. Tenga presente que en una
prueba de hipótesis solo se puede tomar una de dos decisiones: no
rechazar o rechazar la hipótesis nula. Debe subrayarse que siempre
existe la posibilidad de rechazar la hipótesis nula cuando no debería
haberse rechazado (error tipo I). También existe la posibilidad de
que la hipótesis nula se acepte cuando debería haberse rechazado
(error de tipo II).
5. Establecer una conclusión.
22

PRUEBA DE HIPOTESIS CON MUESTRA PEQUEÑA PARA UNA MEDIA


POBLACIONAL μ Y VARIANZA DESCONOCIDA
Cuando la varianza poblacional no es conocida y la muestra es pequeña,
sabemos que la podemos estimar con la varianza muestral, siendo la
distribución de la estadística de prueba una t-Student con n-1 grados de
libertad.
1. Hipótesis Nula: H0: μ = μ0 H0: μ μ0 H0: μ μ0
Hipótesis Alternativa: Ha: μ μ0 Ha: μ > μ0 Ha: μ < μ0
2. Estadística de Prueba
Si n es pequeña y σ es desconocida:

3. Región de Rechazo, Valores Críticos y Regla de Decisión


Región de Rechazo
Se establece las condiciones específicas en la que se rechaza la
hipótesis nula y las condiciones en que no se rechaza la hipótesis nula.
La región de rechazo define la ubicación de todos los valores que son
tan grandes o tan pequeños, que la probabilidad de que se presenten
bajo la suposición de que la hipótesis nula es verdadera.

Valores Críticos
Es el punto de división entre la región en la que se rechaza la
hipótesis nula y la región en la que no se rechaza la hipótesis nula.

Regla de Decisión
Si la prueba es de doble cola
Se rechaza H0 si:
t calculado es < a – tcrítico o t calculado es > a tcrítico.

Regla de Decisión
23

Si la prueba es de cola izquierda


Se rechaza H0 si:
t calculado es < a –tcrítico.

Regla de Decisión
Si la prueba es de cola derecha
Se rechaza H0 si:
t calculado es > a tcrítico.
4. Tomar una decisión: En este penúltimo paso de la prueba de hipótesis,
se compara el estadístico de prueba con el valor crítico y se toma la
decisión de rechazar o no la hipótesis nula. Tenga presente que en una
prueba de hipótesis solo se puede tomar una de dos decisiones: no
rechazar o rechazar la hipótesis nula.
5. Establecer una conclusión.

PRUEBA DE HIPOTESIS RELACIONADAS CON UNA VARIANZA


POBLACIONAL
Con frecuencia nuestro interés está en el parámetro de variabilidad, en
cuyo caso podemos hacer pruebas sobre un valor específico de la varianza
poblacional. Para ello nos basamos en el estimador del estimador σ 2 que es
una chi cuadrada Χ2 con n-1 grados de libertad.

1. Hipótesis Nula: H0: = H0: H0:


Hipótesis Alternativa: Ha: Ha: > Ha: <
2. Estadística de Prueba
Si n es pequeña y σ es desconocida:

3. Región de Rechazo, Valores Críticos y Regla de Decisión


Región de Rechazo
Se establece las condiciones específicas en la que se rechaza la
hipótesis nula y las condiciones en que no se rechaza la hipótesis nula.
La región de rechazo define la ubicación de todos los valores que son
tan grandes o tan pequeños, que la probabilidad de que se presenten
bajo la suposición de que la hipótesis nula es verdadera.
24

Valores Críticos
Es el punto de división entre la región en la que se rechaza la
hipótesis nula y la región en la que no se rechaza la hipótesis nula.
Regla de Decisión
Si la prueba es de doble cola
Se rechaza H0 si:
Calculado es < a – crítico o Calculado es > a crítico.

Regla de Decisión
Si la prueba es de cola izquierda
Se rechaza H0 si:
Calculado es < a crítico.

Regla de Decisión
Si la prueba es de cola derecha
Se rechaza H0 si:
Calculado es > a crítico.
4. Tomar una decisión: En este penúltimo paso de la prueba de hipótesis,
se compara el estadístico de prueba con el valor crítico y se toma la
decisión de rechazar o no la hipótesis nula. Tenga presente que en una
prueba de hipótesis solo se puede tomar una de dos decisiones: no
rechazar o rechazar la hipótesis nula.
5. Establecer una conclusión.

EJERCICIOS PROPUESTOS DE PRUEBAS DE HIPÓTESIS


1. Heinz, un fabricante de kétchup, utiliza una máquina para vaciar 16
onzas de su salsa en botellas. A partir de su experiencia de varios años
con la máquina despachadora, la empresa sabe que la cantidad del
producto de cada botella tiene una distribución normal con una media de
16 onzas y una desviación estándar de 0,15 onzas. Una muestra de 50
25

botellas llenadas durante la hora pasad reveló que la cantidad media por
botella era de 16,017 onzas. ¿Sugiere la evidencia que la cantidad media
despachada es diferente de 16 onzas? Use un nivel de significancia de
0,05.
2. La cadena de restaurantes MacBurger afirma que el tiempo de espera
de los clientes es de 8 minutos con una desviación estándar poblacional
de 1 minuto. El departamento de control de calidad halló en una muestra
de 50 clientes en Warren Road MacBurger que el tiempo medio de
espera era de 2,75. Con un nivel de significancia de 0,05, ¿Puede
concluir que el tiempo medio de espera sea menor a 3 minutos?
3. La vida media de una batería de un reloj digital es de 305 días. Las vidas
medias de las baterías se rigen por la distribución normal. Hace poco se
modificó la batería para que tuviera mayor duración. Una muestra de 20
baterías modificadas exhibió una vida media de 311 días con una
desviación estándar de 12 días, ¿La modificación incremento la vida
media de las baterías?
4. El ingreso promedio por persona en Estados Unidos es de $40.000, y la
desviación estándar de ingresos sigue una distribución normal. Una
muestra aleatoria de 10 residentes de Wilmington, Delaware presentó
una media de $50.000, con una desviación estándar de $10.000. a un
nivel de significancia de 0,05, ¿Existe suficiente evidencia para concluir
que los residentes Wilmington, Delaware, ganan más que el promedio
nacional?
5. La cantidad de agua consumida al día por un adulto sano sigue una distribución
normal, con una media de 1,4 litros. Una campaña de salud promueve el consumo
de agua de cuando menos 2,0 litros diarios. Después de la campaña, una muestra de
10 adultos muestra el siguiente consumo en litros:
1,5 1,6 1,5 1,4 1,9 1,4 1,3 1,9 1,8 1,7
A un nivel de significancia de 0,01, ¿Se puede concluir que se ha elevado
el consumo de agua?
6. Chicken Delight firma que 90% de sus pedidos se entrega se entrega en
10 minutos desde que se hace el pedido. Una muestra de 100 pedidos
mostró que 82 se entregaron en el tiempo prometido. Con un nivel de
significancia de 0,10, ¿Se puede concluir que menos de 90% de los
pedidos se entregó en menos de 10 minutos?
7. Un banco debe cumplir según ley que los clientes morosos de tarjeta de
crédito no debe tener en promedio una deuda mayor a BsF 500. Se
selecciona una muestra de 25 clientes y se obtiene un promedio de
deuda de 510 BsF con una desviación típica de 45. Utilizando un nivel de
significancia de 10%, evalúe si la empresa cumple con lo establecido por
ley.
26

8. Midwest Productions planea comercializar un nuevo producto sólo si por


lo menos 40% del público le gusta. El departamento de investigación
selecciona 500 personas y encuentra que 225 lo prefieren al de la
competencia más cercana. ¿A un nivel de significancia del 2%, Midwest
debería comercializar el producto?
9. Un documental televisivo acerca de comer en exceso afirmaba que los
estadounidenses tienen un sobrepeso aproximado de 10 libras en
promedio. Para probar esta afirmación, examinaron a 18 individuos
elegidos aleatoriamente, y encontraron que su sobrepeso promedio era
12.4 libras, con una desviación estándar de la muestra de 2.7 libras. A
un nivel de significancia de 0.01, ¿hay alguna razón para dudar de la
validez del valor afirmado de 10 libras?
10. Un fabricante de bombillas industriales desea que sus bombillas tengan una vida
promedio aceptable para sus clientes y una variación pequeña en la duración. Si
algunas bombillas fallan muy pronto los clientes se molestan y cambian a productos
más competitivos. Las variaciones grandes sobre la media reducen las ventas de
reemplazo, y la variación en general interrumpe los programas de reemplazo de los
clientes. Al probar una muestra de 20 bombillas se obtuvieron las siguientes
duraciones en horas:
2100 2302 1951 2067 2415 1883 2010 2146 2278 2019
1924 2183 2077 2392 2286 2501 1946 2161 2253 1827
El fabricante desea controlar la variabilidad en las duraciones de modo
que la desviación estándar de la población sea menor que 150 horas. ‘Los
datos proporcionan evidencia suficiente para indicar que el fabricante
está logrando esta meta? Pruebe con un nivel de significancia de 0,01.
11. Un gerente de producción siente que la tasa de producción de los
empleados con experiencia es seguramente mayor que la de los nuevos
empleados, pero no espera que la variabilidad en las tasas de producción
difiera entre los dos grupos. En estudios anteriores se ha encontrado
que la producción promedio por hora para los nuevos empleados en este
tipo de trabajo específico es 20 unidades por hora con una varianza de
56 unidades al cuadrado. Para un grupo de 20 empleados con 5 años de
experiencia, la producción promedio en este mismo tipo de trabajo es 30
unidades por hora con varianza muestral de 28 unidades al cuadrado.
¿Parecería que la variabilidad en la producción difiere entre los dos
niveles de experiencia? Pruebe las hipótesis para un nivel de
significancia de 0.05.

Guía preparada por: Ing° Luis Hernández Salinas

S-ar putea să vă placă și