Documente Academic
Documente Profesional
Documente Cultură
Intervalos de Confianza
Oscar R. Diaz
Piensa Estadística
14-5-2019
Universidad de El Salvador
Facultad de Ingeniería y Arquitectura
Unidad de Ciencias Básicas
Probabilidad y Estadística
Unidad VI: Intervalos de Confianza.
Por Oscar Díaz
Podemos interpretar la expresión como el intervalo Como el intervalo no incluye a 6.175, esto sugiere que
aletorio quizas el proceso no esté operando adecuadamente.
𝜎 𝜎 Interpretación del Intervalo
𝑋̅ − 1.96 ≤ 𝜇 ≤ 𝑋̅ + 1.96
√𝑛 √𝑛 Un intervalo de confianza es un intervalo de valores
tal como se muestra en la siguiente figura plausibles para un parámetro desconocido en la población
𝜎 𝜎 (por ejemplo, la media) basado en datos de una muestra
1.96 1.96 aleatoria. Los puntos finales inferiores y superiores de este
√𝑛 √𝑛 intervalo se calculan a partir de los datos de la muestra y
tenemos «cierta confianza» en que el verdadero parámetro
𝜎 𝜎 de la población (pero desconocido) se encuentra dentro de
𝑋̅ − 1.96 𝑋̅ 𝑋̅ + 1.96
√𝑛 √𝑛 los límites calculados.
1
parámetro, este intervalo puede o no cubrir el valor del Ejemplo 2: La cantidad de chatarra que genera un
parámetro; Es una cuestión de incertidumbre. determinado proceso de manufactura es en promedio de
25.5 kg. Se pienza que un nuevo ajuste del proceso reducirá
Así, tenemos una confianza (no una probabilidad) del 95%
esta cantidad. Durante 10 dias de prueba, los kilogramos de
de que el intervalo 6.166 ≤ 𝜇 ≤ 6.170 contenga al
chatarra que se producen con el ajuste son de 25.0, 21.9,
verdadero parámetro poblacional. De esta manera, el nivel
23.5, 25.2, 22.0, 23.0, 24.5, 25.0, 26.1 y 22.8
de confianza de un intervalo mide la confiabilidad del
método usado para calcular el intervalo. Un intervalo de Construya un intervalo de confianza del 95% para el
confianza del 95% se calcula mediante un método que, a la promedio de chatarra despues del ajuste. ¿Los datos
larga, dará como resultado que la media poblacional se sugieren una disminución en la cantidad de chatarra?
sitúe en una proporción de 0.95 todas las veces que se
Solución: Como no sabemos si la población es normal,
utilice. Es decir que, si construimos una y otra vez el
primero debemos verificar si la muestra es
intervalo de confianza, los resultados podrían parecerse a
aproximadamente normal. El siguiente diagrama de caja
los siguientes
representa el comportamiento para los 10 días de prueba
diámetros de los productos de manera que sea lo más pe- (19)1.62 (19)1.62
≤ 𝜎2 ≤
queña posible, de otra manera no se acoplarán de manera 32.852 8.907
adecuada. En el caso de la elaboración de medicinas la va- 1.5 ≤ 𝜎 2 ≤ 5.5
rianza y desviación estándar de cada componente del me-
dicamento resultan de vital importancia para que el pa- Podemos tener una confianza del 95% que la varianza del
ciente reciba la dosis adecuada. contenido de nicotina está entre 1.5 y 5.5 mg2.
Para calcular el intervalo de confianza necesitamos una dis- Un IC del 95% para la desviación estándar es
tribución que muestre el comportamiento de la varianza
1.2 ≤ 𝜎 ≤ 2.3
muestral en el muestreo repetido. La distribución chi-cua-
𝑠2 Elección del Tamaño de Muestra
drado se obtiene a partir de los valores de (𝑛 − 1) 𝜎2 cuando
se toman muestras aleatorias de una población distribuida En una situación práctica la primera pregunta que surge es
normalmente con varianza 𝜎 2 . En la siguiente figura se ¿qué tamaño de muestra tomar para lograr cierto grado de
muestra una familia de curvas de la distribución chi-cua- exactitud en los resultados? La respuesta no es simple, ya
drado (𝜒 2 ) que se diferencian por los grados de libertad que hay que considerar tres factores: el máximo error del
(d.f.) estimado (qué tan cerca al verdadero parámetro se desea
3
estar (¿una unidad? ¿dos?, etc.), la desviación estándar de revisión del programa actual de aseguramiento de calidad.
la población (¿se conoce o no?) y el nivel de confianza Se desea que la estimación esté dentro de 0.05 de la verda-
deseado (90%, 95%, etc.). dera proporción de los que están a favor de revisar el pro-
grama con un nivel de confianza del 90%. ¿Cuántos traba-
Una expresión para el tamaño de muestra se puede obte-
jadores deben de tomarse en cuenta?
ner a partir del error máximo del estimado –la máxima di-
ferencia posible entre el estimado puntual y el valor actual Solución: como no tenemos ningún conocimiento de 𝑝̃ usa-
del parámetro 𝐸– de la siguiente manera: mos 𝑝̃ = 0.5 y determinar así la muestra más grande para
𝜎 𝑧 𝛼 ⁄2 ∙ 𝜎
asegurar los resultados deseados. Entonces
𝐸 = 𝑧𝛼 ( 𝑛) ⇒ √𝑛 = 𝐸
2 √ 𝛼
1 − 𝛼 = 0.90 ⇒ 𝛼 = 0.10 y = 0.05. De tablas encontra-
2
De donde obtenemos mos que 𝑧0.05 = 1.645 . Con estos datos el tamaño de mues-
tra es
𝑧𝛼⁄2 ∙ 𝜎 2
𝑛=( ) 0.5(1−0.5)
𝐸 𝑛 = 1.6452 − 4 = 266.6 que finalmente redondea-
0.052
En el caso que no se conozca 𝜎, se recomienda hacer un mos a 𝑛 ≥ 267.
muestreo preliminar y estimar el valor de 𝜎 2 con 𝑠 2 . Como
último recurso puede estimar la desviación estándar divi- Intervalo de Confianza para la Diferencia de Me-
diendo el rango por 4. dias.
En ocasiones se está interesado en comparar dos medias
Ejemplo 5: Una empresa de manufactura está interesada poblacionales, lo cual se logra convenientemente esti-
en estimar la distancia promedio recorrida por sus trabaja- mando 𝑋̅1 − 𝑋̅2
dores. Un estudio preliminar indica que la desviación están-
dar de estas distancias es cercana a los 3 km. ¿Cuántos em- Caso de Poblaciones Normales con σ Conocida.
pleados debería incluir en la muestra si desea estimar con Un intervalo de confianza del 100(1 − 𝛼)% para 𝜇1 − 𝜇2 es
un error de 0.16 km del verdadero valor promedio a un ni-
𝜎12 𝜎22 𝜎12 𝜎22
vel de confianza del 95%? (𝑥̅1 − 𝑥̅2 ) − 𝑧𝛼 √ + ≤ 𝜇1 − 𝜇2 ≤ (𝑥̅1 − 𝑥̅2 ) + 𝑧𝛼 √ +
2 𝑛1 𝑛2 2 𝑛1 𝑛2
6 4 6 4
(12 − 9) − 1.645√ + ≤ 𝜇1 − 𝜇2 ≤ (12 − 9) + 1.645√ +
100 100 100 100
2.48 ≤ 𝜇1 − 𝜇2 ≤ 3.52
Supuestos:
• Ambas muestras son tomadas de manera aleatoria en
su respectiva población de interés.
• Las muestras son tomadas de manera independiente
una de otra.
• Ambas muestras son tomadas de poblaciones normales (𝑛1 −1)𝑆12 +(𝑛2 −1)𝑆22 14(2.8242 )+11(3.5972 )
Con 𝑆𝑝2 = = = 10.159
• Ambas poblaciones tienen la misma varianza (descono- 𝑛1 +𝑛2 −2 25
bras textiles) de los hilos producidos por dos máquinas. Se- Como el intervalo no contiene a cero y cae enteramente
lecciona dos muestras aleatorias de ambas máquinas de antes de cero, podemos concluir que la media de la má-
manera independiente. Los resultados se muestran en la quina 2 es significativamente mayor que el de la máquina
tabla 1. Construya un IC del 95% para 𝜇1 − 𝜇2 1.
Solución: de las muestras obtenemos
5
Caso de Muestras Pequeñas con Varianzas Diferen-
tes.
En este caso el intervalo de confianza está dado por
𝑠2 𝑠2 𝑠2 𝑠2
(𝑥̅1 − 𝑥̅2 ) − 𝑡𝛼,𝑣 √ 1 + 2 ≤ 𝜇1 − 𝜇2 ≤ (𝑥̅1 − 𝑥̅2 ) + 𝑡𝛼,𝑣 √ 1 + 2
2 𝑛1 𝑛2 2 𝑛1 𝑛2
2
𝑆2 𝑆2
(𝑛1 +𝑛2 )
1 2
Con 𝜈 = 2 2 2 grados de libertad.
(𝑆1 /𝑛1 ) (𝑆2 /𝑛 )
+ 2 2
𝑛1 −1 𝑛2 −1
−3.858 ≤ 𝜇1 − 𝜇3 ≤ −0.664