Sunteți pe pagina 1din 8

UNIVERSIDAD ANTONIO NARIÑO

DEPARTAMENTO DE MATEMÁTICAS
ANÁLISIS ESTADÍSTICO Y PROBABILÍSTICO

INTERVALOS DE CONFIANZA PARA LA MEDIA

1. ESTIMACIÓN PUNTUAL
Un parámetro poblacional es una medida de resumen de una población, en tanto que a una medida
de resumen de una muestra se le denomina estadística muestral. Con el objeto de utilizar los datos
muestrales para realizar inferencias estadísticas, incluyendo estimaciones, la muestra que se tome
debe ser una muestra aleatoria.

EJEMPLO 1. La media μ y la desviación estándar σ de una población de mediciones son


parámetros poblacionales. La media y la desviación estándar s de una muestra de mediciones son
estadísticas muestrales.

Un estimador puntual es un solo valor numérico basado en datos de una muestra aleatoria que se
utiliza para estimar el valor de un parámetro poblacional. Una de las características más importantes
de las estadísticas muestrales que se utilizan como estimadores es que no son sesgados. Un
estimador no sesgado es un estadístico muestral cuyo valor esperado es igual al parámetro que se
estima. Un valor esperado es el promedio a largo plazo de la estadística muestral.

En la Tabla se presentan algunos estimadores puntuales de parámetros poblacionales que se utilizan


con frecuencia. En todos los casos, el estimador apropiado de un parámetro poblacional es
simplemente el correspondiente estadístico muestral.

2. DISTRIBUCIÓN MUESTRAL DE LA MEDIA


Una distribución poblacional representa la distribución de valores de una población y una
distribución muestral representa la distribución de los valores de una muestra. En contraste con las
distribuciones de mediciones individuales, una distribución muestral es una distribución de
probabilidad que se aplica a los valores posibles de una estadística muestral. Así, la distribución
muestral de la media es la distribución de probabilidad de los valores posibles de la media muestral,
, con base en un determinado tamaño de muestra.
UNIVERSIDAD ANTONIO NARIÑO
DEPARTAMENTO DE MATEMÁTICAS
ANÁLISIS ESTADÍSTICO Y PROBABILÍSTICO

Para cualquier tamaño de muestra dado n, tomado de una población con media μ, los valores de la
media muestral varían de una muestra a otra. Esta variabilidad sirve de base para la distribución
muestral. La distribución muestral de la media se describe determinando el valor esperado E( ) o
media, de la distribución y la desviación estándar de la distribución de las medias σ . Como esta
desviación estándar indica la precisión de la media muestral como estimador puntual, por lo general
se le denomina error estándar de la media. En general, se define el valor esperado de la media y el
error estándar de la media de la siguiente manera:
E( ) = μ

σ =

EJEMPLO 2. Suponga que la media de una población muy grande es μ = 50.0 y que la desviación
estándar es σ =12.0. Se determina la distribución muestral de las medias para una muestra de
tamaño n = 36, en términos del valor esperado y del error estándar de la distribución de la siguiente
manera.

Cuando se muestrea a partir de una población finita, se debe incluir un factor de corrección por
población finita en la fórmula para el error estándar de la media. Como regla general, la corrección
es despreciable y puede omitirse cuando n ˂ 0.05 N, es decir, cuando el tamaño de la muestra es
menos del 5% del tamaño de la población. Muchos textos y programas de computación no incluyen
esta corrección porque suponen que la población siempre es muy grande, o quizá de tamaño infinito.
La fórmula para el error estándar de la media, incluyendo el factor de corrección por población
finita, es:

Si no se conoce la desviación estándar de la población, puede estimarse el error estándar de la


media utilizando la desviación estándar muestral como estimador de la desviación estándar de la
población. Para diferenciar este error estándar del que se basa en una conocida, se le designa
mediante el símbolo s . La fórmula del error estándar estimado de la media es:
UNIVERSIDAD ANTONIO NARIÑO
DEPARTAMENTO DE MATEMÁTICAS
ANÁLISIS ESTADÍSTICO Y PROBABILÍSTICO

La fórmula del error estándar estimado de la media, incluyendo el factor de corrección por
población finita es:

EJEMPLO 3. Un auditor toma una muestra aleatoria de tamaño n=16 de un conjunto de N= 100
cuentas por cobrar. No se conoce la desviación estándar de los montos de las cuentas por cobrar
para el total de las 100 cuentas. Sin embargo, la desviación estándar de la muestra es s = $57.00. Se
determina el valor del error estándar para la distribución muestral de la media de la siguiente
manera:

En este ejemplo se estima el error estándar de la media con base en la desviación estándar muestral,
y se requiere utilizar el factor de corrección por población finita porque no es cierto que n ˂ 0.05 N,
es decir, 16˃ 0.05 * (100).
El error estándar de la media ofrece la base principal para la inferencia estadística con respecto a la
media de una población que se desconoce. Un teorema de la estadística que conduce a la utilidad
del error estándar de la media es
Teorema del límite central: Al aumentar el tamaño de la muestra, la distribución muestral de la
media se aproxima a la forma de la distribución normal sin importar la forma de la distribución de
las mediciones individuales de la población. Para propósitos prácticos, puede suponerse que la
distribución muestral de la media es aproximadamente normal cuando el tamaño de la muestra es
n˂ 30.

Por ello, si se tiene una muestra "grande" de n = 30, puede utilizarse siempre la distribución normal
de probabilidad junto con el error estándar de la media. Además, si la población tiene distribución
normal y se conoce puede utilizarse la distribución normal para hacer inferencias estadísticas a
partir de muestras pequeñas.

3. INTERVALOS DE CONFIANZA PARA LA MEDIA UTILIZANDO LA


DISTRIBUCIÓN NORMAL.
UNIVERSIDAD ANTONIO NARIÑO
DEPARTAMENTO DE MATEMÁTICAS
ANÁLISIS ESTADÍSTICO Y PROBABILÍSTICO

Los métodos de estimación por intervalo se basan en el supuesto de que puede utilizarse la
distribución normal de probabilidad. Esta suposición es válida:

(1) cuando debido al teorema del límite central.


(2) cuando n < 30, pero la población tiene distribución normal y se conoce σ
Aunque la media muestral es útil como estimador no sesgado de la media de la población, no hay
forma de expresar el grado de precisión de un estimador puntual. De hecho, en términos
matemáticos, la probabilidad de que la media muestral sea exactamente correcta como estimador es
P = 0. Un intervalo de confianza para la media es un estimador de intervalo que se construye con
respecto a la media muestral y que permite especificar la probabilidad de que incluya el valor de la
media poblacional. El grado de confianza asociado con un intervalo de confianza señala el
porcentaje a largo plazo de esa clase de intervalos que incluirían el parámetro que se estima.

Por lo general, se construyen los intervalos de confianza utilizando el estimador no sesgado como
punto medio del intervalo, el intervalo de confianza para la media se determina mediante:

Los intervalos de confianza que se utilizan con mayor frecuencia son los de 90,95 y 99%. En la
Tabla se presentan los valores de z que se requieren para esos intervalos.

EJEMPLO 4. En una semana determinada, se elige al azar una muestra de 300 empleados de un
número muy grande de ellos que trabajan en una empresa manufacturera. Los trabajadores realizan
una labor a destajo y se encuentra que el promedio de pago por pieza trabajada es de = $1800, con
una desviación estándar muestral de s = $140. Se estima que el pago promedio a destajo para todos
los empleados de la empresa, con una estimación por intervalo que permita tener una confianza del
95% de que ese intervalo incluye el valor de la media poblacional, es:
UNIVERSIDAD ANTONIO NARIÑO
DEPARTAMENTO DE MATEMÁTICAS
ANÁLISIS ESTADÍSTICO Y PROBABILÍSTICO

En donde,

Por ello, puede afirmarse que el pago promedio a destajo para todos los empleados se encuentra
entre $174 980 y $185 020 con un grado de confianza del 95% en esa estimación.

4. LA DISTRIBUCIÓN t DE STUDENT Y LOS INTERVALOS DE CONFIANZA PARA


LA MEDIA
En la sección anterior se señaló que el uso de la distribución normal en la estimación de una media
poblacional es válida para cualquier muestra grande (n ˃30), y para una muestra pequeña (n˂30)
sólo si la población tiene distribución normal y se conoce σ. En este apartado, miraremos los casos
en el que la muestra es pequeña y la población tiene una distribución normal, pero se desconoce σ.

Si una población tiene distribución normal, la distribución muestral de la media para cualquier
tamaño de muestra tiene también distribución normal; esto es cierto independientemente de si se
conoce σ o no. Sin embargo, en el proceso de inferir, se convierte cada valor de la media en un
valor normal estándar, y aquí radica el problema. Si se desconoce σ la fórmula de conversión (X –
μ)/s incluye una variable en el denominador porque s y, por lo tanto, s , diferirá de una muestra a
otra. Esto da como resultado que, al incluir la variable en vez de la constante en el denominador, se
obtienen variables convertidas que no se distribuyen como los valores z. En cambio, los valores se
distribuyen de acuerdo con la distribución t de Student, que es platikúrtica (aplastada) en
comparación con la distribución normal. En el apéndice anexo se incluyen las proporciones de área
bajo la distribución r, en donde la distribución específica se basa en los grados de libertad (gl)
correspondientes a la situación. Para el caso de una sola muestra, gl = n – 1.

La distribución es apropiada para realizar inferencias sobre la media cuando se desconoce σ y la


población tiene una distribución normal, sin importar el tamaño de la muestra. Sin embargo, al
aumentar el tamaño de la muestra (y los grados de libertad), la distribución f se aproxima a la forma
de la distribución normal. Una regla general es que puede aproximarseuna distribución f mediante la
distribución normal cuando n ˃30 (o los gl ˃ 29) para una sola muestra. Esta sustitución es distinta
de la que se especificó mediante el teorema de limite central, y es una conveniencia que en ambos
casos se requiera que la muestra sea cuando menos de tamaño n < 30.

Cuando gl = n - 1 , el intervalo de confianza para estimar la media de la población cuando se


desconoce σ, n < 30 y la población tiene una distribución normal es:
UNIVERSIDAD ANTONIO NARIÑO
DEPARTAMENTO DE MATEMÁTICAS
ANÁLISIS ESTADÍSTICO Y PROBABILÍSTICO

EJEMPLO 5. La vida útil promedio de una muestra aleatoria de n = 10 focos es = 4000 horas,
con una desviación estándar muestral s = 200 horas. Se supone que la vida útil de los focos tiene
una distribución aproximadamente normal. Se estima la vida útil promedio de la población de focos
de la cual se tomó la muestra, utilizando un intervalo de confianza del 95% de la siguiente manera:

En donde,

EJEMPLO 6. Como supervisor del proceso de empacado de café en sobres, suponga que se toma
una muestra aleatoria de 12 de los sobres en la planta empacadora. El peso neto de los sobres de
café es el que se reporta en la Tabla. Determine (a) el peso neto del café que se empaca en cada
sobre, y (b) la desviación estándar muestral. (c) Suponiendo que el peso del café empacado tiene
distribución normal, estime el peso promedio por sobre de café utilizando un intervalo de confianza
del 95%.

Se determinan los valores:


UNIVERSIDAD ANTONIO NARIÑO
DEPARTAMENTO DE MATEMÁTICAS
ANÁLISIS ESTADÍSTICO Y PROBABILÍSTICO

= 15.97 ±2.201(0.043) =15.88 a 16.06 gr

EJERCICIOS.

1. Suponga que desea estimar el promedio de ventas por tienda para un producto determinado
de consumo popular durante el año anterior, y que el número de tiendas es grande.
Determine el intervalo de confianza del 95%, considerando que las ventas se distribuyen en
forma normal, = $3 425 000, σ = $200 000 y n = 25.
2. Con referencia al problema 1, determine el intervalo de confianza del 95%, asumiendo que
la población tiene una distribución normal, = $3 425 000, s =$200 000 y n = 25.
3. Un analista de un departamento de personal elige al azar los expedientes de 16 trabajadores
a destajo y encuentra que el salario promedio por pieza es de $950. Se supone que los
salarios de esa empresa tienen una distribución normal. Si se sabe que la desviación estándar
de los salarios es de $100, estime la tasa promedio de salarios en la empresa utilizando un
intervalo de confianza del 80%.
4. El diámetro promedio de una muestra de n =12 varillas incluidas en un embarque es 2.350
mm, con una desviación estándar de 0.050 mm. Se supone que la distribución de los
diámetros de todas las varillas incluidas en el embarque tiene una distribución
aproximadamente normal. Determine el intervalo de confianza del 99% para estimar el
diámetro promedio de todas las varillas.
5. Merrill Lynch Securities y Health Care Retirement, Inc., son dos grandes empresas ubicadas
en el centro de Toledo, Ohio. Contemplan ofrecer de forma conjunta servicio de guardería
para sus empleados. Como parte del estudio de viabilidad del proyecto, desean calcular el
costo medio semanal por el cuidado de los niños. Una muestra de 10 empleados que
recurren al servicio de guardería revela las siguientes cantidades gastadas la semana pasada.
Construya el intervalo de confianza de 90% de la media poblacional. Interprete el resultado
UNIVERSIDAD ANTONIO NARIÑO
DEPARTAMENTO DE MATEMÁTICAS
ANÁLISIS ESTADÍSTICO Y PROBABILÍSTICO

6. Greater Pittsburgh Area Chamber of Commerce desea calcular el tiempo medio que los
trabajadores que laboran en el centro de la ciudad utilizan para llegar al trabajo. Una muestra
de 15 trabajadores revela las siguientes cantidades de minutos de viaje.
Construya el intervalo de confianza de 98% de la media poblacional. Interprete el resultado.

7. La industria estadounidense de lácteos desea calcular el consumo medio de leche por año.
Una muestra de 16 personas revela que el consumo medio anual es de 60 galones, con una
desviación estándar de 20 galones.
a) ¿Cuál es el valor de la media poblacional? ¿Cuál es el mejor estimador de este valor?
b) Explique por qué necesita utilizar la distribución t. ¿Qué suposiciones necesita hacer?
c) ¿Cuál es el valor de t en un intervalo de confianza de 90%?
d) Construya el intervalo de confianza de 90% de la media de población.
e) ¿Es razonable concluir que la media poblacional es de 63 galones?

8. Warren County Telephone Company afirma en su informe anual que “el consumidor
habitual gasta $60 mensuales en el servicio local y de larga distancia”. Una muestra de 12
abonados reveló las cantidades que gastaron el mes pasado.

a) ¿Cuál es el estimador puntual de la media poblacional?


b) Construya el intervalo de confianza de 90% de la media poblacional.
c) ¿Es razonable la afirmación de la compañía de que el “consumidor habitual” gasta $60
mensuales? Justifique su respuesta.

9. Hay 250 familias en Scandia, Pennsylvania. Una muestra aleatoria de 40 de estas familias
revela que la contribución anual media a la iglesia fue de $450, y la desviación estándar, de
$75. ¿La media poblacional puede ser de $445 o $425?
1. ¿Cuál es la media de la población? ¿Cuál es el mejor estimador de la media poblacional?
2. Construya el intervalo de confianza de 90% de la media de la población. ¿Cuáles son los
puntos extremos del intervalo de confianza?
3. Interprete el intervalo de confianza.

S-ar putea să vă placă și