Documente Academic
Documente Profesional
Documente Cultură
PROBABILIDAD Y ESTADÍSTICA
UNIDAD IV: ESTIMACIÓN Y PRUEBA DE HIPÓTESIS
Temas
OBJETIVO DE LA UNIDAD
Aplicar diferentes test estadísticos para validar diferentes tipos de hipótesis
estadísticas.
INTRODUCCIÓN
El cálculo del tamaño de la muestra se definió en la Unidad I, sin embargo se hace
un reuerzo del tema en este apartado, con la finalidad de validar las hipótesis respectivas.
Cálculo del tamaño necesario de la muestra para alcanzar una precisión dada
Considerando el problema para el caso de muestreo aleatorio simple. En el que se desea estimar
el ingreso promedio mensual de remesas recibidas por familia en una gran ciudad. Por estudios
previos, se estima que σ = 200 dólares.
¿De qué tamaño debe ser la muestra para obtener una probabilidad de 95% de que la
discrepancia entre 𝑋̅ y µ (error de estimación) no será mayor de 20 dólares?
Este problema se puede plantear mediante simbología probabilística en la siguiente forma:
𝑝[|𝑋̅ − 𝜇| ≤ 20] = 0.95
Aplicando la propiedad de la desigualdad:
𝑝[−20 ≤ 𝑋̅ − 𝜇 ≤ 20]=0.95
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 2 de 7
𝜎
Aplicando el Teorema del Límite Central y estandarizando al dividir la desigualdad por , para
√𝑛
lograr una variable con distribución normal estándar:
−20 𝑋̅ − 𝜇 20
𝑝[ ≤ ≤ ] = 0.95
200 200 200
√𝑛 √𝑛 √𝑛
−20 20
𝑝[ ≤𝑧 ≤ ] = 0.95
200 200
√𝑛 √𝑛
Por la normal estándar se sabe que:
𝑝[−1.96 ≤ 𝑧 ≤ 1.96] = 0.95
De las dos últimas expresiones, se deduce que debe cumplirse la relación:
20
= 1.96
200
√𝑛
Despejando √𝑛, y elevando al cuadrado se tiene:
200 2
𝑛 = (1.96 ∗ )
20
𝑛 = (1.96 ∗ 10)2
n = 384.16
n = 385
El resultado indica que debe tomarse una muestra de 385 familias.
Analizando los componentes de cálculo para n puede establecerse una expresión general para el
tamaño de muestra, cuando se utiliza muestreo simple al azar. Así:
𝑧𝑐 ∗ 𝜎 2
𝑛=[ ]
𝑑
Donde:
𝜎: Desviación estándar de la población
d= 𝑋̅ − 𝜇 : discrepancia permisible o error máximo de estimación permisible
𝑧𝑐 : Valor de z crítico, normal estándar, para un nivel de confianza de (1- α/2)%.
La expresión anterior para n puede utilizarse para resolver otro tipo de problemas, despejando
la variable de interés.
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 3 de 7
Para encontrar la solución a este problema, debemos partir de la fórmula de n encontrada para
la media, pero ajustándola para el caso de proporciones; en donde, la desviación estándar
poblacional es
𝜎 = √𝑝 ∗ 𝑞 = √𝑝 ∗ (1 − 𝑝)
𝑧𝑐 ∗ 𝜎 2 𝑧𝑐∗ 𝑝𝑞 2 𝑧𝑐 2
𝑛=[ ] = ( √ ) = ( ) ∗ 𝑝 ∗ (1 − 𝑝)
𝑑 𝑑 𝑑
Es importante hacer notar que para calcular el tamaño de muestra se requiere conocer p, el valor
que se quiere estimar. Este inconveniente se logra superar a partir de la información previa, como
el valor de la desviación estándar obtenido en un estudio anterior, o haciendo una conjetura
razonable acerca del posible valor de p. Cuando no se tiene idea de cuál puede ser el valor, se
utiliza el máximo valor de p que hace máxima la varianza o desviación estándar y, por lo tanto,
se obtiene un valor máximo de n. Para el ejemplo considerado desconocemos el valor de p,
usando p=0.50.
𝑧𝑐 2 1.96 2
𝑛 = ( ) ∗ 𝑝 ∗ (1 − 𝑝) = ( ) ∗ 0.5 ∗ 0.5
𝑑 0.06
# Cálculo de tamaño de muestra para proporciones usando R
p=0.5
zc=1.96
d=0.06
(n= (zc/d*p) ^2)
## [1] 266.7778
𝑛 ≈ 267
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 4 de 7
La muestra máxima que debe usarse para estimar el número de estudiantes, con un margen de
error de 6%, es de 267. Considerando que se trata de una población finita no muy grande 1500
estudiantes, se hace la corrección para población finita muestreada sin reemplazo:
𝑛0 267
𝑛= 𝑛0 =
1 + 𝑁 1 + 267
1500
Usando R
n=267
> N=1500
> n0=n
> n= n0/ (1+n0/N);n
[1] 226.6553
𝑛 ≈ 227
Adoptando la expresión para la corrección para población finita, se tiene que el tamaño de
muestra es de 227, que reduce en 40 unidades el tamaño de muestra sin ajustar. Que podría
considerarse despreciable, por la facilidad del manejo de la base de datos de los correos.
ENLACES SUGERIDOS
http://www.randomservices.org/random/apps/SpecialSimulation.html
https://www.uv.es/ceaces/
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 6 de 7
https://www.bioestadistica.uma.es/analisis/teoremacentral/
http://www.stats.gla.ac.uk/steps/glossary/confidence_intervals.html
http://www.randomservices.org/random/
REFERENCIAS BIBLIOGRÁFICAS
GLOSARIO
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 7 de 7
Margen de error: es una estadística que expresa la cantidad de error de muestreo aleatorio en
los resultados de una encuesta.
Los límites de confianza: son los límites / valores inferior y superior de un intervalo de confianza,
es decir, los valores que definen el rango de un intervalo de confianza.
Intervalo de confianza para una media: especifica un rango de valores dentro del cual puede
estar el parámetro de población desconocida, en este caso la media.
Intervalo de confianza para una media: especifica un rango de valores dentro del cual puede estar
el parámetro de población desconocida, en este caso la media.
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.