Inferencia Estadística Tema 4.4

UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA

PROBABILIDAD Y ESTADÍSTICA
Página 1 de 7
UNIDAD IV: ESTIMACIÓN Y PRUEBA DE HIPÓTESIS
Temas
4.4 DETERMINACIÓN DE TAMAÑO DE MUESTRA.
OBJETIVO DE LA UNIDAD
Aplicar diferentes test estadísticos para validar diferentes tipos de hipótesis
estadísticas.
INTRODUCCIÓN
El cálculo del tamaño de la muestra se definió en la Unidad I, sin embargo se hace
un reuerzo del tema en este apartado, con la finalidad de validar las hipótesis respectivas.
4.4 DETERMINACIÓN DE TAMAÑO DE MUESTRA.
4.4.1 Determinación de tamaño de muestra para la media.

Es de hacer notar la importancia del tamaño de la muestra en las investigaciones estadísticas. Se
ha señalado, que el tamaño de la muestra está determinado por factores como: variabilidad de
la población, precisión deseada en las estimaciones, recursos disponibles para el estudio., etc.
Cálculo del tamaño necesario de la muestra para alcanzar una precisión dada
Considerando el problema para el caso de muestreo aleatorio simple. En el que se desea estimar
el ingreso promedio mensual de remesas recibidas por familia en una gran ciudad. Por estudios
previos, se estima que σ = 200 dólares.
¿De qué tamaño debe ser la muestra para obtener una probabilidad de 95% de que la
discrepancia entre 𝑋̅ y µ (error de estimación) no será mayor de 20 dólares?
Este problema se puede plantear mediante simbología probabilística en la siguiente forma:
𝑝[|𝑋̅ − 𝜇| ≤ 20] = 0.95
Aplicando la propiedad de la desigualdad:
𝑝[−20 ≤ 𝑋̅ − 𝜇 ≤ 20]=0.95
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
Página 2 de 7
𝜎
Aplicando el Teorema del Límite Central y estandarizando al dividir la desigualdad por , para
√𝑛
lograr una variable con distribución normal estándar:
−20 𝑋̅ − 𝜇 20
𝑝[ ≤ ≤ ] = 0.95
200 200 200
√𝑛 √𝑛 √𝑛
−20 20
𝑝[ ≤𝑧 ≤ ] = 0.95
200 200
√𝑛 √𝑛
Por la normal estándar se sabe que:
𝑝[−1.96 ≤ 𝑧 ≤ 1.96] = 0.95
De las dos últimas expresiones, se deduce que debe cumplirse la relación:
20
= 1.96
200
√𝑛
Despejando √𝑛, y elevando al cuadrado se tiene:
200 2
𝑛 = (1.96 ∗ )
20
𝑛 = (1.96 ∗ 10)2
n = 384.16
n = 385
El resultado indica que debe tomarse una muestra de 385 familias.
Analizando los componentes de cálculo para n puede establecerse una expresión general para el
tamaño de muestra, cuando se utiliza muestreo simple al azar. Así:
𝑧𝑐 ∗ 𝜎 2
𝑛=[ ]
𝑑
Donde:
𝜎: Desviación estándar de la población
d= 𝑋̅ − 𝜇 : discrepancia permisible o error máximo de estimación permisible
𝑧𝑐 : Valor de z crítico, normal estándar, para un nivel de confianza de (1- α/2)%.
La expresión anterior para n puede utilizarse para resolver otro tipo de problemas, despejando
la variable de interés.
4.4.2 Determinación del tamaño de muestra para la proporción
Página 3 de 7
Suponga que la Facultad de Ingeniería y Arquitectura de la Universidad de El Salvador en Línea,

Educación a Distancia desea estimar la proporción de estudiantes que podrían estar interesados
en un sistema especial de préstamos para la compra de ordenadores. Como se tiene una base de
datos con los correos electrónicos de los estudiantes, se decide llevar a cabo una encuesta en
línea diseñada con un formulario de Google. El total de estudiantes en el ingreso 2018 es de 1500.
¿Qué tamaño de muestra debe usarse si se quiere estimar la proporción de estudiantes
interesados, con un margen de error no mayor de 4 puntos porcentuales y una confianza de 95%?
Para encontrar la solución a este problema, debemos partir de la fórmula de n encontrada para
la media, pero ajustándola para el caso de proporciones; en donde, la desviación estándar
poblacional es
𝜎 = √𝑝 ∗ 𝑞 = √𝑝 ∗ (1 − 𝑝)
Realizando la sustitución correspondiente, se llega a la fórmula:
𝑧𝑐 ∗ 𝜎 2 𝑧𝑐∗ 𝑝𝑞 2 𝑧𝑐 2
𝑛=[ ] = ( √ ) = ( ) ∗ 𝑝 ∗ (1 − 𝑝)
𝑑 𝑑 𝑑
Es importante hacer notar que para calcular el tamaño de muestra se requiere conocer p, el valor
que se quiere estimar. Este inconveniente se logra superar a partir de la información previa, como
el valor de la desviación estándar obtenido en un estudio anterior, o haciendo una conjetura
razonable acerca del posible valor de p. Cuando no se tiene idea de cuál puede ser el valor, se
utiliza el máximo valor de p que hace máxima la varianza o desviación estándar y, por lo tanto,
se obtiene un valor máximo de n. Para el ejemplo considerado desconocemos el valor de p,
usando p=0.50.
𝑧𝑐 2 1.96 2
𝑛 = ( ) ∗ 𝑝 ∗ (1 − 𝑝) = ( ) ∗ 0.5 ∗ 0.5
𝑑 0.06
# Cálculo de tamaño de muestra para proporciones usando R
p=0.5
zc=1.96
d=0.06
(n= (zc/d*p) ^2)
## [1] 266.7778
𝑛 ≈ 267
Página 4 de 7
La muestra máxima que debe usarse para estimar el número de estudiantes, con un margen de
error de 6%, es de 267. Considerando que se trata de una población finita no muy grande 1500
estudiantes, se hace la corrección para población finita muestreada sin reemplazo:
𝑛0 267
𝑛= 𝑛0 =
1 + 𝑁 1 + 267
1500
Usando R
n=267
> N=1500
> n0=n
> n= n0/ (1+n0/N);n
[1] 226.6553
𝑛 ≈ 227
Adoptando la expresión para la corrección para población finita, se tiene que el tamaño de
muestra es de 227, que reduce en 40 unidades el tamaño de muestra sin ajustar. Que podría
considerarse despreciable, por la facilidad del manejo de la base de datos de los correos.
4.4.3. SECCIÓN DE EJERCICIOS.
1. Un fabricante de ropa desea conocer la proporción de estudiantes de secundaria, de una

cabecera municipal, que usa la “ropa” que produce. Él cree que esa proporción no es
mayor del 30%, y desea estimarla con un error no mayor de 4 puntos porcentuales (p ±
0.04) y con una confianza del 95%.
¿Qué tamaño de muestra le recomendaría utilizar?
2. En la región costera de un país hay 350 escuelas públicas. Se desea estimar la proporción
de pupitres por reemplazar por su mal estado, se decide hacer un estudio directo en una
muestra de escuelas. Por una investigación realizada varios años antes, se estima que σ=
0.49. ¿Qué tamaño de muestra sugeriría utilizar, sabiendo que interesa un margen de
error no mayor a 5 puntos porcentuales y un 90% de estimación?
3. Supongamos que una empresa de telefonía móvil desea determinar el porcentaje actual
de clientes mayores de 50 años que usan mensajes de texto en sus teléfonos celulares.
¿Cuántos clientes de más de 50 años debería encuestar la empresa para tener un 90% de
Página 5 de 7
confianza de que la proporción estimada (muestra) está dentro de tres puntos

porcentuales de la proporción real de la población de clientes mayores de 50 años que
usan mensajes de texto en sus teléfonos celulares?
4. Supongamos que una empresa de marketing en Internet quiere determinar el porcentaje
actual de clientes que hacen clic en anuncios en sus teléfonos inteligentes. ¿Cuántos
clientes debería encuestar la empresa para tener un 90% de confianza de que la
proporción estimada se encuentra dentro de los cinco puntos porcentuales de la
proporción real de la población de clientes que hacen clic en los anuncios en sus teléfonos
inteligentes?
5. Graﬁque el error estándar de la proporción contra el tamaño muestral n y enlace los
puntos con una curva suave. Dejando fijo p ¿Cuál es el efecto de aumentar el tamaño
muestral sobre el error estándar?
6. En igualdad de condiciones, el margen de error será mayor para un intervalo de confianza
del 90% o un intervalo de confianza del 95%.
7. En igualdad de condiciones, ¿qué ocurre con el margen de error a medida que aumenta
el tamaño de la muestra?
8. Supongamos que estamos llevando a cabo una encuesta universitaria para determinar si
los estudiantes respaldan un aumento de $ 10 por año en las cuotas de pago para mejorar
las instalaciones deportivas, ¿qué tan grande debe ser una muestra para asegurarse de
que el margen de error sea menor a 0.04 con una confianza del 95%?
9. Una estimación reciente de la calificación de aprobación de la Asamblea Legislativa fue
del 17%. ¿Qué tamaño de muestra sugiere esta calificación que deberíamos usar para un
margen de error de ± 0.04 con una confianza del 90%?
10. Las compañías de auditoría generalmente seleccionan una muestra aleatoria de los
clientes de un banco y verifican los balances contables reportados por el banco. Si una
compañía de este tipo se encuentra interesada en estimar la proporción de cuentas para
las cuales existe una discrepancia entre el cliente y el banco. ¿Cuántas cuentas deberán
seleccionarse de manera tal que con una confiabilidad del 99% la proporción muestral se
encuentra a no más de 0.02 unidades de la proporción real?
ENLACES SUGERIDOS
http://www.randomservices.org/random/apps/SpecialSimulation.html
https://www.uv.es/ceaces/
Página 6 de 7
https://www.bioestadistica.uma.es/analisis/teoremacentral/
http://www.stats.gla.ac.uk/steps/glossary/confidence_intervals.html
http://www.randomservices.org/random/
REFERENCIAS BIBLIOGRÁFICAS
1. Canavos, G., (1998), Probabilidad y estadística: Aplicaciones y métodos, Mexico, D.F.,

McGraw-Hill/Interamericana de Mexico S.A. de C.V.
2. Diez, D., Barr C., Rundel, M., (2015). Advanced High School Statistics (1a. ed.), Retomado
de: https://www.openintro.org/download.php?file=ahss1&referrer=/stat/textbook.php
3. Gómez, M., (2016). Elementos de Estadística Descriptiva (5a.ed.), San José, Costa Rica,
Editorial Universidad Estatal a Distancia.
4. Illowsky, B., Dean, S., (2017). Introductory Statistics, Houston, Texas, U.S.A. OpenStax,
Rice University, Retomado de: https://d3bxy9euw4e147.cloudfront.net/oscms-
prodcms/media/documents/Statistics-OP.pdf
5. Mendenhall, W., Beaver, R., Beaver, B., (2010). Introducción a la Probabilidad y Estadística
(13ª ed.) Mexico, D.F., Cengage Learning Editores S.A de C.V.
6. San Segundo, F., Marvá, M., (2016). PostData 1.0 Una Introducióna los conceptos de la
Estadística, pensado para principiantes, Retomado de: http://www.postdata-
statistics.com/IntroEstadistica/Curso/000-CursoEstadistica-color.pdf
7. Yakir, B., (2011). Introduction to Statistical Thinking (With R, Without Calculus), Retomado
de: http://pluto.huji.ac.il/~msby/StatThink/IntroStat.pdf
GLOSARIO
Una muestra aleatoria es una secuencia de variables aleatorias independientes, distribuidas de

forma idéntica (IID).
Estadístico: es una función computable definida en el espacio muestral S.
Media muestral: es simplemente el promedio aritmético de los valores de muestra.
Página 7 de 7
Margen de error: es una estadística que expresa la cantidad de error de muestreo aleatorio en
los resultados de una encuesta.
Estimador: es una función que asigna el espacio de muestra a un conjunto de estimaciones de

muestra.
Estimación puntual: es el proceso de estimación de un parámetro a partir de una distribución de

probabilidad, basada en datos observados de la distribución.
Intervalo de confianza: es un rango estimado de valores que probablemente incluya un

parámetro de población desconocido, y el rango estimado se calcula a partir de un conjunto dado
de datos en la muestra.
Los límites de confianza: son los límites / valores inferior y superior de un intervalo de confianza,
es decir, los valores que definen el rango de un intervalo de confianza.
Intervalo de confianza para una media: especifica un rango de valores dentro del cual puede
estar el parámetro de población desconocida, en este caso la media.
El nivel de confianza: es el valor de probabilidad asociado con un intervalo de confianza.
Intervalo de confianza para una media: especifica un rango de valores dentro del cual puede estar
el parámetro de población desconocida, en este caso la media.

Inferencia Estadística Tema 4.4

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Inferencia Estadística Tema 4.4

Încărcat de

Drepturi de autor:

Formate disponibile

UNIVERSIDAD DE EL SALVADOR EN LÍNEA

FACULTAD DE INGENIERÍA Y ARQUITECTURA

4.4 DETERMINACIÓN DE TAMAÑO DE MUESTRA.

4.4 DETERMINACIÓN DE TAMAÑO DE MUESTRA.

4.4.1 Determinación de tamaño de muestra para la media.

4.4.2 Determinación del tamaño de muestra para la proporción

Suponga que la Facultad de Ingeniería y Arquitectura de la Universidad de El Salvador en Línea,

Realizando la sustitución correspondiente, se llega a la fórmula:

4.4.3. SECCIÓN DE EJERCICIOS.

1. Un fabricante de ropa desea conocer la proporción de estudiantes de secundaria, de una

confianza de que la proporción estimada (muestra) está dentro de tres puntos

1. Canavos, G., (1998), Probabilidad y estadística: Aplicaciones y métodos, Mexico, D.F.,

Una muestra aleatoria es una secuencia de variables aleatorias independientes, distribuidas de

Estadístico: es una función computable definida en el espacio muestral S.

Media muestral: es simplemente el promedio aritmético de los valores de muestra.

Estimador: es una función que asigna el espacio de muestra a un conjunto de estimaciones de

Estimación puntual: es el proceso de estimación de un parámetro a partir de una distribución de

Intervalo de confianza: es un rango estimado de valores que probablemente incluya un

El nivel de confianza: es el valor de probabilidad asociado con un intervalo de confianza.

S-ar putea să vă placă și