Documente Academic
Documente Profesional
Documente Cultură
1. Definición
El muestreo sistemático, es aquel que se realiza en un lugar donde pasan las unidades muéstrales
y se selecciona una unidad cada k elementos que pasan, hasta cumplir los n necesarios.
Ejemplos:
Ventajas
Es más económico, ya que se evita el proceso de la selección aleatoria y evita
la movilidad del encuestador.
Es más preciso cuando se tiene una movilidad constante de elementos
muéstrales, ya que muestrea uniformemente.
Procedimiento
Si se conoce N, el tamaño de la población, y si por experiencias anteriores, se
puede estimar n, entonces = N/n
El muestreo se realizará cada que pasen k elementos, es decir 1 en k.
Antes de iniciar el muestreo, se selecciona aleatoriamente un número entre 1 y
k, que ese será la primera muestra, después se sigue la regla de 1 en k.
En caso de desconocer N, se escoge n como un valor exploratorio y luego se
determina el valor de la muestra
Estimación de la media
El estimador de la media poblacional es la media muestral.
∑𝑦𝑖
𝑌̅ =
𝑛
INTERVALO DE CONFIANZA DE LA MEDIA
Para encontrar el intervalo de confianza para la media primero se encuentra la varianza
de la muestra:
̅)𝟐
∑(𝒚𝒊 − 𝒚
𝑺𝟐 =
𝒏−𝟏
Luego se obtiene la varianza de la media, que es menor que la varianza muestral, así que
se obtiene el estimador de la varianza de la media. Donde N es el tamaño de la población
y n es el tamaño de la muestra. Cuando N es muy grande, el factor del paréntesis se
puede eliminar
𝑆 2 𝑁−𝑛
𝑉̂ (𝑌̅)= ( )
𝑛 𝑁
∑𝑦𝑖 280
̅
𝑌= ̅
𝑌= = 18.67
𝑛 15
b) la varianza muestral es:
2
∑(𝑦𝑖− 𝑦)
𝑠2 =
𝑛−1
2
297.3335
𝑠 =
14
𝑠 2 = 21.24
c) la varianza de la media es:
𝑆 2 𝑁−𝑛
𝑉̂ (𝑌̅)= ( )
𝑛 𝑁
21.24 200−15
𝑉̂ (𝑌̅)= ( )
15 200
𝑉̂ (𝑌̅)=1.31
d) el limite del error es :
𝐵2
Se calcula el valor de D D= 4
𝑁ơ2
Se calcula n: n= (𝑁−1)𝐷+ơ2
Donde σ2 es la varianza poblacional o s2, que es su estimador
b) Si se conoce el valor mínimo y el máximo, el rango dividido entre cuatro puede ser un
estimador.
c) Obtener una pequeña muestra, luego calcular el tamaño de la muestra correcta utilizando los
datos ya recopilados.
Ejemplo
En una productora de chorizos se desea conocer el contenido de grasa promedio de la producción
diaria. Si al día se producen 200 productos y por experimentos previos se sabe que la varianza es
de 21.24 grs. Encontrar el tamaño de la muestra necesaria si se permite un error máximo de 1 grs.
El valor B = 1
12
El valor D es: D= = 0.25
4
200(21.24)
El valor de n es: n= (
200−1)0.25+(21.24)
El resultado se redondea a 60. La cantidad es muy alta porque el límite de error se seleccionó
muy pequeño.
1.96𝑠
n= ( )
𝐵
Donde s es la desviación estándar muestral y B es el error máximo permitido. Esta ecuación es
con el 95% de seguridad
Estimación del total de una variable
2
∑(𝑦𝑖− 𝑦)
𝑠2 =
𝑛−1
Luego se obtiene la varianza del estimador del total, se le agrega el término N porque se
multiplica por el total de elementos t etá al cuadrado porque está dentro de la varianza.
𝑆 𝑁−𝑛 2
𝑉̂ (𝑡̂)=𝑁 2 ( )
𝑛 𝑁
La varianza de la media se le obtiene la raiz cuadrada (se convierte a desviación estándar) y se
multiplica por 2, se le resta y se le suma a ala media y se conforma el intervalo con el 95% de
seguridad.
La media es 24.45
13 600−20
𝑉̂ (𝑡̂)=6002 ( )=226.154
20 600
El límite del error es:
𝐵2
Se calcula el valor de D D=
4𝑁2
𝑁ơ2
Se calcula n: n= (𝑁−1)𝐷+ơ2
Donde σ2 es la varianza poblacional o su estimador s2
EJEMPLO
En una huerta de 600 manzanos de primer año de producción se desea estimar el total de la
producción, pero primero se desea saber el tamaño de la muestra. En una muestra previa se
encontró una varianza de 13 kilos. El error máximo permitido es de 1000 kg.
El valor B = 1000
10002
El valor D es: D= =0.694
4(600)2
600(13)
El valor de n es: n= ( =18.8
600−1)0.694+13
nótese que el resultado se redondea al límite superior.
Para calcular el total se debe conocer N, es por eso que no existe ecuación simplificada para el
tamaño de la muestra.
MUESTREO POR CONGLOMERADOS
Por algunas razones naturales, los elementos muestral es se encuentran formando grupos, como
por ejemlo, las personas que viven en colonias de una ciudad, lo elementos de una caja de una
línea de producción, los clubes de personas, las áreas arboladas de un terreno, etc.
Como el objetivo del muestreo es levantar la mayor cantidad de información al menor costo, en
este tipo de casos lo más económico el encuestar a un elemento muestral y a todos sus vecinos,
así se ahorran los costos de un traslado del encuestador.
A este modelo de muestreo se llama “Por conglomerados”, ya que una vez seleccionado un
elemento para la muestra, se incluyen también a todos los elementos que estén alrededor de él.
A diferencia del muestreo estratificado, este muestreo no requiere que los elementos tengan
características homogéneas.
Características
Población N conglomerados
Conglomerado 1 conglomerado 2
Conglomerado 3 conglomerado 4
Se tienen N conglomerados
De los N conglomerados se obtiene una muestra de n conglomerado
Conglomerado 1 tamaño 𝑚1
Conglomerado 2 tamaño 𝑚2
Conglomerado 3 tamaño 𝑚3
1
m= ∑𝑛𝑖=1 𝑚𝑖
𝑛
El tamaño de toda la población se calcula de la siguiente manera:
M= ∑𝑁
𝑖=1 𝑚𝑖
Nótese que los parámetros marcados con “M” mayúscula se refieren a toda la población.
𝑀
̅=
𝑀
𝑁
Selección de la muestra.
Si los conglomerados son evidentes, se sigue un proceso aleatorio para su
selección, de lo contrario se selecciona aleatoriamente los elementos y
muestrear y después se identifica su conglomerado.
En cada conglomerado se obtiene una suma de la variable que se va a medir
(en este método se trabaja con la suma más que con la media)
A la suma de la variable de cada conglomerado se llamará 𝑌𝐼
Estimación de la media
Una vez seleccionados los conglomerados a muestrear, se obtiene de cada
uno su tamaño (mi) y la suma de la variable que se desea analizar (yi). Nótece
que es la suma de las variables, no la media.
CONGLOMERADO 𝑚𝑖 𝑦𝑖
1 32 125
2 28 136
3 25 145
4 27 134
5 26 135
6 30 128
Total 168 803
∑𝑛
𝑖=1 𝑦𝑖
Y=∑𝑛
𝑖=1 𝑚𝑖
803
Y= = 4.7797
168
𝑁−𝑛 ∑𝑛 ̅ 𝑚𝑖 )2
𝑖=1(𝑦𝑖 −𝑦
V(𝑦̅) = ( 𝑀 2
)
𝑁𝑛( ) 𝑛−1
𝑁
𝑛 2
2 ∑𝑖=1(𝑦𝑖 −𝑦𝑚𝑖 )
𝑆𝐶 = 𝑆𝐶2 =362.61
𝑛−1
Se determina el error máximo que se permite en los resultados. A este valor se le llamará B.
Las ecuaciones para encontrar el tamaño de la muestra son las siguientes:
𝐵2 𝑀
̅2 𝑁𝑆2𝐶
D= n=
4 𝑁2 𝐷+𝑆2𝐶
Si B=0.4
2268 2
(0.4)2 ( )
81
D= =31.36
4
El resultado es el número de conglomerados que se deben muestrear. El resultado se
redondea al entero superior
(81)(362.61)
n= ( =10.11 n=(11)
81)31.36+362.61
Ejemplo
Con el fin de determinar si es conveniente instalar una productora de yogurt
en cierto poblado, se desea conocer el consumo mensual por persona al mes.
De un total de 120 conglomerados detectados se establecieron 8
conglomerados con los resultados que se muestran. Estimar la media, su
intervalo de confianza y el tamaño adecuado de la muestra si el error máximo
es 0.2. El total de de personas estimado es de 10,000.
𝑁−𝑛 ∑𝑛 ̅ 𝑚𝑖 )2
𝑖=1(𝑦𝑖 −𝑦
V(𝑦̅) = ( 𝑀 2
)
𝑁𝑛( ) 𝑛−1
𝑁
120−8 691712.4
V(𝑦̅) = ( 10000 2) =1.66
120(8)( ) 8−1
120
∑𝑛
𝑖=1 𝑦𝑖
Y=∑𝑛
𝑖=1 𝑚𝑖
540
Y= = 0.89
601
El intervalo de confianza:
𝑛 2
2 ∑𝑖=1(𝑦𝑖 −𝑦𝑚𝑖 )
𝑆𝐶 = 𝑆𝐶2 = 138.342
𝑛−1
10000 2
𝐵2 𝑀
̅2 (0.2)2 ( )
120
D= D= =69.44
4 4
𝑁𝑆2𝐶 (120)(138.342)
n= n=( = 113.18
𝑁2 𝐷+𝑆2𝐶 120)69.44+138.342
n=114