Sunteți pe pagina 1din 37

Universidad Evangélica de El Salvador

Maestría en Epidemiologia
Escuela de posgrado
Cátedra: Bioestadística descriptiva

Población y muestra

Dr. Rolando Masis López


Md, MPH, MEP, OETP
e-mail: rolando_masis@hotmail.com
Poblaciones de estudio
a. Población. Es un grupo completo de personas con un
grupo especifico de características acerca de los
cuales queremos hacer algunas inferencias.
b. Población blanco, diana u objetivo. Definida por las
características clínicas y demográficas de un grupo
de personas.
c. Población accesible o de estudio. Definida además
de las anteriores por las características geográficas y
temporales de un grupo de personas (población que
en realidad podemos estudiar)
Poblaciones de estudio
d. Muestra. Es un subconjunto de la población. Una
muestra puede ser probabilística (aleatoria) o no
probabilística.
e. Unidad elemental. Es una persona o un objeto que
esta sujeto a mediciones múltiples
f. Unidad de analisis. Es una persona o un objeto, en el
que se realizara la medición del estudio y de donde
se obtendrá la información estadística definida
Poblaciones de estudio
d. Muestra. Es un subconjunto de la población. Una
muestra puede ser probabilística (aleatoria) o no
probabilística.
e. Unidad elemental. Es una persona o un objeto que
esta sujeto a mediciones múltiples
f. Unidad de análisis. Es una persona o un objeto, en el
que se realizara la medición del estudio y de donde
se obtendrá la información estadística definida
Poblaciones de estudio

g. Marco muestral. Es una lista o mapa que


conforma la población, es el material básico
para la selección de la muestra. El marco
muestral debe contener todas las unidades de
muestreo que conforman la población bajo
estudio.
Criterios de inclusión

Clínicos

Población Geográficos
blanco
Población
accesible

Temporales

Demográficos
Criterios de exclusión
1. Definen el subgrupo de sujetos accesibles para el
estudio pero que además tienen características que
podrían interferir con la calidad de los datos o con la
aceptabilidad de la interpretación de los hallazgos o
incluir problemas éticos
2. Los criterios de exclusión deben ser aplicados
únicamente a aquellos sujetos que han cumplido
previamente los criterios de inclusión
3. No son simplemente la negación de los criterios de
inclusión
Tipo de muestreo
Muestreo probabilístico
 Es el estándar de oro para asegurar generalizabilidad
 Usa un proceso aleatorio para garantizar que cada
unidad de la población tenga una oportunidad
especifica de selección
 Es un enfoque científico y provee una base rigurosa
para estimar la fidelidad a través del cual fenómenos
observados en la muestra representan aquellos
existentes en la población
Métodos de muestreo
1. Probabilístico:
a. Aleatorio simple
b. Aleatorio sistemático
c. Conglomerados
d. Estratificado

2. No probabilístico
a. Cuotas
b. Conveniencia
Muestreo aleatorio simple
 Es extraído enumerando las unidades de la
población y seleccionando un subgrupo en forma
aleatoria
 Asigna a cada elemento de la población una misma
probabilidad de ser seleccionado
 El uso mas común es cuando uno tiene una lista de
población accesible mas grande que la que uno
necesita
 Ej: Necesitamos estudiar prematuros < 1500 gr al
nacer. Hacemos una lista de ellos y seleccionamos al
azar
Muestreo aleatorio simple

POBLACION
TOTAL
ACCESIBLE
Ventajas del MAS
 Es sencillo de aplicar
 Permite hacer generalizaciones
 Proporciona base para calcular el grado de
disparidad entre las medidas de la muestra y la
población (error por muestreo)
 Económicas que se derivan de no estudiar toda la
población
Desventajas del MAS
 Todos los individuos de la poblacion deben ser
numerados antes de la selección (Costos, consume
tiempo)
 Los individuos seleccionados pueden estar altamente
dispersos
 Ciertos subgrupos en la población pueden pasar por
alto en la selección
Muestreo aleatorio sistemático
 Se necesita enumerar la población completa de
elegibles
 Difiere del anterior al utilizar un proceso periodico
preordenado para seleccionar (se selecciona uno de
cada n)
Muestreo aleatorio sistemático
Procedimiento: Sea N tamaño de la población, y n el
tamaño de muestra, entonces, K=N/n son las n
divisiones de tamaño k que se hace a la población:
• De la primera división se selecciona i-ésimo elemento
al azar
• El próximo individuo será i +k, el siguiente i + 2k, y así
sucesivamente

Si N=20 y n=4, entonces k = 20/4 = 5


● ●● ●● ● ●● ●● ● ●● ●● ● ●● ●●

Selección 4+5 4+2(5) 4+3(5)


i=4
al azar
Muestreo aleatorio sistemático
 Ventajas
 Al igual que el aleatorio en éste es más fácil obtener la
muestra
 Es util en situaciones donde no se no conoce con
exactitud el tamaño de la población N
 Desventajas
 La selección está sesgada, i.e. la posicion de los
elementos de la muestra esta linealmente relacionada
Muestreo Aleatorio Estratificado
 Se divide la población en subgrupos de acuerdo a
características como sexo y edad. Después se toma
una muestra aleatoria para cada uno de los estratos
 Magnifica grupos de interés
 Se instala conformando proporciones artificiales de
grupos interesantes menos comunes
 Ej: Para estudiar incidencias de mortalidad en
HNNBB estratifico en neonatos y no neonatos
Muestreo Aleatorio Estratificado

1 2

3 4
Muestreo por Conglomerados
• Es una muestra aleatoria de agrupaciones naturales
de individuos en la población
• Es muy útil cuando la población esta muy dispersa y
es impráctico enlistarla y rifarla
• El problemas es que la población dentro de los
agrupamientos puede ser homogénea en cuanto a
algunas variables de interés
• A veces dificulta el análisis
Muestreo por Conglomerados
• Conglomerado = grupo de unidades de muestreo
relativamente “agrupadas” en espacio
• Cuando la población esta organizada en áreas
geográficas
• No necesita listas de la población
• Solo necesita población por localidad, barrio,
albergues, etc
Muestreo por Conglomerados
• Localización de los conglomerados seleccionada al
azar a partir de una lista de áreas geográficas.
• Las unidades de muestreo son seleccionadas al azar
dentro de cada área geográfica.

• Las unidades de un mismo cluster tienden a tener


características similares
 efecto de diseño
Muestreo por Conglomerados
Muestreo por Conglomerados
 Ventajas
 No necesita datos detallados
 Menor tiempo y costo para recolectar datos
 Desventajas
 Efecto de diseño
 Baja variabilidad intra-conglomerado
 Perdida de precisión
 Análisis complejo
Muestreo por Conglomerados
 Siempre al azar
 A partir del centro, escoger una direccion al azar
 Contar el # de casas hasta los limites
 Selección de 1 casa al azar
 Escoger la siguiente casa usando criterios
predeterminados (ej: puerta mas cercana)
 Completar el conglomerado
Muestreo no probabilístico
 Llamado también de conveniencia
 Mejora la logística del estudio
 Se acepta todo sujeto que cumple criterios hasta llenar
el tamaño requerido
 El mas conocido es el llamado de Casos consecutivos
 Este es especialmente deseable cuando es impráctico
obtener o esperar toda la población de elegibles
Muestreo no Probabilístico
 Cuotas
 Selección de «muestras» a partir de una distribución
conocida (sexo, edad, raza)
 # fijo de sujetos por grupo
 Conveniencia
 Selección de una población en función de su accesibilidad
(geográfica, etc…)
Calculo del tamaño de la muestra
1.Estudiar a todos los individuos de una población es la mejor
manera de Conocer características de la población, pero A qué
Costo?
2.Será posible generalizar conclusiones “confiables” a partir de
una Muestra hacia la Población.
3.Si es posible conseguir una Muestra, ¿Qué tan grande debe ser
esta muestra?
4.Son mejores las muestras pequeñas que las grandes?
5.De qué factores depende el calculo del tamaño de una
muestra?
De qué depende el cálculo de la muestra

 Recursos Disponibles (Ingresos)


 Objetivos del estudio
 Tiempo
 Precisión
 Distribución de la característica a medir
 Potencial para encontrar diferencias entre grupos
(Poder)
Población y muestra

Población

P, µ Muestra
p, x

Generalización
(Inferencia)
Tamaño de muestra para estudios de
Encuestas, estimando proporciones

Sea p la proporción en la población con la


característica de interés

(muchas veces desconocido) 
d d
N: Tamaño de la población
d: Precisión del estimador muestral p
n: Tamaño de la muestra p-d p+d
: Nivel de significancia, generalmente del
5%
Z: Un valor que depende del nivel de
significancia 
P: puede ser obtenido a través de estudios a
priori, estudios pilotos, experiencia del
investigador.
Estudios de encuesta

El tamaño de la muestra:

1. Si la población es infinita:

Z2 / 2 p(1  p)
n 2
(1)
d
2. Si la población es finita, un factor de corrección es incluida en (1)

NZ2 / 2 p(1  p)
n 2 (2)
d ( N  1)  Z 2 p(1  p)
Ejemplo
1. De un estudio piloto que se hizo a 50 niños de 4000 niños que
residen en una villa se encontró que 30 de ellos tenían ascariasis.
Calcular el tamaño de la muestra que debe ser seleccionada con un
95% de confianza, el estimador no debe diferir del verdadero en
mas de un 5%.

Solución: Usando la (2)

N = 4 000 NZ2 / 2 p(1  p)


n 2
d ( N  1)  Z 2 p(1  p)
p = 30/50 = 60%
4000(1.96) 2 (0.6)(0.4)
α = 1-0.95 = 0.05 n  337.74
(0.05) (3999)  (1.96) (0.6)(0.4)
2 2

Zα/2 = Z0.025
288 niños del estudio piloto son agregados
Ejemplo
2. Una agencia de salud desea saber para una región geográfica
qué proporción de pacientes admitidos al hospital por un
tratamiento de un trauma egresan muerto. Con un nivel de
confianza del 95% y una precisión del 3% y la proporción
poblacional a partir de evidencias es estimado por 0.20. Calcular
el tamaño de la muestra necesaria?

Usando la (1)
Solución:
Z / 2 p(1  p)
2

p = 0.20 n
α = 1 – 0.95 = 0.05
d2
d = 0.03 1.96 * 0.20 * (1  0.20)
n
Z0.05/2 = Z0.025 = 0.032
1.96 = 683
Tamaño de muestra ajustado a
pérdidas
Si durante el estudio se presenta:
1. Pérdidas de participantes
2. Abandono
3. No respuesta
El tamaño de la muestra deberá ser ajustados por estas
condiciones, por tanto el tamaño de la muestra será:

1
najustado  n( ) (3) R: proporción esperada de pérdidas
1 R
Del ejercicio 1, si se sabe que con anterioridad que la proporción
de NO RESPUESTA es del 10%, entonces el tamaño de muestra
ajustado a esta pérdida será de 348[1/(1-0.1)] = 387
Tamaños de muestras de poblaciones finitas (N1=1000,
N2=2000, N3=8456) a distintos niveles de prevalencia

p n1 n2 n3 100
0.1 34.45871 34.00358 34.44172 90

0.2 61.09618 59.66186 61.03637 80

0.3 80.03592 77.58294 79.92994 70


60
0.4 91.36516 88.17757 91.22532
50
0.5 95.13583 91.68321 94.98368
40
0.6 91.36516 88.17757 91.22532
30
0.7 80.03592 77.58294 79.92994
20 Distribución del tamaño de la muestra
0.8 61.09618 59.66186 61.03637 cuando N1=1000
10
0.9 34.45871 34.00358 34.44172
0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

El valor máximo que alcanza el tamaño de la muestra


ocurre cuando la prevalencia es del 50%.

S-ar putea să vă placă și