Documente Academic
Documente Profesional
Documente Cultură
Muestreo
Panorama General
Conceptos importantes Estadísticos: medidas
obtenidas de la
muestra.
1. Representativa
2. Aleatoriedad.
Dentro del total de los elementos que serán objeto de estudio, los elementos que
MUESTRA DE JUICIO
NO PROBABILÍSTICOS
ALEATORIO SIMPLE
PROBABILÍSTICOS SISTEMÁTICO
ESTRATIFICADA
RACIMOS O
CONGLOMERADO
Muestras No probabilísticas: Muestras probabilísticas:
1. Política. Las muestras de las opiniones de los votantes se usan para que los
candidatos midan la opinión pública y el apoyo en las elecciones.
2. Educación. Las muestras de las calificaciones de los exámenes de estudiantes
se usan para determinar la eficiencia de una técnica o programa de enseñanza.
3. Industria. Muestras de los productos de una línea de ensamble sirve para
controlar la calidad.
4. Medicina. Muestras de medidas de azúcar en la sangre de pacientes diabéticos
prueban la eficacia de una técnica o de un fármaco nuevo.
5. Agricultura. Las muestras del maíz cosechado en una parcela proyectan en la
producción los efectos de un fertilizante nuevo.
6. Gobierno. Una muestra de opiniones de los votantes se usaría para determinar
los criterios del público sobre cuestiones relacionadas con el bienestar y la
seguridad nacional.
Errores del muestreo
ERROR NO MUESTRAL:
ERROR MUESTRAL: Error que no depende del diseño muestral, sino del desarrollo
de la operación de campo, entre otros factores.
Se refiere a la variación natural existente
entre las muestras tomadas de la misma Es un error en las estimaciones de muestra que no pueden
atribuirse a las fluctuaciones del muestreo. [INEGI. 2012.
población.
Planeación y control administrativo en proyectos estadísticos.]
Z = nivel de confianza,
esperada
Q = probabilidad de fracaso
En donde,
Q = probabilidad de fracaso
El nivel de confianza habitual es de .05 (α = .05). El nivel de confianza va a entrar en la fórmula para
determinar el número de sujetos con un valor de zeta, que en la distribución normal está asociado
a una determinada probabilidad de ocurrencia.
2. La varianza (o diversidad de opiniones…) estimada en la población. Esta
diversidad en la población es la diversidad estimada; si la conociéramos (cuántos van a decir que
sí y cuántos van a decir que no) en primer lugar no necesitaríamos hacer la encuesta.
La varianza mayor (la mayor diversidad de respuestas) se da cuando p = q = .50 (la mitad de los
sujetos responde sí y la otra mitad responde no) por lo que en esta fórmula [1] pq es siempre
igual a (.50)(.50) = .25 (es una constante).
Si por ejemplo el 20% de la muestra está de acuerdo con una proposición (o dice que va votar a
un determinado candidato o que prefiere un determinado producto) eso no significa que el 20%
exacto de la población vaya a responder lo mismo, puede ser el 22% o el 18%… necesitaremos
muestras mayores si queremos que el margen de error o de oscilación de muestra a muestra de
los resultados sea muy pequeño (el resultado exacto lo tendríamos si respondiera el 100% y la
muestra coincidiera con la población).
¿Cómo conozco el nivel de confianza?
Ejemplos:
nN
Ejemplos:
1. Para una muestra de 30 alumnos se obtuvo una nota media en el
último exámen de matemáticas de 5.83 con una desviación típica
de 1.92. Determina el intervalo de confianza al 80%.
167, 167,168, 168, 168, 169, 171, 172, 173, 175, 175, 175,
177, 182, 195
Del ejercicio anterior,
Sin embargo, una muestra debe recogerse de forma aleatoria para que
represente fielmente a toda la población de la que proviene. Usted debe
planificar cuidadosamente su proceso de recolección de datos para asegurarse
de que la muestra sea aleatoria. Además, el proceso o la población de donde se
toman los datos debe ser estable.
Las muestras deben ser aleatorias para eliminar el sesgo de
selección. Sesgo de selección significa que algunos sujetos tienen
más probabilidades que otros de estar en la muestra. Si la muestra
es sesgada, usted solo podrá hacer inferencias acerca de los
sujetos de la muestra, no acerca de toda la población.
Hospital 1 Hospital 2
Varianza
La varianza mide qué tan dispersos están los datos alrededor de la
media. La varianza es igual a la desviación estándar elevada al
cuadrado.
La ley de los grandes números
Te hago una pregunta personal: Si estás jugando a la ruleta
apostando en cada turno por negro o rojo y ves que sale 6
veces seguidas el negro,
¿Cuál es tu siguiente apuesta? ¿Negro o rojo?
Born Joseph Hobson Jagger
2 September 1830
Bradford, Yorkshire
Nationalit British
y
Esta ley señala que si se lleva a cabo repetidas veces un mismo experimento (lanzar una
moneda, tirar una ruleta, etc), la frecuencia con la que se repetirá un determinado suceso
se acercará a una constante. Dicha constante será a su vez la probabilidad de que ocurra
este evento.
Ejemplo:
Supongamos el siguiente experimento: lanzar un dado común.
Ahora consideremos el evento de que nos salga el número 1. Como
sabemos, la probabilidad de que salga el número 1 es de 1/6 (el
dado tiene 6 caras, una de ellas es el uno).
¿Qué nos dice la Ley de los Grandes Números?, nos dice que a
medida que vamos aumentando el número de repeticiones de
nuestro experimento (hacemos más lanzamientos del dado), la
frecuencia con la que se repetirá el evento (nos sale 1) se acercará
cada más a una constante, que tendrá un valor igual a su
probabilidad (1/6 o 16,66%).
Tal como indica la Ley de los
grandes números, en los primeros
lanzamientos la frecuencia es
inestable pero a medida que
aumentamos el número de
lanzamientos, la frecuencia tiende
a estabilizarse a un cierto número
que es la probabilidad de que
ocurra el suceso (en este caso
números del 1 al 6 ya que se trata
del lanzamiento de un dado).
Teorema del Límite
central
El teorema del límite central es un teorema fundamental de probabilidad y estadística. El
teorema describe la distribución de la media de una muestra aleatoria proveniente de una
población con varianza finita. Cuando el tamaño de la muestra es lo suficientemente grande,
la distribución de las medias sigue aproximadamente una distribución normal.
El teorema de límite central le permite aplicar estos procedimientos útiles a poblaciones que
son considerablemente no normales.
Una población que sigue una distribución exponencial es asimétrica y no normal, como lo
demuestra el primer histograma. Sin embargo, la distribución de las medias de 1000 muestras
de tamaño 50 de esta población es aproximadamente normal debido al teorema del límite
central, como lo demuestra el segundo histograma. Este histograma de las medias de las
muestras incluye una curva normal superpuesta para ilustrar esta normalidad.
Asimetría:
Es el grado en que los datos no son simétricos. El hecho de que el valor de la
asimetría sea 0, positivo o negativo, revela información sobre la forma de los datos.