Documente Academic
Documente Profesional
Documente Cultură
Es la actividad por la cual se toman ciertas muestras de una población de elementos de los cuales
vamos a tomar ciertos criterios de decisión, el muestreo es importante porque a través de él
podemos hacer análisis de situaciones de una empresa o de algún campo de la sociedad.
DISTRIBUCIÓN EN EL MUESTREO:
Cuando el tamaño de la muestra (n) es más pequeño que el tamaño de la población (N), dos o
más muestras pueden ser extraídas de la misma población. Un cierto estadístico puede ser
calculado para cada una de las muestras posibles extraídas de la población. Una distribución del
estadístico obtenida de las muestras es llamada la distribución en el muestreo del estadístico.
Por ejemplo, si la muestra es de tamaño 2 y la población de tamaño 3 (elementos A, B, C), es
posible extraer 3 muestras ( AB, BC Y AC) de la población. Podemos calcular la media para
cada muestra. Por lo tanto, tenemos 3 medias muéstrales para las 3 muestras. Las 3 medias
muéstrales forman una distribución. La distribución de las medias es llamada la distribución de
las medias muéstrales, o la distribución en el muestreo de la media. De la misma manera, la
distribución de las proporciones (o porcentajes) obtenida de todas las muestras posibles del
mismo tamaño, extraídas de una población, es llamada la distribución en el muestreo de la
proporción.
ERROR ESTÁNDAR:
La desviación estándar de una distribución, en el muestreo de un estadístico, es frecuentemente
llamada el error estándar del estadístico. Por ejemplo, la desviación estándar de las medias de
todas las muestras posibles del mismo tamaño, extraídas de una población, es llamada el error
estándar de la media. De la misma manera, la desviación estándar de las proporciones de todas
las muestras posibles del mismo tamaño, extraídas de una población, es llamada el error estándar
de la proporción. La diferencia entre los términos "desviación estándar" y "error de estándar" es
que la primera se refiere a los valores originales, mientras que la última está relacionada
con valores calculados. Un estadístico es un valor calculado, obtenido con los elementos
incluidos en una muestra.
POBLACIÓN Y MUESTRA.
Población es el conjunto de todos los elementos objeto de nuestro estudio
Muestra es un subconjunto, extraído de la población, (mediante técnicas de muestreo) cuyo
estudio sirve para inferir características de toda la población.
Cuando se realiza un estudio de investigación, se pretende generalmente inferir o
generalizar resultados de una muestra a una población. Se estudia en particular a un reducido
número de individuos a los que tenemos acceso con la idea de poder generalizar los hallazgos a
la población de la cual esa muestra procede.
Este proceso de inferencia se efectúa por medio de métodos estadísticos basados en la
probabilidad.
La población: Representa el conjunto grande de individuos que deseamos estudiar y
generalmente suele ser inaccesible. Es, en definitiva, un colectivo homogéneo que reúne unas
características determinadas.
La muestra: Es el conjunto menor de individuos (subconjunto de la población accesible y
limitado sobre el que realizamos las mediciones o el experimento con la idea de obtener
conclusiones generalizables a la población).
MÉTODOS DE MUESTREO.
Sin reposición de los elementos: Cada elemento extraído se descarta para la subsiguiente
extracción. Por ejemplo, si se extrae una muestra de una "población" de bombillas para estimar la
vida media de las bombillas que la integran, no será posible medir más que una vez la bombilla
seleccionada.
Con reposición de los elementos: Las observaciones se realizan con remplazo de los individuos,
de forma que la población es idéntica en todas las extracciones. En poblaciones muy grandes, la
probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse con
reposición, aunque, realmente, no lo sea.
Con reposición múltiple: En poblaciones muy grandes, la probabilidad de repetir una extracción
es tan pequeña que el muestreo puede considerarse con reposición.
Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la extracción
de números aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto.
MUESTREO SISTEMÁTICO.
Se utiliza cuando el universo o población es de gran tamaño, o ha de extenderse en el tiempo.
Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda).
Luego hay que calcular una constante, denominada coeficiente de elevación:
K= N/n
Donde N es el tamaño de la población y n el tamaño de la muestra.
Para determinar en qué fecha se producirá la primera extracción hay que elegir al azar un número
entre 1 y K; de ahí en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es
conveniente tener en cuenta la periodicidad del fenómeno.
Esto quiere decir que si tenemos un determinado número de personas que es la población (N) y
queremos escoger de esa población un número más pequeño el cual es la muestra (n), dividimos
el número de la población por el número de la muestra que queremos tomar y el resultado de esta
operación será el intervalo, entonces escogemos un número al azar desde uno hasta el número del
intervalo, y a partir de este número escogemos los demás siguiendo el orden.
MUESTREO ESTRATIFICADO.
Consiste en la división previa de la población de estudio en grupos o clases que se suponen
homogéneos con respecto a alguna característica de las que se van a estudiar. A cada uno de
estos estratos se le asignaría una cuota que determinaría el número de miembros del mismo que
compondrán la muestra. Dentro de cada estrato se suele usar la técnica de muestreo sistemático,
una de las técnicas de selección más usadas en la práctica.
Según la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos,
existen dos técnicas de muestreo estratificado:
Asignación proporcional: el tamaño de la muestra dentro de cada estrato es proporcional al
tamaño del estrato dentro de la población.
Asignación óptima: la muestra recogerá más individuos de aquellos estratos que tengan más
variabilidad. Para ello es necesario un conocimiento previo de la población.
Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por separado las
opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede
haber cierta homogeneidad. En la asignación proporcional, si la población está compuesta de un
55% de mujeres y un 45 % de hombres, se tomaría una muestra que contenga también esos
mismos porcentajes de hombres y mujeres. En la asignación óptima, si todos los hombres
piensan igual, pero las mujeres son impredecibles, se tomaría una muestra con más del 55% de
mujeres.
Para una descripción general del muestreo estratificado y los métodos de inferencia asociados
con este procedimiento, suponemos que la población está dividida en h subpoblaciones o estratos
de tamaños conocidos N1, N2,..., Nh tal que las unidades en cada estrato sean homogéneas
respecto a la característica en cuestión. La media y la varianza desconocidas para el i-ésimo
estrato son denotadas por mi y si2, respectivamente.
MUESTREO NO PROBABILÍSTICO.
Es aquel para el que no se puede calcular la probabilidad de extracción de una determinada
muestra ya que no todos los sujetos tienen la misma probabilidad de ser elegidos. Por tal motivo,
se busca seleccionar a individuos que tienen un conocimiento profundo del tema bajo estudio y
se considera que la información aportada por esas personas es vital para la toma de decisiones.
DISTRIBUCIONES MUÉSTRALES.
La distribución muestral es lo que resulta de considerar todas las muestras posibles que pueden
ser tomadas de una población. Su estudio permite calcular la probabilidad que se tiene, dada una
sola muestra, de acercarse al parámetro de la población. Mediante la distribución muestral se
puede estimar el error para un tamaño de muestra dado.
La distribución de muestreo de una estadística es la distribución de esa estadística, considerada
como una variable aleatoria, cuando se deriva de una muestra aleatoria de tamaño n. Se puede
considerar como la distribución de la estadística para todas las muestras posibles de la misma
población de un tamaño de muestra dado. La distribución del muestreo depende de la
distribución subyacente de la población, la estadística que se considera, el procedimiento de
muestreo empleado y el tamaño de muestra utilizado. A menudo existe un considerable interés
en si la distribución muestral puede aproximarse mediante una distribución asintótica, que
corresponde al caso límite ya que el número de muestras aleatorias de tamaño finito, tomadas de
una población infinita y utilizadas para producir la distribución, tiende a infinito, o cuando se
toma una "muestra" del mismo tamaño infinito de esa misma población.
DISTRIBUCIONES MUÉSTRALES DE UNA POBLACIÓN: MEDIA, VARIANZA Y
PROPORCIÓN
Algunas distribuciones muestrales son de interés particular, como la de la Media. En este punto
se introduce las distribuciones muestrales de la Media, Varianza y proporción. Más adelante se
introducirá otras distribuciones.
a. MEDIA.
La distribución muestral de la Media depende de varias circunstancias como la distribución de la
población de la que se extrae las muestras:
1. La población se distribuye según el modelo Normal. La distribución de Medias
muestrales sigue el modelo Normal, con parámetros mu y sigma donde sigma al cuadrado
y n son la Varianza de la distribución poblacional y el tamaño de la muestra
respectivamente.
b. VARIANZA.
La distribución muestral del estimador de la Varianza, (la Cuasivarianza) es:
}}_{2})}
Diremos que {\displaystyle {\hat {\theta }}_{1}} es más eficiente que {\displaystyle {\hat
{\theta }}_{2}} . Un estimador es más eficiente (más preciso), por tanto, cuanto menor es
su varianza.
La eficiencia de los estimadores está limitada por las características de la distribución de
probabilidad de la muestra de la que proceden. El teorema de Cramér-Raodetermina que la
varianza de un estimador insesgado {\displaystyle {\hat {\theta }}} de un
parámetro {\displaystyle \theta } es, como mínimo,
{\displaystyle \mathrm {var} \left({\widehat {\theta }}\right)\geq {\frac {1}{\mathrm {E}
\left[\left[{\frac {\partial }{\partial \theta }}\log f(X;\theta )\right]^{2}\right]}}}
En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias muestrales es
(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución muestral son
los valores cuya función de distribución es igual a 0.975 y 0.025 respectivamente y se pueden
obtener en las tablas de la distribución Normal estandarizada o de funciones en aplicaciones
informáticas como Excel). Seguidamente generamos una muestra de la población y obtenemos
su Media, que es igual a 4.5. Si establecemos el intervalo alrededor de la Media muestral, el
parámetro poblacional (5.1) está incluido dentro de sus límites:
Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por esa razón, la
distancia desde m a la Media muestral es la misma que va de la Media muestral a m. En
consecuencia, si hacemos un muestreo con un número grande de muestras observamos que el
95% de las veces (aproximadamente) el valor de la Media de la población (m) se encuentra
dentro del intervalo definido alrededor de cada uno de los valores de la Media muestral. El
porcentaje de veces que el valor de m se halla dentro de alguno de los intervalos de confianza es
del 95%, y es denominado nivel de confianza.
Si queremos establecer un intervalo de confianza en que el % de veces que m se halle dentro del
intervalo sea igual al 99%, la expresión anterior es: