Sunteți pe pagina 1din 9

TEORÍA DEL MUESTREO.

Es la actividad por la cual se toman ciertas muestras de una población de elementos de los cuales
vamos a tomar ciertos criterios de decisión, el muestreo es importante porque a través de él
podemos hacer análisis de situaciones de una empresa o de algún campo de la sociedad.

Terminología básica para el muestreo.


Los nuevos términos, los cuales son frecuentemente usados en inferencia estadística son:
ESTADÍSTICO: Un estadístico es una medida usada para describir alguna característica de
una muestra , tal como una media aritmética, una mediana o una desviación estándar de una
muestra.
PARÁMETRO: Un parámetro es una medida usada para describir alguna característica de una
población, tal como una media aritmética, una mediana o una desviación estándar de una
población.
Cuando los dos nuevos términos de arriba son usados, por ejemplo, el proceso de estimación en
inferencia estadística puede ser descrito como le proceso de estimar un parámetro a partir del
estadístico correspondiente, tal como usar una media muestral (un estadístico para estimar la
media de la población (un parámetro)).
Los símbolos usados para representar los estadísticos y los parámetros, en éste y los siguientes
capítulos, son resumidos en la tabla siguiente:

DISTRIBUCIÓN EN EL MUESTREO:
Cuando el tamaño de la muestra (n) es más pequeño que el tamaño de la población (N), dos o
más muestras pueden ser extraídas de la misma población. Un cierto estadístico puede ser
calculado para cada una de las muestras posibles extraídas de la población. Una distribución del
estadístico obtenida de las muestras es llamada la distribución en el muestreo del estadístico.
Por ejemplo, si la muestra es de tamaño 2 y la población de tamaño 3 (elementos A, B, C), es
posible extraer 3 muestras ( AB, BC Y AC) de la población. Podemos calcular la media para
cada muestra. Por lo tanto, tenemos 3 medias muéstrales para las 3 muestras. Las 3 medias
muéstrales forman una distribución. La distribución de las medias es llamada la distribución de
las medias muéstrales, o la distribución en el muestreo de la media. De la misma manera, la
distribución de las proporciones (o porcentajes) obtenida de todas las muestras posibles del
mismo tamaño, extraídas de una población, es llamada la distribución en el muestreo de la
proporción.
ERROR ESTÁNDAR:
La desviación estándar de una distribución, en el muestreo de un estadístico, es frecuentemente
llamada el error estándar del estadístico. Por ejemplo, la desviación estándar de las medias de
todas las muestras posibles del mismo tamaño, extraídas de una población, es llamada el error
estándar de la media. De la misma manera, la desviación estándar de las proporciones de todas
las muestras posibles del mismo tamaño, extraídas de una población, es llamada el error estándar
de la proporción. La diferencia entre los términos "desviación estándar" y "error de estándar" es
que la primera se refiere a los valores originales, mientras que la última está relacionada
con valores calculados. Un estadístico es un valor calculado, obtenido con los elementos
incluidos en una muestra.

POBLACIÓN Y MUESTRA.
Población es el conjunto de todos los elementos objeto de nuestro estudio
Muestra es un subconjunto, extraído de la población, (mediante técnicas de muestreo) cuyo
estudio sirve para inferir características de toda la población.
Cuando se realiza un estudio de investigación, se pretende generalmente inferir o
generalizar resultados de una muestra a una población. Se estudia en particular a un reducido
número de individuos a los que tenemos acceso con la idea de poder generalizar los hallazgos a
la población de la cual esa muestra procede.
Este proceso de inferencia se efectúa por medio de métodos estadísticos basados en la
probabilidad.
La población: Representa el conjunto grande de individuos que deseamos estudiar y
generalmente suele ser inaccesible. Es, en definitiva, un colectivo homogéneo que reúne unas
características determinadas.
La muestra: Es el conjunto menor de individuos (subconjunto de la población accesible y
limitado sobre el que realizamos las mediciones o el experimento con la idea de obtener
conclusiones generalizables a la población).

MÉTODOS DE MUESTREO.
Sin reposición de los elementos: Cada elemento extraído se descarta para la subsiguiente
extracción. Por ejemplo, si se extrae una muestra de una "población" de bombillas para estimar la
vida media de las bombillas que la integran, no será posible medir más que una vez la bombilla
seleccionada.
Con reposición de los elementos: Las observaciones se realizan con remplazo de los individuos,
de forma que la población es idéntica en todas las extracciones. En poblaciones muy grandes, la
probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse con
reposición, aunque, realmente, no lo sea.
Con reposición múltiple: En poblaciones muy grandes, la probabilidad de repetir una extracción
es tan pequeña que el muestreo puede considerarse con reposición.
Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la extracción
de números aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto.

MUESTREO SISTEMÁTICO.
Se utiliza cuando el universo o población es de gran tamaño, o ha de extenderse en el tiempo.
Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda).
Luego hay que calcular una constante, denominada coeficiente de elevación:
K= N/n
Donde N es el tamaño de la población y n el tamaño de la muestra.

Para determinar en qué fecha se producirá la primera extracción hay que elegir al azar un número
entre 1 y K; de ahí en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es
conveniente tener en cuenta la periodicidad del fenómeno.
Esto quiere decir que si tenemos un determinado número de personas que es la población (N) y
queremos escoger de esa población un número más pequeño el cual es la muestra (n), dividimos
el número de la población por el número de la muestra que queremos tomar y el resultado de esta
operación será el intervalo, entonces escogemos un número al azar desde uno hasta el número del
intervalo, y a partir de este número escogemos los demás siguiendo el orden.

MUESTREO ESTRATIFICADO.
Consiste en la división previa de la población de estudio en grupos o clases que se suponen
homogéneos con respecto a alguna característica de las que se van a estudiar. A cada uno de
estos estratos se le asignaría una cuota que determinaría el número de miembros del mismo que
compondrán la muestra. Dentro de cada estrato se suele usar la técnica de muestreo sistemático,
una de las técnicas de selección más usadas en la práctica.
Según la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos,
existen dos técnicas de muestreo estratificado:
Asignación proporcional: el tamaño de la muestra dentro de cada estrato es proporcional al
tamaño del estrato dentro de la población.
Asignación óptima: la muestra recogerá más individuos de aquellos estratos que tengan más
variabilidad. Para ello es necesario un conocimiento previo de la población.
Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por separado las
opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede
haber cierta homogeneidad. En la asignación proporcional, si la población está compuesta de un
55% de mujeres y un 45 % de hombres, se tomaría una muestra que contenga también esos
mismos porcentajes de hombres y mujeres. En la asignación óptima, si todos los hombres
piensan igual, pero las mujeres son impredecibles, se tomaría una muestra con más del 55% de
mujeres.
Para una descripción general del muestreo estratificado y los métodos de inferencia asociados
con este procedimiento, suponemos que la población está dividida en h subpoblaciones o estratos
de tamaños conocidos N1, N2,..., Nh tal que las unidades en cada estrato sean homogéneas
respecto a la característica en cuestión. La media y la varianza desconocidas para el i-ésimo
estrato son denotadas por mi y si2, respectivamente.

MUESTREO NO PROBABILÍSTICO.
Es aquel para el que no se puede calcular la probabilidad de extracción de una determinada
muestra ya que no todos los sujetos tienen la misma probabilidad de ser elegidos. Por tal motivo,
se busca seleccionar a individuos que tienen un conocimiento profundo del tema bajo estudio y
se considera que la información aportada por esas personas es vital para la toma de decisiones.

MUESTREO POR CUOTAS.


Es la técnica más difundida sobre todo en estudios de mercado y sondeos de opinión. En primer
lugar, es necesario dividir la población de referencia en varios estratos definidos por algunas
variables de distribución conocida (como el género o la edad). Posteriormente se calcula el peso
proporcional de cada estrato, es decir, la parte proporcional de población que representan.
Finalmente se multiplica cada peso por el tamaño de n de la muestra para determinar la cuota
precisa en cada estrato. Se diferencia del muestreo estratificado en que una vez determinada la
cuota, el investigador es libre de elegir a los sujetos de la muestra dentro de cada estrato.

MUESTREO DE BOLA DE NIEVE.


Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas, pero en
contacto entre sí. Consiste en identificar sujetos que se incluirán en la muestra a partir de los
propios entrevistados. Partiendo de una pequeña cantidad de individuos que cumplen los
requisitos necesarios, servirán como localizadores de otros con características análogas.

MUESTREO SUBJETIVO POR DECISIÓN RAZONADA.


En este caso las unidades de la muestra se eligen en función de algunas de sus características de
manera racional y no casual. Una variante de esta técnica es el muestreo compensado o
equilibrado, en el que se seleccionan las unidades de tal forma que la media de la muestra para
determinadas variables se acerque a la media de la población. La cual funciona sobre la base de
referencias o por recomendación, después se reconoce por medio de la estadística.

DISTRIBUCIONES MUÉSTRALES.
La distribución muestral es lo que resulta de considerar todas las muestras posibles que pueden
ser tomadas de una población. Su estudio permite calcular la probabilidad que se tiene, dada una
sola muestra, de acercarse al parámetro de la población. Mediante la distribución muestral se
puede estimar el error para un tamaño de muestra dado.
La distribución de muestreo de una estadística es la distribución de esa estadística, considerada
como una variable aleatoria, cuando se deriva de una muestra aleatoria de tamaño n. Se puede
considerar como la distribución de la estadística para todas las muestras posibles de la misma
población de un tamaño de muestra dado. La distribución del muestreo depende de la
distribución subyacente de la población, la estadística que se considera, el procedimiento de
muestreo empleado y el tamaño de muestra utilizado. A menudo existe un considerable interés
en si la distribución muestral puede aproximarse mediante una distribución asintótica, que
corresponde al caso límite ya que el número de muestras aleatorias de tamaño finito, tomadas de
una población infinita y utilizadas para producir la distribución, tiende a infinito, o cuando se
toma una "muestra" del mismo tamaño infinito de esa misma población.
DISTRIBUCIONES MUÉSTRALES DE UNA POBLACIÓN: MEDIA, VARIANZA Y
PROPORCIÓN
Algunas distribuciones muestrales son de interés particular, como la de la Media. En este punto
se introduce las distribuciones muestrales de la Media, Varianza y proporción. Más adelante se
introducirá otras distribuciones.
a. MEDIA.
La distribución muestral de la Media depende de varias circunstancias como la distribución de la
población de la que se extrae las muestras:
1. La población se distribuye según el modelo Normal. La distribución de Medias
muestrales sigue el modelo Normal, con parámetros mu y sigma donde sigma al cuadrado
y n son la Varianza de la distribución poblacional y el tamaño de la muestra
respectivamente.

2. La población no sigue la distribución Normal. En este caso la distribución de Medias


muestrales se acerca al modelo Normal (con los mismos parámetros que hemos visto al
apartado a) cuanto mayor sea el tamaño de la muestra.

b. VARIANZA.
La distribución muestral del estimador de la Varianza, (la Cuasivarianza) es:

Donde n es el número de grados de libertad.


c. PROPORCIÓN.
La distribución de p aproxima la distribución Normal con parámetros

si el producto np es mayor que 5.


Ejemplo: La distribución muestral de la proporción de "suspenso" en un muestreo aleatorio en
que el número de muestras es igual a 10000, el tamaño de la muestra es igual a 20 y la
probabilidad de obtener "suspenso" es igual 0.3 es
TEORÍA DE LA ESTIMACIÓN.
Los administradores utilizan las estimaciones porque se deben tomar decisiones racionales, sin
que tengan la información pertinente completa y con una gran incertidumbre acerca de lo que
pueda deparar el futuro, pero con la esperanza de que las estimaciones posean una semejanza
razonable con el resultado
Estimador: Es la regla o procedimiento, expresado en general por medio de una fórmula, que se
utiliza para deducir la estimación.
Estimación: Es un valor específico observado de un estimador, por lo que asigna un valor
numérico a un parámetro de una población sobre la base de datos de muestra.
Estimación puntual.
Consiste en un solo estadístico muestral que se usa para estimar el valor verdadero de un
parámetro de una población que es desconocido. Por ejemplo, la media muestral x es una
estimador puntual de la media poblacional μ.
Cuando usamos una estimación puntual, sabemos que, aunque usemos un método bueno de
estimación es prácticamente improbable que el valor de la estimación coincida con el verdadero
valor del parámetro, así que sería conveniente acompañar nuestra estimación con alguna medida
que nos permitiera expresar la cercanía del estimador al parámetro. Una solución a ello no lo
brindan los estimadores por Intervalos de Confianza.
Consiste en la estimación del valor del parámetro mediante un sólo valor, obtenido de una
fórmula determinada. Por ejemplo, si se pretende estimar la talla media de un determinado grupo
de individuos, puede extraerse una muestra y ofrecer como estimación puntual la talla media de
los individuos. Lo más importante de un estimador, es que sea un estimador eficiente. Es decir,
que sea insesgado(ausencia de sesgos) y estable en el muestreo o eficiente (varianza mínima)
Estimación puntual. Sea X una variable poblacional con distribución Fθ , siendo θ desconocido.
El problema de estimación puntual consiste en, seleccionada una muestra X1, ..., Xn, encontrar
el estadístico T(X1, ..., Xn) que mejor estime el parámetro θ. Una vez observada o realizada la
muestra, con valores x1, ..., xn, se obtiene la estimación puntual de θ, T(x1, ..., xn) = ˆ θ .
Vemos a continuación dos métodos para obtener la estimación puntual de un parámetro: método
de los momentos y método de máxima verosimilitud. Método de los momentos: consiste en
igualar momentos poblacionales a momentos muestrales. Deberemos tener tantas igualdades
como parámetros a estimar. Momento poblacional de orden r αr = E(Xr) Momento muestral de
orden r ar = Xn i=1 Xr i n
Método de máxima verosimilitud: consiste en tomar como valor del parámetro aquel que
maximice la probabilidad de que ocurra la muestra observada. Si X1, ..., Xn es una muestra
seleccionada de una población con distribución Fθ o densidad fθ(x), la probabilidad de que
ocurra una realización x1, ..., xn viene dada por: Lθ(x1, ..., xn)
PROPIEDADES DEL ESTIMADOR PUNTUAL.
Sesgo: Se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor esperado)
del estimador y el verdadero valor del parámetro a estimar. Es deseable que un estimador
sea insesgado o centrado, es decir, que su sesgo sea nulo por ser su esperanza igual al parámetro
que se desea estimar. Por ejemplo, si se desea estimar la media de una población, la media
aritmética de la muestra es un estimador insesgado de la misma, ya que su esperanza (valor
esperado) es igual a la media de la población.
En efecto, si una muestra X=(X1,X2,...,Xn)t procede de una población de media μ, quiere decir
que:

{\displaystyle E[X_{i}]=\mu } para cualquier i=1...n


La media aritmética o media presupuestal,

{\displaystyle {\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}} , con lo que, al


aplicar las propiedades de linealidad de la esperanza matemática se tiene que:

{\displaystyle ={\frac {1}{n}}\sum _{i=1}^{n}\mu ={\frac


{1}{n}}n\mu =\mu }
Eficiencia
Diremos que un estimador es más eficiente o más preciso que otro estimador, si la varianza del
primero es menor que la del segundo. Por ejemplo, si {\displaystyle {\hat {\theta }}_{1}}
{\displaystyle {\hat {\theta }}_{2}} son ambos estimadores de {\displaystyle \theta } y

{\displaystyle \operatorname {Var} ({\hat {\theta }}_{1})<\operatorname {Var} ({\hat {\theta

}}_{2})}
Diremos que {\displaystyle {\hat {\theta }}_{1}} es más eficiente que {\displaystyle {\hat
{\theta }}_{2}} . Un estimador es más eficiente (más preciso), por tanto, cuanto menor es
su varianza.
La eficiencia de los estimadores está limitada por las características de la distribución de
probabilidad de la muestra de la que proceden. El teorema de Cramér-Raodetermina que la
varianza de un estimador insesgado {\displaystyle {\hat {\theta }}} de un
parámetro {\displaystyle \theta } es, como mínimo,
{\displaystyle \mathrm {var} \left({\widehat {\theta }}\right)\geq {\frac {1}{\mathrm {E}
\left[\left[{\frac {\partial }{\partial \theta }}\log f(X;\theta )\right]^{2}\right]}}}

Donde {\displaystyle f(X;\theta )} es la función de densidad de probabilidad de la


muestra {\displaystyle X=(X_{1},X_{2},\cdots ,X_{n})^{t}} en función del
parámetro {\displaystyle \theta } , (denominada función de verosimilitud). Si un estimador
insesgado alcanza esta cota mínima, entonces se dice que el estimador es de mínima
varianza dentro de los estimadores insesgados, pudiendo existir estimadores sesgado con
varianza menor.
ESTIMACIÓN POR INTERVALO.
La estimación por intervalos consiste en establecer el intervalo de valores donde es más probable
se encuentre el parámetro. La obtención del intervalo se basa en las siguientes consideraciones:
a. Si conocemos la distribución muestral del estimador podemos obtener las
probabilidades de ocurrencia de los estadísticos muestrales.
b. Si conociéramos el valor del parámetro poblacional, podríamos establecer la
probabilidad de que el estimador se halle dentro de los intervalos de la
distribución muestral.
c. El problema es que el parámetro poblacional es desconocido, y por ello el
intervalo se establece alrededor del estimador. Si repetimos el muestreo un gran
número de veces y definimos un intervalo alrededor de cada valor del estadístico
muestral, el parámetro se sitúa dentro de cada intervalo en un porcentaje conocido
de ocasiones. Este intervalo es denominado "intervalo de confianza".
Ejemplo:
Se generan 100000 muestras aleatorias (n=25) de una población que sigue la distribución
Normal, y resulta:
La distribución de las Medias muestrales aproxima al modelo Normal:

En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias muestrales es

(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución muestral son
los valores cuya función de distribución es igual a 0.975 y 0.025 respectivamente y se pueden
obtener en las tablas de la distribución Normal estandarizada o de funciones en aplicaciones
informáticas como Excel). Seguidamente generamos una muestra de la población y obtenemos
su Media, que es igual a 4.5. Si establecemos el intervalo alrededor de la Media muestral, el
parámetro poblacional (5.1) está incluido dentro de sus límites:

Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por esa razón, la
distancia desde m a la Media muestral es la misma que va de la Media muestral a m. En
consecuencia, si hacemos un muestreo con un número grande de muestras observamos que el
95% de las veces (aproximadamente) el valor de la Media de la población (m) se encuentra
dentro del intervalo definido alrededor de cada uno de los valores de la Media muestral. El
porcentaje de veces que el valor de m se halla dentro de alguno de los intervalos de confianza es
del 95%, y es denominado nivel de confianza.
Si queremos establecer un intervalo de confianza en que el % de veces que m se halle dentro del
intervalo sea igual al 99%, la expresión anterior es:

(Obtenemos el valor +-2.58 que multiplica la Desviación Típica de la distribución muestral en


las tablas de la distribución Normal estandarizada o de funciones en aplicaciones informáticas
como Excel), y son los valores cuya función de probabilidad es igual a 0.995 y 0.005
respectivamente).

S-ar putea să vă placă și