Sunteți pe pagina 1din 8

2.

Distribuciones de Muestreo Conceptos bsicos Para introducir los conceptos bsicos consideremos el siguiente ejemplo: Supongamos que estamos interesados en determinar el nmero medio de televisores por hogar en la ciudad de Caracas. Para ello consideraremos primeramente: Poblacin: Conjunto de personas u objetos de inters en una Investigacin. Ej: Todos los hogares de la ciudad de Caracas Muestra Es una porcin representativa de elementos de una poblacin, elegida para su examen o medicin directa. Note que generalmente es costoso el anlisis de todos los datos, as que se hace necesario realizar las mediciones de inters slo en una porcin representativa de la poblacin e inferir de ella resultados que corresponden a la poblacin entera. Ej: Medir la cantidad de televisores en un grupo de hogares de varias localidades, municipios de la ciudad de Caracas, escogidos aleatoriamente de manera conveniente. Parmetro Es cualquier caracterstica de una poblacin, como la media de la poblacin, la desviacin de la poblacin, etc. Ej: Nmero promedio de televisores por hogar en toda la ciudad de Caracas.

Estadstico Es cualquier caracterstica de una muestra, como la media de la muestra, la desviacin de la muestra, etc. Ej: Nmero promedio de televisores calculado slo a partir de los hogares que fueron seleccionados en la muestra.

Muestreo Proceso de seleccin de muestras, se utiliza cuando no es posible contar o medir todos los elementos de la poblacin objeto de estudio. Tipos de Muestreo Existen dos mtodos para seleccionar muestras de poblaciones: a) Muestreo no aleatorio o de juicio: Se emplea el conocimiento y la opinin personal para identificar aquellos elementos de la poblacin que deben incluirse en la muestra.

b) Muestreo aleatorio o de probabilidad: En el cual todos los elementos de la poblacin tienen la oportunidad de ser escogidos para la muestra. Dentro de este tipo de muestreo se encuentran: b.1) Muestreo aleatorio simple: el cual es un mtodo de seleccin de muestras que permite que cada muestra posible pueda ser elegida con la misma probabilidad. Por su parte cada elemento de la poblacin tiene la misma oportunidad igual de ser incluido en la muestra. b.2) Muestreo sistemtico: mtodo en el cual los elementos que se muestrearn se seleccionan de la poblacin en un intervalo uniforme que se mide con respecto al tiempo, al orden o al espacio. b.3) Muestreo estratificado: mtodo en el que la poblacin se divide en grupos homogneos, o estratos, y despus se toma una muestra aleatoria simple de cada estrato. Aqu la variabilidad dentro de cada grupo es pequea y entre los grupos es grande. b.4) Muestreo de racimo: mtodo en el que la poblacin se divide en grupos o racimos de elementos, y luego se selecciona una muestra aleatoria de estos racimos. La variabilidad dentro de cada grupo es grande y entre los grupos es pequea; es como si cada racimo fuese un pequea representacin de la poblacin en si mima. El seleccionar uno u otro tipo de muestreo depende del problema en cuestin. Analicemos nuestro ejemplo. Imagine que decidiramos seleccionar una muestra simple aleatoria para nuestro propsito, sto significara que podra darse el caso que la mayora de las familias seleccionadas para formar parte de la muestra fueran de un sitio de clase alta donde quizs las casas tienen mltiples habitaciones y cada una de ellas con un televisor, de manera que podramos concluir que el promedio de televisores por familia es mucho mayor que el que realmente es en promedio por vivienda en una familia venezolana. En este ejemplo, quizs fuese ms conveniente construir algunos estratos, que representen las diferentes zonas de Caracas, y de cada uno de ellos escoger de manera aleatoria un grupo de familia para realizar el estudio.

Error Muestral Es la diferencia entre el parmetro de la poblacin y el estadstico de la muestra utilizado para estimar el parmetro. Distribucin muestral Es una lista de todos los valores posibles de un estadstico y la probabilidad asociada a cada valor. Se considerarn la distribucin muestral de medias y la de proporciones.

Distribucin muestral de medias

1. Definicin: es la distribucin de probabilidad de todas las medias posibles de muestras de un tamao dado, n, de una poblacin.

2. Media de las medias muestrales: es el promedio de todos los valores posibles de las medias que se pueden generar mediante las diversas muestras aleatorias simples. Se puede demostrar que el valor esperado de las medias muestrales es igual a la media poblacional; es decir, E (x ) = x n se tiene que

x=

x
k

en donde k es el nmero de muestras.

3. Error estndar de la media: es la desviacin estndar de la distribucin de muestreo de la media, por lo que mide el grado en que se espera que varen las medias de las diferentes muestras de la media de la poblacin, debido al error aleatorio en el proceso de muestreo. Al disminuir el error estndar, el valor de cualquier media de muestra probablemente se acercar al valor de la media de la poblacin. (efecto del tamao de la muestra sobre el error tpico, es decir, a medida que aumenta el tamao de la muestra, se incrementa la precisin con la que se puede usar la media de muestra para estimar la media de la poblacin, sin embargo, rara vez vale la pena tomar muestras excesivamente grandes ya que el error estndar de la media vara inversamente con n , por lo que hay una utilidad decreciente en el muestreo). Usos: indica el tamao del error de azar que se ha cometido, y adems seala la probable precisin que obtendremos si utilizamos una estadstica de muestra para estimar un parmetro de poblacin. La distribucin muestral de medias tiene un error estndar igual a: Para poblacin infinita con n>30, muestreo con reemplazo

n n Para poblacin finita o muestreo sin reemplazo con 0,05 : N N-n = x N -1 n n estndar de la poblacin y n el tamao de la N -n se le denomina factor de correccin muestra. Al factor N -1 4. Teorema del lmite central: es un teorema a travs del cual se asegura que la distribucin de muestreo de la media se aproxima a la normal, al incrementarse el tamao de la muestra. Este teorema permite usar estadstica de muestra para hacer inferencias con respecto a los parmetros de la poblacin, sin saber nada sobre la forma de la distribucin de frecuencias de esa poblacin ms que lo que podamos obtener de la muestra. Para efectos prcticos el tamao de la muestra debe ser n
Nota: si la distribucin de la poblacin es bastante simtrica, la distribucin muestral de la media se aproxima a la normal si se seleccionan muestras pequeas.

o poblacin normal :

 1 # ' %  320)(&$#

    "! 

 

7 5 )64

 

Aplicaciones: Una aplicacin muy corriente y til de la distribucin muestral es determinar la probabilidad de que la media de una muestra caiga dentro de un intervalo determinado. Puesto que la distribucin muestral seguir una distribucin normal (ya sea porque la muestra se toma de una distribucin normal, o porque n teorema del lmite central garantice la normalidad en el proceso de muestreo), se podr utilizar la variable tipificada para obtener la informacin necesaria en la toma de decisiones. x z=
x

Ejemplo 2.1: El precio medio de ventas de casa nuevas en una ciudad americana es de $115 000 con una desviacin tpica de $25 000. Se toma una muestra aleatoria de 100 casas nuevas de esta ciudad. a)Cul es la probabilidad de que la media muestral de los precios de venta sea menor de $110 000? X: Precios de venta de las casas. Dado que el tamao de muestra n=100 > 30 podemos utilizar el Teorema Central del Lmite, as que tenemos que: x = = 115000

25000 = = 2500 10 n 110000 115000 P( X < 110000) = P Z < = (2) = 1 0.9772 = 0.0228. 2500 b) Cul es la probabilidad de que la media muestral se encuentre a menos de $500 de la media poblacional?

x =

P X < 500 = P( 114500 < X < 115500) = P(2 < Z < 2) = 0.9772 0.0228 = 0.9544
Ejemplo 2.2 Se ha tomado una muestra de 16 directores de 100 oficinas de una ciudad con el fin de estimar el tiempo medio diario que emplean en desplazarse hasta su trabajo. Si la media de los tiempos es de 87 minutos y la desviacin tpica de 20 minutos, calcule la probabilidad de que la media muestral sea menor de 100 minutos. Como la poblacin es finita y la muestra es sin reemplazo, debemos verificar si es o no necesario el empleo del factor de correccin para calcular el error muestral.

% $#

7 )5 4

Tenemos que: N = 100, n = 16 , Correccin. Entonces: x = 87

n = 0.16 > 0.05 , por lo que es necesario el Factor de N

x =

20 100 16 = 4.605 4 100 1

100 87 P(X < 100 ) = P Z < = (2.82) = 0.9976 4.605 Ejemplo 2.3: Supongamos que el incremento porcentual de los salarios de los funcionarios de todas las corporaciones medianas se distribuye normal con una media de 12.2% y una desviacin tpica de 3.6%. Si se toma una muestra aleatoria de nueve observaciones de esta poblacin, calcule la probabilidad de que el incremento medio muestral porcentual sea menor del 10%.
Como la distribucin de la poblacin es normal, tenemos que los parmetros de la distribucin muestral de la media son:

x = 12.2 3.6 = 1.2 x = 3 2.2 P(X < 10 ) = P Z < = (1.83) = 0.0306 1. 2


Es realmente muy poco probable que el incremento medio porcentual est por debajo del 10%. Distribucin muestral de proporcin 1. Definicin: es la distribucin de probabilidad de todos los valores posibles de la proporcin muestral ( p ). 2. Media de las proporciones muestrales: es la media de todos los valores posibles de las proporciones que se pueden generar mediante las diversas muestras aleatorias simples. Se puede demostrar que la media de las proporciones muestrales p ser igual a n de la poblacin). El valor esperado de las proporciones muestrales es igual a la proporcin poblacional; es decir, E ( p) = p . 3. Error estndar de la proporcin: es la desviacin estndar de la distribucin de muestreo de la proporcin, por lo que mide el grado en que se espera que varen las proporciones de las diferentes muestras de la proporcin de la poblacin, debido al error aleatorio en el proceso de muestreo.

  

La distribucin de muestreo tiene un error estndar igual a: Para poblacin infinita con n>30 o muestreo con reemplazo: p(1 p ) p = n n Para poblacin finita y muestreo sin reemplazo con > 0,05 N p (1 p ) N-n p = N -1 n n en la poblacin y n el tamao de la muestra. En ambos caso 4. Teorema del lmite central: es un teorema a travs del cual se asegura que la distribucin muestral de la proporcin se aproxima a la distribucin normal, al incrementarse el tamao de la muestra. Este teorema permite usar estadstica de muestra para hacer inferencias con respecto a los parmetros de la poblacin, sin saber nada sobre la forma de la distribucin de frecuencias de esa poblacin ms que lo que podamos obtener de la muestra. Para efectos prcticos el tamao de la muestra debe ser n n(1-p) deben ser mayores a 5. 5. Aplicaciones: una aplicacin muy corriente y til de distribucin muestral es determinar la probabilidad de que la proporcin de una muestra caiga dentro de un intervalo determinado. Puesto que la distribucin muestral seguir una distribucin normal (ya sea porque la muestra se toma de una distribucin normal, o porque n n como n(1 p ) deben p ser mayores a 5, (el teorema del lmite central garantiza la normalidad en el proceso de muestreo), se podr utilizar la variable tipificada para obtener la informacin necesaria en la toma de decisiones. p p z= Observacin: En la terminologa estadstica, la distribucin de muestreo que se obtendra al tomar todas las muestras de un tamao dado constituye una distribucin terica de muestreo. En la prctica, el tamao y el carcter de la mayor parte de las poblaciones impiden que los responsables de las decisiones tomen todas las muestras posibles de una distribucin de poblacin, sin embargo, se han desarrollado frmulas para estimar las caractersticas de estas distribuciones tericas de muestreo, haciendo innecesario que se recolecten grandes nmeros de muestras. En casi todos los casos, los responsables de las decisiones slo toman una muestra de la poblacin, calculan estadsticas para esa muestra y de esas estadsticas infieren algo sobre los parmetros de toda la poblacin. Ejemplo 2.4 Se toma una muestra de 250 casas de una poblacin de edificios antiguos para estimar la proporcin de casas de este tipo. Supongamos que el 30% de todos los edificios son

BA90827!532 0)('%!#! @ 1 $ $ 6 4 & 1 $ " & $ "  

`YYXWVU!0!T%S&EQPI!!GFE%EC $ $ 6 " & $ " $ R" H 4 D

  

% $# 

antiguos. Hallar la probabilidad de que la proporcin de edificios antiguos est entre 0.25 y 0.35. Tenemos que p = 0.3 y n = 250 , note que aqu la poblacin es infinita. As que

0.3 * 0.7 = 0.029 y con ello: 250 0.25 0.3 p 0.3 0.35 0.3 P(0.25 < p < 0.35) = P < < = (1.72) (1.72) = 0.9146 0.029 0.029 0.029

p =

p (1 p ) n

Es muy probable que la probabilidad de que la proporcin de edificios antiguos est en ese intervalo. Ejemplo 2.5: Se ha estimado que el 43% de los licenciados en economa consideran que es muy importante que se imparta un curso de tica en economa. De una poblacin de 800 estudiantes se tom una muestra de 80. Calcular la probabilidad de que ms de la mitad de ellos opinen de ese modo. En este necesitamos el factor de correccin dado que: n 80 = = 0.1 > 0.05 por lo que obtenemos : N 800 0.43 * 0.57 800 80 p = = 0.0525 80 800 1 La probabilidad que se nos pide es:

0.5 0.43 P( p > 0.5) = P Z > = P( Z > 1.33) = 1 (1.33) = 1 0.9082 = 0.0918 0.0525
Por tanto es pequea la probabilidad de que ms de la mitad de los estudiantes consideren necesario que se imparta tica en la licenciatura de economa.

S-ar putea să vă placă și