Sunteți pe pagina 1din 6

CAPITULO IV La teora de muestreo estudia la relacin entre una poblacin y las muestras extradas de ella.

Por ejemplo, para estimar magnitudes desconocidas de una poblacin (parmetros) a partir del conocimiento de esas magnitudes en las muestras (estadsticos). Tambin es til la teora de muestreo para determinar si las diferencias observadas entre dos muestras son debidas a variaciones fortuitas o si son realmente significativas. Por ejemplo, al probar dos procesos de produccin se puede decidir si uno es mejor que el otro. En general, un estudio de las inferencias hechas sobre una poblacin a partir de muestras suyas, indicando la precisin de tales inferencias; se llama inferencia estadstica. Para que las conclusiones de la teora de muestreo y de la inferencia estadstica sean vlidas, las muestras deben escogerse de forma tal que sean representativas de la poblacin. El anlisis de los mtodos de muestreo y los problemas relacionados con cada uno de ellos, se llama diseo de experimento. Hay varios tipos de muestreo, entre ellos se tienen: aleatorio, estratificado, sistemtico, por conglomerados. Adems el muestreo puede ser: con reposicin o sin reposicin. Si se selecciona un objeto de un sitio, se puede volver a colocarlo o no en el sitio, antes de realizar una segunda extraccin. En el primer caso ese objeto puede ser seleccionado ms de una vez, por lo cual recibe el nombre de muestro con reposicin. Mientras que en el segundo caso slo puede ser seleccionado una vez. Por tanto se llama muestreo sin reposicin. Las poblaciones son finitas e infinitas. Una poblacin finita en la que se efecte un muestreo con reposicin puede considerarse infinita. Para efectos prcticos, una poblacin muy grande se puede considerar como si fuese infinita. Distribuciones muestrales: Para hacer inferencias sobre una poblacin, es necesario examinar un poco ms los resultados muestrales. De una muestra se obtiene la media muestral x . Se puede esperar que el valor de x sea exactamente igual al valor de la media poblacional? La respuesta es no. Se espera que no sea as; pero sern satisfactorios los resultados muestrales si la media muestral est prxima al valor de la media poblacional. Si se toma una segunda muestra, tendr una media igual a la de la poblacin? Igual a la primera? Nuevamente debe responderse no. Sin embargo, se espera que los valores estn prximos. Este argumento debe cumplirse para cualquier otro estadstico y su correspondiente valor poblacional (parmetro). Las siguientes preguntas surgen en la mente: qu se entiende por prximo? Cmo se determina esa proximidad? Cmo es la distribucin de un estadstico cuando se ha muestreado repetidamente? Para contestar estas preguntas, se hablar de las distribuciones de muestreo o distribuciones muestrales. Distribucin de muestreo de un estadstico: Es la distribucin de valores del estadstico obtenida a partir de todas las muestras posibles del mismo tamao, de una poblacin dada. Si por ejemplo, el estadstico utilizado es la media muestral entonces la distribucin se llama distribucin muestral de medias. De manera similar, se pueden tener distribuciones muestrales de: varianza, desviacin estndar, proporciones, etc. Ejm 1: Considrese la media de cada muestra de tamao dos que puede ser seleccionada con reposicin del conjunto {0, 2, 4, 6,8}. N muestras posibles = 5.5 = 25

Hay 25 muestras posibles: (0, 0) (0, 2) (0, 4) (0, 6) (0, 8) (2, 0) (2, 2) (2, 4) (2, 6) (2, 8) (4, 0) (4, 2) (4, 4) (4, 6) (4, 8) (6, 0) (6, 2) (6, 4) (6, 6) (6, 8) (8, 0) (8, 2) (8, 4) (8, 6) (8, 8) Cada una de ellas tiene una media ( x ). Estas medias son: 0 1 2 3 4 1 2 3 4 5 2 3 4 5 6 3 8 Ahora se construir la distribucin muestral de medias

6 7

x 0 1 2 3 4 5 6 7 8

f 1 2 3 4 5 4 3 2 1 25

P( x ) 0,04 0,08 0,12 0,16 0,20 0,16 0,12 0,08 0,04

x P( x ) 0,00 0,08 0,24 0,48 0,80 0,80 0,72 0,56 0,32 4,00

x 2 P( x ) 0,00 0,08 0.48 1,44 3,20 4,00 4,32 3,92 2,56 20,00

= x. P (x) =4

2 x

= 20 42 = 4

=2

Se calcula la media y la varianza de {0, 2, 4, 6, 8}, obtenindose = 4 y 2 = 8. Comparando la media y la varianza de este conjunto con la media y la varianza de la 2 distribucin muestral de medias, se encuentra que = y x = 2/ n.

Teorema del Lmite Central Si se seleccionan al azar todas las muestras posibles, cada una de tamao n, de una poblacin con media y desviacin estndar , entonces la distribucin muestral de medias tendr una media

= y una desviacin estndar

= / n . Adems

ser de tipo normal cuando la poblacin de la que proceden las muestras, o distribucin original sea de tipo normal, o bien ser aproximadamente normal para muestras de tamao 30 o ms, cuando la distribucin original no sea normal. La aproximacin a la distribucin normal mejora conforme aumenta el tamao de la muestra. La esencia de este teorema recae en el hecho que para n grande (n30), la distribucin tiene forma aproximadamente normal con media cero y desviacin estndar uno;

sin importar cual sea el modelo de probabilidad a partir del cual se obtuvo la muestra. Debe notarse que si el modelo de probabilidad de la poblacin es semejante a una distribucin normal, la aproximacin normal ser buena an para muestras pequeas. Por otro lado, si el modelo de la poblacin tiene poco parecido a una distribucin

normal (por ejemplo, existe una marcada asimetra), la aproximacin normal slo ser adecuada para valores grandes de n. Distribucin muestral de medias -Si de una poblacin se toman todas las muestras posibles de tamao n, con reposicin. O si la poblacin es infinita con media y desviacin tpica ; la distribucin muestral de medias tendr las siguientes propiedades: a) La media de la distribucin muestral de medias, denotada por , ser igual a la

media de la poblacin de la cual se extrajeron las muestras; es decir = .


x
x

b) La desviacin estndar de la distribucin muestral de medias o error estndar de la media, denotada por , ser igual a la desviacin estndar de la poblacin dividida x

por la raz cuadrada del tamao de la muestra, es decir

= / n.

-Si se toman todas las posibles muestras de tamao n, sin reposicin, de una poblacin finita de tamao N con media y desviacin tpica , la distribucin muestral de medias tendr las siguientes propiedades: a) La media de la distribucin muestral de medias, denotada por , ser igual a la media de la poblacin de la cual se extrajeron las muestras; es decir

= .

b) La desviacin estndar de la distribucin muestral de medias o error estndar de la media, denotada por x , ser igual a:

N n x n N 1 Puesto que la distribucin muestral de medias est distribuida de forma aproximadamente normal, se pueden contestar preguntas sobre probabilidades utilizando la tabla de la distribucin normal estandarizada. Es decir, si se conoce un valor de la media muestral x se estandariza mediante la frmula

Z=

Ejm 2: Considere la poblacin aproximadamente normal de las estaturas de los estudiantes varones de una universidad. Suponga que las alturas individuales tienen media y desviacin estndar iguales a 1,65 m y 0.09 m, respectivamente. Se obtiene una muestra de 16 estaturas. a) Halle la media y el error estndar de la distribucin muestral de medias. b) Qu forma tiene esta distribucin? c) Cul es la probabilidad de tener una estatura media mayor de 1,70 m? d) Cul es la probabilidad de tener una estatura media menor de 1,68 m? e) Cul es la probabilidad de tener una estatura entre 1,68 m y 1,73 m? Solucin: a)

= = 1,65 m

0,09 = = 0,0225 16 n

b) Tiene forma aproximadamente normal debido a que la poblacin de donde se selecciona la muestra tiene esa forma

c)

Z =

1,70 1,65 = 2, 22 0,0225

P ( x > 1,70 m ) = P ( z > 2,22 ) = 0,5 0,4868 = 0,0132 d) Z =


1,68 1,65 = 1, 33 0,0225

P ( x < 1,68 m) = P (z < 1,33) = 0,5 + 0,4082 = 0,9082 e) Z =


1,73 1,65 = 3,56 0,0225

P (1,68 m < x < 1,73 m) = P (1,33 < z < 3,56) = 0, 4998 0,4082= 0,0916 Ejm 3: Si una poblacin normal tiene desviacin estndar igual a 25 unidades. Cul es el error estndar de la media si se utilizan muestras de tamao 16, de tamao 25, de tamao 50 y de tamao 100? Qu concluye a medida que aumenta el tamao de la muestra? Solucin: Para n = 16, = 6,25. Para n = 25, = 5. = =

Para n = 50, = 3,54. Para n = 100, = 2,50. = = Se concluye que el error estndar disminuye a medida que aumenta el tamao de la muestra. Ejercicio 1: Las masas de 1500 bolas de rodamientos estn normalmente distribuidas, con media de 22,4 g y desviacin estndar 0,048 g. Si se toman 300 muestras aleatorias de tamao 36 de esa poblacin, determine la media esperada y la desviacin estndar esperada de la distribucin muestral de medias, si el muestreo se hace: a) con reposicin, b) sin reposicin. Ejercicio 2: Cuntas de las muestras del Ejercicio 1 tendrn sus medias: a) entre 22,39 g y 22,41 g? b) Mayor que 22,42 g? c) Menor que 22,37 g? d) Menor que 22,38 g o mayor que 22,41 g? Distribucin muestral de diferencias de medias Dadas dos poblaciones, para cada muestra de tamao de la primera poblacin se determina su media; esto da una distribucin muestral de medias cuya media y desviacin estndar se denotar por y respectivamente. De manera similar, para cada muestra de tamao de la segunda poblacin se calcula su media, obteniendo as una distribucin muestral de medias cuya media y desviacin estndar se denotar por y .De todas las posibles combinaciones de estas muestras de las dos poblaciones se obtiene una distribucin de diferencias - que se llama distribucin muestral de diferencias de medias. La media y la desviacin estndar de esta distribucin de muestreo vienen dadas por

, suponiendo que las muestras seleccionadas

sean independientes. Utilizando el Teorema Central del Lmite, se puede decir que la distribucin muestral de diferencias de medias est distribuida de forma aproximadamente normal y por tanto se pueden encontrar probabilidades utilizando la tabla de la distribucin normal estandarizada, mediante la siguiente transformacin

Z=

( )

Ejm 3: La puntuacin media en una prueba de aptitud es de 72 con una desviacin estndar de 8 puntos. Cul es la probabilidad de que dos grupos de 40 y 36 estudiantes respectivamente, difieran en su puntuacin media: a) 3 o ms puntos? b) 6 o ms puntos? c) entre 2 y 5 puntos? Solucin: Sean y las puntuaciones medias de ambos grupos. Entonces = = 72 72 = 0

=
( )

= 1,84

Por tanto, Z=

a) Una diferencia de 3 o ms puntos puede suceder si - 3 - - 3, es decir Z1 = = 1,63 ; Z2 = = - 1,63 P( - - 3 - 3) = P(Z -1,63 Z 1,63) = 2(0,5 0,4484) = 0,1013 b) Una diferencia de 6 o ms puntos puede suceder si - 6 Z1= = 3,26 ; Z2 = = - 3,26 - - 6, es decir

P( - - 6 - 6) = P(Z -3,26 Z 3,26) = 2(0,5 0,4994) = 0,0012 c) Una diferencia entre 2 y 5 puntos, significa 2 - Z1= = 1,09 ; Z2 = = 2,72 P(-5 - - 2 2 - = 2(0,4967 -0,3626) = 0,2682 5 -5 - - 2, es decir

) = P(-2,72 Z -1,09 1,09 Z 2,72) =

Estimacin de Parmetros Uno de los objetivos de la estadstica es hacer inferencias acerca de una poblacin teniendo como base la informacin contenida en una muestra. Un problema importante de la estadstica inferencial es la estimacin de parmetros de la poblacin ( tales como media, varianza o desviacin estndar de la poblacin) a partir de los correspondientes estadsticos muestrales( media, varianza o desviacin estndar de la muestra). Los procedimientos de estimacin pueden ser divididos en dos tipos: estimacin puntual y estimacin por intervalo. Estimacin Puntual: Es aquella que utiliza un slo valor de la muestra para estimar el parmetro de la poblacin implicada. Por ejemplo, la media de la muestra es una estimacin puntual de la media de la poblacin; la varianza s2 de la muestra es una estimacin puntual de la varianza 2 de la poblacin. Estimacin Por Intervalo: Es una estimacin de un parmetro de la poblacin dado por dos nmeros, entre los cuales se puede considerar encajado el parmetro. Las estimaciones por intervalo indican la precisin de una estimacin y son por tanto preferibles a las estimaciones puntuales. La estimacin se lleva a cabo mediante un estimador. Estimador: Es una regla que indica cmo calcular la estimacin en base a la informacin contenida en la muestra. Generalmente se expresa mediante una frmula.

Por ejemplo, la media muestral = es un estimador de la media poblacional . Un buen estimador es aqul que es muy semejante al parmetro de la poblacin. Caractersticas de un buen estimador: Un buen estimador debe ser: insesgado, consistente, eficiente y suficiente. Insesgado: Cuando el valor esperado de un estadstico tomado como estimador, es igual al parmetro poblacional que se quiere estimar. Consistente: Cuando el estimador se aproxima al parmetro poblacional al aumentar el tamao de la muestra.

S-ar putea să vă placă și