Sunteți pe pagina 1din 31

Distribuciones muestrales.

Distribucin muestral de Medias

Algunas secciones han sido tomadas de: Apuntes de Estadstica, Mtra Leticia de la Torre Instituto Tecnolgico de Chiuhuahua

El concepto de calificacin Z estudiado nos va a ayudar para calcular probabilidades de que ocurra un cierto caso referido a la media de la poblacin, como veremos a continuacin.

Actividad 2. Resolver los siguientes problemas El promedio de estudiantes inscritos en jardines de nios es de 500 con una desviacin estndar de 100. El nmero de alumnos tiene una distribucin aproximadamente normal. Cul es la probabilidad de que el nmero de alumnos inscritos en una escuela elegida al azar est: a) entre 450 y 500 b) entre 400 y 640 = 500, = 100

a)

450 500 z1 = = 0.5 100

z2 = 0

P(450 < x < 500 ) = [(0.5)]- [(0)] = 0.6915-0.5 = 0.1915

Respuesta: la probabilidad es de 19.15%

b) entre 400 y 640 = 500, = 100

b)

z1 =

400 500 = 1 100

z2 =

640 500 = 1. 4 100

P(400 < x < 640 ) = (1)- [1-(1.4)] = 0.8413-(1-.9192) = 0.8413-0.0808 = 0.7605

Respuesta: la probabilidad es de 76.05%

Se ha determinado que la vida til de cierta marca de llantas radiales tienen una distribucin normal con un promedio de 38,000 kilmetros y desviacin estndar de 3,000 kilmetros a)Cul es la probabilidad de que una llanta elegida al azar tenga una vida til de cuando menos 30,000 kilmetros? b)Cul es la probabilidad de que dure 40,000 kilmetros o ms? = 38,000 , = 3000

a)

z1 =

30000 38000 = 2.666 3000

P(x > 30,000 ) = (2.67) = 0.9962

Respuesta: la probabilidad es de 99.62%

b)Cul es la probabilidad de que dure 40,000 kilmetros o ms?

b)

40000 38000 z1 = = 0.666 3000


P(x > 40,000 ) = 1- (0.67) = 1-0.7486 = 0.2514

Respuesta: la probabilidad es de 25.14%

Un distribuidor hace un pedido de 500 de las llantas especificadas en el problema anterior. Aproximadamente cuntas llantas durarn a) entre 30,000 y 40,000 kilmetros b) 38,000 kilmetros o ms
a)

z1 =

30000 38000 = 2.666 3000

z2 =

40000 38000 = 0.666 3000

P(30000 < x < 40000) = (0.67) [1- (2.67)]


= 0.7486 (1 0.9962) = 0.7486

74.86% de 500, 0.7486x500 = 374.3

Actividad 3. La produccin de tomates por planta tiene una media de 12 kg y una desviacin estndar (o tpica) de 2 kg. Se considera que la produccin de tomates tiene una distribucin normal. a) Si se selecciona al azar una planta de tomate Cul es la probabilidad de que rinda 15 kg o ms?

8. x = 12, s = 2 a) P (15 x )

Z=

15 12 3 = = 1.5 2 2

P (15 x ) = 1 (1.5) = 1 0.9332 = 0.0668


La probabilidad es del 6.68%

b) Si en una granja hay 10000 plantas de tomate Cuntas rendirn ms de 11 kg?


b) P (11 x )

Z=

11 12 1 = = 0 .5 2 2

P (11 x ) = 0.6915 0.6915 10,000 = 6,915

El total de plantas de tomates que producirn ms de 11 kg. de tomate es 6,915

Supngase que la duracin promedio de las estancia de los pacientes en un hospital es de 10 das con una desviacin estndar de 2 das. Considrese que la distribucin de las duraciones est normalmente distribuida. a) Cul es la probabilidad de que el prximo paciente que se reciba permanezca ms de 9 das?
. x = 10, s = 2 a) P (9 x )

9 10 1 = = 0 .5 2 2 P (9 x ) = 0.6915 Z=
La probabilidad es del 69.15%

b) Si el da de hoy se admitieran 200 pacientes Cuntos continuarn en el hospital dentro de 2 semanas?


b) P (14 x )

Z=

14 10 4 = =2 2 2

P (14 x ) = 1 ( 2) = 1 0.9772 = 0.0228


0.0228 200 = 4.56

Despus de dos semanas quedaran slo aprox 5 pacientes de los 200

TEORIA DEL MUESTREO Uno de los propsitos de la estadstica inferencial es estimar las caractersticas poblacionales desconocidas, examinando la informacin obtenida de una muestra, de una poblacin. El punto de inters es la muestra, la cual debe ser representativa de la poblacin objeto de estudio. Se seguirn ciertos procedimientos de seleccin para asegurar de que las muestras reflejen observaciones a la poblacin de la que proceden, ya que solo se pueden hacer observaciones probabilsticas sobre una poblacin cuando se usan muestras representativas de la misma.

Una poblacin est formada por la totalidad de los datos de las cuales se requiere informacin. Una muestra es un subconjunto de observaciones seleccionadas de una poblacin.

Errores en el Muestreo Cuando se utilizan valores muestrales (parmetros), o estadsticos para estimar valores poblacionales, pueden ocurrir dos tipos generales de errores: El error muestral y El error no muestral. El error muestral se refiere a la variacin natural existente entre muestras tomadas de la misma poblacin. An si se ha tenido gran cuidado para asegurar que dos muestras del mismo tamao sean representativas de una cierta poblacin, no esperaramos que las dos sean idnticas en todos sus detalles. El error muestral es un concepto importante que ayudar a entender mejor la naturaleza de la estadstica inferencial.

Los errores que surgen al tomar las muestras y que no pueden clasificarse como errores muestrales y se denominan errores no muestrales. El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere a una tendencia sistemtica inherente a un mtodo de muestreo que da estimaciones de un parmetro que son, en promedio, menores (sesgo negativo), o mayores (sesgo positivo) que el parmetro real. Ejemplo: la longitud del dedo ndice de personas de la misma edad y sexo. El sesgo muestral aleatorizacin. puede suprimirse, o minimizarse, usando la

La aleatorizacin se refiere a cualquier proceso de seleccin de una muestra de la poblacin en el que la seleccin es imparcial o no est sesgada; una muestra elegida con procedimientos aleatorios se llama muestra aleatoria. aleatoria Los tipos ms comunes de tcnicas de muestreo aleatorios son el muestreo aleatorio simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo sistemtico. tico Si una muestra aleatoria se elige de tal forma que todos los elementos de la poblacin tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple.

Ejemplo 1 Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de estadstica de 20 alumnos. Las combinaciones se escriben 20C5 lo que da el nmero total de formas de elegir una muestra no ordenada y este resultado es igual a 15,504 maneras diferentes de tomar la muestra. Un procedimiento simple para elegir una muestra aleatoria sera escribir cada uno de los 20 nombres en pedazos separados de papel, colocarlos en un recipiente, revolverlos y despus extraer cinco papeles al mismo tiempo. Otro mtodo parea obtener una muestra aleatoria de 5 estudiantes en un grupo de 20 utiliza una tabla de nmeros aleatorios. Se puede construir la tabla usando una calculadora o una computadora o con mtodos de seleccin al azar.

Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco prctico, imposible o no deseado; aunque sera deseable usar muestras aleatorias simples para las encuestas nacionales de opinin sobre productos o sobre elecciones presidenciales, sera muy costoso o tardado. El muestreo estratificado requiere de separar a la poblacin segn grupos que no se traslapen llamados estratos, y de elegir despus una muestra aleatoria simple en cada estrato. La informacin de las muestras aleatorias simples de cada estrato constituira entonces una muestra global.

Ejemplo 2 Suponga que nos interesa obtener una muestra de las opiniones de los profesores de una gran universidad. Puede ser difcil obtener una muestra con todos los profesores, as que supongamos que elegimos una muestra aleatoria de cada colegio, o departamento acadmico; los estratos vendran a ser los colegios, o departamentos acadmicos.

El muestreo por conglomerados requiere de elegir una muestra aleatoria simple de unidades heterogneas entre s de la poblacin llamadas conglomerados. Cada elemento de la poblacin pertenece exactamente a un conglomerado, y los elementos dentro de cada conglomerado son usualmente heterogneos o dismiles. Ejemplo 3 Suponga que una compaa de servicio de televisin por cable est pensando en abrir una sucursal en una ciudad grande; la compaa planea realizar un estudio para determinar el porcentaje de familias que utilizaran sus servicios, como no es prctico preguntar en cada casa, la empresa decide seleccionar una parte de la ciudad al azar, la cual forma un conglomerado. En el muestreo por conglomerados, stos se forman para representar, tan fielmente como sea posible, a toda la poblacin; entonces se usa una muestra aleatoria simple de conglomerados para estudiarla. Los estudios de instituciones sociales como iglesias, hospitales, escuelas y prisiones se realizan, generalmente, con base en el muestreo por conglomerados.

El muestreo sistemtico es una tcnica de muestreo que requiere de una seleccin aleatoria inicial de observaciones seguida de otra seleccin de observaciones obtenida usando algn sistema o regla.

Ejemplo 4 Para obtener una muestra de suscriptores telefnicos en una ciudad grande, puede obtenerse primero una muestra aleatoria de los nmeros de las pginas del directorio telefnico; al elegir el vigsimo nombre de cada pgina obtendramos un muestreo sistemtico, tambin podemos escoger un nombre de la primera pgina del directorio y despus seleccionar cada nombre del lugar nmero cien a partir del ya seleccionado. En este caso, podramos seleccionar un nmero al azar entre los primeros 100; supongamos que el elegido es el 40, entonces seleccionamos los nombres del directorio que corresponden a los nmeros 40, 140, 240, 340 y as sucesivamente.

Distribuciones Muestrales
Las muestras aleatorias obtenidas de una poblacin son, por naturaleza propia, impredecibles. No se esperara que dos muestras aleatorias del mismo tamao y tomadas de la misma poblacin tenga la misma media muestral o que sean completamente parecidas; puede esperarse que cualquier estadstico, como la media muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la distribucin de todos los valores posibles de un estadstico. Tales distribuciones sern muy importantes en el estudio de la estadstica inferencial, porque las inferencias sobre las poblaciones se harn usando estadsticas muestrales.

Con el anlisis de las distribuciones asociadas con los estadsticos muestrales, podremos juzgar la confiabilidad de un estadstico muestral como un instrumento para hacer inferencias sobre un parmetro poblacional desconocido. Como los valores de un estadstico, tal como la media, varan de una muestra aleatoria a otra, se le puede considerar como una variable aleatoria con su correspondiente distribucin de frecuencias. La distribucin de frecuencia de un estadstico muestral se denomina distribucin muestral. En general, la distribucin muestral de un estadstico es la de todos sus valores posibles calculados a partir de muestras del mismo tamao.

Distribucin Muestral de Medias Suponga que se han seleccionado muestras aleatorias de tamao 20 en una poblacin grande. Se calcula la media muestral x para cada muestra; la coleccin de todas estas medias muestrales recibe el nombre de distribucin muestral de medias, lo que se puede ilustrar en la siguiente figura:

El Teorema del Lmite Central tambin nos indica que cuando se extraen muestras de tamao mayor a 30 o bien de cualquier tamao pero provenientes de una poblacin normal, la distribucin muestral de medias tiene un comportamiento aproximadamente normal, por lo que la desviacin estndar se puede aproximar con la desv de la poblacin con la siguiente modifcacin:

=x

s=

Este factor modifica la desv est original

entonces la frmula para calcular la probabilidad del comportamiento del estadstico, en este caso la media de la muestra , quedara de la siguiente manera:

z=

Distribucin de la media poblacional

.001

Distribucin de la media muestral

Notar que la desviacin estndar (o la varianza) es mucho menor en la muestra que en la poblacin.

Ahora bien, si el muestreo se hace sin reemplazo y el tamao de la poblacin es al menos 20 veces el tamao de la muestra, entonces se usa la siguiente frmula que incluye un factor de correccin para poblacin finita.

z=

N n N 1

Siendo n el tamao de la muestra y N el de la poblacin.

Ejemplo 5: Una empresa elctrica fabrica bateras que tienen una duracin que se distribuye aproximadamente en forma normal, con media de 800 horas y desviacin estndar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 bateras tenga una vida promedio de menos de 775 horas. Solucin:

z =-2.5 La respuesta sera que la probabilidad de que la media de la muestra de 16 bateras sea menor a 775 horas es de 0.0062 o 0.62 %.

Ejemplo 6. Las estaturas de 1000 estudiantes estn distribuidas aproximadamente en forma normal con una media de 174.5 centmetros y una desviacin estndar de 6.9. centmetros. Si se extraen 200 muestras aleatorias de tamao 25 sin reemplazo de esta poblacin, determine: a) El nmero de las medias muestrales que caen entre 172.5 y 175.8 centmetros. b) El nmero de medias muestrales que caen por debajo de 172 centmetros.

Solucin: Como se puede observar en este ejercicio se cuenta con una poblacin finita y un muestreo sin reemplazo, por lo que se tendr que agregar el factor de correccin. Se proceder a calcular el denominador de Z para slo sustituirlo en cada inciso.

a)

rea

Por lo tanto la respuesta es: (0.7607)(200)=152 medias muestrales

b)

rea

Por lo tanto la respuesta es: (0.0336)(200)= 7 medias muestrales

Tarea. Se eligen muestras ordenadas de tamao 2, con reemplazo, de la poblacin de valores 1, 3, 5 y 7. Encontrar:

, la media poblacional.

, la desviacin estndar poblacional.

x, la media de la distribucin muestral de medias. x, la desviacin estndar de la distribucin muestral de medias. Adems, graficar las frecuencias para la poblacin y para la distribucin muestral de medias. Nota: Usar muestras ordenadas implica todas las combinaciones de valores, por ejemplo, (3,5) y (5,3) son dos parejas diferentes.

S-ar putea să vă placă și