Sunteți pe pagina 1din 8

CAPTULO 6

DISTRIBUCIONES MUESTRALES
Uno de los objetivos de la estadstica es saber acerca del comportamiento de
parmetros poblacionales tales como: la media ( ), la varianza ( 2 ) o la proporcin ( p ).
Para ello se extrae una muestra aleatoria de la poblacin y se calcula el valor de un
estadstico correspondiente, por ejemplo, la media muestral ( X ), la varianza muestral
( s 2 ) o la proporcin muestral ( p ). El valor del estadstico es aleatorio porque depende de
los elementos elegidos en la muestra seleccionada y, por lo tanto, el estadstico tiene una
distribucin de probabilidad la cual es llamada la Distribucin Muestral del Estadstico.

6.1 Distribucin de la Media Muestral cuando la poblacin es normal


Si se estraen muestras aleatorias de tamao n de una poblacin infinita que tiene
media poblacional y varianza 2 , entonces sea cual sea la distribucin de la poblacin
se tiene que:
i)
ii)

La media de las medias muestrales es igual a la media poblacional. Es decir


x .
La varianza de las medias muestrales es igual a la varianza poblacional dividida por
n . En consecuencia la desviacin estndar de las medias muestrales (llamada
tambin el error estndar de la media muestral), es igual a la deviacin estndar
poblacional dividida por la raz cuadrada de n . Es decir x

Si la poblacin fuera finita de tamao N , entonces se aplica el factor de correcin


N n
N 1

al error estndar de la media muestral. Pero en la prctica este factor es omitido a

menos que la muestra sea lo suficientemente grande comparada con la poblacin.


Si adems la poblacin se distribuye normalmente, entonces la media muestral
tambin tiene una distribucin normal con la media y varianza anteriormente indicadas.

6.2 El Teorema del Lmite Central


Un importante resultado en Probabilidades y Estadstica es el llamado Teorema del
Lmite Central que dice que si de una poblacin infinita con media y varianza 2 se
extraen muestras aleatorias de tamao n , entonces la media muestral se comporta
aproximadamente como una variable aleatoria normal con media igual a la media

Edgar Acua

Captulo 6

Distribuciones Muestrales

141

poblacional y con varianza igual a la varianza poblacional dividida por el tamao de la


muestra, siempre que n sea grande. Lo importante de este resultado es que es
independiente de la forma de la distribucin de la poblacin. Es decir,

X ~ N ( ,

2
n

Estandarizando, esto es equivalente a:

~ N (0,1)

n
Si la poblacin es bastante simtrica entonces, un tamao de muestra n mayor que
30 es suficiente para una buena aproximacin a la normal. Si la poblacin es bastante
asimtrica, entonces el tamao de muestra debe ser mucho ms grande.
En MINITAB se puede tratar de corroborar el Teorema del Lmite Central a travs
de un proceso de simulacin.
Ejemplo 6.1 Considerar una poblacin que consiste de 3, 4, 6, 8, 10, 11, 12, 15, 20.
Primero calculamos la media y desviacin estndar de dicha poblacin.
Descriptive Statistics
Variable
C1

N
9

Variable
C1

Min
3.00

Mean
9.89
Max
20.00

Median
10.00

Tr Mean
9.89

Q1
5.00

StDev
5.42

SE Mean
1.81

Q3
13.50

Notar que 9.89 y 5.42 .


Segundo, extraemos 30 muestras de tamao 4 de dicha poblacin, ejecutando 4 veces la
siguiente secuencia CalcRandom DataSample from columns. Guardar cada una de
las 4 observaciones de las muestras en 4 columnas distintas: Obs1, Obs2, Obs3, y Obs4.
Tercero, calculamos las medias de todas esas muestras usando la opcin Row Statistics
del men Calc y tratamos de ver grficamente al menos si hay acercamiento a
Normalidad. Asimismo se debe observar que la media de todas estas medias debera estar
cerca de y la varianza cerca de 2/n.

Las 30 muestras elegidas y sus respectivas medias son:


Muestra

obs1

obs2

obs3

obs4

media

Edgar Acua

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

Captulo 6

6
11
3
10
15
4
12
12
8
8
20
11
11
3
20
20
12
3
20
11
6
11
10
6
15
11
11
10
4
11

4
8
3
8
12
12
11
8
10
20
10
10
3
10
12
3
20
3
11
3
8
3
8
20
6
10
11
10
20
6

3
4
15
10
11
6
20
20
12
11
6
12
8
11
20
15
20
11
10
11
6
12
3
12
4
3
11
6
20
6

Distribuciones Muestrales

8
3
3
6
8
6
10
12
11
20
8
12
11
4
3
11
15
20
15
15
15
6
20
6
12
4
11
10
3
8

142

5.25
6.50
6.00
8.50
11.50
7.00
13.25
13.00
10.25
14.75
11.00
11.25
8.25
7.00
13.75
12.25
16.75
9.25
14.00
10.00
8.75
8.00
10.25
11.00
9.25
7.00
11.00
9.00
11.75
7.75

Las medidas estadsticas de la media muestral son:


Variable
media

N
30

Mean
10.108

Median
10.125

Tr Mean
10.019

Variable
media

Min
5.250

Max
16.750

Q1
7.938

Q3
11.875

StDev
2.806

SE Mean
0.512

En la Figura 6.1 se muestra el histograma de la distribucin de las medias muestrales y la


curva normal que ms se aproxima al histograma.
Interpretacin: Notar que la media de las medias muestrales es x 10.108 que est
bien cerca de la media poblacional 9.89 . Adems la desviacin estndar de la media
muestral es 2.806 mientras que n es igual a 5.42/2=2.71 ambos valores tambin
estn relativamente cerca. El histograma si est un poco alejado de la normalidad.

Edgar Acua

Captulo 6

Distribuciones Muestrales

143

Si se incrementa el tamao de las muestras se puede notar una mejor aproximacin a la


Normal.

Figura 6.1 Histograma de la distibucin de las medias maestrales del Ejemplo 6.1

Luego de aplicar estandarizacin, las siguientes frmulas se cumplen, aproximadamente si


la poblacin no es normal y exactamente si lo es.

i)

P( X a) P( Z

ii)

iii)

P ( a X b) P (

P ( X b) P ( Z

n
b

n
)

n
Las probabilidades pueden ser calculadas usando la tabla de la normal estndar que
aparece en al apndice del texto. Sin embargo, stas pueden ser halladas directamente en
MINITAB sin necesidad de estandarizacin.

Edgar Acua

Captulo 6

Distribuciones Muestrales

144

Ejemplo 6.2. El tiempo de atencin por cliente de un cajero de un Banco es normal con
media 6 minutos y desviacin estndar 2.5 minutos.
a) Cul es la probabilidad de que el tiempo promedio de atencin para una muestra de
15 clientes sea menor de 7 minutos?
b) Cul es la probabilidad de que el tiempo de atencin a un grupo de 15 clientes sea
ms de una hora y 15 minutos?
c) Si el tiempo en que el cajero atiende a un grupo de 15 clientes excede las dos horas
entonces ste es despedido. Cul es la probabilidad de que esto ocurra?
Solucin:
Usando el hecho que el tiempo promedio de atencin para una muestra de tamao 15 es
2.5
normal con media 6, y desviacin estndar
0.645 , con la ayuda de MINITAB se
15
obtiene:
a) P( X 7) 0.9395
b) Un tiempo de atencin de 75 minutos a 15 clientes equivale a un tiempo promedio de
atencin de 75/15 = 5 minutos. Luego, hay que hallar P( X 5) 1 0.0605 0.9395
c) Un tiempo de atencin de 120 minutos a 15 clientes equivale a un tiempo promedio de
atencin de 120/15 = 8 minutos por cliente. Luego, hay que hallar P(X 8) 1 0.9990 = .001.
Ejemplo 6.3. Los pesos de las personas que suben a un ascensor se distribuyen
normalmente con media igual a 125 libras y desviacin estndar de 30 libras. Un grupo de
9 personas sube al ascensor:
a) Cul es la probabilidad de que el peso promedio del grupo sea menor de 100 libras?
b) El ascensor tiene una capacidad mxima de 1400 libras. Cul es la probabilidad de
que se exceda sta capacidad con un grupo de 9 personas?
Solucin:
a) El peso promedio de un grupo de 9 personas se distribuye normalmente con media 125
30
y desviacin estndar igual a
10 . Luego usando la secuencia CalcProbability
9
Distributions Normal en MINITAB se obtiene que P( X 100) 0.0062 .
b) Decir que la suma de los pesos del grupo sea mayor que 1400, equivale a que el peso
promedio del grupo de 9 personas sea mayor que 1400/9 = 166.66 libras. Luego, la
probabilidad pedida ser P( X 166.66) 1 P( X 166.66) 1 .9989 0.0011.

6.3 Distribucin de la Proporcin Muestral


Si de una poblacin distribuida Binomialmente con probabilidad de xito p , se
extrae una muestra aleatoria de tamao n , entonces se puede mostrar que la media de X:

Edgar Acua

Captulo 6

Distribuciones Muestrales

145

nmero de xitos en la muestra, es np y que su varianza es 2 npq . En


X
pq
consecuencia la proporcin muestral p
tiene media p , y varianza
. As, por el
n
n
Teorema del Limite Central, cuando el tamao de muestra es grande, entonces:

X np
npq

p p
pq
n

Se distribuye aproximadamente como una normal estndar. La aproximacin es


bastante confiable si tanto np como nq son mayores que 5. Cuando p es cercano a 0 1
se debe tomar un tamao de muestra ms grande para mejorar la aproximacin.
Asmismo, como se estn aproximando probabilidades de una distribucin discreta
por probabilidades de una distribucin contnua, se debe aplicar un Factor de Correccin
por Continuidad de 1/2, antes de calcular las probabilidades. Este 1/2 se explica porque
un valor entero k de la variable discreta representa a todos los valores de la variable
continua que caen en el intervalo k 1 2 , k 1 2. Cuando el tamao de muestra es bien
grande entonces el efecto de considerar el factor de correccin por continuidad es
insignificante.

Frmulas de aproximacin Normal a la Binomial.


Si X es una Binomial con parmetros n y p, entonces

k .5 np

i)

P X k P(k .5 X k .5) P(

ii)

Pa X b P(a .5 X b .5) P(

iii) Pa X b P(a .5 X b .5) P(

npq

a .5 np
npq
a .5 np
npq

k .5 np

Z
Z

npq

b .5 np
npq
b .5 np
npq

)
)

Similarmente se pueden definir frmulas para aproximar probabilidades para proporciones


muestrales.

Edgar Acua

Captulo 6

Distribuciones Muestrales

146

Ejemplo 6.4. Segn reportes del centro nacional para estadsticas de salud, alrededor del
20 % de la poblacin masculina adulta de los Estados Unidos es obesa. Se elige al azar
una muestra de 150 hombres adultos en los Estados Unidos. Cul es la probabilidad de
que:
a) Haya a lo ms 25 personas obesas?
b) Haya ms de 22 pero menos de 35 obesos?
c) Haya por lo menos un 25% de obesos en la muestra?

Solucin:
Usando aproximacin normal a la Binomial se tiene que:
25.5 30

a) P X 25 P X 25.5 P Z
PZ 0.91 0.1814
24

34.5 30
22.5 30
Z
b) P22 X 35 P22.5 x 34.5 P

24
24

P 1.53 Z 0.91 0.8186 0.0063 0.8123 .


37.5 30
c) P( p .25) P( X 37.5) P( Z
) P(Z>1.53) = 1-P(Z<1.53) =
24
1-.9730 = .0630.

Edgar Acua

Captulo 6

Distribuciones Muestrales

147

EJERCICIOS
1. Los tiempos de espera en la fila de un proceso de matrcula de una universidad se
distribuyen normalmente con media 45 minutos y desviacin estndar de 20 minutos.
Se elige al azar una muestra de 16 estudiantes que se van a matricular.
a) Cul es la probabilidad de que el tiempo de espera promedio de la muestra sea
mayor de 60 minutos?
b) Cul es la probabilidad de que el tiempo de espera promedio de la muestra sea
mayor de 35 minutos pero menor de 55 minutos?
2. Los tiempos que se demoran los empleados de una fbrica en realizar una tarea de
ensamblaje se distribuyen normalmente con media de 12 minutos y desviacin
estndar de 6. Se toma una muestra de 10 empleados:
a) Cul es la probabilidad de que el tiempo promedio que usan los empleados para
terminar la tarea de ensamblaje sea mayor de 15, pero menor de 17 minutos?
b) Si los 10 empleados tardan menos de hora y media en terminar la tarea de
ensamblaje entonces la fbrica recibe un premio. Cul es la probabilidad de que
esto ocurra?
3. El contenido promedio de cereal en un paquete es de 450 gramos con una desviacin
estndar de 13 gramos. Si se tom una muestra de 35 paquetes
a) Cul es la probabilidad de que el promedio de esta muestra sea mayor a 455
gramos?
b) Cul es la probabilidad de que el promedio de sta muestra se encuentre entre 445
y 458 gramos?
4. Haga uso del programa MINITAB para:
a) Generar 60 muestras aleatorias de tamao 25 de una poblacin normal con media
60 y deviacin estandar 13.
b) Calcule la media para cada muestra generada en la parte a).
c) Calcule la desviacin estndar de los promedios calculados en la parte a)
d) Compare los resultados obtenidos en la parte b) y c) , con lo propuesto en la parte
a)
5. Un restaurant determin que en 1 de cada 5 almuerzos vendidos el cliente pide un
postre. Si en un da el restaurant realiza 600 ventas:
a) Calcular la probabilidad de ms de 150 clientes acompae su almuerzo con un
postre.
b) Calcular la probabilidad de que a lo ms 450 clientes acompaen su almuerzo con
un postre.
6. En la poca de invierno en los Estados Unidos se estima que el 90% de la poblacin
contrae enfermedades respiratorias, para una muestra de 350 cul es la probabilidad de
que ms de 315 podrian eventualmente sufrir algn tipo de enfermedades
respiratorias?.

S-ar putea să vă placă și