Sunteți pe pagina 1din 40

Distribuciones Continuas de Probabilidad

UC

2018

Distribuciones Continuas
Distribución Normal

Distribuciones Continuas
Caracterı́sticas

La moda, que es el punto sobre el eje horizontal donde la curva


tiene su punto máximo, ocurre en x = µ.
La curva es simétrica alrededor de un eje vertical.
La curva normal se aproxima al eje horizontal de manera asintóti-
ca.
El área total bajo la curva y sobre el eje horizontal es igual a uno.

Distribuciones Continuas
Áreas bajo la curva normal
La curva de cualquier distribución de probabilidad continua o función
de densidad se construye de manera que el área bajo la curva limitada
por las dos ordenadas x = x1 y x = x2 sea igual a la probabilidad de
que la variable aleatoria X tome un valor entre x = x1 y x = x2 . Es
decir:
Z x2 Z x2 (x − µ)2
1 −
P(x1 < X < x2 ) = n(x; µ, σ)dx = √ e 2σ 2 dx
x1 σ 2π x1

Distribuciones Continuas
Áreas bajo la curva normal

El área bajo la curva entre dos ordenadas también depende de los


valores µ y σ.
Las dos regiones sombreadas tienen tamaños diferentes, por lo
tanto, la probabilidad asociada con cada distribución será diferente
para los dos valores dados de X .

Distribuciones Continuas
Normal Estándar

Serı́a inútil tratar de establecer tablas separadas para cada posible


valor de µ y σ.
Podemos transformar todas las observaciones de cualquier variable
aleatoria normal X en un nuevo conjunto de datos de una variable
aleatoria normal Z con media 0 y varianza 1.
Z se llama distribución normal estándar n(z; 0, 1).
La transformación de los valores por medio de:
x −µ
Z=
σ
Es decir que:

P(x1 < X < x2 ) = P(z1 < X < z2 )

Distribuciones Continuas
Normal Estándar

Figura: Distribuciones normales, original y transformada

Distribuciones Continuas
Aproximación Normal a la Binomial

Si X es una variable aleatoria binomial con media µ = np y


varianza σ 2 = npq, entonces:
X − np
Z= √
npq

Ejemplo: Graficar b(x; 15, 0,4) y calcular P(X = 4).

Ejemplo: Graficar b(x; 50, 0,4) y calcular P(20 ≤ X ≤ 26).

Distribuciones Continuas
Aproximación Normal a la Binomial

Sea X una variable aleatoria binomial con parámetros n y p. Para


una n grande X tiene aproximadamente una distribución normal con
µ = np y σ 2 = npq y además:
x
X
P(X ≤ x) = b (k; n, p)
k=0
≈ área bajo la curva normal a la izquierda de x + 0,5
 
x + 0,5 − np
=P Z ≤ √
npq

La aproximación será buena si np y nq son ≥ 5.

Distribuciones Continuas
Distribuciones Gamma y Exponencial
La función gamma se define como:
Z ∞
Γ(α) = x α−1 e −x dx , α > 0
0

La variable aleatoria continua X tiene una distribución gamma, con


parámetros α y β, si su función de densidad está dada por:

 1 x α−1 e −x/β x > 0


f (x; α, β) = β α Γ(α)
0 en otro caso

donde α > 0, β > 0.


La media y la varianza de la distribución gamma son

µ = αβ σ 2 = αβ 2
Distribuciones Continuas
Distribución Exponencial

La variable aleatoria continua X tiene una distribución exponencial,


con parámetro β, si su función de densidad es:

 1 e −x/β , x > 0

f (x; β) = β
0, en otro caso

donde β > 0.
La media y la varianza de la distribución exponencial son

µ = β σ2 = β 2

Distribuciones Continuas
Problemas

1 Un aparato electrónico contiene cierto tipo de componente cuyo


tiempo de operación antes de fallar, en años, es T. La variable
aleatoria T se modela mediante la distribución exponencial con
tiempo medio de operación antes de fallar β = 5 . Si se instalan
5 de estos componentes en diferentes aparatos, ¿cuál es la proba-
bilidad de que al final de 8 años al menos dos aún funcionen?
2 La vida, en años, de cierto interruptor eléctrico tiene una distri-
bución exponencial con una vida promedio de β = 2. Si 100 de
estos interruptores se instalan en diferentes sistemas, ¿cuál es la
probabilidad de que a lo sumo, fallen 30 durante el primer año?

Distribuciones Continuas
Problemas

3 El tiempo necesario para que un cliente sea atendido en una banco


es una variable aleatoria que tiene una distribución exponencial
con una media de 4 minutos. ¿Cuál es la probabilidad de que una
persona sea atendida en menos de 3 minutos en al menos 4 de los
siguientes 6 dı́as?

4 En un estudio biomédico con ratas se utiliza una investigación de


respuesta a la dosis, para determinar el efecto de un tóxico en
su tiempo de supervivencia. El tóxico es producido por el com-
bustible que utilizan los aviones y en consecuencia, descargan con
frecuencia a la atmósfera. Para cierta dosis del tóxico, el estudio
determina que el tiempo de supervivencia de las ratas, en sema-
nas, tiene una distribución gamma con α = 5 y β = 10. ¿Cuál es
la probabilidad de que una rata no sobreviva más de 60 semanas?

Distribuciones Continuas
Problemas

5 A partir de datos previos se sabe que el tiempo que transcurre,


en meses, entre las quejas de los clientes sobre cierto producto
es una distribución gamma con α = 2 y β = 4. Se realizaron
cambios para hacer más estrictos los requerimientos del control
de calidad después de los cuales pasaron 20 meses antes de la
primera queja. ¿Parecerı́a que los cambios realizados en el control
de calidad resultaron eficaces?

6 En cierta ciudad el consumo diario de energı́a eléctrica, en millo-


nes de kilowatts-hora, es una variable aleatoria X que tiene una
distribución gamma con media µ = 6 y varianza σ 2 = 12.
a Calcule los valores de α y β.
b Calcule la probabilidad de que en cualquier dı́a dado el consumo
diario de energı́a exceda los 12 millones de kilowatts-hora.

Distribuciones Continuas
Estimación

La estimación puntual de algún parámetro (estadı́stico) θ de la


población es un solo valor θ0 . Por ejemplo, el valor x del estadı́stico
X que se calcula a partir de una muestra de tamaño n, es una
estimación puntual del parámetro de la población µ.
Se puede esperar que una estimación puntual de una muestra
dada sea exactamente igual al parámetro de la población que se
quiere. Hay muchas situaciones en que es preferible determinar
un intervalo dentro del cual esperarı́amos encontrar el valor del
parámetro. Tal intervalo se conoce como estimación por intervalo
o intervalo de confianza.

Distribuciones Continuas
Intervalos de confianza

Intervalo de confianza de µ - σ 2 conocida


Si x es la media de una muestra aleatoria de tamaño n de una población
de la que se conoce su varianza σ 2 , un intervalo de confianza de 100(1−
α) % para µ es:
σ σ
x − zα/2 √ < µ < x + zα/2 √
n n

donde zα/2 es el valor z que deja un área de α/2 a la derecha.

Distribuciones Continuas
Intervalos de confianza

Ejemplo
Se encuentra que la concentración promedio de zinc que se obtiene
en una muestra de mediciones en 36 sitios diferentes de un rı́o es de
2.6 gramos por mililitro. Calcule los intervalos de confianza del 95 %
y 99 % para la concentración media de zinc en el rı́o. Suponga que la
desviación estándar de la población es de 0.3 gramos por mililitro.

Distribuciones Continuas
Error

Teorema
Si utilizamos x como una estimación de µ, podemos tener 100(1−α) %
σ
de confianza en que el error no excederá a zα/2 √ .
n

En el ejemplo anterior tenemos una confianza del 95 % en que la media


muestral x = 2,6√difiere de la media verdadera µ en una cantidad menor
que (1,96)(0,3)/ 36 = 0,098.
Con frecuencia queremos saber qué tan grande necesita ser una mues-
tra para poder estar seguros de que el error al estimar µ será me-
nor que una cantidad especı́fica e, debemos elegir n de manera que
σ
zα/2 √ = e.
n

Distribuciones Continuas
Tamaño de la muestra

Es decir que: z
α/2 σ
2
n=
e

Ejemplo
Qué tan grande debe ser la muestra del ejemplo anterior si queremos
tener 95 % de confianza en que nuestra estimación de µ diferirá por
menos de 0.05?

Distribuciones Continuas
σ 2 desconocida
Si x y s son la media y la desviación estándar de una muestra aleatoria
de una población normal de la que se desconoce la varianza σ 2 , un
intervalo de confianza del 100(1 − α) % para µ es:
s s
x − tα/2 √ < µ < x + tα/2 √
n n

donde tα/2 es el valor t con v = n − 1 grados de libertad que deja un


área de α/2 a la derecha.

Ejemplo
El contenido de ácido sulfúrico de 7 contenedores similares es de 9.8,
10.2, 10.4, 9.8, 10.0, 10.2, y 9.6 litros. Calcule un intervalo de
confianza del 95 % para el contenido promedio de todos los
contenedores suponiendo una distribución aproximadamente normal.
Distribuciones Continuas
σ 2 desconocida

Con frecuencia se recomiendan que incluso cuando no sea posible su-


poner la normalidad, se desconozca σ y n ≥ 30, σ se puede reemplazar
con s para poder utilizar el intervalo de confianza
s
x ± zα/2 √
n

A menudo se hace referencia a esto como un intervalo de confianza


para una muestra grande.
Ejemplo: Se obtienen las calificaciones de matemáticas de las prue-
bas Saber de una muestra aleatoria de 500 estudiantes. Se calculan la
media y la desviación estándar muestrales, que son 501 y 112, respecti-
vamente. Calcular un intervalo de confianza del 99 % de la calificación
promedio de matemáticas.

Distribuciones Continuas
Dos muestras: estimación de la diferencia entre dos
medias

Si tenemos dos poblaciones con medias µ1 y µ2 , y varianzas σ12 y


σ22 , respectivamente, el estadı́stico que da un estimador puntual de la
diferencia entre µ1 y µ2 es X 1 − X 2 . Por lo tanto, para obtener una
estimación puntual de µ1 − µ2 , se seleccionan dos muestras aleatorias
independientes, una de cada población, de tamaños n1 y n2 , y se calcula
X 1 − X 2 , la diferencia de las medias muestrales.

Distribuciones Continuas
Intervalo de confianza para µ1 − µ2

Cuando se conocen σ12 y σ22


Si x1 y x2 son las medias de muestras aleatorias independientes de
tamaños n1 y n2 , de poblaciones que tienen varianzas conocidas σ12 y
σ22 , respectivamente, un intervalo de confianza del 100(1 − α) % para
µ1 − µ2 está dado por
s s
σ12 σ2 σ12 σ2
(x1 − x2 ) − zα/2 + 2 < µ1 − µ2 < (x1 − x2 ) + zα/2 + 2
n1 n2 n1 n2

donde zα/2 es el valor z que deja un área de α/2 a la derecha.

Si las varianzas no se conocen y las dos distribuciones implicadas son


aproximadamente normales, la distribución t resulta implicada como
en el caso de una sola muestra. Si no se supone normalidad, muestras
grandes (mayores que 30) permitirán usar s1 y s2 .

Distribuciones Continuas
Ejemplo

Se llevó a cabo un experimento donde se compararon dos tipos de mo-


tores tipo A y tipo B. Se midió el rendimiento de combustible en millas
por galón. Se realizaron 50 experimentos con el motor A y 75 con el
motor B. La gasolina utilizada y las demás condiciones se mantuvieron
constantes. El rendimiento promedio de gasolina para el motor A fue
de 36 millas por galón y el promedio para el motor B fue de 42 millas
por galón. Calcule un intervalo de confianza del 96 % sobre µA − µB ,
donde µA y µB corresponden a la media de la población del rendimiento
de millas por galón para los motores A y B, respectivamente. Suponga
que las desviaciones estándar de la poblacion son 6 y 8 para A y B
respectivamente.

Distribuciones Continuas
Varianzas desconocidas e iguales

Si x1 y x2 son las medias de muestras aleatorias independientes con ta-


maños n1 y n2 , respectivamente, tomadas de poblaciones aproximada-
mente normales con varianzas iguales pero desconocidas, un intervalo
de confianza del 100(1 − α) % para µ1 − µ2 está dado por
s s
1 1 1 1
(x1 − x2 ) − (tα/2 )Sp + < µ1 − µ2 < (x1 − x2 ) + (tα/2 )Sp +
n1 n2 n1 n2

donde Sp es la estimación agrupada de la desviación estándar de la


población y tα/2 es el valor t con v = n1 + n2 − 2 grados de libertad,
que deja un área de α/2 a la derecha.

(n1 − 1)S12 + (n2 − 1)S22


Sp2 =
n1 + n2 − 2

Distribuciones Continuas
Varianzas desconocidas e iguales

Ejemplo
En el artı́culo “Estructura comunitaria de los macroinvertebrados co-
mo un indicador de la contaminación de minas ácidas”, publicado en el
Journal of Environmental Pollution, se informa sobre una investigación
realizada para determinar la relación entre parámetros fı́sicoquı́micos
seleccionados y diversas mediciones de la estructura de la comunidad
de macroinvertebrados. Una faceta de la investigación consistió en eva-
luar la efectividad de un ı́ndice numérico de la diversidad de especies
para indicar la degradación del agua debida al desagüe ácido de una
mina. Conceptualmente, un ı́ndice elevado de la diversidad de especies
macroinvertebradas deberı́a indicar un sistema acuático no contamina-
do; mientras que un ı́ndice bajo de esta diversidad indicarı́a un sistema
acuático contaminado.

Distribuciones Continuas
Varianzas desconocidas e iguales

Ejemplo
Se eligieron 2 estaciones de muestreo independientes para este estudio:
una que se localiza corriente abajo del punto de descarga ácida de la
mina y la otra ubicada corriente arriba. Para 12 muestras mensuales
reunidas en la estación corriente abajo el ı́ndice de diversidad de espe-
cies tuvo un valor medio de x1 = 3,11 y una desviación estándar de
s1 = 0,771; mientras que 10 muestras reunidas mensualmente en la
estación corriente arriba tuvieron un valor medio del ı́ndice x2 = 2,04
y una desviación estándar de s2 = 0,448. Calcular un intervalo de con-
fianza del 90 % para la diferencia entre las medias de la población de
los dos sitios, suponiendo que las poblaciones se distribuyen de forma
aproximadamente normal y que tienen varianzas iguales.

Distribuciones Continuas
Varianzas desconocidas y diferentes

σ12 6= σ12 desconocidas


s s
s12 s22 s12 s2
(x1 − x2 ) − (tα/2 ) + < µ1 − µ2 < (x1 − x2 ) + (tα/2 ) + 2
n1 n2 n1 n2

donde tα/2 es el valor t con:

(s12 /n1 + s22 /n2 )2


v=
[(s12 /n1 )2 /(n1 − 1)] + [(s22 /n2 )2 /(n2 − 1)]

grados de libertad, que deja un área de α/2 a la derecha.

Distribuciones Continuas
Varianzas desconocidas y diferentes

Ejemplo
Se llevó a cabo un estudio para estimar la diferencia en la cantidad
de ortofosfato medido en dos estaciones diferentes del rı́o Cauca. El
ortofosfato se mide en miligramos por litro. Se reunieron 15 muestras
de la estación 1 y 12 muestras de la estación 2. Las 15 muestras de
la estación 1 tuvieron un contenido promedio de ortofosfato de 3.84
miligramos por litro y una desviación estándar de 3.07 miligramos por
litro; mientras que las 12 muestras de la estación 2 tuvieron un conte-
nido promedio de 1.49 miligramos por litro y una desviación estándar
de 0.80 miligramos por litro. Determinar un intervalo de confianza de
95 % para la diferencia en el contenido promedio verdadero de ortofos-
fato en estas dos estaciones. Suponga que las observaciones provienen
de poblaciones normales con varianzas diferentes.

Distribuciones Continuas
Observaciones pareadas

Consideremos el caso de estimación para la diferencia de dos medias


cuando las muestras no son independientes y las varianzas de las dos
poblaciones no son necesariamente iguales. La situación que se consi-
dera hace referncia a las observaciones pareadas.
En este caso cada unidad experimental homogénea recibe ambas con-
diciones de la población; como resultado, cada unidad experimental
tiene un par de observaciones, una para cada población. Por ejemplo,
si realizamos una prueba de una nueva dieta con 15 individuos, los pe-
sos antes y después de seguir la dieta conforman la información de las
dos muestras. Las dos poblaciones son antes y después y la unidad
experimental es el individuo.

Distribuciones Continuas
Observaciones pareadas

Intervalo de confianza
Si d y sd son la media y la desviación estándar, respectivamente, de
las diferencias distribuidas normalmente de n pares aleatorios de medi-
ciones, un intervalo de confianza del 100(1 − α) % para µD = µ1 − µ2
es
sd sd
d − tα/2 √ < µD < d + tα/2 √ < µD
n n
donde tα/2 es el valor t con v = n − 1 grados de libertad, que deja un
área de α/2 a la derecha.

Distribuciones Continuas
Observaciones pareadas

Ejemplo
Un estudio reporta los niveles de dioxina TCDD en 20 personas, quienes
posiblemente estuvieron expuestos a un agente quı́mico. En la siguiente
tabla se presentan los niveles de TCDD en sangre y tejido adiposo.
Calcular un intervalo de confianza del 95 % para µ1 − µ2 , donde µ1
y µ2 representan las medias de los niveles de TCDD en sangre y en
tejido adiposo, respectivamente. Suponga que la distribución de las
diferencias es casi normal.

Distribuciones Continuas
Observaciones pareadas

Ind. Sangre TA di Ind. Sangre TA di


1 2.5 4.9 -2.4 11 6.9 7.0 -0.1
2 3.1 5.9 -2.8 12 3.3 2.9 0.4
3 2.1 4.4 -2.3 13 4.6 4.6 0.0
4 3.5 6.9 -3.4 14 1.6 1.4 0.2
5 3.1 7.0 -3.9 15 7.2 7.7 -0.5
6 1.8 4.2 -2.4 16 1.8 1.1 0.7
7 6.0 10.0 -4.0 17 20 11 9.0
8 3.0 5.5 -2.5 18 2.0 2.5 -0.5
9 36 41 -5.0 19 2.5 2.3 0.2
10 4.7 4.4 0.3 20 4.1 2.5 1.6

Distribuciones Continuas
Estimación de una Proporción

Ejemplo
En una muestra aleatoria de n = 500 familias que tienen televisores en
la ciudad de Cali, se encuentra que x = 340 tiene suscripción con el
operador de cable A. Calcular un intervalo de confianza del 95 % para
la proporción real de familias que tienen televisores en esta ciudad y
están suscritas al operador A.

Distribuciones Continuas
Estimación de una Proporción

Si p̂ es la proporción de éxitos en una muestra aleatoria de tamaño n,


y q̂ = 1 − p̂, un intervalo de confianza aproximado del 100(1 − α) %
para el parámetro binomial p se obtiene por medio de
r r
p̂ q̂ p̂ q̂
p̂ − zα/2 < p < p̂ + zα/2
n n
x
donde p̂ = (x representa el número de éxitos en n ensayos) y zα/2
n
es el valor z que deja un área de α/2 a la derecha.

Distribuciones Continuas
Estimación de una Proporción

Teorema
Si p̂ se utiliza como un estimado de p, podemosptener un 100(1 − α) %
de confianza en que el error no excederá a zα/2 p̂ q̂/n.
Qué tan grande debe ser una muestra para poder estar seguros de que
el error al estimar p será menor que una cantidad especı́fica e?.
Por p medio del teorema anterior debemos elegir un n tal que
zα/2 p̂ q̂/n = e.

Distribuciones Continuas
Estimación de la diferencia entre dos proporciones

Consideremos el problema en el que se busca estimar la diferencia


entre dos parámetros binomiales p1 y p2 . Por ejemplo, p1 podrı́a ser la
proporción de fumadores con cáncer de pulmón y p2 la proporción de
no fumadores con cáncer de pulmón, y el problema consiste en estimar
la diferencia entre estas dos proporciones. Para esto, seleccionamos
muestras aleatorias independientes de tamaños n1 y n2 a partir de las
dos poblaciones binomiales con medias n1 p1 y n2 p2 , y varianzas n1 p1 q1
y n2 p2 q2 , respectivamente. Luego, determinamos los números x1 y x2
de personas con cáncer de pulmón en cada muestra, y formamos las
proporciones pˆ1 = x1 /n1 y pˆ2 = x2 /n2 .
El estadı́stico pˆ1 − pˆ2 provee un estimador puntual de la diferencia
entre las dos proporciones, p1 − p2 .

Distribuciones Continuas
Estimación de la diferencia entre dos proporciones

Definición
Si pˆ1 y pˆ2 son las proporciones de éxitos en muestras aleatorias de
tamaños n1 y n2 , respectivamente, un intervalo de confianza aproxi-
mado del 100(1−α) % para la diferencia de dos parámetros binomiales
p1 − p2 es:
s s
pˆ1 qˆ1 pˆ2 qˆ2 pˆ1 qˆ1 pˆ2 qˆ2
(pˆ1 − pˆ2 ) − zα/2 + < p1 − p2 < (pˆ1 − pˆ2 ) + zα/2 +
n1 n2 n1 n2

donde zα/2 es el valor z que deja un área de α/2 a la derecha.

Distribuciones Continuas
Estimación de la Varianza

Definición
Si s 2 es la varianza de una muestra aleatoria de tamaño n de una
población normal, un intervalo de confianza del 100(1 − α) % para σ 2
es:
(n − 1)s 2 2 (n − 1)s 2
< σ <
χ2α/2 χ21−α/2
donde χ2α/2 y χ21−α/2 son valores χ2 con v = n − 1 grados de libertad,
que dejan áreas de α/2 y 1 − α/2, respectivamente, a la derecha.

Distribuciones Continuas
Intervalos de confianza

Error estándar
σ
σx = √ Población infinita
rn
N −n σ
σx = √ Población finita
N −1 n

Distribuciones Continuas

S-ar putea să vă placă și