Distribuciones de Probabilidad

Distribuciones Continuas de Probabilidad
UC
2018
Distribuciones Continuas
Distribución Normal
Caracterı́sticas
La moda, que es el punto sobre el eje horizontal donde la curva

tiene su punto máximo, ocurre en x = µ.
La curva es simétrica alrededor de un eje vertical.
La curva normal se aproxima al eje horizontal de manera asintóti-
ca.
El área total bajo la curva y sobre el eje horizontal es igual a uno.
Áreas bajo la curva normal
La curva de cualquier distribución de probabilidad continua o función
de densidad se construye de manera que el área bajo la curva limitada
por las dos ordenadas x = x1 y x = x2 sea igual a la probabilidad de
que la variable aleatoria X tome un valor entre x = x1 y x = x2 . Es
decir:
Z x2 Z x2 (x − µ)2
1 −
P(x1 < X < x2 ) = n(x; µ, σ)dx = √ e 2σ 2 dx
x1 σ 2π x1
Áreas bajo la curva normal
El área bajo la curva entre dos ordenadas también depende de los

valores µ y σ.
Las dos regiones sombreadas tienen tamaños diferentes, por lo
tanto, la probabilidad asociada con cada distribución será diferente
para los dos valores dados de X .
Normal Estándar
Serı́a inútil tratar de establecer tablas separadas para cada posible

valor de µ y σ.
Podemos transformar todas las observaciones de cualquier variable
aleatoria normal X en un nuevo conjunto de datos de una variable
aleatoria normal Z con media 0 y varianza 1.
Z se llama distribución normal estándar n(z; 0, 1).
La transformación de los valores por medio de:
x −µ
Z=
σ
Es decir que:
P(x1 < X < x2 ) = P(z1 < X < z2 )
Normal Estándar
Figura: Distribuciones normales, original y transformada
Aproximación Normal a la Binomial
Si X es una variable aleatoria binomial con media µ = np y

varianza σ 2 = npq, entonces:
X − np
Z= √
npq
Ejemplo: Graficar b(x; 15, 0,4) y calcular P(X = 4).
Ejemplo: Graficar b(x; 50, 0,4) y calcular P(20 ≤ X ≤ 26).
Aproximación Normal a la Binomial
Sea X una variable aleatoria binomial con parámetros n y p. Para

una n grande X tiene aproximadamente una distribución normal con
µ = np y σ 2 = npq y además:
x
X
P(X ≤ x) = b (k; n, p)
k=0
≈ área bajo la curva normal a la izquierda de x + 0,5

x + 0,5 − np
=P Z ≤ √
npq
La aproximación será buena si np y nq son ≥ 5.
Distribuciones Gamma y Exponencial
La función gamma se define como:
Z ∞
Γ(α) = x α−1 e −x dx , α > 0
0
La variable aleatoria continua X tiene una distribución gamma, con

parámetros α y β, si su función de densidad está dada por:
 1 x α−1 e −x/β x > 0


f (x; α, β) = β α Γ(α)
0 en otro caso

donde α > 0, β > 0.

La media y la varianza de la distribución gamma son
µ = αβ σ 2 = αβ 2
Distribución Exponencial
La variable aleatoria continua X tiene una distribución exponencial,

con parámetro β, si su función de densidad es:
 1 e −x/β , x > 0

f (x; β) = β
0, en otro caso
donde β > 0.
La media y la varianza de la distribución exponencial son
µ = β σ2 = β 2
Problemas
1 Un aparato electrónico contiene cierto tipo de componente cuyo

tiempo de operación antes de fallar, en años, es T. La variable
aleatoria T se modela mediante la distribución exponencial con
tiempo medio de operación antes de fallar β = 5 . Si se instalan
5 de estos componentes en diferentes aparatos, ¿cuál es la proba-
bilidad de que al final de 8 años al menos dos aún funcionen?
2 La vida, en años, de cierto interruptor eléctrico tiene una distri-
bución exponencial con una vida promedio de β = 2. Si 100 de
estos interruptores se instalan en diferentes sistemas, ¿cuál es la
probabilidad de que a lo sumo, fallen 30 durante el primer año?
Problemas
3 El tiempo necesario para que un cliente sea atendido en una banco

es una variable aleatoria que tiene una distribución exponencial
con una media de 4 minutos. ¿Cuál es la probabilidad de que una
persona sea atendida en menos de 3 minutos en al menos 4 de los
siguientes 6 dı́as?
4 En un estudio biomédico con ratas se utiliza una investigación de

respuesta a la dosis, para determinar el efecto de un tóxico en
su tiempo de supervivencia. El tóxico es producido por el com-
bustible que utilizan los aviones y en consecuencia, descargan con
frecuencia a la atmósfera. Para cierta dosis del tóxico, el estudio
determina que el tiempo de supervivencia de las ratas, en sema-
nas, tiene una distribución gamma con α = 5 y β = 10. ¿Cuál es
la probabilidad de que una rata no sobreviva más de 60 semanas?
Problemas
5 A partir de datos previos se sabe que el tiempo que transcurre,

en meses, entre las quejas de los clientes sobre cierto producto
es una distribución gamma con α = 2 y β = 4. Se realizaron
cambios para hacer más estrictos los requerimientos del control
de calidad después de los cuales pasaron 20 meses antes de la
primera queja. ¿Parecerı́a que los cambios realizados en el control
de calidad resultaron eficaces?
6 En cierta ciudad el consumo diario de energı́a eléctrica, en millo-

nes de kilowatts-hora, es una variable aleatoria X que tiene una
distribución gamma con media µ = 6 y varianza σ 2 = 12.
a Calcule los valores de α y β.
b Calcule la probabilidad de que en cualquier dı́a dado el consumo
diario de energı́a exceda los 12 millones de kilowatts-hora.
Estimación
La estimación puntual de algún parámetro (estadı́stico) θ de la

población es un solo valor θ0 . Por ejemplo, el valor x del estadı́stico
X que se calcula a partir de una muestra de tamaño n, es una
estimación puntual del parámetro de la población µ.
Se puede esperar que una estimación puntual de una muestra
dada sea exactamente igual al parámetro de la población que se
quiere. Hay muchas situaciones en que es preferible determinar
un intervalo dentro del cual esperarı́amos encontrar el valor del
parámetro. Tal intervalo se conoce como estimación por intervalo
o intervalo de confianza.
Intervalos de confianza
Intervalo de confianza de µ - σ 2 conocida

Si x es la media de una muestra aleatoria de tamaño n de una población
de la que se conoce su varianza σ 2 , un intervalo de confianza de 100(1−
α) % para µ es:
σ σ
x − zα/2 √ < µ < x + zα/2 √
n n
donde zα/2 es el valor z que deja un área de α/2 a la derecha.
Ejemplo
Se encuentra que la concentración promedio de zinc que se obtiene
en una muestra de mediciones en 36 sitios diferentes de un rı́o es de
2.6 gramos por mililitro. Calcule los intervalos de confianza del 95 %
y 99 % para la concentración media de zinc en el rı́o. Suponga que la
desviación estándar de la población es de 0.3 gramos por mililitro.
Error
Teorema
Si utilizamos x como una estimación de µ, podemos tener 100(1−α) %
σ
de confianza en que el error no excederá a zα/2 √ .
n
En el ejemplo anterior tenemos una confianza del 95 % en que la media

muestral x = 2,6√difiere de la media verdadera µ en una cantidad menor
que (1,96)(0,3)/ 36 = 0,098.
Con frecuencia queremos saber qué tan grande necesita ser una mues-
tra para poder estar seguros de que el error al estimar µ será me-
nor que una cantidad especı́fica e, debemos elegir n de manera que
σ
zα/2 √ = e.
n
Tamaño de la muestra
Es decir que: z
α/2 σ
2
n=
e
Ejemplo
Qué tan grande debe ser la muestra del ejemplo anterior si queremos
tener 95 % de confianza en que nuestra estimación de µ diferirá por
menos de 0.05?
σ 2 desconocida
Si x y s son la media y la desviación estándar de una muestra aleatoria
de una población normal de la que se desconoce la varianza σ 2 , un
intervalo de confianza del 100(1 − α) % para µ es:
s s
x − tα/2 √ < µ < x + tα/2 √
n n
donde tα/2 es el valor t con v = n − 1 grados de libertad que deja un

área de α/2 a la derecha.
Ejemplo
El contenido de ácido sulfúrico de 7 contenedores similares es de 9.8,
10.2, 10.4, 9.8, 10.0, 10.2, y 9.6 litros. Calcule un intervalo de
confianza del 95 % para el contenido promedio de todos los
contenedores suponiendo una distribución aproximadamente normal.
σ 2 desconocida
Con frecuencia se recomiendan que incluso cuando no sea posible su-

poner la normalidad, se desconozca σ y n ≥ 30, σ se puede reemplazar
con s para poder utilizar el intervalo de confianza
s
x ± zα/2 √
n
A menudo se hace referencia a esto como un intervalo de confianza

para una muestra grande.
Ejemplo: Se obtienen las calificaciones de matemáticas de las prue-
bas Saber de una muestra aleatoria de 500 estudiantes. Se calculan la
media y la desviación estándar muestrales, que son 501 y 112, respecti-
vamente. Calcular un intervalo de confianza del 99 % de la calificación
promedio de matemáticas.
Dos muestras: estimación de la diferencia entre dos
medias
Si tenemos dos poblaciones con medias µ1 y µ2 , y varianzas σ12 y

σ22 , respectivamente, el estadı́stico que da un estimador puntual de la
diferencia entre µ1 y µ2 es X 1 − X 2 . Por lo tanto, para obtener una
estimación puntual de µ1 − µ2 , se seleccionan dos muestras aleatorias
independientes, una de cada población, de tamaños n1 y n2 , y se calcula
X 1 − X 2 , la diferencia de las medias muestrales.
Intervalo de confianza para µ1 − µ2
Cuando se conocen σ12 y σ22

Si x1 y x2 son las medias de muestras aleatorias independientes de
tamaños n1 y n2 , de poblaciones que tienen varianzas conocidas σ12 y
σ22 , respectivamente, un intervalo de confianza del 100(1 − α) % para
µ1 − µ2 está dado por
s s
σ12 σ2 σ12 σ2
(x1 − x2 ) − zα/2 + 2 < µ1 − µ2 < (x1 − x2 ) + zα/2 + 2
n1 n2 n1 n2
Si las varianzas no se conocen y las dos distribuciones implicadas son

aproximadamente normales, la distribución t resulta implicada como
en el caso de una sola muestra. Si no se supone normalidad, muestras
grandes (mayores que 30) permitirán usar s1 y s2 .
Ejemplo
Se llevó a cabo un experimento donde se compararon dos tipos de mo-

tores tipo A y tipo B. Se midió el rendimiento de combustible en millas
por galón. Se realizaron 50 experimentos con el motor A y 75 con el
motor B. La gasolina utilizada y las demás condiciones se mantuvieron
constantes. El rendimiento promedio de gasolina para el motor A fue
de 36 millas por galón y el promedio para el motor B fue de 42 millas
por galón. Calcule un intervalo de confianza del 96 % sobre µA − µB ,
donde µA y µB corresponden a la media de la población del rendimiento
de millas por galón para los motores A y B, respectivamente. Suponga
que las desviaciones estándar de la poblacion son 6 y 8 para A y B
respectivamente.
Varianzas desconocidas e iguales
Si x1 y x2 son las medias de muestras aleatorias independientes con ta-

maños n1 y n2 , respectivamente, tomadas de poblaciones aproximada-
mente normales con varianzas iguales pero desconocidas, un intervalo
de confianza del 100(1 − α) % para µ1 − µ2 está dado por
s s
1 1 1 1
(x1 − x2 ) − (tα/2 )Sp + < µ1 − µ2 < (x1 − x2 ) + (tα/2 )Sp +
n1 n2 n1 n2
donde Sp es la estimación agrupada de la desviación estándar de la

población y tα/2 es el valor t con v = n1 + n2 − 2 grados de libertad,
que deja un área de α/2 a la derecha.
(n1 − 1)S12 + (n2 − 1)S22

Sp2 =
n1 + n2 − 2
Ejemplo
En el artı́culo “Estructura comunitaria de los macroinvertebrados co-
mo un indicador de la contaminación de minas ácidas”, publicado en el
Journal of Environmental Pollution, se informa sobre una investigación
realizada para determinar la relación entre parámetros fı́sicoquı́micos
seleccionados y diversas mediciones de la estructura de la comunidad
de macroinvertebrados. Una faceta de la investigación consistió en eva-
luar la efectividad de un ı́ndice numérico de la diversidad de especies
para indicar la degradación del agua debida al desagüe ácido de una
mina. Conceptualmente, un ı́ndice elevado de la diversidad de especies
macroinvertebradas deberı́a indicar un sistema acuático no contamina-
do; mientras que un ı́ndice bajo de esta diversidad indicarı́a un sistema
acuático contaminado.
Ejemplo
Se eligieron 2 estaciones de muestreo independientes para este estudio:
una que se localiza corriente abajo del punto de descarga ácida de la
mina y la otra ubicada corriente arriba. Para 12 muestras mensuales
reunidas en la estación corriente abajo el ı́ndice de diversidad de espe-
cies tuvo un valor medio de x1 = 3,11 y una desviación estándar de
s1 = 0,771; mientras que 10 muestras reunidas mensualmente en la
estación corriente arriba tuvieron un valor medio del ı́ndice x2 = 2,04
y una desviación estándar de s2 = 0,448. Calcular un intervalo de con-
fianza del 90 % para la diferencia entre las medias de la población de
los dos sitios, suponiendo que las poblaciones se distribuyen de forma
aproximadamente normal y que tienen varianzas iguales.
Varianzas desconocidas y diferentes
σ12 6= σ12 desconocidas

s s
s12 s22 s12 s2
(x1 − x2 ) − (tα/2 ) + < µ1 − µ2 < (x1 − x2 ) + (tα/2 ) + 2
n1 n2 n1 n2
donde tα/2 es el valor t con:
(s12 /n1 + s22 /n2 )2

v=
[(s12 /n1 )2 /(n1 − 1)] + [(s22 /n2 )2 /(n2 − 1)]
grados de libertad, que deja un área de α/2 a la derecha.
Varianzas desconocidas y diferentes
Ejemplo
Se llevó a cabo un estudio para estimar la diferencia en la cantidad
de ortofosfato medido en dos estaciones diferentes del rı́o Cauca. El
ortofosfato se mide en miligramos por litro. Se reunieron 15 muestras
de la estación 1 y 12 muestras de la estación 2. Las 15 muestras de
la estación 1 tuvieron un contenido promedio de ortofosfato de 3.84
miligramos por litro y una desviación estándar de 3.07 miligramos por
litro; mientras que las 12 muestras de la estación 2 tuvieron un conte-
nido promedio de 1.49 miligramos por litro y una desviación estándar
de 0.80 miligramos por litro. Determinar un intervalo de confianza de
95 % para la diferencia en el contenido promedio verdadero de ortofos-
fato en estas dos estaciones. Suponga que las observaciones provienen
de poblaciones normales con varianzas diferentes.
Observaciones pareadas
Consideremos el caso de estimación para la diferencia de dos medias

cuando las muestras no son independientes y las varianzas de las dos
poblaciones no son necesariamente iguales. La situación que se consi-
dera hace referncia a las observaciones pareadas.
En este caso cada unidad experimental homogénea recibe ambas con-
diciones de la población; como resultado, cada unidad experimental
tiene un par de observaciones, una para cada población. Por ejemplo,
si realizamos una prueba de una nueva dieta con 15 individuos, los pe-
sos antes y después de seguir la dieta conforman la información de las
dos muestras. Las dos poblaciones son antes y después y la unidad
experimental es el individuo.
Intervalo de confianza
Si d y sd son la media y la desviación estándar, respectivamente, de
las diferencias distribuidas normalmente de n pares aleatorios de medi-
ciones, un intervalo de confianza del 100(1 − α) % para µD = µ1 − µ2
es
sd sd
d − tα/2 √ < µD < d + tα/2 √ < µD
n n
donde tα/2 es el valor t con v = n − 1 grados de libertad, que deja un
área de α/2 a la derecha.
Ejemplo
Un estudio reporta los niveles de dioxina TCDD en 20 personas, quienes
posiblemente estuvieron expuestos a un agente quı́mico. En la siguiente
tabla se presentan los niveles de TCDD en sangre y tejido adiposo.
Calcular un intervalo de confianza del 95 % para µ1 − µ2 , donde µ1
y µ2 representan las medias de los niveles de TCDD en sangre y en
tejido adiposo, respectivamente. Suponga que la distribución de las
diferencias es casi normal.
Ind. Sangre TA di Ind. Sangre TA di

1 2.5 4.9 -2.4 11 6.9 7.0 -0.1
2 3.1 5.9 -2.8 12 3.3 2.9 0.4
3 2.1 4.4 -2.3 13 4.6 4.6 0.0
4 3.5 6.9 -3.4 14 1.6 1.4 0.2
5 3.1 7.0 -3.9 15 7.2 7.7 -0.5
6 1.8 4.2 -2.4 16 1.8 1.1 0.7
7 6.0 10.0 -4.0 17 20 11 9.0
8 3.0 5.5 -2.5 18 2.0 2.5 -0.5
9 36 41 -5.0 19 2.5 2.3 0.2
10 4.7 4.4 0.3 20 4.1 2.5 1.6
Estimación de una Proporción
Ejemplo
En una muestra aleatoria de n = 500 familias que tienen televisores en
la ciudad de Cali, se encuentra que x = 340 tiene suscripción con el
operador de cable A. Calcular un intervalo de confianza del 95 % para
la proporción real de familias que tienen televisores en esta ciudad y
están suscritas al operador A.
Si p̂ es la proporción de éxitos en una muestra aleatoria de tamaño n,

y q̂ = 1 − p̂, un intervalo de confianza aproximado del 100(1 − α) %
para el parámetro binomial p se obtiene por medio de
r r
p̂ q̂ p̂ q̂
p̂ − zα/2 < p < p̂ + zα/2
n n
x
donde p̂ = (x representa el número de éxitos en n ensayos) y zα/2
n
es el valor z que deja un área de α/2 a la derecha.
Teorema
Si p̂ se utiliza como un estimado de p, podemosptener un 100(1 − α) %
de confianza en que el error no excederá a zα/2 p̂ q̂/n.
Qué tan grande debe ser una muestra para poder estar seguros de que
el error al estimar p será menor que una cantidad especı́fica e?.
Por p medio del teorema anterior debemos elegir un n tal que
zα/2 p̂ q̂/n = e.
Estimación de la diferencia entre dos proporciones
Consideremos el problema en el que se busca estimar la diferencia

entre dos parámetros binomiales p1 y p2 . Por ejemplo, p1 podrı́a ser la
proporción de fumadores con cáncer de pulmón y p2 la proporción de
no fumadores con cáncer de pulmón, y el problema consiste en estimar
la diferencia entre estas dos proporciones. Para esto, seleccionamos
muestras aleatorias independientes de tamaños n1 y n2 a partir de las
dos poblaciones binomiales con medias n1 p1 y n2 p2 , y varianzas n1 p1 q1
y n2 p2 q2 , respectivamente. Luego, determinamos los números x1 y x2
de personas con cáncer de pulmón en cada muestra, y formamos las
proporciones pˆ1 = x1 /n1 y pˆ2 = x2 /n2 .
El estadı́stico pˆ1 − pˆ2 provee un estimador puntual de la diferencia
entre las dos proporciones, p1 − p2 .
Estimación de la diferencia entre dos proporciones
Definición
Si pˆ1 y pˆ2 son las proporciones de éxitos en muestras aleatorias de
tamaños n1 y n2 , respectivamente, un intervalo de confianza aproxi-
mado del 100(1−α) % para la diferencia de dos parámetros binomiales
p1 − p2 es:
s s
pˆ1 qˆ1 pˆ2 qˆ2 pˆ1 qˆ1 pˆ2 qˆ2
(pˆ1 − pˆ2 ) − zα/2 + < p1 − p2 < (pˆ1 − pˆ2 ) + zα/2 +
n1 n2 n1 n2
Estimación de la Varianza
Definición
Si s 2 es la varianza de una muestra aleatoria de tamaño n de una
población normal, un intervalo de confianza del 100(1 − α) % para σ 2
es:
(n − 1)s 2 2 (n − 1)s 2
< σ <
χ2α/2 χ21−α/2
donde χ2α/2 y χ21−α/2 son valores χ2 con v = n − 1 grados de libertad,
que dejan áreas de α/2 y 1 − α/2, respectivamente, a la derecha.
Error estándar
σ
σx = √ Población infinita
rn
N −n σ
σx = √ Población finita
N −1 n

Distribuciones de Probabilidad

Încărcat de

Informații document

Descriere originală:

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Distribuciones de Probabilidad

Încărcat de

Drepturi de autor:

Formate disponibile

Distribuciones Continuas de Probabilidad

La moda, que es el punto sobre el eje horizontal donde la curva

El área bajo la curva entre dos ordenadas también depende de los

Serı́a inútil tratar de establecer tablas separadas para cada posible

P(x1 < X < x2 ) = P(z1 < X < z2 )

Figura: Distribuciones normales, original y transformada

Si X es una variable aleatoria binomial con media µ = np y

Ejemplo: Graficar b(x; 15, 0,4) y calcular P(X = 4).

Ejemplo: Graficar b(x; 50, 0,4) y calcular P(20 ≤ X ≤ 26).

Sea X una variable aleatoria binomial con parámetros n y p. Para

La aproximación será buena si np y nq son ≥ 5.

La variable aleatoria continua X tiene una distribución gamma, con

 1 x α−1 e −x/β x > 0

donde α > 0, β > 0.

La variable aleatoria continua X tiene una distribución exponencial,

1 Un aparato electrónico contiene cierto tipo de componente cuyo

3 El tiempo necesario para que un cliente sea atendido en una banco

4 En un estudio biomédico con ratas se utiliza una investigación de

5 A partir de datos previos se sabe que el tiempo que transcurre,

6 En cierta ciudad el consumo diario de energı́a eléctrica, en millo-

La estimación puntual de algún parámetro (estadı́stico) θ de la

Intervalo de confianza de µ - σ 2 conocida

donde zα/2 es el valor z que deja un área de α/2 a la derecha.

En el ejemplo anterior tenemos una confianza del 95 % en que la media

donde tα/2 es el valor t con v = n − 1 grados de libertad que deja un

Con frecuencia se recomiendan que incluso cuando no sea posible su-

A menudo se hace referencia a esto como un intervalo de confianza

Si tenemos dos poblaciones con medias µ1 y µ2 , y varianzas σ12 y

Cuando se conocen σ12 y σ22

donde zα/2 es el valor z que deja un área de α/2 a la derecha.

Si las varianzas no se conocen y las dos distribuciones implicadas son

Se llevó a cabo un experimento donde se compararon dos tipos de mo-

Si x1 y x2 son las medias de muestras aleatorias independientes con ta-

donde Sp es la estimación agrupada de la desviación estándar de la

(n1 − 1)S12 + (n2 − 1)S22

σ12 6= σ12 desconocidas

donde tα/2 es el valor t con:

(s12 /n1 + s22 /n2 )2

grados de libertad, que deja un área de α/2 a la derecha.

Consideremos el caso de estimación para la diferencia de dos medias

Ind. Sangre TA di Ind. Sangre TA di

Si p̂ es la proporción de éxitos en una muestra aleatoria de tamaño n,

Consideremos el problema en el que se busca estimar la diferencia

donde zα/2 es el valor z que deja un área de α/2 a la derecha.

S-ar putea să vă placă și