Sunteți pe pagina 1din 35

1

DISTRIBUCIONES CONTINUAS

Arqumedes seguir siendo recordado cuando el mundo
haya olvidado a Esquilo, porque las lenguas mueren y las
ideas matemticas no. Puede que inmortalidad sea una
palabra absurda pero quizs un matemtico tenga ms
probabilidades que nadie de aproximarse a su posible
significado
G. H. Hardy a mathematical apology
La inmortalidad, aquel sueo vanidoso de ser recordado por
generaciones futuras por los aportes al desarrollo de la
humanidad, es menos probable que el recuerdo de aquellos
siempre presentes actores de pesadillas que han marcado el
hilo de la historia
MOVE

La Distribucin Normal
Se le atribuye a Karl Friedrich Gauss, 1777-1865, matemtico alemn quien
demostr el teorema fundamental del lgebra e hizo notorias contribuciones a
otras ciencias. Abraham de Moivre, 1667-1754, matemtico britnico de
origen y formacin francesa, ya haba antes que Gauss logrado la
aproximacin normal de la distribucin binomial. Este resultado de Abraham
profundiz el concepto de probabilidad al conectar una va discreta con una
continua, es decir, las frecuencias relativas con valores estables de
probabilidad

Definicin. La variable aleatoria continua vac. X se distribuye normalmente
con media y varianza
2
o si su funcin de distribucin de probabilidad (fdp)
es:
( ) ( )
fijos. , , 0 , - , x -
2

x
2
1
2
1
, , x n x f e
< < < < < <

= =
|
|
|
.
|

\
|

2

Propiedades grficas de la distribucin normal.

1) El eje x es una asntota horizontal de f, esto es, ( )
+
~ 0 f .
2) La vertical u x = es eje de simetra de f, esto es ( ) ( ) a u f a u f = +
para todo a.
3) ( ) o t = 2 1 u f es un mximo de f, esto es ( ) 0 u ' f = y ( ) 0 u ' ' f < .
4) ( ) ( ) | |
2
1
2
e 2 u f u f

o t = o + = o son los puntos de inflexin de f as
( ) 0 u ' ' f = o .

Propiedades probabilsticas de la normal
5) ( ) 1 x d , u , x n
R
= o
}
para probar esto es mejor probar que 1 n
2
R
=
|
|
.
|

\
|
}
.
Resulta aqu una doble integral que se puede resolver mediante
coordenadas polares.
6) ( ) u X E = 7) ( )
2
X V o =
6) y 7) se comprueban integrando directamente.

Algunas representaciones grficas permiten visualizar ciertas relaciones de
localizacin segn y picudez de o para diferentes normales; observe:
3

Mayor densidad de informacin alrededor de
1
.





Igual densidad de informacin alrededor de
1
y
2
.






Mayor densidad de informacin alrededor de
2
.

4
Estandarizacin de la distribucin normal
Si la vac X se distribuye ( ) o , u , x n y efectuamos el cambio de variable
o = u x z , entonces z es tambin una vac que se distribuye ( ) 1 , 0 , z n . Basta
simplemente sustituir en la fdp original y observar que la nueva funcin, que
llamaremos Normal Estndar cumple las propiedades probabilsticas.
Observe que, independientemente de la fdp de la variable X, segn las
propiedades de la Esperanza y la Varianza:

E(X)

1
E

X
E E(Z)
=
|
|
.
|

\
|
(

+ =
|
.
|

\
|
=

0 E(Z) =
| | ( )
( )
2
2

V(X)

X V

1

X V V(Z)
=
=
=

1 V(Z) =

El proceso de estandarizacin permite la equivalencia probabilstica entre
cualquier campana ( ) o , u , x n y la estandarizada ( ) 1 , 0 , z n , lo que es
simplemente un cambio de origen y escala. As:
2
2
z -
2
1
1) 0, n(z, e
t
=
) , , ( o x n



5
( ) ( )
b a
z z z P
u b u x u a
P b X a P s s = |
.
|

\
|
o

s
o

s
o

= s s
Observe que ahora n(0,0,1)= 4 . 0
2
1
2 =

t es el mximo y que:
n (1, 0, 1) = 242 . 0
2
1
2 =

e t son los puntos de inflexin.



Funcin de Probabilidad Acumulada Normal Estndar.
Se denota como (z) y se define como

( ) ( ) ( ) t d t n z z Z P
z
}

= = s 1 , 0 , |

As: ( ) ( ) ( )
}
= s s = s s
b
a
z
z
b a
t d 1 . 0 , t n z z z P b X a P


( ) ( ) ( )
a b
z z | | = s s b X a P Segn el teorema fundamental.



Si por ejemplo queremos hallar la probabilidad correspondiente a una regin
simtrica, esto es, ( ) ( ) ( ) c c c z c P | | = s s ,
6



En la figura la simetra muestra que las colas sombreadas son de igual rea o
valor de probabilidad as:
( ) ( ) c 1 c | = | , de donde 1 ) ( 2 | = s s c c) z c P(

Observe que (0) = P (- <z<0)=
2
1
, media campana
Y por lo tanto si c=0
}
= =
0
0
n(t,0,1)dt 0) P(z =2 (0)-1=0

La siguiente tabla permite leer los valores acumulativos de probabilidad con
una precisin de cuatro cifras decimales para valores de z con dos cifras
decimales significativas. No solo informa sobre las probabilidades de la
normal estndar de media 0 y desviacin 1 sino que informa sobre cualquier
distribucin normal con media y desviacin que, sabemos, se puede
estandarizar.


7

Tabla 1. reas bajo la curva normal estndar. Los valores de la tabla que no se muestran
en negrita representan la probabilidad de observar un valor menor o igual a z. La cifra
entera y el primer decimal de z se buscan en la primera columna, y el segundo decimal en
la cabecera de la tabla. Solo se muestra la parte positiva de la tabla ya que esta
distribucin es simtrica la otra parte es la misma solo que con signo negativo.





Segunda cifra decimal del valor de z
z 0.00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753
0.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
0.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
0.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879
0.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
0.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
0.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
0.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
0.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
1.0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621
1.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .8830
1.2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .9015
1.3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .9177
1.4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319
1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545
1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706
1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
2.0 .9772 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .9817
2.1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .9857
2.2 .9861 .9864 .9868 .9871 .9875 .4878 .9881 .9884 .9887 .9890
2.3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .9916
2.4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936
2.5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .9952
2.6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .9964
2.7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974
2.8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .9981
2.9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986
3.0 .9987 .9987 .9987 .9988 .9988 .9989 .9989 .9989 .9990 .9990
3.1 .9990 .9991 .9991 .9991 .9992 .9992 .9992 .9992 .9993 .9993
3.2 .9993 .9993 .9994 .9994 .9994 .9994 .9994 .9995 .9995 .9995
3.3 .9995 .9995 .9995 .9996 .9996 .9996 .9996 .9996 .9996 .9997
3.4 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9998
8
Aunque z es cualquier nmero real se considera que P (| Z |>3.5) < 0.0001 que
se aproxima a 0.
Es prctico visualizar grficamente, usando la tabla de las probabilidades
acumulativas de la normal estndar que:
P (-1 s s z 1)=2c (1) - 1=2*0.8413 - 1=0.6826
P (-2 s s z 2)=2 (2) - 1=2*0.9772 - 1=0.9544
P (-3 s s z 3)=2 (3) - 1=2*0.9987 - 1=0.9974
Criterios De Concentracin De Informacin Alrededor De La Media
Si la fdp de una variable aleatoria es dbilmente simtrica pero se conocen
la media y la desviacin la desigualdad de Chebysheb indica que la
concentracin de informacin entre mltiplos k alrededor de la media est
dada por el valor de probabilidad:
2
k
1
1- > ks) + < X < ks - P(
Si la fdp de una variable aleatoria con media y desviacin , es monticular
o acampanada, y no necesariamente normal, entonces la desigualdad de
Chebysheb se extiende, segn Camp-Meidell cambiando k por
2
3k
a la
derecha aumentando la concentracin de informacin alrededor de la media
as:
2
9
4
- 1 > ks) < | - X | P(
k

De esta forma el porcentaje mnimo de datos de la variable por intervalo
segn el tipo de distribucin y segn k = 1, 2,3, sera:

fdp |X | < |X | < 2 |X | < 3
Arbitraria
Chebysheb
0
+
4
3
=75%
+
~
9
8
88%
+

Monticular
Camp-Meidell
~
9
5
55%
+
~
9
8
88%
+

~
81
77
96%
+

Campana
Normal*
*68%
+
*95%
+
*99%
+

9
*Estos valores son las probabilidades acumuladas en la normal estndar con dos cifras
significativas
Se concluye en general que cuando la fdp de una variable aleatoria es normal
la concentracin de datos en intervalos alrededor de la media es ms alta.
Ejemplo 1. Supngase que en cierta zona en el mes de diciembre la
temperatura T (C), se distribuye normal ( ) 10 , 20 , t n .
a) Halle la probabilidad de que se presente un fro intenso, esto es, que la
temperatura baje a menos de 10 grados, o que se presente un calor
intenso, esto es, que la temperatura supere los 30 grados.
b) Halle la temperatura c tal que la probabilidad de que se supere c sea el
doble de la probabilidad de que no se supere.
c) Cual es la probabilidad de que se presente simultneamente fro y calor
intensos?



Solucin
a) ) 30 P(T 10) P(T 30) T 10 P(T > + s = > s
Ya que son dos eventos excluyentes
30) P(T 10) P(T > = s por la simetra
10) 2P(T 30) T 10 P(T s = > s
|
.
|

\
|
s

=
10
20 10

T
2P
( ) 1 Z 2P s =
10
( ) 1587 0 2 2 . = | = 1

b) P(T>c)=2P(Tsc) como son sucesos complementarios
1-P(Tsc)=2P(Tsc)
P(Tsc)=
3
1

3
1
= |
.
|

\
|
s

10
20 c

T
P
3
1
10
20 c
10
20 c
Z P = |
.
|

\
|
| = |
.
|

\
|
s
7 . 15 c 43 . 0
3
1
10
20 c
1
= = |
.
|

\
|
| =



Observe que en T=15.7 el rea bajo la curva normal de temperatura se divide
as P (Ts15.7) =
3
1
; P (T>15.7) =
3
2

c) P(T10T30)=P()=0
Densitometra sea. DMO
La distribucin normal permite estudios conclusivos sobre muchas mediciones
de variables aleatorias asociadas a fenmenos naturales. Uno de estos
estudios corresponde a la densitometra sea DMO- es decir, la medicin de
la densidad mineral de los huesos en gramos por centmetro cuadrado. Estas
mediciones estn referenciadas segn gnero, edad y peso y permiten segn
la organizacin mundial de salud, mediante la definicin

DMO
Z

=

La clasificacin siguiente:
Se considera que la densidad mineral sea del paciente evaluado es de:
Normalidad si Z> -1,
Osteopenia si -2.5<Z<-1,
11
Osteoporosis si Z<-2.5
Osteoporosis severa o establecida si Z<-2.5 mas fractura.
Durante toda su vida el hombre pierde entre el 20 y el 30% de masa sea y la
mujer entre 30 y 50% segn esta grfica






Ejercicio. Un estudio diagnostico de DMO en la ciudad de Medelln realizado
entre Septiembre de 1996 y Marzo de 1998 mediante escaneo DEXA dio los
siguientes resultados:
Osteoporosis: 49 hombres, Osteopenia: 70 hombres, Normales: 31 hombres
a. Son consistentes los resultados con la clasificacin anterior?
Un anlisis de columna lumbar a nivel de las vrtebras 2 y 4 determinan una
DMO de 1086 granos/cm
2
con prdida del 12% de masa sea con relacin al
promedio del adulto joven.
b. Cual es el promedio DMO del adulto joven?
c. Cual es la desviacin estndar DMO del adulto joven si esta lectura
corresponde a 1.28 desviaciones estndar por debajo de dicho
promedio?
d. Cual es la clasificacin o diagnostico en este caso?
Un anlisis similar en el cuello femoral determin una DMO de 1.75 gramos
por cm
2
. Se apreci una prdida del 30% de masa sea con relacin al
promedio del adulto joven que correspondi a 2.7 desviaciones estndar por
debajo de dicho promedio.
12
e. Halle la esperanza y la varianza y clasifique el diagnstico del DMO
femoral
Distribucin Lognormal
Una vac X no negativa tiene una distribucin lognormal si la vac Y=ln(X) tiene
una distribucin normal. La fdp resultante de una va lognormal cuando ln(X)
est normalmente distribuida con parmetros y es
( ) | |

s
>
|
.
|

\
|

t
= )
0 x
0 x
2 ln
, f(x,

0
2 2
2
1
x
e
x

Observe que y no son la media y la desviacin estndar de X, sino de
ln(X). La media y la varianza de X se puede demostrar que son
( ) e e V(X) e E(X)
2 2 2
2 2
1 - = =
+ + o o

Como ln(X) tiene una distribucin normal, la fda de X se puede expresar en
trminos de la fda (z) de una vac Z normal estndar. Para x>0,
F(x; , ) = P(Xsx)=P [ ln (X) s ln (x) ]
=
( ) ( )
|
.
|

\
|

| =
|
.
|

\
|

s

ln

ln
Z P
x x

Aun cuando la curva normal es simtrica, una curva lognormal tiene sesgo
positivo.
En la siguiente familia de graficas lognormales se observa cmo la moda esta
siempre a la izquierda de la media.
13


Correspondencia Grfica entre las Distribuciones Lognormal, normal y
normal estndar

Observe que por la simetra, sesgo a la derecha de la lognormal, se cumple la
siguiente relacin de orden:
14
Moda < Mediana < Media

Ejemplo 2. El mdulo de elasticidad de cierta madera utilizada para construir
sistemas de arrastre es una variable aleatoria medida en 10
6
psi que se
distribuye lognormalmente con =0.375 y =0.25.
El valor medio y la varianza del mdulo de elasticidad son:
1.50 e e E(X)
0.40625 2 0.25 0.375
2
= = =
+

( ) 0.1453 e e V(X)
2
= - = 1
0625 . 0 8125 . 0

La probabilidad de que el mdulo de elasticidad est entre 1 y 2 es
( ) ( ) ln(2) ln(X) ln(1) P 2 X 1 P s s = s s
( ) 693 . 0 s s = ln(X) 0 P
|
.
|

\
|
s s

=
0.25
0.375 0.693
Z
0.25
0.375 0
P
0.8312 1.50) ( (1.27) = | | =
Qu valor c es tal que slo 1% de los sistemas tenga su mdulo mayor que
c? Se desea conocer la c para la cual
|
.
|

\
|
s = s =
0.25
0.375 ln(c)
Z P c) P(X 0.99
Donde (ln(c)-0.375)/0.25 = 2.33 y c = 2.605. Por lo anterior, 2.605 es el
percentil 99 de la distribucin de mdulos de elasticidad.

Ejemplo 3. La amplificacin de corriente en ciertos transistores se mide en
unidades que la hacen igual al logaritmo de I
S
/I
E,
o sea la razn entre la
corriente de salida y la corriente de entrada. Si la amplificacin de corriente
est normalmente distribuida con =2 y =0.01, calcular la probabilidad de
que la amplificacin asuma un valor entre 6.1 y 8.2.

( ) ( ) 0.8185 2.0 1.0
0.1
2 ln6.1
0.1
2 ln8.2
= | | =
|
.
|

\
|
|
|
.
|

\
|
|
15

Correccin por aproximacin contina
Son muchas las situaciones en que una fdp. de variable discreta se aproxima
mediante una fdp de variable continua cometiendo, bajo ciertas condiciones,
un error no significativo. Es este el caso de la aproximacin normal de la
binomial o de la distribucin de Poisson.
Veamos el siguiente ejemplo ilustrativo. Sea
1,2,3,4 x si
10
x 5
f(x) =

=







Evidentemente el rea bajo el histograma vale 1 y la probabilidad del suceso
3 x 1 s s es:
9 . 0 ) 3 ( ) 2 ( ) 1 ( ) 3 1 ( = + + = s s f f f x P

Es tambin obvio que la funcin continua que mejor representa la funcin f es
( )
10
y 5
y g

= , para y recorriendo continuamente el intervalo
(

2
9
,
2
1
se
puede ver por ejemplo que
1 dy
10
y 5
2
9
2
1
=

}

El suceso 3 x 1 s s es equivalente al suceso c + s s c 3 y 1 , e integrando
16
9 . 0 dy
10
y 5
3
1
=

}
c +
c

Se observa que 5 . 0 = c , que es precisamente nuestra correccin por la
aproximacin continua de f mediante g. En general se puede ver que
2
x x
i 1 i

= c
+
.
De manera prctica diremos que:
CONTINUA DISCTRETA
0.5) + b Y 0.5 - P(a = b) X P(a s s s s
En el caso en que 1 x x
i 1 i
>
+
.
Aproximacin normal estndar de la distribucin Binomial.

Este importante resultado se debi al trabajo de Moivre ya mencionado y de
Pierre Simon de Laplace, 1749 a 1827, quin mas de 40 aos antes que
Gauss haba presentado en su teora analtica de probabilidades el mtodo
de los mnimos cuadrados y las funciones generatrices. En su ensayo
filosfico sobre probabilidades aplic el clculo de probabilidad a las
ciencias naturales.
Si X es una variable aleatoria discreta que se distribuye binomialmente,
esto es ( ) ( ) n ..., 2, 1, 0, x , p 1 p
x
n
p n, x, b
x n x
=
|
|
.
|

\
|
=

con ( ) p n X E = y
( ) ( ) p 1 p n X V = y efectuamos correccin por continuidad para X y un cambio
de variable mediante la funcin
( ) p 1 p n
p n X
z

= para valores de n
suficientemente grandes, podemos aproximar la funcin binomial mediante la
distribucin normal estndar, es decir:
17
( )
1) 0, n(z, p) n, b(x,
n
o estadstic lImite
entonces
p 1 p n
p n X
z si
=

=

La aproximacin normal de la binlomial es vlida si el significado estadstico
de (n ) es que al menos el 95% de la informacin de la variable normal
est entre las cotas binomiales 0 y n, esto es n 2 0 < < , es decir
n npq 2 np 0 < <
Esta condicin origina una serie de criterios, por ejemplo autores como Meyer,
Walpole, Montgomery y Menden Hall aplican lo siguiente

p<0.5 obliga np>5
p>0.5 obliga n(1-p)>5
Usaremos el criterio de Devore

10 >

nq
y
np

















Comparacin de una distribucin Binomial con la Normal que la
aproxima. n=10,p=0.5
18









Comparacin de una distribucin Binomial con la Normal que la
aproxima. n=10,p=0.1


Ejemplo 4. En un proceso de fabricacin de lavadoras se estima que el 5%
son defectuosas; si se inspeccionan 100 lavadoras, cul es la probabilidad
de que al menos 4 de ellas sean defectuosas?
Tenemos entre manos un experimento binomial ( ) % 5 , 100 , x b , donde x es el
nmero de lavadoras defectuosas, x = 0, 1, 2,..., 100, as queremos calcular
x 100 x 100
4
100
95
100
5
x
100
4) P(X

|
.
|

\
|
|
.
|

\
|
|
|
.
|

\
|
= >


=1-P(X< 4) = 1-P(Xs3)
=1 - b(0, 100, 5/100) - b(1, 100, 5/100)
-b(2, 100, 5/100) - b(3, 100, 5/100)

Como ( ) ( ) 3 X 0 P 3 X P s s = s efectuamos la correccin de aproximacin
continua y tenemos
CONTINUA DISCRETA
0.5) 3 X 0.5 P(0 3) P(X + s s = s

19
Efectuando la estandarizacin tenemos:
|
|
.
|

\
|

s

= s
2.18
5 3.5
npq
np X
2.18
5 0.5
P 3) P(X
=P(-2.52sZs-0.69)
=(-0.69)- (-2.52)
=0.239 as P(X>4)=0.761

Ejemplo 5. Comprobar que la probabilidad de ingresar a la universidad
contestando completamente al azar un test de 50 preguntas de 4 alternativas
equiprobables es casi cero. El test se contesta completo y cada 4 respuestas
incorrectas anulan una correcta.
El nmero mnimo de respuestas correctas en el test para optar a la
universidad sera de 34, las incorrectas serian 16 que le restaran 4,
alcanzando un puntaje neto de 30 puntos. Estamos interesados en calcular
( ) ( ) 50 X 34 P 34 X P s s = > .
( ) ( ) 5 . 50 X 5 . 33 P 34 X P s s = >
discreta continua

|
|
|
|
.
|

\
|

s

s

=
06 . 3
4
1
50 5 . 50
q p n
p n X
06 . 3
4
1
50 5 . 33
P
( )
+
= s s = 0 4 . 12 Z 9 . 6 P





20
Ejemplo 6. Dado que no todos los pasajeros de una aerolnea abordan el
vuelo para el que han reservado un lugar, la aerolnea vende 52 boletos para
un vuelo de 50 pasajeros. La probabilidad de que cada pasajero cumpla con
el horario de pasabordo es constante e igual a 0.9. Las llegadas de pasajeros
son independientes
a. Cul es la probabilidad de que 1 2 pasajeros sean rechazados por
sobrecupo? Compare el clculo binomial con el clculo normal, Qu
ocurre?
b. Este vuelo se cancela si el cupo con pasabordo es menor o igual al
40% del cupo del avin, Cul es la probabilidad de que el vuelo sea
cancelado?
c. Cul es la probabilidad de que un pasajero no viaje al ser rechazado
por sobrecupo o habiendo hallado cupo por que el vuelo se cancela?
Solucin.
a. b(x, 52, 0.9)=
x x
x

|
|
.
|

\
|
|
|
.
|

\
|
|
|
|
.
|

\
|
52
52
0.1 0.9
P(x>50) = P(x=51 x=52)
=52(0.9)
51
(0.1)+ (0.9)
52

= (0.9)
51
[5.2+0.9] = (6.1) (0.9)
51
= 0.02829
n(x,46.8, 68 . 4 )
( ) ( ) 52.5 X 50.5 P 52 X 51 P
CONT DISC
s s = s s
|
.
|

\
|
s s = |
.
|

\
|
s s

2.16
5.7
Z
2.16
3.7
P
4.68
46.8 52.5
Z
4.68
46.8 50.5
P
= (2.63)- (1.71)=0.9957-0.9564~0.0392
Observe que la diferencia entre los dos clculos no es grande, es cercana al
1% y podemos considerar la aproximacin aceptable.
21
Como 5
21 5 1 0 52
8 46 9 0 52
>
)
`

= =
= =
. . nq
. . np
se cumple dbilmente el criterio de bondad de
la aproximacin pero como nq=5.2<10 no se cumple el criterio de Devore.
b. Calcular P(Xs0.4*50)= P(Xs20)=


20
0
32
) 1 . 0 ( ) 9 . 0 (
x x

c. Calcular P(x>50)+P(xs20)

Aproximacin normal estndar de la distribucin de Poisson.
Si X se distribuye binomialmente b(x,n,p) y hacemos que n sea grande y p
pequeo de forma que =np permanezaca constante, entonces

b(x,n,p) ~ (x,) con =np~ constante

Si adems hacemos X=Y continua, Y ser aproximadamente una variable
normal estndar, es decir,

1) 0, n(z, ) (x, entonces
- Y
Z si ~ = t


Ejemplo 7. En una ciudad el nmero de conductores infractores de las
normas de trnsito tiene una distribucin de Poisson con media 1000
infractores por semana. Cul es la probabilidad de partir un mximo de 950
conductores en una semana cualquiera?
Solucin.
El clculo exacto de esta probabilidad es

= s
950
0 x
x 1000
x!
(1000) e
950) P(X
un clculo ms amable es:
22
0.057 (-1.58)
1000
1000 950
Z P 950) P(X
= | =
|
.
|

\
|
s = s

Compruebe que al corregir continuidad el valor de probabilidad aumenta en
una milsima.

Tringulo de Aproximaciones de las Distribuciones Binomial, Poisson y
Normal




Se pueden visualizar, integradamente, las relaciones lmite de aproximacin
de estas tres distribuciones as:
Si en una binomial b(x, n, p) es posible sustituir
n

p = bajo la condicin de que


=np permanezca aproximadamente constante con n grande y p pequeo,
entonces b(x, n, p) se puede aproximar a una Poisson(x, )
Si corregimos continuidad en la variable aleatoria, binomial o Poisson
haciendo
( ) ( ) 0.5 b Y 0.5 a P b X a P
CONT DISC
+ s s = s s
Podemos estandarizar la nueva variable aleatoria continua Y as:

10 constante y Poisson es X si

- Y
10 p) - n(1 y np binomial es X si
p) np(1
np Y
Z

>
>

=
Obteniendo una distribucin lmite n(z, 0, 1)
23
La distribucin Gamma
Definimos primero la funcin Gamma como punto de apoyo para la definicin
de la distribucin del mismo nombre as
0 x 0, p para converge que dx e x (p)
0
x 1 p
> > =
}



Propiedades
1. (1)=1 sustituyendo directamente e integrando.
2. (p)=(p-1) (p-1) que se visualiza integrando por partes una vez.
3. (n)=(n-1)! al hacer n=p entero positivo.
4. (1/2)= al hacer
2
y
x
2
= y visualizar que
}


=
0
2
y
2

dy e
2
.
Podemos definir ahora la distribucin as: la vac positiva X es una gamma si
su fdp es:
( )
( ) 0 ) (
1
>
I
=

x e x
r
x f
x r o
o
o
con o y r fijos y positivos

Ejercicio. Probar que ( )
o
r
X E = y ( )
2
o
r
X V =
Hallar la moda y efectuar la grfica para distintos valores de r.

Distribucin exponencial
Si en la distribucin Gamma sustituimos 1 r = obtenemos la fdp exponencial
2
1
) ( y
1
) (
0 , 0 , ) (
o o
o o
o
= =
> > =

X V X E con
X e X f
X


Algunas propiedades de la exponencial son:
24
1) La fda exponencial es ( ) 0 x , e 1 x F
x
> =
o

Adems ( )
x
e x X P
o
= > .

2) La distribucin exponencial no tiene memoria, esto es,
( ) ( ) t X P s x / t s X P > = > + >
Para cualquier punto s en el tiempo, la duracin restante tiene la misma
distribucin exponencial que la duracin inicial
s
t) (s
e
e
s) P(X
t) s P(X
s) P(X
s) X t s P(X

+
=
>
+ >
=
>
> + >

t) P(X e
t
> =


3) En la fdp Gamma
( )
x 1 r
e x
(r)

f(x)

=
Cuando ( ) 1 r f , 1 = o es el valor mximo de f y la moda de x es 1 r .
( )( ) ( ) ( ) | |
1 r x x 2 r
x e e x 1 r
(r)

(x) f

= '
( ) ( ) | | x 1 r e x
(r)

(x) f
x
2 r
2
= '


r-1=x implica 0 (x) f = '
25
En x =

1 r
hay un mximo de f pues 0

1 r
f <
|
.
|

\
|
' '
Cuando =1, x=r-1 y por lo tanto f(r-1) es el valor mximo de f y la moda de x
es r-1.
4) Las grficas de ( ) 1 , r , x f y ( ) 1 , 1 r , x f + se interceptan en r x = .
f(x, r, 1) f(x, r+1, 1) implica que
x r x 1 r
e x
1) (r
1
e x
(r)
1

=

x
(r)
1) (r
=
+
r x
1)! (r
r!
= =

valor donde E(X)=Var(X)=r


Ejemplo 8. Una instalacin de bombillos cuya duracin en aos est indicada
por una vac T distribuida exponencialmente con parmetro 2 . 0 = o bombillas
por ao. Si se construye un sistema ensamblando 5 de estas.
a) Cul es el valor esperado de la duracin?
E(T)=
o
1
=
2 . 0
1
= 5
bomb
aos

b) cul es la probabilidad de que al menos 2 de ellas continen funcionando
independientemente despus de 8 aos?


26
( ) = < < < > > 8 T , 8 T , 8 T , 8 T , 8 T P
5 4 3 2 1

( ) ( ) ( ) 0.2 e 8 T P y 8 T P 8 T P
1.6 3 2
= = > < > =


As queremos calcular
( ) ( ) 2) P(x 0.8 0.2
x
5
5
2 x
x 5 x
> =
|
|
.
|

\
|


Donde X es el nmero de bombillas que duran ms de 8 aos.
=1-P(Xs1)
=1 - P(X=0) - P(X=1)
=1-(0.8)
5
-5(0.2)(0.8)
4
=0.2627

Relacin entre las distribuciones Exponencial y de Poisson
Si el numero de eventos en un intervalo es una variable X Poisson con
parmetro constante y los eventos son independientes, entonces la
distribucin del tiempo T transcurrido entre dos eventos sucesivos es
exponencial con parmetro = con E(x)= y E(T)=1/

Ejercicio
La atencin a los clientes en un puesto de servicio es un proceso Poisson-
Exponencial con =0.2 clientes atendidos por hora.

a) Cual es la distribucin del tiempo de servicio entre clientes
consecutivos?
b) Cual es la distribucin del numero de clientes atendidos por hora?
c) Cual es el promedio del tiempo de servicio a los clientes?
d) Cual es el numero esperado de clientes por hora?
e) Cules son las varianzas de ambas variables?
f) Cual es la probabilidad de que se atiendan exactamente 5 clientes en
una hora?
g) Cul es la probabilidad de que no se atiendan clientes durante una
hora?


La distribucin Chi-cuadrado ( )
2
_
Si en la distribucin Gamma:
0 x e x) (
(r)

f(x)
x 1 r
> o =


27
o, r fijos, hacemos
2
1
= o ,
2
n
r = n entero positivo y cambiamos x por z
obtenemos
( )
2
3
1
2
n
2
n
e
2
n

z
2
1
f(z)

=
y decimos que z tiene una distribucin Chi-cuadrado con v 1 n = grados de
libertad.









Esta distribucin permite muchas aplicaciones. En general se establece
simblicamente
( ) < < = Z x
2
P
o
o
.
Es claro que 2n ) y V(z n E(z) = =



28
Distribucin Efe de Snedecor
Proposicin. Sean U y V dos v.a. independientes que tienen distribuciones
Chi-cuadrado con
1
v y
2
v grados de libertad respectivamente, entonces la
variable aleatoria
2
1
v V
v U
F =
Tiene una distribucin dada por:
( ) | |( )
( ) ( )( )
2
v v
2 1 2 1
1
2
v
2 v
2 1 2 1
2 1
1
1
v f v 1 2 v 2 v
f v v 2 v v
h(f)
+

+
+
=

y se le denomina dbn efe con
1
v y
2
v grados de libertad.






Simblicamente aceptamos ( ) < < = o
o
F f P
El orden de los grados de libertad es importante de hecho
1
1 2 2 1
1

|
.
|

\
|
o
= |
.
|

\
|
o
v , v v , v
f f
Veamos:
29

( ) ( )
1 2,

21 2 1,
1
12
f F P f F P > = = <


( )
1
1 2,
2
1 12
F
v V
v U
F

= =
( )
|
|
.
|

\
|
< = <

2,1

2,1
1,2
1
12
f
1
F
1
P f F P

|
|
.
|

\
|
< =
1 2,

12
f
1
F P As
1
1 2 2 1
1

|
.
|

\
|
o
= |
.
|

\
|
o
,
f
,
f


Distribucin t-student -Gosset-
Contribucin del estadstico ingls William Sealy Gosset, 1879-1937, quien
publicara su trabajo bajo el seudnimo de student. Esta distribucin es muy
til en el estudio de muestras pequeas.

Proposicin. Sean Z y V dos vac independientes que se distribuyen n (z,
0,1) y Chi-cuadrado con v grados de libertad respectivamente, entonces la
variable aleatoria
v
V
Z
T =
Es continua y se distribuye as:
30
( ) | |
( )
< <
|
|
.
|

\
|
+
+
=
|
.
|

\
| +

t -
v
t
1
v 2 v
2 1 v
h(t)
2
1 v
2

y se denomina dbn t con v grados de libertad.
Se puede probar estadsticamente que
( )
( ) ( ) 1 , 0 , t n t h lim
v
30 v
v
=
>


Utilizando que
k
k
n
n
e
n
k
1 im l = |
.
|

\
|
+








Simblicamente aceptamos que
( ) < < = o
o
T t P

Observe que por la simetra
2 v Para
2 - v
v
V(T)
1 v para
0 E(T)
>
=
>
=



31
Ejemplo 9. Un fabricante de pilas, sabe que la vida media de la duracin de las pilas
se distribuye normalmente. l quiere estimar la vida media de las pilas del ltimo
lote, pero sabe que hay una gran dispersin tanto en la media como en la desviacin
estndar entre lote y lote. l quiere calcular:
o
o

o o
= < < 1 ) (
2 2
n
t X
n
S
t X P
Para construir lo que se define como un intervalo de confianza de la media
al 90% de confianza probando solo 9 pilas seleccionadas al azar.
Se utilizaron hasta la falla las 9 pilas y los resultados fueron 82 X = horas y
S = 4.2 horas.
Para 8 v 1 n = = grados de libertad y 9 . 0 1 = o encontramos 86 . 1
2 /
=
o
t .
As el intervalo estimado de es:
n
S t
X
n
S t
X
2 2
+ s s
2.6 82
9
(1.86)4.2
82 = as
79.4 s s 84.6
Como la muestra es pequea 12 n s y la variable es normal, la distribucin
de Gosset nos permite una forma sencilla de construir el intervalo para la
media poblacional. El ensayo es destructivo, gasto de las nueve pilas lo que
obliga a que la muestra sea pequea.






32

PROBLEMAS SELECCIONADOS
1. En un estudio sobre tumores del hgado, se comenta sobre su posible
conexin con el uso de pldoras anticonceptivas orales y se informa sobre
una encuesta de 477 hospitales que revelaron 378 casos de tumores del
hgado en mujeres. De stas, se sabe que 187 haban usado
anticonceptivos orales. Sea p la proporcin de mujeres que han usado
anticonceptivos y supongamos que 4 . p = . Si las 378 pacientes
mujeres con tumores del hgado pudieran ser vistas como una muestra
aleatoria tomada del grupo de todas las mujeres adultas, cul es la
probabilidad de que el nmero de pacientes que ha usado
anticonceptivos orales sea hasta de 187? Si p es realmente igual a .4,
es la observacin de 187 en la muestra aleatoria de 378, un suceso
raro? Representan las 378 pacientes una muestra aleatoria
seleccionada de todo el grupo de mujeres adultas?

2. De acuerdo con un artculo reciente, la televisin puede ser peligrosa para
su dieta. Los siclogos creen que comer excesivamente puede estar
asociado con estados emocionales (estar molesto, aburrido, etc.). Para
probar esta teora, supongamos que se seleccionan al azar 60 personas
con sobrepeso y que se las junta en pares, de acuerdo a su peso y sexo.
Durante un perodo de dos semanas, uno de cada par lee novelas de su
inters durante las noches, mientras que el otro miembro del par ve
televisin. Se observ entonces la cantidad de caloras en comida y
bebidas ingeniada por cada persona y se encontr que en 19 y = de los
pares las personas que vean televisin superaron a las que lean en
caloras ingeridas. Si no hay diferencia entre el efecto de la televisin y la
lectura sobre la cantidad de caloras ingeridas, la probabilidad p de que
la cantidad de caloras ingeridas por un miembro del par exceda a la
33
cantidad ingerida por el otro miembro es .5 (Si hay diferencia, entonces
5 . p = ). Proporcionan estos datos suficiente evidencia que indique que
hay diferencia entre los efectos de la televisin y la lectura sobre la
cantidad de caloras que se ingiere?

3. Las aerolneas y los hoteles frecuentemente aseguran reservaciones por
encima de su capacidad, con el objeto de minimizar las prdidas
ocasionadas por los pasajeros que no se presentan. Supongamos que
los archivos de un hotel indican que, en promedio, 10% de sus clientes
no se presentan a reclamar sus reservaciones. Si el hotel acepta 215
reservaciones y slo hay 200 habitaciones en el hotel, cul es la
probabilidad de que todos los clientes que lleguen a reclamar su
reservacin consigan una habitacin?
4. La recopilacin de grandes cantidades de datos sobre el cncer del
pulmn muestra que aproximadamente 1 de cada 40 adultos adquiere la
enfermedad. Se sabe que los trabajadores de cierta industria trabajan
en un ambiente contaminado que puede causar un aumento en la tasa de
cncer del pulmn. Una muestra aleatoria de 400 n = trabajadores
contiene 19 con casos identificables de cncer del pulmn.
Proporcionan los datos suficiente evidencia que indique una tasa de
cncer del pulmn para estos trabajadores mayor que el promedio
nacional?

5. Es causa de preocupacin cmo introducir ideas nuevas en una
universidad, principalmente al contratarse profesores jvenes nuevos, lo
cual podra causar preocupacin debido a que los profesores son cada
vez de mayor edad. Esto es, la distribucin de las edades de los
profesores se est desplazando hacia arriba, debido probablemente a la
escasez de puestos vacantes y al exceso de personal acadmico. Si la
edad de jubilacin en la mayora de las universidades es 65, podra
34
esperarse que la distribucin de las edades de los profesores sea
normal?

6. Consideremos un experimento binomial con 25 n = , 4 . p = . Calcule
( ) 11 y 8 P s s usando:

a) Las probabilidades binomiales tabuladas.
b) La aproximacin normal a la binomial.

7. Se sabe que el tiempo promedio requerido para terminar un examen es de
70 minutos con una desviacin estndar de 12 minutos. Cunto tiempo
debe asignarse si se desea que el 90% de los estudiantes tengan
suficiente tiempo para terminar el examen? (Suponga que el tiempo
requerido para terminar el examen tiene una distribucin normal).

8. Datos recolectados en un perodo largo de tiempo muestran que un
defecto gentico particular ocurre en 1 de cada 1.000 nios. En los
archivos de una clnica se encuentra que de un total de 50.000 nios
examinados 60 y = tenan el defecto. Si los 50.000 nios
representasen una muestra aleatoria de la poblacin de nios
especificada por los historiales mdicos, cul es la probabilidad de
observar un valor de y igual a 60 o ms? Dira usted que la observacin
de y = 60 nios con defectos genticos constituye un suceso raro?

9. El teorema del lmite central establece que una media muestral y tiene
una distribucin aproximadamente normal para valores grandes de n.
Supongamos que se extrae una muestra de tamao n = 100 de una
poblacin con media 40 = y 4 = o .

a) Cul es el valor de ( ) y E ?
35
b) Cual es la desviacin estndar de y ?
c) Cul es el valor de ( ) 41 y P > ?

10. Una aerolnea encuentra que el 5% de las personas que hacen una
reservacin por cierto vuelo no se presentan al aeropuerto. Si la
aerolnea vende 160 boletos para un vuelo con slo 155 asientos
disponibles, cul es la probabilidad de que todas las personas que
tengan una reservacin y se presenten al aeropuerto consigan un
asiento?

11. Los requerimientos de seguridad para los cascos de proteccin usados
por los trabajadores de la construccin y otros, especifican que cada uno
de tres cascos deben pasar la siguiente prueba: Se monta el casco en
una pieza de aluminio con forma de cabeza. Se deja caer sobre el casco
una bola de acero de 8 libras de peso desde una altura de 5 pies y se
mide la fuerza resultante en la base de la pieza de aluminio. La fuerza
ejercida sobre la pieza de aluminio por cada uno de los tres cascos debe
ser menor que 1.000 libras y el promedio de las tres debe ser menor que
850 libras. (La relacin entre esta prueba y el dao real a una cabeza
humana es desconocida). Supongamos que la fuerza ejercida tiene una
distribucin normal y que por lo tanto la media muestral de las tres
fuerzas observadas tambin tiene una distribucin normal. Si se
selecciona al azar una muestra de tres cascos de un envo cuya media es
igual a 900 y 100 = o , cul es la probabilidad de que la media
muestral satisfaga los requerimientos de seguridad?

S-ar putea să vă placă și