Documente Academic
Documente Profesional
Documente Cultură
-1-
12
Observe que la media, la varianza y cualquier otro momento depende nicamente del parmetro n.
Ejemplo.En el ao de 1979 se encomend a un auditor de la Secretara de Hacienda revisar la declaracin de
impuestos de un profesor cualquiera, de los 74 profesores del Colegio de Postgraduados. Para elegir al
profesor, el auditor escribe los nombres de cada uno de los profesores en tarjetas
tar
previamente
numeradas. Despus de revolverlas, selecciona una de ellas y registra el nombre all escrito. El espacio
-2-
muestral resultante est constituido por los nombres de los 74 profesores. Sea X la variable aleatoria
definida por X=nmero de la tarjeta con el nombre del profesor. La funcin de probabilidad de X es:
1/74; X=1, 2, 3..74
P(X)=
0, de otra forma
La media y la varianza de la variable X son:
Ejercicios
74 1
37.5
2
74
1
456.2
12
Se sugieren los ejercicios del texto Mtodos Estadsticos de Said Infante y Guillermo Zrate Captulo 6
pg. 229 #s. 1 y 2.
6.1.2. La distribucin Binomial
Algunos experimentos consisten en la observacin de una serie de ensayos idnticos e independientes,
los cuales pueden generar uno de dos resultados posibles, ejemplo: cada artculo que sale de una lnea de
produccin es o bien, defectuoso o no defectuoso, los tiros en una serie de disparos a un blanco pueden
resultar un xito o un fracaso; este tipo de experimentos se denominan Binomiales y todos ellos renen
las siguientes caractersticas:
1. El experimento consta de n ensayos idnticos.
2. Cada ensayo tiene dos resultados posibles. A uno se le llama xito E y al otro fracaso F.
3. La probabilidad de tener xito en un solo ensayo es igual a p, y permanece constante de ensayo
en ensayo. La probabilidad de un fracaso es igual a q=(1-p)
4. Los ensayos son independientes.
5. La variable aleatoria bajo estudio es X, que se refiere al nmero de xitos observados en los n
ensayos.
Para determinar si un experimento es realmente Binomial, este debe de cumplir con cada una de las
caractersticas que se mencionaron. Obsrvese que la variable aleatoria de inters es el nmero de xitos
observados en el ensayo n. Es muy importante recalcar desde el principio que un xito no
necesariamente es lo mejor, en este caso es nicamente el nombre que recibe uno de los dos posibles
resultados de un solo ensayo en un experimento.
Ejemplo.Un sistema de alarma para detectar rpidamente aviones consta de cuatro unidades de radar idnticas
que trabajan independientemente. Suponga que cada una tiene una probabilidad de 0.95 de detectar un
avin que se interna en el rea del sistema. Cuando un avin aparece, la variable aleatoria de inters es
-3-
X el nmero de unidades de radar que no detectan el avin. Puede decirse que se trata de un
experimento binomial?
Ejemplo.Supngase que el 40% de una gran poblacin de votantes registrados est a favor del candidato
Caldern. Se tomara una muestra aleatoria de n=10 votantes y se observa Y que es el nmero de
quienes favorecen a Caldern Satisface este experimento los requisitos de un experimento binomial?
Solucin
Si seleccionamos cada una de las 10 personas de manera aleatoria de la poblacin, entonces tenemos 10
pruebas casi idnticas, en donde cada prueba corresponde a una persona a favor (E) o en contra (F) de
Caldern. La variable aleatoria de inters es el nmero de xitos en 10 pruebas. La probabilidad de estar
a favor (E) de Caldern para la primera persona elegida es 0.4, pero cual sera la probabilidad para la
segunda persona estar a favor de Caldern?
Cuando la poblacin es muy grande el hecho de sacar a una persona no cambia sustancialmente la
fraccin de votantes a favor de Caldern y la probabilidad de que la segunda persona este a favor de
Caldern seguir estando cercana a 0.4.
En general cuando la poblacin es grande y el tamao de muestra es relativamente pequeo con
respecto a ella, la probabilidad de tener xito permanecer aproximadamente igual de prueba a prueba,
sin importar el resultado de las pruebas anteriores por lo que las pruebas sern aproximadamente
independientes y los problemas de este tipo sern aproximadamente binomiales.
Reflexin Si el tamao de la muestra fuera relativamente grande con respecto al tamao de la poblacin
(20% de la poblacin), la probabilidad de elegir un partidario de Caldern en una seleccin posterior se
alterara significativamente.
Despus de haber definido un experimento binomial y de ver sus aplicaciones practicas, pasemos a la
derivacin de la distribucin de probabilidad de la variable y que representa el nmero de xitos
observados en n ensayos. Para ello obtendremos la probabilidad de la variable X para experimentos que
tengan n=1 2 y 3 ensayos y observemos los resultados.
As para n=1 ensayo, tenemos dos puntos muestrales E que representa el xito y F que representa el
fracaso, que respectivamente tienen probabilidades p y q=1-p. Puesto que X es el nmero de xitos en
el nico ensayo y E implica el xito, le asignamos un valor a X de x=1cuando se da el xito y de
manera similar F es fracaso, le asignamos un valor x=0. La distribucin de probabilidad sera:
Tabla1
Puntos
x
P(x)
muestrales
p(x)=p+q=1
-4-
La distribucin de probabilidades para un experimento con n=2 ensayos se obtiene de una manera
similar y los cuatro puntos muestrales posibles se muestran en la siguiente tabla
Tabla2
Puntos
P(x)
EE
P2
EF
pq
FE
pq
FF
q2
muestrales
p(x)=p2+pq+pq+q2
=p2+2pq+q2=(p+q)2=(1)2=1
-5-
eee
eef
1/3
efe
2/3
eff
1/3
fee
fef
1/3
ffe
2/3
fff
1/3
1/3
e
2/3
e
2/3
1/3
e
2/3
1/3
2/3
f
2/3
f
Probabilidad
Valor de x
1) eee
ppp=1/31/31/3=(1/3)3
2) eef
ppq=1/31/32/3=(1/3)2(2/3)
3) efe
pqp=1/32/31/3=(1/3)2(2/3)
4) eff
pqq=1/32/32/3=(1/3)(2/3)2
5) fee
qpp=2/31/31/3=(1/3)2(2/3)
6) fef
qpq=2/31/32/3=(1/3)(2/3)2
7) ffe
qqp=2/32/31/3=(1/3)(2/3)2
8) fff
qqq=2/32/32/3=(2/3)3
Observe lo siguiente:
En la primera fila la variable aleatoria toma el valor 3, de una sola forma y la probabilidad de que esto
suceda (3xitos) es:
P(x=3)=P(eee)=ppp=(1/3)(1/3)(1/3)=(1/3)3
O tambin:
P(x=3)=1(1/3)3=1p3
-6-
En las filas 2, 3 y 5 la variable aleatoria toma el valor 2, de 3 formas diferentes y las probabilidades de
que esto suceda (2 xitos) es:
P(x=2)=P(eef)+P(efe)+P(fee)=ppq+pqp+qpp
P(x=2)=(1/3)2(2/3)+(1/3)2(2/3)+(1/3)2(2/3)
P(x=2)=3(1/3)2(2/3)=3p2q
En las filas 4, 6 y 7 la variable aleatoria toma el valor 1, de 3 formas diferentes y las probabilidades de
que esto suceda (1xito) es:
P(x=1)=3(1/3)(2/3)2= 3pq2
Por ltimo en la fila 8 la variable aleatoria toma el valor 0, de una sola forma y la probabilidad de que
esto suceda (0xitos) es:
P(x=0)= 1(2/3)3=1q3
Si se suman todas estas probabilidades obtenidas, puede notarse que se obtienen los trminos del
desarrollo del binomio (p+q)3 o sea:
3
P ( x ) = P ( x = 3) + P ( x = 2 ) + P ( x = 1) + P ( x = 0 )
x=0
(p+q)3=p3+3p2q+3pq2+1q3
Pero:
(p+q)3=(1/3+2/3)3=13=1
Entonces se concluye que la distribucin de probabilidades para este experimento binomial en el cual se
esperan x xitos (0, 1, 2, 3) en 3 ensayos o repeticiones, esta dada por el desarrollo del binomio (p+q)3 y
es igual a la unidad.
Los nmeros 1, 3, 3, 1 que son los coeficientes del desarrollo del binomio representan todas las maneras
posibles como la variable aleatoria x toma cada uno de los diferentes valores y se pueden calcular como
Cnx (combinaciones de n elementos tomados de x en x) en donde n representa el nmero de ensayos y x
el nmero de xitos en los n ensayos.
Si generalizamos el caso anterior sabemos que una variable aleatoria X tiene una distribucin de
probabilidad binomial si su funcin de probabilidad es:
, ,
Cuando X= 0, 1, 2, n
Ejercicio
Durante un perodo largo de tiempo se ha observado que un tirador da en el blanco con probabilidad
igual a 0.8, cada vez que hace un disparo. Si dispara cuatro veces:
a) Cul es la probabilidad de que de en el blanco exactamente dos veces?
b) Cul es la probabilidad de que de en el blanco al menos dos veces?
c) Cul es la probabilidad de que de en el blanco exactamente cuatro veces?
-7-
Solucin:
a) Supongamos que los disparos son independientes y que p permanece constante en todos los
disparos, entonces n=4 y p=0.8, entonces la probabilidad de que d en el blanco exactamente dos
veces ser:
P(X=2)= C4,2p2q4-2=6(0.8)2(0.2)2=0.1536
b) La probabilidad de que d en el blanco al menos dos veces ser:
P(X2)=P(X=2)+P(X=3)+P(X=4)= C4,2p2q4-2+ C4,3p3q4-3+ C4,4p4q4-4
=6(0.8)2(0.2)2+4(0.8)3(0.2)1+1(0.8)4(0.2)0
=0.1536+0.4096+0.4096=0.9728
Otra forma de plantearlo sera:
P(X2) = 1-P(X<2)=1- [P(X=0)+P(X=1)]=1- (C4,0p0q4-0+ C4,1p1q4-1)
=1-[(1)(1)(0.2)4+4(0.8)1(0.2)3]=1-[0.0016+0.0256]=0.9728
c) La probabilidad de que d en el blanco exactamente cuatro veces
P(X=4)= C4,4p4q4-4=0.4096
Hemos visto que se pueden encontrar variables aleatorias con distribuciones binomiales en muchos
casos; pero el calculo de la P(X) se vuelve tedioso para valores grandes de n (ensayos), entonces es
conveniente describir la distribucin binomial usando su media y su varianza. Esto nos permite
identificar los valores de X que son altamente improbables.
Si recordamos de acuerdo a la definicin de esperanza matemtica y del segundo momento con respecto
a la media (varianza) tenemos:
Puedes observar los valores de la p(xi) en las tablas 1 y 2 que vimos anteriormente
Para n =1
Para n=2
Para n=2
-8-
4 1 4 4 2 41
Generalizando:
Teorema: Sea x una variable aleatoria binomial basada en n ensayos y con una probabilidad de xito p,
entonces la media y la varianza son:
=E(x)=np
2=V(x)=npq
b) n=4, p=0.3
x=4(0.1)=0.4,
x=4(0.3)=1.2
2x=4(0.3)(0.7)=0.84
x=4(0.1)(0.9)=0.36
0.7
0.5
0.6561
0.4116
0.6
0.4
0.5
0.3
0.4
0.2646
0.2401
0.2916
0.3
0.2
0.2
0.0756
0.1
0.1
0.0486
0.0036 0.0001
2
3
4
Valores de la variable X
0.0081
4
Valores de la variable X
d) n=4, p=0.7
x=4(0.5)=2,
x=4(0.7)=2.8
2x=4(0.7)(0.3)=0.84
x=4(0.5)(0.5)=1
-9-
0.4
0.5
0.375
0.4116
0.4
0.3
0.25
0.25
0.3
0.2646
0.2401
0.2
0.2
0.1
0.0625
0.0625
0.0756
0.1
0
Valores de la variable X
0.0081
0
Valores de la variable X
Existen algunas caractersticas ciertas en general en las distribuciones de probabilidad que son:
a) Para valores pequeos de p (p<0.5) las probabilidades mayores se dan para valores pequeos de
x. Esto es congruente con el modelo probabilstico propuesto, ya que en estos casos la
probabilidad de xito en cada repeticin es menor que la probabilidad de fracaso. El histograma
tiene una larga cola hacia la derecha. Lo contrario ocurre con valores de p mayores de 0.5,
teniendo entonces distribuciones asimtricas hacia la izquierda.
b) La distribucin es simtrica para p=0.5. Esto se debe a que en este caso las probabilidades estn
dadas por Cnx (1/2)n y a la propiedad de las combinaciones que seala que Cn,x = Cn, n-x
c) La distribucin tiene varianza mxima para p=0.5
Ejemplo.Cmo podramos evaluar la calificacin que puede obtener un estudiante en una prueba de respuestas
mltiples? Sabemos que en una prueba objetiva donde las respuestas a las preguntas requieren que el
estudiante recuerde todo lo estudiado, una calificacin de cero, significa que la persona no pudo recordar
el material del examen en el momento de la prueba. Contrariamente un estudiante que recuerde poco o
nada del material del examen puede obtener una calificacin mayor en una prueba de respuestas
mltiples, porque solamente tiene que reconocer, en vez de recordar la respuesta correcta y adems
algunas preguntas sern respondidas correctamente solo por azar, an cuando no sabe la respuesta
correcta. Por lo que la calificacin en una prueba de este tipo puede estar por encima de cero. Si una
prueba de respuestas mltiples consta de 100 preguntas, cada una con 6 posibles respuestas. Cul sera
la calificacin esperada para un estudiante que no tiene ningn conocimiento del material de la prueba?
Dentro de que lmites se podra esperar que este la calificacin?
Solucin
Sea p la probabilidad de seleccionar la respuesta correcta en cada pregunta y sea x el nmero de
respuestas correctas que puede obtener el estudiante para n=100 preguntas. Supongamos que como no
tiene ningn conocimiento las respuestas las seleccionar al azar una de las seis posibles respuestas para
cada pregunta por lo que p=1/6. Entonces para n=100 preguntas la calificacin esperada de un estudiante
que no tiene conocimientos seria:
E(X)=np=100(1/6)=16.7 respuestas correctas.
- 10 -
Para poder evaluar entre que lmites podra estar la calificacin tendremos que considerar la variacin de
las calificaciones, as:
' .'
. /10001162516 3.7
Por el teorema de Tchebysheff, esperaramos que la mayora de las calificaciones para quienes no tienen
conocimiento del material se encuentren en el intervalo 2 o sea 16.72(3.7)=(9.3, 24.1), esto es
comparable con una calificacin de cero para una persona sin ningn conocimiento en una prueba
objetiva de memorizacin.
Ejercicios
Se sugieren los ejercicios del texto Introduccin a la Probabilidad y la Estadstica de William
Mendenhall Captulo 6 pags 166,167,170 y 171.
6.1.3.-La distribucin de probabilidad geomtrica
La variable aleatoria que tiene distribucin geomtrica se define para un experimento que es muy similar
al experimento binomial. Tambin se refiere a pruebas idnticas e independientes y cada una puede tener
dos resultados, xito o fracaso. La probabilidad de tener xito es igual a p y es constante para cada
prueba. Sin embargo, la variable aleatoria X es el nmero de la prueba en la cual ocurre el primer xito,
en lugar del nmero de xitos que ocurren en n pruebas. Entonces el experimento consiste en una serie
de pruebas que termina al obtener el primer xito. Por consiguiente el experimento podra terminar en la
primera prueba, si se obtiene un xito o continuar indefinidamente, finalizando hasta obtener el xito.
El espacio muestral E, para el experimento contiene el siguiente conjunto, infinito numerable de puntos
muestrales:
A1:
A2:
FE
A3:
FFE
A4:
FFFE
:
:
Ak:
FFFF.FE
k-1
Como la variable aleatoria X es el nmero de pruebas hasta obtener el primer xito, inclusive. Entonces
cuando X=1, X=2 y X=3, tendrn A1, A2 y A3 puntos muestrales respectivamente y en general el evento
numrico X = x, contendr solamente Ax. De ese modo:
p(x)=P(Ax)=P(FFFF.FE)
x-1
- 11 -
La probabilidad de la interseccin
n de x eventos independientes da lugar a la distribucin de probabilidad
geomtrica.
Definicin.- Una variable aleatoria X tiene una distribucin de probabilidad geomtrica, si y solamente
si:
p(x)=qx-1p
x=1, 2, 3 0 p 1
Un histograma de la distribucin de probabilidades, en donde la probabilidad de xito p=0.5 se muestra
a continuacin:
La distribucin de probabilidad geomtrica se usa frecuentemente como modelo para las distribuciones
de la longitud de tiempos de espera.. Por ejemplo, suponga que se da mantenimiento peridico al motor
de un avin comercial, de tal manera que sus diferentes partes se cambian en distintos momentos y por
eso tiene tiempos de servicio diferentes. Entonces puede ser razo
razonable
nable suponer que la probabilidad p de
falla del motor, durante cualquier intervalo de una hora de operacin, es igual para cualquier otro
intervalo de una hora. El tiempo hasta la falla del motor es entonces igual al nmero de intervalos de una
hora (X) hasta
asta el primer fallo o descompostura
descompostura. (Aqu el xito es el fallo o descompostura en una hora).
Ejemplo.- Suponga que la probabilidad de que falle un motor durante cualquier perodo de una hora es
de p=0.02. Encuentre la probabilidad de que dicho motor func
funcione
ione bien durante dos horas.
Solucin: Sea X el nmero de intervalos de una hora hasta la primera falla, entonces nos estn pidiendo
la P(X 3), o sea que funcione bien durante dos horas, en otras palabras que el primer xito (falla del
motor) se presente a partir de la tercera hora, as:
4
5 3 # "
Pero como la
4
% "
6
1, entonces:
Cuando se analiza la frmula para la distribucin geomtrica, se observa que para valores grandes de p
(por lo tanto menores de q),, llevan a probabilidades mayores para valores pequeos de
d X. Por lo que el
valor promedio de X es al parecer inversamente proporcional a p. En el siguiente teorema se da el valor
de la media de una variable aleatoria con distribucin geomtrica y el de su varianza.
Teorema.- Sea X una variable aleatoria con una distribucin geomtrica. Entonces:
- 12 -
!
'
%9
9:
Ejemplo.- Si la probabilidad de que falle un motor durante cualquier perodo de una hora es p=0.02 y si
X denota el nmero de perodos horarios hasta la primera falla, hallar la media y la desviacin estndar
de X.
Solucin: De acuerdo con el ejemplo anterior X tiene una distribucin geomtrica, con p=0.02. Por lo
%
%
que:
50 <=
9
Por lo que se espera tener que esperar muchas horas hasta que ocurra la primera falla. Como la:
%9
% .
.>?
Ejercicios
Se sugieren los ejercicios del texto Estadstica Matemtica con Aplicaciones de William Mendenhall,
Dennis Wackerly y Richard Scheaffer. Captulo 3 pgs. 101 y 102.
6.1.4.-La distribucin hipergeomtrica
En el ejemplo sobre el candidato Caldern, se comenta que si la muestra era relativamente grande con
respecto a N (mayor al 20% de la poblacin), la probabilidad de seleccionar posteriormente a un
partidario de Caldern se vera afectada significativamente por las preferencias observadas de las
personas seleccionadas anteriormente y este tipo de distribucin deja de ser binomial y la mas apropiada
para estos casos es la hipergeomtrica.
La distribucin binomial y la hipergeomtrica son parecidas ya que en ambos casos el experimento
consta de n pruebas idnticas, cada prueba tiene dos resultados posibles pero la diferencia es que las
pruebas no son independientes, ya que la probabilidad de xito en un segundo intento se ve afectada
por el resultado del primer intento; en otras palabras si E1 y E2 son xitos en el primero y segundo
intento respectivamente entonces la P(E2/E1)P(E2).
As podemos decir que una variable tiene distribucin hipergeomtrica si procede de un experimento
que cumple las siguientes condiciones:
La variable aleatoria bajo estudio es X, que se refiere al nmero de xitos observados en los n
ensayos.
- 13 -
P( X ) =
x =0
C A, x C B , n x
C ,n
cuando X=0,1,n
y nA y nB
P( X ) =
C10, x C40,5 x
; x = 0,1,2,3,4,5
C50,5
P( x 4) =
- 14 -
p=
A
q=1-p
A
B
Ejemplo.En el ejemplo anterior se tiene una distribucin hipergeomtrica con A=10, B=40 y n=5, para ese caso:
10
=1
50
= E ( X ) = 5
10 40 45
= 0.7347
50 50 49
2 = Var ( x) = 5
- 15 -
Ejercicios
Se sugieren los ejercicios del texto Estadstica Matemtica con Aplicaciones de William Mendenhall,
Dennis Wackerly y Richard Scheaffer. Captulo 3 pg. 109.
- 16 -
P( X ) =
y
x!e
Donde: e=2.71828 que es la base de los logaritmos naturales y es un nmero mayor que cero que
representa el promedio de xitos en un intervalo.
La frmula de la distribucin de Poisson se ajusta perfectamente a las necesidades de calcular, por
ejemplo: la probabilidad de que en un da cualquiera se presenten ms de un cierto nmero de
reclamaciones por pliza de seguros, o la probabilidad de que la demanda de servicios a la hora pico
exceda la capacidad de los nuevos equipos, etc.
El parmetro de la distribucin es , el nmero promedio de xitos por intervalo, que es igual a la media
y a la varianza de la variable.
! C
'
C
Esta caracterstica puede servirnos para identificar a una variable Poisson en casos en que se presenten
serias dificultades para verificar los postulados de definicin.
La distribucin de Poisson se puede considerar como el lmite al que tiende la distribucin binomial
cuando n tiende a y p tiende a 0, siendo np constante (y menor que 7); algunos autores sugieren
cuando n20 y p0.05; en esta situacin sera difcil calcular probabilidades en una variable binomial y,
por tanto, se utiliza una aproximacin a travs de una variable Poisson con media = n p.
En general utilizaremos la distribucin de Poisson como aproximacin de experimentos binomiales
donde el nmero de pruebas es muy alto, pero la probabilidad de xito muy baja.
El aspecto de la distribucin Poisson depende muchsimo de la magnitud de la media. Como ejemplo,
mostramos tres casos con = 0.5 (arriba a la izquierda), = 1.5 (arriba a la derecha) y = 5 (abajo)
Obsrvese que la asimetra de la distribucin disminuye al crecer y la grfica empieza a tener un
aspecto acampanado.
- 17 -
10
11
12
Ejemplo.Si 2% de los libros encuadernados en cierto taller tiene encuadernacin defectuosa, obtener la
probabilidad de que 5 de 400 libros encuadernados en este taller tengan encuadernaciones defectuosas.
En este caso la variable toma el valor 5, o sea X = 5, y el promedio de xitos por intervalo es = 400
(0.02) = 8
P ( X = 5) =
85
32768
=
= .0915
8
5!e
(120 )( 2981 .1174 )
Ejemplo.En la inspeccin de hojalata producida por un proceso electroltico continuo, se identifican 0.2
imperfecciones en promedio por minuto. Determine las probabilidades de identificar:
a) Una imperfeccin en 3 minutos
b) Al menos dos imperfecciones en 5 minutos
c) Cuando ms una imperfeccin en 15 minutos.
- 18 -
Solucin:
a) X es la variable que nos define el nmero de imperfecciones en la hojalata por cada intervalo de
3 minutos y podr tomar los valores X= 0, 1, 2, 3, ...., la probabilidad de xito por minuto es
p=0.2, entonces el promedio de xitos por intervalo es:
= 0.2(3) =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata
( 0 .6 )1
0 .6
=
= 0 .329307
0 .6
1! e
(1)( 2.718 ) 0.6
b) X es la variable que nos define el nmero de imperfecciones en la hojalata por cada 5 minutos y
podr tomar valores X=0, 1, 2, 3,....,en este caso = 0.2(5) =1 imperfeccin en promedio por
cada 5 minutos en la hojalata
P ( X 2) = P ( X = 2) + P ( X = 3) + P ( X = 4) + .........
O tambin puede expresarse como:
P ( X 2) = 1 [ P ( X = 0) + P ( X = 1)]
P ( X = 1) =
(1) 0 (1)1
P ( X 2 ) = 1 1 + 1 = 1 ( 0 .3679 + 0 .3679 ) = 0 .2642
0! e 1! e
c) X es la variable que nos define el nmero de imperfecciones en la hojalata por cada 15 minutos y
podr tomar valores X= 0, 1, 2, 3, ....., en este caso
= 0.2(15) = 3, imperfecciones en
promedio por cada 15 minutos en la hojalata
P ( X 1) = P ( X = 0) + P ( X = 1)
(3) 0 (3)1
P ( X 1) = 3 + 3 = ( 0 .0498 + 0 .1494 ) = 0 .1992
0! e 1! e
Ejemplo.Cierta enfermedad tiene una probabilidad muy baja de ocurrir, p=1/100,000. Calcular la probabilidad de
que en una ciudad con 500,000 habitantes haya ms de 3 personas con dicha enfermedad. Calcular el
nmero esperado de habitantes que la padecen.
Solucin: Si consideramos la v.a. X que contabiliza el nmero de personas que padecen la enfermedad,
es claro que sigue un modelo binomial, pero que puede ser muy bien aproximado por un modelo de
Poisson, de modo que:
~E 500,000; 11100,000 <I np 5
- 19 -
5
5%
5
56
> 3 1
0! R S 1! R S 2! R S 3! R S
> 3 1 0.0067 0.0337 0.0842 0.1404 0.735
Ejercicios
Se sugieren los ejercicios del texto Estadstica Matemtica con Aplicaciones de William Mendenhall,
Dennis Wackerly y Richard Scheaffer. Captulo 3 pgs. 114 115 y 116.
- 20 -
representan probabilidades para las variables aleatorias continuas y A1=A2, entonces podemos
considerar que P(0X2)=P(6X8)
F(x)
A1
A2
0 1 2 3 4 5 6 7 8 9 10
La variable aleatoria X, que acaba de analizarse, es un ejemplo de variable aleatoria que tiene una
distribucin uniforme. La forma general para la funcin de densidad de una variable aleatoria con una
distribucin uniforme es como sigue:
Una variable aleatoria X, tiene una distribucin de probabilidad uniforme, si y solamente si la funcin de
densidad de X es:
%
T: TU
1 x 2
f(x)=
0, en cualquier otro punto
En el problema del autobs podemos tomar 1=0 y 2=10, porque solamente interesa un intervalo
particular de 10 minutos.
Para esta distribucin de probabilidad los parmetros de la distribucin son 1 y 2, por lo que la
probabilidad de que X caiga en un intervalo dado depende de 1 y 2.
La esperanza y la varianza de una variable aleatoria con distribucin uniforme continua y con
parmetros 1 y 2 son:
!
TU VT:
'
T: TU :
%
Ejemplo
Sea X una variable aleatoria distribuida uniformemente en el intervalo [-3,4]. Es decir X~U[-3,4].
a) La funcin de densidad de X ser:
f(x)=
@6
W; ,
" [3,4]
- 21 -
F(x)
1/7
x
-3
Ejercicio
El tiempo de un viaje (ida y vuelta) de los camiones que transportan concreto hacia una obra de
construccin en una carretera, est distribuido uniformemente en un intervalo de 50 a 70 minutos. Cul
es la probabilidad de que la duracin del viaje sea mayor a 65 minutos, si se sabe que la duracin del
viaje es mayor a 55 minutos?
E(X)=
- 22 -
Observemos las principales caractersticas de la grfica de la Curva ormal tambin llamada Campana
de Gauss:
La curva tiene forma de campana
Se extiende indefinidamente o sea es asinttica al eje X
Se especifica por su y su
Es simtrica con respecto a la media
El rea total bajo la curva es igual a 1 o 100%
El rea debajo de la curva entre la media y otro punto est en funcin del nmero de
desviaciones estndar que el punto dista de la media
Estas caractersticas sugieren que los fenmenos en los que se va a usar la normal como modelo debern
ser de tal naturaleza que los valores numricos de los datos que se presentan con mayor frecuencia se
concentren alrededor del valor esperado de X (media) y a medida que se alejan de l, su frecuencia
disminuye. Dada la forma de esta grafica se comprende por qu esta distribucin se deriv como modelo
para la distribucin de frecuencias de los errores de medicin, en donde E(X) o es el valor verdadero
de una constante que se desea determinar y x es una medicin cualquiera. Por ello el error en una
medicin es x E(X). As es fcil suponer que errores pequeos tienen una frecuencia alta, mientras que
los errores muy grandes tienen una frecuencia muy baja.
La distribucin Normal o Gaussiana tiene una funcin de densidad que se representa con la siguiente
ecuacin:
%
U ]^_ :
a
`
R : \
Z
[
- < x <
f(x)=
0, en cualquier otro punto
En donde:
__es la desviacin estndar y es un nmero real positivo (>0)
__es la media aritmtica y es un nmero real
e__base del logaritmo natural cuyo valor es 2.71828
__nmero irracional cuyo valor es 3.1416
Es importante sealar que este modelo de distribucin no es nico, sino que es una familia de
distribuciones que se determinan para cada par de valore e y . Esto significa que la Curva Normal se
puede determinar completamente si se conoce su media y su desviacin estndar, lo que a su vez
significa que hay una y solo una distribucin normal para cada combinacin posible de media y
desviacin estndar como muestran las figuras. La notacin que generalmente se utiliza para variables
con distribucin normales: X~N(, 2)
Figura 1. Misma media y diferente desviacin estndar
1
2
3
- 23 -
1
2
3
En la prctica las reas situadas debajo la curva normal, se encuentran en tablas, pero no es posible
calcular tantas tablas como combinaciones hallan de y , por lo que estas reas se calculan en relacin
con la curva normal estndar que tiene una =0 y =1, mediante una conversin de unidades; as las
unidades de medicin se convierten a unidades estndar o z, la cual mide la diferencia de cada valor de
la variable aleatoria X con respecto a la media , en funcin de la desviacin estndar , por medio de la
siguiente frmula:
"!
b
'
Las unidades z indican simplemente a cuantas desviaciones estndar est el valor de la variable aleatoria
X, arriba o debajo de la media .
Una caracterstica importante de la curva normal estndar es la forma como est distribuida su
probabilidad con relacin a su desviacin estndar.
Entre +1 y -1 desviaciones estndar se encuentra el 68.3% aprox. de la probabilidad.
Entre +2 y -2 desviaciones estndar se encuentra el 95.5% aprox. de la probabilidad.
Entre +3 y -3 desviaciones estndar se encuentra el 99.7% aprox. de la probabilidad.
Como se muestra en la siguiente figura.
- 24 -
-3
-2
-1
68.3%
95.5%
99.7%
En las tablas de la curva normal estndar los valores representan las reas bajo la curva, para los valores
negativos de z se emplean los valores positivos dada la simetra de la curva.
La curva normal estndar al ser simtrica con respecto a la media =0 y dado que el total del rea bajo la
curva es igual a uno o 100% de probabilidad, entonces el rea total a cada lado de =0 es igual 0.5 o
50% de probabilidad.
Para el manejo de las tablas, la primera columna de la izquierda nos da los valores de z con un decimal y
en las columnas de restantes se encuentran el segundo decimal de z.
El uso de las tablas no tiene mayor dificultad, por ejemplo si se quiere encontrar el valor para z=1.63 se
visualiza en la tabla en la primera columna 1.6 y como el segundo decimal de z es 3, se busca la
columna con el digito 3 y en la interseccin con la fila 1.6, se halla el valor del rea que es 0.4484. Esto
se interpreta como la P(0<z<1.63)=0.4484. Esta probabilidad corresponde al rea entre la media (z=0) y
un punto a z=1.63desviaciones estndar a la derecha de la media (ver figura)
1.63
De esta manera podremos calcular diferente probabilidades que corresponden a reas situadas bajo la
curva normal estndar, por ejemplo:
Encontrar la P(-0.5 z 1)
El rea pedida es igual a la suma de las reas A1 y A2 que se muestran en la siguiente figura
A1
-0.5
A2
- 25 -
En la tabla se encuentra que A2, rea entre 0 y 1 es 0.3413 y el rea A1, rea entre 0 y 0.5 es 0.1915, por
lo que el rea total ser 0.3413 +0.1915=0.5328
Ejemplo
Sea X una variable aleatoria normalmente distribuida con media igual a 10 y desviacin estndar igual a
2. Encuentre la probabilidad de que X se encuentre entre 11 y 13.6
Solucin:
Primero calculemos los valores de z que corresponden a X1=11 y X2=13.6
c d
%%%
c d
%6.e%
b% U
0.5
b
:
1.8
Z
Z
Por lo que la probabilidad buscada es el rea que se encuentra entre z1 y z2, el rea entre 0 y 1.8 es, de
acuerdo con las tablas, 0.4641 y el rea entre 0 y 0.5 es 0.1915. Por lo que la probabilidad buscada ser:
0.4641-0.1915=0.2726 (ver figura)
0.5
1.8
Ejemplo
Ciertos estudios demuestran que el consumo de gasolina de los autos medianos tiene una distribucin
normal con un consumo medio de 25.5 km por galn y una desviacin estndar de 4.5 km por galn.
Qu porcentaje de autos medianos obtienen 30 o ms km por galn?
Solucin:
La proporcin P de autos medianos que obtienen 30 o ms km por galn se indica en el rea sombreada
en la figura.
z
25.5
30
- 26 -
est muy asociada a la variable Poisson y basados en esa relacin se puede llegar a la expresin de su
funcin de densidad probabilstica
Considrese una serie de eventos sucedindose en el tiempo de acuerdo a una distribucin Poisson con
razn media de C eventos por unidad de tiempo, y en ese fenmeno aleatorio interesa ahora analizar lo
siguiente:
Cunto tiempo se debe esperar para observar la prxima ocurrencia del evento?
Ya se ha estudiado en la distribucin de Poisson ese mismo fenmeno aleatorio, pero a travs de la
variable aleatoria discreta X="# de veces que ocurre un suceso en un perodo de duracin t", la cual
sigue una distribucin tpica de Poisson, pero para dar respuesta a la pregunta anterior se requiere definir
otra variable, que puede ser denotada por T la cual represente "tiempo de espera entre dos ocurrencias
consecutivas del evento":
Si T>t, ello significa que la prxima ocurrencia del evento sucedi despus de t unidades de tiempo, lo
que implica que en el lapso de 0 a t, el evento no ocurri; de ah que podemos plantear que:
1 R f ,
si 0 <x
f(x)=
0, en otro caso
Donde:
La probabilidad exponencial de que el primer evento ocurra dentro del intervalo designado de tiempo o
espacio es.
P(T < t) = 1 - e - x
De manera que la probabilidad exponencial de que el primer evento no ocurra dentro del intervalo
designado de tiempo o espacio es:
P(T > t) = e - x
- 27 -
El valor esperado y la varianza de una variable aleatoria X con distribucin exponencial son
E[X] = 1/C
V(X) = 1/C2
La funcin de densidad
Si una variable aleatoria continua X distribuida a lo largo de
Como cualquier distribucin continua de probabilidad, el rea bajo la curva que corresponde a
cierto intervalo equivalente a la probabilidad de que la variable aleato
aleatoria
ria asuma un valor en ese
intervalo. En el ejemplo del muelle de mercurio, la probabilidad de que la carga de un camin
ca
dure 6
minutos o menos (x6)
6) se define como el rea bajo la curva de x=0 a x=6.
- 28 -
Para calcular probabilidades exponenciales como las que acabamos de describir empleamos la
ecuacin de la funcin de distribucin acumulada, que da como resultado la probabilidad acumulada de
obtener un valor de la variable aleatoria exponencial igual o menor que determinado valor especifico de
x, representado por x0
P(xx0) = 1e-Cx
Continuando con el ejemplo del muelle de carga de mercurio, si x es el tiempo de carga, entonces, x = 6
y C= 1/15; por lo que la probabilidad de que la carga de un camin dure seis minutos o menos o sea,
P(x6) ser:
P(x6) = 1e-(1/15)6 =0.3297
La probabilidad de carga un camin en 18 minutos o menos es:
P(x18)= 1 e-(1/15)18 = 0.6988;
As la probabilidad de que la carga del camin tarde de 6 a 18 minutos es igual a 0.6988-0.3297=0.3691.
De este modo se pueden calcular las probabilidades para cualquier otro intervalo.
Ejemplos donde puede utilizarse la distribucin exponencial
El tiempo que tarda una partcula radiactiva en desintegrarse (datacin de fsiles o cualquier
materia orgnica mediante la tcnica del carbono 14)
El tiempo que puede transcurrir en un servicio de urgencias, para la llegada de un paciente.
Los tiempos entre llegadas de clientes a una oficina de atencin de pblico, pueden representarse
por un modelo exponencial.
El tiempo necesario para que se produzca el fallo de un componente de una mquina.
El tiempo que transcurre hasta la muerte de un organismo biolgico. En este caso la funcin
recibe el nombre de funcin de supervivencia y que es la probabilidad de que el individuo no
fallezca antes del instante x.
- 29 -
Ejemplo
En un crucero de una carretera pasan en promedio 27 vehculos cada hora. Cul es la probabilidad de
que pase por ah un vehculo en el lapso de los prximos tres minutos.
- x
P(x)=1-e C
Aqu C = 27/60 y x= 3, por lo que:
P(un xito antes de tres minutos) = 1-2.71828- (27/60)(3)
P(3) = 1- 0.2592 = 0.7408 = 74.08%
Ejemplo
Un departamento de mantenimiento recibe un promedio de 5 llamadas por hora. Comenzando en un
momento aleatoriamente seleccionado, la probabilidad de que una llamada llegue dentro de media hora
es:
Si es el promedio 5 llamadas por hora, entonces C= 5/60; aqu, x = 30 min
Ejemplo
Se ha comprobado que el tiempo de vida de un marcapasos sigue una distribucin exponencial con
media de 16 aos. Cul es la probabilidad de que a alguien que se le ha implantado este dispositivo se
le deba reimplantar otro antes de 20 aos?
Si es el promedio 1 cada 16 aos, entonces C= 1/16 y x = 20 aos
2 = Z12 + Z 22 + .......... + Z2
Entonces decimos que (kl
) tiene una distribucin ji-cuadrada con grados de libertad.
La forma de la distribucin depende de los grados de libertad, o sea del nmero de variables normales
independientes que la generan. El parmetro de la distribucin son los grados de libertad (), as, si una
variable aleatoria W se distribuye con 2 con grados de libertad, se simboliza: W~kl
Y la grafica de la distribucin ji-cuadrada con diferentes grados de libertad
- 30 -
=4
=7
(2 )
En esta figura puede observarse que a medida que aumenta la media y la varianza de la distribucin
aumentan y la asimetra de la curva disminuye.
E ( 2 ) =
Var ( 2 ) = 2
Obsrvese tambin en la figura que a medida que aumenta, la asimetra de la distribucin disminuye,
puede probarse que la 2 se aproxima a la normal a medida que se tengan mayor nmero de grados de
libertad.
La funcin de densidad de la distribucin ji-cuadrada es bastante compleja, por lo que el clculo de las
probabilidades se har a travs de tablas.
Uso de las tablas de ji-cuadrada.La tabla tiene la siguiente forma, la primera columna nos da los grados de libertad () y la primera fila
los diferentes valores de la probabilidad () y en el resto del cuerpo de la tabla los valores que pue de
tomar la variable que los denotaremos por km
ntales que:
P 2 2 ( ) =
O sea km
n es el valor de la variable aleatoria ji-cuadrada con grados de libertad tal que el rea bajo la
curva a su derecha es . Ver figura
2 ( )
otas Probabilidad y Estadstica
- 31 -
Ntese que en la tabla solo se da la probabilidad a la derecha de algunos valores de km
n , por lo que la
tabla es limitada pero suficiente para los propsitos del curso.
Ejemplos
En la distribucin de ji-cuadrada con 15 grados de libertad se desea encontrar el valor de la variable tal
que la probabilidad de un valor mayor o igual sea 0.05, es decir, se desea obtener k
. S 15. En
smbolos se representa as:
k%S
5 k
. S 15 0.05
En la primera columna se busca =15 y en la primera fila el valor =0.05. En la interseccin de la fila y
la columna se lee el nmero 24.9958, por lo que:
k%S
5 24.9958 0.05
0.05
k
. S 15
k%S
24.9958
De acuerdo con la figura, observe que si se desea un <0.05, entonces el valor de la variable ser mayor,
ejemplo para el valor k
. % 15 30.5779.
Puede existir un tipo de problemas inverso, en donde dado el valor de la variable 2 se quiera encontrar
la probabilidad de un valor mayor, pero esto no siempre es posible de obtener a travs de las tablas por
lo limitadas que son.
Ejemplo
Con 10 grados de libertad (=10), se quiere encontrar la probabilidad de que la variable 2 sea mayor a
3.9403. entonces se busca en la primera columna =10 y sobre esa fila se localiza el valor 3.9403 y se
observa que sobre l est = 0.95 por lo que:
- 32 -
En este tema se podrn utilizar muestras pequeas siempre y cuando la distribucin de donde proviene la
muestra tenga un comportamiento normal. Esta es una condicin para utilizar la distribucin t de
Student.
Para este tema necesitamos hacer uso del concepto "grados de libertad".
Para definir grados de libertad se har referencia a la varianza muestral:
n
s2 =
(x
x)
i =1
n 1
Esta frmula est basada en n-1 grados de libertad. Esta terminologa resulta del hecho de que si bien s2
est basada en n cantidades "% "o , "
"o , .. " "o ; stas suman cero, as que especificar los valores
de cualquier n-1 de las cantidades determina el valor restante. Por ejemplo, si n=4 y
"% "o 8, "
"o 6 y "@ "o 4, entonces automticamente tenemos "6 "o 2, as que
slo tres de los cuatro valores de "$ "o , estn libremente determinados, por lo tanto, hablamos de 3
grados de libertad.
Entonces, para hallar los grados de libertad ser mediante n-1 y se simboliza con
Definicin.- Sea Z una variable aleatoria normal estndar y sea 2 una variable aleatoria ji-cuadrada con
q
grados de libertad. Entonces si Z y 2 son independientes, la variable p :
/r
T=
n(X )
(n 1)S
o d
Z
l
2 (n 1)
%v :
Z:
tiene una
X
= n
- 33 -
simtricas con respecto al origen y el valor mximo de la ordenada se alcanza en la media . Sin
embargo, la distribucin t tiene colas ms amplias que la normal; esto significa que la probabilidad de
las colas es mayor que en la distribucin normal. A medida que el nmero de grados de libertad tiende a
infinito, la forma lmite de la distribucin t es la distribucin normal estndar.
t
N(0,1)
- 34 -
De esta manera, una variable aleatoria tiene una distribucin t-Student con 10 grados de libertad y para
una probabilidad igual a 0.01, se encuentra el punto 2.764. Por lo tanto para 10 grados de libertad, la
probabilidad de que una variable aleatoria con distribucin t sea mayor que 2.764 es 0.01. Con lo cual, la
funcin de distribucin a la izquierda del punto 2.764 para una t-Student de 10 grados de libertad vale 1
0.01 =0.99.
=0.01
2.764
Ejemplo:
Calcula la probabilidad de que el valor del estadstico t con 10 grados de libertad este entre 0.260 y
1.812
De acuerdo con la tabla el rea a la derecha de 0. 260 es 0.4 y el rea a la derecha de 1.812 es 0.05 por lo
que:
Ejemplo:
El valor t con = 9 grados de libertad que deja un rea de 0.01 a la derecha, es:
t0.01 = 2.821
Ejercicio:
Hallar los valores crticos de t para los que el rea a la derecha sea de 0.05 si el nmero de grados de
libertad, es:
a) 16
b) 27
c) 200
Ejemplo:
Un ingeniero qumico afirma que el rendimiento medio de la poblacin de cierto proceso en lotes es 500
gramos por milmetro de materia prima. Para verificar esta afirmacin toma una muestra de 25 lotes
- 35 -
cada mes. Si el valor de t calculado cae entre: t0.05 y t0.05, queda satisfecho con su afirmacin. Qu
conclusin extraera de una muestra que tiene una media de 518 gramos por milmetro y una desviacin
estndar de 40 gramos? Suponga que la distribucin de rendimientos es aproximadamente normal.
Solucin:
De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.711. Por tanto, el fabricante queda
satisfecho con esta afirmacin si una muestra de 25 lotes rinde un valor t entre 1.711 y 1.711.
Se procede a calcular el valor de t:
t =
518 500
= 2 . 25
40
25
Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de obtener un valor de t
con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es aproximadamente de 0.01. De
aqu que es probable que el fabricante concluya que el proceso produce un mejor producto del que
piensa.
6.2.6. La Distribucin F
Esta funcin de densidad de probabilidades es muy til en varios problemas de inferencia como la
comparacin de varianzas de dos poblaciones normales, la comparacin de dos o ms tratamientos y se
define as:
Definicin.- Sean ky
y k
dos variables aleatorias independientes distribuidas como ji-cuadradas con m
y n grados de libertad respectivamente. Entonces la variable aleatoria F definida como:
(2m ) m
F= 2
( n) n
Tiene una distribucin F con m y n grados de libertad.
Los parmetros de la distribucin son m y n y se puede identificar a la distribucin diciendo que tiene m
grados de libertad en el numerador y n grados de libertad en el denominador; cuando una variable se
distribuye con una F se denota z~zy .
La forma de la distribucin es:
P(f)
- 36 -
La distribucin F est ligada con la t ya que: Si t es una variable aleatoria distribuida como una t de
Student con grados de libertad, entonces el cuadrado de t se distribuye como una F con 1 y grados de
(t )2 = F1
libertad en smbolos ser:
Ya que la expresin de la funcin de densidad de F tambin es complicada utilizaremos tablas para el
clculo de las probabilidades.
Las diferentes tablas de F proporcionan valores de F nm, para valores de de: =0.10, =0.05, =0.025,
=0.01
S
Ejemplo.- Se quiere encontrar z%>,
.% es decir el valor de F tal que la probabilidad de un valor mayor de
dicha F, es 0.10 con 5 grados de libertad en el numerador y 19 grados de libertad en el denominador. De
la tabla F para =0.10 se localiza la interseccin de la columna 5 con la fila 19 y se obtiene 2.176. Por lo
tanto P( F nm, >2.176)=0.10.
- 37 -