Sunteți pe pagina 1din 48

UNIVERSIDAD CATÓLICA DE CUYO .

Facultad de Ciencias Químicas y Tecnología .


Cátedra de Bioestadística .
Curso: Cuarto Año – Carreras: Licenciatura en Bioquímica y Farmacia .
..

Variable Aleatoria y Modelos


Probabilísticos

Lic.: Mariana L. Gomez 1


EXPERIMENTOS ALEATORIOS

Considerar las siguientes situaciones:

1. Se observa el cambio mensual del número de clientes de una


laboratorio.

2. Se toman los tiempos entre llegadas de clientes a la fila de una


caja de banco.

3. Un investigador cuenta el número de partículas atómicas


captadas por un instrumento.

4. Se mide la cantidad de jeringas falladas por caja de 30 u.

5. Un meteorólogo registra las temperaturas máximas diarias.


Lic. Mariana Gomez 2
Un experimento aleatorio es aquél que puede tener al
menos dos resultados posibles, con incertidumbre en
cuanto a cuál de ellos tendrá lugar cuando se realice el
experimento.

Lic. Mariana Gomez 3


Una variable aleatoria es lo que deseo estudiar sobre mi
experimento aleatorio, y toma valores numéricos.

Es discreta si sólo puede tomar una cantidad finita o


infinita de números enteros.

Es continua si asume valores en un intervalo de números


reales (números con decimales).

Lic. Mariana Gomez 4


En los casos planteados las variables aleatorias son:

1. X: “Número mensual de clientes de una laboratorio”. Variable


discreta.

2. X: “Tiempos entre llegadas de clientes a la fila de una caja de


banco”. Variable continua

3. X: “Número de partículas atómicas captadas por un


instrumento”. Variable discreta

4. X: “Cantidad de jeringas falladas por caja de 30 u”. Variable


discreta

5. X: “Temperaturas máximas diarias”. Variable continua

Lic. Mariana Gomez 5


Dado que la variable aleatoria puede asumir distintos
valores y es el azar el que determina cuál de ellos se
obtiene al realizar el experimento, a cada valor de la
variable aleatoria se le debe asignar una probabilidad, la
cual nos indicará cuán probable es obtener un cierto valor
de la variable.

Este conjunto de medidas de probabilidad para cada uno


de los posibles valores de la variable es lo que se denomina
función o distribución de probabilidades y su manejo
difiere si se trata de una variable discreta o continua.

Lic. Mariana Gomez 6


Variable discreta:
Ejemplo= X: “Cantidad de caras en el lanzamiento de una
moneda”. P(X=0)=P(“Seca”)=0.5, P(X=1)=P(“Cara”)=0.5
El recorrido de la variable (posibles valores) y su
correspondiente distribución de probabilidades es:

X 0 1
f(X)=P(X=x) 0.5 0.5

Dicha distribución se puede representar mediante un


gráfico de barras, como se muestra en la figura siguiente.
Probabilidad

Lic. Mariana Gomez 7


X
Variables Continuas
Dado que una variable continua puede asumir cualquier valor
real en un cierto intervalo de valores podríamos construir un
histograma con los datos agrupados en intervalos. Si se
aumenta progresivamente la cantidad de intervalos a construir
se llegaría eventualmente a una curva continua

Por lo tanto la distribución de probabilidades de una variable


continua es una curva continua. Lic. Mariana Gomez 8
Además, como el número de valores que puede
tomar una variable continua es infinito, la
probabilidad puntual de que suceda uno de
ellos es nula.
Por lo tanto, solo es posible determinar la
probabilidad de que la variable asuma cierto
intervalo de valores con este tipo de variables.
Y dado que la función de probabilidades es una
curva continua, la probabilidad queda
representada por el área bajo la curva para el
intervalo de valores de interés, área que se
podrá obtener por medio de una integral
definida.

Lic. Mariana Gomez 9


Esperanza y varianza

El Valor esperado de una variable aleatoria,


discreta o continua, es el promedio de todos sus
valores, ponderados por sus respectivas
probabilidades.

La varianza de una variable aleatoria es una


medida de la dispersión o variabilidad de los
valores de la variable.
Lic. Mariana Gomez 10
Tanto en el caso discreto como continuo,
existen modelos probabilísticos conocidos,
que pueden aplicarse a determinados
fenómenos, para representar sus
probabilidades.

Las funciones de probabilidad asociadas a


estos modelos pueden escribirse como una
ecuación matemática.
Lic. Mariana Gomez 11
Es así como existen los modelos:

-Para variables discretas:

•Binomial,

•Geométrico,

•Hipergeométrico,

•Poisson.

-Para variables continuas:

•Exponencial,

•Normal,

•Entre otros. Lic. Mariana Gomez 12


DISTRIBUCIÓN BINOMIAL

Supongamos que un experimento aleatorio tiene sólo


dos resultados posibles mutuamente excluyentes
(resultados dicotómicos), "éxito" y "fracaso", y que p es
la probabilidad de obtener un éxito en cada repetición y
tiene un valor conocido, el cual se considera constante
de ensayo en ensayo (independencia).

Si se realizan n repeticiones independientes del


experimento y se registra el número de éxitos
obtenidos, X, la distribución de probabilidades de dicha
variable aleatoria sigue el modelo de una distribución
Binomial. Lic. Mariana Gomez 13
La función de probabilidad (ecuación de cálculo de
probabilidades puntuales (P(X=x)) para una variable
con distribución de probabilidades Binomial es
n x
f ( x)    p (1  p )( n  x )
 x

f ( x)  probabilidad de x exitos en n intentos


n n!
 x 
  x !(n - x)!
p  probabilidad de un exito en cualquier intento
(1- p)=probabilidad de un fracaso en cualquier intento
Lic. Mariana Gomez 14
Valor esperado o esperanza de una variable aleatoria con
distribución de probabilidades Binomial :

E ( x)    np

Varianza una variable aleatoria con distribución de


probabilidades Binomial:

Var ( x)   2  np(1  p)

Lic. Mariana Gomez 15


EJEMPLO:

Supongamos que un agente de seguros tiene cinco


clientes, y piensa que para cada uno la probabilidad de
conseguir una venta es 0.4. La distribución del número
de ventas, X, tiene entonces una distribución de
probabilidades Binomial, con n = 5 y p = 0.4, es decir,

5!
P( X  x exitos )  (0.4) x (0.6)5 x
x!(5  x)!

para x = 0, 1,..., 5

Lic. Mariana Gomez 16


•Si se desea conocer la probabilidad de que se logren hacer
dos ventas, el cálculo a realizar es el siguiente:

P(X=2) = 5! (0,4)2(0,6)3 = 0.346 = F(2)-F(1)


2! 3!

•Si se desea obtener la probabilidad de que se realicen menos


de tres ventas:

P(X<3)= P(X≤2)=P(X=0)+P(X=1)+P(X=2)=F(2) (que se puede


obtener de una tabla)
Lic. Mariana Gomez 17
•Valor esperado de ventas (o cantidad de
ventas promedio) es:

E(X)= np = 5*0.4 = 2

•Varianza de las ventas:

V(X) = npq = 5*0.4*0.6 = 1.2

Lic. Mariana Gomez 18


DISTRIBUCIÓN GEOMÉTRICA

En el caso de una distribución geométrica las


características del experimento que llevan a emplear
dicha distribución son:

-La variable de interés es X: “Cantidad de intentos


realizados hasta obtener el primer éxito” (donde éxito
representa lo que deseamos obtener, sea algo bueno o
malo)

-La probabilidad de éxito es conocida y constante para


todos los intentos. Lic. Mariana Gomez 19
Bajo estas condiciones la fórmula de cálculo de una
variable con distribución Geométrica (función de
cuantía) es:
f(X) = P(X=x) = qx-1 * p

Siendo p la probabilidad de éxito y q = (1-p) = la


probabilidad de fracaso.

El recorrido de una variable aleatoria con distribución


de probabilidades Geométrica es x: 1, 2, ……

Lic. Mariana Gomez 20


La esperanza y la varianza para esta distribución son:

E(X) = 1/p V(X) = q/ p2

Ejemplos de variables aleatorias con distribución


Geométrica son:

-Número de tiradas de moneda hasta obtener la


primera cara.

-Número de veces que rinde un alumno hasta aprobar la


materia.

-Intentos de encendido de un motor


Lic. Mariana Gomez 21
Ejemplo1= En un laboratorio de análisis clínicos
especializado en HIV la probabilidad de que un paciente de
positivo es del 20%. Calcular la probabilidad de que entren 8
pacientes antes de encontrar al primer positivo.

Ejemplo 2= En una farmacia la probabilidad de que un


cliente compre un remedio es del 60%. Calcular la
probabilidad de tener que hacer 5 intentos hasta vender el
primer remedio.

Lic. Mariana Gomez 22


DISTRIBUCIÓN POISSON

Supongamos que se puede asumirse lo siguiente:


Para cada intervalo de tiempo, área, volumen o longitud,
muy pequeño, la probabilidad de que ocurra un suceso en
ese intervalo es aproximadamente proporcional a la
amplitud del intervalo y no puede ocurrir dos o más sucesos
en un intervalo determinado. Además se conoce el número
medio de ocurrencia del evento en un intervalo
determinado.
Lic. Mariana Gomez 23
Si lo anterior es cierto, puede probarse que la
probabilidad de X ocurrencias en el intervalo de
tiempo, área, volumen o longitud, de 0 a T es:

e   x
P( X  x éxitos ) 
x!

donde λ es el número medio de ocurrencias entre 0 y T.

Este modelo probabilístico se denomina Distribución


de Poisson.
Lic. Mariana Gomez 24
EJEMPLO 1:

Un estudio indica que el número de huelgas anuales


en una fábrica con 2.000 empleados, se puede
representar por una distribución de Poisson con un
promedio de λ = 0.4 huelgas anuales.

La función de probabilidad del número de huelgas


anuales, X, es:

e 0.4 (0.4) x
P( X  x huelgas ) 
x!

para x = 0, 1, 2,…..
Lic. Mariana Gomez 25
Podemos calcular ahora probabilidades para números
concretos de huelgas anuales.

La probabilidad de que no haya huelgas en un año es:

P(X=0) = e-0.4(0.4)0 = (0.6703)(1) = 0.670

0! 1

La probabilidad de que haya más de una huelga es:

P(X> 1) = 1 – P(X≤1) = 1- F(1) = 0.0616

Lic. Mariana Gomez 26


EJEMPLO 2.
La distribución de Poisson ha resultado ser muy útil en
problemas de líneas de espera o colas.
Los clientes llegan a una maquina fotocopiadora a una tasa
media de dos cada cinco minutos En la práctica, se pueden
representar los procesos de llegada de esta clase mediante
una distribución de Poisson.

Lic. Mariana Gomez 27


Asumiendo que éste es el caso, representaremos por X el
número de llegadas de clientes en un periodo de cinco
minutos con lo cual X tiene una distribución de Poisson
con media λ = 2.

La función de probabilidad es

P(X=x) = e-22x
x!
para x = 0, 1, 2,...

Lic. Mariana Gomez 28


Las probabilidades para el número de llegadas en un período
de cinco minutos son

P(X=0 llegadas) = e-2(2)0 = (0.135335)(1) = 0.1353


0! 1

P(X=1 llegadas) = e-2(2)1 = (0.135335)(2) = 0.2707


1! 1

Lic. Mariana Gomez 29


P(X=2 llegadas) = e-2(2)2 = (0.135335)(4) = 0.2707
2! 2
y así sucesivamente. Así, por ejemplo, la probabilidad de que
se produzcan al menos dos llegadas en un periodo de cinco
minutos es:

P(X≥2) = 1 – P(X<2) = 1 – P(X=0) - P(X=1) = 1 – 0.1353 –


0.2707= 1- F(1)

Lic. Mariana Gomez 30


El valor esperado para una variable aleatoria con
distribución de probabilidades de tipo Poisson es:

E(X) = λ

Y su varianza es:
V(X) = λ

Lic. Mariana Gomez 31


DISTRIBUCIÓN HIPERGEOMÉTRICA

Se usa para calcular la probabilidad de que en una muestra


aleatoria de n artículos seleccionados sin reemplazo,
obtengamos x elementos identificados como éxitos, y n-x
fracasos. Donde dichos n elementos son extraídos de una
población de tamaño N, conocido, y en la cual se sabe
cuantos éxitos hay (r) y por ende cuantos fracasos (N-r).
Para calcular la probabilidad de obtener una cierta
cantidad x de éxitos se emplea la siguiente ecuación:

Lic. Mariana Gomez 32


 r  N  r 
 x  n  x 
f ( x)    
N
n
 

Donde nuestra variable X puede asumir cualquier valor


entero desde 0 al mínimo valor entre n y r.
La esperanza y varianza para una variable con distribución
Hipergeométrica son:
E(X) = n*p V(X) = n*p*q*(N-n/N-1)
Siendo p = r / N y q = 1-p
Lic. Mariana Gomez 33
EJEMPLO:
Se deben seleccionar 2 miembros de un comité, entre 5
personas (de las cuales 3 son mujeres y 2 son hombres),
para que asistan a una convención en Buenos Aires. Se
desea determinar la cantidad de mujeres elegidas para
formar el comité. Por lo tanto la variable X:”Número de
mujeres elegidas” tiene un modelo de probabilidades
hipergeométrica. Si se quiere conocer la probabilidad de
seleccionar a dos mujeres se debe realizar el siguiente
cálculo, sabiendo que N=5, n=2 y r=3.

 3  2 
 2  0 
f (2)     
3
 0.3
5 10
 2
 
Lic. Mariana Gomez 34
MODELO DE PROBABILIDAD EXPONENCIAL

Si la variable aleatoria X no puede tomar valores


negativos y tiene función de densidad

 x
f X ( x)  e para x  0

y cero si x<0, donde λ tiene un valor conocido y


positivo, entonces se dice que X sigue una
distribución exponencial. Lic. Mariana Gomez 35
La función de densidad se representa en el gráfico
siguiente:

La esperanza y varianza para una variable


aleatoria con distribución exponencial es:

E(X)=1/λ

V(X))=1/λ2 Lic. Mariana Gomez 36


EJEMPLO.

El tiempo de atención al cliente en un servicio de


información de una biblioteca sigue una distribución
exponencial, con un tiempo de servicio medio de cinco
minutos.

¿Cuál es la probabilidad de que una consulta de un cliente


dure más de diez minutos?

Lic. Mariana Gomez 37


Sea X el tiempo de atención, en minutos. La función
de densidad es

f X ( x) 
 5
exp  x
para x  0
5
Dado que la distribución de probabilidades es una curva
continua la probabilidad es el área bajo dicha curva para
el intervalo de valores de interés y para calcularla se
deberá usar integrales definidas.
La probabilidad que se pide es:
10  5
exp  x
P(X > 10) = 1 - P(X < 10) = 1-  5 = 0,135335
0
Lic. Mariana Gomez 38
La distribución exponencial está relacionada con la
distribución de Poisson.

Concretamente, si el número de ocurrencias de un suceso


en un intervalo sigue una distribución de Poisson con
media λ, puede probarse que el tiempo que pasa entre dos
ocurrencias consecutivas del suceso sigue una distribución
exponencial de media 1/λ.

Lic. Mariana Gomez 39


DISTRIBUCIÓN NORMAL

Muchas variables que se encuentran en la naturaleza


siguen un modelo de probabilidades normal. Su
característica es tal que los valores de la variable tienden
a agruparse respecto a un valor central, por lo que lo
más probable es que la variable asuma valores próximos
a su valor medio o centro y es poco probable que asuma
valores extremos (más pequeños o mucho mayores a la
media).

Lic. Mariana Gomez 40


Su función de probabilidad está definida
matemáticamente por la ecuación

1  1 ( x   )2 
f ( x)  exp  
2   2 
2

Los parámetros son µ y σ, donde µ es el valor medio o


esperado y σ es la desviación estándar poblacional.

Lic. Mariana Gomez 41


Un caso especial es el modelo probabilístico normal
estándar, que tiene valor esperado cero y desviación
estándar 1. La ecuación de la función de probabilidad
es
1  1 2
f ( x)  exp  x 
2  2 

Lic. Mariana Gomez 42


Es un modelo de probabilidad continuo, como se muestra en
la figura siguiente:

Lic. Mariana Gomez 43


Se sabe que si X es una variable que sigue un modelo normal,
con parámetros m y s, la variable transformada:

X 
z

sigue un modelo normal estándar. Es muy conveniente, por


cuanto permite usar una tabla normal estándar para obtener
probabilidades de cualquier otra normal.

Lic. Mariana Gomez 44


EJEMPLO.

Se sabe que el coeficiente intelectual de las personas sigue un


modelo de probabilidades Normal con media 100 y desvío 10.

Se desea calcular la probabilidad de que al seleccionar a una


persona esta tenga un CI de entre 80 y 110:

P(80<X<110) = P((80-100)/10 < Z < (110-100)/10) =P(-2<Z<1) =


F(1) – F(-2) = o.8413 – 0.0228 = 0.8185

Donde F(x) representa la probabilidad acumulada, en este


caso el área bajo la curva de probabilidades a la izquierda del
número y se encuentra tabulado.
Lic. Mariana Gomez 45
APROXIMACIONES

Bajo ciertas condiciones, partiendo de una distribución de


probabilidades determinada, se puede trabajar con otra
distribución. Este tipo de pasaje se llama aproximación, ya
que la distribución original en ciertas condiciones se
comporta o aproxima a otra distribución conocida. Las
aproximaciones a utilizar son:

1) De Binomial a Normal: Si nuestra variable tiene una


distribución Binomial, con un n → y p→0.5 entonces se
puede emplear para el cálculo de probabilidades una
distribución Normal con media = n*p y varianza = n*p*q
Lic. Mariana Gomez 46
2) De Poisson a Normal: Si nuestra variable tiene una
distribución Poisson, con λ → entonces se puede
emplear para el cálculo de probabilidades una distribución
Normal con media = λ y varianza = λ

Lo curioso es que una variable de tipo discreta se puede


aproximar con una de tipo continua. Por ello, se debe
efectuar una corrección por continuidad que consiste
en sumarle o restarle 0,5 a los valores enteros en los
intervalos buscados.
Lic. Mariana Gomez 47
3) De Binomial a Poisson: Si nuestra variable tiene una
distribución Binomial, con n → y p→0 entonces se
puede emplear para el cálculo de probabilidades una
distribución Poisson con λ = n*p.

4) De Hipergeométrica a Binomial: Si nuestra variable tiene


una distribución Hipergeométrica, con N >> n entonces se
puede emplear para el cálculo de probabilidades una
distribución Binomial con p = r/N.

Lic. Mariana Gomez 48

S-ar putea să vă placă și