Sunteți pe pagina 1din 6

La distribución Binomial

Cualquier variable aleatoria X que represente el número de éxitos en n pruebas idé


nticas e independientes, con probabilidad de éxito p constante de una prueba a
otra, se llama variable aleatoria binomial.
Puesto que la variable aleatoria binomial es de gran aplicación, existen tablas y
programas con los que se puede calcular su función de probabilidad. Por esta razón,
la primera misión del investigador es darse cuenta que está tratando con una
variable binomial, a fin de que se formule preguntas en términos de probabilidades
de eventos de su intrés, y pueda utilizar la distribución de probabilidad
correctamente. Existen tablas acumuladas de la distribución binomial (ver anexo).
También se pueden obtener la distribución de probabilidad utilizando
procedimientos computacionales. (Ver Guía de EXCEL).

Aplicaciones de la distribución Binomial

Algunas situaciones en las cuales se utiliza la distribución Binomial se plantean a


continuación:
- Se desarrolla una nueva variedad de maíz en una estación agrícola experimental.
Se plantan 20 semillas en un suelo de idéntica composición y se le dedican los
mismos cuidados. se espera que germine el 90% de las semillas. Cuántas semillas
se espera que germinen?
- Diez individuos propensos a desarrollar tuberculosis, entran en contacto con un
portador de la enfermedad. Si la probabilidad de que la enfermedad se contagie del
portador a un sujeto cualquiera es de 0.10. Cuántos contraerán la enfermedad?.

La distribución Poisson

Las variables aleatorias de Poisson surgen al observar un conjunto discreto de


sucesos en un intervalo continuo de tiempo, longitud o espacio.

Aplicaciones de la distribución de Poisson

En el campo microbiológico, las variables con distribución Poisson están


relacionadas en su mayoría a procesos de conteo como el recuento de
microorganismos viables por conteo en plato o determinación del número más
probable (NMP), así como a procesos relacionados con la determinación de la
probabilidad de mutación celular.
Cuando se busca realizar del recuento de microorganismos viables por conteo en
plato o determinar el número más probable (NMP), el suceso a observar será el nú
mero de colonias bacterianas (UFC) desarrolladas sobre el plato de agar o el nú
mero de tubos con crecimiento bacteriano (positivos) y el intervalo corresponderá a
la unidad de muestra analizada, llámese gramo de suelo, o mililitro de un líquido
analizado (agua, sangre, etc). -
En el caso de la determinación de la probabilidad de mutación bacteriana, el suceso
será la observación del número de bacterias mutantes (cada célula bacteriana
mutante generará una colonia en un medio de cultivo selectivo de dicha mutación)
y el intervalo corresponderá a la concentración bacteriana bajo observación, por
ejemplo 2×10 9 células bacterianas.

La Distribución Normal

La distribución normal es de gran importancia en el análisis y cálculo de todos los


aspectos relacionados con datos experimentales y la mayoría de los métodos estadí
sticos básicos se apoyan en la distribución normal.
Podemos entonces, resumir en tres razones la importancia de la distribución normal
en la estadística::

( i ) Numerosos fenómenos continuos parecen seguirla o se pueden aproximar


mediante ella.
( ii ) Se puede utilizar para aproximar varias distribuciones discretas de
probabilidad (La binomial, hipergeométrica, Poisson) y de esta forma simplificar c
álculos tediosos.
( iii ) Proporciona la base para la inferencia estadística clásica por su relación con
el teorema central del límite.
La distribución normal tiene varias propiedades teóricas importantes, entre éstas se
encuentran:

1. Tiene “forma de campana” y es de apariencia simétrica (Figura 2).


2. Sus medidas de tendencia central (Media, mediana, moda) son idénticas y se
encuentran ubicadas en el centro de la curva
3. La variable aleatoria asociada con esta distribución tiene rango infinito
( − ∞ < x < + ∞ ).
4. El rango intercuartílico es igual a 4/3 de la desviación estándar.
Figura 2.. Distribución Normal

De acuerdo al tipo de parámetros que se tengan (media y varianza) existen muchas


variables normales, una ilustración de esto se puede observar en la figura 3. En
donde se puede las variables 1 y 2 tiene la misma varianza pero diferentes medias
poblacionales. Gráficamente parece que la variable 2 se obtuvo sumando 20
unidades (Kgs) a cada valor de la variable 1. La vriable 2 y 3 tienen la misma
media poblacional pero diferentes varianzas , observe que el polígono de la
variable 2 es más cerrado que el de la variable 3, lo cual muestra gráficamente que
los datos de la variable 2 son menos dispersos que los de la variable 3.

Cómo calcular probabilidades de eventos?


Para hallar las probabilidades de eventos asociados a la variable aleatoria, tales
como

1. p( a ≤ X ≤ b )
2. p( X ≤ b )
3. p( X ≥ a )
Se procede de la siguiente manera formal:

En el caso 1, se tendría que calcular

p( a ≤ X ≤ b ) = ∫ f ( x )dx
a

En el caso 2,

p( X ≤ b ) = ∫ f ( x )dx
−∞

En el caso 3,
+∞

p( X ≥ a ) = ∫ f ( x )dx
a

Para evitar los cálculos anteriores, los cuales resultan en ocasiones tediosos; se
hace una transformación de la variable aleatoria X en una nueva variable aleatoria:
x−µ
Z, dada por Z = σ x . La variable aleatoria: Z posee media µ z = 0 y varianza
x
σ 2z = 1. Esta nueva variable aleatoria se dice que tiene una distribución Normal Est
.
ándar. De esta manera:

Caso 1.

a − µx b − µx b − µx a − µx
p( a ≤ X ≤ b ) = p ( σx ≤ X ≤ σx ) (= Fz σx ) ( − Fz σx )
Caso 2.

b − µx b − µx
(
p( X ≤ b ) = p X ≤ σx ) (
= Fz σx )
Caso 3.

p( X ≥ a ) = 1 − p( X ≤ a ) = 1 − F z ( a −σ µ )
x
x

Donde F z es la función de distribución acumulada de la variable aleatoria z, sus


valores aparecen en tablas o en programas de computador.
Muchos caracteres biológicos (pero no todos) siguen una distribución normal o
Gaussiana, cuando el número de muestras es grande (mayor de 30). Así, si X
representa el número de células/gr y f ( x ) es la frecuencia de ocurrencia de un nú
mero de células, la gráfica de f ( x ) versus X de la población de células/gr tendrá
forma de campana con media µ y desviación estándar σ. La variación en los
valores es continua y se distribuye de igual forma alrededor de la media, con mayor
proporción de valores cerca de la media y pocos en los extremos.
La distribución normal permite determinar, por ejemplo, la proporción de la poblaci
ón total con valores por debajo o por encima de un determinado valor. El siguiente
ejemplo ilustra lo anterior.

Ejemplo.

Se necesita conocer la proporción de muestras de agua (de 1 ml) que contienen más
de 100 coliformes. Se sabe que la media, µ de la variable aleatoria X, el número de
coliformes por mililitro es 83 células/ml y que la desviación estándar, σ es 10.

a) Cúal es la proporción de muestras (de 1 ml) que tienen entre 73 y 93 células?


b) Cúal es el porcentaje de muestras (de 1 ml) con a lo más 63 células?.
c) Cúal es la probabilidad de encontrar una muestra (de 1 ml) con más de 100 cé
lulas?

Solución.
a) La proporción buscada es equivalente al área particionada de la curva de
distribución normal entre 73 y 93 células/ml.
Esta área es equivalente al área particionada sobre la distribución normal está
ndarizada entre z = − 1 y z = 1.
Estos valores se obtienen transformado x 1 = 73 y x 2 = 93 en valores de la
distribución normal estándar (número de desviaciones estándar a que están
alejados estos datos de la media 83 células/ml).

z1 = 73 − 83 = − 1
10
z2 = 93 − 83 = 1
10

y así

p( 73 ≤ X ≤ 93 ) = p ( 7310− 83 ≤ X 10− 83 ≤ 9310− 83 )


= p( − 1 ≤ Z ≤ 1 )
= F z( 1 ) − F z( − 1 )
= 0.8413 − .01587
= 0.6826

Luego la proporción de muestras que tienen entre 73 y 93 células/ml células es


0.6826; o en otras palabras, el 68.26% de las muestras tienen entre 73 y 93 células/
ml.

b)
p( X ≤ 63 ) = p( X 10− 83 ≤ 6310− 83 )
= p( Z ≤ 63 − 83 )
10
= p( Z ≤ − 2 )
= F z( − 2 )
= 0.0228
c)

p( X ≥ 100 ) = p ( X 10− 83 ≥ 10010− 83 )


= p( Z ≥ 1.7 )
= 1 − F z( 1.7 )
= 1 − 0.9554 = 0.0446

S-ar putea să vă placă și