La distribucin hipergeomtrica es una distribucin discreta que modela el
nmero de eventos en una muestra de tamao fijo cuando usted conoce el nmero total de elementos en la poblacin de la cual proviene la muestra. Cada elemento de la muestra tiene dos resultados posibles (o es un evento o un no evento). Las muestras no tienen reemplazo, por lo que cada elemento de la muestra es diferente. Cuando se elige un elemento de la poblacin, no se puede volver a elegir. Por lo tanto, la probabilidad de que un elemento en particular sea seleccionado aumenta con cada ensayo, suponiendo que an no ha sido seleccionado.
Utilice la distribucin hipergeomtrica para muestras obtenidas de poblaciones
relativamente pequeas, sin reemplazo. Por ejemplo, esta distribucin se utiliza en la prueba exacta de Fisher para probar la diferencia entre dos proporciones y en muestreos de aceptacin por atributos cuando se toman muestras de un lote aislado de tamao finito.
La distribucin hipergeomtrica es descrita por 3 parmetros: tamao de la
poblacin, conteo de eventos en la poblacin y tamao de la muestra
Por ejemplo, usted recibe un envo de pedido especial de 500 etiquetas.
Supongamos que el 2% de las etiquetas tiene defectos. El conteo de eventos en la poblacin es de 10 (.02 * 500). Usted toma una muestra de 40 etiquetas y desea determinar la probabilidad de que haya 3 o ms etiquetas defectuosas en esa muestra.
La probabilidad de que haya 3 o ms etiquetas defectuosas en la muestra es
de 0.0384. Ejemplo del clculo de probabilidades hipergeomtricas. Supongamos que hay diez automviles que le gustara someter a una prueba de conduccin (N = 10), y cinco de ellos tienen motores turbo (x = 5). Si prueba tres de los vehculos (n = 3), cul es la probabilidad de que dos de los tres que probar tengan motores turbo? 1. Elija Calc > Distribuciones de probabilidad > Hipergeomtrica. 2. Elija Probabilidad. 3. En Tamao de la poblacin (N), ingrese 10. En Conteo de eventos en la poblacin (M), ingrese 5. En Tamao de la muestra (n), ingrese 3. 4. Elija Constante de entrada e ingrese 2. 5. Haga clic en Aceptar. La probabilidad de que seleccione dos automviles con motores turbo cuando pruebe tres de los diez vehculos que le interesan es 41.67%.
La diferencia entre las distribuciones hipergeomtrica y binomial
Tanto la distribucin hipergeomtrica como la distribucin binomial describen el nmero de veces que un evento ocurre en un nmero fijo de ensayos. En una distribucin binomial, los ensayos son independientes. Para la distribucin hipergeomtrica, cada ensayo cambia la probabilidad de cada ensayo subsiguiente, porque no hay reemplazo.
Un tpico caso de aplicacin de este modelo es el siguiente :
Supongamos la extraccin aleatoria de n elementos de un
conjunto formado por N elementos totales, de los cuales Np son del tipo A y Nq son del tipo (p+q=l) .Si realizamos las extracciones sin devolver los elementos extrados , y llamamos X. al nmero de elementos del tipo A que extraemos en n extracciones X seguir una distribucin hipergeomtrica de parmetros N , n , p
Funcin de cuanta.
La funcin de cuanta de una distribucin Hipergeomtrica har corresponder
a cada valor de la variable X (x = 0,1,2, . . . n) la probabilidad del suceso "obtener x resultados del tipo A ", y (n-x) resultados del tipo no A en las n pruebas realizadas de entre las N posibles.
Veamos :
Hay un total de formas distintas de
obtener x resultados del tipo A y n-x del tipo , si partimos de una poblacin formada por Np elementos del tipo A y Nq elementos del tipo
Por otro lado si realizamos n pruebas o extracciones hay un total de
posibles muestras ( grupos de n elementos)
aplicando la regla de Laplace tendramos
que para valores de X comprendidos entre el conjunto de enteros 0,1,. .n
ser la expresin de la funcin de cuanta de una distribucin , Hipergeomtrica de parmetros N,n,p .
Media y varianza.
Considerando que una variable hipergeomtrica de parmetros N, n, p
puede considerarse generada por la reiteracin de un proceso dicotmico n veces en el que las n dicotomas NO son independientes ; podemos considerar que una variable hipergeomtrica es la suma de n variables dicotmicas NO independientes.
Es bien sabido que la media de la suma de variables aleatorias (sean stas
independientes o no) es la suma de las medias y por tanto la media de una distribucin hipergeomtrica ser , como en el caso de la binomial :
En cambio si las variables sumando no son independientes la varianza de la
variable suma no ser la suma de las varianzas.
Si se evala el valor de la varianza para nuestro caso se obtiene que la
varianza de una distribucin hipergeomtrica de parmetros N,n,p es : si para demostracin de esta expresin vase Wilks S. ,Mathematical Statistics,1962
Esta forma resulta ser la expresin de la varianza de una binomial (n, p)
afectada por un coeficiente corrector [N-n/N-1] , llamado coeficiente de exhaustividad o Factor Corrector de Poblaciones Finitas (F.C.P.F.) y que da cuenta del efecto que produce la no reposicin de los elementos extrados en el muestreo.
Este coeficiente es tanto ms pequeo cuanto mayor es el tamao muestral
(nmero de pruebas de n ) y puede comprobarse como tiende a aproximarse a 1 cuando el tamao de la poblacin N es muy grande . Este ltimo hecho nos confirma lo ya comentado sobre la irrelevancia de la reposicin o no cuando se realizan extracciones sucesivas sobre una poblacin muy grande. Con una poblacin muy grande se cual fuere el tamao de n , el factor corrector sera uno lo que convertira , en cierto modo a la hipergeomtrica en una binomial (ver D. Binomial) . As
Lmite de la distribucin hipergeomtrica cuando N tiende a infinito.
Hemos visto como la media de la distribucin hipergeomtrica [H{N,n,p)],
tomaba siempre el mismo valor que la media de una distribucin binomial [B{n,p)] tambin hemos comentado que si el valor del parmetro N creca hasta aproximarse a infinito el coeficiente de exhaustividad tenda a ser 1, y, por lo tanto, la varianza de la hipergeomtrica se aproximaba a la de la binomial : puede probarse asimismo , cmo la funcin de cuanta de una distribucin hipergeomtrica tiende a aproximarse a la funcin de cuanta de una distribucin binomial cuando Puede comprobarse en la representacin grfica de una hipergeomtrica con N =100000 como sta ,es idntica a la de una binomial con los mismos parmetros restantes n y p , que utilizamos al hablar de la binomial
Moda de la distribucin hipergeomtrica
De manera anloga a como se obtena la moda en la distribucin binomial es
fcil obtener la expresin de sta para la distribucin hipergeomtrica. De manera que su expresin X0 sera la del valor o valores enteros que verificasen.