Sunteți pe pagina 1din 15

Unidad 2 2.

1 Variables aleatorias uniformemente distribuidas


Para poder simular eventos aleatorios discretos se debe generar una gran cantidad de nmeros aleatorios con el computador, de la manera ms eficiente y rpida posible. Algunos mtodos para realizar esto se vern a continuacin. En realidad los nmeros no sern totalmente aleatorios puesto que son generados en secuencias reproducibles por medio de tcnicas deterministicas y por eso se les llama nmeros seudo aleatorios, pero en la prctica satisfacen las pruebas de aleatoriedad. Se va a considerar nmeros seudo aleatorios con una distribucin uniforme en el intervalo (0,1). Luego estos nmeros con distribucin uniforme servirn para generar otros nmeros aleatorios que cumplen otro diferente tipo de distribucin (no uniforme), requeridos para problemas de simulacin.

2.2 Propiedades de los generadores de nmeros aleatorios


1. Aleatoriedad: es esencial que las secuencias de nmeros seudoaleatorios generadas tengan las mismas propiedades que los verdaderos nmeros aleatorios. El comportamiento aleatorio es determinado por una serie de pruebas estadsticas que se vern posteriormente. 2. Perodo largo: debido a que las series seudoaleatorias se basan en frmulas determinsticas precisas, cada secuencia de ellas comenzar eventualmente a repetirse. La cantidad de nmeros no repetidos en cada secuencia se llama perodo; este se desea lo ms largo posible de tal forma que no se deben repetir las secuencias en una simulacin simple. 3. Reproducibilidad: es deseable generar la misma secuencia de nmeros durante cada simulacin, cuando se usan los mismos valores para los parmetros y las variables de entrada. Hay otros casos en los que se requieren frecuencias diferentes. El generador de nmeros aleatorios debe ser capaz de generar ambas secuencias, las repetidas y las diferentes, segn lo requerido. 4. Eficiencia computacional: el generador de nmeros no debe requerir demasiada memoria, debiendo ser generados la mayor cantidad de nmeros en el menor tiempo posible. 5. Independencia estadstica: baja correlacin entre los valores generados. 6. 7Distribucin uniforme de las variables.

2.3 Mtodos para generar nmeros aleatorios


2.3.1 Mtodo de Von Newmann (1946)
Es sencillo pero inefectivo pues se ha demostrad que la secuencia generada no cumple las condiciones de los nmeros aleatorios: el perodo es impredecible y dependiente del valor inicial de Ni, resultando a veces perodos demasiado pequeos.

Ejemplo: Comenzando con Ni = 25073 Ni = 628655329 N2 = 86553 N2 =7491421809 N3 = 14218 .

2.3.2 Variacin del mtodo de Von Newmann


Los dos primeros nmeros se multiplican entre s. Es un mtodo tambin insatisfactorio. Ejemplo: Ni = 60455 N2 = 71287 Ni*N2 = 4309655585 N3 = 96555 N2*N3 = 6883116285 N4 = 31162

2.3.3 Mtodos basados en nmeros congruentes


Dado un entero positivo m, llamado mdulo, se dice que dos nmeros a y b son congruentes en mdulo m, si (a-b) es un mltiplo entero de m tal que a-b = k*m siendo k un nmero entero. Esta relacin se nota usualmente como a b (mod. m) y se lee a congruente con b mdulo m. Ejemplo: Dado m=8 hallar los pares de nmeros congruentes en mod. 8. (8,0) (11,3) (6,-2) (35,3) Si 8-0 = 1*8 11-3=1*8 6+2=1*8 35-3=4*8 y 8 0 (mod. 8) 11 3 (mod. 8) 35 3 (mod. 8) b c (mod. m) se cumple a c (mod. m)

a b (mod. m)

2.3.3.1 Mtodo del residuo potencia o congruencial multiplicativo


Hace uso de la relacin congruencial recursiva Ni A^i Ni-1 (mod. M) donde Ni-1 y Ni son dos nmeros enteros aleatorios sucesivos. Dados A, el multiplicador, y m, el mdulo, si se comienza con la constante N0 conocida, se tiene N2 A N1 (mod. M),o sea N2 A*A^1 N0 (mod. M).Queda N1 A^1 N0 (mod. M) N2 A^2 N0 (mod. M)

.. Ni A^i N0 (mod. M) Para que los Ni tengan un aceptable comportamiento aleatorio es esencial que los valores para m, N0 y A sean elegidos de acuerdo a las siguientes reglas: 1. El mdulo m podr ser escogido tan grande como sea posible para maximizar el perodo de la secuencia de nmeros aleatorios. Si el computador trabaja con w bits por palabra, el m seleccionado es m= 2^ (w-1) 2. El multiplicador A debe ser escogido de tal forma que minimice la correlacin entre dos nmeros sucesivos y que haga el perodo lo ms grande posible. A debe satisfacer las dos condiciones siguientes: A 2^ (w/2) y A +/- 3 (mod. 8) 3. La semilla N0 puede ser cualquier nmero positivo entero impar cuyo valor sea menor que m. Diferentes semillas se pueden usar para generar diferentes secuencias, pero el mdulo m y el multiplicador A deben permanecer los mismos. Cuando son escogidos de esta manera los valores de m, A y N0, cada secuencia generada tendr un perodo T= m/4 y los valores obtenidos para los Ni estn entre 0 y m-1. Para obtener las variables aleatorias distribuidas uniformemente U1, U2.cuando 0 Ui 1, se divide cada Ni/m = Ui Ejemplo: Si el nmero de bits por palabra es w = 12, hallar m, A, N0 y los primeros Ui La frmula es Aqu m = 2^ (12-1) = 2048 A 2^ (12/2) = 64 y A +/- 3 (mod. 8) de donde resulta A = 67 (67-3 = 64 = 8*8 pero tambin 61+3= 8*8) Se elige N0 menor que m pudiendo ser por ejemplo, N0 = 129. I=1 Ni 67^ 1 129 (mod. 2048) = 451 (67*129 = 8643 8643/2048 =4.2202. 0.2202*2048 = 451) U1=451/2048 = 0.220214843 N2 67 ^ 2 129 (mod. 2048) = 1545 U2 = 1545/2048 = 0.7544 N513 = N1 = 451 N514 = N2 = 1545 etc. Ni A ^ i N0 (mod. m)

I=2

El perodo T= m/4 = 2048 / 4 = 512 distintos Ni. As

Este mtodo es ampliamente utilizado por que cumple las pruebas estadsticas para aleatoriedad y es fcilmente implantable en el computador. Existen otros conjuntos de reglas para escoger los valores de m, A y N0 diferentes al ya visto.

2.3.3.2 Mtodo congruencial mixto o de perodo completo


Basado en la siguiente relacin: Ni A Ni-1 + b (mod. m)

Donde Ni, Ni-1 son dos enteros aleatorios sucesivos; A, b, m constantes enteras especficas y N0 es la semilla. N1 A N0 + b (mod. m) N2 A N1 + b (mod. m) = A (AN0+b (mod.m)) +b (mod.m) =A^2 N0 + b ((A^2)-1)/ (A-1) (mod. m) Ni A Ni-1 + b (mod. m) = A^I N0 + ( b ((A^i)-1 )/ (A-1)) (mod. m) Como cada Ni ser un residuo del lado derecho (por ser mod. m) 0 Ni < m pudiendo obtenerse las variables aleatorias uniformemente distribuidas, como Ui = Ni/ m donde Ui pertenecer al intervalo entre 0 y 1. Cuando se implementa este mtodo en un computador se deben observar las siguientes reglas: 1. El mdulo m podr ser escogido tan grande como sea posible para maximizar el perodo de la secuencia de nmeros aleatorios. Si el computador trabaja con w bits por palabra, el m seleccionado es m= 2^ (w-1) 2. El multiplicador A debe ser escogido de tal forma que minimice la correlacin entre dos nmeros sucesivos y que haga el perodo lo ms grande posible. A debe satisfacer las dos condiciones siguientes: A 2^ (w/2) y A 1 (mod. 4) 3. La semilla N0 y la constante b son enteros positivos menores que m. Para este mtodo resulta un perodo T = m . Se usa menos frecuentemente que el anterior pues produce series menos aleatorias, a pesar de tener un T mayor. Valores apropiados para algunos tamaos comunes de palabras w: Tamao de palabra W 8 bits 12 . 64 Multiplicador A(2^(w/2) +3) 19 67 4294967299 Mod -1(2^(w/1) -1) 127 2047 9223372036854775807

2.3.4 Otros generadores aleatorios con distribucin uniforme


Ver libro Simulacin, mtodos y aplicaciones de D. Ros y S. Ros.

2.3.5 Variables aleatorias continuas


Si X es una v.a. continua distribuida uniformemente en el intervalo (a, b), con a menor que b, llamamos U a la v. continua uniformemente distribuida en el intervalo (0,1) Por proporcionalidad X-a / b-a = U-0 / 1-0 quedando X = a+ (b-a) U donde U ya se ha generado antes. Para generar en PASCAL, por ejemplo, nmeros entre 1 y 4: X = 1 + (4 1) RND Donde RND es la biblioteca para generar nmeros aleatorios uniformes.

2.3.6 Variables aleatorias discretas


A y b son enteros y a menor que b. X es una variable entera (discreta) aleatoria uniformemente distribuida en el intervalo (0,1). Se puede hallar X = a + INT ( (b a + 1 ) U ) Si 0U< 1 entonces 0 (b-a+1) U < (b-a+1) 0, 1, 2, (b-a) a, a+1, a+2,.b

La cantidad INT ( (b a + 1 ) U ) toma valores enteros de Y por ello se asumen para X los valores

2.4 Pruebas estadsticas de aleatoriedad


Estas pruebas determinan qu tan bien puede ser representado un conjunto de observaciones por una distribucin dada.

2.4.1 Estadstica Chi cuadrado:


K ser el nmero de las diferentes categoras y cada observacin debe caer en una de ellas. Oi es el nmero de eventos observados en cada una de las categoras i (i=1, k). Ei es el nmero esperado de eventos en cada categora i. Si Oi y Ei son conocidos para cada categora, la estadstica Chi cuadrado puede ser determinada como
k

Chi cuadrado = (O1-E1) ^2 / E1 + ..+ (Ok-Ek) ^2 / Ek = (Oi-Ei) ^2 / Ei


i=1

El resultado de este clculo se usa en unin de la tabla para la distribucin Chi cuadrado. En ella la primera fila indica la probabilidad, en porcentaje, de que la distribucin asumida pronostique incorrectamente. A esto se le llama nivel de significacin. Algunas tablas dan el nivel de significacin 100-p, en vez de la probabilidad de rechazo de la hiptesis. La columna de la izquierda representa el nmero de grados de libertad v que es, para este caso, uno menos que el nmero de categoras. (v= k-1) ya que en este caso no se est estimando ningn parmetro. En general el nmero de grados de libertad es k-m-1 donde k es el nmero de categoras o

clases y m representa el nmero de parmetros estimados por los estadsticos muestrales de la distribucin propuesta. Cuando no se estima ningn parmetro, m=0. Cuando se hace una prueba estadstica, se est examinando si la hiptesis Ho de que los resultados observados puedan ser representados por la distribucin dada, es correcta. La probabilidad de que la hiptesis sea incorrecta (o sea, de que la distribucin sea inapropiada) aumenta cuando el valor calculado para Chi cuadrado aumenta. En la prctica, la hiptesis se rechaza Ho si el valor calculado para Chi excede el tabulado para alguna probabilidad de rechazo razonablemente pequea, por ejemplo p=5% o 1%. Fuera indeseable que los resultados observados difirieran grandemente con los esperados si la hiptesis fuera vlida. La hiptesis es rechazada si el valor calculado de Chi cuadrado es menor que el tabulado para alguna probabilidad de rechazo muy grande, por ejemplo p= 95% o 99%. En este caso fuera indeseable que los resultados observados estuvieran pronosticados perfectamente por la distribucin. La hiptesis es aceptada si el valor de Chi cuadrado calculado est en el intervalo formado por los valores tabulados correspondientes a las dos probabilidades de rechazo extremas. Si la hiptesis nula Ho resulta cierta y an as se rechaza a favor de la hiptesis alternativa Ha, se est cometiendo un error de tipo I: probabilidad . Pero si Ha es cierta y an as no se rechaza Ho, se comete un error de tipo II: probabilidad Las pruebas de hiptesis se configuran para permitir especificar la probabilidad de un error de tipo I, mientras se hace todo lo posible por maximizar la probabilidad de error tipo II. Si se exige pequea, se obtiene pero al costo de una mayor. El nivel de significancia es entonces la mxima probabilidad aceptable del error tipo I. Si = 0.05 existe 5 de 100 posibilidades de rechazar Ho cuando es correcta. Otra forma de llevar a cabo la prueba es no tomar una decisin si-no sino cuantificar qu tan acertado se est sobre cul es la hiptesis correcta. El valor del parmetro p nos indica la probabilidad de obtener un conjunto de datos, si Ho es cierta, que est ms a favor de Ha. Si p es muy pequeo, la evidencia para Ha es fuerte. Si p es grande (de 0.5 a 0.7) no hay razn para sospechar de Ho. Si p est en el lmite (0.1) el resultado es no concluyente. Ho no se acepta si calculado tabulado para p=5% (p es la probabilidad de que se pronostique incorrectamente). La distribucin Chi cuadrado tiene la forma

Y su ecuacin es Y = C () ^ ((v-2)/2) exp (-/2) donde v es el nmero de grados de libertad y C es una constante que depende de v, elegida de tal forma que el rea bajo la curva sea 1.

Las pruebas de hiptesis aparecen en la simulacin: 1. En el ajuste de las distribuciones de probabilidad de los parmetros de entrada al modelo y 2. En los resultados, cuando hay varios modelos que se estn comparando en base a una medida de desempeo: existe diferencia entre las medias de estas medidas? Ejemplo 1: se lanza un dado un nmero n=60 veces. Las frecuencias tericas esperadas, Ni* para este caso, son de 10 veces cada cara y las frecuencias reales, Ni, son los resultados del lanzamiento. A base de un nivel de significacin del 5%, permite su8poner que el dado es perfecto, es decir, no est cargado? Caras Ni 1 2 3 4 5 6 7 14 8 5 16 10 Ni* Ni-Ni* 10 10 10 10 10 10 60 -3 4 -2 -5 6 0 0 (Ni-Ni*)^2 (Ni-Ni*)^2/ Ni* 9 16 4 25 36 0 0.9 1.6 0.4 2.5 3.6 0 9.0

suma 60

La prueba se realiza teniendo en cuenta los siguientes pasos: 1. Formulacin de hiptesis: Hiptesis nula Ho: Ni = Ni* (dado legtimo) Hiptesis alterna Ha: Ni Ni* (dado no legtimo) P es la evidencia en contra de Ho que hay en las observaciones. 2. Nivel de significancia (Alfa) =0.05 (normalmente se usa 1%, 5% o 10%). Es la mxima probabilidad que se especifique con el fin de hacer mnimo el error de rechazar la hiptesis si sta es verdadera. Si se trabaja con 5% de significancia el resultado es significativo, si se emplea el 1% el resultado es altamente significativo. es la probabilidad de que se pronostique errneamente. En este punto se est estableciendo el criterio de decisin para juzgar si las frecuencias observadas, en promedio, difieren significativamente de las frecuencias esperadas. El valor del nivel de significacin corresponde a un rea bajo la curva de probabilidad normal llamada zona de rechazo, ZR, o regin crtica, siendo ZA la zona de aceptacin. 3. calculado= (Ni-Ni*)^2/ Ni* = 9 Aqu se ve que a mayor coincidencia entre las frecuencias reales y esperadas, Chi cuadrado tendr menor valor. Si su valor fuera igual a cero. Ambas frecuencias coincidiran. 4. Grados de libertad v = k-m 1 = 6-0 1 = 5 El nmero de parmetros estimados m es cero pues en este caso no se est estimando ningn parmetro. Para este valor se busca en la tabla de la distribucin Chi cuadrado, v = 5 y = 0.05. Se halla el valor para (5.0.05) tabulado = 11.07 5. Aceptacin o rechazo de la hiptesis: como calculado menor que tabulado, se acepta la hiptesis nula de que la diferencia entre las frecuencias no es significativa. Se

puede afirmar al nivel del 5%, que las diferencias que presentan las frecuencias reales, en relacin con las tericas, no nos dan una base para afirmar que el dado est cargado.

Ejemplo 2: se estudiaron 64 cras de cruzamiento entre conejos de las cuales 34 son rojos, 10 negros y 20 blancos. El modelo gentico predice que la relacin entre cras con estos colores es 9:3:4. Al nivel del 5% se puede afirmar que los datos son consistentes con el modelo? 9+3+4 =16 Prob 1 = 9/16 = .5625, N1* = n*P1= 64*.5625 = 36, Ni observados 34 10 20 Total 64

Prob2 = 3/16 =.19, N2*= 64*.19= 12,

Prob3= 4/16 = .25 N3* = 64*.25 = 16

Ni *esperados 36 12 16 64

(Ni-Ni*)^2 / Ni* 4 / 36 = .111 4 / 36 = .111 16/ 36 =.444 calc= .666

Con grados de libertad v= 3-0-1= 2 y = 0.05 (2,0.05) tab = 5.99 (m = 0 por que no se est estimando ningn parmetro). Como el valor de Chi tabulado es menor que el de Chi calculado, se acepta la hiptesis al nivel del 5%: se puede afirmar que los datos son consistentes con el modelo.

2.4.2 Prueba de frecuencia


Es la ms sencilla y utilizada de las pruebas de aleatoriedad. Aqu el intervalo (0,1) se subdivide en k subintervalos de igual longitud. El nmero de variables aleatorias que cae dentro de cada subintervalo se determina y luego se calcula una estadstica Chi cuadrado con v= k-m-1 grados de libertad. El xito o fracaso de la prueba lo determina el valor obtenido por el estadstico Chi. Ejemplo 1: Por medio de un algoritmo se generan 1000 nmeros seudoaleatorios cuyas frecuencias observadas son: Digito 0 F observada 94 1 93 2 112 3 101 4 104 5 95 6 100 7 99 8 108 9 94

Para un = 0.05 se pide verificar la hiptesis de que el generador funciona correctamente. Se calculan las frecuencias esperadas as: F esperada 100 100 100 100 100 100 100 100 100 100

Puesto que estas frecuencias se pueden obtener sin estimar ningn parmetro a partir de los datos muestrales, m=0. El estadstico tendr (k-m-1) = 10-0-1 = 9 grados de libertad. As que (9,0.05) tabulado = 16.92

El valor calculado = (94-100) / 10 + (93 100)/ 100 +.+ (94 100)/ 100 = 3.72 Por lo tanto no se puede rechazar la hiptesis nula. Ejemplo 2: Se realizan 50 mediciones del voltaje de salida de una fuente de alimentacin dando como resultado los siguientes valores: 4.56 5.053 5.064 5.041 5.019 4.95 4.91 4.97 5.081 4.85 5.023 4.99 5.014 5.027 4.99 4.99 5.059 4.96 4.9 5.066 4.97 4.72 5.035 4.96 4.99 5.019 5 4.84 5 5.038 4.96 4.97 5.045 5.069 5.06 5.122 5.132 5.09 5.099 5.089 5.141 5.098 5.128 5.15 5.145 5.138 5.144 5.131 5.139 5.094 Promedio 5.02046 Con = 0.05 se desea determinar si el voltaje de salida se rige por la distribucin normal. Las estimaciones muestrales de la media y de la desviacin son: Xmedia = 5.02046 V y S= 0.110602 V Una prctica comn para construir intervalos de clase en la prueba de Chi cuadrado, es seleccionar los lmites de las clases de forma tal que las frecuencias esperadas Ei = n Pi (n tamao de la muestra, Pi la probabilidad de la clase) sean iguales para todos los subintervalos. Las fronteras para las k clases a0, a1,ak se escogen de tal forma que las probabilidades Pi = P(a (i-1) X ai) = f(x) dx siendo la integral calculada entre a (i1) y a (i), sean iguales. Suponga que se decide utilizar 8 celdas o subintervalos. Para la distribucin normal estndar, los intervalos que dividen la escala en segmentos igualmente probables son

En cada subintervalo tendramos 12.5% de probabilidad. Los valores de Z se hallan en la tabla de la distribucin normal asignando 0.125 de rea al primer intervalo. As se obtiene Z = 0.32. Al segundo intervalo se le asigna un rea tambin de 0.125 que sumada al rea anterior dara 0.25 y cuyo Z es 0.675 etc. Se hace lo mismo tambin a la izquierda del 0. Intervalos FREC. Observada FREC. Esperada 4.948 6 6.25 4.948 4.986 7 6.25 4.986 5.014 6 6.25 Chi cuadrado 0.01 0.09 0.01

5.014 5.04 5.04 5.066 5.066 5.094 5.094 5.132 5.132 Sumas

7 6 5 6 7 50

6.25 6.25 6.25 6.25 6.25 50

0.09 0.01 0.25 0.01 0.09 0.56

Debido a que se han estimado los dos parmetros de la distribucin normal, el estadstico Chi cuadrado tabulado con k-m-1 = 8-2-1 = 5 grados de libertad y con = 0.05 vale 11.07. De este modo no se puede rechazar la hiptesis de que el voltaje de salida est regido por una distribucin normal. Se le aconseja al estudiante revisar los valores calculados para los intervalos y verificar si son o no los correctos.(Sugerencia: comience con el valor de la variable que corresponde al 12.5% del rea total calculada por medio de la frmula de traslacin de escalas Z = ( x - ) / ) Los siguientes ejemplos ilustran el procedimiento general para estimar parmetros de una serie de datos experimentales u observaciones, e identificar la distribucin que rige estos datos con el fin de simularlos, utilizando esta distribucin en el modelo. Ejemplo 3: El nmero de defectos en un producto hecho de madera se propone que sigue una distribucin de Poisson. Los defectos pueden ser por ejemplo, en el color, en la veta,, en el terminado, en el tamao etc. En una muestra aleatoria de 60 piezas, la distribucin del nmero de defectos hallados es: Numero de defectos Frecuencia observada 0 32 1 15 2 9 3 4

La media de la distribucin de Poisson propuesta debe ser estimada a partir de los datos muestrales: = (32*0 + 15*1 + 9*2 + 4*3) /60 = 0.75
X

La funcin de densidad de probabilidad de Poisson es f(x) = exp. (- t) (t) / X ! A partir de ese valor y esta frmula se puede calcular Pi = probabilidad hipottica asociada al i-simo intervalo de clase, asignando arbitrariamente a t el valor de 1; cada intervalo corresponde a un nmero particular de defectos. Fesp P1*60 = 28.32 P2*60 = 21.24 P3*60 = 7.98 P4*60 = 2.46 Fobs 32 15 9 4

P1 = P(X=0) = exp (-0.75)*(0.75) / 0! = 0.472 P2 = P(X=1) = exp (-0.75)*(0.75) / 1! = 0.354 P3 = P(X=2) = exp (-0.75)*(0.75) / 2! = 0.133 P4 = P (X3) = 1-P1-P2-P3 = 0.041

Puesto que la frecuencia esperada en la ltima celda es menor que 0.3, se combinan las dos ltimas celdas: Nmero de defectos 0 1 2 o ms Fobs 32 15 13 F esp 28.32 21.24 10.44

En este caso k-m-1 = 3-1-1 = 1 (3 categoras y un parmetro estimado, la media.) (1,0.05) tabulado = 3.84 calculado = 2.94 Por ello no se puede rechazar la hiptesis nula.

Ejemplo 4: Suponga que 17 observaciones para un tiempo entre llegadas, en minutos, a un sistema de colas, tuvieron los siguientes valores: Llegada Tiempo 1 5 2 3 4 5 6 7 8 9 10 2 1 2 1 3 1 3 2 1 11 4 12 4 13 14 15 16 17 1 2 1 1 1

Se desea generar v.a. que se rijan segn la distribucin del tiempo entre llegadas dado. Procedimiento: para tener alguna sospecha sobre la distribucin a hipotetizar, es conveniente hacer el histograma de frecuencias de la variable en cuestin. Subintervalo Conteos 1 8 2 4 3 2 4 2 5 1

Si se hace una grfica se ver que la funcin de densidad de probabilidad se parece a una exponencial, as que esta es la primera distribucin que hipotetizamos. El parmetro de la distribucin exponencial es la media que se calcula = (5+2+1+2+.+1+1) min. / 17 llegadas = 35 min. / 17 = 2.05 min. /llegada El valor del parmetro alfa: = 1 / = 1 / 2.05 = 0.488 clientes / min. Como suponemos (hiptesis Ho) que la distribucin de tiempos entre llegadas es exponencial, se debe utilizar la expresin de densidad de probabilidad f(x) exponencial como frecuencia esperada:
X1 X0 X1 X0

f(x) dx = exp(- x) dx = - exp (- t ) | = - (exp(- x1) exp(- x0)) = = exp (-0.488 x0 ) exp (-0.484 x1)

Con esta formula se calculan los valores de la funcin de densidad de probabilidad para los diferentes intervalos, siendo X1 y X2 los lmites inferior y superior de cada uno de ellos.

Marca Xi 0.5 1.5 2.5 3.5 4.5 5.5

Intervalo X0,X1 ( 0,1] (1,2] (2,3] (3,4] (4,5] (5,10]

fobservada 8 4 2 2 1 0

fesperada exp (-0.488*0)-exp(-.488*1) = 1- 0.613 = .386 = 6.56/17 0.2361 = 4 / 17 0.1455 = 2.47 / 17 0.0893 = 1.51/17 0.0544 = 0.92 / 17 0.079 = 1.3 / 17

Se comparan ahora los dos conjuntos de datos: fobs y fesp utilizando las pruebas de o K-S; se define un nivel de significancia de = 0.05 por ejemplo, donde los grados de libertad para el caso de una distribucin exponencial son k-m-1 = 6-1-1 = 4 Si se comprueba la hiptesis nula Ho, para generar las variables aleatorias exponenciales podemos utilizar la frmula Xexp = xo (-xo) ln u = 1 - ( 2.05-1) ln u

2.4.3 Prueba del espacio intermedio (Gap test)


Se usa para examinar el orden de una secuencia de dgitos seudoaleatorios. Las anteriores pruebas han sido de uniformidad, esta es una prueba de aleatoriedad. Aqu se cuentan los nmeros de los dgitos que intervienen entre la ocurrencia i y la i+1 de algn digito particular, d. Si intervienen n dgitos, se tiene un espacio intermedio de longitud n. Los espacios se determinan para cada d cuando se le permite tomar 10 valores (d= 0, 1,29). Se tabula el nmero total de ocurrencias para cada longitud de espacio intermedio. El nmero de espacios de longitud n es dado por En = (0.9) ^ n (0.1) N Siendo N el nmero total de espacios. Esta frmula se halla a partir de calcular la probabilidad de tener una cadena de longitud n+1 con un dgito de comienzo no repetido en una muestra de tamao N.

Ejemplo 1: Considere la secuencia de 48 dgitos aleatorios consecutivos:

923060497710807406852632953903562526358756195478

Paso 1: determinar los espacios asociados a cada dgito. D 0 1 2 3 4 5 6 7 8 9 Longitud del espacio intermedio 1, 5, 1, 2, 11 31 18, 2, 8, 1 19, 3, 2, 6 8, 29 5, 4, 2, 3, 2, 3 12, 3, 9, 3, 5 0, 4, 24, 6 5, 19, 8 6, 16, 2, 15

N= 38 espacios. El mayor espacio posible es n mx. =46 Rango de 38 espacios hallados entre (n min, n max)= (0,31)

Paso 2. Tabular el nmero de espacios observados On y esperados En para cada longitud utilizando la relacin En = (0.9) ^n (0.1) N As, por ejemplo E0 = (0.9) ^0 (0.1) 38 = 3.8 E1 = (0.9) ^1 (0.1) 38 = 3.42 n 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 36 37 38 On 2 0 0 0 0 1 0 0 0 0 1 0 1 0 0 0 0 0 0 En .51 .46 .42 .37 .34 .3 .27 .25 .22 .2 .18 .16 .14 .13 .12 .11 .09 .08 .07 n 39 40 41 42 43 44 45 46 On 0 0 0 0 0 0 0 0 En .06 .06 .05 .05 .04 .04 .03 .03

n 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

On 1 3 6 5 2 4 3 0 3 1 0 1 1 0 0 1 1 0 1

En 3.8 3.42 3.08 2.77 2.49 2.24 2.02 1.82 1.64 1.47 1.32 1.19 1.07 .97 .87 .78 .7 .63 .57

Paso 3. Para aplicar la prueba Chi cuadrado se deben combinar las categoras de tal forma que Ei 5 para cada nueva categora.

I 1 2 3 4 5 6

n 0-1 2-3 4-6 7-10 11-16 17-46

Oi 4 11 9 4 4 6

Ei 7.22 5.85 6.75 6.25 5.58 6.08

nmax

Paso 4. Se halla el valor El valor de

calculado = (On En) ^ 2 / En = 7.98


n=1

tabulado (5,0.05) = 11.07

La hiptesis nula se acepta: la secuencia dada es aleatoria.

2.4.4 Prueba de Kolmogorov-Smirnoff


Ejemplo 1: Para ilustrar la prueba de K-S se debe considerar la siguiente lista de 100 nmeros seudoaleatorios generados a partir de cualquier generador.

Lista original 0,71737 0,137189 0,34985 0,75759 0,60552 0,62753 0,95304 0,537105 0,50274 0,648736 0,91186 0,995236 0,12566 0,146339 0,65523 0,396992 0,50363 0,782123 0,62129 0,368505 0,25921 0,657123 0,09768 0,445516 0,58337 0,233252 0,27453 0,234646 0,00341 0,988611 0,986 0,385912 0,43642 0,397358 0,54114 0,842296 0,37442 0,909516 0,20667 0,492185 mnimo 0,00341

0,027109 0,706141 0,042967 0,913921 0,238971 0,461956 0,139518 0,702397 0,378967 0,251721 0,438599 0,145883 0,786293 0,884543 0,65796 0,28162 0,92938 0,088264 0,653527 0,448303 mximo 0,995236

0,33978 0,24287 0,7821 0,9749 0,97854 0,24425 0,84442 0,79611 0,85043 0,73613 0,49227 0,26099 0,23766 0,90359 0,41962 0,04967 0,86879 0,41657 0,31922 0,05089

0,69776 0,63228 0,88768 0,94915 0,05264 0,55761 0,63479 0,07854 0,04523 0,70679 0,22951 0,1434 0,42738 0,86524 0,95343 0,85275 0,62916 0,40498 0,7559 0,74692

La lista debe ordenarse de menor a mayor. Los valores esperados se calculan como i / 100 para cada variable, donde i es el puesto que ocupa la variable en la lista (i va desde 1 hasta 100). En las columnas rotuladas como D, se calcula para cada variable, la diferencia absoluta entre el valor observado, f(obs), de la variable y el esperado f(esp).

Lista ordenada f(obs) f(esp) D 0,003 0,01 0,007 0,027 0,02 0,007 0,043 0,03 0,013 0,045 0,04 0,005 3E0,05 0,05 04 0,051 0,06 0,009 0,053 0,07 0,017 0,079 0,08 0,001 0,088 0,09 0,002 0,098 0,1 0,002 0,126 0,11 0,016 0,137 0,12 0,017 0,14 0,13 0,01 0,143 0,14 0,003 0,146 0,15 0,004 0,146 0,16 0,014 0,207 0,17 0,037 0,23 0,18 0,05 0,233 0,19 0,043 0,235 0,2 0,035

f(obs) f(esp) D f(obs) f(esp) D f(obs) f(esp) D f(obs) f(esp) D 0,238 0,21 0,0277 0,4196 0,41 0,0096 0,6348 0,61 0,025 0,844 0,81 0,034 0,239 0,22 0,019 0,4274 0,42 0,0074 0,6487 0,62 0,029 0,85 0,82 0,03 0,243 0,23 0,0129 0,4364 0,43 0,0064 0,6535 0,63 0,024 0,853 0,83 0,023 0,244 0,24 0,0042 0,4386 0,44 0,0014 0,6552 0,64 0,015 0,865 0,84 0,025 0,252 0,259 0,261 0,275 0,282 0,319 0,34 0,35 0,369 0,374 0,379 0,386 0,397 0,397 0,405 0,417 0,25 0,26 0,27 0,28 0,29 0,3 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,4 0,0017 0,0008 0,009 0,0055 0,0084 0,0192 0,0298 0,0298 0,0385 0,0344 0,029 0,0259 0,027 0,0174 0,015 0,0166 0,4455 0,4483 0,462 0,4922 0,4923 0,5027 0,5036 0,5371 0,5411 0,5576 0,5834 0,6055 0,6213 0,6275 0,6292 0,6323 0,45 0,46 0,47 0,48 0,49 0,5 0,51 0,52 0,53 0,54 0,55 0,56 0,57 0,58 0,59 0,6 0,0045 0,0117 0,008 0,0122 0,0023 0,0027 0,0064 0,0171 0,0111 0,0176 0,0334 0,0455 0,0513 0,0475 0,0392 0,0323 0,6571 0,658 0,6978 0,7024 0,7061 0,7068 0,7174 0,7361 0,7469 0,7559 0,7576 0,7821 0,7821 0,7863 0,7961 0,8423 0,65 0,66 0,67 0,68 0,69 0,7 0,71 0,72 0,73 0,74 0,75 0,76 0,77 0,78 0,79 0,8 0,007 0,002 0,028 0,022 0,016 0,007 0,007 0,016 0,017 0,016 0,008 0,022 0,012 0,006 0,006 0,042 0,869 0,885 0,888 0,904 0,91 0,912 0,914 0,929 0,949 0,953 0,953 0,975 0,979 0,986 0,989 0,995 0,85 0,86 0,87 0,88 0,89 0,9 0,91 0,92 0,93 0,94 0,95 0,96 0,97 0,98 0,99 1 0,019 0,025 0,018 0,024 0,02 0,012 0,004 0,009 0,019 0,013 0,003 0,015 0,009 0,006 0,001 0,005

De los 100 valores calculados para D1, D2D100 se calcula el estadstico D de K-S como el mximo de los Di : Dcalculado = max | f(esp)-f(obs) | = 0,051 para i=57. Luego se busca en la tabla del estadstico dn, de Kolmogorov-Smirnoff, con n = 100, en nuestro caso, y = 0.05 = 0.134. En la tabla se observa el valor d100, 0.05 = 0.134 Si D dn, , no se puede rechazar la hiptesis de que la distribucin que rige los nmeros generados es uniforme. Existen varias pruebas de hiptesis ms: la de Anderson-Darling, la prueba de las series, prueba de independencia para descubrir autocorrelacin entre nmeros, pruebas de bondad de ajuste (grfico cuantil-cuantil) etc. Se recomienda leer el libro Simulacin de Raul Coss-Bu, para tener una idea sobre estas otras pruebas. Para un ejemplo de Prueba de series cargue Texto completo sobre simulacin en la seccin Aplicaciones de simulacin de la pgina de la materia y lea la seccin 3.2.3.2 sobre pruebas de independencia. Lea en ese mismo texto, de la pgina 66 a la 73, seccin 3.3.3, un ejemplo prctico sobre modelado de entradas donde se aplica la prueba K-S.

S-ar putea să vă placă și