Documente Academic
Documente Profesional
Documente Cultură
Facultad de Ingeniera
MAESTRA Y DOCTORADO EN CIENCIAS E INGENIERA
Probabilidad y Estadstica
UNIVERSIDAD AUTNOMA DE BAJA CALIFORNIA HIPTESIS EVALUACIN TEORA PROCEDIMIENTO CDIGO FUNCIONES AUXILIARES SERIE M-AGREGADA CLCULO DE PARMETRO DE HURST POR MTODO DE LA VARIANZA PROGRAMA PRINCIPAL RESULTADOS CONCLUSIONES 3 3 3 5 6 6 6 6 7 9 10
2|Page
Probabilidad y Estadstica
HIPTESIS
Que la serie sea autosimilar para m=10 y 100.
EVALUACIN
El trabajo final requiere de una serie de datos http://yaqui.mxl.uabc.mx/~mangulo/trazas/index.htm Se realizar una presentacin del trabajo final el da 3 de diciembre. El 2 de diciembre se enviar al tablero de discusin de blackboard un documento que incluya lo siguiente: a) Justificacin de los procesamientos realizados a la serie de datos (25pts) b) Pseudocdigos y algoritmos implementados (25 pts) c) Resultados tablas y figuras- (20 pts) Anlisis de resultados y conclusiones (30 pts)
TEORA
Los procesos autosimilares tienen distribuciones invariantes ante escalamientos arbitrarios de tiempo y espacio. Estos procesos se presentan ampliamente en numerosos campos de estudio (geofsica, hidrologa, economa, fsica, biologa). La autosimilitud es una propiedad fundamental de los fractales. Esta propiedad implica que fragmentos del fractal son equivalentes al fractal completo al ser escalados. La autosimilitud en un proceso significa que las propiedades estadsticas del proceso son invariantes ante cualquier escalamiento. En un proceso autosimilar X(t) el ndice de autosimilitud H o parmetro de Hurst es un nmero positivo tal que se cumple la siguiente relacin para toda a > 0 : ()
=
()
3|Page
UNIVERSIDAD AUTNOMA DE BAJA CALIFORNIA Dicha relacin establece que un proceso estocstico autosimilar con ndice de autosimilitud H tiene la misma distribucin para cualquier valor de a. Por consecuencia los momentos para dichas distribuciones deben ser iguales. La condicin de autosimilitud tambin puede ser descrita como:
() = 1
Donde m representa el nivel de agregacin de la serie X con n elementos, siendo X(m) la serie magregada la serie de i elementos igual a n/m, donde la serie original se divide en ventanas no traslapadas de tamao m y cada elemento X(m)i se calcula sobre dicha ventana como:
()
1 = +(1)
=1
Dicho de otra forma, el elemento X(m)i corresponde al promedio de los m elementos en la ventana de Xim hasta X(i+1)m. Uno de los mtodos para determinar el ndice de autosimilitud H de una serie X es el mtodo de la varianza, que parte de la suposicin de que en un proceso autosimilar estacionario la varianza de la serie m-agregada Var{X(m)} mantiene la siguiente relacin con la varianza de la serie original: { () } = 22 {}
Se obtienen las series m-agregadas para diferentes valores de m y se evala la relacin log [{ () }] log [{}] y se tabula contra log(m) . Como resultado se tiene una nube de puntos y suponiendo que el proceso tiene un ndice de autosimilitud constante para toda t es posible realizar una aproximacin lineal de H para mltiples valores de agregacin de la misma serie. Para determinar si las distribuciones son iguales, es necesario realizar una prueba de igualdad. La prueba Kolmogorov-Smirnov o prueba K-S, es una prueba no paramtrica para la igualdad de distribuciones de probabilidad contnuas de una sola dimensin. Se puede emplear para comprar una muestra con una distribucin de referencia, o se pueden comprar dos muestras entre s. Si se emplea para comprar dos muestras, la estadstica Kolmogorov-Smirnov cuantifica la distancia entre dos distribuciones empricas de las muestras. La distribucin nula de la esta estadsitca est calculada bajo la histesis nula de que las muestras son tomadas de la misma distribucin.
4|Page
PROCEDIMIENTO
El procesamiento realizado para los datos fue el siguiente. Clculo de ndice de Hurst. Para obtener el Parmetro de Autosimilitud se emple el mtodo de la varianza antes mencionado. Dicho mtodo se basa en la relacin que existe entre las varianzas de la serie original, la serie m-agregada, el nivel de agregacin y el Parmetro de Autosimilitud. Obtencin de las series m-agregadas. Se calcularon las series para nivel de agregacin m=10 y m=100 usando el algoritmo antes mencionado:
()
1 = +(1)
=1
Clculo de CDF empricas. Para poder realizar la prueba de igual, es necesario prepara los datos. Primero se debe obtener dos series multiplicando la serie original por un factor de 1 para m=10 y m=100 y encontramos la CDF de ambas y para las series m-agregadas. Evaluacin de la condicin de autosimilitud. Para evaluar la condicin de autosimilitud es necesario obtener la serie m-agregada para m = 10 y m = 100. Una vez calculadas las series m-agregadas se realiza la prueba Kolmogorov-Smirnov para las dos condiciones. Validacin de la Hiptesis. Se analizaron los datos bajo la condicin de autosimilitud mediante una prueba Kolmogorov-Smirnov y se generaron conclusiones.
5|Page
6|Page
Programa Principal
%Lectura de los datos Data = fopen ('C:\Users\Alex Lizarraga\Desktop\TrabajoFinal_6.txt'); y = fscanf (Data,'%f'); fclose('all'); %Serie original x = transpose(y); figure(11); plot(x); figure(12); cdfplot(x); %Calculo de Indice de Hurst [H,m,Haux] = HurstVarianceC(x ,20,10); figure (13); scatter(log(m),Haux,'b','fill','c'); hold on; a = polyfit(log(m),Haux,1); scatter(log(m),(a(1)*(log(m)) + a(2)),'r','x'); %Calculo de las series xOrgM10 = (10^(H-1))*x; xOrgM100 = (10^(H-1))*x; xAggM10 = getMAggSer2(x,10); xAggM100 = getMAggSer2 (x,100); %Graficas de las Series figure(21); plot(xOrgM10); figure(22); plot(xOrgM100); figure(23); plot(xAggM10);
7|Page
figure(24); plot(xAggM100); %Comparacion de CDF [fxOrgM10,iOrgM10]= ecdf(xOrgM10); [fxOrgM100,iOrgM100]= ecdf(xOrgM100); [fxAggM10,iAggM10]= ecdf(xAggM10); [fxAggM100,iAggM100]= ecdf(xAggM100); figure(31); scatter(iOrgM10,fxOrgM10,'b','fill','c'); hold on; scatter(iAggM10,fxAggM10,'r','x'); figure(32); scatter(iOrgM100,fxOrgM100,'b','fill','c'); hold on; scatter(iAggM100,fxAggM100,'r','x'); %Evaluacion de Hipotesis 1 Hiptesis1=kstest2(fxOrgM10,fxAggM10); %Evaluacion de Hipotesis 2 Hiptesis2=kstest2(fxOrgM100,fxAggM100);
8|Page
RESULTADOS
Ilustracin 3. A la (izquierda) CDF de la serie original escalda (azul) y CDF para serie m-agregada m=10 (rojo), y al a (derecha) CDF de la serie original escalda (azul) y CDF para serie m-agregada m=100 (rojo),
9|Page
Ilustracin 4. (Izquierda) Serie original escala m^(H-1). (Derecha) Serie m-Agregada para m=10
Ilustracin 5. (Izquierda) Serie original escala m^(H-1). (Derecha) Serie m-Agregada para m=100
CONCLUSIONES
Al evaluar la condicin de Autosimilitud () = 1 para las series m-agregadas m=10 y m=100 usando una prueba de igualdad Kolmogorov-Smirnov para 2 muestras, se obtuvo que la serie original escalada un factor 1 y la serie (10) no son iguales y que tampoco la serie original escalada un factor 1 y la serie (100) son iguales con un nivel de confianza de 95%, por lo tanto no cumple con la condicin de Autosimilitud y las serie no es Autosimilar para m=10 ni para m=100.
Se calcularon ms puntos para H con diferentes niveles de agregacin para observar el comportamiento de la varianza a medida que m tiende a infinito. Se obtuvo lo siguiente:
10 | P a g e
Podemos observar que el comportamiento de la varianza cambia drsticamente a medida que m se incrementa. Este comportamiento puede sugerir que el proceso pierde la propiedad de autosimilitud ante escalamiento de gran magnitud, o simplemente que el proceso no es autosimilar.
11 | P a g e