Sunteți pe pagina 1din 8

Capitulo12

ALEATORIZACIÓN DE FASE PARA LA DETECCIÓN DE CAMBIOS


EN DATOS HIDROLÓGICOS

Maciej Radziejewski, Andras Bardossy & Zbigniew W. Kundzewicz

12.1 Introducción
El tema de la detección de cambios en los datos hidrológicos tiene una gran importancia
práctica. Los sistemas de recursos hídricos generalmente se diseñan y operan bajo el
supuesto de estacionario, lo que significa que las características esenciales de la
variabilidad de los procesos hidrológicos no cambian con el tiempo.
Si no se considera este supuesto, tendrían que revisarse los códigos de diseño existentes
de los sistemas de recursos hídricos: presas, diques y otras obras de ingeniería del agua.
De lo contrario, los sistemas estarían mal diseñados, es decir, algunos no cumplirían con
la demanda o serían demasiado costosos.
Muchas pruebas para la detección de tendencias se han sido utilizadas en estudios de
series de datos hidrológicos de larga duración. Sin embargo, cada prueba requiere una
serie de suposiciones para ser aceptado. Cuando las suposiciones de prueba subyacentes
no se cumplen, las regiones de aceptación y rechazo de la estadística de prueba no se
pueden determinar rigurosamente. Por lo tanto, tales pruebas deben tratarse como
métodos de análisis de datos exploratorios en lugar de técnicas de prueba rigurosas.
El supuesto de normalidad, necesario en el caso de las pruebas paramétricas, puede ser
demasiado simplificador en el contexto de datos hidrológicos muy desviados. En el caso
de pruebas sólidas no paramétricas, no es necesario asumir una distribución.
Hirsch et al. (1991) encontró que los procedimientos no paramétricos ofrecen grandes
ventajas cuando los datos son fuertemente no normales, y solo tienen pequeñas
desventajas (en términos de eficiencia de potencia) para los datos distribuidos
normalmente.
Aunque no se debe asumir ninguna distribución, las pruebas no paramétricas aún hacen
suposiciones. Por lo general, debe hacerse una asunción de independencia temporal. Al
analizar una serie temporal de flujos de ríos, esta suposición puede ser adecuada para los
registros de flujo anual. Sin embargo, para intervalos de tiempo más cortos, como meses
o días, no es probable que se mantenga.

12.2 Técnica de aleatorización de fase


La técnica de aleatorización de fase es una forma de generar datos mientras se preserva
la estructura de autocorrelación de la serie sin procesar. La idea surge de la filosofía de la
transformada de Fourier, convirtiendo una serie de tiempo original en un dominio de
frecuencia: espectros de amplitud y fase. Considere un ejemplo continuo donde la serie
temporal de datos observados se da como una función f(t).

Al hacer transformada de Fourier de f(t) se obtiene:


………. (12.1)

Donde i es la unidad imaginaria, ω es la frecuencia, F (ω) es la transformada de Fourier,


|F(ω)| es el espectro de amplitud y φ (ω) es el espectro de fase de la función f(t).
El espectro de amplitud en el dominio de frecuencia, |F(ω)|, está relacionado con la
función de autocorrelación de la señal original f (t) en el dominio temporal.
El principio de la técnica de aleatorización de fase es generar una señal mientras se
mantiene el espectro de amplitud de la señal original, cambiando (aleatorizando) el
espectro de fase. La serie de tiempo generada tiene la misma estructura de autoconexión
que la serie sin procesar. Preservar el espectro de amplitud en el dominio complejo es
equivalente a preservar las propiedades de autocorrelación en el dominio temporal.
Los tres pasos esenciales de la aleatorización de fase se muestran en la Tabla 12.1.
Tabla 12.1. Aleatorización de fase
Transformación de Fourier al dominio espectral. La transformada de Fourier
A (espectros de amplitud y fase) de las series estandarizadas resultantes se
computan
Aleatorizar las fases en el espectro de fase, manteniendo el espectro de potencia
B
Preservado.
C Revertir la Transformación de Fourier, de vuelta al dominio temporal

El uso de este método para la detección de tendencias en el presente estudio es similar al


espíritu del bootstrapping. Al igual que el bootstrapping, la aleatorización de fase se usa
para obtener niveles de significancia de prueba y el método se puede aplicar a cualquier
estadística de prueba seleccionada. La aleatorización de fases evita la necesidad de utilizar
fórmulas clásicas para los rangos de rechazo/aceptación de las estadísticas de prueba, que
se basan en suposiciones simplificadoras (por lo tanto, inaceptables). Es probable que la
aleatorización de fase sea particularmente útil para probar series con autocorrelación
fuerte en los datos, por ejemplo: series hidrológicas diarias.

12.3 metodología:
La aleatorización (asignación al azar) de fase se recomienda como una técnica útil que
evita la suposición restrictiva de independencia de los datos observados. Además, como
se mostrará en este análisis, la técnica de aleatorización de fase se presta bien para
comparar enfoques de pruebas estadísticas.
Para obtener una serie sintética, sin tendencia, fuera de un registro de flujo natural, se
llevó a cabo el siguiente procedimiento. La buena calidad de los datos brutos estuvo sujeta
a normalización, desestacionalización y transformación de Fourier. Manteniendo el
espectro de amplitud preservado, el espectro de fase se sometió a asignación al azar. De
esta manera, se realizaron varias pruebas conservando las propiedades esenciales de la
serie sin procesar. Después de transformar de nuevo para el dominio temporal, los datos
fueron contaminados con tendencias lineales o una tendencia abrupta de salto (no lineal).
Los cambios fueron medidos desde varios puntos de vista como una relación de la
amplitud de la tendencia o salto, y la desviación estándar de la serie a la que se agregó.
Las series fueron sometidas a una serie de pruebas estadísticas.

El algoritmo de la metodología propuesta se muestra en la Tabla 12.2.


La evaluación del nivel de significancia se realizó de la siguiente manera.
Supongamos que una serie temporal f (t) debe investigarse y se calcula una estadística de
prueba S (f). Para evaluar la importancia del resultado, se generan N series temporales
con propiedades prescritas. Para cada uno de estas series la estadística de prueba S(f) se
vuelve a calcular. Supongamos que están ordenados:

Si

Entonces la probabilidad de no exceder S (f) es


p=m/N (12.4)
Los vínculos en (12.2) y (12.3) pueden manejarse como de costumbre, tomando un
promedio apropiado. Ahora el resultado sería significativo con nivel del 95% si la
probabilidad estuviera por encima de 0.975 (lo que indica un alto resultado) o por debajo
de 0.025 (indicando un resultado bajo). Una noción de significancia definida en los
términos de esta probabilidad se usarán aquí como:
Significancia = 2 p - 1 (12.5)
El valor absoluto de significancia corresponde directamente al nivel de significancia
logrado, mientras que el signo indica la dirección del cambio.
0 Punto de partida: serie larga de datos brutos de buena calidad.
Normalización de la distribución, reemplazando cada término por el valor que
1 han tenido la misma probabilidad de no exceso en la distribución Gaussiana.
Este paso preserva los rangos relativos de los datos.
Desestacionalización. El ciclo anual se eliminó restando el régimen y
2
dividiendo el residuo por desviaciones estándar estacionales.
3 Aleatorización de fases (Tabla 12.1)
Se agregaron tendencias artificiales/cambios de pasos a la serie generada a partir
del paso 3. Luego, las propiedades distribucionales y estacionales originales de
4
la serie se restauraron invirtiendo los pasos 2 y 1. La serie resultante se probó
para ver los cambios.
Comparación de las estadísticas de prueba para una serie contaminada con la
obtenidas para todas las series generado a partir de este por una fase de
5
aleatorización adicional, con el fin de reemplazar cada el valor de la estadística
por el significado correspondiente. El proceso se repitió para toda la serie
contaminada y la significancia media se calculó para cada forma, fuerza y
estadística en estudio.

Tabla 12.2. Algoritmo de la metodología propuesta:

Atención: la convención utilizada aquí difiere de la del Capítulo 5. Significancia del 95%
aquí corresponde al 5% en el Capítulo 5.

12.4 Comparación de pruebas.


El cambio hidrológico puede tomar diferentes formas, e. g. salto brusco versus cambio
monótono gradual (tendencia), y puede ocurrir en la media y/o en la variabilidad
(varianza, extremos, persistencia). Además, existen factores complicados como
estacionalidad, valores faltantes y, en algunos casos, datos censu o. rados y problemas
derivados de tamaños de muestra pequeños. La capacidad de detectar cambios utilizando
una prueba depende del tipo de cambio, su magnitud, la longitud de la serie y el momento
en que ocurre el cambio en la serie. Una prueba particular puede funcionar bien en
situaciones específicas (por ejemplo, para una tendencia gradual o un salto brusco) y no
tan bien en otros lugares. Aun así, muchos cambios observados en datos reales no
necesariamente caen en una sola categoría; existen casos intermedios. Dos posibles
criterios de selección son el poder de la prueba y su eficiencia computacional. El primero
es una medida de qué tan bien detecta la prueba las tendencias: examina la probabilidad
de error (detección de tendencias falsas o falla al detectar una tendencia real). La
eficiencia computacional es de menor importancia dado el crecimiento masivo de la
potencia de la computadora, pero aún puede ser importante en los estudios de Monte Carlo
de gran computación y en análisis de múltiples sitios en grandes regiones espaciales. Hay
muchas pruebas paramétricas y no paramétricas para la detección de cambios. Algunas
pruebas paramétricas se pueden aplicar de forma no paramétrica probando los rangos o
los llamados "puntajes normales", es decir, la serie se transforma de tal manera que la
distribución marginal se vuelve normal, mientras que los rangos relativos de los valores
son Preservado. Las pruebas utilizadas en el presente estudio representan una selección
de algunas de las pruebas estadísticas más comúnmente utilizadas y se describen con más
detalle en Radziejewski et al. (2000) Estos son:
No. 1. Prueba de Mann (no paramétrica)
No. 2. Regresión lineal de puntajes normales (no paramétrica)
No. 3. Correlación de rango de Spearman (no paramétrica)
No. 4. Regresión lineal (paramétrica)
No. 5. Ajuste de salto a puntajes normales (no paramétrico)
No. 6. Ajuste de saltos de rango (no paramétrico)
No. 7. Saltar ajuste (paramétrico)
12.5 Resultados

12.5.1 Datos utilizados


Para reducir los problemas relacionados con la calidad de los datos, se utilizó un conjunto
de observaciones del flujo de los ríos de la Red de Datos Hidroclimáticos del USGS
(Slack et al., 1993). El subconjunto de las series 202 seleccionadas para las
investigaciones cumplió con los siguientes criterios: duración suficiente del registro
diario continuo (al menos 60 años), falta de influencia antropogénica significativa y
ausencia de influencia documentada sobre el hielo. Los registros del río Greenbrier en
Alderson, WV (1896-1985) y el río Mississippi en Clinton, IA (la parte 1879-1 967) han
servido de base para la serie generada artificialmente.
A menudo es necesario ejecutar pruebas usando datos agregados (generalmente anual)
para cumplir con los requisitos de prueba habituales de independencia. La suposición de
independencia no es necesaria aquí porque los niveles de significancia se determinarán
usando la asignación al azar de fase. Esto significa que es posible probar la serie diaria
completa, aprovechando al máximo los datos disponibles.

12.5.2 Resultados para las comparaciones de prueba usando series artificiales

Se han creado series contaminadas con tendencias artificiales controladas de diferente


amplitud y forma (series 2500 para cada tipo / resistencia de cambio) siguiendo el
procedimiento explicado en la Tabla 12.2. Los resultados se utilizan para comparar el
rendimiento de la prueba en la fase de asignación al azar y para evaluar cómo varía la
detección del cambio en función de la magnitud de la tendencia contaminante.
Las Figuras 12.1-12.2 ilustran qué tan bien se detecta la tendencia para la serie
contaminada con cambios en la media de la fuerza de 0.1δ a 2δ, en intervalos de 0.1δ. Los
cambios considerados son salto brusco y tendencia lineal, respectivamente. Radziejewski
et al. (1998) informan sobre los resultados de otros tipos de cambio, como línea
discontinua, salto gradual y pulso rectangular.
En caso de contaminación con una tendencia lineal (Fig. 12.1), las pruebas 1-3 se
realizaron casi idénticamente entre sí y mejor que todas las otras pruebas. La prueba
paramétrica 4 fue la siguiente mejor, pero aún así, significativamente peor, excepto en los
casos de tendencia muy fuerte. El mejor rendimiento de las pruebas 1-4 en el caso de
tendencia lineal no es sorprendente, ya que el cambio gradual monótona es lo que buscan
estas pruebas. Otro objetivo cercano es entre las pruebas 5 y 6, con la prueba 6 (salto en
los rangos) siendo marginalmente mejor. Nuevamente, estas pruebas no paramétricas
funcionaron mejor que su contraparte paramétrica (prueba 7). Las pruebas 5 y 6
permitieron la detección de cambios para los cuales no fueron diseñados, mientras que la
prueba 7 fue completamente inútil en esta situación. La característica de detectar una
amplia gama de cambios es muy importante en situaciones de la vida real, donde no
tenemos información sobre el tipo de cambios que se esperan.
Como era de esperar, para la contaminación con un salto abrupto (figura 12.2), las pruebas
5 y 6 dan los mejores resultados. Nuevamente, existe un alto grado de similitud entre las
dos pruebas, ambas significativamente mejores que la prueba 7. La prueba 7 dio mejores
resultados que las pruebas 1-4 para la serie basada en Mississippi, pero de otro modo fue
de poca utilidad. Las pruebas 1-4 exhibieron un rendimiento similar. El caso del río
Mississippi, donde la prueba paramétrica 4 funciona bien, es interesante, pero podría ser
una ocurrencia casual.
Figura 12.1. Detección de tendencia lineal en series artificiales basadas en el flujo del río
Mississippi en Clinton, IA, EE. UU.

Fig. 12.2. Detección de salto en series artificiales basadas en el flujo del río Greenbrier
en Alderson, WV, USA
12.5.3 Resultados para series de flujo natural
De las 202 series de flujo natural en estudio, 23 mostraron un aumento significativo (al
nivel del 5%) y solo 4 una disminución significativa. Las pruebas 4 y 7 apenas dieron
resultados significativos con una detección mucho mejor de los cambios que se producen
cuando se utilizan las pruebas no paramétricas.

FRECUENCIA ACUMULADA VS SIGNIFICANCIA


Fig. 12.3. Enlace entre frecuencia acumulativa e importancia para series naturales (un
subconjunto de 202 series de flujo de HCDN).

La dirección predominante de cambio es hacia un flujo creciente, esto es más claro cuando
se consideran todos los resultados (significativos y no significativos). Se puede observar
fácilmente cuando el nivel de significación se traza frente al porcentaje de la serie con el
mismo nivel o menor (figura 12.3). También se puede ver que las pruebas paramétricas
identifican menos cambios que las no paramétricas. Esto puede sugerir que los cambios
que ocurren en las series de flujo natural afectan el flujo promedio relativamente menos
que otros parámetros de la distribución a los cuales las pruebas no paramétricas son más
sensibles.
Parece que las pruebas 1-3 arrojan resultados muy similares y son particularmente
recomendables cuando se aplican mediante técnicas de aleatorización de fase para series
de datos con dependencia temporal.
Agradecimientos El presente estudio es una contribución al proyecto del Programa
Mundial sobre el Clima - Agua titulado Análisis de series largas de datos e índices
hidrológicos con respecto a la variabilidad y el cambio climático (WCP-Water Project
A.2), coordinado por la OMM. Parte de la investigación informada en el presente estudio
se llevó a cabo en el marco de una Subvención de investigación colaborativa de la OTAN.
Se agradece la posibilidad de utilizar la base de datos de la Red Hidrográfica Climática
de USGS. Gracias también a la Dra. Alice Robson por sus útiles comentarios que nos
ayudaron a mejorar esta presentación.

Referencias
Hirsch, R.M., Alexander, RB. & Smith, R.A., 1991. Selección de métodos para la
detección y estimación de tendencias en la calidad del agua. Wat. Resour. Res. 27 (5),
803-8 13.

Radziejewski, M., Bardossy, A. y Kundzewicz, Z. W., 1998. Intercomparación de


pruebas para detección de cambios en series de tiempo prolongado de flujo de río. Proc.
de la Segunda Conferencia Internacional sobre el Clima y el Agua, Espoo, Finlandia, 17-
20 de agosto de 1998, VoL 3, 1120-1129.

Radziejewski, M., Bardossy, A. y Kundzewicz, Z. W., 2000. Detección del cambio en el


flujo del río utilizando fase de aleatorización, Hydrol. Sci. J. (en impresión).

Slacic J.R, Lumb, A.M. & Maciunas Landwehr, J., 1993. Red de datos hidroclimáticos:
(HCDN) Streamfiow Data Set, 1874-1988, USGS (CD-ROM y Manual).

S-ar putea să vă placă și