Documente Academic
Documente Profesional
Documente Cultură
Resumen
Este trabajo consiste en evaluación de la aplicabilidad de distintos métodos para la estimación
de datos faltantes de precipitación, en cuatro estaciones pluviométricas de la Región de Pasco,
Perú. Estos métodos corresponden a correlación lineal, completación por razones de distancia,
completación por promedios vecinales, completación por correlación con estaciones vecinas y
completación por regresiones múltiples. Los métodos se analizan a través del coeficiente de
determinación (R²), error estándar de estimación (EEE), test de concordancia de Bland y
Altman y análisis de varianza, con los que se determina que método presenta mejor ajuste para
la región. Según el análisis de Bland y Altman, el mejor método de completación fue el de
regresión múltiple con 2 y 3 estaciones cercanas, lo que además se corrobora con los valores
obtenidos del R² y el EEE.
Palabras clave: completación de datos faltantes, estimación de datos faltantes métodos de
completación de datos faltantes de precipitación.
Abstract
This study evaluates the applicability of different methods for the estimation of rainfall
missing values, through four raingauge stations in Maule Region of Pasco. These methods
were linear correlation, distance rate, local averages, correlation with nearly stations and
multiple regressions, these methods were analyzed through different statistical methods; these
were determination coefficient (R²), standard error of estimation (EEE), test of agreement of
EVALUACIÓN DE MÉTODOS PARA LA COMPLETACIÓN DE DATOS FALTANTES DE PRECIPITACIÓN
Bland and Altman and analysis of variance, in order to define the best goodness of fit method.
According to the analysis of Bland and Altman, the best method of completing missing rain
value, was multiple regression with 2 and 3 nearly stations. This result is also validated by R²
values, and also validated by standard error of estimation.
Keywords: Rainfall missing value; rainfall data base; rainfall estimation.
INTRODUCCIÓN
En la mayoría de los estudios relacionados con hidrología y en investigaciones de los recursos
naturales o relacionados con el medio ambiente, el punto de partida es la estimación de las
precipitaciones (Tapiador et al., 2003). Por ello, conocer el comportamiento y la forma de
evaluación que tiene la precipitación es de gran importancia (Aparicio, 2003).
En la estimación de la precipitación, cuando hay carencia de datos, existen diversos métodos
que van desde avanzadas tecnologías como el uso de satélites, programas estadísticos y
modelaciones hidrológicas (Smith, et al., 1997), que por su elevado costo, no son de masiva
utilización, hasta los métodos tradicionales, que son más factibles de utilizar, estos últimos, se
basan en fórmulas matemáticas simples, en donde se establecen relaciones entre estaciones
patrones o cercanas (con datos completos) y la estación con carencia de información
pluviométrica. En este contexto, el presente trabajo compara cinco métodos de completación
de datos para la estimación de la precipitación, cuando hay carencia de información en
distintas estaciones pluviométricas de la Región del Pasco, Perú, con el fin de evaluar la
calidad de la predicción de dichos métodos, para su posterior recomendación.
AREA DE ESTUDIO
La zona de trabajo es la cuenca Huancabamba, que está ubicada en la Provincia de Oxapampa,
Región de Pasco, a una altura de 1,814 msnm, a 10°35'25" de latitud sur y 75°23'55" de
longitud oeste. Las precipitaciones se concentran en los meses de setiembre y abril, donde
precipita entre un 75% a 80% del total anual; entre mayo y agosto ocurre la estación seca, que
se prolonga entre 4 y 5 meses
EVALUACIÓN DE MÉTODOS PARA LA COMPLETACIÓN DE DATOS FALTANTES DE PRECIPITACIÓN
Estaciones
Lechecocha
Jaico
DATOS Y METODOS
Los datos requeridos para la aplicación de los métodos de completación de datos faltantes,
corresponden a los valores de precipitación mensual de las cuatro estaciones (Tabla 1)
consideradas para el estudio y para un período de 16 años (1965–1980), con un total de 192
datos mensuales por estación. Con esta información se hizo una selección aleatoria del 25% de
los datos por estación, los que fueron considerados como faltantes (Tabla 2), con el fin de
generar vacíos de información, para posteriormente establecer las comparaciones entre las
precipitaciones reales y las estimadas. Se debe señalar que para poder utilizar de forma
comparativa los métodos, se estableció que los meses en los cuales se eliminó la información,
debían ser los mismos en cada estación. Una vez establecidos los vacíos de información
mensual, los datos que se extrajeron se consideraron como la precipitación real, que fue la
base para establecer las comparaciones entre los distintos métodos.
Estacion con datos Estaciones utilizadas (X), para la estimacion de la precitacion (Y)
faltantes (Y) 1ª estación más cercana 2ª estación más cercana 3ª estación más cercana
Lechecocha Jaico Huangush bajo La Victoria II
Jaico Lechecocha Huangush bajo La Victoria II
Huangush bajo Lechecocha Jaico La Victoria II
La Victoria II Jaico Huangush bajo Lechecocha
Para la aplicación del método de completación por correlación con estaciones vecinas, se
utilizaron las estimaciones hechas con la completación por regresión lineal y sus respectivos
coeficientes de correlación (R), para cada una de las estaciones. Las correlaciones con
estaciones vecinas se realizaron en dos escenarios; el primero, con dos estaciones y, el
segundo, con tres estaciones, con el fin de establecer si el número de estaciones incluidas en la
estimación, tiene relación con la calidad de ésta (Tabla 5).
EVALUACIÓN DE MÉTODOS PARA LA COMPLETACIÓN DE DATOS FALTANTES DE PRECIPITACIÓN
Tabla 5. Esquema para la aplicación del método de correlación con estaciones vecinas.
Estacion con datos Estaciones utilizadas (X), para la estimacion de la precitacion (Y)
faltantes (Y) 1ª estación más cercana 2ª estación más cercana 3ª estación más cercana
Lechecocha Jaico Huangush bajo La Victoria II
Jaico Lechecocha Huangush bajo La Victoria II
Huangush bajo Lechecocha Jaico La Victoria II
La Victoria II Jaico Huangush bajo Lechecocha
Una vez obtenida la información faltante, se hizo una comparación entre los valores reales y
los valores estimados a través de los diversos métodos de completación. Así, se analizaron los
resultados generados por cada uno, comparándolos entre sí para detectar diferencias
estadísticamente significativas entre ellos.
Para detectar estas diferencias, se aplicaron las siguientes medidas de bondad de ajuste: el
coeficiente de determinación (R²), que expresa el porcentaje de la variación total de las
precipitaciones reales, que son explicadas por el método de completación; el error estándar de
estimación (EEE), que permite calcular la disparidad promedio entre los valores reales de
precipitación y los estimados, en donde los valores cercanos a cero indican la buena
descripción de la precipitación (Caro, 2001); el test de concordancia de Bland y Altman
(ACBA), se basa en las diferencias promedio existentes entre el valor real y el estimado, y la
comparación de las gráficas residuales, la ecuación de test de concordancia esta dado por:
LC = dp ± 1.96* SD (1)
Donde LC es límite de concordancia; dp es diferencias promedio y SD es la desviación
estándar.
RESULTADOS
En el Tabla 8 se entregan los valores del coeficiente de determinación (R²) y el error estándar
de estimación (EEE) para cada estación, según el método aplicado.
Se observo que las mayores diferencias se presentan para la estación La Victoria II con
errores superiores a 40 mm para todos los métodos. Por otro lado el error más bajo se obtuvo
en las estaciones Lechecocha y Jaico con 10.39 mm y 10.72 mm respectivamente, y con un
coeficiente de determinación (R2) de 0.981 y 0.982, en general en estas estaciones se
presentaron bajos errores y elevados coeficientes de determinación, los que fueron superiores
a 0.80.
En la Tabla 9, Se observa el comportamiento de los efectos entre las medias de cada método.
El resultado de esta prueba entrego que existen 2 estaciones Jaico y La Victoria II, que
manifiestan diferencias entre los distintos métodos utilizados, con un valor P muy bajo inferior
a 0.05.
Para determinar que método fue el que estimo mejor los valores reales de precipitación media,
se aplico el test de concordancia Bland y Altman (ACBA), para cada estación en particular. En
la Fig. 2, se presenta el grafico de las diferencias promedio entre los métodos utilizados para
cada estación.
EVALUACIÓN DE MÉTODOS PARA LA COMPLETACIÓN DE DATOS FALTANTES DE PRECIPITACIÓN
Fig. 2. Diferencias promedio del test de concordancia de Bland y Altman, estación Jaico
Tabla 10. Valores de test de concordancia para cada método de completación, para la estación
Jaico.
En la Tabla 10, muestra qué en la estación Jaico, el Método de Regresión Múltiple con 3
estaciones es el que más se acerca a los valores reales, con una diferencia de promedio de
22.72 mm, seguido del Método Razones de Distancias con 24.38 mm, y el método de
Correlación Lineal 3ra estación más cercana es el que tiene el valor más alto con 155.90 mm.
EVALUACIÓN DE MÉTODOS PARA LA COMPLETACIÓN DE DATOS FALTANTES DE PRECIPITACIÓN
Tabla 11. Valores de test de concordancia para cada método de completación, para la estación
Lechecocha.
En la Tabla 11. muestra qué en la estación Lechecocha, el Método de Regresión Múltiple con
3 estaciones es el que más se acerca a los valores reales con una diferencia de promedio de
23.19 mm, seguido del Método Correlación Lineal 1ra estación más cercana con 24.83 mm y
el método de Correlación Lineal 3ra estación más cercana es el que tiene el valor más alto
con 162.80 mm.
EVALUACIÓN DE MÉTODOS PARA LA COMPLETACIÓN DE DATOS FALTANTES DE PRECIPITACIÓN
Fig. 4. Diferencias promedio del test de concordancia de Bland y Altman, estación Huangush
Tabla 12. Valores de test de concordancia para cada método de completación, para la estación
Huangush.
En la Tabla 12. muestra qué en la estación Huangush, el Método de Regresión Múltiple con 3
estaciones es el que más se acerca a los valores reales con una diferencia de promedio de
81.87 mm, y el método de Correlación Lineal 3ra estación más cercana es el que tiene el
valor más alto con 234.91 mm.
EVALUACIÓN DE MÉTODOS PARA LA COMPLETACIÓN DE DATOS FALTANTES DE PRECIPITACIÓN
Tabla 13. Valores de test de concordancia para cada método de completación, para la estación
La Victoria II.
En la Tabla 13. muestra qué en la estación La Victoria II, el Método de Regresión Múltiple
con 3 estaciones es el que más se acerca a los valores reales con una diferencia de promedio de
75.32 mm, y el método de Correlación Lineal 3ra estación más cercana es el que tiene el
valor más alto con 272.23 mm.
EVALUACIÓN DE MÉTODOS PARA LA COMPLETACIÓN DE DATOS FALTANTES DE PRECIPITACIÓN
En base a los resultados de test de concordancia de Bland y Altman, se asigno puntajes a cada
uno de ellos. Este puntaje varía en función de cuantas veces un método se ubico entre la
primera, segunda o tercera posición de calidad (Tabla 14). Así, cada una de estas posiciones
fue valorada con un punto. De este modo, se pudo observar claramente que el método que
obtuvo mayor puntaje, fue el método de regresiones múltiples, con 3 estaciones
respectivamente.
Tabla 14. Estadística de los métodos de completación de datos, que fueron elegidos como el
mejor estimador, por los distintos métodos de análisis.
Metodos Puntaje
Regresión Multiple con 3 estaciones 7
Razones de Distancias 7
Correlacion Lineal (1ra estación más cercana) 4.5
Correlacion de Estaciones Vecinas (3 Estaciones) 4
Correlacion de Estaciones Vecinas (2 Estaciones) 4
Correlacion Lineal (2da estación más cercana) 2
Correlacion Lineal (3ra estación más cercana) 1.25
Promedios Vecinales 1.25
CONCLUSIONES
Sobre la base de los análisis desarrollados y considerando los objetivos planteados para el
estudio, se concluye que para la completación de datos faltantes en la Cuenca de
Huancabamba, el método que obtuvo mejores resultados, fue regresión múltiple con 3
estaciones.
Con respecto al método de correlación lineal, este es el más utilizado, por su fácil aplicación,
dado que no requiere mucha información, sin embargo a pesar de ser el más utilizado y
recomendado, en la práctica para las estaciones utilizadas, no obtuvo los mejores resultados.
La principal limitación de aplicación del método de promedios vecinales, es la distribución
espacial triangular que deben cumplir las estaciones, las cuales no fue posible estimar los
datos faltantes además sus resultados fueron deficientes.
En relación al método de correlación con estaciones vecinas, este generalmente se utiliza
cuando los coeficientes determinación del método de regresión lineal no supera +/- 0.8, sin
embargo para este estudio, se decidió probar que sucedía inclusive obteniendo buenos
EVALUACIÓN DE MÉTODOS PARA LA COMPLETACIÓN DE DATOS FALTANTES DE PRECIPITACIÓN
coeficientes de correlación entre las estaciones, de este modo los resultados obtenidos fueron
muy favorables, ya que en 3 estaciones se ubico dentro de los tres mejores estimadores.
En relación al coeficiente de determinación (R2), para este estudio es un buen indicador ya
que se relaciona con el error estándar de estimación (EEE), como es el caso de la estación La
Victoria II, que tiene un R2 de 0.578 y un EEE 74.004 ambos los más altos de todos los
métodos.
Finalmente se recomienda la aplicación del método de regresión múltiple con 3 estaciones,
para la completación de datos faltantes, especialmente porque los error estándar de estimación
son bajos, comparados con otros métodos.
AGRADECIMIENTOS
El autor agradece al Servicio Nacional de Meteorología e Hidrología del Perú (SENAMHI),
institución que facilito la información pluviométrica de la Región de Pasco, Perú.
REFERENCIAS
Aparicio, F (2003). Fundamentos de hidrología de superficie. México: Editorial Limusa S.A.
2003, 303 pp.
Caro, J. (2001). Modelación de caudales recesivos para la Cuenca del Rio Purapel, Estación
Nirivilo. Tesis de Pregrado. Talca: Universidad de Talca. 113 PP.
Pizarro T. R. et al. (2001). Evaluación de Métodos Hidrológicos para la Completación de
Datos Faltantes de Precipitación en estaciones pluviográficas de la VII Región del Maule,
Chile. Universidad de Talca, Facultad de Ciencias Forestales, Departamento de Gestión
forestales y Ambiental, Avenida Lircay s/n, Talca.
Smith, D.; D. Kniveton, E. Barrett (1997). Statistical modeling approach to passive
microwave rainfall retrieval. Journal of Applied Meteorology: Vol. 37, No. 2, 1997. 135-154
PP.
Tapiador, F.; C. Kidd, (2003). A neural networks-based fusion technique to estímate half-
hourly rainfall estimates at 0.1° resolution from satellite passive microwave and infrared data.
Journal of Applied Meteorology: Vol. 43, No. 4, 2003, 576-594 p.
EVALUACIÓN DE MÉTODOS PARA LA COMPLETACIÓN DE DATOS FALTANTES DE PRECIPITACIÓN