Cedeo, Fernando; Guevara, Esnil; Cho, Anthony; Vega, Cristbal FACYT, Facultad de Ciencias y Tecnologa. Universidad de Carabobo, Venezuela. Email cvegas@uc.edu.ve
Resumen El propsito de este trabajo es emplear y adaptar algunas herramientas estadsticos, para luego aplicarlo a la data que se han ido recolectado a travs de los aos; dado que la recoleccin de dicha data dependen de instrumentos de medicin de cada uno de los elementos meteorolgico, stas pueden producir impurezas o hasta podra faltar datos por recolectar debido a factores como: descalibracin del instrumento, mantenimiento del aparato, otros. Para reducir estas impurezas, es necesario depurar y homogeneizar la data obtenida por medio de los instrumentos, de tal manera, poder realizar estimaciones, deteccin de anomalas, errores y adems, rellenar los datos faltantes a travs de construccin de series de referencias. Dichos procesos son facilitados del paquete estadstico CLIMATOL, el cual contiene rutinas programadas bajo el lenguaje R. Y los datos digitalizados, son almacenados en la base de datos usando el software MySQL con el fin de poder hacer consultas y obtener mejores resultados en los estudios meteorolgicos a futuras. Palabras clave: Impurezas, estimaciones, anomalas, errores, datos faltantes.
1. Introduccin El gran problema en la base de datos climatolgicos, es que las series meteorolgicas disponibles tengan inhomogeneidades y errores debidos a causas no climticas. El estudio de homogeneidad y reconstruccin de datos nos permite la identificacin y la eliminacin de inconsistencia en las series temporales climticas, que son a causa de factores no climticos, como cambio en la localizacin de la estacin, cambio en el entorno de la estacin y descalibracin de los instrumentos de la estacin. En la actualidad los ordenadores nos permiten la manipulacin de grandes cantidades de datos y se han convertido en una potente herramienta en la reconstruccin de base de datos climticos, de ah, la importancia de construccin de software que permitan la manipulacin de datos climticos y realizar estudios de homogeneidad de datos climticos. 206 En este trabajo se construir un software en el lenguaje estadstico R que permitan la manipulacin de datos climticos de una base de datos bajo MySQL e integre las herramientas del paquete de depuracin de datos climticos mensuales CLIMATOL de R.
2. CLIMATOL Es un software libre para la depuracin y homogenizacin de datos climatolgicos desarrollado por J os A. Guijarro (Guijarro 2006). El paquete hace el estudio de homogeneidad de la serie comparndola con una serie de referencia. Esta es construida a travs de varias series usando un criterio de correlacin. Una vez construida la serie de referencia se procede a compararla con la serie a la que se hace el estudio. Esta comparacin se puede realizar a travs del estudio de la serie de diferencias entre la serie de referencia y la serie que se estudia. Esta serie de diferencia debera comportarse como un ruido blanco, pudiendo considerar como inhomogeneidades a cualquier anomala. Estas anomalas pueden ser: Errores aislados, debidos a errores de lectura o trascripcin, o a errores puntuales en el Censor (estaciones automticas). Se pueden detectar como datos anmalos aislados (outliers en la terminologa inglesa). (GUIJ ARRO, 2006:495) Saltos en las series, atribuibles a cambios de instrumentacin o de las condiciones de instalacin de los aparatos. Se pueden detectar por cambios en los promedios anteriores y posteriores a los saltos (mediante pruebas de la t.). (GUIJ ARRO, 2006:495) Las series de referencia suelen obtenerse a partir de una o, ms frecuentemente, varias series de estaciones prximas o que estn bien correlacionadas con la serie del observatorio problema. En este caso, la serie de referencia se obtiene como promedio de los valores de las series de los observatorios escogidos, utilizando algn mtodo de ponderacin para dar mayor peso a las mejores correlacionada. (GUIJ ARRO, 2006:496) Para conseguir estos objetivos los pesos de cada estacin se han calculado mediante la funcin a d 2 1 1 +
207 donde d es la distancia entre la estacin problema y la de referencia, y a es un parmetro de forma (GUIJ ARRO, 2006:498). Sus valores estarn acotados en el intervalo (0,1]. Para valores de a=1 o superiores diluirn los errores de las estaciones de referencia al considerar gran nmero de ellas con pesos del mismo orden, mientras que con a=10 o inferior obtendremos estimas con mayor ajuste a la Climatologa local de la estacin problema y con poca disminucin de varianza. Una vez construidas las series de referencia (series de datos estimados para cada observatorio) por el procedimiento anterior, la homogeneidad de cada serie original se puede contrastar mediante comparacin con su serie estimada. Para ello se estudian las diferencias entre ambas series que, en el caso ideal, deberan semejarse a una serie aleatoria de distribucin normal.
3. Desarrollo del software En este trabajo hemos desarrollado un software en lenguaje R que permite la manipulacin de una base de datos climatolgicos en MySQL y la homogeneizacin de las series climatolgicas mediante CLIMATOL. Adems tiene protocolo de usuarios que evite daos a la base de datos. Para la conexin de la base de datos hemos utilizado el paquete del lenguaje R llamado RMySQL, que permite cargar datos de una base de datos en MySQL al entorno de trabajo de R. En este men principal permite escoger entre las dos principales tareas la Consulta y la grafica de datos climatolgicos.
Figura 1: Men Principal del software (Fuente: Interfaz prototipo del software) 208
El programa incluye un administrador de usuario que asegura la manipulacin de los datos climticos por usuarios registrados
Figura 2: Men de asistente de administrador de usuarios
Podemos manipular los elementos y estaciones climticos que se registran en la base de datos
Figura 3: Administrador de Estacin y Elemento
209
Figura 4: Asistente de elemento
Figura 5: registrar elemento
210
Figura 6: Asistente Estacin
Figura 7: Informacin Geogrfica de la Estacin (Fuente: Interfaz prototipo del software) 211
Figura 8: Informacin de las Observaciones de la Estacin
Figura 9: Asistente de Relacin Estacin Elemento (Fuente: Interfaz prototipo del software)
Podemos hacer consultas de datos horarios, diarios y mensuales 212
Figura 10: Consultas de datos climatolgicos
Al programa se le implementaron las rutinas de depuracin del paquete CLIMATOL (Fuente: Interfaz prototipo del software)
Figura 11: homogeneizacin de datos mensuales
Adems de algunas rutinas graficas 213
Figura 12: Rosa de los vientos y Diagrama de Walter Lieth
4. Consideraciones Finales Este trabajo permite a los usuarios hacer un estudio de homogeneizacin a series mensuales, esperamos en un futuro ir incorporando con el tiempo nuevos modelos que permitan el estudio de series climatolgicas sobre los datos diarios y anuales. Adems, el uso de nuevos criterios de correlacin para la construccin de series de referencia y nuevas funciones visuales, los cuales son de mucha utilidad al momento de realizar algn tipo de anlisis meteorolgicos.
5. Bibliografa Citada GUIJ ARRO PASTOR, J os A. (2006), CLIMATOL: SOFTWARE LIBRE PARA LA DEPURACION Y HOMOGENEIZACION DE DATOS CLIMATOLOGICOS, Instituto Nacional de Meteorologa, Centro Meteorolgico en Illes Balears.