Sunteți pe pagina 1din 10

205

Homogeneizacin de los datos climatolgicos


de la base area con R y MySQL

Cedeo, Fernando; Guevara, Esnil; Cho, Anthony; Vega, Cristbal
FACYT, Facultad de Ciencias y Tecnologa. Universidad de Carabobo,
Venezuela. Email cvegas@uc.edu.ve

Resumen
El propsito de este trabajo es emplear y adaptar algunas
herramientas estadsticos, para luego aplicarlo a la data que se han ido
recolectado a travs de los aos; dado que la recoleccin de dicha data
dependen de instrumentos de medicin de cada uno de los elementos
meteorolgico, stas pueden producir impurezas o hasta podra faltar datos
por recolectar debido a factores como: descalibracin del instrumento,
mantenimiento del aparato, otros. Para reducir estas impurezas, es necesario
depurar y homogeneizar la data obtenida por medio de los instrumentos, de tal
manera, poder realizar estimaciones, deteccin de anomalas, errores y
adems, rellenar los datos faltantes a travs de construccin de series de
referencias. Dichos procesos son facilitados del paquete estadstico
CLIMATOL, el cual contiene rutinas programadas bajo el lenguaje R. Y los
datos digitalizados, son almacenados en la base de datos usando el software
MySQL con el fin de poder hacer consultas y obtener mejores resultados en
los estudios meteorolgicos a futuras.
Palabras clave: Impurezas, estimaciones, anomalas, errores, datos faltantes.

1. Introduccin
El gran problema en la base de datos climatolgicos, es que las
series meteorolgicas disponibles tengan inhomogeneidades y errores
debidos a causas no climticas.
El estudio de homogeneidad y reconstruccin de datos nos
permite la identificacin y la eliminacin de inconsistencia en las series
temporales climticas, que son a causa de factores no climticos, como
cambio en la localizacin de la estacin, cambio en el entorno de la
estacin y descalibracin de los instrumentos de la estacin.
En la actualidad los ordenadores nos permiten la manipulacin
de grandes cantidades de datos y se han convertido en una potente
herramienta en la reconstruccin de base de datos climticos, de ah, la
importancia de construccin de software que permitan la manipulacin
de datos climticos y realizar estudios de homogeneidad de datos
climticos.
206
En este trabajo se construir un software en el lenguaje
estadstico R que permitan la manipulacin de datos climticos de una
base de datos bajo MySQL e integre las herramientas del paquete de
depuracin de datos climticos mensuales CLIMATOL de R.

2. CLIMATOL
Es un software libre para la depuracin y homogenizacin de
datos climatolgicos desarrollado por J os A. Guijarro (Guijarro 2006).
El paquete hace el estudio de homogeneidad de la serie comparndola
con una serie de referencia. Esta es construida a travs de varias
series usando un criterio de correlacin.
Una vez construida la serie de referencia se procede a
compararla con la serie a la que se hace el estudio. Esta comparacin
se puede realizar a travs del estudio de la serie de diferencias entre la
serie de referencia y la serie que se estudia.
Esta serie de diferencia debera comportarse como un ruido
blanco, pudiendo considerar como inhomogeneidades a cualquier
anomala. Estas anomalas pueden ser:
Errores aislados, debidos a errores de lectura o trascripcin, o a
errores puntuales en el Censor (estaciones automticas). Se
pueden detectar como datos anmalos aislados (outliers en la
terminologa inglesa). (GUIJ ARRO, 2006:495)
Saltos en las series, atribuibles a cambios de instrumentacin o
de las condiciones de instalacin de los aparatos. Se pueden
detectar por cambios en los promedios anteriores y posteriores
a los saltos (mediante pruebas de la t.). (GUIJ ARRO, 2006:495)
Las series de referencia suelen obtenerse a partir de una o, ms
frecuentemente, varias series de estaciones prximas o que estn bien
correlacionadas con la serie del observatorio problema. En este caso,
la serie de referencia se obtiene como promedio de los valores de las
series de los observatorios escogidos, utilizando algn mtodo de
ponderacin para dar mayor peso a las mejores correlacionada.
(GUIJ ARRO, 2006:496)
Para conseguir estos objetivos los pesos de cada estacin se
han calculado mediante la funcin
a
d
2
1
1
+

207
donde d es la distancia entre la estacin problema y la de referencia, y
a es un parmetro de forma (GUIJ ARRO, 2006:498). Sus valores
estarn acotados en el intervalo (0,1]. Para valores de a=1 o superiores
diluirn los errores de las estaciones de referencia al considerar gran
nmero de ellas con pesos del mismo orden, mientras que con a=10 o
inferior obtendremos estimas con mayor ajuste a la Climatologa local
de la estacin problema y con poca disminucin de varianza.
Una vez construidas las series de referencia (series de datos
estimados para cada observatorio) por el procedimiento anterior, la
homogeneidad de cada serie original se puede contrastar mediante
comparacin con su serie estimada. Para ello se estudian las
diferencias entre ambas series que, en el caso ideal, deberan
semejarse a una serie aleatoria de distribucin normal.

3. Desarrollo del software
En este trabajo hemos desarrollado un software en lenguaje R
que permite la manipulacin de una base de datos climatolgicos en
MySQL y la homogeneizacin de las series climatolgicas mediante
CLIMATOL. Adems tiene protocolo de usuarios que evite daos a la
base de datos.
Para la conexin de la base de datos hemos utilizado el paquete
del lenguaje R llamado RMySQL, que permite cargar datos de una
base de datos en MySQL al entorno de trabajo de R.
En este men principal permite escoger entre las dos principales
tareas la Consulta y la grafica de datos climatolgicos.


Figura 1: Men Principal del software
(Fuente: Interfaz prototipo del software)
208

El programa incluye un administrador de usuario que asegura la
manipulacin de los datos climticos por usuarios registrados


Figura 2: Men de asistente de administrador de usuarios

Podemos manipular los elementos y estaciones climticos que
se registran en la base de datos


Figura 3: Administrador de Estacin y Elemento

209

Figura 4: Asistente de elemento


Figura 5: registrar elemento

210

Figura 6: Asistente Estacin


Figura 7: Informacin Geogrfica de la Estacin
(Fuente: Interfaz prototipo del software)
211


Figura 8: Informacin de las Observaciones de la Estacin


Figura 9: Asistente de Relacin Estacin Elemento
(Fuente: Interfaz prototipo del software)

Podemos hacer consultas de datos horarios, diarios y
mensuales
212

Figura 10: Consultas de datos climatolgicos

Al programa se le implementaron las rutinas de depuracin del
paquete CLIMATOL (Fuente: Interfaz prototipo del software)


Figura 11: homogeneizacin de datos mensuales

Adems de algunas rutinas graficas
213

Figura 12: Rosa de los vientos y Diagrama de Walter Lieth


4. Consideraciones Finales
Este trabajo permite a los usuarios hacer un estudio de
homogeneizacin a series mensuales, esperamos en un futuro ir
incorporando con el tiempo nuevos modelos que permitan el estudio de
series climatolgicas sobre los datos diarios y anuales. Adems, el uso
de nuevos criterios de correlacin para la construccin de series de
referencia y nuevas funciones visuales, los cuales son de mucha
utilidad al momento de realizar algn tipo de anlisis meteorolgicos.

5. Bibliografa Citada
GUIJ ARRO PASTOR, J os A. (2006), CLIMATOL: SOFTWARE LIBRE PARA
LA DEPURACION Y HOMOGENEIZACION DE DATOS
CLIMATOLOGICOS, Instituto Nacional de Meteorologa, Centro
Meteorolgico en Illes Balears.

214

S-ar putea să vă placă și