Sunteți pe pagina 1din 8

APLICACIN DEL MODELO PERCEPTRN MULTICAPA PARA EL PRONSTICO DE INUNDACIONES POR PENETRACIONES DEL MAR EN LA COSTA NORTE OCCIDENTAL

DE CUBA
Lic. Dahiana Torres Pablos Centro de Meteorologa Marina. Instituto de Meteorologa, Carretera del Asilo s/n. Loma de Casablanca, Regla, Ciudad de La Habana, Cuba, Telf.: 868-6519, E-mail: dahiana.torres@insmet.cu

RESUMEN
Las inundaciones por penetraciones del mar en la costa Norte de la regin occidental de Cuba, son producidas por reas formadoras de oleaje asociados a fenmenos meteorolgicos peligrosos que transitan por el Golfo de Mxico como bajas extratropicales, frentes fros y huracanes. Dada una situacin meteorolgica peligrosa para esta rea, se quiere predecir si se producirn o no inundaciones costeras por penetraciones del mar, a partir del anlisis de los datos de los fenmenos meteorolgicos anteriores, teniendo en cuenta el conjunto de valores de presin para la rejilla que abarca el Golfo de Mxico. En la presente investigacin se aplic el modelo de Redes Neuronales Artificiales con aprendizaje supervisado: Perceptrn Multicapa, el cual establece una clasificacin para la situacin meteorolgica de pronstico actual asociado a bajas extratropicales y frentes fros, empleando como herramienta la plataforma Weka. Se comprob la efectividad de esta red para el pronstico de inundaciones costeras por penetraciones del mar, determinando los valores del conjunto de parmetros correspondientes a este modelo. Palabras clave: inundaciones costeras, pronstico, clasificacin, Perceptrn Multicapa.

APPLICATION OF MULTILAYER PERCEPTRONS MODEL FOR FLOOD FORECASTING BY SEA PENETRATIONS ON THE NORTHWEST COAST OF CUBA ABSTRACT
Flooding by sea penetrations in the northern coast of western Cuba, are produced by waves forming areas associated with dangerous weather phenomenon transiting the Gulf of Mexico, as an extratropical low, cold fronts and hurricanes. Given a dangerous weather situation for this area, we want to predict whether or not there will be coastal flooding by sea penetrations, from analysis of data from past weather events, taking into account all pressure values for the grid covers the Gulf of Mexico. In the present study applied the model of Artificial Neural Networks with Supervised Learning: Multilayer Perceptron, which provides a classification for the current forecast weather conditions associated with extratropical low and cold fronts, using as a tool Weka platform. It proved the effectiveness of this network for the prediction of coastal flooding by sea penetrations, determining the values of all parameters of this model. Key words: Flooding by sea penetrations, forecast, classification, Multilayer Perceptrn.

INTRODUCCIN
Uno de los objetivos propuestos por el Centro de Meteorologa Marina (CMM), es la realizacin diaria de un pronstico meteorolgico marino el cual cubre las aguas territoriales del pas y mares adyacentes. El personal de este centro utilizar estas observaciones ntegramente para facilitar un servicio meteorolgico adecuado a todas las formas de actividades marinas. (Hernndez, 2007) Las inundaciones costeras por penetraciones del mar es uno de los fenmenos ms peligrosos de la naturaleza. En la dcada de los aos 80 del siglo pasado, comienzan a emplearse en Cuba las primeras tcnicas para su pronstico, (Hernndez, 2007) que se basaban en la solucin de relaciones empricas que relacionaban la velocidad, alcance y persistencia del viento con las caractersticas de las olas. A partir de la solucin de estas relaciones se obtuvieron resultados importantes acerca del comportamiento del estado del mar en presencia de condiciones meteorolgicas extremas. Para pronosticar especficamente las inundaciones costeras por penetraciones del mar, solo se ha empleado el mtodo de anlogos, que se basa en la comparacin de situaciones meteorolgicas producidas con anterioridad con la situacin de pronstico actual, en la que resulta difcil la memorizacin de todas las situaciones sinpticas ocurridas. De esta forma se podr predecir la ocurrencia o no de inundacin costera por penetraciones del mar en un sector de inters. Para mejorar las tcnicas tradicionales de pronstico de inundaciones se ha propuesto la aplicacin de las Redes Neuronales Artificiales (RNA) como modelos entrenados para realizar conexiones entre los valores pasados y presentes, aprendiendo de su error de pronstico, y extraer estructuras y relaciones escondidas que gobiernan el sistema de informacin (Jalil, 2006), a su vez que se almacena esta clasificacin. Estas redes han tenido una mayor atencin en las recientes investigaciones para la realizacin de los pronsticos marinos. (Organ, 2004) Se emple el modelo Perceptrn Multicapa (MLP) como una RNA clasificadora para realizar el pronstico de inundaciones costeras por penetraciones del mar en la costa norte de la regin occidental de Cuba, determinando la clasificacin de las situaciones meteorolgicas de pronstico actual.

MATERIALES Y MTODOS
Empleo del mtodo de anlogos para predecir la ocurrencia de inundaciones costeras por penetraciones del mar
Para realizar el pronstico de inundaciones costeras por penetraciones del mar (Petterssen, 1941) se emplea el mtodo de anlogos. Mediante este mtodo se examina el escenario del pronstico actual (comportamiento de las variables meteorolgicas), y se compara con algn escenario meteorolgico pasado muy similar, es decir, un anlogo. Para utilizar este mtodo es necesario tener en cuenta todos los fenmenos meteorolgicos que provocaron las inundaciones costeras por penetraciones del mar en el tramo costero Punta Gobernadora Punta Hicacos. La complejidad de este mtodo deviene en que es implcitamente imposible encontrar un anlogo perfecto, (Petterssen, 1941) ya que todas las variables del tiempo raramente se repiten donde ellas fueron observadas

anteriormente. Por esta razn, los datos obtenidos de las situaciones meteorolgicas anteriores se basaron en la configuracin brica de la rejilla que abarca las longitudes de 98-70 grados oeste y las latitudes 35-17 grados norte.

El Perceptrn Multicapa como modelo clasificador


La clasificacin incluye un amplio desarrollo de los enfoques tericos de decisin. Dado un nmero discreto de clases que pueden ser mutuamente excluyentes, el objetivo es determinar la pertenencia de un ejemplo de entrada a una de las clases. Si la respuesta se encuentra representada por variables nominales, esto indica un problema de clasificacin, donde los valores nominales corresponden a las diferentes clases. (Slobodan, 2002) Una herramienta empleada actualmente para la clasificacin son las RNA, las cuales se ha demostrado que pueden comportarse, al menos, igual que los mtodos estadsticos tradicionales de pronstico. (Organ, 2004) El Perceptrn Multicapa tienen como objetivo la categorizacin o clasificacin de forma supervisada de los datos, siendo una de las redes ms utilizadas para la clasificacin. (Couchman, 2003) Para el presente estudio se ha utilizado esta red aplicado a la clasificacin binaria. Utilizando el algoritmo de aprendizaje supervisado Backpropagation, la red aprende la relacin entre los ejemplos de entrada, valores de presin de la rejilla, y su correspondiente clase, definida por si produjo o no inundacin costera (fase de entrenamiento), para luego poder categorizar un ejemplo de entrada del cual se desconoce su salida (fase de aprendizaje). Para el estudio se tomaron 19 muestras de frentes fros y 10 muestras de bajas extratropicales, en un perodo que abarca desde 1977-2001. (Tabla 1. Torres, 2008) Se excepta del mismo los fenmenos de huracanes. Los ejemplos que no provocaron inundacin costera por penetraciones del mar, se seleccionaron por su similitud a los que pertenecen a la otra clase. Para esta clase se cuenta con 10 situaciones meteorolgicas. (Tabla 2. Torres, 2008) Para la clasificacin se requiere de la seleccin de parmetros sensibles a la seleccin segn el problema a resolver, por esta razn se consideran diferentes vectores de valores iniciales, seleccionando aquel que converja al mnimo valor de la funcin objetivo. (Jalil, 2006) Estos parmetros son: cantidad de capas, cantidad de neuronas en cada capa, cantidad de pocas, valor de la velocidad de aprendizaje, valor del momentum, utilizacin de la degradacin de la velocidad de aprendizaje (decay learning).

La herramienta Weka
Para realizar la clasificacin de las inundaciones costeras por penetraciones del mar se emple la herramienta Weka. Es un conjunto de libreras implementadas en Java para la extraccin de conocimientos desde bases de datos (licencia GPL). (Hernndez, 2006) Incluye diferentes caractersticas que pueden ser aplicadas sobre los datos, como herramientas para minera de datos, manipulacin y visualizacin de los mismos, entre otras. (Salas, 2002) Para confeccionar el archivo de datos de entrada que requiere esta herramienta, se ha realizado la implementacin de funciones que permiten automatizar el proceso de obtencin de los datos de presin a partir del archivo GRIB, insertando en este fichero los valores procesados y su clase asociada.

RESULTADOS
Una vez elegido el MLP en la herramienta Weka para la clasificacin de los datos y los parmetros que intervienen en esta red, antes de realizar la fase de entrenamiento, se escoger el mtodo utilizado para la evaluacin de este algoritmo. Los mtodos escogidos para el estudio son: uso del conjunto de entrenamiento (Using training set) , (Garca, 2006) validacin cruzada (Cross- validation), (Garca, 2006) porcentaje dividido (Percentage Split) . (Hernndez, 2006) Cuando se realiza la evaluacin de los datos segn el mtodo de evaluacin escogido se presentan los siguientes datos estadsticos: (Villena, 2003) instancias bien clasificadas (Bien %), instancias mal clasificadas (Mal %), estadsticas Kappa (Ks), error medio absoluto (Mae), raz del error cuadrtico medio (Rmse), error relativo (Rae %), raz del error cuadrtico relativo (Rrse %). A continuacin (Tabla 1) se muestran todos los resultados obtenidos de las pruebas realizadas con los tres mtodos de evaluacin sobre la misma arquitectura: tres capas, con 96 neuronas en la capa de entrada correspondientes a los atributos, 50 neuronas en la capa oculta y dos neuronas en la capa de salida correspondiente a las dos clases.

Tabla 1. Tablas de pruebas por mtodos de evaluacin. A) Using training set. B) Cross- Validation. C) Percentage split A N 1 2 3 4 5 6 7 8 9 10 Parmetros de la red MLP dL False False False False False False False False False False Lr 0.5 0.5 0.8 0.8 0.9 0.9 0.9 0.9 0.3 0.9 M 0.4 0.2 0.4 0.6 0.6 0.9 0.8 0.8 0.1 0.1 Na True True True True True True True True True True E 500 500 500 500 500 500 500 1000 1000 1000 Medidas de evaluacin del algoritmo de aprendizaje Bien 37 37 37 37 37 29 37 37 37 37 Mal 0 0 0 0 0 8 0 0 0 0 Ks 1 1 1 1 1 0 1 1 1 1 Mae 0.004 0.004 0.003 0.002 0.002 0.21 0.009 0.001 0.004 0.002 Rmse 0.008 0.009 0.006 0.005 0.004 0.46 0.003 0.002 0.009 0.004 Rae 1.25 1.40 0.96 0.77 0.72 62.27 0.55 0.38 1.35 0.74 Rrse 0.97 2.25 1.52 1.23 1.14 112.8 0.93 0.64 2.18 1.18 CI 37 37 37 37 37 37 37 37 37 37

B N 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Parmetros de la red MLP dL False True True False False False False False False False False False False False Lr 0.3 0.3 0.3 0.3 0.3 0.5 0.3 0.5 0.1 0.5 0.5 0.5 0.5 0.8 M 0.2 0.2 0.2 0.2 0.2 0.2 0.5 0.5 0.5 0 0.1 0.3 0.4 0.4 Na True True True True False True True True True True True True True True E 500 500 1000 1000 500 500 500 500 500 500 500 500 500 500

Medidas de evaluacin del algoritmo de aprendizaje Bien 33 29 28 33 29 33 33 32 33 33 33 33 33 32 Mal 4 8 9 4 8 4 4 5 4 4 4 4 4 5 Ks 0.70 0 -.05 0.70 0 0.70 0.70 0.61 0.70 0.70 0.70 0.70 0.70 0.61 Mae 0.13 0.33 0.33 0.13 0.30 0.13 0.13 0.13 0.13 0.13 0.13 0.13 0.13 0.13 Rmse 0.31 0.39 0.39 0.31 0.42 0.31 0.31 0.31 0.31 0.31 0.31 0.31 0.31 0.32 Rae 38.13 95.58 94.96 37.72 86.97 37.64 37.36 37.40 38.38 37.82 37.78 37.48 37.30 38.45 Rrse 76.99 96.19 95.54 77.27 102.1 77.11 76.68 77.23 76.20 77.11 77.14 77.02 77.05 78.53 CI 37 37 37 37 37 37 37 37 37 37 37 37 37 37

C N 1 2 3 4 5 6 7 8 9 10

Parmetros de la red MLP dL False False True False False False False False False False Lr 0.9 0.3 0.5 0.9 0.9 1.0 1.0 0.9 0.2 0.8 M 0.8 0.2 0.3 0.9 0.3 0.9 1.0 0.9 0.1 0.9 Na True True True True True True True True True True E 1000 1000 1000 1000 1000 1000 1000 500 1000 1000

Medidas de evaluacin del algoritmo de aprendizaje Bien 7 7 7 8 6 8 8 error 7 8 1 0 0 1 0.16 0 0.36 0 56.99 0.0004 127.33 0.0004 Mal 1 1 1 0 2 0 0 Ks 0 0 0 1 0 1 1 Mae 0.15 0.17 0.19 0 0.19 0 0 Rmse 0.36 0.37 0.26 0 0.39 0 0 Rae 52.17 58.61 65.99 0 65.68 0 0 Rrse 124.1 128.95 92.86 0 137.4 0 0 CI 8 8 8 8 8 8 8 8 8 8

Aunque los valores de los parmetros LearningRate y momentum, en la mayora de los casos donde se ha aplicado este algoritmo de aprendizaje, se estiman entre 0,2-0,4; es importante sealar que para algunas pruebas satisfactorias, estos parmetros alcanzaron valores de 0,8-1 para el LearningRate y para el momentum de 0,6-1.

DISCUSIN
Segn los resultados de estas pruebas se concluy que: Utilizando el mtodo de evaluacin Using training set, se valid sobre las 37 muestras. El valor promedio obtenido fue de 36,2 instancias bien clasificadas del total de muestras, clasificndose incorrectamente como promedio 0,8. Se realiza con un valor promedio del LearningRate de 0,7, logrndose un error ms pequeo con el valor 0,9, el valor promedio del momentum es de 0,49. En todas las pruebas se utilizaron 1 000 pocas. Cabe destacar que si el momentum es igual al mejor valor del LearningRate se obtiene la peor clasificacin.

Tabla 2. Valores de las medias y desviacin estndar de las pruebas con el mtodo de evaluacin Using training set Bien Medias Des Est 97.83 2.52 Mal 2.1 2.52 Ks 0.9 0.31 Mae 0.02 0.06 Rmse 0.05 0.14 Rae 7.04 19.40 Rrse 12.59 35.24

Utilizando el mtodo de evaluacin Validacin Cruzada (Cross- Validation), se valid sobre las 37 muestras, con diez particiones (folds). El valor promedio obtenido fue de 32 instancias bien clasificadas y cinco mal clasificadas de la muestra total. Se realiza con un valor promedio del LearningRate de 0,4, el valor promedio del momentum es tambin de 0,4. En todas las pruebas se utilizaron 500 pocas logrndose un error ms pequeo con 0,7 de LearningRate y 0,4 como valor del momentum. Utilizando 1 000 pocas se obtiene una mejor clasificacin.

Tabla 3. Valores de las medias y desviacin estndar de las pruebas con el mtodo de evaluacin Cross- Validation Bien Medias Des Est 86 1.81 Mal 14 1.81 Ks 0.53 0.30 Mae 0.17 0.08 Rmse 0.33 0.03 Rae 49.50 23.38 Rrse 81.58 8.99

Utilizando el mtodo de evaluacin Percentage split tomando 20 % de los datos para la evaluacin (esto equivale a tener ocho muestras para la evaluacin), el valor promedio obtenido fue de 7,33 instancias bien clasificadas del total de muestras que se evaluaron, clasificando incorrectamente como promedio 0,66 muestras. Esto se logra con un valor promedio del LearningRate de 0,7 y del momentum de 0,6. La cantidad de pocas es de 1 000, ya que si se disminuye se produce un error de memoria.

Tabla 4. Valores de las medias y desviacin estndar de las pruebas con el mtodo de evaluacin Percentage split Bien Medias Des Est 91.63 0.70 Mal 8.38 0.70 Ks 0.44 0.52 Mae 0.09 0.19 Rmse 0.19 31.84 Rae 33.27 31.84 Rrse 67.85 65.49

Para obtener una mejor clasificacin en todas las pruebas realizadas con esta topologa, todos los atributos de entrada fueron normalizados y no se utiliz el decay learning. No se realizaron pruebas utilizando otra capa oculta ya que se concluy que utilizando una sola capa el problema puede ser representado por polgonos separables. El comportamiento del algoritmo de aprendizaje fue satisfactorio en cuanto a la prediccin de los patrones que se utilizaron para la evaluacin, logrando la capacidad de generalizar, dado los valores obtenidos en los tres mtodos de evaluacin utilizados para el estudio.

CONCLUSIONES
El desarrollo de esta investigacin se ha basado en modelar el problema del pronstico de inundaciones costeras por penetraciones del mar de forma tal que se pueda brindar una solucin factible a travs de una herramienta computacional, que en otras reas ha sido de gran beneficio. Con el empleo de la herramienta Weka se ha podido comprobar la utilidad que tiene el uso de las Redes Neuronales Artificiales, especficamente el modelo Perceptrn Multicapa, para el pronstico de inundaciones costeras por penetraciones del mar. Las clasificaciones realizadas en situaciones meteorolgicas que pueden provocar este fenmeno natural, fueron en la mayora de los casos satisfactorias para las muestras evaluadas, por lo que la aplicacin de este modelo es factible para elaborar el pronstico de inundaciones por penetraciones del mar en la costa norte de la regin occidental de Cuba. Este es una herramienta que permite adems que se automatice la elaboracin del pronstico marino, sin dejar la importante valoracin del pronosticador con respecto a la elaboracin de las predicciones. Los valores de los parmetros que intervienen en la red MLP, que brindan mejores resultados y hacen que la red tenga un comportamiento estable por lo que logra la habilidad de generalizar fueron los siguientes: Cantidad de capas: 3 LearningRate: 0,5 Momentum: 0,6 Cantidad de pocas: 1 000 No se utiliza el decay learning Se normalizan los atributos

AGRADECIMIENTOS
A M. Sc. Reynaldo Casals Taylor (INSMET) y a Lic. Eveln Fonseca Cruz (UH) por ser guas de este trabajo. A todos los que me brindaron su apoyo incondicional en la realizacin de la presente investigacin.

REFERENCIAS
Couchman, P.; F. Imbault, R. Tigreat and U. Tellechea Gorka (2003): Classification assignment: Image processing. Tesis de maestra en Sistemas embebidos. Universidad de Heriot Watt. Garca Morate, D. (2006): Manual de Weka, http:/metaemotion.com/diego.garcia.morate/download/weka.pdf Hernndez, J. y C. Ferri (2006): Introduccin al Weka. Curso de Doctorado Extraccin automtica de

conocimiento en Bases de Datos e Ingeniera de Software. Universidad Politcnica de Valencia. Hernndez, N. (2007): Desarrollo del pronstico marino en Cuba 2007. Algunas tcnicas. Cuba: Centro de Meteorologa Marina, Instituto de Meteorologa. Jalil, M. y Martha Misas (2006): Evaluacin de pronsticos del tipo de cambio utilizando redes neuronales y funciones de prdida asimtricas. Banco de la Repblica de Colombia. Organ, D. (2004): Flood Forecasting using Nonlinear Time Series Analysis. Tesis de diploma. Universidad del Sur de la Florida (USF). Departamento de Ingeniera Industrial, Estados Unidos. Petterssen, S. (1941): Introduction to Meteorology. 1ra. edicin. McGraw- Hill Book Company, Inc. Salas, R. (2002): Robustez en Redes Neuronales Feedforward. Tesis de Maestra en Ingeniera Informtica. Universidad Tcnica Federico Santa Mara. Valparaso, Chile. Slobodan, V. (2002): Introduction to Neural Networks. Curso de primavera. www.ist.temple.edu/~vucetic/cis 350spring2002.htm Torres, D. (2008): Aplicacin del modelo Perceptrn Multicapa para el pronstico de inundaciones por penetraciones del mar en la costa Norte Occidental de Cuba. Tesis de Diploma. Universidad de la Habana, Cuba. Villena, J. (2003): Minera de datos. Universidad Carlos III Madrid, http://www.it.uc3m.es/jvillena/irc/ practicas/03-04/18.mem.pdf

S-ar putea să vă placă și