Documente Academic
Documente Profesional
Documente Cultură
Resumen -Este trabajo presenta un prototipo para adaptar una norma Los resultados obtenidos mediante el control de los pacientes en el hospital y finalmente, la Sección
oxímetro del pulso al convertirlo en un dispositivo inalámbrico utilizando ZigBee. los datos VIII se presentan las principales conclusiones de este trabajo.
del paciente se extraen y se transmiten al servidor en tiempo real a través de una red de
sensores inalámbricos. Esta red de sensores inalámbrica se implementa usando la
II. PAGS PRINCIPIOS DE O XIMETRY
topología de malla con el fin de alcanzar la máxima fiabilidad en las comunicaciones. El
oxímetro de pulso se basa en una sonda de DS-100 A Nellcor y es controlado por un En la década de los años 1860, se descubrió que la sustancia coloreada en la
Arduino FIO con un módem inalámbrico XBee. El circuito de fi er ampli que está diseñado
sangre, la hemoglobina, también era el portador de oxígeno. Al mismo tiempo, se
para extraer la información de la sonda de oxímetro de pulso está incluido en este trabajo.
observó que la absorción de luz visible por una solución de hemoglobina varía
con oxigenación. Esto es porque las dos formas comunes de la molécula,
Términos del Índice -código hemoglobina oxidada ( HBO 2) y hemoglobina reducida ( Media pensión),
ZigBee, Xbee, Wireless Sensor Network, oxímetro de pulso, e-Salud, telemetría en
la atención sanitaria
tienen significativamente diferentes espectros de óptica en el rango de longitud de onda
de 500 nm a 1000 nm [Towsend (2001)].
I. INTRODUCCIÓN
Sobre la base de la ley de Beer-Lambert [Webster (1997)], la oximetría de
Hoy en día, los sistemas de vigilancia de la salud son una de las áreas de
pulso mide el efecto de la sangre arterial en los tejidos, teniendo en cuenta la
investigación más importantes en el científico de campo. Este trabajo se centra en los
intensidad de la luz transmitida [Cheung et al. (1989) Cheung, Gautlitz, Mason,
sistemas de vigilancia para aplicaciones hospitalarias. En los hospitales, las constantes
Prosser, Smith, Wagner, y Hunsaker]. El volumen de sangre en el tejido es
vitales de los pacientes son monitorizados por varios sistemas, la mayoría de los cuales
proporcional al pulso arterial. El volumen de sangre más alta se produce
utilizan sensores que se wireconnected a los dispositivos de vigilancia. El uso de cables
durante la sístole, mientras que la más baja se presenta en la diástole. Blood
hace sentir incómodos y hay una falta de movilidad tanto para el paciente como para el
absorbe parte de la luz que pasa a través del tejido. La luz emergente es
personal del hospital. Este trabajo presenta el diseño de un oxímetro de pulso
proporcional al volumen de sangre presente en el tejido. Esta luz es modi fi con
inalámbrica que es capaz de almacenar la información sobre el paciente en tiempo real a
cada latido del corazón. Además, la absorbancia coeficiente de oxihemoglobina
través de una red de sensores inalámbricos. Esta información se almacena en un
es diferente de la de hemoglobina desoxigenada para la mayoría de longitudes
servidor de base de datos, lo que permite la consulta de todos los datos de los pacientes.
de onda de luz. Eq. 1 establece la fórmula para comparar ambos tipos de
Este consultas permitirán derivar nueva información sobre el estado de salud de los
hemoglobina.
pacientes.
algunos dispositivos de telemetría inalámbrica en el mercado. Varios oxímetros de de tejido tal como el dedo o el lóbulo de la oreja, y mide la señal de luz transmitida. El
pulso de comunicación inalámbrica Bluetooth [Mor' dispositivo funciona en los siguientes principios:
Casilari, y G ' azquez] están disponibles comercialmente. En esto • La absorbancia de la luz de la hemoglobina oxigenada y hemoglobina
trabajo, tres diferentes protocolos de comunicación inalámbrica (Wi Fi, Bluetooth y desoxigenada en dos longitudes de onda es diferente.
ZigBee) han sido estudiados. Una red inalámbrica de sensores para monitorizar los • La naturaleza pulsátil de resultados de la sangre arterial en una forma de onda en
pacientes ha sido diseñado. la señal transmitida que permite a los efectos de absorbancia de la sangre arterial
El resto del trabajo se organiza de la siguiente manera. Sección II describe para ser identi fi ed de los de sangre venosa pulsátil no y otra cuestión cuerpo.
los principios teóricos de la oxímetro de pulso. En la sección III, se describe la Mediante el uso de un cociente de los dos efectos a diferentes longitudes de onda
comunicación inalámbrica. Sección IV describe el microcontrolador utilizado que es posible obtener una medida que no requiere calibración absoluta con
para procesar los valores de SpO2 pulso y. En la Sección V, la sonda de respecto a la absorbancia del tejido en general. Este es un claro avance de los
oxímetro de pulso y sus componentes son detallada. Sección VI describe la oxímetros de pulso más de los anteriores tipos de oxímetros.
arquitectura del sistema propuesto. Sección VII describe la
II JORNADAS ANDALUZAS DE INFORMÁTICA, JAI2011 37
ZigBee r Wifi TM BT TM
802.15.4 802.15.1 802.11b
Alcance de transmisión (m) 1 - 100 1 - 100 1 - 100
Vida útil de la batería (días) 100 - 1000 0.5 - 5 1-7
Tamaño de la red (# nodos) > 65000 32 7
Tamaño de la pila (Kbytes) 4 - 32 1000 250
Transferencia Rate (Kb / s) 20 - 250 11000 720
TABLA I
C OMPARATIVE entre las tecnologías
Como se ha mencionado previamente, un oxímetro de pulso brilla la luz de A. Los dispositivos ZigBee
dos longitudes de onda, rojo y infrarrojos e, y cada señal de luz tiene un
ZigBee permite hasta 254 nodos por red. Sin embargo, este protocolo
componente de CA y CC. Tanto AC y DC de cada longitud de onda tienen que
permite hacer grupos con hasta 255 nodos por clúster, y así, para llegar a un
ser medidos [Watthanawisuth et al. (2010) Watthanawisuth, Lomas, Wisitsoraat,
límite superior de 64770 nodos en la misma red. Hay tres tipos de
y Tuantranont] usando la Ec. 2.
dispositivos de ZigBee:
Coordinador: El dispositivo más capaz, el coordinador forma la raíz del
árbol de la red. Puede actuar como un puente hacia otras redes.
R DC)
R = log ( R C.A. (2)
Iniciar sesión( IR C.A. Router: Este tipo de dispositivo es capaz de comportarse como un enrutador intermedio, la
IR DC)
transmisión de datos de otros dispositivos que determinan el mejor camino.
Con el fin de deshacerse de los cables de datos en el hospital, se utilizará la B. ZigBee topologías
comunicación inalámbrica. Existen varias tecnologías inalámbricas disponibles, que Como se muestra en la Figura 1, ZigBee soporta tres topologías de red:
se comparan en la Tabla I. Un oxímetro de pulso inalámbrico necesita ciertas
características como bajo consumo de energía, el rango de transmisión de alta y
fácil integración (tanto física y funcional). Estos hechos hacen ZigBee como el mejor los Topología de las estrellas tiene las siguientes ventajas: La
protocolo para asegurar que estos requisitos. Además, una de las principales sincronización fácil, modos de bajo y baja latencia. Por otro lado, la principal
aplicaciones de ZigBee [Alianza (2010)] es e-Salud. Estas tecnologías aseguran un desventaja es la centralización del coordinador, lo que podría provocar la
bajo consumo de energía y de comunicaciones altamente fiables. parada de toda la red.
microcontrolador ATmega328P
los La topología de malla tiene estas ventajas: robusta comunicación de múltiples saltos,
Tensión de funcionamiento 3.3V
la red es más flexible para mantenerse al día con los cambios de estructura, y una menor Voltaje de entrada 3,35 -12 V
latencia de la estrella y del árbol topologías. Los principales inconvenientes son: el Tensión de entrada para carga 3,7-7 V
Digital pines I / O 14 (de los cuales 6 proporcionan una salida PWM)
descubrimiento de ruta es más caro, y necesita más espacio de almacenamiento para
Pines de entrada analógica 8
guardar las tablas de enrutamiento. Corriente DC por Pin I / O 40 mA
Memoria flash 32 KB
SRAM 2 KB
La topología de malla se ha seleccionado en este trabajo. Los hospitales EEPROM 1 KB
requieren redes robustas que calcular automáticamente nuevas rutas cuando caen Velocidad de reloj 8MHz
las rutas establecidas, con el fin de evitar una pérdida de información. Tiene que TABLA II
asegurarse de que todos los paquetes llegan a su destino y con restricciones de A RDUINO FIO C ARACTERÍSTICAS
A. LED
La FIO Arduino es una placa electronica basada en el ATmega328P. Cuenta con 14
pines digitales de entrada / salida, 8 entradas analógicas, un resonador de a bordo, un Una de las grandes mejoras de los oxímetros de pulso modernos más de
botón de reinicio, y los agujeros para el montaje de cabezales de pin. Tiene una batería oxímetros anteriores es el uso de LED como su fuente de luz. Los LEDs pueden
de polímero de litio y se puede cargar con un cable USB. Un zócalo XBee está transmitir grandes intensidades de luz proporcional a la cantidad de corriente de
disponible en la parte inferior del tablero. excitación. Como hay dos LED en el sistema (roja e infrarroja), el microcontrolador
es responsable de su control de temporización. El momento de pulsaciones es
Todas estas características, combinadas con su pequeño tamaño (2,8 cm × crítico porque el fotodiodo no puede distinguir entre diferentes longitudes de onda
6.6cm), hace Arduino FIO adecuadas para el diseño de oxímetro de pulso junto con la de luz. oxímetro de pulso se basa en el sistema de microprocesador para
comodidad del paciente. sincronizar las pulsaciones de los LEDs con las muestras tomadas por de ADC.
Esta sincronización de alta precisión permitirá determinar correctamente que LED
V. N ELLCOR PAGS Ulse O XIMETER PAGS TÚNICA
es el transmisor de cada valor de la absorbancia detectada por el fotodiodo.
El objetivo principal de este trabajo es la de suprimir los cables de los oxímetros de
pulso, manteniendo el presupuesto lo más bajo posible. Por estas razones, es muy
importante seleccionar una frecuencia Las dos longitudes de onda elegidas para la oximetría de pulso son 660
II JORNADAS ANDALUZAS DE INFORMÁTICA, JAI2011 39
Alfiler Función
toda la red, que permite la gestión de todo el sistema dentro de un servidor. La
2 Diodo rojo cátodo // diodo infrarrojo del ánodo
3 Diodo infrarrojo cátodo del diodo rojo // ánodo principal ventaja de un servidor es la posibilidad de incluir Arti fi cial de Inteligencia (AI)
5 Terreno para Fototransistor en el sistema, lo que proporcionaría la capacidad de realizar inferencias complejas.
9 entrada del circuito para Fototransistor
Gracias a este AI, el sistema podría no sólo actuar como un mero almacenamiento de
TABLA III N ELLCOR DS-100 AP INOUT
datos sobre los pacientes, pero podría también estudiar cada caso en tiempo real, el
envío de alertas al personal médico cuando el estado de los cambios de los pacientes.
En este trabajo, una primera aproximación compuesto por una red de sensores
inalámbricos y un servidor de base de datos se ha diseñado e implementado.
y HbO2, de cada luz deben ser seleccionados para variar tanto como sea posible.
En esta primera aproximación, operativos amplificadores por una ±
En este sentido, HbO2 se ha determinado que tienen un coeficiente de extinción
fuente 12V para amplificar y filtro de la señal de la sonda se han utilizado. El
mayor que Hb en 940 nm y un menor coeficiente de extinción a 660 nm. En otras
circuito ha sido diseñado en cuatro etapas para mantener las diferentes
palabras, como SaO2 aumenta, la absorbancia de la luz aumenta a 940 nm y
recomendaciones descritas en la literatura [Webster (1997)],
disminuye a 660 nm.
[Cysewska-Sobusiak (1995)], [Graeme (1992)], [Burr-Brown Corp. (1994a)] ,
[Burr-Brown Corp. (1994b)], [Burr-Brown Corp. (1994c)] en mente.
B. Fototransistor
1) Filtro 1: Filtrado de 60 Hz de ruido: En esta primera etapa fi, la señal pasa a través
El fotodetector es un fototransistor de silicio que produce una tensión que es
de un filtro de paso de banda para eliminar desplazamiento de CC y a FI ruido 60Hz
linealmente proporcional a la intensidad de la luz llamativo. Los avances en la
filtro. Pin 9 de la Nellcor DS-100a está conectado al circuito de fi er cador. Se trata de un
tecnología de silicio permiten que el fototransistor sea lo suficientemente pequeño
filtro de paso de banda de inversión con los cálculos. Un filtro de paso alto se ha creado
para encajar en la reducción de tamaño, las sondas de punta de dedo. Estos
usando R1 y C1, mientras que C2 y R4 controla la construcción de un filtro de paso bajo.
avances han hecho oxímetros de pulso mucho más precisa y conveniente que los
La salida de este circuito está conectado a la entrada del segundo filtro de fase fi.
dispositivos anteriores. dispositivos de oxímetro anteriores necesitan una
calibración frecuente debido a que los dispositivos fotoeléctricos, utilizados como
sensores, eran a menudo inconsistente [Miller (1966)]. Un fotodiodo no puede
2) Filtro 2: Ajuste de la frecuencia de corte de 0,5 Hz: Al establecer la
distinguir entre un rojo y una luz infrarroja, pero para tratar con él, el sistema de
frecuencia de corte de 0,5 Hz, el ruido de la señal original se reduce. Con el fin de
microprocesador, alternativamente, convierte cada LED encendido y apagado. El
hacer esto, un nuevo filtro de paso alto con una frecuencia de corte de 0,5 Hz
oxímetro de pulso toma muestras de la salida del fotodiodo mientras que el LED
[Webster (1997)] se ha desarrollado.
rojo está encendido, mientras que el LED infrarrojo está encendido, y mientras tanto
están apagados. Mediante el muestreo con ambos LEDs apagado,
1 2Π · R 6 · 1 2Π · 330 k · 1 mF
fc = = =
C3
(5)
1) Pruebas: Nellcor DS-100 A: Finalmente, la sonda Nellcor tiene un
fototransistor colector abierto y su pinout se describe en la Tabla III y la Fig. 3. =1
2,07 = 0,4822 hz
La señal dada por la sonda es de aproximadamente 0.1-1mV, que es 3) Filtro 3: amplificación de la señal: Como es requerido por el microcontrolador
demasiado bajo para ser procesados directamente por el microcontrolador. Por usado, la señal es amplificado a 3.3V. Las resistencias R9 y R10 proporcionan la
lo tanto, un circuito para amplificar y procesar se requiere la señal de [Webster ganancia principal del circuito. Varios ensayos han sido realizados para medir los
(1997)], [Baran et al. (2006) Baran, Chen, Stanford, y Yamarkovich]. En la valores de los latidos del corazón y oxígeno, y la mejor con fi guración para leerlos
siguiente sección, el circuito necesario de filtro y amplificar la señal con el fin de en el microcontrolador se obtiene mediante el establecimiento de R9 a 38.9M Ω y
digitalizar con el microcontrolador se ha desarrollado. R10 a 100 K Ω. Con ellos, se obtiene un valor de ganancia de 398. Por lo tanto, la
señal ha sido amplificado de 8mV a 3,3 V, aproximadamente.
Hoy en día, los sistemas de seguimiento en los hospitales se diseñan generalmente con
cables. Para los oxímetros de pulso, existen algunos dispositivos inalámbricos, a pesar de
G = R9 = 38,9 METRO Ω (6)
que no son capaces de establecer una R 10 100 K Ω = 398
40 Canillas de Aceituno, MÁLAGA
sallen-clave filtro de paso bajo con 5 Hz de corte ha sido diseñado [Webster ZS (ZigBee Pila 0
SH (Alta Dirección) 13A200
(1997)]. La salida de esta etapa está conectado a una entrada analógica del SL (Low Dirección) 400A00D6
microcontrolador. NI (Nodo Identi fi er) COORDINADOR
BH (emisión de radio) 0
AP (Modo API) 2
1 2Π √ R 11 R 12 AO (API Modo de salida) 0
fc = =
C4 C5 TABLA IV
1 (7) M AIN C ONFIGURACIÓN EN Z IG B EE C OORDINATOR. S EE [A
= LLIANCE ( 2010)] PARA MÁS DETALLES.
2Π √ 100 k · 100 k · 470 nF · 220 nF =
= 4,9494 hz
A. Ensayos de paquetes
• 5 dispositivos router.
• 3 dispositivos finales.
entre un dispositivo final asociado a un oxímetro de pulso y su nodo padre que actúa
como un router. Esta prueba trató de comprobar si el dispositivo final fue capaz de
volver a conectar a otro router. Esta prueba se ha realizado correctamente, y el estado
de Casilari et al. ha sido confirmado [Casilari (2010)]: “ La operación de volver a
conectar cualquier dispositivo extremo a un FFD toma más de 2 segundos ”.
Obviamente, durante el tiempo de reconexión, el nodo no es capaz de transmitir
cualquier información al coordinador. Sin embargo, el dispositivo final se ha
programado para almacenar la información en una memoria intermedia con el fin de
Fig. 7. Saturación O2 Resultados
evitar la pérdida de datos. Cuando el propio nodo re-asocia a otro router, envía toda la
información almacenada.
A veces, si un dispositivo final no es capaz de volver a conectar a otro router, La Fig. 6 muestra varias pruebas con más de 35 valores de pulso en momentos
se puede conectar directamente al coordinador, si existe suficiente cobertura diferentes. Los resultados prueban que ISSO certi fi oxímetro de pulso ed y los valores
entre los dos puntos finales. Esta situación reduce la cantidad de tiempo para los de oxímetro de pulso basado Arduino son similares y las diferencias entre ambos
paquetes de viaje, a pesar de que hace que el coordinador sea más dispositivos están a punto ± 1 pulsos. Estos valores pueden ser considerados casi igual, a
sobrecargado. pesar de que los dos oxímetros de pulso son completamente diferentes con respecto
tanto de algoritmos y hardware.
B. Ensayos de medición
Con el fin de probar que los datos obtenidos con el oxímetro de pulso desarrollado Analizing los valores de SpO2 en la Fig. 7, se puede observar que tanto el
son correctos, una comparación entre los datos muestreados por el sistema diseñado oxímetro de pulso ISSO y el oxímetro de pulso basado Arduino difieren en menos
y por un ISSO certi fi ed (para usar en hospitales) oxímetro de pulso profesional se de 1% del valor de SpO2.
llevó a cabo. Estos resultados demuestran que el oxímetro de pulso basado Arduino tiene
En el experimento, se utilizaron dos sondas. La primera uno estaba una respuesta similar a la certi fi oxímetro de pulso ed ISSO tanto en
conectado con el oxímetro de pulso ISSO, y era el otro mediciones de pulso SpO2 y.
42 Canillas de Aceituno, MÁLAGA
C. Análisis coexistentes Pulsioxímetro [Baran et al. (2006) Baran, Chen, Stanford, y Yamarkovich] J. Baran,
K. Chen, W. Stanford, M. Yamarkovich, el pulso de transmisión del dispositivo, que mide 2.006.
En esta prueba, 3 oxímetros de pulso eran ejecutan simultáneamente con resultados
exitosos. Durante todo el tiempo de funcionamiento, los datos extraídos de cada persona [Cysewska-Sobusiak (1995)] A. Cysewska-Sobusiak, problemas de procesamiento
fiabilidad en mediciones no invasivas de la saturación de oxígeno en sangre, optoelectrónicos y
alcanzados en tiempo real el coordinador. En un futuro, las pruebas en un hospital serán
sensores electrónicos SPIE 2634 (1995) pp. 163-171. [Graeme (1992)] J. Graeme, la
necesarios para ajustar la red para utilizar un mayor número de los oxímetros de pulso. compensación de fase de banda optimiza fotodiodo
bruja, EDN 7 (1992) pp. 177-184.
[Burr-Brown Corp. (1994a)] Burr-Brown Corp., OPT101: Las hojas de datos: Mono-
VIII. C CONCLUSIONES fotodiodo lítica y de transimpedancia de suministro de un solo amplificador (1994a). [Burr-Brown
Corp. (1994b)] Burr-Brown Corp., Boletín de Aplicación del ab-075:
Se propone una red inalámbrica de sensores en tiempo real para la vigilancia de monitoreo fotodiodo con amplificadores operacionales (1994b). [Burr-Brown Corp. (1994c)] Burr-Brown
la salud mediante el protocolo ZigBee. Un oxímetro de pulso usando un FIO Arduino Corp., Boletín de Aplicación del ab-077:
El diseño de circuitos de fotodiodos del ampli fi cador con opa128 (1994c). [Xbe (2010)] Una API de
y una Nellcor DS-100 han sido diseñados con el fin de monitorizar los pacientes en
Java para módulos de RF OEM XBee de Digi-pro XBee /.
los hospitales. El pulso y SpO2 de cada paciente se recogen y se envían a través de http://code.google.com/p/xbee-api/, 2010, 2010. Último Acceso octubre
la red inalámbrica con el servidor central. Este servidor central gestiona la red y 2010.
[Casilari (2010)] E. Casilari, Modelado del consumo actual en
envía la información a un servidor de base de datos.
motas 802.15.4 sensor / ZigBee, Sensores 2010 10 (2010) pp. 5443-5468.
R EFERENCIAS
[Jovanov (2005)] E. Jovanov, la tecnología inalámbrica y sistema de integración en
redes de área corporal para aplicaciones de m-Salud., en: Conferencia Anual Internacional
de la Ingeniería de IEEE en Medicina y Biología - Proceedings, volumen 7 vols, pp
7158-7160.
[Jovanov (2000)] E. Jovanov, redes inalámbricas de área personal en telemedicina
medio ambiente, Actas de la Conferencia Internacional IEEE EBMS sobre aplicaciones de
tecnología de la información en Biomedicina (2000) pp.74-
78.
[Hameed (2003)] K. Hameed, la aplicación de la informática móvil y
La tecnología de los servicios de salud, Telemática e Informática vol. 20, Iss. 2 (2003) pp.
99-106. [Mor'
en et al. (2005) Mor' en adelante, Luque, Casilari, y G ' azquez] M. Mor' en,
J. Luque, E. Casilari, J. G' azquez, Un sistema de supervisión inalámbrico para
sensores de oximetría de pulso, en: ICW '05 Proceedings de los sistemas de comunicaciones
2005, pp 79-84..
[Towsend (2001)] DN Towsend, oximetría de pulso, Medical Electronics (2001)
pp. 32-42.
[Webster (1997)] J. Webster, Diseño de oxímetros de pulso, ISBN 0750304677,
IOP Publishing Ltd, 1 o edición de 1997.
[Cheung et al. (1989) Cheung, Gautlitz, Mason, Prosser, Smith, Wagner, y Hunsaker]
P. Cheung, K. Gautlitz, L. Mason, S. Prosser, R. Smith, D. Wagner,
S. Hunsaker, método de retroalimentación controlado y un aparato para el procesamiento de señales y se
utiliza en oximetría, la patente US 4.819.646 (1989). [Watthanawisuth et al. (2010) Watthanawisuth, Lomas,
Wisitsoraat, y Tuantranont]
N. Watthanawisuth, T. Lomas, A. Wisitsoraat, A. Tuantranont, oxímetro de pulso portátil
inalámbrico para la vigilancia de la salud utilizando la red inalámbrica de sensores ZigBee,
Ingeniería Eléctrica / Electrónica Informática y Telecomunicaciones Tecnología de la
Información (ECTI-CON), 2010 Conferencia Internacional sobre (2010 ) 575-579.
E-mail: carlosmo@ujaen.es
European Centre for Soft Computing, Mieres, Asturias, Espa~ n/A
E-mail: daniel.sanchezf@softcomputing.es
Resumen -En Una Sociedad en La Que El Conocimiento es Realizar la ONU Resumen de la informaci' Usando el lenguaje el NAT
Esencial nn aumento de la Necesidad de Manejar adecuadamente ingentes ural. Este tipo de res' umenes reciben el nombre de res' umenes
Cantidades de Datos. Podemos Lo View in Nuestra Vida Diaria, Pero Importancia de
u'ısticos
abadejo y gracias a Ellos Es Posible ofrecer una los Usuarios Una informaci'
la cobra Una alcaldesa en el ' Ambito empre-
en M como comprensible Y Que: Al mismo tiempo les
sarial. Empresas y Organizaciones generan y consumen Grandes vol '
umenes de Datos con el fi n de Llevar un Cabo SUS actividades. Pero los Datos en S'i mar de M' como una utilidad f La Hora de Tomar Decisiones determinadas. Este
ninguna Tienen Impacto de la ONU en el desempe~ ninguna de las trabajo en sí Presentan algunos adj de los Enfoques Que Han Sido desarrollados
Actividades Si No somos CAPACES de Obtener informaci' A partir de con el fi n de Realizar Resumen Ling u'ıstico
Que de Ellos: Al mismo tiempo el mar ' util e inteligible para Nosotros.
Sobre las series temporales obtenidas de Datos de Almacenes de Datos. Dichos
La Posibilidad de Generar res ' umenes Ling u'ısticos de la serie de
Enfoques USAN Como Herramientas Para resolver Este Problema de Conceptos Conjuntos
Datos en el ' ambito empresarial Se presenta Como una Poderosa
Herramienta Que facilitar' a el Proceso de la Toma de Decisiones. difusos ( FS - Fuzzy Sets) [28]. En la literatura se pueden ENCONTRAR
DIVERSOS Enfoques basados en el USO de Soft Computing Para La realizaci'
Términos del Índice -Resumen Ling u'ıstico, Serie de Datos tempo
en
estertores, Modelo de Datos multidimensional, Business Intelligence, Soporte a la
Toma de Decisiones. de res' umenes de Datos. De Entre Estas Propuestas, el Resumen Ling
Posee u'ıstico inter' especial de la ONU ES DEBIDO a la ya mencionada
Necesidad de Obtener Sentencias cercanas al lenguaje natural, al describir
I. INTRODUCCIÓN
Grandes Conjuntos de Datos.
La Capacidad de Manejar Grandes vol' umenes de Datos SE El Resumen Ling u'ıstico de series temporales de Datos es de
por la fi Cada Vez m ' como Necesaria En Una sociedad Que Sin Duda mucha utilidad f en el ' Ambito Referente una Sistemas de Infor-
Alguna est' un Basada En El Conocimiento. El Importante n' umero maci' en ( IS - Information Systems), debido a la importancia de la dimensi´
de Grandes Empresas, as'ı Como Organizaciones u Organismos p ' on temporal en el desempe˜ no del negocio. Las
ublicos, Que generan y consumen ingentes Cantidades de Datos con el fi n de soluciones basadas en Business Intelligence permiten a los administradores
Llevar un Cabo SUS actividades, un son Buen Ejemplo de Ello. La mayor'ıa de o gerentes de empresas, organizaciones u organismos, obtener un
Datos ESTOS est' un Relacionados conocimiento m´ as preciso del proceso
Con La dimensi' el temporal de Una u Otra Manera. que desempe˜ nan y las operaciones comerciales o sociales
Pero no s' olo el Manejo de los Datos es ' util; del Mismo que llevan a cabo, con el fin de apoyar una mejor toma de decisiones. En
Modo, El Proceso Que permite Realizar la extracci' el de la general se puede esperar que las compa˜ n´ıas
informaci' en un partir de Conjuntos de Datos, se est' Volviendo una que hacen uso de alg´ un tipo de tecnolog´ıa para facilitar la
Cada Vez m ' como Importante para Nuestro entorno. La Importancia de Este toma de decisiones tengan un mayor rendimiento que las compa˜
Proceso se Dębe al Hecho De que permite a los Usuarios Realizar tareas tan n´ıas que prescinden de ella. Una parte muy importante de las
Importantes Como El an' Alisis en la toma de herramientas relacionadas con Business Intelligence est´ a
Decisiones, pron' ostico o predicci' en 2]. basada en el uso del modelo de datos multidimensional y las operaciones
Como se ha comentado anteriormente, la Posibilidad de realizaci' OLAP (OnLine Analytical Processing) llevadas a cabo sobre ´
el de pron' ostico y predicci' en basados en El Estudio de el y que permiten la consulta de grandes cantidades de datos
Las series de Datos es Muy importante. En Este trabajo, Nosotros nos vamos a [23].
Centrar En Otra utilidad f Como Es La descripci' el de El modelo de datos multidimensional es un modelo ampliamente
La informaci' Que Alberga en la serie temporal. Diversas EXISTEN extendido que se basa en el uso de los llamados cubos de datos (tambi´
Formas de PRESENTAR La informaci' Que se obtiene en un trav' es del en conocidos como hipercubos o data
un Alisis de las series de Datos. En concreto, en nuestro de Caso nos Interesa cubos) los cuales est´ an orientados al an´ alisis de datos. Cada
Que la presentaci' en of this informaci' Realice en SE cubo de datos almacena una colecci´ on de hechos num´ ericos,
En Forma de Resumen. llamados medidas, que se encuentran descritos por un conjunto de
Los Receptores Son de los Resultados obtenidos Los Usuarios con formaci' dimensiones. El cubo alberga en cada una de sus celdas los datos relacionados
en experta o no, de Modo Que es muy conveniente con los elementos, agregados en cada una
44 CANILLAS DE ACEITUNO, MÁLAGA
de las dimensiones. informaci´ on esencial de una forma breve y concisa. Pero en la mayor´ıa
Los cubos de datos, como norma general, contienen una dimensi´ de los casos, las situaciones no se caracterizan por ser ideales. Podemos
on tiempo debido al importante papel de ´ esta en encontrarnos, por ejemplo, con que toda la informaci´
general y referente a la actividad comercial en particular. Muchas de las on esencial no pueda ser reflejada de forma
operaciones OLAP que se aplican sobre la dimensi´ breve; aunque lo que realmente representa un problema son las distintas
on temporal de los cubos de datos producen series de datos percepciones que tienen diferentes personas de los conceptos breve o esencial.
temporales. Un gran n´ umero de autores han dedicado sus Esta concepci´ on vendr´ a marcada
esfuerzos e investigaci´ on en realizar miner´ıa de datos (DM - por los diferentes intereses de cada uno o la utilidad que se le vaya a dar al
Data Mining) sobre estas series temporales. En [1], los autores presentan una resumen obtenido. Lo que para un individuo o grupo puede resultar
extensa visi´ on general de algunos enfoques a interesante o esencial, puede no serlo para otros, y viceversa, incluso se
este respecto que son de inter´ es. pueden presentar visiones diferenciadas acerca de qu´
Cada vez son m´ as las voces que relacionan las tareas e extensi´ on puede ser considerada
llevadas a cabo en los procesos de Data Mining con el soporte a la toma de o no como breve.
decisiones [21]. En el presente trabajo consideramos el resumen ling¨ El proceso de resumir es una actividad inherente al ser humano. Las
u´ıstico de datos como un caso personas continuamente reciben informaci´ on del
particular de Data Mining ya que la entrada es la misma y como resultado exterior que someten a una serie de procesos (transformaci´ on,
obtenemos informaci´ on no trivial, novedosa reducci´ on, almacenaje, recuperaci´ on o utilizaci´ on) seg´ un sus
y potencialmente ´ util que antes no se conoc´ıa, pero con la capacidades y necesidades, con vistas a una futura aplicaci´ on.
cualidad a˜ nadida de que las salidas se realizan usando lenguaje natural. Podemos considerar pues que resumir implica una actividad de reducci´
on natural de informaci´ on en la mente humana. En
A continuaci´ on se presenta la estructura del trabajo: La este proceso se pasa a fijar los conceptos m´ as importantes o
secci´ on II est´ a dedicada a establecer algunos conceptos b´ asicos significativos de entre todos los datos percibidos. En general el resumen
sobre el resumen ling¨ u´ıstico. En III se aborda la importancia pretende ser lo mismo pero en tama˜ no m´ as peque˜ no
de la dimensi´ on temporal en nuestro entorno y la necesidad del y no una parte arbitraria de lo que tenemos que resumir.
estudio de series temporales. En la secci´ on IV retomamos con-
La obtenci´ on de un buen resumen es algo muy importante.
ceptos anteriores para centrarnos en el resumen ling¨ u´ıstico de
No basta con tener un resumen, dicho resumen debe de satisfacer las
datos con t´ ecnicas difusas. Nuestro enfoque en la realizaci´ on
necesidades del usuario y debe de hacerlo con una cierta calidad. La
de res´ umenes ling¨ u´ısticos de datos temporales as´ı como una
selecci´ on de caracter´ısticas es una acci´ on
plataforma para la obtenci´ on de informaci´ on relevante a partir
que determinar´ a qu´ e partes son las que queremos destacar o a
de grandes cantidades de datos es presentada en la secci´ on V.
cu´ales prestar mayor atenci´ on. Una vez hecho esto y obtenido
Finalmente en la secci´ on VI se muestran algunas conclusiones
el resumen final, se deber´ a de medir la calidad de resumen,
relativas al trabajo.
a fin de que podamos conocer c´ omo de bueno es el producto
obtenido.
II. E L RESUMEN LING ¨ U ´ ISTICO La tarea de intentar que las m´ aquinas produzcan res´ umenes
comparables a los realizados por humanos, es una tarea de gran inter´
De acuerdo con el diccionario de la Real Academia Espa˜
es en la sociedad actual. El punto fuerte de
nola de la Lengua, resumen es una “exposici´ on resumida
los ordenadores en esta tarea lo aportan su capacidad para almacenar datos
en un asunto o materia”. Se trata tambi´ en de la “acci´ on y
y su potencia de c´ alculo que puede realizar
efecto de resumir o resumirse”. Y lo que hacemos al resumir es “reducir a t´
millones de operaciones en un tiempo muy inferior al que nosotros
erminos breves y precisos”, o, “considerar tan s´ olo
emplear´ıamos. En cambio, el punto d´ ebil es el de
y repetir abreviadamente lo esencial de un asunto o materia”.
conseguir que la informaci´ on que produce sea comprensible
Siguiendo las ideas e investigaciones de Pinto [13], diremos que el
para los humanos, que en la mayor´ıa de las ocasiones son los receptores
“resumen es el documento referencial m´ as completo
habituales.
y por consiguiente el que mejor representa la informaci´ on
original, ofreciendo una visi´ on global del contenido del do- Pero algo que para los seres humanos es tan natural y que incluso se
cumento”. realiza sin reparar en ello, no es una tarea tan f´ acil
El hecho de que un resumen sea breve no implica que en ´ el como puede parecer. Los humanos adaptamos inconscientemente nuestra
se refleje lo esencial acerca de algo, aunque esta situaci´ on ser´ıa forma de actuar y desenvolvernos seg´ un en
la m´ as deseable. En muchas ocasiones estas dos palabras son usadas como entorno y la situaci´ on en la que nos encontremos. Cuando
sin´ onimos cuando en realidad no lo son. Es cierto nos enfrentamos al reto de intentar que las m´ aquinas realicen
que existen diversas circunstancias o situaciones en las que no es necesaria res´umenes comparables a aquellos que producimos nosotros mismos, nos
tanta precisi´ on al hablar o definir t´ erminos, ya que damos cuenta de ello.
existen patrones de conocimiento com´ un respecto a un cierto Debido a la dificultad y utilidad del tema un gran n´ umero
tema, o que son compartidos por una determinada comunidad. Deberemos de de investigadores est´ a centrando sus estudios en mejorar el
tener muy en cuenta las diferencias existentes entre los t´ proceso de comunicaci´ on entre humanos y m´ aquinas. En
erminos breve y esencial. nuestro caso, son de especial inter´ es los esfuerzos de investi-
La situaci´ on ideal a la hora de enfrentarnos a la realizaci´ on gaci´on realizados en el ´ ambito del resumen de series de datos
de un resumen ser´ıa que fu´ esemos capaces de ofrecer la temporales.
II JORNADAS ANDALUZAS DE INFORMÁTICA, JAI2011 45
III. L A IMPORTANCIA DE LA DIMENSI ´ ON TEMPORAL de una organizaci´ on. De este modo, el personal encargado de
la toma de decisiones puede realizar el an´ alisis de la evoluci´ on
Desde los tiempos m´ as remotos el ser humano ha medido
de diferentes y variados aspectos del negocio a lo largo del tiempo. Por ello
el paso del tiempo con diferentes m´ etodos y herramientas,
es por lo que la dimensi´ on temporal suele
algunos de ellos de gran precisi´ on. A pesar de ello, el estudio
estar presente casi siempre entre las dimensiones de los cubos de datos.
de las series de tiempo en s´ı, posee un origen relativamente reciente. Se
piensa que fue hace aproximadamente 1000 a˜ nos
De forma breve y general se puede describir un data cubo o cubo de
cuando se produjo la primera representaci´ on gr´ afica de los
datos como un conjunto multidimensional de celdas. Cada una de las
eventos dividiendo un eje horizontal en intervalos de igual amplitud para
dimensiones que conforman dicho cubo pueden ser vistas como un conjunto
representar iguales periodos de tiempo.
de miembros que pueden organizarse a su vez haciendo uso de una o varias
En este trabajo seguiremos las ideas de Pe˜ na cuando afirma
jerarqu´ıas. Gracias a la organizaci´
que “una serie temporal es el resultado de observar los valores de una
on jer´ arquica de las dimen-
variable a lo largo del tiempo en intervalos regulares (cada d´ıa, cada mes,
siones, la granularidad en el cubo de datos puede variar en cada dimensi´
cada a˜ no, etc.)” [24]. Las primeras series
on dependiendo del nivel seleccionado en cada
temporales estudiadas correspond´ıan a datos astron´ omicos y
momento. Las operaciones OLAP permiten a los usuarios aprovechar la
meteorol´ ogicos.
ventaja de esta particularidad y consultar de diferentes formas al data cubo
Las series de datos temporales pueden ser representadas mediante una
con el fin de obtener los datos deseados en cada momento.
sucesi´ on de las medidas tomadas. Si estas me-
didas no se han tomado en intervalos regulares o necesitamos obtener m´
as informaci´ on acerca del momento de tiempo al Podemos obtener series de datos temporales mediante observaci´
que corresponde, dichas medidas pueden ser acompa˜ nadas por on directa pero es m´ as usual hacerlo mediante recogida
el instante de tiempo concreto con mayor o menor nivel de detalle autom´ atica de datos con volcado de la informaci´ on en sis-
dependiendo de nuestras necesidades. Sin embargo, en ocasiones estas temas de almacenamiento. Si hacemos consultas sobre este tipo de
formas de representaci´ on, bien sea en estructuras de almacenamiento seremos capaces de obtener series de datos
texto plano o ayudados mediante tablas, no suelen ser muy intuitivas. temporales. Si adem´ as las estructuras
son multidimensionales como las mencionadas anteriormente, mediante la
En algunas ocasiones puede que el usuario que recibe la informaci´ aplicaci´ on de operaciones OLAP seremos capaces
on no posea conocimiento experto en el tema de obtener series temporales con diferentes granularidades.
espec´ıfico. Otras veces, puede que la cantidad de datos sea tan elevada o La importancia de la dimensi´ on temporal y la necesidad
la diferencia entre sus valores tan notable, que hagan complicado el proceso de obtener resultados entendibles por los usuarios humanos, hacen de este
de an´ alisis de los datos. Sea tipo de series candidatas principales para beneficiarse de t´
como fuere, incluso con las series de datos m´ as sencillas, ecnicas de resumen ling¨ u´ıstico en su estudio.
en muchos de los casos la representaci´ on gr´ afica aporta una
El prop´ osito del estudio o an´ alisis de las series de datos
buena herramienta de representaci´ on de las series de datos
temporales puede ser dividido en dos grandes ´ areas seg´ un
temporales. Por desgracia, la representaci´ on gr´ afica de las
varios autores. La primera de ellas es “entender o modelar el mecanismo
series no siempre es f´ acil de interpretar, ya que en ocasiones
estoc´ astico de una serie observada” y la otra
las series son muy complicadas o incluso tenemos varias series relacionadas
“predecir o pronosticar los valores futuros de series basadas en la historia de
entre s´ı presentadas en el mismo gr´ afico. A esto
esas series y, posiblemente, otras series o factores relacionados” (Cryer
se suman problemas como la necesidad de equipos apropiados y las diferentes
[11]).
percepciones dependiendo de la granularidad usada.
De este modo, podemos decir que el an´ alisis de series
En todos los casos, con independencia de la complejidad de la serie o temporales comprende m´ etodos que ayudan a interpretar los
series, el resumen ling¨ u´ıstico de series de datos datos, extrayendo para ello informaci´ on representativa, tanto
temporales es un herramienta potente que permite presentar a usuarios no referente a los or´ıgenes o relaciones subyacentes como a la posibilidad de
expertos informaci´ on acerca de la serie en extrapolar y predecir su comportamiento futuro. De hecho uno de los usos
caracter´ıstica atribuible a los res´ umenes ling¨ u´ısticos es la datos temporales es su an´ alisis para predicci´ on y pron´ ostico.
posibilidad de uso de un sintetizador de voz, de especial utilidad en aquellos En nuestro caso, no vamos a centrar nuestra atenci´ on en ´ areas
casos en los que la visualizaci´ on de las como la predicci´ on o pron´ ostico, sino en la posibilidad de la
gr´aficas no es adecuada o no es posible (por ejemplo, para poder descripci´ on de las series. La
presentarse los resultados a personas con alg´ un tipo de tarea de obtenci´ on de la informaci´ on subyacente en las
problema visual). series de datos temporales es importante y permite conocer tendencias,
La importancia del tiempo es crucial cuando se analizan datos en las eventos destacados o patrones, que permitir´ an
empresas, por ejemplo, para asesorarse en el proceso de toma de una mejor toma de decisiones. Si esta nueva informaci´ on
decisiones. De hecho, el tiempo juega un papel muy importante en los se encuentra representada en formato textual con patrones similares a los
almacenes de datos, o data warehouses, debido a que esta dimensi´ usados por los humanos cuando se comunican entre ellos, la toma de
on permite almacenar decisiones se desarrollar´ a de forma m´ as
la informaci´ on hist´ orica concerniente a las operaciones diarias amigable para el decisor.
46 CANILLAS DE ACEITUNO, MÁLAGA
IV. R ESUMEN LING ¨ U ´ ISTICO DE DATOS CON T ´ ECNICAS V. H ACIA UNA VERSI ´ ON LING ¨ U ´ ISTICA DE FC UBE
DIFUSAS F ACTORY
complejos.
Anteriormente ya ha sido mencionado el fuerte v´ınculo que muchos
autores comienzan a ver entre las t´ ecnicas de miner´ıa
!•" D•"
pero sobre todo los res´ umenes ling¨ u´ısticos de series de datos D D
los trabajos de D´ıaz et al. [14], Trivi˜ no et al. [15] y Moreno Most of the patient inflow is low or very low with cold weather;
[16]. medium in seasons with cold to hot
II JORNADAS ANDALUZAS DE INFORMÁTICA, JAI2011 47
weather, May, and June; very high or high in July and August; Se ha identificado la necesidad de introducir el resumen ling¨
and high or medium in September and October. Finally, at least u´ıstico en este campo con el fin de conseguir m´ etodos
70% of patient inflow is low or very low in November. r´apidos, sencillos y que produzcan resultados informativos, de calidad y
amigables para los usuarios. Los resultados obtenidos siguiendo patrones
FCube Factory es una plataforma web que nos permite la manipulaci´ semejantes a los del lenguaje natural ser´ an
on de grandes cantidades de datos almacena- mucho m´ as legibles y por lo tanto ´ utiles para su posterior uso.
dos siguiendo el modelo multidimensional ([12], [22]). En su versi´ Los res´ umenes ling¨ u´ısticos de series de datos se presentan
on inicial se implementaron diversas t´ ecnicas que como una herramienta de gran utilidad en el ´ ambito del
ofrec´ıan informaci´ on novedosa obtenida a partir de los datos Business Intelligence en general y en el apoyo a la toma de decisiones en
almacenados. Las capacidades de esta potente plataforma se est´ particular.
an ampliando en la actualidad mediante la adici´ on de la
R EFERENCES
posibilidad de obtenci´ on de res´ umenes de datos en general y
de series temporales en particular. [1] I. Z. Batyrshin and L. Sheremetov. Perception-based approach to time
series data mining. Appl. Soft Comput., 8(3):1211–1221, 2008. [2] I. Z. Batyrshin and T.
A trav´ es de la plataforma se pretende que el usuario tenga la posibilidad Sudkamp. Perception based data mining and
de consultar cubos de datos multidimensionales de forma r´ decision support systems. Int. J. Approx. Reasoning, 48(1):1–3, 2008. [3] R.
apida y sencilla, presentando los datos con diferentes formatos Castillo-Ortega, N. Mar´ın, and D. S´ anchez. Linguistic query answer-
ing on data cubes with time dimension. Special Topic Issue on Advances in Fuzzy
(incluyendo la s´ıntesis de audio a partir de los res´ Querying: Theory and Applications in International Journal of Intelligent Systems (IJIS), page
umenes), pudiendo consultar el conjunto de sentencias cuantificadas que To appear. [4] R. Castillo-Ortega, N. Mar´ın, and D. S´
conforman el resumen o un texto completo fruto del postprocesado de anchez. Fuzzy quantification-
based linguistic summaries in data cubes with hierarchical fuzzy partition of time dimension.
dichas sentencias. In H. Yin and E. Corchado, editors, IDEAL’09,
El an´ alisis de la variaci´ on de afluencia, esta vez a otro centro volume 5788 of LNCS, pages 578–585. Springer, Heidelberg, 2009. [5] R.
Castillo-Ortega, N. Mar´ın, and D. S´ anchez. Linguistic summary-
de salud, sigue siendo el tema en el siguiente ejemplo. En esta ocasi´
based query answering on data cubes with time dimension. In T. Andreasen, R. R. Yager,
on los resultados se han tomado directamente de la herramienta H. Bulskov, H. Christiansen, and H. L. Larsen, editors, FQAS’09, volume 5822 of LNAI, pages
FCube Factory (ver Figura 2). 560–571. Springer, Heidelberg, 2009. [6] R. Castillo-Ortega, N. Mar´ın, and D. S´
conjuntos de datos. No es extraordinario el hecho de tener que enfrentarse a probabilistic fuzzy quantifiers. In ESTYLF 2010, pages 255–260, 2010. [15] A. S.
Montemayor J. J. Pantrigo R. Cabido G. Trivi˜ no, A. S´ anchez and
una situaci´ on como la descrita, si E. G. Pardo. Linguistic description of traffic in a roundabout. In IEEE International
no frecuentemente, s´ı alguna vez en la vida. Las empresas, organizaciones Conference on Fuzzy Systems - FUZZ-IEEE (WCCI 2010 IEEE World Congress on
e instituciones dependen en gran medida de llevar este proceso a cabo de Computational Intelligence), pages 2158–
2165, 2009.
forma eficaz. [16] J. Moreno Garc´ıa, J. J. Castro-Schez, and L. Jim´ enez. A fuzzy inductive
Es vital el manejo de importantes vol´ umenes de datos, pero algorithm for modeling dynamical systems in a comprehensible way.
IEEE T. Fuzzy Systems, 15(4):652–672, 2007. [17] J. Kacprzyk and A. Wilbik. Using fuzzy
m´as lo es el hecho de ser capaz de extraer informaci´ on ´util de
linguistic summaries for the
dichos datos. Una de las dimensiones m´ as reflejadas en estos comparison of time series: an application to the analysis of investment fund quotations. In
datos es la dimensi´ on temporal. Las empresas mantienen datos U. Kaymak J. P. Carvalho, D. Dubois and J. M. C. Sousa, editors, IFSA-EUSFLAT 2009, pages
1321–1326, 2009. [18] I. Kobayashi and N. Okumura. Verbalizing time-series data: With an
de su producci´ on, las ventas, los gastos, el stock de productos,
y tantas otras facetas similares, que reflejan su funcionamiento y su evoluci´ example of stock price trends. In IFSA/EUSFLAT Conf., pages 234–239,
on a lo largo del tiempo. 2009.
48 CANILLAS DE ACEITUNO, MÁLAGA
[19] A. Laurent. A new approach for the generation of fuzzy summaries [27] R. R. Yager. A human directed approach for data summarization. In
based on fuzzy multidimensional databases. Intell. Data Anal., 7:155– IEEE International Conference on Fuzzy Systems, pages 707–712, 2006. [28] L.A. Zadeh.
177, April 2003. Fuzzy sets. Information and Control, 8, 1965. [29] L. Zhang, Z. Pei, and H. Chen. Extracting fuzzy
[20] S. Mitra, Senior Member, Fellow, S. K. Pal, and P. Mitra. Data mining linguistic summaries
in soft computing framework: A survey. IEEE Transactions on Neural Networks, 13:3–14, based on including degree theory and fca. In Proceedings of the 12th international Fuzzy
2001. Systems Association world congress on Foundations of Fuzzy Logic and Soft Computing, IFSA
[21] D. Mladenic, N. Lavrac, M. Bohanec, and S Moyle, editors. Data Mining ’07, pages 273–283, Berlin, Heidelberg, 2007. Springer-Verlag.
and Decision Support, volume 745 of The Springer International Series in Engineering and
Computer Science. 2003.
[22] C. Molina, L. Rodr´ıguez Ariza, D. S´ anchez, and M. A. Vila Miranda. A
new fuzzy multidimensional model. IEEE T. Fuzzy Systems, 14(6):897–
912, 2006.
[23] J. A. O’Brien and G. M. Marakas. Management information systems.
McGraw-Hill, 8 edition, 2008. [24]
Daniel Pe˜ na. Analisis de Series Temporales. Alianza, 2005.
[25] R. R. Yager. A new approach to the summarization of data. Information
Sciences, ( 28):69–86, 1982.
[26] R. R. Yager. Toward a language for specifying summarizing statis-
tics. IEEE Transactions on Systems, Man, and Cybernetics, Part B,
33(2):177–187, 2003.
II JORNADAS ANDALUZAS DE INFORMÁTICA, JAI2011 49
Luis Cerda*, Juan Horacio Campos †, Mario Rojas †, and Daniel Sánchez ‡
e-mail: juanh.campos@uandresbello.edu ,
e-mail: jm.rojas@unab.cl .
‡ European Centre for Soft Computing, Mieres, Asturias, Spain, and with the Dept.
Resumen: El Fuzzy Balanced Scorecard ha sido propuesto por Bobillo, Delgado, Gómez-
Romero y López [BF09], para gestionar ámbitos caracterizados por la imprecisión y la
ambigüedad, en este trabajo se muestra su aplicación al aseguramiento de la calidad del proceso
formativo universitario de pre-grado y lo complementa con la extracción de reglas de asociación
difusa para mantener la vigencia de los indicadores gestión y sus metas.
Abstract — The Fuzzy Balanced Scorecard has been that the model in its original version is not apt to manage environments
proposed by Bobillo, Delgado, Gomez-Romero and Lopez, to manage areas where the performance measurement introduces fuzzy variables for this
characterized by the vagueness and ambiguity, this paper demonstrates its purpose Bobillo et. al. [2] proposed the so-called fuzzy Balanced
application to ensure quality of university learning process of
Scorecard, from now on, fuzzyBSC.
undergraduate and supplements it with the extraction of fuzzy association
rules to maintain the validity of the management indicators and its goals.
T
and also provides proactive support for decision-making leading to
HE high and increasing competitiveness of the Chilean educational
ensure quality.
system in the third cycle requires its suppliers to demonstrate that the
learning process made is with quality certified. Ensuring the quality of
the learning process involves handling the vagueness and ambiguity
The fuzzyBSC model is reinforced extracting useful and novel
inherent in the evaluation and monitoring of performance and efficiency
knowledge from historical databases that store transactions that the
of its protagonists (students and teachers), which represents a
learning process generates, which permits to verify the validity of the
challenge not overcome by conventional management tools.
processing rules, rates and targets.
profile of egress and their relevance to the needs of the environment and university selection tests.
of potential employers, finally the level of satisfaction with the learning o Number of citations and/or publications (adjusted for the number of
experience gained and the grade of fulfillment of expectations both in equivalent full-time teachers)
terms employability and in the level of monthly income received by the o Peer evaluation and/or evaluation of academic excellence.
graduate.
In this paper we include data from the main reference point, the
report "Working Future 2009/2010" sponsored by the Ministry of
This document presents the preliminary work for free adaptation of Education, University of Chile and Diego Portales University, and
fuzzyBSC to quality assurance of the learning process and the coordinated by the eminent national experts Patricio Meller and José
verification of validity of the processing rules through data mining Joaquin Brunner.
techniques and it is established the future work to develop to implement
it as solution for the quality assurance of the learning process of an
B. Learning Process Quality Control
academic unit of undergraduate.
Although the indicators identified in the previous section, of one way
or another way, sanction the quality of the result of the learning process,
they do not control it, for these effects and in this sense, for this work is
This paper is organized as follows: Section 2 shows the
considered, as benchmark, the systematic model of Education System
methodologies and main conceptual aspects of this work, Section 3
Quality, developed by Arturo De la Orden [4], which establishes the
describes the current status of field of study, Section 4 presents an
relationship of effectiveness, efficiency, functionality, level of use and
example, formulating a dimension of fuzzyBSC, the Section 5 shows the
allocation levels between inputs, functions, goals and objectives and
verification process of the indicators and fuzzyBSC goals through
education products.
extraction of mining fuzzy association rules, finally Section 6 contains
some conclusions of the work done and some ideas for future work.
It raises the
consistency between inputs, processes, products, goals and satisfaction
of social needs and expectations that define the quality of education as
A. Quality Indicators of the Learning Process Secondly, it notes the consistency of the product with the goals and
According to a study made by Fernández et. al. [3], international objectives, defines the quality of education as efficiency or effectiveness.
Universities; World Universities Ranking on the web, Asia's Best other hand, products, defines the quality of education as efficiency.
o Teachers/students ratio.
o Entry Qualifications, ie, high school grades and
II JORNADAS ANDALUZAS DE INFORMÁTICA, JAI2011 51
C. Step by Step Evaluation of the Learning Process D. Authentic Evaluation of the Learning Process
In Arturo de la Orden’s aforementioned work, it is noted that The demands of the environment requires that vocational learning is
the Joint Committee on Standards for comprehensive, meaning that learning and its evaluation also covers the
Educational Evaluation, believes that "the evaluation is the systematic cognitive aspect of yesteryear, whose evaluation was binary long time
determination of the value or merit of an object", the concept “value” (Knows/Does not know), covering behavioral, attitudinal and procedural
clearly indicates that any evaluation involves a value judgment and fields of the professional profile, to that end, the emerging technique of
therefore it may not be pretended neutrality, on the contrary, requires a evaluation in faculty who have accepted the challenge, is the authentic
defensible set of principles or ideals to determine the status of the object evaluation, which is aimed at assessing the level of skill development
of being evaluated with respect to such values. Often the value of object through action manifested, which, it claims to do these measurements
to be evaluated is specified on its merit or intrinsic value, this accounts with wider tasks such as troubleshooting. In assessing the domain of
for the subjectivity and vagueness inherent in the evaluation process that certain skills and competence should be applied an expert opinion,
this paper argues. which as in all areas, has a strong element of intuition and subjectivity of
the evaluator.
It also notes that the intended use of the results of the evaluation
(information and value judgment of the object), distinguishes two
E. Intuition, Subjectivity, and Vagueness of the Learning
categories called learning function and summative function, where the
Process Evaluation
first is an evaluation of processes and the summative function is a final
As Arturo de la Orden´s work aforementioned points out, evaluation
evaluation. To formative evaluation is given the proactive nature and
of the result of each stage takes the form of merit or intrinsic value,
whose function could be identified with permanent decisions-making on
which accounts for the intuition, subjectivity, vagueness and ambiguity
program processes, thus considering the summative evaluation as
that are inherent to the learning evaluation process, the analysis of the
retro-active with the function of demanding responsibility or
vagueness and ambiguity dates back to early last century and is one of
accountability as a consequent of the final results of the program, which
its highest expressions in 1965 with the work of Lotfi Zadeh [5], with the
tends to confirm the proposal to have a mechanism to permit monitoring
definition of fuzzy set that gives rise to the Theory of Possibility. This
step by step the learning process.
theory allows expressing in mathematical terms the approximate
reasoning which is used by man in everyday life, describing facts that
are not totally true or totally false, for that it is not apply the classical
logic or logic bivaluate. This theory of Fuzzy Logic allows using concepts
With regard to the concept of quality, De la Orden states "The lack of
concerning to reality, defining varying grades of membership and
a concept of quality as a benchmark for evaluation of an educational
following reasoning patterns similar to those of human thought, Kosko
system obviously is translated into the impossibility of establishing
[6]. For example, in the formal logic if a result is good, it can be score
criteria for the selection of variables as indicators, ensuring information
“achieved”, and otherwise “not achieved”, namely, true or false,
about something we call quality, whose identity is not determined", which
approved or disapproved, for fuzzy logic is possible to identify
leads us to propose the verification of indicators and targets by applying
intermediate outcomes such as competition grades as proposed by Gil
data mining to verify their relevance
Aluja [7] and interpretation of grades that notes the regulation of the
student, both are reflected in Table I.
He also notes that the connection with the movement focused on the
management and quality control and total quality, developed and
promoted by the business world, a concept that in the educational field
has a high level of ambiguity and scant operating as educational activity
guide, which is remedied with the concepts introduced by Bobillo in his fuzzy
In this sense, as manifested by Bobillo, the membership functions
BSC model.
used for the definitions of fuzzy sets such as triangular and trapezoidal
functions are fully applicable in this context.
TABLE I knowledge is a basic need, in our specific case, to determine trends and
I NTERPRETATION OF EVALUATION
patterns in a field in constant evolution and improvement that nowadays
Approved Levels of competition Grades
requires timely and effective decisions.
1.0 Fully competent
0.9 Competent 7 Excellent 6 Very
Yes 0.8 Practically competent Good 5 Good 4
0.7 Enough competent Sufficient
The treatment, storage and processing of historical data with their
0.6 Nearly Competent respective linguistic labels for each results obtained by its protagonists,
0.5 Moderately competent in different learning
activities, are contributing the attributes that make a transaction in the
repository of historical data.
performed, this is solved using fuzzy variables that admits their values
The control of management or performance
are linguistic labels whose terms are defined as fuzzy sets (on some
management nowadays has an implicit relationship with the instrument
underlying domain).
presented in 1992 at the Harvard Business Review named the Balanced
Scorecard by Norton and Kaplan [1]. The objective of
this instrument is
continuously evaluating the organizational, group and individual
performance, from four perspectives:
The incorporation of linguistic labels, which, by its affinity with the
way of human´s reasoning, have characteristics appropriate to meet this
challenge in addition to granting the ease of storing and processing 1) The perspective of organizational dynamics which permits to
evaluate the performance of members of the organization and its
historical data to extract further useful and novel knowledge hidden by
commitment to the vision, mission and strategic objectives of the
fuzzy association rules which they provide the best result in similar
organization and this performance is the basis for the following
situations as described by Delgado et. al. [8].
perspectives.
corresponds to the perspective of user/beneficiary when dealing with contribution is measured in terms of the progress of implementation of
non-profit entities as stated by María José González Quintana and commitments by teachers and the result of the evaluation by the
Encarnación Cañadas in [11]), which permits to determine the added students of teachers' work in relation to the validity and appropriateness
value to stakeholders and the positive externalities that generates the of content and activities developed by teachers in their subject, among
environment and society in general. others.
I. BSC as a Management Control Model of the 2) For the perspective of internal processes providing an efficient and
Learning Process effective learning process with good indicators that allow the level of
progress in content and activity of the subject that lead to achievement
In the work published by Leonel Arias et. al. [12], it is raised the of the professional profile of the student and to determine the level of
application of the BSC in public higher education institutions and they retention timely (attendance of pupils) and risk conditions of repeat that
build the strategic map considering for Human Capital perspective and attacks against the actual duration of the career, this requires evaluating
Organizational Dynamics evaluate the alliance with other institutions, the the development attained in skills and knowledge by students and by
learning programs , technology and know-how (Know How), the internal fulfillment of progress level of the program of subject, timeliness and
process perspective, consider completeness of content delivery and implementation of planned
activities and evaluations, among others.
the research, extension, administrative
modernization and academic reform among others, on the customer
perspective where applicants, students,
graduates and employers are included, consider
efficiency and effectiveness in research, extension and teaching and 3) For the perspective of customers (students)
finally in the Financial perspective or Contribution of Interest Group, s providing excellent learning to attract the best applicants and students
consider the community, public and private companies, and other getting good indicators in number of stakeholders and last registered
indicators such as the egress of skilled professionals, knowledge scores and good grades from the student and teacher, that is measured
transfer to society and improving quality of life of the community, in our in terms of satisfaction for the learning experience of students and
case we consider to graduates and potential employers are part of the indicators of attendance and punctuality to classes, student academic
users/beneficiaries scale. performance and level of commitment and involvement with the process
of learning to learn.
J. Fuzzy BSC Applied to the Learning Process 4) For user/beneficiary perspective (contribution to the milieu and
Interest Groups, such as society, employers and graduates): Contributing
Bobillo's work et. al., to incorporate the treatment of uncertainty and to the milieu a graduate with a comprehensive education that contributes
ambiguity to the BSC, transforms it and presents it as a valid option for professionally to the discipline and growth and development of the
continuous evaluation of the performance of the different roles and society, measured by the level of employability of
different stages of the learning process that this work aims to obtain.
graduates and the financial
compensation that they receive (monthly income from the first and fifth
The proposed design for the different perspectives of fuzzyBSC to year out of school) as well as evaluated its contribution to the
continuously evaluate the learning process under study is the following: environment in terms of number, quality and evaluation of professional
practices carried out, early employability and evaluation to contribution
as community services in consulting and business support to
1) The basis perspective is of organizational dynamics entrepreneurs.
(Faculty and Staff): The strategic objective of the teaching unit is to have
excellence faculty and staff. Indicators that permit to verify fulfillment with
these objective, are, for example teachers/students ratio, the number of For example, the fuzzyBSC could be configured with the following
citations and/or publication of full-time teachers and those that measure indicators and targets:
the organizational climate conductive to excellent learning experience of
their students. 1) Organizational Dynamics Dimension or
Perspective:
TABLE II
R ESULTS OF Q UALITY C ERTIFICATIONS
Number of teachers with grades and graduate, maintaining a higher
than average rate of school of the discipline with an annual growth by Units Total Certified Rejected
10%. Universities 65 56 9
Professional Institutes 43 11 1
Technical Learning Centers 74 8 2
2) Internal Processes Dimension:
Armed Forces Institutions 3 3 3
Careers 7746 444 8
Retention = abandonment of the career by class/total enrolled Master Programs 768 179 8
number by class, the goal is to have below than average rates of school PhD Programs 170 118 5
In the particular case under study, the career has about 20 years of
existence with an accumulated historical enrollment of 3,906 students.
Wage levels higher the average for graduates of schools of discipline,
Of which 1.732 belong to daytime class and 2.174 evening class.
reducing the gap in annual rates of 10%.
Today the career gives more than 100 courses per semester for its
III. S COPE OF S TUDY
853 active students.
The status of certified quality of the learning process of the university
system for undergraduate students, according to the Higher Education
IV. E XAMPLE OF A PPLICATION
Council of Chile, are summarized in Table II, which states that only 444
As an example, it is only presented the internal process dimension of
of
fuzzyBSC, the data used are from the first semester of the first year, in
7.746 careers (6%), with certified quality . Moreover
particular the class entering the career in 2009. The exploratory analysis
4.327 careers (56%) belong to universities with institutional quality
of these data is performed using the results of the 5 initial subjects that
certified, there is not binding
make up the curriculum, these data show the distribution of students per
relationship between the certified quality of the institution and the quality
course shown in Table III:
of the learning process specific to each careers, a situation that is being
resolved. For postgraduate programs, 1083 programs are offered, of
which 79% belongs to such accredited institutions, and 28% of these
programs are with certified quality.
II JORNADAS ANDALUZAS DE INFORMÁTICA, JAI2011 55
TABLE III final average grade and improve it at the rate of 10% per semester.
C OURSES FOR SUBJECTS OF 1 ST S EMESTER.
From exploratory analysis of data for the results of the first semester
363 transactions representing the results obtained by students in
of the students entering in 2009, and the opinion of teachers involved in
each of their subjects.
their learning process, who suggesting as an answer to the question
"What are the characteristics of students in first year who obtaining good
In processing these transactions, it will get the
results during the learning process?”, they respond as follows:
following fuzzy association rules:
Future work consists of extending the verification process to all [4] A. de la Orden, “Evaluación y calidad: análisis de un modelo”, Estudios sobre
Educación, 16, pp. 17-36, Servicios de Publicaciones de la U. de Navarra, 2009.
dimensions of fuzzyBSC design, through data mining process. Construct
[5] L.A. Zadeh, “Fuzzy Sets”, Information and Control. 8, pp. 338-
and implement the proposed model, considering the necessary
interfaces to capture and consolidate data coming from different existing 353., 1965.
[6] B. Kosko, “Fuzzy systems as universal approximators”. IEEE Transactions on
information systems and building up a database which allows to manage
Computers, 43 (11), pp. 1329-1333, 1994. [7] J. Gil Aluja, “Nuevas técnicas para la
online the quality of learning process of undergraduate college, with a gestión de empresas. Retos Empresariales”, Management Empresa, Universidad de
repository of historical transactions that periodically allows performing Barcelona,
1997.
the data mining process that helps maintain in force the management
[8] M. Delgado, N. Marín, D. Sánchez, and M.A. Vila, “Fuzzy Association Rules: General
indicators and process goals. Model and Applications”, IEEE Transactions on Fuzzy Systems 11(2), pp. 214–225,
2003. [9] R. Agrawal, T. Imielinski, and A. Swami. “Mining associations between sets of
items in massive databases”. In ACM-SIGMOD International Conference on Data, pp.
207–216, 1993. [10] F. Berzal, I. Blanco, D. Sánchez, and M.A. Vila., “Measuring the
Accuracy and Interest of Association rules: A New Framework.”, Intelligent Data
Analysis 6(3) pp. 221–235, 2002. [11] M.J. González and M.E. Cañadas M, “Los
R EFERENCES indicadores de gestión y el cuadro de mando en las entidades no lucrativas”,
CIRIECESPAÑA 63 pp. 227-252, 2008. [12] L. Arias-Montoya, J.C.
[1] R.S. Kaplan and D.P. Norton, “ The Balanced Scorecard: Measures that drive
Castaño-Benjumea, A.M. Lanzas-Duque, Scientia et Técnica Año XI, 27, 2005,
performance”, Harvard Business Review, 1992. [2] F. Bobillo, M. Delgado, J.
181-184.
Gómez-Romero, and E. López, “A semantic fuzzy expert system for a fuzzy balanced
scorecard”, Expert System with Applications 36, pp. 423-433, 2009. [3] R. Fernández, Y.
Martínez, N. Velasco, “Indicadores y estandares internacionales de calidad
universitaria”, Revista Calidad de la Educación 25, pp. 17-29, 2006
II JORNADAS ANDALUZAS DE INFORMÁTICA, JAI2011 57