Sunteți pe pagina 1din 13

Universidad de la Amazonia

RECONOCIMIENTO OPTICO DE CARACTERES OCR


Carolina Silva Barreto
Universidad de la amazonia
Florencia, Colombia
{c.silva}@udla.edu.co

Resumen En este artculo se describirn las


tcnicas de Reconocimiento ptico de Caracteres
OCR (Optical Character Recognition) las cuales son
utilizadas para desarrollar programas orientados al
OCR, que se encargan de dar solucin a problemas
que se presentan hoy en da. Teniendo en cuenta
proyectos que se han desarrollado a travs de la
utilizacin del reconocimiento de OCR. El uso del
reconocimiento de patrones ha sido un avance
tecnolgico innovador que la humanidad ha podido
llegar a tener a su alcance, sin embrago para la
realizacin de programas que perciban la gran
cantidad de
informacin que se maneja en
materiales escritos como libros escritos antiguos o
algn otro tipo de material es necesario hacer uso de
tcnicas o tareas especficas que contribuyan al
desarrollo exitoso de estos programas de
reconocimiento de caracteres.

cabo a travs del uso de las diferentes tcnicas y


algoritmos caractersticos que presentan los OCR.

Palabras claves Reconocimiento ptico de


Caracteres OCR, Anlisis de Imgenes, tcnicas,
clasificador de mnima distancia, reconocimiento de
patrones, esqueletizacin, red neuronal.

Las redes neuronales son un paradigma de


aprendizaje y procesamiento de datos, perteneciente
a la disciplina de la Inteligencia Artificial, inspirado
en la forma en que funciona el cerebro humano.
Una red neuronal est compuesta por la
interconexin de neuronas artificiales (estructuras
de programacin) que presentan un comportamiento
individual simple, pero que en su conjunto pueden
manifestar un comportamiento global de alta
complejidad. Para lograr este funcionamiento
global, las redes neuronales deben ser entrenadas,
de forma que se configuren las interconexiones
entre sus nodos. Su funcionamiento puede verse
como el de una caja negra, en cuanto a que, tanto
para su entrenamiento como para su utilizacin, no
es necesario conocer su configuracin. [44]

I. INTRODUCCIN
Hoy en da automatizar los procesos que se llevan a
cabo es una de las principales actividades que se
tienen en cuenta, es por eso que las nuevas
tecnologas han permitido desarrollar programas
software orientado al Reconocimiento ptico De
Caracteres con el fin de minimizar el tiempo de
ejecucin de algunas tareas realizadas manualmente
por seres humanos. Entre uno de los aspectos ms
importantes a destacar en el presente escrito son la
gran variedad de proyectos que se han llevado a

Grupo de Investigacin GIECOM

II. MARCO TEORICO


La digitalizacin de la informacin se ha convertido
en los ltimos aos en un punto creciente de inters
y de gran atencin en beneficio para la sociedad. En
el caso especfico de los textos, existen y se generan
continuamente grandes cantidades de informacin
escrita, tipogrfica o manuscrita. [41] Por tal razn
se debe poder automatizar la introduccin de
caracteres evitando la entrada por teclado, implica
un importante ahorro de recursos humanos y un
aumento de la productividad, al mismo tiempo que
se mantiene, o hasta se mejora, la calidad de
muchos servicios.

Las Redes Neuronales son sistemas de computacin


que permiten la resolucin de problemas que no
pueden ser descritos fcilmente mediante un
enfoque algortmico tradicional, como, por ejemplo,

Universidad de la Amazonia

ocurre en el reconocimiento de formas. Con las


redes se expresa las soluciones en un problema, no
como una secuencia de pasos, sino como la
evolucin en un sistema inspirado en el
funcionamiento del cerebro y dotado, por tanto, de
cierta "inteligencia". Tal sistema no es sino la
combinacin de una gran cantidad de elementos
simples de proceso (nodos o neuronas)
interconectados que, operando de forma
masivamente paralela, consiguen resolver el
problema. [35]
El Reconocimiento ptico de Caracteres (ROC), as
como el reconocimiento de texto, en general son
aplicaciones dirigidas a la digitalizacin de textos.
Identifican automticamente smbolos o caracteres
que pertenecen a un determinado alfabeto, a partir
de una imagen para almacenarla en forma de datos
con los que podremos interactuar mediante un
programa de edicin de texto o similar. Con
frecuencia se abrevia en textos escritos en espaol
utilizando el acrnico a partir del ingls OCR. [28]
Los OCR son un tipo de software que se encarga del
reconocimiento ptico de caracteres. Se encarga de
extraer de una imagen los caracteres de un texto y
los guarda en un formato que pueda editarse como
texto. Sirve para guardar en forma de texto
imgenes escaneadas de un libro sin digitalizarlo, o
sea ingresar carcter por carcter en un editor de
texto. Los sistemas son relativamente fiables
aunque suelen fallar si las imgenes o las letras no
son claras. Para identificar los caracteres, el sistema
analiza la imagen pixel a pixel, buscando formas que
coincidan con las caractersticas de los caracteres. El
software buscar coincidencias con los caracteres y
fuentes disponibles en el sistema, o tratar de
identificar los caracteres a travs del anlisis de sus
caractersticas, de forma que el reconocimiento de los
mismos no se limite exclusivamente a un determinado
nmero de fuentes. [41]
El reconocimiento ptico de caracteres, es un rea
de investigacin importante en reconocimiento de
patrones. El objetivo de un sistema OCR, es
reconocer letras del alfabeto, nmeros y otros
caracteres, que estn en forma de imgenes
digitales sin ninguna intervencin humana. [46] este
sistema ptico de caracteres es una aplicacin
especfica del reconocimiento de patrones, que
hasta la actualidad no tiene un modelo de solucin

Grupo de Investigacin GIECOM

absolutamente superior. En su lugar, existen


numerosos mtodos de clasificacin automtica,
cada uno con sus ventajas y desventajas, que han
sido adaptados al reconocimiento de caracteres. Los
mtodos de clasificacin provienen de las
investigaciones en varios campos tales como: Redes
Neurales, Sistemas Difusos, Estadstica y Sistemas
Expertos, entre otros. Debe aclararse que estos
campos de estudio tienen tambin otras aplicaciones
adems del reconocimiento de patrones. [26]
El OCR intenta identificar las palabras por medido
de la proximidad de caracteres y reconstruirlas
segn la disposicin de la pgina original. El
software se basa en algoritmos que convierten las
letras representadas en una imagen digital en
caracteres
ASCII,
lenguaje
que
puede
posteriormente ser ledo y editado por algn
procesador de textos comn y corriente. De esta
manera se puede ahorrar una gran cantidad de
recursos humanos y se posibilita la bsqueda y
recuperacin de texto a travs de una computadora.
[19]
Para poder llevar a cabo el desarrollo de programas
orientado a los OCR es necesario utilizar algoritmos
de Reconocimiento ptico de Caracteres los cuales
tienen la finalidad de poder diferenciar un texto de
una imagen cualquiera. Para hacerlo se basan en 4
etapas:
Binarizacin, Fragmentacin o
Segmentacin de la imagen, Adelgazamiento de los
componentes y Comparacin con patrones.
BINARIZACIN
La binarizacin de una imagen digital consiste en
convertir la imagen digital en una imagen en blanco y
negro, de tal manera que se preserven las propiedades
esenciales de la imagen. [41]
Por lo tanto es conveniente convertir una imagen de
escala de grises, o una de color, en una imagen en
blanco y negro, de tal forma que se preserven las
propiedades esenciales de la imagen. Mediante este
proceso obtenemos una imagen en blanco y negro
donde quedan claramente marcados los contornos
de los caracteres y smbolos que contiene la imagen.
A partir de aqu podemos aislar las partes de la
imagen que contienen texto (ms transiciones entre
blanco y negro). [28]

FRAGMENTACIN O SEGMENTACIN

Universidad de la Amazonia

mientras que las empleadas en el reconocimiento de


caracteres en lnea se revisan [4]
Es una
manera bastante efectiva de extraer
caracteres de una imagen en blanco y negro es
buscar los conjuntos de pxeles que cumplen una
relacin de conexin entre s. Este mtodo
proporciona caracteres bien segmentados que
pueden analizarse sin problemas en el mdulo de
reconocimiento. [40]
La fragmentacin permite la descomposicin de un
texto en diferentes entidades lgicas, que han de ser
suficientemente invariables, para ser independientes
del escritor, y suficientemente significativas para su
reconocimiento.
ADELGAZAMIENTO DE LOS COMPONENTES
Es un procedimiento que consiste en ir borrando
sucesivamente los puntos de los contornos de cada
componente de forma que se conserve su tipologa.
La eliminacin de los puntos ha de seguir un
esquema de barridos sucesivos para que la imagen
contine teniendo las mismas proporciones que la
original y as conseguir que no quede deforme. Es
necesario hacer un barrido en paralelo, ms
claramente, sealar los pxeles borrables para
eliminarlos todos a la vez. Este proceso se lleva a
cabo para hacer posible la clasificacin y
reconocimiento, simplificando la forma de las
componentes. [28]
COMPARACION CON PATRONES
Es un proceso mediante el cual se compara los
caracteres obtenidos anteriormente con unos
tericos (patrones) almacenados en una base de
datos. El buen funcionamiento del ROC se basa en
gran medida a una buena definicin de esta etapa.
La aplicacin de los algoritmos de Reconocimiento
ptico de Caracteres han hecho un gran aporte a
los servicios en donde se han introducido estos
procesos para aumentar su rendimiento y otros que
se basan completamente en estas tecnologas.
El reconocimiento de escritura en lnea gana
nuevamente inters, no solo por el nmero de
aplicaciones donde este recurso es utilizado, sino
por el aumento de nuevos dispositivos de captura
que han sido desarrollados en la actualidad. Las
metodologas generales en reconocimiento de
patrones y procesamiento de imgenes se analizan,
Grupo de Investigacin GIECOM

Hoy en da se maneja una gran cantidad de


informacin en las organizaciones u otras entidades,
a pesar que el avance de las tecnologas permite
hacer uso de herramientas que facilitan el
almacenamiento de datos, todava se utilizan los
materiales impresos donde se guarda informacin o
textos escritos los cuales todava son importantes
para llevar a cabo actividades. Sin embargo en
bsqueda de soluciones a los problemas y optimizar
tiempo y recursos ha surgido el Reconocimiento
ptico de Caracteres OCR (Optical Character
Recognition) se define como una herramienta de
software que convierte los caracteres alfanumricos
capturados por medio del scanner, a cdigos ASCII,
con el fin de posibilitar el proceso de indexado de lo
que se almacena [2]
Los programas OCR pueden lograr capturar toda la
informacin que se requiere de un texto escrito y
almacenarla en dispositivos sin necesidad de
realizar la ardua tarea de transcribir a la maquina los
datos existentes en papel. El OCR tiene infinidad de
campos de aplicacin, con la nica certeza que
ayuda o mejora muchas de las actividades que se
llevan a cabo por seres humanos.
El principal propsito que tiene el Reconocimiento
de Caracteres es el anlisis de imgenes que se
conoce como un proceso que consiste en descubrir,
identificar y comprender los patrones que son
relevantes en el rendimiento de un trabajo basado en
imgenes. Uno de los principales objetivos del
anlisis de imgenes por computadora consiste en
dotar a una mquina, en algn sentido, de la
capacidad de aproximacin, similar a la de los seres
humanos. [1]
Teniendo en cuenta lo anterior mencionado para
lograr el desarrollo de programas orientados al
Reconocimiento ptico de Caracteres es necesario
conocer las tcnicas utilizadas en este campo.
III. TECNICAS Y ALGORITMOS
PARA
RECONOCIEMNTO DE CARACTERES

EL

Con el auge de las nuevas tecnologas y los


formatos electrnicos para los documentos, mejorar
y avanzan tambin las tcnicas de reconocimiento
ptico de caracteres (OCR) con las que es un poco

Universidad de la Amazonia

ms fcil realizar los procesos de desarrollar


programas que estn orientados al (OCR), a
continuacin se describen algunas tcnicas
aplicables en el tema anteriormente mencionado.

A pesar que se tienen dos imgenes binarias


distintas con dos vectores iguales, se puede observar
en la siguiente figura

i. CLASIFICADOR DE MNIMA DISTANCIA


Esta tcnica se utiliza para el reconocimiento de
dgitos numricos, la cual consiste en convertir e
interpretar una imagen capturada como un dgito
entre cero y nueve. Entonces si se quiere desarrollar
un programa orientado al Reconociento ptico de
caracteres, es necesario digitalizar una imagen con
la representacin en una matriz de ceros y unos
donde cero es blanco y un uno negro. A
continuacin se explica cmo realizar el proceso.
El primer problema que tenemos es encontrar unos
buenos descriptores para cada imagen, que
describan con bastante exactitud el patrn de la
imagen correspondiente, y que adems nos permita
calcular con facilidad la distancia de ese patrn a
cualquier otro patrn de descriptores.
Pensamos que un buen patrn para describir una
imagen binaria con exactitud y considerando esa
imagen binaria como una matriz de unos y ceros, es
el nmero de unos que tiene cada columna, es decir,
si la primera columna de esta matriz tiene un
nmero n de unos, el primer valor del vector ser
n. Siguiendo con este barrido horizontal de la
matriz (de izquierda a derecha) obtenemos un
vector con unos valores (descriptores) que describen
esa imagen binaria de una manera bastante
fidedigna. [1]

Figura 1. Imagen que representa el nmero de unos en cada


columna

Grupo de Investigacin GIECOM

Figura 2. Dos imgenes distintas con el mismo patrn

ii. RECONOCIMIENTO DE PATRONES


Dentro del Reconocimiento ptico de Caracteres
se da a conocer tambin la tcnica de
reconocimiento de patrones, la cual consiste en el
estudio de los mecanismos por los que las seales
externas estimulan los rganos sensoriales y se
convierten
en
experiencias
perceptibles
significativas.
El reconocimiento patrones es una disciplina en
continuo desarrollo en los ltimos aos, sobre todo
en el campo del anlisis de imgenes y la visin por
computador. Las redes neuronales artificiales son
una herramienta muy potente dentro de este campo,
particularmente los mapas auto organizados de
Kohonen (SOFM) (1997), ya que son capaces de
detectar la topologa y la distribucin de
probabilidad de los patrones de entrada. [3]

Universidad de la Amazonia

La tcnica de reconocimiento de patrones maneja


tres procesos:
1. Adquisicin y preproceso de datos.
2. Extraccin de caractersticas.
3. Toma de decisiones o agrupamiento como se
muestra en la siguiente figura. [2]

Esta tcnica se toma en cuenta para proyectos que


se relacionan con la captura e interpretacin de
datos numricos, ya que proporciona gracias a las
medidas que toma de separar cada patrn y
estudiarlo para posteriormente unir u y poder
conocer el anlisis del esqueleto recopilado en la
primera fase.
iv. TCNICA PARA EL RECONOCIMIENTO
DE CARACTERES GOCR

Figura 3. Imagen que representa el proceso de


reconocimiento de patrones

El reconocimiento de patrones utiliza el mtodo de


capturar una imagen con cualquier aparato scanner
y despus continuar con sus fases de proceso para
lograr desarrollar el sistema que identifique los
patrones que se desean analizar. Esta tcnica es muy
utilizada y recae cada da ms en aplicaciones para
sistemas educativos.

Desarrollada por Joerg Schulenburg, se basa en un


conjunto de reglas, es portable a diferentes sistemas
operativos, el tamao de las fuentes que soporta esta
tcnica es entre 20 - 60 pxeles y acepta muchos
formatos de imgenes, como pnm, PBM, pgm, ppm,
pcx, tga. Sin embargo, tiene inconvenientes con
letras cursivas, texto escrito a mano, adicionalmente
es muy sensible a imgenes que contenga ruido y
grandes ngulos de inclinacin, por lo que se
necesita de un grfico de alta calidad para conseguir
buenos resultados.[7]

v. BACKPROPAGATION

iii. ESQUELETIZACION
La esqueletizacin (palabra tcnica procedente del
vocablo ingls skeletonization) es un proceso
mediante el cual se transforma una determinada
forma u objeto de una imagen digital, compuesta de
una determinada cantidad de pixeles, en un objeto
basado en lneas, de forma que las propiedades
topolgicas del objeto se preserven. Este objeto
resultante constituido por lneas se denomina
esqueleto. [12]
Los esqueletos son muy tiles a la hora de
reconocer, dentro de una imagen, objetos o patrones
que sean alargados o con una determinada forma
como por ejemplo caracteres, polgonos, patrones
cromosmicos, etc. Los esqueletos proporcionan
una abstraccin de las caractersticas topolgicas y
geomtricas del objeto, de forma que al almacenarse
slo una determinada informacin estructural de los
objetos en estudio, la esqueletizacin puede verse
tambin como un proceso de compresin de
datos.[3]

Grupo de Investigacin GIECOM

El desarrollo del algoritmo back propagation


proporciona un mtodo eficiente para entrenar este
tipo de redes. Su importancia est en su capacidad
de auto adaptar los pesos de las neuronas
intermedias para aprender la relacin que existe
entre el conjunto de vectores o patrones de entrada
y su correspondiente salida, y poder aplicar esa
relacin despus del entrenamiento a nuevos
vectores de entrada imperfectos o con ruido.[50]
La propagacin hacia atrs de errores o retro
propagacin es un algoritmo de aprendizaje
supervisado que se usa para entrenar redes
neuronales artificiales. El algoritmo consiste en
minimizar un error (comnmente cuadrtico) por
medio de gradiente descendiente, por lo que la parte
esencial del algoritmo es clculo de las derivadas
parciales de dicho error con respecto a los
parmetros de la red neuronal. [33]
vi. ALGORITMO DE CLASIFICACIN

Universidad de la Amazonia

Consiste en la extraccin de caractersticas


multicanal o basadas en filtros; el falsificador K-NN
es la ubicacin de sus vecinos cercanos. Se
determinan las dos clases ms probables, donde K
es el nmero natural especificado por el usuario. El
desarrollo de estos algoritmos nos permite la
bsqueda de nuevas alternativas y mejoras a los
sistemas de identificacin biomtrica. [5]
vii. EXTRACCIN DE CARACTERSTICAS
La informacin contenida en el mapa de bits de
una imagen no es adecuada para el procesado
digital. Debido a esto, es necesario describir un
carcter de otra manera. La descripcin del
carcter debera ser invariable hacia el tipo de
fuente usado, o deformaciones causadas por el
proceso de centrado. Adems, en todos los casos
del mismo carcter debera tener una
descripcin similar. Una descripcin del carcter
consiste un vector de valores numerales,
llamados descriptores o patrones.
Generalmente, la descripcin de una regin de la
imagen est basada en su representacin interna
y externa. La representacin interna est basada
en sus propiedades regionales, como el color o
textura.
La
descripcin
de
caracteres
normalizados est basada en sus caractersticas
externas, ya que solo afectan a propiedades
como la forma del carcter. [17]
IV. APLICACIONES

En los ltimos aos la digitalizacin de la


informacin (textos, imgenes, sonido, etc.) ha sido
un punto de inters para la sociedad. Un caso
concreto es el de los textos, existen y se generan
continuamente grandes cantidades de informacin
escrita, tipogrfica o manuscrita en todo tipo de
soportes.
Existen varios proyectos que han sido desarrollados
haciendo uso del Reconocimiento de caracteres
OCR desarrollado como lo expone el articulo
Aplicacin de Redes Neurales en el reconocimiento
ptico de caracteres en donde se buscaba desarrollar
dos aplicaciones. La primera, miniOCR, ser una
aplicacin capaz de reconocer dgitos aislados

Grupo de Investigacin GIECOM

dibujados a mano en la misma a travs del mouse.


Luego, se desarrollar Calculadora, una segunda
aplicacin basada en miniOCR, que permita aplicar
a un caso de ejemplo las conclusiones del primer
desarrollo. En esta, el usuario podr obtener
respuestas de la computadora a operaciones
aritmticas simples dibujadas en su interfaz de
usuario. Teniendo como resultado final la primera
aplicacin miniOCR desarrollada que es capaz de
reconocer dgitos dibujados manualmente utilizando
el mouse. Abarca todo el proceso necesario para
llegar a dicho fin. [6]
La importancia de utilizar redes neuronales en el
desarrollo de proyectos se ve reflejado en el artculo
escrito por Aurelio Velazquez y dos compaeros
ms denominado Reconociendo Eficiente de
Caracteres Alfanumricos Provenientes de Mapas
Raster por Medio de Clasificadores Neuronales, el
cual consiste en analizar mapas cartogrficos con
leyendas en espaol por lo cual su artculo describe
una tcnica simple pero eficiente para el aprendizaje
de clasificadores neuronales, Redes Neuronales
(RNA) en este caso, Gracias al estudio y las pruebas
que se realizaron para lograr su objetivo se
concluy que el conjunto de RNA entrenado, puede
identificar cualquier tipo de caracteres [30] teniendo
en cuenta el estudio realizado para el
reconocimiento de mapas raster se puede decir que
es de vital importancia la utilizacin de las redes
neuronales en el reconocimiento de caracteres de
igual manera un programa que identifique y
minimice el tiempo de identificar este tipo de mapas
es de mucha utilidad.
Dentro la clasificacin de herramientas que se han
diseado a partir de los OCR encontramos la
miniOCR una aplicacin capaz de reconocer dgitos
aislados dibujados a mano en pantalla por el usuario
a travs del mouse. Utiliza una red neuronal
convencional adaptada para este fin. Comprende
tambin la recoleccin de muestras, el
entrenamiento y medicin de Rendimiento,
fundamentada en el artculo de Gabriel Constenla y
Sergio Omar Aguilera [6] acerca de esta aplicacin
desarrollada se nota la agilidad que tiene para poder
captar los dgitos dibujados manualmente utilizando
el mouse.

Universidad de la Amazonia

Un aporte interesante es el que se da a conocer en el


artculo de Cristian pozo en donde se denominado
Desarrollo de Algoritmos de Reconocimiento de
Placas de Vehculos presentado, en donde se
desarroll un algoritmo confiable para el
reconocimiento de placas vehiculares en la entrada
a un parqueadero mediante el procesamiento digital
de imgenes. Su propuesta consiste en que el
software localiza la placa vehicular dentro de la
imagen del vehculo y reconoce los caracteres y
nmeros que se encuentran dentro la misma. Para la
localizacin de la placa se emplea la estrategia
denominada Bsqueda de Patrones con la cual es
posible encontrar la palabra Ecuador presente en
el pas. [9] este proyecto desarrollado en el pas de
ecuador es una fiel afirmacin que la aplicacin de
los algoritmos de reconocimiento ptico de
caracteres es de mucha importancia ya que permite
que estacionamientos como parqueaderos sea
confiables.
El articulo Desarrollo de un modelo para el
seguimiento de patrones mediante reconocimiento
ptico, presenta el desarrollo de un sistema de
seguimiento de patrones por medio del
procesamiento de imgenes que pueda aplicarse en
cualquier mbito, nicamente variando las
caractersticas del objeto que se desea seguir, lo
cual permitira la aplicacin de diversos campos
donde se usen cmaras y sea necesario el
seguimiento de alguna caracterstica de un sujeto u
objeto. Tiene aplicacin en diferentes contextos
como sistemas de seguridad, filmacin automtica
de eventos deportivos (con una cmara programada
siguiendo un baln de ftbol a un jugador
especfico), entre otras. [10] el desarrollo de
aplicaciones como la anteriormente mencionadas
son tiles para la sociedad ya que aumentan la
seguridad en establecimientos pblicos y a su vez
permite a los aficionados de la televisin ver ms
detalladamente sus programas favoritos.
El reconocimiento ptico de caracteres tiene
infinidad de campos de aplicacin, un ejemplo claro
para demostrar esta afirmacin es el artculo
Deteccin automtica de presencia/ausencia de
atn en imgenes obtenidas mediante sonar de largo
alcance a bordo de buques pesqueros en donde se
presenta una metodologa para el anlisis
Grupo de Investigacin GIECOM

automatizado de las seales del sonar de largo


alcance y una aplicacin basada en la tcnica de
OCR, consiste en el anlisis de imgenes de sonar
mediante tcnicas de procesamiento de imgenes.
[11] es importante resaltar que los campos de
aplicacin de OCR no tiene delimitaciones lo
importante es identificar el problema que se quiere
solucionar y adecuar la mejor tcnica o algoritmo
para su desarrollo.
En un trabajo presentado en el 2011 como tesis de
grado, presentado por Edgar Barragn consista en
disear e implementar un sistema de control y
seguridad vehicular mediante la captura de la placa
del vehculo con una cmara infrarroja que puede
grabar video en cualquier condicin ambiental. [14]
lo que se buscaba con el desarrollo de este
programa de reconocimiento ptico de caracteres es
implementar una base de datos donde estn
registradas las placas vehiculares, con el fin de que
sea ms segura y confiable la entrada y salida de los
autos en lugares pblicos.
En el 2014 se desarroll el sistema DocLux que
permite el tratamiento de imgenes digitalizadas
por lotes; DocLux permite aplicar una serie de
filtros que posibilitan mejorar la calidad de las
imgenes. Se desarroll un prototipo de aplicacin
DocLux que permite reconocer y trascribir las
vocales minsculas sin tilde del lenguaje espaol.
Utilizando el motor Tesseract [15] el anterior
programa se llev a cabo ya que se necesitaba
recopilar la informacin que se encontraba en textos
antiguos pero por el paso del tiempo se encontraban
en muy mal estado y no se poda leer la informacin
por tal razn fue necesario desarrollar esta
aplicacin a travs del reconocimiento ptico de
caracteres.
En el artculo Herramienta de transcripcin
automtica de partituras musicales de importancia
dentro del patrimonio documental andaluz mediante
reconocimiento ptico de caracteres musicales
buscaba como objetivo global del Proyecto de
Investigacin desarrollar una herramienta de
transcripcin automtica de partituras musicales
escritas, tanto en grafa antigua como moderna, que
permite transcribir partituras musicales de
importancia, dentro del patrimonio documental

Universidad de la Amazonia

andaluz mediante reconocimiento ptico de


caracteres. Para desarrollar dicha herramienta [16]
Segn el artculo Reconocedor ptico De
Caracteres Manuscritos (ROCM) por medio de
redes neuronales realizado como opcin de grado
buscaba elaborar un programa que convierta la
informacin manuscrita, contenida en un archivo de
imagen, a formato texto para que el usuario pueda
manipularla con algn procesador o editor de texto
convencional; dicha conversin ser hecha con un
alto grado de fiabilidad usando redes neuronales
para la identificacin de caracteres.[22] este trabajo
que fue desarrollado tuvo xito con los resultados
que esperaban ya que obtuvieron un nueva funcin
a travs del reconocimiento de OCR.

documento a color o escala de grises.


Pre-Procesamiento. Clarificar la imagen, eliminar
ruido, convertir la imagen en blanco y negro.
Segmentacin de palabras. A partir del mapa de
bits de todo el documento, obtener las palabras
presentes. [23]

Figura 5.Modelo PRISCUS [23]

Figura 4.Etapas del Programa Reconocedor ptico De


Caracteres Manuscritos [22]

En Mxico se desarroll un proyecto para la


construccin de un sistema de reconocimiento
ptico de caracteres basado en redes neuronales
artificiales (RNA) y otros componentes de
inteligencia computacional y entendimiento de
lenguaje, especializado en el reconocimiento de
textos manuscritos y textos antiguos. EL objetivo de
PRISCUS es desarrollar un software inteligente
integral, que supere la problemtica intrnseca que
se presenta en los reconocedores convencionales al
trabajar con letra cursiva y textos antiguos. Para
poder llevar a cabo lo que se buscaba se necesit
aplicar el modelo o PRISCUS se compone de las
siguientes partes:
Digitalizacin. Creacin de una imagen digital del
Grupo de Investigacin GIECOM

Para resaltar el uso de las tcnicas ms utilizadas


para el Reconociendo de caracteres como se
evidencia en el artculo realizado por Carlos Javier
y Victor Sandonis indica que normalmente, las
tcnicas de OCR son tiles para digitalizar textos de
algn libro (caracteres impresos) o formularios
rellenados manualmente (caracteres manuscritos).
Tanto en un caso como en el otro el desglose de los
caracteres individuales es mucho ms sencillo que
en el caso de texto manuscrito continuo, para el que
es necesario la aplicacin de tcnicas de pre proceso
y segmentacin ms complejas que en el caso de
OCR. Una vez pre procesada la imagen se deber
fragmentar o segmentar en las diferentes
componentes conexas (parte de la imagen donde
todos los pxeles son adyacentes entre s) que la
componen. La fragmentacin o segmentacin de la
imagen constituye una de las mayores dificultades
del reconocimiento, y se hace necesaria para poder
reconocer cada uno de los caracteres de la imagen
binaria [31]
El articulo realizado por Carlos Chaoz denominado
Normalizacin de imgenes de placas vehiculares
a travs de correccin geomtrica se enfoc en

Universidad de la Amazonia

implementar un sistema de control de acceso


vehicular mediante el reconocimiento del nmero
de placa de manera automtica usando una cmara y
algoritmos de procesamiento de imgenes
incluyendo Reconocimiento ptico de Caracteres
(OCR). Para el reconocimiento de las placas se
tomara una imagen al vehculo al momento de
entrar a un parqueadero especfico. [20] gracias a lo
anterior expuesto podemos recalcar la importancia
de hacer uso de este sistema de reconocimiento
ptico de caracteres y los beneficios que se
obtienen.
Hoy en da se dispone de mucha informacin que se
encuentra documentada en medios fsicos, por eso
es tan importante desarrollar proyectos como el que
se desarroll en el artculo realizado por Eduardo,
Miguel; Gmez, Flores en donde se buscaba
elaborar un programa que convierta la informacin
manuscrita, contenida en un archivo de imagen, a
formato texto para que el usuario pueda manipularla
con algn procesador o editor de texto
convencional; dicha conversin ser hecha con un
alto grado de fiabilidad usando redes neuronales
para la identificacin de caracteres. [22]
El reconocimiento de caracteres pticos se ha
convertido en un reto de la tecnologa
contempornea debido a las inmensas cantidades de
aplicaciones que abracan el tema y a lo sofisticada
que es tcnica. Su popularidad radica en su
versatilidad y uso, que permite convertir material
impreso, mecanografiado o escrito manualmente
por medios computacionales sin necesidad de
digitar la informacin. [29]
El articulo
Reconocimiento Automtico de
Caracteres Manuscritos y Marcas, Orientado al
Procesado de Encuestas se enfoca en la
implementacin de un sistema de reconocimiento de
caracteres manuscritos y marcas, relevante para la
toma de informacin del contenido de grandes
volmenes de formularios (encuestas), la cual ser
utilizado por la Escuela de Ingenieras Elctrica,
Electrnica y de Telecomunicaciones de la
Universidad. [24] gracias al desarrollo de este
programa se pudo implementar un sistema de
carcter
cooperativo
capaz
de
extraer
automticamente la informacin de una encuesta
que contiene datos de marcas y/o letras maysculas
y nmeros; el sistema tiene una precisin para

Grupo de Investigacin GIECOM

reconocimiento de marcas del 100% y del 90% para


caracteres.
En el 2009 se hizo un estudio importante ya que se
desarroll y utilizacin de firmas vectoriales para el
reconocimiento de imgenes, aprovechando las
propiedades que presentan las transformadas de
Escala y de Fourier. Como primer caso, se
analizaron los dgitos del sistema decimal, escrito
cada uno en color blanco con fondo negro, tipo
Arial en tamao 144; a ellos se les aplicaron
rotaciones de 360 grados con variacin de un grado
y cambios de escala de 80 % a 120 % con
incrementos de 0.5 %. Como segundo caso, se
tomaron imgenes de 9 diferentes formas de hojas
de plantas, con variaciones en rotacin y escala
similares al caso anterior. Para cada imagen se
realizaron diferentes transformaciones matemticas
que permitieron obtener dos firmas vectoriales; para
encontrar el grado de semejanza entre las imgenes,
se compararon sus firmas vectoriales mediante la
Distancia euclidiana. [25] el programa que se
desarrollo fue de gran importancia es una de las
muestras de la gran cantidad de opciones que
tenemos a la mano para automatizar los procesos
que llevamos a diario.
Un proyecto destacado es el que se presenta en el
artculo denominado Sistema Control de Acceso a
Estacionamiento por Medio de Reconocimiento de
Placas Vehiculares que fue desarrollado en el 2012;
El dicho estudio se bas en disear y desarrollar un
sistema de cmputo para permitir el acceso a
estacionamientos, basado en reconocimiento de
placas automviles [47] desde mi punto de vista
contemplo que este tipo de proyectos que van de la
mano con la tecnologa es de vital importancia en la
sociedad de hoy ya que permite tener ms seguridad
y menos riesgos.
Es de gran importancia resaltar los proyectos que se
han desarrollado gracias al uso del Reconocimiento
ptico de Caracteres, un ejemplo de este caso es el
representado en el artculo Sistema de Conteo,
Identificacin y Clasificacin de Vehculos en un
Peaje en donde se desarroll de un sistema que
permite identificar, contar y clasificar de manera
automtica los vehculos presentes en un carril de
un peaje a partir de un video capturado del mismo.
Para ello el sistema detecta la llegada de un

Universidad de la Amazonia

vehculo al peaje mediante la deteccin de sus


luces, localiza la placa del vehculo, separa sus
caracteres, adems de detectar y contar el nmero
de llantas del mismo. [36]
A raz de la variedad de tcnicas y algoritmos que el
sistema OCR presenta se determinan un sin nmero
de aplicaciones, entre estas encontramos la expuesta
en el articulo Sistema de Control Vehicular
Utilizando Reconocimiento ptico de Caracteres en
donde su objetivo es realizar un control vehicular
mediante el Reconocimiento ptico de Caracteres
(OCR) de la Placa de un vehculo, utilizando una
cmara USB y posteriormente procesada en la
Plataforma de desarrollo National Instruments
Labview 8.2 en tiempo real. [38]
El avance de las nuevas tecnologas hoy en da
acapara todos los mbitos de desarrollo educativos
que existen, por ejemplo en el artculo presentado
por Milton Baque desarrolla un sistema que permite
verificar
y evaluar los caracteres y trazos
manuscritos utilizando la tecnologa en pantalla
tctil para captar las actividades que realiza un
estudiantes en la etapa de educacin inicial. [39] el
sistema desarrollado anteriormente me parece que
es uno de los mejores mtodos en donde se
involucran las tecnologas y aplicacin del
Reconocimiento ptico de Caracteres y los mas
beneficioso es que se involucra a los menores en sus
primeros ciclos de educacin.
En el artculo referenciado por Ivan Ruiz describe
el algoritmo
de in OCR
para un sistema
Automtico de acceso mediante el reconocimiento
de matrculas vehiculares, a travs de las tcnicas de
visin computacional. El software de ANPR utiliza
el reconocimiento ptico de caracteres, extrae de
una imagen los caracteres que componen un texto
para almacenarlos en un formato con el cual
puedan interactuar programas de edicin de texto.
[48]
Los sistemas de Reconocimiento ptico de
Caracteres hoy en da se han convertido en una
herramienta muy importante para agilizar algunos
procesos; una de estas se encuentra a servicio de
cualquier tipo de usuario, se conoce como FreeOCR.com es una herramienta gratuita en lnea de
OCR (Optical Character Recognition). Permite

Grupo de Investigacin GIECOM

10

utilizar este servicio para extraer el texto de


cualquier imagen que el usuario provee.
Es un servicio gratuito, sin necesidad de
registrarse. No se necesita direccin de correo
electrnico.
La nica condicin es
subir archivos de
imgenes. Free-OCR toma ya sea un archivo JPG,
GIF, TIFF BMP o PDF (slo la primera pgina).
La nica restriccin es que las imgenes no deben
ser ms grandes que 2 MB, no ms ancha o ms alta
que 5.000 pxeles y hay un lmite de 10 archivos de
imagen por hora.
V. CONCLUSION
Los Sistemas OCR es uno de los campos de
investigacin ms importantes en el rea de
reconocimiento de patrones ya que a raz de su
infinidad de aplicaciones aportan a mejorar y
automatizar los procesos; a travs de la
investigacin realizada se puede concluir que en la
actualidad muchas organizaciones ya hacen uso del
Reconocimiento ptico de caracteres gracias a su
efectividad.
Tambin es importante concluir que el manejo de
programas software que realicen el reconocimiento
de patrones se puede realizar en cualquier lenguaje
de programacin e incluso ya existen aplicaciones
que permiten solamente ejecutar las acciones y
obtener lo que se necesita.
REFERENCIAS
[1] Universidad de Sevilla Espaa Reconocedor

por Mnima Distancia,


http://www.sav.us.es/formaciononline/asignatur
as/asigpid/apartados/textos/recursos/rmd/docu
mentacion.zip, Noviembre-2003
[2] Facultad Politcnica, Universidad Nacional del
EsteCiudad del Este, ParaguayReconocimiento de
Patrones. Una propuesta de Correccin Automtica
de Test de Seleccin Mltipleautores Laura
Leticia Valenzuela Valenzuela y Gustavo Javier
Bez Villar
[3]. J.A. Gmez Ruiz, J. Muoz Prez, M.A. Garca
Bernal, E. Lpez Rubio Deteccin de esqueletos
de caracteres mediante una red neuronal
competitiva basada en segmentos

Universidad de la Amazonia

Inteligencia Artificial. Revista Iberoamericana de


Inteligencia Artificial, vol. 6, nm. 17, 18, 2002, pp.
7-22, Asociacin Espaola para la Inteligencia
Artificial Espaa
[4] Karina Toscano, Humberto Sossa, Ricardo
Barrn, Gabriel Snchez Reconocimiento de
caracteres manuscritos mediante informacin del
proceso inverso en la realizacin de su trazo[5] ACHING SAMATELO, Jorge L.; ROJAS
VIGO, David A. Algoritmos para el reconocimiento
de imgenes de huellas dactilares. ElectrnicaUNMSM, 2014, no 12, p. 11-20.
[6] AGUILERA, Sergio; CONSTENLA, Gabriel.
Aplicacin de Redes Neurales en el reconocimiento
ptico de caracteres. En XII Workshop de
Investigadores en Ciencias de la Computacin.
2010.
[7] GUTIERREZ, Richard, et al. Aplicacin de
Visin por Computador para el Reconocimiento
Automtico de Placas Vehiculares utilizando
OCRs Convencionales. 2011.
[8] FIGUEROA, Yumis, et al. APLICACIN WEB
DEL ICA PARA LA CONSTRUCCIN DE UNA
BASE DE DATOS DE MICROORGANISMOS
DEL RUMEN, BASADA EN UN RPIDO
ALGORITMO DE RECONOCIMIENTO DE
CARACTERES.
[9]
TASIGUANO
POZO,
Cristian
Andrs. Desarrollo de algoritmos de reconocimiento
de placas de vehculos. 2011. Tesis Doctoral.
QUITO/EPN/2011.
[10] LUNA, Rodrigo Andrs Franco; OSORIO,
Jos Andrs Chaves. Desarrollo de un modelo para
el
seguimiento
de
patrones
mediante
reconocimiento ptico.Scientia Et Technica, 2012,
vol. 17, no 50, p. 199-204.
[11] URANGA AIZPURUA, Jon. Deteccin
automtica de presencia/ausencia de atn en
imgenes obtenidas mediante sonar de largo alcance
a bordo de buques pesqueros y aplicacin de
Optical Character Recognition (OCR) para la
extraccin de parmetros. 2013; 5, 2013.
[12] RUIZ, JA Gmez, et al. Deteccin de
esqueletos de caracteres mediante una red neuronal
competitiva basada en segmentos. Inteligencia
Artificial, Revista Iberoamericana de Inteligencia
Artificial, 2002, no 17, p. 7-21.
[13] MONGE OSORIO, Manuel Alejandro. Diseo
de una arquitectura para una red neuronal artificial

Grupo de Investigacin GIECOM

11

perceptron multicapa sobre una FPGA aplicada al


reconocimiento de caracteres. 2011.
[14] BARRAGN DEL POZO, Edgar Edison.
Diseo e Implementacin de un Sistema de Control
Vehicular Utilizando Reconocimiento Optico de
Caracteres en el Laboratorio de Automatizacin
Industrial de la EIS. 2012.
[15] CANTERO, Lisbet Milagros Guerra; LAGO,
Eriberto Vanegas. Doclux OCR: Software libre para
la restauracin y transcripcin de imgenes
archivsticas.3C Tecnologa, 2014, vol. 3, no 1.
[16] PREZ, Isabel Barbancho, et al. Herramientas
de transcripcin automtica de partituras musicales
de importancia dentro del Patrimonio Documental
Andaluz mediante reconocimiento ptico de
caracteres musicales. Papeles del Festival de
Msica Espaola de Cdiz., 2007, no 3, p. 247-333.
[17] CEBALLOS JIMNEZ, Samuel Enrique.
Identificacin y reconocimiento de matrculas de
automviles con MATLAB. 2012.
[18] PILLAJO, Tituaa; POLO, Tito. Lgica difusa
y extraccin de rasgos topolgicos para el
reconocimiento de caracteres manuscritos. 1997.
Tesis Doctoral. QUITO/EPN/1997.
[19] BALLESTEROS ESTRADA, Silvia Socorro.
Los problemas de identificacin de caracteres OCR
para la recuperacin de texto en el libro antiguo: un
anlisis de caso en el Fondo Antiguo de la
Biblioteca
Central,
UNAM. Biblioteca
Universitaria, vol. 15, no 1, p. 25-34.
[20] CHOEZ LVAREZ, Carlos Leonardo;
SALAS
GUERRERO,
Steve
Fernando;
VINTIMILLA, Boris X. Normalizacin de
imgenes de placas vehiculares a travs de
correccin geomtrica. 2013.
[21] AYALA CHARCA, Giancarlo. Reconocedor
ptico de caracteres de placas de automviles
empleando tcnicas de procesamiento digital de
imgenes. 2007.
[22]
EDUARDO,
MIGUEL;
GMEZ,
FLORES. RECONOCEDOR
PTICO
DE
CARACTERES MANUSCRITOS (ROCM) POR
MEDIO DE REDES NEURONALES. 2004. Tesis
Doctoral.
[23] FARFN, Eduardo Cuevas; GMEZ-GIL,
Pilar. PRISCUS: Reconocedor ptico de Caracteres
Manuscritos y Antiguos.
[24] DE ARMAS DOMNGUEZ, Roberto Carlos;
RODRGUEZ,
Lener
Samuel
Bautista.
RECONOCIMIENTO
AUTOMTICO
DE

Universidad de la Amazonia

CARACTERES MANUSCRITOS Y MARCAS,


ORIENTADO
AL
PROCESADO
DE
ENCUESTAS. 2005.
[25] LERMA, Jess R.; LVAREZ, Josu.
RECONOCIMIENTO
DE
CARACTERES
BASADO EN FIRMAS VECTORIALES. eGnosis, 2009, p. 1-7.
[26] ALBUJA DELGADO, Jorge. Reconocimiento
de caracteres manuscritos por medio de redes
neurales y neuro-difusas artificiales. 1995. Tesis
Doctoral. QUITO/EPN/2005.
[27]
BONILLA
MARTNEZ,
Eduardo
Gabriel. Reconocimiento de caracteres mediante
redes neuronales con MATLAB. 2005. Tesis
Doctoral. QUITO/EPN/2005.
[28] ALVARADO, Luca Chacn. Reconocimiento
de
Caracteres
pticos
Aplicaciones
en
Bibliotecas. Bibliotecas: Revista de la Escuela de
Bibliotecologa, Documentacin e Informacin,
1989, vol. 7, no 2.
[29] DURN GMEZ, Mauricio. Reconocimiento
de caracteres pticos OCR por medio de correlacin
y redes neuronales. 2013.
[30] VELZQUEZ, Aurelio; SOSSA, Humberto;
LEVACHKINE, Serguei. Reconocimiento Eficiente
de Caracteres Alfanumricos Provenientes de
Mapas Rster por Medio de Clasificadores
Neuronales. Test journal, 2002, vol. 6, no 1.
[31] SANCHEZ, carlos; Reconocimiento ptico de
Caracteres (OCR) revistar universidad carlos lll
[32] EL RECONOCIMIENTO PTICO DE
CARACTERES, O. C. R. 2. Reconocimiento
ptico de Caracteres. Directora General, p. 42.
[33] ORDOEZ, Juan, RECONOCIMIENTO
OPTICO DE CARACTERES OCR CON REDES
NEURONALES ESTADO DEL
ARTE,
universidad de loja.
[34] SARI, Toufik; KEFALI, Abderrahmane.
Recognition-free Retrieval of Old Arabic Document
Images. Computacin y Sistemas, 2011, vol. 15, no
2, p. 195-208.
[35] CALLISAYA UCHANI, Zenn Amado.
REDES NEURONALES EN OCR CON
RECONOCIMIENTO DE IMAGENES. Revista de
Informacin, Tecnologa y Sociedad, 2009, p. 78.
[36] QUINTERO, Juan Manuel; QUINTERO,
Pablo Andrs; SEPLVEDA, Julin Quiroga.
Sistema de Conteo, Identificacin y Clasificacin
de Vehculos en un Peaje.

Grupo de Investigacin GIECOM

12

[37] ANDRADE MIRANDA, Gustavo; LOPEZ


ENCALADA, Jose. Sistema De Control Vehicular
Utilizando Reconocimiento Optico De Caracteres.
2009. Tesis Doctoral.
[38] MIRANDA GUSTAVO, Andrade; LOPEZ
ENCALADA, Jose; CHAVEZ BURBANO,
Patricia. Sistema De Control Vehicular Utilizando
Reconocimiento ptico De Caracteres. 2009.
[39] AGURTO BAQUE, Milton, et al. Sistema de
evaluacin de actividades en la educacin inicial,
usando como medio el reconocimiento y
verificacin on-line de caracteres y trazos
manuscritos. 2011.
[40] GUPTA, Amar; HIELSCHER, Rafael Palacios.
Sistema de reconocimiento de caracteres para la
lectura automtica de cheques. En anales de
mecnica y electricidad. Asociacion de Ingenieros
del ICAI, 2003. p. 26-30.
[41] BETANCOURT SALAZAR, Silvana del
Roco; PONCE PROAO, Miguel Alejandro.
Sistema de reconocimiento ptico de caracteres,
como solucin al procesamiento digital de la
informacin en la Facultad de Ingeniera, Ciencias
Fsicas y Matemtica Especialidad-Informtica.
2012.
[42] MARI-DOMENEC, Francesca; BIA-PLATAS,
Alejandro. Tcnicas de produccin masiva de
contenidos para bibliotecas digitales. 2002.
[43] RODRGUEZ, Gustavo Adolfo Lara. Tcnicas
de reconocimiento de imgenes para la creacin de
fotomosaicos.
[44]
CONSTENLA,
Gabriel
Roberto.
Reconocimiento ptico de Dgitos con Redes
Neuronales. 2010.
[45] ARLANDIS, Joaqum, et al. Grupo de
Reconocimiento de Imgenes y Visin Artificial
(RIVA).
[46] MAYTA CHURA, William. Reconocimiento
automtico de dgitos manuscritos en base a
prototipos multivaluados. 2010.
[47]
SALDANA
PEREZ,
A.
N.
A.;
MAGDALENA, MARIA; XOCHIGUA JORGE,
ALEJANDRO. SISTEMA
CONTROL
DE
ACCESO A ESTACIONAMIENTO POR MEDIO
DE
RECONOCIMIENTO
DE
PLACAS
VEHICULARES. 2012. Tesis Doctoral.
[48] RUIZ DELGADO, IVAN ABEL. SISTEMA
DE
IDENTIFICACION
DE
PLACAS
VEHICULARES CON TECNICAS DE VISION
COMPUTACIONAL. 2012. Tesis Doctoral.

Universidad de la Amazonia

[49]
FDEZ,
Juan
M.
Lpez,
et
al.
RECONOCIMIENTO
AUTOMTICO
DE
MATRCULAS
USANDO
OPERADORES
MORFOLGICOS Y MLTIPLES REDES
NEURONALES.
[50] PLATA CHEJE, Rubn Wismark. MatLab &
Redes Neuronales. Revista de Informacin,
Tecnologa y Sociedad, 2008, p. 96.
Autores
Carolina Silva Barreto, estudiante de Ingeniera de
Sistemas de la Universidad de la Amazona
Florencia Caquet.

Grupo de Investigacin GIECOM

13

S-ar putea să vă placă și