Sunteți pe pagina 1din 7

Ing. Jess Tejerina R.

UPT 2011-I

Implicancia en la Digitalizacin

OCR OMR ICR


Las tecnologas OCR, ICR y OMR revolucionaron en su momento el mundo digital, al evitar tener que ingresar datos a mano en los ordenadores y reconocer automticamente los caracteres tanto impresos como manuscritos, as como las marcas en determinados formularios. A lo largo del tiempo han ido evolucionando y mejorando su efectividad, hasta que se han incorporado a nuestra vida diaria, ahorrndonos mucho tiempo y aumentando la productividad. ICR, OCR y OMR son todos mtodos orientados a disminuir la cantidad de entradas de datos manual en ambientes de procesamiento de formularios. ICR y OCR son dispositivos de reconocimiento usados con imgenes. OMR es una tecnologa de captura de datos que no requiere un dispositivo de reconocimiento, es utilizada cuando se requiere un alto grado de precisin. Un dispositivo de escaneo ptico combina equipo y programas de cmputo especializados. Los equipos capturan una imagen y los programas convierten esa imagen en informacin que puede ser leda por la computadora. Existen cuatro tipos de tecnologas de escaneo ptico:

Lector de marcas pticas (OMR por sus siglas en ingls) Reconocimiento de caracteres pticos (OCR) Reconocimiento inteligente de caracteres (ICR) Tecnologa de imagen

1. Lector de marcas pticas (OMR) La tecnologa OMR detecta la ausencia o presencia de una marca, pero no la forma de la marca. El software de Scantron interpreta la imagen del escner y la traduce en la imagen deseada ASCII. Los formularios son reproducidos por escner a travs de un escner OMR. Los formularios contienen pequeos crculos, llamados burbujas, que son completados por la persona encargada de llenar el formulario. La tecnologa OMR no es capaz de reconocer caracteres en letra manuscrita o a mquina; las imgenes de los formularios tampoco son reproducidas por el escner. Un escner de reproduccin de imgenes es capaz de procesar entre 1.200 y 7.500 formularios por hora. Sin embargo, no es la velocidad de reproduccin del escner la que determina la 1

Ing. Jess Tejerina R.

UPT 2011-I

Implicancia en la Digitalizacin

productividad de una aplicacin. Otros factores influyen en esta variable, tales como la cantidad de caracteres por pgina, el nmero de distintos tipos de documentos y el grado de legibilidad de la letra manuscrita. Un escner de reproduccin de imgenes es significativamente ms costoso que un escner OMR. A medida que el volumen de reproduccin por escner aumenta, se requiere una red de terminales y servidores para procesar dicha actividad. Una aplicacin esta rara vez limitada por la velocidad de reproduccin del escner, puede estar en cambio, limitada por el poder de procesamiento de la red. Un escner OMR es capaz de mantener un nivel de procesamiento de 2.000 a 10.000 formularios por hora. Esta actividad puede ser controlada y procesada por una sola terminal, que a su vez es capaz de manipular cualquier volumen que el escner genere. Incrementar la capacidad de procesamiento simplemente requiere mejorar el tipo de escner. Los software ICR y OCR no pueden ser utilizados con un escner OMR. Un OMR comprende tpicamente ciertas clases particulares de marcas que pueden ser ledas por un escner en un conjunto determinado de posiciones de una pgina. Los programas de cmputo utilizados por el escner OMR est programada para reconocer el significado de las distintas marcas y de convertir las imgenes escaneadas en informacin legible por la computadora de acuerdo a su ubicacin. Por ejemplo la mayora de las mquinas de votacin basadas en lectores (escaneo ptico) utilizan tecnologa de OMR La tecnologa OMR ha sido ampliamente utilizada desde la dcada de los 70's para distintos propsitos, incluyendo pruebas escolares y universitarias, censos, encuestas y sorteos, as como para votar. Tambin se utiliza en lectores de cdigo de barras, que se utilizan comnmente en comercios, bibliotecas y escuelas. A parte de los sistemas de votacin, hay otras aplicaciones potenciales de la tecnologa OMR. En Australia, por ejemplo, son utilizados para escanear las listas electorales marcadas en los sitios de votacin para indicar los nombres de los electores que han sufragado. Esto le permite a las autoridades electorales australianas automatizar la aplicacin de la ley para el voto obligatorio, as como identificar cualquier caso de votacin mltiple. 2

Ing. Jess Tejerina R.

UPT 2011-I

Implicancia en la Digitalizacin

Los sistemas de cdigo de barras OMR tambin se utilizan ampliamente en servicios postales. Muchas autoridades postales colocan cdigos de barras en la correspondencia para automatizar el proceso de entrega. Algunos pases tienen sistemas postales que permiten que los usuarios impriman cdigos de barra con sus direcciones en la correspondencia, para que las autoridades puedan procesarla sin tener que imprimir esos cdigos en sus instalaciones, generndole por tanto un descuento al usuario. Las autoridades electorales tambin estn haciendo uso del cdigo de barras en su correspondencia. Toda vez que los cdigos de barras pueden identificar tanto el nombre como la direccin del elector, pueden ser utilizados cuando la correspondencia es devuelta. Esto es particularmente til para automatizar la grabacin de los nombres de los electores que han votado por correo. Los cdigos de barras tambin pueden ser utilizados cuando la correspondencia es regresada porque el destinatario "no es conocido en este domicilio" a fin de capturar esa informacin para efectos de actualizacin de los listados electorales. La tecnologa OMR es muy til y eficiente para recabar informacin simple y predeterminada. Sin embargo no lo es para recabar informacin compleja o variable, como la que implica una gran cantidad de texto. Los sistemas OCR e ICR son ms apropiados para estos propsitos.

2. Sistemas de escaneo basados en el reconocimiento de caracteres pticos (OCR) La tecnologa OCR proporciona a los sistemas de reproduccin por escner y sistemas de imgenes la habilidad de convertir imgenes de caracteres en letra de mquina, en caracteres capaces de ser interpretados o reconocidos por una computadora. As, las imgenes de caracteres en letra de mquina son extradas de un mapa de bits de la imagen reproducida por el escner. Estos sistemas toman imgenes escaneadas y utilizan programas de cmputo para reconocer las formas de los caracteres impresos o escritos a mano, como nmeros o letras, y los almacenan como informacin que puede ser leda por la computadora. Los sistemas OCR son utilizados normalmente para convertir un texto impreso en legible para la computadora. Esta capacidad tiene potenciales aplicaciones en el campo electoral. Por ejemplo, a principios de la dcada de 1980, la Comisin Electoral de Australia produjo un gran nmero de manuales de procedimientos. Algunos aos despus, cuando era necesario revisarlos, los archivos originales de 3

Ing. Jess Tejerina R.

UPT 2011-I

Implicancia en la Digitalizacin

computadora que los contenan no eran capaces de ser utilizados por los programas mejorados de que dispona la Comisin. En lugar de recapturar los manuales originales, los programas OCR fueron utilizados para convertir los manuales impresos en archivos apropiados para su edicin y revisin por computadora. Otro uso importante del OCR es para la captura de informacin impresa en formatos. En lugar de capturarla manualmente, el OCR puede ser utilizado para convertir automticamente la informacin de esos formatos en informacin legible para la computadora. El OCR opera "capacitando" a los programas de escaneo para que reconozcan formas particulares como letras y nmeros. Ya que los distintos tipos de letras tienen diferentes formas, los sistemas OCR tienen que ser capacitados para reconocer que un nmero o letra particular puede adoptar distintas formas. Dada la regularidad de los tipos impresos, es un proceso relativamente directo. Los sistemas OCR tambin pueden ser capacitados para reconocer la letra manuscrita. Sin embargo, dada la infinita variedad de estilos, esta es una tarea mucho ms complicada. Los sistemas OCR iniciales tenan un ndice relativamente alto de error cuando convertan el texto impreso en informacin legible para la computadora, particularmente el texto manuscrito. Esto requiere un alto nivel de supervisin humana para revisar y corregir la informacin que ha sido convertida. A medida que los equipos y programas de escaneo ptico mejoran a finales de la dcada de 1990, disminuyeron los ndices de error. Sin embargo, la siguiente generacin de sistemas de escaneo, los sistemas ICR, han ido ms lejos en el incremento de sus niveles de precisin.

3. Sistemas de escaneo basados en el reconocimiento inteligente de caracteres (ICR) La tecnologa ICR proporciona a los sistemas de reproduccin por escner y sistemas de imgenes la habilidad de convertir caracteres en letra manuscrita (no cursiva) en caracteres capaces de ser interpretados o reconocidos por una computadora. As, las imgenes de caracteres en letra manuscrita son extradas de un mapa de bits de la imagen reproducida por el escner. Existen diversos dispositivos de reconocimiento ICR en el mercado. Los sistemas ICR llevan a los OCR un paso adelante utilizando programas de cmputo para aplicar pruebas de inteligencia lgica a los caracteres escaneados para convertirlos de manera ms confiable en informacin ms legible para la computadora.

Ing. Jess Tejerina R.

UPT 2011-I

Implicancia en la Digitalizacin

Los sistemas de ICR aplican reglas de ortografa, gramtica y contexto para escanear los textos a fin de efectuar evaluaciones "inteligentes" sobre la interpretacin correcta de la informacin. Esto permite una conversin mucho ms precisa de los textos escaneados de la que realizan los sistemas OCR ms simples, especialmente con el texto manuscrito. Los programas ICR requieren computadoras rpidas y poderosas para desempearse de manera eficiente: Los sistemas ICR de alta confiabilidad solo estuvieron disponibles a mitad de la dcada de 1990 con el desarrollo de productos computacionales, econmicos y poderosos. A medida que se vuelvan ms confiables los sistemas ICR, se incrementarn sus aplicaciones electorales. Son particularmente apropiados para capturar informacin de formatos. Tambin se est evaluando su capacidad para capturar nmeros manuscritos de las papeletas que utilizan sistemas electorales ms complejos, como el de voto alternativo o el de voto nico transferible. A la fecha, los sistemas automatizados de captura de informacin no han sido utilizados para estos sistemas electorales debido a la complejidad de la tarea.

4. Tecnologa de imagen Adems de capturar imgenes para convertirlas en informacin, los escneres tambin pueden capturar imgenes para almacenarlas como imgenes legibles para las computadoras. Fotografas, dibujos e imgenes de texto pueden ser almacenadas y reutilizadas en formatos legibles para computadoras. Las imgenes computarizadas tienen muchas aplicaciones electorales. Se pueden utilizar en sitios de la red e imprimir en publicaciones. Las fotografas del personal se pueden colocar en la pgina de internet de la autoridad electoral y en su reporte anual. Las fotografas de los sitios de votacin pueden incluirse en los sitios de internet y manuales de instrucciones. Las muestras de formatos debidamente llenados pueden ser escaneados como imgenes e impresos en manuales de capacitacin. Los formatos de papel pueden ser convertidos en imgenes y almacenados en formato electrnico. Luego se pueden bajar copias de las imgenes en una red de computadoras sin necesidad de acceder a las copias originales en papel. La Comisin Electoral de Australia est actualmente involucrada en convertir en imgenes los millones de formato de registro de electores y colocarlos en una red de cmputo accesible desde cualquiera de sus oficinas en el pas. Este sistema ser utilizado para verificar las firmas o cualquier otro dato incluido en los formatos accediendo a los formatos de imagen. Los logotipos corporativos pueden ser almacenados electrnicamente como imgenes e impresos en diversas publicaciones. Una organizacin que alguna vez utiliz promocionales preimpresos y costosos que contenan su logotipo, hoy puede imprimirlos desde su computadora utilizando una impresora a color y digitalizando la imagen de su logotipo. 5

Ing. Jess Tejerina R.

UPT 2011-I

Implicancia en la Digitalizacin

La tecnologa de imagen tambin puede ser utilizada para verificar la identidad. Las fotografas pueden ser digitalizadas y colocadas en tarjetas de identidad. Las imgenes de las huellas digitales o de rasgos faciales pueden ser digitalizadas y almacenadas en tarjetas inteligentes. Los sistemas de identidad basados en programas de cmputo pueden ser utilizados para comparar la imagen de la persona mostrada en la carta inteligente con la codificada en la tarjeta para determinar si es la misma persona. 5. Comparaciones Las diferencias entre las tecnologas ICR, OCR y OMR pueden ser demostradas en las siguientes reas: Formularios Almacenamiento y recuperacin Precisin

Formularios Los formularios OMR son documentos muy especializados. Las lneas de tiempo a lo largo del margen del formulario indican al escner donde leer las marcas. Los formularios OMR tambin contienen marcas de identificacin (cuadrados negros al principio y al final de los formularios). Adems, el corte de cada formulario OMR es extremadamente preciso y las burbujas deben estar posicionadas exactamente en la misma ubicacin en cada formulario. La tecnologa de imgenes es mucho ms flexible. No existen lneas de tiempo en los mrgenes o formularios con marcas de identificacin, pudiendo las imgenes flotar en la pgina. Las tecnologas ICR y OCR usan marcas de registro, que tambin aparecen como tringulos en los cuatro mrgenes de un documento para reconocimiento de una imagen. Los documentos que tienen informacin que ser extrada y enviada a un dispositivo ICR contienen recuadros para ser completados por los destinatarios de los formularios. Estos recuadros solo admiten una letra por recuadro. En ambos tipos de documentos el color tiene suma importancia. El uso de colores de tonalidad opaca reduce ostensiblemente el tamao de la transmisin entre el escner y la computadora con un escner de imgenes. El uso de colores opacos en un escner OMR permite el uso de lapiceras (adems de lpices) para el llenado de formularios. En ambos tipos de escner OMR y escner de imgenes, el uso de colores opacos asegura la precisin de los resultados. Almacenamiento y Recuperacin Si los documentos precisan ser almacenados en formato electrnico y ser mantenidos, la reproduccin por imgenes es necesaria. Con las tecnologas ICR y OCR, las imgenes pueden ser reproducidas por escner, ordenadas por un ndice, y escritas en formato ptico. Las imgenes pueden luego ser recuperadas e impresas de acuerdo a sus necesidades. Con la tecnologa OMR,

Ing. Jess Tejerina R.

UPT 2011-I

Implicancia en la Digitalizacin

las imgenes de documentos no son ledas por los escner, por lo tanto el almacenamiento y recuperacin de imgenes no es posible. Precisin La tecnologa OMR puede proporcionar una eficacia del 99,9% de precisin en la lectura de datos en un documento impreso con calidad. Las tecnologas ICR y OCR pueden proporcionar una eficacia del 98% de precisin si el sistema est configurado de manera apropiada, los formularios estn bien diseados, los caracteres recibidos son prolijos y limpios de errores, y si se utiliza una edicin contextual. Esto se aproxima al mismo porcentaje de precisin alcanzado por el procesamiento de entrada de datos manual. Cuadro de Referencias Por Imgenes Reconocimiento de letra manuscrita Reconocimiento de letra a mquina Reconocimiento de marcas burbujas Reconocimiento de tildes y equis Reconocimiento de cdigo de barras Requiere Lneas de tiempo / formularios con identificacin Requiere Registro de Marcas Grado de Precisin Almacenamiento Electrnico y Recupero Entrada de FAX Si- ICR Si- OCR Si Si Si No Si Hasta un 98% con salvedades Si Si Ilimitada La configuracin de la red permite un poder de procesamiento ilimitado (1,200/hr/escaner) No No Si No Si Si No 99.9 +% Consistentemente No No 1,500 - 10,000/hr por escner OMR

Velocidad

TRABAJO GRUPAL (4). Con el presente texto, realice un crucigrama de 20x20 con 10 definiciones horizontales y 10 verticales

S-ar putea să vă placă și