Documente Academic
Documente Profesional
Documente Cultură
Aunque el empleo práctico de métodos y vías para reconocer (identificar) patrones tiene
raíces mucho más antiguas, es posible afirmar que el auge y la popularidad de estas técnicas
ha coincidido con el desarrollo de los modernos equipos de computación, que han permitido
la manipulación, en un período de tiempo aceptable, de los grandes volúmenes de datos
requeridos en muchos de los problemas en que se utilizan estos métodos. Entre otras
aspiraciones, en el presente texto se pretende mostrar que el empleo adecuado de estas
técnicas automatizadas puede conducir no sólo a mayor rapidez sino también a resultados que
pueden competir en calidad con los obtenidos por analistas humanos, y en determinados
casos, superarlos.
a) reconocimiento de caracteres
b) diagnóstico médico
c) teledetección de recursos naturales
d) identificación de caras humanas y de huellas digitales
e) análisis de señales e imágenes biomédicas
f) clasificación de suelos
g) conteo de células sanguíneas
h) análisis de los registros de pozos (carotaje)
i) arqueología
j) pronóstico de yacimientos minerales
k) reconocimiento oral
l) análisis de la actividad sismológica
m) clasificación de documentos
y muchos otros
En los últimos treinta años se han editado decenas de libros y cientos de artículos sobre el
Reconocimiento de Patrones, lo que refleja el alto grado de interés que esta actividad ha
despertado. A pesar de esta popularidad resulta difícil encontrar definiciones generales y
precisas. Entre las publicadas se destacan las siguientes:
Concepto de Patrón-
Tou y González (1974): es la descripción de un objeto.
Meisel (1972): en su sentido más amplio son los medios mediante los cuales interpretamos
el mundo.
Chen (1973): Es un modelo, guía o plan usado al hacer cosas. Puede ser concreto o
abstracto. Concreto: casi todo lo que está al alcance de nuestros sentidos.
Clases de Patrones
Tou y González (1974 ): es una categoría determinada por algunos atributos comunes
dados.
Chen ( 1973 ): es un grupo de patrones con ciertas propiedades comunes.
Existen varios enfoques para el estudio de las cuestiones relacionadas con el reconocimiento
de patrones. Los que mayor atención han recibido son el estadístico (que es el que se estudia
en el presente texto), y el sintáctico (estructural, lingüístico).
c) Difuso (Fuzzy): Permite funciones de pertenencia fuzzy. Para situaciones en las que no es
conveniente tomar decisiones terminantes o excluyentes, y en las que existe un alto grado de
incertidumbre.
( M e c a n i s m o d e r e t r o a li m e n t a c i ó n )
O b s e r v Sa c e i ó n n s oP r r e p r o c e sS a e m l e i ce . n t Vo C a l r a i a s bi f li ecA ass i gc n i óa c ni ó n
Figura 1.1
2. Selección de las variables con mayor poder discriminatorio, para reducir la dimensión del
problema. Esto permite mejorar la efectividad y la precisión del clasificador, simplificar la
modelación del problema y facilitar la labor computacional.
No obstante, se le atribuye a Chow (1957) la formulación rigurosa por primera vez del
problema de Reconocimiento de Patrones en términos de la teoría de la decisión estadística.
En este marco de trabajo la meta es encontrar el clasificador óptimo. Cuando se dispone de
información suficiente esa optimalidad se alcanza con la bien conocida Regla de Bayes o
Clasificador de Bayes, que se discutirá en el capítulo siguiente. Este clasificador minimiza el
riesgo esperado para cada decisión.
c = δ(X)
donde c ε {1,2,...m}es la etiqueta correspondiente a una de las m clases consideradas en el
problema, y
Con frecuencia resulta conveniente visualizar las regiones y fronteras de decisión. Cuando el
número de variables es menor o igual a 3, diagramas de dispersión como el que se muestra a
continuación constituyen herramientas útiles para identificar estructuras particulares de los
datos, detectar observaciones atípicas, o para estudiar los aspectos geométricos y
computacionales de las fronteras de decisión. Para un número de variables mayor que 3, se
requieren técnicas de visualización más complejas.
x1
Frontera de
decisión
x2
Figura 1.2
Entre los factores más importantes a considerar durante la selección y el diseño del
clasificador están la probabilidad de clasificación errónea y el costo de llevar a cabo la
clasificación (la complejidad del algoritmo y el gasto en que se incurre al tomar las
mediciones). La máquina de Reconocimiento de Patrones más simple utiliza hiperplanos para
separar las regiones de decisión, lo que equivale a la definición de funciones lineales para
resolver el problema de la clasificación. Además de su simplicidad matemática y
computacional, estos clasificadores lineales son los clasificadores óptimos para determinados
casos.
Con una visión más general y práctica, puede concebirse el proceso formado por dos etapas
básicas: construir la regla de decisión y emplearla.
Si después de un tiempo (por ejemplo, en tareas de pronósticos) se conoce la verdadera
clasificación, la regla de decisión puede evaluarse.
Pudiera considerarse también el ajuste del clasificador después de una cierta cantidad de
elementos clasificados. O sea, no limitar el aprendizaje a la etapa previa (a la información
aportada por la muestra de entrenamiento), sino continuar incrementando el conocimiento
incorporado al sistema, a partir de la experiencia acumulada (éxitos y errores) a través del
proceso de trabajo mismo, en la ejecución de la clasificación de patrones nuevos.
3) El tipo de función de decisión depende también del nivel de conocimiento que se posea a
priori sobre el problema en cuestión
.
Si se conocen las distribuciones de probabilidad de las clases, podemos usar la teoría
estadística de la decisión para diseñar la máquina que será óptima en el sentido de minimizar
el riesgo esperado u otro criterio de rendimiento seleccionado (en general, se necesitaría
entonces conocer también las probabilidades a priori de las clases y disponer de una
definición adecuada de la función de costo). Resulta muy difícil, en la práctica, disponer de
todos estos elementos.
Una vez que la estructura general se ha decidido, la forma final del clasificador queda
determinada por la muestra de entrenamiento, es decir, por la información suministrada por
un grupo de individuos que identifican a todas las clases que resultan de interés en el
problema que se estudia.
a) paramétrico: en los que se supone conocida la forma de las funciones de densidad del
modelo en cuestión y la muestra de entrenamiento se utiliza para "aprender" o estimar los
parámetros desconocidos de esas densidades.
Aunque en la mayoría de los textos sólo se consideran los dos casos que se acaban de
mencionar (supervisados y no supervisados), es posible hablar de una situación intermedia:
imperfectamente supervisada. Son problemas prácticos, que se presentan con cierta
frecuencia en las aplicaciones, y en los que se dispone de una muestra de entrenamiento, pero
no se cumple el supuesto de que la identificación de todos los prototipos de esa muestra de
entrenamiento sea correcta. Son varias las razones que pueden provocar esta situación:
dificultades en el proceso de identificación, alto costo de esa actividad, ambigüedad en la
definición de las clases, presencia de prototipos que representen a más de una clase, etc.
Si se desea una comprensión cabal de todas las fundamentaciones estadísticas en las que se
apoya el Reconocimiento de Patrones estadístico, la lectura de este texto requeriría un
conocimiento previo de los elementos de Álgebra Lineal, Teoría de las Probabilidades y de
Inferencia Estadística, en los niveles en que usualmente se estudian en los primeros años de
las especialidades universitarias de ciencias e ingeniería. Para aquellos interesados solamente
en captar las ideas básicas y conseguir el dominio suficiente para el empleo de estos métodos
en tareas prácticas, se ha tratado de desarrollar una exposición lo más sencilla y comprensible
posible. Comentarios y señalamientos serán bien recibidos.
1.6.- Bibliografía.
Chen, C.H (1973): Statistical Pattern Recognition. Spartan Books, New York.
Chow, C.K. (1957): An optimum character recognition system using decision functions. IRE
Trans. Elec. Comp, EC-6, 247-254.
Devijver, P.A., Kittler, J. (1982). Pattern Recognition: a statistical approach. Prentice Hall,
Londres.
Fisher, R.A (1936): The use of multiple measurements in taxonomic problems. Annals of
Eugenics.
Tou, J.T, González, R.C (1974): Pattern Recognition Principles. Addison-Wesley Co,
Massachutsetts.