Sunteți pe pagina 1din 20

Modelare i modele matematice n recunoaterea obiectelor i clasificarea automat a imaginilor

Ioan Ispas, Catedra de Matematic-Informatic, Universitatea Petru Maior, Trgu Mure, e-mail: john@upm.ro Abstract: This paper summarize and classify the most important approaches, methods and techniques used in mathematical modeling and algorithms design for solving the Image Recognition and Classification Problem. The classification is done with respect to the fundamental mathematical modeling process of this difficult but challenging problem. Keywords: Pattern recognition, Image classification, approaches, Mathematical modeling. Se poate spune c schema urmtoare conine modul ideal n care oamenii i propun s foloseasc calculatorul. Cnd omul este pus n situaia obositoare de a lua n mod repetat aceleai decizii "de rutin", ideal este ca el s fie nlocuit de un calculator, cu softul su adecvat. Image retrieval

Fenomen real

date de intrare

Calculator: Procesarea datelor despre fenomen

Informaii structurate, de sintez

Om/calculator = factor de decizie

Bucl invers (de control a fenomenului real)

n domeniul prelucrrii digitale a imaginilor (DIP), n care exist multe operaii "de uzur" ce nu implic un grad nalt de rspundere, aceast nlocuire este unul dintre cele mai importante obiective i se studiaz mai ales atunci cnd se vorbete despre Problema recunoaterii obiectelor i clasificrii automate a imaginilor (pattern recognition and classification). Prin aceast sintagm

1 703

general se nelege capacitatea calculatorului, prin softul su specializat, de a determina coninutul unei imagini imitnd ntr-o ct mai bun msur capacitatea uman de "citire" a imaginilor n vederea lurii unor decizii ulterioare. Prin clasificarea automat a imaginilor se nelege de fapt o categorie de tehnici, metode i algoritmi de recunoatere a obiectelor i formelor n imagini ce permit clasificarea imaginilor pe baza obiectelor recunoscute. Cteva domenii care necesit aplicaii DIP de clasificare automat a imaginilor pe baza recunoaterii obiectelor componente sunt: Astronomie - pentru clasificarea automat a imaginilor preluate de la diferitele telescoape n benzi de frecvene extinse; Fizica pmntului - pentru clasificarea automat (de multe ori n timp real) a imaginilor preluate de la sateliii geostaionari n vederea prognozei meteo, a strii atmosferei, a controlului creterii vegetaiei (culturilor) i a comportamentului vulcanilor, etc.; Fizica atomica sau cuantic- pentru clasificarea automat a imaginilor preluate n experimente cu particule subatomice; Microelectronic - pentru clasificarea automat i detectarea calitii circuitelor VLSI pe baz de imagini microscopice; Automatic - pentru clasificarea automat i controlul automat al calitii diferitelor produse, n diverse domenii economice, ce trec pe band rulant prin faa unui controlor automat al calitii (aici este inclus i domeniul alimentar); Televiziune - pentru asigurarea controlului i securitii pe baz de camere video de urmrire continu prin detectarea i recunoaterea n timp real a situaiilor (eventual a persoanelor) frauduloase (aici este inclus controlul circulaiei prin camere video i radar, controlul bagajelor pe aeroporturi, urmrirea persoanelor n incinta bncilor, etc.); Armat - pentru recunoaterea i detectarea intelor i pentru dirijarea n mod direct (orientare) a rachetelor sau avioanelor de lupt; Inspecia non-chirurgical - mai ales pentru detectarea i marcarea automat (un fel de diagnoz asistat) a zonelor sau organelor suspecte, din imaginile preluate in vivo prin microscopie electronic, tomografie (raze gamma), fotografierea cu raze X i prin rezonan magnetic, radiologie;

2 704

Analiza compoziiei chimice - prin clasificarea i prelucrarea automat a informaiei achiziionate pe criterii cromatice, spectrale, etc.; Microscopie - pentru recunoaterea i clasificarea automat a structurilor moleculare i atomice ale substanelor studiate; Data mining clasificare i regsirea informaiilor de diverse tipuri (multimedia) n volume mari de date structurate, mai mult sau mai puin, ca baze de date, depozite de date sau bnci de date; Document image analysis presupune clasificare, cutarea, regsirea cu sau fr conversia total n text a unor documente pstrate sub form de imagini (copii fax, scanner, etc.); Multimedia database querying and content retrieval se refer mai ales la regsirea unor secvene video dup criterii de cutare specifice inclusiv, s zicem, dup chipul unui personaj;

3 705

Iat dou exemple ce ilustreaz folosirea metodelor automate de recunoatere, detecie i control a calitii produselor farmaceutice: n primul caz, camera video detecteaz trecerea prin faa ei (pe band rulant) a unor recipieni necorespunztori, iar n al doilea caz, prin inspecie microscopic se detecteaz prezena unui numr prea mare de bule de aer n compoziia unei substane (prin recunoatere i numrare automat).

4 706

Iat alte trei exemple de utilizare practic a metodelor de recunoatere i clasificare a imaginilor: sus, o imagine preluat de o camer radar a poliiei care este prelucrat i se extrage n mod automat numrul de identificare a mainii; la mijloc, o imagine folosit ntr-o aplicaie de recunoatere a poliiei cu ajutorul unei baze de amprente digitale; jos, o imagine preluat cu raze X de o camer de control a calitii produselor alimentare i oferit unei aplicaii care detecteaz prezena ascuns a oaselor n pachetele de "carne fr oase" 5 707

Recunoaterea formelor. Noiuni fundamentale. Literatura despre prelucrarea digital a imaginilor (DIP) n limba englez folosete diferite exprimri, ce se acoper parial reciproc, pentru a desemna acest domeniu de interes. Din perspective diferite, exprimrile ntlnite curent sunt: object recognition, pattern recognition, pattern / template matching, image recognition, pattern / image classification [GOW], [JDM], [BKKP]. n limba romn acestor sintagme le corespund urmtoarele traduceri sau echivalri: recunoaterea formelor, recunoaterea obiectelor, recunoaterea i clasificare imaginilor, analiz de imagini [VLA], unde noiunea de pattern (ablon, model, form primar) este tradus mai ales prin cuvntul cu neles general - form. Din punct de vedere al creterii complexitii metodelor i operaiilor implicate exist urmtoarea incluziune logic evident: forme obiecte imagini. Dac vrem s facem distincie ntre termenii de mai sus, ordinea fireasc de abordare teoretic a lor ar trebui s fie (pe nivele de complexitate): 1. recunoaterea formelor, 2. recunoaterea obiectelor, 3. recunoaterea / clasificarea imaginilor. n modelarea matematic a problemei recunoaterii formelor exist i abordri teoretice care eludeaz aceast ordine logic. De exemplu, abordarea cu metode matematice statistice a recunoaterii, face abstracie de incluziunea structural a formelor n obiecte (cu forme complexe) i a obiectelor n imagini (coninnd mai multe obiecte). ntr-o astfel de modelare ntreg procesul se reduce la un unic nivel al recunoaterii, ce conine la modul sintetic cele trei nivele de mai sus. Un exemplu semnificativ este metoda de recunoaterea statistic a imaginilor /obiectelor pe baza coninutului lor cromatic. nainte de a trece la prezentarea diferitelor modele teoretice i practice de soluionare a problemei recunoaterii vom prezenta mai nti o scurt analiz a acestei probleme din perspectiva sa fundamental: psiho-fiziologia uman. Din aceast perspectiv, problema recunoaterii formelor i imaginilor nu este o problem de sine stttoare ci este subordonat unei alte probleme mai generale: problema lurii unor decizii pe baza procesului psiho-mental de

6 708

percepie vizual. Aici trebuie deasemenea incluse fenomene umane complexe ca orientarea spaial, explorarea vizual, etc., n fiecare din aceste situaii pornindu-se de la percepii vizuale primare (imagini). Aceast problem general i foarte complex conine ntr-o form particular cel mai important mecanism ce st la baza funcionrii tuturor sistemelor vii: mecanismul de feed-back. Domeniul Inteligenei artificiale (AI) este cel care modeleaz i studiaz aceste mecanisme umane de explorare, orientare i luare de decizii. El se bazeaz ntr-o mare msur pe o alt important trstur a fiinelor nzestrate cu capacitate de orientare: nvarea. n paginile ce urmeaz nu trebuie s se fac confuzie ntre abordarea problemei recunoaterii formelor i imaginilor din perspectiva DIP, cu abordarea aceleai probleme din perspectiva AI, abordare care nu este obiectul acestui studiu. Analiza i modelarea problemei recunoaterii. Percepia vizual - noiuni fundamentale. Din punct de vedere al percepiei umane, problema recunoaterii este separat de problema captrii senzaiilor primare (input-ul). Imitarea capacitilor umane de percepie vizual (ocular), perfecionarea i extinderea acestora este obiectul de studiu colaborat al medicinei, al ingineriei electronice i al fizicii optice. Pentru noi este important doar abordarea psihologicmental a problemei recunoaterii, n special pentru descoperirea i modelarea mecanismelor cerebrale de percepie, explorare i orientare vizual. Din aceast perspectiv studiile de specialitate [VPRE, pag.40-56] constat c problema explorrii vizuale la om are grad foarte mare de complexitate. Studiul acestei probleme se afl nc n etapa de punere a fundamentelor i este plin de necunoscute. Numrul factorilor (parametrilor) care au fost descoperii ca fiind implicai este att de mare nct nu se poate vorbi nc de o modelare precis a acestui fenomen, aa cum putem sesiza din schema de sintez urmtoare [VPRE, pag. 53].

7 709

SARCINA SUBIECTULUI (INSTRUCTAJUL)

FACTORI COGNITIVI

FACTORI MOTIVAIONALI I AFECTIVI FACTORI DEPENDENI DE APTITUDINI SUBIECT

JUDECI OPERATORII CU SPECIFIC VIZUAL

STRATEGII EXPLORATORII OCULOMOTORII

VEDEREA FOVEAL

CMPUL PERCEPTIV (OBIECTUL EXPLORAT)

MEMORIE VIZUAL, GNDIRE, IMAGINAIE

IMAGINEA RETINIAN

PRELUCRARE INIIAL

PRELUCRARE DE NIVEL MAI NALT

PRELUCRARE DE NIVEL I MAI NALT

IMAGINEA PERCEPTIV

R S P U N S U L LA S A R C I N A PERCEPTIV

8 710

O alt concluzie care este extras din aceste studii este faptul c percepia i explorarea vizual uman este o problem avnd o complexitate att "pe vertical" ct i "pe orizontal", fapt ce complic mult lucrurile din perspectiva modelrii ei cu ajutorul calculatorului. Astfel, se vorbete de mecanisme de percepie vizual structurate i mbuntite n timp, pe grupuri de vrste: de la 0 la 2 ani, ntre 2 i 7 ani, ntre 7 i 12 ani i perioada peste 12 ani, aceasta constituind o extindere "pe vertical" a problemei i cuprinznd numeroase mecanisme (de exemplu nvarea) care snt modelate mai ales n domeniul inteligenei artificiale. Dar se constat la aceleai grupe de vrst, deci o extindere "pe orizontal", existena unor strategii tipologice de explorare vizual n funcie de trsturile psihologice ale diferiilor subieci umani (i nu n funcie de starea de sntate psiho-fiziologic a lor). Prin urmrirea micrilor i traseelor de explorare ocular a imaginilor-sarcin s-a putut constata chiar mai mult dect att: exist strategii conjuncturale (orientate pe sarcin) diferite de explorare vizual la acelai subiect uman, ce depind att de gradul de complexitate /importana sarcinii de explorare vizual asumate ct i de aptitudinile sau starea general a subiectului. n concluzie, din perspectiv psihologic-cognitiv, problema recunoaterii nu poate fi separat de cele dou probleme cu care ea se ntreptrunde strns: 1. problema extragerii semnificailor dintr-o form sau imagine; 2. problema interpretrii coninutului imaginilor pe baza tipologiei i formaiei cognitiv-psihologic a subiecilor umani (tipologii ce difer la vrste diferite dar i la aceeai vrst). Prin studiul sistematic al capacitilor de explorare vizual a copiilor foarte mici s-a putut constata existena urmtoarele trsturi fundamentale care snt nc un deziderat major pentru sistemele automate de recunoatere, urmrire i orientare spaial: a) Fixarea i urmrirea. n decursul primelor luni de via copilul ajunge la o deplin capacitate de fixare i urmrire n cmpul vizual (mai exact, e vorba de zona foveal) a subiectului (intei) recunoscut i dorit. b) Discriminarea figur fond. La numai 15 zile de la natere copilul cruia i se arat o imagine coninnd un triunghi negru pe un fond alb sau o imagine bicolor i ndreapt cu precizie privirea spre contorul triunghiului (mai
9 711

ales spre coluri) respectiv spre zona de grani dintre cele dou zone bicolore ceea ce permite s se trag concluzia c procesul de discriminare dintre fond i figur (simpl) se nsuete foarte repede. c) Percepia formelor, modelelor i obiectelor. Dup numai 9 luni de via copilul este capabil s recunoasc i s deosebeasc obiectele noi de cele vechi, sau imagini coninnd modele noi de imagini cu modele (texturi) vechi. El este capabil s recunoasc i s diferenieze cu precizie obiectele dup cele trei atribute de baz: culoare, mrime i form. d) Diferenierile perceptive i preferinele. nc de la vrsta de dou sptmni copilul ncepe s aib preferine pentru unele forme i culori, preferine care evolueaz i se schimb cu vrsta. Astfel, pn la vrsta de dou luni toi copii prefer s examineze o imagine n dungi fa de una cu cercuri, situaie care se inverseaz dup trecerea celor dou luni. Copii de 7 sptmni nu pot nc reine nici una din atributele unui obiect dar i in minte prezena; dup 11 sptmni copii rein un atribut al obiectului forma, iar dup 14 sptmni ei rein deja dou atribute forma i culoarea. e) Organizarea perceptiv. Prin urmrirea i nregistrarea micrilor oculare (mai exact, a sacadelor oculare) s-a putut trage concluzia c, nc din primele zile dup natere, n timpul inspeciilor oculare snt prezente la noi nscui mecanisme de organizare i de structurare a procesului de percepie vizual. Acest fapt are o importan major pentru obinerea pn la vrsta de 4-5 luni a coordonrii ochi-mn i a capacitii de apucare i manipulare a obiectelor, n funcie de forma i de mrimea lor. f) Constanele perceptive. Este evident c, n timp ce un obiect i pstreaz proprietile tactile-kinestezice oriunde s-ar deplasa n cmpul vizual al copilului, totui imaginea acestuia (dei obiectul este neschimbat) i modific att forma ct i mrimea n funcie de poziia pe care o ocup n spaiu. S-a constatat c, pn la mplinirea vrstei de un an, copilul i dezvolt complet capacitatea de a recunoate i identifica obiectele indiferent de proiecia imaginii lor pe retin, el reuind s stabileasc o legtur cauzal ntre obiect i diferitele forme ale sale, aa cum snt ele percepute din perspective vizuale diferite din unghiuri i de la distane diferite.

10 712

Din scurtele extrase de mai sus [VPRE, pag.40-45] se poate conchide c, pentru cei ce se ocup cu modelarea problemei recunoaterii formelor i imaginilor, este nc un el deosebit de nalt acela de a imita capacitile de explorare vizual mcar ale unui copil de doi ani. Totui, din constatrile enunate putem s extragem nite idei preioase pentru proiectarea algoritmilor de recunoatere. Exist ase trsturi fundamentale ale procesului de explorare vizual, aa cum apare i se dezvolt el la fiinele umane: 1. Fixarea i urmrirea figurii 2. Discriminarea figur fond 1. Percepia formelor, modelelor i obiectelor 2. Diferenierile perceptive / preferinele 3. Organizarea perceptiv 4. Constanele perceptive Prin trecerea n revist a numeroaselor articole de specialitate se poate afirma c doar primele trei trsturi sunt luate n calcul la modelarea i proiectarea sistemele de recunoatere automat a formelor i imaginilor. Este aceasta o dovad n plus a complexitii i dificultii n cazul modelrii explorrii vizuale. Se poate constata c fixarea i urmrirea este imitat i realizat deja n cazul sistemelor de supraveghere automat, n cazul sistemelor de dirijare a rachetelor ctre inte, etc. ce utilizeaz algoritmi foarte performani (eficieni) de analiz n timp real a cadrelor video ce se succed. n aceast situaie, zona central a imaginilor captate, ce este analizat foarte rapid, corespunde cu zona foveal de pe retina ochiului observatorului uman iar efortul algoritmului const n a menine "'inta" aflat n micare n centrul imaginii, prin comenzi adecvate asupra orientrii obiectivului camerei video. Un amnunt mai puin cunoscut i oarecum trecut cu vederea, dar care constituie unul din eforturile majore ale algoritmilor de fixare i urmrire, este faptul c "inta" trebuie mai nti localizat i adus n mijlocul imaginii pentru a putea fi apoi fixat i urmrit continuu, exact ca n cazul fixrii privirii i implicit a imaginii obiectului n zona foveal. Ori acest lucru nu este deloc uor n cazul unei inte aflat n continu micare ntr-un spaiu tridimensional! De aceea, de multe ori este necesar efortul conjugat al mai multor camere de luat imagini (sau sisteme
11 713

radar) pentru a se putea realiza rapid localizarea spaial 3-D a intei, folosind de exemplu, o metod topografic de triangulaie. Discriminarea figur fond se realizeaz prin algoritmii de detecie automat a muchiilor i contururilor, algoritmi ce se bazeaz pe determinarea zonelor de discontinuitate din imagini. Percepia formelor, modelelor i obiectelor este trstura care ridic cele mai serioase probleme proiectanilor de algoritmi de recunoatere i constituie efortul principal al procesului de modelare, dup cum se va putea vedea n continuare. Diferenierile perceptive i preferinele, Organizarea perceptiv i Constanele perceptive snt trsturi ale mecanismelor de percepie vizual care fac subiectul de studiu al inteligenei artificiale i presupun modelarea i simularea unor mecanisme extrem de complexe ca extragerea semnificanilor i recunoaterea prin nvare. Recunoaterea formelor i clasificarea imaginilor modelare teoretic Aa cum am spus deja, pentru a se face distincie clar ntre problema recunoaterii din perspectiva prelucrrii digitale a imaginilor i aceeai problem din perspectiva inteligenei artificiale i roboticii, terminologia de specialitate folosit n limba englez este pattern recognition [GOW, pag. 693] i mai puin object recognition. Chiar dac vom folosi expresii ca recunoaterea formelor, recunoaterea obiectelor sau clasificarea imaginilor, n continuare ne vom referi doar la ceea ce literatura englez de specialitate numete pattern recognition. Recunoaterea formelor i/sau clasificarea imaginilor este un proces ce are la baz un model n patru pai sau etape. Chiar dac n sistemele automate de recunoatere i clasificare etapele nu apar ntotdeauna ca fiind separate, ele vom fi n continuare prezentate distinct. Se urmrete astfel scoaterea n eviden a trsturile eseniale ale fiecrui pas /etap, aa cum se poate observa n schema urmtoare:

12 714

I m a g i n e

I. Preprocesare

II. Extragere atribute

III. Msurare atribute

IV. Clasificare

Modelul general al procesului recunoaterii formelor i clasificrii imaginilor

I.

Preprocesarea imaginii. De obicei aceast etap este privit mpreun cu etapa a doua dar importana capital pe care noi dorim s o acordm etapei de extragere a atributelor ne-a fcut s le tratm separat. Prin aceast etap de preprocesare se nelege de fapt aplicarea, unor algoritmi DIP specializai de mbuntire a calitii imaginii. Unii dintre cei mai uzitai algoritmi de preprocesare, prezentai n [ISP 1], snt:

algoritmi de amplificare a contrastului; algoritmi de eliminarea paraziilor i a "zgomotului" (noise


reduction);

algoritmi de transformare Fourier a imaginii, folosii mai ales pentru


analizarea texturii imaginii; Rezultatul final al acestei etape poate fi: aceeai imagine dar mbuntit, avnd unele detalii puse n eviden; aceeai imagine dar ntr-o alt descriere ce faciliteaz recunoaterea obiectelor componente; doar pri componente ale imaginii n diverse descrieri i formalizri. II. Extragerea atributelor sau descriptorilor de imagine (feature extraction). Este etapa cheie, este cea care d msura performanelor i a profesionalismului aplicaiei de recunoatere. Ea const n aplicarea, mpreun sau separat (dup necesiti), a unor algoritmi DIP specializai care urmeaz s fie prezentai n aceast lucrare, cum ar fi:

ngroarea,
contururilor;

extragerea i/sau detectarea liniilor, muchiilor sau

concatenarea segmentelor i conectarea contururilor;


13 715

segmentarea imaginii n zone de interes; introducerea unor reprezentri sau descrieri ajuttoare a contururilor,
zonelor sau obiectelor cu contururi delimitate prin metodele anterioare; Alegerea unor atribute sau caracteristici ct mai potrivite este cheia succesului algoritmilor de recunoatere. Dei, n general vorbind, obiectele snt nzestrate cu doar trei atribute principale mrimea, culoarea i forma, totui n practic determinarea cu exactitate i complet a celor trei caracteristici fundamentale este extrem de dificil sau chiar imposibil i presupune proiectarea i implementarea unor metode de aproximare a lor. Iar numrul posibilitilor de aproximare a mrimii i formei combinate ntre ele i nmulite cu numrul imens de nuane de culori (ce snt coninute de exemplu n textura obiectelor) conduce la un numr foarte mare de alegeri posibile. Secretul reuitei n problema recunoaterii const tocmai n reducerea acestui numr uria de posibiliti de a alege dintre mrimile, formele i culorile "sugerate" de imagine. Rezultatul final al acestei etape este un vector de n atribute extrase (v1, v2, , vn) nu neaprat numerice. III. Msurarea atributelor sau descriptorilor (feature/pattern measurement). n practic aceast etap nu este separat de cea anterioar ntruct, odat alegerea atributelor fiind fcut, se presupune ca pentru ele a fost aleas deja o metod de msurare, evaluare i comparare (discriminare). Totui, crile de specialitate scot n eviden aceast etap i, deseori, doar ea este cea care e prezentat n capitolul Object recognition and pattern clasification. Un motiv pentru care aceast etap este att de bine tratat teoretic este faptul c exist un aparat matematic bine pus la punct Teoria msurii cu ajutorul cruia se pot introduce diferite metrici n-dimensionale sau metode discriminative eficiente. n practic se constat c folosirea unei singure msuri (a unei singure metrici) nu este o metod suficient de discriminativ (nu conduce la separarea precis n clase distincte) i de aceea majoritatea aplicaiilor folosesc mai multe metrici simultan (aa cum, parafraznd, i omul folosete doi ochi n loc de unul). Atragem

14 716

atenia c aceasta este etapa "vulnerabil" a ntregului proces i poate conduce n final la confuzii, rezultate eronate sau chiar mistificri. Exprimarea popular cu tlc "Rezultatul msurtorii depinde de ce msur ai i de cine msoar" se potrivete i n aceast situaie. Rezultatul final al acestei etape este de obicei o valoare numeric unisau multi-dimensional (un vector) privit ca fiind "distana" vectorului de atribute fa de "bornele" de clasificare. IV. Clasificarea imaginii (pattern classification). Este etapa final n care se colaboreaz rezultatele msurtorilor multiple anterioare (realizate cu mai multe metrici diferite) i se stabilete apartenena formei, obiectului sau imaginii descris prin vectorul de atribute la o clas. Pentru creterea vitezei de clasificare apartenena la o clas se stabilete cu ajutorul unor metode ce snt specifice strategiei de recunoatere folosite. Ele poart denumirea de criterii matematice sau funcii de apartenen, ce se bazeaz pe poziia spaial a vectorului de semnificani fa de graniele (liniile, planele sau hiperplanele) de delimitare ntre clase, sau reguli structurale (sintactice) de decizie (acceptare) a apartenenei la o clas. Aplicarea practic a acestor metode de clasificare nu este ntotdeauna o problem simpl de calcul ci, de cele mai multe ori, necesit un aparat teoretic sofisticat i nite algoritmi pe msur. Rezultatul final al etapei de clasificare este numrul C al clasei de apartenen sau direct denumirea ei, de unde se obine implicit i numele obiectului ce se dorea a fi recunoscut. Literatura de specialitate grupeaz modelele i metodele generale de recunoatere i clasificare n patru mari categorii sau strategii, denumite abordri (pattern recognition approaches) [JDM, pag.6] : A. Recunoaterea prin potrivirea cea mai bun (template matching approach); B. Recunoaterea prin metode statistice (statistical approach); C. Recunoaterea cu ajutorul reelelor neuronale (neural networks approach); D. Recunoaterea sintactic sau structural (syntactic or structural approach);

15 718

Exist i o alt clasificare n doar dou mari categorii [GOW, pag.XIV]: A. Recunoaterea bazat pe metode teoretice de decizie (decision-theoretic methods); B. Recunoaterea sintactic sau structural (syntactic or structural methods); n cea de a doua clasificare, metodele A, B, C ale clasificrii anterioare snt cuprinse toate ntr-o singur categorie. Diferena ntre cele dou clasificri const n faptul c cele trei metode ce au fost grupate mpreun, dei diferite ntre ele, au comun totui la etapa clasificrii aceeai abordare funcional. Categoria D din prima clasificare este aceeai cu categoria B de metode din cea de-a doua clasificare i conine n etapa final a procesului de recunoatere (etapa clasificrii) aceeai metod de discriminare bazat pe algoritmi de apartenen, folosind arbori sintactici de acceptare. Aceast metod de recunoatere a apartenenei la o clas este o metod structural ce este inspirat din Teoria gramaticilor i limbajelor formale. Tabelul urmtor, adaptat dup [JDM, pag.6], ne ofer o privire de ansamblu asupra strategiilor (abordrilor) de recunoatere a formelor i clasificare a imaginilor scond n eviden modul specific, particular, de abordare a fiecrei strategii. De asemenea este prezentat distinct aparatul matematic implicat n analiza i modelarea procesului de recunoatere n cazul fiecreia din cele patru abordri. Strategia de abordare / Modelarea matematic Potrivirea cea mai bun (Template matching approach) Metode statistice (Statistical approach) Reele neuronale (Neural networks approach) Sintactic / structural (Syntactic / structural approach) Modele de Modele / reprezentare a funcii de atributelor discriminare (descriptorilor) (recunoatere) mostre de pixeli, funcia de contururi, forme corelaie, diferite metrici valori numerice, funcia de contururi, forme discriminare forme i mrimi funcie de numerice de decizie antrenament neuronal iruri de coduri reguli de (simboluri) derivare (sintactice)
clasificrii automate a imaginilor

Modele / criterii (condiii) de discriminare Minimizarea erorii/maximizare a potrivirii Minimizarea pierderii (riscului) Minimizarea erorii la nvare arbore de derivare sintactic

Tabelul sintetic de descriere a celor patru strategii de modelare a problemei recunoaterii i

16 719

restaurarea imaginii, mbuntirea calitii, amplificarea contrastului; eliminarea paraziilor i a "zgomotului" (noise reduction); transformarea Fourier a imaginii, folosit mai ales pentru analizarea texturii

algoritmi de reprezentare i descriere a formelor: descrierea contururilor, momente statistice invariante, descriptori Fourier, texturi;

algoritmi de segmentare a imaginii: detectarea discontinuitilor - puncte, linii, muchii (edges), conectarea segmentelor (edge linking), determinarea contururilor (boundries), filtre globale i adaptative (thresholdings), histograma;

Etapa n procesul I. recunoaterii Preprocesarea imaginii Modelul /Strategia de abordare A. Potrivirea cea mai bun (Template matching approach) B. Modelare prin

II. Extragerea atributelor (feature extraction)

III. Msurarea atributelor (feature measurement)

IV. Clasificarea (pattern classification) de boundary)

Tabelul sintetic al algoritmilor specifici folosii la recunoaterea imaginilor grupai pe modele /strategii i repartizai pe cele patru etape ale procesului de recunoatere

algoritmi de determinare a algoritmi potrivirii: distance metode riscului) average equation) perceptroni, multistrat, nvare i reguli metode algoritmi risk classifier, (decision ntre clase; statistice

minimum determinare a graniei

algoritmi morfologici: dilatare, eroziune, umplere, nfurtoarea convex, scheletizare;

matching by correlation

de algoritmi i funcii de

metode

statistice

minimizare a pierderii (a discriminare statistic: (conditional funcia de clasificare statistical Bayes statistical classifier); de metode neuronale de de exemplu training by antrenare, reele neuronale antrenare i nvare, de back-propagation; de metode de derivare i sintactic de a coduri (optimum Bayes

(Statistical approach)

C.

Modelare

prin

reele (Neural approach)

neuronale networks

D. Modelare sintactic / structural (Syntactic / structural approach)

algoritmi

de

reprezentare

i gramatici

descriere a formelor: nlnuire de derivare sintactic, arbori analiz coduri, aproximri poligonale, de shape numbers derivare (analiz) irurilor

semnturi, descriptori topologici, sintactic, automate finite (scanning); de recunoatere

720

nainte de trecerea n revist a numeroaselor strategii de modelare i a algoritmilor utilizai n sistemele de recunoatere a formelor i de clasificare a imaginilor, tabelul de mai sus cuprinde clasificarea sintetic unitar - pe strategii i modele - a tuturor algoritmilor folosii n recunoatere, att de numeroi i de diferii. Scopul urmrit este de a aduce un spor de claritate, care poate s conduc mai apoi la un plus de utilitate practic. Parcurgerea tabelului pe linii i pe coloane permite realizarea de corelaii ntre modelul matematic i strategia de recunoatere folosite de un algoritm i etapa din procesul de recunoatere la care acel algoritmul este adecvat, stabilindu-se astfel cu acuratee locul i rolul lui practic. Parcurgnd literatura de specialitate de exemplu colecia articolelor din International Journal on Document Analysis and Recognition, Springer-Verlag, 2004 se pot identifica o varietate impresionant de metode, tehnici i algoritmi diferii folosite n abordarea dificilei probleme a recunoaterii i clasificrii automate. Pentru edificare i pentru a crea o imagine just a multitudinii de perspective diferite existente, le vom trece n continuare n revist. Pentru acuratee i pentru a permite rafinarea ulterioar a termenilor ce apar, ei vor apare n limba englez fr traducere n limba romn. S observm mai nti c n articolele de sintez pe aceast tem se ofer explicit strategiile de modelare folosite, numite tehnici, metode sau abordri: n [TCY] sunt oferite trei strategii generale de recunoatere i regsire a imaginilor: the signature-based technique, the partition-based approach and the clusterbased approach. [MSTS&N] propune o clasificare asemntoare, tot n trei mari strategii: textbased retrieval, content-based retrieval, and semantic-based retrieval. Tot aici sunt trecute n revist metodele utilizate de sistemele autoamte de recunoatere i regsire a imaginilor existente pe pia. Exist astfel ase criterii generale de cutare /recunoatere /regsire: Color Content (CC), Shape Content (SC), Texture Content (TC), Color Structure (CS), Brightness Structure (BS) and Aspect Ratio (AR). Pe lng aceste strategii sau modele generale, pot fi gsite i alte abordri generale: component classification using fuzzy approach, User and Task-Based Approach, contextual clues and automatic pseudofeedback, relevance feedback, etc. Fr a epuiza subiectul, lista urmtoare conine o alte metode /tehnici /algoritmi ce combin strategiile de mai sus sau introduc altele noi: Fourier transform for

18 721

segmentation, wavelets analysis methods, multi-level color histogram, Similarity Measure methods, Dominant color classification, joint histograms, Edge angle distribution, 3D neighborhood graph model, Hough transform based methods, data covariance matrix based methods, connected component analysis, Statistical image differences methods, degradation features based techniques, Clustering methods, Skew estimation methods, skew detection using morphology, classification and segmentation using support vector machines, Multilevel thresholding Region growing Complex background analysis, classification and segmentation using boundary characteristics, etc.

BIBLIOGRAFIE
[VPRE] VASILE PREDA Explorarea vizual. Cercetri fundamentale i aplicative, Editura tiinific i enciclopedic, Bucureti, 1988 [GOW] - GONZALEZ R., WOODS R. - Digital Image Processing, Prentice Hall, 2002, 2nd Edition [JDM] A. JAIN, R. DUIN, J. MAO Statistical Pattern Recognition: A Review, IEEE Transactions On Pattern Analysis and Machine Intelligence, Vol. 22, No. 1, January 2000 [BKKP] - BEZDEK J., KELLER J., KRISHNAPURAM R., PAL N.- Fuzzy Models and Algorithms for Pattern Recogniton and Image Processing, Kluwer Academic Publishers, 1999 [VLA] AUREL VLAICU Prelucrarea digital a imaginilor, MicroINFORMATICA, Cluj-Napoca, 1997 [ISP 1] IOAN ISPAS Algoritmi de prelucrare digital a imaginilor, Referat, Univ. Babe-Bolyai, Facultatea de Matematic-Informatic, Cluj-Napoca, 2003 [ISP 2] IOAN ISPAS Baze de date de imagini, Referat, Univ. Babe-Bolyai, Facultatea de Matematic-Informatic, Cluj-Napoca, 2003

19 722

[ISP 3] IOAN ISPAS Algoritmi de recunoaterea formelor i clasificarea automat a imaginilor, Referat, Univ. Babe-Bolyai, Facultatea de Matematic-Informatic, ClujNapoca, 2003 [TCY] KIAN-LEE TAN, BENG CHIN OOI, CHIA YEOW YEE - An Evaluation of Color-Spatial Retrieval Techniques for Large Image Databases, Multimedia Tools and Applications, 14, 5578, 2001, Kluwer Academic Publishers [MSTS&N] MARJO MARKKULA, EERO SORMUNEN, MARIUS TICO, BEMMU SEPPONEN AND KATJA NIRKKONEN - A Test Collection for the Evaluation of Content-Based Image Retrieval Algorithms - A User and Task-Based Approach, Information Retrieval, 4, 275293, 2001, Kluwer Academic Publishers n lucrare s-au folosit spre ilustrare imagini oferite public: www.prenhall.com/gonzalezwoods/ - the companion web site for students, instructors and practitioners oferit de autorii bestseller-ului Digital Image Processing

20 723

S-ar putea să vă placă și