Prelucrarea de imagini este un domeniu care îşi păstrează
dinamismul în ciuda trecerii anilor. Dezvoltările tehnologice au facilitat accesul unui număr tot mai mare de oameni la această ramură fascinantă a imagisticii computerizate. Conţinutul imagisticii computerizate a fost sintetizat (Fig.1) în lucrarea lui Pavlidis [79], lucrare fundamentală pentru începuturile prelucrării de imagini. Imagine Descriere Prelucrare de imagini Grafică computerizată Recunoaştere de forme Fig. 1. Conţinutul imagisticii computerizate. În aceeaşi lucrare, Pavlidis propune clasificarea imaginilor în patru clase, astfel: • Clasa (1) de imagini include imaginile în scară de gri (sau color). • Clasa (2) de imagini cuprinde imaginile binare (sau cu câteva culori). • Clasa (3) de imagini include imagini formate din linii şi curbe continue. • Clasa (4) de imagini cuprinde imagini formate din puncte izolate sau poligoane. Se remarcă scăderea complexităţii imaginii odată cu numărul clasei, simultan cu reducerea semnificativă a volumului de date necesar pentru stocarea lor (Howe[51]). ELEMENTE DE INTELIGENTA ARTIFICIALA 1. Introducere. 2 Astfel imaginile de clasă (1) sunt cele mai complexe, un exemplu tipic de astfel de imagini fiind cele de televiziune, obţinute deci cu o cameră TV. Imaginile binare conţin doar două nuanţe, de obicei alb şi negru (sau doar câteva culori în cazul imaginilor color). Clasa (3) cuprinde imagini şi mai simple, adică conţinând doar linii şi curbe având grosimea de un pixel. Imaginile din ultima clasă sunt cele mai simple, ele fiind formate din puncte izolate sau, în cazul graficii computerizate, din poligoane care descriu corpul tridimensional a cărui reprezentare realistă se doreşte în final. Câteva exemple de imagini din diferite clase sunt date în continuare (Fig. 2): Clasa (1) Clasa (2) Clasa(3) Clasa (3) Clasa (4) Fig. 2. Exemple de imagini din diferite clase. O taxonomie a domeniului prelucrării de imagini în corelaţie cu grafica computerizată este propusă în continuare (Fig. 3): binarizare (segmentare) 1D 1 2 4 3D 3 subţiere contur extragere contur segmentare curbe aproximare expandare contur interpolare refacere umplere contur proiecţie 1D reconstrucţie 2D proiecţie 2D reconstrucţie 3D restaurare îmbunătăţire imagini filtrări recunoaştere PRELUCRARE IMAGINI GRAFICĂ Fig. 3. O taxonomie a imagisticii computerizate. Nu au fost reprezentaţi în diagrama anterioară algoritmii de codare/decodare a imaginilor, care formează un subdomeniu destul de consistent al prelucrării de imagini. Îmbunătăţirea imaginilor şi filtrările formează un domeniu care se ocupă de eliminarea zgomotelor, îmbunătăţirea contrastului, accentuarea muchiilor şi detecţia de muchii. Restaurarea imaginilor îşi propune eliminarea distorsiunilor care afectează imaginea, distorsiuni datorate unor fenomene fizice cunoscute, modelate matematic sau estimate. 1. Introducere. 3 Segmentarea imaginilor realizează separarea regiunilor uniforme, de interes, din imagine. Uniformitatea este o noţiune generală ea nereducându-se la constanţa nivelelor de gri (aceeaşi textură, aceleaşi proprietăţi, etc.). Binarizarea furnizează la ieşire o imagine de clasă (2), ea putând fi asimilată unei operaţii particulare de segmentare (de exemplu segmentarea cu prag). Algoritmii de extragere de contur furnizează la ieşire un contur închis, deci o imagine de clasă (3). Algoritmii de subţiere de contur realizează tot transformarea imaginilor de clasă (2) în imagini de clasă (3), dar furnizează la ieşire un graf. Imaginile de clasă (3) pot fi simplificate în continuare cu algoritmi de segmentare a curbelor, care furnizează localizarea aşa-numitele puncte critice şi, în plus, parametrii curbelor care aproximează/interpolează liniile şi curbele din imagine între două puncte critice succesive. Se poate remarca că, practic, se obţine în această fază o descriere extrem de simplificată a imaginii iniţiale. În cazul graficii computerizate, după cum s-a menţionat anterior, se pleacă de la o descriere a imaginii, urmărindu-se în cazul cel mai general, sinteza unei imagini realiste. Descrierea iniţială cea mai des folosită conţine o colecţie de poligoane împreună cu conexiunile dintre ele, ceea ce formează aşa-numita descriere "cadru-de sârmă" (wire-frame). Obţinerea imaginii realiste (clasa (1)) se traduce printr-o secvenţă de algoritmi care "apropie" imaginea sintetizată de cea reală. Algoritmii de aproximare/interpolare pleacă de la descrierea "cadru-de-sârmă" şi urmăresc obţinerea unei curbe netede pentru suprafeţele corpurilor tridimensionale ce se reprezintă. Algoritmii de umplere de contur realizează operaţia complementară extragerii de contur, în timp ce expandarea este operaţia complementară subţierii. Cunoscând sau deducând regulile de variaţie a nivelului de gri (culorii) de-a lungul suprafeţelor care mărginesc corpul, prin operaţia de refacere se poate obţine o reprezentare bidimensională realistă a corpurilor studiate. Se ţine cont de caracteristicile şi poziţia surselor de lumină şi caracteristicile locale ale corpurilor care se reprezintă (reflexivitate, transparenţă, etc.). Alte clase de algoritmi sunt specifice tomografiei computerizate, care realizează investigarea nedistructivă a corpurilor. Corpul studiat este penetrat de un fascicol de unde (raze "X", radiaţii electromagnetice, ultrasunete, etc) iar în prelungirea lor (mai puţin în cazul ultrasunetelor, care măsoară unda reflectată) un set de receptori măsoară energia rezultată a radiaţiei, energie dependentă direct de proprietăţile locale de absorbţie ale corpului investigat. Ceea ce se obţine la nivelul receptorilor este proiecţia 1D (deci un vector) a unei secţiuni plane a corpului investigat, într-o anumită direcţie. Reconstrucţia 2D reface secţiunea plană a corpului studiat dintr-un set de proiecţii 1D, în direcţii diferite, ale secţiunii. Având la dispoziţie mai multe asemenea secţiuni (paralele sau radiale) ale corpului studiat, se poate realiza reconstrucţia 3D a corpului studiat. Operaţia inversă se numeşte proiecţie 2D. Trebuie de remarcat însă că această sinteză nu trebuie văzută rigid, existând în literatură o multitudine de algoritmi care nu pot fi încadraţi în ea şi, în plus diferiţi autori încadrează diferit un acelaşi algoritm în categorii diferite. Ca exemplu, operaţia de codare a datelor poate fi văzută ca o extragere de trăsături regenerative, ceea ce se obţine fiind în esenţă o descriere a imaginii, scopurile urmărite fiind însă diferite. 1.2. Teoria recunoaşterii formelor - generalităţi. Recunoaşterea formelor (Meisel[72]), (Sklansky[102]), (Vancea[108]) se ocupă de clasificarea unui set de obiecte, procese sau evenimente. Clasificarea este un proces fundamental 1. Introducere. 4 care caracterizează nu numai ştiinţele ci şi viaţa socială. Metodele matematice dezvoltate în cadrul recunoaşterii formelor îşi găsesc aplicaţie în cele mai diverse domenii. Recunoaşterea formelor are ca scop determinarea clasei din care fac parte elementele unei mulţimi. Stabilirea numărului de clase este o problemă legată direct de caracteristicile aplicaţiei. Pot exista aplicaţii cu număr de clase cunoscut aprioric, dar şi aplicaţii în care numărul de clase trebuie stabilit algoritmic. Clasificatorul este sistemul care implementează operaţia de recunoaştere a formelor, deci el realizează o procedură stabilită anterior de clasificare. Există două abordări ale procesului de recunoaştere: recunoaşterea controlată şi recunoaşterea necontrolată. Recunoaşterea controlată (supervizată) implică existenţa unui set de forme a căror apartenenţă la clase este cunoscută. Acest set de forme include setul de formare (învăţare, antrenare) care este folosit pentru construcţia propriu-zisă a clasificatorului şi setul de predicţie (testare) al cărui scop este testarea (evaluarea) clasificatorului respectiv. Construirea clasificatorului este asociată în acest caz algoritmului de învăţare corespunzător clasificatorului, algoritm care construieşte în mod iterativ coeficienţii acestui clasificator. Recunoaşterea necontrolată (nesupervizată) nu necesită cunoaşterea apriorică a apartenenţei formelor din setul de formare la clase (Hartigan[46]). Această abordare dezvoltă algoritmi care realizează construcţia claselor pe măsură ce formele analizate sunt luate în considerare. Ei sunt numiţi algoritmi de grupare (clustering). Schema bloc a unui sistem de recunoaştere a formelor este dată în continuare (Fig. 4):