Recunoastere F

6. PRELUCRAREA DE NIVEL ÎNALT A IMAGINILOR.
RECUNOAŞTEREA FORMELOR
Recunoaşterea formelor reprezintă o etapă de nivel înalt în

prelucrarea imaginilor. Rezultatul acestei etape de prelucrare nu mai
reprezintă o imagine, ci poate fi o decizie, o descriere sau o interpretare
a imaginii iniţiale.
În general, prin recunoaşterea formelor se înţelege clasificarea
sau discriminarea unor obiecte, semnale sau procese, numite forme,
dintr-o mulţime dată. Această mulţime este partiţionată în submulţimi,
numite clase, separate prin anumite proprietăţi. Pe de altă parte,
proprietăţile grupează formele în interiorul claselor, ele fiind comune
membrilor unei clase. Scopul recunoaşterii formelor este acela de a
atribui formei analizate, numele (eticheta) clasei din care face parte.
Pentru recunoaşterea automată a formelor, se pot utiliza, fie
metode matematice, fie metode sintactice. Metodele matematice se
grupează, după proprietăţile claselor de forme, în metode deterministe şi
metode statistice. În cazul recunoaşterii formelor bidimensionale (de tip
imagine), cele mai larg utilizate metode matematice sunt cele cu decizie
teoretică. Aceste metode se bazează pe utilizarea unor funcţii de decizie
(funcţii discriminant) a căror valoare trebuie extremizată pentru
realizarea clasificării. Rezultatul recunoaşterii formelor prin utilizarea
funcţiilor de decizie constă doar în atribuirea etichetei clasei formei
recunoscute. Metodele sintactice sau structurale utilizează descrieri
simbolice ale formelor, care trebuie să fie propoziţii valide într-un
anumit limbaj. Rezultatul recunoaşterii prin utilizarea metodelor
sintactice conţine eticheta clasei (clasificarea), cât şi descrierea
structurală a formei. De cele mai multe ori, în procesul de recunoaştere,
se utilizează o singură metodă, dar sunt cazuri în care se întâlnesc şi
combinaţii ale acestor metode.
Schema funcţională a unui sistem general de recunoaştere a
formelor este prezentată în Fig. 6.1.
172
Semnificaţia notaţiilor din Fig. 6.1 este următoarea: FI – forma
de intrare, BA – bloc de achiziţie a datelor, BR – bloc de reprezentare a
formei, BD – bloc de decizie, BAS – bloc de analiză structurală, C –
clasificare, C+D – clasificare şi descriere.
FI C
BA BR BD
(BAS) (C+D)
Fig.6.1. Sistem general de recunoaştere a formelor.
În cazul recunoaşterii formelor bidimensionale (obiecte din

imagini) se consideră o împărţire a planului P în submulţimi C i , i
= 1,2,…, p , adică:
P
C i
 P
i 1
Submulţimile C i, i = 1,2,…,p, se caracterizează prin anumite

proprietăţi. Submulţimea (forma) S din P, aparţine clasei C i dacă S are
proprietăţile ce definesc clasa C i .
6.1. METODE DE RECUNOAŞTERE UTILIZÂND

ŞABLOANE (MODELE)
Una din primele şi cele mai simple metode de recunoaştere a

formelor este potrivirea cu modelul. Fiecărei clase îi corespunde un
model (şablon). Forma de clasificat (forma de intrare în dispozitivul de
recunoaştere) este comparată cu acest model. Pe baza criteriului de
clasificare stabilit în prealabil, forma de intrare se atribuie unei anumite
clase. O astfel de abordare s-a utilizat mult în cazul dispozitivelor
automate de recunoaştere a caracterelor şi a codurilor bancare.
Criteriul de clasificare este un criteriu de similitudine a formei
de intrare cu modelul. Pentru detectarea obiectului sau caracterului din
imagine, aceasta este baleiată cu o fereastră (mască) ce reprezintă
obiectul sau caracterul model până când modelul şi obiectul din imagine
173
se suprapun (ceea ce corespunde unei valori extreme a criteriului de
similitudine).
În cazul imaginilor binare, cel mai simplu criteriu de
similitudine îl constituie numărul maxim de coincidenţe între pixelii
şablonului şi pixelii porţiunii de imagine comparate cu şablonul. De
asemenea, se poate folosi un criteriu echivalent şi anume numărul
minim de nepotriviri între şablon şi fereastra comparată .
În cazul imaginilor cuantizate pe mai multe niveluri de gri, se
adoptă drept criteriu de similitudine fie distanţa minimă dintre şablon şi
fereastra de imagine, fie funcţia de intercorelaţie normalizată maximă
dintre şablon şi fereastra de imagine.
Metoda este afectată de distorsiuni, zgomot şi rotaţii de
imagine.
Considerând cazul mai multor niveluri de gri, se notează cu Gs
funcţia nivel de gri pentru şablon şi cu Gu,v funcţia nivel de gri pentru
fereastra de imagine cu originea în punctul (u, v), originea ferestrei fiind
colţul din stânga sus:
G S : M S xN S  N , Gu ,v : M u xN v  N
unde: n1 x n2 este dimensiunea imaginii, ms x ns este dimensiunea

modelului,
Ms = {0,1, …, ms – 1}, N s = {0, 1, ..., n s – 1}, ms < n1 , ns <

n2 ,
Mu = { u , u + 1,..., u + ms – 1}, Nv = {v, v +1,…, v + ns – 1},
u є {0,1,…, n1 – ms}, v є {0,1,…, n2 – ns }
Se defineşte funcţia distanţă euclidiană DS dintre şablonul Gs şi

fereastra de imagine Gu,v prin:
1
m S 1 n S 1 2
 
DS (u , v)     GS (i, j )  Gu , v (i  u, j  v) 2 
 i 0 j 0 
(6.1)
174
Dacă această distanţă este zero, se consideră că obiectul din
fereastra de imagine Gu,v aparţine clasei şablonului. Datorită prezenţei
zgomotului, în loc de D(u,v) = 0, se adoptă criteriul:
D(u,v) = min {D(k ,l)/ kє Mu , lє Nv } ≤ TD , (6.2)
unde TD ≥ 0 este un prag prestabilit.

Se pot folosi şi alte tipuri de distanţă între două matrice. De
exemplu, o distanţă mai uşor de evaluat, dar mai puţin precisă, este
maximum modulului diferenţelor dintre componentele celor două
matrice D* (6.3).
D * (u , v )  max G S (i, j )  Gu ,v (i  u , j  v ) (6.3)

i, j
În prezenţa zgomotului, se preferă funcţia de intercorelaţie

normalizată R(u,v) dintre şablonul Gs şi ferestra de imagine considerată
Gu,v (6.4):
mS 1 nS 1
 G
i 0 j 0
S (i, j ) Gu ,v (i  u , j  v )
R (u , v)  1 1
mS 1 nS 1 2 
2 mS 1 nS 1
2
    Gu ,v (i  u , j  v       GS (i, j ) 
2
 i  0 j 0   i  0 j 0 
(6.4)
În acest caz, criteriul de similitudine este (6.5):
R(u,v) = max{R(k,l), kє Mu, lє Nv}≥TR (6.5)
unde TR ≤ 1 este un nivel prestabilit, iar –1 < R(u ,v ) < 1.

Metoda suprapunerii cu modelul prezintă unele dezavantaje care
o fac să fie mai puţin utilizată în cadrul sistemelor de vedere artificială:
175
► la o baleiere a imaginii, se poate detecta doar prezenţa obiectului
reprezentat prin şablonul respectiv. Dacă se urmăresc detectarea mai
multor obiecte şi clasificarea lor, imaginea trebuie baleiată pe rând, cu
fiecare şablon;
► volumul de calcul la o singură baleiere este foarte mare, decizia
putându-se lua după ce s-au efectuat (n1 - ms + 1 ) x (n1 - n2 + 1 ) paşi de
calcul de tipul (6.1) sau (6.4);
► potrivirea cu modelul este dependentă de rotaţia imaginii.
Pentru reducerea timpului şi volumului de calcul, Barnea şi
Silverman [15] au propus o metodă secvenţială, prin considerarea unei
funcţii eroare, E, care se calculează pentru fiecare poziţionare (u,v) a
ferestrei comparate, prin sumarea repetată a modulelor diferenţelor
punctuale:
mS 1 nS 1
E (u , v)  
i 0 j 0
GS (i, j )  Gu ,v (i  u , j  v)
Iniţial, se fixează un prag P, iar E(u,v) se calculează pornind din

0. Dacă, în calculul lui E(u,v), se depăşeşte pragul P, înainte de sumarea
completă, se renunţă imediat la calculul distanţei (6.1) pentru punctul
corespunzător şi se trece la punctul următor de evaluare.
Metoda suprapunerii cu modelul este utilizată cu bune rezultate
dacă şabloanele au dimensiuni mici, iar obiectele sunt bine poziţionate
în câmpul de imagine (de exemplu, recunoaşterea caracterelor). Aceste
metode elementare pot fi considerate ca fiind matematice, bazate pe
funcţii de decizie (distanţa euclidiană sau funcţia de intercorelaţie
normalizată). Pentru a reduce volumul de calcul şi, evident, timpul de
recunoaştere, în majoritatea aplicaţiilor bazate pe funcţii de decizie, se
obişnuieşte să se reducă dimensiunea spaţiului în care se face
comparaţia, prin utilizarea trăsăturilor.
6.2. METODE DE RECUNOAŞTERE BAZATE PE FUNCŢII

DE DECIZIE ÎN SPAŢIUL TRĂSĂTURILOR
S-a arătat că imaginea de intrare, conţinând forma de clasificat,

poate fi reprezentată printr-o matrice [G], de dimensiune n1 x n2 :
176
Ea trebuie comparată, în spaţiul euclidian al formelor, de
dimensiune n1 x n2 , cu formele de referinţă ce reprezintă clasele C i din
mulţimea:
C ={Ci , i = 1,2,…, p}
De obicei, dimensiunea n1 x n2 a matricei [G] este foarte mare şi

atunci comparaţia nu se mai face în spaţiul formelor, ci într-un spaţiu X
de dimensiune s, mult mai mică, numit spaţiul trăsăturilor ( s<<n1 n 2 ).
După cum s-a menţionat în Cap.5, în linii mari, prin trăsături se
înţeleg caracteristici numerice comune tuturor formelor analizate, ce
concentrează o cantitate mare de informaţie şi care, pe cât posibil, iau
valori diferite de la o clasă la alta. Aceste trăsături pot fi considerate
descriptori de forme bidimensionale.
Extragerea trăsăturilor în scopul recunoaşterii formelor este
particulară şi ţine seama de aplicaţia respectivă, neexistând până în
prezent o teorie riguroasă privind alegerea lor. Totuşi, criteriile de
selecţie trebuie să ţină seama de următoarele elemente: eficienţa,
importanţa trăsăturilor în separarea claselor (în spaţiul trăsăturilor,
distanţa dintre clase să fie cât mai mare), timpul, costul, redundanţa etc.
Uneori, se cere invarianţa trăsăturilor la rotaţia şi translaţia imaginii.
În vederea recunoaşterii, în faza iniţială – de învăţare – spaţiul
trăsăturilor X este partiţionat în mulţimi disjuncte C i, i = 1,2,…,p ,
reprezentând clasele. În cazul cel mai simplu, o clasă C i poate fi
reprezentată printr-un punct [z i], corespunzând unei forme imagine de
referinţă, numită prototip. Acest punct, din spaţiul X, constituie vectorul
valorilor trăsăturilor de referinţă pentru clasa C i. Alt caz îl constituie
acela în care, o clasă C i este reprezentată prin mai multe prototipuri:
[z i ,1], [z i ,2], … , [z i ,Ni]. În sfârşit, al treilea caz îl constituie acela în
care, o clasă este reprezentată prin domenii din spaţiul trăsăturilor.
Clasificarea se face pe baza comparaţiei dintre vectorul
trăsăturii măsurate [x] = [x 0 , x 1 , … , x s-1]T şi vectorii trăsăturilor de
referinţă [zi] = [z i0, z i2,…,z is-1]T , i = 1,2, … , p , cu ajutorul unor funcţii:
di: X →R ,
177
numite funcţii de decizie sau funcţii discriminant, ataşate claselor. Prin
intermediul acestor funcţii, se pot stabili frontiere de decizie, care separă
clasele.
Dintre funcţiile de decizie, cele mai folosite sunt funcţiile de
decizie liniare şi funcţiile de decizie de tip distanţă.
Pe baza celor menţionate mai sus se poate considera schema
funcţională a sistemului de recunoaştere automată a formelor în
abordarea cu decizie teoretică, prezentat în Fig.6.2. Semnificaţia
notaţiilor din figură este următoarea: F – forma de măsurat (imaginea
achiziţionată), ET – blocul pentru extragerea trăsăturilor, VTM –
vectorul trăsăturilor măsurate, C – clasificatorul, D – decizia de
apartenenţă a formei măsurate la o clasă, FE – forme eşantion, ST –
blocul de selectare a trăsăturilor, I – blocul de învăţare, VTR – vectorul
trăsăturilor de referinţă.
VTM D
ET C
F
VTR
FE
ST I
Fig. 6.2. Sistem de recunoaştere a formelor în abordarea cu decizie

teoretică.
6.2.1. Funcţii de decizie liniare
O funcţie de decizie liniară este de forma (6.6):
d([x]) = [w]T[x] + ws = w0 x0 + w1 x1 + … + ws-1 xs-1 + ws (6.6)
unde :
[w] =[ w0 ,w1 ,…,ws-1]T
este vectorul ponderilor (constantelor), iar
178
[x ] = [x0 ,x1 ,…, x s-1]T
este vectorul trăsăturilor, w s = const.

În abordarea problemei recunoaşterii formelor prin metoda
funcţiilor de decizie liniare, fiecărei clase Ci , i = 1, 2, …,p, caracterizată
prin trăsătura de referinţă zi (6.4), i se ataşază o funcţie de decizie liniară
di (6.5), ale cărei ponderi wji , j = 0, 1, …, s, se determină în funcţie de
trăsătura de referinţă:
[ z i ]  [ z 0i , z1i ,..., z si 1 ]T (6.7)
s 1
d i ([ x ])   w ij x j  w si , i  {1, 2,..., p} (6.8)
j 0
i
Forma de intrare [x] se atribuie clasei C dacă pentru orice
jє{1,2,…, p}, j ≠ i , este îndeplinită relaţia:
di ([x]) > dj ([x]) ,
adică
di([x]) = max. pentru iє{1,2,…, p} (6.9)
d1([x])
GFD1
d2([x]) DEC
GFD2 BD
[x]
dp([x])
GFDp
Fig. 6.3. Schema funcţională a unui clasificator de forme bazat pe trăsături şi
179
funcţii de decizie liniare.
În acest sens, în Fig. 6.3 este prezentată schema funcţională a

unui clasificator de forme bazat pe trăsături şi funcţii de decizie liniare,
în care:
► GFD denumeşte un generator de funcţie de decizie liniară,
► BD este blocul de decizie sau selectorul de maximum,
► [x] este forma măsurată, (vectorul valorilor trăsăturilor ce
caracterizează forma),
► di ([x]) este valoarea funcţiei de decizie liniară, asociată clasei C i , i =
1, 2,…, p , pentru forma măsurată [x], iar
► DEC reprezintă decizia că [x ]є C i, dacă di (x) = max.
Exemplu
Fie două clase C 1 şi C 2 în planul P (corespunzător reprezentării
spaţiului trăsăturilor prin două trăsături, x0 şi x1), caracterizate prin
funcţiile de decizie:
d1 ([x]) = - x0 + x1 – 1 ,
d2 ([x]) = x0 – x1 + 1
În acest caz, se poate considera, ca frontieră de decizie şi, totodată,

frontieră de separare , dreapta de ecuaţie:
δ: x1 – x0 – 1 = 0
x1 δ: x1-x0-1=0
C1
C2
x0
Fig. 6.4. Exemplu de proces de clasificare bazat pe funcţii de decizie liniare,
180
cu două clase.
Astfel:
► dacă d1 ([x]) > 0 şi d2 ([x]) < 0, atunci [x]є C 1;
► dacă d1 ([x]) < 0 şi d2 ([x]) > 0, atunci [x]є C 2;
► dacă d1 ([x]) = d2 ([x]) = 0, atunci apartenenţa lui [x] este
nedeterminată.
Funcţiile de decizie liniare pot fi generalizate considerând , în

loc de componentele xj , j=0,1,…, s-1, ale vectorului trăsăturilor
măsurate [x], diferite funcţii reale fj([.] (6.10), având ca variabilă,
vectorul [x]:
d([x]) = w0f0([x])+w1f1([x]) + . . . +ws-1fs-1([x]) +ws (6.10)
Considerând vectorul:
[x* ] = [f0 ([x]), f1 ([x]) ,…, fs-1 ([x])]T ,

se observă că relaţia (6.10) are formă liniară.
O clasă importantă de funcţii fj o reprezintă funcţiile
polinomiale. Exemple mai des întâlnite de astfel de funcţii sunt funcţiile
liniare, pentru care se obţin relaţii de tipul (6.6), şi funcţiile de gradul al
doilea.
6.2.2. Funcţii de decizie de tip distanţă
Clasificarea formelor cu ajutorul funcţiilor distanţă reprezintă

una dintre cele mai utilizate metode în recunoaşterea automată a
formelor. Ea dă rezultate bune atunci când formele au tendinţa de
grupare în jurul unor centre de grupare sau prototipuri ce reprezintă
clasele.
Se va arăta că funcţia discriminant de tip distanţă euclidiană
poate fi redusă la o funcţie de decizie de tip liniar, precizându-se
formele ei în cazul în care, clasele sunt caracterizate printr-un prototip şi
în cazul în care, clasele sunt caracterizate prin mai multe prototipuri. De
asemenea, se vor prezenta metode de determinare a centrelor de grupare.
181
A. Clase caracterizate printr-un singur prototip
Aceste situaţii se întâlnesc atunci când formele de analizat

prezintă mici variaţii în jurul unor forme prototip, reprezentând clasele.
suficient de distanţate între ele (de exemplu, cecurile bancare,
caracterele tipărite, unele piese industriale etc., pentru care apar erori
datorate conversiei analog-numerice sau datorate micilor imperfecţiuni
de fabricaţie).
Considerând p clase de forme, fiecare reprezentată de o formă
prototip [z i], i = 1,2, … , p, clasificatorul bazat pe distanţa minimă
calculează distanţa (de exemplu, cea euclidiană) între vectorul
trăsăturilor corespunzător formei măsurate x şi cel corespunzător
fiecărui prototip (6.11):
D([ x], [ z i ])  ([ x]  [ z i ]) T ([ x ]  [ z i ]) , i  1,2,..., p (6.11)
Forma [x] este atribuită clasei clasei Ci dacă:
D([x],[zi]) < D([x],[z j]), pentru jє{1,2,…, p}, j ≠ i,
adică,
D( [x ], [z i] ) = min., pentru iє{1,2,…, p} (6.12)
Se poate arăta că funcţia de decizie de tip distanţă (6.11) este

echivalentă cu o funcţie de decizie liniară. Astfel, ridicând la pătrat
relaţia (6.11), se obţine:
1 i T i
D 2 ([ x], [ z i ])  [ x]T [ x]  2([ z i ]T [ x]  [ z ] [ z ]) (6.13)
2
cu [x]T [x] = const., pentru un [x] dat.
Deoarece D ([x] ,[zi])≥0, rezultă:
182
D ([x] ,[zi]) = min. pentru iє{1,2,…, p} dacă şi numai dacă D 2 ( [x],[zi])
= min. pentru iє{1,2,…, p}.
Notând:
1
d i ([ x ])  [ z i ]T [ x]  [ z i ]T [ z i ] (6.14)
2
din relaţia (6.13), rezultă că minimizarea (6.12) este echivalentă cu

maximizarea (6.15):
di ([x]) = max., pentru iє{1,2,…, p} (6.15)
Notând ponderile :
1 i T i
[ z i ]  [ w],  [ z ] [ z ]  wS
2
se observă că relaţia (6.14) este expresia unei funcţii de decizie liniare

de tipul (6.6).
Exemplu
În Fig. 6.5 este prezentat un exemplu în care intervin două
trăsături, x0, x1 şi clasele C1, C2, C3, reprezentate, respectiv, de formele
prototip [z1] = [-4,3]T, [z2] = [0,-3]T, [z3] = [5,0]T. În sistemul de axe x0,
x1, clasele şi trăsătura măsurată [x] sunt marcate prin puncte. Calculând
distanţele euclidiene de la [x] la fiecare clasă C1, C2 şi C3, rezultă că
trăsătura [x] = [4,1]T este mai aproape, în sensul distanţei euclidiene, de
prototipul clasei C3. Într-adevăr, D2(C1,[x]) = 68, D2(C2,[x]) = 52, D2(C3,
[x]) = 2, deci [x]є C3.
x1
1
C
[x] C3
x0
C2
Fig. 6.5.Exemplu de trei clase caracterizate printr-un singur prototip.
183
Pentru recunoaşterea formelor, se pot folosi şi alte tipuri de
distanţe capabile să aprecieze apropierea vectorului trăsăturilor măsurate
de vectorii trăsăturilor de referinţă. De exemplu, o distanţă mai uşor de
evaluat, este maximum modulului diferenţelor dintre componentele
celor doi vectori D* (6.16):
D * ([ x], [ z i ])  max{ x j  z ij } (6.16)

j
B. Clase caracterizate prin mai multe prototipuri
Dacă clasele C i , i = 1,2,…, p, sunt reprezentate prin

prototipurile [z i,k ], k =1,2,…,Ni , atunci forma măsurată aparţine unei
clase C j, dacă ea este mai aproape de unul din prototipurile din C j decât
de prototipurile altei clase (în sensul distanţei considerate).
Clasificatorul determinat va fi asemănător cu cel prezentat anterior, în
cazul claselor caracterizate printr-un singur prototip.
Notând cu:
D ([x ],C i) = min{D ([x],[z i, k])}, pentru kє{1,2,…,Ni}, (6.17)
distanţa dintre forma măsurată [x] şi clasa Ci, atunci forma [x] se
atribuie clasei Ci dacă:
D ([x],Ci ) < D ([x], C j ), pentru orice jє{1,2,…,p}, j ≠ i,
Astfel, pentru criteriul de distanţă minimă, se obţine, din nou, forma

(6.12):
D ([x],Ci ) = min. pentru iє{1,2,…,p}
Procedând ca în cazul claselor caracterizate printr-un singur

prototip, se găsesc funcţiile de decizie liniare corespunzătoare fiecărei
clase Cl, l = 1,2,…,p:
 1 
d i ([ x])  max[ x]T [ z ki ]  [ z ki ]T [ z ki ], k  1,2,..., N i 
k
 2 
184
Se consideră că [x]є Ci, dacă di([x]) > dj ([x]), oricare ar fi jє{1,2,
…,p}, j ≠ i.
Astfel, clasificatorul bazat pe distanţă minimă, pentru clase
caracterizate prin mai multe prototipuri, este un caz particular de
clasificator liniar pe porţiuni.
Exemplu
În Fig.6.6, este prezentat un exemplu de două clase,
caracterizate prin mai multe prototipuri, în planul trăsăturilor x0 ,x1.
Clasa C1 este reprezentată prin prototipurile [z1,1] = [-2,1]T, [z1,2] = [-
2,0]T şi clasa C2, prin [z2,1] = [2,2]T, [z2,2] = [3,2]T, [z2,3] = [3,1]T, iar [x] =
[-1,0]T. Se observă că D2(C1,[x]) = 1 şi D2(C2,[x]) = 13, deci: [x]є C1.
x1
z2,1
z2,2
C2
1,1
z
[x] z2,3
x0
z1,2
C1
Fig. 6.6. Exemplu de două clase caracterizate prin mai multe prototipuri.
6.2.3. Metode de grupare
În proiectarea clasificatorilor bazaţi pe conceptul de distanţă

minimă, un loc important îl ocupă determinarea centrelor de grupare
dintr-o mulţime dată de forme (forme eşantion) şi gruparea
prototipurilor pe clase. Aceste metode sunt mai mult euristice.
Un exemplu de algoritm simplu de grupare este următorul.
Să presupunem că avem N forme eşantion: [x1], [x2 ],…[xN ]. Fie
1
[z ] primul centru de grupare coincizând cu o formă eşantion oarecare,
185
de exemplu, [x1 ]. Se calculează distanţa D21 de la [x2 ] la [z1 ]. Dacă
această distanţă este mai mare decât un prag P, atunci se consideră un
nou centru de grupare, [z2 ] = [x2 ]. Altfel, se consideră că [x2] aparţine
grupării de centru [z1]. Să presupunem că [z2 ] = [x2 ] (D21 > P). Se
calculează distanţele D31 şi D32 de la [x3 ] la [z1 ], respectiv de la [x3 ] la
[z2 ]. Dacă D31 > P şi D32 > P, atunci se creează un nou centru de grupare
[z3 ] = [x3 ]. Altfel, se atribuie [x3 ] grupării al cărei centru este mai
aproape de [x3 ].
Similar, se calculează distanţa de la fiecare formă eşantion la
fiecare centru de grupare şi se compară cu pragul P. Dacă toate aceste
distanţe sunt mai mari decât P, atunci se creează un nou centru de
grupare; în caz contrar, această nouă formă se atribuie grupării al cărei
centru este cel mai apropiat de ea (în sensul distanţei minime).
Rezultatele procedurii depind de primul centru de grupare ales,
de pragul P şi de proprietăţile geometrice ale imaginii achiziţionate.
Această metodă se recomandă să fie folosită atunci când datele prezintă
grupări bine separate relativ la pragul P.
A. Algoritm bazat pe distanţa max.-min.
Acest algoritm este asemănător cu cel precedent, cu deosebirea

că, la început, se determină centrele de grupare cele mai depărtate.
Astfel, se calculează distanţa dintre primul centru de grupare,
considerat [x1 ] = [z1 ] şi cel mai depărtat eşantion, fie acesta [xk ]. Dacă
ea este mai mare decât un prag P prestabilit, atunci se creează un nou
centru de grupare, [z2 ] = [xk ] şi se reia testarea. Dacă distanţa este mai
mică decât P, atunci nu există decât o grupare şi algoritmul se opreşte.
Apoi, se calculează distanţele Dj1, Dj2 dintre fiecare eşantion
rămas, [x j], j ≠ 1, j ≠ k şi centrele de grupare [z1 ] şi [z2 ]. Pentru fiecare
pereche (Dj1 ,Dj2 ), se păstrează valoarea minimă Dj = min{ Dj1 ,Dj2 }.
Dacă valoarea maximă D3 = max {Dj }≥ P, pentru j,k є {1,2 ,…, N}, j ≠
1, j ≠ k, atunci se creează un nou centru de grupare [z3 ] = [xm ], unde
[xm] este eşantionul corespunzător lui D3 . Dacă D3 < P, atunci
eşantioanele rămase se atribuie celor două grupări, după criteriul
distanţei minime faţă de centrul grupării. Algoritmul continuă până când
se epuizează toate eşantioanele. Concluziile privind rezultatele
procedurii sunt asemănătoare celor de la algoritmul precedent.
186
B. Algoritm bazat pe mediere
Acest algoritm minimizează un indice de performanţă definit ca

suma pătratelor distanţelor de la fiecare punct al unei grupări la centrul
grupării. Algoritmul cuprinde următoarele etape:
1. Se aleg K centre iniţiale de grupare: [z1](1), [z2](1),…,[zK](1).
Acestea sunt arbitrare şi, de obicei, sunt alese primele K eşantioane ale
setului dat.
2. La pasul de iteraţie m, se atribuie eşantioanele [x j], jє{1,2,…, N}
celor K grupări utilizând relaţia:
[x j]є Sl (m), dacă D{[x j],[z l](m)}< D{[x j],[z i](m)},
pentru iє{1,2,…,K}, i ≠ j, i ≠ l
În relaţia de mai sus, D{[x j],[z l](m)} este distanţa dintre eşantionul [x j]
şi centrul de grupare [z l](m), iar Sl (m) denumeşte gruparea al cărei
centru este [z l](m), lє{1,2,…,K}, dat.
3. Din rezultatele etapei 2 se calculează noile centre de grupare de la
pasul de iteraţie m+1, [zl](m+1), jє{1,2,…,K}, astfel încât suma
pătratelor distanţelor de la toate punctele din Sl (m) la noul centru să fie
minimă. Cu alte cuvinte, noul centru de grupare [zl](m+1) este
determinat astfel încât indicele de performanţă:

2
Jl  [ x ]  [ z l ](m  1)
[ x ]Sl ( m )
să fie minimizat. Rezultă că [z l ](k+1) este valoarea medie pentru setul

Sl(m) :
1
[ z l ](m  1)   [ x]
N [ x ]Sl ( m )
jє{1,2,…,K }, unde N este numărul de eşantioane din Sl(m) .
187
4. Dacă [zl](m+1)= [zl](m), pentru j{1,2,…,K}, algoritmul se termină.
Dacă nu, se trece la etapa 2.
Algoritmul este influenţat de numărul de centre de grupare
stabilit, de alegerea efectivă a centrelor de grupare, de ordinea în care
sunt luate eşantioanele şi de proprietăţile geometrice ale imaginii
achiziţionate. Deşi nu există o teoremă generală de convergenţă pentru
acest algoritm, se poate afirma că el dă rezultate acceptabile atunci când
trăsăturile măsurate formează grupări relativ depărtate unele faţă de
celelalte.
6.2.4. Recunoaşterea formelor prin metoda arborelui binar de

decizie
Dacă o trăsătură x asigură un grad bun de separabilitate a

claselor, adică ia valori relativ distanţate de la o clasă la alta:
x i  [ x k  c, x k  c ], i, k  {1,2,..., p}, i  k, c > 0 dat, (6.18)
pentru accelerarea procesului de recunoaştere, se poate utiliza o metodă

simplă, numită arborele binar de decizie şi în care operaţia de clasificare
se face doar în funcţie de această trăsătură. Metoda este de tip
secvenţial.
Pentru alcătuirea arborelui binar de decizie se consideră că
numărul de clase este o putere a lui 2: p =2q. Dacă acest lucru nu se
îndeplineşte, atunci numărul real de clase se completează cu un număr
de clase auxiliare până la următoarea putere a lui 2.
Arborele binar de decizie este alcătuit din noduri, unite între ele
prin săgeţi, într-o structură triunghiulară, cu baza în jos. Un nod poate
avea cel mult o intrare şi cel mult două ieşiri. Nodurile sunt de trei
feluri: nod rădăcină, nod terminal şi nod de tranziţie (Fig. 6.7) .
Nodul rădăcină este nodul cu două ieşiri şi nici o intrare. Din
nodul rădăcină porneşte procesul de clasificare. Există un singur nod
rădăcină pentru un proces de clasificare, aflat în vârful triunghiului..
Nodurile terminale sunt nodurile cu o intrare şi nici o ieşire.
Procesul de clasificare se opreşte într-un nod terminal. Numărul
188
nodurilor terminale este egal cu numărul claselor de forme (putere a lui
2). Ele sunt poziţionate la baza triunghiului.
Nodurile de tranziţie sunt nodurile cu o intrare şi două ieşiri.
Ele sunt aşezate pe mai multe niveluri intermediare, între nodul rădăcină
şi nodurile terminale.
Fiecărui nod de tranziţie îi sunt ataşaţi doi subarbori, denumiţi
subarbore stâng şi subarbore drept. Un nod conţine o etichetă cu trei
câmpuri, şi anume: N – numărul de ordine, K – cheia informaţiei, T –
tipul nodului (Fig.6.8).
Pentru nodurile terminale, cheile vor avea valorile de referinţă
xj(ref), jє{1,2,…, p}, asociate claselor, iar la tipul nodului se pun clasele
C j.
a) b) c)
Fig. 6.7. Tipuri de noduri: a) nod rădăcină; b) nod terminal; c) nod de tranziţie.
Fiecărui nod de tranziţie şi nodului rădăcină le este asociată

informaţia cu cheia K, care va fi determinată mai jos, iar la tipul nodului
se pune 0.
N K T
Fig. 6.8. Eticheta unui nod.
Nodurile sunt organizate pe niveluri. Astfel, dacă numărul de

clase este p, atunci numărul de niveluri ale arborelui este 2p-1, dintre
care p vor fi de tip terminal.
Un nod, care nu este terminal, se leagă cu cei doi descendenţi ai
săi, care se află pe nivelul inferior, prin două săgeţi care pornesc din el.
Nodul rădăcină are numărul de ordine 1, cheia K(1) şi se va afla
pe nivelul 0.
189
Nodurile de pe nivelul i au numerele de ordine (de la stânga la
dreapta): 2i, 2i+1, … , 2i+1 –1 (în total 2i noduri), cheile: K(2i), K(2i+1),
…, K(2i+1 -1) şi sunt descendenţi direcţi ai nodurilor de pe nivelul i-1.
De la nodul rădăcină la un nod k există o singură cale.
Considerând p = 2q , algoritmul de construcţie a arborelui binar
de decizie, corespunzător trăsăturii alese (cu grad de discernabilitate
maxim), constă în următoarele:
a) Se ordonează şirul valorilor trăsăturii de referinţă în sens crescător:
x 1(ref) < x 2(ref) < … < x p(ref)
b) Se alcătuieşte structura arborelui binar de decizie pe q+1 niveluri,

din p noduri terminale, p-2 noduri de tranziţie şi un nod rădăcină.
c) Cheile nodurilor se completează astfel:
cheile nodurilor terminale (de pe ultimul nivel, q) sunt egale cu
valorile x j(ref), j є{1,2,…, p}, ordonate de la stânga la dreapta , în
sens crescător, iar cheile nodurilor de tranziţie şi cheia nodului
rădăcină sunt determinate succesiv, de jos în sus, pornind de la
cheile nodurilor terminale. Astfel:
KS  KD
K
2
unde Ks este cheia nodului descendent stâng, iar Kd este cheia nodului
descendent drept.
Pentru a clasifica o formă cu ajutorul arborelui binar de decizie, se
compară trăsătura măsurată x cu cheile K(j), jє{1,2,…,}, începând cu
nodul rădăcină şi continuând cu descendenţii direcţi, în felul următor:
dacă x < K(j), se trece la nodul descendent direct stâng, iar dacă x >K(j),
se trece la nodul descendent direct drept. Datorită restricţiei (6.19)
egalităţile sunt omise. Forma este atribuită clasei nodului terminal în
care se ajunge. Avantajul acestei metode constă în rapiditate, fiind
necesare doar q comparaţii simple.
Exemplu
190
În Fig. 6.9 este prezentat un exemplu de arbore binar de decizie
pentru p = 4 clase şi x 1(ref) = 2, x 2 (ref) = 4, x 3(ref) = 6, x 4(ref) = 8. Să
se clasifice forma a cărei trăsătură măsurat este x = 4,2. Traseul urmat de
procesul de clasificare este marcat prin săgeţi îngroşate. Rezultatul este
xєC2.
1 5 0
4,2 ‹5
2 3 0 3 7 0
4,2 › 3
4 2 C1 5 4 C2 6 6 C3 7 8 C4
Fig. 6.9. Exemplu de arbore binar de decizie pentru 4 clase.
Deoarece recunoaşterea se face pe baza unei singure trăsături,

dezavantajul principal îl constituie faptul că pot fi atribuite unei clase
forme care, în realitate nu aparţin ei. Astfel, dacă valorile x j(ref) nu sunt
suficient de distanţate, datorită dispersiilor admise ale claselor, relativ la
trăsătura respectivă, formele pot fi clasificate incorect. Din această
cauză, uneori, este necesară o verificare ulterioară a clasificării pe baza
distanţei minime (în acest criteriu intervin toate trăsăturile selectate).
6.3. METODE DE RECUNOAŞTERE SINTACTICE
6.3.1. Reprezentarea formelor prin şiruri de primitive
În abordarea sintactică a recunoaşterii formelor, este esenţială

descompunerea formelor în subforme sau primitive. Fiecare primitivă
este interpretată ca simbol permis într-o anumită gramatică, unde prin
gramatică sunt înţelese, în linii mari, un set de reguli de sinteză pentru
generarea propoziţiilor din simboluri date. Fiecărei clase îi corespunde
un limbaj generat cu o anumită gramatică:
191
C j ↔L(Gj ), jє{1,2,…, p}
Fiind dată o propoziţie (un şir de simboluri), ce reprezintă o

formă imagine, problema care se pune este de a decide în care limbaj
descrierea acestei forme este o propoziţie validă. Forma este atribuită în
mod unic clasei C j dacă ea este o propoziţie din L(Gj) şi nu din alt
limbaj.
Definiţie
Formal, o gramatică este definită ca un cuadruplu:
G =(N,Σ P, S ) ,
unde:
- N este mulţimea finită a neterminalelor sau variabilelor;
- Σ este mulţimea finită a terminalelor sau constantelor;
- N  
- P este mulţimea finită a regulilor de formare (de generare, de
rescriere sau de producere);
- S este simbolul de start, Sє N
Definiţie
Mulţimea N    V se numeşte alfabetul gramaticii G. Se
notează cu V* închiderea lui V, adică mulţimea formată din toate
propoziţiile cu simboluri din V, iar cu V +, mulţimea V* \{λ} unde λ este
şirul nul (propoziţie fără simboluri, de lungime nulă).
În cele ce urmează, se vor utiliza următoarele notaţii:
-literele mari - variabilele;
-literele mici de la începutul alfabetului - constantele;
-literele mici de la sfârşitul alfabetului - şirurile de constante;
-literele mici greceşti - şirurile mixte de variabile şi constante.
Mulţimea P constă din regulile de generare de forma α→β,
unde αєV *N V * şi βєV, cu interpretarea că α este înlocuit cu β (α
trebuie să conţină cel puţin o variabilă).
Fie o gramatică G , şirurile ρ,δєV * şi regulile de formare din P:
α→β. Se utilizează notaţia    , pentru a indica faptul că
şirul ρβδ derivă din şirul ραδ printr-o singură aplicare a regulii de
rescriere din G, α→β.
192
Simbolul  reprezintă o relaţie de derivare a gramaticii G, iar
simbolul  indică una sau mai multe utilizări ale relaţiei  .

Limbajul generat de G, notat L(G), este acea submulţime a lui

Σ* (închiderea lui Σ) obţinută din simbolul de start S prin aplicarea unui
număr finit de reguli de generare:

L (G )  {x / x  , S  x}
Altfel spus, o propoziţie conform gramaticii G este un şir peste alfabetul

V derivat din simbolul de start. Limbajul L(G) este o mulţime de
propoziţii care constă doar din terminale.
Potrivit restricţiilor privitoare la regulile de formare, gramaticile
pot fi de mai multe tipuri:
► Gramatică dependentă de context (sau de tipul 1) care are reguli de
generare de forma θAδ→θρδ, pentru θ,δ,ρєV *, AєN (adică variabila A
poate fi înlocuită prin şirul ρ doar când A apare încadrată de şirul θ la
stânga şi de şirul δ la dreapta).
► Gramatică independentă de context (sau de tipul 2) care are reguli de
generare de forma A→α pentru AєN şi αєV . Variabila A poate fi
înlocuită cu şirul α fără a ţine seama de contextul în care apare A .
► Gramatică regulată (sau de tipul 3) care are reguli de generare de
forma A→aB sau A→a, pentru A,B є N, a єΣ.
► Gramatică nerestrictivă (sau de tipul 0) care nu are nici o restricţie în
regulile de formare.
În recunoaşterea formelor de tip imagine, cele mai utilizate
gramatici sunt: gramatica regulată şi gramatica independentă de context.
Exemplu
Presupunem că obiectul (forma analizată) este o cheie mecanică
(Fig. 6.10.b) şi este reprezentat prin scheletul său (Fig. 6.10.c).
Considerăm primitivele a, b, c din Fig. 6.10.a. Fie G(N,Σ,P,S) o
gramatică cu N = {A,B,S}, Σ = {a,b,c} şi regulile de formare:
1. S→ aA;
2. A→ bA;
3. A→ aB;
4. B → b,
193
unde constantele a, b, c sunt cele definite prin primitivele respective
(Fig. 6.10.a). Pentru a descrie obiectul, se aplică legea de formare 1,
apoi se aplică legea 2 de două ori, urmată de o aplicare a legii 3 şi, în
final o aplicare a legii 4:
S  aA  abA  abbA  abbbB  abbbc
Gramatica de mai sus are limbajul asociat:
L(G) ={ ab nc / n ≥ 1},
unde bn indică repetarea de n ori a simbolului b. Gramatica G este

capabilă să genereze scheletul unei chei mecanice de lungime
nespecificată.
b b)
c a b b b c
c)
a)
Fig.6.10. Exemplu de descriere sintactică a unei chei mecanice:

a)constantele,b)forma iniţială, c)scheletul formei.
Exemplu
Fie clasa triunghiurilor echilaterale având laturile de 1 cm, 2
cm sau 3 cm (Fig. 6.11.a). Dacă primitivele alese sunt cele din
Fig.6.11.b, atunci limbajul care descrie această clasă este:
L = {a n b n c n / 1≤ n ≤3}
194
Cazul 1 : L = L(Gr ), unde:
Gr = (N,Σ,P,S) , N = {S,A1,B1,A2,B2,C2,A3,B3,C3,D3}, Σ = {a,b,c},

P: 1. S → aA1 ,
2. A1 → bB1,
3. B1 → c,
4. A1 → aA2,
5. A2 → bB2,
6. B2 → bC2,
7. C2 → cB1 ,
8. A2 → aA3,
9. A3 → bB3,
10.B3 → bC3,
11.C3 → bD3,
12.D3 → cC2
a b
a b a b
a b a b a b
c c c c c c
a b c
a) b)
Fig. 6.11. Exemplu de descriere sintactică a unui triunghi echilateral:
a) clasa de triunghiuri, b) constantele.
Cazul 2 : L = L(Gic), unde:
Gic = (N,Σ,P,S), N = {S,A1,B1,A2,B2,B3,C}, Σ = {a,b,c},

P: 1.S→ aA1C,
2.A1 → b,
3.A1 → aB2 C,
4.A1 → aA2 C,
5.A2 → aB3 C,
6.B3 → bB2 ,
7.B2 → bB1 ,
8.B1 → b,
9.C → c
195
Gramaticile prezentate anterior generează propoziţii care, prin
definirea corespunzătoare a primitivelor (constantelor), reprezintă
forme. Se pot considera gramatici similare celor de şiruri care generează
direct forme. Ele sunt însă mai greu de manevrat decât gramaticile de
şiruri.
6.3.2. Recunoaşterea structurilor sintactice. Dispozitive de

recunoaştere automată a formelor
Există o corespondenţă biunivocă între cele patru tipuri de

gramatici generatoare de şiruri de primitive şi patru tipuri de dispozitive
de calcul, utilizate ca dispozitive automate de recunoaştere:
-gramatică de tip 0 ↔ maşina Turing
-gramatică de tip 1 ↔ automat liniar mărginit;
-gramatică de tip 2 ↔ automat cu stivă;
-gramatică de tip 3 ↔ automat finit.
Cel mai puternic dispozitiv de calcul este maşina Turing, iar cel
mai slab este automatul finit. În cele ce urmează, va fi prezentat
automatul finit ca un dispozitiv de recunoaştere a formelor imagine
simple.
Un automat finit A f este definit ca un cvintuplu:
A f = ( Q, Σ ,δ , q0 ,F ) ,
unde Q este mulţimea finită, nevidă de stări, Σ este alfabetul finit de

intrare, δ este regula de tranziţie a stărilor de la mulţimea Q x Σ la
mulţimea părţilor lui Q, P(Q). δ furnizează stările (starea) următoare din
starea prezentă şi din simbolul corespunzător din alfabetul de intrare. qo
este starea iniţială din Q, iar F este mulţimea stărilor finale (de multe ori
conţinând un singur element), submulţime a lui Q.
Automatul finit este reprezentat grafic prin diagrama stărilor. În
această diagramă, stările de tranziţie şi cea iniţială sunt reprezentate prin
cercuri, iar starea finală este reprezentată printr-un cerc dublu. Cercurile
sunt unite între ele prin arce orientate ce indică tranziţiile dintre stări.
Fiecare arc este etichetat cu simbolul din alfabetul de intrare care
cauzează tranziţia corespunzătoare. Un şir w de simboluri de intrare se
196
spune că este acceptat sau recunoscut de către automatul finit dacă,
pornind din starea iniţială q0 , cu simbolul din stânga al şirului,
parcurgând pas cu pas secvenţa de simboluri w, simbolul din dreapta al
şirului conduce automatul într-o stare finală (după ce au fost parcurse
toate simbolurile din şir). Automatul se opreşte după ce a fost baleiat
întregul şir sau dacă o combinaţie stare-intrare produce δ(q,a) = Φ şi, în
acest ultim caz, automatul rejectează, de asemenea, şirul.
Exemplu
Fie automatul A f = (Q ,Σ δ,q0 ,F), unde Q = {q0, q1, q2},
Σ={a,b}, F={q0} şi regulile de tranziţie a stărilor date de: δ(q0,a)={q2},
δ(q0,b)={q1}, δ(q1,a)={q2}, δ(q1,b)={q0}, δ(q2,a)={q0}, δ(q2,b)={q1}.
Astfel, automatul A f , descris mai sus şi reprezentat graphic în Fig. 6.12
recunoaşte şirul w = abbabb, dar nu recunoaşte (rejectează) şirul v =
aabab.
b
q0 q1
b
a
a
a b
q2
Fig. 6.12. Diagrama de stări pentru un automat finit determinist.
Un automat finit se numeşte determinist dacă are proprietatea că

δ este o funcţie, δ:QxΣ→Q. În acest caz, nu există nici o pereche
(q,a), astfel încât δ(q,a) = Φ, deci maşina poate baleia complet orice şir
de intrare. Astfel, automatul din Fig. 6.12 este determinist. Acest
automat este realizabil hardware cu bistabili şi porţi logice. Se poate
arăta că, dat fiind un automat finit nedeterminist Af , există şi se poate
determina un automat finit determinist echivalent Af’ (evident, cu mai
197
multe stări), care să recunoască aceleaşi forme (şiruri), adică:
L(Af’)=L(Af).
Două automate finite deterministe A şi A’ se numesc
echivalente dacă L(A) = L(A’).
Se poate demonstra că, oricare ar fi automatul finit determinist
A, există un automat finit determinist, echivalent, cu un număr minim de
stări, Am, numit automat minimal şi el este unic (mai puţin o
renumerotare a stărilor).
Referitor la relaţia dintre o gramatică regulată şi un automat
finit există următoarea teoremă:
Teoremă
Există o corespondenţă biunivocă între gramaticile regulate şi
automatele finite. Cu alte cuvinte, un limbaj este recunoscut de un
automat finit dacă şi numai dacă el este generat de o gramatică regulată.
Observaţie
Dată fiind o gramatică regulată, se poate construi un automat
finit care să recunoască şirurile de constante generate cu ajutorul
regulilor din acea gramatică şi, reciproc, dat fiind un automat finit care
recunoaşte anumite şiruri de simboluri de intrare, se poate construi o
gramatică al cărei limbaj să fie constituit din şirurile respective.
Obţinerea automatului finit din gramatica regulată G(N,Σ,P,S)
este simplă. Astfel, dacă N={S,A1,A2,…,An}, atunci mulţimea Q va
conţine n+2 stări: q0 = S, q1 = A1 , q2 = A2 ,…, qn = An şi qn+1 єF, starea
finală. Mulţimea simbolurilor de intrare Σ este identică (notaţia se
păstrează) cu mulţimea constantelor din G. Relaţia δ este definită de
cele două tipuri de legi de formare din G, şi anume:
1.Dacă A i→ bA j este în P, atunci δ(qi , b) conţine starea q j .
2.Dacă A i → b este în P atunci δ(qi ,b) conţine qn+1 .
Starea iniţială q0 se identifică cu simbolul de start S, iar mulţimea F
conţine stare finală, introdusă artificial qn+1.
Pe de altă parte, dat fiind automatul finit Af =(Q,Σ,δ,q0 ,F),
obţinem gramatica regulată corespunzătoare G(N,Σ,P,S), identificând N
cu Q\F, S cu starea q0 şi considerând regulile de formare din G obţinute
astfel:
198
1. Dacă qj este în δ(qi ,b), atunci există o lege de formare A i → bA j în
P.
2. Dacă o stare din F este în δ(qi ,b), atunci există în P o lege de formare
Ai → b .
Exemplu
Automatul finit corespunzător cheii mecanice prezentate în
exemplul anterior se obţine scriind legile de formare în felul următor:
S→ aA1 , A1 → bA1, A1 → bA2 , A2 → c. Atunci, automatul finit va avea
structura A =(Q,Σ ,δ , q0, F), unde Q ={q0,q1,q2,q3}, Σ={a,b,c}, F={q3} şi
legile δ(qo,a)={q1}, δ(q1,b)={q1,q2}, δ(q2,c)={q3}. În rest, δ(q0,b)=
δ(q0,c)= δ(q1,a)= δ(q1,c)= δ(q2,a)= δ(q2,b)= Φ unde Φ indică faptul că
nu există tranziţie. Un astfel de automat (Fig. 6.13) recunoaşte şiruri de
primitive de tipul abb…bc.
a
b
q0 q1
q3 q2
c
Fig. 6.13. Exemplu de automat finit pentru recunoaşterea

imaginii unei chei mecanice.
Se observă că acest automat finit nu este determinist.
Exemplu
Graful automatului finit asociat gramaticii regulate G , generate
pentru descrierea clasei triunghiurilor echilaterale, este descris în
199
Fig.6.14, în care s-a stabilit următoarea corespondenţă între stări şi
variabile:
-starea iniţială: q0 ↔S ;
-stările de tranziţie: q1 ↔A1 , q2 ↔B1 , q3 ↔A2 , q4 ↔B2 , q5 ↔C2,
q6 ↔A3, q7 ↔ B3 , q8 ↔ C3 , q9 ↔D3;
-starea finală: q10 .
b b b
q6 q7 q8 q9
c
a
b b
q3 q4 q5
c
a
b c
q1 q2 q10
q0
Fig.5.15. Graful automatului finit pentru recunoaşterea triunghiurilor

echilaterale utilizând gramatica Gr .
6.4. CONCLUZII
Dintre metodele şi tehnicile de recunoaştere a formelor

prezentate şi analizate mai sus, cele mai utilizate în cadrul sistemelor de
vedere artificială de tip industrial sunt cele bazate pe funcţii de decizie
de tip distanţă minimă şi cele sintactice.
200
Metoda suprapunerii cu modelul se aplică în cazuri simple, când
imaginea are un număr mic de pixeli, deoarece, în caz contrar, volumul
de calcul devine inacceptabil.
La metodele sintactice, dificultatea constă în extragerea în timp
real a primitivelor. Ele pot fi aplicate, în special, atunci când se dispune
de scheletul imaginii. Un alt inconvenient al acestor metode este
puternica influenţă a zgomotului din imagine asupra deciziei de
clasificare. Din această cauză, trebuie luate măsuri de reducere
suplimentară a zgomotului şi de detectare şi corectare a erorii.
Metodele bazate pe funcţii de decizie de tip distanţă minimă în
spaţiul trăsăturilor oferă anumite avantaje faţă de celelalte metode, care
le face să fie mai mult utilizate în domeniul roboţilor industriali:
condensarea informaţiei, volum mai mic de calcul, extragerea relativ
uşoară a trăsăturilor invariante la rotaţie şi translaţie, sensibilitate mai
redusă la zgomot. În anumite cazuri, procesul de clasificare utilizând
aceste metode poate fi accelerat folosind arborele binar de decizie,
construit pentru o singură trăsătură. De asemenea, imaginile conţinând
texturi sau fractali se clasifică, de regulă, tot pe baza distanţei minime în
spaţiul trăsăturilor.
201

Recunoastere F

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Recunoastere F

Încărcat de

Drepturi de autor:

Formate disponibile

6. PRELUCRAREA DE NIVEL ÎNALT A IMAGINILOR.

Recunoaşterea formelor reprezintă o etapă de nivel înalt în

Fig.6.1. Sistem general de recunoaştere a formelor.

În cazul recunoaşterii formelor bidimensionale (obiecte din

Submulţimile C i, i = 1,2,…,p, se caracterizează prin anumite

6.1. METODE DE RECUNOAŞTERE UTILIZÂND

Una din primele şi cele mai simple metode de recunoaştere a

unde: n1 x n2 este dimensiunea imaginii, ms x ns este dimensiunea

Ms = {0,1, …, ms – 1}, N s = {0, 1, ..., n s – 1}, ms < n1 , ns <

Se defineşte funcţia distanţă euclidiană DS dintre şablonul Gs şi

D(u,v) = min {D(k ,l)/ kє Mu , lє Nv } ≤ TD , (6.2)

unde TD ≥ 0 este un prag prestabilit.

D * (u , v )  max G S (i, j )  Gu ,v (i  u , j  v ) (6.3)

În prezenţa zgomotului, se preferă funcţia de intercorelaţie

În acest caz, criteriul de similitudine este (6.5):

R(u,v) = max{R(k,l), kє Mu, lє Nv}≥TR (6.5)

unde TR ≤ 1 este un nivel prestabilit, iar –1 < R(u ,v ) < 1.

Iniţial, se fixează un prag P, iar E(u,v) se calculează pornind din

6.2. METODE DE RECUNOAŞTERE BAZATE PE FUNCŢII

S-a arătat că imaginea de intrare, conţinând forma de clasificat,

De obicei, dimensiunea n1 x n2 a matricei [G] este foarte mare şi

Fig. 6.2. Sistem de recunoaştere a formelor în abordarea cu decizie

6.2.1. Funcţii de decizie liniare

O funcţie de decizie liniară este de forma (6.6):

d([x]) = [w]T[x] + ws = w0 x0 + w1 x1 + … + ws-1 xs-1 + ws (6.6)

[w] =[ w0 ,w1 ,…,ws-1]T

este vectorul ponderilor (constantelor), iar

este vectorul trăsăturilor, w s = const.

di ([x]) > dj ([x]) ,

Fig. 6.3. Schema funcţională a unui clasificator de forme bazat pe trăsături şi

În acest sens, în Fig. 6.3 este prezentată schema funcţională a

În acest caz, se poate considera, ca frontieră de decizie şi, totodată,

Fig. 6.4. Exemplu de proces de clasificare bazat pe funcţii de decizie liniare,

Funcţiile de decizie liniare pot fi generalizate considerând , în

d([x]) = w0f0([x])+w1f1([x]) + . . . +ws-1fs-1([x]) +ws (6.10)

[x* ] = [f0 ([x]), f1 ([x]) ,…, fs-1 ([x])]T ,

6.2.2. Funcţii de decizie de tip distanţă

Clasificarea formelor cu ajutorul funcţiilor distanţă reprezintă

Aceste situaţii se întâlnesc atunci când formele de analizat

D([ x], [ z i ])  ([ x]  [ z i ]) T ([ x ]  [ z i ]) , i  1,2,..., p (6.11)

Forma [x] este atribuită clasei clasei Ci dacă:

D([x],[zi]) < D([x],[z j]), pentru jє{1,2,…, p}, j ≠ i,

D( [x ], [z i] ) = min., pentru iє{1,2,…, p} (6.12)

Se poate arăta că funcţia de decizie de tip distanţă (6.11) este

cu [x]T [x] = const., pentru un [x] dat.

Deoarece D ([x] ,[zi])≥0, rezultă:

din relaţia (6.13), rezultă că minimizarea (6.12) este echivalentă cu

di ([x]) = max., pentru iє{1,2,…, p} (6.15)

se observă că relaţia (6.14) este expresia unei funcţii de decizie liniare

Fig. 6.5.Exemplu de trei clase caracterizate printr-un singur prototip.

D * ([ x], [ z i ])  max{ x j  z ij } (6.16)

B. Clase caracterizate prin mai multe prototipuri

Dacă clasele C i , i = 1,2,…, p, sunt reprezentate prin

D ([x ],C i) = min{D ([x],[z i, k])}, pentru kє{1,2,…,Ni}, (6.17)

D ([x],Ci ) < D ([x], C j ), pentru orice jє{1,2,…,p}, j ≠ i,

Astfel, pentru criteriul de distanţă minimă, se obţine, din nou, forma

Procedând ca în cazul claselor caracterizate printr-un singur

6.2.3. Metode de grupare

În proiectarea clasificatorilor bazaţi pe conceptul de distanţă

A. Algoritm bazat pe distanţa max.-min.

Acest algoritm este asemănător cu cel precedent, cu deosebirea

Acest algoritm minimizează un indice de performanţă definit ca

[x j]є Sl (m), dacă D{[x j],[z l](m)}< D{[x j],[z i](m)},