Sunteți pe pagina 1din 160

1

Mircea Virgil Popa tefan Demeter


Romana Oancea Alina Hangan

Prelucrarea numeric a
imaginilor
Aplicatii ale reelelor neuronale n
prelucrarea imaginilor
2

Cuprins

I. PRELUCRAREA NUMERIC A IMAGINILOR................................................................ 5
1. Imagini digitale ....................................................................................................................... 6
1.1 Reprezentarea imaginilor digitale ......................................................................................... 6
1.2 Imaginea digital semnal bidimensional............................................................................ 8
2. Achiziia i conversia analog numeric a imaginilor ......................................................... 11
2.1 Achiziia imaginilor ............................................................................................................ 11
2.2 Conversia analog numeric a imaginilor ......................................................................... 12
3. Memorarea i compresia imaginilor ..................................................................................... 14
3.1 Stocarea imaginilor ............................................................................................................. 14
3.1.1 Stocarea imaginilor n memorie................................................................................... 14
3.1.2 Stocarea imaginilor n fiiere ....................................................................................... 15
3.2 Compresia imaginilor.......................................................................................................... 17
4. Restaurarea imaginilor .......................................................................................................... 18
4.1 Modele ale imaginii observate ............................................................................................ 19
4.2.Estimarea degradrii ........................................................................................................... 20
4.3. Restaurarea adaptiv a imaginilor...................................................................................... 21
4.4. Restaurarea imaginilor pe baza funciei de vizibilitate a zgomotului ................................ 22
4.5. Metode de reducere a zgomotului ...................................................................................... 23
4.5.1. Modele de zgomot....................................................................................................... 23
4.5.2. Tipuri de filtre utilizate pentru reducerea zgomotului ................................................ 25
1. Filtre de mediere aritmetic .............................................................................................. 25
2.Filtre de ordine................................................................................................................... 26
3.Filtrul binar ........................................................................................................................ 29
4. Alte tipuri de filtre............................................................................................................. 29
4.5.3 Concluzii privind utilizarea diferitelor tipuri de filtre ................................................. 31
5. Operaii de mbuntire a imaginilor n domeniul spaial ................................................... 31
5.1.Operaii punctuale............................................................................................................... 33
5.1.1. Modificarea de contrast............................................................................................... 33
5.1.2. Limitarea i binarizarea imaginilor ............................................................................. 34
5.1.3. Inversarea (negativarea ) imaginilor ........................................................................... 35
5.2. Operaii de tip fereastr...................................................................................................... 35
5.2.1. Extragerea unui bit ...................................................................................................... 36
5.2.2. Compresia de contrast................................................................................................. 36
5.2.3. Scderea imaginilor .................................................................................................... 36
5.2.4 Modelarea imaginilor prin histograme......................................................................... 36
5.3. Operaii spaiale ................................................................................................................. 39
5.3.1. Filtrarea spaial.......................................................................................................... 39
5.3.2. Inversarea de contrast i scalare statistic................................................................... 45
5.3.3. Mrimea i interpolarea imaginilor (zooming) ........................................................... 45
5.4 Pseudocolorarea imaginilor................................................................................................. 46
5.5 mbuntirea imaginilor color............................................................................................ 48
6. Operaii de mbuntire a imaginilor n domeniul transformat ........................................... 50
6.1. Principalele transformri folosite n prelucrarea de imagini.............................................. 50
6.1.1. Transformarea Fourier ................................................................................................ 51
6.1.2. Transformarea Cosinus ............................................................................................... 52
6.1.3. Transformarea Sinus ................................................................................................... 53
6.1.4. Transformarea Hartley................................................................................................ 53
6.1.5. Transformarea Hadamard ........................................................................................... 53
6.1.6. Transformarea Walsh.................................................................................................. 54
3
6.1.7. Transformarea Slant .................................................................................................... 54
6.1.8. Transformarea Haar..................................................................................................... 55
6.1.9. Transformarea Karhunen-Love................................................................................... 55
6.1.10. Transformarea wavelet .............................................................................................. 56
6.2. Filtrare n domeniul frecven............................................................................................ 57
6.2.1.Filtrul trece jos ............................................................................................................. 57
6.2.2. Filtrul trece sus............................................................................................................ 60
6.2.3. Filtrul homomorfic ...................................................................................................... 61
6.2.4. Operaii de transformare.............................................................................................. 63
7. Segmentarea imaginilor......................................................................................................... 65
7.1. Segmentarea orientat pe regiuni ....................................................................................... 65
7.1.1. Segmentarea bazat pe histogram ............................................................................. 65
7.1.2. Tehnici de fixare a pragului (thresholding)................................................................. 66
7.1.3. Determinarea automat a pragurilor: metoda Bhattacharya........................................ 67
7.1.4. Segmentarea cu prag optim......................................................................................... 68
7.1.5. Creterea i fuziunea regiunilor................................................................................... 69
7.2. Segmentarea orientat pe contururi.................................................................................... 71
7.2.1. Metode derivative........................................................................................................ 71
7.2.2. Metoda filtrelor trece-sus ............................................................................................ 74
7.2.3. Extragerea conturului din imagini binarizate.............................................................. 74
8. Analiza de imagine................................................................................................................ 75
8.1 Msurarea imaginilor .......................................................................................................... 75
8.1.1 Msurarea strlucirii..................................................................................................... 75
8.1.2 Determinarea locaiei ................................................................................................... 76
8.1.3 Orientarea..................................................................................................................... 78
8.2 Extragerea caracteristicilor imaginilor ................................................................................ 80
8.2.1 Caracteristici de form ................................................................................................. 80
8.2.2 Caracteristici de tip transformare ................................................................................. 88
8.2.2.1 Transformata Fourier procesarea n domeniul frecvenelor................................... 89
8.2.2.2 Descriptorii Fourier (DF) .......................................................................................... 90
8.3 Identificarea trsturilor ...................................................................................................... 92
8.4 Extragerea trsturilor ......................................................................................................... 94
8.4.1 Organizarea i vizualizarea trsturilor........................................................................ 94
8.4.2 Selecia trsturilor....................................................................................................... 94
8.4.3 Clasificarea................................................................................................................... 94
8.5 Recunoaterea formelor....................................................................................................... 95
8.5.1 Metode de recunoatere cu decizie teoretic............................................................... 95
8.5.2 Recunoaterea obiectelor folosind shape-from-shading........................................... 97
8.5.3 Aplicaii ale folosirii culorilor n recunoaterea formelor............................................ 98
2.5.3.1 Potrivirea culorilor .................................................................................................... 98
8.5.3.2 Localizarea culorilor ................................................................................................. 99
8.5.3.3 Potrivirea culorilor dup ablon.............................................................................. 100
9. Concluzii ............................................................................................................................. 101
10. Bibliografie...................................................................................................................... 102
II. UTILIZAREA REELELOR NEURONALE N PRELUCRAREA IMAGINILOR ....... 104
1. Introducere .......................................................................................................................... 105
1.1 Inteligena artificial ................................................................................................... 105
1.2 Specificul calculului neuronal ..................................................................................... 105
1.3 Structura unei reele neuronale.................................................................................... 106
2. Reele neuronale supervizate utilizate pentru refacerea imaginilor degradate.................... 109
2.1 Distorsiunile imaginilor............................................................................................... 109
2.2 Perceptronul multistrat ................................................................................................ 109
4
2.3 Algoritmul backpropagation ....................................................................................... 110
2.4 Metode de accelerare a vitezei de convergen........................................................... 112
2. 4.1. Metoda momentului ................................................................................................. 112
2.4.2. Rata de nvare variabil.......................................................................................... 113
2.4.3. Evitarea minimelor locale ......................................................................................... 113
2.4.4. Ruperea simetriei i iniializarea ponderilor ............................................................. 114
2.5 Reele neuronale artificiale recurente. Reele Hopfield.............................................. 115
2.6 Reele cu funcii de transfer radiale ............................................................................ 116
2.6.1. Funcii radiale i problema interpolrii..................................................................... 116
2.6.2. Arhitectura reelelor RBF.......................................................................................... 116
2.6.3. Instruirea reelelor neuronale radiale ........................................................................ 117
2.6.4. Determinarea separat a parametrilor ....................................................................... 118
3. Reele neuronale nesupervizate utilizate pentru refacerea imaginilor degradate................ 121
4. Aplicaii ale reelelor neuronale.......................................................................................... 127
4.1 Aplicaii ale reelelor feedforward pentru eliminarea zgomotelor.............................. 127
4.2 Aplicaii ale reelelor neuronale Elman pentru eliminarea zgomotelor ...................... 143
4.3 Aplicaii ale reelelor neuronale Hopfield pentru eliminarea zgomotelor .................. 156
4.4 Aplicaii ale reelelor RBF pentru eliminarea zgomotelor.......................................... 157
5. Concluzii ............................................................................................................................. 159
6. Bibliografie ......................................................................................................................... 160
5












I. PRELUCRAREA NUMERIC A IMAGINILOR
6
1. Imagini digitale

De obicei, cuvntul imagine se refer la reproducerea sau reprezentarea realitii
nconjurtoare. O importan deosebit o are mecanismul fizic prin intermediul cruia se realizeaz
reproducerea sau reprezentarea. Prin imagine se poate nelege i reprezentarea plastic (desen,
schi, schem, fotografie) a lumii nconjurtoare, dar din punctul de vedere al televiziunii,
imaginea reprezint distribuia valorilor unei anumite mrimi, care s redea cu o anumit fidelitate
caracteristicile spaiale i de radiaie ale obiectelor.

1.1 Reprezentarea imaginilor digitale
La nceput, imaginile sunt semnale, dar nu funcii temporale, ci funcii definite pe un domeniu
spaial. Orice imagine este o structur bidimensional (tablou, matrice) de date. Un element al
imagini se numete pixel (cuvnt preluat din engleza, unde provine de la picture element). Aceste
date pot fi numere naturale, reale sau complexe, reprezentate ns pe un numr finit de bii. . Dup
tipul datelor din acesta structur bidimensional, imaginile prelucrate pot fi mprite n mai multe
categorii:
imagini scalare, n care fiecare component este un scalar (un unic numr); ca exemple de
astfel de imagini se pot da imaginile monocrome (n care punctele au doar dou valori posibile, ce
corespund unui coninut binar al imaginii, n general alb-negru) i imaginile cu nivele de gri (de
tipul imaginii de luminan de pe ecranele televizoarelor alb-negru).
imagini vectoriale, n care fiecare component este un vector de numere; cazul particular cel
mai de interes este acela al imaginilor color, n care vectorul are trei elemente (ce corespund celor
trei constituente de baz ale oricrei culori); n general, pentru imaginile multicomponent, vectorul
asociat fiecrui punct din imagine are mai multe elemente (caz ce corespunde imaginilor preluate n
mai multe benzi de frecven, aa cum sunt imaginile de teledetecie ale sateliilor, imaginile de
termodetecie n benzile de infrarou,...). Tot n categoria imaginilor vectoriale intr ns i
imaginile stereo (o pereche de imagini ale aceleiai scene, luate din unghiuri diferite) i secvenele
de imagini.
Dup natura lor, imaginile pot fi clasificate ca imagini abstracte, imagini non-vizibile i
imagini vizibile. Imaginile abstracte sau modelele sunt de fapt funcii matematice, continue sau
discrete, de doua variabile. Imaginile non-vizibile, care, evident, nu pot fi percepute n mod direct
de ochiul uman, sunt de fapt achiziii ale unor cmpuri bidimensionale de parametri fizici (presiune,
temperatur, densitate, ...). n fine, imaginile ce pot fi percepute n mod direct de ctre ochiul uman
(deci imaginile vizibile) sunt la rndul lor imagini optice, generate ca distribuii de intensitate
luminoas (aa ca hologramele, imaginile de interferen i difracie) sau imagini propriu-zise (de
luminan - n sensul curent al termenului, ce se refer la fotografii, desene, picturi, schie, scheme
i altele din aceeai categorie).
O alt mprire a imaginilor scalare se poate face dup semnificaia ce se d valorii numerice
a pixelilor. Vom distinge astfel imagini de intensitate i imagini indexate. O imagine de intensitate
este o imagine n care valoarea fiecrui pixel este o msur direct a intensitii luminoase sau a
mrimii fizice preluate de senzor, ca de exemplu n imaginile cu nivele de gri. Pixelii unei imagini
de intensitate pot avea orice fel de valori: reale sau naturale (depinznd dac imaginea este sau nu
cuantizat).
O imagine indexat este acea imagine n care valoarea fiecrui pixel este un indice prin care
se regsete informaia de culoare asociat pixelului respectiv. Deci, pentru afiarea sau
reprezentarea unei imagini indexate este necesar o informaie suplimentar, de asociere ntre indici
i culori. Aceast asociere se face prin intermediul tabelei de culoare. Tabela de culoare este o
matrice n care fiecare linie conine descrierea unei culori (deci cele trei componente ce definesc
7
culoarea - n mod tipic intensitile relative de rou, verde i albastru ce compun culoarea dat
printr-un amestec aditiv). Deci tabela de culoare are trei coloane; numrul de linii al tabelei de
culoare este egal cu numrul de culori din imaginea reprezentat i este n mod tipic o putere a lui
doi (16, 256, ...). Indicele (valoarea pixelului) va fi numrul de ordine al liniei din tabela de culoare
pe care se gsete descrierea culorii. Este evident c valorile pixelilor unei imagini indexate nu pot
fi dect numere naturale (deoarece sunt indici ntr-o matrice).
Fiecare pixel ce aparine unei imagini, care este reinut ntr-un calculator, are o anumit
valoare ce descrie strlucirea pixelului i/sau ce culoare ar trebui s aib. n funcie de valorile pe
care le au pixelii putem diferenia mai multe tipuri de imagini, dintre acestea amintim imaginile
binare, imaginile gri i imaginile color.

Imagini binare
Imaginile binare sunt imaginile ale cror pixeli au doar dou valori de intensitate posibile.
Sunt de obicei reprezentate n alb i negru. Numeric, cele dou valori sunt 0 pentru negru i 1 sau
255 pentru alb.
Acestea se obin cel mai des prin prguirea imaginilor color sau a imaginilor n gri, i se
folosesc pentru a separa un obiect de fundal.

Imagini gri
O imagine pe o scar gri (cu nivele de gri) este o simpl imagine n care singurele culori
folosite sunt umbre de gri. Motivul pentru care s-a realizat diferenierea acestor imagini de alte
categorii de imagini color este acela c, trebuie s fie reinut mai puin informaie pentru fiecare
pixel din imaginea original. De fapt, o culoare gri este acea culoare n care componentele de
culoare roie, verde i albastr au aceeai intensitate n spaiul RGB aa c, este nevoie s se
specifice o singur valoare a intensitii pentru fiecare pixel, n opoziie cu cele trei intensiti
necesare a fi specificate pentru fiecare pixel dintr-o imagine color.
Adesea, scala de gri este reprezentat ca fiind un ntreg pe 8 bii, dnd 256 de umbre posibile
ale griului, de la negru la alb. Dac nivelele sunt uniform desprite, atunci diferena dintre dou
nivele de gri succesive este semnificativ mai bun dect cea realizat de ochiul uman.
Imaginile gri sunt foarte comune, n mare parte poate pentru c instrumentele de reprezentare
i captur hardware a imaginii pot suporta, n cele mai multe cazuri, numai imagini pe 8 bii.
Oricum imaginile gri sunt mai mult dect suficiente pentru multe aplicaii, aa c, nu este nevoie s
se foloseasc imagini mult mai grele i complicate pentru procesare, cum sunt imaginile color.

Imagini color
Este posibil s se creeze (aproape) toate culorile vizibile prin combinarea a trei culori primare
rou, verde i albastru. Aceasta se ntmpl datorit faptului c ochiul uman are doar trei receptori
de culoare diferii, fiecare dintre ei fiind sensibil la una dintre aceste culori. Diferitele combinaii
realizate pentru stimularea acestor receptori au artat c ochiul uman distinge aproximativ 350000
de culori. O imagine color RGB este o imagine multi-spectral cu cte o band pentru fiecare
culoare primar, aceasta determinnd producerea unei infiniti de combinaii a celor trei culori,
pentru fiecare pixel.
O imagine RGB cere ca pentru fiecare pixel s fie specificat intensitatea a trei componente
de culoare (roie, verde i albastr). De obicei fiecare component de intensitate este stocat pe 8
bii ntregi, aa c fiecare pixel necesit 24 de bii pentru a se putea specifica complet i exact
culoarea. Aceste imagini sunt cunoscute ca fiind imagini color pe 24 de bii (24-bit color images).
Folosirea a 24 de bii pentru a reine informaia color permite reprezentarea a 2
24
=16777216
de culori, i acest lucru este suficient pentru a acoperi foarte bine ntregul spectru de percepie a
culorilor de ctre om. Sunt ns multe dezavantaje n folosirea imaginilor color pe 24 de bii. Poate
cel mai important este faptul c aceste imagini cer de trei ori mai mult memorie, mai mult spaiu
pe disc i timpul de procesare este mult mai mare. De exemplu, o imagine pe 24 bii de 512X512
necesit pentru memorare 750 Kb n form necomprimat.
8
Din cauza acestor dezavantaje, multe imagini folosesc o hart de colorare pe 8 bii pentru a
restriciona numrul de culori la 256. Folosind aceast metod este necesar s stochezi un singur
index pe 8 bii pentru fiecare pixel, nu pe 24 bii. Formatul imaginilor pe 8 bii conine 2 pri: o
hart de colorare care descrie ce culori sunt prezente n imagine i un ir cu valorile indecilor
pentru fiecare pixel din imagine.
Cnd o imagine pe 24 bii este transformat ntr-o imagine pe 8 bii este necesar s se elimine
unele culori, avnd loc un proces numit cuantizare. Acest lucru duce la unele degradri calitative
ale imaginii, dar, n practic, efectele observate pot fi foarte mici i, oricum, aceste degradri sunt
inevitabile dac perifericul folosit (ecran sau imprimant) este capabil s foloseasc numai 256 de
culori.

Imagini multi-spectrale
Imaginile multi-spectrale pot conine chiar i mai mult de trei componente pentru fiecare pixel
i, prin extindere, acestea sunt reinute ntr-un vector pentru fiecare valoare a unui pixel, sau n
planuri separate de culori.
O imagine multi-spectral este o colecie de mai multe imagini monocrome a aceleiai
scheme, fiecare dintre ele fiind luat cu un diferit senzor. Fiecare imagine este considerat a fi o
band. O binecunoscut imagine multi-spectral (sau imagine band) este imaginea color RGB, care
conine o imagine roie, una verde i una albastr. Fiecare dintre aceste imagini este luat cu
ajutorul unui senzor sensibil la o anumit lungime de und. n procesarea imaginilor, imaginile
multi-spectrale sunt cel mai des folosite pentru aplicaiile de teledetecie. Sateliii de obicei iau
cteva imagini din banda de frecven n spectru vizual i non-vizual. De exemplu, Landsat 5
produce 7 imagini band cu lungimea de und cuprins ntre 450 i 1250 nm.

1.2 Imaginea digital semnal bidimensional

Imaginea format n planul focal al unui sistem optic cu lentile poate fi descris prin funcii
depinznd de coordonatele n plan (carteziene, polare) i de timp. n cele ce urmeaz se presupune
c imaginile sunt staionare pe durata achiziiei. Cu aceast ipotez se definete funcia nivel de gri
G ca fiind legea ce asociaz unui punct (x,y) din domeniul de definiie D (de regul interiorul unui
dreptunghi D din planul
2
) un numr corespunztor strlucirii (luminanei) din acel punct:
G:D. (1.1)
Valoarea G(x,y) se numete nivel de gri n punctul (x,y). Dac se dispune de un senzor vizual,
atunci se poate considera c G asociaz punctului un numr care corespunde tensiunii la ieirea
senzorului, cnd el detecteaz strlucirea din punctul respectiv.
Semnalul provenit de la senzorul vizual poate fi eantionat spaial (n plan) i cuantizat (n
nivel). n acest fel se obine imaginea numeric caracterizat prin funcia G (avnd semnificaia de
mai sus): G : M
1
M
2
sau G : M
1
.Unde s-a notat: M
1


N,

M
2
N, n care N reprezint
mulimea numerelor naturale, iar M
1
={0,1,...,n
1
-1} i M
2
={0,1,...,n
2
-1}. Perechea de numere
(n
1
,n
2
)= n
1
xn
2
se numete dimensiunea imaginii.
Datorit dezvoltrii puternice a tehnicilor numerice de calcul un interes deosebit l prezint
imaginile numerice. Dac se noteaz cu x i y paii de eantionare spaial (pe orizontal
respectiv pe vertical), atunci n
1
x=a i n
2
y=b, unde constantele a i b reprezint laturile
dreptunghiului D din relaia (1.1).
Un element de imagine (pixel) este un triplet:
E
i,j,G
={i,j,G(i,j)}, iM
1
, jM
2
. (1.2)

O imagine numeric este o mulime finit de elemente de imagine iM
1
, jM
2
, mulimile
M
1
i M
2
fiind definite mai sus. Imaginea numeric se poate caracteriza prin matricea de
dimensiune n
1
xn
2
:
9


(
(
(
(

=
) 1 , 1 ( ..... ) 0 , 1 (
..... ..... .....
) 1 , 1 ( ) 1 , 1 ( ) 0 , 1 (
) 1 , 0 ( ) 1 , 0 ( ) 0 , 0 (
] [
2 1 1
2
2
n n G n G
n G G G
n G G G
G
. (1.3)

Originea imaginii se ia colul din stnga sus. Atunci cnd se dorete aplicarea unor tehnici
monodimensionale de prelucrare sau de transmitere a semnalelor, matricea G poate fi transformat n
vector prin aranjarea n stiv a coloanelor sale (analog se poate proceda pentru aranjare n stiv a
liniilor) prin aezare n ordine una dup alta. n general, pentru prelucrarea imaginilor n vederea
analizei i interpretrii se utilizeaz tehnici specifice bidimensionale, iar pentru transmiterea
imaginilor se utilizeaz tehnici monodimensionale.
La o privire general exist multe similitudini ntre procesarea semnalelor bidimensionale (2D)
i a celor unidimensionale. n cazul semnalelor 1D vorbim despre filtrare, transformare Fourier,
transformare Fourier Discret, transformare Fourier rapid. Cnd vorbim despre procesarea
semnalelor 2D ne gndim la aceleai operaiuni, doar c se realizeaz pe dou direcii. Deci,
conceptele generale folosite n 2D pot fi vzute n multe cazuri ca extensii directe ale rezultatelor din
procesarea semnalelor 1D.
La o privire mai atent apar unele deosebiri astfel:
- cantitatea datelor manipulate n cazul semnalelor 2D este mult mai mare dect n cazul
semnalelor 1D. De aceea n acest caz conteaz foarte mult eficiena de calcul a algoritmilor de
procesare ca i noile realizri n tehnica hard.
-o a doua diferen rezid din faptul c procedeele matematice de calcul sunt mai puin
dezvoltate pentru procesarea semnalelor 2D dect pentru cele 1D. De exemplu, multe sisteme 1D
sunt descrise cu ajutorul ecuaiilor difereniale, n timp ce multe sisteme 2D pot fi descrise prin
ecuaii difereniale pariale despre care se cunoate mai puin.
Pentru ca funcia imagine f(x,y) s poat fi prelucrat cu ajutorul calculatorului, trebuie s fie
digitizat att n spaiu ct i n amplitudine. Digitizarea n domeniul coordonatelor spaiale (x,y)
este numit eantionarea imaginii, iar digitizarea amplitudinii se numete cuantizarea nivelului de
gri.
S presupunem c o imagine continu f(x,y) este aproximat printr-o reea rectangular de
dimensiune NXN, eantioane dispuse la distane egale unele de altele aa cum se arat n ecuaia de
mai jos, n care fiecare element din tabloul 2D este o mrime discret:
f x y
f f f N
f f f N
f N f N f N N
( , )
( , ) ( , ).... ( , )
( , ) ( , )..... ( , )
.
.
( , ) ( , ).... ( , )
=


0 0 0 1 0 1
1 0 11 1 1
1 0 11 1 1
(1.4)
Membrul drept al ecuaiei de mai sus reprezint o imagine digital n care fiecare element al
tabloului este denumit element de imagine sau pixel.
Procesul de digitizare de mai sus necesit luarea unei decizii privind mrimea lui N, ca i
asupra numrului de nivele discrete de gri alocate fiecrui pixel. De obicei, se iau aceste cantiti
ca puteri ntregi ale lui doi, lucru care aduce unele simplificri n operaiunea de procesare digital
a imaginii: N=2
n
, iar G=2
m
, unde cu G am notat nivelul de gri. Dac se dispune de un senzor
vizual, atunci se poate considera c G asociaz punctului un numr care corespunde tensiunii
obinute la ieirea senzorului, cnd el msoar strlucirea din punctul respectiv.
Dac notm cu b numrul biilor necesari pentru a memora o imagine digital, n funcie de
mrimea imaginii (N) i numrul nivelelor de gri (G) rezult: b=N*N*m (bii).
10
Apare n acest moment ca fireasc ntrebarea referitoare la ct de muli pixeli i ct de multe
nivele de gri trebuie s se foloseasc n procesul de digitizare a unei imagini. Rezoluia unei
imagini, adic gradul de sesizare a detaliilor acesteia depinde puternic de N i m. Cu ct N i m sunt
mai mari, cu att imaginea digital va aproxima mai bine originalul. Dar, din pcate, se observ c
necesarul de memorie i n consecin i timpul de procesare cresc rapid cu creterea lui N i m.
Este interesant de analizat efectul pe care l au asupra calitii imaginii modificrile lui N i
m. Este ns greu s definim o imagine bun deoarece cerinele de calitate difer n funcie de
aplicaia avut n vedere. n funcie de N imaginile se pot clasifica n 3 categorii:
a) Imagini cu rezoluie sczut
Acestea sunt imagini de 256x256. Este rezoluia spaial minim care furnizeaz imagini de
o calitate acceptabil. Se folosesc pentru prelucrarea imaginilor preluate n infrarou, tomografii,
radiografii, imagini pentru testarea unor algoritmi.
b) Imagini cu rezoluie medie
Acestea sunt imagini de 512x512 pixeli, comparabile cu calitatea imaginilor de televiziune.
Se folosesc n activiti de supraveghere, recunoatere a intelor, etc.
c) Imagini de mare rezoluie
n aceast categorie putem aminti imaginile furnizate de satelii pentru cercetarea resurselor
sau alte scopuri, eantionate la 3000x4000 pixeli, imaginile sintetizate pe calculator pentru film
cinematografic de 35mm sau 70 mm eantionate la 8000x8000 pixeli.
Dac numrul punctelor de eantionare se micoreaz, atunci la refacerea imaginii analogice
din imaginea digital, pentru a fi afiat pe ecran, apare un efect perturbator de tip tabl de ah.
Numrul de eantioane i de nivele de gri necesar pentru a realiza o reproducere corespunztoare a
unei imagini depinde de tipul imaginii, adic de coninutul acesteia n detalii. De exemplu, un
portret este mai srac n detalii dect o imagine care reprezint tribunele unui stadion. Dac numrul
nivelelor de gri scade sub 64, apare un fenomen suprtor de contururi false, fenomen mult mai
accentuat pe msur ce numrul nivelelor de gri scade.
Fie dou imagini cu acelai numr de pixeli, una cu detalii multe, iar alta cu detalii puine.
Pentru aceiai calitate a imaginilor numrul nivelelor de gri n imaginea cu detalii mai multe poate
fi mai mic dect n imaginea cu detalii mai puine. Acest lucru se datoreaz faptului c ochiul este
mai puin sensibil n aprecierea nuanelor de gri n zonele cu modificri abrupte ale nivelului de gri.
Din aceast cauz efectul de contur fals este ntlnit mai frecvent n imaginile cu detalii puine.
n unele cazuri, mai ales n prelucrarea optic a imaginilor, este convenabil ca imaginea s
fie reprezentat n alt domeniu dect cel iniial (spaial) i anume ntr-un domeniu obinut prin
transformare ortogonal bidimensional de tip sinusoidal (Fourier).
Fie D=R
2
si G:R
2
->R funcia nivel de gri. Presupunnd c sunt ndeplinite condiiile:
1. G x y dxdy ( , ) <


; (1.5)
2. G are un numr finit de discontinuiti i un numr finit de maxime i minime n orice
dreptunghi finit, se definete Transformata Fourier,


+ = = dxdy vy ux j y x G y x G v u )] ( 2 exp[ ) , (
4
1
)} , ( { ) , (

(1.6)


+ = dudv vy ux j v u y x G )] ( 2 exp[ ) , ( ) , ( (1.7)
Coordonatele x i y se numesc coordonate spaiale. Pentru u i v constante, considernd
funciile cos 2(ux+vy), sin2(ux+vy), n planul (x,y) se obin drepte echidistante, paralele, pe care
funciile respective iau valori constante.
Pentru calculul Transformatei Fourier discrete bidimensionale se procedeaz n modul
urmtor:
a) Liniile matricei iniiale se nlocuiesc cu transformatele Fourier discrete ale lor
(monodimensionale).
11
b) n noua matrice se nlocuiesc coloanele cu transformatele Fourier discrete ale lor. Matricea
rezultat este Transformata Fourier Discret a matricei iniiale.
n reprezentarea Fourier a imaginilor, matricea [G] este nlocuit cu matricea [], de
aceeai dimensiune, care, n anumite condiii, poate oferi faciliti de calcul sau de transmisie.


2. Achiziia i conversia analog numeric a imaginilor

2.1 Achiziia imaginilor

Indiferent de domeniul de aplicaie, utilizarea calculatoarelor impune un format numeric
pentru informaia prelucrat. Vederea artificial respect aceast regul i lucreaz cu imagini
numerice. Pentru a obine imaginea numeric (digital image) este nevoie de dou elemente:
senzorul i convertorul (digitizer). Senzorul este un element fizic care percepe o radiaie
electromagnetic ntr-o anumit band de frecven (ultraviolete, infrarou, vizibil, raze X). Ieirea
senzorului este o mrime electric, n general o tensiune, proporional cu energia radiaiei
electromagnetice primit de senzor. n funcie de aplicaie, banda de frecven i senzorul aferent
sunt diferite. Convertorul este un dispozitiv electronic care primete mrimea electric furnizat de
senzor i o transform ntr-un format numeric. Pentru aplicaiile de vedere artificial, cel mai
frecvent, senzorii sunt identificai cu numele generic de camere de luat vederi. Datorit acestui
lucru prima etap n procesul de prelucrare a imaginilor l constituie achiziia.
Cele mai cunoscute camere de luat vederi au fost, n ordinea apariiei i utilizrii istorice,
camerele vidicon i camerele matriceale (solid state). Lumina este focalizat pe suprafaa senzorului
prin intermediul unui sistem de lentile la nivelul cruia are loc o transformare optic care depinde
de natura i caracteristicile lentilei, respectiv ale luminii i sursei de lumin. O condiie pentru
obinerea unei imagini ideale este ca planul de focalizare s coincid cu planul senzorului.
Funcionarea camerelor video cu vidicon se bazeaz pe principiul fotoconductibilitii: o imagine
focalizat pe suprafaa tubului produce un relief de conductibiliti proporional cu distribuia de
strluciri din imaginea optic. Un fascicul de electroni focalizat pe suprafaa posterioar a intei
fotosensibile a tubului exploreaz punct cu punct aceast suprafa i prin neutralizarea sarcinilor
electrice, creeaz o diferen de potenial care produce pe un electrod colector un curent
proporional cu relieful de strluciri de pe faa anterioar a intei. Imaginea digital este obinut
prin eantionarea i cuantizarea acestui semnal.
Camerele matriceale sunt formate din elemente fotosensibile, senzori individuali. Fiecare
element fotosensibil poate fi privit ca o capacitate individual care acumuleaz o sarcin mai mare
sau mai mic n funcie de intensitatea luminoas primit. Citirea sarcinilor nu se poate face n
acelai timp pentru toate elementele (este evident c nu putem avea practic, din punct de vedere
tehnologic, un circuit electronic cu sute de mii sau milioane de pini) i ca urmare un proces de
baleiere rmne necesar. Aici, baleierea este de fapt un transfer al sarcinilor ctre dispozitivul care
face efectiv citirea. Rezultatul va fi tot o mrime electric variabil n timp u(t).
Dispozitivele videocaptoare integrate sunt compuse din elemente semiconductoare discrete,
numite fotocapaciti MOS, care dau la ieire un potenial proporional cu intensitatea luminii
incidente. Exist dou tipuri de asemenea dispozitive: liniare i matriciale. Un senzor liniar const
dintr-un ir de asemenea fotocapaciti semiconductoare i poate produce o imagine bidimensional
prin micarea relativ ntre scen i detector.
Un senzor matricial este compus dintr-o matrice de fotocapaciti MOS i poate capta o
imagine ntr-un mod similar unui tub videocaptor. Tehnologia utilizat n dispozitivele
12
videocaptoare integrate se bazeaz pe circuitele cu transfer de sarcin (CCD charge coupled
devices). Senzorii CCD capteaz lumina n mici fotocelule i i-au primit numele de la modul n
care sarcinile sunt citite dup expunere. Pentru aceasta, mai nti sarcinile din prima linie sunt
transferate ntr-un registru de citire. De acolo, semnalele sunt preluate de un amplificator i ulterior
de un convertor analog numeric. Dup ce o linie a fost citit, sarcinile ei din registrul de citire sunt
terse. Urmtoarea linie va fi transferat n registrul de citire, iar toate liniile sunt transferate cu o
linie mai jos. Sarcinile din fiecare linie sunt cuplate astfel nct la fiecare transfer din linia curent
n linia urmtoarea are loc i un transfer din linia precedent n linia curent. n acest mod se poate
citi o linie ntreag la un moment dat.
2.2 Conversia analog numeric a imaginilor

Pentru a putea fi utilizat de ctre dispozitivele de calcul, informaia analogic despre
imagine, obinut la ieirea senzorului vizual, trebuie convertit ntr-o reprezentare numeric.
Presupunnd imaginea staionar pe durata achiziiei, ea comport dou aspecte principale:
a) Suprafaa imaginii s fie eantionat (spaial) n n
1
,n
2
puncte (n
1
linii si n
2
coloane); aceasta
este automat realizat, prin construcie, n cazul senzorilor vizuali CCD;
b) Semnalul electric ce reprezint iluminarea n punctul imaginii(i,j), s fie cuantificat cu un
numr de bii reprezentnd 2
k
nivele de gri.
Pentru digitizare, imaginea se eantioneaz cu ajutorul unei reele discrete, iar fiecare eantion
(sau pixel) este cuantizat folosind un numr finit de bii. Pentru afiare, imaginea digital se
convertete din nou n forma analogic.
O metod simpl de eantionare este explorarea (scanarea) imaginii, linie dup linie, i
eantionarea fiecrei linii. De exemplu, camera video cu tub vidicon sau avnd un dispozitiv
videocaptor de tip CCD, face o asemenea scanare a imaginii chiar n procesul de captare. Alte tipuri
de imagini, cum ar fi filmele sau paginile tiprite, se scaneaz n mod analog, cu ajutorul unor
echipamente numite scanere.
Eantionarea poate fi uor neleas dac se tie c transformata Fourier a unei funcii
eantionate este duplicatul scalat, respectiv periodic, al transformatei Fourier a funciei originale.
Pentru a demonstra aceasta, se va considera o imagine eantionat ideal, care se reprezint ca un
tablou bidimensional de funcii Dirac delta, situate pe o reea dreptunghiular cu pasul x,y definit
de:

g x y x y x m x y n y
p
n m
( , ; , ) ( , ) =
=



(2.1)
Imaginea eantionat este definit prin urmtoarea ecuaie:
f f x y g x y x y f m x n y x m x y n y
s p
m n
= =
=


( , ) ( , ; , ) ( , ) ( , )
,

(2.2)
Din proprietatea de unicitate a transformatei Fourier se tie c, dac spectrul imaginii originale
se poate reface folosind spectrul imaginii eantionate, atunci vom putea obine i imaginea
interpolat pe baza imaginii eantionate. Dac frecvenele de eantionare pe cele dou axe, x i y,
sunt de dou ori mai mari dect lrgimea de band, respectiv dac:
xs
>2
x0
,
ys
>2
y0
,sau dac
intervalele de eantionare sunt mai mici dect jumtate din 1/l (1/lrgimea de band)
corespunztoare, x<1/2
x0
, y<1/2
y0
atunci F(
1
,
2
) poate fi refcut printr-o filtrare trece jos cu
caracteristica de frecven:

H
xs ys
( , )
( )
,
,

1 2
1
0
=

(2.3)
pentru (
1

2
), unde este orice regiune.
13
Sunt trei factori care limiteaz rezoluia efectiv a imaginii i fidelitate imaginilor numerice:
- Frecvena de eantionare a senzorului.
- Limea de band a semnalului video.
- Frecvena de eantionare a convertorului analog-numeric.
Pentru a se afla ct de mic trebuie sa fie zona de eantionare pentru a se putea lucra cu
varianta discretizat a imaginii, cu imaginea numeric n loc de imaginea continu, analogic se
apeleaz la teorema lui Shannon. Teorema de eantionare a lui Shannon stipuleaz, n esen, c dac
un semnal de band limitat B [Hz] trebuie eantionat, atunci frecvena utilizat n acest proces
trebuie s fie mai mare sau egal cu dublul frecvenei de tiere.
Pasul ulterior eantionrii, n digitizarea imaginilor, este cuantizarea, codificarea numeric a
valorii funciei de gri, pentru fiecare pixel . Un cuantizor face corespondena dintre o variabil
continu u i o variabil discret u care ia valori dintr-un set finit de numere {r
1
,...,r
L
}. Aceast
alocare se face n general cu o funcie scar i regula este urmtoarea: se definete {t
k
; k=1,...,L+1}
un set de tranziii cresctoare sau nivele de decizie, unde t
1
si t
L+1
sunt valoarea minim i,
respectiv, maxim a lui u. Dac u este n intervalul [t
k
, t
k+1
), atunci i se aloc nivelul r
k
, al k-lea
nivel de reconstrucie. Cel mai simplu i mai uzual cuantizor este cel uniform.
Considerm ieirea unui senzor de imagine cu valori ntre 0.0 si 10.0. Dac eantioanele sunt
cuantizate uniform cu 256 de nivele, atunci nivelele de tranziie i de reconstrucie sunt:

t
k
k
=
1 0 1
2 5 6
( )
, k=1,...,257 (2.4)

256
5
+ =
k k
t r , k=1,...,256 (2.5)
Intervalul q=t
k
-t
k-1
=r
k
-r
k-1
este constant pentru diferite valori ale lui k i este numit interval de
cuantizare. Trebuie reinut faptul c operaia de cuantizare este ireversibil deoarece, pentru o
valoare dat de ieire, nu se poate determina n mod unic valoarea de la intrare. Datorit acestui
lucru, un cuantizor introduce distorsiuni, pe care orice metod de proiectare trebuie s ncerce s le
minimizeze.
Modalitatea general de realizare a cuantizrii este prezentat n continuare.Se consider
) , ( ) , ( y j x i j i = un punct din imaginea eantionat, g=G(i,j) i g
C
=G(i,j) valoarea cuantizat a lui
G(i,j). Considernd c t
1
gt
Lm
unde t
1
i t
m
sunt limitele inferioar respectiv superioar ale
domeniului de variaie a valorii G(i,j), atunci problema cuantizrii are drept scop determinarea unor
niveluri de decizie d
j
i a unor niveluri de reconstrucie rj, astfel nct dac d
j
gd
j+1
, atunci
eantionul cuantizat s ia valoarea r
j
.
Nivelurile de decizie i de reconstrucie sunt alese astfel nct s se minimizeze eroarea medie
ptratic de cuantizare (ntre g i g
C
):

{ } dg g p g g g g M
m
t
t
C C C
) ( ) ( ) (
1
2 2 2

= =
(2.6)
Rezult:

=
|
|
.
|

\
|
=
+
1
0
2
1
) ( ) (
J
j
d
d
j C
j
j
dg g p r g
(2.7)
J fiind numrul total de niveluri de decizie. Dac densitatea de probabilitate p(g) este
constant pe fiecare interval de cuantizare (d
j
,d
j-1
), p(g)=p
j
atunci eroarea de cuantizare devine:

| |
3 3
1
1
0
2
) ( ) (
3
1
j j j j
J
j
j C
r d r d p =
+

(2.8)
n acest caz nivelul de reconstrucie r
j
se determin din condiia :
14

0
2
=

j
C
r

, obinndu-se : r
j
=0,5(d
j+1
+d
j
) (2.9)
i eroarea numeric:

3
1
1
0
2
) (
12
1
j j
J
j
j C
d d p =
+

(2.10)
n cazul n care numrul de nivele de cuantizare nu este suficient, devine vizibil un fenomen numit
conturare. Atunci cnd un grup de pixeli vecini sunt cuantizai la aceeai valoare, se vor forma
regiuni avnd un nivel de gri constant i ale cror granie sunt numite contururi.
Pentru majoritatea imaginilor n care pixelii reprezint funcia luminan, cuantizarea
uniform necesit aproximativ 256 nivele de gri, respectiv 8 bii. Efectele de conturare devin vizibile
la 6 bii/pixel sau sub aceast valoare. Un cuantizor care minimizeaz eroarea medie ptratic,
adaptat la histograma unei imagini date, poate lucra i cu numai 5 sau 6 bii/pixel, fr apariia
fenomenului de conturare. Atunci ns cnd histogramele imaginilor variaz foarte mult, cuantizorul
optimal este foarte rar folosit. n locul acestuia se utilizeaz frecvent cuantizorul uniform cu 8
bii/pixel.
Pentru evaluarea erorilor de cuantizare, ochiul pare a fi foarte sensibil la conturare i la
erorile care afecteaz structura local. Deci, o metod de cuantizare vizual ar trebui s ncerce s
menin conturarea datorat cuantizrii sub nivelul de vizibilitate, pe ntreg domeniul nivelelor de gri
care se afieaz.

3. Memorarea i compresia imaginilor


Dup ce fotografia a fost captat, aceasta este stocat ntr-un format digital universal care
permite s fie transferat pe calculator, imprimant sau alt dispozitiv periferic. Exist mai multe
formate de memorare a imaginii dintre care putem aminti: TIFF, EPS, BMP, JPG, PNG, GIF, etc.
3.1 Stocarea imaginilor

Se poate considera c exist dou moduri de stocare a imaginilor: stocarea n memoria de
lucru a unitii de prelucrare a imaginii de lucru (care este o stocare de scurt durat - doar pe durata
prelucrrii efective) i stocarea de lung durat a imaginilor, n fiiere, pe suporturi externe de
memorie (benzi, discuri, etc.). Diferena eseniala ntre cele doua tipuri de stocare este aceea ca n
memorie imaginea va fi reprezentat complet, n forma necomprimat, pentru a permite accesul
rapid direct la informaia fiecrui pixel. . Pentru stocarea imaginii este necesar ca aceti octei s
conin informaia aferent pixelilor precum i informaie despre tipul imaginii: dimensiunile
acesteia, dac este sau nu indexat, dac are sau nu o tabel de culoare ataat, daca este sau nu
comprimat i dup ce metod. Anumite structuri de fiiere au fost impuse de-a lungul timpului de
firme productoare de software sau de organisme de standardizare, cptnd denumirea de formate
de imagini.
3.1.1 Stocarea imaginilor n memorie

n limbajele C i C++ stocarea imaginilor se face prin intermediul unor variabile ce
implementeaz structuri de date bidimensionale. Ceea ce este deosebit este modul de declarare a
acestora: declararea statica nu este convenabil din cauza dimensiunilor n general mari ale
imaginilor, i deci este necesar o declarare dinamic. Particularitatea este data de memorarea
separat a fiecrei linii (sau coloane) a matricii ntr-un vector alocat dinamic, i gruparea adreselor
15
de nceput a acestora ntr-un vector de pointeri, la care se va reine adresa de nceput (deci un alt
pointer).
Spre deosebire de C, limbajul Matlab aduce mari simplificri. Exist un singur tip de date,
reprezentate pe 8 octei (caracteristic ce se schimb ncepnd cu versiunea 5.0, ce admite valori
reale, ntregi sau caracter, declarate explicit). Orice variabila Matlab este creat n momentul
folosirii sale n membrul stng al unei expresii (deci nu este necesar declararea prealabil folosirii);
orice variabil este o matrice (scalarul este o matrice de o linie i o coloana). Funciile returneaz
matrici, iar acest lucru permite ca memorarea i accesul la imaginile memorate s se realizeze mult
mai uor.
3.1.2 Stocarea imaginilor n fiiere

Un fiier este entitatea logic de organizare a informaiei nscrise pe mediile magnetice de
stocare i se compune dintr-un ir de octei. Pentru stocarea imaginii este necesar ca aceti octei s
conin informaia aferent pixelilor precum i informaie despre tipul imaginii: dimensiunile
acesteia, dac este sau nu indexat, dac are sau nu o tabel de culoare ataat, dac este sau nu
comprimat i dup ce metod. Anumite structuri de fiiere au fost impuse de-a lungul timpului de
firme productoare de software sau de organisme de standardizare, cptnd denumirea de formate
de imagini. Formatele de imagini s-au fcut cunoscute mai ales dup extensia standard a fiierelor
ce conin imaginile stocate dup formatul respectiv: BMP, TIF, GIF, PCX, JPG ... . n continuare
vor fi prezentate cteva caracteristici ale acestor tipuri de fiiere, iar o atenie deosebit va fi
acordat formatului Windows Bitmap -BMP al firmei Microsoft, care este unul dintre cele mai larg
recunoscute formate de fiiere.
Un fiier BMP are trei componente consecutive: un antet de fiier (BITMAPFILEHEADER),
o structura de informaie a imaginii (BITMAPINFO) i codarea pixelilor. Antetul de fiier
(BITMAPFILEHEADER) conine informaii asupra tipului, dimensiunii i reprezentrii fiierului
Bitmap independent de dispozitiv (DIB - Device Independent Bitmap); semnificaiile
componentelor sunt date n tabelul 3.1.

Cmp Descriere
bfType Specific tipul de fiier; trebuie s conin caracterele BM
bfSize Specific lungimea fiierului n DWORD
BfReserved1 Cmp rezervat, valoare 0
BfReserved2 Cmp rezervat, valoare 0
bfOffBits Specific deplasamentul n octei de la sfritul structurii

BITMAPFILEHEADER pn la zona din fiier ce conine pixelii
codai

Tabel 3.1: Descrierea cmpurilor structurii BITMAPFILEHEADER

Structura de informaie a imaginii (BITMAPINFO) conine informaii asupra dimensiunilor i
culorilor unui DIB, i este alctuit din dou componente: antetul structurii de informaii
(BITMAPINFOHEADER), a crui componente sunt descrise n tabelul3.2 i tabelul de culoare,
format din structuri RGBQUAD.

Cmp Descriere
BiSize Numrul de octei ai structurii BITMAPINFOHEADER
BiWidth Limea imaginii, n pixeli
BiHeight nlimea imaginii, n pixeli
BiPlanes Numrul de plane de culoare ale dispozitivului de afiaj (1)
16
BiBitCount Numrul de bii cu care se codeaz un pixel; poate fi 1, 4, 8 sau 24
BiCompression
Tipul de compresie utilizat: BI_RGB fr compresie, BI_RLE8 sau
BI_RLE4 pentru compresie de tip RLE cu cuvinte de respectiv 8 sau 4
bii
BiSizeImage Dimensiunea imaginii n octei
BiXPelsPerMeter Rezoluia pe orizontala a dispozitivului inta (n pixeli pe metru)
BiYPelsPerMeter Rezoluia pe vertical a dispozitivului inta (n pixeli pe metru)
BiClrUsed
Numrul de culori utilizate n imagine; dac este 0, imaginea
folosete toate culorile disponibile ale paletei
BiClrImportant
Numrul de culori considerate importante; daca este 0, toate culorile
sunt luate n considerare

Tabel 3.2: Descrierea cmpurilor structurii BITMAPINFOHEADER

Structura RGBQUAD descrie o culoare prin componentele sale de rou, verde i albastru, i
un cmp rezervat avnd valoarea 0.
Codarea pixelilor se face dup cteva reguli. Fiecare pixel va fi codat pe biBitCount bii; dac
biBitCount este 1, 4 sau 8, imaginea va fi indexat i fiierul conine tabela de culoare asociat
imaginii. Codurile pixelilor se grupeaz pe octei (deci pentru o codare de 4 bii per pixel, fiecare
octet de cod va corespunde la doi pixeli alturai). Daca biBitCount este 24, pentru fiecare pixel se
asociaz direct trei octei, ce reprezint componentele de rou, verde i albastru ale culorii
respective; aceast imagine se numete True Color i nu mai are un tabel de culoare asociat.
Denumirea de True Color (culoare adevrat) provine din faptul c numrul total de culori ce se pot
astfel reprezenta (2
24
) depete limita sensibilitii umane de discernere a culorilor. Imaginile n 16
i 256 culori pot fi comprimate prin codare. n tonuri de gri se obin 256 de nivele. n tabelul de mai
jos este prezentat numrul de culori posibile de redat pe ecranul unui monitor.


Culori Bii/Pixel Formula de Calcul Numrul de culori
Alb-negru 1 2
1
2
Ecran Windows 4 2
4
16
Scala de gri 8 2
8
256
256 de culori 8 2
8
256
High color 16 2
16
Peste 65000
True color 24 2
24
Peste 16 milioane

Tabel 3.3: Numrul de culori afiate pe ecran

Codarea se face independent pe fiecare linie orizontal a imaginii. Codurile (indexurile)
tuturor pixelilor unei linii sunt concatenate; irul rezultat trebuie s fie multiplu de 32 de bii (sau de
4 octei, sau s conin un numr ntreg de DWORD's). Dac aceast constrngere nu este
respectat, linia respectiv se completeaz cu numrul necesar de bii (care, n mod evident, nu vor
fi utilizai la citirea imaginii din fiier). Codarea imaginii ncepe cu ultima linie, i pentru fiecare
linie baleiajul este normal (de la stnga la dreapta).

Formatul TIFF (Tag Image File Format .TIF) a fost iniial proiectat de Aldus Corporation,
pentru a salva imaginile create cu scannere sau cu unele programe de editare. Acest format a fost
folosit destul de mult. TIFF suport pn la 24 de bii de culoare.
17
Formatul EPS (Encapsulated PostScript .EPS) a fost propus de Adobe pentru imprimantele
PostScript. Fiierele se compun din dou pri: prima, n format text, transmite imprimantei
informaii asupra felului cum va aprea imaginea la ieire, iar a doua parte este de tip PICT.

Formatul JPEG (Joint Photografic Experts Group .JPG) este cel mai folosit format pentru a
afia imagini fotografice pe Web.
JPEG are dou caracteristici distincte:
* folosete o schem de compresie cu pierdere a crei valoare se poate modifica, conducnd
la variaia dimensiunii fiierului (se pot obine fiiere mici dar cu caliti slabe)
* suport 24 de bii pentru a defini culoarea unui pixel (spre deosebire de formatul apropiat
GIF la care sunt disponibili doar 8 bii).
Nu este recomandat salvarea imaginilor originale n acest format dac se intenioneaz
procesarea acestora deoarece de fiecare dat cnd se deschide i se salveaz imaginea aceasta este
compresat. Ca urmare, dup un anumit numr de salvri, imaginea se va degrada din ce n ce mai
mult. De aceea, se recomand ca imaginea original s fie salvat n format BMP sau TIFF cu numr
maxim de bii.

Formatul PNG (Portable Network .PNG) a fost produs pentru a nlocui formatul GIF n
Microsoft Internet Explorer i Netscape Navigator. PNG, spre deosebire de GIF, este un format fr
pierderi. PNG are pn la 254 niveluri de transparen (GIF suport numai unul),un control al
strlucirii imaginii i pn la 48 de bii pentru specificarea culorii pixelilor.

Formatul GIF (Graphics Interchange Format .GIF) este larg utilizat pe Web i mai puin n
tehnica fotografic. Formatul poate memora pn la 256 culori pentru un pixel stocate ntr-o palet
de culori. Pe Web se pot folosi dou versiuni: GIF 86a i GIF 89a. Ambele imagini folosesc
memorarea imaginii printr-o explorare ntreesut (imaginea este explorat de patru ori n loc de o
singur dat). n mod normal, cnd imaginea se distribuie la un utilizator, se transmite informaia
referitoare la culoarea pixelilor linie cu linie. La formatul GIF se transmite ntreaga imagine, dar cu
o rezoluie slab, permind utilizatorului s-i fac o idee asupra coninutului fiierului ce urmeaz
a se transmite. n continuare se transmit informaiile referitoare la celelalte trei explorri, imaginea
se umple i se ajunge la rezoluia complet.
Cu toate c pe ecran o imagine salvat cu extensia GIF pare bun (dar limitat la 256 de
culori), dac se pune alturi de o imagine salvat cu extensia JPEG sau altele, se poate observa o
diferen net. Formatul GIF este recomandat pentru desene animate, grafice, scheme logice sau
text, unde exist un numr limitat de culori i frontier distinct ntre dou regiuni colorate.
Imaginile GIF se pot compresa fr pierderi. Compresia depinde de ct de frecvent se schimb
culoarea la doi pixeli de pe o linie (pixelii de pe aceiai linie care au aceiai culoare sunt nregistrai
ca un singur bloc). Ca urmare, o imagine cu benzi orizontale va fi mai mult comprimat dect una
cu benzi verticale, fotografiile cu suprafee identic colorate (de exemplu: cerul, zpada, norii) vor fi
puternic comprimate.
3.2 Compresia imaginilor
Termenul de compresie a imaginilor (uneori numit i codare a imaginilor) se refer la o clas
larg de tehnici i metode al cror scop este reprezentarea unei imagini date cu un numr ct mai
mic de bii (mai mic dect numrul de bii al reprezentrii iniiale). Necesitatea reducerii cantitii
de informaie necesar reprezentrii este evident daca consideram cazul transmisiei de televiziune
alb-negru (625 x 625 pixeli cu 256 nivele de gri, de 50 de ori pe secunda, deci un flux de 18.6 MB/
secunda). Procesul de recompunere a imaginii iniiale din reprezentarea restrns se numete
decompresie sau decodare; este evident ca prin decodare trebuie s se obin o imagine ct mai
apropiata de imaginea original. Exist doua categorii fundamentale de tehnici de compresie
(codare): codarea fr pierderi (in care imaginea decodata este identica cu imaginea iniial) i
codarea cu pierderi, n care se admit mici diferene fat de original. Calitatea unui procedeu de
18
compresie (pentru o imagine data) se msoar prin factorul de calitate (raportul semnal zgomot
dintre imaginea original f i imaginea decodat g) i factorul (raportul) de compresie. Factorul de
compresie C este raportul dintre cantitatea de informaie necesar reprezentrii imaginii iniiale i
cantitatea de informaie necesar reprezentrii imaginii codate; evident compresia are loc dac
factorul de compresie este supraunitar (C>1). Uneori, factorului de compresie i se asociaz (sau este
nlocuit de) rata de compresie: cantitatea de informaie necesar reprezentrii comprimate a fiecrui
pixel al imaginii; rata de compresie se msoar n bii per pixel (bpp).
O alt clasificare posibil a tehnicilor de compresie se poate face dup tipul imaginii creia i
se aplic: vom face astfel distincia ntre compresia imaginilor binare i compresia imaginilor cu
nivele de gri. Se impune totui o observaie: metodele de codare ce se vor prezenta n cadrul
tehnicilor specifice imaginilor binare pot fi folosite pentru compresia oricrei succesiuni de valori
binare, indiferent de semnificaia acestora (ceea ce nseamn c ar putea fi folosite i pentru
compresia imaginilor cu nivele de gri) i sunt metode de compresie fr pierderi.

4. Restaurarea imaginilor

La ieirea blocului de achiziie a imaginilor, rezultatul poate fi o imagine distorsionat ce se
datoreaz imperfeciunii detectorului, iluminrii neadecvate sau neuniforme sau unui unghi de
vedere nedorit. Este important s se neleag c acestea sunt corecii ce se aplic dup ce imaginea
a fost digitizat i stocat i astfel devine imposibil redarea celor mai bune care s-ar fi putut obine
prin optimizarea procesului de achiziie a imaginilor.
Desigur, achiziia unei imagini de o calitate optim este uneori imposibil. Deoarece camera
poate colecta un numr redus de fotoni ntr-un interval scurt de timp sau nainte ca scena s se
schimbe, zgomotul prezent n imagine nu poate fi mediat prin adugarea de fotoni sau cadre video
i astfel sunt necesare alte metode de reducere a zgomotului. Dac sursa de iluminare nu poate fi
controlat astfel nct s fie centrat perfect i perpendicular pe suprafa (de exemplu Soarele) sau
dac suprafaa este curb i nu plan, imaginea va avea o iluminare neuniform care trebuie
corectat. Dac poziia camerei nu poate fi ajustat (de exemplu n cazul sateliilor) sau dac
suprafaa prezint neregulariti atunci pri ale scenei vor fi ngustate iar de acest lucru trebuie s
se in cont atunci cnd se fac comparaii sau se msoar diferite distane.
n zilele noastre este posibil implementarea de astfel de corecii cu ajutorul calculatoarelor cu
performane moderate n timpi de ordinul a ctorva secunde.Restaurarea (refacerea) imaginii se
refer la nlturarea sau minimizarea degradrilor cunoscute ntr-o imagine. Degradarea se poate
datora zgomotului, proastei focalizri a camerei, micrii relative obiect-camer, turbulenelor
aleatoare ale atmosferei, etc. Scopul restaurrii este de a minimiza, prin filtrare, efectele degradrii.
Filtrele utilizate pentru restaurarea imaginilor depind de cunoaterea cauzei ce determin
degradarea, precum i de criteriile de filtrare. Succesul operaiei de restaurare depinde n mod
esenial de potrivirea ntre modelul presupus al degradrii i modul real n care imaginea a fost
degradat Un criteriu frecvent utilizat este eroarea ptratic medie. Restaurarea imaginii difer de
mbuntirea imaginii prin aceea c, pentru cel de-al doilea proces, scopul este de a extrage sau
accentua anumite trsturi i nu de a corecta erorile ce apar la captarea imaginii. n figura urmtoare
este prezentat un sistem de restaurare a imaginii:

Sistem de
captare
a imaginii
u(x,y) Conversie
A/D

Filtrare
Conversie
D/A
Redarea
imaginii
u(m,n
Fig. 4.1 Sistem de restaurare a imaginilor
19
Filtrele utilizate pentru restaurarea imaginilor depind de cunoaterea cauzei ce determin
degradarea, precum i de criteriile de filtrare. Succesul operaiei de restaurare depinde n mod
esenial de potrivirea ntre modelul presupus al degradrii i modul real n care imaginea a fost
degradat Un criteriu frecvent utilizat este eroarea ptratic medie. Restaurarea imaginii difer de
mbuntirea imaginii prin aceea c, pentru cel de-al doilea proces, scopul este de a extrage sau
accentua anumite trsturi i nu de a corecta erorile ce apar la captarea imaginii.
Obiectivul procesului de restaurare a imaginilor este acela ca dintr-o imagine degradat s se
elimine sau s se reduc factorul de degradare, dar pentru a se putea realiza o refacere eficient a
imaginilor trebuie simulate pentru nceput toate posibilitile de degradare. Schema unui astfel de
sistem este dat n figura urmtoare:

Putem considera f(n
1
,n
2
) ca fiind imaginea original digitizat, g(n
1
,n
2
) ca fiind imaginea
digital degradat i p(n
1
,n
2
)

ca fiind imaginea digital prelucrat. Obiectivul refacerii imaginilor
este de a obine o valoare p(n
1
,n
2
) ct mai apropiat de f(n
1
,n
2
).
Trebuie s se in ns seama c degradarea nu are loc ntotdeauna naintea blocului de
refacere (de exemplu zgomotul aditiv din display). n acest caz trebuie anticipat viitoarea
degradare care poate s apar dup lanul de refacere i apoi s fie prelucrat imaginea n mod
corespunztor. Uneori, diferite tipuri de degradri (estomparea blurring, din digitizor sau
display, de exemplu) pot fi modelate ca blocuri de degradare aplicate naintea blocului de refacere.
4.1 Modele ale imaginii observate
Un sistem tipic de captare a imaginii const dintr-un sistem de formare a imaginii, un detector
i un nregistrator. De exemplu, un sistem electrooptic de tipul camerei de televiziune conine un
sistem optic care focalizeaz imaginea pe un dispozitiv fotoelectronic. Imaginea este apoi scanat
pentru transmisie sau nregistrare. Similar, un aparat fotografic obinuit utilizeaz lentile pentru a
forma o imagine care este detectat i nregistrat pe un film fotosensibil.
Modelul matematic pentru un astfel de sistem poate fi exprimat prin ecuaiile:
( ) ( ) | | ( ) y x, y x, w g y x, v + =
(4.1) ( )
' ' ' ' ' '
dy dx y , x u ) y , x y, h(x, y) w(x,

+

= (4.2)
( ) ( ) ( ) | | ( ) ( ) y x, y . x y . x w g f y x,
2 1
+ = (4.3)






Digitizor
ideal
Degradare Refacere
imagine
Display
ideal
f(n
1
,n
2
)
g(n
1
,n
2
)
p(n
1
,n
2 f(x,y) f (x,y)
Domeniul discret
Fig 4.2 Sistem de refacere (toate degradrile sunt cunoscute)
Sistem liniar
h(x,y,x,y)
Neliniaritate
punctual g(.)
+
f(.)
X
+

1
(x,y)
2
(x,y)
u(x,y) w(x,y)
v(x,y)
(x,y)


20



unde u(x,y) reprezint obiectul (imaginea original) i v(x,y) este imaginea observat.
Procesul de formare a imaginii poate fi modelat printr-un sistem liniar (ca n figura de mai
sus), unde h(x,y,x',y') este rspunsul la impuls.
Funciile f i g sunt n general neliniare i reprezint caracteristicile mecanismului de detecie
i nregistrare, iar (x, y) reprezint zgomotul aditiv, care are o component imagine f[g(w)]
1
, i o
component aleatoare
2
.

Modele pentru imaginea format
Pentru sistemele coerente, limitarea datorat difraciei are efectul unui filtru trece-jos ideal.
Pentru cele necoerente, aceasta nseamn limitare de band i un rspuns n frecven obinut prin
convoluia unei funcii coerente de transfer cu ea nsi.
Degradrile datorate distorsiunilor de faz ale funciei de transfer coerente CTF ("coherent
trunsfer function") sunt numite aberaii i se manifest ca distorsiuni n banda de trecere a funciei
de transfer optice. Neclaritatea poate s apar atunci cnd exist o micare relativ ntre obiect i
camer, pe durata expunerii. Tulburrile atmosferice sunt datorate variaiei aleatoare a indicelui de
refracie a mediului dintre obiect i sistemul de captare a imaginii.
Imaginea nceoat (neclar) poate s apar, de asemenea, n imaginile achiziionate prin
scanare, caz n care pixelii sunt integrai de apertura scanerului. Asemenea imagini se obin, de
exemplu la radar sau la echipamentele de redare clasice. n cazul achiziiei de imagine cu camere
CCD, interaciunea dintre elementele vecine ale reelei de captare duce, i ea, la " nceoarea"
imaginii.
Rspunsul detectorului de imagine i a dispozitivului de nregistrare sunt n general neliniare.
De exemplu, rspunsul filmelor fotografice, scanerelor i dispozitivelor de redare poate fi scris sub
forma:
g=aw

(4.4)
unde a i sunt constante dependente de dispozitiv, iar w este variabila de intrare. Pentru filmele
fotografice, un model mai utilizat este:
d=log
10
w-d
0
(4.5)
unde se numete factor de contrast al peliculei, w este intensitatea luminii incidente, iar d este
densitatea optic a suportului. Pentru un dispozitiv fotoelectronic, w reprezint intensitatea luminii
incidente iar g reprezint de fapt curentul de fascicul. Valoarea exponentului este, n general,
pozitiv i aproximativ egal cu 0,75.

4.2.Estimarea degradrii

Fiecare algoritm de refacere este astfel conceput, nct s exploateze caracteristica semnalului
i cea a degradrii, exactitatea informaiei despre degradare fiind esenial pentru aplicarea cu
succes a unui algoritm de refacere a imaginilor. Exist dou metode pentru obinerea informaiei
asupra degradrii imaginii.
Prima metod se bazeaz pe culegerea informaiei despre degradarea din imagine. Dac se pot
identifica regiunile din imagine unde intensitatea este aproximativ uniform (de exemplu "cerul"),
Fig. 4.3 Sistem de captare a imaginii
21
este posibil estimarea puterii spectrale sau estimarea funciei de probabilitate a zgomotului aleator
n regiunea cu fond uniform. Un alt exemplu poate fi dat presupunnd o imagine estompat i o
regiune din imaginea iniial, putndu-se estima funcia de estompare ("blurring") b(n
1
,n
2
).
Considernd imaginea original f(n
1
,n
2
), n particular o regiune din imaginea original, i imaginea
alterat g(n
1
,n
2
), respectiv aceeai regiune alterat, atunci se poate scrie:
( ) ( ) ( )
2 1 2 1 2 1
, , , n n b n n f n n g = (4.6)
Presupunnd cunoscute f(n
1
,n
2
), g(n
1
,n
2
) se poate determina b(n
1
,n
2
). Dac f(n
1
,n
2
) este
impulsul unitate (n
1
,n
2
), atunci b(n
1
,n
2
) este dat de g(n
1
,n
2
) (de exemplu, o stea pe un cer nocturn).
Cea de a dou metod pentru obinerea informaiei despre alterare const n studierea
mecanismului care a cauzat degradarea. De exemplu, se va considera o imagine analogic f(x,y),
estompat datorit unei micri plane a sistemului de captare n timpul expunerii. Presupunnd c
nu exist o alt degradare n sistemul de captare, se poate exprima degradarea imaginii g(x,y) ca
fiind:
dt t y y t x x f
T
y x g
T
T
t

=
=
2
2
0 0
)) ( ) ( (
1
) , ( (4.7)
unde x
0
(t), y
0
(t) reprezint translaia pe orizontal, respectiv pe vertical a punctului f(x,y) relativ la
sistemul de captare, n intervalul t, iar T este durata de expunere.
4.3. Restaurarea adaptiv a imaginilor

n cazul real al unei imagini, caracteristicile difer considerabil de la o regiune la alta. De
exemplu, cerul are o intensitate de gri aproximativ constant, n timp ce copacii au variaii mari de
intensitate. Totodat, gradul de degradare poate varia de la o regiune la alta. Din aceste motive este
util implementarea unui algoritm adaptiv de refacere a imaginilor. Ideea adaptrii nu este folosit
numai n cazul refacerii imaginilor, ci i n alte aplicaii, cum ar fi intensificarea imaginilor. Dou
dintre aceste metode de prelucrare adaptiv sunt:
Metoda "pixel cu pixel"
Const n adaptarea procesului la fiecare pixel. Astfel, pentru fiecare pixel din imagine,
metoda este determinat pe baza caracteristicilor locale ale imaginii, pe baza gradului de degradare
i pe baza oricrei alte informaii relevante, care pot fi culese din regiunile nvecinate pixelului
curent. Deoarece fiecare pixel este prelucrat n mod diferit, aceast metod are un nalt grad de
adaptare i nu este afectat de discontinuitile artificiale ce apar n procesul de prelucrare.
Metoda "bloc cu bloc"
Practic, imaginea este mprit n blocuri (regiuni sau subimagini) i fiecare bloc este
prelucrat separat, dup care este combinat cu celelalte. Mrimea tipic a unui bloc este ntre 8x8 i
32x32 pixeli. Pentru fiecare bloc se alege o operaie spaial, n funcie de caracteristicile de baz
ale blocului, n funcie de degradare sau de orice alt informaie referitoare la regiunea discutat.
Deoarece prelucrarea aplicat unui bloc este o operaie spaial, este nevoie de o anumit
flexibilitate n implementarea acesteia. De exemplu, un FTJ ar putea fi implementat fie n domeniul
spaial, fie n domeniul frecven. n plus, aceast metod este mult mai simpl, n comparaie cu
metoda de prelucrare pixel cu pixel, datorit faptului c se folosete un singur tip de prelucrare
pentru ntregul bloc de pixeli. Datorit ns faptului c tipul prelucrrii se schimb brusc de la un
bloc la altul, pot aprea discontinuiti artificiale la trecerile dintr-o regiune n alta. Acest efect
poart denumirea de efectul de mprire n blocuri ("blocking"). n multe aplicaii, cum ar fi cele
de refacere a imaginilor, la un nivel mare al raportului semnal-zgomot acest efect poate s nu fie
22
suprtor i de aceea poate s nici nu fie luat n considerare. n alte aplicaii, ca spre exemplu
codarea prin transformare la rate mici de transmisie, efectul poate fi mult mai suprtor.
Efectul blocking poate fi redus printr-o filtrare trece jos aplicat numai regiunilor de frontier.
De asemenea, efectul blocking se poate diminua prin suprapunerea parial a blocurilor. n acest
caz, pentru a obine un bloc se aplic o fereastr w
i,j
(n
1
,n
2
) peste g(n
1
,n
2
). Fereastra aleas trebuie
s satisfac dou condiii. Prima este ca

=
i j
1 n2) (n1, wij , pentru toi pixelii de interes condiie
care garanteaz c prin simpla adunare a blocurilor componente se obine imaginea iniial. A doua
condiie cere ca w
i,j
(n
1
,n
2
) s fie o funcie descresctoare spre zero n apropierea marginilor
ferestrei, ceea ce duce la diminuarea eventualelor discontinuiti care apar la frontierele dintre
blocuri.
Una dintre metodele de determinare a ferestrei bidimensionale care s satisfac ambele
condiii este folosirea a dou ferestre unidimensionale, care satisfac relaia:
w
i,j
(n
1
,n
2
)=w
i
(n
1
)w
j
(n
2
) (4.8)

n figura de mai sus este prezentat un proces de prelucrare adaptiv. Prelucrarea ce trebuie
folosit la fiecare pixel/bloc de pixeli, aceasta este adaptat n funcie de caracteristicile imaginii, de
gradul de degradare i de orice alt informaie relevant. Obinerea acestor informaii se poate face
n dou moduri: fie pe baza presupunerii c sunt disponibile informaii asupra problemelor care pot
aprea (de exemplu, se poate cunoate tipul imaginii sau se poate determina gradul degradrii
folosind informaiile care sunt deinute despre sursele de degradare), fie extrgnd informaiile din
imaginea care trebuie prelucrat.

4.4. Restaurarea imaginilor pe baza funciei de vizibilitate a zgomotului

Se poate dezvolta un sistem de refacere a imaginilor bazat pe gradul de vizibilitate al
zgomotului. Pentru aceasta se va folosi funcia de vizibilitate a zgomotului. Vizibilitatea zgomotului
depinde de tipul zgomotului i de tipul semnalului la care este adunat. Acelai nivel al zgomotului
alb, respectiv al zgomotului colorat, genereaz efecte diferite pentru un observator uman, iar
regiunile cu multe detalii tind s mascheze zgomotul mai mult dect regiunile cu detalii puine.
Una dintre metodele de definire a funciei de vizibilitate a zgomotului presupune zgomotul ca
fiind alb (poate fi aplicat i pentru alte tipuri de zgomote). Totodat se noteaz cu M(n
1
,n
2
)
informaiile referitoare la detaliile imaginii originale f(n
1
,n
2
). Funcia M(n
1
,n
2
) se numete masc.
Caracteristici
locale
Prelucrri
Imaginea
alterat g(n
1
,n
2
)
Informaii
Despre imagine
Imaginea
Prelucrat p(n
1
,n
2
)
Fig. 4.4. Sistem adaptiv de prelucrare a imaginilor

23
Funcia de vizibilitate a zgomotului, V(M), este astfel definit nct s reprezinte vizibilitatea
relativ pentru un nivel dat al zgomotului, la nivelul M al mtii. Deci, presupunnd un zgomot cu
variana
1
2
la M=M
1
, acesta poate fi apreciat de un observator uman ca un zgomot cu variana
2
2

la M=M
2
, astfel ca:

1
2
V(M
1
)=
2
2
V(M
2
) (4.9)
Msurarea funciei de vizibilitate a zgomotului se poate face astfel: presupunnd c se adun
zgomotul cu variaia
1
2
la o regiune din imagine cu un nivel al mtii M
1
. Se poate solicita
observatorului uman s compare vizibilitatea zgomotului din regiunea curent cu o vizibilitate
dintr-o alt regiune a imaginii, unde M=M
2
iar nivelul zgomotului este
2
2
. Se modific nivelul
2
,
astfel nct zgomotul din cele dou regiuni s fie egal vizibil i se noteaz valoarea obinut.
Cunoscnd
1
2
i
2
2
se poate determina V(M
2
) /V(M
1
). V(M) depinde numai de M, prin urmare
funcia masc M(n
1
,n
2
) este aleas astfel nct s se obin acelai nivel al zgomotului pentru toate
regiunile din imagine care au acelai M.
Zgomotul adugat unei imagini are n general un spectru de frecvene mai mare dect
componentele imaginii normale din cauza decorelrii spaiale a componentelor sale. Printr-o filtrare
trece jos n domeniul spaial sau n domeniul frecvenelor spatiale se poate suprima o mare parte a sa.
Nu exist deosebiri ntre rezultatele obinute prin filtrarea n domeniul spaial i filtrarea n domeniul
Fourier, alegerea fiind dat de considerente de implementare. Totui procesarea n domeniul Fourier,
spre deosebire de convoluie ne permite o privire cantitativ i intuitiv n natura de zgomot, util n
proiectarea filtrelor de suprimare a zgomotului n domeniul spaial. Fundamentul tehnicilor n
domeniul frecvenelor spaiale l constituie teorema de convoluie.
Fie g(x,y) o imagine rezultat prin convoluia imaginii f(x,y) i un operator invariant la
deplasare h(x,y), adic: g(x,y)=h(x,y)*f(x,y). Conform teoremei de convoluie tim c n domeniul
frecvenelor avem relaia: G(u,v)=H(u,v)F(u,v), unde G,H,F sunt transformatele Fourier ale funciilor
spaiale g,h si respectiv f. Transformata H(u,v) este numit funcie de transfer a procesului. n
aplicaiile tipice de mbuntire a imaginilor este dat funcia imagine f(x,y), iar scopul dup
calcularea transformatei Fourier F(u,v) este de a selecta H(u,v) astfel nct imaginea dorit dat de
g x y H u v F u v ( , ) { ( , ) ( , )} =
1
s ndeplineasc anumite condiii. De exemplu, accentuarea muchiilor
din f(x,y), se poate face folosind o funcie H(u,v) care s favorizeze componentele de nalt frecven
din F(u,v). Teorema de convoluie impune ca H(u,v) i h(x,y) s fie de aceleai dimensiuni, dac
H(u,v) este de mrime 256x256 la fel trebuie s fie i h(x,y) pentru a obine acelai rezultat prin
filtrarea n domeniul spaial ca n cazul filtrrii n domeniul frecven. Convoluia cu mti de
asemenea dimensiune se realizeaz mult mai eficient n domeniul frecven.
Pentru o anumit imagine s-a observat c refacerea depinde puin de aproximarea folosit
pentru spectrul de putere al zgomotului i al imaginii ideale, dar depinde foarte mult de forma exact
a funciei de transfer H(u,v) a sistemului degradant. Din fericire aceasta este o proprietate a
sistemului de achiziie a imaginii i poate fi calculat cu acuratee.
4.5. Metode de reducere a zgomotului
4.5.1. Modele de zgomot

Cel mai ntlnit tip de zgomot este cel gaussian datorat capacitii limitate de numrare a
detectorului ce apare din cauza numrului mic de particule incidente (fotoni sau electroni).
Zgomotul din imagine se poate datora de asemenea instabilitii sursei de lumin sau a detectorului
pe timpul procesului de scanare sau digitizare a imaginii. Modelul acestui tip de zgomot este diferit
de cel al zgomotului gaussian datorat capacitii de numrare (counting statistics) dar apare tot ca
o variaia a strlucirii n regiunile uniforme.
Zgomotul Gaussian are urmtoarea funcie de densitate a probabilitii:
24
Error! Objects cannot be created from editing field codes.
(4.10)
Distribuia Gaussian are proprietatea c estimarea valorii mediane a unei variabile aleatoare
Gaussiene staionare se realizeaz cel mai bine folosind medierea aritmetic liniar. Acest lucru
face ca zgomotul Gaussian s aduc cele mai multe probleme filtrelor neliniare de restaurare a
imaginilor, n sensul c mbuntirea pe care o aduc aceste filtre fa de cele liniare este cea mai
mic n cazul zgomotului Gaussian. Pentru a aduce mbuntiri rezultatelor obinute de filtrele
liniare, filtrele neliniare pot exploata doar distribuiile ne-Gaussiene ale semnalelor.
Zgomotul Laplacian (numit de asemenea bi-exponenial) are urmtoarea funcie de
densitate a probabilitii:
Error! Objects cannot be created from editing field codes.
(4.12)
Fa de medierea aritmetic liniar, filtrele neliniare pot oferi o aproximare mai exact a
valorii mediane a unei variabile aleatoare Laplaciane .
Zgomotul uniform nu este foarte ntlnit n imaginile reale dar ofer o comparaie
folositoare cu zgomotul Gaussian. Fcnd aceast comparaie, medierea aritmetic liniar
realizeaz o aproximare slab a valorii mediane a unei distribuii uniforme. Din acest lucru rezult
faptul c filtrele neliniare elimin mai bine zgomotul uniform n comparaie cu cel Gaussian.
Funcia de densitate a probabilitii pentru acest tip de zgomot este:
Error! Objects cannot be created from editing field codes.
(4.13)
Pentru sistemele foto-electronice, zgomotul ce apare n curentul de fascicul este modelat
adesea ca:
( ) ( ) ( ) ( ) y x y x y x g y x , , , ,
2 1
+ = (4.14)
unde g este rspunsul detectorului de imagine iar
1
i
2
sunt cmpuri de zgomot aleator, alb,
gaussian, independente mutual i cu valoare medie nul.
Termenul dependent de semnal,
1
(x,y) apare pentru c procesul de detecie i nregistrare
implic emisie aleatoare de electroni, avnd o distribuie Poisson cu valoarea medie egal cu g.
Termenul
2
(x,y) reprezint zgomotul termic de band larg i poate fi modelat ca zgomot gaussian
alb.
Un tip diferit de zgomot care apare n imaginile degradate este numit "speckle noise", n
traducere liber "zgomot ptat" (blat). Pentru imagini cu rezoluie slab, acesta este multiplicativ
i apare atunci cnd neuniformitatea suprafeei obiectului este de dimensiunea lungimii de und a
radiaiei incidente. El poate fi modelat ca:

( ) ( ) ( ) ( ) y x, y x, s y x, u y x, v + =
(4.15)
unde s(x,y), intensitatea zgomotului "blat", este de fapt un zgomot alb cu o distribuie aleatoare
exponenial, respectiv:
( )

0,
0
|
.
|

\
|
=
2
rest n
,
-
exp
1
p
2
s

(4.16)
Presupunnd c o imagine deine cea mai bun calitate ce poate fi obinut practic, vor fi
prezentate n continuare cteva modaliti de nlturare a zgomotelor ce se pot efectua pentru a
mbunti posibilitatea vizualizrii i separrii trsturilor (detaliilor) prezente n imagine.
Presupunerile fcute pentru toate aceste metode sunt c pixelii prezeni n imagine sunt mult mai
mici dect cele mai nsemnate detalii i c pentru majoritatea pixelilor cei mai muli vecini ai lor fac
25
parte din aceeai structur. Pe baza acestor presupuneri se pot aplica diferite metode de mediere sau
comparaie.
4.5.2. Tipuri de filtre utilizate pentru reducerea zgomotului
1. Filtre de mediere aritmetic
Cea mai simpl form de mediere spaial cuprinde urmtorii pai:
- nsumarea valorilor strlucirii pixelilor din fiecare regiune mic a imaginii;
- mprirea acestei sume la numrul pixelilor din imagine;
- folosirea valorilor obinute pentru a construi o nou imagine.
n cazul zgomotului aleator prezent n imagine datorat caracteristicii de numrare a unui
numr redus de fotoni se obine o mbuntire a calitii imaginii i a raportului semnal/zgomot
(signal-to-noise ratio). Totui, rezoluia lateral a imaginii este afectat serios iar detaliile mici din
imagine nu se mai pot discerne separat.
Cel mai ntlnit mod de a pune n practic aceast metod de mediere a vecintii este de a
nlocui fiecare pixel cu media sa i a vecinilor lui. Acest lucru poate fi descris ca o operaie de tip
nucleu (kernel operation) deoarece implementarea ei poate fi generalizat suma fiecrei valori a
pixelilor din regiune nmulite cu un set de coeficieni ntregi (ce semnific nsemntatea, ponderea
fiecrui pixel):

+
=
+
=
+ +
=
m
m j i
m
m j i
,
j i,
,
j y i, x j i,
*
y x,
W
P W
P
(4.17)
Aceast formul prezint calculul efectuat asupra unui ptrat de dimensiune 2m+1 (impar).
Este posibil de asemenea, dar nu foarte des ntlnit, utilizarea unor regiuni care nu sunt ptratice.
Aranjarea coeficienilor W pentru o mediere simpl conine valori de 1, iar astfel se poate nelege
c aceti coeficieni vor fi nmulii cu valorile pixelilor ce nconjoar pixelul central iar totalul
normat prin mprirea la suma coeficienilor. Valoarea obinut va fi scris n locul pixelului
central pentru a forma o nou imagine.
Deoarece spaiul pentru stocare nu este niciodat nelimitat putem memora noua imagine
obinut n locul celei originale. Totui, pentru a efectua calculul n continuare avem nevoie de
valorile originale ale pixelilor i nu de cele ce au fost calculate deja. Aceast problem se rezolv
prin meninerea unei copii a ctorva linii pe timpul desfurrii procesului.
Operaiile pe vecinti, incluznd i multiplicarea nucleului, sunt de obicei aplicate simetric
n jurul fiecrui pixel. Acest lucru creeaz o problem pentru pixelii din zona de margine a imaginii.
Pentru a rezolva aceast problem se folosesc diverse aproximri cum ar fi:
crearea de nuclee speciale asimetrice, sau
crearea de reguli de-a lungul liniilor sau n coluri presupunnd c :
- marginile imaginii sunt oglinzi i astfel fiecare linie de pixeli din interiorul imaginii este
dublat dincolo de aceasta, sau c
- marginile imaginii se unesc astfel nct marginea de jos cu cea de sus i cea din stnga cu
cea din dreapta s fie continue.
prelucrarea imaginii este restrns la acele poriuni unde nu apar probleme cu marginile
(aceast aproximare las linii cu pixeli neutilizai de-a lungul marginilor imaginii egale cu
jumtate din dimensiunea vecintii).
26
Nici una din aceste aproximri nu sunt perfecte i, n general, majoritatea operaiilor de
prelucrare a imaginilor sacrific civa pixeli situai la marginile imaginii.
Reducerea zgomotului este mai mare atunci cnd se folosete o vecintate mai larg, dar
aceasta este nsoit de o nceoare semnificativ a marginilor trsturilor (detaliilor) prezente n
imagine. Acest efect de nceoare se poate reduce folosind valori ale coeficienilor diferite de 1. De
exemplu valorile pentru o matrice 3X3 pot fi [ 1 2 1;2 4 2; 1 2 1], iar aceasta prezint alte
caracteristici mult mai atractive:
- n primul rnd coeficientul 4 situat n mijloc face ca pixelul central s domine operaia de mediere
reducnd astfel efectul de nceoare (blurring)
- valorile de 2 pentru cei patru vecini alturai ortogonali i valorile de 1 pentru cei patru vecini
alturai diagonali ne arat c de fapt cei patru pixeli diagonali sunt foarte ndeprtai de centrul
vecintii.
Filtrul Gaussian
Din analize a rezultat faptul c una dintre cele mai folositoare forme ale nucleului este cea
gaussian. Aceasta este un set de valori ntregi care aproximeaz profilul unei funcii gaussiene de-a
lungul oricrui rnd, coloan sau diagonal ce trece prin centrul vecintii.
Aceast form este caracterizat de o deviaie standard exprimat n termeni ce in de
dimensiunile pixelilor. Mrimea unui astfel de nucleu este destul de mare astfel nct, adugnd un
alt rnd de termeni, acetia s introduc valori neglijabile. n continuare vor fi prezentate cteva
astfel de nuclee, iar pentru fiecare dintre acetia este calculat i deviaia standard:
3x3=[1 4 1 ;4 12 4 ;1 4 1] , =0,391;
5x5=[1 2 3 2 1 ;2 7 11 7 2 ; 3 11 17 11 3 ;2 7 11 7 2 ; 1 2 3 2 1], =0,625;
9x9=[0 0 1 1 1 1 1 0 0 ;0 1 2 3 3 3 2 1 0 ;1 2 3 6 7 6 3 2 1 ;1 3 6 9 11 9 6 3 1 ;1 3 7 11 12 11 7
3 1 ;1 3 6 9 11 9 6 3 1 ;1 2 3 6 7 6 3 2 1 ;0 1 2 3 3 3 2 1 0 ;0 0 1 1 1 1 1 0 0], =1,0.
Pentru a se aproxima ct mai bine curba analitic neted a lui Gauss trebuie alese valori
ntregi, cel puin pentru nuclee (vecinti) mari. Totui, totalul coeficienilor trebuie pstrat ct mai
mic pentru a facilita calculele aritmetice ale calculatorului.
Desigur, mrimea nucleului crete odat cu deviaia standard. Aplicarea repetat a unui
nucleu mic sau aplicarea secvenial a dou sau mai multe nuclee este echivalent cu o singur
aplicare a unui nucleu mai mare (aplicnd coeficienii unui singur nucleu asupra altor coeficieni ai
altui nucleu ca i cum acetia ar fi valori ale unor pixeli i fcnd nsumarea i adugarea acestora
generm un nou nucleu de dimensiuni mai mari). De reinut este faptul c i atunci cnd se folosesc
nuclee de dimensiuni mai mari cuantizarea coeficienilor utiliznd valori ntregi produce anumite
distorsiuni.
Acest tip de mediere poate reduce zgomotul vizibil din imagine dar de asemenea nceoeaz
marginile, deplaseaz zonele marginale ale detaliilor i reduce contrastul. Poate introduce, de
asemenea, un artificiu numit adesea pseudorezoluie (sau aliasing) prin care dou structuri separate
ale imaginii fiind mediate mpreun se creeaz o legtur aparent ntre acestea.
2.Filtre de ordine
Utilizarea nucleelor pentru a media pixelii dintr-o vecintate este o operaie de convoluie ce
are un echivalent direct n domeniul frecvenelor. Este o operaie liniar prin care nu se pierde nici o
informaie din imaginea original. Sunt i alte tipuri de operaii de prelucrare ce se pot efectua n
domeniul spaial, cu ajutorul vecintilor i care ofer de asemenea reducerea zgomotelor.
Cea mai larg utilizat dintre aceste metode se bazeaz pe ordonarea pixelilor dintr-o
vecintate n funcie de strlucirea lor. Apoi, de exemplu, valoarea median din aceast list
ordonat poate fi folosit drept valoare a strlucirii pixelului central. Ca i n cazul operaiilor ce
27
utilizeaz nuclee aceast valoare median este folosit pentru a crea o nou imagine i se folosesc
numai valorile originale ale pixelilor n ordonarea vecintii din jurul fiecrui pixel.
Filtrul median
Tehnica medierii vecinilor are drept defect principal crearea efectului de estompare (flou) la
marginile obiectelor sau n punctele cu mare gradient de intensitate. Acest efect secundar este
puternic diminuat prin tehnica filtrrii mediene, care nlocuiete nivelul de gri al fiecrui pixel
printr-o combinaie a nivelelor de gri ale pixelilor vecini. Considernd o fereastr din imagine
coninnd N = 2p+1 pixeli, N impar, mai nti se ordoneaz valorile {g
i
} ale nivelelor de gri astfel
nct la sfrit s se obin g
1
g
2
g
N
. Apoi printr-o operaie liniar asupra acestei secvene
ordonate, se efectueaz urmtoarea sum:

i
N
i
i
g c g

=
=
1
'
(4.18)
care reprezint noua valoarea care va fi afectat pixelului central, unde c
i
sunt coeficieni constani
de ponderare. Filtrul median standard se obine dac se alege c
p+1
=1, iar toi ceilali coeficieni nuli.
Se poate nelege intuitiv c filtrul median foreaz pixelii de intensitate luminoas mare, n raport
cu cei din vecintatea lor, s fie netezii, adic s ia valori apropiate de ale acestota. Acest filtru este
un filtru trece jos care elimin zgomotul de tip ninsoare, dar care antreneaz o uoar pierdere de
rezoluie.
Filtrul median elimin foarte bine tipurile de zgomote sigure (cunoscute), de exemplu
zgomotul mpucat ( shot noise ) n care unii pixeli sunt afectai sau lipsesc din imagine. Dac un
pixel este schimbat accidental la o valoare extrem el va fi eliminat din imagine i nlocuit cu o
valoare rezonabil, valoarea median din vecintate. Un filtru median este capabil s elimine
zgomotul i s nlocuiasc pixelii afectai (necorespunztori) cu valori rezonabile avnd n acelai
timp o distorsiune i o degradare minim a imaginii.
Aplicaii ale filtrului median se pot folosi de asemenea pentru reducerea diferitelor tipuri de
zgomot aleator.

Fig. 4.5 Modele de vecinti folosite n filtrarea median
a) cei mai apropiai 4 vecini aflai n cruce; b) vecintate ptratic de 3x3 ce conine
nou pixeli;
c) regiune octogonal de 5x5 cu 21 de pixeli; d) vecintate ptratic de 5x5 cu 25 pixeli;
e) regiune octogonal de 7x7 ce conine 37 pixeli.

Efortul cerut calculatorului crete repede odat cu creterea numrului de valori ce trebuie
sortate chiar i atunci cnd se folosesc metode speciale care pstreaz separat pri din setul de
28
valori ordonate astfel nct atunci cnd vecintatea se mic de-a lungul imaginii s fie necesare
doar cteva comparaii suplimentare ale pixelilor.
Exist dou avantaje principale ale filtrului median n comparaie cu filtrul de mediere
aritmetic (cu multiplicare prin coeficieni):
- n primul rnd aceast metod nu introduce valori ale strlucirii deoarece valorile avute la
dispoziie sunt doar acele valori prezente n vecintate i nu o medie a acelor valori;
- n al doilea rnd filtrul median nu schimb valorile zonelor de margine aa cum filtrul de
mediere aritmetic o poate face n funcie de mrimea relativ a valorilor prezente n imagine.
Aceste valori fac ca filtrul median s fie preferat att pentru examinarea vizual ct i pentru
diferitele msurtori efectuate pe imagini.
Degradarea minim a marginilor n urma filtrrii mediane fac posibil aplicarea repetat a
acestei metode. Prin aplicarea repetat a acestui filtru detaliile fine prezente n imagine se terg iar
zone largi din imagine capt aceeai valoare a strlucirii. Totui, nu are loc o deplasare a
marginilor; acestea rmn la locul lor i sunt bine definite.

Filtrul median trunchiat
Valoarea cea mai convenabil care trebuie obinut la ieirea unui filtru este slab definit n
cazul vecintilor de dimensiuni mici. Aceast valoare se poate obine cu aproximaie folosind un
filtru median trunchiat. De exemplu prin ordonarea valorilor de strlucire ale unei vecinti ce se
afl n apropierea unei margini (dar nu se suprapune peste aceasta ) se va obine o distribuie
asimetric. n acest caz valoarea care trebuie obinut la ieirea filtrului coincide cu punctul ce are
cea mai nalt valoare a strlucirii. Aplicnd un filtru median convenional nu se va obine aceast
valoare datorit distribuiei asimetrice. Tehnica filtrului median trunchiat const n descrcarea
ctorva valori din vecintate astfel nct valoarea median a pixelilor rmai s se apropie de
valoarea dorit.
De exemplu pentru o vecintate de 3x3 prin aplicarea unui filtru median trunchiat se elimin
dou dintre valorile cele mai diferite de valoarea medie, dup care se ordoneaz cele apte valori
rmase i se extrage valoarea lor median. Prin aplicarea acestui filtru se obin margini mai stridente
i o imagine n care contrastul este ridicat.
Aplicnd acest filtru asupra unei vecinti ce are o distribuie simetric a valorilor nu vom
ntmpina dificulti deoarece valorile sunt descrcate de la ambele capete iar valoarea median nu
se schimb (ea deja coincide cu valoarea cea mai probabil).

Filtrul median hibrid
O alt modificare adus filtrului median este folosit pentru a nltura tendina acestuia de a
terge liniile ce sunt mai nguste dect jumtate din lrgimea vecintii i de a rotunji colurile.
Aa numitul filtru hibrid sau filtrul ce pstreaz marginile este o operaie de ordonare ce
cuprinde trei pai. Pixelii din vecintate sunt ordonai n dou grupuri diferite. Valorile mediane ale
vecinilor situai la 45
0
ce formeaz un x i a celor situai la 90
0
ce formeaz un + (amndou
grupuri incluznd pixelii central) sunt comparate cu valoarea pixelului central iar valoarea median
a acestui set format din trei pixeli este salvat ca valoare a pixelului.



Fig. 4.6. Diagrama pixelilor dintr-o vecintate
de 5x5 ce prezint grupurile folosite de filtrul
median hibrid
29
Aceast metod conserv liniile i colurile care sunt terse i rotunjite de filtrul median
convenional. Dac i acest filtru hibrid este aplicat de mai multe ori el poate reduce de asemenea
formarea unei imagini cu un contrast ridicat (posterization). Deoarece detaliile liniilor i colurilor
sunt conservate mai bine de filtrul median hibrid fa de filtrul media convenional formele
regiunilor nu sunt netezite la fel de mult, cu toate c valorile strlucirii sunt mai stridente i
contrastul este mai mare (sharpened and posterized ).
Faptul c filtrul median hibrid implic trei operaii de ordonare, prima dat n interiorul celor
dou grupuri de pixeli i apoi pentru a compara acele valori mediane obinute cu valoarea pixelului
central, nu sunt introduse penaliti mari asupra vitezei de efectuare a calculelor. Fiecare operaie
de ordonare se face pentru un numr de valori mai mic dect n cazul vecintilor ptrate sau
octogonale de aceeai mrime. De exemplu vecintatea cu o lrgime de 5 pixeli conine 25 de pixeli
dac este ptrat sau 21 dac are o form octogonal care trebuie ordonai n metoda clasic. n
metoda hibrid, fiecare din cele dou grupuri conin doar 9 pixeli iar comparaia final implic doar
3 valori. Deci metoda hibrid este cel puin la fel de rapid ca cea convenional.

Filtre extreme
Exist i alte metode ce pot produce acest efect. Una dintre acestea, ce ine de metoda
median, este filtrul extrem (extremum filter) care nlocuiete fiecare pixel cu valoarea maxim
din vecintate sau cu cea minim, n funcie de apropierea acesteia de valoare medie. Acest filtru nu
conserv marginile i nu poate schimba zonele de margine.

3.Filtrul binar

Un caz important, care apare n sistemele de vedere artificial este acela n care imaginea
folosete pentru fiecare pixel F(i,j) un singur bit (imagine binarizat). Pentru eliminarea zgomotului
de tip sare i piper ( 1 ntre 0- uri i 0 ntre 1- uri ) se pot folosi filtre locale bazate pe
funcii logice. Astfel dac notm fereastra :

F( i-1 , j-1 ) F( i-1 , j ) F( i-1 , j+1 )

a
1
a
2
a
3

F( i , j-1 ) F( i , j ) F( i , j+1 ) = b
1
b
2
b
3
(4.19)
F( i+1 , j-1 ) F( i+1 , j ) F( i+1 , j+1 ) c
1
c
2
c
3

i punctul central b
2
este nlocuit cu b
2

, avnd expresia:
( ) | | ( )
3 2 1 3 1 3 2 1 2 3 2 1 3 1 3 2 1 2
'
2
c c c b b a a a b c c c b b a a a b b U U U U U U U U I I I I I I I I U = (4.20)
Un filtru de acest tip permite eliminarea unui punct negru singular sau a unui punct alb
singular. Orice alt configuraie de puncte albe sau negre din vecintate las neschimbat punctul
central.
1 1 1 1 1 1 0 0 0 0 0 0
1 0 1 1 1 1 sau 0 1 0 0 0 0
1 1 1 1 1 1 0 0 0 0 0 0

4. Alte tipuri de filtre

Filtrul olimpic
O modificare adus simplei medieri aritmetice a valorilor dintr-o vecintate care ncearc s
achiziioneze i cteva dintre avantajele unui filtru median este aa numitul filtru olimpic.
Denumirea filtrului provine de la modul de stabilire a scorului n unele ntreceri ce se desfoar n
cadrul Jocurilor Olimpice, n care cel mai mare i cel mai mic scor nu sunt luate n calcul iar
celorlalte li se face o medie aritmetic. Acelai lucru se face i cu valorilor pixelilor dintr-o
vecintate. Nelund n considerare valorile extreme zgomotul mpucat (shot noise) este eliminat.
Apoi media celorlalte valori ale pixelilor este folosit ca o nou valoare de strlucire.
FB FB
30
Aceast metod este n general inferioar celorlalte metode discutate anterior i nu este
folosit foarte des deoarece prezint urmtoarele dezavantaje:
- nceoarea imaginii ;
- nu este uor de adaptat la valorile ce in cont de poziia pixelilor din imagine ;
- necesit att o mediere aritmetic a valorilor strlucirii pixelilor din vecintate ct i o
ordonare a acestora.

Filtre adaptive
Exist i alte combinaii de operaii mai complexe ce se folosesc pentru anumite tipuri
specifice de imagini. De exemplu n imaginile ce conin zgomot ptat (speckle noise) ce variaz
ntr-un mod cunoscut odat cu strlucirea imaginii, pentru a elimina zgomotul strlucirea fiecrui
pixel este comparat cu media aritmetic a valorilor din vecintate. Dac aceast valoare a
strlucirii depete media vecintii cu o valoare calculat din aceast medie i o valoare standard
atunci ea este nlocuit cu o valoare mai apropiat de cea medie.
Utiliznd coeficieni determinai experimental aceast metod ofer o mbuntire a
raportului semnal/zgomot n comparaie cu un filtru median simplu. Acesta este un exemplu al unei
metode aleatoare bazat pe cunoaterea caracteristicilor semnalului i zgomotului pentru o situaie
particular. n general, orice metod de filtrare care alege dintre civa algoritmi sau care i
modific algoritmul n funcie de coninutul actual al imaginii sau vecintii este denumit filtru
adaptiv.

Filtrul Top Hat / Rolling Ball
O alt metod folosit pentru identificarea i eliminarea zgomotului din imagini este tehnica
Top Hat sau Rolling Ball. Considernd valorile strlucirii pixelilor ca o ridicare a suprafeei
imaginii, atunci un filtru Top Hat este alctuit dintr-un disc plat ce este aezat pe aceast
suprafa i o coroan central de diametru mai mic.


Acest filtru este centrat pe fiecare pixel din imagine. Orice pixel care iese din coroan este
considerat zgomot i este nlocuit. Valoarea cu care se face nlocuirea poate fi ori valoarea median
ori valoarea medie a pixelilor acoperii de disc.
Dac se inverseaz sensul valorilor strlucirii i pixelii cei mai ntunecai sunt inta filtrului
atunci acesta este denumit filtru Rollig Ball. Acesta este simbolizat de o sfer ce se rostogolete
pe suprafa i care nu va putea atinge partea de jos a gropilor ce reprezint pixelul ntunecat de
zgomot.
Filtrul de ordonare este aplicat de dou ori asupra imaginii, folosind vecinti diferite
(corespunztor diametrului discului i a coroanei ). Imaginile rezultate sunt extrase (sczute), iar
imaginea ce rmne este prguit ( tresholded ) pentru a selecta pixelii ce prezint o diferen mai
mare dect nlimea coroanei. Acei pixeli care depesc aceast valoare pot fi nlocuii cu valoarea
dorit. n afar de nlocuirea punctelor extreme considerate zgomote, aceast operaie mai poate fi
folosit pentru a gsi acele puncte care sunt mai mici dect coroana plriei i mai strlucitoare, sau
mai ntunecate, dect restul vecintii. n acest caz, punctele care nu ptrund n coroan sunt
suprimate i celelalte pstrate.
Fig. 4.7. Vedere
tridimensional a
filtrului Top-Hat
31

4.5.3 Concluzii privind utilizarea diferitelor tipuri de filtre

Alegerea diferitelor tipuri de filtre utilizate n eliminarea (rejecia) zgomotului prezent n
imagini se face innd seama de caracteristicile imaginii i de modelul de zgomot prezent n aceasta.
Fiecare filtru prezint avantaje i dezavantaje, elimin mai bine sau mai puin bine diferite tipuri de
zgomote.
Medierea aritmetic poate reduce zgomotul vizibil din imagine dar, de asemenea, duce la
nceoarea marginilor, neclaritatea contururilor, deplasarea zonelor marginale ale detaliilor i
reducerea contrastului. Poate introduce, de asemenea, pseudo-rezoluia, fenomen prin care ntre
dou structuri separate din imagine, fiind mediate mpreun, se creeaz o legtur aparent.
Prin aplicarea unui filtru de mediere aritmetic se obine o mbuntire a calitii imaginii i a
raportului semnal/zgomot n cazul zgomotului aleatoriu. Reducerea zgomotului este mai mare
atunci cnd se folosete o vecintate mai larg dar aceasta este nsoit de o nceoare semnificativ
a marginilor trsturilor (detaliilor) prezente n imagine (acest efect secundar se reduce folosind
coeficieni care s mreasc nsemntatea pixelului central). n fiecare caz este necesar s se
gseasc dimensiunea optim a ferestrei care s elimine zgomotul fr a pierde detalii importante
sau contururi. De regul dimensiunea ferestrei este 3x3.
Prin aplicarea unui filtru median se elimin foarte bine tipurile de zgomote sigure, cunoscute
(de exemplu zgomotul mpucat n care unii pixeli sunt afectai sau lipsesc din imagine) crend o
distorsiune i o degradare minim a imaginii.
Filtrul median prezint dou avantaje semnificative fa de medierea aritmetic:
- nu introduce valori noi de strlucire deoarece valorile avute la dispoziie sunt doar acele
valori prezente n imagine i nu o medie a lor;
- nu schimb poziia zonelor din imagine.
Filtrul median este preferat att pentru msurtori ct i pentru examinarea vizual a imaginii.
Efortul calculatorului (timpul necesar efecturii calculelor) crete rapid odat cu creterea
numrului de valori ce trebuie sortate.
Acest tip de filtru are tendina de a terge liniile ce sunt mai nguste dect jumtate din
limea vecintii i de a rotunji colurile. Din acest motiv a aprut o mbuntire a acestui filtru
median numit filtru median hibrid. Filtrul median hibrid conserv liniile i colurile care sunt terse
i rotunjite de filtrul median convenional ns acesta nu netezete la fel de mult zonele din imagine.
Mrirea contrastului i reducerea numrului nivelelor de gri, astfel nct imaginea s devin
uniform i marginile mai evidente, sunt efecte colaterale ale filtrrii mediene.

5. Operaii de mbuntire a imaginilor n domeniul spaial

Prin prelucrarea imaginii se urmrete transformarea ei ntr-o alt imagine mbuntit sau
extragerea unor informaii referitoare la coluri, contururi, compoziie, care s conduc utilizatorul
la o interpretare potrivit scopului propus. Metodele de mbuntire nu mresc coninutul de
informaie, dar mresc gama dinamic a caracteristicilor alese pentru a putea fi mai uor analizate
de om sau main.
Pentru simplificarea calculelor se pornete de la ipoteza c pe durata prelucrrii imaginea este
staionar. Datorit reprezentrii bidimensionale prelucrarea imaginii se face prin metode specifice,
n domeniu spaial sau n domeniul frecven. Lucrul n domeniul spaial presupune efectuarea de
calcule direct asupra valorii pixelilor, iar n domeniul frecven se apeleaz n special la
transformata Fourier.
Din punct de vedere al efortului de calcul care trebuie depus, n prelucrarea imaginilor este
nevoie de calculatoare performante, deoarece volumul de date este foarte mare, iar durata de
32
prelucrare este limitat de cerinele aplicaiilor. Corespunztor complexitii, succesiunii i scopului
propus prelucrarea imaginii poate avea trei etape:
prelucrarea de nivel sczut (sau prelucrarea primar);
prelucrarea de nivel mediu;
prelucrarea de nivel nalt.
Prelucrarea primar are drept scop prelucrarea imaginii ntr-o alt imagine, mbuntit, prin
reducerea zgomotului, ntrirea contrastului sau evidenierea contururilor obiectelor.
Prelucrarea de nivel mediu are drept scop condensarea informaiei coninute n imagine prin
codificare sau prin selectarea unor informaii de interes(extragerea trsturilor).
Prelucrarea de nivel nalt se refer la interpretarea informaiei din imagine, n special prin
recunoaterea unor obiecte din scena analizat.
Prelucrarea primar se realizeaz prin operaii efectuate asupra unei imagini sau mai multor
imagini, iar rezultatul operaiei este tot o imagine de aceiai dimensiune ca prima. Dificultatea
const n cuantificarea criteriilor de mbuntire i n alegerea acestora, iar datorit acestui lucru
exist o mulime de tehnici empirice, majoritatea interactive, pe baza crora se determin
modalitatea de mbuntire a imaginii. Se poate realiza o clasificare a acestor operaii n funcie de
mai multe criterii, astfel:
* Dup numrul de operanzi implicai, operaiile pot fi cu un operand (translaia imaginii,
modificarea contrastului) sau cu mai muli operanzi (adunarea/scderea a dou imagini).
* Dup zona de operare, operaiile pot fi:
a) operaii punctuale, pentru care valoarea funciei nivel de gri obinut ca rezultat, ntr-un
punct (i,j) depinde de valoarea funciei nivel de gri corespunztoare operandului n acelai punct
(fig. 5.1). Principalele tipuri de operaii punctuale sunt legate de transformri de intensitate:
accentuarea de contrast, limitarea i binarizarea, inversarea, etc.

Fig. 5.1 Operaii punctuale

b) operaii de tip fereastr, pentru care valoarea funciei nivel de gri obinut ca rezultat ntr-un
punct (i,j), depinde de valorile funciilor nivel de gri corespunztoare operandului dintr-o
vecintate V
ij
a punctului considerat (fig. 5.2). Principalele tipuri de operaii de tip fereastr sunt:
compresia de imagini, adunarea/scderea imaginilor, modelarea prin histograme, etc.


Fig. 5.2 Operaii de tip fereastr

c) operaii spaiale pentru care valoarea funciei nivel de gri obinut ca rezultat, ntr-un punct
(i,j), depinde de toate valorile funciei nivel de gri corespunztoare operandului (fig. 5.3).
33
Principalele tipuri de operaii spaiale: filtrare spaial, inversare de contrast, mrirea i
interpolarea imaginilor, etc.

Fig. 3.3 Operaii spaiale


d) operaii geometrice, pentru care valoarea funciei nivel de gri obinut ca rezultat ntr-un
punct (m,n), depinde de valoarea funciei nivel de gri corespunztoare operandului n alt punct,
(i,j) (fig.5.4).

Fig. 5.4 Operaii geometrice

e) pseudocolorarea i colorarea fals, sunt operaii care se refer la imagini color. Ele sunt
tehnici de mbuntire a vizibilitii anumitor componente ale imaginii sau a imaginii n
ansamblul ei, prin modificarea paletei de culoare cu care este afiat imaginea. Punctul de plecare
n aceste analize l constituie faptul c ochiul uman poate distinge cu uurin cteva mii de culori,
dar numai cteva zeci de nuane de gri (de aceea numrul maxim de nuane de gri este 256).
n cazul dispozitivelor de prelucrare primar a imaginilor att mrimea de intrare ct i
mrimea de ieire reprezint imagini. Calitatea prelucrrii imaginii este apreciat prin intermediul a
dou caracteristici importante: fidelitatea i inteligibilitatea.
Fidelitatea imaginii prelucrate caracterizeaz ct de mult o imagine prelucrat coincide cu o
anumit imagine standard dat, n timp ce inteligibilitatea imaginii prelucrate denot ce informaie
util poate fi extras din acea imagine.
Deoarece n aprecierea inteligibilitii imaginii sunt implicai muli factori subiectivi, aceasta
este foarte greu de formalizat. n schimb, fidelitatea poate fi caracterizat prin mai multe moduri:
abaterea maxim absolut, suma erorilor absolute, eroarea medie ptratic de pixel i eroarea
ptratic medie de nivel.

5.1.Operaii punctuale
Operaiile punctuale sunt aa numitele operaii cu memorie zero la care un anumit nivel de
gri ] , [ L o u trece n alt nivel de gri ] , [ L o v , n conformitate cu o funcie v=f(n). Acestea
reprezint cele mai simple metode de mbuntire a imaginii deoarece se opereaz asupra
intensitii unui singur punct.
5.1.1. Modificarea de contrast

34
Modificarea de contrast este necesar mai ales n cazul imaginilor cu contrast mic, un efect
destul de des ntlnit n imaginile fotografice sau electronice. Contrastul imaginii poate fi mrit prin
rescalarea amplitudinii fiecrui pixel. Funcia matematic utilizat este:

= +
= +
=
=

tg p L u b v b u p
tg n b u a v b u n
tg m a u mu
v
b
a
, , ) (
, , ) (
, 0 ,
(5.1)
Parametrii a i b se obin n urma examinrii histogramei, iar m, n i p determin gradul de
accentuare a contrastului, dup cum se vede n figura 5.5:


Fig.5.5 Accentuarea de contrast
m<1, pentru regiuni ntunecate i a=L/3;
n>1 pentru regiunea medie de gri i b=2L/3;
p<1, pentru regiunile luminoase.

Fig. 5.6 Exemplu de accentuare de contrast

n figura 5.6 se poate vedea rezultatul accenturii de contrast. n stnga este imaginea
original, iar n dreapta imaginea mbuntait prin accentuarea contrastului.
5.1.2. Limitarea i binarizarea imaginilor

Limitarea este un caz particular de accentuare n care m=p=0 i datorit acestui lucru ecuaia
5.1 devine :




=
L u b L
b u a nu
a u
n f
,
,
0 , 0
) (
. (5.2)

35

Fig. 5.7 Limitarea imaginilor

Metoda se folosete mai ales la atenuarea zgomotului, cnd se tie c acesta se gsete n
intervalul [a,b].(fig. 5.7).
Binarizarea reprezint un caz particular al limitrii, atunci cnd a=b=t, rezultnd o imagine
de ieire binar. De exemplu, o pagin tiprit nu d prin scanare o imagine binar, (datorit
zgomotului senzorului i variaiilor de iluminare) dar prin aplicarea acestei metode se realizeaz
binarizarea ei.

Fig. 5.8 Efectul binarizrii imaginilor

5.1.3. Inversarea (negativarea ) imaginilor

Operaia de inversare sau negativare a imaginilor este folosit n redarea imaginilor medicale,
sau la realizarea de imagini negative digitale. Tansformarea se face conform relaiei: v=L-u (5.3)
Relaia dintre cele dou imagini este prezentat n figura 3.9

Fig.5.9 Negativare de imagini

5.2. Operaii de tip fereastr

36
Dac se folosete una din relaiile


=
rest in 0,
b u a L,
v sau


=
rest in u,
b u a L,
v (5.4)
se obin reprezentri de tip fereastr. Acestea sunt utile atunci cnd diferite caracteristici ale
imaginii sunt coninute n regiuni cu niveluri de gri diferite.
5.2.1. Extragerea unui bit
Presupunem c fiecare pixel din imagine este cuantizat cu B bii. Se dorete extragerea bitului
de rang n. Funcia corespunztoare imaginii digitale se poate scrie sub forma:

B B
B B
k k k k u + + + + =


2 ... 2 2
1
2
2
1
1
(5.5)
Iar imaginea de ieire va fi:

=
=
rest in 0,
1 k daca L,
v
n
(5.6)
Prelucrarea este folositoare pentru determinarea biilor nesemnificativi din punct de vedere
vizual dintr-o imagine. n general, se poate spune c doar primii 6 bii au semnificaie din punct de
vedere vizual, contribuia celorlali fiind legat mai mult de redarea detaliilor fine din imagine, fr
s ofere informaii asupra structurii acesteia.

5.2.2. Compresia de contrast
Compresia de contrast este utilizat n cazul n care dinamica datelor din imagine este foarte
larg, ceea ce face ca anumite pri din imagine s fie mai puin vizibile pe ecran (de exemplu,
afiarea spectrului la o transformat Fourier). Un mod efectiv de a realiza compresia, este s se
utilizeze o caracteristic logaritmic pentru variaia intensitii:
) 1 log( u v + = , (5.7)
unde c este o constant.
Aceast transformare accentueaz mai puternic componentele cu valori mai mici i
compreseaz componentele cu valori mai mari. n alte cazuri poate fi necesar s se accentueze
componentele cu amplitudini mai mari, folosindu-se atunci expresia:

1
1

=
c
n
e
e
c v
.
(5.8)

5.2.3. Scderea imaginilor
Scderea imaginilor este cu precdere utilizat pentru a compara cu uurin dou imagini
complicate, cu multe elemente dar existnd diferene relativ mici ntre ele. Imaginea diferen poate
fi supus apoi procesului de imbuntire.
Scderea imaginilor este o operaiune care are numeroase utilizri n practic. Este folosit n
medicin, la analiza strii venelor i arterelor (se injecteaz n snge o substan mai puin
transparent la radiaii i se fac investigaii cu raze x nainte i dup injectare), dar i n sistemele de
monitorizare i supraveghere a unor incinte.

5.2.4 Modelarea imaginilor prin histograme
Prelucrarea histogramei reprezint o alt tehnic puternic de mbuntire a imaginii.
Histograma unei imagini digitale cu L niveluri de gri, arat frecvena de apariie a acestor niveluri i
37
este redat de o funcie discret p
k
=n
k
/n, unde n
k
este numrul de pixeli care au nivelul de gri k, din
numrul total de pixeli n.

Fig. 5.10 Histograme corespunztoare diferitelor tipuri de imagini

O imagine poate avea patru tipuri specifice de variaie a histogramei, dup cum este ilustrat n
figura 5.10. n figura 5.10 a) toate componentele histogramei sunt concentrate spre zona ntunecat,
ceea ce corespunde unei imagini ntunecate, n timp ce histograma din figura 5.10 b), arat situaia
opus, o imagine prea luminoas. Dac gama dinamic a senzorului este mic, atunci se obine o
histogram ngust, cu un contrast slab, ca n figura 5.10 c), iar opusul ei apare n urmtoarea figur.
Tehnica de mbuntire a imaginii prin modelarea acesteia const n modificarea formei
acesteia. Cel mai adesea se asigur o variaie uniform (egalizarea histogramei), dar n unele
aplicaii curba respectiv poate avea i alt lege de variaie.
Egalizarea histogramei. La analiza egalizrii histogramei, n prima etap se presupune c
variabila r, care reprezint nivelul de gri din imagine, variaz continuu n intervalul [0,1]. Deci
trebuie gsit o funcie (transformare) s care s realizeze transformarea valorii r a fiecrui pixel
ntr-un nivel dorit: s=T(r),unde transformarea trebuie s ndeplineasc urmtoarele condiii:
- s creasc monoton i s fie biunivoc n intervalul [0,1];
- 0T(r)1, pentru 0r1.
De asemenea, i transformata invers r=T
-1
(s), s[0,1], trebuie s satisfac aceleai restricii.
Nivelurile de gri pot fi privite ca realizri ale unei variabile aleatoare continue, ele putnd fi
caracterizate de o funcie a densitii de probabilitate p
1
(r) i p
2
(s). Din teoria probabilitiilor
rezult c dac p
1
(s) i T(r) sunt cunoscute, iar T
-1
(s) satisface prima condiie, atunci funcia
densitii de probabilitate p
2
(s) este dat de expresia:

(

=
ds
dr
r p s p ) ( ) (
1 2
, (5.9)
unde r=T
-1
(s). n particular, fie:

= =
r
d p r T s
0
1
) ( ) ( , (5.10)
astfel nct: ) (
1
r p
dr
ds
= , rezulti: ] 1 , 0 [ , 1
) (
1
) ( ) (
1
1 2
= = r
r p
r p s p .
(5.11)
Aceasta este o distribuie uniform n intervalul de definiie a variabilei transformate s. Acest
rezultat este indiferent de funcia de transformare invers, care este important deoarece obinerea
38
analitic a lui T
-1
(s) nu este totdeauna o metod uoar. Aducerea la o variaie uniform implic
pentru imagine o cretere a gamei dinamice a valorii pixelilor cu efecte importante n claritatea
imaginii.

Fig. 5.11. mbuntirea imaginii prin egalizarea histogramei

n cadrul aplicaiilor pentru imagini digitale trebuie realizat trecerea la forma discret:

1, - L 0,1,..., k ], 1 , 0 [ r , ) (
k
= =
n
n
r p
k
k
(5.12)
unde k reprezint numrul nivelurilor de gri, p(r
k
) este probabilitatea nivelului de gri k, n
k
arat de
cte ori apare acest nivel de gri n numrul total n al pixelilor din imagine.
Tot sub form discret se poate scrie transformarea direct:


= =
= = = =
k
i
i
k
j
j
k k
r p
n
n
r T s
0
k
0
1, - L 0,1,..., k ], 1 , 0 [ r ), ( ) (
(5.13)
iar transformarea invers este: r
k
=T
-1
(s
k
), s
k
[0,1].
Modificarea histogramei. Aceasta reprezint o generalizare a procedurii anterioare. Nivelul
de gri de la intrare u este transformat, la nceput neliniar de f(n), iar ieirea este cuantizat uniform.
La egalizarea histogramei, funcia:

=
=
u
x
i
i
x p u f
0
) ( ) (

(5.14)
conduce la o compresie a variabilei de intrare. Exist i alte reprezentri ale funciei f(n) care au
comportri similare:
,
) (
) (
) (
1
0
/ 1
0

=
=
=
L
i
i
x
x
i
n
u
x
i
x p
x p
u f
sau
2,3 n 0, u ) (
/ 1
= =
n
u u f
sau
0. u ), 1 log( ) ( + = u u f
(5.15)
Aceste funcii sunt similare cu funciile de comprimare utilizate la comprimarea informaiilor.
Cu toate c metoda prelucrrii histogramei este destul de des folosit, ea nu conduce la
aplicaii interactive de mbuntire a imaginilor. Uneori este de dorit s se realizeze o form
special a histogramei. Presupunnd p
1
(r) i p
3
(z) ca fiind funciile densitii de probabilitate
original i dorit, se folosete transformarea:
39

= =
r
d p r T s
0
1
) ( ) (
(5.16)
Dac imaginea dorit a fost disponibil, nivelurile ei de gri trebuie egalizate prin
transformarea:

= =
z
d p z G V
0
3
) ( ) (
(5.17)
Procesul invers z=G
-1
(v) ar putea reda nivelurile z ale imaginii dorite. Formularea este
ipotetic pentru c nivelurile lui z erau deja alese. Cu toate acestea, p(s) i p(v) ar putea fi densiti
uniforme, pentru c rezultatul final este independent de densitatea din interiorul integralei. Astfel,
dac n loc de a folosi v n procedura invers se folosesc nivelurile uniforme s obinute din imaginea
original, nivelurile care rezult z=G
-1
(s) ar putea avea funcia densitate de probabilitate dorit.
n acest caz principalele etape de lucru vor fi:
1.egalizarea nivelelor din imaginiea original;
2.specificarea funciei densitate de probabilitate i obinerea funciei de transformare G(z);
3.aplicarea transformatei inverse z=G(v) la nivelele de la etapa 1.
Aceast prelucrare conduce la o versiune de prelucrare a imaginii originale cu noi nivele de gri,
caracterizate prin uncia de densitate specificat p
3
(y).
5.3. Operaii spaiale

Spre deosebire de operaiile punctuale, cele spaiale se realizeaz asupra pixelilor din
imaginea iniial, dar i asupra pixelilor din imediata lor vecintate. Aceste operaii sunt cele mai
utilizate n prelucrarea primar a imaginilor numerice, n special pentru reducerea zgomotului i
pentru extragerea liniilor de contur.
n unele aplicaii ale vederii artificiale, cum ar fi interpretarea imaginilor luate din satelit,
problema reducerii zgomotului este destul de dificil, iar n alte aplicaii, cum sunt cele industriale
sau de laborator, aceast problem nu pare prea acut. Totui, i n aceast situaie, imaginea poate
fi perturbat uneori de zgomotul provenit de la senzorii vizuali sau de la unele impuriti depuse pe
obiectele de lucru. Frecvent acest zgomot este de tip sare i piper dnd schimbri de tip impuls n
nivelul de gri.
Una din metodele principale de procesare se bazeaz pe filtre (mti sau abloane). De cele
mai multe ori masca este o reea bidimensional nn, n care influena fiecrui pixel este ponderat
dup anumite reguli. Tehnica bazat pe aceast metod se numete filtrare. Nivelul de gri al
pixelului central este evaluat prin nsumarea ponderat a nivelului fiecrui pixel din matrice.
Aceasta poate avea diferite dimensiuni, iar pentru cazul n care n este egal cu 3 calculul se
realizeaz conform relaiei :

=
=
9
1 i
i i
y w r
(5.18)
n continuare, masca este mutat la pixelul vecin i procedura se repet pn ce sunt acoperii
toi pixelii din imagine.
5.3.1. Filtrarea spaial
mbuntirea calitii imaginii cere, n principal, ndeplinirea urmtoarelor condiii:
eliminarea zgomotului prin netezirea tranziiilor de tip impuls n nivelul de gri;
pstrarea contururilor, care apar ca tranziii de tip treapt n nivelul de gri;
rapiditate n efectuarea operaiunilor.
40
Deoarece filtrarea numeric global nu ndeplinete cerina a doua, se adopt metode
numerice locale de reducere a zgomotului. Aceste metode sunt i mai uor de implementat hardware
(echipamente specializate funcionnd n timp real) sau software.
Una dintre primele operaii care trebuie efectuate asupra unei imagini achiziionate este
netezirea.Obiectivul acesteia l reprezint eliminarea zgomotului sau a fluctuaiilor minore ale
intensitii n imagine. Uneori, netezirea urmrete i eliminarea unor structuri reale de dimensiuni
mai mici dect o limit specificat, n scopul analizei sau compresiei de imagine. O problem
comun tuturor operatorilor de netezire este efectul lor de estompare a contururilor i eliminarea
unor detalii ce pot conine detalii utile. n general, proiectarea operatorilor de netezire urmrete
obinerea unui compromis ct mai bun ntre gradul de suprimare al zgomotului i pstrarea
contururilor i a detaliilor fine.
5.3.1.1. Filtre de netezire
Filtrele de netezire se utilizeaz pentru estomparea i reducerea zgomotului. Estomparea se
folosete n etapa de preprocesare pentru a terge mici detalii dintr-o imagine, n special din
obiectele mari, i de a face mici conexiuni peste goluri, n linii drepte sau curbe. Pentru netezire se
pot folosi filtre liniare de tip trece jos sau neliniare de tip median.
1. Filtre spaiale de tip trece jos
Forma rspunsului n impuls (n domeniul frecven) necesar pentru a implementa un filtru
spaial de tip trece jos este ilustrat n figura 5.12 i se observ c toi coeficienii trebuie s fie
pozitivi. Cel mai simplu aranjament pentru coeficienii mtii ar fi ca valorile coeficienilor s fie
egale cu unitatea. Se introduce i un coeficient de pondere egal cu numrul de coeficieni (1/9 n
canalul mtii 3x3). Nucleul de filtrare liniar de netezire trebuie s satisfac relaia de normare:

=
V l k
l k h
) , (
1 ) , (

(5.19)

Fig.5.12 Rspunsul n domeniul frecven al FTJ

Filtrul trece jos este un filtru bazat pe valoarea medie, deoarece el nlocuiete valoarea
nivelului de gri n punctul (i, j) f(i, j), cu valoarea medie a sa pe vecintatea [(2h + 1) (2h
+ 1)] a lui (i, j) g(i, j):


= =
+ +
+
=
h
h m
h
h n
n j m i f
h
j i g ) , (
) 1 2 (
1
) , (
2
(5.19)
i = h, h + 1, , n
1
1 h ; j = h, h + 1, , n
2
1 h.
Relaia de mai sus se poate scrie ca produs de convoluie a dou matrice, [F
ij
] i [H]:
G(i, j) = [F
ij
]*[H], (5.20)
Unde

| |
) 1 2 ( ) 1 2 (
) , ( )... , (
.. .......... .......... .......... ..........
) , ( )... , (
= +
(
(
(

+ + =
+
=
h x h
ij
h j h i F h j h i F
h j h i F h j h i F
F

41

| |
) 1 2 ( ) 1 2 (
2
1 ... 1 1
... ... ... ...
1 ... 1 1
1 ... 1 1
) 1 2 (
1
+ +
(
(
(
(

+
=
h x h
h
H


Fig. 5.13 Filtrare de tip trece jos

Deoarece o cretere a ferestrei de mediere conduce la apariia neclaritilor, de cele mai multe
ori se prefer dimensiunea ferestrei 3x3, adic h=1. n acest caz, [H] devine:
| |
(
(
(

=
1 1 1
1 1 1
1 1 1
9
1
1
H
.n mod asemntor pot fi considerate medieri ponderate, lund de
exemplu:
| | | |
(
(
(

=
(
(
(

=
1 2 1
2 4 2
1 2 1
16
1
,
1 1 1
1 2 1
1 1 1
10
1
3 2
H H

Creterea dimensiunii ferestrei are un dublu efect: reduce zgomotul i face contururile mai
slabe, neclare, deci scade informaia coninut n imagine (produce o defocalizare). Aceasta
conduce la necesitatea determinrii unei ferestre corespunztoare pentru fiecare aplicaie.
2. Filtrul median
Una din principalele dificulti la metoda netezirii o constituie faptul c muchiile i zonele
bine conturate devin mai estompate, mai neclare (similar unei defocalizri). Dac obiectivul
mbuntirii imaginii este n principal reducerea zgomotului i mai puin estomparea detaliilor, se
poate folosi filtrul median. La acesta nivelul de gri se nlocuiete cu mediana nivelurilor de gri a
pixelilor vecini i nu se determin valoarea medie ca n cazul precedent. Acest tip de filtru este
neliniar i se recomand pentru conservarea detaliilor fine n cazul imaginilor cu zgomot puternic,
cu componente cu band larg de frecven.
Referitor la filtrul median monodimensional se cunosc urmtoarele proprieti:
- secvena de date monoton este invariant la trecerea printr-un filtru median; astfel spus, dac
{x(n)} este o secven monoton i n
c
este centrul filtrului median de dimensiune 2h+1, rezult c
ieirea filtrului este egal cu {x(n
c
)};
- deoarece o secven de date de tip treapt constituie o secven monoton, rezult c este
invariant la trecerea prin filtrul median.
O secven {x(n)} se numete m-local monoton dac secvena {x(n), x(n+1), , x(n + m
n)} este monoton pentru fiecare n. Secvena m-local monoton, care nu e monoton pe tot
domeniul, trebuie s rmn constant pe cel puin (m 1) termeni consecutivi. O secven m-local
monoton {x(n)} este invariant la trecerea prin filtrul median de fereastr 2h+1, oricare ar fi
m>2h+1. Ca o consecin a celor de mai sus rezult c filtrul median elimin impulsurile (zgomot)
i conserv zonele monotone sau constante mai mari dect fereastra.
Observaiile fcute pentru cazul filtrului median monodimensional rmn valabile i n cazul
bidimensional, cu specificarea c monotonicitatea se consider n vecinti simetrice. Se obin
42
rezultate asemntoare, i anume: filtrul median bidimensional pstreaz liniile de contur i zonele
constante mai mari dect fereastra i elimin zgomotele de tip impuls.
Uneori, pentru simplificare, se poate face o filtrare pseudomedian. De exemplu, pentru o
fereastr de filtrare 3x3, centrat n (i, j), se consider mediana pe fiecare linie:
h
1
(i, j) = M
e
{F(i 1, j 1), F(i 1, j), F(i 1, j + 1)}
h
2
(i, j) = M
e
{F(i, j 1), F(i, j), F(i, j + 1)}
h
3
(i, j) = M
e
{F(i + 1, j 1), F(i + 1, j), F(i + 1, j + 1)}
iar apoi se nlocuiete F(i, j) cu:
G(i, j) = M
e
{h
1
(i, j), h
2
(i, j), h
3
(i, j)}. (5.21)
Mediana m a unui set de valori este numrul pentru care jumtate din valori sunt mai mici
dect m, iar celelalte sunt mai mari. Pentru a efectua o filtrare median, se sorteaz valorile pixelilor
vecini, se determin mediana i cu ea se nlocuiete valoarea pixelului central. Pentru o fereastr
3x3, mediana este a cincia valoare n ordine cresctoare, n cazul 5x5, aceasta este a 13-a, .a.m.d.
n general, numrul de vecini pe o linie, n, se alege impar. Dac n este par, atunci valoarea medianei
se alege prin medierea aritmetic a celor dou valori centrale.
Filtrul median are urmtoarele proprieti:
- este neliniar pentru dou secvene x(m) i y(m): median(x(m)+y(m)) median(x(m)) +
median(y(m));
- se folosete pentru tergerea liniilor sau pixelilor izolai (n general pentru zgomot de tip sare
i piper), conservnd rezoluia spaial; n figura 5.14 sunt prezentate comparativ imaginile:
original, cu zgomot, filtrat cu filtru trece jos i filtrat cu filtru median;
-performanele sunt slabe dac numrul pixelilor de zgomot din fereastr este mai mare dect
jumtate din numrul de pixeli ai ferestrei;
- pentru n impar, sunt necesare 30(n
2
1)/8 comparaii, de exemplu pentru n=3 (masca 3x3)
numrul de comparaii de efectuat pentru evaluarea unui pixel din imagine este 30, pentru n=5
rezult 90 de comparaii;
- dac dup o rulare se constat c filtrarea este insuficient atunci se poate filtra nc o dat sau
de mai multe ori, fr a afecta n ru coninutul imaginii; dac se utilizeaz acelai procedeu i la
filtrarea trece jos, atunci imaginea devine mai estompat.



Fig. 5.14-a) imagine original, b)imagine cu zgomot sare i piper,
c)imagine filtrat cu filtru trece jos, d)imagine filtrat cu filtru median

n figura 5.14 s-a reprezentat efectul filtrrii cu filtrul median comparativ cu cel trece jos
descris n capitolul anterior. Se constat o comportare foarte bun la zgomotul de tip sare i piper.
a)
d) c)
b)
43

3. Filtrul binar
Un alt tip de filtru care se poate folosi n prelucrarea imaginilor binarizate este filtrul binar.
Acesta a fost caracterizat pe larg n capitolu anterior.

5.3.1.2. Filtre de accentuare
Principalul obiectiv al filtrelor de accentuare este de a scoate mai bine n eviden detaliile
fine ale imaginii sau de a accentua detalii care au fost estompate sau de a micora o serie de erori
care au aprut ca efect al metodei de achiziie a datelor. Principalele aplicaii ale metodei sunt
ntlnite n editare (tiprire electronic), imagerie medical, control industrial, precum i n
domeniul militar, n detecia intelor de pe cmpul de lupt.
1. Filtru spaial trece sus de baz
Forma necesar rspunsului de impuls pentru a implementa o caracteristic de tip trece sus
(accentuare) arat c filtrul trebuie s aib coeficieni pozitivi n apropierea zonei centrale i
negativi spre margini. O implementare a acestui tip de filtru se poate face cu ajutorul mtii 3x3 de
mai jos:
m=[-1 -1 -1;-1 1 -1; -1 -1 -1] (5.22)
Cnd aceast masc se suprapune peste o suprafa constant sau uor variabil, ieirea este 0 sau
variaz foarte puin. Acest filtru elimin componenta cu frecven 0, ceea ce conduce la scderea
pronunat a contrastului. Detaliile fine ale imaginii vor fi bine puse n eviden, dar contrastul
general va scdea foarte mult.
Reducerea valorii medii a unei imagini la zero va face unele nivele de gri ale imaginii s fie
negative. Deoarece sunt procesate numai valorile pozitive, rezult c filtrarea trece sus presupune o
scalare i/sau o limitare astfel ca nivelurile de gri s cuprind gama [0, L 1]. Procesnd n valoare
absolut datele, pentru a fi pozitive, valorile negative mari vor aprea strlucitoare pe imagine.
Deoarece o imagine filtrat cu FTS se poate calcula prin diferena dintre imaginea original i
imaginea filtrat cu FTJ, rezult c:
FTS = Original FTJ (5.23)


Fig.5.17 Filtrare de tip trece sus

O accentuare controlat a detaliilor se poate face dac imaginea original este ponderat cu o
valoare A (supraunitar), ceea ce conduce la o restaurare spaial a componentelor de joas
frecven:
FTS = (A)Original FTJ = (A 1)Original + FTS (5.24)
n final, imaginea obinut seamn mai mult cu cea original i detaliile sunt mai bine
conturate. Valoarea de pondere a pixelului central va fi w=9A1. Avantajul utilizrii filtrrii de
accentuare este net mai bun dect filtrarea trece sus. Cu ct A crete, cu att fondul imaginii se
lumineaz mai mult. Dezavantajul acestei metode este c accentueaz i zgomotul.
44
2. Filtre derivative
Medierea valorii pixelilor conduce la apariia petelor pe imagine (estompare sau defocalizare).
Medierea fiind analoag cu integrarea, diferenierea se poate considera a avea ca efect accentuarea
detaliilor fine.
Cea mai utilizat metod pentru diferenierea imaginii este gradientul. Gradientul pentru o
funcie scalar f(x, y) are expresia:

T
y
f
x
f
f
(

,
(5.25)
Amplitudinea acestui vector st la baza metodelor pentru diferenierea imaginilor:

.
2
2
|
|
.
|

\
|
+
|
.
|

\
|
=
y
f
x
f
f


(5.26)
n cazul imaginilor numerice s-au propus diveri algoritmi care aproximeaz gradientul
ntr-un punct utiliznd mti de diverse dimensiuni.
De exemplu, dac:
| |
(

=
d c
b a
H
este o matrice de dimensiune 2 i G
ij
este o fereastr 2x2:
| |
(

+ + +
+
=
) 1 , 1 ( ) , 1 (
) 1 , ( ) , (
j i G j i G
j i G j i G
G
ij
se noteaz convoluia lor prin:
[G
ij
]*[H] = aG(i, j) + b G(i, j+1) + c G(i+1, j) + d G(i+1, j+1) (5.27)
n mod analog, se definete convoluia a dou matrici de dimensiune 3x3. Cu toate acestea
estimarea gradientului n punctul (i, j) se poate face utiliznd relaia:
grad G(i, j) = ([G(i, j)*[H
1
])u
1
+ ([G(i, j)*[H
2
])u
2
, (5.28)
unde u
1
i u
2
sunt versorii pe cele dou axe, orizontal i, respectiv, vertical, iar H
1
i H
2
sunt
mtile ce caracterizeaz operatorul local pe direciile u
1
i u
2
.



Considernd direciile principale ale lui Freeman (fig. 5.18) se pot defini urmtorii operatori
cu rspuns direcional:

| | ,
1 1 1
1 2 1
1 1 1
1
(
(
(



= O | | ,
1 1 1
1 2 1
1 1 1
2
(
(
(



= O , | | .
1 1 1
1 2 1
1 1 1
8
(
(
(


= O
direcia 1 direcia 2 direcia 8
Formele O
1
, O
2
,, O
8
sunt rotite fiecare cu /4 n sens trigonometric fa de
precedentul. Dac:
O
k
*G
ij
= O
k
(0, 0)G(i 1, j 1) + O
k
(0, 1)G(i 1, j) + O
k
(0, 2)G(i 1, j + 1) + + + O
k
(2, 2)
G(i + 1, j + 1) = max, (5.29)
( unde O
k
(r,s) sunt elementele matricei O
k
), atunci cnd se consider c din punctul (i, j) pleac un
segment de dreapt, aparinnd conturului i normal la direcia k.
45

Fig. 5.18 Direciile principale n codificarea lui Freeman

Algoritmul de extragere a conturului cu ajutorul operatorilor O
k
,k = 1, 2, , 8 este urm torul:
- se baleiaz succesiv liniile pn cnd se ntlnete un punct de centru (n care gradientul este
maxim);
- n acest punct se aplic operatorii O
k
= 1, 2, , 8 i se determin k
0
pentru care O
k0
= max. Se
merge apoi spre normala direciei k
0
pn la urmtorul punct al reelei (considerat punct pe
contur) i se aplic aici operatorii O
k
, gsindu-se urmtorul punct al conturului, etc.
Metoda prezint avantajul codificrii comode a conturului, prin irul normalelor, dar este
dezavantajoas din punctul de vedere al efortului de calcul, deoarece n fiecare punct este necesar
aplicarea celor 8 operatori.
5.3.2. Inversarea de contrast i scalare statistic

Ochiul detecteaz un obiect pe un fond uniform, n funcie de mrimea sa i de factorul de
contrast , definit ca : = /, (5.30)
unde este deviaia standard a luminanei obiectului fa de fond, iar este luminana medie a
obiectului.
Dac se consider un factor de contrast invers de forma:
) , (
) , (
) , (
n m
n m
n m v

= (5.31)
unde (m, n) reprezint luminana medie local, iar (m, n) este deviaia standard local a u(m ,n),
msurat pe o fereastr W, date de relaiile:

| |
2 / 1
) , (
2
) , (
) , ( ) , (
1
) , (
) , (
1
) , (
)
`

=
=

W l k W
W l k W
n m l n k m u
N
n m
l n k m u
N
n m v


(5.32)

Prin aceast transformare se scaleaz fiecare pixel n funcie de deviaia sa standard, rezultnd o
imagine avnd pixeli cu varian unitar, transformare care poart numele de scalare statistic.
Operaia duce la rezultate spectaculoase n ceea ce privete punerea n eviden a unor detalii care
nu apar n imaginea original.
5.3.3. Mrimea i interpolarea imaginilor (zooming)

46
Dintre modalitile de zooming, cele mai importante sunt dublarea imaginii i interpolarea
liniar. n cazul dublrii imaginii, fiecare pixel de-a lungul unei linii i fiecare linie este repetat.
Acest lucru este echivalent cu ntreesarea unei imagini de dimensiuni MxN cu linii i coloane de
zerouri, pentru a obine o matrice de dimensiuni 2Mx2N i, apoi, convoluia acesteia cu o matrice H
de forma:
1 1
1 1
= H
Rezult o imagine: v(m,n)=u(k,l) unde k = int[m/2], l = int[n/2], m, n = 0, 1, 2,


Fig. 5.19 Rezultatul dublrii succesive a unei imagini
Interpolarea liniar este o multiplicare a imaginii la care pixelii care se intercaleaz sunt
media aritmetic a pixelilor vecini din imaginea original. De exemplu, pentru a mri de 2x2 ori
o imagine, interpolarea liniar de-a lungul liniilor d:

| |
1 - M m 0 ,
2
) 1 , ( ) , (
) 1 2 , (
1 - N n 0 , 1 - M m 0 , ) , ( ) 2 , (

+ +
= +
=
n m u n m u
n m v
n m u n m v
i
i
(5.33)
Pe coloane, transformarea este n conformitate cu relaiile urmtoare:

| |
1 - 2N n 0 1, - M m 0 ,
2
) , 1 ( ) , (
) , 1 2 (
, ) , ( ) , 2 (

+ +
= +
=
n m v n m v
n m v
n m v n m v
i i
i
(5.34)
Un rezultat similar se poate obine prin convoluia matricei 2Mx2N (obinut prin ntreesarea
imaginii MxN originale cu o matrice MxN de zerouri), cu matricea:
4 / 1 2 / 1 4 / 1
2 / 1 1 2 / 1
4 / 1 2 / 1 4 / 1
= H
a crei origine (m = 0, n = 0) este n centrul matricii.

Algoritmul folosit n acest caz este ilustrat n figura urmtoare:
(
(
(
(


(
(
(
(


(
(
(
(

25 , 0 5 , 0 1 5 , 1
5 , 0 1 2 3
2 4 3 2
5 , 3 7 4 1
0 0 0 0
5 , 0 1 2 3
2 4 3 2
5 , 3 7 4 1
0 0 0 0
0 1 0 3
0 0 0 0
0 7 0 1
1 3
7 1
int
voloane
e Interpolar
randuri
erpolare
zero cu
e Intreteser

Fig. 5.20
Interpolarea de ordin superior este posibil prin intercalarea fiecrei linii i coloane cu p linii
i p coloane de zerouri i convoluia de p ori cu matricea H.
5.4 Pseudocolorarea imaginilor

47
O alt metod de mbuntire a percepiei vizuale n condiiile unor imagini cu contrast redus
o constituie pseudocolorarea acestora. Deoarece ochiul uman distinge mult mai multe culori dect
trepte de gri, este posibil dinamica percepiei vizuale prin codarea informaiei n culori. n mod
normal, ochiul este capabil s disting ceva mai mult de 30 de nivele de gri, pe cnd n domeniul
culorilor percepia vizual este mult mai mare, ochiul putnd distinge un numr foarte mare de
culori. Sunt justificate, deci, preocuprile de mbuntire a percepiei vizuale prin transpunerea
nivelelor de gri din imaginile alb-negru (monocrome) n spaiul culorilor. Cele mai utilizate metode
n acest sens sunt colorarea fals i pseudocolorarea.
Colorarea fals reprezint transformarea unei imagini color n alta, pentru a obine un
contrast mai mare de culoare.
Pseudocolorarea reprezint transformarea unui set de imagini u(m,n), ntr-o imagine color.
Transformarea se face n aa fel, nct diferite caracteristici s se disting prin culori diferite.

Fig. 5.21 Pseudocolorarea imaginilor monocrome

Figura 5.21 prezint procedura general utilizat pentru pseudocolorare. Imaginile iniiale
sunt transformate n trei imagini diferite, care sunt apoi transformate n spaiul culorilor primare R,
G, B.
Dac de exemplu, se dorte pseudocolorareaa a unei imagini alb-negru, trebuie fcut o
coresponden ntre gama dinamic de gri-uri i spaiul culorilor. O variant este s se pstreze
saturaia culorilor constant, s se transforme nuanele de gri n strlucirea culorii, iar medile
spaiale locale ale nivelelor de gri, n faz a culorii.
Exist i alte metode de pseudocolorare cum ar fi alocarea pseoudoaleatoare de nivele de gri
n coordonate R, G, B. De exemplu, imaginile monocrome primite din spaiul cosmic, cum ar fi
imaginea cometei Haley, pot fi pseudocolorate prin alocarea unor culori diferite diferitelor densiti
de pe suprafaa acesteia. Pentru seturi coninnd un numr mai mare de imagini, setul de date se
poate reduce la trei, prin diverse metode, dup care urmeaz alocarea celor mai potrivite culori.
Indiferent de numrul culorilor din palet folosite pentru pseudocolorare, cel mai important
lucru l constituie alegerea culorilor din palet. Alegnd o palet necorespunztoare, efectul obinut
poate fi contrar celui ateptat. Culorile din palet trebuie alese n aa fel, nct tranziia de la o
culoare la alta s fie ct mai lin, fr salturi mari din punct de vedere al percepiei vizuale. De
asemenea, paleta de culori folosit trebuie s se asemene pe ct posibil cu scara de gri-uri, innd
cont de modalitatea de percepie vizual ce se bazeaz decisiv pe experiene anterioare (senzaia pe
care o d ochiului imaginea pseudocolorat trebuie s fie asemntoare cu cea dat de imaginea alb-
negru).
Secvenele de culori cele mai des folosite sunt: curcubeul (ncepnd de la rou nchis,
continund cu portocaliu, galben, verde, cian, albastru i violet, toate cu aceiai luminozitate),
spirala (pornind de la violet nchis, continund cu rou, simultan cu creterea coninutului de alb
din culoare) sau variaia de temperatur (rou nchis, portocaliu, galben, alb,alb-albastru).

coeficieni coeficieni Niv.
de
gri
culoarea
corespunztoare R G B
Niv.
de
gri
culoarea
corespunztoare R G B
Extragere
de
caracteristici
Transformare
de coordonate
color


A
-1
S(A
T
)
-1
u(m,n)
v
3
(m,n)
v
1
(m,n)
v
2
(m,n)
R
G
B
C(m,n)
48
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
Negru
Albastru nchis




Maro nchis







Rou nchis










Rou
Maro nchis
0
0
0
0
0
0
15
17
19
21
23
25
27
29
26
29
32
35
38
41
44
47
50
53
56
59
48
53
55
57
59
61

0
0
0
0
0
0
2
3
3
5
6
7
8
9
0
5
5
5
5
5
5
5
5
5
5
5
24
26
27
28
29
30

0
1
2
3
4
5
0
0
0
0
0
0
1
1
0
5
5
5
5
5
5
5
5
5
5
5
9
11
12
13
14
15
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
Maro deschis
Portocaliu nchis









Portocaliu
Galben nchis















Galben deschis


alb
63
63
63
63
63
63
63
63
63
63
63
63
63
63
63
63
63
63
63
63
63
63
63
63
63
63
63
63
63
61
62
63
31
31
33
35
37
41
43
45
47
49
51
53
63
63
63
63
63
63
63
63
63
63
63
63
63
63
63
63
63
61
62
63


16
0
0
0
0
0
0
0
0
0
0
0
0
0
2
4
6
8
10
12
14
16
18
20
22
24
26
28
30
61
62
63

Fig.5.22
n figura 5.22 sunt prezentai coeficienii RGB corespunztori nivelelor de gri de la 0 la 63,
aceatia pot reprezenta o palet de culori ce poate fi folosit pentru realizarea pseudocolorrii.



5.5 mbuntirea imaginilor color

n analiza automat a imaginii, culoarea este un descriptor foarte puternic care simplific
identificarea obiectelor i extragerea lor din scen. De aceea mbuntirea imaginilor color prezint
o importan destul de mare n sistemele de prelucrare de imagini.
La lumina colorat se folosesc trei parametrii pentru caracterizare: radiana, luminana i
strlucirea.
Radiana este cantitatea total de energie care vine de la o surs de lumin. Unitatea de
msur este watt-ul.
49
Luminana, care se msoar n lumeni, [lm], d o msur a energiei pe care o percepe un
observator de la o surs de lumin. De exemplu, o surs n infrarou poate avea o cantitate foarte
mare de energie, dar ochiul nu va putea percepe dect foarte puin (luminana este aproape zero,
dei radiana este foarte mare).
Strlucirea este un parametru descriptiv care nu se poate msura practic.

Fig.5.23 Cubul culorilor RGB

n anul 1931, CIE (comisia internaional pentru standardizarea radiaiei luminoase) a propus
urmtoarele valori pentru culorile fundamentale: albastru -435,8 nm, verde -546,1 nm i rou -700
nm (fig. 5.23).
Pentru a putea distinge o culoare de alta se folosesc urmtoarele mrimi: strlucirea, culoarea,
(nuana de culoare), saturaia. Nuana este asociat cu lungimea de und din cadrul amestecului de
culori din imaginea respectiv, dup cum ea este perceput de utilizator.
Saturaia se refer la puritatea relativ sau la cantitatea de alb din amestecul de culori.
Culorile spectrului pur sunt perfect saturate. Alte culori, precum roz (rou i alb), lila (violet i alb)
sunt mai puin saturate, iar gradul de saturaie este invers proporional cu cantitatea de alb adugat
n imagine. Nuana i saturaia, luate mpreun, se numesc cromativitate. O culoare se poate
caracteriza prin strlucire i cromativitate. Cantitile de rou, verde i albastru, X, Y, Z, necesare
pentru a forma o culoare particular se numesc culori culori tristimulus. O culoare se specific prin
coeficienii tricromatici:

. , ,
Z Y X
Z
z
Z Y X
Y
y
Z Y X
X
x
+ +
=
+ +
=
+ +
=
(5.35)

Cel mai bun exemplu de utilizare a modelului RGB este procesarea reelelor de imagine
multispectrale prin folosirea senzorilor de imagine care lucreaz n mai multe zone spectrale. De
exemplu, n imageria de la LANDSAT se folosesc patru imagini digitale: dou n spectrul vizibil
(rou i verde) i dou n zona de infrarou.
B(0,0,1)
R(1,0,0)
G(0,1,0)
Albastru
Galben
Scala de gri
Verde
Negru
(0,0,0)
Rou
Alb
50
Fig. 5.24 mbuntiri ale imaginilor color

n procesul de mbuntire a imaginilor, dificultile ce intervin sunt mult mai mari, avnd n
vedere cantitatea mult mai mare de date i complexitatea mai mare a percepiei vizuale a culorilor.
Coordonatele color ale fiecrui pixel sunt transformate independent n alt set de coordonate color,
unde imaginea corespunztoare fiecrei coordonate este mbuntit printr-un algoritm propriu
(monocrom), ales n mod corespunztor. Coordonatele imaginii mbuntite T
1,
T
2
, T
3
sunt
transformate invers n R, G i B pentru redare. Deoarece fiecare plan de imagine este mbuntit
n mod independent, trebuie luat precauia ca T s fie n gama dinamic a sistemului RGB. Acest
proces este prezentat n figura 5.24).


6. Operaii de mbuntire a imaginilor n domeniul transformat
6.1. Principalele transformri folosite n prelucrarea de imagini

Dup cum s-a amintit mai sus, operaiile care pot fi efectuate asupra unei imagini pentru a
obine mbuntirea acesteia se pot realiza att n domeniul spaial (capitolul V), ct i n cel
transformat.La fel cum un semnal unidimensional poate fi reprezentat prin serii de funcii
ortogonale, o imagine se poate reprezenta printr-o serie de funcii de baz ortogonale, n funcie de
un set de vectori de baz, numit imagine de baz, set generat cu ajutorul unor matrici unitare. Ca
alternativ la reprezentarea sub form matricial, o imagine de dimensiuni NxN poate fi considerat
i ca vector de dimensiune N
2
x1. O transformare de imagini are ca rezultat un set de coordonate sau
vectori da baz n acest spaiu vectorial.
n cazul unidimensional considerm secvena: {u(n), 0 n N - 1} reprezentat de un vector
u de lungime N. O transformare unitar a acestui vector se poate scrie ca:
V = Au, sau
1 - N k 0 , ) ( ) , ( ) (
1
0
=

=
N
n
n u n k a k v
(6.1)
unde A
-1
=A
*T
este o matrice unitar.
Rezult, n acest caz: u = A
*T
v sau 1 - N k 0 , ) ( ) , ( * ) (
1
0
=

=
N
n
n v n k a n u (6.2)
Coloanele lui A
*T
, adic vectorii a
*
k
= {a
*
(k, n), 0 n N 1},se numesc vectorii bazei lui A.
Conversie
de
coordonate
mbuntire
imagine alb-negru
mbuntire
imagine alb-negru

mbuntire
imagine alb-negru




Transfor-
mare
invers
de
coordonate





Redar
e
imagi-
ne
color

R
G
B
51
Diferena principal ntre diferite transformri este dat de alegerea funciilor de baz,
respectiv a liniilor matricii transformrii. Aceste linii formeaz un set de vectori de baz ntr-un
spaiu N-dimensional. n mod normal, dei orice set de asemenea vectori ortonormali poate fi
folosit pentru a realiza o transformare liniar, se folosesc seturi care deriv din aceeai funcie de
baz prototip. Fa de aceasta, funciile individuale de baz difer numai n frecven.
Orice vector din spaiu poate fi exprimat ca sum ponderat de vectori de baz de lungime
unitar. Orice transformare unitar unidimensional (Nx1) va corespunde, n consecin, rotaiei n
spaiul vectorial N-dimensional al unui vector. Prin generalizare, avnd n vedere c matricea
corespunztoare unei imagini de dimensiuni NxN poate fi considerat ca un vector de dimensiuni
N
2
x1, orice transformare unitar, separabil, simetric, bidimensional va corespunde rotaiei unui
vector n spaiul vectorial de dimensiune N
2
.
Transformarea bidimensional invers poate fi imaginat ca o nsumare a unui set de imagini
de baz, convenabil ponderate, n vederea reconstruirii imaginii. Fiecare element al matricii
transformrii reprezint coeficientul cu care se nmulete imaginea de baz corespunztoare.
O imagine de baz poate fi generat prin transformarea invers a unei matrici de coeficieni
coninnd un singur element nenul, care este considerat unitar. De fapt, exist N
2
asemenea matrici,
care vor genera N
2
imagini de baz.
n fond, imaginile de baz pot fi considerate ca un set de componente n care poate fi
descompus o imagine i, totodat, blocurile componente din care poate fi reconstruit.
Transformarea direct realizeaz descompunerea, prin determinarea coeficienilor, iar transformarea
invers realizeaz reconstrucia prin nsumarea imaginilor de baz, ponderate cu aceti coeficieni.
Deoarece exist o infinitate de seturi de imagini de baz, vor exista, de asemenea, o infinitate
de transformri. Cu toate acestea, un anumit set de imagini de baz prezint importan numai n
contextul unei anumite transformri.

6.1.1. Transformarea Fourier
Transformata Fourier discret bidimensional a unei imagini {u(m, n)} de dimensiuni NxN
este transformarea separabil definit prin:
1 - N l k, 0 , ) , ( ) , (
1
0
ln
1
0
=

=
N
m
N
km
N
N
n
W W n m u l k v (6.3)
iar transformata invers este:

1 - N n m, 0 , ) , (
1
) , (
1
0
ln
1
0
2
=

=
N
k
N
km
N
N
l
l k v W W
N
n m u
(6.4)
Perechea unitar bidimensional este dat de relaiile:

1 - N n m, 0 , ) , (
1
) , (
1 - N l k, 0 , ) , (
1
) , (
1
0
ln
1
0
1
0
ln
1
0
=
=

=
N
k
N
km
N
N
l
N
m
N
km
N
N
n
W W l k v
N
n m u
W W n m u
N
l k v

(6.5)

Proprietile transformrii DFT bidimensionale

Proprietile transformrii unitare DFT bidimensionale sunt similare cu cazul unidimensional
i sunt succint trecute n revist n continuare:
- Simetrie: F
T
= F, F
-1
= F
*

- Extensii periodice:
v(k + N, l + N) = v(k, l) l k,
u(m + N, n + N) = u(m, n) n m,
52
- Spectrul Fourier eantionat: dac (m, n) = u(m, n), 0 m, n N 1 i (m, n) = 0 n
rest, rezult:
{ } ) , ( ) , (
2
,
2 ~
l k v n m u DFT
N
l
N
k
U = =
|
.
|

\
|
(6.6)
unde (
1
,
2
) este transformata Fourier a lui (m, n).
- Transformata rapid, deoarece transformarea DFT bidimensional este separabil, relaiile
(6.5) sunt echivalente cu 2N transformri DFT unitare unidimensionale, fiecare realizabil n
Nlog
2
N operaii, prin FFT. Rezult deci c numrul total de operaii necesare este de
N
2
log
2
N.
- Simetrie conjugat, transformrile DFT i DFT unitar ale unor imagini reale au simetrie
conjugat:

1
2
N
l k, 0 ,
2
,
2 2
,
2
*
|
.
|

\
|
= |
.
|

\
|
l
N
k
N
v l
N
k
N
v m m
(6.7)
sau v(k, l) = v
*
(N k, N l), 0 k, l N 1 (6.8)
De aici se poate deduce foarte uor c v(k, l) are doar N
2
elemente reale independente. Spre
exemplu, eantioanele din regiunea haurat n figura 6.1 determin complet transformarea DFT.

Fig. 6.1 Simetria coeficienilor DFT

6.1.2. Transformarea Cosinus
Transformata cosinus discret se definete, n spaiul bidimensional, ca:

(

+
(

+
=

=
N
n
N
k m
n m u l k l k v
N
m
N
n
2
) 1 2 (
cos
2
) 1 2 (
cos ) , ( ) ( ) ( ) , (
1
0
1
0


(6.9)
unde k, l = 0, 1, , N 1, iar inversa ei ca:

(

+
(

+
=

=
N
n
N
k m
l k v l k n m u
N
k
N
l
2
) 1 2 (
cos
2
) 1 2 (
cos ) , ( ) ( ) ( ) , (
1
0
1
0


(6.10)
unde m, n = 0, N 1, iar coeficienii sunt:
N k
N
= = 1 pentru
N
2
(k) i
1
) 0 (

La fel ca i transformarea DFT, transformarea cosinus discret poate fi exprimat ca operaie
cu matrici unitare: V = CuC
T
, unde coeficienii transformrii C sunt:

(

+
=
N
k m
k c
m k
2
) 1 2 (
cos ) (
,

(6.11)
Transformata cosinus discret are, de asemenea, un algoritm rapid de implementare dar, spre
deosebire de DFT, are numai valori reale. Ca domenii de aplicabilitate, este cea mai folosit
transformare n compresia de imagini.

53
6.1.3. Transformarea Sinus
Transformata sinus discret bidimensional, introdus de A. Jain, este definit de relaia:

(

+
+ +
(

+
+ +
+
=

=
1
) 1 )( 1 (
sin
1
) 1 )( 1 (
sin ) , (
1
2
) , (
1
0
1
0
N
l n
N
k m
n m u
N
l k v
N
m
N
n

(6.12)
iar transformata invers, de:

(

+
+ +
(

+
+ +
+
=

=
1
) 1 )( 1 (
sin
1
) 1 )( 1 (
sin ) , (
1
2
) , (
1
0
1
0
N
l n
N
k m
l k v
N
n m u
N
k
N
l

(6.13)
Transformata sinus discret are elementele matricii unitare de forma:

(

+
+ =
+
=
1
) 1 )( 1 (
sin
1
2
,
N
k m
N
s
k m

(6.14)
Spre deosebire de alte transformri de tip sinusoidal, transformarea DTS este mai uor de
implementat dac N = 2
p
1, cu p numr ntreg. n acest caz, poate fi considerat ca fiind partea
imaginar a unei transformri Fourier rapide de dimensiune (2N+2). Are, totodat, un algoritm
rapid de implementare i proprietile ei o impun pentru aplicaii de tipul compresie imagini.

6.1.4. Transformarea Hartley
Transformata Hartley este o transformare integral continu, propus de
matematicianul cu acelai nume, ca alternativ la transformata Fourier. Varianta discret a acestei
transformri (DHT) este dat de relaiile:

=
(

+ =
1
0
1
0
) (
2
) , (
1
) , (
N
m
N
n
nl mk
N
cas n m u
N
l k v

i (6.15)

=
(

+ =
1
0
1
0
) (
2
) , (
1
) , (
N
k
N
l
nl mk
N
cas l k v
N
n m u

(6.16)
identice i folosind funcia de baz:
) 4 / cos( 2 ) sin( ) cos( ) cos( = + = (6.17)
Elementele matricii unitare ale transformateii Hartley sunt de forma:

(

|
.
|

\
|
=
N
mk
cas
N
h
k m
2
1
,
(6.18)
Spre deosebire de DFT, care transform N numere reale n N numere complexe cu simetrie
conjugat, transformata Hartley discret produce N numere reale. Ea este strns legat de
transformata Fourier discret, fiind pur i simplu diferena dintre partea real i partea imaginar a
transformatei Fourier corespondente. Analog, transformata Fourier este partea par, minus j ori
partea impar a transformatei Hartley.
Din aceste motive, DHT constituie o alternativ din punct de vedere al implementrii pe
calculator a transformatei DFT, avnd i ea un algoritm rapid de implementare. Anumite aplicaii de
filtrare liniar de imagini, n special n cazul unor imagini simetrice, impun folosirea DHT datorit
reducerii semnificative a volumului de calcule (se evit lucrul cu numere complexe).

6.1.5. Transformarea Hadamard
Unele dintre transformrile de interes din punct de vedere al prelucrrilor digitale de imagini
folosesc funcii de baz ce reprezint variaii ale unor unde dreptunghiulare i nu sinusoidale ca cele
prezentate mai sus. n general, aceste transformri se caracterizeaz prin rapiditate n calcul , avnd
n vedere faptul c multe din operaiile de nmulire pot fi evitate. Dintre transformrile de acest tip,
mai importante sunt transformrile Hadamard, Walsh, Slant, Haar i Wavelet.
54
Transformata Hadamard este simetric, separabil i unitar i se evideniaz prin faptul c
elementele matricii transformrii iau valorile de +1 sau 1. Transformarea are sens pentru N = 2
n
,
unde n este un numr ntreg. Pentru o transformare 2x2, matricea corespunztoare este:

(

=
1 1
1 1
2
1
2
1
2
H
(6.19)
iar pentru dimensiuni mai mari N, ea poate fi generat astfel:

(

=
2 / 2 /
2 / 2 /
1 1
N N
N N
N
H H
H H
N
H
N
(6.20)
Pentru orice dimensiune N = 2
n
, matricea conine doar elemente de forma 1, cu condiia ca
factorul N
-1/2
s fie n afara matricii. Spre exemplu, pentru N = 8 matricea Hadamard are forma
prezentat n matricea (6.21), unde n coloana din dreapta matricii se evideniaz numrul
schimbrilor de semn din linia respectiv. Se poate observa c numrul difer de la o linie la alta i
poart numele de secvena liniei. Reordonarea liniilor n aa fel nct secvenele corespunztoare s
fie cresctoare, n mod analog cu creterea frecvenei la transformarea Fourier, duce la o
transformare mai uor de implementat, care se numete transformare Hadamard ordonat dat de
matricea (6.22):

(6.22)
7
6
5
4
3
2
1
0
1 - 1 1 - 1 1 - 1 1 - 1
1 1 - 1 1 - 1 - 1 1 - 1
1 - 1 1 1 - 1 1 - 1 - 1
1 1 - 1 - 1 1 1 - 1 - 1
1 - 1 - 1 1 1 - 1 - 1 1
1 1 1 - 1 - 1 - 1 - 1 1
1 - 1 - 1 - 1 - 1 1 1 1
1 1 1 1 1 1 1 1
2 2
1
H (6.21)
5
2
6
1
4
3
7
0
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
2 2
1
8 8
(
(
(
(
(
(
(
(
(
(
(

=
(
(
(
(
(
(
(
(
(
(
(








= H


6.1.6. Transformarea Walsh
Funciile de baz ale transformatei Hadamard sunt, de fapt, funcii Walsh. Din aceast cauz
ea este denumit uneori i transformare Walsh. n unele referine se ntlnete i denumirea
combinat de transformare Walsh Hadamard.

6.1.7. Transformarea Slant
Transformarea Slant are funciile de baz de ordinul 0 i 1 liniare, fapt ce face s fie util n
unele aplicaii de prelucrri digitale de imagini. Matricea unitar a transformrii Slant se obine
pornind de la transformarea Haar sau Hadamard de dimensiuni 2x2:
(

=
1 1
1 1
2
1
2
S i iternd-o n
conformitate cu urmtorul algoritm:

(
(
(
(
(
(
(
(
(

(
(
(
(
(
(
(
(
(
(
(



1
1 - n
2 ) 2 / ( 2 ) 2 / (
2 ) 2 / ( 2 ) 2 / (
: 0
:
:
... ... ... : ... .... ....
:
:
0 : S

: 0 : : 0
.... .......... : ..... .......... : . .......... : .. ..........
0 :
1 0
: 0 :
1 0
.. .......... : .. .......... : .......... : . ..........
: 0 : : 0
... .......... : .... .......... : .......... : ..........
0 :
0 1
: 0 :
0 1
2
1
n
n n
n n n n
n n
n n n n
n
S
I I
a b a b
I I
b a b a
S
(6.23)
unde I este matricea identitate de ordinul N/2-2, iar
55

1 4
b i
1 4
3
2
2
2N 2
2
2

=
N
N
N
N
a
N
(6.24)
Funciile de baz ale transformatei Slant apar n toate secvenele, ncepnd de la 0 la N 1.
6.1.8. Transformarea Haar
Transformata Haar este simetric, unitar i separabil, i folosete ca funcii de baz funciile
Haar. Transformarea are sens pentru N = 2
n
, unde n este un numr ntreg. Spre deosebire de
transformata Fourier, unde funciile de baz difer numai n poziie pe axa frecvenelor, funciile
Haar variaz att n scal (lime) ct i n poziie. Aceast caracteristic particularizeaz
transformarea Haar fa de celelalte tipuri de transformri rectangulare i face ca ea s constituie,
totodat, un punct de plecare pentru transformrile de tip Wavelet (undioare).
Indexare funciilor Haar, deoarece acestea sunt variabile de doi parametrii (scal i poziie),
trebuie fcut dup o schem dual. Ele se definesc pe intervalul [0, 1] dup cum urmeaz: se
consider k un numr ntreg, 0 k N 1 unic determinat de ali doi ntregi p i q astfel:
k = 2
p
+ q 1 (6.25)
Se observ c prin aceast modalitate de definire, nu numai k este o funcie de p i q, dar i p
i q sunt funcii de k. Pentru orice valoare a lui k > 0, 2
p
este cea mai mare putere a lui 2 care
ndeplinete condiia 2p k, iar q 1 este restul mpririi.
Funciile Haar se definesc astfel:

N
x h
1
) (
0
= (6.26)

<

<
=
rest n , 0
2 2
1/2 - q
dac , 2
2
2 / 1
2
1 - q
dac , 2
1
) (
p
2 /
p
2 /
p
p
p
p
k
q
x
q
x
N
x h
(6.27)
Dac se consider x = i/N, i = 0, 1, , N 1, va rezulta un set de funcii de baz. Acestea
variaz att ca modul (scal) ct i ca poziie. Indicele p specific scala, iar q determin deplasarea.
Din aceast cauz, ordonarea coeficienilor transformrii dup k nu este la fel de edificatoare ca,
spre exemplu, ordonarea spaiului coeficienilor obinut n urma unei transformri Fourier.

6.1.9. Transformarea Karhunen-Love
Transformarea Karhunen-Loeve (sau K-L) este cunoscut n literatura de specialitate i ca
transformarea Hotelling, transformarea vectorilor proprii sau transformarea componentelor
principale.
Capacitatea acestei transformri de a reduce dimensiunile vectorilor transformai o face
extrem de util n compresia de imagini. Imaginile multispectrale, de exemplu, conin mai multe
nivele de gri pentru acelai pixel, fiecare nivel de gri corespunznd unei benzi spectrale diferite.
Spre exemplu, o imagine multispectral pe 24 de benzi, avnd dimensiunea de 100x100, poate fi
considerat ca un set de zece mii de vectori avnd fiecare 24 elemente.
Tehnica reducerii dimensiunilor vectorilor prin transformarea Karhunen-Loeve (K-L)
poate fi aplicat n acest caz, deoarece corelaia ntre diferite benzi spectrale este, n general ,
destul de ridicat i, n consecin multe dintre cele 24 valori proprii vor fi mici.
56
Aceasta nseamn c setul de 24 imagini monocrome poate fi reprezentat, cu erori relativ
mici, prin doar cteva imagini principale, fiecare dintre acestea fiind calculat ca o sum
ponderat a celor 24 iniiale. De asemenea, fiecare dintre acestea poate fi reconstituit
aproximativ, ca i combinaie liniar a celor cteva imagini principale. Metoda uureaz foarte
mult stocarea i transmisia imaginilor, mai ales a celor preluate de la satelii.

6.1.10. Transformarea wavelet
Pentru aplicarea transformatei wavelet discrete bidimensionale, este necesar aplicarea
transformatei wavelet unidimensionale discrete de dou ori, o dat pe liniile i apoi pe coloanele
matricii corespunztoare imaginii. Aceast manier de aplicare a DWT pentru un semnal
bidimensional, eantionat cu o reea dreptunghiular, se numete n literatur transformare diadic
2-D DWT. Cuvntul diadic se refer la faptul c avem acelai factor de scar pentru aplicarea
transformatei.
O alt metod de aplicare a 2-D DWT este prin metoda quincunx, caz n care factorul de
scar este egal pe toate direciile.
Transformarea 2D-DWT diadic
Pentru a defini 2D-DWT se va apela la cunotinele referitoare la analiza multirezoluie. Prin
extinderea la domeniul bidimensional se obin funciile de scal (x) i funcia wavelet (x) i
anume:
LL
(x, y) = (x)(y) (6.28)
care reprezint funcia de scal, i cele trei funcii wavelet (x, y), date de:

LH
(x, y) = (x)(y)

HL
(x, y) = (x)(y) (6.29)

HH
(x, y) = (x)(y)
Versiunea dilatat i translatat a funciei de scal
LL
(x) este definit pentru subspaiul
aproximat V
m
din L
2
(R
2
). Aceast aproximare poate fi descris ca i produsul vectorial dintre dou
subspaii V

m
aparinnd L
2
(R):
V
m
= V

m
V

m



Descompunerea imaginii originale cu ajutorul transformrii 2D-DWT diadice se face n patru
subbenzi, ca n figura 6.2.
Zona LL reprezint subbanda care conine toate informaiile de joas frecven. Zona HH
conine toate informaiile de nalt frecven, iar celelalte dou zone, HL i LH, conin informaiile
de nalt frecven pe direcie vertical i de joas frecven pe direcie orizontal, respectiv de
joas frecven pe direcie vertical i de nalt frecven pe orizontal. Pentru a obine o
LL LH
HL HH
LH
(5)
HH
(7)
HL
(6)
HH
(4)
LH
(2)
HL
2
LL
(1)
Fig. 6.2 Primul pas al
aplicrii
transformrii 2D-DWT
didactice
Fig. 6.3 Transformare
2D-DWT pasul doi
57
transformare DWT complet se repet pasul de descompunere n subbanda LL. n urma celui de-al
doilea pas se obine imaginea din figura 6.3.
n cele mai multe dintre lucrri de specialitate aplicaiile de codare se fac prin aplicarea a trei
sau chiar patru pai ai algoritmului de codare wavelet diadic. Trebuie avut ns n vedere faptul c la
imaginile mai mici, prin aplicarea a mai mult de trei pai de codare wavelet exist posibilitatea ca,
nainte de implementarea ultimului pas, subbanda de joas frecven s aib dimensiuni
comparabile cu lungimea filtrului i s existe posibilitatea interferenei, datorit simetriei care exist
ntr-o linie sau ntr-o coloan. De aceea este bine s se ia n considerare toate erorile care pot aprea
datorit acestui aspect.

6.2. Filtrare n domeniul frecven

Filtrarea liniar poate fi modelat ca o multiplicare a spectrului Fourier a unei imagini cu o
funcie de transfer definit n domeniul frecven. Analog, se pot defini algoritmii de filtrare i
pentru celelalte transformri de imagini.
La fel ca i transformata Fourier, transformrile unitare, n general, realizeaz o expandare a
imaginii ca sum ponderat a imaginilor de baz. Prin transformarea direct se determin
coeficienii de pondere, iar n transformarea invers se face reasamblarea imaginii din imaginile de
baz.
Filtrarea n domeniul transformatei presupune o modificare a coeficienilor de pondere,
naintea reconstruciei imaginii prin transformarea invers. n cazul filtrrii liniare, transformarea va
fi o transformare Fourier, iar modificarea se face nmulind spectrul cu o funcie de transfer. n
cazul mai general al filtrrii, matricea coeficienilor este modificat (prin nmulire sau prin alte
metode), iar dup transformarea invers rezult imaginea filtrat.
n mod evident, natura vectorilor i, implicit, a imaginilor de baz ce rezult stabilesc
comportarea diferitelor transformri din acest punct de vedere. De exemplu, zgomotul de tip
sinusoidal ce afecteaz o imagine va aprea foarte compact n domeniul transformrii de tip
sinusoidal i, deci, va putea fi nlturat foarte uor prin anularea coeficienilor respectivi. n cazul
transformrilor rectangulare, problema eliminrii unui asemenea tip de zgomot se complic,
deoarece el nu va putea fi separat la fel de uor n domeniul transformatei.
n general, dac fie componentele semnalului (utile), fie componentele zgomotului (nedorite)
din imagine sunt asemntoare imaginilor de baz ale unei anumite transformri, atunci acea
transformare este cea mai potrivit pentru separarea lor, deoarece acele componente vor fi
reprezentate foarte compact n domeniul transformatei.
De exemplu transformata Haar este util n cazul deteciei liniilor sau muchiilor verticale i
orizontale, deoarece unele dintre imaginile sale de baz se potrivesc cu aceste caracteristici.
Datorit faptului c transformarea este separabil, o caracteristic a acesteia de tipul unei linii sau
muchii orizontale i verticale va produce coeficieni diferii de zero numai n prima linie i,
respectiv n prima coloan a imaginii transformate. Numrul coeficienilor diferii de zero va fi de
cel mult N/2, iar poziia muchiei n imagine determin care i ci dintre coeficieni vor fi nenuli.
Datorit asocierii strnse cu sistemele liniare, transformata Fourier reprezint cel mai bine pus
la punct fundament teoretic n ceea ce privete filtrarea imaginilor. Celelalte transformri sunt mai
dificile de interpretat din punct de vedere al filtrrii i, de aceea, folosirea lor se face adesea pe baz
de experimente. nelegerea similaritilor i diferenelor ntre aceste transformri este extrem de
important n alegerea unor soluii potrivite pentru diferite tipuri de aplicaii.

6.2.1.Filtrul trece jos
Ca i n cazul filtrrii spaiale mbuntirea imaginii se poate face lucrnd n domeniul
frecven. Se evalueaz transformata Fourier a imaginii care trebuie mbuntit, se multiplic
58
rezultatul cu o funcie de transfer i apoi se face transformata Fourier invers pentru a realiza noua
imagine.
Ideile de dez-accentuare (nceoare) prin reducerea coninutului de frecvene nalte,
accentuarea detaliilor (ascuirea) prin creterea ponderii componentelor de nalt frecven, apar
direct din proprietile transformatei Fourier. De fapt, ideea complet de filtrare liniar este mai
intuitiv n domeniul frecven. n practic sunt folosite mti spaiale mai mici dect cele pentru
transformata Fourier din cauza simplitii de implementare i a vitezei de lucru. Cu toate acestea,
nelegerea conceptelor n domeniul frecven este esenial pentru rezolvarea unor probleme care
nu pot fi accesate prin tehnica spaial, rezolvare care are loc cu ajutorul filtrrii homomorfice sau
prin unele operaii de restaurare a imaginii. Atenuarea unor componente de nalt frecven
determin reducerea tranziiilor ascuite (zgomot, muchii etc.).
Dac F(u,v) este transformata Fourier a imaginii care trebuie uniformizat, atunci produsul cu
funcia de transfer H(u,v) conduce la funcia de ieire G(u,v) care are componente de nalt
frecven atenuate:
G(u,v)=H(u,v)F(u,v). (6.30)
n continuare vor fi abordate filtrele cu deplasare de faz zero, n care prile reale i
imaginare ale lui F(u, v) sunt afectate n acelai mod.
Filtrul trece-jos ideal are caracteristica de transfer dat de relaia:

)
`

>

=
0 v) D(u, daca 0,
D v) D(u, daca , 1
) , (
0
v u H (6.31)
unde D
0
este o cantitate nenegativ, iar distana de la origine la un punct (u, v) este dat de relaia:

2 / 1 2 2
) ( ) , ( v u v u D + = (6.32)
Filtrul se numete ideal pentru c toate frecvenele sunt oprite, dac D>D
0
, sau neatenuate,
pentru D D
0
, ca n figura 6.4 (reprezentarea n 3D, figura fig. 6.4 a sau n plan fig.6.4 b). Punctul
de tranziie se numete frecven de tiere. Aceste filtre sunt radial simetrice n jurul originii.

Fig.6.4 Funcia de transfer a unui filtru trece jos
Forma ideal din fig. 6.4 nu se poate realiza cu componente electronice, dar se poate simula
pe calculator.
H(u,v)
v
u
a)
1
H
(
u
,
v
)

D D(u,v)
b)
59

Fig. 6.5 Imaginea original i transformata ei Fourier

n figura 6.5a este reprezentat o imagine standard, iar n fig. 6.5b, transformata ei Fourier.
Figura 6.6 arat rezultatele aplicrii unui filtru trece-jos cu frecvenele de tiere diferite, luate n aa
fel nct s treac 90, 95, 99, respectiv 99,5% din puterea componentelor spectrale. Imaginea din
figura 6.6a este mai puin utilizat n practic din cauza petelor foarte mari care apar pe imagine.
Coninutul din cele 10 procente reprezint o contribuie semnificativ a componentelor de nalt
frecven. La scderea ponderii, chiar cu 5%, fig. 6.6b, se constat nc o estompare a imaginii.
Eliminarea a numai 1% din putere face ca imaginea s fie acceptabil (fig. 4.6c), iar la 0,05% se
constat (fig. 6.6d) c imaginea posed suficiente informaii de detalii i este aproape identic cu
imaginea original (fig. 4.5a).
Rotunjirea i defocalizarea elementelor din imagine se poate explica pe baza teoremei
convoluiei:
Error! Objects cannot be created from editing field codes.
(6.33)
unde h(x, y) este transformata Fourier invers a funciei de transfer. Cheia nelegerii estomprii
imaginii ca un proces de convoluie const n natura funciei h(x, y). Dou puncte strlucitoare se
pot considera ca provenind de la dou impulsuri. Convoluia lui h(x, y) este un proces simplu de
copiere a lui h(x,y) n locul fiecrui impuls. Fenomenul de estompare este o consecin a convoluiei
funciei f(x, y) cu h(x,y). Forma lui h(x,y) depinde de raza funciei filtru n domeniul frecven.

60

Fig. 6.6 Filtrarea imaginii cu diferite valori ale frecvenei de tiere

Calculnd transformata invers H(u,v) pentru un filtru trece-jos ideal, se constat c raza
cercurilor concentrice n h(x,y) este invers proporional cu valoarea lui D
0
din ecuaia filtrului.
Filtrri severe n domeniul frecven (ceea ce corespunde unei valori mici pentru D
0
) produc un
numr mic de cercuri largi n h(x, y) i, implicit, o estompare pronunat n g(x, y). Cnd D
0
crete,
va crete i numrul de inele din regiunea lui h(x,y), ceea ce produce la o spaiere mai fin a
cercurilor o mai mic estompare. Dac D
0
este n afara domeniului de definiie al lui F(u, v), h(x, y)
devine egal cu 1 n toat regiunea i convoluia lui h(x, y) cu f(x, y) este egal cu f(x,y) (aceast
situaie corespunde de fapt lipsei filtrrii).
Funcia de transfer a unui filtru trece-jos de tip Butterworth de ordin n are expresia:

.
) , (
1
1
) , (
2
0
n
D
v u D
v u H
(

+
=
(6.34)

Fig. 6.7 Filtru trece jos Butterworth

Imaginile n perspectiv i seciune transversal sunt redate n figura 6.7. Spre de deosebire de
filtrul ideal trece-jos, acum funcia de transfer nu are o pant infinit (o trecere brusc de la banda
de tiere la cea de trecere), variind uniform. Ca urmare, definirea frecvenei de tiere este o
problem de utilizator. Dac, H(u, v)=0,5(50% din valoarea maxim), atunci D(u, v)=D
0
.
O alt valoare des folosit este 2
-0,5
, caz n care funcia de transfer devine:
Error! Objects cannot be created from editing field codes.
(6.35)


6.2.2. Filtrul trece sus

61
O alt metod de mbuntire a acurateei imaginii const n utilizarea filtrelor trece sus. n
continuare vor fi analizate numai filtre cu deplasare de faz nul, care au o structur radial
simetric i pot fi specificate complet printr-o seciune transversal. n cazul filtrului trece sus ideal
funcia de transfer are expresia:
Error! Objects cannot be created from editing field codes.
(6.36)
i este reprezentat grafic n figura 6.8.

Fig. 6.8 Funcia de transfer a unui filtru trece sus ideal

n cazul modelrii prin polinoame Butterworth, funcia de transfer are forma:

n
v u D
D
v u H
2
0
) , (
1
1
) , (
(

+
=
(6.37)
i ajunge la valoarea de 0,5 dac D(u, v) = D
0
. Acceptnd o alt valoare, 2
-0,5
, rezult:
Error! Objects cannot be created from editing field codes.
(6.38)
mbuntirea modului de redare a unei imagini se mai poate face modificnd simultan
strlucirea (prin comprimarea gamei dinamice) i accentuarea contrastului. Imaginea f(x, y) este
rezultatul aciunii luminii care cade direct pe obiect i a luminii reflectate de obiectele
nconjurtoare: f(x, y)=i(x, y) r(x, y).
Cele dou componente nu pot fi prelucrate independent (transformata Fourier a produsului a
dou funcii nu este separabil). Dar presupunnd c:
z(x, y)=ln f(x, y) =ln i(x, y) + ln r(x, y) i (6.39)
F[z(x, y)]=F[ln f(x, y)]=F[ln i(x, y) + ln r(x, y)], (6.40)
atunci : Z(u, v)=I(u, v) + R(u, v). (6.41)
Procesnd Z(u, v) cu funcia H(u, v), rezult: S(u, v)=H(u, v)Z(u, v)=H(u, v)[I(u, v) + R(u, v)]
n domeniul spaial: s(x, y)=F
-1
[H(u, v)I(u, v)] + F
-1
[H(u, v)R(u, v)]=i

(x, y) + r

(x, y). (6.42)


n final, n imaginea mbuntit g(x, y) va avea expresia:
g(x, y)=exp[s(x, y)]=exp[i

(x, y)]exp[r

(x, y)]=i
0
(x, y)r
0
(x, y), (6.43)
unde i
0
i r
0
sunt componentele de iluminare sau reflectan ale imaginii de ieire. Componenta dat
de iluminare are, n general, o variaie spaial mai lent, iar cealalt component tinde s aib o
variaie abrupt.

6.2.3. Filtrul homomorfic

Filtrul homomorfic (fig. 6.9) asigur condiiile anterioare. Funcia de transfer a filtrului este
reprezentat grafic n figura 6.10. Dac parametrii de prag se aleg p
j
<1 i p
s
<1 , atunci funcia de
transfer a filtrului tinde s atenueze componentele de joas fracven i s amplifice componentele
H(u,v)
H(u,v)
u
v
1
D
0
D(u,v)
a) b)
62
de nalt frecven. O scdere a gamei dinamice a strlucirii i o cretere a contrastului permit
evidenierea mai multor detalii.

Fig. 6.9 Filtrarea homomorfic

Fig. 6.10 Funcia de transfer a unui filtru homomorfic

Dac este specificat comportarea i domeniul frecven, se pot calcula mtile (valorile
coeficienilor) pentru domeniul spaial. Aplicnd teorema convoluiei n domeniul spaial, se obine:

=
=
1
0
1
0
), , ( ) , ( ) , (
N
i
N
k
k i f k y i x b y x g (6.44)
unde x, y=0, 1, , N-1 (pentru simplitatea notaiilor se folosesc reele ptrate de imagini).
Dac masca are dimensiunea NxN, rezultatul dat de relaia anterioar este acelai cu cel dat de
transformata Fourier invers a lui G(u,v):
Error! Objects cannot be created from editing field codes. (6.45)
unde u, v= 0, 1, 2, , N-1. Reducnd la zero termenii pentru care x>n i y>n, (n<N), se creeaz o
masc de convoluie nxn:
Error! Objects cannot be created from editing field codes. (6.46)
n continuare urmeaz a se determina coeficienii lui (x, y), astfel nct eroarea s fie
minim:

=
=
1
0
1
0
2
2
) , ( ) , (

N
u
N
v
v u H v u H e
(6.47)
Sub form vectorial se poate scrie:
h C H

=
(6.48)
unde este un vector coloan cu N
2
elemente ale lui (u, v), este un vector coloan de ordinul n
2

care conine elementele lui (x, y), iar C este o matrice N
2
xn
2
de termeni exponeniali. O procedur
simpl de generare a elementelor (i), 1 , 0
2
= N i , a lui din (u, v) este: (u, v) (i), unde
i= uH + v, u,v=0, 1, , N-1. Acest lucru se realizeaz mergnd succesiv n liniile lui (u, v), prin
punerea u=0, v=0, 1, , N-1; u>1; v=0, 1, , N-1 .a.m.d., ceea ce corespunde formrii primelor N
elemente ale lui din prima linie a lui (u, v), se continu apoi prin realizarea celor N elemente din
linia a doua etc. Elementele lui , notate cu (k), 1 , 0
2
= n k , sunt obinute n mod similar punnd
condiia (x, y) (k), pentru k=xn+y, cu 1 , 0 = = n y x . n final, elementele corespunztoare ale
matricei C, notate c(i,k), sunt generate de termenii exponeniali:
(1/N)exp[-2j(ux + vy)/N] C(i, k), (6.49)
ln FFT exp H(u,v) FFT
-1
f(x,y) g(x,y)
D(u,v)
H(u,v
)
p
s
s
j
63
pentru i=uN + v, k=nx+y, cu 1 , 0 , = N v u i 1 , 0 , = n y x . Sub form matriceal se poate scrie
astfel:
2 2
2

)

( * )

( H h C H H H H H H e = = = . (6.50)
Lund derivata parial i egalnd-o cu zero, se obine un minim al lui e
2
n raport cu :
. *

0 )

( * 2

2 2
H C h H h C C
h
e
= = =

(6.51)
Ultima ecuaie conduce la condiia necesar pentru eroare minim necesar construirii
mtii (x, y) de convoluie din funcia de filtrare specificat H(u, v) de dimensiune NxN. n
general elementele lui (x, y) sunt numere complexe, dar, dac n domeniul frecven funcia de
filtrare este real i simetric (aa cum s-a presupus la filtrele prezentate pn acum), atunci (x,y)
este tot real i simetric.

6.2.4. Operaii de transformare

n tehnicile de mbuntire a imaginii, care folosesc operaii de transformare, se realizeaz
operaii punctuale asupra imaginii transformate, dup care urmeaz transformarea invers (fig.
6.11).
Dintre operaiile care se aplic transformatei unei imagini menionm filtrarea liniar
generalizat, filtrarea neliniar, precum i filtrarea cepstrum i homomorfic.


Fig. 6.11 mbuntiri de imagini folosind transformri


Filtrarea liniar generalizat

Operaiile punctuale pe imaginea transformat sunt produse de forma:

(k, l) = g(k, l)* (k, l)


unde g(k, l) se numete masc zonal (este zero n afara regiunii respective).
Figura 6.12a reprezint mtile zonale corespunztoare filtrrii trece-jos, trece-sus i trece-
band pentru o transformare Fourier digital, iar figura 6.12b reprezint aceleai mti zonale
pentru alte tipuri de transformri ortogonale.
u(m,n) Transformare
unitar
AUA
T
Operaii
punctuale

Transformare
invers
A
-1
V[A
T
]
v(k,l) v(k,l) u(m,n)
64

Fig. 6.12 Mti zonale pentru filtrarea liniar generalizat

Un filtru de interes particular este filtrul gaussian invers, a crui masc zonal pentru o
imagine A de dimensiuni NxN este definit ca:


+
=
rest n l), - N k, - g(N
N/2 l k, a ,
2
exp
) , (
2
2 2

l k
l k g
(6.52)
unde imaginea A este transformat prin TFD. Pentru alte transformri ortogonale:
1 - N l k, 0 ,
2
exp ) , (
2
2 2

+
=

l k
l k g (6.53)
Aceste filtrri sunt de tip trece-sus, i sunt utilizate pentru refacerea imaginilor nceoate,
imagini care au fost afectate spre exemplu de turbulene atmosferice sau de alte fenomene ce pot fi
modelate analog.

Filtrare neliniar
n acest caz coeficienii transformrii (k, l) vor fi scrii ca: (k, l) = (k, l)e
j(k, l)
(6.54)
Pentru acest tip de filtrare se ia rdcina de ordin alfa a mrimii componentei (k, l) , n timp ce faza
se reine ca atare: 1 a 0 , ) , ( ) , ( '
) , (
=
l k j
a
e l k v l k v

(6.55)
Pentru imagini obinuite, dat fiind faptul c mrimea lui (k, l) este mai mic la frecvene
spaiale mari, efectul este de mbuntire a frecvenelor spaiale nalte, comparativ cu frecvenele
spaiale joase.

Filtrarea homomorfic i cepstrum generalizat
Dac modulul (k, l) se nlocuiete cu logaritmul lui (k, l) i se definete:
s(k, l) = [log (k, l)] e
j(k, l)
, (k, l) > 0 (6.56)
atunci transformarea invers a lui S(k, l), notat cu c(m,n) se numete transformat cepstrum
generalizat. n practic se adaug o constant pozitiv la (k,l) pentru ca logaritmul s nu tind
la minus infinit. Imaginea c(m,n) se mai numete i transformarea homomorfic generalizat K a
imaginii i are proprietatea c reduce dinamica imaginii n domeniul transformatei i o mrete n
domeniul cepstral. Algoritmul de prelucrare este dat n figura 6.13.

Fig. 6.13 Filtrarea homomorfic i cepstrum

AUA
T
[Logv(k,l)]e
je(k,l)
A
-1
S(A
T
)
-1
u(m,n) v(k,l) s(k,l) c(m,n)
65
7. Segmentarea imaginilor

Segmentarea imaginilor se refer la descompunerea unei scene (imagini) n componentele
sale. n urma procesului de segmentare vor fi extrase din imagine obiecte distincte, regiuni ce
satisfac anumite criterii de uniformitate, sau alte elemente.
n Digital Image Signal Processing de Wahl se propune o definiie matematizat a procesului
de segmentare, i anume segmentarea unei imagini f este definit ca partiionarea [complet] a lui f
ntr-un ansamblu de mulimi disjuncte nevide i conexe, ce satisfac fiecare un anumit criteriu,
criteriu ce nu mai este respectat pentru reuniunea oricror dou elemente ale partiiei.
Alegerea unei tehnici specifice de segmentare (partiionare a imaginii) este legat de mai
multe aspecte caracteristice imaginii de analizat i cerinelor utilizatorului. Dup natura i
coninutul imaginii, tehnicile de segmentare trebuie s in cont de prezena n imagine a diverse
categorii de artefacte:
reflexii, iluminare neomogen;
zgomot suprapus informaiei utile;
zone texturate
Dup primitivele de extras, tehnicile de segmentare se mpart n dou categorii fundamentale:
tehnicile de segmentare orientate pe regiuni i tehnicile de segmentare orientate pe contur.
Primitivele extrase din imagine sunt regiuni (forme) i zone texturate pentru tehnicile orientate pe
regiuni, sau entiti de tip discontinuitate (frontiere, segmente de dreapt, unghiuri) pentru tehnicile
orientate pe contur. n cadrul segmentrii orientate pe regiuni se disting cteva categorii principale
de tehnici:
etichetarea imaginilor binare
segmentarea pe histogram
creterea i fuziunea regiunilor
segmentarea texturilor
segmentarea prin metode de clustering
Tehnicile principale de segmentare orientata pe contururi sunt:
extragerea contururilor prin metode de gradient i derivative;
extragerea contururilor prin metode neliniare;
extragerea contururilor prin metode liniare optimale;
extragerea contururilor prin modelare matematic
n continuare vor fi prezentate doar o parte dintre aceste tehnici, cele care sunt considerate a fi
semnificative.

7.1. Segmentarea orientat pe regiuni
7.1.1. Segmentarea bazat pe histogram
n general, operaia de segmentare orientat pe regiuni urmrete extragerea din imagine a
zonelor (regiunilor) ocupate de diferitele obiecte prezente n scen. Un obiect se definete ca o
entitate caracterizat de un set de parametri ale cror valori nu se modific n diferitele puncte ce
aparin entitii considerate. Mai simplu, se poate spune c obiectul are proprietatea de uniformitate
a parametrilor de definiie.
Unul dintre cei mai simpli parametri de definiie este nivelul de gri al punctului. Nivelul de
gri, ce este preluat de senzorul de imagine i asociat luminanei imaginii, corespunde n scen unei
proprieti fizice (reflectan, transmitivitate etc.). n acest caz, histograma imaginii (funcia de
densitate de probabilitate a variabilei aleatoare discrete ale crei realizri sunt nivelele de gri din
imagine) reflect distribuia n scen a proprietii fizice nregistrate.
Caracteristicile histogramei se bazeaz pe histograma unei regiuni din imagine. Dac u este o
variabil aleatoare care reprezint nivelul de gri ntr-o anumit zon a imaginii, atunci se definete
66
probabilitatea p
u
(x)=p[u=x], respectiv numrul pixelilor cu nivel de gri x raportat la numrul total
al pixelilor din zon, pentru x=0,1,...,L-1.
Pentru o imagine f de MxN pixeli i L nivele de gri, histograma este definit ca probabilitatea
(frecvena relativ) de apariie n imagine a diferitelor nivele de gri posibile.

=
=
1
0
1
0
)) , ( (
1
) (
M
m
N
n
n m f i
MN
i h , i=0,1,...,L-1 (7.1)
Dac nivelul de gri (respectiv proprietatea fizic pe care acesta o reprezint) caracterizeaz
n mod suficient obiectele din scen, histograma imaginii va prezenta o structur de moduri
dominante - intervale de nivele de gri ce apar cu probabilitate mai mare. Fiecare asemenea mod
(maxim al histogramei) va reprezenta o anumit categorie de obiecte.
7.1.2. Tehnici de fixare a pragului (thresholding)
Separarea modurilor histogramei (i deci identificarea obiectelor din imagine) se face prin
alegerea unui nivel de gri T, numit prag de segmentare. Acest prag de segmentare se alege pe
minimul global al histogramei. Din imaginea iniial f de nivele de gri se construiete o imagine de
etichete (imagine etichetat) g.
( )
( )
( )

<
<
=
L n m f T E
T n m f E
n m g
, ,
, 0 ,
,
1
0
(7.2)
Imaginea etichetat va fi descris de dou etichete: E
0
pentru punctele al cror nivel de gri
este mai mic dect pragul T i E
1
pentru punctele al cror nivel de gri este mai mare dect pragul T.
Etichetele E
0
i E
1
pot fi valori numerice (0 i 1, sau 0 i 255) sau pot fi iruri de simboluri sau ali
identificatori. Aceast transformare este o transformare punctual (noua valoare din punctul (m,n)
depinde doar de valoarea anterioara din punctul (m,n)) i poart numele de binarizare. Aceasta
denumire provine din faptul ca rezultatul transformrii (imaginea etichetat) este o imagine binar -
deci o imagine caracterizat doar de dou valori. Se poate remarca de asemenea faptul c
binarizarea este un caz particular al transformrii de modificare liniar a contrastului, n care
limitele domeniilor de contrastare sunt egale (T
1
=T
2
) i contrastarea se face la valorile limit ale
nivelelor de gri (=0, =L-1).
Segmentarea pe histogram (numit i prguire sau thresholding) semnific determinarea unor
nivele de gri ce separ modurile histogramei. Tuturor punctelor din imagine al cror nivel de gri
corespunde unui acelai mod, li se asociaz o aceeai etichet (numr, ir de simboluri), rezultnd o
imagine etichetat, ce pune n evident diferitele obiecte ale scenei iniiale.
n cazul general al existenei mai multor praguri de segmentare T
k
, transformarea de
segmentare pe histogram este descris de:
g(m,n)=E
k
, dac ( )
1
,
+
<
k k
T n m f T , unde T
0
=0 , T
c
=L , k=0,1,...,C-1. (7.3)
Pragurile T
k
se aleg prin inspecia histogramei, n minimele locale ale acesteia. Acest tip de
segmentare multinivel este mai puin eficient dect binarizarea, din cauza dificultii de stabilire a
pragurilor care s izoleze eficient intervalele de interes din histogram, mai ales atunci cnd
numrul modurilor este mare. Trebuie de asemenea remarcat faptul c este necesar cunoaterea
numrului de tipuri de obiecte din imagine, pentru alegerea corespunztoare a numrului de praguri
de segmentare. n marea majoritate a cazurilor, segmentarea obinut nu este corect (exist regiuni
prost etichetate); ca o regul general de mbuntire a performanelor, se recomand aplicarea,
naintea segmentrii, a unor operaii de filtrare (eliminare a zgomotului), contrastare, mbuntire,
netezire a histogramei - numite preprocesri.
n general, se admite clasificarea metodelor de segmentare pe histogram dup atributele
global, local i dinamic. Aceste atribute se refera la modul de calcul al pragurilor de segmentare T
k

n funcie de nivelul de gri din fiecare punct al imaginii f(m,n), coordonatele punctelor din imagine
(m,n) i o anumit proprietate local p(m,n) a punctului (m,n), conform ecuaiei:
T
k
= T
k
( f(m,n) , p(m,n) , (m,n) ) (7.4)
67
Segmentarea se numete global dac pragurile depind doar de nivelele de gri ale
punctelor imaginii: T
k
= T
k
( f(m,n) ). Datorit acestui lucru se poate spune c segmentarea
multinivel este n mod evident o metod de tip global.
Segmentarea se numete local dac pragurile depind de nivelul de gri i de anumite
atribute locale calculate pentru vecinti ale fiecrui punct:
T
k
= T
k
( f(m,n) , p(m,n) ) (7.5)
Segmentarea se numete dinamic dac pragurile depind de poziionarea punctelor n imagine
(forma cea mai general a modului de deducere pragurilor).

7.1.3. Determinarea automat a pragurilor: metoda Bhattacharya
Metoda Bhattacharyya se bazeaz pe descompunerea histogramei n moduri individuale
Gaussiene, adic se ncearc exprimarea histogramei imaginii ca o sum ponderat de funcii de
densitate de probabilitate de tip normal (Gaussian). Modelarea modurilor histogramei imaginilor
prin distribuii normale este o presupunere ce se ntlnete n multe tehnici de prelucrare i analiz a
imaginilor. Aceasta pare a fi justificat din considerentul c imaginea provenind dintr-o imagine
ideal, n care fiecare tip de obiect este reprezentat de un unic nivel de gri, peste care s-a suprapus
un zgomot alb, aditiv, gaussian. n acest mod, mediile modurilor din histogram corespund
nivelelor de gri ce caracterizeaz obiectele scenei, iar variantele acestor moduri sunt determinate de
zgomotul suprapus imaginii (care nu este obligatoriu s afecteze n acelai mod toate nivelele de
gri).
Pentru segmentarea dup metoda Bhattacharyya nu este necesar precizarea unui numr de
clase (praguri de segmentare), acesta urmnd a fi determinat n mod automat.

( )( )
( )
2
2
2
1
,
k
k
x
k
k k
e
R
x N

=
(7.6)
Ideea de plecare a metodei este de a determina parametrii caracteristici ai unei distribuii
normale. Pentru o distribuie normal derivata logaritmului este:

( )
k k
k
k
k
k k
n x m
x
x
x N
+ = + =
2 2
, ln



(7.7)
Se observ prin examinarea expresiei de mai sus c derivata logaritmului distribuiei normale
este o dreapt de pant negativ, din ai crei parametri se pot deduce media i varianta distribuiei.
Parametrii statistici ai distribuiei sunt dai de ecuaiile de mai jos:

k
k
m
1
=
i
k
k
k
m
n
=
(7.8)
Aceast observaie poate fi aplicat i pentru o mixtur de distribuii normale. Dac se
consider c ca histograma h a imaginii este compus prin superpoziia aditiv a C moduri
gaussiene N(k, sk) , adic :

( ) ( )( )

=
=
C
k
k k k
x N w x h
1
,
(7.9)
Din parametrii dreptei se pot determina deci parametrii statistici ai distribuiei locale.Aadar,
pentru aplicarea metodei la segmentarea pe histogram a imaginilor, se va studia comportamentul
derivatei logaritmului histogramei, adic a funciei z(a):
( )
( )
( )
1 , 1 ,
1
ln =

= L a
a h
a h
a z (7.10)

Pentru funcia astfel construit, se determin intervalele pe care acesta este descresctoare;
limitele superioare ale acestor intervale sunt pragurile Tk de segmentare pe histogram.
68
Suplimentar, pe fiecare dintre aceste intervale se poate face o aproximare liniar a punctelor i pe
baza parametrilor dedui pentru dreapta de aproximare se pot calcula, parametrii statistici locali.
Principalele inconveniente ale metodei deriv din faptul c presupunerea alctuirii
histogramei imaginii numai din moduri gaussiene nu este ntotdeauna adevrat. Ca rezultat,
metoda Bhattacharrya va identifica un numr mai mare de praguri dect este necesar, producnd
fenomenul de suprasegmentare.

7.1.4. Segmentarea cu prag optim
Metoda de segmentare cu prag optim face apel la teoria deciziilor (criteriul de decizie Bayes)
pentru stabilirea valorii pragurilor de segmentare ce optimizeaz un anumit criteriu de eroare.
Informaiile apriori necesare pentru aplicarea unei asemenea tehnici sunt numrul de tipuri de
obiecte din imagine, C, procentele de ocupare a imaginii de ctre fiecare tip de obiecte, Pi i
distribuia nivelelor de gri ce caracterizeaz fiecare tip de obiect, pi(x). Atunci histograma imaginii
va fi determinata de mixtura distribuiilor tipurilor de obiecte:
( ) ( )

= =
= =
C
i
C
i
i i i
P x p P x h
1 1
1 , (7.11)
Cazul cel mai simplu i mai des folosit este cel al binarizrii, n care trebuie determinat un
unic prag T ce separ distribuiile celor dou tipuri de obiecte din imagine (n mod tipic, obiecte
utile i fundal). Criteriul ce se urmrete optimizat este eroarea de segmentare (clasificare) a
punctelor din imagine, adic este dat de numrul de pixeli ce aparin primului tip de obiect, dar au
nivelul de gri mai mare ca pragul T (fiind deci alocai greit celui de-al doilea tip de obiect) i
numrul de pixeli ce aparin celui de-al doilea tip de obiect, dar au nivelul de gri mai mic dect
pragul de segmentare T (fiind deci alocai greit primului tip de obiect). Aadar, eroarea de
segmentare va fi dat de:
( ) ( ) ( )

+

+ =
T
T
dx x p P dx x p P T E
2 2 1 1
(7.12)
Pragul optim va minimiza eroarea de segmentare a pixelilor. Minimizarea erorii conduce la
rezolvarea ecuaiei, n necunoscuta T:

( )
0 =

T
T E
(7.13)

Derivnd se obine forma echivalent a ecuaiei: ( ) ( ) T p P T p P
2 2 1 1
= .
Dup cum a fost menionat i n seciunea dedicat tehnicilor de segmentare ce nu folosesc
informaii apriori despre imagine (metoda Bhattacharyya), presupunerea c distribuia nivelelor de
gri a diferitelor tipuri de obiecte este de tip normal (Gaussian) este relativ des ntlnit. n aceste
condiii, distribuiile p1(x) i p2(x) sunt distribuii normale, N1(
1
,s
1
)(x) i N2(
2
,s
2
)(x), iar ecuaia
devine:

( ) ( )
2
2
2
2
2
1
2
1
2
2
2
2
1
1
2
1
2
1

=
T T
e P e P
(7.14)
Prin logaritmare, se obine urmtoarea ecuaie de gradul 2 n necunoscuta T:
0 ln 2 2
1 1
1 2
2 1
2
2
2
2
2
1
2
1
2
2
2
2
1
1
2
2
2
1
2
=
|
|
.
|

\
|
+
|
|
.
|

\
|

|
|
.
|

\
|

P
P
T T (7.15)
Una dintre simplificrile uzuale este presupunerea c s
1
=s
2
=s. Aceast presupunere implic
modelarea imaginii n nivele de gri ca o imagine cu doar dou nivele de gri
1
i
2
, afectat de un
zgomot Gaussian aditiv, avnd varianta s
2
. n aceste condiii, ecuaia de gradul 2 devine o ecuaie
liniar, a crei soluie este:
69

2
1
2 1
2
2 1
ln
2 P
P
T

+
= (7.16)
Metoda se poate extinde i pentru imagini ce conin mai mult de dou tipuri de obiecte. n
acest caz este ns necesar presupunerea suplimentar de localizare a modurilor, astfel nct s se
poat considera, ca i n cazul metodei Bhattacharyya, c influena fiecrui mod este limitat la
intervale nesuprapuse de nivele de gri.
7.1.5. Creterea i fuziunea regiunilor
Pentru aplicarea cu succes a tehnicilor de segmentare pe histogram prezentate anterior
trebuiesc ndeplinite neaprat cteva condiii (deja enunate). Aplicarea tehnicilor de segmentare pe
histogram este condiionat n primul rnd de reprezentarea diferitelor clase de obiecte din imagine
pe intervale de nivele de gri diferite care nu se suprapun (sau se suprapun parial pe poriuni foarte
mici). Apoi este necesar cunoaterea numrului de tipuri de obiecte diferite. Dar se presupune c
valorile prag corespunztoare se pot determina cu o precizie destul de mare.
Chiar dac toate aceste condiii enunate sunt ndeplinite, nu se poate garanta condiia de
conexitate a regiunilor obinute n urma segmentrii. Acest lucru este evident, att timp ct dou
obiecte de acelai tip, neconexe, primesc prin segmentarea pe histogram o aceeai etichet, i
formeaz n imaginea de etichete o regiune neconex. O metod care respect toate condiiile
impuse de definiia matematic a segmentrii este creterea regiunilor.

Creterea regiunilor

Principiul pe care se bazeaz creterea regiunilor este simplu: se aleg n imagine puncte
reprezentative pentru fiecare obiect individual i categorie de obiecte, pe baza crora are loc un
proces de aglomerare a pixelilor vecini acestora, ce au aceleai proprieti (n particular acelai
nivel de gri). n urma acestui proces de aglomerare (adugare de puncte) se obin zone (regiuni) de
pixeli cu aceleai caracteristici, deci obiecte individuale. Procesul se oprete n momentul n care
fiecare punct al imaginii a fost alocat unei regiuni. Evident, metoda astfel descris pe scurt, are doua
etape eseniale: alegerea punctelor de start (puncte iniiale), numite germeni sau semine, i
creterea propriu-zis a regiunilor.
Numrul final de regiuni rezultate este egal cu numrul de germeni alei iniial pentru
cretere. n principiu, este de dorit ca fiecare obiect individual aflat n imagine s fie marcat de cte
un germene. Dac n interiorul unui aceluiai obiect se gsesc mai muli germeni, pentru fiecare
dintre ei va fi crescut o regiune, iar acesta determin ca obiectul iniial s fie mprit artificial prin
segmentare n mai multe regiuni. Parial, acest neajuns se poate corecta printr-o etap ce urmeaz
creterii regiunilor, i anume fuziunea regiunilor adiacente ce au proprieti asemntoare. Dac n
interiorul unui obiect nu este ales nici un germene, obiectul respectiv va fi nglobat de regiunile ce
cresc pornind de la germeni din vecintatea sa spaial, iar astfel, respectivul obiect nu apare ca o
regiune distinct i este pierdut, rezultnd o eroare grav de segmentare.
Pentru a preveni efectul unor neuniformiti de iluminare pe suprafaa imaginii, aceasta este
mprit n ferestre nesuprapuse. n fiecare astfel de fereastr se alege un numr de germeni, al
cror plasament spaial este aleator (germenii se distribuie uniform pe suprafaa imaginii). Germenii
se aleg astfel nct nivelul lor de gri s fie reprezentativ pentru obiectele prezente local (deci nivelul
de gri al germenilor trebuie s corespund unor maxime ale histogramei locale). n plus, trebuie
verificat ca plasamentul spaial al germenilor s se fac n interiorul regiunilor i nu pe frontiera
acestora. Verificarea se poate face simplu pe baza calculului unui operator derivativ local, ca de
exemplu laplacianul, dac valoarea acestuia nu depete un anumit procent prestabilit (10% - 20%)
din diferena maxim de nivele de gri a ferestrei, punctul ales este considerat ca plasat corect.
O verificare suplimentar ncearc s previn o eventual suprasegmentare (mprirea
artificial a unui acelai obiect n mai multe regiuni), eliminnd germenii plasai n interiorul
aceluiai obiect. Verificarea se face pe baza calculului variaiei nivelelor de gri de-a lungul
drumurilor arbitrare ce unesc perechi de germeni. Daca exist o cale ce unete doi germeni de-a
70
lungul creia nivelul de gri nu variaz cu mai mult de 20% - 30% din diferena maxim a nivelelor
de gri din fereastr, cei doi germeni sunt plasai n interiorul unei zone de nivele de gri uniforme,
deci n interiorul unui acelai obiect. n aceste condiii unul dintre cei doi germeni ai perechii este
eliminat, deoarece este redundant. Dac de-a lungul tuturor cilor ce unesc perechea de germeni
nivelul de gri variaz mai mult dect pragul ales, atunci se consider c cei doi germeni sunt plasai
n interiorul unor obiecte diferite (deoarece cile ce unesc germenii traverseaz regiuni de frontier).
n practic, examinarea tuturor drumurilor (cilor) ce unesc perechi de germeni este extrem de
costisitoare din punctul de vedere al timpului de calcul. De aceea se verific doar cile formate din
segmente verticale i orizontale, i eventual, dreapta ce unete cele dou puncte (dac aceast
dreapt poate fi reprezentat de o secven de puncte conexe).
Valorile procentuale ale pragurilor de comparaie, precum i numrul de germeni distinci ce
rmn dup procesul de reducere, nu trebuie considerate ca fixe; nu exist valori standardizate i
alegerea acestora se face pe baza condiiilor particulare (legate de coninutul imaginii) i a
experienei utilizatorului.
Pornind de la germenii alei, regiunile sunt obinute printr-un proces de cretere aproape
simultan, nceput de la acetia, pn cnd toi pixelii imaginii sunt repartizai unei regiuni. Cvasi-
simultaneitatea creterii poate fi realizat cu un algoritm serial, prin alocarea pixelilor ce sunt
adiaceni (vecini) zonelor deja segmentate. Aceast alocare trebuie s in seama de criteriul ca
regiunile crescute s fie uniforme: nivelul de gri al pixelului ce se adaug nu trebuie s difere cu
mai mult de un prag prestabilit fa de nivelul de gri al germenului regiunii la care se aloc. n
acelai timp, la o singura trecere, numrul de puncte ce se adaug unei regiuni nu poate depi un
numr prestabilit (condiia ncearc s asigure creterea relativ uniform i izotrop a tuturor
regiunilor).
Dac adugarea de noi pixeli se blocheaz (criteriul de uniformitate nu mai este respectat),
diferena maxim admis pentru nivelul de gri poate fi crescut n etape, pn la epuizarea pixelilor
imaginii.
Avantajele pe care le are o asemenea tehnic de cretere a regiunilor sunt acelea c nu mai
este necesar nici o informaie privind coninutul imaginii, regiunile crescute sunt conexe i nu
exist puncte neetichetate (nealocate vreunei regiuni) i poziia frontierelor dintre diferitele regiuni
corespunde poziiei frontierelor percepute subiectiv n imagine.

Fuziunea regiunilor

O extindere a principiului utilizat n creterea regiunilor, i anume adugarea la o regiune a
unor entiti (pixeli n acest caz) a cror proprieti sunt similare cu cele ale obiectului de baz
(regiunea), se afl la baza tehnicilor de fuziune a regiunilor. Fuziunea regiunilor const n reunirea
iterativ a regiunilor adiacente (ncepnd de la nivelul unor entiti atomice ale imaginii - deci
pixelii) pn cnd regiunile adiacente devin suficient de diferite. Procesul de fuziune a regiunilor
poate fi aplicat i n urma unei creteri a regiunilor, pentru a nltura efectele unei eventuale
suprasegmentri. Exist mai multe criterii de fuziune a regiunilor adiacente, a cror aciune de
verificare a deosebirii ntre regiuni se face fie prin inspecia frontierei comune, fie prin
caracterizarea interiorului regiunii.
Pentru dou regiuni adiacente R
i
i R
j
, al cror perimetru este Perim(R
i
) i Perim(R
j
), putem
determina P
m
=min (Perim(R
i
), Perim(R
j
)) i P lungimea frontierei comune. Pe aceast frontier
comun se disting puncte slabe (n
s
) i puncte tari (n
t
). Un punct slab este acel punct pentru care
diferena nivelelor de gri ntre vecinii din regiunile adiacente este foarte mic (mai mic dect un
anumit prag fixat). Un punct tare este acel punct pentru care diferena de nivele de gri ntre vecinii
din regiunile adiacente este foarte mare (mai mare ca un anumit prag fixat). Cu aceste notaii,
criteriile de fuziune a regiunilor R
i
i R
j
sunt:
dac numrul de puncte slabe raportat la perimetrul minim este important, n
s
/P
m
>q
1

dac numrul de puncte slabe de pe frontiera comun este mare, n
s
/P>q
2

dac numrul de puncte tari de pe frontiera comun este mic, n
t
/P<q
3
.
71
Parametrul q
1
controleaz dimensiunea regiunilor ce se unesc i se alege n general cu
valoarea 0.5 (de exemplu o valoare apropiata de 1 implic unirea a dou regiuni numai dac una
dintre ele este aproape nconjurat de cealalt). Valori tipice pentru parametrii q
2
i q
3
sunt 0.75 i
0.2.
Abordarea fuziunii pe baza caracterizrii interiorului regiunilor necesit definirea a dou
componente: o modalitate de caracterizare a proprietilor regiunilor i o modalitate de a defini
apropierea sau similaritatea dintre trsturi n termeni numerici. Vectorul de trsturi ce
caracterizeaz o regiune se compune din momente statistice ale variabilei aleatoare ale crei
realizri particulare sunt nivelele de gri din regiunea respectiv, nu pot lipsi din acest vector nivelul
de gri mediu al regiunii i varianta acestuia.
7.2. Segmentarea orientat pe contururi

ntr-o imagine, variaiile de valoare ale pixelilor reprezint schimbri ale proprietilor fizice
sau geometrice ale scenei sau ale obiectului observat. Aceste schimbri pot corespunde fizic la
variaiile iluminrii, la schimbrile de orientare sau de distana fa de observator, schimbri de
reflectan ale suprafeelor, variaii de absorbie a radiaiei. ntr-un numr mare de cazuri, aceste
variaii de intensitate sunt informaii importante pentru operaiile ce urmeaz segmentrii, informaii
ce corespund frontierelor regiunilor determinate de obiectele scenei.
7.2.1. Metode derivative
Principiul acestei metode const n definirea punctelor de contur ca fiind acei pixeli ai
imaginii n care apar schimbri importante (abrupte) ale nivelului de gri. Deci, msurarea acestei
variaii se va face prin operatori derivativi de tip gradient.
Pentru o imagine cu suport spaial continuu, pe direcia unei muchii, derivata va fi maxim.
Derivata imaginii pe direcia r, ce face unghiul cu orizontala, este dat de combinaia liniar a
derivatelor pariale pe direciile orizontal i vertical:
sin cos
y
f
x
f
r f
y f
r x
x f
r
f

=


+


=


sin cos
y x
f f
r
f
+ =

(7.17)
Valoarea maxim a acestei derivate, calculate dup unghiul este determinat de ecuaia :
0 cos sin = + =
|
.
|

\
|

y x
f f
r
f
ce are soluia evident:
|
|
.
|

\
|
=
x
y
f
f
arctg
0
(7.18)
Pe aceast direcie, modulul gradientului este:
2 2
max
y x
f f
r
f
+ =
|
.
|

\
|

(7.19)
Din punct de vedere practic, implementarea acestei metode implic calcularea, pentru fiecare
punct al imaginii, derivatelor pariale f
x
i f
y
, calcularea modulului gradientului maxim i a direciei
acestuia. Valoarea gradientului maxim din fiecare punct al imaginii este apoi comparat cu un prag
fixat: dac pragul este depit (deci gradientul maxim n pixelul respectiv este suficient de
important) atunci pixelul testat este pixel de contur.
Realizarea derivatelor pariale dup direciile orizontal i vertical implic translaia n
discret a lui f
x
i f
y
:
( )
m
n m f
x
f
f
x

=
,
,
( )
n
n m f
y
f
f
y

=
,
(7.20)
Aceste derivate pariale discrete pot avea mai multe implementri:
f
x
= f(m,n) - f(m+1,n), f
y
= f(m,n) - f(m,n+1)
f
x
= f(m-1,n) - f(m,n), f
y
= f(m,n-1) - f(m,n) (7.21)
f
x
= f(m-1,n) - f(m+1,n), f
y
= f(m,n-1) - f(m,n+1)
72
Toate expresiile date sunt combinaii liniare ale valorilor unor pixeli din imagine, situai n
vecintatea pixelului curent din poziia (m,n). Deci toate aceste operaii se pot realiza prin filtrri
liniare cu mti potrivite:
( )
|
|
.
|

\
|

= =
1
1
, 1 1
y x
W W ( )
|
|
|
.
|

\
|

= =
1
0
1
, 1 0 1
y x
W W ( )
|
|
.
|

\
|
= =
1
1
, 1 1
y x
W W (7.22)
Harta de orientri este o imagine care conine, pentru fiecare pixel, orientarea gradientului de
modul maxim n punctul respectiv, i n general este folosit la prelucrarea suplimentar a
contururilor (conectare de contururi, extragere direcional de contururi). Harta de contururi este o
imagine binar n care punctele marcate (puncte-obiect) corespund poziiei punctelor de contur
(puncte cu gradient de modul mare). O simplificare uzual practicata este nlocuirea normei L2 din
calculul modulului maxim al gradientului cu norma L1, ceea ce conduce la aproximarea:

y x
f f
r
f
+ = |
.
|

\
|

max
(7.23)
Folosirea mtilor de derivare pe vertical i orizontal prezentate are ns serioase
neajunsuri: dimensiunea lor mic face ca rezultatele s fie extrem de sensibile n prezena
zgomotului. n aceste condiii a aprut natural ideea de a combina filtrarea de derivare cu o filtrare
de netezire, care s mai reduc efectele zgomotului. Considernd zgomotul de tip gaussian, aditiv,
filtrarea de netezire are ca efect secundar micorarea contrastului frontierelor obiectelor din imagine
(efectul de nceoare, sau blur). Pentru ca n aceste condiii detecia contururilor s nu fie afectat,
trebuie ca operaia de mediere prin care se realizeaz netezirea s se fac pe o direcie
perpendicular direciei contururilor cutate. Atunci derivarea pe vertical se combin cu o operaie
de netezire cu masca orizontal ( ) 3 / 1 3 / 1 3 / 1 i derivarea pe orizontala se combin cu o operaie
de netezire cu masca vertical
|
|
|
.
|

\
|
3 / 1
3 / 1
3 / 1
.
Dac se folosete pentru derivare masca W
y
, masca de filtrare rezultant va fi:

|
|
.
|

\
|
3 / 1
3 / 1
3 / 1
3 / 1
3 / 1
3 / 1
(7.24)
n cazul general se pot folosi pentru netezire medieri ponderate (i nu neaprat medieri
aritmetice), care s acorde o mai mare importan pixelului curent prelucrat, ca de exemplu
( ) 1 1 2 / 1 c c + i se prefer folosirea operatorilor de derivare simetrici. Ceea ce rezult pentru
operatorii de derivare orizontal i vertical sunt mtile:

|
|
|
.
|

\
|

=
1 0 1
0
1 0 1
c c W
x

|
|
|
.
|

\
|

=
1 1
0 0 0
1 1
c
c
W
y
(7.25)
Prin particularizarea valorilor constantei de ponderare c se pot obine diferite tipuri de
operatori de extragere de contur clasici: Prewitt (c=1), Izotrop (c=2), Sobel (c=2). Se remarc faptul
c, constanta de ponderare global a mtii de filtrare este neesenial, ntruct condiia de normare
ce trebuie ndeplinit este cea pentru filtre de contrastare (derivare): suma coeficienilor mtii s fie
nul.
Informaia de orientare este n general folosit n etapele urmtoare ale prelucrrii. Unghiurile
determinate ofer un unghi exact al direciei conturului n punctul curent, calculat cu un efort
semnificativ de calcul (mprire i calcul de arctg). n practic, aceast informaie este prea exact:
pe grila ptrat de eantionare nu se pot reprezenta cu uurin drepte continue dup orice direcie.
73
Cteva direcii sunt favorizate i uor de utilizat (vertical, orizontal, cele dou diagonale). n acest
caz se poate msura n fiecare punct, modulul gradientului dup aceste cteva direcii importante, i
apoi se poate alege direcia dup care acest modul este maxim. Acesta este principul operatorilor
compas.
Un operator compas este definit de un numr de mti de derivare (corespunztoare n
continuare unor filtrri liniare) pe direciile principale (vertical, orizontal, cele dou diagonale), n
cele dou sensuri. Compasul clasic are D=8 mti de filtrare (identice dou cte dou, mai puin
semnul), fiecare dintre ele realiznd o derivare dup o direcie multiplu de 45. Se remarc faptul
ca, odat determinat valoarea maxim a modulului gradientului n pixelul curent (m,n), obinerea
harii de contururi se face ca i la un operator de gradient clasic.
Un exemplu de mti de derivare direcional sunt mtile urmtoare (indexate dup direcia
geografic pe care se calculeaz derivata):
W
N
=[-1 -1 -1; 0 0 0; 1 1 1];
W
NV
=[-1 -1 0; -1 0 1; 0 1 1];
W
V
=[-1 0 1; -1 0 1; -1 0 1];
W
SV
=[0 1 1; -1 0 1; -1 -1 0];
W
S
=[1 1 1; 0 0 0; -1 -1 -1];
W
SE
=[1 1 0; 1 0 -1; 0 -1 -1];
W
NE
=[0 -1 -1; 1 0 -1; 1 1 0];
W
E
=[1 0 -1; 1 0 -1; 1 0 -1];
Dup cum se remarc, familia de mti se poate genera pornind de la una dintre mtile
Prewitt, prin translaii circulare cu o poziie a frontierei mtii n jurul centrului ei; n mod analog se
pot obine operatori compas bazai pe masca Sobel sau pe gradientul izotrop sau pe masca Kirsch:
[5 5 5; -3 0 -3; -3 -3 -3].
Precizia unghiular a operatorilor compas este deci determinat de numrul de orientri
diferite pe care se calculeaz derivatele, i deci de numrul de translaii ale frontierei mtii. Pentru
o masc ptrat de baz, de dimensiune N, precizia unghiulara a operatorului compas este de 90
/(N-1).
Unul dintre principalele dezavantaje ale metodelor de gradient este precizia slab de
localizare a conturului (a centrului tranziiei) n condiiile unei pante puin abrupte a acestuia
(tranziii slabe, graduale). Derivata a doua poate fi ns folosit pentru a determina capetele
tranziiei (cele dou extreme), sau pentru a marca centrul tranziiei (trecerea sa prin zero).
Metodele prezentate mai sus sunt utile mai ales pentru tranziii brute ale nivelelor de gri, ca
n cazul funciilor-treapt (salturi alb-negru sau invers).
Dac regiunea de tranziie este mai larg (saltul este mai lin), este mai avantajos s se
foloseasc derivatele de ordin doi n locul gradienilor. Un operator des ntlnit este operatorul
Laplace, definit ca:

2
2
2
2
2
y
f
x
f
f

= (7.26)
Operatorul Laplace poate fi aproximat, n varianta discret, sub forma unei matrici centrate n
jurul elementului asupra cruia se aplic:

|
|
|
.
|

\
|



0 1 0
1 4 1
0 1 0

|
|
|
.
|

\
|



1 1 1
1 8 1
1 1 1

|
|
|
.
|

\
|



1 2 1
2 4 2
1 2 1
(7.27)

Datorit derivatei de ordinul doi, acest operator este mai sensibil la zgomot dect cei definii
anterior. De asemenea, la extragerea conturului prin limitare cu prag se vor obine contururi duble.
Din aceste motive i, totodat, deoarece nu este capabil s detecteze direcia contururilor, operatorul
Laplace ca atare nu este foarte des utilizat. O modalitate mai bun o constituie folosirea trecerilor
prin zero pentru detecia locaiilor conturului sau muchiei. Un operator laplacian generalizat, care
74
aproximeaz laplacianul funciilor gausiene (LOG) este foarte potrivit pentru detecia trecerilor prin
zero. El se definete ca:
( )
( )
|
|
.
|

\
| +

(

+
=
2
2 2
2
2 2
2
exp 1 ,

n m n m
c n m h (7.28)
unde controleaz limea funciei gaussiene, iar c realizeaz o normalizare a sumei elementelor
mtii date la valoarea unitar. Trecerile prin zero ale unei imagini, convoluionate cu h(m,n), vor
da locaiile muchiilor.
Operatorul h(m,n) reprezint rspunsul eantionat la impuls al unui filtru analogic trece-
band, a crui rspuns n frecven este proporional cu: ( ) ( ) | |
2
2
2
1
2 2
2
2
1
2 exp + + (7.29)
Din aceast cauz, detectorul de treceri prin zero este echivalent cu un filtru trece-jos avnd
un rspuns la impuls de tip gaussian, urmat de un operator Laplace. Filtru trece-jos este util pentru
atenuarea sensibilitii la zgomot a operatorului Laplacian, iar parametru controleaz rspunsul n
amplitudine al filtrului, dar nu afecteaz locaia trecerii prin zero.
O informaie util referitoare la direcia muchiilor se poate obine cutnd trecerile prin zero
ale derivatei de ordinul doi de-a lungul unei drepte r, pentru fiecare direcie posibil :

2
2
2 2
2
2
2
2
2
sin cos sin 2 cos sin cos
y
f
y x
f
x
f
r
f
r
f
r
f
y
x

(7.30)
Trecerile prin zero vor fi cutate prin modificarea unghiului .

7.2.2. Metoda filtrelor trece-sus
Contururile pot fi accentuate utiliznd un filtru trece-sus, caracterizat prin funcia de transfer
H(
x
,
y
), deoarece schimbrile de strlucire corespund frecvenelor spaiale
x
i
y
nalte. Metoda
prezint unele dezavantaje importante care o fac neutilizabil la sistemele uzuale:
a) volum mare de calcul;
b) nu furnizeaz indicaii cu privire la proprietile locale ale imaginii;
c) accentueaz zgomotul mai mult dect metodele locale.

7.2.3. Extragerea conturului din imagini binarizate
n cazul imaginilor (alb-negru) binare, extragerea conturului poate fi fcut utiliznd
algoritmi simpli i rapizi bazai pe funcii logice. Matricea care reprezint imaginea binarizat
este baleiat pe linii i pe coloane n vederea detectrii salturilor 01 sau 10 i n final se
obine o nou imagine binar ale crei elemente C(i,j) au valoarea 1 dac punctul respectiv
aparine conturului i 0 n rest. Baleerea se face cu o fereastr centrat n punctul (i,j). Valoarea
central se nlocuiete cu:
( ) ( )
I U U U 3 1 2 2 2 2
' , b b c a b b j i C = = (7.31)
Aplicarea algoritmului de mai sus introduce erori n cazul unghiurilor drepte ce au laturile
paralele cu axele i corespund unor poriuni convexe.
Un alt exemplu de algoritm de extragere a liniilor de contrast din imaginea binarizat
nlocuiete b
2
cu valoarea logic 1, iar dac b
2
= 1 i exist cel puin un element nul n vecintatea
pixelului prelucrat C(i,j)=0. n acest caz, funcia logic ce caracterizeaz filtru de extragere a
conturului este dat de relaia:
( )
I U U U U U U U
3 '
2 1 3 1 3 2 1 2 2
c c c b b a a a b b = (7.32)
Algoritmul de mai sus dubleaz liniile de contrast nclinate la 45
0
ceea ce poate avea efecte
negative la calculul unor trsturi geometrice (perimetrul). n acest caz este necesar subierea
conturului.
Se constat c algoritmul nu introduce erori importante n interpretarea imaginii.
75
8. Analiza de imagine

Distincia dintre prelucrarea imaginilor i analiza imaginilor const n faptul c cea de a doua se
ocup cu extragerea informaiilor din imagine,n timp ce prelucrarea imaginilor este tiina care se
ocup cu rearanjarea imaginilor. Valorile pixelilor pot fi alterate datorit pixelilor vecini, datorit
strlucirii acestora sau dac locul lor n cadrul matricii a fost schimbat, dar cantitatea de pixeli
rmne aceeai pe durata prelucrrii imaginii. n schimb, analiza imaginilor ncearc s gseasc
acei parametrii descriptivi, de obicei numerici, care reprezint acea informaie important din
imagine.
Msurrile care pot fi executate asupra filmelor de imagini pot fi grupate n patru clase,
msurri asupra strlucirii, locaiei, mrimii i formei. Pentru fiecare clas n parte se pot realiza o
mare varietate de msurtori i, n acelai timp, exist o mulime de ci diferite pentru realizarea
acestor operaii. Cele mai multe sisteme de analiz ofer cel puin cteva tipuri de msurtori pentru
fiecare clas precizat. n procesul de analiz, operatorii gsesc la un moment dat singuri aceste
operaii, innd cont de faptul c lucreaz cu diferii parametrii care trebuie msurai. Dup cum am
precizat anterior, cele mai multe tehnici produc un rspuns numeric pentru o analiz statistic sau
pentru o reprezentare grafic. De cele mai multe ori interpretarea datelor rmne pentru un alt
program. n puine cazuri numerele sunt convertite n decizii de a face/a nu face ceva.
Extragerea caracteristicilor imaginii presupune separarea caracteristicilor spaiale, a
caracteristicilor de tip transformare, separarea muchiilor i contururilor, a caracteristicilor de form,
de textur i a caracteristicilor statice ale imaginii. Segmentarea imaginii presupune identificarea
modelului, detecia de contur, clasificarea i gruparea obiectelor etc. Clasificarea i descrierea
obiectelor dintr-o imagine presupune gruparea acestora, statistica i realizarea de arbori decizionali,
msurarea similaritii cu imaginea iniial.
8.1 Msurarea imaginilor
8.1.1 Msurarea strlucirii
Dup cum s-a prezentat n primul capitol al acestei cri, fiecare pixel dintr-o imagine are o
anumit valoare numeric, care, de cele mai multe ori, este strlucirea punctului corespunztor din
scena original. Cteva astfel de valori pot fi combinate pentru a reprezenta informaia color. Cel
mai folosit domeniu al valorilor strlucirii este de la 0 la 255 (pe 8 bii), dar depinde de tipul
camerei foto, al scanner-ului sau al altui echipament care poate s lucreze pe 10 sau chiar pe 16 bii
(de la 0 la 65535). Rareori, valorile stocate pot fi numere reale n locul numerelor ntregi. Oricum,
n cele mai multe cazuri, aceste imagini sunt stocate i cu un set discret de valori gri, deoarece
este mai uor s lucrezi cu asemenea iruri i s le converteti apoi pentru a le arta. n aceste cazuri
o matrice calibrat sau o funcie este inut pentru a converti valorile ntregi la valorile reale
asociate cnd este nevoie.
Procesul de a crea o asemenea funcie calibrat pentru o anumit imagine nu este deloc uor.
Multe camere foto sau alte dispozitive care achiziioneaz imagini nu sunt liniare sau logaritmice,
dar n acelai timp nici nu au o consisten complet a relaiei dintre valoarea numeric a pixelului
i valoarea semnalului de la intrare. Prezena circuitelor automate de ctig sau a adaptoarelor de
control de ctre utilizator, face mai dificil stabilirea i meninerea oricrui tip de calibrare. Chiar i
atunci cnd poate fi folosit o surs stabil de lumin i o camer care poate fi acordat, rmne
problema calibrrii. Msurarea strlucirii unei regiuni dintr-o prob poate fi folosit destul de des
pentru a ine un sistem calibrat. n scanarea unor suprafee simple este practic s se ncorporeze
cteva standarde de densitate pentru ca aceast calibrare s se realizeze direct. Densitate optim este
definit ca fiind:
0
10
.
I
I
Log D O = , unde
0
I
I
este raportul din lumina incident care penetreaz fr
a fi absorbit sau mprtiat. Dac se folosete o camer foto sau un scanner i o surs de lumin
76
aleas cu grij astfel nct toate valorile strlucirii converg n ranguri ale densitii de la 0,1 la 2,5
atunci, rezultatul calibrrii strlucirii, folosind densitatea optic, este prezentat n figura 8.1.


Fig.8.1 Strlucirea pixelilor

Cnd imaginile color sunt digitizate, se amplific problema de a avea destui bii pentru a da o
precizie suficient pentru fiecare plan de culoare. Multe dintre scanner-ele de ultim generaie
folosesc mai mult de 8 bii pentru planurile RGB, i folosesc pentru a determina informaia color i,
apoi creeaz o reprezentare pe 8 bii optimizat pe care o transmit calculatorului. Dar, chiar i cu
aceast cretere a preciziei, este dificil s achiziionezi reprezentri color exacte.
Valorile strlucirii pixelilor nu trebuie s fie densiti optice ci, bineneles, componente
informaionale color. Imaginile sunt att de folositoare pentru a transmite informaii oamenilor nct
sunt folosite pentru toate tipurile de date. n imaginile cu raze X de la SEM, valorile strlucirii sunt
aproximativ proporionale cu concentraia elementelor. Aceste relaii nu sunt neaprat liniare i nici
nu sunt uor de calibrat.
n imaginile n infrarou, strlucirea reprezint o msur a temperaturii. Imaginile cu
mprtierea retrograd a electronilor de la microscopul pentru scanarea electronilor au valori ale
strlucirii care cresc prin nsumarea numrului atomic, deci pot fi folosite pentru a determina
compoziia chimic a unei probe de substan.
Aceste exemple sunt unele din multele cazuri n care se pot folosi valorile pixelilor pentru a
determina unele caracteristici ale componentelor care apar n imagine. Dar, o tehnic des folosit
pentru analiza informaiilor coninute ntr-o imagine o reprezint msurarea valorilor stocate i
conversia lor pe o scal calibrat. Analiza statistic a datelor folosete valoarea medie i deviaia
standard, direcia poziiei, sau comparaii ntre locaiile punctelor din cadrul aceleiai imagini sau
dintre imagini diferite. Pentru o asemenea metod de lucru este important s fie stabilit o curb de
calibrare folositoare, care s cear standarde i/sau cunotine fundamentale.
8.1.2 Determinarea locaiei
n unele exemple de msurare a valorii strlucirii, este necesar determinarea locaiei figurii
pentru a se putea realiza interpretarea rezultatelor. Pentru o figur neregulat care se ntinde peste
mai muli pixeli exist mai multe definiii diferite ale locaiei, unele mai uor de calculat dect
altele. De exemplu, coordonatele (x,y) ale punctului din centrul unei figuri pot fi determinate simplu
ca jumtate dintre limitele maxim i minim a pixelilor din figur. Normal i adresele pixelilor
sunt valori ntregi care numeroteaz poziia, cel mai des ncepnd din colul stnga sus al matricii.
Aceast convenie este dat de modul n care lucreaz cele mai multe calculatoare, folosind o
baleiere care ncepe din colul stnga sus.
77
Limitele maxim i minim ale unei figuri sunt uor de determinat prin gsirea pixelilor cu cea
mai mare/mai mic valoare a coordonatelor pe orizontal i vertical. Aceste coordonate limit
definesc o grani rectangular n jurul figurii i punctul din centrul acestui chenar este luat ca i
locaie pentru figura nscris. Oricum, centrul nu este o reprezentare preferat a locaiei. O aplicaie
n care aceste coordonate ale graniei rectangulare sunt folosite este programul de desen pe
calculator. Multe din aceste programe permit utilizatorului s selecteze un numr de obiecte de
desenat i apoi le mut automat ntr-un chenar. Opiunile sunt tipice pentru a alinia obiectele
vertical dup muchiile (punctele) de sus, din centru sau de jos, i orizontal dup punctele din stnga,
din centru sau din dreapta. Acestea sunt exact coordonatele chenarelor rectangulare n care sunt
nscrise figurile i centrul acestora.
Pentru figurile neregulate este preferabil de luat n calcul ntreaga figur i locaia tuturor
pixelilor. Aceast aproximare definete centrul de greutate al figurii, un punct unic (x,y) care se va
folosi pentru a indica cu precizie refacerea figurii n cazul n care aceasta a fost tiat. Coordonatele
acestui punct pot fi determinate prin nsumarea coordonatelor fiecrui pixel din obiect:
aria
x
CG
i
x

= ,
aria
y
CG
i
y

= unde aria reprezint numrul total al pixelilor din figur. De reinut
este faptul c aceste ecuaii dau coordonate care nu sunt n general numere ntregi. Dac figura a
fost segmentat, nu intereseaz dect pixelii de pe contur pentru a calcula centrul de greutate i,
bineneles, toate aceste operaii sunt fcute de ctre calculator. Dac centrul de greutate este
calculat cu ajutorul ecuaiilor prezentate mai sus i folosind numai pixelii de pe contur, rezultatul va
fi probabil greit. Punctul calculat va fi influenat de acea parte a conturului care este mai complex
i conine mai muli pixeli(fig.8.2). Aceast influenare poate varia i cu orientarea conturului cu
referire la irul de pixeli, pentru c pixelii ptrai sunt mai mari pe diagonal dect n lime.


Fig.8.2 Coordonatele centrului de greutate, pentru o
figur neregulat, sunt calculate corect n primul caz
folosindu-se toi pixelii din imagine. Folosindu-se
doar cei de pe contur se obin o localizare eronat a
centrului de greutate










Calcularea corect a centrului de greutate poate fi realizat dac s-a reprezentat conturul sub
forma unui ir de valori. Astfel c, pentru a calcula corect coordonatele centrului de greutate, se
folosesc perechi de coordonate x
i
, y
i
pentru fiecare punct de pe contur, iar x
o
, y
o
sunt aceleai cu x
n
,
y
n
dac este un contur nchis.

aria
y y x x
CG
i
i i i i
x

+
=
) ( ) (
1
2
1

aria
x x y y
CG
i
i i i i
y
+
+
=
) ( ) (
1
2
1
(8.1)
i este necesar s se calculeze
2
) ( ) (
1 1
+
=
i
i i i i
y y x x
aria (8.2)

78
Aceast definiie dat centrului de greutate trateaz fiecare pixel din figur n mod egal. Pentru
anumite scopuri, strlucirea pixelilor, sau o valoare calculat din caracteristica de calibrare, fac
anumii pixeli mai importani dect alii. De exemplu, pentru a stabili poziia exact a liniilor i a
petelor ntr-o imagine de intensitate se pot modifica ecuaiile de mai sus astfel:


=
i
i
i
i i
X
valoare
x valoare
CG


=
t
t
t
t
t
y
valoare
y valoare
CG (8.3)
Numitorul este n acest caz o densitate integrat. Bineneles, pentru a realiza acest calcul,
trebuie avut acces la valorile strlucirii pixelilor pentru fiecare n parte, deci nu pot fi folosite aceste
ecuaii n cazul n care exist o reprezentare a conturului figurii.

8.1.3 Orientarea
Alturi de determinarea locaiei centrului de greutate a unei figuri este i ideea de a determina
orientarea ei. Exist diferii parametrii care sunt folosii, incluznd i orientarea celei mai lungi
dimensiuni din figur (linia dintre dou puncte de pe margine care sunt cele mai deprtate,
cunoscut i sub denumirea de diametrul maxim Feret), i orientarea axelor principale ale unei
elipse tangent la conturul figurii. Dar, aa cum este centrul de greutate un descriptor mai robust
dect punctul mediu, i o orientare definit de toi pixelii din imagine este, de cele mai multe ori,
mai bun dect oricare dintre caracteristicile enumerate anterior. Acest lucru se realizeaz deoarece
este foarte puin influenat de prezena sau absena unui singur pixel de pe contur, acolo unde
accidentele de achiziionare sau zgomotul pot face alterri ale conturului.
Axa de moment a unei figuri este linia n jurul creia figura, dac ar fi tiat uniform i drept, ar
avea cel mai mic moment de rotaie. Poate fi descris de asemenea ca fiind axa care descrie cel mai
bine toi pixelii n sensul c, suma ptratelor distanelor de la fiecare pixel la ax este minimizat.
Acesta este i criteriul folosit pentru potrivirea liniilor i a punctelor care conin date n procesul de
construcie a grafurilor. Determinarea acestei axe i a unghiului ei de orientare este direct i,
implic suma coordonatelor pixelilor i produsul coordonatelor pixelilor pentru toi pixelii din
imagine. De exemplu, n ecuaia prezentat mai sus este posibil s ncarci fiecare pixel cu o valoare,
n loc s lai pe fiecare s influeneze n mod egal rezultatul. Cea mai convenabil metod de calcul
este s aduni i s formezi o list de sume dup cum sunt prezentate n ecuaia 7.4.

=
i x
x S ,

=
i y
y S ,

=
2
i xx
x S ,

=
2
i yy
y S ,

=
i i xy
y x S (8.4)

Odat ce aceste sume au fost calculate pentru o figur, momentul axelor x i y, i unghiul
momentului minim se calculeaz dup cum se arat in ecuaia 7.5.

aria
S
S M
x
xx xx
2
= ,
aria
S
S M
y
yy yy
2
= ,
aria
S S
S M
y x
xy xy

=
}
2
4 ) (
{ tan
2 2
1
xy
xy yy xx yy xx
M
M M M M M

+ +
=

(8.5)

Aliniamentul

Un lucru pe care oamenii l vd foarte repede ntr-o imagine, i care nu este foarte uor de gsit
folosind un algoritm de ctre calculator, este aliniamentul i aranjarea figurilor. Suntem att de buni
la aceste lucruri nct uneori gsim aliniamente i aranjamente, cnd acestea nici mcar nu exist.
Constelaiile de pe cer sunt un bun exemplu a acestei ncercri de a gsi o ordine n dezordine.
Sunt multe situaii de analiz de imagini n care se cere un algoritm pentru determinarea
aliniamentelor sau a aranjamentelor. Unul dintre cele mai frecvente cazuri este acela de a completa
liniile rupte, mai ales cele drepte. n general punctele de-a lungul liniei nu sunt distribuite ntr-o
79
perfect ordine. Aceast neregularitate i sensibilitatea la zgomot sau la alte puncte de lng linie
fac ca tehnicile din domeniul frecvenei s fie dificil de aplicat, iar rezultatele vor fi slabe din punct
de vedere al preciziei. Din aceast cauz se va folosi n locul transformatei Fourier, transformata
Hough.
Spaiile Hough sunt folosite pentru a potrivi diferite figuri, i este necesar n cele mai multe
cazuri s ai o idee despre tipurile de linii i alte aranjamente care trebuie potrivite cu datele. Pentru
nceput se ia cel mai simplu caz linia dreapt. Modalitatea convenional de a potrivi o linie cu
punctele date dintr-un graf este aa numita metod a ultimului ptrat n care suma fiecrui ptrat
din deviaia pe vertical a fiecrui punct de pe linie este minimizat. Metoda Hough este superioar
acesteia pentru c minimizeaz deviaia punctelor de pe linie ntr-o direcie perpendicular pe linie,
i trateaz corect cazurile n care punctele nu sunt uniform distribuite de-a lungul liniei.

Mrimea formei

Cea mai important msur a mrimii unei figuri dintr-o imagine este aria. Mrimea unei figuri
dintr-o imagine bidimensional este relaionat cu mrimea obiectului n spaiul tridimensional, n
diferite moduri n funcie de felul n care aceasta a fost obinut. Cele mai ntlnite tipuri de imagini
sunt proieciile n care figura este de fapt umbra obiectului sau o seciune plan, forma este o
seciune din obiect. n fiecare caz, dac sunt gsite destul de multe figuri pe o direcie cunoscut sau
aleatoare, este posibil s estimezi volumul de obiecte din proiecie. Regulile pentru aceste estimri,
care sunt bazate pe probabiliti geometrice, sunt furnizate de stereologie. Aceste estimri sunt
statistice, ceea ce arat c volumul unui singur obiect nu este determinat exact, dar distribuia
mrimilor mai multor obiecte poate fi descris.
Pentru o sfer poate fi calculat prin secionare probabilitatea de a gsi un cerc de o anumit
mrime. Cel mai mare cerc, bineneles, este cel care are diametrul egal cu cel al sferei. Cercurile de
mrimi mici apar cu o frecven definit i calculabil.
Chiar dac aria este definit i determinat, este necesar un factor de conversie ntre mrimea
pixelilor i mrimea structurii stabilite din lumea real. Calibrarea (normarea) dimensiunii este de
obicei fcut prin captarea imaginii unui obiect cunoscut i msurarea ei cu acelai algoritm care,
mai trziu, este utilizat pentru obiecte necunoscute. Pentru imaginile macroscopice i microscopice
se va folosi i o scar de msurri. Cele mai moderne sisteme folosesc pixeli ptrai care au aceiai
dimensiune i pe orizontal i pe vertical, dar pentru ca distana s fie aceiai n orice direcie a
imaginii este de asemenea necesar ca direcia de privire s fie normal pe suprafa.
Odat ce aria a fost determinat, de cele mai multe ori este mai convenabil s se exprime ca un
diametru echivalent. Acesta este o trstur liniar, calculat simplu din arie
astfel: aria Diam
q
=

4
(8.6)
Figurile de diferite forme i orientri pot induce n eroare ochii i este dificil s se estimeze
mrimea relativ a figurii, iar valoriile ariei vor fi supraapreciate. Diametrul echivalent reprezint
un parametru simplu i uor de comparat pentru a caracteriza mrimea.

Descrierea formelor

Forma este ceva ce nu are un neles precis pentru om. Exist cteva adjective care descriu o
form, ntr-un mod aproximativ (aspru, dificil, neted, gras, slab etc.). n discuiile despre forme se
folosesc de cele mai multe ori prototipuri (o form ca o ). Bineneles, se presupune c fiecare
este de acord cu aspectele importante ale formei care sunt gsite i n prototipul selectat. Gsirea
descriptorilor numerici ai formei este dificil pentru c, corespondena dintre ei i viaa noastr de zi
cu zi este fr importan, i toi parametrii vor avea un caracter fabricat.
Cele mai vechi clase de descriptori de form sunt simple combinaii ale parametrilor de
mrime, aranjai astfel nct dimensiunea s se anuleze. De exemplu raportul lungime/lime d
formatul imaginii, iar schimbnd mrimea figurii nu se schimb valoarea numeric a formatului.
80
Datorit faptului c exist zeci de posibili parametrii ai mrimii, exist sute de modaliti n care
acestea pot fi combinate n expresii dimensionale care pot fi folosite ca descriptori ai formelor.
8.2 Extragerea caracteristicilor imaginilor

Odat ce forma (obiectul) a fost detectat i reprezentat, o mulime de modaliti pot fi folosite
pentru a extrage informaii referitoare la proprietile acesteia. Clasificarea i recunoaterea
obiectelor dintr-o imagine sa face prin determinarea unor trsturi ale formelor care sunt definitorii
pentru fiecare clas considerat sau descoperit.
8.2.1 Caracteristici de form
n continuare va fi prezentat modul n care unele caracteristici simple ca aria i perimetrul pot
fi convertite n trsturi mult mai sofisticate. Odat ce conturul sau scheletul unei forme, care sunt
ele nsele trsturi ale formei, au fost obinute, este posibil s fie considerai perimetrul i aria alte
caracteristici.
Caracteristicile de form sunt folositoare ori de cte ori mrimea unei forme este important, i
reprezint o important resurs pentru compararea i clasificarea formelor. Toate trsturile metrice
prezentate sunt exprimate referindu-se la dimensiunea pixelului. Cum asemenea caracteristici
trebuie s fie convertite n uniti originale, metrii sau centimetrii, se cere o conversie corect n
care trebuie luat n considerare i rezoluia adoptat pentru reinerea imaginii. Este de asemenea
important de reinut c aceste caracteristici geometrice pot fi afectate de alegerea vecintilor i de
definiia distanei.
Este important de notat c i unele din cele mai simple caracteristici pot fi folosite cu succes n
anumite situaii specifice, de asemenea este dificil de ales care este cel mai potrivit set de trsturi
pentru fiecare aplicaie. O posibil soluie este testarea unui set ct mai mare de posibile trsturi i
aplicarea unui algoritm automat de selectare a acestora pentru a defini caracteristicile referitoare
pentru un exerciiu dat.

1.Perimetrul
Lungime arcului unei curbe simple sau a unui contur poate fi exprimat prin folosirea multor
aproximri. Presupunnd c acest contur este reprezentat izolat ntr-o imagine binar, cea mai
simpl metod de a calcula perimetrul este dat de urmtorul algoritm:
- se citete imaginea binar;
- se aplic algoritmul de detecie a muchiilor;
- perimetrul este numrul punctelor muchiilor detectate la pasul 2.
Algoritmul prezentat d rezultate bune n cazul conectri cu 4 muchii, dar apar probleme cnd
sunt 8 muchii conectate, deoarece distana n acest caz este 2 (fig.8.3) pe cnd n rest este 1.
Algoritmul prezentat nu ia n considerare existena acestei distane de 2 , de aceea pentru
conexiunea cu 8 vecini se folosete un ir n care se in valorile conturului. Atunci perimetrul poate
fi exprimat folosind formula 2
0
+ = N N P
e
unde N
e
i N
o
reprezint numrul de coduri pare i
impare din reprezentarea conturului sub forma irului de valori.

Fig8.3
81
Dac conturul este reprezentat sub forma unui ir de numere complexe
u(n)=x(n)+jy(n), 1 = j i n=0,1N-1, lungimea P a conturului reprezentat poate fi exprimat
prin

=
=
1
0
) 1 ( ) (
N
n
n u n u P unde u(0)=u(N) pentru contururi nchise i ) (n u reprezint conturul.

2. Aria
Cea mai simpl metod de a estima aria unui obiect este de a numra pixelii care reprezint
obiectul. Presupunnd c g este o imagine binar n care g(p,q)=1 pentru pixelii obiectului i
g(p,q)=0 pentru fond, urmtorul algoritm calculeaz aria :
aria=0
for p=1 to Max_p do
for q=1 to Max_q do
aria=aria+g(p,q);
Acest algoritm presupune c obiectul a fost izolat ntr-o imagine binar. n cazul n care sunt
mai multe obiecte prezente este necesar s se separe fiecare obiect i s se aplice acest algoritm
fiecrei pri componente. O alt metod ine cont de faptul c pixelii de pe contur aparin jumtate
obiectului, jumtate fondului i pentru calcularea ariei se folosete formula
(

+ = 1
2
0
b
N
N A unde N
o
-numrul de pixeli din interior, iar N
b
-numrul pixelilor de pe grani.
n cazul n care este dat o imagine n care sunt prezentate mai multe obiecte care trebuie s fie
sortate dup mrimea lor, se folosete urmtorul algoritm:
- se eticheteaz fiecare component a imaginii;
- se calculeaz histograma imaginii etichetate;
- se sorteaz componentele ca o funcie a nlimii respectivei histograme, ignornd pixelii din
fond.
Acest algoritm folosete ideea c histograma componentelor etichetate calculeaz ci pixeli
constituie fiecare obiect etichetat. Cel mai mare i cel mai mic obiect poate fi, de asemenea, uor de
detectat prin analiza histogramei imaginii etichetate.

3. Centrul de greutate
Cea mai uoar metod de a calcula centrul de greutate este de a nsuma valorile coordonatelor
punctelor formei. Presupunnd c g este o imagine binar, pentru calcularea centrului de greutate se
poate folosi urmtorul algoritm:
cg_p=0
cg_q=0
for p=1 to P do
for q=1 to Q do
if (g(p,q)=1)
cg_p=cg_p+p
cg_q=cg_q+q
aria=aria+1
cg_p=cg_p/aria
cg_q=cg_q/aria
Centrul de greutate poate fi obinut i pentru o form reprezentat doar prin conturul ei. Centrul
de greutate M a unui contur reprezentat de un ir u(n) poate fi calculat prin nsumarea valorilor
tuturor componentelor lui u(n):
N
n u
M
N
n

=
=
1
0
) (
, M=z
1
+jz
2
, iar z
1
,z
2
-coordonatele centrului de
greutate. Este interesant faptul c uneori acesta poate s fie i n afara obiectului.

82
4. Raza maxim i minim (distana maxim i minim pn la centrul de greutate)
n procesarea imaginilor este folositoare de cele mai multe ori calcularea distanei dintre doi
pixeli, dar acest lucru nu este att de clar precum pare. Prezena pixelilor n gril determin
posibilitatea calculrii unor distane numite distances matrics care dau adesea rspunsuri diferite
pentru aceleai perechi de puncte.
Distana euclidian
Aceasta este distana cu care cei mai muli oameni sunt familiari. Dac dou puncte au
coordonatele (x
1
,y
1
) i (x
2
,y
2
), distana euclidian este dat prin:
D
euclid
=
2
2 1
2
2 1
) ( ) ( y y x x + (8.7)

Distana City block
Aceast distan este cunoscut i drept distana Manhattan. Se presupune c pentru a ajunge
de la un pixel la altul este posibil s mergi direct de-a lungul liniilor grilei de pixeli. Deplasrile pe
diagonal nu sunt permise, astfel c n acest caz distana se calculeaz astfel:
D
city
=
1 2 1 2
y y x x + (8.8)

Distana pe tabla de ah
Aceast metod presupune c poi face mutrile pe grila de pixeli ca i cum ai fi un rege care
face mutrile n ah (de exemplu o mutare pe diagonal reprezint tot att ct o mutare pe
orizontal). Aceasta nseamn c aceast distan este reprezentat de:
D
ah
=max( )
1 2 1 2
, y y x x (8.9)
De reinut este faptul c ultimele dou metode sunt mult mai rapide de calculat dect distana
euclidian i de aceea sunt uneori folosite n cazurile n care viteza este important, iar
corectitudinea nu este foarte important.
Odat ce centrul de greutate a fost obinut, urmtoarele trsturi geometrice pot fi obinute din
acesta:
- distana maxim D
max
dintre centrul de greutate i punctele de pe contur;
- distana minim D
min
dintre centrul de greutate i punctele de pe contur;
- distana medie D
mediu
dintre centrul de greutate i punctele de pe contur;
- histograma distanelor dintre centrul de greutate i punctele de pe margine;
-
min
max
D
D
,
mediu
D
D
max
,
mediu
D
D
min
.
Rapoartele caracteristicilor prezentate sunt folositoare atunci cnd se cere independena unei
mrimi. Aceste rapoarte pot fi folosite pentru a face diferena ntre un cerc (n care D
min
D
max
) i o
elips. n plus, caracteristicile care implic distana medie sunt mult mai tolerante cu modificrile
aprute pe suprafaa formei.

5.Distana medie pn la grani
Distana medie dintre punctele interioare ale formei i punctele de pe grania acesteia poate fi
folosit de asemenea ca o caracteristic a formei. Dac g este obiectul de interes compus din N
puncte, rg un punct al obiectului i d(r,boundary(g)) ar fi cea mai mic distan ntre r i toate
punctele de pe grani, atunci distana medie poate fi calculat astfel:

= )) ( , (
1
g boundary r d
N
(8.10)
Aceast caracteristic poate fi folosit pentru a defini msura complexitii formei dup cum
urmeaz:
2

A
f = unde A este aria.


83
6.Diametrul
Diametrul este definit ca fiind cea mai mare distan ntre oricare dou puncte ale obiectului. O
metod exact de a calcula diametrul este aceea de a cuta distana maxim ntre oricare dou
puncte care aparin obiectului. Este uor de vzut c este suficient s calculezi distane ntre
punctele de pe contur. Presupunnd c g este o imagine binar care conine numai obiectul de
interes n care g(p,q)=1 pentru pixelii care aparin obiectului i g(p,q)=0 pentru fond, algoritmul
urmtor calculeaz diametrul obiectului i coordonatele corespunztoare celor mai ndeprtate
puncte ale obiectului reprezentat n g(p,q).
Se calculeaz muchiile obiectului i forma complex a semnalului n=b+jc unde b i c sunt
puncte ale muchiilor.
n=length(n)
dmax=0
for i1=1 to (n-1) do
for i2=(i1+1) to n do
if n(i1)-n(i2)>dmax
dmax=n(i1)-n(i2)
lm=i1
cm=i2
n acest algoritm lm i cm indic cele mai ndeprtate puncte n timp ce dmax indic diametrul
obiectului.

7.Numrul de goluri
Unele proprieti topologice ale figurii pot fi determinate direct, cum ar fi numrul de goluri.
Gsirea gurilor din interiorul figurii poate fi fcut fie direct, dac aria este msurat i figurile
etichetate, sau prin inversarea imaginii i gsirea figurilor care nu ating contururile imaginii.

8.Colurile
Aceast caracteristic poate fi obinut din reprezentarea contururilor. De exemplu prezena
unui col este detectat ca o secven de cretere (sau descretere) a valorilor codurilor din irul de
valori de-a lungul graniei. Similar, segmentele drepte sunt reprezentate prin valori ale codurilor din
lan care nu variaz semnificative o lungime selectat. n ambele cazuri, decizia de ct de mult
trebuie s varieze este important, i pe ce distan, este o definiie arbitrar. Lanul de coduri
pentru un contur sau pentru o linie de schelet este esenial de cnd distana de vecintate dintre 2
pixeli poate varia n numai 45 grade.

9.Numrul de laturi
O alt proprietate topologic a figurilor este numrul de laturi. n cazul unei structuri dintr-o
pilitur, a firelor dintr-un metal sau a cmpurilor obinute n urma unei survolri aeriene, numrul
de laturi pe care fiecare figur le are este numrul altor figuri cu care aceasta se altur. Deoarece
figurile sunt separate atunci trebuie s existe o linie de pixeli de fond care le separ. n multe cazuri
aceast linie este produs de procesarea imaginilor, prin scheletizarea imaginii originale de intrare i
apoi prin inversarea ei pentru a definii pixelii. Cuantificarea numrului de vecini pentru fiecare
figur poate fi realizat prin verificarea numrului de identificare a figurii a crei pixeli ating
fondul. Etichetarea figurilor n funcie de numrul de vecini ne poate dezvlui cteva proprieti
interesante ale structurii.
Numrul de laturi pe care le are o form poate fi descris i n alt fel. Dac punctele din coluri
sunt definite cum s-a prezentat anterior, atunci numrarea laturilor este realizat direct din irul de
valori care reprezint conturul. Cel de al doilea mod de abordare, care este mai puin sensibil la
micile neregulariti ale pixelilor din contur, folosete poligonul convex sau limitat. Acest poligon
este de obicei construit cu un numr fix i destul de mare de pri. De exemplu rotirea axelor n 16
pai va forma un poligon cu 32 de laturi.

84
10.Grosimea
Grosimea unei forme este definit ca fiind numrul de eroziuni, realizate cu acelai element
structural, care sunt necesare pentru a eroda complet obiectul. Se observ c o asemenea definiie a
grosimii formei depinde de structura elementului considerat. De exemplu o curb deschis realizat
dintr-o niruire de cte un pixel are grosimea 1, deoarece o singur eroziune este suficient pentru a
o elimina. O caracteristic a formei uor modificat, poate fi definit ca numrul de eroziuni de care
este nevoie pentru a distruge legturile formei. n cazul n care forma conine o poriune de istm, va
fi rupt dup un numr mic de eroziuni (fig 8.4). Evoluia numrului de componente conectate care
sunt create n urma erodrii formei poate fi de asemenea analizat statistic pentru a genera
caracteristici ale formei care s reflecte limea istmurilor.


Fig.8.4 Reprezentarea grosimii formei: aceast form este rupt n
dou dup un numr mic de eroziuni


11.Momentele statistice
Momentele statistice alturi de descriptorii Fourier, sunt printre cei mai cunoscui descriptori ai
formei. La fel ca i descriptorii, acestea pot fi obinute din conturul formei, dar i din regiunile 2D.
Dac g reprezint imaginea formei, atunci momentele standard 2D sunt definite ca:

=
=
1
0
1
0
,
) , (
P
p
Q
q
s r
s r
q p g q p m . (8.11)
Pentru a obine translaia invarianei trebuie s fie calculate momentele centrale:

=
=
1
0
1
0
,
) , ( ) ( ) (
P
p
Q
g
s r
s r
q p g q q p p unde
0 , 0
0 , 1
m
m
p = i
0 , 0
1 , 0
m
m
q = . (8.12)
Una dintre cele mai frumoase caracteristici expus de aceti descriptori ai formei, care a fost
folosit n analiza formei, este aceea c primele momente au o interpretare geometric, fiind
posibil reconstrucia formei din setul complet de momente.

12.Simetria
Simetria reprezint o caracteristic important care poate fi decisiv pentru soluia efectiv a
multor probleme care apar n caracterizarea i clasificarea formelor. Cel mai important lucru care
trebuie reinut este faptul c exist mai multe tipuri de simetrii. n continuare vom prezenta cum
poate fi exprimat numeric gradul de simetrie bilateral dintr-o reprezentare coninut ntr-o imagine
binar. Se consider imaginea din figura 8.5a. Primul pas const n reflexia figurii n funcie de
orientarea axei principale. Dup aceea se umplu golurile cauzate de reflexie, i aceast versiune
rezultat este suprapus peste figura original, figura 8.5b. Se observ c valorile pixelilor imaginii
rezultate sunt limitate astfel: 0 pentru fundal, 1 pentru poriuni ale figurii care sunt asimetrice, iar 2
pentru pixelii simetriei, apoi se calculeaz simetria. Acelai lucru este prezentat n figurile 8.5c i
8.5d, dar pentru o form mult mai simetric.

85

Fig.8.5

13.Semntura formei
Ideea fundamental, de a reprezenta forma printr-un semnal sau o semntur, este de a genera
unul sau mai multe semnale care oarecum descriu forma bidimensional a obiectului. Se observ c
o semntur unidimensional se poate obine, aceasta fiind bazat pe reprezentarea contururilor i a
regiunilor, i exist o mulime de modaliti diferite de a defini aceste semnturi. Este important de
subliniat c semntura formei descrie formele printr-un semnal unidimensional, i de aceea se
permite folosirea tehnicilor de procesare 1D pentru analiza formelor.
n general, semntura bazat pe contur este creat prin nceperea dintr-un punct iniial de pe
contur, i traversarea lui n sensul acelor de ceasornic sau invers. O simpl semntur care ilustreaz
acest concept este de a plnui distana dintre fiecare punct de pe contur i centru formei n funcie
de secvena anterioar, care se comport ca un parametru. Figura 7.6 b ne arat un exemplu a
semnturii d(u) obinut din conturul din figura 8.6 a.
Este important de notat c aceste semnale sunt periodice pentru curbele nchise, deoarece se
poate traversa conturul de un numr infinit de ori. O alternativ i n acelai timp i un foarte
popular mod de a definii axele de coordonate ale semnturii, este de a lua unghiul dintre linia care
unete punctul curent i centrul de greutate al formei, i un vector de referin sau o ax. Acest mod
de abordare prezint inconvenientul c pentru un unghi dat se poate obine mai mult dect un punct
de intersecie. Pentru a mpiedica aceast problem, este definit o parametrizare a semnturii
bazat pe unghiuri prin variaia continu a unghiului dintre linia de referin i linia de rotaie. n
cazul n care linia curent intersecteaz conturul formei n mai mult de un punct, unele funcii ale
punctelor intersectate pot fi luate ca valorile semnturii respective. De exemplu, semntura poate fi
calculat ca maximul, minimul sau valoarea medie pn la centrul de greutate, cu referire la toate
punctele intersectate definite de fiecare unghi. Rezultatele semnturii sunt periodice n cazul
curbelor nchise.
Semnturile bazate pe regiuni pot fi de asemenea obinute dintr-un semnal 1D, dar ele folosesc
ntreaga informaie din form. Un exemplu al acestei posibiliti este folosirea semnturilor bazate
pe proiecii, care sunt definite prin proiectarea valorilor pixelilor din imagine de-a lungul unei linii
perpendiculare pe o orientare de referin. Acest concept este apropiat de transformata Hough.

86

Fig.8.6 figura original (a) i distana pn la centru bazat pe semntur

14.Descriptori topologici
Formele pot fi analizate i lund n considerare aspectele lor structurale, nu numai
caracteristicile metrice. Un exemplu de aspect structural este i prezena golurilor ntr-o form.
Cteva dintre cele mai importante caracteristici topologice folosite pentru analiza formelor
sunt:
- numrul de goluri N
H
;
-numrul de componente conectate N
C
. Este important de reinut c aceast caracteristic se
aplic formelor compuse (ex. recunoaterea caracterelor arabe);
- numrul lui Euler, care este definit ca E=N
C
-N
H
.

15.Aproximarea poligonal-descriptor de baz al formei
Odat ce conturul formei a fost reprezentat printr-un poligon, urmtoarele caracteristici ale
formei pot fi extrase prin proceduri directe:
- numrul de coluri sau vrfuri;
- valorile statistice ale unghiului i a laturilor (mijlocul, media, variaia i momentele);
- lungimea maxim i minim a laturilor;
- raportul maxim i minim dintre laturi;
- raportul maxim i minim dintre unghiuri;
- raportul dintre cel mai mare unghi i sume celorlalte unghiuri;
- raportul dintre deviaia standard a laturilor i unghiurilor;
- msurarea simetriei. Msurarea simetriei pentru segmentele poligonale este definit
prin:

=
L t
dt
A
dl l k S
0 0
)
2
) ( ( unde t este un parametru de-a lungul curbei,

t
dl l k
0
) ( este msura
schimbrii unghiulare pn la t, A este numrul total de schimbrii unghiulare a segmentului curbei
i L este lungimea segmentului curbei.

16.Descriptori ai formei bazai pe regiuni, texturi i grafuri
Neomogenitatea dintr-o imagine implic i existena mai multor tipuri de caracteristici ale
imaginii care redau independent informaii celui care le vede. Dei variaia dintre diferite imagini
poate fi mare, totui un numr destul de mare de imagini poate fi caracterizat de un numr mic de
tipuri de caracteristici. Acestea sunt de obicei reinute sub forma a trei categorii: regiuni, texturi i
muchii. n continuare v vom prezenta caracteristicile principale ale celor trei categorii enumerate.
Regiunile netede de obicei cuprind cea mai mare parte a unei imagini deoarece suprafeele unor
obiecte artificiale sau naturale, cnd sunt privite de la distan, par a fi netede. Un model simplu
pentru o regiune neted este alocarea unui nivel constant de gri unui domeniu determinat.
n opoziie cu regiunile, muchiile cuprind numai o parte foarte mic din aria unei imagini. Fr
ndoial cea mai mare parte a informaiilor este coninut de acestea. Acest lucru este uor de
realizat dac se privete o hart a muchiilor dintr-o imagine, dup detecia acestora, se poate uor
deduce coninutul original al imaginii, numai din reprezentarea muchiilor. Datorit faptului c
87
muchiile reprezint locaii ale unei treceri abrupte a valorii nivelelor de gri ntre regiuni adiacente,
cel mai simplu model de muchie este deci o variabil random de nalt frecven, n opoziie cu
modelul regiunilor care folosete random de joas frecven. Oricum, acest model simplu nu ia n
considerare constrngerea structural din muchii, ceea ce poate conduce la confuzia acestora cu
regiunile care au aceeai frecven. Modelele de muchii mai sofisticate includ modelul faet, care
aproximeaz diferite regiuni cu valori constante ale nivelului de gri din jurul muchiilor cu diferite
funcii continue. Mai exist i modelul de profil al muchiei, care descrie seciunea unidimensional
a muchiei n direcia variaiei maxime a nivelului de gri. Au fost fcute ncercri de a modela acest
profil folosind o funcie treapt i diferite funcii monoton cresctoare. Oricum, aceste modele
caracterizeaz cel mai mult amplitudinea valorii de tranziie a nivelului de gri din locaia muchiilor.
Diagrama muchiilor n termenii trecerii prin zero a celei de-a doua derivate, obinut printr-o filtrare
Log (Laplacian of Gaussian) caracterizeaz poziia muchiilor ntr-o imagine.

Modelul faet Modelul profilului muchiilor Modelul trecerii prin
zero
Fig.8.7

Apariia texturilor este de obicei datorat prezenei unui obiect natural n imagine. Texturile de
obicei au o apariie zgomotoas, dei ele sunt diferite n mod evident de zgomot, deoarece n
acestea exist, de obicei, anumite forme care se disting ntre ele. Datorit acestei apariii
zgomotoase este normal ca acest model al texturii s foloseasc un cmp random bidimensional.
Cel mai simplu mod de abordare este s foloseti variabile distribuite independent i identic, cu
variaii apropiate.
Identificarea diferitelor planuri de informaii coninute n texturi este o problem foarte
important n cadrul problemelor de analiz de imagini. Aceast problem poate fi abordat att
ntr-un mod global, ct i ntr-un mod local. Abordarea din punct de vedere global implic
identificarea punctelor care dispar din gradientul texturii sau din informaia spectral. Aceast
metod se nvrte n jurul analizei structurale a texturii pre-segmentate, dar totui nu se potrivete
prea mult n analiza scenelor care conin mai multe plane. Un alt mod de abordare este i msurarea
distorsiunilor spectrale pentru a putea face o estimare local a parametrilor pozai. n acest caz
exist un numr de caracteristici locale ale domeniului de frecven care pot folosi funciile
Gabor[2]
1
sau distribuia Wigner[3]
2
.Metodele domeniului Fourier pentru analiza formelor din
texturi se nvrt n jurul simplificrii din punct de vedere geometric, pentru a obine msuri ale
distorsiunilor affine locale ale texturii.
Una dintre metodele de acest tip, considerate n literatura de specialitate, este metoda realizat de
Krumm i Shafers[4]
3
.Aceast metod folosete proiecia spectral pentru a estima orientarea
local a suprafeei. Acest lucru se realizeaz prin regsirea parametrilor proieciei affine care
minimizeaz numeric suma ptratelor diferite din spectrul local. Odat ce parametrii fixai au fost
reinui, fiecare spectru local de putere este din nou proiectat ntr-un plan paralel. Planele texturii
sunt segmentate folosind o dendrogram bazat pe metoda ciorchinelui Figurile pot fi reprezentate
i cu ajutorul regiunilor sau al grafurilor. n aceste situaii pot fi extrase foarte uor urmtoarele
caracteristici ale formei:

1
M.R.Turner Texture discrimination by gabor function, Biological Cybernetics, Nr. 55, 1986, pag.271
2
T.R.Reed, H.Wechler Segmentation of textured images and gestalt organisation using spatial/spectral frequency,
IEEE Transactions on Pattern Analysis and Machine Intelligence, Nr.12(1),1986, pag 1-12
3
J.Krumm, S.A.Shafer Texture segmentation and shape in the same image, IEEE International Conference on
Computer Vision, 1995, pag. 121-127


88
- numrul de pri care constituie figura;
- numrul de jonciuni;
- numrul de extremiti;
- numrul de ramuri;
- mrimile ramurilor;
- statistica geodezic;
- statistica transformrilor de distan.

17.Descriptori simpli ai complexitii
O proprietate a formelor este complexitatea. n multe situaii se apeleaz la aceasta pentru a
putea clasifica obiectele. De exemplu, neuronii au fost organizai n clase morfologice lund n
considerare complexitatea formei lor (n special arborele dendritic). n timp ce complexitatea este,
ntr-un fel, un concept ambiguu, este interesant s fie legat de alte proprieti geometrice cum ar fi
suprafaa de acoperire spaial. Acest concept este cunoscut i ca space-filling capability", ceea ce
indic capacitatea entitilor biologice de a interaciona sau de a umple spaiul din jur. Cu alte
cuvinte, acoperirea spaial definete interfaa figurii cu mediul extern ceea ce determin capaciti
importante ale entitilor biologice. Un alt exemplu ar fi faptul c o bacterie cu o form ct mai
complex (i deci cu o acoperire spaial mai mare) va gsi mai probabil mncare dect una cu o
form simpl. La o scar mai mare, putem spune c acea cantitate de ap pe care o absoarbe un
copac este legat de suprafaa pe care se ntind rdcinile sale, de complexitatea acestora.
Complexitatea este legat de acoperirea spaial n sensul c, cu ct este mai complex figura,
cu att este mai mare capacitatea de acoperire spaial.
Fiind P i A perimetrul figurii, respectiv aria sa, cteva msuri ale complexitii pot fi definite
astfel:
* circularitatea definit ca P
2
/A;
* raportul de subiere este invers proporional cu circularitatea i se definete ca fiind
) ( 4
2
P
A
;
*raportul dintre arie i perimetru A/P ;
* )
4
4
(
2
2
A P P
A P P
+

reprezint o relaie ntre raportul de subiere i circularitate


[OHiggins,1997]; (8.13)
*ortogonalitatea este definit ca
) (MER area
A
, unde MER reprezint minimul de dreptunghiuri
nchise;
*temperatura unui contur este definit ca fiind
1
2
))
2
( (log

=
H P
P
T , unde H este perimetrul
componentei convexe a formei;
*textura, analiza texturii din imagine este o important parte ea nsi, dar poate fi folosit i ca
un mijloc de a defini caracteristicile formei. Tehnicile de analiz a texturii produc un rezultat
calculnd pixel cu pixel, astfel c valoarea unui pixel obinut este relaionat de textura din jurul lui
din imaginea iniial.

8.2.2 Caracteristici de tip transformare
n multe cazuri procesarea imaginilor se realizeaz n domeniul spaial. Oricum se poate dori
s se realizeze o prelucrare a imaginii n domeniul frecvenelor pentru a se ndeprta frecvenele
informaiilor nedorite nainte de a analiza imaginea. Zgomotul adugat unei imagini are n general
un spectru de frecvene mai mare dect componentele imaginii normale, acest lucru este determinat
de decorelarea spaial a componentelor sale. Printr-o filtrare trece jos n domeniul spaial sau n
89
domeniul frecvenelor spaiale se poate suprima o mare parte a sa. Nu exist deosebiri ntre
rezultatele obinute prin filtrarea n domeniul spaial i filtrarea n domeniul Fourier, alegerea fiind
dat de considerente de implementare. Totui procesarea n domeniul Fourier, spre deosebire de
convoluie ne permite o privire cantitativ i intuitiv n natura procesului de zgomot, util n
proiectarea filtrelor de suprimare a zgomotului n domeniul spaial.
8.2.2.1 Transformata Fourier procesarea n domeniul frecvenelor
Dup cum s-a prezentat i n capitolele anterioare transformata Fourier este un important
instrument de procesare a imaginii care este folosit pentru a descompune o imagine n
componentele ei sinus i cosinus. Rezultatul transformrii este reprezentat de o imagine n domeniul
Fourier, sau domeniul frecvenelor, n timp ce imaginea de intrare este echivalenta din domeniul
spaial. Aceast transformat produce la ieire o imagine format din valori complexe care poate fi
reprezentat cu dou imagini, fie partea real i cea imaginar, sau cu amplitudine i faz. n
procesarea imaginilor, de cele mai multe ori numai amplitudinea este reprezentat, deoarece conine
cele mai multe informaii ale structurii geometrice din imaginea spaial. Oricum, dac se dorete
re-transformarea imaginii Fourier n imaginea corect din domeniul spaial, dup unele procesri
realizate n domeniul frecvenelor, trebuie s se in cont att de amplitudinea ct i de faza din
imaginea Fourier.
Transformrile de imagini furnizeaz informaii din domeniul frecven, folosind
caracteristicile de transformare, care se extrag prin filtrarea zonal a imaginii transformate. Filtrele
zonale se numesc filtre masc i reprezint, n spaiul bidimensional al frecvenelor spaiale,
ferestre de diferite dimensiuni i forme, cu ajutorul crora este selectat un anumit domeniu al
frecvenelor spaiale. n general, informaia de nalt frecven poate fi folosit pentru detectarea
muchiilor sau a contururilor, iar mtile unghiulare pentru determinarea orientrii. De exemplu, o
imagine care conine linii paralele de orientare va avea energie mare de-a lungul unei linii la un
unghi /2+, trecnd prin originea transformrii Fourier bidimensionale.
Fundamentul tehnicilor n domeniul frecvenelor spaiale l constituie teorema de convoluie.
Fie g(x,y) o imagine rezultat prin convoluia imaginii f(x,y) i un operator invariant la deplasare
h(x,y) adic: g(x,y)=h(x,y)*f(x,y) (8.14)
Conform teoremei de convoluie se tie c n domeniul frecven se obine relaia:
G(u,v)=H(u,v)F(u,v), unde G,H,F sunt transformatele Fourier ale funciilor spaiale g, h i respectiv
f. Transformata H(u,v) este numit funcie de transfer a procesului. n aplicaiile tipice de
mbuntire a imaginilor este dat funcia imagine f(x,y), iar scopul dup calcularea transformatei
Fourier F(u,v) este de a selecta H(u,v) astfel nct imaginea dorit dat de
)} , ( ) , ( { ) , (
1
v u F v u H y x g =

s ndeplineasc anumite condiii. De exemplu accentuarea
muchiilor din f(x,y) se poate face folosind o funcie H(u,v) care s favorizeze componentele de
nalt frecven din F(u,v). Teorema de convoluie impune ca H(u,v) i h(x,y) s fie de aceleai
dimensiuni, dac H(u,v) este de mrime 256*256 la fel s fie i h(x,y) pentru a obine acelai
rezultat prin filtrarea n domeniul spaial ca n cazul filtrrii n domeniul frecven. Convoluia cu
mti de asemenea dimensiuni se realizeaz mult mai eficient n domeniul frecven.
Analiza armonic este cunoscut i drept analiz spectral sau desfurarea imaginii.
Aceasta ncepe prin conversia conturului ntr-o funcie unghiular sau (). Aceasta permite
determinarea termenilor a
i
i b
i
din seria:
()=a
0
+a
1
cos()+b
1
sin()+a
2
cos(2)+b
2
sin(2)+ . (8.15)
Aceast serie este infinit, sau cel puin continu cu att de muli termeni ci sunt pe margine.
Oricum, este o caracteristic a analizei Fourier faptul c numai primii termeni sunt necesari pentru a
pstra cele mai multe detalii despre caracteristicile formei. Dup cum se arat n figura 8.10 cu
numai 10-25 de termeni din serie, forma original poate fi refcut cu o precizie foarte mare. n cele
mai multe cazuri, informaia de faz
i
pentru fiecare termen din serie poate fi ignorat fr a crea
90
prea mare efect, i un singur coeficient c
i
poate fi folosit pentru fiecare frecven.
2 2
i i i
b a c + = i

= ) 2 sin( ) (
i i
i c (8.16)
Primele cteva valori ale lui c din reprezentarea Fourier a conturului conin o mare cantitate
de informaii despre caracteristicile formei.
8.2.2.2 Descriptorii Fourier (DF)
Descriptorii Fourier sunt una dintre cele mai cunoscute metode de reprezentare a formelor n
cadrul aplicaiilor de vizualizare sau de recunoatere folosind abloane. Ar trebui s ne gndim c
descriptorii Fourier se refer la o clas de metode, nu la o singur metod, deoarece exist multe
feluri diferite n care pot fi definii aceti descriptori ai unei forme. Ideea principal care st la baza
acestui tip de metode se refer la faptul c, forma care ne intereseaz se prezint sub forma unor
semnale 1D sau 2D, apoi este calculat transformata Fourier a acestor semnale, i se extrag
descriptorii Fourier din aceast reprezentare. Aceti descriptori au fost propui pentru prima dat de
R.L.Cosgriff n 1960, i au devenit cunoscui mai trziu, prin lucrrile lui Gosta H.Granlund
referitoare la recunoaterea formelor folosind modele.Proprietile acestora sunt prezentate mai jos:
*simplitatea implementrii i eficiena calculului
Orice definiie a descriptorilor Fourier poate fi exprimat prin aplicarea transformatei Fourier

=
1
0
/ 2
) ( ) (
N
t
N ns j
e n u s FD

, s=0,1N-1; (8.17)
*cea mai mare cantitate de informaie din contur este concentrat de-a lungul primei
componente, cea de joas frecven. Este cunoscut faptul c cea mai mare parte din energia
conturului obinut din obiect n aplicaiile de analiz de imagini se concentreaz n coeficienii de
joas frecven.

Fig.8.8 un neuron artificial

Fig.8.9 Semnalele i descriptorii Fourier (modulul i faza)obinui din conturul formei din fig 8.8
91



Fig.8.10 reconstrucia formei din figura 8.8 prin folosirea
a 2i coeficieni,pentru i=10,30,60,100

*pot fi obinute cteva caracteristici adiionale din descriptorii Fourier.
Fondul matematic al teoriei analizei Fourier furnizeaz un set larg de instrumente pentru
analiza formelor. De exemplu, este posibil s evaluezi cteva msuri ale formei direct din
descriptorii Fourier.
Au fost propuse multe moduri de abordare a analizei formelor bazate pe tehnica Fourier, i
acestea pot fi denumite toate descriptori Fourier. Dac u(n) reprezint conturul i U(s) transformata
Fourier, atunci U(s) este definit ca fiind

=
1
0
2
) (
1
) (
N
n
sn
N
j
e n u
N
s U

s=-N/2+1,,N/2. (8.18)
Aceast serie Fourier a lui u(n) poate fi folosit pentru a defini un set de descriptori invariani
la translaie, la rotaie sau la shimbarea parametrilor. Aceti descriptori Fourier pot fi definii ca:
FD(s)=|NFD(s)| cu

=
=
0 ), 1 ( / ) (
0 , 0
) (
s U s U
s
s NFD . NFD au fost aplicai pentru caracterizarea
formelor din cadrul imaginilor mamografice[Sken 1994]. Au fost folosii pentru a defini un alt
descriptor:

+ =
+ =
(

=
2 /
1 ) 2 / (
2 /
1 ) 2 / (
) (
/ ) (
N
N s
N
N s
s NFD
s s NFD
FF
. (8.19)
Autorii lucrrii n care a aprut acest descriptor au susinut c acesta este mai puin sensibil la
zgomotul de nalt frecven. Mai mult, valorile acestuia sunt cuprinse n intervalul [0.1].
n ciuda succesului pe care l are, abordarea analizei armonice a fost puin folosit n afara
studiilor prin sedimentare. Principala cauz este faptul c termenii de frecven nu au corespondent
n concepia uman. Informaiile despre forme pe care noi le extragem vizual din imagine nu
dezvluie aceti factori numerici. Distincia dintre dou sedimente bazate pe armonica a 7-a poate fi
neleas oarecum ca i prezena frecvenei n neregularitile conturului obiectului, dar pentru
92
observatorul uman aceasta este mascat de alte variabile. Succesele pe care le au programele actuale
bazate pe algoritmii de msurare au reuit s depeasc ndemnarea uman nu numai cantitativ (n
termeni de exactitate i precizie), dar i calitativ (n termeni de tipuri de lucruri care pot fi
msurate). Dar acest lucru nu nseamn c omenirea se simte confortabil folosind aceste
instrumente.
Analiza armonic folosete caracteristici sau trsturi ale formei care sunt destul de diferite
de cele pe care le folosete viziunea uman. Pe de alt parte, parametrii topologici sunt cei care par
mult mai evideni pentru cei mai muli dintre observatori. Cnd se cere s se diferenieze stelele de
pe steagul american, australian sau israelian nu se vorbete despre dimensiuni i unghiuri, ci despre
numr de puncte. Cea mai evident diferen ntre un disc i litera O nu este forma eliptic a
literei, ci prezena centrului gol. Proprietile topologice sunt puin diferite de cele metrice. Dac
figura a fost desenat pe o bucat de cauciuc, ntinderea ei pn la orice mrime cu orice distorsiune
nu va schimba topologia.
8.3 Identificarea trsturilor

Recunoaterea sau identificarea trsturilor ntr-o imagine este un subiect foarte bogat i n
acelai timp foarte complicat. Implementrile care utilizeaz logica vag sau reele neuronale pentru
a combina informaiile de intrare, toate ncep prin realizarea msurrilor care au fost prezentate n
aceast lucrare. Aceste metode sunt folosite pentru a recunoate fee, inte militare din fotografiile
fcute din avion, amprente i n sarcinile zilnice cum ar fi citirea unui text tiprit sau scris cu mna.
Multe sisteme ofer o clasificare rudimenar a trsturilor bazat fie pe valorile limit de intrare
date de utilizator, fie pe datele msurate pe un set de trsturi de exerciiu. Multe dintre acestea pot
s foloseasc diferii parametrii, i pot opera ntr-un spaiu de mari dimensiuni unde clasele sunt
descrise geometric, de obicei ca nite cutii sau elipse. De exemplu, se consider 4 clase de obiecte
de exerciiu (fig 8.11) i se realizeaz msurtori asupra acestora. Nu exist o singur mrime sau
un singur parametru care s le disting pe cele 4 clase, dar combinaia a doi parametrii (aria i
factorul de form) poate determina o prim diferen. Msurrile individuale sunt prezentate n
figura 8.12, pentru a arta ciochinele de puncte. Unele programe pot determina adunri de puncte
pentru a gsi o clasificare, dar n exemplu dat se presupune c obiectele de exerciiu sunt deja
cunoscute i cele 4 clase sunt stabilite. n acest exemplu bidimensional ar fi posibil s descrii clasele
prin mprirea spaiului n regiuni cu contururi simple (poligoane). Oricum, un mod de abordare
mult mai flexibil, care este chiar i mai uor de calculat este s determini media i deviaia standard
a valorilor parametrilor msurai pentru fiecare grup de exerciiu, i s se foloseasc acestea pentru
a desena elipse. Cele desenate n figur au axa mare i cea mic egal cu de dou ori deviaia
standard a datelor, aa c se ateapt ca un procent destul de mic dintre puncte s fie n afara
elipselor.


fig.8.11 un exemplu cu patru clase de antrenament cu
trsturi diferite. Dou dintre acestea au aceiai form,
dar difer mrimea, n timp ce celelalte au aceiai
mrime,dar difer forma. Nu este de ajuns s se
msoare doar un singur parametru pentru a le putea
clasifica.







93



fig.8.12 o reprezentare a valorii ariei i a
factorului de form care au fost calculate pentru
formele prezentate n figura 2.11, fiecare este codat
cu ajutorul unei culori n funcie de clas.






Obiectele necunoscute sunt reprezentate i msurate dup cum se arat n figura 8.13. Valorile
msurate pentru aceeai parametrii sunt reinute ntr-un graf i distana de la centru la fiecare elips
este msurat. Cea mai apropiat clas este raportat ca i identificare (n acest exemplu prin
colorarea trsturii n imagine). Dac punctul nu este n elips atunci identificarea este marcat s
indice un grad mai sczut de ncredere (liniile negre din jurul formelor din figur).

Fig.8.13 Un exemplu de forme necunoscute care
trebuie identificate folosind reprezentarea din figura
8.12. Codurile de culoare identific clasa a crei
valoare medie a ariei i a factorului de form este mai
apropiat de cea obinut pentru o form necunoscut
care a fost msurat.






Acest mod de abordare este extrem de rapid de aplicat, poate urca uor i la dimensiuni mai
mari (mai muli parametrii msurai) i permite ca noi clase s fie adugate uor, prin msurarea
unei noi populaii de obiecte de exerciiu, dar, n acelai timp, are i multe limitri. Selectarea
msurrii celui mai bun parametru pentru a distinge clase variate este departe de a fi simpl, iar n
exemplul dat acest lucru a fost lsat pe baza judecii umane. Exist ns unele metode statistice
care sunt capabile s sorteze dintr-un numr mare de parametrii msurabili cel mai economic set
pentru a-l folosi.
Alt limitare este i presupunerea c ciorchinele de puncte, pentru fiecare clas, este descris
de deviaia medie i standard. De fapt, acest lucru este observat n cazul msurrilor de mrime (sau
uneori pentru logaritmii valorilor mrimii), dar rareori pentru parametrii de form sau pentru
valorile culorii sau densitii. Este posibil s se fac modele non-parametrice pentru clase, de
exemplu prin construirea unei histograme n-dimensionale de observaii, dar acest lucru se apropie
de o implementare logic a tehnicilor de identificare, i se cer mult mai multe observaii n seturile
de exerciiu.
A treia limitare este bineneles cerina setului de exerciiu. Selectarea unei populaii de forme
reprezentative din fiecare clas, care sunt echilibrate statistic, i includerea tuturor variantelor este
foarte dificil de realizat. Folosirea unei populaii de exerciiu mare poate deveni consumatoare de
timp sau foarte scump, i a unei populaii mici poate fi chiar prtinitoare. Spre deosebire de alte
moduri de clasificare, aceast metod nu poate nva din greelile ei sau nu se poate mbogi prin
experien.
94
O alt limitare este i faptul c distana de la un punct msurat la centru fiecrei clase are
nsemntate special. Pentru un necunosctor calcularea acestei distane se ridic la presupunerea c
msurarea spaiului este ortogonal i toate axele de distan au aceiai nsemntate. De exemplu, de
ce trebuie o diferen de 0,1 a factorului de form s aib aceeai importan cu o diferen de 0,1 a
mrimii? i, dac se ntmpl ca factorul de form s foloseasc parametrii de mrime (dac
lungimea i rotunjimea ar fi cele dou axe din exemplul precedent), este echivalent cu un graf de
axe care nu sunt carteziene, sau cu o elips a crei ax mare i mic nu sunt paralele cu axele
parametrice. Este uor s enumeri slbiciunile acestui mod simplu i direct de abordare, dar de
asemenea este adevrat c multe dintre problemele de clasificare automat, pentru care este folosit
analiza de imagini, sunt destul de simple astfel c aceste metode funcioneaz. Implementare unei
metode mult mai riguroase, bazat pe mai multe tehnici statistice, este ntotdeauna o opiune atunci
cnd este nevoie s se rezolve probleme mai complicate.
8.4 Extragerea trsturilor

Problema extragerii trsturilor implic dou probleme importante: cum s vizualizezi i s
organizezi trsturile; ce trsturi s extragi i cum s msori trsturile selectate ale obiectelor.
8.4.1 Organizarea i vizualizarea trsturilor
Datorit faptului c problema analizei datelor implic multe observaii, este important s fie
organizate aceste date ntr-un mod sensibil, nainte de a fi prezentate i analizate de oameni sau de
aparate. Unul dintre cele mai tradiionale modele este acela n care se folosete un tabel n care
obiectele sunt reprezentate pe linie, iar trsturile pe coloan.
8.4.2 Selecia trsturilor
Procesul de selectare al trsturilor potrivite a fost de multe ori identificat ca fiind mai critic
dect algoritmii de clasificare. De aceea nu exist reguli definitive, universal valabile, pentru a
defini ce trsturi trebuie folosite n fiecare situaie specific. Exist totui cteva repere care ne
sunt folositoare n rezolvarea acestor probleme:
*s se caute ntotdeauna trsturi discriminative ale obiectelor luate n considerare;
*s se ocoleasc trsturile cu un coeficient de corelaie mare;
*s se pstreze numrul de trsturi ct de mic este posibil;
*s se considere frecvent, dar nu ntotdeauna, trsturi care sunt invariante la unele transformri
geometrice;
*s se foloseasc trsturi care pot fi msurate obiectiv prin diferite metode fr a implica prea
muli parametrii.
8.4.3 Clasificarea
Clasificarea include un domeniu larg de decizii teoretice care se folosesc pentru identificarea
imaginilor sau a prilor componente ale acesteia. Toi algoritmii de clasificare se bazeaz pe
presupunerea c imaginea analizat este descris de una sau mai multe caracteristici, i fiecare
dintre aceste trsturi aparine uneia dintre clasele distincte. Aceste clase pot fi specificate apriori de
un analist (se realizeaz n cazul clasificrii supravegheate), sau trsturile determinate sunt adunate
automat ntr-un set de clase prototip n cadrul cruia analistul specific numai numrul de categorii
dorite (clasificare nesupravegheat).
n cadrul clasificrii imaginilor se analizeaz proprietile numerice a unor trsturi variate ale
imaginilor i datele obinute se organizeaz n categorii. Algoritmii tipici de clasificare au dou
faze: faza de pregtire (training) i faza de testare (testing). n prima faz, cea de pregtire,
proprietile caracteristice ale trsturilor imaginii sunt izolate, i, pe baza acestora, este creat o
descriere unic a fiecrei categorii clasificate. Ulterior, n faza de testare, aceste partiii ale
proprietilor sunt folosite pentru a clasifica trsturile imaginilor.
95
O component foarte important a procesului de clasificare o reprezint descrierea claselor de
pregtire. n cadrul clasificrii supravegheate pot fi folosite, pentru a extrage descriptorii diferitelor
clase, procesele statistice (ex. cele bazate pe cunoaterea apriori a probabilitii de distribuie a
funciilor) sau procesele de distribuie liber. n timp ce clasificarea nesupravegheat se bazeaz pe
algoritmi de adunare care segmenteaz automat datele de pregtire n clase prototip. n ambele
cazuri criteriul motivaional care st la baza construirii claselor de pregtire este reprezentat de
faptul c acestea trebuie s fie:
- independente- schimbarea descrierii unei clase de pregtire trebuie s nu schimbe valoarea
alteia;
- descriminatorii- diferite trsturi ale imaginii trebuie s aib descrieri semnificative diferite;
- de ncredere - toate trsturile imaginii din cadrul unui grup de pregtire trebuie s
mprteasc descrierile comune definitorii ale acelui grup.
O modalitate convenabil de a realiza o descriere parametric a acestui model este printr-un
vector de trsturi (v
1
, v
2
, ...,v
n
), unde n este numrul de atribute care descriu fiecare trstur a
imaginii i a clasei de pregtire. Aceast reprezentare ne permite s considerm c fiecare trstur
a imaginii ocup un anumit punct, iar fiecare clas de pregtire ocup un subspaiu dintr-un spaiu
de clasificare n-dimensional. Vzut n acest mod, problema clasificrii este aceea de a determina
crui sub-spaiu i aparine fiecare vector de trsturi.

8.5 Recunoaterea formelor
8.5.1 Metode de recunoatere cu decizie teoretic

a)Metode de recunoatere utiliznd modele (abloane)

Una din primele i cele mai simple metode de recunoatere a formelor este potrivirea cu
modelul. Fiecrei clase i corespunde un model. Forma de clasificat este comparat cu acest model
i pe baza criteriului de clasificare stabilit n prealabil, forma de intrare se atribuie unei anumite
clase. O astfel de abordare se utilizeaz mult n cazul dispozitivelor automate de recunoatere a
caracterelor i a codurilor bancare. Criteriul de clasificare este un criteriu de similitudine a formei
de intrare cu modelul. Pentru detectarea obiectului sau caracterului n imagine, aceasta este baleiat
cu o fereastr(masc) ce reprezint obiectul sau caracterul model pn cnd modelul i obiectul din
imagine se suprapun.
n cazul imaginilor binare, cel mai simplu criteriu de similitudine l constituie numrul maxim
de coincidene ntre pixelii ablonului i pixelii poriunii de imagine comparate cu ablonul. Metoda
este afectat de zgomot, distorsiuni i rotiri de imagine i nu poate fi aplicat atunci cnd imaginea
este cuantizat n mai multe nuane de gri. n acest caz se adopt drept criteriu de similitudine fie
distana D dintre ablon i fereastra imagine, fie funcia de corelaie normalizat dintre ablon i
fereastra de imagine,R.
Astfel, dac G
S
este funcia de gri pentru ablon i G
Io,Jo
-funcia nivel de gri pentru fereastra de
imagine cu originea n punctul (I
o
, J
o
)-originea ferestrei fiind n colul din stnga sus:
G
S
: M
S
x N
S
->N


G
Io,Jo
: M
Io
x N
Jo
->N
unde n
1
xn
2
este dimensiunea imaginii, m
s
xn
s
este dimensiunea modelului.
Funcia distan D dintre ablon i fereastra de imagine se definete prin:

=
+ + =
1
0
1
0
2 / 1 2
0 0 , 0 0
} )] , ( ) , ( [ { ) , (
0 0
s s
m
i
n
j
j i s
j j i i G j i G j i D
(8.20)
Se consider c obiectul din fereastra de imagine aparine clasei ablonului dac aceast distan
este zero. Datorit prezenei zgomotului, n loc de D(i
o
,j
o
)=0, se adopt criteriul
D(i
o
,j
o
)=minD(i,j)<=T
D
, unde T
D
este un prag prestabilit.
96

n prezena zgomotului se prefer funcia de corelaie normalizat ntre ablon i fereastra de
imagine:


=
+ +
+ +
=
1
0
1
0
2
0 0
1
0
1
0
0 0
0 0
)] , ( [
) , ( ) , (
) , (
0 0
0 0
s s
s s
m
i
n
j
j i
m
i
n
j
j i s
j j i i G
j j i i G j i G
j i R
(8.21)
Criteriul de similitudine este R(i
o
,j
o
)=max R(u,v)>=T
R
, unde T
R
este un nivel prestabilit iar
1<= R(i
o
,j
o
)<=1.
Exist metode secveniale de comparare cu modelul, care reduc timpul i volumul de calcul.
Metoda suprapunerii cu modelul prezint unele dezavantaje care o fac s fie mai puin utilizat.
Unul dintre dezavantaje ar fi faptul c la o baleiere a imaginii se poate detecta doar prezena
obiectului reprezentat prin ablonul respectiv. Dac se urmrete detectarea mai multor obiecte i
clasificarea lor, imaginea trebuie baleiat pe rnd cu fiecare ablon. n acelai timp i volumul de
calcul, la o singur baleiere, este foarte mare, decizia lundu-se destul de trziu. Un alt dezavantaj
este i faptul c potrivirea modelului este dependent de rotaia imaginii.

b)Metode de recunoatere bazate pe funcii de decizie n spaiul trsturilor

Forma de intrare (de clasificat) poate fi reprezentat printr-un vector [v] de dimensiune n
1
x n
2
:
[v]=[v
1
v
2
v
n1 n2 1
]
T
.Ea trebuie comparat, n spaiul euclidian al formelor de dimensiune n
1
n
2
,
cu formele de referin ce reprezint clasele C
I
din mulimea ={ C
i
, i=1,2,p}.
De obicei dimensiunea n
1
n
2
a vectorului [v] este mare i atunci comparaia nu se mai face n
spaiul formelor, ci ntr-un spaiu de dimensiune mult mai mic s, numit spaiul trsturilor
(s<<n
1
n
2
).
n linii mari prin trsturi se neleg caracteristici numerice comune tuturor formelor analizate,
ce concentreaz o cantitate mare de informaie i care, pe ct posibil, iau valori diferite de la o clas
la alta. Unele dintre cele mai importante trsturi au fost prezentate n capitolele anterioare.
Criteriile de selecie trebuie s in seama de importana trsturilor n separarea claselor (distana
ntre clase s fie suficient de mare), timpul, costul, redundana, etc. De cele mai multe ori se cere
invariana trsturilor la rotaie i translaie.
Avnd n vedere cele menionate mai sus, un sistem de recunoatere a formelor n abordarea cu
decizie teoretic poate fi reprezentat convenional prin dou subsisteme: subsistemul de extragere a
trsturilor i subsistemul de clasificare sau de recunoatere propriu-zis.
Clasificarea se face pe baza comparaiei dintre vectorul trsturilor msurate
[x]=[x
0
,x
1
, x
s 1
]
T
i vectorii trsturilor de referin [x
i
]=[x
i
0
, x
i
1
,

x
I
s-1
]
T
i=1,2,,p,
cu ajutorul unor funcii d
i
: numite funcii de decizie sau funcii discriminant. Dintre acestea
cele mai utilizate sunt funciile liniare i funciile distan.
O funcie de decizie liniar este de forma : d([x])=[w]
T
[x]+w
s
unde [w]=[w
0
,w
1
,,w
s-1
]
T
este
vectorul ponderilor, iar [x]=[x
0
,x
1
,,x
s-1
]
T
este vectorul trsturilor, w
s
=const.
n abordarea recunoaterii formelor prin metoda funciilor de decizie liniare, dac pentru un
i{1,2,,p},d
i
(|x|)>d
j
(|x|) oricare ar fi j{1,2,,p}, jI, atunci forma de intrare [x] se atribuie
clasei C
i
. n vederea recunoaterii, n faza iniial, spaiul trsturilor ,, este partiionat n mulimi
disjuncte X
i
,i=1,2,3,p reprezentnd clasele. Ele sunt separate prin frontiere de decizie definite
prin funciile discriminant respective, d
i
, i=1,2,,p. n cazul funciilor liniare, frontierele reprezint
hiperplane. Alte hipersuprafee de separaie utilizate sunt hipersferele, hipercuburile i
hiperelipsoizii.

97
8.5.2 Recunoaterea obiectelor folosind shape-from-shading
Recunoaterea obiectelor din mai multe biblioteci de imagini reprezint cheia pentru
manipularea automatizat a unui volum ct mai mare de informaii vizuale. Scopul general al
multor aplicaii este o recunoatere rapid a imaginilor n funcie de coninutul lor. Multe dintre
cercetrile de specialitate realizate pentru recunoaterea obiectelor dintr-o bibliotec mare de
imagini, s-au concentrat pe folosirea unui numr redus de caracteristici ale imaginii. Una dintre cele
mai cunoscute scheme pentru recunoaterea obiectelor este folosirea atributelor histogramei.
Aceast idee a fost emis pentru prima dat de M. Swain[4]
4
,i se referea la refolosirea imaginilor
color din baza de date. Ideea acestei reprezentri este de a strnge atributele potrivite alese pentru
imagine ntr-o histogram grosolan, dar corect, i, pe baza histogramei distanei minime, de a
efectua recunoaterea. Aceast metod a refolosirii informaiilor din baze de date a fost extins i la
reprezentare texturii[5]
5
i a orientrii[6]
6
.De asemenea au fost folosite pentru recunoaterea
obiectelor din imaginile aranjate i din histogramele informaiilor formelor topografice. Pentru
recunoaterea liniilor se folosete o reprezentare apropiat de cele prezentate, histograma
geometric. Aceast reprezentare nu folosete atributele neprelucrate ale imaginii ci atributele
relative definite prin perechi de linii segmentate din mtile de muchii (edge-maps).
n ciuda acestui interes prezentat pentru dezvoltarea reprezentrii compacte a obiectelor, pentru
recunoterea rapid a imaginilor i pentru refolosirea acestora, pe de alt parte s-a realizat folosirea
unui nivel mare de descriptori relaionali pentru o scar larg de probleme de recunoatere a
obiectelor.
Tehnica shape-from-shading se ocup cu gsirea orientrii unei suprafee prin variaia local a
strlucirii msurate. Exist dovezi psiho-fizice care arat faptul c acest proces joac un rol
important n percepia i recunoaterea topografiei suprafeelor[7]
7
.De-a lungul timpului au fost
diferii autori care au ncercat s gseasc diferite metode pentru a realiza aceast recunoatere a
formelor. Dintre acetia i amintim pe Bicksel i Pentland[8]
8
,ei au realizat o metod care cere o
cunoatere anterioar a celui mai nalt punct singular dintr-o suprafa. Pe de alt parte Oliensis i
Dupuis[9]
9
au elaborat un algoritm care realizeaz reconstrucia informaiilor importante din date
care conin intensitatea pixelilor. n acelai timp este destul de interesant i folosirea aparatueii
teoretice de nivel nalt pentru a rezolva ecuaiile expunerii imaginii ca o problem a valorilor de
grani. Legat de acest lucru Rouy i Tourin[10]
10
au artat corectitudinea i unicitatea soluiilor n
cazul shape-from-shading pentru cazurile n care sursa de lumin i direcia de vedere coincid.
S-a observat c aceast metod SFS poate fi considerat furnizoarea cheie a nelegerii structurii
3D prin intermediul unor reprezentri 2D. Acest proces de cercetare dureaz de mai mult de dou
decenii i se ocup cu gsirea formelor 3D ale suprafeelor din modelele de proiecie.
Clasicul mod de abordare a SFS este exprimat printr-un proces de minimizare a energiei folosind
aparate performante de calcul. Principalul scop al acestei metode este gsirea unei schie care s
reprezinte orientarea suprafeei locale, prin minimizarea unei funcii eroare. Funcia conine o limit
apropiat a datelor i o limit obinuit care controleaz netezimea schiei gsite. Datorit faptului
c se cere gsirea unei schie, ecuaiile care variaz trebuie s fie stabilizate prin constrngerea
domeniului de definiie. Din aceast cauz, diferitele formulri care au aprut n literatura de
specialitate au fost focalizate pe trei probleme mari. Prima dintre acestea o reprezint definirea unei

4
M.J.Swain Interactive indexing into image databases, Image Vision Storage Retrieval ,1995, pag 95-103
5
G.L.Gimelfarb,A.K.Jain On retrieving textured images from am image database, Pattern Recognition Nr29(9), 1996,
pag.1461-1483
6
C.Dorai, A.K.Jain View organisation and matching of free-form objects,IEEE Computer Society International
Symposium on Computer Vision, 1995, pag.25-30
7
E.Mingola, J.T.Todd Perception of solid Shape from Shading, Biological Cybernetic vol 53, 1986, pag 137-151
8
M.Bichsel, A.P.Pentland A Simple Algirithm for Shape from Shading, IEEE Conference Computer vision and
PatternRecognition, 1992, pag.459-465
9
J.Oliensis, P.Dupuis An Optimal Control Formulation and Related Numerical Methods for a Problem in Shape
Reconstruction, An Application Probability, vol4, Nr 2, 1994, pag287-346
10
E.Roy, A.Tourin A Viscosity Solutions Approach to Shape from Shading, SIAM Numerical Analysis, vol29, Nr.3,
1992, pag.867-884
98
funcii corecte. Cea mai mare parte a efortului a fost ndreptat spre gsirea modului n care pot fi
impuse constrngeri n gsirea schiei dorite. n unele cazuri s-a folosit pentru determinarea acestor
constrngeri relaiile dintre deformarea geometric a unui obiect 3D i deformarea 2D
corespondent imaginii proieciei sale.
Al doilea scop a fost s se gseasc modele fizice mai realiste ale procesului de reflectan. Iar
ultimul domeniu de activitate este modelarea condiiilor de grani. Munca clasic s-a ndreptat de
cele mai multe ori spre folosirea condiiei granielor nchise, care cere ca schia cerut s apar n
planul imaginii i ortogonal la muchiile nchise. Dac constrngerile graniei nchise nu sunt
valabile, atunci se poate folosi un singur punct pentru a constrnge realizarea schiei cerute.
Ideea principal din SFS este c regiunile locale dintr-o imagine E(x,y) corespund petelor
iluminate a unei suprafee continue pe poriuni z(x,y). Msura strlucirii E(x,y) va varia depinznd
de proprietile materialului suprafeei, de orientarea suprafeei i de direcia iluminrii.
Schema de reflectan R(p,q) caracterizeaz aceste proprieti i, realizeaz o conexiune
explicit ntre imagine i orientarea suprafeei. Orientarea suprafeei este caracterizat de
componentele gradientului suprafeei pe direciile x i y (ex. p=z/x i q=z/y). Problema SFS
este regsirea suprafeei z(x,y) din imaginea E(x,y).
Ecuaia iluminrii imaginii[11]
11
exprim faptul c msura strlucirii unei imagini este
proporional cu radiana punctului corespondent din suprafa, care este reprezentat de R(p,q).
Normaliznd imaginea intensitii i schia reflectanei, constanta de proporionalitate devine
unitate, iar ecuaia iluminrii este simplificat la E(x,y)=R(p,q). Urmtorul scop este s se gseasc
o suprafa neted care satisface ecuaia iluminrii imaginii. Aceasta reprezint o problem
variabil n care o funcie eroare global este minimizat direct prin adaptarea repetat a schiei.
Horn i Brook propun o funcie eroare a crei formul este:
dxdy n
y
n
x
n
s n y x E I )} 1 ( ) ( )) ( ) , ( {(
2
2
2
2
+

+ =

(8.22)
eroarea de strlucire termenul de termenul de
regularizare normare

Primul termen, eroarea de strlucire, ncurajeaz datele apropiate de intensitatea imaginii
msurate i de funcia de reflectan. Este singurul termen care folosete direct informaiile
proieciei. Al doilea termen impune constrngeri de netezire n refacerea suprafeelor normale,
separ schimbrile mari locale din orientarea suprafeei, msurate prin amplitudinea derivatelor
pariale a suprafeei pe direciile x i y. Ultimul termen impune constrngeri de normare n regsirea
formelor. Constantele i sunt multiplicatori Lagrange.
Aceast funcie este minimizat prin rezolvarea ecuaiilor lui Euler:
0 ) (
2
= + n n s s n E (8.23)

8.5.3 Aplicaii ale folosirii culorilor n recunoaterea formelor
2.5.3.1 Potrivirea culorilor
Potrivirea culorilor este o metod prin care se calculeaz ce culoare, i ct de mult din fiecare
culoare, exist ntr-o regiune a unei imagini. Se folosesc aceste informaii pentru a verifica dac alte
imagini conin aceleai culori n acelai raport.
Informaia color dintr-o imagine poate conine una sau mai multe culori. Aparatele de vedere
artificial folosesc informaia color tridimensional dintr-o imagine, i o reprezint ca un spectru
color unidimensional. Aplicaiile de vedere artificial compar informaia color din ntreaga
imagine, sau regiune din imagine, cu spectrul color cunoscut, i calculeaz o valoare pentru fiecare

11
B.K.P.Horn, M.J.Brooks Shape from Shading, MIT Press Cambridge MA, 1989
99
regiune. Aceast valoare arat ct de apropiat este informaia color din regiune de informaia
reprezentat de spectru color. Aceasta poate fi folosit n aplicaii de identificare sau inspecie a
culorilor, precum i n alte aplicaii care cer compararea culorilor pentru a lua decizii.
n figura 8.14 este prezentat un exemplu de aplicaie de identificare a unei igle. Figura a
prezint igla care trebuie identificat, iar figura b prezint un set de diferite igle, precum i
rezultatul potrivirii culorilor, rezultat obinut pe timpul procesului de potrivire.


Fig.8.14
8.5.3.2 Localizarea culorilor

Se folosete localizarea culorilor pentru a se determina repede regiunile color dintr-o imagine.
Prin localizarea culorilor se creeaz un model sau portret care reprezint culorile care sunt cutate.
Diferitele aplicaii de vedere artificial caut modelul realizat n fiecare imagine achiziionat i
calculeaz o valoare pentru fiecare potrivire. Aceast valoare indic ct se apropie imaginea color
din model de imaginea color gsit n regiune.
Algoritmii de localizare color furnizeaz o metod rapid de localizare a regiunilor dintr-o
imagine cu anumite culori. Se folosete localizarea culorilor n aplicaii care:
- cer locaia i numrul de regiuni dintr-o imagine care conin informaia color specificat;
- retransmit informaia color cumulativ din regiune, n loc s reprezinte felul n care culorile
sunt aranjate n regiune;
- nu cer o orientare regiunii;
- nu cer locaia la nivel exact al pixelilor.
Instrumentele de localizare a culorii n IMAQ Vision msoar similitudinea dintre o
reprezentare ideal a unei trsturi, numit model, i o trstur care poate fi prezent n imagine. O
trstur pentru localizarea culorilor este definit ca fiind o regiune dintr-o imagine care conine
anumite culori specifice. Se folosete localizarea color n aplicaii de identificare i sortare.
n figura 8.15 se arat o aplicaie de sortare a bomboanelor. Folosind un model color al
diferitelor bomboane din imagine, prin localizarea color se determin foarte repede poziia
diferitelor bomboane.



Fig.8.15

100
8.5.3.3 Potrivirea culorilor dup ablon

Se folosete potrivirea culorilor dup ablon pentru a localiza rapid diferite abloane
cunoscute, sau de referin, dintr-o imagine color. Prin aceast potrivire se creeaz un model sau un
ablon care reprezint obiectul care trebuie cutat. Astfel c aplicaia folosit caut modelul n
fiecare imagine achiziionat, i calculeaz valoarea pentru fiecare potrivire. Valoarea calculat
indic ct de apropiat este modelul de ablonul color considerat. Aceast potrivire se folosete dac:
*obiectul care se dorete a fi localizat conine informaie color care este diferit de fond, i se
vrea s se gseasc locaia obiectului n imagine foarte exact. Pentru aceste aplicaii potrivirea
abloanelor furnizeaz o soluie mai precis dect localizarea color, deoarece folosete informaii
despre form pe timpul cutrii.
n figura 8.16 se arat diferena dintre localizarea color i potrivirea abloanelor color. Figura
8.16a este un ablon color care reprezint un rezistor. n figura b se prezint localizarea color a
rezistoarelor, potrivirea nu este foarte precis pentru c informaia color este limitat. Potrivirea
abloanelor color folosete localizarea color pentru a gsi obiectele i apoi folosete potrivirea cu
ablon pentru a stabili exact locaia, ducnd la un rezultat mai exact dup cum se vede n figura
8.16.

Fig.8.16

*obiectul care se dorete a fi localizat are proprieti pe scara nivelelor de gri care sunt dificil de
caracterizat, sau sunt asemntoare cu ale altor obiecte din imaginea studiat. n asemenea cazuri
potrivirea folosind abloane gri poate s nu dea rezultatele ateptate. Dac obiectul are unele
informaii color care l difereniaz de alte obiecte din scen, culoarea furnizeaz informaia
adiional pentru a localiza obiectul.
Figura 8.17 arat avantajele folosirii informaiei color cnd se localizeaz sigurane codate
color dintr-o cutie de sigurane. Figura 8.17a arat o imagine gri a unei cutii de sigurane. n aceast
imagine, potrivirea cu instrumente care folosesc abloane gri realizeaz cu greutate diferena dintre
o rezisten de 20 i una de 25, din cauza intensitii similare a scrii de gri. n figura 8.17b
culorile ajut la separarea rezistenelor. Aceast adugare a culorilor ajut la mbuntirea
exactitii prin folosirea instrumentelor de potrivire cu ablon.

Fig.8.17
Potrivirea cu ablon color este cheia pentru multe aplicaii, aceasta furnizeaz aplicaiilor
informaii despre numrul de cazuri i localizarea diferitelor abloane n imagine

101


9. Concluzii

Din tot ceea ce a fost prezentat n aceast lucrare pot fi determinate cteva caracteristici i, n
acelai timp, probleme aprute n analiza imaginilor. Dintre acestea pot fi amintite urmtoarele:
Cercetrile realizate n acest domeniu au o natur inter i multi-disciplinar deoarece implic
att informatic, matematic, psihologie,inteligen artificial, precum i multe alte discipline;
Nu exist un ghid stabilit pe baza cruia s se aleag trsturile formei care trebuie s fie
calculate, dar nu exist nici metode de clasificare care s se poat folosi n orice tip de
problem;
Este important cunoaterea aspectelor specifice ale fiecrei probleme pentru a defini
trsturile potrivite i pentru a selecta metodele de clasificare eficiente;
n marea majoritate a aplicaiilor se folosesc forme 2D n detrimentul celor 3D;
Pentru a obine rezultate favorabile n procesul de clasificare trebuie s se foloseasc
algoritmi potrivii att n procesarea imaginilor ct i n analiza formelor;
Domeniul de aplicabilitate al analizei imaginilor este foarte variat, mergnd de la biologie
pn la cercetrile spaiale, din industrie pn la aciunile de pe cmpul de lupt, dar din pcate
nc nu s-au realizat algoritmi care s rezolve toate tipurile de probleme aprute ntr-un anumit
domeniu.
Orice pronostic asupra viitorului analizei imaginilor trebuie s ia n considerare problemele
prezentate anterior i s ncerce s determine un mod de rezolvare a lor. Datorit acestui lucru se va
ncerca gsirea, cel puin din punct de vedere teoretic, a ctorva metode de rezolvare a lor. n
rndurile urmtoare sunt prezentate cteva dintre acestea.
Datorit faptului c analiza imaginilor are o natur inter i multi-disciplinar este nevoie de
tehnic care s proceseze informaia n timp ct mai scurt, calculatoare cu un procesor rapid i
mult memorie, deoarece numai aa se va putea nelege vederea biologic i se vor lua decizii
"n timp real". n acelai timp, pentru a se putea realiza acest lucru trebuie s existe sisteme
automate de analiz a formelor care s aib posibiliti asemntoare cu cele ale sistemului de
vedere uman. De asemenea dezvoltarea calculatoarelor, n special a sistemelor paralel, poate
furniza putere de calcul care s permit extragerea unor trsturi mai complicate, ceea ce duce la
realizarea unor metode de clasificare mai puternice. n acelai timp trebuie s se in cont i de
rezultatele cercetrilor realizate n psihologie i neurologie pentru a determina soluiile adoptate
de cel mai puternic analizator al formelor, sistemul vizual uman. Se tie c modul de organizare
a cunotinelor depinde de reprezentrile utilizate, iar pentru reprezentarea scenelor complexe
statice se poate recurge la "imagini mintale", reprezentri sau scheme cognitive. innd cont de
acest lucru n cadrul procesrii i analizei imaginilor de ctre calculator trebuie s se realizeze
pentru acesta o baz de date care s conin reprezentri a diferitelor forme.
Se dorete ca pe viitor folosindu-se rezultate din statistic i matematic, precum i din
experimente realizate pentru determinarea trsturilor i a metodelor de clasificare, s se
gseasc algoritmi care s poat fi folosii pentru rezolvarea fiecrei clase de probleme care
exist n acest domeniu. Rezultatele experimentale obinute de A.Treisman (1969,1988) au
evideniat faptul c detectarea unor trsturi fizice simple este un proces automat, preatenional,
n cazul omului. Experimentul presupunea semnalizarea dac n imagine apare sau nu un anumit
stimul int. Pentru a ngreuna discriminarea, n imagine apar i ali stimuli distractori. n prima
etap stimulul int se deosebea de distractori printr-o singur trstur, iar apoi interveneau
dou deosebiri. S-a observat c timpul de reacie rmne constant n cazul n care identificarea
se face pe baza unei singure trsturi i crete liniar cu numrul de trsturi implicate. Aceasta
permite concluzia c extragerea trsturilor individuale se realizeaz n paralel, i combinarea
lor se realizeaz serial. innd cont de concluzia obinut dup analiza omului, trebuie s se
realizeze programe care funcioneaz pe acelai principiu.
102
O posibilitate particular pentru a determina aspectele specifice ale unei probleme este prin
aplicarea metodologiei cercetrii adnci", considernd cteva aplicaii tipice. Cteva rezultate
din neuro-biologie au relevat faptul c selecia informaiilor ce vor fi prelucrate, selecie
realizat de sistemul vizual uman, este realizat printr-o mulime de procese ascendente
(intensitatea, frecvena, neobinuitul stimulului) sau descendente (importana, motivaia,
relevana stimulului).
Mediul real este complex, el cuprinde obiecte i forme de o mare varietate care evolueaz i,
n acelai timp, este afectat de diverse perturbaii. Deoarece sistemele cognitive (umane sau
artificiale) dispun de capaciti limitate de procesare, i deoarece se impune adoptarea unei
decizii (adaptive) puternice, este necesar selecia stimulilor semnificativi. Prelucrarea primar
i o parte a procesrilor secundare a informaiei vizuale opereaz asupra configuraiilor
complexe ale imaginii 3D constituite. Aa c ar trebui s se foloseasc analiza formelor 3D
deoarece astfel se pot obine mai multe informaii dintr-o imagine, dar acest lucru se poate
realiza numai odat cu creterea vitezei calculatoarelor. n vederea 3D un rol important l are
matematica (geometria diferenial i sistemele neliniare), grafica pe calculator i sistemele
paralel.
nainte de a folosi un algoritm este necesar s fim siguri c a fost corect implementat, dar n
acelai timp trebuie comparat i cu alte exemple. n acest fel pot fi identificate att aspectele
pozitive, ct i cele negative ale fiecrui algoritm-metod n parte, i n acest fel se furnizeaz
informaii pentru realizarea unui cod de corecie a erorilor. De fapt la nceput dezvoltarea
analizei imaginilor i a vederii computerizate a fost empiric, de cele mai multe ori lipsind un
fundament matematic solid. Dar, chiar i acum, analiza formelor implic o serie de msurtori
prin care se definesc multiple trsturi spaiale i, de aceea, este nevoie de un fundament teoretic
solid.
Domeniul de aplicabilitate al analizei imaginilor este i va fi foarte mare, se vor oferii soluii
n cele mai variate arii de activitate ale oamenilor, n special n internet i realitatea virtual, dar
i n medicin, armat i multe altele.
ntr-o lume caracterizat i dominat de schimbri, informaia reprezint o condiie absolut
necesar pentru progresul general al omenirii. Noile dimensiuni ale mediului internaional, precum
i cele ale spaiului de lupt modern impun o manipulare adecvat a acesteia. Studiile n domeniul
informaiei sunt tot mai complete, fcndu-se utile n toate domeniile existenei omului. n viziunea
noastr viitorul i progresul fr deinerea informaiei nu se pot realiza, de aceea subliniem
importana existenei echipamentelor i programelor capabile s o proceseze .




10. Bibliografie


1.***Dicionar tehnic englez-romn, Bucureti, Editura Tehnic, 2004
2.***Image ProcessingToolbox-Users Guide, Version 2.1, The MathWorks, 1997
3.Mr.ing. CREANG, I.,Metode n procesarea digital a imaginilor, Bucureti, Editura
Academiei Tehnice Militare, 1994
4.GHINEA,M.,FIREEANU,V., MATLAB-Calcul numeric,grafic,aplicaii, Bucureti, Teora,
2003
5.MICLEA, M., Psihologie cognitiv, Iai, Editura Polirom, 1999
6.MITROFAN, G.,Introducere n televiziune, Bucureti, Editura Teora, 1998
7.POPESCU, D.,Senzori i sisteme de percepie artificial,Bucureti, Centrul de multiplicat
cursuri I.P.B. 1991
103
8.VERTAN, C., Prelucrarea i analiza imaginilor-ndrumar de laborator, Bucureti, Editura
Printech, 2001
9.VLAICU, A., Prelucrarea digital a imaginilor,Cluj-Napoca, Editura Albastr,1997
10ATTIA, J.O.,Electronics and circuit analysis using MATLAB,CRC Press, 1999
11.CARY, R.S.,The Avionics Handbook,CRC Press 2001
12. FONTOURA COSTA, L.,Shape Analysis and Classification, CRC Press, 2001
13.KERMIT, S., TIMOTHY A.D.,MATLAB PrimerSixth Edition, CRC Press, 2000
14.KNIGHT, A., Basics of MATLAB and Byond, CRC Press 2000
15.LAPLANTE COSTA, L.Computational Intelligence Perspective, CRC Press, 2001
16.MICHELI-TZANAKOU, EVANGELIA, Supervised and Unsupervised Pattern Recognition-
Feature Extraction and Computational,CRCPress, 2000
17.PERKINS,S., FISHER,R.,Connected Components Labeling,2003
18.YUNG,Q.S.,HUFANG,S.,Image and Video compression for multimedia Engineering, CRC
Press, 2000
19. http://www.cisc.ufl.edu/research/surflab
20. http://www.csse.uwa.edu.au
21. http://www.homepages.inf.ed.ac.uk
22. http://www.national_instruments/image_analysis_and_processing
23. http://www.research.csse,uwa.edu.au
24. http://www.secure.csse.uwa.edu.au
25. http://www.undergraduate.csse.uwa.edu.au

104












II. UTILIZAREA REELELOR NEURONALE N
PRELUCRAREA IMAGINILOR
1. Introducere

1.1 Inteligena artificial
Inteligena artificial ncearc rezolve problemele simulnd inteligena uman.
Principalele direcii ale calculului inteligent sunt:
- Calcul neuronal. Este folosit n principal n rezolvarea problemelor de asociere (clasificare,
aproximare, predicie etc.), bazndu-se pe extragerea, prin nvare, a unui model pornind de
la exemple. Sursa de inspiraie o reprezint structura i funcionarea creierului.
- Calcul evolutiv. Este folosit n principal n rezolvarea problemelor bazate pe cutarea soluiei
ntr-un spaiu mare de soluii poteniale (n particular n rezolvarea problemelor de
optimizare). Sursa de inspiraie o reprezint principiile evoluionismului darwinist.
- Calcul fuzzy. Este folosit atunci cnd datele problemei (i relaiile dintre acestea) nu pot fi
descrise exact ci exist un grad de incertitudine. Ideea de baz este de a nlocui valorile exacte
(crisp) cu valori fuzzy descrise prin funcii de apartenen.
n fiecare dintre cele trei direcii majoritatea prelucrrilor care se efectueaz au caracter
numeric, fiind necesar o codificare numeric adecvat a problemei. Aceasta motiveaz
prezena cuvntului calcul n denumirea domeniului. Pe de alt parte n fiecare dintre direciile
de mai sus se ncearc simularea unor comportamente inteligente ceea ce motiveaz prezena
termenului inteligent.
Principiul fundamental al calculului neuronal i al celui evolutiv este de a dezvolta sisteme de
calcul inteligent pornind de la implementarea unor reguli simple, comportamentul complex al
acestor sisteme derivnd aplicarea n paralel i n manier interactiv a acestor reguli.
Aceast abordare de tip bottom-up este n contrast cu abordarea de tip top-down specific
altor abordri din Inteligena Artificial.
Calculul neuronal i cel evolutiv fac parte din sfera mai larg a calculului natural al crui
principiu este de a prelua idei de rezolvare a problemelor din sistemele naturale. Obiectivul
principal al calculului natural este de a dezvolta metode de rezolvare a problemelor ru-puse
i a celor nerezolvabile prin metodele tradiionale (de exemplu, rezolvarea problemelor NP-
complete n timp polinomial).
Pe lng componentele amintite deja, calculul natural mai include calculul molecular (DNA
Computing), calculul cu membrane (Membrane Computing) i calculul cuantic (Quantum
Computing).
Dac primele dou direcii sunt deja tradiionale, ultimele trei sunt nc n primele faze de
dezvoltare.

1.2 Specificul calculului neuronal
Din punct de vedere funcional o reea neuronal este un sistem ce primete date de intrare
(corespunztoare datelor iniiale ale unei probleme) i produce date de ieire (ce pot fi
interpretate ca rspunsuri ale problemei analizate). O caracteristic esenial a reelelor
neuronale este capacitatea de a se adapta la mediul informaional corespunztor unei probleme
concrete printr-un proces de nvare. n felul acesta reeaua extrage modelul problemei
pornind de la exemple.
Din punct de vedere structural o reea neuronal este un ansamblu de uniti interconectate
fiecare fiind caracterizai de o funcionare simpl. Funcionarea unitilor este influenat de o
serie de parametri adaptabili. Astfel o reea neuronal este un sistem extrem de flexibil.
106

Structura unitilor funcionale, prezena conexiunilor i a parametrilor adaptivi precum i
modul de funcionare sunt inspirate de creierul uman. Fiecare unitate funcional primete
cteva semnale de intrare pe care le prelucreaz i produce un semnal de ieire. Interaciunea
multor uniti cu funcionare simpl conduce la un sistem care poate s rezolve probleme
complexe. Funcionarea sistemului este controlat de un set numeros de parametri ajustabili
care permit acestuia s se adapteze ct mai fidel mediului informaional n care este amplasat
(specific problemei de rezolvat).
Una dintre cele mai importante caracteristici ale unui sistem neuronal este caracterul su
adaptiv, faptul c poate s-i stabileasc parametrii de funcionare printr-un proces de nvare
bazat pe informaiile primite. Astfel de sisteme sunt adecvate, astfel, pentru problemele ce
sunt dificil sau chiar imposibil de formalizat pentru ele existnd doar exemple de rezolvare.
1.3 Structura unei reele neuronale
Din punct de vedere structural, o reea neuronal este un ansamblu de uniti funcionale
simple, interconectate. Elementele definitorii ale unei reele neuronale sunt:
Unitile funcionale
Arhitectura: specific modul n care sunt amplasate i interconectate unitile
funcionale. Arhitectura determin i fuxul informaional n cadrul reelei.
Funcionarea: specific modul n care fiecare unitate n parte i reeaua n
ansamblul ei transform semnalele de intrare n semnale de ieire. Funcionarea este
influenat de arhitectur, n special de modul de interconectare a unitilor.
Adaptarea (nvarea): specific modul de stabilire a parametrilor ajustabili
astfel nct reeaua s poate rezolva anumite probleme. n funcie de natura informaiei de care
se dispune, nvarea poate fi supervizat sau nesupervizat.
nvarea const n modificarea funcionalitii reelei prin modificarea parametrilor i/sau a
structurii acesteia. Procesul de nvarea bazat pe adaptarea parametrilor const n existena
unor reguli de modificare a parametrilor i un algoritm de aplicare a acestor reguli.
a) Unitatea funcional este componenta elementar de prelucrare a informaiei n cadrul unei
reele neuronale. O unitate funcional primete semnale din partea altor uniti i produce un
semnal de ieire. Att semnalele de intrare ct i cel de ieire sunt codificate numeric. Unitatea
integreaz semnalele de intrare innd cont de ponderea asociat fiecruia i transform
semnalul integrat prin aplicarea unei funcii de transfer (activare) obinnd semnalul de ieire.
b) Arhitectura unei reele neuronale nseamn modul n care sunt amplasate unitile
funcionale (topologie) i modul n care sunt interconectate (conectivitate). O reea neuronal
este formalizat printr-un graf orientat etichetat, n nodurile sale fiind amplasate unitile
funcionale, arcele specificnd conexiunile i deci fluxul informaional.
Cazul cel mai frecvent este cel al reelelor organizate pe nivele: un nivel de uniti de intrare
care primesc semnale din partea mediului, acestea neavnd alt rol dect acela de a retransmite
semnalul primit ctre alte uniti din reea, unul sau mai multe nivele de uniti ascunse care
sunt conectate doar cu alte uniti ale reelei fr a comunica cu mediul extern i cu rolul de
colecta, prelucra i distribui semnale ctre alte uniti i un nivel de ieire care colecteaz
semnale de la alte uniti, le prelucreaz i transmit semnalul obinut mediului extern.
Din punctul de vedere al topologiei exista reele n care nu are importan poziia geometric a
unitilor (reelele organizate pe nivele i reelele Hopfield) i reele n care organizarea
geometrica este esenial, relaiile de vecintate dintre uniti intervenind n algoritmul de
funcionare sau de nvare (reele Kohonnen, reele celulare).
Din punctul de vedere al conectivitii, interconectarea determina fluxul de semnale prin
reea, acesta fiind factorul esenial n determinarea algoritmului de funcionare. Astfel exista
dou categorii de reele:
107

X
Date de intrare
Y
rspuns
Fig. I.1 Reea neuronal ca sistem de transformare a semnalelor de intrare n semnale de ieire
reele de tip feed-forward - fluxul informaional este unidirectional, dinspre
unitile de intrare ctre unitile de ieire;
reele recurente - graful asociat conine conexiuni inverse directe (bucle) sau
indirecte (circuite).
Principalele tipuri de topologii sunt:
Arbitrara. Mulime de uniti pe care nu este definit nici o relaie de ordine. n
acest caz nu are importan nici locul i nici distantele dintre uniti . Un model cu o astfel de
topologie este modelul Hopfield. De regul, acestei topologii i corespunde o conectivitate
total.
Pe niveluri. Unitile sunt mprite n mai multe submulimi, numite niveluri.
n cadrul unui nivel nu are importanta modul de aranjare al unitilor. n aceast categorie
intr reelele feedforward cu unul sau mai multe niveluri.
Cu structura geometrica. Unitile sunt amplasate n nodurile unei grile
unidimensionale, bidimensionale sau chiar tridimensionale. n acest caz se poate defini o
funcie distan ntre uniti. n aceasta categorie intr reelele de tip Kohonen i cele celulare.
n practic se utilizeaz i arhitecturi mixte n care fiecare nivel poate avea o anumit structur
geometric.
Principalele tipuri de conexiuni sunt:
Conexiuni ntre elementele a dou nivele distincte (ntre straturi). Sunt folosite
n special la reelele organizate pe nivele.
Conexiuni ntre elementele aceluiai nivel (conexiuni laterale). Se folosesc la
reelele cu structur geometric.
Conexiuni inverse prin care o unitate este conectat cu ea nsi. Pot fi folosite
la toate tipurile de topologii.

Fluxul informaional reprezint modul n care curge informaia prin reea (de la unitile
care preiau datele de intrare ctre unitile care produc semnalul de ieire). n funcie de
modul de interconectare a unitilor, fluxul informaional poate aparine uneia dintre
categoriile:
Feedforward: flux unidirecional (informaia circula doar dinspre nivelul uniti
lor de intrare nspre cel al unitilor de ieire). Este ntlnit la reelele organizate pe nivele n
care nu exist conexiuni inverse.
Feedback: flux multidirecional (un semnal produs de o unitate poate s ajung
din nou la unitatea respectiva fie direct, fie prin intermediul altor uniti ). Este ntlnit la
reelele cu organizare oarecare i la cele n care sunt prezente conexiunile inverse.
c) Funcionarea
Funcionarea se refera la modul n care reeaua transform un semnal de intrare, X, ntr-un
semnal de ieire, Y. Ea depinde att de modul n care funcioneaz unitile ct i de modul n
care sunt interconectate. Unul dintre parametrii cei mai importani ai funcionrii este
ansamblul ponderilor asociate tuturor conexiunilor (W ). La prima vedere, o reea neuronala
poate fi vzut ca o cutie neagr care primete date de intrare i produce un rezultat.


108

Fig. I.3. Funcionarea unei reele recurente
X(0)=X
starea iniial
X(t+1)=F
W
X(t)
(sist. dinamic)
Y=X(T)
starea staionar

n funcie de specificul informaional exist dou moduri principale de funcionare:
- Funcionare neiterativ. n cazul reelelor n care fluxul informaional este de tip
feedforward, semnalul de ieire, Y, se poate obine prin aplicarea unei funcii, F
W
(care
depinde de parametrii reelei) , asupra semnalului de intrare, X




- Funcionare iterativ. n cazul reelelor n care sunt prezente conexiuni inverse nu este
suficienta o singur trecere a semnalului de intrare, X, prin reea pentru a obine semnalul de
ieire. n acest caz funcionarea se desfoar n timp, putnd fi descris printr-un proces
iterativ de forma: X(0) = X; X(t + 1) = F
W
(X(t)); t >=0. Semnalul de ieire se consider ca
fiind limita lui X(t) (X
*
=
) (
lim
1
t X
t
). n implementri, limita se aproximeaz prin X(T), T
fiind momentul n care este oprit procesul iterativ. Calitatea acestei aproximri depinde att de
proprietile lui F
W
ct i de X(0).





d) Procesul de nvare
Un sistem i mbuntete performanele prin achiziia de cunoatere realizat n cadrul
procesului de nvare. nvarea se refer la modificarea ponderilor asociate conexiunilor unei
reele i pragurilor asociate unitilor, care asigur adecvarea comportrii reelei la problema
pentru care a fost proiectat. Una din cele mai importante caliti ale unei reele neuronale este
tocmai capacitatea de a nva, posibilitatea nvrii din exemple permind evitarea
formalizrii detaliate a problemei. O alt calitate este capacitatea de generalizare care permite
producerea de rspunsuri pentru date pentru care reeaua nu a fost antrenat. Elementele pe
care se bazeaz procesul de nvare sunt mulimea de informaii i algoritmul de adaptare la
informaiile primite. n funcie de natura informaiilor primite, nvarea poate fi:
nesupervizat - n care sistemul primete doar semnale de intrare din partea
mediului, pe baza acestora descoperind trsturile statistice ale stimulilor i construind o
reprezentare codificat n ponderi a mediului care poate fi ulterior utilizat pentru ali stimuli.
supervizat n care se dispune de un set de antrenare (o mulime de exemple)
care conine perechi de forma (i, d) cu i semnal de intrare i d rspunsul corect, pe baza
acestuia ponderile ajustndu-se iterativ prin urmrirea minimizrii unei funcii de eroare sau
prin maximizarea unui indice de performan; aceast metod de adaptare trebuie s prevad
i testarea reelei antrenate prin reinerea din setul de antrenare a unui subset de testare i s
asigure o capacitate de generalizare prin meninerea unui nivel acceptabil de eroare pe setul de
antrenare.
Y=F
W
(X)
Fig. I.2. Funcionarea unei reele cu flux de tip feedforward
X
date de
intrare
Y
rspuns
109


2. Reele neuronale supervizate utilizate pentru refacerea
imaginilor degradate

2.1 Distorsiunile imaginilor
Imaginile sunt adesea nregistrate sub o varietate larg de mprejurri. Pe msur ce
tehnologia avanseaz rapid, interesul pentru fenomenele neobinuite sau ireproductibile crete.
Adesea ducem tehnologia imaginii la limitele de sus. Din acest motiv vrem ca din imagini s
nlturm formele de degradare.
Tehnologia imaginii nu este perfect, fiecare imagine nregistrat este o versiune a scenei
degradat. n fiecare imagine sau scen ntlnim limite n ceea ce privete rezoluia sau viteza
cu care este nregistrat.
Degradrile uzuale ale unei imagini sunt, de obicei datorate neclaritii, micrii i
zgomotului.
Neclaritatea poate aprea cnd un obiect din imagine este n deprtare. Obiectivul pierde
detaliul, iar nceoarea apare deoarece componentele de frecven nalt sunt atenuate.
Alt degradare comun este motion blur care e cauzat de micarea obiectivului relativ la
camer n timpul fotografierii. Zgomotul este, mai degrab o distorsiune datorat mediului de
transmisie sau stocare, dect a scenei de nregistrat. n urma afectrii cu zgomot pixelii din
imagine au valori modificate.
Procesul de degradare al imaginii poate fi mprit n dou categorii:
distorsiuni invariante spaial toate regiunile din imagine sunt afectate de
acelai tip distorsiune
distorsiuni variante spaial fiecare pixel din imagine poate suferi alt tip de
degradare, n funcie de poziia sa n imagine.
Cu alte cuvinte degradarea imaginii poate fi descris prin modele liniare sau neliniare. n
lucrarea de fa voi trata numai cazul n care degradrile pot fi descrise prin modele liniare.


2.2 Perceptronul multistrat
ncercrile de rezolvare a problemelor neseparabile liniar au condus la diverse variante privind
numrul de straturi de neuroni i funciile de activare utilizate. Perceptronul multistrat (MLP)
este tipul de reea neuronal cel mai cunoscut i mai des folosit.
De cele mai multe ori, semnalele se transmit n interiorul reelei ntr-o singur direcie: de la
intrare spre ieire. Nu exist bucle, ieirea fiecrui neuron neafectnd neuronul respectiv.
Aceast arhitectur se numete feed - forward. Straturile care nu sunt conectate direct la mediu
se numesc ascunse. Exist n literatura de specialitate o controvers privind considerarea
primului strat (de intrare) ca strat propriu-zis n reea, de vreme ce singura sa funcie este
transmiterea semnalelor de intrare spre straturile superioare, fr a face vreo prelucrare asupra
intrrilor.

110


Fig. II.1. Arhitectura unei reele cu un strat ascuns

Exist i reele recurente, n care impulsurile se pot transmite n ambele direcii, datorit unor
conexiuni de reacie n reea. Aceste tipuri de reele sunt foarte puternice i pot fi extrem de
complicate. Sunt dinamice, starea lor schimbndu-se permanent, pn cnd reeaua ajunge la
un punct de echilibru iar cutarea unui nou echilibru are loc la fiecare schimbare a intrrii.
Introducerea mai multor straturi a fost determinat de necesitatea creterii complexitii
regiunilor de decizie. Adugnd nc un strat, fiecare neuron se comport ca un perceptron
standard asupra ieirii neuronilor din stratul anterior i astfel ieirea reelei poate aproxima
regiuni de decizie convexe, rezultate din intersecia semiplanelor generate de neuroni. La
rndul su, un perceptron cu trei straturi poate genera zone de decizie arbitrare.
Din punctul de vedere al funciei de activare a neuronilor, s-a constatat c reelele multistrat
nu asigur o cretere a puterii de calcul n raport cu reelele cu un singur strat dac funciile de
activare rmn liniare, deoarece o funcie liniar de funcii liniare este tot o funcie liniar.
Puterea perceptronului multistrat provine tocmai din funciile de activare neliniare. Aproape
orice funcie neliniar poate fi folosit n acest scop, cu excepia funciilor polinomiale. n
prezent, funciile cele mai des utilizate n prezent sunt sigmoid unipolar (logsing), sigmoida
bipolar (tansing) sau liniar (purelin).

2.3 Algoritmul backpropagation
Algoritmul backpropagation este cel mai cunoscut i utilizat algoritm de nvare supervizat.
Numit i algoritmul delta generalizat deoarece extinde modalitatea de antrenare a reelei
MADALINE (regula delta), el se bazeaz pe minimizarea diferenei dintre ieirea dorit i
ieirea real, tot prin metoda gradientului descendent (gradientul ne spune cum variaz o
funcie n diferite direcii). Metoda a fost propus pentru prima dat de Bryson i Ho (1969),
dar la momentul respectiv a fost practic ignorat, deoarece presupunea un volum de calcule
prea mare pentru vremea respectiv. A fost redescoperit apoi de Werbos (1974), ns abia la
mijlocul anilor `80 a fost lansat de Rumelhart, Hinton i Williams (1986) ca instrument
general acceptat de antrenare a perceptronului multistrat. Ideea de baz este gsirea minimului
funciei de eroare n raport cu ponderile conexiunilor.
Algoritmul pentru un perceptron multistrat cu un strat ascuns (Negnevitsky, 2002):
Pasul 1: Iniializarea
Toate ponderile i pragurile reelei sunt iniializate cu valori aleatorii nenule, distribuite
uniform ntr-un mic interval.
Dac valorile acestea sunt 0, gradienii care vor fi calculai pe parcursul antrenrii vor fi tot 0
(dac nu exist o legtur direct ntre intrare i ieire) i reeaua nu va nva. Este chiar
indicat ncercarea mai multor antrenri, cu ponderi iniiale diferite, pentru gsirea celei mai
bune valori pentru funcia cost (minimul erorii). Dac ns valorile iniiale sunt mari, ele tind
s satureze unitile respective. n acest caz, derivata funciei sigmoide este foarte mic. Ea
111

acioneaz ca un factor de multiplicare n timpul nvrii i deci unitile saturate vor fi
aproape blocate, ceea ce face nvarea foarte lent.
Pasul 2: O nou epoc de antrenare
O epoc reprezint prezentarea tuturor exemplelor din setul de antrenare. n majoritatea
cazurilor, antrenarea reelei presupune mai multe epoci de antrenare.
Pentru a pstra rigoarea matematic, ponderile vor fi ajustate numai dup ce toi vectorii de
test vor fi aplicai reelei. n acest scop, gradienii ponderilor trebuie memorai i ajustai dup
fiecare model din setul de antrenare, iar la sfritul unei epoci de antrenare, se vor modifica
ponderile o singur dat (exist i varianta mai simpl, n care ponderile sunt actualizate
direct; n acest caz, poate conta ordinea n care sunt prezentai reelei vectorii de test).
Se iniializeaz toi gradienii ponderilor i eroarea curent cu 0:
0 =
ij
w
, E = 0.
Pasul 3: Propagarea semnalului nainte
3.1. La intrrile reelei se aplic un exemplu din setul de antrenare.
3.2. Se calculeaz ieirile neuronilor din stratul ascuns:

=
=
n
i
j ij i i
p w p x f p y
1
) ) ( ) ( ( ) (
(2.1)
unde: - n este numrul de intrri ale neuronului j din stratul ascuns,
- f este funcia de activare sigmoid.
3.3. Se calculeaz ieirile reale ale reelei:
) ) ( ) ( ( ) (
1

=
=
m
i
k jk jk k
p w p x f p y
(2.2)
unde: - m este numrul de intrri ale neuronului k din stratul de ieire.

= ))) ( ) ( ( ) ( ( ) (
1 2
p x p w f p w f p y
i
ji kj
k

3.4. Se actualizeaz eroarea pe epoc:
2
)) ( (
2
p e
E E
k
+ =
(2.3)
Pasul 4: Propagarea erorilor napoi i ajustarea ponderilor
4.1. Se calculeaz gradienii erorilor pentru neuronii din stratul de ieire:
) ( ' ) ( p e f p
k k
=
(2.4)
unde: eroarea este
) ( ) ( ) (
,
p y p y p e
k k d k
=
(2.5)
4.2. Se actualizeaz gradienii ponderilor dintre stratul ascuns i stratul de ieire:
) ( ) ( ) ( ) ( p p y p w p w
k j jk jk
+ =
(2.6)
4.3. Se calculeaz gradienii erorilor pentru neuronii din stratul ascuns
4.4. Se actualizeaz gradienii ponderilor dintre stratul de intrare i stratul ascuns
Pasul 5. O nou iteraie
Dac mai sunt vectori de test n epoca de antrenare curent, se trece la pasul 3.
Dac nu, se actualizeaz ponderile tuturor conexiunilor pe baza gradienilor ponderilor:
ij ij ij
w w w + =
(2.7)
unde: -

este rata de nvare.


Dac s-a ncheiat o epoc, se testeaz dac s-a ndeplinit criteriul de terminare (
max
E E <
sau
s-a atins un numr maxim de epoci de antrenare). Dac nu, se trece la pasul 2. Dac da,
algoritmul se termin.
Pornind de la algoritmul BackPropagation standard pot fi dezvoltate diferite variante care
difer ntre ele prin:
- modul de alegere a ratei de nvare: constant sau adaptiv;
112

- relaiile de ajustare (determinate de algoritmul de minimizare utilizat, ce
poate fi diferit de algoritmul gradientului simplu: algoritmi de tip gradient
conjugat, algoritmi de tip Newton, algoritmi aleatori de descretere,
algoritmi genetici etc.);
- modul de iniializare a parametrilor: iniializare aleatoare sau bazat pe un
algoritm de cutare;
- parcurgerea setului de antrenare (influeneaz doar varianta serial a
algoritmului): secvenial sau aleatoare;
- funcia de eroare: pe lng eroarea medie ptratic se pot folosi i msuri
ale erorii specifice problemei de rezolvat;
- criteriul de oprire: pe lng criteriul bazat pe numrul maxim de epoci i pe
eroarea corespunztoare setului de antrenare se pot folosi i criterii legate
de eroarea pe setul de validare i de mrimea ajustrilor din cadrul ultimei
epoci.
Motivaia dezvoltrii unor variante ale algoritmului standard o reprezint faptul c acesta
prezint o serie de inconveniente:
- Convergena lent: necesit multe epoci pentru a atinge o valoare suficient de
mic pentru eroarea pe setul de antrenare.
- Blocarea n minime locale: o data ce algoritmul ajunge ntr-un minim local al
funciei de eroare, algoritmul nu permite evadarea din acest minim pentru a atinge optimul
global.
- Stagnarea (paralizarea): algoritmul stagneaz ntr-o regiune care nu este
neaprat n vecintatea unui minim local ca urmare a faptului c ajustrile aplicate
parametrilor sunt foarte mici.
- Supraantrenarea: reeaua asigur o bun aproximare pe setul de antrenare ns
posed o capacitate de generalizare redus.

2.4 Metode de accelerare a vitezei de convergen
Alegerea unei valori adecvate pentru rata de instruire

are un efect semnificativ asupra


performanelor reelei. n mod obinuit, se consider
) 1 , 0 (
, dar e posibil ca acest interval
s fie prea larg. Stabilind o rat de nvare n jurul valorii de 0.2, se asigur obinerea unei
soluii, dei reeaua va necesita pentru instruire un numr mare de iteraii.
Este, de asemenea, posibil ca valoarea parametrului de nvare s creasc n timpul instruirii,
pe msur ce eroarea reelei descrete, situaie care conduce, n general, la mrirea vitezei de
convergen. n acest caz, exist ns riscul ca reeaua s sar prea departe de valoarea de
minim real, pentru o rat

inadecvat de mare. Creterea lui

n timpul instruirii este util


doar dac suprafaa de eroare este relativ neted astfel, pe msura apropierii de o soluie,
eroarea devine tot mai mic, ceea ce provoac schimbri nensemnate ale ponderilor. Deci,
este justificat mrirea vitezei de convergen prin creterea ratei de nvare.

2. 4.1. Metoda momentului
Metoda momentului ( Rumelhart, Hinton & Williams, 1986) propune adugarea unui termen
la ajustarea ponderilor. Acest termen este proporional cu ultima modificare a ponderii, adic
valorile cu care se ajusteaz ponderile sunt memorate i influeneaz n mod direct toate
ajustrile ulterioare:
) 1 ( ) ( ) ( + = p w p w p w
ij ij ij

(2.8)
113

Adugarea noului termen se face dup actualizarea gradienilor ponderilor dintre stratul
ascuns i stratul de ieire i dintre stratul de intrare i stratul ascuns.
Tehnica momentului funcioneaz bine pentru unele probleme, dar are efect redus, sau chiar
negativ, n cazul altor aplicaii.

2.4.2. Rata de nvare variabil
Metoda ratei de nvare variabile (Silva & Almeida, 1990) const n utilizarea unei rate de
nvare individuale pentru fiecare pondere i adaptarea acestor parametri n fiecare iteraie, n
funcie de semnele succesive ale gradienilor:

=
=
=
)) 1 ( sgn( )) ( sgn( ), 1 (
)) 1 ( sgn( )) ( sgn( ), 1 (
) (
p w p w p d
p w p w p u
p
ij ij ij
ij ij ij
ij

(2.9)
Dac pe parcursul antrenrii eroarea ncepe s creasc, n loc s scad, ratele de nvare se
reseteaz la valorile iniiale i apoi se continu procesul.
Pentru a evita oscilaiile care pot aprea n jurul soluiei optime, este necesar ca ratele de
instruire
ij

s descreasc n timp. Descreterea nu trebuie s fie nici prea rapid, nici prea
lent. irul
) (
ij

descrete suficient de lent dac seria sumelor pariale este divergent


(

+ =
j i
ij
,

).
Cu ct coeficienii descresc mai lent, cu att mai rapid decurge instruirea reelei. Condiia ca
irul
) (
ij

s descreasc suficient de rapid se exprim prin cerina ca seria ptratelor acestor


coeficieni s fie convergent (adic

+ <
j i
ij
,
2

)
Cu ct coeficienii
) (
ij

descresc mai repede, cu att mai rapid vectorul pondere uit deja
formele nvate.
Condiiile stabilite anterior reprezint pentru cazul propagrii napoi, o formulare matematic
a ceea ce Grosseberg numete dilema stabilitate plasticitate. Conform acestei dileme, o reea
neuronal trebuie s satisfac dou cerine contradictorii:
- pe de o parte, reeaua trebuie s fie suficient de stabil pentru a-i aminti formele nvate
anterior
- pe de alt parte, reeaua trebuie s fie suficient de plastic pentru a putea nva noi forme.

2.4.3. Evitarea minimelor locale
Este posibil ca propagarea napoi a erorii s genereze o stare de minim local, iar procesul de
instruire se oprete cnd reeaua atinge un minim local sau minim global al funciei criteriu.
Dac se atinge un minim local este posibil ca eroarea asociat ieirilor s fie nepermis de
mare. Problema care se pune este cum se poate face ca reeaua s ias dintr-o stare
corespunztoare de minim local. Exist mai multe posibiliti de abordare a acestei probleme:
- schimbarea constantei de instruire;
- schimbarea ponderilor iniiale;
- schimbarea numrului de uniti ascunse.
Adugarea unor valori aleatoare mici la vectorul pondere poate permite reelei s scape dintr-o
stare de minim local. Dac noua stare este suficient de ndeprtat de acest minim local, atunci
instruirea se poate desfura ntr-o nou direcie, fr a reveni n acel minim. Micile variaii
114

aleatoare depind de vecintatea minimului local, a crei configuraie nu este ns cunoscut
nainte de instruirea reelei.
Dac reeaua a atins o soluie acceptabil, nu este sigur c ea corespunde unui minim global
sau local; de obicei, dac soluia este satisfctoare din punct de vedere al erorii, nu conteaz
tipul minimului la care se ajunge.
O caracteristic a reelelor cu straturi ascunse este c ele au mai multe stri de minim global,
stri ce sunt perfect echivalente. Acestea se datoreaz numeroaselor simetrii n arhitectura
reelei. Prezena minimelor globale multiple nu reprezint nici o problem pentru procesul de
instruire.

2.4.4. Ruperea simetriei i iniializarea ponderilor
Dac iniial, toate ponderile sunt egale dar soluia necesit ns apariia ponderilor diferite,
sistemul nu va putea fi instruit deoarece eroarea se propag napoi prin semnale proporionale
cu ponderile, astfel se va obine pentru toi neuronii din stratul ascuns conectai la stratul de
ieire erori identice. Deoarece schimbarea ponderilor depinde de valoarea erorii ponderile
conexiunilor neuronilor din stratul ascuns cu neuronii din stratul de ieire vor fi ntotdeauna
aceleai, iar sistemul nu va putea iei din aceast stare (reeaua este paralizat). Inconvenientul
poate fi ndreptat considernd, la momentul iniial, valori aleatoare mici pentru ponderi,
valori ce conduc la ruperea simetriilor.
115

2.5 Reele neuronale artificiale recurente. Reele Hopfield
Reele neuronale artificiale recurente sunt caracterizate de:
- uniti de procesare neliniare;
- simetria conexiunilor sinaptice (w
ji
= W
IJ
);
- folosirea intensiv a feedback-ului.
Din aceast categorie fac parte reelele neuronale Boltzmann i Hopfield.
Reeaua neuronal recurent de tip Hopfield poate fi vzut ca o memorie asociativ sau ca o
memorie adresabil prin coninut, a crei funcie principal este regsirea tiparelor
stocate n memorie, ca rspuns la prezentarea unui tipar incomplet sau contaminat cu
zgomot. Esena memoriilor adresabile prin coninut const n transformarea tiparelor

R
n
stri stabile

s
, ale sistemului dinamic (proces de codare) i invers (proces de decodare).
Fiecare neuron, de tip McCulloch-Pitts, al reelei neuronale Hopfield este caracterizat prin una
din cele dou stri posibile: activ (s
i
=1), respectiv inactiv (s
i
=-1). Starea unei reele
neuronale Hopfield alctuit din N neuroni este definit de ctre vectorul:
s = [s
1
,s
2
,..., s
N
]
T
Potenialul intern al unui neuron j este:

=
=
N
i
j ji j
w v
1

, (2.10)
unde
=
j

pragul neuronului
Neuronul j i modific starea conform regulii

<
> +
=
0 , 1
0 , 1
j
j
j
v daca
v daca
s
(2.11)

n funcionarea reelei neuronale Hopfield se disting dou etape:
a) faza de memorare n care se calculeaz ponderile reelei ntr-o singur etap, spre
deosebire de celelalte reele prezentate anterior. Ieirea fiecrui neuron se constituie n intrare
pentru toi ceilali neuroni ai reelei, nu exist autoexcitaie (self-feedback), adic w
ii
=0, iar
matricea ponderilor este simetric w
ij
=w
ji
adic influena exercitat de neuronul i asupra
neuronului j este egal cu influena exercitat de neuronul j asupra neuronului i.
b) faza de utilizare (regsire). n aceast faz, un anumit tipar x este impus drept vector de
stare al reelei neuronale Hopfield. De regul reprezint o versiune incomplet sau afectat de
zgomot al unui tipar memorat. Procesul de regsire se desfoar n mod dinamic: fiecare neuron
al reelei, n mod aleator ales, estimeaz propriul potenial de activare i i stabilete starea
final. Acest proces asincron (serial) de modificare a strilor se va opri n momentul n care
vectorul de stare nu se va mai modifica. Aceasta nseamn c reeaua neuronal Hopfield a
produs un vector de stare y invariant n timp, ale crui elemente satisfac condiia de stabilitate:

=
= =
N
i
i i ji i
N j y w y
1
,..., 2 , 1 ), sgn(
(2.12)
Vectorul de stare y este denumit stare stabil a spaiului fazelor sistemului.
Nu este obligatoriu ca starea final s coincid cu unul din tiparele memorate.
Relativ la capacitatea de memorare a reelei neuronale recurente Hopfield se arat c numrul
maxim de tipare de dimensiune N care pot fi regsite perfect este:
N
N
p
ln 4
max

(2.13)
116

x h(x)
c
2.6 Reele cu funcii de transfer radiale
Reelele neuronale utilnd funcii de baz radiale reprezint o combinaie performant ntre o
tehnic de modelare ntr-un spaiu multidimensional i o schem rspndit de aproximare
reprezentat de o reea neuronal. O reea RBF are o structur de tip feedforward cu dou
straturi de neuroni pentru prelucrarea datelor :
- stratul ascuns care furnizeaz funciile radiale care constituie baz pentru
vectorii de intrare,
- stratul de ieire alctuit din neuroni cu funcii de activare liniar,
i un strat de neuroni virtuali de intrare. Diferena fa de reelele feedforward cu mai multe
straturi const n funciile de integrare i cele de transfer specifice unitilor stratului ascuns.

2.6.1. Funcii radiale i problema interpolrii
Justificarea matematic a construirii reelelor neuronale axate pe funciile radiale este
furnizat de teorema lui Cover(1965) referitoare la separabilitatea vectorilor. Conform acestei
teoreme, o problem complex de clasificare poate fi rezolvat mai bine, n sensul
separabilitii liniare, ntr-un spaiu cu mai multe dimensiuni dect ntr-unul de dimensiune
redus. Astfel, pentru N vectori,
1 px
N
,
X x
, se definete un vector
T
m
x x x x )] ( ),..., ( ), ( [ ) (
2 1
=
(2.14)
Funcia

scufund vectorii spaiului de intrare n noul spaiu m- dimensional (m>p). Funcia

este numit funcie ascuns.


Problema interpolrii: pentru o mulime dat de puncte
{ } N i R c
p
i
..., 2 , 1 | =
i o mulime de
numere reale
{ } N i R d
i
..., 2 , 1 | =
trebuie s se gseasc o funcie
R R F
N
:
care s
satisfac cerina de interpolare
N i d x F
i i
,..., 2 , 1 , ) ( = =
(2.15)
Metoda funciilor radiale const n alegerea funciei F de forma:

=
=
N
i
i i
c x w x F
1
) ( ) (
(2.16)
unde: -

= funcie radial
- c
i
= centrii funciei radiale
Exemple de funcii radiale:
- funcii gaussiene
0 , 0 , ) (
2
2
2
> =

r e r
r


(2.17)
- funcii multicuadrice inverse
0 , 0 ,
) (
1
) (
2
1
2 2
>
+
= r c
c r
r
(2.18)
- funcii spline de tipul
) log( ) (
2
r r r =
(2.19)
2.6.2. Arhitectura reelelor RBF
O arhitectur RBF cu un singur neuron:


Fig. 6 Arhitectura reelei RBF cu un singur neuron

unde : - c = ponderea conexiunii dintre neuron i intrare
117


n cazul unei reele cu x
n
intrri ieirea neuronului i este
i

iar singurul neuron de ieire al


reelei are activarea y

Fig. Arhitectura reelei neuronale cu funcii radiale

2
2
2
) (

i
c x
i
e x

=
(2.20)
unde
i

funcie radial n-dimensional

=
i
i i
w y
(2.21)
unde
i
w
= ponderea conexiunii neuronului ascuns i cu neuronul de ieire
2.6.3. Instruirea reelelor neuronale radiale
Parametrii ajustabili ai unei reele RBF sunt: centrele C
k
ale unitilor ascunse, ponderile
conexiunilor ctre nivelul de ieire, W i parametrii
i

care controleaz lrgimile cmpurilor


receptive. n funcie de modul n care se determin parametrii corespunztori nivelului ascuns
i cei corespunztori nivelului de ieire exist dou categorii principale de algoritmi: cu
antrenare simultan, respectiv cu antrenare separat a acestor parametrii.

a) Algoritmi cu antrenare simultan a tuturor parametrilor.
Ieirea produs de reea, pentru semnalul de intrare
N
R X este vectorul
M
R Y avnd
componentele:
M i w C X g w y
K
k
i
k
k ik i
, 1 , ) (
1
0
= =

=
(2.22)
unde:
-
( )
K o k N i ik
w W
, , , 1 = =
=
este matricea ponderilor conexiunilor dintre nivelul ascuns i cel de
intrare
-
.
= norma euclidian
Notez cu
k
z
semnalul produs de unitatea ascuns, k, adic
) (
k
k k
C X g z =
. Se poate folosi
o variant normalizat pentru calculul semnalului produs de unitatea ascuns,
k
z

h
i
y

y

y
X
1
X
2
X
n
w
1
w
i
118

=
K
i
i
k
k
k
C X g
C X g
z
1
) (
) (
(2.23)
Caracterul de localitate al funciei de transfer face ca fiecare unitate ascuns s produc ieiri
semnificative doar pentru semnalele de intrare apropiate de centrul corespunztor unitii.
Fiecare unitatea ascuns reacioneaz doar la semnale provenind din zona care le este asociat,
zon numit cmp receptiv. O bun comportare a reelei se obine dac domeniul datelor de
intrare este acoperit de cmpurile receptive ale unitilor ascunse. Dimensiunea cmpurilor
receptive depinde de parametrul
k

corespunztor. O valoare mare pentru


k

induce o
dimensiune mare a cmpului receptiv pe cnd o valoare mic a lui
k

induce un cmp
receptiv restrns.

=
=
=

M
i
k l
k ik
l
i
l
i
k k
l
M
i
kj
l
j k ik
l
i
l
i
k kj
l
C x z w y d W C
E
c x z w y d W C
c
E
1
2
3
1
2
) (
1
) , , (
) ( ) (
1
) , , (

(2.24)
Folosind ideea de la varianta serial a algoritmului backpropagation se obine urmtorul
algoritm:
Iniializarea aleatoare a tuturor parametrilor
REPEAT
FOR
L l , 1 =

k k C W
E
N j K k C W
c
E
c c
K k M i C W
w
E
w w
k
l
k k
kj
l
kj kj
ik
l
ik ik
, 1 ), , , (
, 1 , , 1 ), , , (
, 0 , , 1 ), , , (
=

=
= =

=
= =




(2.25)
Recalcularea erorii
UNTIL este satisfcut condiia de oprire

2.6.4. Determinarea separat a parametrilor
Vom considera procesul de antrenare descompus n trei procese distincte care se desfoar n
urmtoarele ordine:
- determinarea centrelor
; , 1 , K k R C
N k
=

- determinarea lrgimilor cmpurilor receptive,
; , 1 , K k
k
=

- determinarea ponderilor conexiunilor dintre nivelul ascuns i cel de ieire,
. , 0 , , 1 , K k M i w
ik
= =


a) Determinarea centrelor
Centrele reprezint vectori prototip selectai din domeniul datelor de intrare, pe baza crora se
realizeaz partiionarea domeniului de intrare n mici regiuni (cmpurile receptive) de fiecare
dintre acestea fiind responsabil o unitate ascuns.
119

n cazul n care setul de antrenare nu este prea mare atunci se poate considera c datele de
indicare prezente n acesta determin centrele. Astfel, K = L i C
K
= X
k
, pentru fiecare
} { K k ,..., 1
.
Dac, ns, setul de antrenare conine multe date (unele cu caracter redundant) atunci pentru
setarea centrelor se aleg doar o parte dintre acestea. O variant simpl de alegere o reprezinta
selecia aleatoare a K date ns o variant mai adecvat o reprezint aplicarea unui algoritm de
grupare (clustering).
Problematica gruprii este urmtoarea: se dau L vectori
L
X X X ,..., ,
2 1
i se pune problema
amplasrii lor n K < L clase (grupe sau clusteri) astfel nct elementele aflate ntr-o clas s
fie mai apropiate ntre ele dect cele aflate n clase diferite. Noiunea de apropiere se stabilete
pornind de la criteriul ce a stat la baza gruprii. Un astfel de criteriu l poate reprezenta
distana euclidian.
n rezolvarea unei probleme de grupare pot intervenii dou situaii:
- numrul de clase, K , este cunoscut,
- numrul de clase, K , este necunoscut.
Un algoritm simplu de grupare, bazat pe cunoaterea numrului de clase, este algoritmul
mediilor bazat pe ideea c centrul (prototipul) unei clase poate fi reprezentat de media
aritmetic a elementelor clasei, iar afectarea unui vector la o clas sau alta se face pe criteriul
distanei minime:

Algoritmul de grupare. Metoda k-mediilor:
Se iniializeaz centrele C
1
, C
2
, ,C
k
cu vectori selectai aleator din setul de
antrenare.
REPEAT
Construirea claselor: fiecare vector X
l
este afectat clasei C
k
care verific
), , ( ) , (
i l k l
C X d C X d
pentru orice
} ,..., 1 { K i
d =distana euclidian
Recalcularea centrelor: pentru fiecare clas
k

se recalculeaz centrul:

= =
k
X k
k
K k X
w card
C

. , 1 ,
) (
1
(2.27)
UNTIL este ndeplinit un criteriu de oprire.

Algoritmul este oprit fie cnd la ultima parcurgere clasele nu s-au modificat fie cnd s-au
efectuat un numr mare de iteraii i pot alege ca prototipuri vectori ce nu fac parte din setul
iniial de antrenare. Algoritmul mediilor conduce la determinarea acelor centri care
minimizeaz

=
K
k w X
k
k
C X d
1
) , (
(2.28)
Dac numrul de clase nu este cunoscut se poate folosi un algoritm bazat pe principiul
competiiei : numrul claselor este iniializat cu o valoare mic i ulterior este mrit dac este
cazul. De exemplu, dac un vector de intrare din setul de antrenare nu face parte din cmpul
receptiv al nici unei uniti ascunse atunci se adaug o nou unitate avnd centrul determinat
chiar de vectorul de intrare. Valoarea parametrului

influeneaz modul de partiionare a


domeniului datelor de intrare. Valori mici ale lui

favorizeaz partiionarea domeniului de


intrare n multe zone, pe cnd valori mai mari ale lui

conduce la stabilirea a mai puine


centre. Valoarea
t

controleaz mrimea ajustrii parametrilor


kj
c
. Cnd devine suficient de
120

mic, ajustarea este neglijabil i algoritmul poate fi stopat. Descreterea ratei
t

trebuie s fie
lent pentru a nu provoca oprirea algoritmului naintea ajustrii suficiente a centrilor.
Iniializri:
Se stabilete numrul iniial de centre, K.
Se iniializeaz valorile centrelor cu elemente selectate aleator din setul de antrenare
Se iniializeaz indicatorul de iteraie, t = 1 i rata de nvare
t

.
REPEAT
FOR
L l , 1 =

se determin
; min } ,..., 1 {
* * k l
k
k l
C X C X cu K k =

) (
* * * k l
t
k k l
C X C THEN C X IF + <

ELSE se adaug o nou unitate ascuns: K = K + 1 i C
k+1
=X
l
Incrementeaz indicatorul de iteraie, t = t + 1

Determin nou valoare
t

a ratei de nvare,
] 1 , 0 ( ,
0
=



t
t

UNTIL, t>t
max
sau
t

<e

b) Determinarea lrgimii cmpurilor receptive.
Valoarea parametrilor
k

controleaz modul n care este partiionat domeniul datelor de


intrare. Valori prea mici ale lui

conduc la o acoperire incomplet a domeniului de intrare,


n sensul c pot rmne poriuni ce nu aparin nici unui cmp receptiv. Valori prea mari ale lui

provoac mai multe uniti ascunse s produc valori mari astfel c semnalul produs de
reea va fi unul aproape constant.
O regul, cu caracter euristic, de determinare a parametrilor

, dup ce n prealabil au fost


determinate centrele, este urmtoarea:
), , (
j k
k
C C d =
unde C
j
este centrul cel mai apropiat de C
k
, iar
| | 1 , 5 . 0

O regul similar const n
( ) ( ) ( ), , ,
2
1
j k i k
k
C C d C C d + =
(2.29)
unde C
i
i C
j
sunt centrii cei mai apropiai de C
k


c) Determinarea ponderilor conexiunilor ctre nivelul de ieire.
O dat ce au fost determinate centrele i lrgimile cmpurilor receptoare, pentru orice semnal
de intrare X
l
poate fi determinat semnalul produs de nivelul unitilor ascunse, Z
l
. Astfel se
poate considera c trebuie determinate ponderile conexiunilor asociate unei reele cu un singur
nivel de uniti (liniare) pornind de la setul de antrenare
( ) { }
L l
L l
d Z
, 1
,
=
. Acest lucru poate fi
realizat cu un algoritm clasic de antrenare a unei reele cu un singur nivel, de exemplu cu
algoritmul Widrow-Hoff. Un caz particular este acela cnd centrele au fost setate cu
elementele setului de antrenare. n aceste condiii vectorul ponderilor conexiunilor dintre
unitatea ascuns k i nivelul de ieire poate fi setat cu vectorul rspunsurilor dorite: d
k
.
121


3. Reele neuronale nesupervizate utilizate pentru
refacerea imaginilor degradate


nvarea nesupervizat este un proces prin care se extrag informaii, modele, reguli din date
fr a avea la dispoziie exemple de asociere ci doar folosind relaiile existente ntre datele de
intrare. Spre deosebire de nvarea supervizat, cea nesupervizat permite identificarea unor
structuri n datele de intrare fr a utiliza informaii suplimentare.
Reelele neuronale cu nvare nesupervizat au aplicaii n clasificarea, compresia i analiza
datelor.
1) Problema gruprii
Problema gruprii datelor const n identificarea unor clase (clustere) n cadrul datelor astfel
nct elementele unei clase s fie suficient de similare iar cele ce aparin unor clase diferite s
fie suficient de disimilare. Fiecare clas poate fi identificat printr-un element reprezentativ
numit prototip al clasei.
Msuri de similaritate. Pentru a aprecia similaritatea sau disimilaritatea ntre date se folosesc
msuri specifice. n cazul n care datele sunt reprezentate prin vectori din R
N
ca msur a
disimilaritii poate fi folosit distana euclidian:

=
=
N
i
i i
y x Y X d
1
2
) ( ) , (
(3.1)
Cu ct distana este mai mare cu att este mai mare disimilaritatea. Dac vectorii
corespunztori datelor sunt normalizai (
1 = = Y X
) atunci o msur a similaritii poate fi
considerat produsul scalar

=
=
N
i
i i
T
y x Y X
1
(3.2)
Cu ct produsul scalar este mai mare cu att similaritatea este mai mare.
Legtura dintre distana euclidian i produsul scalar rezult din relaia:
) 1 ( 2 2 ) , (
2 2
2
Y X Y Y X X Y X d
T T
= + =
(3.3)
ntruct
cos = Y X Y X
T
, unde
=
unghiul dintre X i Y
Rezult c n cazul datelor normate o alt msur a similaritii este cosinusul unghiului dintre
cei doi vectori.
Prototipuri. Fiecare clas poate fi identificat printr-un element reprezentativ numit prototip
al clasei. Un astfel de prototip poate fi centroidul clasei (media aritmetic a elementelor clasei)
sau medoidul acesteia (elementul din clas care este cel mai apropiat de media aritmetic a
elementelor clasei).
O dat stabilite prototipurile, afectarea unui vector la o clas se realizeaz pe baza criteriului
distanei minime (vectorul este asociat clasei fa de prototipul creia se afl la distana
minim).

2) Reele neuronale pentru clustering
Arhitectura. Pentru gruparea n K clase a unor date N-dimensionale arhitectura adecvat
const din:
- un nivel de N uniti de intrare;
- un nivel cu K uniti liniare de ieire.
122

n cazul n care numrul de clase nu este cunoscut numrul unitilor de pe nivelul de ieire
este adaptabil, fiind modificat n procesul de nvare. Conectivitatea dintre cele dou nivele
este total iar ponderile conexiunilor pot fi organizate ntr-o matrice W cu K linii i N
coloane. Linia i a matricei W poate fi interpretat c fiind prototipul clasei i. Dup
antrenare, setul de vectori {W
1
,..., W
K
} reprezint prototipurile celor K clase.
Funcionare. n timpul funcionrii reeaua trebuie s returneze indicele sau prototipul clasei
asociate datei de intrare. Clasa asociat datei de intrare este determinat de unitatea de ieire
nvingtoare. Unitatea nvingtoare este determinat printr-un proces de competiie care
presupune calculul msurii de similaritate dintre data de intrare, X, i fiecare dintre vectorii
prototip {W
1
,..., W
K
}i determinarea unitii ce are asociat prototipul cel mai apropiat de data
de intrare. n cazul n care msura de similaritate este distana euclidian determinarea unitii
nvingtoare presupune:
- calcul d
1
, d
2
, . . . , d
k
(cu d
i
= d(X,W
i
));
- determinare
} ,... 1 {
*
K k =
cu proprietatea c
} ,..., 1 { ,
*
K i d d
i
k


Indicele k* al unitii nvingtoare poate fi interpretat ca indice al clasei creia i aparine data
de intrare. Dac exist mai multe prototipuri care se afl la aceeai distan fa de X atunci
trebuie s se decid care este unitatea nvingtoare (se alege, de exemplu, unitatea cu indicele
cel mai mic).
Antrenare. Exist dou variante principale de antrenare:
Numrul de uniti funcionale (K) este prestabilit nemodificndu-se pe parcursul antrenrii.
Un exemplu de algoritm de nvare din aceast categorie este cel bazat pe principiul
nvingtorul ia totul (WTA - the winner takes all).
Numrul unitilor funcionale este adaptat pe parcursul procesului de nvare. Algoritmii din
aceast categorie se bazeaz pe teoria rezonanei adaptive (ART - adaptive resonance
theory).
Considerm c setul de antrenare este constituit din vectori N-dimensionali, {X
1
, X
2
,... ,X
L
},
numrul de uniti funcionale este K
Algoritm simplu de tip WTA:
Etapa 1. Iniializarea prototipurilor.
w
ij
= rand(1,1),
N j K i , 1 , , 1 = =

t = 1
Etapa 2. Proces iterativ de ajustare a prototipurilor.
REPEAT FOR l = 1 to L DO
Determin k* cu proprietatea
K i W X d W X d
i l K l
, 1 ), , ( ) , (
*
=

) )( (
* * *
k l k k
W X t W W + =

t = t +1
UNTIL
( ) ) ( ) (
max
t t or pt > <


Ajustarea presupune modificarea vectorului ponderii unitii nvingtoare astfel nct el s
devin mai apropiat de data de intrare. Pentru a evita oscilaia permanent a ponderilor i a
stabiliza prototipurile se utilizeaz o rat descresctoare de nvare
) ( p
Valorile

trebuie s
descreasc (
) ( ) 1 ( p p < +
)ns nu prea rapid pentru a permite ajustarea suficient a
ponderilor.
Se consider c irul valorilor
) ( p
trebuie s satisfac urmtoarele proprieti:
123

=

<
=
1
2
1
) (
, ) (
, 0 ) ( lim
t
t
t
t
t
t

(3.4)
Un dezavantaj al algoritmilor de tip WTA l reprezint faptul c este posibil ca anumite uniti s
nu devin niciodat nvingtoare. Astfel de uniti sunt numite moarte. Pentru a evita
apariia unitilor moarte se ajusteaz nu numai ponderile unitii nvingtoare ci i cele ale
celorlalte uniti ns cu o rat de nvare mai mic. O alt modalitate de a evita apariia
unitilor moarte este aa numitul mecanism al contiinei: la determinarea unitii
nvingtoare se ia n considerare i un prag care variaz invers proporional cu frecvena
victoriilor. Astfel se decide c unitatea k* este nvingtoare (pentru intrarea X) dac:
K k W X d W X d
k
k
k
k
, 1 , ) , ( ) , (
*
*
=
, (3.5)
iar cu ct numrul de victorii este mai mare, cu att valoarea pragului descrete reducnd
ansa unitii de a deveni prea frecvent nvingtoare.

Algoritm de tip ART. Un alt dezavantaj al algoritmului WTA este faptul c numrul de
clase este prestabilit. Exist situaii n care nu se cunoate numrul de clase, sarcina de a
determina acest numr revenindu-i tot algoritmului de nvare. n dezvoltarea reele neuronale
de rezolvare a problemelor de grupare intervin dou aspecte contradictorii:
- Adaptabilitate: capacitatea sistemului de a asimila noi informaii i de a identifica noi
clustere.
- Stabilitate: capacitatea sistemului de a conserva structura de clustere detectat la un moment
dat, astfel ca pe parcursul procesului de adaptare sistemul s nu-i schimbe radical rspunsul
pentru o aceeai dat de intrare.
Pornind de la aceast dilem adaptabilitate-stabilitate a fost dezvoltat de ctre Carpenter i
Grossberg teoria cunoscut sub numele de teoria rezonanei adaptive i au fost dezvoltate
modele sofisticate de reele neuronale care implementeaz diverse mecanisme cu suport biologic.
Considerm o reea neuronal constituit dintr-un nivel de N uniti de intrare i un nivel de
uniti funcional a cror numr poate crete pe parcursul procesului de nvare.
Ideea de baza a algoritmului este aceea de a verifica gradul de similaritate ntre data de intrare i
vectorul de ponderi asociat unitii nvingtoare iar n cazul n care acest grad nu depete un
prag de vigilen se consider c nici o unitate dintre cele existente nu este suficient de
reprezentativ pentru data de intrare, motiv pentru care se adaug o nou unitate.

Iniializri:
Se stabilete numrul iniial de uniti funcionale, K < L.
Se iniializeaz vectorii ponderilor cu elemente distincte selectate aleator din setul de
antrenare. t = 1
REPEAT
FOR l=1 to L
se determin
} ,... 1 {
*
K k
cu
); , ( ) , (
min
*
k l
k
k l
W X d W X d =

IF
< ) , (
*
k l
W X d
sau K=K
max
124

THEN
) ( 1
) (
*
*
*
*
k
k
k l
k
card
card W X
W


+
+
=
unde
) (
*
k
card
=numrul de elemente din
clasa k
*
,

=pragul de vigilent
ELSE se adaug o nou unitate ascuns: K = K + 1 i W
K+l
= X
1
Incrementeaz indicatorul de iteraie, t = t + 1
UNTIL t > t
max


Algoritmul ART prezentat este o variant simplificat a algoritmului ART2 propus de Carpenter
i Grossberg i difer de algoritmul utilizat la reelele RBF pentru determinarea centrelor doar
prin forma relaiei de ajustare.
Unul dintre principalele dezavantaje ale acestui algoritm simplu este acela c gruparea pe care
o identific depinde de ordinea n care sunt prezentate datele de intrare.

3) Mapare topologic i reele Kohonen
Mapare topologic. Maparea topologic este o variant de cuantizare vectorial prin care se
asigur conservarea relaiilor de vecintate din domeniul datelor de intrare. Acest lucru
impune existena unei organizri geometrice a nivelului unitilor funcionale astfel nct
pentru fiecare unitate funcional s poat fi definit o vecintate. Astfel poziia fiecrei uniti
funcionale trebuie identificat cu un vector de poziie (dac nivelul are o structur n-
dimensional atunci vectorul de poziie al unitii p este r
p
=( r
1
p
, ..., r
n
p
))
ntruct prin maparea topologic se urmrete reducerea dimensiunii datelor de intrare se
folosete
3 n
: nivel unidimensional (n = 1), bidimensional (n = 2) sau tridimensional (n = 3).
Reelele cu astfel de organizare a nivelului de uniti funcionale sunt cunoscute sub numele de
reele Kohonen sau hri cu autoorganizare (SOM - self-organizing maps) i au fost propuse de
ctre Kohonen la nceputul anilor 1980.


Arhitectura. O reea Kohonen este constituit dintr-un nivel de intrare i un nivel de uniti
funcionale structurat geometric (vezi fig. pentru cazul unui nivel funcional bidimensional). n
cazul unui nivel unidimensional unitile pot fi plasate n nodurile unei diviziuni (echidistante)
pe cnd n cazul bidimensional ele pot fi plasate n nodurile unei grile ptratice sau chiar
neregulat.

uniti de intrare Nivelul funcional de ieire
Fig. 3.1 Reea cu organizare geometric a nivelului de ieire (reea Kohonen)

Vecinti. O modalitate de a defini un sistem de vecinti n cadrul nivelului de ieire se
bazeaz pe utilizarea unei distane n domeniul D al vectorilor de poziie (n cazul
unidimensional D = {1,..., M}, iar n cazul bidimensional D = {1,... , m} x {1,..., m}, M =
m
2
).
Exemple de distane ce pot fi folosite sunt:
125

- distana euclidian:

=
=
n
i
i
q
i
p q p
r r r r d
1
2
1
) ( ) , (
; (3.6)
- distana Manhattan:

=
=
n
i
i
q
i
p q p
r r r r d
1
2
) , (
; (3.7)
-
i
q
i
p
n i
q p
r r r r d =
=
max
, 1
3
) (
(3.8)
unde:
-
D r
p

= vectorul de poziie al unitii p;
-
D r
q

= vectorul de poziie al unitii q

Utiliznd una din distane pentru o unitate p, o vecintate de ordin s va fi constituit din:
} ) , ( { ) ( s r r d q p V
q p s
=
(3.9)
De exemplu, n cazul unei grile bidimensionale ptratice, vecintile de ordin 1 ale unitii p
(r
p
=(i,j)) corespunztoare celor trei distane sunt:
)} 1 , 1 ( ), 1 , 1 ( ), 1 , 1 ( ), 1 , 1 ( ), 1 , ( ), 1 , ( ), , 1 ( ), , 1 {( ) , (
)} 1 , ( ), 1 , ( ), , 1 ( ), , 1 {( ) , ( ) , (
) 3 (
1
) 2 (
1
) 1 (
1
+ + + + + + =
+ + = =
j i j i j i j i j i j i j i j i j i V
j i j i j i j i j i V j i V

Algoritm de nvare. Specificul nvrii n reelele Kohonen este faptul c nu se ajusteaz
doar ponderile unitii nvingtoare ci i cele corespunztoare unitilor din vecintatea acesteia.
Ajustarea acestor ponderi permite ordonarea unitilor astfel nct n faza de funcionare
pentru date de intrare similare s reacioneze uniti funcionale nvecinate.

Etapa 1. Iniializri.
w
ij
= rand(1,1), i = 1..K, j = 1..N
t = 1, s(t) = s
1
, 1
) ( = t


Etapa 2. Proces iterativ de ajustare.
REPEAT Pentru data de intrare X
Determin p* cu proprietatea
D p W X d W X d
p p
), , ( ) , (
*

) ( ), )( (
*
) (
p V p W X t W W
t s
p p p
+ =

t = t + l
UNTIL
) ( ) ) ( (
max
t t or t > <


Att dimensiunea vecintii ct i rata de nvare descresc treptat de la o iteraie la alta.
Prin utilizarea unei dimensiuni variabile a vecintii se pun n eviden dou faze ale
procesului de nvare:
- Faza de ordonare. Corespunde iteraiilor n care dimensiunea vecintii este relativ mare i
are ca efect aranjarea unitilor (prin ajustarea ponderilor asociate) astfel nct unor date de
intrare similare s le corespund uniti apropiate.
- Faza de ajustare fin. Corespunde ultimelor iteraii, n care vecintile sunt reduse (uneori
chiar la un singur element, algoritmul fiind n acest caz de tip WTA) i are ca scop ajustarea
ponderilor astfel nct acestea s fie ct mai reprezentative pentru datele de intrare.
Iniial raza vecintii se alege suficient de mare, astfel nct ajustarea s se extind asupra
tuturor unitilor. Ulterior raza se micoreaz. O modalitate simpl de reducere a vecintii
este njumtirea razei dup un anumit numr de iteraii.
126

Modificarea ratei de nvare asigur stabilizarea valorii ponderilor. Ca reguli de descretere
se pot folosi cele de la algoritmul WTA. Pentru a diferenia ajustarea aplicat unitii
nvingtoare de cea aplicat unitilor din vecintate se poate modifica relaia de ajustare prin
introducerea unei funcii de vecintate
) , ( q p
a crei valoare maxim este atins pentru
unitatea nvingtoare. Relaia de ajustare devine n acest caz:
) )( , ( ) (
* p p p
W X p p t W W + =
(3.11)
Dac funcia de vecintate verific:


=
altfel , 0
) ( daca , 1
) , (
p V q
q p
s
(3.12)
atunci se reobine relaia iniial de ajustare.
O alt variant prin care mrimea ajustrii depinde de distana fa de unitatea nvingtoare
este:

2
2
2
) , (
) , (
s
r r d
q p
e q p

=
(3.13)
La fel ca i n cazul algoritmilor de tip WTA normalizarea datelor de intrare i a vectorilor cu
ponderi dup fiecare ajustare poate fi benefic procesului de nvare.



127

4. Aplicaii ale reelelor neuronale
4.1 Aplicaii ale reelelor feedforward pentru eliminarea
zgomotelor
Algoritmul backpropagation este implementat n Matlab n mai multe variante. Algoritmii de
nalt performan sunt mult mai rapizi dect variantele Batch Gradient Descent
implementat prin funcia traingd i Batch Gradient Descent with Momentum implementat
prin funcia traingdm, i se pot grupa n dou categorii principale:
- Prima categorie folosete tehnici euristice care sunt dezvoltate din analiza performantei
algoritmului standard de descretere pronunat. n aceast categorie se prezint algoritmul
backpropagation cu rat variabil de nvare traingda i algoritmul backpropagation elastic
trainrp.
- A doua categorie folosete tehnici de optimizare numeric, aici prezentndu-se algoritmii:
gradient conjugat, quasi-Newton i Levenberg-Marquardt.

n partea aplicativ a implementrii reelelor neuronale feedforward, pentru a putea studia
experimental viteza de convergen, am optat pe de-o parte pentru antrenarea imaginii color,
alb-negru sau gri de intrare cu o singur reea, pe de alt parte imaginea de intrare a fost
antrenat cu 4 reele neuronale. n ambele cazuri reele neuronale au 2 niveluri:
- un nivel ascuns cu 76 neuroni
- un nivel de ieire cu numr de neuroni egal cu dimensiunea imaginii de intrare
Imaginile color sunt descompuse iniial n cele trei planuri de culoare (rou, verde, albastru),
fiecare din acestea antrenate cu cte o reea, iar n final rezultatele antrenate sunt concatenate
n vederea obinerii imaginii antrenate.
Funciile de transfer pentru cele dou niveluri sunt de tip tansig iar tolerana la nvare este de
0.001. Reelele sunt antrenate n scopul eliminrii zgomotului aditiv (fig. 2) din imaginea de la
intrare (fig. 1).

Fig.4.1 Imaginea iniial Fig.4.2 Imaginea de intrare afectat de zgomot

a) Varianta Batch Gradient Descendent
n cazul antrenrii imaginii afectate de zgomot att cu o reea ct i cu 4 reele nu s-au atins
erorile de 0,001 pentru nici unul din cele 3 planuri de culoare n 5000 de epoci

Fig. 4.3 Antrenare planul albastru din imagine Fig. 4.4 Antrenare o subreea din planul albastru

128


Fig. 4.5. Imaginea color antrenat cu 3 reele, cte una pentru fiecare plan de culoare

Fig. 4.6. Imaginea color antrenat cu 12 reele; fiecare plan de culoare antrenat cu 4 subreele



Antrenare (TRAINGD) cu o reea Antrenare (TRAINGD) cu 4 reele
Numrul de epoci R,G,B:5000 Numrul de epoci R,G,B:
RN1=5000
RN2=5000
RN3=5000
RN4=5000
Performana medie (nu a
fost atins)
Perf= 0.0274 Performana medie pentru cele
4 subretele (nu a fost atins)
Perf1= 0.0139
Perf2=0.0130
Perf3=0.0132
Perf4=0.0169
Timpul de antrenare

1080 s Timpul de antrenare total 1493 s


Eroarea medie de antrenare
obinut
0,197797 Eroarea medie de antrenare
obinut
0,539085


b) Metoda gradientului descendent cu moment
Algoritmul gradient descendent cu moment completeaz metoda algoritmului gradient
descendent implementat cu trangd oferind o convergen mai rapid prin utilizarea
momentului. Momentul permite unei reele s nu in seama numai de gradientul local, ci i de
tendinele erorilor. Acioneaz ca un filtru trece-jos, ignornd modificrile mici din suprafaa
de eroare. Fr moment reeaua poate s rmn ntr-un minim local, iar cu moment e capabil
s treac de acest minim.
Dei algoritmul gradient descendent cu moment este o mbuntire a algoritmului gradient
descendent standard, n cazul antrenrii imaginii afectate de zgomot att cu o reea ct i cu 4
reele nu s-au atins erorile de 0,001 pentru nici unul din cele 3 planuri de culoare n 5000 de
epoci

Pentru determinarea timpului de antrenare precizez c am antrenat reelele pe un procesor Pentium 4 la


frecvena de 3,20GHz
129


Fig. 4.7 Antrenare planul albastru din imagine Fig. 4.8 Antrenare o subreea din planul albastru

Fig. 4.9. Imaginea color antrenat cu 3 reele, cte una pentru fiecare plan de culoare


Fig. 4.10. Imaginea color antrenat cu 12 reele; 4 subreele pentru fiecare plan de culoare

n cazul antrenrii imaginii cu 4 subreele pentru fiecare plan de culoare se merge spre o
eroare mai mic cu fiecare din subreele, ns nu se atinge eroarea dorit n numrul de epoci
stabilit (5000 epoci).
130


Fig.4.11 Antrenare imagine cu 3, respectiv 12 reele cte 4 pentru fiecare plan de culoare



Antrenare(TRAINGDM) cu o reea Antrenare (TRAINGDM) cu 4 reele
Numrul de epoci R,G,B: 5000 Numrul de epoci R,G,B:
RN1=5000
RN2=5000
RN3=5000
RN4=5000
Performana medie (nu a fost
atins)
Perf= 0.0270 Performana medie pentru
cele 4 subretele (nu a fost
atins)
Perf1= 0.0143
Perf2= 0.0128
Perf3= 0.0121
Perf4= 0.0167
Timpul de antrenare (s) 1145 s Timpul de antrenare total (s) 1479 s
Eroarea medie de antrenare
obinut
0,169173 Eroarea medie de antrenare
obinut
0,506367
mbuntirea performanelor n cazul utilizri momentului sunt nesemnificative pentru
aceast structur de reea comparativ cu metoda algoritmului de descendent clasic.
131


Fig. 4.12 Comparaie ntre algoritmul gradient descendent i gradient descendent cu moment


c) Algoritm cu rat variabil de nvare
n cazul antrenrii reelei cu rat variabil de nvare performanele se mbuntesc deoarece
n procedura de antrenare se calculeaz ieirea iniial a reelei i eroarea, la fiecare epoc se
calculeaz noile ponderi i praguri folosind rata curent de nvare, se calculeaz apoi noile
ieiri i erori, dac noua eroare depete vechea eroare printr-o valoare mai mare dect un
raport predefinit (max_perf_inc=1.04), noile ponderi i bias-uri calculate sunt anulate i n
plus rata de nvare este micorat prin multiplicare cu un factor lr_dec=0.7 , n caz contrar
noile valori calculate sunt pstrate. Dac noua eroare este mai mic dect vechea eroare, rata
de nvare este mrit prin multiplicare cu un factor lr_inc=1.05.
Antrenare (TRAINGDA) cu o reea Antrenare ( TRAINGDA) cu 4 reele
Numrul de epoci R,G,B: 5000 Numrul de epoci R:
RN1=3148
RN2=3611
RN3=4009
RN4=2097
G:
RN1=3381
RN2=3129
RN3=2876
RN4=2841
B:
RN1=2296
RN2=5000
RN3=4494
RN4=4731
Performana medie Perf= 0.0040 Performana medie pentru
cele 4 reele
Perf1= 0.001
Perf2= 0.0013
132

Perf3= 0.001
Perf4= 0.001
Timpul de antrenare

1123 s Timpul de antrenare total 1056s


Eroarea medie de antrenare
obinut
0,0685293 Eroarea medie de
antrenare obinut
0,129703

Analiznd cele 2 metode de antrenare se constat o mbuntire n cazul mpririi imaginii n
4 subimagini, situaie n care o singur subreea din cele 12 nu a atins eroarea impus, fa de
tratarea imaginii compact, cnd nici una din reelele neuronale corespunztoarea celor trei
planuri de culoare nu a atins eroarea de 0,001.

Fig.4.13 Antrenare reea pentru eliminare zgomot cu o reea, respectiv cu 4 reele

d) Algoritm cu rat variabil de nvare i moment (traingdx)
Pe lng algoritmul ratei variabile de nvare implementat cu funcia traingda mai exist o
variant similar - traingdx , care combin rata de nvare adaptiv cu un coeficient moment
mc.
Antrenare(TRAINGDX) cu o reea Antrenare (TRAINGDX)cu 4 reele
Numrul de epoci R,G,B: 5000 Numrul de epoci R:
RN1=1105
RN2=1260
RN3=1211
RN4=797
G:
RN1=956
RN2=1046
RN3=956
RN4=900
B:
RN1=923
RN2=1527

Pentru determinarea timpului de antrenare precizez c am antrenat reelele pe un procesor Pentium 4 la


frecvena de 3,20GHz
133

RN3=1357
RN4=1680
Performana medie
(nu a fost atins)
Perf= 0.0022 Performana medie Perf1= 0.001
Perf2= 0.001
Perf3= 0.001
Perf4= 0.001
Timpul de antrenare 1112 s Timpul de antrenare total 362 s
Eroarea medie de
antrenare obinut
0,0423259 Eroarea medie de antrenare
obinut
0,112011
n urma antrenrii, pentru planul de culoare albastr, s-au obinut:

Fig. 4.14 Antrenare planul albastru cu o reea Fig. 4.15 Antrenare o subreea din planul albastru
Imaginea obinut n urma antrenrii cu algoritmul backpropagation cu rat variabil de
nvare i moment:

Fig. 4.16 Imagine color antrenat cu 3 RN, cte una pentru fiecare plan de culoare

Fig. 4.17. Imagine color antrenat cu 12 RN, 4 subreele pentru fiecare din cele 3 planuri de culoare

e) Algoritm backpropagation elastic (Resilient Backpropagation- Rprop)
Reelele neuronale multistrat folosesc n straturile ascunse funcii de transfer sigmoide,
deoarece comprim un domeniu de intrare infinit ntr-un domeniu finit de ieire, caracterizate
fiind de faptul c panta lor se apropie de zero pe msur ce valoarea de intrare devine mai
mare. Acest lucru provoac n antrenarea cu algoritmul de descretere pronunat (steepest
descent backpropagation algorithm) schimbri mici ale ponderilor i bias-urilor, chiar dac
acestea sunt departe de valoarea lor optim.
Scopul acestui algoritm elastic de antrenare este acela de elimina acest efect al valorii mrimii
derivatelor pariale. Se va folosi doar semnul derivatei pentru a determina direcia actualizrii
ponderilor; mrimea derivatei nu va avea efect asupra actualizrii ponderilor. Valoarea de
actualizare pentru fiecare pondere i bias este mrit printr-un factor delt_inc ori de cate ori
134

derivata parial a criteriului de performan n funcie de respectiva pondere are acelai semn
n dou iteraii succesive; aceeai valoare de actualizare este micorat printr-un factor
delt_dec ori de cte ori derivata parial a criteriului de performan n funcie de respectiva
pondere i schimb semnul fa de iteraia precedent. Dac derivata este zero, atunci
valoarea de actualizare rmne aceeai. Astfel, ori de cte ori ponderile oscileaz, schimbarea
ponderii este micorat, iar dac ponderile continu s se schimbe n aceeai direcie pentru
cteva iteraii la rnd, atunci mrimea schimbrii ponderii va crete.

Antrenare (TRAINRP) cu o reea Antrenare(TRAINRP) cu 4 reele
Numrul de epoci R,G,B:5000 Numrul de epoci R:
RN1=4229
RN2=5000
RN3=5000
RN4=4693
G:
RN1=3352
RN2=3360
RN3=3305
RN4=3440
B:
RN1=5000
RN2=4473
RN3=3305
RN4=3304
Performana medie ( nu a
fost atins)
Perf= 0.0048

Performana medie pentru cele
4 subretele
Perf1= 0.0013
Perf2= 0.001
Perf3= 0.001
Perf4= 0.001
Timpul de antrenare 1198 s Timpul de antrenare total 1390 s
Eroarea medie de antrenare
obinut
0,0676409 Eroarea medie de antrenare
obinut
0,125839


Fig. 4.18. Comparare performane n cazul antrenrii cu algoritm BP elastic (1 reea, 4 reele)

f) Algoritmi gradient- conjugat (Conjugate Gradient Algorithms)
Algoritmii gradient-conjugai ncep cutarea n direcia negativului gradientului la prima
iteraie:
p
0
=-g
0
unde g
0
=gradientul iniial
Este efectuata apoi o cutare (line search) pentru a determina distana optim de deplasare n
direcia cutrii:
x
k+1
= x
k
+
k
p
k

135

Urmtoarea direcie de cutare este determinat astfel nct s fie conjugat cu direciile
precedente de cutare. Procedura general de determinare a noii direcii de cutare este
combinarea noii direcii de descretere pronunat cu direcia anterioar de cutare:
p
k
= -g
k
+
k
p
k-1

Diferitele versiuni de algoritmi gradient-conjugai se disting prin felul n care constanta
k
este
calculat. Pentru varianta Fletcher-Reeves:
1 1
=
k
T
k
k
T
k
k
g g
g g


Acesta este raportul dintre norma ptratic a gradientului curent i cea a gradientului
precedent.
Rezultatele obinute n urma antrenrii cu algoritmul gradient conjugat:
Antrenare (TRAINCGF) cu o reea Antrenare (TRAINCGF) cu 4 reele
Numrul de epoci
R:


RN1=128
RN2=141
RN3=144
RN4=120
G:

RN1=104
RN2=115
RN3=121
RN4=97
Numrul de epoci R:1686
G:5000
B:5000
B: RN1=112
RN2=182
RN3=165
RN4=161
Performana medie

Perf= 0.007 Performana medie pentru
cele 4 subreele
Perf1= 0.001
Perf2= 0.001
Perf3= 0.001
Perf4= 0.001
Timpul de antrenare 1443 s Timpul de antrenare total 94 s
Eroarea medie de antrenare
obinut
0,0288449 Eroarea medie de
antrenare obinut
0,128018


Fig. 4.19.Comparare performane n cazul antrenrii imaginii cu una, respectiv 4 reele

136


Fig. 4.20. Eroarea medie obinut n urma antrenrii cu 1 reea

Fig. 4.21. Eroarea medie obinut n urma antrenrii cu 4 reele

Varianta Polak Ribire (traincgp) determin direcia de cutare la fiecare iteraie la fel ca
varianta Fletcher-Reeves, adic: x
k+1
= x
k
+
k
p
k
.

Constanta
k
este calculat n acest caz:
1 1
1

=
k
T
k
k
T
k
k
g g
g g


Acesta este produsul intern al schimbrii precedente a gradientului cu gradientul curent,
divizat prin norma ptratic a gradientului precedent. Parametrii algoritmului traincgp sunt
aceeai ca i n cazul traincgf , iar rutina de cutare implicit este srchcha. Algoritmul
traincgp are performane similare algoritmului traincgf.

Antrenare(TRAINCGP) cu o reea Antrenare(TRAINCGP) cu 4 reele
Numrul de epoci R:902;
G:2201;
B:1627
Numrul de epoci R:
RN1=127
RN2=135
RN3=126
RN4=125
G:
RN1=104
RN2=115
RN3=121
RN4=97
B:
RN1=112
RN2=182
RN3=165
RN4=161
Performana medie

Perf=0.001 Performana medie pentru
cele 4 subreele

Perf1= 0.001
Perf2= 0.001
Perf3= 0.001
Perf4= 0.001
Timpul de antrenare 754 s Timpul de antrenare total 86 s
Eroarea medie de antrenare
obinut
0,0276453 Eroarea medie de
antrenare obinut
0,120525

137


Fig. 4.22. Performane TRAINCGP cu 1 respectiv 4 reele


Fig. 4.23. Eroarea medie obinut n urma antrenrii cu 1 reea

Fig. 4.24. Eroarea medie obinut n urma antrenrii cu 4 reele

Varianta Powel-Beale Restarts e implementat prin funcia traincgb, algoritmul e
caracterizat prin resetarea direciei de cutare la negativul gradientului dac este ndeplinit
condiia:
2
1
2 . 0
k k
T
k
g g g


Aceast variant consum mai mult memorie astfel c, n cazul tratrii imaginii compact nu
s-a ajuns la nici un rezultat memorie insuficient.
Antrenare(TRAINCGB) cu o reea Antrenare cu 4 reele
Numrul de epoci Memorie
insuficient
Numrul de epoci R:
RN1=126
RN2=131
RN3=128
RN4=125
G:
RN1=105
RN2=111
RN3=116
RN4=101
B:
RN1=100
RN2=138
RN3=138
RN4=146
Performana medie Performana medie pentru cele Perf1=0.001
138

- 4 subreele

Perf2=0.001
Perf3=0.001
Perf4=0.001
Timpul de antrenare

- Timpul de antrenare total 91 s


Eroarea medie de antrenare
obinut
- Eroarea medie de antrenare
obinut
0,12698


Fig. 4.25. Antrenarea imaginii cu 4 subreele

Fig. 4.26. Rezultatele obinute n urma antrenrii cu 4 subreele

Varianta Scaled Conjugate Algoritm nltur neajunsul consumului de timp dat de funciile
de cutare ( o linie de cutare necesit ca rspunsul reelei la toate intrrile de antrenare s fie
calculat de cteva ori pentru fiecare cutare), prin combinarea ideii folosite n algoritmul
Levenberg-Marquartd cu cea a algoritmilor gradient-conjugat. Funciile de cutare folosite
(Line Search Routines) sunt implementate de funciile: srchgol, srchbre, srchhyb, srchcha,
srchbac
Antrenare(TRAINSCG) cu o reea Antrenare(TRAINSCG) cu 4 reele
Numrul de epoci RN_R=846
RN_G=2405
RN_B=1492
Numrul de epoci R:
RN1=122
RN2=124
RN3=130
RN4=91
G:
RN1=111
RN2=118
RN3=105
RN4=92
B:
RN1=105
RN2=153
RN3=131
RN4=141

Pentru determinarea timpului de antrenare precizez c am antrenat reelele pe un procesor Pentium 4 la


frecvena de 3,20GHz
139

Performana medie

Perf=0.001

Performana medie pentru cele
4 reele

Perf1=0.001
Perf2=0.001
Perf3=0.001
Perf4=0.001
Timpul de antrenare 768 s Timpul de antrenare total 76 s
Eroarea medie de antrenare
obinut
0,0266698 Eroarea medie de antrenare
obinut
0,0539085


Fig. 4.27. Comparare performane de antrenare cu 1 respectiv 4 reele

Fig. 4.28. Rezultate obinute n urma antrenrii cu 1 reea

Fig. 4.29. Rezultate obinute n urma antrenrii imaginii cu 4 reele

g) Algoritmi Quasi Newton. Algoritmul BFGS
Metoda Newton este o alternativ la algoritmii gradient-conjugat pentru optimizare rapid.
Metoda Newton converge deseori mai rapid dect metodele gradient-conjugat, dar este mult
mai complex i mai mare consumatoare de memorie n calculul matricei Hessiene pentru
reelele feedforward. Exist o clas de algoritmi bazai pe metoda Newton, dar care nu
necesit calculul derivatelor de ordinul doi, numii algoritmi quasi-Newton. Acetia
actualizeaz o aproximare a matricei Hessiene la fiecare iteraie a algoritmului. Actualizarea
este calculat ca i funcie de gradient. Metoda cea mai reuita este actualizarea Broyden,
Fletcher, Goldfarb si Shanno (BFGS), implementat prin rutina trainbfg.
Din motive de hardware nu s-au obinute rezultate cu nici una din metodele aplicate.

Algoritmi Quasi Newton. Algoritmul One Step Secant
Aceasta varianta nu depoziteaz ntreaga matrice Hessiana, presupunnd ca la fiecare iteraie,
precedenta Hessiana a fost matricea identitate i avnd avantajul c, noua direcie de cutare
poate fi calculat fr a fi nevoie de calculul matricei inverse. Este implementat de funcia
140

trainoss. Poate fi considerat o variant compromis ntre BFGS i algoritmii gradient-
conjugat.
Antrenare(TRAINOSS) cu o reea Antrenare(TRAINOSS) cu 4 reele
Numrul de epoci RN_R=2416
RN_G=5000
RN_B=5000
Numrul de epoci R:
RN1=327
RN2=478
RN3=369
RN4=271
G:
RN1=378
RN2=307
RN3=370
RN4=341
B:
RN1=285
RN2=410
RN3=389
RN4=486
Performana medie Perf=0.0026

Performana medie pentru cele
4 subreele
Perf1=0.001
Perf2=0.001
Perf3=0.001
Perf4=0.001
Timpul de antrenare 3078 s Timpul de antrenare total 372 s
Eroarea medie de antrenare
obinut
0,028138 Eroarea medie de antrenare
obinut
0,112667


Fig.4.30. Comparare metode de antrenare cu 1 respectiv 4 reele

Fig. 4.31. Rezultate obinute n urma antrenrii cu 1 reea

141

Fig. 4.32. Rezultate obinute n urma antrenrii cu 4 reele

h) Algoritmul Levenberg-Marquardt
La fel ca toate variantele quasi-Newton, i aceast variant a fost proiectat s aproximeze
antrenarea de ordinul doi fr a fi nevoie s calculeze matricea hessian. Atunci cnd funcia
de performan are forma unei sume de ptrate, matricea hessian poate fi aproximat astfel:
J J H
T
=

iar gradientul se poate calcula:
e J g
T
=

unde: - J este matricea Jacobian care conine derivatele de ordinul unu ale erorilor n raport
de ponderile i bias-urile reelei,
- e este vectorul erorilor. Matricea Jacobian este calculat folosind o tehnic backpropagation
standard, care este mult mai puin complex dect calculul matricei Hessiene.
Algoritmul Levenberg-Marquardt folosete urmtoarea actualizare:
| | e J I J J x x
T T
k k
1
1

+ =

Atunci cnd scalarul este zero, algoritmul este chiar metoda Newton cu matricea hessian
aproximat. Mrimea lui este micorat dup fiecare pas reuit (reducere a funciei de
performan) i mrit doar atunci cnd pasul tentativ ar crete funcia performan: n acest
fel funcia criteriu va fi ntotdeauna redus la fiecare iteraie a algoritmului.
Inconvenientul algoritmului Levenberg-Marquardt este cantitatea mare de memorie necesar
n calculul Jacobianului, astfel, n cazul reelei neuronale implementate acest algoritm nu
poate fi aplicat.
n urma antrenrii unei imagini afectate de zgomot cu un algoritm backpropagation se obine o
imagine cu contururi terse. n imaginea de eroare sunt vizibile contururile alterate. Cele mai
bune performane s-au obinut, pentru exemplul de fa, n cazul aplicrii algoritmilor de tip
gradient conjugat ce folosesc tehnici de optimizare numeric:
TRAINCGF eroarea de recunoatere 0,0288449
TRAINCGP eroarea de recunoatere 0,02766453
TRAINSCG- eroarea de recunoatere 0,0266698

142


Fig. 4.33. Comparare metodelor BP utilizate pentru eliminarea zgomotului sare i piper din imaginea color cu
reele feedforward.
Nr. epoci
eroare
143

c
c
4.2 Aplicaii ale reelelor neuronale Elman pentru eliminarea
zgomotelor
Reelele neuronale artificiale Elman au alt structur ns pot fi antrenate cu aceeai algoritmi
backpropagation i backpropagation mbuntii ca i reelele feedforward (traingd, traingdm,
traingda, traingdx, trainrp, traincgf, traincgp, traincgb, trainscg, trainbfg, trainoss, trainlm).
Pentru a ine minte ieirile unitilor ascunse se introduc uniti de context care se comport ca
i memoriile de scurt durat. Doar valorile nodurilor de pe nivelul ascuns vor constitui la
urmtorul pas intrrile n reea, fr a fi multiplicate cu ponderile. Aceste valori sunt salvate n
nivelul numit nivel contextual.

Arhitectura reelei Elman cu dou niveluri:








Fig. 4.34. Arhitectura
reelei neuronale
Elman

Pentru a putea evidenia viteza de convergen a reelelor neuronale de tip Elman mai bun
dect n cazul reelelor neuronale implementate n subcapitolul anterior, am optat pentru
aceeai structur a reelei:
- un nivel ascuns cu 76 neuroni
- un nivel de ieire cu numr de neuroni egal cu dimensiunea imaginii de intrare

Att n cazul antrenrii imaginilor color, ct i a celor binare sau cu tonuri de gri
s-au obinut rezultate mai bune cu reeaua neuronal Elman backpropagation dect n cazul
reelelor feedforward n majoritatea cazurilor. Imaginile color le-am descompus n cele trei
planuri de culoare (rou, verde, albastru), fiecare din acestea antrenate cu cte o reea Elman,
iar n final rezultatele obinute n urma antrenrii le-am concatenat n vederea obinerii
imaginii color antrenate.
Funciile de transfer pentru cele dou niveluri sunt de tip tansig pentru nivelul ascuns i
purelin pentru nivelul de ieire, tolerana la nvare este de 0.001. Reelele sunt antrenate n
scopul eliminrii zgomotului aditiv (fig. 4.36) din imaginea de la intrare (fig. 4.35).

Fig. 4.35. Imaginea iniial Fig.4.36. Imaginea de intrare afectat de zgomot
a) Varianta Batch Gradient Descendent (traingd)
n cazul antrenrii imaginii afectate de zgomot att cu o reea ct i cu 4 reele nu
s-au atins performanele de 0,001 pentru nici unul din cele 3 planuri de culoare n 5000 de
epoci
144

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
10
-4
10
-3
10
-2
10
-1
10
0
5000 Epochs
T
r
a
in
in
g
-
B
lu
e

G
o
a
l-
B
la
c
k
Performance is 0.0265895, Goal is 0.001

Fig. 4.37. Antrenare planul albastru din imagine Fig.4.38. Antrenare o subreea din planul albastru
Imaginile obinute n urma antrenrii sunt foarte slabe ca i n cazul reelelor feedforward, iar
rezultatele obinute n urma simulrii att cu zgomot mai mic ct i cu zgomot mai mare sunt
nesemnificativ mai bune dect n cazul anterior.
Imag.originala Imag.cu zgomot Imag. antrenata Eroare-0.177858

Fig. 4.39. Imaginea color antrenat cu 3 reele Elman, cte una pentru fiecare plan de culoare

Fig. 4.40. Imaginea color antrenat cu 12 reele Elman; fiecare plan de culoare antrenat cu 4 subreele

Antrenare (TRAINGD) cu o reea Elman Antrenare (TRAINGD) cu 4 reele Elman
Numrul de epoci R,G,B:5000 Numrul de epoci R,G,B:
RN1=5000
RN2=5000
RN3=5000
RN4=5000
Performana medie (nu a
fost atins)
Perf=0.027562
(Perf= 0.0274 FF)
Performana medie pentru cele 4
subretele (nu a fost atins)
Perf1=0.015893
Perf2=0.014067
Perf3=0.013258
Perf4=0.018376
Timpul de antrenare

- mai
mare dect n cazul FF
1158 s
(1080 s -FF)
Timpul de antrenare total 1734 s
(1493 s FF)
Eroarea medie de antrenare
obinut
0,177858
(0,197797- FF)
Eroarea medie de antrenare
obinut
0,182563
(0,539085 FF)


b) Metoda gradientului descendent cu moment

Pentru determinarea timpului de antrenare precizez c am antrenat reelele pe un procesor Pentium 4 la


frecvena de 3,20GHz
145

Ca i n cazul reelelor feedforward pentru algoritmul gradient descendent cu moment nu s-a
atins performana n 5000 de epoci
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
10
-4
10
-3
10
-2
10
-1
10
0
5000 Epochs
T
ra
in
in
g
-B
lu
e
G
o
a
l-B
la
c
k
Performance is 0.0258761, Goal is 0.001

Fig. 4.41. Antrenare planul albastru din imagine Fig. 4.42. Antrenare o subreea din planul albastru
Imaginile obinute n urma antrenrii:
Imag.originala Imag.cu zgomot Imag. antrenata Eroare-0.179408

Fig. 4.43. Imaginea color antrenat cu 3 reele Elman, cte una pentru fiecare plan de culoare

Fig. 4.44. Imaginea color antrenat cu 12 reele Elman; 4 subreele pentru fiecare plan de culoare

n cazul antrenrii imaginii cu 4 subreele pentru fiecare plan de culoare se merge spre o
eroare mai mic cu fiecare din subreele, ns nu se atinge eroarea dorit n numrul de epoci
stabilit (5000 epoci).
Antrenare(TRAINGDM) cu o reea Elman Antrenare (TRAINGDM) cu 4 reele
Numrul de epoci R,G,B: 5000 Numrul de epoci R,G,B:
RN1=5000
RN2=5000
RN3=5000
RN4=5000
Performana medie (nu a fost
atins)
Perf=0.02737 Performana medie pentru
cele 4 subretele (nu a fost
atins)
Perf1=0.015451
Perf2=0.014584
Perf3=0.013593
Perf4=0.017335
Timpul de antrenare (s) 1214 s

Timpul de antrenare total
(s)
1599 s
(1479 s FF)
Eroarea medie de antrenare
obinut
0,179408

Eroarea medie de
antrenare obinut
0,178376
(0,506367 FF)


c)Algoritm cu rat variabil de nvare
Ca i la reeaua feedforward se atinge performana doar n cazul tratrii imaginii cu 4 reele
pentru fiecare plan de culoare:
146

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
10
-4
10
-3
10
-2
10
-1
10
0
5000 Epochs
T
ra
in
in
g
-B
lu
e
G
o
a
l-B
la
c
k
Performance is 0.00322112, Goal is 0.001

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
10
-4
10
-3
10
-2
10
-1
10
0
5000 Epochs
T
ra
in
in
g
-B
lu
e
G
o
a
l-B
la
c
k
Performance is 0.00100722, Goal is 0.001

Fig. 4.45 Antrenare planul albastru din imagine Fig. 4.46. Antrenare o subreea din planul albastru
Imaginile obinute n urma antrenrii cu reea Elman:
Imag.originala Imag.cu zgomot Imag. antrenata Eroare-0.0548013

Fig. 4.47. Imaginea color antrenat cu 3 reele Elman, cte una pentru fiecare plan de culoare
Imagine originala Imag cu zgomot Imagine-antrenata Eroare-0.125151

Fig. 4.48. Imaginea color antrenat cu 12 reele Elman, cte 4 pentru fiecare plan de culoare
Performanele obinute:
Antrenare (TRAINGDA) cu o reea Elman Antrenare ( TRAINGDA) cu 4 reele Elman
Numrul de epoci R,G,B: 5000 Numrul de epoci R:
RN1=4155
RN2=3987
RN3=3979
RN4=2544
G:
RN1=3317
RN2=3159
RN3=3220
RN4=2517
B:
RN1=2876
RN2=4963
RN3=4780
RN4=5000
Performana medie Perf=0.0033397
(Perf=0.0040-FF)
Performana medie
pentru cele 4 reele

Perf1=0.001
Perf2=0.001
Perf3=0.001
Perf4= 0.001
Timpul de antrenare 1197 s Timpul de antrenare total 1338 s
Eroarea medie de 0,0685293 Eroarea medie de 0,125151
147

antrenare obinut antrenare obinut (0,129703 FF)

d) Algoritm cu rat variabil de nvare i moment (traingdx)
Imaginile obinute n urma antrenrii cu reele Elman cu algoritmul de nvare
backpropagation cu rat variabil de nvare i moment:
Imag.originala Imag.cu zgomot Imag. antrenata Eroare-0.0457244

Fig. 4.49. Imagine obinut n urma antrenrii cu 3 reele Elman, cte una pentru fiecare plan de culoare
Imagine originala Imag cu zgomot Imagine-antrenata Eroare-0.119948

Fig. 4.50. Imagine obinut n urma antrenrii cu 12 reele Elman, cte 4 pentru fiecare plan de culoare

Performane obinute:
Antrenare(TRAINGDX) cu o reea Elman Antrenare (TRAINGDX)cu 4 reele Elman
Numrul de epoci R: 5000
G:1361
B:1234
Numrul de epoci R:
RN1=826
RN2=1021
RN3=1135
RN4=910
G:
RN1=887
RN2=903
RN3=1770
RN4=1741
B:
RN1=1686
RN2=1527
RN3=1357
RN4=1680
Performana medie
(nu a fost atins)

Perf= 0.0020271 Performana medie Perf1= 0.001
Perf2= 0.001
Perf3= 0.001
Perf4= 0.001
Timpul de antrenare 1187 s Timpul de antrenare total 446 s
Eroarea medie de
antrenare obinut
0,0457244 Eroarea medie de antrenare
obinut
0,119948

e) Algoritm backpropagation elastic (Resilient Backpropagation- Rprop)
Performane obinute:
Antrenare (TRAINRP) cu o reea Elman Antrenare(TRAINRP) cu 4 reele Elman
Numrul de epoci R,G,B:5000 Numrul de epoci R:
RN1=1537
RN2=5000
RN3=4206
148

RN4=3819
G:
RN1=3177
RN2=4997
RN3=4308
RN4=3440
B:
RN1=5000
RN2=4473
RN3=1566
RN4=1651
Performana medie ( nu a
fost atins)
Perf=0.0040165

Performana medie
pentru cele 4 subretele
Perf1= 0.0012842
Perf2 = 0.0012
Perf3= 0.001
Perf4= 0.001
Timpul de antrenare

1494 s Timpul de antrenare total 1754 s


Eroarea medie de antrenare
obinut
0,0676409 Eroarea medie de
antrenare obinut
0,118891
(0,125839 FF)

Pentru determinarea timpului de antrenare precizez c am antrenat reelele pe un procesor Pentium 4 la


frecvena de 3,20GHz
149

Antrenarea imaginii color, planul albastru, cu reea Elman:
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
10
-4
10
-3
10
-2
10
-1
10
0
10
1
5000 Epochs
T
ra
in
in
g
-B
lu
e
G
o
a
l-B
la
c
k
Performance is 0.00436, Goal is 0.001

0 200 400 600 800 1000 1200 1400 1600
10
-4
10
-3
10
-2
10
-1
10
0
10
1
1651 Epochs
T
ra
in
in
g
-B
lu
e
G
o
a
l-B
la
c
k
Performance is 0.000999652, Goal is 0.001

Fig. 4.51. Comparare performane n cazul antrenrii cu algoritm BP elastic (1 reea, 4 reele Elman)
Imaginile obinute n cazul antrenrii reelelor Elman cu algoritmul BP elastic :
Imag.originala Imag.cu zgomot Imag. antrenata Eroare-0.0568384

Fig. 4.52. Imagine obinut n urma antrenrii cu 3 reele Elman, cte una pentru fiecare plan de culoare
Imagine originala Imag cu zgomot Imagine-antrenata Eroare-0.118891

Fig.4.53. Imagine obinut n urma antrenrii cu 12 reele Elman, cte 4 pentru fiecare plan de culoare

f) Algoritmi gradient - conjugat (Conjugate Gradient Algorithms)
Rezultatele obinute n urma antrenrii cu algoritmul gradient conjugat, pentru reelele Elman:
Antrenare (TRAINCGF) cu o reea Elman Antrenare (TRAINCGF) cu 4 reele Elman
Numrul de epoci
R:


RN1=149
RN2=147
RN3=202
RN4=159
G:

RN1=123
RN2=133
RN3=137
RN4=107
Numrul de epoci R:1542
G:5000
B:3397
B: RN1=107
RN2=237
RN3=186
RN4=189
Performana medie

Perf=0.001120 Performana medie
pentru cele 4 subreele
Perf1= 0.001
Perf2= 0.001
Perf3= 0.001
150

Perf4= 0.001
Timpul de antrenare

1504s Timpul de antrenare total 126 s


Eroarea medie de
antrenare obinut
0,026351 Eroarea medie de
antrenare obinut
0,124759

0 500 1000 1500 2000 2500 3000
10
-4
10
-3
10
-2
10
-1
10
0
3397 Epochs
T
ra
in
in
g
-B
lu
e
G
o
a
l-B
la
c
k
Performance is 0.000999948, Goal is 0.001

0 20 40 60 80 100 120 140 160 180
10
-4
10
-3
10
-2
10
-1
10
0
189 Epochs
T
ra
in
in
g
-B
lu
e
G
o
a
l-B
la
c
k
Performance is 0.000994789, Goal is 0.001

Fig. 4.54. Comparare performane n cazul antrenrii imaginii cu una, respectiv 4 reele Elman
Imaginile obinute n urma antrenrii cu reele Elman:
Imag.originala Imag.cu zgomot Imag. antrenata Eroare-0.026351

Fig. 4.55. Eroarea medie obinut n urma antrenrii cu 1 reea Elman pentru fiecare plan de culoare
Imagine originala Imag cu zgomot Imagine-antrenata Eroare-0.124759

Fig. 4.56. Eroarea medie obinut n urma antrenrii cu 4 reele Elman pentru fiecare plan de culoare

Pentru determinarea timpului de antrenare precizez c am antrenat reelele pe un procesor Pentium 4 la


frecvena de 3,20GHz
151


g) Rezultate obinute cu algoritmul TRAINCGP
Antrenare(TRAINCGP) cu o reea Elman Antrenare(TRAINCGP) cu 4 reele Elman
Numrul de epoci R:705;
G:1557;
B:1047
Numrul de epoci R:
RN1=140
RN2=130
RN3=131
RN4=112
G:
RN1=110
RN2=121
RN3=113
RN4=103
B:
RN1=115
RN2=149
RN3=139
RN4=143
Performana medie

Perf=0.001 Performana medie pentru
cele 4 subreele

Perf1= 0.001
Perf2= 0.001
Perf3= 0.001
Perf4= 0.001
Timpul de antrenare

632 s Timpul de antrenare total 110 s


Eroarea medie de antrenare
obinut
0,0264776 Eroarea medie de antrenare
obinut
0,124852

0 100 200 300 400 500 600 700 800 900 1000
10
-4
10
-3
10
-2
10
-1
10
0
1047 Epochs
T
ra
in
in
g
-B
lu
e
G
o
a
l-B
la
c
k
Performance is 0.000999705, Goal is 0.001

0 20 40 60 80 100 120 140
10
-4
10
-3
10
-2
10
-1
10
0
143 Epochs
T
ra
in
in
g
-B
lu
e
G
o
a
l-B
la
c
k
Performance is 0.000993769, Goal is 0.001

Fig. 4.57. Performane TRAINCGP cu 1 respectiv 4 reele Elman


Imag.originala Imag.cu zgomot Imag. antrenata Eroare-0.0264776

Fig. 4.58. Eroarea medie obinut n urma antrenrii cu 1 reea Elman pentru fiecare plan de culoare

Pentru determinarea timpului de antrenare precizez c am antrenat reelele pe un procesor Pentium 4 la


frecvena de 3,20GHz
152

Imagine originala Imag cu zgomot Imagine-antrenata Eroare-0.124852

Fig. 4.59. Eroarea medie obinut n urma antrenrii cu 4 reele Elman pentru fiecare plan de culoare

h) Rezultate obinute cu algoritmul TRAINCGB
Antrenare(TRAINCGB) cu o reea Elman Antrenare cu 4 reele Elman
Numrul de epoci Memorie
insuficient
Numrul de epoci R:
RN1=134
RN2=134
RN3=133
RN4=166
G:
RN1=124
RN2=119
RN3=114
RN4=96
B:
RN1=105
RN2=149
RN3=140
RN4=150
Performana medie


-
Performana medie pentru cele 4
subreele

Perf1=0.001
Perf2=0.001
Perf3=0.001
Perf4=0.001
Timpul de antrenare

- Timpul de antrenare total 112 s


Eroarea medie de antrenare
obinut
- Eroarea medie de antrenare
obinut
0,0309821


0 50 100 150
10
-4
10
-3
10
-2
10
-1
10
0
150 Epochs
T
ra
in
in
g
-B
lu
e
G
o
a
l-B
la
c
k
Performance is 0.000993749, Goal is 0.001

Fig. 4.60. Antrenarea imaginii cu 4 subreele Elman

Pentru determinarea timpului de antrenare precizez c am antrenat reelele pe un procesor Pentium 4 la


frecvena de 3,20GHz
153

Imagine originala Imag cu zgomot Imagine-antrenata Eroare-0.0309821

Fig. 4.61. Rezultatele obinute n urma antrenrii cu 4 subreele Elman

i) TRAINSCG utilizat cu reele Elman
Antrenare(TRAINSCG) cu o reea Elman Antrenare(TRAINSCG) cu 4 reele Elman
Numrul de epoci RN_R=744
RN_G=1444
RN_B=959
Numrul de epoci R:
RN1=155
RN2=124
RN3=139
RN4=101
G:
RN1=105
RN2=108
RN3=112
RN4=94
B:
RN1=96
RN2=148
RN3=146
RN4=138
Performana medie

Perf=0.001

Performana medie pentru cele
4 reele

Perf1=0.001
Perf2=0.001
Perf3=0.001
Perf4=0.001
Timpul de antrenare 542 s Timpul de antrenare total 86 s
Eroarea medie de antrenare
obinut
0,0275524 Eroarea medie de antrenare
obinut
0,0539085

0 100 200 300 400 500 600 700 800 900
10
-4
10
-3
10
-2
10
-1
10
0
959 Epochs
T
ra
in
in
g
-B
lu
e
G
o
a
l-B
la
c
k
Performance is 0.000999743, Goal is 0.001

0 20 40 60 80 100 120
10
-4
10
-3
10
-2
10
-1
10
0
138 Epochs
T
ra
in
in
g
-B
lu
e
G
o
a
l-B
la
c
k
Performance is 0.000994337, Goal is 0.001

Fig. 4.62. Comparare performane de antrenare cu 1 respectiv 4 reele Elman
Imag.originala Imag.cu zgomot Imag. antrenata Eroare-0.0275524

154

Fig. 4.63. Rezultate obinute n urma antrenrii cu 1 reea Elman
Imagine originala Imag cu zgomot Imagine-antrenata Eroare-0.0306099

Fig. 4.64. Rezultate obinute n urma antrenrii cu 4 reele Elman

j) Algoritmi Quasi Newton. Algoritmul One Step Secant
Antrenare(TRAINOSS) cu o reea Elman Antrenare(TRAINOSS) cu 4 reele Elman
Numrul de epoci RN_R=2312
RN_G=4761
RN_B=4484
Numrul de epoci R:
RN1=387
RN2=382
RN3=363
RN4=290
G:
RN1=334
RN2=242
RN3=285
RN4=284
B:
RN1=330
RN2=423
RN3=479
RN4=438
Performana medie Perf=0.001

Performana medie pentru cele
4 subreele
Perf1=0.001
Perf2=0.001
Perf3=0.001
Perf4=0.001
Timpul de antrenare

3167s Timpul de antrenare total 400 s


Eroarea medie de antrenare
obinut
0,028138 Eroarea medie de antrenare
obinut
0,112667

0 500 1000 1500 2000 2500 3000 3500 4000
10
-4
10
-3
10
-2
10
-1
10
0
4484 Epochs
T
ra
in
in
g
-B
lu
e
G
o
a
l-B
la
c
k
Performance is 0.000992804, Goal is 0.001

0 50 100 150 200 250 300 350 400
10
-4
10
-3
10
-2
10
-1
10
0
438 Epochs
T
ra
in
in
g
-B
lu
e
G
o
a
l-B
la
c
k
Performance is 0.000999272, Goal is 0.001

Fig. 4.65. Comparare metode de antrenare cu 1 respectiv 4 reele Elman

Pentru determinarea timpului de antrenare precizez c am antrenat reelele pe un procesor Pentium 4 la


frecvena de 3,20GHz
155

Imag.originala Imag.cu zgomot Imag. antrenata Eroare-0.0277268

Fig. 4.66. Rezultate obinute n urma antrenrii imaginii cu 1 reea Elman
Imagine originala Imag cu zgomot Imagine-antrenata Eroare-0.121581

Fig. 4.67. Rezultate obinute n urma antrenrii imaginii cu 4 reele Elman
n urma antrenrii unei imagini afectate de zgomot cu o reea de tip Elman cu un algoritm de
nvare backpropagation se observ o atenuare a contururilor din imagine. n imaginea de
eroare sunt vizibile contururile alterate. Cele mai bune performane s-au obinut, pentru
exemplul de fa, n cazul aplicrii algoritmilor ce folosesc tehnici de optimizare numeric:
TRAINCGF eroarea de recunoatere - 0,026351 (mai mic dect n cazul reelei
feedforward 0,0288449)
TRAINCGP eroarea de recunoatere - 0,0264776 (mai mic dect n cazul reelei
feedforward 0,02766453)
TRAINSCG eroarea de recunoatere - 0,0275524 (mai mare dect n cazul reelei
feedforward 0,0266698)



Fig. 4.68. Comparare metode de nvare backpropagation utilizate pentru eliminarea zgomotului sare i piper din
imaginea iniial ntr-o reea de tip Elman
eroarea
nr. epoci
156

4.3 Aplicaii ale reelelor neuronale Hopfield pentru eliminarea
zgomotelor
Proiectarea a unei reele neuronale recurente de tip Hopfield care s elimine zgomotul dintr-o
imagine color presupune mai nti mprirea imaginii n cele trei planuri de culoare (R,G,B),
implementarea reelelor pentru fiecare din aceste planuri, aplicarea tiparul de antrenament.
Pentru a demonstra capacitatea de corecie a erorilor se vor folosi versiuni ale imaginii
afectate de zgomot.
Rezultate obinute n urma antrenrii au fost bune, n cazul simulrilor cu nivel mai mici de
zgomot:
Img.initiala Img.antrenata Eroare antrenare0.0651795
Img.initiala zg. mai mare Img.simulata
Img.init zg. mult mai mic Img.simulata
Img.init. zg. mic Img.simulata

Fig. 4.69. Imaginea contaminat cu zgomot de tip sare i piper cu distribuie 0.3, 0.02, 0.2.
Se observ c, n cazul distribuiilor mai mici dect 0.3 pentru nivelul de zgomot, s-a obinut
o imagine bun. Timpul de memorare necesar celor trei reele a fost de 3.4690 s.
157

4.4 Aplicaii ale reelelor RBF pentru eliminarea zgomotelor
Antrenarea reelelor cu funcii radiale se face de obicei nesupervizat pentru stratul de intrare i
supervizat pentru stratul de ieire, dar poate fi folosit i metoda backpropagation de antrenare
supervizat pentru ambele straturi de neuroni. Deosebirea dintre metodele de antrenare este
dat de metoda de alegere a centrilor funciilor radiale, astfel centri pot fi fici, alei aleator
sau autoorganizai sau selectai supervizat.
Odat cu crearea unei reele neuronale RBF sunt stabilite i valorile parametrilor i anume:
datele de intrare, datele corecte, lrgimea(parametru cu proprietatea c valoarea gaussinei este
0.5 n punctele 0.8326/lrgime) i valoarea maxim admis pentru nivelul minim al erorii.
n urma implementrii unei reele neuronale cu funcii de transfer radiale n care valorile
centrelor coincid cu datele de intrare, iar valorile ponderilor ctre nivelul ascuns se determin
prin rezolvarea sistemului care furnizeaz punctul critic al funciei de eroare am obinut
urmtoarele rezultate:

Fig. 4.70. Antrenarea imaginii cu zgomot cu e reea RBF(newrbe)
Timpul de antrenare = 1.9220 s
Numrul de neuroni pe nivelul ascuns = 230 R/230 G/ 230 B


Aceeai imagine color afectat de zgomot antrenat cu o reea n manier iterativ.
La fiecare iteraie vectorul de intrare cruia i corespunde cea mai mare diferen ntre
rspunsul dorit i cel produs de reea este utilizat pentru a reprezenta centrul unei noi uniti
ascunse. Procesul iterativ continu pn cnd este atins un nivel minim al erorii sau pn cnd
au fost adugate suficiente uniti ascunse.
Rezultate obinute n urma antrenrii unei imagini color afectate de zgomot cu o reea cu
selecie autoorganizat a centrilor:
- timpul de antrenare (pentru cele 3 reele)= 241.1250 s
- numrul de uniti ascunse = 229 R/ 229G/ 229B
Imaginea obinut n urma antrenrii:
158

Img. originala Img.cu zg.de antrenat Img.antrenata Eroare-0.0231041

Fig. 4.71. Antrenarea imaginii color cu NEWRB

n urma antrenrii imaginii color afectate de zgomot cu o reea RBF regression neural
network care este construit dup urmtoarea regul: se definesc attea uniti ascunse cte
exemple sunt n setul de antrenare, iar centrele se aleg ca fiind datele de intrare, ponderile
conexiunilor ctre unitile de ieire se aleg ca fiind rspunsurile corecte corespunztoare, am
obinut urmtoarele rezultate:
- timpul de antrenare (pentru cele 3 reele)= 0.2810
- numrul de uniti ascunse = 230 R/ 230G/ 230B
Se observ o bun recunoatere a imaginii afectate de zgomot cu un nivel mai sczut dect
nivelul de zgomot cu care a fost antrenat reeaua:

Img. originala Img.cu zg.de antrenat Img.antrenata Eroare-0.0231041
Img.cu zg mai mic Sim.zg mai mic Eroare:0.172966
Img.cu zg mai mare Sim.zg mai mare Eroare:0.273281

Fig. 4.72. Antrenarea imaginii color cu NEWGRNN

n toate situaiile parametrul lrgime trebuie ales adecvat, adic suficient de mare pentru a
acoperi ntreg domeniul datelor de intrare. Valori prea mari ale parametrului fac ca toate
unitile ascunse s rspund aproape n aceeai manier caz n care reeaua va produce o
funcie aproape constant, iar valori prea mici ale parametrului nu permit obinerea unei
aproximri suficient de netede, reeaua fiind incapabil s generalizeze.


159

5. Concluzii

Lucrarea a tratat reelele neuronale artificiale pornind de la structur care nseamn
arhitectur, funcionare i adaptare - nvare, pentru a ajunge la utilizarea acestora din
perspectiva eliminrii zgomotului din imagini color, alb-negru sau n tonuri de gri.
Astfel capitolele doi i trei prezint arhitectura reelelor neuronale supervizate (feedforward,
Elman, recurente Hopfield), hibride (cu funcii radiale) i nesupervizate, utilizate n analiza
imaginilor. Procesul de nvare este dezvoltat de la algoritmii clasici pn la variantele de
antrenare rapida n bloc implementate n Matlab, grupate pe doua categorii: categoria bazat
pe tehnici euristice cu variantele backpropagation cu rata variabil de nvare i
backpropagation elastic i categoria tehnicilor de optimizare numeric cu algoritmii gradient
conjugat i quasi-Newton.
Capitolul patru prezint aplicaii ale reelelor neuronale, implementate n mediul Matlab,
pentru eliminarea zgomotelor din imaginile binare, gri i color. n cazul reelelor feedforward,
imaginile alb-negru sau cele n tonuri de gri au fost antrenate separat cu una i cu patru reele,
iar imaginile color au fost, n prima etap, mprite n cele trei planuri de culoare (rou, verde
i albastru) apoi antrenate cu una, respectiv patru reele pentru fiecare plan de culoare. La
sfritul perioadei de antrenare cu variantele algoritmului backpropagation Batch Gradient
Descendet i Batch Gradient Descendet with Moment nu s-au obinut rezultate
satisfctoare. n numrul de epoci stabilite nu s-a atins eroarea minim impus, iar imaginile
obinute n urma antrenrii sunt de o calitate slab.
Dintre algoritmii BP mbuntii din categoria ce folosete tehnici euristice, cele mai bune
performane s-au obinut n cazul antrenrii imaginii afectate de zgomot cu algoritm
backpropagation cu rat variabil de nvare i moment. Dei eroarea minim impus a fost
atins doar n cazul utilizrii a patru reele pentru imaginea de intrare, rezultate satisfctoare
au fost obinute i n cazul tratrii imaginii cu o singur reea.
Variantele algoritmilor gradient conjugat, cu excepia variantei Powel-Beale Restarts care
consum mult memorie i din considerente hardware nu a putut antrena imaginea cu o
singur reea, au condus la rezultate foarte bune att n ceea ce privete timpul de antrenare ct
i a erorii atinse. Dintre algoritmii de tip Quasi-Newton, imaginea a fost antrenat att cu una
ct i cu patru reele doar cu algoritmul One Step Secant obinndu-se rezultate bune;
metoda BFGS care utilizeaz matricea hessian, de asemenea nu a putut fi implementat din
considerente hardware.
Dac rezultatele cele mai bune n cazul reelelor feedforward s-au obinut cu variante ale
algoritmilor de tip gradient conjugat, i pentru reelele Elman aceeai algoritmi au condus la
convergena cea mai bun, aducnd ns mbuntiri att la timpul de convergen ct i la
eroarea medie de antrenare a imaginilor.
Se poate observa c att n cazul reelelor feedforward ct i Elman, se atenueaz frecvenele
nalte, ceea ce duce la o pierdere din conturul imaginii iniiale.
Dup antrenare, reelele Hopfield au fost capabile s elimine zgomotul aditiv sare i piper cu
distribuie mai mic de 0.3. Reelele feedforward i Elman nu au obinut scoruri bune de
recunoatere pentru alte niveluri de zgomot dect cel pentru care au fost antrenate, iar reelele
cu funcii radiale au fost capabile s recunoasc imaginile afectate de zgomot cu o distribuie
mai mic dect cea cu care au fost antrenate.



160

6. Bibliografie
[1] D. Dumitrescu, H. Costin, Reele neuronale teorie i aplicaii, Ed. Teora, Bucureti,
1996;
[2] G. Toderean, M. Costeiu, M. Giurgiu, Reele neuronale feedforward, Ed. Albastr, Cluj-
Napoca, 1994;
[3] V. Neagoe, O. Stnil, Recunoaterea formelor i reele neuronale algoritmi
fundamentali, Ed. Matrix, Bucureti,1999;
[4] S.W. Perry,Hau-San Wong, Ling Gua, Adaptive Image Processing, 2002 CRC Press LLC;
[5] V.Tiponu, C.D. Cleanu, Reele neuronale. Arhitecturi i algoritmi, Ed. Politehnic,
Timioara, 2002;
[6] L.Giurgiu, Modelarea cu reele neuronale a sistemelor inteligente de msurare, referat
doctorat
[7] C.Vizitiu, .Demeter, M.Popescu, Metode de optimizare a reelelor neuronale artificiale,
Ed. Adalex, 2005;
[8] D, Zaharie , Curs de reele neuronale artificiale, http://www.math.uvt.ro, 2003;
[9] Neural Network Toolbox