Sunteți pe pagina 1din 20

1

INTRODUCERE N PROCESAREA
IMAGINILOR







1.Introducere

Procesarea imaginilor este un domeniu al inteligenei artificiale,
ocupndu-se cu modul de reprezentare, reconstituire, clasificare,
recunoatere i analiz a imaginilor cu ajutorul calculatorului. Sursa de
provenien a imaginilor poate fi un dispozitiv de achiziie (camer video,
scanner, captor radar) dar poate fi la fel de bine i o ecuaie matematic, un
ansamblu de date statistice, etc.

Exist dou motive principale pentru care se apeleaz la procesarea
imaginilor :
1. mbuntirea calitii unei imagini avnd drept scop o mai bun
vizualizare pentru un operator uman. Aceasta poate nsemna:
reducerea zgomotului i a altor defecte ce pot fi prezente n
imagine (datorate, de exemplu, dispozitivului de achiziie),
evidenierea unor zone de interes prin modificarea luminozitii, a
contrastului, accentuarea muchiilor, etc.
2. extragerea de informaii dintr-o imagine, informaii ce pot
reprezenta intrarea pentru un sistem automat de recunotere i
clasificare. Aceste informaii pot fi: diferite distane i relaii dintre
obiectele prezente n imagine, momente statistice, parametri
geometrici (arie, perimetru, circularitate), coeficieni Fourier, etc.
Exemple clasice de aplicaii pentru procesarea imaginilor (i
recunoaterea formelor) includ: recunoaterea caracterelor, recunoaterea
amprentelor, prelucrarea imaginilor medicale, a imaginilor satelit.



2
2.Definiii. Noiuni de baz

n cele ce urmeaz se va considera drept reprezentare a unei imagini
un tablou bi-dimensional de numere ntregi (pixeli). Valoarea fiecrui pixel
descrie nivelul de strlucire sau culoarea acestuia. n cel mai simplu caz, al
imaginilor binare, pentru reprezentarea fiecrui pixel este folosit un singur
bit. n cazul imaginilor cu niveluri de gri, valoarea fiecrui pixel reprezint
strlucirea acestuia. Cel mai comun format pentru aceste imagini are la baz
reprezentarea pixelilor pe 8 bii. Astfel, gama de valori posibile este 0...255,
0 codificnd culoarea negru, 255 alb iar valorile intermediare reprezentnd
nuane (niveluri) de gri. n cazul imaginilor color, pot fi folosite diferite
sisteme de culori (RGB, HSI, CMY, etc.).

2.1.Modele de culori.

Modelul RGB este un model aditiv, avnd culorile fundamentale
rou, verde i albastru, celelalte culori constituindu-se din anumite procente
ale culorilor de baz. Culoarea alb are prezente toate culorile fundamentale
iar culoarea negru se caracterizeaz prin absena lor. Modelul RGB este
adesea reprezentat sub forma unui cub unitate, ca n figura 1:














Figura 1.

Originea (0,0,0) este considerat culoarea negru iar colul opus (1,1,1)
culoarea alb. Diagonala ce unete aceste dou puncte conine nivelurile de
gri obinute prin utilizarea aceluiai procent din culorile de baz.
Magenta
Cyan
Yellow
White
Black
Blue
Green
Red
3

O alt metod de clasificare a culorilor este prin nuanare (Hue),
saturaie (Saturation) i intensitate (Intensity), rezultnd modelul HSI.
Nuana reprezint poziia relativ a culorii n spectru i, n modelul HSI,
corespunde unghiului pe care l face culoarea n cercul de culori. Domeniul
de nuanare se ntinde de la 0 la 360 de grade. Saturaia specific puritatea
culorii. Valoarea saturaiei se exprim n procente i variaz de la 0 (fr
culoare) pn la 100 (culoare pur, aa cum este definit de valoarea
nuanrii). Ultimul parametru specific intensitatea culorii. O reprezentare
simbolic a modelului HSI este dat n figura 2. Nuana determin culoarea
(unghi = 60 - Yellow, 180 - Cyan, etc.) Saturaia este msurat n procente
de la centrul cercului de baz la suprafaa conurilor. Intensitatea se msoar
pe linia Black-White.
















Figura 2.

Modelul CMY are la baz culorile Cyan, Magenta i Yellow,
considerate culori secundare fa de culorile Red, Green, Blue. Modelul este
substractiv, culoarea alb fiind dat de absena culorilor CMY, iar culoarea
negru fiind caracterizat de prezena acestora.
n continuare sunt date cteva modaliti de conversie ntre tipurile de
modele prezentate:

Magenta
Cyan
Yellow
Blue
Green
Red
White
Black
(
(
(

(
(
(

=
(
(
(

B
G
R
Y
M
C
1
1
1
4


2.2.Vecinti.Conectivitate.

ncepnd cu acest capitol ne vom referi prin f
i,j
la valoarea pixelului
aflat la coordonatele (i,j) din matricea ce reprezint imaginea (unde i
reprezint linia iar j coloana). Vom considera c matricea este de dimensiune
M*N. Deasemenea, dac nu se precizeaz altfel, discuiile vor avea n
vedere o imagine cu niveluri de gri (considerm reprezentarea pe 8 bii, deci
cu 256 de valori posibile). Aceasta nu reprezint o limitare ntruct o
imagine color poate fi descompus dup culorile fundamentale (R,G,B) n
trei imagini separate, fiecare astfel de imagine putnd fi tratat ca alctuit
din niveluri de gri.

Un pixel p de coordonate (i,j) prezint patru vecini n punctele: (i-1,j),
(i+1,j), (i,j-1), (i,j+1). Vom nota acest ansamblu (vecintate) de pixeli cu
N
4
(p). Pixelii diagonali de coordonate: (i-1,j-1), (i-1,j+1), (i+1,j+1), (i+1,j-1)
alctuiesc un nou ansamblu notat N
D
(p). n final, ansamblurile N
4
(p) i
N
D
(p) reunite, formeaz ansamblul notat N
8
(p).
Avnd n vedere ansamblurile (vecintile) definite mai sus, se pot
considera dou tipuri de conectivitate:
1. 4-conectivitate - doi pixeli, p
1
i p
2
, de coordonate (i
1
,j
1
) i (i
2
,j
2
)
sunt n relaie de 4-conectivitate dac (i
1
,j
1
) se afl n ansamblul
N
4
(p
2
) sau echivalent, dac (i
2
,j
2
) se afl n ansamblul N
4
(p
1
).
2. 8-conectivitate - doi pixeli, p
1
i p
2
, de coordonate (i
1
,j
1
) i (i
2
,j
2
)
sunt n relaie de 8-conectivitate dac (i
1
,j
1
) se afl n ansamblul
N
8
(p
2
) sau echivalent, dac (i
2
,j
2
) se afl n ansamblul N
8
(p
1
).

Se numete drum de lungime n mulimea de pixeli D
n
={p
1
, p
2
,... p
n
}
pentru care fiecare pixel p
i
se afl n relaie de conectivitate cu pixelul
urmtor p
i+1
, i=1..n-1.
(
(
(
(
(
(
(
(
(

+ +
+ +

+
)
`

=
(
(
(

3
) , , min(
) (
3
1
2
) (
3
2
arctan
2
B G R
B G R
B G R
B G
B G R
I
S
H

5
Doi pixeli p i q sunt conectai dac exist un drum D
n
de la p la q.
Un set de pixeli formeaz o regiune dac orice doi pixeli aparinnd
setului sunt conectai.

2.3.Metrici.

Distanele dintre pixeli poart denumirea de metrici.
Fie P mulimea pixelilor unei imagini. O metric, n cazul unei
imagini, este o funcie
care ndeplinete urmtoarele condiii:


Exemple de metrici des utilizate:

1. distana euclidian
unde p
1
i p
2
sunt pixeli de coordonate (i
1
,j
1
) respectiv (i
2
,j
2
).

2. distana Manhattan (city block metric)
n baza acestei distane putem da o definiie riguroas pentru
ansamblul N
4
(p), astfel:

3. distana jocului de ah (chessboard metric)

Avnd aceast funcie, se poate da o nou definiie pentru
ansamblul N
8
(p), astfel:
P P d :
P p p p p p d p p d p p d
P p p p p d p p d
p p p p d P p p p p d
+
=
= =
3 2 1 2 3 3 1 2 1
2 1 1 2 2 1
2 1 2 1 2 1 2 1
, , ) , ( ) , ( ) , ( . 3
, ) , ( ) , ( . 2
0 ) , ( . , 0 ) , ( . 1
2
2 1
2
2 1 2 1
) ( ) ( ) , ( j j i i p p d + =
2 1 2 1 2 1 4
) , ( j j i i p p d + =
{ }
2 1 2 1 2 1 8
, max ) , ( j j i i p p d =
{ } 1 ) , ( / ) (
4 4
= q p d P q p N
{ } 1 ) , ( / ) (
8 8
= q p d P q p N
6

2.4.Histograma nivelurilor de gri

Histograma nivelurilor de gri a unei imagini reprezint o funcie care
asociaz fiecrui nivel de gri prezent n imagine frecvena sa de apariie.
Dac consideram o imagine f care prezint un numr maxim G de
niveluri de gri, atunci funcia histogram poate fi definit astfel :


Un exemplu de histogram este dat n figura urmtoare:
Figura 3.
a) imagine cu 256 niveluri gri b) histograma nivelurilor de gri

Histograma nu ofer nici o informaie cu privire la locaia pixelilor
sau la poziia relativ a acestora ns, dispunnd de histograma unei imagini,
nivelurile de gri pot fi manipulate pentru a mbunti contrastul,
luminozitatea, etc. De exemplu, o deplasare a nivelurilor de gri din
histogram spre stnga/dreapta conduce la o diminuare/cretere a
luminozitii. Se poate observa din figura 3 o concentrare a valorii unor
pixeli n jurul unor anumite valori (de exemplu 120), reprezentnd regiuni cu
aceeai luminozitate sau luminoziti foarte apropiate (cum ar fi fondul
imaginii). Acest aspect este foarte util n procesul de segmentare permind
o separare rapid a obiectelor de fundal n funcie de luminozitatea acestora.
{ } { }
[ ]

=
= = = =

1
0
1
0
,
, 0
, 1
] [ ) (
,... 1 , 0 1 ,... 1 , 0 :
M
i
N
j
j i
y x pentru
y x pentru
y x unde k f k h
M N G h
0
1000
2000
3000
4000
1
1
9
3
7
5
5
7
3
9
1
1
0
9
1
2
7
1
4
5
1
6
3
1
8
1
1
9
9
2
1
7
2
3
5
2
5
3
Nivel gri
F
r
e
c
v
e
t
a
7
n cazul imaginilor color folosind modelul RGB se pot realiza
histograme pentru fiecare culoare de baz n parte cu pstrarea validitii
celor discutate mai sus.



3.Pre-procesarea imaginilor

Pre-procesarea are drept scop realizarea unei mbuntiri a imaginii
prin punerea n eviden a anumitor regiuni, schimbarea luminozitii,
detecia muchiilor, etc., pregtind imaginea n vederea operaiei de
segmentare.
Transformrile aplicate n aceast etap unei imagini pot fi de dou
tipuri :
transformri punctuale (modificarea valorii unui pixel se face
independent de vecintatea acestuia)
transformri locale (noua valoare a pixelului depinde de valorile
pixelilor nconjurtori)

3.1.Transformri punctuale.Egalizarea histogramei.

Din cadrul transformrilor punctuale, vom avea n vedere manipularea
contrastului prin transformarea nivelurilor de gri. n acest sens, o
transformare punctual poate fi privit ca o funcie de transfer T definit pe
mulimea nivelurilor de gri originale, care atribuie fiecrui pixel o nou
valoare n funcie de luminozitatea sa.
Exemple de funcii de transfer sunt date n urmtoarea figur :










Figura 4.
3
1

2
p
2
p
1
255
255 0
T
Nivel de gri
8

1 funcia identitate T(p)=p ,p=0..255
2 funcia invers T(p)=255-p ,p=0..255
3 o funcie de tipul:
Funcia 3 prezentat poate fi folosit pentru accentuarea contrastului
dintre nivelurile de gri cuprinse ntre p
1
i p
2
dac panta a
2
este superioar
valorilor a
1
i a
3
.

Transformrile nivelurilor de gri au drept scop o mai bun vizualizare
a imaginii de ctre un operator uman. O tehnic din cadrul acestor
transformri care d rezultate bune n practic poart denumirea de
egalizarea histogramei i const n distribuirea nivelurilor de gri existente
pe ntreaga gam posibil de valori. Aceast tehnic este foarte util n cazul
unor imagini ale cror niveluri de gri sunt localizate ntr-un interval restrns
iar mprtierea lor pe ntreaga scal conduce la o vizualizare sensibil mai
bun. Funcia de transfer utilizat n acest caz are la baz histograma
nivelurilor de gri, fiind reprezentat de curba cumulat a frecvenelor
nivelurilor de gri.

Figura 5.
a) imaginea dup egalizarea histogramei b) histograma dup egalizare

> +
+
< +
=
2 3 3
2 1 2 2
1 1 1
,
,
,
) (
p p pentru b p a
p p p pentru b p a
p p pentru b p a
p T
0
1000
2000
3000
4000
1
2
2
4
3
6
4
8
5
1
0
6
1
2
7
1
4
8
1
6
9
1
9
0
2
1
1
2
3
2
2
5
3
Nivele de gri
F
r
e
c
v
e
n
t
a
9
n figura 5 este prezentat imaginea obinut prin aplicarea metodei
egalizrii histogramei originalului din Figura 3. Se observ accentuarea
contrastului ce permite o mai clar observare a detaliilor, punerea n
eviden a variaiilor minore dintre regiuni care trec neobservate n imaginea
iniial.
Concret, metoda egalizrii histogramei const n nlocuirea fiecrui
nivel de gri k din imaginea original cu valoarea frecvenelor cumulate pna
la acest nivel (valoare scalat bineneles n intervalul 0...255).

Trebuie notat faptul c egalizarea histogramei poate fi realizat doar
pentru o anumit regiune de interes i nu pentru toat imaginea (de exemplu
o zon determinat de un dreptunghi).


3.2.Transformri locale

Aceste transformri in cont de o anumit vecintate a pixelului al
crui nivel de gri va fi modificat. De obicei, vecintile cu care se lucreaz
sunt ptratice, de dimensiuni 3x3, 5x5, 7x7, n general de forma
(2p+1)x(2p+1), centrate pe pixelul supus transformrii.

Transformrile locale, n funcie de scopul lor, se pot clasifica n dou
categorii :
transformri care vizeaz netezirea imaginii (image smoothing) sau
a unor regiuni din aceasta, avnd drept scop reducerea zgomotului sau
altor defecte ale imaginii.
transformri care vizeaz detecia muchiilor (edge detection), bazate
pe derivatele funciei asociat imaginii.

O alt clasificare a transformrilor locale are n vedere proprietile de
liniaritate ale acestora. Astfel, putem vorbi despre:
transformri liniare
transformri neliniare

Transformrile liniare se caracterizeaz prin faptul c valoarea
rezultat reprezint o combinaie liniar a nivelurilor de gri din vecintatea

= =
= =
255
0 0
) ( , ) (
255
i
total
k
i
total
nou
i h H unde i h
H
k
10
utilizat pentru fiecare pixel. Contribuia fiecrui pixel din vecintate n
rezultatul final este ponderat cu o anumit valoare, astfel:

unde (i
0
,j
0
) sunt coordonatele pixelului asupra cruia se realizeaz
transformarea, f reprezint imaginea original iar f
out
imaginea final.
Ecuaia de mai sus poate fi scris ca un produs de convoluie dintre
imaginea original f i nucleul (matricea) w, astfel:


Reducerea zgomotului (Image Smoothing)

Metodele privind reducerea zgomotului prezent n imagine (filtrare)
pot fi liniare sau neliniare, n acord cu discuiile de mai sus. Filtrarea liniar
se bazeaz pe nlocuirea nivelului de gri al unui pixel cu media (ponderat
sau nu) a valorilor pixelilor din vecintatea sa.
O metod simpl care poate rezolva acest deziderat este utilizarea
unor nuclee de convoluie de tipul:

Se observ c prin aplicarea nucleului w
1
imaginii original, valoarea
fiecrui pixel este nlocuit cu media valorilor pixelilor dintr-o vecintate
3x3 centrat pe pixelul respectiv. Desigur, pot fi folosite vecinti de
dimensiuni mai mari: 5x5, 7x7, etc. n cazul celorlalte dou exemple se
atribuie o pondere mai mare pixelului central n calculul mediei, respectiv
pixelilor din vecintatea N
4
.
O alt variant este utilizarea unor nuclee ce reprezint aproximri ale
suprafeei lui Gauss, date de funcia:

= =
+ +
+ +
=
m
m i
m
m j
j j i i
m j m i
out
j i
f w f
0 0 0 0
,
,
,
N M ij m m ij
out
f f w w f w f
+ +
= = = ) ( , ) ( ,
) 1 2 ( ) 1 2 (
(
(
(

=
(
(
(

=
(
(
(

=
1 2 1
2 4 2
1 2 1
16
1
1 1 1
1 2 1
1 1 1
10
1
1 1 1
1 1 1
1 1 1
9
1
3 2 1
w w w
2
2 2
2
2
1
) , (


y x
e y x G
+

=
11
Exemple de nuclee de diferite dimensiuni i pentru valori diferite ale
deviaiei sunt date n continuare:
Se observ ponderarea diferit a pixelilor din vecintate n funcie de
poziia lor fa de pixelul central.
Trebuie remarcat faptul c nucleele prezentate mai sus pot fi aplicate
consecutiv imaginii, ns o aplicare excesiv conduce la efectul denumit
blur (cea) i va determina pierderea detaliilor.
n Figura 6 este prezentat o operaie de filtrare a imaginii din Figura
3 la care s-a adugat un zgomot reprezentat de un numr de pixeli albi i
negri generai aleator. A fost utilizat de dou ori nucleul w
1
de dimensiune
3x3. Ultima imagine prezint efectul de blur prin aplicarea nucleului w
5
de
4 ori succesiv pe jumtatea dreapt a imaginii original din Figura 3.


Figura 6.
a) imagine cu zgomot b) imagine filtrat c) efectul blur


625 . 0
1 2 3 2 1
2 7 11 7 2
3 11 17 11 3
2 7 11 7 2
1 2 3 2 1
121
1
391 . 0
1 4 1
4 12 4
1 4 1
32
1
5
4
=
(
(
(
(
(
(

=
=
(
(
(

pentru w
pentru w
12
O metod de filtrare neliniar este dat de filtrajul median al lui
Tuckey care const n nlocuirea valorii fiecrui pixel cu valoarea median a
irului de valori ale pixelilor din vecintatea utilizat. Un exemplu este dat n
continuare, pixelul central avnd nivelul de gri 40, iar vecintatea folosit
fiind de dimensiune 3x3:









Detecia muchiilor (Edge detection)

Intuitiv, ntr-o imagine, muchiile pot fi identificate acolo unde valorile
pixelilor se schimb brusc. n Figura 7 sunt prezentate dou profile ideale de
muchii ct i un caz real de muchie nsoit de zgomot.










Figura 7.
a) muchie tip treapt b) muchie tip vrf c) muchie real cu zgomot

Muchiile de tip treapt se situeaz ntre regiuni caracterizate de valori
medii ale nivelurilor de gri diferite. Muchiile de tip vrf corepund unei
variaii locale a intensitii pixelilor, variaie ce prezint un maxim sau un
minim.

Schimbrile de intensitate pot fi detectate aplicnd imaginii un
operator de tip gradient. Gradientul unei funcii ntr-un punct este un vector
Nivel gri
x
60 51 50 30 20
50 40 30 25 25
12 50 20 25
11 30 50 1 100
50 20 12 1 10
40
irul de valori sortat al nivelelor de gri
din vecintatea considerat este: 1, 20,
25, 30, 30, 40, 40, 50, 50 iar valoarea
median este 30. Aceasta va fi noua
valoare a pixelului central.
Nivel gri
x
Nivel gri
x
13
normal la curba descris de funcie n punctul respectiv. Privind imaginea ca
o funcie de dou variabile f(x,y) care asociaz fiecrui punct (x,y) o valoare
a intensitii (nivel de gri) i fcnd presupunerea c funcia este continu i
derivabil, gradientul n punctul (x,y) va fi:

Amplitudinea i orientarea gradientului n punctul (x,y) sunt date de:

Amplitudinea gradientului msoar diferena dintre intensitile
pixelilor dintr-o vecintate, iar orientarea relev direcia celei mai
semnificative schimbri de intensitate, care este probabil i direcia muchiei.
Aceste formule se transform n cazul discret al procesrii imaginilor
digitale prin nlocuirea derivatelor pariale cu diferene finite, astfel:

n continuare sunt prezentai diferii operatori bazai de gradient:

1. operatorul Roberts

Acest operator presupune calculul urmtoarelor diferene finite :
Amplitudinea i orientarea se calculeaz n conformitate cu definiiile
de mai sus.
Calculul diferenelor finite se poate realiza ca un produs de convoluie
ntre imaginea f i nucleele :
|
|

\
|

=
|
|

\
|

+
|

\
|

= ) , ( ) , ( arctan ) , ( ) , ( ) , (
2
2
y x
y
f
y x
x
f
y x
y
f
y x
x
f
y x f
) , ( ) 1 , ( ) , (
) , ( ) , 1 ( ) , (
y x f y x f y x
y
f
y x f y x f y x
x
f
+

) , 1 ( ) 1 , (
) 1 , 1 ( ) , (
2
1
y x f y x f
y x f y x f
+ + =
+ + =
(

=
(

=
0 1
1 0
1 0
0 1
2 1
w w
|
|

\
|

= ) , ( ), , ( ) , ( y x
y
f
y x
x
f
y x f
14
Un dezavantaj al acestui operator l reprezint sensibilitatea la zgomot
datorit dimensiunilor mici ale vecintii folosite.

2. operatorul Prewitt

Operatorul Prewitt folosete urmtoarea aproximare a derivatelor n
cele dou direcii:
Ca urmare, nucleele folosite n cazul convoluiei sunt:


Gradientul este estimat n 8 direcii posibile (n cazul unui nucleu 3x3)
iar valoarea amplitudinii reprezint maximul rezultatelor obinute prin
aplicarea celor 8 nuclee. Direcia gradientului se calculeaz pentru situaia
corespunztoare maximului amplitudinii.

3. operatorul Sobel

n acest caz, nucleele de convoluie sunt:

Se pot folosi toate cele 8 nuclee corespunztoare celor 8 direcii, ntr-o
manier similar operatorului Prewitt, ns se pot folosi doar nucleele w
1
i
w
3
pentru realizarea diferenelor finite pe linii, respectiv coloane. n acest
caz amplitudinea i direcia gradientului se calculeaz n maniera obinuit:
( )
( ) ) 1 , ( ) 1 , (
2
1
) , 1 ( ) , 1 (
2
1
+

y x f y x f
y
f
y x f y x f
x
f
(
(
(


=
(
(
(

=
(
(
(


=
(
(
(


=
1 1 1
0 0 0
1 1 1
1 0 1
1 0 1
1 0 1
0 1 1
1 0 1
1 1 0
1 1 1
0 0 0
1 1 1
8 3 2 1
w w w w K
(
(
(


=
(
(
(


=
(
(
(


=
1 2 1
0 0 0
1 2 1
0 1 2
1 0 1
2 1 0
1 2 1
0 0 0
1 2 1
8 2 1
w w w K
) arctan(
3 1
2
3
2
1
w w w w A = + =
15

Exist i ali operatori ce utilizeaz metode derivative pentru detecia
muchiilor pe care numai i vom aminti i vom prezenta primul nucleu de
convoluie (celelalte pot fi obinute prin rotaii succesive):

4. operatorul Kirsch 5. operatorul Robinson 6. operatorul Frei & Chen

Trebuie inut cont de faptul c numai o valoare mare a amplitudinii
gradientului poate semnifica prezena unei muchii. Astfel, se impune o
filtrare a rezultatelor obinute (de exemplu, se pstreaz ca poteniale
componente ale muchii acei pixeli ale cror valori depesc un anumit prag).
Figura 8 prezint un exemplu de aplicare al unui operator de detecie a
muchiilor (Prewitt) asupra imaginii din Figura 3:

Figura 8.

Alte metode de detecie a muchiilor se bazeaz pe aplicarea
operatorului Laplace, inndu-se cont de derivata a doua a funciei asociat
imaginii:
(
(
(

(
(
(

(
(
(

1 2 1
0 0 0
1 2 1
1 1 1
1 2 1
1 1 1
5 5 5
3 0 3
3 3 3
) , ( ) , ( ) , (
2
2
2
2
y x
y
f
y x
x
f
y x L

=
16
Dac n cazul precedent existena unei muchii era determinat de un
maxim al gradientului (bazat pe derivate de ordin I), n acest caz muchiile
sunt identificate prin trecerea prin 0 a laplacian-ului imaginii (un maxim al
derivatei de ordinul I reprezint un zero al derivatei de ordinul II).
Laplacianul poate fi calculat printr-un produs de convoluie al
imaginii cu nuclee de forma:

Alte abordri privind detecia muchiilor au n vedere operatori de tip
DoG (Difference of Gaussians) sau LoG (Laplacian of a Gaussian).


4.Tehnici de segmentare

Prin segmentare se nelege divizarea imaginii ntr-un numr finit de
regiuni de interes, n conformitate cu anumite criterii. O complet
segmentare a unei imagini (privit ca o regiune global R) const n
determinarea unui set de regiuni R
1
, R
2
, ... R
p
, astfel nct s fie ndeplinite
condiiile :

Un exemplu de segmentare l constituie separarea obiectelor prezente
n imagine de fundal. n cazul n care att obiectele ct i fundalul se
caracterizeaz prin niveluri medii de gri diferite, acest lucru se poate realiza
printr-o simpl filtrare a nivelurilor de gri n funcie de un anumit prag T
(threshold), rezultnd o imagine binar f
out

astfel:

(
(
(

(
(
(

(
(
(

2 1 2
1 4 1
2 1 2
1 1 1
1 8 1
1 1 1
,
0 1 0
1 4 1
0 1 0
sau
j i p j i R R R R
j i
p
i
i
= =
=
}, .. 2 , 1 { , , 0 ,
1
I U

>

=
T f dac
T f dac
f
j i
j i
out
j i
,
,
,
, 0
, 1
17
n Figura 9 este prezentat o imagine cu 256 niveluri de gri i
rezultatul unui proces de segmentare, valoarea 0 codificnd fundalul iar
valoarea 1 obiectele:


Figura 9.
a) imagine cu 256 niveluri de gri b) imagine segmentat T=110

Trebuie notat faptul c performanele segmentrii sunt determinate de
alegerea nivelului de prag T. Metodele privind alegerea valorii acestuia au n
considerare histograma nivelurilor de gri a imaginii. Pentru cazul considerat,
histograma este prezentat n Figura 10.
Figura 10.


Un algoritm simplu iterativ pentru alegerea automat a pragului n
cazul unei histograme bimodale presupune urmtorii pai:

1. alegerea unei prime aproximri pentru T (de exemplu T=1).
2. la pasul i se calculeaz nivelurile medii de gri ale obiectelor i
fundalului:
0
1000
2000
3000
4000
5000
1
2
1
4
1
6
1
8
1
1
0
1
1
2
1
1
4
1
1
6
1
1
8
1
2
0
1
2
2
1
2
4
1
Nivele gri
F
r
e
c
v
e
n
t
a
Histograma imaginii este
bimodal n sensul c exist
dou concentrri importante ale
nivelelor de gri: n jurul valorii
41 (nivelul mediu de gri al
obiectelor) i n jurul valorii 150
(nivelul mediu de gri al
fundalului). Ca urmare, nivelul
pragului poate fi ales ntre cele
dou valori. (T=110).
18


3. calcularea pragului T la pasul i:

4. dac valoarea T a pragului la pasul i este egal cu valoarea pragului
la pasul anterior sau dac a expirat numrul de iteraii dorite, algoritmul se
ncheie, altfel se reia cu pasul 2.

De regul, un numr de iteraii ntre 4 i 10 este suficient. n cazul
exemplului prezentat n Figura 9, cu un numr de 10 iteraii s-a obinut o
valoare de prag T=119.

n cazul histogramelor multimodale (de exemplu, pot exista obiecte cu
niveluri medii de gri diferite), pot fi alese mai multe niveluri de prag,
corespunztoare concentrrii nivelurilor de gri n jurul unor anumite puncte
n histograma imaginii:

n cazul imaginilor color, segmentarea presupune calcularea
histogramelor pentru cele trei culori de baz (R, G, B) i determinarea
pragurilor T n funcie de culoarea obiectelor ce se doresc a fi separate de
fundal. Se realizeaz segmentarea pentru fiecare component, rezultnd trei
imagini binare finale care vor fi supuse unei operaii de tip OR.

T f
fundal pixeli total
f
n fundal gri mediu nivel
T f
obiecte pixeli total
f
n obiecte gri mediu nivel
j i
j i
j i
fundal
j i
j i
j i
obiecte
> =
=

,
,
,
,
,
,
,
,
2
fundal obiecte
n n
T
+
=


=

altfel
T T T T T T f dac
f
r r j i out
j i
, 0
] , [ ... ] , [ ] , [ , 1
1 3 2 1 0 ,
,
19

5.Analiza i recunoaterea formelor


Procesul de segmentare conduce la obinerea unei imagini binare care
conine obiectele separate de fundal. Utiliznd un algoritm de determinare a
componentelor conexe se realizeaz distingerea i etichetarea obiectelor,
ceea ce creeaz premisele pentru ultima etap n cadrul procesrii
imaginilor : analiza formelor. n urma acestei analize, pentru fiecare obiect
n parte se pot calcula diveri parametri (cum ar fi invarianii de exemplu),
parametri care pot fi utilizai ntr-un sistem automat de clasificare. Exist o
grani foarte fin n aceast etap ntre domeniul procesrii imaginilor i
domeniul recunoaterii formelor.
Prin form se nelege reprezentarea matematic a unui obiect pe baza
observaiilor i msurtorilor efectuate asupra lui.
Exist dou direcii principale n domeniul analizei formelor, i
anume :
abordarea funcional
abordarea din perspectiva teoriei mulimilor
Fiecare dintre cele 2 direcii definete conceptul de form plecnd de
la diferite abordri matematice.
Abordarea funcional se bazeaz pe aproximarea contururilor
formelor (obinute eventual printr-o metod de detecie a muchiilor) cu
diverse funcii ceea ce permite aplicarea rezultatelor geometriei difereniale
i analitice n studiul acestora. Funciile contur rezultate pot fi aproximate cu
serii trigonometrice de funcii sin i cos ceea ce permite o caracterizare a
formelor cu ajutorul coeficienilor Fourier.
Abordarea din perspectiva teoriei mulimilor privete formele ca fiind
mulimi compacte i nchise i are n vedere obinerea anumitor proprieti
geometrice sau rapoarte. n acest sens se pot calcula urmtoarele proprieti :
A(X) - aria formei X
P(X) perimetrul formei X
D
A
(X), D
P
(X) diametrele cercurilor avnd aceai arie respectiv
perimetru cu forma X
FMD(X) Feret Maximum Diameter cea mai mare distan dintre
dou puncte aparinnd formei X (este o msur a alungirii).
C(X) circularitatea C(X) = 4A(X) / (P(X))
2
(caracterizeaz
devierea formei X fa de un disc. Valoarea maxim este 1 n cazul
discului).
20
a(X)/b(X) raportul lungimilor axelor unei elipse avnd aceeai arie
i acelai perimetru cu forma X (acest raport este o msur a
alungirii).
Raportul de convexitate : A(X)/A(conv (X)) unde conv (X) repezint
poligonul dat de nfurtoarea convex a formei X (raportul este o
msur a convexitii, pentru o form convex lund valoarea 1 iar n
caz contrar valoarea este subunitar).

Au fost prezentate numai cteva rapoarte i proprieti doar pentru
exemplificare, alegerea i definirea lor fcndu-se n funcie de specificul
fiecrei aplicaii. O proprietate important pe care parametrii pot s o dein
este invariana (la translaie, rotaie, scalare), un exemplu n acest sens fiind
momentele de diferite ordine.
n final, o form va putea fi caracterizat de un set de valori (x
1
, x
2
,... ,
x
p
), urmnd aplicarea tehnicilor specifice recunoaterii formelor n vederea
clasificrii acesteia.

6.Concluzii

Articolul s-a dorit a fi o introducere sumar n metodele i tehnicile
folosite n cadrul procesrii imaginilor, multe aspecte fiind ignorate (cum ar
fi : reconstrucia imaginilor, compresia, analiza texturii, reconstrucia 3D,
etc.). Aplicaiile acestui domeniu sunt practic nelimitate : de la simple
corecii ale defectelor imaginilor pn la aplicaii complexe n medicin,
industrie, securitate, armat.

7.Bibliografie

1. Pratt W.K., Digital Image Processing, 2
nd
Edition, John Wiley & Sons,
New York, 1991.
2. Russ J.C., The Image Processing Handbook, 2
nd
Edition, CRC Press.
3. Cocquerez J.P., Philipp S., Analyze dImages:Filtrage et Segmentation.
4. Marion A., Introduction aux Tehniques de Traitement dImages.
5. Toumazet J.J., Traitement de lImage sur Micro-ordinateur.

S-ar putea să vă placă și