Documente Academic
Documente Profesional
Documente Cultură
Segmentarea imaginilor
Subiecte
7.1. Definiţii
7.2. Proprietăţi ale imaginilor
7.3. Detecţia muchiilor
7.3.1. Operatori de tip gradient
7.3.2. Detectori de forme cu suprapunere de tipar
7.3.3. Detecţia schimbărilor de semn ale derivatei de ordinul
doi
7.4. Discriminarea cu prag
7.5. Creşterea regiunilor
7.1. Definiţii
Segmentarea este o etapă de prelucrare importantă şi adesea
dificilă în analiza imaginii. Obiectivul segmentării îl constituie
fragmentarea imaginii în părţi constituente, de preferinţă obiecte sau
părţi de sine stătătoare ale obiectelor prezente. Segmentarea este adesea
un procedeu de extragere a informaţiilor esenţiale în vederea
recunoaşterii formelor în imagine. De asemenea, segmentarea poate
constitui o etapă în procesul de compresie a imaginii.
Prin tehnici adecvate de preprocesare, imaginea poate fi
transformată pentru a se facilita sarcinile segmentării. Şi etapa de
achiziţie a imaginii poate avea o influenţă considerabilă asupra
complexităţii segmentării. De exemplu, utilizarea unor senzori de
imagine sensibili în infraroşu poate simplifica spectaculos sarcina
detectării unui tanc sau a unui avion.
Segmentarea este o operaţie puternic dependentă de aplicaţie,
segmentarea autonomă reprezentând una din problemele cele mai
dificile în analiza imaginilor. Sarcinile segmentării pot fi mult uşurate
prin incorporarea în algoritmii de prelucrare a informaţiilor specifice
aplicaţiei, denumite informaţii apriorice. Fragmentele de imagine
separate prin segmentare le vom numi regiuni. O regiune extrasă poate
fi caracterizată la modul general prin omogenitatea unei anumite
proprietăţi (sau caracteristici) în interiorul ei. Definiţia generală este
(inevitabil) vagă. În general, avem în vedere proprietăţi locale, evaluate
în ferestre de anumite dimensiuni. Dimensiunile ferestrei sunt direct
legate de dimensiunile obiectelor căutate şi de noţiunea de scară. În cele
ce urmează, vom exemplifica proprietăţile ce s-au dovedit utile în
rezolvarea cu succes a problemei segmentării într-o serie de aplicaţii.
Proprietăţi globale sunt, de asemenea de interes în segmentare. Rolul lor
este cel mai frecvent acela de a furniza algoritmului de segmentare
parametri ce sunt folosiţi în procesul de decizie care conduce în final la
generarea regiunilor.
Rezultatul segmentării este generarea unei mulţimi finite de
regiuni, Ri, ale imaginii R, astfel încât
Modulul 7
Segmentarea imaginilor
N
R Ri , Ri R j , i j . (7.1)
i 1
| f | | g| g x2 g 2y (7.5)
gy
g arctg . (7.6)
gx
f f x f y
g x cos g y sin . (7.7)
r x r y r
Calculul derivatelor
Calculul derivatelor implicate în definiţia gradientului este
posibil numai prin aproximare, imaginea fiind definită într-o reţea
discretă. De exemplu,
f f ( x x) f ( x)
x x
f ( x) f ( x x)
(7.8)
x
f ( x x) f ( x x)
.
2x
hx1 1 1 0 , (7.10a)
hx 2 0 1 1 , (7.10b)
Modulul 7
Segmentarea imaginilor
respectiv
1
hx 3 1 0 1 . (7.10c)
2
1 1
2
1 0
1 1
1
2
1 1 .
Operatorii de tip gradient Prewitt şi Sobel
Operatorul Prewit [Lipkin 1970] poate fi obţinut impunând
aproximarea cu eroare pătratică minimă a imaginii într-o fereastră 33
cu un plan
z = ax + by + c.
(7.20)
1 1
(a, b, c) [ f
x 1 y 1
xn, yn ax by c ]2 .
(7.21)
0, 0, 0. (7.22)
a b c
1
a ( f m 1,n 1 f m 1,n f m 1,n1 f m 1,n1 f m 1,n f m 1,n1 ),
6
1
b ( f m 1,n1 f m ,n1 f m 1,n1 f m 1,n 1 f m ,n 1 f m 1,n 1 ),
6
1
c ( f m 1,n1 f m ,n 1 f m 1,n1 f m , 1n f m ,n f m 1,n
9
f m 1,n 1 f m ,n1 f m 1,n 1 ).
(7.23)
Pe planul optimal astfel determinat,
a gx ,
b g y.
Modulul 7
Segmentarea imaginilor
1 0 1 1
1 1 1
P
hx
6
1 0 1
2
1 0
1 1
3
(7.24a)
1 0 1
1
1 1 1 1
1 1 1
P
hy 0
6
0 0 0 1
2 3
1 .
1 (7.24b)
1 1 1
1
Factorul de normalizare 1/6 este neimportant, fiind uzual omis, mai ales
dacă se foloseşte aritmetica numerelor întregi, caz în care diviziunea
produce prin trunchiere o eroare neneglijabilă.
1 0 1 1
1 1 1
S
hx
8
2 0 2
2
1 0
1 2 ,
4
1 0
1 1
(7.25a)
1 2 1 1
1 1 1
S
hy 0
8
0 0 0 1
2 4
2 .
1 (7.25b)
1 2 1 1
prag, gp
gx c 1 c
fhx |g|
f dectecto
gy r
fhy
Modulul 7
Segmentarea imaginilor
| g ( x , y )| | g x ( x , y )|| g y ( x , y )| . (7.26)
1, pentru | g ( x , y )| g p
cx, y . (7.27)
0, în rest
Modulul 7
Segmentarea imaginilor
( x, y ) [ f ( x, y ) m ( x
( j , k )D
j , y k )] 2
( j , k )D
[ f ( x, y )]2 [ m( x
( j , k )D
j , y k )]2 (7.28)
2 f ( x, y ) m ( x
( j , k )D
j , y k ).
Fig. 7.6. Opt măşti ale gradienţilor busolă. În ordine, de la stânga spre
dreapta, orientările: N, NV, V, SV, S, SE, E, NE.
g k ( x , y ) f ( x , y ) h( x , y ),
g ( x , y ) max{ g k ( x , y )}. (7.28)
k
1 1 1 3 3 3
R
h 1 2 1, K
h 3 0 3. (7.29)
1 1 1 5 5 5
1
hL 1 4 1. (7.31)
1
1 x2 y2
G( x, y) exp{ }. (7.32)
2 2 2 2
f n ( x , y ) f ( x , y ) G ( x , y ) . (7.33)
2 f n ( x, y) 2 f n ( x, y)
g( x, y) f n ( x, y)
2
. (7.34)
2 x 2 x
g ( x , y ) f ( x , y ) 2 G ( x , y ) .
(7.35)
1 x2 y2 x2 y2
G( x, y)
2
( 1) exp{ }. (7.36)
2 2 2 2 2
G(r)
r2
h2 (r ) c exp{ 2 } ,
2
(7.39)
iar c este o constantă de normalizare.
În fig. 7.8 este redat rezultatul detecţiei de contur pe baza trecerilor prin
zero ale imaginii prelucrate cu operatorului LoG cu = 1. Având în
vedere sensibilitatea la zgomot relativ mare pentru = 1, imaginea a
fost netezită în prealabil cu un filtru median 33. Totodată, schimbările
de semn sub un anumit prag de amplitudine au fost eliminate. Pentru
comparaţie, este alăturat în drepta rezultatul detecţiei cu operatorul
Sobel. Se observă tendinţa detectorului de muchii bazat de filtrul LoG
de a produce linii de contur închise şi rotunjite. În principiu, această
proprietate constituie un avantaj, dar există şi aplicaţii în care este
nedorită (efectul a fost ireverenţios denumit “tava cu spaghete”).
Subţierea contururilor
Pragul de decizie are o valoare critică la detecţia muchiilor prin
metode de tip gradient. Stabilirea automată a pragului “optim” este o
problemă căreia i-au fost dedicate studii numeroase şi se va discuta
ulterior, într-un context mai general. Pentru moment, constatăm din
exemplele precedente faptul că o valoare unică poate fi prea mare
pentru unele muchii şi prea mică pentru altele. Indiferent de modul de
alegere a pragului, muchiile obţinute pe baza unui detector cu schema
bloc din Fig. 7.4 sunt îngroşate pe unele porţiuni şi întrerupte pe altele.
Tehnici de relaxare
Tehnicile de relaxare [Rosenfeld 1976], [Hancock 1990],
[Sonka, 1995] pornesc de la o detecţie iniţială cu un prag mediu.
Valorile ce caracterizează tăria muchiei (modulul gradientului) se
interpretează ca măsuri ale probabilităţii ca un punct să aparţină unei
muchii. Probabilităţile se ajustează succesiv la fiecare pas al
algoritmului de relaxare în funcţie de context, după anumite reguli.
Apoi se face o nouă detecţie de prag şi se continuă din nou cu ajustarea.
Prin fiecare pas, muchiile cu context slab tind să scadă cu probabilitatea
sub pragul de detecţie în timp ce muchiile cu context puternic tind să
treacă de pragul de detecţie. Contextul se modifică cu fiecare pas,
sistemul evoluând spre starea finală. Convergenţa algoritmului spre o
soluţie optimă nu este garantată, fiind semnalate situaţii în care
depăşirea unui număr de iteraţii poate conduce la soluţie mai puţin
performantă.
Discriminarea cu prag reprezintă una din cele mai larg utilizate metode
de segmentare a imaginilor, datorită simplităţii, ce facilitează şi
implementarea în timp real.
1, pentru f x , y T
g x,y . (7.40)
0, în rest
T1 T2
Modulul 7
Segmentarea imaginilor
Histogramă imagine
p(z)
min
Distribuţie obiect Distribuţie fundal
Po po(z) Pf pf(z)
z
Topti T
m
p( z ) Po po ( z ) Pf p f ( z ) . (7.41)
Pe ( T ) Po
po ( z )dz Pf p f ( z )dz .
T
(7.42)
Po po (T ) Pf p f (T ) 0 , (7.44)
sau, echivalent,
Po po ( T ) Pf p f ( T ) . (7.45)
Po (T o ) 2 Pf (T f ) 2
exp{ } exp{ }.
2 o 2 2o 2 f 2 2f
f o 2 Po
T ln (7.46)
2 f o Pf
Po po(z)
Pf pf(z)
z
T1 T2
K 1
kh( k )
k 0
To K 1 .
h( k )
k 0
Alternativ, pragul iniţial se poate alege la jumătatea intervalului dintre
nivelul minim şi maxim prezent în imagine.
T0 1 K 1
kh( k ) kh( k )
k=T0
k= 0
1 T0 1 , 2 K 1 .
h( k ) h( k )
k=T0
k= 0
pixeli selectaţi
TL
TL
1 1 3
1
2 2
5
2 4
3
6
a) b) c)
Fig. 7.15. Segmentare multispectrală cu prag: a) banda 1, b) banda 2,
c) segmentare multispectrală
H ( Ri ) TRUE , i
(7.47)
H ( Ri R j ) FALSE , i j , Ri adiacent cu R j
(7.48)
Problema 7.1