Documente Academic
Documente Profesional
Documente Cultură
Extragerea contururilor
Contururile (muchiile) sunt frontierele obiectelor din imgine si sunt determinate de adiacenta
regiunilor uniforme; pixelii de tip contur sunt deci caracterizati de schimbari importante ale nivelelor de gri (luminanta sau proprietatea zica preluata de senzorul de magine). Schimbarea valorilor imaginii este evaluata prin doua marimi: diferenta de valori
si marimea suportului spatial pe care are loc tranzitia. Astfel, ceea ce este important
pentru caracterizarea contururilor este rata de variatie a nivelelor de gri, deci derivata
functiei imagine.
Pentru o imagine modelata printr-o functie continua, pe directia tranzitiei, derivata va
maxima. Tehnica esentiala de extragere a contururilor este bazata deci pe calculul
gradientului imaginii f (x, y) de-a lungul versorului r, orientat pe directia :
f (x, y)
f (x, y) x f (x, y) y
=
+
= fx (x, y) cos + fy (x, y) sin
r
x r
y r
(1.1)
Dupa cum se observa, calculul gradientului dupa directia r oarecare se poate reduce
la calculul derivatelor pe orizontala fx (x, y) si verticala fy (x, y) ale imaginii n punctul
(x,y)
este obtinuta pentru o anumita
curent (x, y). Valoarea maxima a gradientului f r
orientare 0 , ce se poate obtine prin
f (x, y)
=0
(1.2)
r
Rezolvarea ecuatiei () conduce imediat la fx cos + fy sin = 0, si deci la determinarea
directiei de variatie maxima a functiei imagine:
0 (x, y) = arctan
1
fx (x, y)
fy (x, y)
(1.3)
1.1
(1.4)
Operatori de gradient
Extragerea punctelor de contur este atunci imediata: este sucient de a calcula pentru
ecare punct al imaginii valoarea maxima a gradientului, ce va apoi comparata cu un
prag xat. Daca valoarea maxima a gradientului dintr-un punct este sucient de importanta si depaseste valoarea pragului, atunci punctul corespunzator este declarat punct
de contur. Toate metodele bazate pe estimarea gradientului se ncadreaza n aceasta
schema. Ceea ce va diferentia metodele va modalitatea n care este calculata variatia
maxima a valorilor imaginii (nivelelor de gri) ntr-un punct.
Pentru determinarea variatiei maxime a imaginii este deci necesara determinarea derivatelor
pe directiile orizontala si verticala. Realizarea derivatelor partiale dupa aceste directii implica trecerea n discret a derivatelor fx (x, y) si fy (x, y) (incluzand si modicarea notatiilor
coordonatelor, m ind versiunea discreta a lui x si n ind versiunea discreta a lui y):
fx (x, y) =
f (m, n)
f (x, y)
=
x
m
fy (x, y) =
f (m, n)
f (x, y)
=
y
n
(1.5)
(1.6)
(1.7)
Toate expresiile date de (1.5), (1.6), (1.7) sunt combinatii liniare ale valorilor unor pixeli
din imagine, situati n vecinatatea pixelului curent din pozitia (m, n). Deci toate aceste
operatii se pot realiza prin ltrari liniare cu masti potrivite: (1.8) pentru (1.5), (1.9)
pentru (1.6), (1.10) pentru (1.7).
1
Wx = 1 1 , Wy =
(1.8)
1
2
1
Wx = 1 -1 , Wy =
-1
1
Wx = 1 0 1 , Wy = 0
1
(1.9)
(1.10)
Fig. 1.1: Schema bloc a extractorului de contururi bazat pe metoda de calcul a gradientului prin doua derivate dupa directii ortogonale.
Se observa, deci, existenta a trei rezultate de interes: harta de orientari 0 (m, n) care
este o imagine ce contine, pentru ecare pixel, orientarea gradientului de modul maxim
n punctul respectiv, si este n general folosita la prelucrarea suplimentara a contururilor
(conectare de contururi, extragere directionala de contururi), harta de intensitati de
tranzitie, g(m, n) care este o imagine ce contine, pentru ecare pixel, valoarea maxima a
gradientului pentru pozitia respectiva si harta de contururi e(m, n) care este o imagine
3
1.2
Unul dintre dezavantajele principale legate de folosirea acestor masti derivative simple (ce
implementeaza direct operatia de derivare directionala discreta) este marea sensibilitate
la zgomot. In urma derivarii, un zgomot alb, aditiv este amplicat de doua ori. Compensarea evidenta este de a realiza o operatie de reducere a zgomotului naintea derivarii,
urmarind simultan pastrarea prolurilor abrupte de tranzitie (si deci introducerea unor
efecte minime de ncetosare). Pentru ca prolul tranzitiei pe directia r sa nu e afectat,
ltrarea de netezire va trebui deci aplicata pe directia perpendiculara. Atunci, derivarea
orizontala va trebui precedata de o ltrare de netezire cu o masca verticala, iar derivarea
verticala va trebui precedata de o ltrare de netezire cu o masca orizontala. Operatiile de
ltrare liniara ind realizate prin convolutii, sunt asociative, si deci este posibila determinarea unei masti unice de ltrare, care sa grupeze efectele de netezire si derivare dupa
cele doua directii perpendiculare. Considerand o netezire de tip mediere ponderata cu
coecientul c R+ si operatii de derivare descrise de mastile din (1.10), obtinem mastile
echivamente de ltrare:
1
0
1
1
Wx = c 1 0 1 = c 0 c
1 0 1
1
1
1
1
1
0
0
1 c 1 0 = 0
Wy =
1
1 1 1
Prin particularizari convenabile ale coecientului de ponderare c folosit la ltrarea de
netezire se pot obtine diferite
familii clasice de operatori de derivare cu netezire: Prewitt
(c = 1, 1.12), Izotrop (c = 2, 1.13), Sobel (c = 2, 1.14) [?]. Se remarca faptul ca
constanta de ponderare globala a mastii de ltare este neesentiala, ntrucat conditia de
normare ce trebuie ndeplinita este cea pentru ltre de contrastare (derivare) (??): suma
coecientilor mastii sa e nula.
1 0 1
1
1
1
0
0
Wx = 1 0 1 , Wy = 0
(1.12)
1 0 1
1 1 1
4
0 1
1
Wx = 2 0 2 , Wy = 0
1
0 1
1
1 0 1
1
2 0 2 , Wy =
0
Wx =
1 0 1
1
1
0 0
2 1
2
1
0
0
2 1
2
(1.13)
(1.14)
Wx =
1.3
0
1
1
1
0
1
2
3
2
1
0
0
0
0
0
1
2
3
2
1
0
1
1
1
0
, Wy =
0
1
0
1
0
1
2
0
2
1
1
3
0
3
1
1
2
0
2
1
0
1
0
1
0
(1.15)
Operatori compas
Informatia de orientare este n general folosita n etape urmatoare ale prelucrarii; unghiurile determinate dupa (??) ofera un unghi exact al directiei conturului n punctul
curent, calculat cu un efort semnicativ de calcul (mpartire si calcul de arctangenta). In
practica, aceasta informatie este prea exacta: pe grila patrata de esantionare nu se pot
reprezenta cu usurinta drepte continue dupa orice directie; cateva directii sunt favorizate
si usor de utilizat (vertical, orizontal, cele doua diagonale). In acest caz se poate masura n
ecare modulul gradientului dupa aceste cateva directii importante, si apoi se poate alege
directia dupa care acest modul este maxim. Acesta este principul operatorilor compas.
Operatorii compas calculeaza mai multe derivate directionale, dupa un set de N directii
(N > 2). Gradientul maxim al functiei imagine n punctul respectiv este determinat ca
maximul valorilor derivatelor directionale, iar pentru decizia ulterioara se selecteaza doar
informatia corespunzatoare directiei pe care derivata a fost maxima. Daca N = 2 si cele
doua directii sunt ortogonale, schema de prelucrare obtinuta este similara cu cea a unui
extractor de contururi bazat pe gradient n care estimarea gradientului maxim se face
printr-o metrica de tip L (max). Schema bloc generala a unui operator compas este
prezentata n gura 1.2; ecare dintre mastile Wk realizeaza calculul unei derivate, pe
directia k .
5
Fig. 1.2: Schema bloc a extractorului de contururi bazat pe metoda de calcul a gradientului prin derivate dupa 8 directii.
Operatorul compas uzual are N = 8 masti de ltrare, ecare dintre ele realizand o
derivare dupa o directie multiplu de /4; sunt astfel acoperite directiile principale (vertical, orizontal, cele doua diagonale), n cele doua sensuri. Cele N masti folosite sunt
derivate de la o unica masca de baza, implemenand de obicei o derivare orizontala, prin
rotiri succesive ale acesteia cu unghiuri corespunzand diferentelor de directie a derivatelor
folosite. Pentru operatorul compas uzual cu N = 8, mastile de derivare folosite sunt 3 x
3, si mastile corespunzatoare directiilor succesive diera printr-o rotatie de /4. Aceasta
rotatie de /4 este nsa echivalenta cu o deplasare circulara a valorilor de pe marginea
mastii:
a b c
b c d
W0 = h * d ; W/4 = a * e
(1.16)
g f e
h g f
Masca initiala ce corespunde directiei orizontale poate oricare dintre mastile de derivare
cu netezire pe orizontala Wx prezentate, ca de exemplu Prewitt (1.12) sau Sobel (1.14).
Suplimentar,
au fost introduse
masti speciale, asa ca mastile Kirsch, caracterizate de
5 3 3
3 ; cele 8 masti folosite de operatorul compas Kirsch (indexate
Wx = 5 0
5 3 3
dupa numele orientarilor punctelor cardinale corespunzatoare) sunt deci:
5 3 3
3
3 , WN E =
5 0
5
=
5 3 3
5
3 3 5
3
5 , WSV = 3
= 3 0
3 3 5
3
WE
WV
3 3
3
0
3 , WN =
3
5
3
5
5
5
5
0
5 , WS = 3
3 3
3
6
3 3
3
0
3 , WN V =
3
5
5
3
5
5
5
0
3 , WSE = 5
3 3
3
3
0
5
5
5
5
3
0
3
3 3
Se poate remarca cu usurinta ca exista o legatura ntre precizia unghiulara a operatorului compas (deci diferenta dintre directiile alaturate dupa care se calculeaza derivatele
directionale) si dimensiunea mastilor de ltrare folosite; pentru o masca patrata de dimensiune D x D, precizia unghiulara este de /2(D 1) si numarul de masti utilizate de
operatorul compas este de N = 4(D 1).
1.4
W0
=
10
W/2
=
10
0
0
0.5
0
0
0
0
0
0
0
0
1
1
1
0
0
1
1
1
0
0
1
1
1
0
0
1
1
1
0
0.5
1
1
1
0.5
0
1
1
1
0
0
0
0
0
1
0
0.5 , W/4 =
10
0.5
0
0
0.5
0
0.5
0
0.5
1
0 , W3/4 =
0
10
0
0
0
0
0
0
1
1
0.5
0.5
1
1
0
0
0
1
1
1
0
0
1
1
1
0
0.5
1
1
0
0
0
0
1
1
0.5
0.5
0.5
0
0
0
0
0
0
0.5
0.5
W0
0
0
2
0
0
0
1
2
1
0
0
0
0
0
0
0
1
2
1
0
0
0
2
0
0
, W/8 =
0
0
0
2
0.5
0
0
1
2
0
0
1
0
1
0
0
2
1
0
0
0.5
2
0.5
0
0
W/4
0
0
0
0.5
2
0
0
1
2
0.5
0
1
0
1
0
0.5
2
1
0
0
2
0.5
0
0
0
, W3/8 =
0
0
0
0
0.5
0
0
1
2
2
0.5
1
0
1
0.5
2
2
1
0
0
0.5
0
0
0
0
1
1
1
P1 P2 P3
P4 P5 P6 , 2 2 2
(1.17)
P7 P8 P9
1
1
1
1.5
Principalul mod de determinare a punctelor izolate este bazat pe comparatie dintre valoarea punctului testat si nivelul de gri mediu din vecinatatea acestuia; daca aceasta
diferenta este importanta, punctul testat difera n mod semnicativ de vecinii sai, si este
n consecinta cel pun un punct izolat. O masca simpla de determinare a diferentei ntre
valoare punctului curebt si media aritmetica a vecinilor sai este
1 1 1
1
(1.18)
W = 1 8
1 1 1
1.6
Detectia combinat
a
In cele mai multe cazuri, prelucrarea este realizata n vecinatati de dimensiune redusa
(tipic 3 x 3) a pixelilor; deci ecarui pixel prelucrat i se asociza un vector de caracteristici
(cu 9 componente, daca se foloseste o vecinatate 3 x 3), ce sunt chiar nivelele de gri ale
pixelilor selecteti de fereastra de prelucrare. Astfel, ecare pixel devine reprezentat de un
8
P1 P2 P3
(P1 , P2 , P3 , P4 , P5 , P6 , P7 , P8 , P9 ) P4 P5 P6
P7 P8 P9
(1.19)
O astfel de baza a fost propusa de Frei si Chen si grupeaza 4 vectori (w1 w4 ) ce corespund unei familii de operatori compas construite pe baza mastilor de gradient izotrop,
4 vectori (w5 w8 ) cecorespund unor operatori de tip Laplacian (derivate secunde) si
un vector cecorespunde
aritmetice.
Mastile
echivalente
unei medieri
sunt
acestor vectori
1 0 1
1
0
1 2
2
1
0 0 , w2 = 2 0 2 , w3 = 1 0
1 ,
deci: w1 = 0
1
0 1
1 2 1
2 1
0
2 1 0
0
1 0
1 0 1
0
1
0 0 , w7 =
1
1 0 1 , w6 =
0
w4 =
, w5 =
0
1 0
1
0 1
2
0
1
2 1 2
1 1 1
1
2 1
2 4
2 , w8 =
4 1
1
1 1 1 . Fiecare dintre cele trei
, w9 =
1
2 1
2 1 2
1 1 1
grupuri mentionate de vectori va deni un subspatiu: subspatiul muchiilor, subspatiul
liniilor si subspatiul punctelor.
Pentru un pixel oarecare din imagine vectorul sau de caracteristici (vecinatatea sa 3 x 3
exprimata ca un vector linie, conform (1.19), este proiectat pe cele trei subspatii; marimea
acestor proiectii si unghiurile pe care acestea le fac cu vectorul original sunt date de:
pmuchii
plinii
ppuncte
4
2
pmuchii
wi p , muchii = arccos
=
p2
i=1
8
2
plinii
=
wi p , muchii = arccos
p2
i=5
ppuncte
= w9 , p , puncte = arccos
p2
In functie de unghiurile si proiectiile astfel calculate, pentru ecare pixel, se decide care
este subspatiul cel mai apropiat, si deci natura respectivului pixel. Pixelii de contur sunt
selectati din subspatiile muchiilor si liniilor.
9
1.7
Operatori Laplacieni
Extragerea punctelor de contur pe baza primei derivate (si deci a gradientului, indiferent
de modul de estimare a acestuia) este potrivita n cazul tranzitiilor relativ abrupte a
nivelelor de gri, si deci pentru frontiere bine conturate. Cu cat regiunea de tranzitie
devine mai larga (si deci panta proluli de tranzitie mai mica) centrul acestei tranzitii,
detectat prin maximul gradientului, devine mai greu de determinat cu precizie. Astfel,
contururile detectate vor formate din mai multi pixeli, nu neaparat situati pe centrul
regiunii de tranzitie. Gasirea centrului tranzitiei va putea atunci realizata prin folosirea
derivatelor de ordinul doi, grupate n operatorul Laplacian:
2 f =
2 f (x, y) 2 f (x, y)
+
x2
y 2
(1.20)
1
2 1
Principalele masti utilizate pentru calculul Laplacianului sunt w7 = 2 4
2 ,
1
2 1
0
1 0
1 1 1
1 , W = 1 4
1 .
W = 1 8
1 1 1
0
1 0
Desigur, sensibilitatea la zgomot a Laplacianului este mai mare decat a operatorilor de
gradient, ceea ce a dus la introducerea unor operatori de derivata secunda, combinati
cu netezire. Unul dintre acesti operatori este LOG, Laplacian de Gaussiana; coecientii
nucleului de ltrare sunt dati de
2
k 2 + l2
k + l2
h(k, l) = K 2
exp
(1.21)
2
2 2
Scalarul K este determinat din conditia de normalizare a coecientilor mastii de ltrare
liniara. O varianta separabila a acestui operator (deci care combina ltrari numai pe linii
si numai pe coloane) a fost propusa de Huertas si Medioni [?]:
LOG(g) = g1 (x)g2 (y) + g2 (x)g1 (y)
10
(1.22)
2
2
2
(1.23)
Forma separabila a operatorului LOG pune n evidenta n mod clar operatiile de derivata
secunda unidirectionala a unei Gaussiene (g1 ) si de netezire pe directia ortogonala derivarii, dupa un nucleu Gaussian (g2 ). Avantajul formei separabile este posibilitatea
implementarii cu un numar redus de operatii.
Derivata secunda unidimensionala a nucleului Gaussian poate pusa si sub forma unei
diferente de Gaussiene cu dispersii diferite:
2 G (x)
= G (x) G+d (x)
x2
1.8
(1.24)
Operatiile mofologice de baza, extinse pentru imagini cu nivele de gri, pot utilizate
pentru a construi harti de intensitate de tranzitie, care sa masoare gradul n care valoare
ecarui pixel difera de cea a vecinilor sai. Cele mai simple extractoare morfologice de
contur sunt conturul exterior (diferenta dintre dilatare si imaginea originala) si conturul
interior (diferenta dintre imaginea originala si erodarea sa):
f = f g f ; f = f f g
(1.25)
Gradientul morfologic este diferenta dintre imaginea dilatata si, respectiv erodata, cu
acelasi element structurant (si deci este suma contururilor interior si exterior):
gradf = f g f g = f + f
(1.26)
(1.28)
(1.29)
sau
min (f f gA , f f gB , max (|f gC1 f gC2 | , |f gC3 f gC4 |))
(1.30)
unde suporturile elementelor structuante folosite sunt A = {(0, 1) , (0, 1) , (1, 0) , (1, 0)},
B = {(1, 1) , (1, 1) , (1, 1) , (1, 1)}, C1 = {(0, 1) , (1, 0)}, C2 = {(0, 1) , (1, 0)},
C3 = {(0, 1) , (1, 0)}, C4 = {(0, 1) , (1, 0)}.
1.9
1.9.1
Pentru orice set de n puncte diferite ntre ele, {x0 , ..., xn1 }, se poate determina un
polinom unic de grad n1 care sa aiba punctele date ca solutii, P (xi ) = 0, i = 0, ..., n1.
Pentru aceleasi n puncte se poate determina o familie de n polinoame de grad cel mult
n 1, ortogonale doua cate doua n raport cu setul de puncte {xi }, caracterizate de:
n1
(1.31)
i=0
Polinoamele familie astfel denite sunt deci Pnu , polinomul de grad u din familia celor n
polinoame, si formeaza o baza n spatiul polinoamelor de grad cel mult n 1, denita
n raport cu multimea de puncte {xi }. Orice polinom de grad cel mult n 1 va putea
deci aproximat printr-o combinatie liniara de polinoame Pnu
P(x) =
n1
ak Pnk (x)
(1.32)
k=0
k=0
12
2
2
= 2
P (xi )Pnk (xi ) + 2ak
Pnk
(xi ) = 0
ak
i=0
i=0
(1.34)
n1
P (xi )Pnk (xi )
ak = i=0
n1 2
i=0 Pnk (xi )
(1.35)
n1
n1
Daca multimea punctelor de denitie este simetrica (xk {xi } xk {xi }) se pot
obtine de exemplu polinoamele Cebsev: n = 3, {xi } = {1, 0, 1}, cu
P30 (x) = 1; P31 (x) = x; P32 (x) = x2
2
3
(1.36)
1.9.2
x4 + 210x2 144
160
17
x
5
(1.37)
Aproximare polinomial
a bidimensional
a
N
1 N
1
(1.39)
n=0 m=0
H(u, v) = M
(1.41)
se pot
1 1 1
1 1 1
0
0 , H20 =
deduce coecientii sunt: H00 = 19 1 1 1 , H10 = 16 0
1 1 1
1
1 1
1
1 1
1 2 1
1 2
1
1
2 1
1
0
0 , H22 = 14 2 1
2 ,
2 -2 2 , H02 = 16 1 -2 1 , H12 = 14 0
6
1
1 1
1 2 1
1
2 1
1
2 1
1 0 1
1
0 1
1 0 1
1
1
1
0 0
0 2 .
1 0 1 , H11 = 4
0
2
, H21 = 4
H01 = 6
1 0 1
1 0 1
1 0 1
Folosind expresia aproximativa a functiei imagine, data de (1.39), derivatele dupa directiile
axelor de coordonate se pot calcula ca:
N 1 N 1
N 1 N 1
PN 2 ,nm (x, y) f(x, y)
PN 2 ,nm (x, y)
f(x, y)
=
;
=
anm
anm
x
x
y
y
n=0 m=0
n=0 m=0
(1.42)
In centrul mastii (deci n punctul curent n care se face analiza), derivatele sunt date de
f(x,y)
si f (x,y) (0,0) .
(0,0)
x
P 2
(x,y)
(0,0) = 0, cu
Daca se folosesc polinoamele determinate anterior, se constata ca N ,nm
x
P9,10 (x,y)
P9,12 (x,y)
2
si
ia verticala
exceptia
(0,0) = 1
(0,0) = 3 . Atunci, derivata pe direct
x
x
f(x,y)
a a mastii de ltrare
este
(0,0) = a10 + a12 , ceea ce este echivalent cu aplicarea direct
x
14
0 1 0
0 . In mod analog, masca de ltrare pe directia orizontala
H10 23 H12 = 12 0 0
0 1
0
0
0 0
este 12 1 0 1 .
0
0 0
1.10
(1.43)
1
(f11 + f01 + f11 f11 f01 f11 )
6
(1.44)
1
(f11 + f11 + f10 f11 f10 f11 )
6
(1.45)
1 0 1
si deci pot implementate prin mastile de ltrare liniara W = 16 1 0 1 , W =
1 0 1
1 1 1
1
0
0
0 (deci mastile Prewitt).
6
1
1
1
1.11
unde z0 este valoarea imaginii n punctul curent n jurul caruia se face aproximarea, deci
z0 = f (m, n). Aproximarea se face ntr-o vecinatate V a punctului de coordonate (m, n),
formata din punctele {(m + k, n + l)|(k, l) V }, iar coecientii A E sunt determinati
prin minimizarea erorii patratice :
(f (m + k, n + l) z(m + k, n + l))2
(1.47)
=
(k,l)V
Minimizarea erorii patratice revine la a calcula derivatele partiale ale expresiei acesteia
dupa cei cinci parametri ai suprafetei z si de a anula aceste derivate. Solutiile ecuatiilor
astfel formate sunt valorile optime ale parametrilor. Vom adopta notatia simplicatoare
f (m + k, n + l) = fkl (si deci, de exemplu, f (m + 1, n 1) = f11 ). Atunci expresia erorii
patratice devine:
=
(fkl z(m + k, n + l))2
(1.48)
(k,l)V
Cea mai simpla vecinatate este, desigur, vecinatatea extinsa de ordinul unu, deci V8 (determinata de o masca patrata 3 x3, centrata). Atunci V = {(1, 1), (1, 0), (1, 1), (0, 1), (0, 0), (0, 1), (1,
si expresia erorii devine:
= (f11 f00 A B C D E)2 + (f01 f00 B D)2 +
(1.49)
2
2
+ (f11 f00 A B + C D + E) + (f10 f00 A + C) +
+ (f11 f00 A B + C + D E)2 + (f01 f00 B + D)2 +
+ (f11 f00 A B C + D + E)2 + (f10 f00 A C)2
Derivatele partiale dupa parametrii suprafetei cuadrice sunt atunci:
1
(f11 + f11 f11 f11 )
4
16
(1.50)
(1.51)
(1.52)
(1.53)
(1.54)
(1.55)
1
(f11 + f01 + f11 f11 f01 f11 )
6
1
C = (f11 + f11 + f10 f11 f10 f11 )
6
D=
1
(f11 + 2f10 f11 f11 + 2f10 f11 3f01 3f01 + 6f00 )
10
1
(f11 + 3f10 + f11 + f11 + 3f10 + f11 2f01 2f01 6f00 )
A=
10
B=
(1.56)
(1.57)
(1.58)
(1.59)
Expresiile obtinute sunt liniare n valorile imaginii selectate de vecinatate, deci pot
obtinute prin ltrarea liniara a imaginii, folosind
masti de ltrare
care sa
corspunda expre
1
3
1
1 2 1
1
1
2 6 2 , WB = 10
3 6 3 ,
siilor deduse. Aceste masti sunt: WA = 10
1
3
1
1 2 1
1 0 1
1 1 1
1
0 1
0
0 , WE = 14 0
0 0 .
WC = 16 1 0 1 , WD = 16 0
1 0 1
1
1
1
1 0 1
Ecuatia planului tangent suprafetei determinate n punctul de coordonate (m, n) (deci n
punctul curent de calcul) este data de:
z = z0 +
z(x, y)
z(x, y)
(m,n)) (x m) +
(m,n)) (y n)
x
y
(1.60)
deci
z = f00 + C(x m) + D(y n)
(1.61)
1 c 1
0
0 .
WD = k1 0
1
c
1
1.12
1 0 1
= k1 c 0 c ,
1 0 1
Abordarea topografic
a (cea mai potrivit
a cubic
a)
(1.62)
(1.63)
(1.64)
cu
2 f (, )
= 6A + 2B
2
18
2 f (, )
|=0 = 0
2
(1.65)
k5
1
arctan
2
k6 k4
(1.66)
(,)
Pozitia 0 a tranzitiei se poate apoi determina din f
|=0 = 0 si conditia suplimentara ca < 0.5 (semnicand faptul ca tranzitia trebuie sa e apropiata de centrul
ferestrei de analiza curente).
1.13
Modelul H
uckel
Acest model impune o forma liniara a dreptei de separatie ntre cele doua regiuni cuprinse
n fereastra curenta de analiza. Valorile nivelului de gri n cele doua regiuni este constant,
iar diferenta de nivel de gri este i; separatia dintre regiuni (muchia) este nclinata pe
directia fata de orizontala si este situata la distanta d fata de centrul ferestrei de analiza
(gura 1.3). Fereastra de analiza folosita este patrata, de dimensiune relativ mare (2N
x 2N, cu N = 4 6) si este deplasata peste imagine din N n N pixeli, pe verticala si
orizontala, ceea ce duce la suprapunerea de 50% a ferestrelor de analiza vecine.
Prin folosirea unei ferestre mari de analiza, tranzitiile abrupte nu sunt ngrosate n harta
de contururi, iar prin determinarea variatiei muchiei n raport cu centrul ferestrei, la
translatia acesteia ntre pozitii succesive, muchiile sunt n general detectate n pozitia
corecta. Rezulattul operatorului nu este deci doar o unica valoare, reprezentand intensitatea maxima a tranzitiei locale (ca n cazul mastilor locale de gradient), ci un ntreg
segment de dreapta, caracterizat de nclinare si pozitia n fereastra. Segmentul de dreapta
astfel determinat contribuie la harta de intensitati de tranzitie cu diferenta caracteristica
de nivele de gri, i.
In modelul initial, detectia muchiei este redusa la o problema de optimizare, rezolvata
aproximativ n coordonate spatiale continue. Daca se considera originea locala a sistemului de coordonate n centrul ferestrei de analiza, muchia ideala este descrisa de modelul:
sx + ty = r
s2 + t2 = 1
19
(1.67)
i, sx + ty r
i + i, sx + ty > r
(1.68)
Problema de optimizare consta n minimizarea erorii patratice de aproximare a imaginii reale f prin modelul impus de prolul tranzitiei, f (cu un set xat de parametri
r, s, t, i, i) pentru domeniul spatial ce corespunde ferestrei curente W .
2
y, r, s, t, i, i) dxdy
(r, s, t, i, i) =
f (x, y) f(x,
2
(1.69)
(1.70)
k=0
unde
Fk =
y, r, s, t, i, i)dxdy
hk (x, y)f(x,
H
uckel a folosit o serie limitata de opt functii de baza, denite n ferestre circulare, pentru
care modelul muchiei aproximeaza doar componentele de joasa frecventa ale imaginii
f (x, y) si care permit calculul parametrilor modelului cu un cost de calcul rezonabil (gura
??). Complexitatea de calcul poate redusa folosind exprimarea functiilor de baza si
transformarea Fourier n coordonate polare. Chiar si asa, metoda nu este sucient de
directa sau intuitiva.
1.13.1
Metoda Mero si Vassy [?] permite identicarea rapida a unei frontiere liniare ce corespunde unui model H
uckel, prin determinarea parametrilor de nclinare si de distanta d
fata de centrul ferestrei de analiza. Parametrul de nclinare al dreptei poate determinat
prin utilizarea rezultatelor aplicarii mastilor h1 si h2 din gura 1.4 si combinarea acestora
prin
tan 1
f h1
=
(1.71)
tan + 1
f h2
Fig. 1.4: Mastile de prelucrare folosite la determinarea orientarii muchiei din fereastra.
21
j=q+1
unde q este numarul de pixeli din imagine aati deasupra muchiei (si deci restul de N 2 q
pixeli sunt situati sub muchie). Daca valorile imaginii din fereastra de analiza curente sunt
normalizate (prin scaderea mediei valorilor f (m, n)), atunci suma valorilor din fereastra
2
este nula ( N
j=1 fnorm (j) = 0), ceea ce conduce la
q
fnorm (j) =
j=1
N
fnorm (j)
(1.73)
j=q+1
q
fnorm (j)
(1.74)
j=1
Asadar, corelatia ce trebuie maximizata este exprimata ca suma valorilor normalizate ale
pixelilor din fereastra de analiza situati deasupra muchiei cautate. Daca muchia model
este translatata de-a lungul ferestrei de analiza, pastrandu-si directia, aceasta va ntalni
pe rand toti pixelii din fereastra de analiza, ntr-o ordine determinata de distanta acestora
fata de muchia modelului (dreapta nclinata la unghiul fata de orizontala) situata n
coltul din stanga sus al ferestrei de analiza. Pentru un pixel, a carui coordonate locale
sunt (m, n), aceasta distanta este
(m + (n 1) tan )2
d (m, n) =
1 + tan2
2
22
(1.75)
Cum numitorul expresiei este constant pentru un unghi dat, ordinea de parcurgere a
punctelor va data doar de (m + (n 1) tan )2 .
Odata ce este determinat maximul corelatiei (q) (1.74), din coordonatele pixelului pentru
care acest maxim este atins (si prin care trece muchia modelului) se poate calcula cu
usurinta distanta pana la centrul ferestrei de analiza. In acest fel sunt parametrii muchiei;
parametrii i si i + i pot determinati apoi ca nivelul de gri mediu al pixelilor situati
de o parte si de alta a muchiei.
1.14
Problema detectiei contururilor prin ltrare liniara se poate exprima ca proiectarea unui
ltru a carui raspuns sa marcheze cu maxime bine denite pozitiile tranzitiilor din semnalul de intrare. Cazul de plecare este considerarea unor semnale mono-dimensionale
(semnale de timp uzuale), n care contururile sunt modelate cu prin trepte de amplitudine, degradate cu zgomot Gaussian aditiv. Filtrul dedus trebuie sa e optimal, n
sensul de a oferi cea mai buna performanta medie, pentru orice pozitie si intensitate a
tranzitiei si orice putere a zgomotului suprapus acesteia. Performanta de detectie a contururilor este masurata printr-o serie de caracteristici, precum detectia si localizarea buna
a tranzitiei, precum si minimizarea probabilitatii de detectie falsa prin maxime datorate
exclusiv prezentei zgomotului.
Asadar, e semnalul de intrare f (x), compus dintr-o treapta ideala u(x) de amplitudine
U0 si un zgomot aditiv, gaussian, de medie nula si putere N02 , n(x):
f (x) = U0 u(x) + n(x)
(1.76)
Daca ltrul cautat are functia de pondere h(x), iesirea ltrului este data de
f (t)h(x t)dt
(1.77)
Cum tranzitia apare pentru x = 0, h(x) trebuie determinat astfel ncat g(0) sa e maxim
si sa respecte constrangerile enuntate (buna detectie, buna localizare, evitare a maximelor
multiple).
23
1.14.1
Proprietatea de bun
a detectie
Detectia este exprimata prin raportul semnal zgomot denit de raportul dintre r
aspunsul
maxim determinat doar de semnalul util si radicalul puterii zgomotului prezent la iesirea
ltrului:
U0 h(x t)dt
U0 h(x t)dt
0
=
RSZ = 0
(1.78)
2
N0
|h(t)|2 dt
E n(t)h(x t)dt
Pentru obtinerea ultimei expresii am folosit teorema Parseval (echivalenta dintre puterea
unui semnal calculata din spectrul de frecventa si din domeniul temporal) si proprietatile
legate de trecerea semnalelor aleatoare prin sisteme liniare. Pentru ca raspunsul ltrului
h(x) la un semnl constant sa e nul, se alege o functie de pondere impara, pentru care
0
h(t)dt + h(t)dt = 0 si h(t) = h(t). Daca raportul este calculat pentru pozitia
1.14.2
h(t)dt
=
|h(t)|2 dt
U0
N0
(1.79)
Proprietatea de bun
a localizare
Localizarea este masurata prin inversul variantiei distantei dintre maximul raspunsului
maxim al ltrului si pozitia reala a tranzitiei (si deci 0 pentru modelul folosit). O localizare buna nseamna o varianta mica a acestei distante si deci o valoare mare a inversei
distantei. Daca x0 este pozitia maximului semnalului de la iesirea ltrului, acesta va corspunde anularii primei sale derivate:
g(x)
f (x) h(x) |x=x0 = (f (x) h (x)) |x=x0
|x=x0 =
x
x
g(x)
|x=x0 = U0 (u(x) h (x)) |x=x0 + (n(x) h (x)) |x=x0
x
g(x)
u(x0 t)h (t)dt + (n(x) h (x)) |x=x0
|x=x0 = U0
x
24
g(x)
x
x0
|x=x0
= U0
E x20 =
N02
|h(t)|2 dt
(1.82)
U02 (h (0))2
Cum variabila aleatoare x0 are medie nula (pentru ca presupunem ca estimarea pozitiei
tranzitiei se face ca o estimare nedeplasata printr-o eroare sistematica), atunci media
patratica este egala cu varianta si localizarea (radical din inversul varaiantei) este:
U0
1
|h (0)|
U0
=
(1.83)
=
2
E [x0 ]
N0
N
0
|h(t)|2 dt
h(t)dt
=
2
|h(t)| dt
|h (0)|
(1.84)
2
|h(t)| dt
1.14.3
Pentru a reduce numarul de maxime de la iesirea ltrului (si pentru a nu avea raspunsuri
multiple), va trebui minimizata densitatea trecerilor prin zero a raspunsului ltrului datorate zgomotului. Aceasta densitate, d0 poate calculata printr-un model statistic.
Pentru un proces Gaussian G(x) de medie nula si functie de autocorelatie BG ( ), densitatea trecerilor prin zero este
(0)
1 BG
(1.85)
d0 =
BG (0)
In cazul considerat, raspunsul ltrului la zgomotul aplicat la intrare (G(x) = n(x) h(x))
corespunde unui proces gaussian, atata vreme cat procesul de zgomot n(x) este alb, cu
distributie Gaussiana. Atunci,
BG (0) =
qG ()d = N02
|h(t)|2 dt
(1.86)
|h(t)|2 dt
(1.87)
(1.88)
d0 =
|h (t)|2 dt
Distanta medie dintre doua maxime datorate zgomotului va atunci 1/d0, iar distanta
maxima dintre aceste maxime, xmax = 2/d0.
26
Toate aceste trei conditii sunt deci grupate ntr-o expresie de optimizat. In functie de
tipul de ltru ce se doreste (cu raspuns nit, sau cu raspuns innit), exista doua abordari:
Canny si Deriche.
1.14.4
Abordarea Canny
Filtrul sintetizat de Canny are un raspuns nit la impuls, deci h(x) este o functie de
suport marginit, [M, M]. Conditia de evitare a maximelor multiple datorate zgomotului
cere ca numarul de maxime locale detectate ca raspuns la un unic contur sa e limitat,
si distanta minima dintre maximele succesive sa e o fractiune din M (xmax = km M).
Atunci, ltrul h(x) este dedus prin maximizarea lui () cu constrangerea xmax = km M.
Aceasta revina la a gasi h(x) care minimizeaza functionala
(x, h, h , h ) = h2 + 1 h2 + 2 h2 + 3 h
(1.89)
sau, echivalent,
+
=0
h
x h x2 h
(1.90)
(1.91)
(1.92)
1.14.5
Abordarea Deriche
Deriche a propus sinteza unui ltru cu raspuns innit la impuls (deci cu M ). Solutia
ecuatiei (1.92) este atunci
h(x) = ke|x| sin x
(1.93)
(1.94)