Sunteți pe pagina 1din 27

Capitolul 1

Extragerea contururilor
Contururile (muchiile) sunt frontierele obiectelor din imgine si sunt determinate de adiacenta
regiunilor uniforme; pixelii de tip contur sunt deci caracterizati de schimbari importante ale nivelelor de gri (luminanta sau proprietatea zica preluata de senzorul de magine). Schimbarea valorilor imaginii este evaluata prin doua marimi: diferenta de valori
si marimea suportului spatial pe care are loc tranzitia. Astfel, ceea ce este important
pentru caracterizarea contururilor este rata de variatie a nivelelor de gri, deci derivata
functiei imagine.
Pentru o imagine modelata printr-o functie continua, pe directia tranzitiei, derivata va
maxima. Tehnica esentiala de extragere a contururilor este bazata deci pe calculul
gradientului imaginii f (x, y) de-a lungul versorului r, orientat pe directia :
f (x, y)
f (x, y) x f (x, y) y
=
+
= fx (x, y) cos + fy (x, y) sin
r
x r
y r

(1.1)

Dupa cum se observa, calculul gradientului dupa directia r oarecare se poate reduce
la calculul derivatelor pe orizontala fx (x, y) si verticala fy (x, y) ale imaginii n punctul
(x,y)
este obtinuta pentru o anumita
curent (x, y). Valoarea maxima a gradientului f r
orientare 0 , ce se poate obtine prin


f (x, y)
=0
(1.2)

r
Rezolvarea ecuatiei () conduce imediat la fx cos + fy sin = 0, si deci la determinarea
directiei de variatie maxima a functiei imagine:
0 (x, y) = arctan
1

fx (x, y)
fy (x, y)

(1.3)

Pe directia astfel determinata, modulul gradientului va dat de





f (x, y)
= fx2 (x, y) + fy2 (x, y)
r
max

1.1

(1.4)

Operatori de gradient

Extragerea punctelor de contur este atunci imediata: este sucient de a calcula pentru
ecare punct al imaginii valoarea maxima a gradientului, ce va apoi comparata cu un
prag xat. Daca valoarea maxima a gradientului dintr-un punct este sucient de importanta si depaseste valoarea pragului, atunci punctul corespunzator este declarat punct
de contur. Toate metodele bazate pe estimarea gradientului se ncadreaza n aceasta
schema. Ceea ce va diferentia metodele va modalitatea n care este calculata variatia
maxima a valorilor imaginii (nivelelor de gri) ntr-un punct.
Pentru determinarea variatiei maxime a imaginii este deci necesara determinarea derivatelor
pe directiile orizontala si verticala. Realizarea derivatelor partiale dupa aceste directii implica trecerea n discret a derivatelor fx (x, y) si fy (x, y) (incluzand si modicarea notatiilor
coordonatelor, m ind versiunea discreta a lui x si n ind versiunea discreta a lui y):
fx (x, y) =

f (m, n)
f (x, y)
=
x
m

fy (x, y) =

f (m, n)
f (x, y)
=
y
n

Aceste derivate partiale discrete pot avea mai multe implementari:


fx = f (m, n) f (m + 1, n), fy = f (m, n) f (m, n + 1)

(1.5)

fx = f (m 1, n) f (m, n), fy = f (m, n 1) f (m, n)

(1.6)

fx = f (m 1, n) f (m + 1, n), fy = f (m, n 1) f (m, n + 1)

(1.7)

Toate expresiile date de (1.5), (1.6), (1.7) sunt combinatii liniare ale valorilor unor pixeli
din imagine, situati n vecinatatea pixelului curent din pozitia (m, n). Deci toate aceste
operatii se pot realiza prin ltrari liniare cu masti potrivite: (1.8) pentru (1.5), (1.9)
pentru (1.6), (1.10) pentru (1.7).




1
Wx = 1 1 , Wy =
(1.8)
1
2


1
Wx = 1 -1 , Wy =
-1

1


Wx = 1 0 1 , Wy = 0
1


(1.9)

(1.10)

Este interesant de remarcat faptul ca descompunerea derivatei dupa directia r oarecare se


poate face dupa oricare alte doua directii ortogonale, nu numai orizontala si verticala [?].
Considerand ca aceste directii de referinta sunt diagonalele principale ale sistemului de
coordonate (deci orientate la /4 si 3/4 fata de orizontala), vor trebui determinate forme
discrete pentru derivarea imaginii dupa diagonale. Asemenea derivate sunt realizate de
mastile de ltrare Roberts:




0
1
1 0
W/4 =
, W3/4 =
(1.11)
1 0
0 1
De asemenea, se remarca faptul ca toate mastile de ltrare liniara prezentate, ce implementeaza operatii derivative, verica conditia de normare a ltrelor liniare derivative, si
anume, suma coecientilor de ponderare din masca sa e nula (??).
Implementarea operatiei de extragere a punctelor de contur prin calculul gradientului
dupa doua directii ortogonale este data in gura 1.1.

Fig. 1.1: Schema bloc a extractorului de contururi bazat pe metoda de calcul a gradientului prin doua derivate dupa directii ortogonale.
Se observa, deci, existenta a trei rezultate de interes: harta de orientari 0 (m, n) care
este o imagine ce contine, pentru ecare pixel, orientarea gradientului de modul maxim
n punctul respectiv, si este n general folosita la prelucrarea suplimentara a contururilor
(conectare de contururi, extragere directionala de contururi), harta de intensitati de
tranzitie, g(m, n) care este o imagine ce contine, pentru ecare pixel, valoarea maxima a
gradientului pentru pozitia respectiva si harta de contururi e(m, n) care este o imagine
3

binara n care punctele marcate (puncte-obiect) corespund pozitiei punctelor de contur


(puncte al caror gradient maxim depaseste pragul xat). O simplicare uzuala practicata
este nlocuirea normei L2 din calculul modulului maxim al gradientului (1.4) cu norma
L1, ceea ce conduce la aproximarea:


f (x, y)
|fx (x, y)| + |fy (x, y)|
r
max

1.2

Operatori de gradient cu netezire

Unul dintre dezavantajele principale legate de folosirea acestor masti derivative simple (ce
implementeaza direct operatia de derivare directionala discreta) este marea sensibilitate
la zgomot. In urma derivarii, un zgomot alb, aditiv este amplicat de doua ori. Compensarea evidenta este de a realiza o operatie de reducere a zgomotului naintea derivarii,
urmarind simultan pastrarea prolurilor abrupte de tranzitie (si deci introducerea unor
efecte minime de ncetosare). Pentru ca prolul tranzitiei pe directia r sa nu e afectat,
ltrarea de netezire va trebui deci aplicata pe directia perpendiculara. Atunci, derivarea
orizontala va trebui precedata de o ltrare de netezire cu o masca verticala, iar derivarea
verticala va trebui precedata de o ltrare de netezire cu o masca orizontala. Operatiile de
ltrare liniara ind realizate prin convolutii, sunt asociative, si deci este posibila determinarea unei masti unice de ltrare, care sa grupeze efectele de netezire si derivare dupa
cele doua directii perpendiculare. Considerand o netezire de tip mediere ponderata cu
coecientul c R+ si operatii de derivare descrise de mastile din (1.10), obtinem mastile
echivamente de ltrare:


1
0
1
1


Wx = c 1 0 1 = c 0 c
1 0 1
1

1
1
1
1


0
0
1 c 1 0 = 0
Wy =
1
1 1 1
Prin particularizari convenabile ale coecientului de ponderare c folosit la ltrarea de
netezire se pot obtine diferite
familii clasice de operatori de derivare cu netezire: Prewitt
(c = 1, 1.12), Izotrop (c = 2, 1.13), Sobel (c = 2, 1.14) [?]. Se remarca faptul ca
constanta de ponderare globala a mastii de ltare este neesentiala, ntrucat conditia de
normare ce trebuie ndeplinita este cea pentru ltre de contrastare (derivare) (??): suma
coecientilor mastii sa e nula.

1 0 1
1
1
1
0
0
Wx = 1 0 1 , Wy = 0
(1.12)
1 0 1
1 1 1
4

0 1
1
Wx = 2 0 2 , Wy = 0
1
0 1
1

1 0 1
1

2 0 2 , Wy =
0
Wx =
1 0 1
1

1
0 0
2 1

2
1
0
0
2 1
2

(1.13)

(1.14)

Metoda de combinare a derivarii si netezirii poate extinsa, folosind diferite tipuri de


masti de derivare directionale de baza sau diferite tipuri de ltrari de netezire, chiar
nedirectionala. Operatorii de derivare MDIF [?] sunt construiti printr-o ltrare de mediere
aritmetica ntr-o vecinatate V4 ce precede aplicarea unor masti de derivare Prewitt (1.12).
Mastile rezultante sunt evident de dimensiune 5 x5:

Wx =

1.3

0
1
1
1
0

1
2
3
2
1

0
0
0
0
0

1
2
3
2
1

0
1
1
1
0

, Wy =

0
1
0
1
0

1
2
0
2
1

1
3
0
3
1

1
2
0
2
1

0
1
0
1
0

(1.15)

Operatori compas

Informatia de orientare este n general folosita n etape urmatoare ale prelucrarii; unghiurile determinate dupa (??) ofera un unghi exact al directiei conturului n punctul
curent, calculat cu un efort semnicativ de calcul (mpartire si calcul de arctangenta). In
practica, aceasta informatie este prea exacta: pe grila patrata de esantionare nu se pot
reprezenta cu usurinta drepte continue dupa orice directie; cateva directii sunt favorizate
si usor de utilizat (vertical, orizontal, cele doua diagonale). In acest caz se poate masura n
ecare modulul gradientului dupa aceste cateva directii importante, si apoi se poate alege
directia dupa care acest modul este maxim. Acesta este principul operatorilor compas.
Operatorii compas calculeaza mai multe derivate directionale, dupa un set de N directii
(N > 2). Gradientul maxim al functiei imagine n punctul respectiv este determinat ca
maximul valorilor derivatelor directionale, iar pentru decizia ulterioara se selecteaza doar
informatia corespunzatoare directiei pe care derivata a fost maxima. Daca N = 2 si cele
doua directii sunt ortogonale, schema de prelucrare obtinuta este similara cu cea a unui
extractor de contururi bazat pe gradient n care estimarea gradientului maxim se face
printr-o metrica de tip L (max). Schema bloc generala a unui operator compas este
prezentata n gura 1.2; ecare dintre mastile Wk realizeaza calculul unei derivate, pe
directia k .
5

Fig. 1.2: Schema bloc a extractorului de contururi bazat pe metoda de calcul a gradientului prin derivate dupa 8 directii.
Operatorul compas uzual are N = 8 masti de ltrare, ecare dintre ele realizand o
derivare dupa o directie multiplu de /4; sunt astfel acoperite directiile principale (vertical, orizontal, cele doua diagonale), n cele doua sensuri. Cele N masti folosite sunt
derivate de la o unica masca de baza, implemenand de obicei o derivare orizontala, prin
rotiri succesive ale acesteia cu unghiuri corespunzand diferentelor de directie a derivatelor
folosite. Pentru operatorul compas uzual cu N = 8, mastile de derivare folosite sunt 3 x
3, si mastile corespunzatoare directiilor succesive diera printr-o rotatie de /4. Aceasta
rotatie de /4 este nsa echivalenta cu o deplasare circulara a valorilor de pe marginea
mastii:

a b c
b c d
W0 = h * d ; W/4 = a * e
(1.16)
g f e
h g f
Masca initiala ce corespunde directiei orizontale poate oricare dintre mastile de derivare
cu netezire pe orizontala Wx prezentate, ca de exemplu Prewitt (1.12) sau Sobel (1.14).
Suplimentar,
au fost introduse
masti speciale, asa ca mastile Kirsch, caracterizate de

5 3 3
3 ; cele 8 masti folosite de operatorul compas Kirsch (indexate
Wx = 5 0
5 3 3
dupa numele orientarilor punctelor cardinale corespunzatoare) sunt deci:

5 3 3
3

3 , WN E =
5 0
5
=
5 3 3
5

3 3 5
3
5 , WSV = 3
= 3 0
3 3 5
3

WE

WV

3 3
3

0
3 , WN =
3
5
3
5

5
5
5
0
5 , WS = 3
3 3
3
6

3 3
3

0
3 , WN V =
3
5
5
3

5
5
5
0
3 , WSE = 5
3 3
3

3
0
5
5
5

5
3
0
3
3 3

Se poate remarca cu usurinta ca exista o legatura ntre precizia unghiulara a operatorului compas (deci diferenta dintre directiile alaturate dupa care se calculeaza derivatele
directionale) si dimensiunea mastilor de ltrare folosite; pentru o masca patrata de dimensiune D x D, precizia unghiulara este de /2(D 1) si numarul de masti utilizate de
operatorul compas este de N = 4(D 1).

1.4

Operatori compas cu netezire

Problemele legate de sensibilitatea derivatelor directionale la zgomot raman aceleasi si


pentru operatorii compas; etapa logica a fost deci de a combina derivarea directionala
(deja cu masti de derivare si netezire) cu o etapa suplimentara de netezire directionala
adaptiva. De exemplu, structura de ltrare propusa de Awajan [?] foloseste patru masti
de mediere ponderata directionala (pe verticala, orizontala si cele doua diagonale); pentru
ecare pixel al imaginii, varianta sa netezita ce va folosita apoi la extragerea contururilor, este determinata ca rezultatul ltrarii care difera cel mai putin de valoare initiala
din pixelul considerat. Mastile de netezire sunt:

W0

=
10

W/2

=
10

0
0
0.5
0
0
0
0
0
0
0

0
1
1
1
0
0
1
1
1
0

0
1
1
1
0

0
1
1
1
0

0.5
1
1
1
0.5

0
1
1
1
0

0
0

0
0
1

0
0.5 , W/4 =
10
0.5
0
0
0.5

0
0.5

0
0.5
1

0 , W3/4 =
0
10
0
0
0
0

0
0
1
1
0.5
0.5
1
1
0
0

0
1
1
1
0
0
1
1
1
0

0.5
1
1
0
0
0
0
1
1
0.5

0.5
0.5
0
0
0
0
0
0
0.5
0.5

Operatorul compas propriu-zis foloseste 16 masti ce implementeaza derivate directionale


pe directii orientate dupa unghiuri multiplu de /8; primele patru masti ale setului sunt:

W0

0
0
2
0
0

0
1
2
1
0

0
0
0
0
0

0
1
2
1
0

0
0
2
0
0

, W/8 =

0
0
0
2
0.5

0
0
1
2
0

0
1
0
1
0

0
2
1
0
0

0.5
2
0.5
0
0


W/4

0
0
0
0.5
2

0
0
1
2
0.5

0
1
0
1
0

0.5
2
1
0
0

2
0.5
0
0
0

, W3/8 =

0
0
0
0
0.5

0
0
1
2
2

0.5
1
0
1
0.5

2
2
1
0
0

0.5
0
0
0
0

In [?] este prezentata o varianta asemanatoare de operator compas cu netezire, care


foloseste pentru netezire o ltrare adaptiva Nagao.
O alta posibilitate de accentuare a neliniaritatii si de adaptare a operatorului compas
consta n calcularea derivatelor directionale numai pentru pixelii ce ndeplinesc anumite
conditii, ca de exemplu situarea pe mijlocul unei tranzitii pe directia data. Aceasta se
poate verica e prin operatori logici aplicati la nivelul valorilor individuale ale pixelilor
(((P4 > P1 ) si (P4 > P6 )) sau ((P4 < P1 ) si (P4 < P6 )) si echivalentele pentru pixelii P5
si P6 ), e prin vericarea ca rezultatul aplicarii unei masti de tipul:

1
1
1
P1 P2 P3
P4 P5 P6 , 2 2 2
(1.17)
P7 P8 P9
1
1
1

1.5

Detectia punctelor izolate

Principalul mod de determinare a punctelor izolate este bazat pe comparatie dintre valoarea punctului testat si nivelul de gri mediu din vecinatatea acestuia; daca aceasta
diferenta este importanta, punctul testat difera n mod semnicativ de vecinii sai, si este
n consecinta cel pun un punct izolat. O masca simpla de determinare a diferentei ntre
valoare punctului curebt si media aritmetica a vecinilor sai este

1 1 1
1
(1.18)
W = 1 8
1 1 1

1.6

Detectia combinat
a

In cele mai multe cazuri, prelucrarea este realizata n vecinatati de dimensiune redusa
(tipic 3 x 3) a pixelilor; deci ecarui pixel prelucrat i se asociza un vector de caracteristici
(cu 9 componente, daca se foloseste o vecinatate 3 x 3), ce sunt chiar nivelele de gri ale
pixelilor selecteti de fereastra de prelucrare. Astfel, ecare pixel devine reprezentat de un
8

punt ntr-un spatiu 9-dimensional. Pe langa baza evidenta de reprezentare, constituita


de versorii axelor carteziene de coordonate, n acest spatiu se pot introduce mai multe
baze ortogonale de reprezentare, iar versorii vectorilor ce compun aceste baze pot
transformati n matrici 3 x 3, ce vor folosite ca masti de ltrare.

P1 P2 P3
(P1 , P2 , P3 , P4 , P5 , P6 , P7 , P8 , P9 ) P4 P5 P6
P7 P8 P9

(1.19)

O astfel de baza a fost propusa de Frei si Chen si grupeaza 4 vectori (w1 w4 ) ce corespund unei familii de operatori compas construite pe baza mastilor de gradient izotrop,
4 vectori (w5 w8 ) cecorespund unor operatori de tip Laplacian (derivate secunde) si
un vector cecorespunde
aritmetice.
Mastile
echivalente
unei medieri
sunt

acestor vectori

1 0 1
1
0
1 2
2
1
0 0 , w2 = 2 0 2 , w3 = 1 0
1 ,
deci: w1 = 0
1
0 1
1 2 1
2 1
0

2 1 0
0
1 0
1 0 1

0
1
0 0 , w7 =
1
1 0 1 , w6 =
0
w4 =
, w5 =
0
1 0
1
0 1
2
0
1

2 1 2
1 1 1
1
2 1

2 4
2 , w8 =
4 1
1
1 1 1 . Fiecare dintre cele trei
, w9 =
1
2 1
2 1 2
1 1 1
grupuri mentionate de vectori va deni un subspatiu: subspatiul muchiilor, subspatiul
liniilor si subspatiul punctelor.
Pentru un pixel oarecare din imagine vectorul sau de caracteristici (vecinatatea sa 3 x 3
exprimata ca un vector linie, conform (1.19), este proiectat pe cele trei subspatii; marimea
acestor proiectii si unghiurile pe care acestea le fac cu vectorul original sunt date de:

pmuchii

plinii
ppuncte


4
   2
pmuchii
wi p , muchii = arccos
= 
p2
i=1

8
   2
plinii
= 
wi p , muchii = arccos
p2
i=5
ppuncte
= w9 , p , puncte = arccos
p2

In functie de unghiurile si proiectiile astfel calculate, pentru ecare pixel, se decide care
este subspatiul cel mai apropiat, si deci natura respectivului pixel. Pixelii de contur sunt
selectati din subspatiile muchiilor si liniilor.
9

1.7

Operatori Laplacieni

Extragerea punctelor de contur pe baza primei derivate (si deci a gradientului, indiferent
de modul de estimare a acestuia) este potrivita n cazul tranzitiilor relativ abrupte a
nivelelor de gri, si deci pentru frontiere bine conturate. Cu cat regiunea de tranzitie
devine mai larga (si deci panta proluli de tranzitie mai mica) centrul acestei tranzitii,
detectat prin maximul gradientului, devine mai greu de determinat cu precizie. Astfel,
contururile detectate vor formate din mai multi pixeli, nu neaparat situati pe centrul
regiunii de tranzitie. Gasirea centrului tranzitiei va putea atunci realizata prin folosirea
derivatelor de ordinul doi, grupate n operatorul Laplacian:
2 f =

2 f (x, y) 2 f (x, y)
+
x2
y 2

(1.20)

Operatorul Laplacian nu mai permite detectarea directiilor de tranzitie, deoarece informatia


de orientare a tranzitiei este pierduta. Determinarea punctelor de contur ca puncte de
extrem ale Laplacianului (maxime si minime, sau maxime ale valorii absolute a Laplacianului) produce muchii duble n harta de contururi, deoarece aceste puncte de extrem sunt
situate de o parte si de alta a regiunii de tranzitie, marcand limitele acesteia. Mijlocul
tranzitiei este este marcat de trecerea (tranzitia) prin zero a Laplacianului: pe aceasta
observatie se bazeaza modelul de detector zero-crossing introdus de
Marr si Hildreth.

1
2 1
Principalele masti utilizate pentru calculul Laplacianului sunt w7 = 2 4
2 ,
1
2 1

0
1 0
1 1 1
1 , W = 1 4
1 .
W = 1 8
1 1 1
0
1 0
Desigur, sensibilitatea la zgomot a Laplacianului este mai mare decat a operatorilor de
gradient, ceea ce a dus la introducerea unor operatori de derivata secunda, combinati
cu netezire. Unul dintre acesti operatori este LOG, Laplacian de Gaussiana; coecientii
nucleului de ltrare sunt dati de


 2

k 2 + l2
k + l2
h(k, l) = K 2
exp
(1.21)
2
2 2
Scalarul K este determinat din conditia de normalizare a coecientilor mastii de ltrare
liniara. O varianta separabila a acestui operator (deci care combina ltrari numai pe linii
si numai pe coloane) a fost propusa de Huertas si Medioni [?]:
LOG(g) = g1 (x)g2 (y) + g2 (x)g1 (y)
10

(1.22)

unde cele doua nuclee liniare g1 si g2 sunt date de:


 






y2
x2
K
K
x2
exp 2
g1 (x) =
1 2 exp 2 ; g2 (y) =
2

2
2
2

(1.23)

Forma separabila a operatorului LOG pune n evidenta n mod clar operatiile de derivata
secunda unidirectionala a unei Gaussiene (g1 ) si de netezire pe directia ortogonala derivarii, dupa un nucleu Gaussian (g2 ). Avantajul formei separabile este posibilitatea
implementarii cu un numar redus de operatii.
Derivata secunda unidimensionala a nucleului Gaussian poate pusa si sub forma unei
diferente de Gaussiene cu dispersii diferite:
2 G (x)
= G (x) G+d (x)
x2

1.8

(1.24)

Operatori morfologici de extragere a contururilor

Operatiile mofologice de baza, extinse pentru imagini cu nivele de gri, pot utilizate
pentru a construi harti de intensitate de tranzitie, care sa masoare gradul n care valoare
ecarui pixel difera de cea a vecinilor sai. Cele mai simple extractoare morfologice de
contur sunt conturul exterior (diferenta dintre dilatare si imaginea originala) si conturul
interior (diferenta dintre imaginea originala si erodarea sa):
f = f g f ; f = f f g

(1.25)

Gradientul morfologic este diferenta dintre imaginea dilatata si, respectiv erodata, cu
acelasi element structurant (si deci este suma contururilor interior si exterior):
gradf = f g f g = f + f

(1.26)

Daca interpretam sumarea contururilor interior si exterior ca pe o operatie de agregare


a unor informatii partiale, realizarea agregarii se poate realiza si prin alte operatii, ca
minimul sau maximul; operatorii rezultati grupeaza deci doua etape de calcul de extrem (o
data prin operatia morfologica si apoi prin operatorul de agregare) si deci sunt operatori
multietaj:
max (f, f ) ; min (f, f )
(1.27)
Varianta cu netezire a operatorului morfologic multietaj foloseste o varianta netezita a
imaginii originale (prin ltrare liniara cu o masca de mediere h) si
min (f h (f h) g, (f h) g f h)
11

(1.28)

Variantele directionale ale extractoarelor morfologice de contur se bazeaza pe posibilitatea


denirii unor elemente structurante al caror suport sa e orientat, urmarind astfel comportarea valorilor din vecnatatea ecarui punct pe o anumita directie. Alegerea directie
pe care variatia este predominanta este realizata, desigur, printr-un operator de maxim
sau minim, rezultand, din nou, o structura multietaj. De exemplu:
min (f gA f, f gB f, max (|f gC1 f gC2 | , |f gC3 f gC4 |))

(1.29)

sau
min (f f gA , f f gB , max (|f gC1 f gC2 | , |f gC3 f gC4 |))

(1.30)

unde suporturile elementelor structuante folosite sunt A = {(0, 1) , (0, 1) , (1, 0) , (1, 0)},
B = {(1, 1) , (1, 1) , (1, 1) , (1, 1)}, C1 = {(0, 1) , (1, 0)}, C2 = {(0, 1) , (1, 0)},
C3 = {(0, 1) , (1, 0)}, C4 = {(0, 1) , (1, 0)}.

1.9
1.9.1

Operatorul Haralick (aproximarea polinomial


a)
Aproxim
ari polinomiale liniare

Pentru orice set de n puncte diferite ntre ele, {x0 , ..., xn1 }, se poate determina un
polinom unic de grad n1 care sa aiba punctele date ca solutii, P (xi ) = 0, i = 0, ..., n1.
Pentru aceleasi n puncte se poate determina o familie de n polinoame de grad cel mult
n 1, ortogonale doua cate doua n raport cu setul de puncte {xi }, caracterizate de:
n1


Pnu (xi )Pnv (xi ) = 0, u = v

(1.31)

i=0

Polinoamele familie astfel denite sunt deci Pnu , polinomul de grad u din familia celor n
polinoame, si formeaza o baza n spatiul polinoamelor de grad cel mult n 1, denita
n raport cu multimea de puncte {xi }. Orice polinom de grad cel mult n 1 va putea
deci aproximat printr-o combinatie liniara de polinoame Pnu
P(x) =

n1


ak Pnk (x)

(1.32)

k=0

Coecientii de ponderare ak se deduc din conditia de minimizare a erorii patratice de


aproximare n punctele familiei {xi } :
2

n1
n1


2 =
ak Pnk (xi )
(1.33)
P (xi )
i=0

k=0

12



2
2
= 2
P (xi )Pnk (xi ) + 2ak
Pnk
(xi ) = 0
ak
i=0
i=0

(1.34)

n1
P (xi )Pnk (xi )
ak = i=0
n1 2
i=0 Pnk (xi )

(1.35)

n1

n1

Daca multimea punctelor de denitie este simetrica (xk {xi } xk {xi }) se pot
obtine de exemplu polinoamele Cebsev: n = 3, {xi } = {1, 0, 1}, cu
P30 (x) = 1; P31 (x) = x; P32 (x) = x2

2
3

(1.36)

sau n = 5, {xi } = {2, 1, 0, 1, 2}, cu


P50 (x) = 1; P51 (x) = x; P52 (x) = x2 2; P53 (x) = x3
P54 (x) =

1.9.2

x4 + 210x2 144
160

17
x
5

(1.37)

Aproximare polinomial
a bidimensional
a

Portiunea de imagine situata n fereastra de analiza de dimensiune N x N, centrata n


pixelul de coordonate (i, j) (deci cu N impar si N = 2M + 1), este aproximata cu un
polinom al carui grad maxim n x si y nu depaseste N 1. Exista deci o multime de
N 2 puncte pentru care se construieste o baza de N 2 polinoame, ce rezulta din produsul
cartezian al celor doua baze de polinoame unidimensionale determinate pentru aceleasi
puncte:
{PN 2 ,00 (x, y), PN 2,01 (x, y), ..., PN 2 ,N 1N 1 (x, y)} = {PN 0 (x), ..., PN N 1 (x)}{PN 0 (y), ..., PN N 1(y)}
(1.38)
Considerand N = 3 (M = 1) si multimile de puncte (i, j) {1, 0, 1} {1, 0, 1} ,
polinoamele bazei bidimensionale sunt:
2
P9,00 (x, y) = 1; P9,10 (x, y) = x; P9,20 (x, y) = x2
3

2
2
P9,01 (x, y) = y; P9,11 (x, y) = xy; P9,21 (x, y) = y x
3





2
2
2
2
2
2
2
2
; P9,22 (x, y) = x
y
P9,02 (x, y) = y ; P9,12 (x, y) = x y
3
3
3
3
13

In fereastra de analiza aleasa, imaginea este aproximata ca


f(x, y) =

N
1 N
1



anm PN 2 ,nm (x, y)

(1.39)

n=0 m=0

si coecientii de aproximare sunt determinati din aceeasi conditie de eroare patratica


minima, ca
M
M
i=M
j=M f (i, j)PN 2 ,nm (i, j)
(1.40)
anm =
M
M
2
i=M
j=M PN 2 ,nm (i, j)
Coecientii de aproximare anm se pot calcula printr-o ltrare liniara a imaginii (expresia
de denitie () este liniara n valorile PN 2 ,nm (i, j) = f (i, j)) cu o masca de ltrare a carei
coecienti sunt dati de:
PN 2 ,nm (u, v)
M
2
i=M
j=M PN 2 ,nm (i, j)

H(u, v) = M

(1.41)

Pentru polinoamele prezentate n exemplul


anterior,
mastile
de ltrare prin care

se pot

1 1 1
1 1 1
0
0 , H20 =
deduce coecientii sunt: H00 = 19 1 1 1 , H10 = 16 0
1 1 1
1
1 1

1
1 1
1 2 1
1 2
1
1
2 1
1
0
0 , H22 = 14 2 1
2 ,
2 -2 2 , H02 = 16 1 -2 1 , H12 = 14 0
6
1
1 1
1 2 1
1
2 1
1
2 1

1 0 1
1
0 1
1 0 1
1
1
1

0 0
0 2 .
1 0 1 , H11 = 4
0
2
, H21 = 4
H01 = 6
1 0 1
1 0 1
1 0 1
Folosind expresia aproximativa a functiei imagine, data de (1.39), derivatele dupa directiile
axelor de coordonate se pot calcula ca:
N 1 N 1
N 1 N 1
PN 2 ,nm (x, y) f(x, y)  
PN 2 ,nm (x, y)
f(x, y)  
=
;
=
anm
anm
x
x
y
y
n=0 m=0
n=0 m=0

(1.42)

In centrul mastii (deci n punctul curent n care se face analiza), derivatele sunt date de



f(x,y) 
si f (x,y) (0,0) .
(0,0)
x

P 2
(x,y) 
(0,0) = 0, cu
Daca se folosesc polinoamele determinate anterior, se constata ca N ,nm
x


P9,10 (x,y) 
P9,12 (x,y) 
2
si
ia verticala
exceptia
(0,0) = 1
(0,0) = 3 . Atunci, derivata pe direct
x
x

f(x,y) 
a a mastii de ltrare
este
(0,0) = a10 + a12 , ceea ce este echivalent cu aplicarea direct
x

14


0 1 0
0 . In mod analog, masca de ltrare pe directia orizontala
H10 23 H12 = 12 0 0
0 1
0

0
0 0
este 12 1 0 1 .
0
0 0

1.10

Cel mai potrivit plan

Functia imagine continua se poate aproxima cu o suprafata de ordinul unu, deci cu un


plan. Ecuatia planului ce trece prin punctul de coordonate spatiale (m, n) este:
z(x, y) = z0 + (x m) + (y n)

(1.43)

Coecientii si , care dau derivatele pe orizontala si verticala sunt date de expresiile:


=

1
(f11 + f01 + f11 f11 f01 f11 )
6

(1.44)

1
(f11 + f11 + f10 f11 f10 f11 )
6

(1.45)

1 0 1
si deci pot implementate prin mastile de ltrare liniara W = 16 1 0 1 , W =
1 0 1

1 1 1
1
0
0
0 (deci mastile Prewitt).
6
1
1
1

1.11

Cea mai potrivit


a cuadric
a

Se urmareste construirea unei suprafete cuadrice (descrisa deci de o expresie polinomiala


de ordinul doi) care sa aproximeze cel mai bine (n sensul erorii patratice medii) functia
continua ce modeleaza imaginea, n jurul unui pixel xat. Suprafata determinata va
aproxima prolul imaginii ntr-un spatiu tridimensional de reprezentare, n care coordonata valorica (axa z) este valoare nivelului de gri, iar coordonatele spatiale si pastreaza
semnicatia, ind asociate primelor doua axe. Suprafata este descrisa de ecuatia:
z(x, y) = z0 + A(x m)2 + B(y n)2 + C(x m) + D(y n) + E(x m)(y n) (1.46)
15

unde z0 este valoarea imaginii n punctul curent n jurul caruia se face aproximarea, deci
z0 = f (m, n). Aproximarea se face ntr-o vecinatate V a punctului de coordonate (m, n),
formata din punctele {(m + k, n + l)|(k, l) V }, iar coecientii A E sunt determinati
prin minimizarea erorii patratice :

(f (m + k, n + l) z(m + k, n + l))2
(1.47)
=
(k,l)V

Minimizarea erorii patratice revine la a calcula derivatele partiale ale expresiei acesteia
dupa cei cinci parametri ai suprafetei z si de a anula aceste derivate. Solutiile ecuatiilor
astfel formate sunt valorile optime ale parametrilor. Vom adopta notatia simplicatoare
f (m + k, n + l) = fkl (si deci, de exemplu, f (m + 1, n 1) = f11 ). Atunci expresia erorii
patratice devine:

=
(fkl z(m + k, n + l))2
(1.48)
(k,l)V

Cea mai simpla vecinatate este, desigur, vecinatatea extinsa de ordinul unu, deci V8 (determinata de o masca patrata 3 x3, centrata). Atunci V = {(1, 1), (1, 0), (1, 1), (0, 1), (0, 0), (0, 1), (1,
si expresia erorii devine:
= (f11 f00 A B C D E)2 + (f01 f00 B D)2 +
(1.49)
2
2
+ (f11 f00 A B + C D + E) + (f10 f00 A + C) +
+ (f11 f00 A B + C + D E)2 + (f01 f00 B + D)2 +
+ (f11 f00 A B C + D + E)2 + (f10 f00 A C)2
Derivatele partiale dupa parametrii suprafetei cuadrice sunt atunci:

= 8E 2f11 2f11 + 2f11 + 2f11 = 0


E

= 12D 2f11 2f01 2f11 + 2f11 + 2f01 + 2f11 = 0


D

= 12C 2f11 2f11 2f10 + 2f11 + 2f10 + 2f11 = 0


C

= 12B + 8A + 12f00 2f11 2f01 2f11 2f11 2f01 2f11 = 0


B

= 12A + 8B + 12f00 2f11 2f10 2f11 2f11 2f10 2f11 = 0


A
Rezolvand ecuatiile, parametrii cuadricei sunt:
E=

1
(f11 + f11 f11 f11 )
4
16

(1.50)
(1.51)
(1.52)
(1.53)
(1.54)

(1.55)

1
(f11 + f01 + f11 f11 f01 f11 )
6
1
C = (f11 + f11 + f10 f11 f10 f11 )
6

D=

1
(f11 + 2f10 f11 f11 + 2f10 f11 3f01 3f01 + 6f00 )
10
1
(f11 + 3f10 + f11 + f11 + 3f10 + f11 2f01 2f01 6f00 )
A=
10

B=

(1.56)
(1.57)
(1.58)
(1.59)

Expresiile obtinute sunt liniare n valorile imaginii selectate de vecinatate, deci pot
obtinute prin ltrarea liniara a imaginii, folosind
masti de ltrare
care sa
corspunda expre

1
3
1
1 2 1
1
1
2 6 2 , WB = 10
3 6 3 ,
siilor deduse. Aceste masti sunt: WA = 10
1
3
1
1 2 1

1 0 1
1 1 1
1
0 1
0
0 , WE = 14 0
0 0 .
WC = 16 1 0 1 , WD = 16 0
1 0 1
1
1
1
1 0 1
Ecuatia planului tangent suprafetei determinate n punctul de coordonate (m, n) (deci n
punctul curent de calcul) este data de:
z = z0 +

z(x, y) 
z(x, y) 
(m,n)) (x m) +
(m,n)) (y n)
x
y

(1.60)

deci
z = f00 + C(x m) + D(y n)

(1.61)

Deci, derivatele pe directiile orizontala si verticala (x si y), sunt date de coecientii C si


D ai ecuatiei ce descrie suprafata de aproximare a imaginii n jurul pixelului (m, n). Dar,
dupa cum se poate observa din forma mastile de determinare practica acestor coecienti,
C si D sunt derivatele directionale obtinute prin mastile Prewitt.
Dupa cum se remarca din expresia de denitie a termenului de eroare patratica (1.47),
ponderea diferitelor erori ce corespund pixelilor din vecinatatea utilizata (cu exceptia
originii, desigur, pentru ca suprafata de aproximare este constransa sa realizeze o eroare
nula n punctul curent) este aceeasi, indiferent de distanta acestor diferite puncte fata
de punctul central de coordonate (m, n). Se poate considera ca este mai important ca
aproximarea sa e mai buna pentru pixelii mai apropiati de pixelul considerat decat
pentru pixelii situati la o distanta mai mare. In cazul folosirii unei masti 3 x3 patrate,
centrate, ar putea deci considerat normal ca eroarea de aproximare a vecinilor imediati
(pe linii si pe coloane) sa e ponderata cu un factor c (cu c > 1), astfel ncat contributia
sa sae mai importanta decat cea ce corespunde vecinilor de pe diagonala. Daca se reia
calculul parametrilor A E ai suprafetei de aproximare, derivatele orizontal si verticala
17

C si D vor exprimate prin masti de gradient generalizate WC

1 c 1
0
0 .
WD = k1 0
1
c
1

1.12

1 0 1
= k1 c 0 c ,
1 0 1

Abordarea topografic
a (cea mai potrivit
a cubic
a)

Abordarea topograca [?, 145-146] face asocierea functiei tridimensionale construite pe


baza reprezentarii nivelelor de gri a imaginii ca suprafata cu relieful unui teren, n care
frontierele dintre obiectele din imagine au rolul de creste si vai. Pentru detectia acestora,
imaginea este modelata local cu o suprafata cubica (polinomiala de ordinul trei)
f (x, y) = k1 + k2 x + k3 y + k4 x2 + k5 xy + k6 y 2 + k7 x3 + k8 x2 y + k9 xy 2 + k10 y 3

(1.62)

Coecientii k1 k10 se determina analog aproximarilor liniara si cuadrica, ntr-o vecinatate


a ecarui pixel din imagine (vecinatate de dimensiune 5 x 5). Cum expresiile de calcul
ale coecientilor sunt liniare dupa valorile pixelilor imaginii din vecinatatea considerata,
coecientii vor putea calculati prin ltrarea liniara a imaginii (convolutie) prin mastile
5 x 5 determinate.
Suprafata astfel determinata este apoi representata n coordonate polare prin
f (, ) = A3 + B2 + C + k1

(1.63)

A = k7 sin3 + k8 sin2 cos + k9 cos2 sin + k10 cos3


B = k4 sin2 + k5 sin cos + k6 cos2
C = k2 sin + k3 cos

(1.64)

cu

Atunci, derivatele partiale ale expresiei lui f (, ) sunt:


f (, )
= 3A2 + 2B + C

2 f (, )
= 6A + 2B
2
18

Deeterminarea vailor si crestelor se face pe baza

ceea ce conduce la a calcula


directia tranzitiei ca


2 f (, )
|=0 = 0
2

(1.65)

= k5 cos 2 + (k4 k6 ) sin 2 = 0, de unde se determina


0 =

k5
1
arctan
2
k6 k4

(1.66)

(,)
Pozitia 0 a tranzitiei se poate apoi determina din f
|=0 = 0 si conditia suplimentara ca < 0.5 (semnicand faptul ca tranzitia trebuie sa e apropiata de centrul
ferestrei de analiza curente).

1.13

Modelul H
uckel

Acest model impune o forma liniara a dreptei de separatie ntre cele doua regiuni cuprinse
n fereastra curenta de analiza. Valorile nivelului de gri n cele doua regiuni este constant,
iar diferenta de nivel de gri este i; separatia dintre regiuni (muchia) este nclinata pe
directia fata de orizontala si este situata la distanta d fata de centrul ferestrei de analiza
(gura 1.3). Fereastra de analiza folosita este patrata, de dimensiune relativ mare (2N
x 2N, cu N = 4 6) si este deplasata peste imagine din N n N pixeli, pe verticala si
orizontala, ceea ce duce la suprapunerea de 50% a ferestrelor de analiza vecine.
Prin folosirea unei ferestre mari de analiza, tranzitiile abrupte nu sunt ngrosate n harta
de contururi, iar prin determinarea variatiei muchiei n raport cu centrul ferestrei, la
translatia acesteia ntre pozitii succesive, muchiile sunt n general detectate n pozitia
corecta. Rezulattul operatorului nu este deci doar o unica valoare, reprezentand intensitatea maxima a tranzitiei locale (ca n cazul mastilor locale de gradient), ci un ntreg
segment de dreapta, caracterizat de nclinare si pozitia n fereastra. Segmentul de dreapta
astfel determinat contribuie la harta de intensitati de tranzitie cu diferenta caracteristica
de nivele de gri, i.
In modelul initial, detectia muchiei este redusa la o problema de optimizare, rezolvata
aproximativ n coordonate spatiale continue. Daca se considera originea locala a sistemului de coordonate n centrul ferestrei de analiza, muchia ideala este descrisa de modelul:


sx + ty = r
s2 + t2 = 1
19

(1.67)

Fig. 1.3: Schema unei muchii liniare Hueckel.


iar functia imagine este descrisa n fereastra de analiza prin:
f(x, y, r, s, t, i, i) =

i, sx + ty  r
i + i, sx + ty > r

(1.68)

Problema de optimizare consta n minimizarea erorii patratice de aproximare a imaginii reale f prin modelul impus de prolul tranzitiei, f (cu un set xat de parametri
r, s, t, i, i) pentru domeniul spatial ce corespunde ferestrei curente W .
 
2
y, r, s, t, i, i) dxdy
(r, s, t, i, i) =
f (x, y) f(x,
2

(1.69)

Functiile f si f pot dezvoltate n serie dupa un set de functii de baza ortonormale


{hk (x, y)}, avand ca suport fereastra W , ceea ce face posibila exprimarea erorii de aprox20

imare n functie de coecientii dezvoltarii n serie, Fk si Fk :





(r, s, t, i, i) =
Fk Fk (r, s, t, i, i)
2

(1.70)

k=0

unde
Fk =

hk (x, y)f (x, y)dxdy, Fk =

 y, r, s, t, i, i)dxdy
hk (x, y)f(x,

H
uckel a folosit o serie limitata de opt functii de baza, denite n ferestre circulare, pentru
care modelul muchiei aproximeaza doar componentele de joasa frecventa ale imaginii
f (x, y) si care permit calculul parametrilor modelului cu un cost de calcul rezonabil (gura
??). Complexitatea de calcul poate redusa folosind exprimarea functiilor de baza si
transformarea Fourier n coordonate polare. Chiar si asa, metoda nu este sucient de
directa sau intuitiva.

1.13.1

Metoda Mero si Vassy

Metoda Mero si Vassy [?] permite identicarea rapida a unei frontiere liniare ce corespunde unui model H
uckel, prin determinarea parametrilor de nclinare si de distanta d
fata de centrul ferestrei de analiza. Parametrul de nclinare al dreptei poate determinat
prin utilizarea rezultatelor aplicarii mastilor h1 si h2 din gura 1.4 si combinarea acestora
prin
tan 1
f h1
=
(1.71)
tan + 1
f h2

Fig. 1.4: Mastile de prelucrare folosite la determinarea orientarii muchiei din fereastra.
21

Dupa cum se remarca, obtinerea scalarilor f h1 si f h2 nu necesita decat operatii de


adunare si scadere; o unica mpartire este deci necesara pentru a determina panta (tan )
conturului. Mai mult, valoarea astfel calculata pentru orientarea conturului este relativ
stabila la prezenta zgomotului, ind dedusa printr-un calcul similar medierii valorilor din
imagine.
Determinarea parametrului de distanta la centrul ferestrei poate realizata pe baza
aceleiasi idei, de a minimiza diferenta dintre imaginea reala f si imaginea ideal
 a, impusa
2


de modelul de muchie, f. Minimizarea erorii patratice 2 = (m, n) W
f (m, n) f(m, n)
este echivalent
a cu maximizarea corelatiei dintre imaginea reala si imaginea model, =

(m, n) W
f (m, n)f(m, n). Daca modelul este simplicat astfel ncat valorile lui f
sa e +1 deasupra muchiei si -1 sub muchie, calculul corelatiei dintre imaginea reala si
imaginea model revine la
q
N2


(q) =
f (j)
f (j)
(1.72)
j=1

j=q+1

unde q este numarul de pixeli din imagine aati deasupra muchiei (si deci restul de N 2 q
pixeli sunt situati sub muchie). Daca valorile imaginii din fereastra de analiza curente sunt
normalizate (prin scaderea mediei valorilor f (m, n)), atunci suma valorilor din fereastra
 2
este nula ( N
j=1 fnorm (j) = 0), ceea ce conduce la
q


fnorm (j) =

j=1

N


fnorm (j)

(1.73)

j=q+1

si atunci, evident, corelatia se poate scrie ca


(q) = 2

q


fnorm (j)

(1.74)

j=1

Asadar, corelatia ce trebuie maximizata este exprimata ca suma valorilor normalizate ale
pixelilor din fereastra de analiza situati deasupra muchiei cautate. Daca muchia model
este translatata de-a lungul ferestrei de analiza, pastrandu-si directia, aceasta va ntalni
pe rand toti pixelii din fereastra de analiza, ntr-o ordine determinata de distanta acestora
fata de muchia modelului (dreapta nclinata la unghiul fata de orizontala) situata n
coltul din stanga sus al ferestrei de analiza. Pentru un pixel, a carui coordonate locale
sunt (m, n), aceasta distanta este
(m + (n 1) tan )2
d (m, n) =
1 + tan2
2

22

(1.75)

Cum numitorul expresiei este constant pentru un unghi dat, ordinea de parcurgere a
punctelor va data doar de (m + (n 1) tan )2 .
Odata ce este determinat maximul corelatiei (q) (1.74), din coordonatele pixelului pentru
care acest maxim este atins (si prin care trece muchia modelului) se poate calcula cu
usurinta distanta pana la centrul ferestrei de analiza. In acest fel sunt parametrii muchiei;
parametrii i si i + i pot determinati apoi ca nivelul de gri mediu al pixelilor situati
de o parte si de alta a muchiei.

1.14

Detectia contururilor prin filtare optimal


a

Problema detectiei contururilor prin ltrare liniara se poate exprima ca proiectarea unui
ltru a carui raspuns sa marcheze cu maxime bine denite pozitiile tranzitiilor din semnalul de intrare. Cazul de plecare este considerarea unor semnale mono-dimensionale
(semnale de timp uzuale), n care contururile sunt modelate cu prin trepte de amplitudine, degradate cu zgomot Gaussian aditiv. Filtrul dedus trebuie sa e optimal, n
sensul de a oferi cea mai buna performanta medie, pentru orice pozitie si intensitate a
tranzitiei si orice putere a zgomotului suprapus acesteia. Performanta de detectie a contururilor este masurata printr-o serie de caracteristici, precum detectia si localizarea buna
a tranzitiei, precum si minimizarea probabilitatii de detectie falsa prin maxime datorate
exclusiv prezentei zgomotului.
Asadar, e semnalul de intrare f (x), compus dintr-o treapta ideala u(x) de amplitudine
U0 si un zgomot aditiv, gaussian, de medie nula si putere N02 , n(x):
f (x) = U0 u(x) + n(x)

(1.76)

Daca ltrul cautat are functia de pondere h(x), iesirea ltrului este data de

f (t)h(x t)dt

g(x) = f (x) h(x) =

(1.77)

Cum tranzitia apare pentru x = 0, h(x) trebuie determinat astfel ncat g(0) sa e maxim
si sa respecte constrangerile enuntate (buna detectie, buna localizare, evitare a maximelor
multiple).
23

1.14.1

Proprietatea de bun
a detectie

Detectia este exprimata prin raportul semnal zgomot denit de raportul dintre r
aspunsul
maxim determinat doar de semnalul util si radicalul puterii zgomotului prezent la iesirea
ltrului:


U0 h(x t)dt
U0 h(x t)dt
0
=
RSZ =  0
(1.78)


2 





N0
|h(t)|2 dt
E  n(t)h(x t)dt



Pentru obtinerea ultimei expresii am folosit teorema Parseval (echivalenta dintre puterea
unui semnal calculata din spectrul de frecventa si din domeniul temporal) si proprietatile
legate de trecerea semnalelor aleatoare prin sisteme liniare. Pentru ca raspunsul ltrului
h(x) la un semnl constant sa e nul, se alege o functie de pondere impara, pentru care
0

h(t)dt + h(t)dt = 0 si h(t) = h(t). Daca raportul este calculat pentru pozitia

corecta a tranzitiei, x = 0, se obtine


0
U0

RSZ =
N0


1.14.2

h(t)dt
=
|h(t)|2 dt

U0

N0

(1.79)

Proprietatea de bun
a localizare

Localizarea este masurata prin inversul variantiei distantei dintre maximul raspunsului
maxim al ltrului si pozitia reala a tranzitiei (si deci 0 pentru modelul folosit). O localizare buna nseamna o varianta mica a acestei distante si deci o valoare mare a inversei
distantei. Daca x0 este pozitia maximului semnalului de la iesirea ltrului, acesta va corspunde anularii primei sale derivate:





g(x)
f (x) h(x) |x=x0 = (f (x) h (x)) |x=x0
|x=x0 =
x
x


g(x)
|x=x0 = U0 (u(x) h (x)) |x=x0 + (n(x) h (x)) |x=x0
x



g(x)
u(x0 t)h (t)dt + (n(x) h (x)) |x=x0
|x=x0 = U0
x

24

g(x)
x

x0
|x=x0

= U0

h (t)dt + (n(x) h (x)) |x=x0 = U0 h(x0 ) + (n(x) h (x)) |x=x0

A fost folosita proprietatea h() = 0. Apoi, presupunand ca x0 nu este departat de


pozitia corecta (deci 0), h(x0 ) poate dezvoltat n serie Taylor truncheata n jurul lui x0
ca h(x0 ) h(0) + x0 h (0). Dar functia h este impara, si atunci h(0) = 0 si:


g(x)
(1.80)
|x=x0 = U0 x0 h (0) + (n(x) h (x)) |x=x0
x


In plus, h (x0 ) = h (0) = h(x0 )/x0 si anularea derivatei g(x) |x=x0 conduce la:
x
U0 x0 h (0) = (n(x) h (x)) |x=x0
2
2
U02 x20 (h (0)) = |n(x) h (x)| |x=x0
Cum x0 este o variabila aleatoare, ca si puterea de la iesirea ltrului determinata de
zgomot, se aplica un operator de mediere statistica si se obtine:

!
 2
2
2
2


2
U0 (h (0)) E x0 = E |n(x) h (x)| |x=x0 = N0
|h(t)|2 dt
(1.81)

 
E x20 =

N02

|h(t)|2 dt

(1.82)
U02 (h (0))2
Cum variabila aleatoare x0 are medie nula (pentru ca presupunem ca estimarea pozitiei
tranzitiei se face ca o estimare nedeplasata printr-o eroare sistematica), atunci media
patratica este egala cu varianta si localizarea (radical din inversul varaiantei) este:

U0
1
|h (0)|
U0

=

(1.83)
=
2
E [x0 ]
N0
N

0
|h(t)|2 dt

eja se poate observa ca produsul dintre localizare si detectie nu mai depinde de


amplitudinea tranzitiei si este invariant la schimbarea de scala, k:
0

h(t)dt

= 


2

|h(t)| dt

|h (0)|


(1.84)
2

|h(t)| dt

ntr-adevar,considerand o varianta scalata a ltrului, hk (x) = h(x/k), atunci k =


si k = / k (deci rezultand = k k ).
25

1.14.3

Proprietatea de evitare a maximelor multiple

Pentru a reduce numarul de maxime de la iesirea ltrului (si pentru a nu avea raspunsuri
multiple), va trebui minimizata densitatea trecerilor prin zero a raspunsului ltrului datorate zgomotului. Aceasta densitate, d0 poate calculata printr-un model statistic.
Pentru un proces Gaussian G(x) de medie nula si functie de autocorelatie BG ( ), densitatea trecerilor prin zero este


(0)
1 BG
(1.85)
d0 =

BG (0)
In cazul considerat, raspunsul ltrului la zgomotul aplicat la intrare (G(x) = n(x) h(x))
corespunde unui proces gaussian, atata vreme cat procesul de zgomot n(x) este alb, cu
distributie Gaussiana. Atunci,

BG (0) =

qG ()d = N02

|h(t)|2 dt

(1.86)

unde qG () este densitatea spectrala de putere a raspunsului ltrului. In plus, avem


  2


( ) = BG ( ), si atunci BG
(0) = N02
|h (t)| dt. Atunci, densitatea trecerilor
BG

prin zero ale raspunsului la zgomot al ltrului este






|h (t)|2 dt

1
d0 =


  |h(t)|2 dt

(1.87)

Extremele semnalului de iesire (obtinut dupa ltrarea zgomotului) corespund tranzitiilor


din semnalul de zgomot de la intrare; aceste extreme sunt nsa si trecerile prin zero ale
derivatei secunde ale semnalului de zgomot de la intrare, deci ale derivatei semnalului
de iesire (ntrucat ltrul h(x) este un derivator, avand un raspuns nul pentru un semnal
constant, g(x) = f (x) h(x) = f  (x)). Atunci, nlocuind simbolic pe G(x) cu G (x)
obtinem:




|h (t)|2 dt
1

(1.88)
d0 =


  |h (t)|2 dt

Distanta medie dintre doua maxime datorate zgomotului va atunci 1/d0, iar distanta
maxima dintre aceste maxime, xmax = 2/d0.
26

Toate aceste trei conditii sunt deci grupate ntr-o expresie de optimizat. In functie de
tipul de ltru ce se doreste (cu raspuns nit, sau cu raspuns innit), exista doua abordari:
Canny si Deriche.

1.14.4

Abordarea Canny

Filtrul sintetizat de Canny are un raspuns nit la impuls, deci h(x) este o functie de
suport marginit, [M, M]. Conditia de evitare a maximelor multiple datorate zgomotului
cere ca numarul de maxime locale detectate ca raspuns la un unic contur sa e limitat,
si distanta minima dintre maximele succesive sa e o fractiune din M (xmax = km M).
Atunci, ltrul h(x) este dedus prin maximizarea lui () cu constrangerea xmax = km M.
Aceasta revina la a gasi h(x) care minimizeaza functionala
(x, h, h , h ) = h2 + 1 h2 + 2 h2 + 3 h

(1.89)

si deci sunt solutiile ecuatiei

sau, echivalent,

+
=0
h
x h x2 h

(1.90)

2h(x) 21 h (x) + 22 h (x) + 3 = 0

(1.91)

Rezolvarea ecuatiei produce solutii de forma


h(x) = a1 ex sin x + a2 ex cos x + a3 ex sin x + a4 ex cos x

(1.92)

cu 2 21 /4 > 0, 2 2 = 1 /22 , 42 2 = (21 422 )/422 . Conditiile la limita impuse


sunt h(0) = 0, h(M) = 0, h (0) = S si h (0) = 0. Folosind tehnici numerice de optimizare,
s-a dedus valoarea optima = 1.12. Cum ltrul ce rezulta este mult prea complex de
implementat, Canny a dedus ca ltrul DOG conduce la o valoare extrem de apropiata,
= 0.92.

1.14.5

Abordarea Deriche

Deriche a propus sinteza unui ltru cu raspuns innit la impuls (deci cu M ). Solutia
ecuatiei (1.92) este atunci
h(x) = ke|x| sin x
(1.93)

si = 2/ 2 + 2. Daca consideram = m, atunci = 2m/ m2 + 1 si cazul cel


mai performant corespunde la m , pentru care rezulta = 2 si
h(x) = 2 xe|x|
27

(1.94)