Sunteți pe pagina 1din 19

Capitolul 3

Operaţii de vecinătate

Operaţiile de vecinătate sunt caracterizate prin aceea că valoare unui pixel din imaginea
prelucrată rezultă din combinarea valorilor unui număr oarecare de pixeli din imaginea
iniţială, situaţi ı̂n vecinătatea spaţială a pixelului curent prelucrat. Astfel, pentru un pixel
situat ı̂n poziţia (l, c) (deci pe linia l şi pe coloana c a imaginii), valoarea g(l, c) rezultată
prin prelucrare este: ¡ ¡ ¢¢
g(l, c) = T f V(l,c) . (3.1)
Această nouă valoare rezultă prin folosirea funcţiei de combinare T a valorilor pixelilor
din imaginea originală f , pixeli selectaţi ı̂n jurul pixelului curent prelucrat (de coordonate
(l, c)) de vecinătatea V . Vecinătatea este o formă plană, deci o mulţime de puncte din
suportul spaţial al imaginii, precizate prin coordonatele lor carteziene faţă de o origine
oarecare, precizată, ce este asociată acestei mulţimi (originea vecinătăţii nu este originea
sistemului de coordonate ataşat imaginii). Aşadar punctele din vecinătate sunt precizate
prin coordonate relative (deci ı̂n alt sistem de coordonate decât sistemul de coordonate
al imaginii) faţă de propria origine a vecinătăţii. În mod curent, vecinătatea mai este
denumită şi fereastră de filtrare sau fereastră de prelucrare.
Operaţiile de prelucrare de vecinătate (numite ı̂n mod uzual filtre) se clasifică după ca-
racteristicile funcţiei de combinare T : operaţii (sau filtre) liniare şi respectiv operaţii (sau
filtre) neliniare.

3.1 Filtrarea liniară

Operaţia de prelucrare liniară de vecinătate a imaginilor (sau filtrare liniară a imaginilor)


are o unică formă, transformarea T fiind combinaţia liniară ponderată a valorilor selectate
de vecinătatea utilizată.
X
g(l, c) = wmn f (l − m, c − n), cu wmn ∈ R. (3.2)
(m,n)∈V

Vecinătatea V (deci mulţimea de puncte din plan definite de coordonatele (m, n) faţă de
originea ce le este ataşată), ı̂mpreună cu mulţimea de ponderi wmn asociate punctelor
din vecinătate formează masca de filtrare (sau nucleul, sau funcţia pondere a filtrului).
Scalarii individuali wmn poartă numele de coeficienţi ai filtrului.

35
Prima observaţie ce se poate face cu privire la forma de definire a operaţiei de filtrare
liniară din (3.2) este că folosirea unor ponderi wmn nule este echivalentă cu eliminarea
din vecinătatea folosită a punctelor ce le corespund. În mod echivalent, putem modifica
ı̂n mod arbitrar forma vecinătăţii prin adăugarea unor puncte cărora le alocăm pondere
nulă, fără a modifica ı̂n vreun fel rezultatul filtrării. Aceasta conduce la suficienţa con-
siderării ı̂n practică a unor forme regulate (pătrate centrate) pentru vecinătate (fereastră
de filtrare). Orice mască poate fi extinsă cu puncte ce auÃataşat un coeficient
! nul, pentru
1/2 1/6
a rezulta o mască pătrată centrată; de exemplu, masca poate fi scrisă şi
1/6 1/6
 
0 0 0
ca  0 1/2 1/6 .
0 1/6 1/6
Din punctul de vedere al calculelor, formula de definiţie (3.2) este suma produselor punct
cu punct dintre coeficienţii wmn ataşaţi punctelor vecinătăţii reflectate şi valorile pixelilor
din imaginea originală f din zona de imagine peste care a fost suprapusă vecinătatea.
Această sumă de produse se calculează pentru fiecare punct al imaginii, deplasând masca.
Deplasarea vecinătăţii (ferestrei de filtrare) a condus la adoptarea denumirii de tehnică a
ferestrei glisante. Tehnica ferestrei glisante ı̂nseamnă plasarea originii ferestrei de filtrare
(vecinătăţii), pe rând, ı̂n fiecare pixel al imaginii şi selectarea punctelor imaginii situate
ı̂n interiorul acesteia (ne putem imagina fereastra de filtrare ca fiind o apertură ı̂ntr-o
placă opacă; ı̂ntr-o anumită poziţie a acesteia valorile selectate din imagine sunt valorile
punctelor ce se “văd” prin apertură); pentru fiecare poziţie (l, c) a ferestrei glisante se
calculează noua valoare a pixelului, g(l, c), conform (3.2). Descrierea algoritmului nu
este ı̂nsă altceva decât descrierea (poate destul de plastică) a unei operaţii de convoluţie
bidimensională, ı̂n care, prin convenţie, masca de filtrare este considerată nucleul de
convoluţie.
Din punctul de vedere al implementării practice a filtrelor liniare trebuie luate ı̂n con-
siderare două aspecte: complexitatea de calcul a operaţiei de filtrare liniară şi problema
apariţiei efectelor de margine.
Pentru o imagine de dimensiune L × C şi o mască de filtrare având K puncte (deci cu
Card(V ) = K), numărul de operaţii necesare unei filtrări liniare este de LCK ı̂nmulţiri şi
LC(K − 1) adunări, adică complexitatea de calcul este O[N 2 ], atât faţă de dimensiunile
imaginii cât şi faţă de dimensiunile ferestrei
√ de filtrare (considerând că fereastra de filtrare
ar fi pătrată, având dimensiunea K). Aceasta duce la constrângerea practică de a
folosi ferestre de filtrare cât mai mici, şi de a ı̂ncerca descompunerea ferestrelor mari de
filtrare ı̂ntr-o succesiune de ferestre mai mici (descompunere bazată pe proprietatea de
asociativitate a operaţiei de convoluţie, prin care se realizează filtrarea liniară). Spre
exemplu o filtrare cu un nucleu de 5 × 5, care ar necesita 25 de operaţii (de ı̂nmulţire)
pentru fiecare pixel, poate fi echivalată cu două filtrări succesive cu nuclee de 3 × 3 pixeli,
cu coeficienţi aleşi convenabil, filtrări succesive ce necesită numai 18 operaţii (de ı̂nmulţire)
pentru fiecare pixel.
Efectele de margine sunt caracteristice pixelilor marginali ai imaginii, ı̂n care, fereastra
de filtrare, plasată cu originea ı̂n unul dintre aceştia, “debordează” ı̂n afara imaginii,
adică, pentru anumite poziţii (l, c) de plasament al originii vecinătăţii, unele poziţii din
vecinătatea astfel deplasată nu au corespondent ı̂n suportul fizic al imaginii. Pentru

36
compensarea acestor efecte de margine sunt disponibile două soluţii: ı̂n primul rând,
pentru pixelii ı̂n care apar aceste probleme de margine, noua valoare (rezultatul filtrării
liniare) nu mai este evaluată, urmănd ca ı̂n imaginea rezultat al prelucrării aceştia să ı̂şi
păstreze valoarea din imaginea iniţială; această variantă (deşi cea mai simplă şi rapidă) are
un dezavantaj evident ı̂n cazul filtrărilor ce folosesc vecinătăţi de dimensiune importantă.
O a doua soluţie este completarea suportului spaţial al imaginii de prelucrat cu un număr
suficient de linii şi coloane, astfel ca efectul de margine să nu mai apară. Liniile şi coloanele
nou adăugate sunt completate cu valori convenabile - de cele mai multe ori valori identice
cu cele ale liniilor/ coloanelor marginale din imaginea originală.

3.1.1 Filtrarea liniară de netezire

Netezirea unei imagini are ca scop reducerea variaţiei nivelelor de gri din imagine şi, im-
plicit, creşterea uniformităţii. Aceasta ı̂nseamnă că regiunile din imagine vor căpăta un
caracter mai constant, apropiindu-se astfel de idealul unei regiuni ı̂n care toţi pixelii ce o
compun au aceeaşi valoare. Variaţiile prezente ı̂n imagine pot fi considerate ca fiind de
două tipuri: variaţii reale, puternice ale intensităţii luminoase (corespunzând contururilor
obiectelor din imagine) şi variaţii relativ mici, parazite, datorate ı̂n principal zgomotului
suprapus imaginii şi neuniformităţii intrinseci a obiectelor din scenă. O filtrare de netezire
va reduce toate aceste categorii de variaţii, având ca efect secundar ı̂nceţoşarea contu-
rurilor şi pierderea detaliilor (efect numit bluring). Figura 3.1 prezintă efectul aplicării
unui filtru liniar de netezire simplu (media aritmetică a valorilor selectate de fereastra de
filtrare) cu vecinătăţi de dimensiune diferită; se poate remarca creşterea uniformităţii (şi
uniformizării) imaginii odată cu creşterea dimensiunii ferestrei de filtrare.
Ponderile wmn care definesc un filtru liniar de netezire derivă dintr-o condiţie simplă de
normare. Să considerăm cazul particular al unei regiuni absolut uniforme din imagine,
regiune ı̂n care toţi pixelii au o aceeaşi valoare J. Desigur, uniformitatea acestei regiuni
nu mai poate fi ı̂mbunătăţită, dar operaţia de filtrare de netezire trebuie să nu modifice
valoarea constantă a pixelilor regiunii. Din exprimarea acestei condiţii rezultă relaţia de
normare a filtrelor liniare de netezire. Dacă se particularizează formula de definiţie a
filtrării liniare (3.2) pentru cazul valorilor identice ale pixelilor selectaţi de fereastra de
filtrare (f (l − m, c − n) = J), vom obţine că valoarea ce rezultă prin filtrare este:
X X
g(l, c) = wmn f (l − m, c − n) = J wmn = J.
(m,n)∈V (m,n)∈V

adică: X
wmn = 1, cu wmn ≥ 0. (3.3)
(m,n)∈V

Această condiţie (suma coeficienţilor măştii de filtrare să fie unitară) se numeşte condiţia
de normare a nucleelor de filtrare de netezire şi defineşte un astfel de nucleu.
Teoria proceselor aleatoare [11] arată că, pentru o combinaţie liniară de realizări partic-
P
K
ulare ale unei variabile aleatoare ξ, ai ξi = η, varianţa noii variabile aleatoare obţinute
i=1
η este proporţională cu varianţa variabilei aleatoare din care au provenit realizările par-
PK
ticulare: ση2 = a2i σξ2 . Deci, prin medierea a K realizări particulare ale unei variabile
i=1

37
a) b) c)

d) e) g)

Figura 3.1: a) Imagine originală; b) Rezultatul filtrării imaginii din a) cu un filtru liniar
de netezire cu fereastră de filtrare (vecinătate) de 5×5 pixeli (SNR=19.9 dB); c) Rezultatul
filtrării imaginii din a) cu un filtru liniar de netezire cu fereastră de filtrare (vecinătate)
de 11 × 11 pixeli (SNR=16.6 dB); d) Imagine degradată cu zgomot alb, gaussian, aditiv
de medie 0 şi dispersie 25 (SNR=15.7 dB); e) Rezultatul filtrării imaginii din d) cu un
filtru liniar de netezire cu fereastră de filtrare (vecinătate) de 5 × 5 pixeli (SNR=22.5 dB);
f ) Rezultatul filtrării imaginii din d) cu un filtru liniar de netezire cu fereastră de filtrare
(vecinătate) de 11 × 11 pixeli (SNR=19.7 dB).

1
aleatoare, varianţa este redusă de K ori (ai = K
).
X
σ2 2
wmn = σf2inal . (3.4)
(m,n)∈W

Proiectarea filtrului de netezire (ı̂n sensul determinării coeficienţilor wmn ) ce asigură


o reducere
P maximă a puterii de zgomot ı̂nsemnă găsirea valorilor wmn ce maximează
2
wmn , ı̂n condiţiile respectării constrâgerilor din (3.3). Se poate astfel demonstra
(m,n)∈W
că filtrul de mediere aritmetică (wmn = 1/Card(V ) = 1/K) introduce o atenuare maximă
a zgomotului alb, aditiv, gaussian suprapus imaginii.
Din punct de vedere obiectiv, la nivelul semnalului de imagine, gradul de reducere a
zgomotului poate fi măsurat prin rapoarte de calitate. Notând cu f versiunea degradată
a imaginii originale f0 (degradată fie ca efect al suprapunerii zgomotului, fie ca efect al
unei prelucrări), ambele având dimensiunea de L×C pixeli, putem defini câteva măsuri de
calitate ale imaginii f faţă de originalul f0 , obţinute prin extinderea ı̂n cazul bidimensional
a măsurilor de calitate a semnalelor: eroarea pătratică medie, eroarea absolută medie,

38
raportul semnal/ zgomot, raportul semnal de vârf/ zgomot.
L C
1 XX
M SE = (f (l, c) − f0 (l, c))2 (3.5)
LC l=1 c=1

L C
1 XX
M AE = |f (l, c) − f0 (l, c)| (3.6)
LC l=1 c=1
L P
P C
f 2 (l, c)
l=1 c=1
SN R = 10 log dB (3.7)
P
L P
C
2
(f (l, c) − f0 (l, c))
l=1 c=1
µ ¶2
LC max f0 (l, c)
l,c
P SN R = 10 log dB (3.8)
L P
P C
2
(f (l, c) − f0 (l, c))
l=1 c=1

Condiţia de normare a filtrelor de netezire (3.3) nu limitează măştile (nucleele) de filtrare


folosite la doar nucleele ce realizează media aritmetică ı̂ntr-o vecinătate pătrată, centrată
ı̂n punctul considerat. Filtrele de netezire realizează o mediere ponderată definită de pon-
deri wmn cu valori diferite. Modul de variaţie a valorilor ponderilor respectă ı̂n principiu
două reguli: originea vecinătăţii are asociată o pondere maximă, şi ponderile descresc cu
distanţa ı̂n suportul imaginii dintre punctul căruia ı̂i sunt asociate şi originea vecinătăţii.
Aceste principii reflectă cerinţa uzuală de a considera că valoarea din pixelul curent pre-
lucrat trebuie să conteze cel mai mult ı̂n determinarea noii valori a pixelului respectiv, iar
valorile pixelilor vecini pixelului curent prelucrat trebuie să contribuie ı̂ntr-o măsură mai
mică, cu atât mai mică cu cât sunt situaţi mai departe (ı̂n suportul spaţial al imaginii) de
pixelul curent prelucrat. Netezirea (şi respectiv şi ı̂nceţoşarea) introdusă ı̂n imagine de o
filtrare de mediere ponderată este ı̂ntotdeauna mai mică decât cea introdusă de o filtrare
de mediere aritmetică realizată cu aceeaşi vecinătate.
     
0 1/5 0 0 1/8 0 0.075 0.124 0.075
 1/5 1/5 1/5  ,  1/8 1/4 1/8  ,  0.124 0.204 0.124  . (3.9)
0 1/5 0 0 1/8 0 0.075 0.124 0.075

Un filtru de mediere ponderată des utilizat este filtrul gaussian de netezire, ale cărui
ponderi variază după o lege gaussiană de medie nulă şi dispersie impusă ı̂n domeniul
coordonatelor spaţiale ale punctelor ce formează vecinătatea. Ecuaţia (3.10) prezintă
forma generală a funcţiei ce generează ponderile unui filtru gaussian de netezire.
µ ¶
gmn 1 m2 + n2
wmn = P , gmn = √ exp − (3.10)
gkl σ 2π 2σ 2
(k,l)∈V

Ultima mască de filtrare prezentată ı̂n ecuaţia (3.9) este o mască gaussiană cu dispersie
1.

39
3.1.2 Filtrarea liniară de accentuare

Contrastarea unei imagini are ca obiectiv ı̂mbunătăţirea perceperii vizuale a contururilor


obiectelor (ı̂mbunătăţirea detectabilităţii componentelor scenei de-a lungul frontierelor
acestora). În principiu, acest deziderat se poate realiza prin modificarea valorilor pixelilor
aflaţi de o parte şi de alta a unei frontiere comune, prin măsurare şi mărirea diferenţelor de
valoare dintre pixelii vecini. La bază, o asemenea tehnică va folosi o operaţie de derivare.
Pentru deducerea condiţiei de definiţie a unui operator liniar de derivare, să considerăm
cazul particular al unei regiuni absolut uniforme din imagine, regiune ı̂n care toţi pixelii
au o aceeaşi valoare J. Desigur, contrastul ı̂n această regiune nu poate fi ı̂mbunătăţit
(ı̂ntrucât nu există nici o diferenţă ı̂ntre valorile pixelilor), iar operaţia de filtrare derivativă
realizată după (3.2) nu poate decât să aibă un rezultat nul. Din exprimarea acestei condiţii
rezultă relaţia de normare a filtrelor liniare de derivare. Dacă se particularizează formula
de definiţie a filtrării liniare (3.2) pentru cazul valorilor identice ale pixelilor selectaţi de
fereastra de filtrare (f (l − m, c − n) = J), vom obţine că valoarea ce rezultă prin filtrare
este:
X X
g(l, c) = wmn f (l − m, c − n) = J wmn = 0.
(m,n)∈V (m,n)∈V

adică:
X
wmn = 0 (3.11)
(m,n)∈V

Această condiţie (suma coeficienţilor măştii de filtrare să fie nulă) se numeşte condiţia de
normare a nucleelor de filtrare de derivare şi defineşte un astfel de nucleu.
O experienţă de percepţie vizuală subiectivă (“benzile lui Mach”) a pus ı̂n evidenţă faptul
că sistemul vizual uman are tendinţa de a adânci profilul zonelor de tranziţie dintre
regiuni uniforme. Studiul fiziologiei sistemului vizual a demonstrat că acesta se realizează
prin prelucrări de tip derivativ ce apar ı̂n diferitele etape pe care le parcurge informaţia
vizuală; efectul global poate fi descris ca scăderea din semnalul original a unei derivate
secunde a acestuia, ponderată corespunzător (aşa cum prezintă figura 3.2, pentru cazul
unidimensional - secţiunea unei frontiere ı̂ntre regiunile imaginii).
Implementarea unei derivate secunde pentru cazul discret va trebui să ia ı̂n considerare
existenţa a două direcţii de derivare de bază şi modul de definire a derivatei ı̂n cazul discret
(de exemplu prima derivată pe direcţia orizontală poate fi f 0 (m, n) = f (m, n+1)−f (m, n)
sau f 0 (m, n) = f (m, n) − f (m, n − 1) sau f 0 (m, n) = f (m, n + 1) − f (m, n − 1)). Măşti
obişnuite de implementare a unei derivate secunde bidirecţionale (operator Laplacian)
sunt prezentate ı̂n ecuaţia (3.12) [33], [68], [21]:
     
0 1/4 0 −1/4 1/2 −1/4 1/8 1/8 1/8
 1/4 -1 1/4  ,  1/2 -1 1/2  ,  1/8 -1 1/8  . (3.12)
0 1/4 0 −1/4 1/2 −1/4 1/8 1/8 1/8

Figura 3.3 prezintă folosirea tehnicii de ı̂mbunătăţire a contrastului unei imagini prin
scăderea laplacianului.

40
a)

b)

c)

d)

Figura 3.2: a) Profil de tranziţie puţin abrupt; b) Prima derivată a funcţiei din a), maxi-
mul acesteia este larg şi nu permite identificarea precisă a mijlocului tranziţiei; c) derivata
a doua a funcţiei din a) trece prin zero ı̂n centrul tranziţiei; d) funcţia originală din a)
(reprezentată cu linie punctată) din care s-a scăzut o versiune scalată a derivatei a doua
c), obţinând efectul de adâncire a tranziţiei.
41
a) b)

Figura 3.3: a) Imagine iniţială neclară (provine din filtrarea de mediere aritmetică a unei
imagini de calitate); b) Rezultatul filtrării imaginii din a) cu un filtru liniar de contrastare
(imagine - laplacianul imaginii) (SNR=22.86 dB, PSNR=26.44 dB). Laplacianul folosit
a fost implementat după masca din ecuaţia (3.12) a).

3.2 Filtrarea neliniară

Operaţiile de filtrare studiate până ı̂n prezent au fost caracterizate esenţial (din punct
de vedere matematic) de către principiul liniarităţii (sau superpoziţiei). O bună parte
a aplicaţiilor curente de prelucrare a imaginilor probabil că se pot rezolva suficient de
precis folosind doar operaţii liniare. Limitările operaţiilor liniare de filtrare apar ı̂nsă ı̂n
momentul ı̂n care se consideră zgomote ce nu au distribuţie normală, şi, mai mult, nu mai
sunt aditive.
Exemplul cel mai simplu de astfel de zgomot este zgomotul impulsiv, caracterizat de im-
pulsuri pozitive şi negative de amplitudine maxim posibilă (relativ la numărul de nivele de
cuantizare ale imaginii) care afectează prin ı̂nlocuire o parte din pixelii imaginii. Aceasta
ı̂nseamnă că imaginea va fi uniform acoperită de puncte foarte ı̂nchise (negre) şi foarte
deschise (albe), rezultatul fiind ceea ce se numeşte zgomot de tip sare şi piper (vezi figura
3.4). Asemenea erori apar ı̂n porţiunile de achiziţie şi transmisiune ale sistemului de pre-
lucrarea şi analiza imaginilor (din cauza erorilor ı̂n convertorul analog-digital, din cauza
erorilor de ı̂nregistrare pe mediile magnetice de stocare sau de pe canalul de transmisiune);
este posibil ca asemenea valori să apară şi ca urmare a unui zgomot aditiv caracterizat de
o distribuţie “cu coadă lungă” - deci care asigură probabilităţi nenule de apariţie a unor
valori mult diferite de medie. Aceste valori aberante (mult mai mari sau mai mici decât
valorile normale ale regiunii ı̂n care apar) sunt numite outlier : valori extreme sau erori
grosiere. Dacă o asemena imagine ar fi filtrată liniar (cu un filtru de mediere sau poate
cu un filtru de reliefare) rezultatul ar fi o accentuare a punctelor de zgomot şi o corupere
a punctelor cu valori corecte din jurul lor.
Zgomotul impulsiv nu este singurul model de degradare neliniară: există zgomote depen-
dente de valoarea imaginii din pixelul afectat, precum şi compuneri neaditive ale zgomo-
tului cu imaginea originală (multiplicativă, convolutivă) [33].
Este deci evident că se impune considerarea şi a altor metode de filtrare, care nu mai res-
pectă principiul superpoziţiei, şi sunt deci neliniare. O clasă esenţială de astfel de metode

42
a) b)

Figura 3.4: a) Imagine degradată cu zgomot de tip sare şi piper ı̂n proporţie de 5%; b)
rezultatul filtrării cu un filtru de mediere aritmetică cu fereastră de 3 × 3 pixeli; mânjirea
imaginii ı̂n jurul punctelor de zgomot este evidentă.

de filtrare sunt cele bazate pe ordonare – rank order filtering [46]. Ideea esenţială este
aceea că operaţia de ordonare plasează valorile aberante (extremale) la capetele şirului de
valori (deci ı̂ntr-o zonă bine definită), permiţând astfel identificarea şi eliminarea acestora.
Filtrele de ordine sunt operatori locali: filtrul este definit de o fereastră (mască), care
selectează din imaginea de prelucrat un număr de vecini ai pixelului curent (se respec-
tă deci acelaşi model de prelucrare al ferestrei glisante, ı̂ntâlnit şi la filtrările liniare ı̂n
domeniul spaţial). Valorile selectate de fereastra de filtrare sunt apoi ordonate crescător;
dacă valorile selectate de o fereastră cu K poziţii sunt {x1 , x2 , ..., xK }, atunci acelaşi set
de valori, ordonate crescător, este {x(1) , x(2) , ..., x(K) }. Valorile x(i) se numesc statistici de
ordine de ordinul i şi au proprietatea

x(1) 6 x(2) 6 ... 6 x(K) (3.13)

În mod evident statistica de ordinul 1, x(1) , este valoarea minimă, iar statistica de ordinul
K, x(K) , este valoarea maximă.
Ieşirea filtrului de ordine de ordin k este statistica de ordinul k, cu k ∈ [1; K]:

rankk {x1 , x2 , ..., xK } = x(k) (3.14)

În acest fel, ieşirea unui filtru de ordine este una dintre valorile selectate de fereastra de
filtrare, şi deci nu se crează la ieşire valori noi (aşa cum se ı̂ntâmplă la filtrarea liniară);
acesta este un avantaj atât ı̂n ceea ce priveşte păstrarea valorilor originale din imagine,
cât şi din punctul de vedere al simplificării calculelor (nu mai sunt necesare operaţii cu
numere reale, ce trebuie apoi rotunjite sau truncheate la numere naturale).
Filtrele de ordine nu sunt liniare din cauza operaţiei de ordonare (ce nu respectă principiul
superpoziţiei); ı̂n general putem scrie:

rankk {x1 +y1 , x2 +y2 , ..., xK +yK } 6= rankk {x1 , x2 , ..., xK }+rankk {y1 , y2 , ..., yK } (3.15)

Filtrele de ordine comută ı̂nsă cu operaţiile de modificare liniară a valorilor:

rankk {αx1 + β, αx2 + β, ..., αxK + β} = αrankk {x1 , x2 , ..., xK } + β (3.16)

43
Proprietăţile deterministe ale filtrelor de ordine se referă la comportamentul acestora
ı̂n zonele tipice ale unei imagini: porţiuni netede şi contururi. Filtrele de ordine nu
afectează contururile (zonele de pantă abruptă) şi păstează valoarea zonelor uniforme.
Aceste comportări au fost extinse la investigarea clasei mai generale de semnale rădăcină
– semnale ce nu sunt modificate prin filtrare. Orice secvenţă {xi } monotonă (crescătoare
sau descrescătoare) de lungime cel puţin K este un semnal rădăcină pentru un filtru de
ordine definit ı̂ntr-o vecinătate de K puncte. În plus, filtrele de ordine comută cu orice
funcţie monotonă g:
rankk (g(xi )) = g(rankk (xi ))

3.2.1 Filtrul median

Filtrul median este un filtru de ordine a cărui ieşire este statistica de ordine de ordin
central a setului de valori selectate de fereastra de filtrare.
(
x( K+1 ) dacă K este impar
median{x1 , x2 , ..., xK } = 1
2
(3.17)
x
2 (K )
+ 12 x( K +1) dacă K este par
2 2

Ieşirea filtrului median este deci valoarea din centrul secvenţei ordonate; ı̂n cazul
secvenţelor (ferestrelor de filtrare) de dimensiune pară, această poziţie centrală nu e-
xistă, şi atunci este definită ca media aritmetică a valorilor vecine centrului imaginar. În
practică, filtrul median se foloseşte doar cu ferestre de filtrare de dimensiune impară, ceea
ce conduce la posibilitatea de a scrie:
median{x1 , x2 , ..., xK } = rank K+1 {x1 , x2 , ..., xK } (3.18)
2

Aceasta ı̂nseamnă că dacă fereastra de filtrare are 3 puncte, medianul este statistica de
ordinul 2, pentru o fereastră filtrare cu 9 puncte, medianul este statistica de ordinul 5,
iar pentru o fereastră de filtrare de 25 de puncte, medianul este statistica de ordinul 13.
Figura 3.5 prezintă rezultatul filtrării cu un filtru median cu fereastră pătrată de 3 × 3
puncte a imaginii degradate cu zgomot impulsiv din figura 3.4.
Efectele de filtrare a zgomotului impulsiv (de tip sare şi piper) sunt evidente; valorile
punctelor de zgomot sunt 0 sau 255 şi deci, după ordonare, se vor afla la “capetele”
şirului de valori; ieşirea filtrului median, fiind statistica de ordin central, este situată
departe de valorile extreme. În imaginea filtrată median (figura 3.5) se observă totuşi
existenţa unor puncte albe şi negre (puncte de zgomot) ce nu au putut fi eliminate prin
filtrare; spunem că ı̂n acele poziţii filtrul a fost străpuns de impulsuri (care deci au ajuns
la ieşirea filtrului). Probabilitatea de străpungere a unui filtru median este dependentă de
procentul de puncte de zgomot din imagine şi de dimensiunea ferestrei de filtrare folosite.
Străpungerea filtrului median se produce atunci când ı̂n fereastra de filtrare avem mai
mult de (K + 1)/2 impulsuri de zgomot de acelaşi fel.

3.2.2 Filtre de ordine de domeniu

Filtrele de ordine de domeniu (filtre LUM – Lower-Upper-Middle [26]) introduc o posi-


bilitate de reglare a filtrelor de ordine şi adaptare a acestora pentru cele două operaţii de
bază de prelucrare a imaginilor: netezirea şi respectiv contrastarea.

44
a) b)

Figura 3.5: Rezultatul filtrării imaginii degradate cu zgomot impulsiv din figura 3.4 cu: a)
un filtru median cu fereastră de 3 × 3 pixeli; b) un filtru de ordine de rang 2 cu fereastră
de 3 × 3 pixeli.

Pentru un filtru LUM de netezire, valoarea nou calculată pentru fiecare pixel din imaginea
prelucrată g(l, c) = y este definită ca:

 x(k) , dacă x∗ < x(k)
y= x(K−k+1) , dacă x∗ > x(K−k+1) (3.19)
 ∗
x , ı̂n rest

unde x∗ este valoarea ce corespunde originii ferestrei de filtrare cu K poziţii (deci este
valoarea originală pixelului curent prelucrat, f (l, c) = x∗ ), iar k este parametrul de reglaj
al filtrului. Valoarea k este un ı̂ntreg din intervalul [0; K+1
2
]; dacă k = 0 filtrul de comportă
ca un filtru trece tot (y = x∗ ), iar dacă k = K+1
2
, filtrul este un filtru median (y = x( K+1 ) ).
2

Pentru un filtru LUM de contrastare, valoarea nou calculată pentru fiecare pixel din
imaginea prelucrată g(l, c) = y este definită ca:
 x(l) +x(K−k+1)
 x(k) , dacă x(l) < x∗ < 2
x +x
y= x(K−k+1) , dacă (k) (K−k+1) < x∗ < x(K−k+1) (3.20)
 ∗ 2
x , ı̂n rest

unde x∗ este valoarea ce corespunde originii ferestrei de filtrare cu K poziţii (deci este
valoarea originală pixelului curent prelucrat, f (l, c) = x∗ ), iar k este parametrul de reglaj
al filtrului. Valoarea k este un ı̂ntreg din intervalul [0; K+1
2
]; dacă k = 0 filtrul de comportă
K+1
ca un filtru de reliefare extremă, iar dacă k = 2 , filtrul este un filtru trece tot (y = x∗ ).
Figura 3.6 prezintă rezultatele aplicării filtrelor LUM de netezire şi respectiv de con-
strastare.

3.2.3 L-filtre

L-filtrele [46] au fost introduse din dorinţa de a oferi o mai mare flexibilitate operaţiilor
de filtrare neliniară bazate pe ordonare; pasul firesc de dezvoltare a fost combinarea

45
a) b)

Figura 3.6: a) Rezultatul filtrării imaginii degradate cu zgomot impulsiv din figura 3.4 a)
cu un filtru LUM de netezire cu fereastră de 3 × 3 pixeli şi factor de reglaj 3 (ı̂ntre filtrul
trece-tot şi filtrul median); b) Rezultatul filtrării imaginii fără contrast din figura 3.3 a) cu
un filtru LUM de contrastare cu fereastră de 3 × 3 pixeli şi factor de reglaj 1 (contrastarea
maximă).

tuturor statisticilor de ordine ı̂n valoarea de la ieşirea filtrului. Ieşirea unui L-filtru este o
combinaţie liniară a statisticilor de ordine:
K
X
L({x1 , x2 , ..., xn }) = wi x(i) (3.21)
i=1

Este evident că prin varierea coeficienţilor wi se pot obţine diferite filtre, inclusiv filtrele
de ordine (un singur coeficient egal cu 1, iar restul coeficienţilor nuli). Coeficienţii celor
mai uzuale L-filtre sunt prezentaţi ı̂n tabelul 3.1

Filtru Coeficienţi
Filtru de ordine de ordin k, rankk ak = 1, ai = 0, i 6= k
k ∈ [1, K]
Filtru de mediere aritmetică ai = 1/n
Filtru de mijloc a1 = aK = 0.5, ai = 0, i ∈
/ {1, K}
Filtru de cvasi-mijloc ak = aK+1−k = 0.5, ai = 0, i ∈
/ {k, K + 1 − k}
k ∈ [1, K]
Medie α-reglabilă ai = 1/[2αK − 1], i ∈ [ K+1
2
− αK + 1; K+1
2
+ αK]
α ∈ (0, 1/2) / [ K+1
ai = 0, i ∈ 2
− αK + 1; K+1
2
+ αK]

Tabela 3.1: Coeficienţii celor mai uzuale L-filtre.

Se poate demonstra cu uşurinţă că, coeficienţii L-filtrelor trebuie să ı̂ndeplinească ace-
leaşi condiţii de normare ca şi coeficienţii filtrelor liniare: să aibă suma 1 pentru un filtru
de netezire (similar cu condiţia (3.3)) şi suma 0 pentru un filtru de reliefare (similar cu
condiţia (3.11)). Toate filtrele prezentate ı̂n tabelul 3.1 sunt deci filtre de netezire, al

46
căror scop este mărirea uniformităţii regiunilor imaginii prin eliminarea diferitelor zgo-
mote suprapuse acesteia. Tabelul 3.2 prezintă filtrele cele mai potrivite pentru eliminarea
diferitelor tipuri de zgomote.

Tip zgomot Filtru


impulsiv (sare şi piper) filtru de ordine (median, maxim, minim)
gaussian filtru de mediere aritmetică
impulsiv + gaussian filtru de tip medie α-reglabilă
uniform filtru de mijloc

Tabela 3.2: L-filtre utilizate pentru reducerea diferitelor tipuri de zgomote.

Un exemplu simplu de filtru de reliefare este gradientul morfologic – diferenţa dintre


valoarea maximă şi minimă din fereastra de filtrare curentă:

grad{x1 , x2 , ..., xK } = x(K) − x(1)

Figura 3.7 prezintă rezultatele aplicării unor L-filtre de netezire, şi, respectiv, de con-
trastare.

3.3 Filtrarea adaptivă

Termenul de adaptiv se referă la capacitatea filtrului de a-şi ajusta comportarea (care este
determinată de caracteristicile sale de definiţie) ı̂n funcţie de anumite cerinţe ce definesc
conceptul de calitate a imaginii filtrate (de exemplu ı̂n sensul apropierii ei de imaginea
nedegradată din care provine). În mod uzual, la prelucrarea semnalelor unidimensionale,
măsurile de calitate utilizate sunt eroarea pătratică medie (sau raportul semnal/ zgomot).
Aceleaşi măsuri se pot folosi şi ı̂n cazul imaginilor, acestora putându-li-se adăuga măsuri
subiective de tipul confortului vizual al unui observator, pentru care imaginea dată arată
bine, sau mai bine decât o alta.
Prin procesul de adaptare, ı̂n fiecare nou punct prelucrat structura filtrului este alta,
luând ı̂n considerare caracteristicile locale pixelului curent prelucrat. Atâta timp cât (cel
puţin teoretic) ı̂n fiecare punct al imaginii operaţia este diferită (deoarece se face cu un
filtru diferit), filtrarea globală nu mai este liniară, chiar dacă structura filtrului se bazează
ı̂n fiecare punct pe o combinaţie liniară a valorilor selectate de fereastra de filtrare.
În cazul folosirii structurii de filtru liniar ca structură de bază a unui filtru adaptiv,
adaptarea nu poate urmări decât două variante: modificarea formei ferestrei de filtrare 1 ,
sau modificarea coeficienţilor unei ferestre de filtrare de formă fixată.
1
După cum arătat şi ı̂n secţiunea 3.1, la pagina 35, introducerea de coeficienţi de ponderare nuli are
ca efect modifcarea forma ferestrei de filtrare, fără modificarea rezultatelor filtrării. Din acest punct
de vedere am putea considera că este suficientă considerarea cazului de adaptare doar a coeficienţilor
filtrului.

47
a) b) c)

d) e) f)

Figura 3.7: Rezultatul filtrării imaginii degradate cu zgomot mixt (impulsiv şi gaussian)
din figura a) cu: b) un filtru median cu fereastră de 3 × 3 pixeli, c) un L-filtru de netezire
de tip α-median cu fereastră de 3 × 3 pixeli şi α = 0.25. Rezultatul filtrării imaginii
din a) cu L-filtre de tip derivativ: d) gradient morfologic (x(9) − x(1) ); e) x(6) − x(4) ; f )
P8 P
4
x(i) − x(i) . Reprezentarea valorilor este făcută după o scară inversată: valorile mari
i=6 i=2
sunt reprezentate cu nuanţe ı̂nchise, valorile mici sunt reprezentate cu nuanţe deschise;
se observă că filtrele derivative marchează frontierele obiectelor din imagine.

48
3.3.1 Adaptarea formei vecinătăţii

Filtrarea de netezire este evaluată prin diferenţele introduse faţă de imaginea care se fil-
trează; dacă diferenţele dintre imaginea filtrată şi cea dinainte de filtrare sunt prea mari
este posibil ca filtrul de netezire să fi ı̂nceţoşat contururi din imagine. Presupunerea colate-
rală este că zgomotul este mai slab decât contururile imaginii şi că variaţiile datorate zgo-
motului sunt mai mici decât variaţiile dintre valorile regiunilor alăturate. Implementarea
acestei categorii de filtre foloşeste un “comutator” ı̂ntre mai multe valori posibile de după
filtrare, corespunzând unor praguri de acceptare a variaţiilor.
Ideea de a accepta valoarea produsă de medierea valorilor selectate de fereastra filtrului
numai dacă acestă valoare este suficient de apropiată de valoarea originală se poate aplica
şi pentru filtrarea de netezire cu fereastră şi coeficienţi ficşi [21]. În acest caz rezultatul
netezirii ı̂ntr-un punct va fi acceptat doar dacă diferenţa faţă de valoarea originală este
mai mică decât un prag impus:
 ¯ ¯
 ¯ ¯
 P ¯ P ¯
wmn f (l − m, c − n), dacă ¯f (l, c) − wmn f (l − m, c − n)¯ < T
g(l, c) = (m,n)∈W ¯ (m,n)∈W ¯


f (l, c), ı̂n rest

Adaptarea presupune deci comutarea ı̂ntre un filtru de mediere [aritmetică] şi un filtru
trece-tot.
Exemplul cel mai folosit de modificare a formei ferestrei de filtrare este filtrul de netezire
direcţională adaptivă [33]. Termenul de filtrare direcţională se referă la forma puternic
orientată a ferestrei de filtrare (deci fereastra de filtrare nu mai este pătrată, ci va avea
o formă liniară, orientată după o anumită direcţie). Pentru fiecare punct al imaginii
se pot considera mai multe orientări (deci mai multe direcţii) posibile pentru masca de
mediere. Pentru fiecare dintre direcţiile alese se obţine ı̂n urma filtrării o valoare. În mod
ideal, dorim ca valoarea obţinută prin filtrare să nu difere ı̂n mod semnificativ de valoarea
iniţială din pixelul considerat. O diferenţă semnificativă poate ı̂nsemna că punctul curent
este situat pe un contur, şi acceptarea acestei valori mult diferite de cea iniţială produce
efectul de ı̂nceţoşare a imaginii (caracteristic oricărei filtrări de netezire). Soluţia adusă
de filtrul adaptiv este de a alege din setul de valori obţinute pentru diferitele ferestre de
filtrare pe aceea care este cea mai apropiată de valoarea iniţială din punctul curent. Dacă
notăm cu Wi măsţile asociate diferitelor orientări şi cu gi (l, c) rezultatul filtrării imaginii
zgomotoase f ı̂n punctul (l, c) cu masca Wi , putem scrie atunci că:

g(l, c) = gk (l, c), unde k = arg min {kgi (l, c) − f (l, c)k} (3.22)

Figura 3.8 prezintă rezultatul filtrării unei imagini zgomotoase cu filtre ce ı̂şi adaptează
forma vecinătăţii.

3.3.2 Adaptarea ponderilor - filtrul LLMMSE

O variantă clasică de filtrare liniară adaptivă, realizată prin recalcularea coeficienţilor


măştii de filtrare ı̂n fiecare punct al imaginii este prezentată ı̂n [71]. Acest filtru este

49
a) b)

c) d)

e) f)

Figura 3.8: a) Imagine degradată cu zgomot alb, aditiv, gaussian. b) Rezultatul filtrării
imaginii din a) cu un filtru de medie aritmetică cu fereastră de 3×3 pixeli (SNR=20.7 dB).
c) Rezultatul filtrării imaginii din a) cu un filtru adaptiv fereastră de 3×3 pixeli descris de
(3.3.1) (SNR=17.35 dB). Numai 52% dintre pixelii imaginii sunt prelucraţi prin mediere
aritmetică, introducând diferenţe mai mici de 15 faţă de imaginea zgomotoasă iniţială. d)
Rezultatul filtrării imaginii din a) cu un filtru adaptiv fereastră de 3 × 3 pixeli descris de
(3.22) (SNR=19.46 dB). e) Imagine a orientării vecinătăţilor alese de filtrul descris de
(3.22) din d); f ) Detaliu din e) din colţul stânga sus al imaginii: se pot observa ı̂n jurul
conturului circular al biscuitelui zonele ı̂n care sunt alese vecinătăţi cu diferite orientări,
urmărind conturul obiectului.

50
o combinaţie liniară convexă a imaginii zgomotoase şi a imaginii obţinute din aceasta
printr-o filtrare liniară de mediere (cu fereastră constantă), adică:
g(l, c) = αf (l, c) + (1 − α(l, c))f (l, c) (3.23)
Acronimul LLMMSE provine de la denumirea engleză Locally Linear Minimal Mean
Squared Error, adică filtru local liniar ce minimizează eroarea pătratică medie. După
cum se poate remarca din ecuaţia (3.23), coeficientul α de mixare a imaginii zgomotoase
f şi a variantei sale filtrate f va trebui determinat ı̂n fiecare punct (l, c) al imaginii. În
cele ce urmează vom omite din ecuaţii scrierea explicită a coordonatelor punctului curent
de prelucrat, (l, c).
Imaginea zgomotoasă f provine dintr-o imagine corectă f0 , la care s-a adăugat un zgomot
alb, aditiv (f = f0 + z), de medie nulă z (z = 0) şi necorelat cu imaginea (zf = zf = 0).
Atunci ecuaţia (3.23) devine:
g = α(f0 + z) + (1 − α)(f0 + z) = αf0 + αz + (1 − α)f0 (3.24)

Ceea ce defineşte filtrul adaptiv este coeficientul α; acesta este calculat local impunând
optimizarea unei măsuri de calitate obiective - eroarea pătratică medie dintre imaginea
originală f0 şi rezultatul filtrării g.
¡ ¢2
ε2 = (g − f0 )2 = αz + (α − 1)(f0 − f0 ) = α2 z 2 +2α(α−1)zf0 −2α(α−1)zf0 +(α−1)2 (f0 −f0 )2

ε2 = α2 z 2 + 2α(α − 1)zf0 − 2α(α − 1)zf0 + (α − 1)2 (f0 − f0 )2 = α2 z 2 +(α−1)2 (f0 − f0 )2


ε2 = α2 σz2 + (α − 1)2 σf20 (3.25)

Formula (3.25) arată că eroarea pătratică medie este suma ponderată dintre varianţa
(puterea) zgomotului σz2 şi varianţa imaginii originale σf20 . Găsirea coeficientului α optim
ı̂nseamnă găsirea minimului lui ε2 , deci anularea derivatei acestuia.
dε2
= 2ασz2 + 2(α − 1)σf20 = 0

σf20 σz2
α= = 1 − (3.26)
σf20 + σz2 σf2
De aici rezultă expresia finală a filtrului:
à !
σ2 σz2
g= 1 − z2 f+ f (3.27)
σf σf2

Se observă că trebuie cunoscute puterea de zgomot şi varianţa locală (ı̂n fiecare punct) a
imaginii zgomotoase. Adaptarea se face ı̂ntre două cazuri limită: dacă puterea de zgomot
este mult mai mare decât varianţa valorilor imaginii originale (σz2 À σf20 ) atunci, din
prima parte a formulei (3.26) rezultă α = 0 şi deci filtrul optim este un simplu filtru de
mediere; dacă varianţa valorilor din imagine este mult mai mare decât puterea de zgomot
(σf2 À σz2 , deci este de presupus că punctul curent considerat este situat pe un contur)
atunci α = 1 şi filtrul optim este un filtru identitate (trece tot). Acest comportament
poate fi interpretat şi prin aceea că α este o măsură a variaţiei locale de intensitate din
imagine, şi deci este un indicator al contururilor din imagine (după cum se poate observa
şi din figura 3.9).

51
a) b)

c) d)

Figura 3.9: a) Imagine degradată cu zgomot alb, aditiv, gaussian. b) Rezultatul filtrării
imaginii din a) cu un filtru de medie aritmetică cu fereastră de 3 × 3 pixeli (SNR=24
dB). c) Coeficientul de mixare α din filtrarea LLMMSE calculat pentru imaginea din
figura a). Reprezentarea valorilor este făcută după o scară inversată: valorile mari sunt
reprezentate cu nuanţe ı̂nchise, valorile mici sunt reprezentate cu nuanţe deschise. d)
Rezultatul filtrării imaginii din a) cu un filtru LLMMSE cu fereastră de 3 × 3 pixeli
(SNR=27.4 dB).

52
3.3.3 Adaptarea ponderilor - filtrul bilateral

Filtrul bilateral a fost propus recent [61] ca un mod de a realiza o filtrare de netezire
adaptivă, ce păstrează contururile din imagine şi care grupează local valorile selectate
de fereastra de filtrare ı̂ntr-o combinaţie liniară. Ponderile combinaţiei liniare sunt ı̂nsă
calculate ı̂n fiecare pixel, pe baza unei duble ponderări gaussiene: ı̂n funcţie de poziţia
spaţială fiecărui pixel ı̂n fereastra de filtrare şi ı̂n funcţie de similaritatea valorii fiecărui
pixel cu valoarea pixelului curent prelucrat (centrul ferestrei de filtrare). În cazul folosirii
unei ferestre de filtrare V de formă fixată, putem scrie următoarele:
X
g(l, c) = wmn (l, c)f (l − m, c − n), cu wmn (l, c) ∈ R. (3.28)
(m,n)∈V

X
wmn (l, c) = wpos,mn (l, c) × wval,mn (l, c)/ wpos,ij (l, c) × wval,ij (l, c); (3.29)
(i,j)∈V
µ ¶
1 m2 + n2
wpos,mn (l, c) = √ exp − 2
; (3.30)
σpos 2π 2σpos
µ ¶
1 (f (l − m, c − n) − f (l, c))2
wval,mn (l, c) = √ exp − 2
; (3.31)
σval 2π 2σval
Figura 3.10 prezintă rezultatul aplicării filtrului bilateral, cu diferiţi parametri, pentru
netezirea unei imagini degradate de zgomot alb, aditiv, gaussian. Se poate remarca faptul
că imaginea este cu atât mai clară cu cât parametrii de dispersie a funcţiilor gaussiene
ce generează ponderile de similaritate a valorilor şi de apropiere cu centrul ferestrei de
filtrare sunt mai mici. În acelaşi timp, performanţa filtrului bilateral este superioară
filtrului de mediere aritmetică realizat ı̂n aceeaşi fereastră de filtrare, atât din punctul de
vedere a calităţii perceptuale a imaginii obţinute, cât şi din punctul de vedere al raportului
semnal-zgomot.
Principiul pe care se bazează funcţionarea filtrului bilateral este de a folosi pentru calculul
noii valori a unui pixel doar acele valori din vecinătatea acestuia care au valori suficient
de apropiate cu valoarea sa (păstrarea valorilor apropiate fiind realizată prin coeficienţii
de ponderare daţi de (3.31)); astfel se evită medierea valorilor situate de o parte şi alta a
contururilor.

3.4 Filtrarea morfologică

Operatorii morfologici au fost construiţi pornind de la un punct de vedere deosebit de cel


adoptat până ı̂n momentul de faţă; anume, se va modifica modelul matematic al imaginii
de la o funcţie definită pe un domeniu D din R2 sau din Z2 la o mulţime. În particular,
cum o imagine binară este o funcţie cu două valori, (de exemplu 0 şi 1), ea poate fi privită
drept funcţia caracteristică a unei submulţimi din D. Astfel ajungem să identificăm o
imagine binară cu o submulţime, iar prelucrările imaginilor binare se pot exprima, ı̂n
mod natural, prin operaţii asupra mulţimilor (operaţii ansambliste). Un obiect dintr-o
imagine binară este o mulţime conexă, care ı̂l defineşte implicit şi ca formă; operaţiile
asupra mulţimilor modifică formele – de unde denumirea de operatori morfologici, iar

53