Sunteți pe pagina 1din 29

1.

Ajustarea contrastului

- Introducere
Procesele de imbunatatire a imaginilor constau intr-o colectie de tehnici ce
urmaresc sa modifice perceptia vizuala sau sa converteasca imaginea intr-o forma
mai potrivita pentru a fi analizata de oameni sau de calculatoare. In scopul analizei,
definirea tehnicilor de imbunatatire a imaginilor se refera la extragerea informatiei.
Spre exemplu, un astfel de sistem ar putea pune in evidenta contururile unor obiecte
dintr-o imagine. Imaginea rezultata ar putea fi utilizata la intrarea unei masini ce
traseaza contururile si realizeaza anumite masuratori de forma si dimensiune. In
aceasta aplicatie, imbunatatirea imaginilor are drept scop punerea in evidenta a
formelor existente in imaginea originala si astfel, simplificarea procesului de extragere
a informatiei din imagine.

- Ajustarea contractului
Unul din cele mai intalnite defecte ale imaginilor fotografice sau electronica este
lipsa de contrast, rezultat in urma unei reduceri, poate neliniare a intervalului de
amplitudine a imaginii. Contrastul poate fi cel mai des imbunatatit prin rescalarea
amplitudinii fiecarui pixel.
Ajustarea contrastului pentru imaginea de intrare va fi realizata prin rescalarea intensitatii
(nivelului de gri) a fiecarui pixel.
Primul pas presupune determinarea nivelului minim si
maxim de tonuri de gri pentru imaginea data. Apoi pentru fiecare pixel se va rescala valoarea
astfel incat aceasta sa fie in noul interval de intensitati [a,b]. Se va folosi urmatoarea
formula:

IN = (b-a) * (IO -min) / (max-min) + a

• IN - noua intensitate;
• IO – intensitatea originala;
• min – intensitatea minima a unui pixel din imagine (cea mai inchisa);
• max – intensitatea maxima a unui pixel din imagine (cea mai deschisa);
• a – noua intensitate minima;
• b – noua intensitate maxima;

Imaginea de iesire nu va avea toate nivele din intervalul imaginii de intrare si anumite
tranzitii de nivel de gri vor fi mai mari decat in imaginea originala.

In urma acestei procesari poate rezulta un efect de conturare in nivele de gri, rezultand o
imagine care poate fi analizata mai usor de oameni sau de software specializat.

2. Scalarea amplitudinii
- Introducere
Procesele de imbunatatire a imaginilor constau intr-o colectie de tehnici ce
urmaresc sa modifice perceptia vizuala sau sa converteasca imaginea intr-o forma
mai potrivita pentru a fi analizata de oameni sau de calculatoare. In scopul analizei,
definirea tehnicilor de imbunatatire a imaginilor se refera la extragerea informatiei.

- Scalarea amplitudinii
O imagine procesata numeric poate ocupa un interval diferit de intervalul imeginii
originale. De fapt, intervalul numeric al unei imagini procesate poate cuprinde valori
negative, ce nu pot fi transferate direct in interval ale intensitatii luminoase.
Exemple de rescalare a imaginilor:

Mai sus sunt prezentate unele posibilitati de scalare a unei imagini procesate in
domeniul de valori ocupate de imaginea originala.
Folosind prima tehnica, imaginea rezultata este transformata liniar in intreg
domeniul de intrare.
Cea de-a doua tehnica prezentata, transforma valorile extreme ale amplitudinii
imaginii rezultate in limitele maxime si minime ale imaginii originale. Cea de-a doua
tehnica este de preferat primei, mai ales in situatiile in care imaginea contine un
numar mic de pixeli care depasesc limitele. Algorimtii de imbunatatire a contrastului
au o optiune de taiere a unui procent din valorile amplitudinii in fiecare capat al
intervalului de amplitudine. In aplicatii de procesare de imagine medicala, aceasta
operatie de modificare a contrastului este numita transformare nivel-fereastra.
Nivelul este aflat pe punctual c pe axa de intrare, iar valoarea ferestrei este latimea
pantei, b-a.
Cea de-a treia tehnica de scalare a amplitudinii, utilizeaza o transformare a
valorii absolute pentru a vizualiza o imagine cu valori negative ale pixelilor. Aceasta
este utila sistemelor ce utilizeaza conventia de complement fara de doi pentru
reprezentarea amplitudinii.
Un alt procedeu ce este folosit este extinderea contrastului unei imagini. Aceasta
se realizeaza in urma taierii din imagine a unor nivele de gri si rescalarea celor
ramase, rezultand astfel o imagine a carei histograma ocupa aproape toate nivelele
de gri din scara.
3. Modificarea de contrast

- Introducere
Procesele de imbunatatire a imaginilor constau intr-o colectie de tehnici ce
urmaresc sa modifice perceptia vizuala sau sa converteasca imaginea intr-o forma mai
potrivita pentru a fi analizata de oameni sau de calculatoare. In scopul analizei,
definirea tehnicilor de imbunatatire a imaginilor se refera la extragerea informatiei.

- Modificarea de contrast
Scalarea amplitudinii imaginilor nu utilizeaza mereu intregul interval afisabil:
aceasta poate avea valuri in afara intervalului sau ocupa doar o parte din interval.
Operaţiunea de modificare a contrastului imaginii digitale face parte din cadrul
operaţiilor punctuale numite operaţii cu memorie zero.
Procesarile punctuale neliniare pot aduce imbunatatiri ale contrastului, dar unele
din ele il pot chiar inrautati.
In functiile ce vor fi prezentate in continuare, imaginea procesata este definita de
G(j,k) = F(j,k)p, unde F(j,k) reprezinta imaginea originala, si p este variabila
functiei putere.

Functia de eroare a lui Gauss se comporta ca o functie patrata pentru pixeli


cu amplitudine scazuta si ca o functie radacina patrata pentru pixeli de amplitudine
ridicata. Aceasta este definita de:
𝐹(𝑗,𝑘)−0.5 0.5
erf{ }+ [ ]
𝑎 √2 𝑎 √2
G(j,k) = 0.5
erf{ }
𝑎√2
Unde,
2 𝑥
erf{x} = ∫ 0
exp{−𝑌 2 } 𝑑𝑌
√𝜋
si a este deviata standard a distributiei lui Gauss.

Functia logaritm este utila pentru modificarea imaginilor cu un spectru foarte


larg. Presupunand ca F(j,k)>=0, transformarea punctuala logaritmica este definita de:
𝑙𝑜𝑔𝑒 { 1 +𝐹(𝑗,𝑘)}
G(j,k) =
𝑙𝑜𝑔𝑒 { 1+𝑀𝐴𝑋[𝐹(𝑗,𝑘)]}

Exista aplicatii in procesare de imagine, in care modificarea amplitudinii dupa legi


monoton descrescatoare sau nemonotone este foarte utila. Spre exemplu, functiile
revers sau invers aplicate contrastului au drept scop vizualizarea detaliilor din zonele
intunecate ale imaginii.
Functia revers este definita de:
G(j,k) = 1 – F(j,k)
Functia inversa este data de ecuatia:
𝟏, 𝟎 ≤ 𝑭(𝒋, 𝒌) ≤ 𝟎. 𝟏
𝑮(𝒋, 𝒌) = { 𝟎. 𝟏
, 𝟎. 𝟏 ≤ 𝑭(𝒋, 𝒌) ≤ 𝟏
𝑭(𝒋, 𝒌)
4. Modificarea de histograma

- Introducere
Procesele de imbunatatire a imaginilor constau intr-o colectie de tehnici ce
urmaresc sa modifice perceptia vizuala sau sa converteasca imaginea intr-o forma mai
potrivita pentru a fi analizata de oameni sau de calculatoare. In scopul analizei,
definirea tehnicilor de imbunatatire a imaginilor se refera la extragerea informatiei.

- Modificarea de histograma
Histograma de luminanta a unei imagini naturale ce a fost cuantificata liniar
contine de obicei considerabil de multe nivele intunecate; majoritatea pixelilor din
imagine au o luminanta sub medie. In astfel de imagini detaliile din regiunile
intunecate nu sunt deloc perceptibile. Un mijloc de a imbunatati aceste tipuri de
imagini este tehnica numita „modificare de histograma”, in care imaginea originala e
rescalata in asa fel incat histograma imaginii imbunatatite urmeaza o forma dorita.
Andrew, Hall si altii, au produs o imbunatatire a imaginii printr-un proces de
egalizare a histogramei, in care histograma imaginii multiplicate e fortata sa fie
uniforma.
Ketcham si Hummel au demostrat rezultate imbunatatite printr-o procedura de
modificare adaptiva de histograma.
5. Modificarea neadaptiva a histogramei

- Introducere
Procesele de imbunatatire a imaginilor constau intr-o colectie de tehnici ce
urmaresc sa modifice perceptia vizuala sau sa converteasca imaginea intr-o forma
mai potrivita pentru a fi analizata de oameni sau de calculatoare. In scopul analizei,
definirea tehnicilor de imbunatatire a imaginilor se refera la extragerea informatiei.

- Modificarea neadaptiva a histogramei


Egalizarea histogramei este o metodă de modificare neadaptivă a histogramei imaginilor si
are rolul de a scoate în evidenţă informaţii care pot fi greu identificate în imaginea originală.

Etapele algoritmului de rescalare sunt următoarele:


1. Se determină histograma imaginii;

2. Se construieste histograma cumulativă;

3. Se determină vectorul de transformare a histogramei;

4. Se modifică imaginea conform vectorului de transformare.

Efectul procesului de egalizare a histogramei poate fi observat în figura următoare:

Dacă numărul de niveluri de rescalare a imaginii originale e mare, e posibilă modificarea


nivelelor de gri în asa fel încât histograma imaginii îmbunăţite să fie aproape constantă.

6. Modificarea adaptiva a histogramei

- Introducere
Procesele de imbunatatire a imaginilor constau intr-o colectie de tehnici ce urmaresc sa
modifice perceptia vizuala sau sa converteasca imaginea intr-o forma mai potrivita pentru a
fi analizata de oameni sau de calculatoare. In scopul analizei, definirea tehnicilor de
imbunatatire a imaginilor se refera la extragerea informatiei.
- Modificarea adaptiva a histogramei
Metodele de modificare a histogramei discutate in sectiunea anterioara realizeaza
aplicarea aceleiasi transformari sau functii fiecarui punct din imagine. Functia de
transformare este bazata pe histograma intregii imagini. Acest proces poate fi facut adaptive
spatial, aplicand modificari de histograma fiecarui punct din imagine, bazandu-ne pe
histograma punctelor din vecinatate, aflate in interiorul unei ferestre. Aceasta tehnica e
evident complexa din punct de vedere al calculelor, deoarece necesita calculul histogramei,
calculul functiei de modificare si aplicarea acestei functii la fiecare punct din imagine.

A fost propusa o tehnica de egalizare adaptiva a histogramei, in care histogramele sunt


generate pe o retea rectangular de puncte si modificarile fiecarui punct din imagine sunt
realizate prin interpolarea maparilor a 4 puncte cele mai apropiate de retea.

Figura 2.11 ilustreaza geometria acestor calcule. O histograma este calculate pentru
fiecare punct din retea, pe o fereastra din jurul punctului. Dimensiunea ferestrei poate fi mai
mica sau mai mare decat spatiile din retea.

7. Metode lineare de curatare a zgomotului

8. Procesarea din domeniul spatial

- Introducere
O imagine poate fi bruiata de zgomot sau interferente din partea mai multor surse,
inclusiv zgomotul senzorilor electronici si zgomotul granulelor fotografice. Aceste efecte pot
fi reduse de tehnicile clasice de filtrare statica. Zgomotul ce apare in imagini din cauza unui
senzor zgomotos sau a erorilor canalului de transmisie se manifesta de obicei ca variatii ale
pixelilor, ce nu sunt corelate spatial. Pixelii zgomotosi apar vizual ca fiind diferiti de vecinii
lor.

- Metode lineare de curatare a zgomotului

Procesarea din domeniul spatial


Zgomotul adaugat la o imagine are in general un spectru mai larg de fregventa decat
componentele normale ale imaginii din cauza decorelarii sale spatiale. De aici rezulta ca
filtrarea „trece-jos” simpla poate fi eficienta in indepartarea zgomotului.

Filtrarea trece-jos se poate efectua prin convoluţia imaginii afectate de zgomot cu o


matrice:

Aceste matrici, numite măsti de îndepătare a zgomotului, sunt normalizate la unitate,


astfel procesul de îndepărtare a zgomotului nu introduce o schimbare de amplitudine în
imaginea rezultată.

Conceptul de indepartare a zgomotului prin filtrarea trece-jos poate fi extins la matrici


mai mari. Dupa cum este asteptat, folosirea unei matrici de dimensiuni mai mari contribuie
in mod sporit la indepartarea zgomotului, dar cu costul pierderilor detaliilor.

Alte metode lineare:

- Procesare Fourier
- Filtrare homomorfa

9. Filtrare homomorfa

- Introducere
O imagine poate fi bruiata de zgomot sau interferente din partea mai multor surse,
inclusiv zgomotul senzorilor electronici si zgomotul granulelor fotografice. Aceste efecte pot
fi reduse de tehnicile clasice de filtrare statica. Zgomotul ce apare in imagini din cauza unui
senzor zgomotos sau a erorilor canalului de transmisie se manifesta de obicei ca variatii ale
pixelilor, ce nu sunt corelate spatial. Pixelii zgomotosi apar vizual ca fiind diferiti de vecinii
lor.

- Filtrare homomorfa
Filtrarea homomorfa este o tehnica folositoare pentru imbunatatirea imaginii
atunci cand aceasta este supusa zgomotului unei interfete.

Imaginea de filtrare F(j,k) se presupune ca fiind rezultata ca produs al unei


imagini fara zgomot A(j,k) si a unei matrici de interferenta a iluminarii I(j,k). Astfel,
F(j,k) = A(j,k)* I(j,k).

In mod ideal I(j,k) este constanta pentru toti pixelii. Logaritmand ecuatia
obtinem rezultatul sub forma aditiva:
𝒍𝒐𝒈{𝑭(𝒋, 𝒌)} = 𝒍𝒐𝒈{𝑰(𝒋, 𝒌)} + 𝒍𝒐𝒈{𝑨(𝒋, 𝒌)}

Tehnicile de filtrare lineara conventionala poti fi aplicate acum pentru a reduce


componenta logaritmica de interferenta. Exponentierea dupa filtrare completeaza
procesul de imbunatatire.

10. Tehnica Outlier

- Introducere
O imagine poate fi bruiata de zgomot sau interferente din partea mai multor surse,
inclusiv zgomotul senzorilor electronici si zgomotul granulelor fotografice. Aceste efecte pot
fi reduse de tehnicile clasice de filtrare statica. Zgomotul ce apare in imagini din cauza unui
senzor zgomotos sau a erorilor canalului de transmisie se manifesta de obicei ca variatii ale
pixelilor, ce nu sunt corelate spatial. Pixelii zgomotosi apar vizual ca fiind diferiti de vecinii
lor.

Tehnicile neliniare ofera mai buna echilibrare intre eliminarea de zgomot si retinerea
detaliilor din imagine.

- Tehnica Outlier
Este o tehnica nelineara de procesare de semnal utilizata pentru suprimarea
zgomotului din imagini. Fiecare pixel este comparat cu media a 8 dintre vecinii sai.
Daca magnitudinea diferentei e mai mare decat un nivel oarecare de prag, pixelul
este considerat a fi zgomotos si este inlocuit cu media vecinilor sai.
Media vecinilor sai poate fi obtinuta prin convoltia imaginii cu masca de mai jos:
1 1 1
1
𝐻 = 8 [1 0 1].
1 1 1

Operatorul “outlier” poate fi extins la ferestre de dimensiuni mai mari.

11. Filtrul median

- Introducere
O imagine poate fi bruiata de zgomot sau interferente din partea mai multor surse,
inclusiv zgomotul senzorilor electronici si zgomotul granulelor fotografice. Aceste efecte pot
fi reduse de tehnicile clasice de filtrare statica. Zgomotul ce apare in imagini din cauza unui
senzor zgomotos sau a erorilor canalului de transmisie se manifesta de obicei ca variatii ale
pixelilor, ce nu sunt corelate spatial. Pixelii zgomotosi apar vizual ca fiind diferiti de vecinii
lor.

Tehnicile neliniare ofera mai buna echilibrare intre eliminarea de zgomot si retinerea
detaliilor din imagine.

- Filtrul median
Este o tehnica nelineara de procesare de semnal utilizata pentru suprimarea
zgomotului din imagini.
In forma unidimensionala, filtrul median este constituit dintr-o fereastra ce
cuprinde un numar impar de pixeli. Filtrul central din fereastra este inlocuit cu media
pixelilor din fereastra.
De exemplu, daca valorile pixelilor dintr-o fereastra sunt 0.1, 0.2, 0.9, 0.4, 0.5
pixelul central va fi inlocuit de 0.4 care este valoarea mediana a succesiunii.
Exista diferite strategii de aplciare a filtrului median pentru suprimarea
zgomotului. O metoda ar fi utilizarea unui filtru median cu o fereastra de marime 3.
Daca nu se observa nici o pierdere importanta de semnal, latimea ferestrei poate fi
marita la 5. Procesul poate fi interrupt cand filtrul median incepe sa dauneze
imaginii.

12. Filtrul pseudo-median

- Introducere
O imagine poate fi bruiata de zgomot sau interferente din partea mai multor surse,
inclusiv zgomotul senzorilor electronici si zgomotul granulelor fotografice. Aceste efecte pot
fi reduse de tehnicile clasice de filtrare statica. Zgomotul ce apare in imagini din cauza unui
senzor zgomotos sau a erorilor canalului de transmisie se manifesta de obicei ca variatii ale
pixelilor, ce nu sunt corelate spatial. Pixelii zgomotosi apar vizual ca fiind diferiti de vecinii
lor.

Tehnicile neliniare ofera mai buna echilibrare intre eliminarea de zgomot si retinerea
detaliilor din imagine.

- Filtrul pseudo-median
Filtrarea mediană necesită un volum mare de calcule, iar numărul operaţiilor
creste exponenţial cu dimensiunea ferestrei. Un operator mai simplu este filtrul
pseudomedian:

În cazul unui filtru pseudomedian în formă de “+” calculul funcţiilor min si max se face
în ferestre, după cum urmează:

unde sirurile { } C X si { } R X conţin pixelii aflaţi pe orizontală si respectiv verticală din


fereastră. Pseudomedianul poate fi definit ca:

Operatorul MAXIMIN in forma unidimensionala si bidimensionala e util in indepartarea


zgomotului de tip impuls de culoare deschisa, dar nu are aproape nici un effect asupra
zgomotului de tip impuls intunecat.

Invers, operatorul MINIMAX indeparteaza cu succes zgomotul de tip impuls intunecat,


dar nu sic el stralucitor.

In conclusive, se poate cascada cei doi operatori pentru a elimina in proportie foarte
mare zgomotele de tip “sare si piper”.

13. Accentuarea liniara a marginilor


Filtrul Trece-Sus (FTS)

- Introducere
Experimentele psihofizice au aratat ca o fotografie sau un semnal vizual cu marginile
accentuate este, adesea, mai multumitoare decat o reproducere fotometrica exacta.

- Filtrul Trece-Sus
Accentuarea contururilor se poate realiza prin utilizarea filtrelor trece-sus. Cele
mai utilizate măsti FTS de mărime 3x3 sunt următoarele:

Asa cum se poate observa, măstile utilizate pentru accentuarea contururilor au


proprietatea că suma elementelor este 1, evitând în felul acesta modificări ale intensităţilor
în imaginea procesată.

Algoritmul constă în înlocuirea intensităţilor cu sumele obţinute prin convoluţia imaginii


cu una din măstile FTS. Evident, este necesară si o normalizare a noilor intensităţi la
intervalul [0, 255].

O alta posibilitate consta in folosirea unei masti de tip „unsharp”, aplicand


formula:
𝒄 𝟏−𝒄
𝑮(𝒋, 𝒌) = 𝟐𝒄−𝟏 𝑭(𝒋, 𝒌) − 𝑭𝑳 (𝒋, 𝒌).
𝟐𝒄−𝟏
Efectul de accentuare devine mai puternic pe masura ce L creste si c scade.

Accentuarea liniara a marginilor poate fi executata cu un filtru Fourier. Un filtru zonal


trece-sus, ce va inlatura toate fregventele aflate sub fregventa de taiere, exceptand
component continua, care este necesara pentru a mentine amplitudinea medie a imaginii
filtrate.

Filtrarea trece-sus zonala cauzeaza adesea efectul de “ringing” asupra imaginii filtrate.
Un aftfel de effect poate fi semnificativ redus prin utilizarea unui filtru trece-sus cu un
raspuns mai neted.

14. Diferentierea statistica

- Introducere
Experimentele psihofizice au aratat ca o fotografie sau un semnal vizual cu marginile
accentuate este, adesea, mai multumitoare decat o reproducere fotometrica exacta.

- Diferentierea statistica
Este o metoda de accentuare a contururilor care consta in generarea unei
imagini prin impartirea valorii fiecarui pixel la deviatia sa standard 𝑆(𝑗, 𝑘) conform
relatiei:
𝐹(𝑗,𝑘)
𝐺(𝑗, 𝑘) = ,
𝑆(𝑗,𝑘)
unde deviata standard estimata este:
𝑗+𝑤 𝑘+𝑤
1
𝑆(𝑗, 𝑘) = 2 ∑ ∑ [𝐹(𝑚, 𝑛) − 𝑀(𝑚, 𝑛)]2
𝑊
𝑚=𝑗−𝑤 𝑛=𝑘−𝑤
este calculata pentru fiecare pixel care se afla in vecinatatea 𝑊 × 𝑊, unde
𝑊 = 2𝑤 + 1. Functia 𝑀(𝑗, 𝑘) este valoarea medie estimata a imaginii originala in
punctul (𝑗, 𝑘) si se calculeaza astfel:
𝑗+1 𝑘+𝑤
1
𝑀(𝑗, 𝑘) = 2 ∑ ∑ 𝐹(𝑚, 𝑛).
𝑊
𝑚=𝑗−𝑤 𝑛=𝑘−𝑤

Imaginea imbunatatita G(j,k) creste in amplitudine in raport cu originalul, la acei pixeli


care deviaza semnificativ fata de punctele invecinate si descreste relativ in amplitudine in
celelalte parti. Acest proces este analog cu controlul automat al castigului unui semnal
audio.

Wallis a sugerat o generalizare a operatorului diferenţierii statistice, în care imaginea


mărită este forţată spre o formă cu momente de ordin întâi şi ordin secund dorite.

Operatorul este definit de relaţia:

unde Md şi Sd reprezintă media şi deviaţia standard dorite, A este un factor de câştig


care previne valorile prea mari atunci când S(j,k) este prea mic r este un factor de
proporţionalitate a mediei care controlează raportul dintre contur şi fundalul imaginii.

4.1 Metode de detective ce utilizeaza derivate de ordinul intai.

Modificarea sau discontinuitatile de amplitutdine(luminanta), dintr-o


imagine constituie caracteristici fundamentale importatne, deoarece acestea
ofera o indicatie legata de prezenta fozoca a unor obiecte intr-o imagine.
Discontinuitatile locale in luminanta de la un nivel la altul sunt denumite
contururi.

Un contur aflat in domeniul continuu F(x,y) poate fi detectat prin calculul


gradientului unidimensional G(x,y) de-a lungul normalei pe directia conturului,
ce formeaza un unghi ɵ pe axa orizontala.

Daca acest gradient este sufficient de mare, pentru o valoare de prag, este
detectat un contur.

Gradientul de-a lungul normalei la directia conturului poate fi calculate


cu ajutorul derivatelor pe doua directii ortogonale conform ecuatiei
Ә𝐹(𝑥,𝑦) Ә𝐹(𝑥,𝑦)
G(𝑥, 𝑦) = ∗ 𝑐𝑜𝑠 ɵ + ∗ cos ɵ
Ә𝑥 Ә𝑦

Prin generarea separate a gradientului pe linii 𝐺𝑅 (j,k) si a gradiantului pe


coloane 𝐺𝐶 (j,k) , aplitudinea gradiantului spatial este data de G(j,k)={[ 𝐺𝑅
(j,k)]²+[ 𝐺𝐶 (j,k)]²} 1/2 .
−1 𝐺𝐶 (j,k)
Orientarea referitoare la axa liniilor : ɵ(j,k)=tan { }
𝐺𝑅 (j,k)

Cea mai simpla metoda de generare a gradientuli este diferenta dintre 2


pixeli consecutive pe liniile si coloanele imaginii.

𝐺𝑅 (j, k)=F(j,k)-F(j,k-1)

𝐺𝐶 (j, k)=F(j,k)-F(j,k-1)

Gradiantele pe diagonala pot fi obtinute realizand diferentele pe perechi


alflati pe diagonal.Aceasta este baza detectorului Roberts , ce este definit sub
forma calculului de magnitudine:

G(j,k)=| 𝐺1 (j, k)| +|𝐺2 (j, k) | - magnitudine


1/2
G(j,k)={[ 𝐺1 (j, k)]² +[𝐺2 (j, k)]²}  radacina patrata

𝐺1 (j, k)=F(j,k) – F(j+1,k-1)

𝐺2 (j, k)=F(j,k) – F(j+1,k)

Orientarea conturului referitor la axa liniilor este:


𝜋 −1 𝐺2 (j,k)
Θ(j,k)= tan { (j,k)}
4 𝐺1
Detectorul Prervitt:

Prervitt a introdus un operator de gradient 3X3 ce poate fi descries


folosind urmatoarea conversiei de numerotare:

𝐴0 𝐴1 𝐴2  Conversie de numerotare a vecinilor unui


pixel
𝐴3 𝐴4

𝐴5 𝐴6 𝐴7

1
𝐺𝑅 (j, k)= [(𝐴2 + K*𝐴3 + 𝐴4 )- (𝐴0 + K*𝐴7 + 𝐴6 )]
𝐾+2

1
𝐺𝐶 (j, k)= [(𝐴0 + K*𝐴1 + 𝐴2 )- (𝐴6 + K*𝐴5 + 𝐴4 )]
𝐾+2

K=1

Detectorul de contur Sobel difera de cel al lui Prervitt prin faptul ca valorile
pixelilor aflati la nord, sud , est si vest sunt dublate deci K=2.

Pentru detectorul Frei-Chen K=√2 , astfel gradientul este acelasi cu


contururile orizontale , vertical si diagonal.

Limitarea operatorilor mai sus prezentati consta in imobilitatea lor de a detecta


in mod précis dontururile din imagini zgomotoase.

 O solutie pentru a rezolva acest gen de problema consta in extinderea


marimii vecinatatilor in care se realizeaza calculul gradiantului .
 Abdou a propus un operator gen trunchi de piramida , ce prezinta o
pondere descrescator liniara pixelilor pe masura departarii lor de central
marginii.
 Argyle si Maclesd(???) au ppropus functii pe ponderare de forma Gauss
pe o vecinatate marita pentru a inlatura efectele zgomotului
4.2 Metode de detective ce utilizeaza derivate de ordinul doi.

Tehnicile de detectie de contur de ordinul doi folosesc forma unei


diferentieri spatial de ordinul al doilea.

Un contur este detectat daca intervine o schimbare semnificativa in a doua


derivata. Doua tipuri de metode ce utilizeaza derivate de ordinul al 2-lea sunt
foarte cunoscute si utilizate : laplacianul si a doua derivata directional

Laplacianul : unei functii imagine F(x,y) in domeniu continuu este diferit


astfel:
Ә² Ә²
G(x,y)= -Γ² {F(x,y)}, unde Γ²= +
Ә𝑥² Ә𝑦²

Operatorul lui Laplace G(x,y) este 0 daca F(x,y) este constanta sau isi
modifica liniar aplitudinea.

Daca rata schimbarii lui F(x,y) este mai mare decat liniara, G(x,y) prezinta
o schimbare de semn in punctul de inflexiune a lui F(x,y).

Trecerea prin zero a lui G(x,y) indica prezenta unui contur . In domeniul
discret , cea mai simpla aproximare Lapacianul este calculul diferentei pantelor
de-a lungul fiecarei axe:

G(x,y)= [F(j,k)-F(j,k-1)]-[F(j,k-1)-F(j,k)]-[F(j,k)-F(j+1,k)]-[F(j-1,k)-F(j,k)]

Un Laplacian de vecinatate poate fi obtinut prin operatia de convolutie :

G(j,k) = F(j,k) (X)(asta e x in cerc :D) H(j,k), unde :

0 −1 0
H=[−1 4 −1]
0 −1 0
Prervitt a sugerat un Laplacian cu 8 vecini, definit de:

−1 −1 −1
1
H= [−1 8 −1]
8
−1 −1 −1

Marr si Hilrith au propus operatorul de detective al conturului Laplacian de


Gaussian (LOG).

In acest caz prima data este aplicata netezirea folosind functia lui Gauss ceasta
fiind urmata de aplicarea Laplacianului .

In domeniul continuu gradientului LOG este :

G(x,y) = -Γ²{ F(x,y) (X)(asta e x in cerc :D) 𝐻𝑆 (x,y)}, unde :

𝐻𝑆 (x,y) = g(x,s)*g(y,s) ,

𝐻𝑆  raspunsul la impulsusl functiei de netezire Gauss

Log

Din tehnicile de detectie de contur prezentate mai sus se observa ca punctele de


trecere prin zero nu se afla intotdeauna in punctele in care a fost discretizat
pixelul.

De fapt, pentru imagini supuse fluctuatiilor de lumina care contin contururi


curbate, nu se obtin pixeli cu valoare zero ca raspuns Laplacian.

O abordare simpla la detectarea punctului de trecere prin zero a


Laplacianului unei imagini in domeniul discret , este de a calcula maximul
tuturor raspunsurilor positive si minimul tuturor raspunsurilor negative dintr-o
fereasta de 3X3 .
Daca magnitudinea diferentei dintre maxim si minim depaseste un prag ,
este detectat un contur

Generarea……….?????

Aceasta metoda consta in estimarea directiei conturului urmand sa se


calculeze derivate de ordinul al doilea de-a lungul directiei conturului.

Un punct de trecere prin zero a derivatei de ordinul 2 specifica un contur.

Derivata directional de ordinul 2 al unei imagini F(x,y) din domeniul


continuu de-a lungul unei linii aflate la un unghi θ de axa orizontala este data
de:
Ә²𝐹(𝑥,𝑦) Ә²𝐹(𝑥,𝑦) Ә²𝐹(𝑥,𝑦)
F"(x,y) = * cos² ɵ + * sin² ɵ* cos ² ɵ + * sin² ɵ (1)
Ә𝑥² Ә𝑥Ә𝑦 Ә𝑦²

Spre deosebire de Laplacian , derivate directional de ordinul 2 este un


operator neliniar.

Un factor cheie in utilizarea metodei prezentate mai sus esste abilitatea de a


determina exact directia conturului.

O abordare consta in a utilize metoda de detective a derivatei de ordinul 1


pentru a estima directia conturului si apoi sa se calculeze o aproximare a
ecuatiei (1)

O alta metoda propusa de Harolick implica aproximarea lui F(x,y) printr-un


polinom bidimensional de la care derivate directionala de ordinul 2 poate fi
determinata analytic.

4.3 Detectia de contur bazata pe filtrul Gabor

Filtrele lui Gabor stau la baza multor algoritmi de procesare de imagine.


Acestea provin din modulatia unei functii Gaussiene si a unui semnal
sinusoidal.

Aceste functii elementare au fost introduce de Gabor ca fiind semnale


optime de transmisie in telecomunicatii.
Mai tarziu s-a demonstrate ca ele sunt si reprezentarea matematica a
celulelor receptoare din contextual visual.

Functia unidimensionala a lui Gabor poate fi reprezentata de ecuatia :


1 𝑥−𝑥0
S(x)= exp[- *( )² + j𝑤𝑥 x](1) , acestea rezulta din convolutia unei
2 𝜎
sinusoide de frecventa 𝑤𝑥 si a unei functii Gauss de deviatie 𝛔 .

Din expresia (1) pot fi derivate doua componente , una para si alta
impara:
1 𝑥
Componenta para : 𝑆𝑒 (x) = exp [- *( )²]cos (𝑤𝑥 x)
2 𝜎

1 𝑥
Componenta impara: 𝑆0 (x) = exp [- *( )²]sin (𝑤𝑥 x)
2 𝜎

Componenta impara a fost propusa a se utiliza ca operator de contur ea putant fi


extinsa si la spatial bidimensional
1 𝑥²+𝑦²
𝑆0 (x) = exp [- *( )²]sin [w(x*cos ɵ + y*sin ɵ)]  functie ce exprima un
2 𝜎²
filtru orientat pe directia unghiului ɵ

Algoritmul care sta la baza evidentierii contururilor cu un astfel de filtru este


urmatorul:

1. Netezirea imaginii printr-un filtru Gaussian de latime 𝛔


2. Pentru fiecare pixel al imaginii:
2.1. Determinarea printr-o metoda de gradient a directiei ɵ a conturului
2.2. Determinarea mastii de convolutie pentru un filtru Gabor orientat dupa
directia ɵ
2.3. Calculul convolutiei imaginii cu masca determinate
3. Normalizarea nivelurilor de gri obtinute

4.4 Urmarirea contururilor

Urmarirea contururilor poate fi aplicata doar imaginilor ce contin informatii


de contur .
Odata determinat un punct de pe contur, operatorul determina toti ceilalti
pixeli ce apartin conturului.

O posibila metoda poate fi urmatoarea :


1. Determina un pixel de contur 1
2. Cauta cei 8 vecini pentru a gasi 2
3. Cauta in aceeasi directie (se permite devierea cu 1 pixel de foecare parte)
4. Repeta pasul 3 pana la determinarea complete a conturului

5. Segmentarea
5.1 Fixarea pragului de binarizare.

Prin segmentarea imaginii intelegem impartirea imaginii in regiuni ce au o


corelatie puternica cu obiecte sau suprafete din lunea reala continute in
imagini
Segmentarea poate fi:completa
partiala
Segmentarea complete : are ca rezultat un set de regiuni disjuncte ce
corespund in mod unic obiectelor din imagine
Segmentarea partial: are ca rezultat regiuni ce nu corespund in mod direct
cu obiectele din imagine , imaginea este impartita in regiuni disjuncte ce sunt
omogene relative la o anumita proprietate cum ar fi luminozitate, culoare etc.

5.1 Binarizarea prin fixarea pragului este o operatie putin costisitoare din
punct de vedere al calculelor sau vitezei , ea fiind una din cele mai vechi
metode de segmentare si inc ape larg utilizata.
O segmentare completa a unei imagini Ι este o multime finite de regiuni
R1,.....,Rs.

Ι=⋃𝑠𝑖=1 𝑅𝑖; unde Ri∩Rj=∅ si i≠j;

Binarizarea este operatia de transformare a unei imagini de intrare ”f” intr-


o imagine de iesire binara “g” (segmentata) dupa cum urmeaza:

g(i,j)={1, pentru f(i,j)≥T


{0, pentru f(i,j)<T unde T=prag

g(i,j)=1  pt elementele imaginii ce apartin obiectelor


g(i,j)=0 pt elementele ce apartin fundalului (sau invers)

Procesul de segmentare se bazeaza in principal pe histograma imaginii ,


mai précis pe forma acesteia.
Cazul ideal il reprezinta o histograma bimodala , situatie in care alegerea
pragului se realizeaza simplu: punctual de minim intre 2 maxime , ce
reprezinta obiectele si fundalul.
De cele mai multe ori , histograma nu este bimodala si este nevoie de alte
tehnici pt a rezolva problema segmentarii prin fixarea pragului de binarizare
Alegerea corecta a pragului este cruciala pentru segmentarea cu succes a
img.
Metodele folosite pentru a rezolva aceasta problema constau in
segmentarea folosind praguri variabile , in care valorile de prag variaza in
functie de caracteristicile locale ale imaginii.
Un prag pentru toata imaginea “f” este determinat de T=T(f) pe cand unul
local este dat de T=T(f,fc), unde “fc” este partea din imagine pe care este
determinat pragul.
Se poate astfel imparti imaginea “f” in sub-imagini “fc” si se determina
astfel un prag independent pentru fiecare sub-imagine.
Binarizarea are mai multe derivatii. O posibilitate este aceea de a segmenta
o imagine in regiuni cu pixeli avand nivelul de gri in intervalul D. In acest
fel , pixelii considerandu-se a se afla in fundal(segmentarea in banda).

g(i,j)= { 1, pentru f(i,j) ∁ D


{ 0, altfel

Acest tip de binarizare poate fi utilizata spre exemplu pentru segmentarea


imaginilor microscopice ale celulelor de sange.

Algoritmul Isodata
Dezvoltat de Rodler si Calvard consta intr-o tehnica iterative de alegere a
pragului de binarizare
Histograma este pentru inceput impartita in 2 parti folosind o valoare de
prag la mijlocul intervalului de gri din imagine.
Dupa care se calculeaza valoarea medie a nivelurilor de gri pt clasa
obiectelor dar si pentru clasa fundalului.
Se determina acum noua valoare a pragului ca fiind media acestor 2 medii.
Procesul se repeta iterative pana in momentul in care valoare de prag
ramane neschimbata.

Algoritmul triunghi.

Propus de Zack, consta in trasarea unei linii intre cea mai mica valoare a
nivelului de gri din imagine ‘bmin ’ si val maxima a histogramei ce are loc
pe nivelul ‘bmax’.
Se calculeaza distanta ‘d’ dintre linia trasata si histograma pentru toate
nivelele dintre ‘bmin’ si ‘bmax’.
Valoare de gri pt care distanta e maxima este considerata a fi valoarea de
prag optima.
Aceasta metoda este eficienta in cazul in care nivelele de gri ale pixelilor
din imagine produc o histograma cu varfuri nu prea accentuate.
5.2 Praguri multiple de binarizare.
In marea majoritate a cazurilor imaginea este segmentata in 3 clase de
regiuni, ceea ce implica gasirea a 2 praguri T1 si T2 a.i. pixelul din imaginea
originala va fi clasificat in una din cele 3 clase astfel:

{ t1, pentru f(i,j)≤ T1


g(i,j)={ t2, pentru T1<f(i,j) )≤ T2
{ t3, pentru f(i,j)> T2

Metoda unei segmentari multiple prin fixarea pragurilor este utilizata pentru
identificarea canderului de piele din imagini. Pentru a putea determina in mod
aproximativ pozitia si forma leziunii este necesata alegerea unui interval in care
sa se afle valorile de prag pentru toate puntele ce se afla pe conturul regiunii.
Pentru a obtine acest interval este necesar a determina o valoare a pragului
initiala, obtinuta prin observarea valorii gradientului de-a lungul conturului
leziunii.
Valoarea lui T este aleasa ca fiind valoarea medie a intensitatii pentru ‘p%’
din pixelii ce au cele mai mari valori ale gradientului. Valoarea lui ‘p’ se
determina experimental si a fost demonstrate ca valori de 5-10 sunt potrivite
pt majoritatea imaginilor.
Daca se considera ‘d’ ca fiind distant cu care trebuie deplasat un punct aflat
pe conturul obtinut prin fixarea pragului T, pana pe pozitia adevaratului contur
, acest parametru depinde de valoarea gradientului pixelului.
Determinarea valorii pragului T1 si T2 se face astfel:
se determina h[i] ca fiind histograma imaginii
se determina valoarea de prag T prin metoda prezentata mai sus
se calculeaza n ca fiind nr. De pixeli din conturul regiunii obtinute prin
fixarea pragului la valoarea T
se obtine T1 si T2 ca fiind valorile pentru care este adevarat sirul de egalitati:
d*n=∑𝑇−1 𝑇2
𝑖=𝑇1 ℎ[𝑖] = ∑𝑖=𝑇+1 ℎ[𝑖]
Daca in imagine sunt mai putin de d*n pixeli avand intensitati mai mici decat
T, atunci T1 ia valoarea 0. Dar daca exista mai putini pixeli decat d*n cu
intensitati mai mari decat T, T2 ia valoarea 255.

5.4 Criteriul entropiei maxime.

𝑃0 𝑃1 𝑃𝑠−1
A≡ { , ,…, }
𝑃(𝑠) 𝑃(𝑠) 𝑃(𝑠)
𝑃𝑠 𝑃𝑠+1 𝑃𝑚−1
𝐵≡{ , ,…, }
1−𝑃(𝑠) 1−𝑃(𝑠) 1−𝑃(𝑠)

Plecand de la cele 2 distributii enuntate anterior putem spune ca idea ce sta


la baza criteriului entropiei maxime este alegerea pragului astfel incat
cantitatea totala de informative obtinuta din obiect si din fundal sa fie
maximizata.
In cazul de fata aceasta informatie este masurata pe baza entropiei fiecareia
din cele 2 distributii A,B astfel:

𝐻(𝑠)
E𝐴 (s)=ln (P(s))+
1−𝑃(𝑠)
𝐻′(𝑠)
E𝐵 (s)=ln (1-P(s))+
1−𝑃(𝑠)
H(s)= -P(s) * ln (Pi)
H’(s)=(1 -P(s)) * ln (Pi)
P(s)= ∑𝑠−1
𝑖=0 𝑃𝑖 probabilitatea totala pana la nivelul de gri (s-1)

Cum informatia este masurata de entropie, cantitatea totala de informatie


data de A si B este:

TE(s) = E𝐴 (s) + E𝐵 (s)

Criteriul maximei entropii presupune gasirea pragului s’ astfel incat:

TE(s’) = max𝑠∁𝐺𝑚 𝑇𝐸(𝑠), Gmmultimea nivelelor de gri


Acest algoritm poate fi extins si la segmentarea pe mai multe nivele. Daca 2
sau mai multe obiecte se suprapun peste acelasi fundal a.i. histograma sa fie
multimodala.

Criteriul corelatiei maxime


Corelatia unei variabile aleatoare discrete x cu o serie finite sau infinita dar
masurabila R= {x0, x1,…., xn} este definite astfel :

C(x) = - ln ∑𝑖≥0 𝑃𝑖² , unde Pi  probabilitatea ca x sa ia valoarea xi.

Pe baza definitiei de mai sus , valoarea totala a corelatiei determinate de


distributiile A si B va fi :

TC(s) = C𝐴 (s) + C𝐵 (s)

Pentru a obtine corelatia maxima data de obiect si fundal TC(s), trebuie


maximizat. Criteriul corelatiei maxime consta in obtinerea unui prag s’ a.i. :

TC(s’) = max𝑠∁𝐺𝑚 𝑇𝐶(𝑠) , Gm  multimea nivelelor de gri

5.5 Watershed

Tehnica de segmentare Waterhed interpreteaza o imagine ca fiind o


suprafata topologica, prin utilizarea marimii de gri ca o altitudine.

Locurile in care au loc schimbari bruste ale nivelului de gri constituie in acest
peisaj, locurile in care este present un contur.

In scopul segmentarii, vor fi in primul rand descoperite liniile de creasta ale


imaginii gradient.

Folosind o analogie cu un relief geographic, se incepe prin a perfora minimul


local al suprafetei si apoi se cufunda imaginea,incet, iintr-un lichid. Apa inunda
progresiv bazinele corespunzatoare minimelor locale.Pentru a preveni reunirea
a 2 bazine diferite, se ridica un baraj intre cele 2.

In momentul in care intreaga suprafata este scufundata multimea barajelor


construite formeaza Watershed-ul imaginii.

Locul in care 2 bazine se intalnesc pentru prima oara este un punct de creasta
din imagine. Se poate deci generaliza si defini Watershed-ul ca fiind mutimea
liniilor de creasta din imagine rezultate in urma sunetelor de creasta.

La momentul ‘t’ bazinele B2 si b3 nu s-au intalnit.

La momentul ‘t+h’ se construieste un baraj pentru a separa bazinul B2 de B3.

Folosind algoritmul classic watershed vom obtine o supra-segmentare a


imaginii,cu toate ca toate contururile obtinute sunt corecte.

De aceea pentru a obtine o segmentare a imaginii ce reprezinta zone de


interes in aplicatiile practice tehnica watershed poate fi imbunatatita folosind:

reconstructia geodezica

tehnica marker-ilor

Reconstructia geodezica

Fie M si N 2 multimi dintr0un plan. Notam cu dM distant geodezica din M,


adica limita de jos a lungimii cailor din M ce leaga 2 puncte a si b din M.

Se numeste reconstructive geodezica a lui N si M, arcele dM ale partilor lio M


ce contin cel putin un punct din N. Aceste parti corespund punctelor aflate la
distant dM de N.

In mod complementar se poate define eroziunea geodezica. Folosind


eroziunea in segmentare prin intermediul eatershed-ului: vor fi suprimate
toate minimele locale ce nu prezinta interes in regasirea conturului.

Tehnica Marker-ilor
Daca se cunoaste o multime de punte ce apartine unui obiect (sau multimi ce
apartin fiecarui obiect) si o multime de puncte ce apartin fundalului, acestea
sunt denumite marker.

Daca modificam imagine ape care se calculeaza watershed-ul, impunand ca


aceste mmultimi sa fie minimele regionale, am obtinut un watershed ce
segmenteaza fiecare obiect din imagine si fiecare bazin de acumulare
reprezinta fie fundalul fie un obiect.

Metoda de impunere a unor minime regionale M unei imagini ‘f’ este


urmatoarea:

 Se contrueste imaginea:
g(x) = +∞ , daca x nu apartine lui M
0 , daca x apartine lui M

Aceasta imagine va avea minimele locale dorite. Pentru a pastra informatia


din imagine originala, se erodeaza geodesic g.

Pe imaginea obtinnuta se poate aplica algoritmul watershed.

5.8 Transformata Ahuja

Forma generala a transformatei une I(x,y), intr-o familie de campuri de forte


de atractie F(x,y; 𝜎𝑔 (x,y) , 𝜎𝑠 (x,y)) este urmatoarea :
𝑟⃗
F(x,y; 𝜎𝑔 (x,y) , 𝜎𝑠 (x,y)) = ∬ 𝑑𝑔 (∆𝛪, 𝜎𝑔 (x,y))* 𝑑𝑠 (𝑟⃗, 𝜎𝑠 (x,y))*
||𝑟⃗||
Unde Rdomeniul ( 𝛪(u,v))\{(x,y)} si r⃗ = (v-x)*i⃗ +(w-y)*j⃗
Pentru fiecare pixel din imagine, transformarea analizeaza intensitatiile
pixelilor aflati in vecinatatea acestuia si produce un vector de forta.
Corespunzator fiecarui pixel, este asovial un factor de scara de
omogenitate 𝑜𝑔 ce reflecta omogenitatea regiunii in care se gaseste pixelul
si un factor de scara de spatialitate 𝑜𝑠 ce controleaza vecinatatea pe care
este calculate forta asociata pixelului.
Transformata calculeaza pentru fiecare pixel un vector suma a afinitatilor
perechi dintre pixeli si ceilalti pixeli din vecinatate.
Vectorul rezultat al transformatei pentru fieare pixel defineste atat
directia cat si amplitudinea atractiei pixelului fata de restul imaginii.
Afinitatea dintre o pereche de pixeli este determinate de factorii de scara.
Factorul spatial 𝑜𝑠 , controleaza functia distant spatial ds(), iar parametrul
de omogenitate 𝑜𝑔 , functia omogena de distant dg().
Pentru o imagine cu nivel de gri, omogenitatea dintr 2 pixeli ∆𝛪 este:

∆𝛪 = |𝛪(x,y) - 𝛪(v,w)|.

Folosind aceasta definitie a campului de forta ‘F’, pixelii sunt grupati in


regiuni ale caror contururi corespund vectorilor divergenri din F si a caror forte
interioare corespund vectorilor de forte convergete din F.
In cadrul transformatei , alegerea valorii lui 𝜎𝑠 , unui pixel pentru un 𝜎𝑔 dat
corespunde cu includerea pixelului intr-o regiune cu un flux al fortelor
convergent si in care pixelii au proprietati omogene. Aceasta zona e denumita
zona de atractie.

↖ ↑ ↗  Alegerea potrivita a lui 𝜎𝑠 duce la


↖ ↑ ↖ ↙ ↗ ↗ transformarea regiunii intr-o zona de atractie
← ↘ ↘ ↙ ↙ → constand intr-o singura regiune de flux
← ↗ ↗ ↖ ↖ → convergent
↙ ↙ ↖ →
↙ ↓ ↘

↘ ↙  Daca 𝜎𝑠 este ales prea mare zona


de atractie va contine mai multe regiuni
de flux convergent
↘ ↙
↗ ↖


↗ ↗ ↖

Determinarea valorii lui 𝜎𝑠


Pentru o anumita valoare a lui 𝜎𝑠 la nivelul pixelului(x0,y0) aflat intr-o
regiune R, 𝜎𝑠 (x0,y0) trebuie sa fie ales in asa fel incat R sa corespunda unei
regiuni de flux convergent in F. In general un interval de valori ale lui
𝜎𝑠 (x0,y0), notat [ 𝜎𝑠 ⁺, 𝜎𝑠 ⁻ ], determina un flux convergent.
Acest interval esteobtinut prin examinarea comportamentului lui F𝜎𝑠 (x0,y0)
atunci cand se variaza 𝜎𝑠 (x0,y0) . Daca 𝜎𝑠 (x0,y0) este destul de mic pt ca
intensitatea lui ds() sa nu treaca de regiunea respectiva , atunci || F𝜎𝑠 (x0,y0)
|| este foarte mic si directia vectorului este sensibila la zgomot.
Daca 𝜎𝑠 (x0,y0) este crescut astfel ca intinderea lui ds() sa treaca de
regiunea respectiva , || F𝜎𝑠 (x0,y0) || creste si directia vectorului devine
stabile si aproximativ ortogonala pe conturul regiunii

6. Algoritmii block matching

Algoritmii de tip block matching(BMA) sunt cele mai cunoscute


metode de estimare a miscarii si sunt adoptate de diverse standarde de
codificare a imaginilor video (MPEg, CCIT, H261/262/263).
Metodele block matching presupon faptul ca un bloc de pixeli are
aceeasi miscare de translatie de la un cadru la celalalt.
Fereastra de sus e impartita in mici blocuri dreptunghiulare. Pentru
fiecare bloc in parte se obtine un vector de miscare, determinand
coordonatele blocului care se potriveste cel mai bine cu cel de referinta din
fereastra de cautare.

Se presupune ca blocul de referinta este de dimensiune MxN pixeli, iar


deplasarea maxima este ±d, in ambele directii, orizontala si verticala.

Vectorul de miscare (u,v) se obtine determinand blocul din cea de-a


doua imagine ce se potriveste cel mai bine cu cel de referinta realizand o
cautare in interiorul ferestrei (2d+1)x(2d+1).

Fereastra de cautare este centrata pe blocul de referinta din prima


imagine.

Cel mai direct algoritm BMA este algoritmul de cautare totala(FS). Acesta
gaseste vectorul de miscare optimal din toti vectorii de miscare din interiorul
ferestrei. Dar el necesita un numar de (2d+1)² calculi pentru determinarea
distantei dintre cele 2 blocuri si determinarea distantei minime.

Aceste calculi complexe fac ca acest algoritm sa nu poata fi folosit in


aplicatii de timp real.

In acest sens , s-au conceput mai multi algoritmi pentru a reduce


complexitatea calculelor.

 Algoritmul de reducere a complexitatii cautarii


Cautarea in 3 pasi.
Metoda ‘three step search ’(3ss) a fost propusa de Koga si se bazeaza pe
o abordare a cautarii de la grosier la fin, ceea ce duce la o scadere logaritmica la
fiecare pas.
Dimensiunea pasilio initial este jumatate din marimea maxima a
deplasarii ‘d’ . Pentru fiecare pas se verifica 9 puncte, iar punctual de minim
alunei masurari devine centru de plecare al pasului urmator.

Cautarea logaritmica 2-D


Aceasta cautare reprezinta o extensie in 2 dimensiuni a cautarii
logaritmice unidimensionale.
Pasul initial este de marime d/4 . La fiecare pas, cautarea este facuta
doar in 5 pozitii care include un punct de mijloc si 4 puncte din 2 directii
principale, orizontala si verticala.
In primul pas , cele 4 puncte utilizate se afla la mijloc, intre central
suprafetei si marginile sale. Daca optimul este in punctual de mijloc , suprafata
este decrementata cu jumatate.
Procedura continua pana cand suprafata de cautare ajunge la
dimensiunea de 3x3 , in acest ultimo pas toate cele 9 pozitii sunt testate pentru
a determina pozitia minimului.

Cautarea cu cresterea acuratetii


Acest algoritm este bazat de asemenea pe ipoteza convexitatii criteriului.
In primul pas , sunt testate vectorii de deplasare peste suprafata de cautare cu
acuratete scazuta.
Dupa determinarea vectorului de deplasare care minimizeaza criteriul de-
a lungul celor 9 puncte posibil, procesul este reluat cu acuratete crescuta, pana
cand se ajunge la acuratete de un pixel.

Cautarea ortogonala
Aceasta tehnica consta printr-o cautare in perechi de pasi orizontali si
verticali, avand o scadere logaritmica la fiecare pas. Pasul initial este de d/2. Se
incepe cu o cautare pe orizontala si sunt verificati cate 3 pixelipe aceasta
directive.
Minimul devine centru de cautare pe vertical, cre de asemenea consta in
verificarea a 3 puncte. Apoi pasul descreste la jumatate si se reia algoritmul.
Algoritmul se termina cand pasul devine 1.

S-ar putea să vă placă și