Sunteți pe pagina 1din 11

1. Opérateurs ponctuels : principes de base, influence de la pente de l’opérateur.

Operatii punctuale : prin care se realizeaza o corespondenta de tip „unu la unu” intre valoarea initiala a
unui nivel de gri si noua valoare a acestuia, pentru fiecare pixel al imaginii. Operatiile punctuale de
modificare a contrastului (numite si transformari ale nivelului de gri) sunt asocieri ce leaga nivelul de gri
original u de noua sa valoare v. O asemenea asociere nu este altceva decat o functie: v = T(u).
Daca pe un interval aceasta panta este subunitara, atunci diferenta intre nivelele alaturate de gri se
micsoreaza si deci contrastul scade; daca din contra, panta dreptei este supraunitara, diferenta dintre
nivelele de gri alaturate se mareste si contrastul va creste.

2. Operateurs ponctuels : l’opérateur linéaire par portions, l’opérateur non-linéaire et non-


linéaire à point fixe.

Tehnica de modificare liniara a contrastului cea mai des folosita este o transformare liniara pe portiuni.
Pentru functia liniara pe portiuni este evident ca derivata va fi constanta pe aceleasi intervale, avand
valoarea egala cu panta segmentului de dreapta. Daca pe un interval aceasta panta este subunitara, atunci
diferenta intre nivelele alaturate de gri se micsoreaza si deci contrastul scade; daca din contra, panta
dreptei este supraunitara, diferenta dintre nivelele de gri alaturate se mareste si contrastul va creste.
Principalul dezavantaj al tehnicii liniare pe portiuni este faptul ca modificarea contrastului este aceeasi
pe un intreg interval de nivele de gri, si nu este posibila o modificare neuniforma a contrastului pe intregul
interval de nivele de gri sau in jurul unui anume nivel de gri. Tehnicile neliniare au aceste proprietati.

O prima proprietate este compandarea domeniului definita de o curba logaritmica si cu punctele fixe
((0; 0) si (M-1; M-1)). Contrastul va varia neuniform de-a lungul scalei de gri, marindu-se la capatul
inferior (negru) si micsorandu-se la capatul superior (alb). In mod reciproc se poate defini expandarea
domeniului, ca transformare inversa celei de compandare, si deci avand o alura exponentiala. Contrastul
va varia neuniform de-a lungul scalei de gri, marindu-se la capatul superior (alb) si micsorandu-se la
capatul inferior (negru). Alte transformari neliniare pot fi obtinute prin folosirea unor functii de tip putere;
si acestea au nivelele de gri extreme ca puncte fixe ((0; 0) si (M-1; M-1)).
Dupa valorile parametrului-putere r se pot obtine doua comportari diferite: pentru r < 1
comportarea este de acelasi tip cu al functiei de compandare logaritmice, iar pentru r > 1
comportarea este de tipul functiei de expandare-prea luminoasa. Trebuie remarcat ca legile de variatie
ale contrastului vor fi insa diferite. Functiei putere i se adauga si un punct fix, functia devenind cu doua
intervale de definitie.

3. Opérateurs ponctuels automatiques.

Egalizarea de histograma este o tehnica de imbunatatire a imaginilor prin cresterea contrastului.


Transformarea este adaptiva si automata, descrierea continutului imaginii fiind realizat prin histograma
imaginii, iar imbunatatirea propriu-zisa fiind rezultatul operatiei de egalizare (sau uniformizare) a acestei
histograme. Valorile histogramei imaginii sunt probabilitatile de aparitie in imagine a diferitelor nivele
de gri din intervalul posibil de valori ([0; M-1]). Histograma imaginii este functia de densitate de
probabilitate de ordinul unu, determinata experimental, a variabilei aleatoare cu valori discrete „nivel de
gri”.
Scopul egalizarii de histograma este obtinerea unei distributii uniforme a nivelelor de gri; imaginea
rezultata va prezenta cea mai mare imbunatatire a contrastului, contrast distribuit regulat in intreaga gama
de valori posibile a nivelelor de gri.
4. Le filtrage linéaire d’image.
IPA_04_linFilt_2016 - CartePAI-2007 – pag 35

Operatia de prelucrare liniara de vecinatate a imaginilor (sau Filtrare liniara a imaginilor) are o
unica forma, transformarea T fiind combinatia liniara ponderata a valorilor selectate de vecinatatea
utilizata.
Vecinatatea V (multimea de puncte din plan definite de coordonatele (m, n) fata de originea ce le
este atasata), impreuna cu multimea de ponderi wmn asociate punctelor din vecinatate formeaza
masca de filtrare (nucleul / functia pondere a filtrului).

Scalarii individuali wmn poarta numele de coeficienti ai filtrului.

Prima observatie ce se poate face cu privire la forma de definire a operatiei de filtrare liniara este
ca folosirea unor ponderi wmn nule este echivalenta cu eliminarea din vecinatatea folosita a
punctelor ce le corespund. In mod echivalent, putem modifica in mod arbitrar forma vecinatatii
prin adaugarea unor puncte carora le alocam pondere nula, fara a modifica in vreun fel rezultatul
filtrarii.

Din punctul de vedere al implementarii practice a filtrelor liniare trebuie luate in considerare doua
aspecte: complexitatea de calcul a operatiei de filtrare liniara si problema aparitiei efectelor de
margine.

Pentru o imagine de dimensiune L x C si o masca de filtrare avand K puncte (Card(V) = K),


numarul de operatii necesare unei filtrari liniare este de LCK inmultiri si LC(K-1) adunari, adica
complexitatea de calcul este O(N2), atat fata de dimensiunile imaginii cat si fata de dimensiunile
ferestrei de filtrare(considerand ca fereastra de filtrare ar fi patrata, avand dimensiunea √K).

Efectele de margine sunt caracteristice pixelilor marginali ai imaginii, in care, fereastra de filtrare,
plasata cu originea in unul dintre acestia, "debordeaza" in afara imaginii, adica, pentru anumite
pozitii (l, c) de plasament al originii vecinatatii, unele pozitii din vecinatatea astfel deplasata nu
au corespondent in suportul fizic al imaginii.

Filtrarea liniara de netezire

Netezirea unei imagini are ca scop reducerea variatiei nivelelor de gri din imagine si, implicit,
cresterea uniformitatii. Aceasta inseamna ca regiunile din imagine vor capata un caracter mai
constant, apropiindu-se astfel de idealul unei regiuni in care toti pixelii ce o compun au aceeasi
valoare. Variatiile prezente in imagine pot fi considerate ca fiind de doua tipuri: variatii reale,
puternice ale intensitatii luminoase (corespunzand contururilor obiectelor din imagine) si variatii
relativ mici, parazite, datorate in principal zgomotului suprapus imaginii si neuniformitatii
intrinseci a obiectelor din scena. O filtrare de netezire va reduce toate aceste categorii de variatii,
avand ca efect secundar incetosarea contururilor si pierderea detaliilor (efect numit bluring).

Filtrarea liniara de accentuare

Contrastarea unei imagini are ca obiectiv imbunatatirea perceperii vizuale a contururilor obiectelor
(imbunatatirea detectabilitatii componentelor scenei de-a lungul frontierelor acestora). In
principiu, acest deziderat se poate realiza prin modificarea valorilor pixelilor aflati de o parte si de
alta a unei frontiere comune, prin masurarea si marirea diferentelor de valoare dintre pixelii vecini.
La baza, o asemenea tehnica va folosi o operatie de derivare.
5. Le filtrage adaptatif de lissage : principes, avantages et désavantages par rapport aux filtres
linéaires.
IPA_06_adaptFilt_2016 - CartePAI-2007 – pag 47

Termenul de adaptiv se refera la capacitatea filtrului de a-si ajusta comportarea (care este
determinata de caracteristicile sale de definitie) in functie de anumite cerinte ce definesc conceptul
de calitate a imaginii filtrate (de exemplu in sensul apropierii ei de imaginea nedegradata din care
provine).
Prin procesul de adaptare, in fiecare nou punct prelucrat structura filtrului este alta, luand in
considerare caracteristicile locale pixelului curent prelucrat. Atata timp cat in fiecare punct al
imaginii operatia este diferita (deoarece se face cu un filtru diferit), filtrarea globala nu mai este
liniara, chiar daca structura filtrului se bazeaza in fiecare punct pe o combinatie liniara a valorilor
selectate de fereastra de filtrare.
In cazul folosirii structurii de filtru liniar ca structura de baza a unui filtru adaptiv, adaptarea nu
poate urmari decat doua variante: modificarea formei ferestrei de filtrare, sau modificarea
coeficientilor unei ferestre de filtrare de forma fixata.

Adaptarea formei vecinatatii

Filtrarea de netezire este evaluata prin diferentele introduse fata de imaginea care se filtreaza; daca
diferentele dintre imaginea filtrata si cea dinainte de filtrare sunt prea mari este posibil ca filtrul
de netezire sa fi incetosat contururi din imagine. Presupunerea colaterala este ca zgomotul este
mai slab decat contururile imaginii si ca variatiile datorate zgomotului sunt mai mici decat
variatiile dintre valorile regiunilor alaturate. Implementarea acestei categorii de filtre foloseste un
"comutator" intre mai multe valori posibile de dupa filtrare, corespunzand unor praguri de
acceptare a variatiilor.

Adaptarea ponderilor - Filtrul LLMMSE

Acronimul LLMMSE provine de la denumirea engleza "Locally Linear Minimal Mean Squared
Error", adica filtru local liniar ce minimizeaza eroarea patratica medie. Coeficientul α de mixare a
imaginii zgomotoase f si a variantei sale filtrate f̅ va trebui determinat in fiecare punct (l, c) al
imaginii.
Imaginea zgomotoasa f provine dintr-o imagine corecta f0, la care s-a adaugat un zgomot alb, aditiv
(f = f0 + z), de medie nula z (z̅ = 0) si necorelat cu imaginea (z̅f = zf = 0).
Ceea ce defineste filtrul adaptiv este coeficientul α; acesta este calculat local impunand
optimizarea unei masuri de calitate obiective - eroarea patratica medie dintre imaginea originala
f0 si rezultatul filtrarii g.

6. Le filtre bilatéral.
IPA_06_adaptFilt_2016 - CartePAI-2007 – pag 53

Filtrul bilateral este un mod de a realiza o filtrare de netezire adaptiva, ce pastreaza contururile din
imagine si care grupeaza local valorile selectate de fereastra de filtrare intr-o combinatie liniara.
Ponderile combinatiei liniare sunt insa calculate in fiecare pixel, pe baza unei duble ponderari
gaussiene: in functie de pozitia spatiala a fiecarui pixel in fereastra de filtrare si in functie de
similaritatea valorii fiecarui pixel cu valoarea pixelului curent prelucrat (centrul ferestrei de
filtrare).

Se remarca faptul ca imaginea este cu atat mai clara cu cat parametrii de dispersie a functiilor
gaussiene ce genereaza ponderile de similaritate a valorilor si de apropiere cu centrul ferestrei de
filtrare sunt mai mici.
Principiul pe care se bazeaza functionarea filtrului bilateral este de a folosi pentru calculul noii
valori a unui pixel doar acele valori din vecinatatea acestuia care au valori suficient de apropiate
cu valoarea sa; astfel se evita medierea valorilor situate de o parte si alta a contururilor.

7. Les filtres d’ordre : principe, filtre médian.


IPA_05_nonlinFilt_2016 - CartePAI-2007 – pag 42

Filtrele de ordine sunt operatori locali: filtrul este definit de o fereastra (masca), care selecteaza
din imaginea de prelucrat un numar de vecini ai pixelului curent.
Iesirea unui filtru de ordine este una dintre valorile selectate de fereastra de filtrare, si deci nu se
creeaza la iesire valori noi (asa cum se intampla la filtrarea liniara); acesta este un avantaj atat in
ceea ce priveste pastrarea valorilor originale din imagine, cat si din punctul de vedere al
simplificarii calculelor (nu mai sunt necesare operatii cu numere reale, ce trebuie apoi rotunjite
sau truncheate la numere naturale).
Filtrele de ordine nu sunt liniare din cauza operatiei de ordonare (ce nu respecta principiul
superpozitiei).
Proprietatile deterministe ale filtrelor de ordine se refera la comportamentul acestora in zonele
tipice ale unei imagini: portiuni netede si contururi. Filtrele de ordine nu afecteaza contururile
(zonele de panta abrupta) si pastreaza valoarea zonelor uniforme.
Aceste comportari au fost extinse la investigarea clasei mai generale de semnale radacina-semnale
ce nu sunt modificate prin filtrare.

Filtru median

Filtrul median este un filtru de ordine a carui iesire este statistica de ordine de ordin central a
setului de valori selectate de fereastra de filtrare.
Iesirea filtrului median este deci valoarea din centrul secventei ordonate; in cazul secventelor
(ferestrelor de filtrare) de dimensiune para, aceasta pozitie centrala nu exista, si atunci este definita
ca media aritmetica a valorilor vecine centrului imaginar. In practica, filtrul median se foloseste
doar cu ferestre de filtrare de dimensiune impara.
Aceasta inseamna ca daca fereastra de filtrare are 3 puncte, medianul este statistica de ordinul 2,
pentru o fereastra filtrare cu 9 puncte, medianul este statistica de ordinul 5, iar pentru o fereastra
de filtrare de 25 de puncte, medianul este statistica de ordinul 13.

Efectele de filtrare a zgomotului impulsiv (de tip sare si piper) sunt evidente; valorile punctelor de
zgomot sunt 0 sau 255 si deci, dupa ordonare, se vor afla la "capetele" sirului de valori; iesirea
filtrului median, fiind statistica de ordin central, este situata departe de valorile extreme.
Probabilitatea de strapungere a unui filtru median este dependenta de procentul de puncte de
zgomot din imagine si de dimensiunea ferestrei de filtrare folosite.
Strapungerea filtrului median se produce atunci cand in fereastra de filtrare avem mai mult de
(K+1)=2 impulsuri de zgomot de acelasi fel.

8. Transformées unitaires : principes de base 1D, 2D, séparabilité.


CartePAI-2007 – pag 73

Termenul de transformata unitara se refera la o clasa de matrici unitare folosite pentru


reprezentarea imaginilor. O transformata unitara este un operator de tip integral, caracterizat de
faptul ca valoarea fiecarui pixel din imaginea finala (transformata) depinde de valorile tuturor
pixelilor din imaginea originala.
Caz unidimensional

Se defineste transformata lui u ca fiind vectorul coloana v = [v(0) v(1) ... v(N-1)]T, obtinut ca:
v = Au.
Transformata inversa, care permite recuperarea vectorului original u din cel transformat v se scrie,
tinand cont de: u = A*T v;
Semnificatia unei transformate unitare poate fi inteleasa punand in evidenta coloanele matricii
A*T , mai precis, scriind-o pe aceasta sub forma: A*T = [a0 a1 ... a N-1];
Calculul lui u se interpreteaza ca o descompunere a acestuia intr-o alta baza a lui CN, si anume
cea formata din coloanele matricii A*T.

Caz bidimensional

Fie U = {u(m,n)}m,n=0,...N-1 un semnal cu suport bidimensional (o imagine). Am putea trata cazul


transformatei unitare a lui U prin reducere la cazul unidimensional, considerand ca date de pornire
un vector coloana avand ca elemente cele N2 valori ale matricii U.
O prima consecinta a echivalentei cu cazul unidimensional este faptul ca o transformata unitara
a unei imagini reprezinta scrierea imaginii respective intr-o alta baza, ca o combinatie liniara a
unor vectori/imagini "de baza". O a doua consecinta a acestei echivalente este faptul ca
transformata unitara a imaginii U necesita specificarea a N4 elemente.
Pentru a pastra, insa, reprezentarea bidimensionala a imaginilor, vom considera cele N4 elemente
organizate sub forma a N2 matrici de dimensiune N x N fiecare.
In plus, pentru ca transformata sa fie unitara, este necesar ca noua baza de reprezentare a imaginii,
formata din cele N2 matrici Akl, sa fie ortonormata.
Insa, din cauza numarului foarte mare de calcule necesitat - complexitatea algoritmului de calcul
al transformatei unitare a unei imagini N x N este O(N4) - transformatele unitare sunt rareori
folosite.
Ce se foloseste este o forma particulara de transformate unitare, si anume asa numitele
transformate separabile, care sunt de complexitate O(N3). Prin definitie, o transformata unitara
bidimensionala se numeste separabila, daca cele N4 elemente care o definesc, akl(m,n), pot fi
calculate pornind de la elementele unei singure matrici A = {a(k,l)}k,l=0,1,...,N-1.

Calculul transformatei unei imagini prin succesiunea de operatii:

1. Inmultirea la stanga a matricii imagine cu matricea unitara A;


2. Transpunerea rezultatului;
3. Inmultirea la stanga a matricii rezultate cu matricea unitara A;
4. Transpunerea rezultatului.

9. La transformée de Fourier discrète.


CartePAI-2007 – pag 77

Fie U = {u(m, n)}m,n = 0,1,...N-1 o imagine de dimensiuni N x N. Se defineste transformata


Fourier bidimensionala a imaginii U ca fiind matricea V = {v(k, l)}k,l=0,1,...,N-1 ale carei
elemente sunt calculate dupa:
Transformata inversa este data de:

1
Din cauza factorului de scalare ce apare numai in transformarea inversa, definitia transformatei
𝑁2
Fourier discrete de mai sus nu se potriveste perfect cu cadrul general al transformatelor unitare.
Pentru o potrivire perfecta, se poate defini transformata Fourier discreta unitara dupa relatiile:

relatii ce pot fi scrise sub forma matriciala ca:

V = FUF
U = F*VF*

unde F = {f (k, n)}k,n = 0,1,...,N-1 este matricea cu elemente date de:

Evident, diferenta intre cele doua definitii ale transformatei Fourier discrete (cea neunitara si cea
unitara) este strict cantitativa, la nivel de factor de scalare. In continuare, vom considera cazul
unitar, neuitand insa ca absolut toate concluziile pe care le tragem sunt valabile si pentru
transformata Fourier neunitara.

10. Le codage de Huffman


CartePAI-2007 – pag 196

Este metoda optimala de codare a unei surse de informatie. Codarea sursei de informatie S ale
carei mesaje sunt {s1; s2; ...;sN}, de probabilitati {p(s1); p(s2); ...; p(sN)} prin alfabetul X cu D
simboluri inseamna a asocia fiecarui mesaj si al sursei primare de informatie un sir de simboluri
din alfabetul codului. Lungimea medie a cuvintelor de cod este data de raportul dintre entropia
H(S)
sursei primare si entropia alfabetului codului: l =
H(X)
Se doreste obtinerea unei lungimi medii minime a cuvintelor de cod, si deci, echivalent, marirea
H(S)
entropiei alfabetului codului: lmin =
log D
Procedeul practic prin care se realizeaza alocarea simbolurilor din alfabetul codului astfel incat
entropia acestuia sa fie maximizata (metoda Huffman) se bazeaza pe reducerea iterativa a
numarului de simboluri ale sursei de codat si construirea unei surse restranse.
11. Le codage Ziv-Lempel
CartePAI-2007 – pag 201

Se bazeaza pe tehnica dictionar LUT (folosita si la reprezentarea imaginilor indexate): cuvintele


de cod asociate unor siruri de simboluri ale sursei de intrare sunt indicii (numerele de ordine)
pozitiilor la care se gasesc respectivele siruri de simboluri in dictionarul codului (tabela de codare).
Tabela de codare(dictionarul) este creata pe masura parcurgerii sirului de simboluri de intrare, si,
pentru decodare, tabela se creaza din cuvintele de cod deja transmise.
Dictionarul initial are doua cuvinte: cuvantul 0, avand indicele 0 si cuvantul 1, avand indicele 1.
Din sirul de intrare (presupus binar) se extrage cate un bit si se verifica daca sirul de biti deja extras
se regaseste sau nu in dictionar. Daca sirul se regasete in dictionar, se mai adauga un bit din sirul
de intrare.
Daca sirul nu se regasaste in dictionar, atunci sirul este trecut in dictionar, in sirul codat se scrie
codul (indicele) prefixului sirului nou adaugat (deci pozitia la care se gaseste in dictionar cuvantul
la care adaugand ultimul bit al sirului de intrare se obtine un cuvant nou) si ultimul bit din sir
devine primul bit al urmatorului sir de intrare.
Daca, inaintea terminarii simbolurilor din sirul de codat, tabela de codare (cu numar fixat de
intrari) se umple, exista doua variante de continuare: fie restul sirului de intrare se codeaza
conform tabelei de codare existente prin cautarea celor mai lungi cuvinte de cod, fie tabela de
codare este "golita" si se continua cu procedeul initial.

12. Le principe de la compression avec des transformées unitaires


CartePAI-2007 – pag 197

Principiul compresiei cu transformate a imaginilor se bazeaza pe proprietatile de compactare a


energiei si decorelare a componentelor spectrale pe care le prezinta majoritatea transformarilor
integrale unitare.
Transformarea optimala trebuie sa decoreleze complet componentele spectrale, asigurand astfel si
compactarea maxima a energiei si cea mai buna eroare de aproximare prin trunchierea frecventelor
inalte. Decorelarea completa este dependenta de proprietatile statistice ale imaginii (matrice de
covariatie) deci, pentru fiecare imagine in parte, trebuie gasita transformarea optimala.
Exemplul cel mai des folosit de compresie cu transformate este standardul de compresie JPEG.
Imaginea este divizata in blocuri de 8 x 8 pixeli, care nu se suprapun. Fiecarui bloc i se aplica o
transformata cosinus bidimensionala, iar cei 64 de coeficienti ai transformarii sunt copiati intr-un
vector prin baleierea pe diagonala a blocului de 8 x 8 pixeli. Coeficientii sunt cuantizati in
conformitate cu un numar prestabilit de nivele de cuantizare (stabilit prin standard, si proportional
cu factorul de calitate dorit pentru imaginea refacuta).
Factorii de compresie ce rezulta sunt cuprinsi in mod tipic intre 10 si 100.
Aspectul de compresie cu pierderi (diferentele fata de imaginea originala) se manifesta prin efectul
de blocking: sublinierea frontierelor de separatie a blocurilor de baza.

13. La segmentation par seuillage.


IPA_08_Segmentation_2016 - CartePAI-2007 – pag 105

Histogram segmentation = Thresholding


Finding “thresholds” that separates the modes of the image histogram.

Segmentarea pe histograma

Urmareste determinarea unor nivele de gri ce separa modurile histogramei, numite praguri de
segmentare. Tuturor punctelor din imagine al caror nivel de gri corespunde aceluiasi mod (deci
care au un nivel de gri situat in intervalul dintre doua praguri succesive), li se asociaza o eticheta
comuna, a carei semnificatie este de apartenenta a punctului la obiectul respectiv.
Segmentarea imaginii originale f dupa setul de praguri {Tk} produce imaginea etichetata g,
descrisa de: g (l, c) = Ek, unde T0 = 0, Tk = M si k = 0, 1,..., K-1. Pragurile Tk pot fi alese manual,
prin inspectia histogramei, in minimele locale ale acesteia.
Cazul cel mai simplu de segmentare pe histograma este acela in care histograma imaginii este
bimodala, corespunzand unei imagini in care regasim obiecte de interes si fundal.
In acest caz, segmentarea revine la impartirea pixelilor imaginii in obiecte/fundal, operatie ce
necesita determinarea unui singur nivel de gri de separatie T.
Acest prag de segmentare poate fi ales pe minimul histogramei ce separa modurile acesteia (daca
separatia este evidenta). Astfel, pornind de la imaginea initiala f, imaginea etichetata g va fi data
de:
E0 daca 0 ≤ f (l, c) < T
g (l, c) =
E1 daca T ≤ f (l, c) < M

Imaginea etichetata g - rezultatul transformarii - va fi descrisa de cele doua etichete:


eticheta E0 pentru punctele al caror nivel de gri este mai mic decat pragul T si eticheta E1 pentru
punctele al caror nivel de gri este mai mare decat pragul T. Etichetele E0 si E1 pot fi valori
numerice (0 si 1, sau 0 si 255) sau pot fi siruri de simboluri. Acest tip de segmentare se numeste
binarizare, intrucat imaginea rezultata este caracterizata de numai doua valori.

14. La segmentation par croissance de régions.


IPA_08_Segmentation_2016 - CartePAI-2007 – pag 97

Principiul pe care se bazeaza cresterea regiunilor este simplu: se aleg in imagine puncte
reprezentative pentru fiecare obiect individual si/sau categorie de obiecte, in jurul carora are loc
un proces de aglomerare a pixelilor vecini, ce au aceleasi proprietati (in particular acelasi nivel de
gri sau aceeasi culoare). In urma acestui proces de aglomerare (adaugare de puncte) se obtin zone
(regiuni) de pixeli cu aceleasi caracteristici, deci obiecte individuale.
Procesul se opreste in momentul in care toate punctele imaginii au fost alocate fiecarei regiuni.

Alegerea germenilor

Este evident ca numarul final de regiuni rezultate este egal cu numarul de germeni initiali.
In principiu, este de dorit ca fiecare obiect individual aflat in imagine sa fie marcat de cate un
germene unic. Daca in interiorul unui aceluiasi obiect se gasesc mai multi germeni, pentru fiecare
dintre ei va fi crescuta o regiune, ceea ce face ca obiectul initial sa fie impartit artificial prin
segmentare in mai multe regiuni.

Pentru a preveni efectul unor neuniformitati de iluminare pe suprafata imaginii, aceasta este
impartita in ferestre nesuprapuse; in fiecare astfel de fereastra se alege un numar de germeni, al
caror plasament spatial este aleator (germenii se distribuie uniform pe suprafata ferestrelor si a
imaginii).
Germenii se aleg astfel incat nivelul lor de gri sa fie reprezentativ pentru obiectele prezente local
si plasamentul lor spatial sa se faca in interiorul regiunilor si nu pe frontiera acestora.

O verificare suplimentara incearca sa previna o eventuala suprasegmentare (deci impartirea


artificiala a unui acelasi obiect in mai multe regiuni), eliminand germenii plasati in interiorul
aceluiasi obiect. Verificarea se face pe baza calculului variatiei nivelelor de gri de-a lungul
drumurilor arbitrare ce unesc perechi de germeni.

In practica, examinarea tuturor drumurilor (cailor) ce unesc perechi de germeni este costisitoare
din punctul de vedere al timpului de calcul, de aceea se verifica doar caile formate din segmente
verticale si orizontale de lungime maxima, si eventual, calea reprezentata de segmentul dreapta ce
uneste cele doua puncte.
Reprezentarea numerica a conceptelor de variatie semnificativa a nivelelor de gri de-a lungul unei
cai sau in jurul unui punct necesita definirea unor praguri de comparatie, a caror alegere se face
pe baza conditiilor particulare din imagine si a experientei utilizatorului.

Cresterea propriu-zisa

Pornind de la germenii alesi, regiunile sunt obtinute printr-un proces de crestere aproape simultan,
inceput de la acestia, pana cand toti pixelii imaginii sunt repartizati unei regiuni. Cvasi-
simultaneitatea cresterii poate fi realizata cu un algoritm serial, prin alocarea pixelilor ce sunt
adiacenti (vecini) zonelor deja segmentate. Aceasta alocare trebuie sa tina seama de criteriul ca
regiunile crescute sa fie uniforme: nivelul de gri al pixelului ce se adauga nu trebuie sa difere cu
mai mult de un prag prestabilit fata de nivelul de gri al germenului regiunii la care se aloca.
Alegerea pragului (a diferentei maxim admise de nivele de gri) dintre pixelii ce se adauga unei
regiuni si germene este o problema ce nu are o solutie universala: diferenta maxim admisa poate
varia de la o imagine la alta, si chiar ar putea fi diferita de la o regiune la alta a aceleiasi imagini.

Avantajele pe care le are tehnica de crestere a regiunilor sunt acelea ca nu mai este necesara nici
o informatie privind continutul imaginii, regiunile crescute sunt conexe, nu exista puncte
neetichetate (nealocate vreunei regiuni) si pozitia frontierelor dintre diferitele regiuni corespunde
pozitiei frontierelor percepute subiectiv in imagine.

15. La segmentation par clustering.


IPA_08_Segmentation_2016 - CartePAI-2007 – pag 117

Tehnicile de clustering (sau de auto-organizare a datelor multidimensionale) sunt metode


algoritmice prin care se atribuie fiecarui vector de date din multimea considerata, o eticheta de
apartenenta la una dintre clasele ce rezulta prin gruparea vectorilor similari. Toti vectorii de date
ce au valori asemanatoare vor capata o aceeasi eticheta de apartenenta, formand un grup. Rezulta
astfel o partitionare completa a setului de vectori de trasaturi asociati pixelilor imaginii, ceea ce
induce partitionarea completa a suportului spatial al imaginii, si deci segmentarea acesteia.

Clustering net

Metodele de clustering iterativ distribuie vectorii intr-un numar predefinit de clase, repetand
testarea unor conditii pentru fiecare vector al multimii; in functie de indeplinirea sau nu a
respectivelor conditii, partitia existenta la un moment dat este declarata corespunzatoare sau, in
urma modificarii alocarii unor unitati, procedeul de verificare se reia.
Calitatea partitiei (a clasificarii) este masurata de suma variantelor claselor wj (adica suma
distantelor de la fiecare vector la centrul clasei in care apartine, ceea ce poate fi interpretat si ca o
eroare de aproximare a vectorilor din clase prin centrul respectivei clase).

Determinarea coeficientilor de apartenenta uij este insa o problema de optimizare combinatoriala,


care nu poate fi rezolvata analitic. Pentru rezolvarea acestei probleme sunt necesare metode
iterative. Metoda urmareste sa determine, pentru fiecare vector al setului, daca acesta poate fi
mutat dintr-o clasa in alta, astfel ca suma variantelor claselor sa scada. Dupa fiecare asemenea
mutare, este necesara actualizarea mediilor claselor intre care s-a facut schimbul. Iteratiile se
repeta pana cand nici un vector nu mai poate fi mutat.
Principalul dezavantaj al acestei abordari este faptul ca mediile claselor sunt recalculate dupa
fiecare schimbare ce implica fiecare vector al multimii considerate, ceea ce are ca efect un volum
mare de calcul. O simplificare a metodei provine din observatia intuitiva ca este normal ca un
obiect sa fie alocat (sa apartina) clasei de care este cel mai apropiat (in sensul distantei la media
acesteia).
Realocarea se poate face pentru toate obiectele considerate fara a fi nevoie de recalcularea mediilor
claselor pentru fiecare obiect; recalcularea mediilor se va face dupa fiecare parcurgere completa a
multimii de obiecte de partitionat.

16. L’extraction des contours en utilisant le gradient.


IPA_10_Contour_2016 - CartePAI-2007 – pag 126

Variatiile de valoare a functiei imagine pe o directie oarecare sunt masurate de operatorul gradient.
Extragerea punctelor de contur este imediata: este suficient a calcula pentru fiecare punct al
imaginii valoarea maxima a gradientului, ce va fi apoi comparata cu un prag fixat. Daca valoarea
maxima a gradientului dintr-un punct este suficient de importanta si depaseste valoarea pragului,
atunci punctul respectiv este declarat punct de contur.

Pentru determinarea variatiei maxime a imaginii este necesara determinarea derivatelor pe


directiile orizontala si verticala. Se remarca faptul ca toate mastile de filtrare liniara, ce
implementeaza operatii derivative, verifica conditia de normare a filtrelor liniare derivative, si
anume, suma coeficientilor de ponderare din masca sa fie nula.

Schema de implementare a operatiei de extragere a punctelor de contur din imagini prin calculul
gradientului dupa doua directii ortogonale, are trei rezultate de interes: harta de intensitati de
tranzitie g (l, c), care este o imagine ce contine, pentru fiecare pixel, valoarea maxima a
gradientului pentru pozitia respectiva; harta de contururi e (l, c) care este o imagine binara in care
punctele marcate(punctele-obiect) corespund pozitiei punctelor de contur (puncte al caror gradient
maxim depaseste pragul fixat) si harta de orientari θ0 (l, c) care este o imagine ce contine, pentru
fiecare pixel, orientarea gradientului de modul maxim in punctul respectiv, si este folosita in
general la prelucrarea suplimentara a contururilor (conectarea contururilor, extragerea directionala
a contururilor).

Unul dintre principalele dezavantaje legate de folosirea mastilor derivative simple, ce


implementeaza direct operatia de derivare directionala discreta, este sensibilitatea importanta la
zgomot.

In urma derivarii, dupa oricare masca, un zgomot alb aditiv este amplificat de doua ori. O metoda
evidenta de compensare a acestei probleme este realizarea unei operatii de reducere a zgomotului
(netezire) inaintea derivarii, urmarind simultan pastrarea profilurilor abrupte de tranzitie
(introducerea unor efecte minime de incetosare).
Operatiile de filtrare liniara fiind realizate prin convolutii, sunt asociative, deci este posibila
determinarea unei masti unice de filtrare, care sa grupeze efectele de netezire si derivare dupa cele
doua directii perpendiculare.

17. L’utilisation de la dérivée seconde pour l’extraction du contour.


IPA_10_Contour_2016 - CartePAI-2007 – pag 135

Gasirea centrului tranzitiei poate fi realizata prin folosirea derivatelor de ordinul doi a functiei
imagine, grupate in operatorul laplacian:
Operatorul laplacian nu permite detectarea directiilor de tranzitie, deoarece informatia de orientare
a tranzitiei este pierduta. Determinarea punctelor de contur ca puncte de extrem ale laplacianului
(maxime si minime, sau maxime ale valorii absolute a laplacianului) produce muchii duble in harta
de contururi, deoarece aceste puncte de extrem sunt situate de o parte si de alta a regiunii de
tranzitie, marcand limitele acesteia. Mijlocul tranzitiei este marcat de trecerea prin zero a
laplacianului: pe acest comportament al laplacianului se bazeaza modelul de detector "zero-
crossing" introdus de Marr si Hildreth.
Existenta trecerii prin zero este definita de existenta unui minim negativ si a unui maxim pozitiv
printre cele patru valori medii. Suplimentar, in practica se foloseste si constrangerea ca diferenta
dintre valoarea maxima si cea minima sa fie semnificativa.

18. L’opérateur en « chapeau mexicaine » pour l’extraction des contours.


CartePAI-2007 – pag 136

Sensibilitatea la zgomot a laplacianului este mai mare decat a operatorilor de gradient, ceea ce a
dus la introducerea unor operatori de derivata secunda, combinati cu netezire.
Unul dintre acesti operatori este LOG, laplacian de gaussiana.

Scalarul K este determinat din conditia de normalizare a coeficientilor mastii de filtrare liniara.
Parametrul σ2 controleaza gradul de netezire al operatorului (deci gradul de reducere al
zgomotului suprapus imaginii) si implicit, importanta contururilor extrase.
O varianta separabila a acestui operator (deci care combina filtrari numai pe linii si numai pe
coloane) a fost propusa de Huertas si Medioni: h = h1(m) * hn(y) + h2(m) * h1(n).

Forma separabila a operatorului LOG pune in evidenta in mod clar operatiile de derivata secunda
unidirectionala a unei gaussiene (h1) si de netezire pe directia ortogonala derivarii, dupa un
nucleu gaussian (h2). Avantajul formei separabile este posibilitatea implementarii cu un numar
redus de operatii.

Derivata secunda unidimensionala a nucleului gaussian poate fi pusa de asemenea si sub forma
unei diferente de gaussiene cu dispersii diferite:

S-ar putea să vă placă și