Sunteți pe pagina 1din 22

Proiect

La Procesarea avansată a semnalelor


biomedicale
Tema : Tehnici de analiză a imaginilor :
egalarea histogramei

A efectuat : Gangan Eduard FCIM-


IBM201M
A verificat : dr.conf.univ.Railean Serghei
CHISINAU 2020
Introducere
~Tehnicile de analiză a imaginilor;
-Ce reprezintă imaginea;
-Aspecte ale imaginilor;
-Culoarea imaginilor;
-Formatele de imagine;
-Tipuri de imagini;
-RGB;
-Conversia din imagini RGB în imagini gri;
-Spațiul de culoare perceptiv;
-Formarea imaginilor.

~Egalarea histogramei
Potrivirea histogramelor ;
Teoria potrivirii histogramelor ;
Teoria potrivirii histogramelor: cazul discret ;
Potrivirea histogramei în practică ;
Egalizarea histogramei adaptive ;
Operații asupra histogramelor în imaginile color ;
Ce reprezintă imaginile?
O imagine digitală poate fi considerată ca o reprezentare discretă a datelor care
posedă atât informații spațiale (aspect) cât și de intensitate (culoare). De asemenea
o imagine poate fi considerată ca un semnal multidimensional.
Aspecte ale imaginilor
Imaginea digitală bidimensională I(m,n) reprezintă răspunsul unor senzori la
poziții fixe în coordonatele carteziene 2-D și sunt derivate de la semnalul spațial
I(x,y) printr-un proces de eșantionare frecvent denumit discretizare, iar indicii m și
n destinați respectiv rândurilor și coloanelor imaginii. Discretizarea apare în mod
natural cu anumite tipuri de senzori de imagine (cum ar fi camere CCD) și practic
determină o mediere locală a semnalului continuu peste unele regiuni mici în
domeniul de recepție. Elementele individuale sau pixelii imaginii sunt astfel
menționate prin indecii lor 2-D (m,n).Ca urmare a convenției Matlab,I(m,n)
reprezintă răspunsul pixelului situat la rândul și coloana n pornind de la o origine
din stânga sus a imaginii.

Figura 1. Coordonatele spațiale carteziene a unei imagini digitale M x N


În alte sisteme de formare a imaginii, originea imaginii utilizate poate varia.
Deseori teoretic este să tratăm o imagine ca un semnal spațial continuu I(x,y) . În
special, acest lucru uneori ne permite să înțelegem mult mai bine proprietățile
imaginii și de a le manipula și procesa mult mai efectiv. Analiza matematică a
imaginilor discrete conduce în general la o formulare algebrică liniară care este
mai bună în unele cazuri. Valorile pixelilor individuali în majoritatea imaginilor
corespund de fapt unor răspunsuri fizice în spațiul 2-D. Cu toate acestea, de
asemenea suntem liberi să considerăm imaginile în spații abstracte, unde
coordonatele reprezintă altceva decât spațiul fizic, și de asemenea putem extinde
notația către 3 sau mai multe dimensiuni. De exemplu, aplicațiile de imagistică
medicală sunt imagini 4-D în care 3 coordonate sunt spațiale și cealaltă coordonată
corespunde timpului.
Culoarea imaginilor
O imagine conține unul sau mai multe canale de culoare care definesc intensitatea
sau culoarea la o anumită locație a pixelului I(m,n) În cel mai simplu caz, fiecare
locație a pixelului conține o singură valoare numerică care reprezintă nivelul
semnalului de la acel punct din imagine. Conversia din acest set de numere la o
imagine afișată este realizată printr-o hartă de culoare. O hartă de culoare atribuie o
nuanță specifică de culoare la fiecare nivel numeric din imagine pentru a da o
reprezentare vizuală a datelor. Cea mai utilizată mapă de culoare este “grayscale”,
care atribuie toate nuanțele de gri de la negru (zero) la alb (maxim) în funcție de
nivelul semnalului. Grayscale este deosebit de bine adaptată pentru imagini de
intensitate, și anume imagini care exprimă numai intensitatea semnalului ca o
singură valoare la fiecare punct din regiune. În anumite cazuri, pentru a afișa
imagini de intensitate, se poate utiliza o hartă în culori false. Unul din principalele
motive de a utiliza afișarea în culori false se bazează pe faptul că sistemul vizual
uman este senzitiv la doar aproximativ 40 de nuanțe de gri, în intervalul de la
negru la alb, în timp ce sensibilitatea la culoare este mult mai fină. Culorile false
pot servi de asemenea pentru a accentua sau delimita anumite funcții sau structuri,
ceea ce le face mai ușor de identificat pentru observatorul uman. Această abordare
este deseori folosită în imagini astronomice și medicale.
Figura 2. Exemplu de afișare a imaginii în scara gri(stânga) și culori
false(dreapta)
În această figură este reprezentată o imagine de intensitate astronomică, afișată
folosind atât nuanțe de gri, cât și o harta de culori false. În acest exemplu, harta de
culori a fost folosită pentru a evidenția detaliat structura și detaliile mai fine ale
imaginii pentru ochiul uman, folosind un interval de culoare liniară variind de la
albastru închis până la roșu închis. Definiția hărților de culoare, adică atribuirea de
culori la valori numerice, pot fi făcute în orice mod pentru ai fi mai ușor
utilizatorului. Deși asocierea dintre valoarea numerică a intensității și culoarea sau
nuanța de gri, este în mod tipic liniară, există situații în care o asociere neliniară
este mult mai binevenită. În plus față de imaginile gri pentru care avem o singură
valoare numerică la fiecare locație a pixelului, de asemenea avem imagini cu culori
reale unde întregul spectru de culori poate fi reprezentat ca un vector triplet, în
mod tipic (R,G,B), component la fiecare pixel. Aici culoarea este reprezentată ca o
combinație liniară de culori de bază sau valori și imaginea poate fi considerată ca
fiind formată din 3 planuri, care sunt planuri 2-D. Alte reprezentări ale culorilor
sunt de asemenea posibile și utilizate destul de larg, cum ar fi (H,S,V)
(hue,saturation and variance[nuanță, saturație și intensitate]). În această
reprezentare, intensitatea V a culorii este decuplată de informațiile cromatice, care
sunt conținute în cadrul componentelor de nuanță și saturație.
Formatele de imagine
Din punct de vedere matematic, orice matrice de numere 2-D poate fi considerată o
imagine. În viața reală, avem nevoie de a afișa imagini în mod eficient, de a le
stoca, de a le transmite prin intermediul rețelelor și de a recunoaște datele numerice
corespunzătoare imaginilor. Acest lucru a condus la dezvoltarea formatelor
standard a imaginilor digitale. În termeni simpli, formatele de imagini cuprind un
fișier antet care conține informațiile despre cum mai exact imaginea este stocată și
valorile 11 reale ale pixelilor. Există un număr mare de formate de imagine
recunoscute existente acum, datând înapoi peste mai mult de 30 de ani de stocare a
imaginilor digitale. Unele dintre cele mai utilizate 2-D formate de imagini sunt:
GIF (Graphics interchange format);
 JPEG (Joint Photographic Experts Group)
CEL MAI UTILIZAT;  BMP (Bit map picture);
 PNG (Portable network graphics);
 TIF/ TIFF (Tagged image (file) format).
sau de culori, cu acestea din urmă sunt definite printr-o hartă de culoare în antetul
fișierului. Prin contrast, formatul obișnuit de JPEG este capabil să stocheze până la
24 de biți RGB pentru o imagine color, și până la 36 de biți pentru aplicațiile de
imagistică medicală sau științifică, și este utilizat cel mai frecvent pentru imagini la
nivel de consum, cum ar fi camerele digitale. Un alt format întâlnit care este bine
cunoscut este formatul bitmap (BMP), originar din dezvoltarea sistemului de
operare Windows Microsoft, și noul PNG format, conceput pentru înlocuirea mai
puternică a lui GIF. TIFF, tagged image file format, reprezintă un format major și
adaptabil, foarte flexibil, capabil să stocheze o gamă largă de diferite formulare de
date ale imaginilor. În general, imaginile de tip fotografic sunt mai potrivite tipului
de stocare JPEG sau TIF, în timp ce imaginile cu culori limitate sau detalii limitate
sunt cele mai potrivite la GIF sau PNG, pentru ca să fie adaptabile fără pierderi la
majoritatea cerințelor stocării.
Tipurile de imagini
Alegerea formatului de imagine utilizat poate fi în mare parte determinată nu
numai de conținutul imaginii, ci și de tipul de date din imagine necesar pentru
stocare. În plus, față de rezoluția de biți a unei imagini date, mai există și un număr
de tipuri distincte ale imaginii:
Imaginile binare sunt matrici 2-D care atribuie o valoare numerică din setul
fiecărui pixel din imagine. Acestea uneori sunt denumite imagini logice: negru
corespunde lui 0 și alb corespunde la 1. După cum nu sunt permise alte valori,
aceste imagini pot fi reprezentate ca un simplu flux de biți, dar în practică ele sunt
reprezentate ca imagini întregi de 8 biți. O imagine de fax este un exemplu de
astfel de imagine binară.
Imaginile în nuanțe gri sau de intensitate sunt matrici 2-D care atribuie o valoare
numerică fiecărui pixel care reprezintă intensitatea în acel punct.
Imaginile color sau RGB sunt matrici 3-D care atribuie trei valori numerice
fiecărui pixel, fiecare valoare corespunde componentelor ROȘU, VERDE și
ALBASTRU (RGB). Conceptual, putem considera trei planuri 2-D distincte de
dimensiunea CxRx3 , unde C este numărul coloanelor și R numărul rândurilor.
Imaginile cu virgule mobile diferă de alte tipuri de imagine discutate mai înainte
prin faptul că nu stochează valori întregi de culoare, în schimb stochează un număr
cu virgulă mobilă, care într-un interval de timp dat, definit de precizia virgulei
mobile, reprezintă intensitatea. Ele pot reprezenta o valoare măsurătoare, alta decât
intensitatea simplă sau culoarea dintr-o imagine științifică sau medicală. Imaginile
cu virgule mobilă sunt de obicei stocate într-o imagine de format TIFF sau mult
mai specializat, formatul domeniu-specific (ex: DICOM). Deși utilizarea
imaginilor cu virgule mobile este în creștere, prin utilizarea domeniului dinamic
înalt și fotografierea stereo, formatele de fișiere care susțin stocarea lor nu rămân
în prezent limitate.
RGB
Imaginile RGB (imagini de culori reale) sunt matrici 3D pe care noi putem să le
considerăm ca 3 planuri distincte 2D, corespunzând fiecărui din cele 3 canale de
culori: roșu(R), verde(G) și albastru(B). RGB este cel mai utilizat spațiu de culori
utilizat pentru reprezentarea imaginilor digitale, pentru că acestea corespund celor
3 culori primare care sunt mixate pentru reprezentarea pe monitor. Putem ușor
separa și vedea componentele roșii, verzi și albastre a imaginilor de culoare reală,
fapt care este demonstrat și în imaginea de mai jos:

Figura 3. Imagine RGB separată în canalele corespunzătoare de culori roșu(R),


verde(G) și albastru(B)
Este important să menționăm că culorile tipice prezente în imaginea reală sunt
aproape totdeauna un amestec de componente de culoare din toate cele 3 canale. O
concepție greșită este că, de exemplu, elementele percepute ca albastru vor apărea
doar în canalul albastru și așa mai departe. În timp ce elementele percepute ca
albastru vor apărea sigur mai strălucitoare în canalul albastru, ele de asemenea vor
apărea ca componente mai puțin nuanțate de roșu și verde.
Dacă considerăm că culorile pot fi afișate cu reprezentarea RGB, atunci
considerăm că spațiul de culoare RGB este un spațiu de culoare esențial 3D cu
axele R,G si B. Fiecare axă are același interval 0 → 1 ( scalat de la 0 la 255 pentru
bitul comun 1 de canal, în reprezentarea imaginii pe 24 de biți). Culoarea neagră
ocupă originea cubului, adică poziția (0,0,0) care corespunde cu absența tuturor trei
culori, iar culoarea albă ocupă colțul opus, adică poziția (1,1,1), indicând valoarea
maximă a celor 3 culori. Toate celelalte culori se află în cadrul acestui cub. Spațiul
de culoare RGB este bazat pe partea spectrului electromagnetic vizibil oamenilor.

Figura 4. Ilustrarea spațiului de culoare RGB ca un cub 3D


Ochiul uman are trei tipuri diferite de receptori de culoare, pe care are o absorbție
limitată pentru fiecare dintre lungimile de unde roșii, verzi și albastre. Din această
cauză transformarea de la culoare la scara gri, utilizează o combinație de canale
RGB. În procesarea digitală de semnale utilizăm modelul simplificat al spațiului
RGB care este optimizat și standardizat către reprezentarea grafică, însă cu toate
acestea este perceptiv neliniar. Prin aceasta avem în vedere faptul că mișcarea într-
o direcție dată în cubul de culoare RGB, nu produce neapărat o culoare care este
perceptivă în concordanță cu schimbarea în fiecare dintre canale. De exemplu,
începând de la alb și scăzând componenta albastră, se produce galben. Similar,
pornind de la roșu și adăugând componente albastre, se produce roz. Din această
cauză, spațiul RGB este dificil pentru oameni de a lucra cu el și motivul din care
cauză nu este relatat la o cale naturală de a percepe culorile. Ca alternativă putem
utiliza perceptarea culorilor ca reprezentare HSV (nuanță, saturație și
intensitate).

Conversia din imagini RGB în imagini gri


Putem converti dintr-un spațiu RGB într-o imagine în nuanțe gri folosind o simplă
transformare. Conversia în scara gri este o etapă inițială în majoritatea algoritmilor
de analiză a imaginilor, deoarece simplifică esențial cantitatea informației în
imagine. Cu toate că o imagine de tip gri are mai puține informații decât o imagine
color, majoritatea celor mai importante caracteristici, cum ar fi marginile,
regiunile, intersecțiile și așa mai departe, sunt menținute. Elementele de detecție și
procesare a algoritmilor operează mai apoi asupra versiunii convertite la scara gri a
imaginii. După o asemenea conversie încă este posibil de a distinge culorile verde
și roșu, cum ar fi în următorul exemplu:

Figura 5. Exemplu de conversie a imaginii color (stânga) la imagine în scara gri


(dreapta)
unde mărul roșu și mărul verde se pot distinge și după conversie.
O imagine de culori RGB, Icolor , este convertită la scara gri,Igri , utilizând

următoarea transformare: ,
unde (n,m) sunt indecși ai unui pixel individual în imaginea gri și (n,m,c) este
canalul individual al locației pixelului (n,m) în imaginea color pentru canalul c: în
roșu r, albastru b și verde g. După cum putem observa și în ecuația de mai sus, o
imagine gri reprezintă o sumă ponderată a canalelor de culoare roșie, verde și
albastru. Coeficienții (α,β si γ) sunt setați proporțional cu răspunsul perceptual al
ochiului uman pentru fiecare din culorile roșu, verde și albastru. Ochiul uman este
natural mult mai senzitiv la roșu și verde deschis și prin urmare aceste culori
primesc ponderi mai mari pentru a asigura ca echilibrul intensității în imaginea gri
obținută, să fie similar cu cel al imaginii color RGB. Conversia de la RGB la
imaginile în nuanțe gri este o transformare ireversibilă: informațiile pierdute în
conversie nu mai pot fi recuperate.
Spațiul de culoare perceptiv
Spațiul de culoare perceptiv este o cale alternativă de reprezentare a imaginilor
color, într-o manieră care este mult mai binevenită percepției și înțelegerii umane a
culorilor, decât în reprezentarea RGB. Există mai multe reprezentări a imaginilor
color, însă noi ne vom concentra mai mult pe spațiul de nuanță, saturație și valoare
(HSV), popular în aplicațiile de analiză a imaginii. Din perspectiva analizei
imaginilor, această reprezentare permite separarea culorilor după gradul de
luminozitate. O imagine RGB poate fi transformată în HSV după următoarea
imagine:

Figura 6. Spațiul de culoare HSV reprezentat în con 3D


unde fiecare din acești parametri pot fi interpretați astfel:
H (nuanță) este lungimea de undă dominantă a culorii;
S (saturație) este “puritatea” culorii (ce cantitate de lumină albă este amestecată cu
ea);
V (intensitate) este luminozitatea culorii.
Reprezentarea HSV a unei imagini 2D este de asemenea o matrice 3D care
cuprinde 3 canale (h,s,v) și fiecare locație a pixelilor din imagine I(n,m) conține
(h,s,v), care poate fi transformată înapoi într-o RGB. În cadrul implementării HSV
în Matlab, fiecare din canalele h,s,v au valori între 0 și 1. De exemplu nuanța
albastră poate avea valorile h=0,9, saturația s=0,5 și intensitatea v=1,obținând un
albastru deschis vibrant. Prin examinarea individuală a canalelor de culori ale
imaginii în HSV, putem observa că obiectele din imagine sunt mai consistent
conținute în câmpul de nuanță rezultat decât în canalele reprezentării RGB, în
ciuda prezenței diferitelor condiții de iluminare.
Figura 7. Imagine transformată și afișată în spațiul de culoare HSV
Ca rezultat, spațiul HSV este de obicei utilizat pentru segmentarea imaginilor pe
baza de culoare utilizând o tehnică cunoscută sub denumirea de colorare

Formarea imaginilor
Cum este formată o imagine ?
Procesul de formare a imaginii poate fi rezumat ca un număr mic de elemente
cheie. În general, o imagine digitală s poate fi formalizată ca un model matematic
ce cuprinde o reprezentare funcțională a scenei (funcția obiectului o ) și cea a
procesului de capturare ( funcția de împărțire a punctelor(PSF) p). În plus, o
imagine conține încă și un zgomot n(din engleză noise). Astfel o imagine are

următoarea formulă:
Elementele cheie prezentate mai sus sunt:
PSF descrie modul în care informațiile despre funcția obiectului sunt răspândite ca
rezultat al înregistrării datelor. Este o caracteristică a instrumentului de imagine
(adică camera ) și este o funcție deterministică (care operează în prezența
zgomotului).
Funcția obiectului. Aceasta descrie obiectul (sau scena ) care este afișat și modul
în care lumina este reflectată de la acea structură către instrumentul de formare a
imaginii.
Zgomotul. Aceasta este o funcție nedeterministă care, în cel mai bun caz, poate fi
descrisă doar în termeni de distribuție a zgomotului statistic (de exemplu
Gaussian). Zgomotul este doar o funcție stochastică care este o consecință a tuturor
perturbațiilor externe nedorite care apar în timpul înregistrării datelor de imagine.

Egalarea histogramei
Este una din cele mai utilizate tehnici de îmbunătățire a imaginilor. Inițial, vom
presupune ca vom avea imagini în scara gri, notate cu Iintrare(x) . Dacă variabila
x este continuă și normalizată să se situeze în intervalul [0,1], atunci aceasta ne
permite să considerăm histograma normalizată a imaginii ca o funcție de densitate
a probabilității (PDF) px(x), care definește probabilitatea unor valori ale scarei gri
care apar în vecinătatea lui x. În mod similar putem nota și imaginea gri de ieșire
după egalarea histogramei ca Iiesire(y) cu funcția PDF corespunzătoare py(y).
Esența problemei de egalare a histogramei este aceea că căutăm o funcție de
transformare y=f(x) care să se potrivească între valorile imaginii de intrare și cea
de ieșire și care va transforma intrarea PDF px(x) pentru a produce rezultatul dorit
PDF py(y). Un rezultat standard din teoria probabilității elementare afirmă că:

; ceea ce înseamnă că PDF-ul de ieșire dorit depinde doar de


PDF-ul de intrare cunoscut și de funcția de transformare . Următoarea funcție de
transformare y=f(x) calculează aria de sub curba densității de probabilitate de

intrare între 0 și limita superioară x: ; Această este


recunoscută ca funcția cumulativă de distribuție (CDF) a unei variabile x aleatoare.
Diferențiind această formulă, aplicând regula lui Leibniz1 și înlocuind în formula

anterioară obținem: , Deoarece Px(x) este o densitate de


probabilitate și se garantează a fi pozitivă (0 ≤ , ob inem următoarea formulă

finală: , Densitatea probabilității de ieșire Px(y)


este astfel constantă, indicând faptul că toate valorile y de ieșire sunt la fel de
probabile, și astfel, histograma intensității de ieșire este egalată. De menționat este
faptul că rezultatul transformării de mai sus depinde de satisfacerea a două
condiții:
a) Funcția y(x) trebuie să fie evaluată singular;
b) Funcția y(x) trebuie să crească monotonic 0

Condiția a)Asigură transformarea inversă există și că ordinal de valoare ascendentă


de la negru la alb este păstrat. În cazul în care funcția nu ar crește monotonic,
transformarea inversă nu ar fi evaluată singular și ca rezultat avem o situație în
care unele intensități de ieșire se referă la una sau mai multe intesități de intrare. A
doua condiție b) pur și simplu asigură ca domeniul de ieșire să înregistreze
intrarea.
Mai jos voi arata figura histogramei a unei imagini simple :

Figura 8. Egalizarea histogramei aplicată unei imagini simple.


În acest rezultat putem observa efectul de egalare asupra intervalului dinamic al
imaginii și egalarea corespunsă a distribuției histogramei asupra intregului interval
de cuantizare al imaginii.

Potrivirea histogramelor
Egalarea histogramei nu este cu siguranță o soluție pentru toate situațiile. Există
multe situații în care egalizarea produce efecte destul de nedorite. O tehnica strâns
legată, cunoscută sub denumirea de potrivire a histogramei ( mai este cunoscută și
ca specificația histogramei), este uneori mai potrivită și poate fi folosită atât ca
mijloc de îmbunatățire a contrastului vizual, cât și pentru regularizarea unei
imagini înainte de procesarea sau analiza ulterioară. Ideea care stă la baza potrivirii
histogramelor este foarte simplă. Având în vedere imaginea inițială (de
intrare)Iintrare și histograma sa corespunzătoare px(x) , căutam să efectuăm o
transformare f(x) asupra valorilor intensității de intrare astfel încât imaginea
transformată (de iesire)Iieșire să aibă o histogramă dorită pz(Z) . Adesea,
histograma țintă este luată dintr-un model sau o imagine de tip similar.
Teoria potrivirii histogramelor
Vom încerca să analizăm problema cum să obținem histograma țintă și pur și
simplu vom presupune că este cunoscută. Deci sarcina noastră de potrivire poate fi
formulată după cum urmează. X
Nivelurile intensităților de intrare vor fi notate prin variabila x (0 ≤ ≤ 1) și funcția
PDF a imaginii de intrare notată px(X) cu Similar nivelurile de ieșire ale
intensității vor fi notate cu variabila z (0) Z
funcția PDF corespunzătoare notată cu pz(Z). Sarcina noastră de potrivire a
histogramei poate fi apoi formulată ca derivarea asocierii f(x) între valorile
intensității de intrare x și cele de ieșire z astfel incât valorile asociate intensității de
ieșire să aibă PDF-ul dorit pz(Z)
Distribuția cumulativă (CDF) Cx(X) a imaginii de intrare poate fi reprezentată ca
definiție în felul urmator:

;
În mod similar, CDF Cz(Z) a imaginii este dată de integrala ieșirii PDF:

;
Un punct cheie în rationamentul nostru este recunoașterea faptului că ambele
transformări sunt irevirsibile. Mai precis, un PDF arbitrar f(x) este legat de CDF
p(X) prin relația:

;
Astfel, cunoașterea unui CDF determină în mod unic PDF-ul; și dacă CDF este
cunoscut, atunci și PDF-ul este cunoscut și calculabil prin acest diferențial explicit.
Rezultă că dacă putem defini o asociere f(x) între intensitățile de intrare (x) și
intensitățile de ieșire (z) astfel încât CDF-urile de intrare și de ieșire să fie identice,
garantăm astfel că PDF-urile corespunzătoare de asemenea vor fi aceleași. În
consecință cerem ca CDF-urile definite anterior, Cx(X) si Cz(Z) sa fie egale pentru
asocierea Z=f(x)

de unde rezultă aasocierea dorită f( ) este

;
Definiția pentru această asociere este fundamentală pentru capacitatea de a asocia
intrarea Cx(x) la Cz(z) și, prin urmare, PDF-ul de intrare px(x) la PDF-ul de ieșire
pz(z).

Teoria potrivirii histogramelor: cazul discret

n general, asocierea inversă C1 nu este o funcție analitică și trebuie să recurgem la


tehnici numerice pentru aproximarea asocierii necesare. Pentru a realiza o
aproximare discretă a potrivirii a doua histograme ale imaginii, vom purcede mai
întâi la calcularea lui CDF Cx(k) discretă a imaginii de intrare:

;
Unde xj sunt valorile la nivelul de intensitate j al imaginii de intrare, N numarul
total de pixeli în acea imagine si k={0,1,2,…,L-1} , unde L este numarul
posibilelor niveluri de gri în imagine. Sub aceeași manieră se calculează și CDF-ul
discret Cz(l) al imaginii de ieșire:

;
unde zj sunt valorile la nivelul de intensitate j al imaginii de ieșire, N numarul total
de pixeli în acea imagine și l={0,1,2,…,L-1} , unde L este numărul posibilelor
niveluri de gri în imagine. În cele din urma, vom alcătui versiunea discretă a
transformării anterioare f(x)=c1z[Cx(x)] și trebuie să găsim asocierea C1z atunci
când intrarea pentru ea este CDF-ul imaginii de intrare, Cx().La fel ca și în
exemplul anterior la egalizarea histogramei, această asociere definește în mod
eficient o tabelă de căutare între valorile pixelilor de intrare și de ieșire care pot fi
ușor și eficient de calculat.
Potrivirea histogramei în practică
Potrivirea histogramei extinde principiile egalizării histogramelor prin
generalizarea formei a histogramei țintă. Este o tehnica de îmbunătățire automată
în care transformarea necesară este derivată dintr-o histogramă țintă specificată de
distribuție. În practică, histograma țintă de distribuție t va fi extrasă dintr-o imagine
de referință existentă, sau va corespunde unei funcții matematice specificată cu
proprietățile necesare. În continuare vom specifica un PDF liniar ca ținta de
distribuție t și vom încerca să observăm potrivirea histogramei.
Exemplu:
Fig 9.Potrivirea histogramei aplicat unei imagini.
Este evident din această figură 9 că histogramă dorită a imaginii de ieșire nu
produce o ieșire cu caracteristici deosebit de perfecte. În general, alegerea unei
histograme ținte adecvate presupune cunoașterea structurilor din imaginea de
intrare și necesită îmbunătățiri. O situație în care alegerea histogramei de ieșire
poate fi fixată esențial, este atunci când imaginea examinată este un exemplu de
clasa dată, dar a fost afectată de factori straini.
Un exemplu în acest sens este o secvență de fețe în poziția frontală. Aceasta
histogramă a unei fețe date poate fi afectată de iluminarea intensității și de efectele
de umbrire. O față capturată în condiții ideale ar putea furniza histograma dorită
pentru a corecta aceste efecte de ilumare și de umbrire înainte de utilizarea
ulterioară a imaginii de intrare, transformate pentru recunoașterea facială.

Egalizarea histogramei adaptive

Uneori histograma globală a unei imagini poate avea o distribuție largă, în timp ce
histograma regiunilor locale este foarte înclinată către un capăt al spectrului de gri.
În asemenea cazuri, de multe ori este de dorit să se îmbunatățească contrastul
acestor regiuni locale, dar egalizarea histogramei globale este ineficientă. Acest
lucru poate fi rezolvat prin egalizarea histogramei adaptive.
Termenul de adaptiv implică faptul că diferite regiuni ale imaginii sunt procesate
diferit în dependență de proprietățile locale.
Există mai multe variante ale egalizării histogramei adaptive, dar poate cea mai
simplă și cea mai utilizată este abordarea asa-numită fereastră glisantă. În această
metodă, imaginea de bază este împărțită în regiuni locale vecine N x M (de
exemplu 16 x 16 pixeli). Fiecare regiune este înconjurată de o regiune mai mare,
care este folosită pentru a calcula tabelul de căutare pentru egalizarea histogramei
adecvate pentru regiunea interioară.
Acest lucru în general este eficient în creșterea contrastului local, dar pot apărea
‚artefacte bloc’ ca rezultat al procesării fiecărei astfel de regiuni izolate, iar
artefactele la limitele dintre ferestrele interioare pot avea tendința de a produce
impresia unei imagini care constă dintr-un număr de blocuri nepotrivite.
Artefactele pot în general fi reduse prin mărirea dimensiunii regiunii exterioare față
de regiunea interioară.
O metodă alternativă pentru egalizareă histogramei adaptive poate fi aplicată cu
succes după următoarele etape:
 O rețea regulată de puncte este suprapusă peste imagine. Spațierea între punctele
rețelei în această abordarea este o variabilă, dar în general este de câteva zeci de
pixeli.
 Pentru fiecare punct al grilei, se determină o regiune dreptunghiulară cu dublul
distanței dintre grilă. Astfel o regiune dată are o suprapunere de 50% cu vecinii săi
imediați din nord,sud,est și vest.
 Valoarea transformată a unui pixel dat din imagine este calculată ca o combinație
ponderată a valorilor de ieșire din cele patru tabele de căutare din apropiere,
utilizând următoarea formulă bilineară:

;
unde a și b reprezintă distanța până la marginea regiunii de la pixelul dat. Această
formulă acordă o importanță adecvată regiunilor vecine căror aparțin punctul de
calcul. De exemplu un punct localizat exact pe un punct al grilei derivă numai la
valoarea sa egală din vecinatatea sa înconjurătoare, în timp ce un punct care este
echidistant față de cele 4 puncte cele mai apropiate ale rețelei, este o combinație
echilibrată a tuturor celor 4 regiuni regiuni învecinate.
Fig 10.Egalizarea histogramei adaptive.Vecinătate de 4 regiuni.

O extindere finală la această metodă este adaptarea contrastului limită la egalizarea


histogramei. În termeni generali, calculând histogramele regiunilor locale și
egalizând valorile intensității între aceste regiuni, există tendința de a mări prea
mult contrastul și de a amplifica zgomotul imaginii. Unele regiuni dintr-o imagine
sunt în mod inerent netede, cu un contrast real redus și o egalizare orbită a
histogramei de intensitate dintr-o regiune dată poate avea rezultate nedorite.
Ideea principală pentru utilizarea limitării contrastului este de a plasa o limită l, 0 ≤
≤ 1, asupra creșterii contrastului aplicat pentru o regiune anumită. Această metodă
extinsă de limitare a contrastului în cadrul egalizării histogramei adaptive este
efectuată în Exemplul de mai jos în Matlab ce urmează. Rezultatul acestui exemplu
este prezentat mai jos unde vedem efectele diferite a specificării limitei
contrastului l și distribuția țintă t asupra imaginii egalizate rezultată.
Egalizarea histogramei adaptive uneori poate avea efecte semnificative de
îmbunatățire a contrastului în imagine. Totuși, datorită naturii fundamentale care
diferă de la o imagine la alta, capacității de a varia numărul de plăci în care este
descompusă o imagine și formei specifice a distribuției probabilităților țintă, există
puține teorii generale care să ne ghideze.
Obținerea unei imagini cu caracteristicile dorite de contrast este astfel, într-o
masură considerabilă, o artă în care acești parametri sunt variații experimentale.
Exemplul Matlab
Aici utilizăm funcția adapthisteq() pentru a efectua operația cu limită l specificată
de utilizator. În plus, implementarea Matlab a egalizării histogramei adaptive de
asemenea permite utilizatorului să specifice distribuția țintă t pentru a o utiliza cu
fiecare regiune din imagine. Egalizarea standard este realizată cu specificarea
distribuției prestabilit în mod uniform.
În mod prestabilit, implementarea Matlab utilizează o divizare 8 x 8 regiuni a
imaginii pentru procesare. Acestea, ca și ceilalți parametri din acest exemplu pot fi
specificați prin denumirea și valoarea lor ca intrări ale funcției. Pentru mai multe
detalii se poate accesa documentația Matlab a funcției adapthisteq().

Fig 11.Egalizarea adaptivă a histogramei aplicată în Matlab


Operații asupra histogramelor în imaginile color
Până în acest moment, am considerat doar aplicarea operațiilor de manipulare a
contrastului pe imagini pe un singur canal, de culoare gri.
Încercarea de a îmbunătăți contrastul imaginilor color este o problemă puțin mai
complexă decât pentru cele în scara gri. La prima vedere, este tentant să se
considere aplicarea egalizării histogramei sau potrivirea independentă cu fiecare
din cele trei canale (R,G,B) ale imaginii color. Cu toate acestea, valorile RGB ale
unui pixel determină atât intensitatea, cât și cromaticitatea (adică impresia
subiectivă a imaginii).
Transformarea valorilor RGB ale pixelilor pentru a îmbunatăți contrastul va
modifica, în general, conținutul cromatic al imaginii (de exemplu nuanța de
culoare). Ca soluție mai întâi vom transforma culoarea imaginii reale, într-un
alternativ și perceptual model de culoare, cum ar fi HSV, unde componenta de
luminozitate (intensitatea V) este decuplată de componentele cromatice (H și S)
care sunt responsabile de impresia subiectivă a culorii. Pentru a efectua astfel de
operații pe histograme asupra imaginilor color, vom face urmatoarele etape:
a) Vom transforma imaginea componentului RGB în reprezentare HSV (hue,
saturation, variance);
b) Vom aplica operațiile histogramei componentei intensitate ;
c) Vom converti rezultatul înapoi în spațiul color RGB după cum s-a cerut inital.
Spațiul de culoare HSV nu este singurul în acest sens, ci mai sunt o mulțime cu
care se poate opera, însă eu am ales să operez cu el fiind cel mai cunoscut dintre
acestea.
Utilizând etapele de mai sus enumerate avem următorul exemplu în Matlab :

În figura de mai sus ce urmează avem rezultatul exemplului dat unde vedem
aplicarea egalizării histogramei asupra unei imagini color RGB, utilizând
reprezentarea HSV. Se observă că impresia subiectivă de culoare (cromaticitatea) a
fost menținută, însă efectul de egalizare a componentului de intesitate în cadrul
histogramei, este evident în rezultat.

Fig 12.Egalizarea histogramei adaptive pentru imaginea color

S-ar putea să vă placă și