Sunteți pe pagina 1din 11

SISTEME DE REGASIRE A INFORMATIEI VIZUALE

Regasirea informatiei vizuale pe baza


caracteristicii culoare

Profesor:

Student:

Liana Stanescu

Amza Ionut Catalin

SISTEME DE REGASIRE A INFORMATIEI VIZUALE

Introducere
Culoarea este caracteristica vizuala care este imediat perceputa intr-o imagine. Sistemul
de culoare folosit pentru a reprezenta informatia culoare intr-o imagine are o mare importanta in
interogarea de imagini bazata pe continut, deci aceasta directie de cercetare a fost intens studiata.
Nu exista un sistem de culori care sa fie folosit universal, deoarece notiunea de culoare
poate fi modelata si interpretata in diferite moduri. Fiecare sistem are modelele sale de culoare
care reprezinta parametrii sistemului.
Au fost create cateva sisteme de culori, pentru diferite scopuri: RGB (pentru afisarea
procesului), XYZ (pentru standardizarea culorilor), rgb, xyz (pentru normalizarea si
reprezentarea culorii), etc.
Au fost propuse sisteme pentru regasirea pe baza de continut care utilizeaza diferite
tehnologii pentru reprezentarea caracteristicilor culorii: histograme de culoare, momente de
culoare, textura culorii, si altele. Acestea utilizeaza sisteme de culoare ca: RGB, HIS, L*a*b* sau
L*u*v*.

Modele de culori
Modelul RGB este un model aditiv, avnd culorile fundamentale rosu, verde si albastru,
celelalte culori constituindu-se din anumite procente ale culorilor de baz. Culoarea alb are
prezente toate culorile fundamentale, iar culoarea negru se caracterizeaz prin absenta lor.
Modelul RGB este adesea reprezentat sub forma unui cub unitate, ca n figura 1

:
Fig. 1. RGB color space
Originea (0, 0, 0) este considerat culoarea negru, iar coltul opus (1, 1, 1) corespunde culorii alb.
Diagonala care uneste aceste dou puncte conine nivelurile de gri obtinute prin utilizarea
aceluiasi procent din culorile de baz.
O alt metod de clasificare a culorilor este prin nuantare (Hue), saturatie (Saturation) si
intensitate (Intensity), rezultnd modelul HSI.
Nuanta reprezint pozitia relativ a culorii n spectru si, n modelul HSI, corespunde unghiului pe
care l face culoarea n cercul de culori. Domeniul de nuantare se ntinde de la 0 la 360 de grade.
Saturatia reprezint puritatea culorii. Valoarea saturatiei se exprim n procente si variaz de la 0
(fr culoare) pn la 100 (culoare pur, asa cum este definit de valoarea nuantrii).

SISTEME DE REGASIRE A INFORMATIEI VIZUALE

Ultimul parametru reprezint intensitatea culorii. O reprezentare simbolic a modelului HSI este
dat n figura 2. Nuanta determin culoarea (unghi = 60 - Yellow, 180 - Cyan etc.) Saturaia
este msurat n procente de la centrul cercului de baz la suprafata conurilor.
Intensitatea se msoar pe linia Black-White.

Fig.2 HSI Model


Modelul CMY are la baz culorile Cyan, Magenta si Yellow, considerate culori secundare fat
de culorile Red, Green, Blue.
Este utilizat pentru specificarea culorilor la dispozitivele de imprimare. Folosete acelai sistem
de coordonate i acelai subspaiu al culorilor ca i modelul RGB cu deosebirea c originea
corespunde culorii alb, vrful (1,1,1) culorii negru iar culorile primare sunt cian, magenta i
galben .
In acest model, o culoare se specific prin trei valori cuprinse ntre 0 i 1, reprezentnd
proporiile n care trebuie s fie amestecai cei trei pigmeni ce extrag componentele luminii albe.
Culoarea negru se obine amestecnd n proporii maxime culorile primare. In general ns,
datorit imperfeciunilor cernelurilor, prin amestecul n proporii maxime al celor trei pigmeni
nu se obine negru. De aceea, n loc de CMY se utilizeaz sistemul CMYK:
K= min(C,M,Y), C = C K , M = M K , Y = Y K
Conversia unei culori din modelul RGB n modelul CMY i invers este foarte simpl. Ea poate
fi exprimat astfel:
[C M Y] = [1 1 1] [R G B]
respectiv
[R G B] = [1 1 1] [C M Y]

SISTEME DE REGASIRE A INFORMATIEI VIZUALE

Histograme de culoare
O metoda uzuala de a reprezenta o imagine este de a o transforma intr-o histograma.De
exemplu, o imagine care contine diferite nivele de gri poate fi transformata intr-o histograma
care defineste numarul de pixeli ai fiecarei culori(nivel de gri). Pentru imaginile color,
histogramele de culoare pot avea o dimensiune mai mare decat 2, deoarece culorile sunt
reprezentate ca vectori cu 3 componente.

Fig 2: Histograma pentru o imagine cu nivele de gri


Pentru o imagine specifica exista o singura histograma, dar diferite imagini pot sa aiba
histograme identice.
Definitie: Distributia culorilor intr-o imagine, regiune sau obiect este reprezentata de o
histograma.

Regasirea informatiei vizuale pe baza caracteristicii culoare


n aceast faza se vor prezenta cinci metode utilizate n calcularea similitudinii color a
imaginilor pe baza histogramelor. Aceste tehnici pot fi utilizate n sistemele de cutare i
regsire a imaginilor pe baza caracteristicilor lor.
Aa cum s-a precizat anterior, histogramele indic distribuia culorilor ntr-o imagine sau
regiune. Pentru c histogramele sunt distribuii discrete, ele pot fi reprezentate ca vectori de
caracteristici ntr-un spaiu M-dimensional, unde M reprezint numrul de culori distincte din
histogram. Acest spaiu se definete ca fiind spaiul histogram, HM.

SISTEME DE REGASIRE A INFORMATIEI VIZUALE

Spaiul histogram HM se consider un spaiu metric, iar histogramele h sunt puncte n


acest spaiu, dac sunt adevrate urmtoarele condiii: pentru fiecare pereche de histograme h i, hj
poate fi gsit un numr corespunztor v(h i,hj), numit distana ntre punctele hi si hj care satisface
urmtoarele:

1.
2.
3.
4.

v(hi,hj) = 0 ( identitate )
v(hi,hj) >= 0 ( ne-negativitate )
v(hi,hj) = v(hj,hi) >= 0 (dac hi # hj) (comutativitate / simetrie )
v(hi,hq) <= v(hi,hj) + v(hj,hq) ( inegalitatea triunghiului )

1.Distane bazate pe forma Minkowski


Prima clas de msuri de disimilitudine se bazeaz pe forma Minkowski. Fie h q
histograma interogare i ht histograma inta. Atunci distana ntre cele dou histograme se
definete astfel:

d qr,t

M 1

| h [ m] h [ m] |

m0

Aa cum se vede i n figura 3-1, msurarea disimilitudinii histogramelor cu ajutorul


formei Minkowski neglijeaz compararea elementelor din histograme care sunt similare, dar nu
identice. De exemplu, o imagine rou nchis este egal diferit de o imagine roie ca i de o
imagine albastr.
Complexitatea metodei este O(m*n) unde m reprezint numrul de culori rezultate n
urma procesului de cuantificare ( de exemplu: 166, sau 64 sau 512), iar n reprezint numrul de
imagini din baza de date.

hq[m]

SISTEME DE REGASIRE A INFORMATIEI VIZUALE

ht[m]

Fig.Distanele bazate pe forma Minkowski compar numai elementele identice ale


histogramelor

2.Intersecia histogramelor

Swain i Ballard au fost cei care au investigat utilizarea interseciei histogramelor n


regsirea imaginilor color. Obiectivul lor a fost acela de a gsi, cu ajutorul histogramelor color,
obiecte cunoscute n cadrul imaginilor. Atunci cnd mrimea obiectului q este mai mic dect
mrimea imaginii t i histogramele nu sunt normalizate, avem : | hq | <= | ht |.
Intersecia histogramelor hq i ht este dat de:
M 1

d q ,t 1

min( h [m], h [m])

| h |
unde

m0

| hq |
M 1

h[m]

m0

Ecuaia de mai sus nu definete o distan valid pentru c nu este simetric: d q,t # dt,q ,
dar poate fi modificat n acest sens astfel :
M 1

'
q ,t

min( h [m], h [m])


m 0

min(| hq |, | ht |)

S-a artat c atunci cnd histogramele sunt normalizate, astfel nct | h q |


intersecia histogramelor este dat de:

= | ht |

SISTEME DE REGASIRE A INFORMATIEI VIZUALE

d q ,t

M 1

| h [ m] h [ m ] |

m0

Se vede c dq,t este o metric bazat pe forma Minkowski cu r=1.


Complexitatea metodei este O(m*n) unde m reprezint numrul de culori rezultate n
urma procesului de cuantificare ( de exemplu: 166, sau 64 sau 512), iar n reprezint numrul de
imagini din baza de date.

3.Distana euclidian ntre histograme

Distana euclidian este o metric bazat pe forma Minkowski cu r=2. Dndu-se dou
histograme hq si ht, atunci:
M 1

d q ,t (| hq [m] ht [m] |) 2
m 0

Complexitatea metodei este, de asemenea,O(m*n) unde m reprezint numrul de culori


rezultate n urma procesului de cuantificare, iar n reprezint numrul de imagini din baza de date.
n vederea creterii eficienei calculului distanei euclidiene ntre histograme, J.R.Smith
n [3] a propus urmtoarea descompunere:
dq,t = hTqhq + hTtht -2 hTqht
Atunci cnd | hq |= hTqhq =1 si | ht |= hTtht =1, avem:
dq,t =2-2 hTqht

Conform acestei descompuneri, distana dq,t se calculeaz cu ajutorul produsului ntre


histograma interogare hq i cea int ht.

SISTEME DE REGASIRE A INFORMATIEI VIZUALE

4.Distana Hamming pentru seturi binare

Se consider cazul special n care histogramele sunt aproximate prin seturi binare. Un set
binar s este un vector binar n spaiul binar M dimensional BM.
Distana Hamming ntre seturile binare sq i st , unde
| s | = m s[m], este :
| sq - st |
dq,t =

| sq | | st |

Distana Hamming se calculeaz n mod eficient utiliznd operatorul OR exclusiv. Deci,


este uor de calculat, de aceea se utilizeaz n aplicaiile de baze de date cu imagini, baze de date
de dimensiuni mari. Complexitatea metodei este O(m*n), unde m i n au aceeai semnificaie ca
mai sus.

hq[m]
ht[m]

m
m

Fig.Distana Hamming ntre seturi color calculeaz OR exclusiv ntre elemente. " * " indic
poziiile n care biii difer.

5.Distana ptratic

SISTEME DE REGASIRE A INFORMATIEI VIZUALE

Distana ptratic compar toate elementele histogramelor i pondereaz distana ntre


elemente prin anumii factori.
6. Distana ptratic ntre histograme
Distana ptratic ntre histogramele hq i ht este dat de formula:

d q ,t

M 1 M 1

(h [m ] h [m ])a

m0 0 m1 0

m0 m1

(hq [ m1 ] ht [ m1 ])

unde A=[a i,j] , iar a i,j reprezint similitudinea ntre elementele cu indecii i si j.
Metrica ptratic este o distan metric adevrat cnd
a i,j = a j,i ( simetrie ) i

a i,i =1.

Fig.Distana ptratic compar toate elementele histogramelor i pondereaz distana ntre


elemente prin elementele a i,j.

SISTEME DE REGASIRE A INFORMATIEI VIZUALE

ntr-o implementare obinuit, calculul distanei ptratice este mult mai complex dect
cel al distanelor bazate pe forma Minkowski, deoarece calculeaz similitudinea ncruciat ntre
toate elementele.
Complexitatea metodei este O(m^2*n) unde m reprezint numrul de culori rezultate n
urma procesului de cuantificare ( de exemplu: 166, sau 64 sau 512), iar n reprezint numrul de
imagini din baza de date.
Tot n vederea scderii timpului de lucru pentru distana ptratic ntre histograme,
J.R.Smith a propus o descompunere asemntoare cu cea din ecuaia de mai sus, i anume:
dq,t = (hq-ht)T A( hq-ht)
Precalculnd q= hTqA hq , t= hTtA ht i t= A ht, avem:
dq,t = q + t -2hTqt
Fie M o permutare care sorteaz hq n ordinea descresctoare. Aplicnd aceast permutare
i asupra t, i notnd fq= Mhq i t= Mt , obinem
dq,t = q + t -2fTqt
Astfel, sortnd histograma interogare, elementele vectorului t sunt accesate n ordinea
descresctoare a importantei lor pentru interogare. t se calculeaz uor din histograma ht. n
aceste condiii avem:
M-1

dq,t = q + t -2 fq[m] t [m]


m=0

Oprind nsumarea la k<M-1, se obine o bun aproximare a distanei ptratice ntre


histograme.
Aceast tehnic conduce la reducerea complexitii algoritmului de calcul pentru distana
ptratic ntre histograme.
S-a constatat c aproximativ 80% din energia histogramei color a unei imagini este
coninut n aproximativ k=10 din cele mai semnificative culori. Cnd se utilizeaz numai k
culori, cele mai semnificative, complexitatea algoritmului este O(M logM +kN+N). Cele M
logM operaii sunt necesare pentru a sorta histograma color a imaginii interogare , N este
mrimea bazei de date, iar M este numrul de culori utilizate.
7.Distana ptratic ntre seturi binare
Distana ptratic ntre dou seturi binare sq i st este dat de:

SISTEME DE REGASIRE A INFORMATIEI VIZUALE


M-1

M-1

dq,t =

(sq[m0] st[m0]) am0,m1 ( sq[m1]-st[m1])

m0=0

m1=0

Complexitatea metodei este, ca i n cazul distanei ptratice ntre histograme O(m^2*n).


Tehnica de calcul prezentat n vederea reducerii complexitii distanei ptratice ntre
histograme, se poate aplica i la distana ptratic ntre seturi color. Pentru c s q BM (sq este un
vector binar ), notnd rt=Ast, avem :
dq,t = q + t -2

rt [m]

, m unde

sq[m]=1
Utiliznd aceast formul, se vor lua n considerare numai elementele setului binar al
imaginii interogare pentru care sq[m]=1.

Bibliografie
[1] Liana Stanescu: Visual Information Processing, retrieval and applications, Editura Sitech,
Craiova 2008
[2]
http://users.ece.utexas.edu/~bevans/courses/ee381k/projects/spring08/saad/LitSurveyReport.pdf
[3] http://www.lifesciencesite.com/lsj/life1002/343_B01072life1002_2475_2487.pdf
[4] Raport tehnic 2008
software.ucv.ro/SIBIM/raport_ceex_2008.doc

S-ar putea să vă placă și