Documente Academic
Documente Profesional
Documente Cultură
1. v(hi,hj) = 0 ( identitate )
2. v(hi,hj) >= 0 ( ne-negativitate )
3. v(hi,hj) = v(hj,hi) >= 0 (dacă hi # hj) (comutativitate / simetrie )
4. v(hi,hq) <= v(hi,hj) + v(hj,hq) ( inegalitatea triunghiului )
M-1
drq,t = ( | hq[m] - ht[m] |r ) (3.1)
m=0
hq[m]
ht[m]
m
Figura 3-1: Distanţele bazate pe forma Minkowski compară numai
elementele identice ale histogramelor
Intersecţia histogramelor
2
Ecuaţia de mai sus nu defineşte o distanţă validă pentru că nu este
simetrică: dq,t # dt,q, dar poate fi modificată în acest sens astfel:
M-1
min ( hq[m],ht[m])
m=0
d' q,t = 1 - (3.3)
min( | hq |, | ht | )
M-1
dq,t = | hq[m] - ht[m] | (3.4)
m=0
M-1
dq,t = ( | hq[m] - ht[m] | )2 (3.5)
m=0
3
Conform acestei descompuneri, distanţa dq,t se calculează cu
ajutorul produsului între histograma interogare hq şi cea ţintă ht.
m
ht[m]
* * * * m
*
Figura 3-2: Distanţa Hamming între seturi color calculează OR exclusiv
între elemente. " * " indică poziţiile în care biţii diferă.
4
Distanţa pătratică
Distanţa pătratică compară toate elementele histogramelor şi
ponderează distanţa între elemente prin anumiţi factori.
a i,j m
ht[m]
m
Figura 3-3: Distanţa pătratică compară toate elementele
histogramelor şi ponderează distanţa între elemente prin elementele a i,j.
5
Într-o implementare obişnuită, calculul distanţei pătratice este mult
mai complex decât cel al distanţelor bazate pe forma Minkowski, deoarece
calculează similitudinea încrucişată între toate elementele.
Complexitatea metodei este O(m^2*n) unde m reprezintă numărul
de culori rezultate în urma procesului de cuantificare ( de exemplu: 166, sau
64 sau 512), iar n reprezintă numărul de imagini din baza de date.
Tot în vederea scăderii timpului de lucru pentru distanţa pătratică
între histograme, J.R.Smith a propus în [3] o descompunere asemănătoare
cu cea din ecuaţia 3.5.1, şi anume:
M-1
dq,t = q + t -2 fq[m] t [m] (3.7.4)
m=0
6
Distanţa pătratică între seturi binare
M-1 M-1
dq,t = (sq[m0] –st[m0]) am0,m1 ( sq[m1]-st[m1]) (3.8)
m0=0 m1=0
Eficacitatea regăsirii
a c A(rel)
b d
B (reg)
atunci:
Reapel = a / ( a + c )
Precizie = a / ( a+b )
8
regăsite, dar multe dintre ele irelevante. Pe de altă parte, un sistem cu
valoare mare pentru parametrul precizie, dar o valoare mică a parametrului
reapel indică faptul că multe articole relevante pentru interogare nu au fost
regăsite. Putem concluziona că un bun sistem de regăsire trebuie să dispună
de un echilibru între cei doi parametri. Pentru a compara performanţele a
două sisteme de regăsire, trebuie comparaţi ambii parametri. O modalitate
de a face acest lucru este de a determina valorile preciziei şi reapelului
(valori cuprinse între 0 şi 1) şi de a ridica un grafic reapel-precizie, pentru
fiecare sistem în parte, aşa cum se vede în figura 3-5. Sistemul care are
graficul mai depărtat de origine dispune de o performanţă mai bună.
Precizie
1 Reapel
R,R,I,I,R,R,I,I,R,I,R,R,I,I,R
11