Sunteți pe pagina 1din 18

Capitolul 7

Caracterizarea texturilor

Termenul de textură este legat de percepţia (vizuală şi tactilă) a unui material (cel mai
adesea de tip ţesătură). Într-un cadru mai larg, putem considera textura ca o proprietate
a obiectelor sau materialelor, ce caracterizează structura lor fizică din punctul de vedere
al dimensiunii, formei, orientării, aranjamentului şi proporţiei părţilor constituente ale
acesteia [15]. Această caracteristică se referă la configuraţia structurală a unei largi ca-
tegorii de obiecte şi materiale: materiale textile urzite sau ţesute, aliaje, roci, sol, piele
şi ţesuturi organice, vegetaţie, aglomerări de granule. Textura este descrisă ı̂n termeni
lingvistici prin cuvinte ca rugozitate, contrast, fineţe, regularitate, etc., termeni a căror
exprimare matematică nu este clară [12]. Dificultatea de a defini textura conduce uneori
chiar la pseudo-definiţii recursive, ca ı̂n [41] 1 . Câteva exemple de texturi (naturale şi
artificiale) sunt prezentate ı̂n figura 7.1; colecţii de texturi sunt disponibile fie ı̂n albume,
precum clasica colecţie Brodatz , fie ı̂n arhive electronice, precum baza de texturi Vistex
[1].
După cum se remarcă şi din imaginile prezentate ı̂n figura 7.1, o textură nu poate fi definită
nici ca o regiune uniformă (din punctul de vedere al valorilor pixelilor ce o compun) şi nici
doar prin prezenţa frontierelor. La o scară dată, orice textură are acelaşi aspect, indiferent
de alegerea subregiunii de analiză. Aceste observaţii conduc la necesitatea caracterizării
texturilor prin alte mărimi decât simpla valoare a pixelilor sau variaţia locală (ı̂n sens
derivativ) a acestor valori. Vom considera că textura poate fi definită prin uniformitatea
(spaţială) a unor caracteristici specifice, calculate de cele mai multe ori pe baza unor
considerente statistice. Corespunzând diferitelor teorii privitoare la percepţia vizuală a
texturii, au fost propuse două modele principale de descriere a texturilor:
- abordarea deterministă, ce se referă la repetarea spaţială a unui motiv de bază, pe
diferite direcţii. Acestă abordare corespunde unei viziuni macroscopice, ı̂ntâlnită de altfel
ı̂n cazul ţesăturilor, fragmentelor de piele de reptilă şi a modelelor de tip mozaic (mozaicul
de pe pardoseală, parchetul). Elementul repetitiv de bază portă numele de texon sau texel
(element de textură – texture element, prin similaritate cu denumirea de pixel – picture
element).
- abordarea probabilistă (statistică), ce se referă la caracterizarea atributelor anarhice şi
omogene ı̂n acelaşi timp, care nu ţin nici de un element de bază localizabil (motiv), nici

1
“Textura este acel obiect pentru care algoritmii de extragere a texturilor dau rezultate concludente.”

139
a) b) c)

d) e) f)

Figura 7.1: Exemple de texturi: a) ţesătură de lână; b) ţesătură de bumbac; c) jaluzele


verticale din plastic; d) pavaj; e) flori de liliac; f ) aglomerare de pietre de râu.

de o frecvenţă principală de repetiţie.


Referindu-ne ı̂n continuare la abordarea cea mai generală, abordarea statistică, vom con-
sidera deci că textura este o realizare particulară a unui proces aleator, care, pentru
simplificare, este considerat staţionar. Ipoteza de staţionaritate presupune că statisticile
calculate pentru o regiune oarecare a texturii sunt independente de poziţionarea regiunii
ı̂n câmpul de observaţie (ı̂ntreaga textură); practica infirmă ı̂nsă de destule ori această
presupunere. O problemă suplimentară legată de calculul mărimilor statistice este deter-
minată de faptul că natura statistică a acestora impune calculul pentru o infinitate de
realizări ale procesului aleator considerat (şi deci o infinitate de texturi de acelaşi fel).
Cum această infinitate de realizări particulare nu este disponibilă, ı̂n practică se face
implicit ipoteza suplimentară de ergodicitate2 a procesului aleator, astfel ı̂ncât o singură
realizare (deci o singură textură) să permită calculul mărimilor statistice ca medii spaţiale.
Acest tip de caracterizare este realizată ı̂n domeniul spaţial (ı̂n domeniul valorilor imagi-
nii/texturii). Este ı̂nsă posibilă şi o caracterizare a texturii ı̂n domeniul spectral, ı̂n urma
folosirii transformatei Fourier, caz ı̂n care se vor măsura distribuţii spectrale de energie.

2
Un proces aleator se cheamă ergodic dacă mediile sale statistice sunt egale cu mediile sale temporale;
pentru o definire mai completă a conceptelor de staţionaritate şi ergodicitate se poate consulta [11]

140
7.1 Caracterizarea ı̂n domeniul spaţial

Caracterizarea texturilor ı̂n domeniul spaţial este bazată pe calculul funcţiilor de densitate
de probabilitate (de diferite ordine) ale valorilor pixelilor din regiuni de interes decupate
din textură. În cele ce urmează vom considera că estimarea mărimilor statistice se face
pentru o regiune R din textura f , regiune de formă oarecare (deşi ı̂n practică se foloseşte
ı̂n covârşitoarea majoritate a cazurilor forma pătrată), formată din Nreg pixeli. Fiecare
pixel este identificat de vectorul coordonatelor sale (coordonată de linie, coordonată de
coloană), grupate ı̂n vectorul de poziţie x.

7.1.1 Statistici de ordinul unu

Funcţia de densitate de ordinul unu asociată valorilor din regiunea R este chiar histograma
nivelelor de gri din regiune şi măsoară probabilitatea de apariţie ı̂n interiorul regiunii con-
siderate a diferitelor nivele de gri posibile (2.9). După cum s-a arătat ı̂n secţiunea 2.2,
histograma h caracterizează conţinutul regiunii din punctul de vedere al proporţiei de
amestec a diferitelor valori ale nivelelor de gri şi deci poate fi folosită pentru identificarea
texturilor. De asemenea, se pot folosi pentru caracterizare momente statistice necentrate,
centrate (se poate urmări ı̂n [11] o prezentare mai detaliată a semnificaţiei momentelor
statistice ale unei variabile aleatoare) sau absolute, calculate pe baza histogramei h.

M
(k) 1 X k
X
m = f (x) = ik h(i); (7.1)
Nreg x∈R i=0
M
(k) 1 X k
X
M = (f (x) − m1 ) = (i − m1 )k h(i); (7.2)
Nreg x∈R i=0
M
c(k) = 1 X X
M |f (x) − m1 |k = |i − m1 |k h(i), k impar. (7.3)
Nreg x∈R i=0

Caracterizarea texturilor prin momente nu este suficient de precisă; au fost sintetizate


texturi (perceptual diferite) ale căror momente statistice sunt identice până la ordinul 4
sau 5 [12]. De asemenea, trebuie remarcat faptul că atât folosirea momentelor, cât şi a
histogramei, nu poate să surprindă informaţia de plasament spaţial a valorilor, ı̂ntrucât
histograma nu ia ı̂n considerare poziţia pixelilor ı̂n interiorul regiunii, fiind deci posibile
texturi vizual diferite dar având aproape acceaşi histogramă, aşa cum este prezentat şi ı̂n
exemplul din figura 7.2.

7.1.2 Statistici de ordinul doi

Funcţiile de densitate de probabilitate de ordin superior (doi şi mai mare decât doi) iau
ı̂n considerare informaţia de poziţie spaţială a diferitelor valori posibile, prin impunerea
unei legături de plasament spaţial al setului de pixeli a cărui probabilitate de apariţie este
măsurată ı̂n regiunea R.

141
h(i)
0.01

0.005

0
0 50 100 150 200 250
i

a) b)

Figura 7.2: Insuficienţa histogramei (densitate de probabilitate de ordinul unu) pentru dis-
criminarea texturilor: a) mozaic format din două texturi: ı̂n partea superioară imaginii
este o imagine a unei ţesături (textura din 7.1 a)), ı̂n partea inferioară a imaginii este
un fragment dintr-un ornament de plafon (castelul Versailles, Franţa), b) histogramele
texturilor din figura a): pentru partea de sus a imaginii (linie punctată) şi, respectiv,
pentru partea de jos a imaginii (linie continuă) – diferenţele dintre cele două histograme
sunt minimale (10%), deşi texturile pentru care au fost calculate sunt foarte diferite.

Matricea de coocurenţă

Matricea de coocurenţă [25], [12], [33] este funcţia de densitate de probabilitate de ordinul
doi corespunzătoare valorilor din regiunea studiată, având ca elemente probabilităţile de
apariţie ı̂n regiunea considerată a unor perechi de valori de nivele de gri. Pentru regiunea
R a texturii studiate şi pentru un vector de translaţie spaţială t dat (ce defineşte separaţia
spaţială dintre cele două elemente ale perechii de pixeli a căror probabilitate de apariţie se
măsoară), componentele matricii de coocurenţă se definesc pentru toate perechile posibile
de nivele de gri (a, b), ca (7.4):

Mt (a, b) = Card {(x, x + t) ∈ R × R | f (x) = a şi f (x + t) = b} /Card {(x, x + t) ∈ R × R} .


(7.4)
Deci Mt (a, b) este probabilitatea de apariţie ı̂n regiunea R a perechii de pixeli separaţi de
vectorul de translaţie t, care au respectiv valorile nivelelor de gri a şi b. Se remarcă faptul
că matricea de coocurenţă astfel definită verifică condiţia de normare a unei densităţi de
probabilitate de ordinul doi: XX
Mt (a, b) = 1. (7.5)
a b

Pentru o imagine cu M nivele de gri, matricea de coocurenţă va fi o matrice pătrată de


dimensiune M × M . În practică, pentru reducerea calculelor, numărul de nivele de gri
este redus la 8 sau la 16, printr-o tehnică convenabilă (ı̂n general este suficientă eliminarea
ultimilor biţi din cuvântul de reprezentare binară a nivelului de gri). În concluzie, pentru
o aceeaşi textură, matricea de coocurenţă depinde de regiunea considerată, vectorul de

142
translaţie şi modalitatea de reducere a nivelelor de gri. Figura 7.3 prezintă un exemplu
de calcul a matricii de coocurenţă pentru o regiune extrasă dintr-o textură.

4 3 3 4 4 5 7 7 5 4
4 4 4 4 4 5 6 7 5 4
4 4 4 4 4 4 6 6 5 4
4 4 4 4 4 4 5 6 5 4
3 4 5 5 4 4 5 6 5 4
3 4 5 5 5 5 5 5 4 3
3 3 4 5 6 6 6 5 4 3
3 3 4 5 6 7 7 6 4 3
a) b)
0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0
3 5 6 2
0 0 72 72
0 0 0 0 0 70 70
0 0 0
4 16 8 1 3 25 4
0 0 72 72 72 72
0 0 0 70 70 70
0 0
8 6 5 1 3 12 4
0 0 0 72 72 72 72
0 0 0 70 70 70
0
1 4 3 2 2 4 2
0 0 0 72 72 72 72
0 0 0 0 70 70 70
2 1 2 2 1
0 0 0 0 72 72 72
0 0 0 0 0 70 70
c) d)

Figura 7.3: Exemplu de calcul a matricii de coocurenţă: a) regiune dintr-o textură, recuan-
tizată pe 7 nivele de gri prin truncherea reprezentării binare a nivelelor de gri; b) valorile
re-cuantizate ale nivelelor de gri pentru regiunea a); c) matricea de coocurenţă calculată
pentru vectorul de translaţie t = (0, 1); d) matricea de coocurenţă calculată pentru vectorul
de translaţie t = (1, 0). .

Având ı̂n vedere influenţa importantă a alegerii vectorului de translaţie asupra matricii
de coocurenţă, unii autori au propus utilizarea unei matrici de coocurenţă compozite,
care să integreze influenţa translaţiilor după mai multe direcţii. Astfel, ı̂n [25] matricea
de coocurenţă utilizată efectiv pentru caracterizarea texturii este media aritmetică a ma-
tricilor de coocurenţă calculate pentru vectorii de translaţie unitari, orientaţi pe direcţiile
verticală şi orizontală:
¡ ¢
M (a, b) = 0.25 M(0,1) (a, b) + M1,0 (a, b) + M(−1,0) (a, b) + M(0,−1) (a, b) . (7.6)

Distincţia ı̂ntre texturi diferite poate fi făcută ı̂n primul rând prin inspecţia (examinarea
de ansamblu) a matricii de coocurenţă, printr-o vizualizare tridimensională a matricii (de
exemplu, pentru o zonă R uniformă, matricea de coocurenţă are o singură componentă
nenulă, indiferent de vectorul de translaţie ales). Pentru o comparaţie numerică au fost
definiţi [25] mai mulţi indici de natură statistică (omogenitate, uniformitate, entropie,
contrast, etc.) ce caracterizează distribuţia componentelor matricii de coocurenţă.
Parametrul de uniformitate (sau energie) [25] (numit omogenitate ı̂n [12]) este definit ca:
XX
U= Mt2 (a, b). (7.7)
a b

Cum matricea de coocurenţă este o densitate de probabilitate de ordinul doi, verificând ca


urmare condiţia de normare a unei distribuţii de probabilitate (7.5), expresia uniformităţii

143
U va fi maximă pentru o distribuţie uniformă a probabilităţilor de apariţie a diferitelor
perechi de nivele de gri (a, b); cu cât anumite perechi de nivele de gri sunt mai prezente
ı̂n regiunea de textură considerată, cu atât mai mică va fi valoare parametrului U din
(7.7). Deci parametrul U va avea valori cu atât mai mici cu cât prezenţa ı̂n textură a unei
perechi de nivele de gri este mai pregnantă şi textura prezintă o uniformitate a nivelelor
de gri sau o repetiţie a nivelelor de gri pe direcţia translaţiei t.
Parametrul de entropie este definit de:
XX
H=− Mt (a, b) log (Mt (a, b) + δ(Mt (a, b))) . (7.8)
a b

Entropia este mare dacă o aceeaşi pereche de pixeli apare de multe ori şi este mică dacă
toate perechile de nivele de gri sunt uniform şi slab reprezentate. Entropia H este deci
un indicator al dezordinii ce caracterizează textura.
Parametrul de corelaţie este definit ca o covariaţie statistică normalizată:
1 XX
B= (a − µa )(b − µb )Mt (a, b) (7.9)
σa σb a b

În expresia (7.9) µa şi µb sunt valorile medii pe regiunea R considerată a nivelelor de gri
ce corespund pixelilor situaţi pe prima poziţie şi respectiv a doua poziţie a perechii, iar
σa şi σb sunt dispersiile corespunzătoare În principiu, pentru un vector de deplasare mic,
valorile mediilor şi dispersiilor nivelelor de gri sunt extrem de similare, putându-se face
aproximarea µa = µb = µ şi σa = σb = σ.
Parametrul de contrast [25] este definit ca:
XX
C= (a − b)2 Mt2 (a, b). (7.10)
a b

După cum se remarcă ı̂n expresia de definiţie (7.10), fiecare termen al matricii de
coocurenţă este ponderat cu distanţa la diagonală (deci cu o cantitate direct proporţională
cu diferenţa dintre cele două nivele de gri ce compun perechea). Astfel se obţine un indice
ce corespunde interpretării uzuale a contrastului şi anume, are o valoare mare atunci când
termenii depărtaţi de diagonala principală a matricii au valori mari (adică atunci când
ı̂n regiunea de textură considerată există numeroase treceri de la pixeli luminoşi la pixeli
ı̂ntunecaţi).
Parametrul de omogenitate locală [12] (numit moment invers al diferenţei ı̂n [25]) este
definit de:
XX 1
O= 2
Mt (a, b)2 . (7.11)
a b
1 + (a − b)

Acest parametru are o acţiune inversă contrastului C din (7.10), ı̂ntrucât sunt favorizate
contribuţiile valorilor apropiate de diagonala principală a matricii de coocurenţă. Aceasta
ı̂nseamnă că parametrul O va avea valori mari pentru texturile ce prezintă o variaţie mică
a nivelelor de gri ı̂n sensul translaţiei t. Acest parametru este asemănător cu ceea ce este
definit ı̂n [12] sub numele de uniformitate (7.12) sau directivitate (7.13) (parametri ce au
valori cu atât mai importante cu cât un acelaşi nivel de gri apare de mai multe ori pe

144
4 3 3 4 4 5 7 7 5 4
4 4 4 4 4 5 6 7 5 4 0 0 0 0 0 0 0 0 0 0 0
4 4 4 4 4 4 6 6 5 4 0 0 0 0 0 0 0 0 0 0 0
4 4 4 4 4 4 5 6 5 4 5 3 0 0 0 0 2 1 1 1 0
3 4 5 5 4 4 5 6 5 4 13 2 0 0 1 2 0 1 3 2 3
3 4 5 5 5 5 5 5 4 3 12 1 0 0 0 1 2 3 1 1 1
3 3 4 5 6 6 6 5 4 3 5 1 1 0 0 0 3 2 1 0 0
3 3 4 5 6 7 7 6 4 3 1 2 0 0 0 0 3 1 0 0 0
a) b) c)
Figura 7.4: Exemplu de calcul a matricii de izosegmente pentru regiunea de textură prezen-
tată ı̂n figura 7.3 b): a) valorile din regiunea texturată; b) matricea de izosegmente ori-
zontale; c) matricea de izosegmente verticale.

direcţia de translaţie):
X
U2 = Mt2 (a, a); (7.12)
a
X
D= Mt (a, a). (7.13)
a

Matricea de izosegmente

Un izosegment de nivele de gri [19] (numit uneori şi plajă sau runlength) este o mulţime
liniară, de lungime maximă, formată din pixeli consecutivi ce au acelaşi nivel de gri,
orientată pe o anumită direcţie. Lungimea unui izosegment este numărul de pixeli ce
formează respectiva mulţime. Pentru o orientare (direcţie) fixată θ, se poate determina
o matrice de izosegmente, ale cărei elemente Mθ (a, b) reprezintă numărul de izosegmente
de lungime b dată, formate din pixeli de un nivel de gri a dat şi orientate pe direcţia θ.
Matricea rezultată are M linii (egal cu numărul de nivele de gri din imagine) şi un număr
de coloane Nθ , egal cu lungimea maximă a izosegmentelor pe direcţia considerată. Figura
7.4 prezintă un exemplu de calcul a matricilor de izosegmente.
La nivel global, caracteristicile regiunii R sunt numărul de izosegmente prezente ı̂n
regiune, Niz , şi numărul de pixeli din regiune, Nreg .

M
X nθ
−1 X
Niz = Mθ (a, b); (7.14)
a=0 b=1
M
X nθ
−1 X
Nreg = bMθ (a, b). (7.15)
a=0 b=1

Matricea de izosegmente reprezintă funcţia de densitate de probabilitate a setului de


variabile aleatoare “valoare a izosegmentelor – lungime a izosegmentelor”, probabilitatea
de apariţie a unui izosegment având o valoare a şi o lungime b impuse fiind dată de:

Mθ (a, b)
Pθ (a, b) = . (7.16)
Niz

145
Aspectul matricii de izosegmente este caracteristic unui anumit tip de textură; ca şi pentru
matricea de coocurenţă se pot defini diferite mărimi caracteristice. Descriptorii de bază
ai matricii de izosegmente au fost definiţi ı̂n [19] şi sunt prezentaţi ı̂n ecuaţiile (7.17):
RF 1 – proporţia izosegmentelor scurte, RF 2 – proporţia izosegmentelor lungi, RF 3 –
heterogenitatea (non-uniformitatea) valorilor, RF 4 – heterogenitatea (non-uniformitatea)
lungimilor, RF 5 – proporţia izosegmentelor.

M −1 nθ
1 XX Mθ (a, b)
RF 1 = ; (7.17a)
Niz a=0 b=1 b2
M −1 nθ
1 XX
RF 2 = b2 Mθ (a, b); (7.17b)
Niz a=0 b=1
M −1
Ãn !2
1 X X θ

RF 3 = Mθ (a, b) ; (7.17c)
Niz a=0 b=1

ÃM −1 !2
1 X X
RF 4 = Mθ (a, b) ; (7.17d)
Niz b=1 a=0
Niz
RF 5 = . (7.17e)
Nreg

O primă extensie a setului de parametri Galloway prezentaţi ı̂n (7.17) a fost propusă ı̂n
[10] prin adăugarea a doi parametri de măsură a proporţiei de valori mici şi respectiv,
importante, definiţi ı̂n (7.18): proporţia nivelelor de gri mici LGRE (Low Gray-level
Run Emphasis) şi proporţia nivelelor de gri importante HGRE (High Gray-level Run
Emphasis). Este evident că aceşti parametri provin din simetrizarea parametrilor RF 1
(7.17a) şi RF 2 (7.17b) definiţi pentru lungimea izosegmentelor.

M −1 nθ
1 XX Mθ (a, b)
LGRE = ; (7.18a)
Niz a=0 b=1 a2
M −1 nθ
1 XX
HGRE = a2 Mθ (a, b). (7.18b)
Niz a=0 b=1

De altfel, principiul după care au fost introduşi parametrii RF1, RF2, LGRE şi HGRE
este ponderarea numărului de izosegmente de o anumită valoare şi lungime, Mθ (a, b),
printr-un factor ce depinde direct (respectiv invers) proporţional de pătratul măsurii de
interes (lungime a izosegmentului sau valoare a izosegmentului).
O nouă extensie a mulţimii de parametri este propusă de [17], prin ponderarea atât
a lungimilor izosegmentelor cât şi a valorilor izosegmentelor. Cei patru noi parametri

146
propuşi sunt definiţi de:
M −1 nθ
1 XX
LRHGE = a2 b2 Mθ (a, b); (7.19a)
Niz a=0 b=1
M −1 nθ
1 XX b2
LRLGE = Mθ (a, b); (7.19b)
Niz a=0 b=1 a2
M −1 nθ
1 XX
SRHGE = b2 a2 Mθ (a, b); (7.19c)
Niz a=0 b=1
M −1 nθ
1 XX 1
SRSGE = Mθ (a, b). (7.19d)
Niz a=0 b=1 a b2
2

Semnificaţia acestor parametri este de proporţie a izosegmentelor lungi, cu valoare impor-


tantă LRHGE (Large Run, High Gray-level Run Emphasis), proporţie a izosegmentelor
lungi cu valoare mică LRLGE (Large Run, Low Gray-level Run Emphasis), proporţie
a izosegmentelor scurte cu valori importante SRHGE (Small Run High Gray-level Run
Emphasis) şi proporţie a izosegmentelor scurte cu valori mici, SRLGE (Small Run Low
Gray-level Run Emphasis).

Corelograma

Corelograma, definită ı̂n [30], [29], este o altă măsură a aranjamentului spaţial a valorilor
pixelilor dintr-o regiune. Corelograma măsoară probabilităţile de apariţie a diferitelor
perechi de valori de nivele de gri (a, b) pentru toate perechile de pixeli din regiunea R ce
sunt situaţi la o distanţă d impusă.
Cd (a, b) = Card {(x1 , x2 ) ∈ R × R | dist(x1 , x2 ) = d, f (x1 ) = a şi f (x2 ) = b} /
(7.20)
Card {(x1 , x2 ) ∈ R × R | dist(x1 , x2 ) = d} .
Evident, corelograma depinde ı̂n mod fundamental de alegerea metricii după care se cal-
culează distanţa. Dimensiunea corelogramei este aceeaşi cu a matricei de coocurenţă;
corelograma este o matrice pătrată cu număr de linii egal cu numărul de nivele de cuanti-
zare a nivelelor de gri din imagine. În practică, corelograma este calculată pentru un set
de mai multe distanţe.
Autocorelograma este un caz particular al corelogramei, ı̂n care se măsoară probabilitatea
de apariţie a perechilor de pixeli de aceeaşi valoare, separaţi de o distanţă d impusă. A-
utocorelograma este un vector, al cărui număr de elemente este numărul de nivele de
cuantizare a nivelelor de gri din imagine:
Cd (a) = Card {(x1 , x2 ) ∈ R × R | dist(x1 , x2 ) = d, f (x1 ) = a şi f (x2 ) = a} /
(7.21)
Card {(x1 , x2 ) ∈ R × R | dist(x1 , x2 ) = d} .

7.2 Caracterizarea ı̂n domeniul spectral

Caracterizarea texturilor ı̂n domeniul spectral se bazează pe proprietatea transformărilor


(integrale) unitare de a transpune, fără pierderi, informaţia vizuală conţinută ı̂n dome-

147
niul spaţial al imaginilor ı̂ntr-un alt domeniu, echivalent, numit domeniu al frecvenţelor
spaţiale (sau domeniu spectral), după cum s-a discutat şi ı̂n capitolul ??. Caracteristicile
de variaţie a valorilor ı̂n domeniul spaţial se regăsesc, ı̂ntr-o formă modificată (depinzând
de tipul transformării unitare utilizate) ı̂n domeniul spectral. De exemplu, dacă este să
ne referim numai la spectrul rezultat ı̂n urma aplicări transformatei Fourier, frecvenţele
(spaţiale) ı̂nalte pot fi folosite pentru detecţia contururilor, frecvenţele ce concentrează
energie corespund unor structuri periodice ı̂n domeniul spaţial, iar aranjarea liniară a unor
maxime energetice poate să indice o anumită direcţie predominantă după care sunt orien-
tate componente din imagine [64], [33]. Astfel se structurează zone de interes ı̂n domeniul
spectral, ı̂n care este posibilă identificarea unor caracteristici de variaţie spaţială a va-
lorilor din textură prin măsurarea energiei spectrale corespunzătoare. Zonele de interes
din spectru sunt extrase cu ajutorul unor seturi de măşti (aperturi) definite convenabil.
Dar această operaţie nu este ı̂nsă altceva decât filtrarea liniară a texturii după un set de
filtre liniare a căror funcţie de transfer corespunde măştilor de frecvenţă dorite, ceea ce
ı̂nseamnă că descrierea unei texturi ı̂n domeniul spectral se realizează echivalent prin fil-
trarea acesteia cu un banc de filtre liniare şi măsurarea unei energii a răspunsului acestora
[49].
Măştile de bază folosite pentru măsurarea caracteristicilor energetice ce definesc textura
sunt de două feluri (reprezentate ı̂n figura 7.5) [33]: măşti inelare simetrice, de tip trece
bandă, a căror parametri de definiţie sunt lărgimea inelului (benzii de trecere) şi raza
inelului (poziţionarea frecvenţei centrale de trecere), măşti ce măsoară concentraţia de
energie pe diferite zone ale spectrului şi măşti orientate, de forma unor sectoare circulare,
ai căror parametri de definiţie sunt orientarea şi lărgimea sectorului circular, măşti ce
măsoară caracteristicile de orientare din textură şi identifică direcţiile predominante. În
mod clasic, texturile se caracterizează prin folosirea a 7 măşti inelare şi 4 măşti de tip
sector (setul complet de măşti este reprezentat ı̂n [49]).

a) b) c) d)

Figura 7.5: Măşti de caracterizare a texturilor ı̂n domeniul spectral: a), b) măşti de tip
inel având diferite raze (frecvenţe centrale ale benzii de trecere); c) d) măşti de tip sector,
având orientările 0 şi π/4. Profilul secţiunii măştilor este gaussian.

Ideea de a măsura atât repartiţia unghiulară cât şi cea de frecvenţă a energiei texturii se
regăseşte şi ı̂n metoda de caracterizare a texturilor prin filtrare cu un banc de filtre Gabor
[49], inclusă şi ca unul dintre descriptorii texturali ı̂n standardul MPEG-7 [2], Filtrul
Gabor este un filtru trece bandă, a cărui funcţie de transfer este de tip gaussian; funcţia
sa pondere este tot o gaussiană, modulată cu o componentă cosinusoidală ce corespunde

148
frecvenţei centrale (f0 ) a benzii de trecere.
µ ¶
k2 l2
h(k, l) = cos(2πf0 k) exp + . (7.22)
σx2 σy2

Modificarea frecvenţei centrale f0 face ca filtrul să selecteze din spectrul texturii o zonă
corespunzătoare unor frecvenţe mai joase (f0 mic) sau mai ridicate (f0 mare), ceea ce
corespunde evaluării ı̂n textură a unor trăsături mai grosiere, respectiv detalii mai fine,
ceea ce este echivalent cu analiza unor versiuni scalate ale texturii considerate. Toate
filtrele Gabor ce sunt definite cu o aceeaşi frecvenţă centrală f0 analizează informaţia din
textură la o aceeaşi scală.

a) b) c)

Figura 7.6: Măşti Gabor (funcţii de transfer) de caracterizare a texturilor ı̂n domeniul
spectral: a) filtru cu 1 scală şi 1 orientare; b) banc de filtre cu 3 scale şi 4 orientări; c)
banc de filtre cu 5 scale şi 2 orientări

O altă metodă clasică de analiză energetică a texturilor se bazează pe calculul unui vector
caracteristic al entropiilor energetice pentru benzi de frecvenţă de tip trece jos, cu bandă
de trecere din ce ı̂n ce mai mare. Pentru fiecare bandă de frecvenţă energiile spectrale
se normează la suma acestora, şi se calculează entropia valorilor rezultate; la rândul ei,
acestă entropie se normează la entropia maxim posibilă pentru o zonă spectrală de energie
uniformă.

7.3 Modelarea texturilor

Termenul de model [27] se foloseşte pentru orice ipoteză ce se poate aplica pentru a
explica sau a descrie legile ascunse (necunoscute) ce se presupune că guvernează sau
constrâng generarea unor date de interes. Aceasta ı̂nseamnă că se presupune adevărat şi
cunoscut un sistem de ecuaţii (dependente de parametri) ce caracterizează desfăşurarea
fenomenului fizic studiat şi se ı̂ncearcă găsirea unui set de parametri particulari care duc la
aproximarea optimă a datelor reale prin cele generate de ecuaţiile sistemului. Parametrii
astfel determinaţi vor constitui un mod de reprezentare comprimat şi aproximativ al
desfăşurării fenomenului fizic studiat, putând fi utilizaţi fie pentru generarea unei forme
aproximative a acestuia, fie pentru compararea sa cu alte procese caracterizate ı̂ntr-un

149
mod similar. În cazul particular al texturilor, modelarea ı̂nseamnă a presupune că valorile
funcţiei imagine, ı̂ntr-o regiune R oarecare, pot fi generate pe baza unui model, parametrii
modelului urmând a caracteriza textura.
În cele ce urmează vom prezenta noţiunile de bază legate de două tipuri de modele des
folosite ı̂n analiza şi prelucrarea imaginilor: modelele statistice (de tip autoregresiv) şi
modelele de tip fractal.

7.3.1 Modele statistice

Folosirea modelelor statistice (stochastice) provine din ideea fundamentală a lui Yule,
potrivit căreia o serie de timp (deci valorile unei realizări particulare ale unui proces
aleator de timp discret) cu observaţii puternic corelate poate fi generată aplicând unui
filtru liniar o serie de eşantioane statistic independente (ce provin, de cele mai multe ori,
dintr-un proces de zgomot alb, gaussian) [27]. În domeniul suportului valorilor procesului
aleator relaţia dintre intrarea şi ieşirea filtrului liniar se poate exprima ı̂n modul cel mai
general prin aceea că ieşirea la un moment dat este suma dintre o combinaţie liniară
a valorii curente şi a unor valori anterioare ale intrării (procesului de zgomot alb) şi o
combinaţie liniară a valorilor anterioare ale ieşirii. În funcţie de alegerea combinaţiilor
liniare, sunt posibile trei tipuri de modele [27], [11]: autoregresiv (AR), medie glisantă
(MA) şi combinat (ARMA). Ordinul modelului este determinat de numărul de termeni
utilizaţi ı̂n cele două combinaţii liniare de valori anterioare de la intrare (Nin ) şi respectiv
ieşire (Nout ).
În cele ce urmează ne vom interesa ı̂n mod particular de modelele autoregresive (AR),
pentru care Nin = 0 (deci nu se folosesc valori anterioare ale intrării) şi Nout ≥ 1 (deci
se foloseşte cel puţin o valoare anterioară de la ieşire). Dacă notăm cu y(n) valorile de
la ieşirea filtrului liniar (modelului) şi cu ξ(n) valorile procesului de zgomot alb de la
intrarea modelului, ecuaţia ce descrie modelul AR de ordin Nout = K este:

K
X
y(n) = ξ(n) + wi y(n − i) cu wi ∈ R. (7.23)
i=1

Se observă deci că valoarea curentă a ieşirii modelului, y(n) depinde de o combinaţie liniară
de valori ale ieşirii modelului, adică y este regresat peste el ı̂nsuşi (autoregresat), de unde
şi numele modelului. Ecuaţia (7.23) de definiţie a modelului AR poate fi ı̂nsă interpretată
şi prin posibilitatea de a realiza o descriere compactă (dar aproximativă) a desfăşurării
valorilor y(n) pe baza doar a coeficienţilor wi . Această interpretare a modelului statistic
descris de ecuaţia (7.23) este numită “analiză”.
Pentru analiza AR a unui semnal dat (pentru care valorile y(n) sunt cunoscute), din
ecuaţia (7.23) trebuie calculate cele K necunoscute wi . O variantă posibilă de rezolvare
este folosirea ecuaţiilor Yule-Walker (a căror prezentare detaliată poate fi regăsită ı̂n [27]
sau [11]). Ecuaţiile Yule-Walker se bazează pe utilizarea valorilor funcţiei de autocorelaţie
a semnalului y, Ry (k), care se presupun posibil de măsurat (evaluat experimental). Mai

150
x x x x x x x x x x x x
x x TRECUT x x x x x
x x x x x x x x x x x x
x x x x x x x x x x x x
x x x x x x x x x x x x
x x x x x x x x x x x x
x x x x x x x x x x x x
x x x x x x x x x x x x
x x x x x x x x x x x x
x x x x x x x x x x x x
x x x x x x VIITOR x x
x x x x x x x x x x x x

Figura 7.7: Ordonarea pixelilor dintr-o regiune prin baleiajul uzual: pixelii predecesori
(“trecutul” semnalului de imagine) şi pixelii următori (“viitorul” semnalului de imagine)
unui pixel oarecare.

precis, avem:
K
X
Ry (k) + wi Ry (k − i) = 0, cu k = 1 . . . M (7.24a)
i=1
XK
Ry (0) + wi Ry (i) = σξ2 . (7.24b)
i=1

Pentru texturi, ca şi pentru imagini ı̂n general, corelaţia existentă ı̂ntre valorile pixelilor
ı̂nvecinaţi este semnificativă, ceea ce justifică ideea de a utiliza un model Ar pentru
caracterizare. Diferenţa esenţială faţă de cele discutate anterior provine din faptul că
semnalul de imagine este un semnal bidimensional şi aplicarea imediată a relaţiilor (7.24)
nu este posibilă. Există, desigur, posibilitatea de a rescrie ecuaţiile modelului AR şi
ecuaţiile Yule-Walker pentru cazul unui semnal cu suport bidimensional dar, cel mai
simplu (din punctul de vedere al implementării) este de a transforma (local) semnalul
de imagine ı̂ntr-un semnal unidimensional. Această transformare este echivalentă cu a
introduce o ordonare a valorilor din imagine, pentru fiecare poziţie (pixel) definindu-se
un “trecut” şi un “viitor” (aceste nume fiind asociate prin analogie cu suportul temporal
al semnalului unidimensional), adică poziţiile din suportul spaţial al imaginii ce sunt
considerate anterioare, şi respectiv ulterioare poziţiei curente. De fapt, această ordonare
nu face altceva decât să precizeze modul de baleiere a regiunii R din imagine ı̂n care se
face analiza; dacă baleierea este uzuală (pe linii de la stânga la dreapta şi de sus ı̂n jos),
structura de pixeli predecesori şi respectiv de pixeli următori ai unui pixel este prezentată
ı̂n figura 7.7.

7.3.2 Modele fractale

Noţiunea de mulţime fractală (şi conceptul asociat de geometrie fractală) oferă cadrul ma-
tematic pentru studiul a numeroase forme complexe şi neregulate ce apar ı̂n natură. Man-
delbrot [37] a demonstrat că multe suprafeţe fractale sunt generalizări ale mişcării brow-
niene (şi deci procese statistice) şi deci rezultă ca un caz limită al proceselor ce modifică

151
forma local, ı̂n mod aleator. Pentland [45] a arătat apoi că majoritatea suprafeţelor
naturale sunt fractali spaţiali izotropi şi că imaginile vizuale de intensitate ale acestor
suprafeţe sunt de asemenea fractali. Rezultă astfel posibilitatea de a caracteriza o textură
prin atributele sale de geometrie fractală [45], [12].
Caracteristica fundamentală a unui fractal (considerat ca o mulţime mărginită din spaţiul
n-dimensional Rn ) este autosimilaritatea. O mulţime A se numeşte autosimilară dacă
poate fi reprezentată prin reuniunea a N copii ale ei ı̂nsăşi, distincte (eventual suprapuse)
şi scalate omogen cu un factor r . Dimensiunea fractală a mulţimii A (numită uneori
şi dimensiune de similaritate), D, este definită de raportul logaritmilor numărului de
submulţimi şi a factorului de scală:
log N
D=− sau, echivalent, N rD = 1. (7.25)
log r

Această caracteristică de compunere/descompunere a unui fractal poate fi exemplificată


evident prin fractali generaţi ı̂n mod artificial, precum curba Koch (“fulgul de zăpadă”
Koch) sau triunghiul Sierpinski, prezentate ı̂n figura 7.8. Curba Koch se obţine prin
transformarea unui segment de dreaptă ı̂ntr-o linie frântă prin ı̂nlocuirea treimii sale
centrale cu două segmente de dreaptă ce sunt laturile triunghiului echilateral construit
având treimea centrală lipsă ca bază, procedura repetându-se pentru fiecare segment
de dreaptă nou construit. Triunghiul Sierpinski se obţine prin decuparea dintr-o placă
triunghiulară plană a triunghiului determinat de centrele laturilor, procedura repetându-
se pentru fiecare triunghi nou rezultat.
Dimensiunea fractală a unei mulţimi autosimilare este ı̂ntotdeauna diferită de dimensiunea
sa topologică (1 ı̂n cazul curbei Koch sau 2 ı̂n cazul triunghiului Sierpinski). Suprafeţele
fractale naturale nu prezintă ı̂n general această autosimilaritate simplă, deterministă, ci
sunt caracterizate de o autosimilaritate statistică, păţile scalate fiind similare mulţimii A
ı̂n sens statistic.
Deşi definiţia dimensiunii fractale este simplă şi imediată, ı̂n practică este adesea dificilă
estimarea acesteia ı̂n mod direct, folosindu-se de cele mai multe ori o aproximare numită
“box dimension”, obţinută printr-un algoritm (numit “box counting”) ce copiază pro-
cedeul de măsurare a unei dimensiuni cu o unitate de măsură de dimensiune fixă, impusă.
Esenţa unei asemenea măsurători este de a stabili de câte ori elementul de măsură este
inclus (fără suprapuneri) ı̂n mulţimea ce se măsoară, sau, echivalent, de câte elemente
este nevoie pentru a acoperi complet mulţimea de măsurat. Să presupunem că mulţimea
iniţială 3 A ⊆ Rn este acoperită cu un hiper-paralelipiped n-dimensional a cărui dimensi-
une maximă este Kmax . Deci, pentru o unitate de măsură de dimensiune Kmax , numărul
de cutii este 1. Dacă se foloseşte o unitate de măsură mai mică (deci mai precisă), de
dimensiune K (care este o fracţiune r din Kmax , K = rKmax ), vor fi necesare N (K) unităţi
(sau cutii) pentru acoperirea mulţimii A. Dar, dacă A este un fractal şi are proprietatea
de autosimilaritate, legătura dintre factorul de scală şi numărul de elemente de măsură
necesare pentru acoperire este stabilit de dimensiunea fractală D prin relaţia (7.25), cu
N = N (K). Atunci, r se cunoaşte (ca alegere a factorului de scalare a unităţii de măsură
K), iar N (K) se măsoară (prin numărare, de unde provine şi denumirea algoritmului de
3
În cazul unei imagini cu nivele de gri, mulţimea A va fi o mulţime ı̂n spaţiul tridimensional (două
coordonate spaţiale şi a treia coordonată nivelul de gri), formată din puncte de coordonate discrete.

152
a) b)

Figura 7.8: Exemple de construire a unor fractali ı̂n plan: a) curba Koch (N = 4, r = 1/3,
D = 1.262); b) Triunghiul Sierpinski (N = 3, r = 1/2, D = 1.585).

numărare a cutiilor).

log N (L) = −D log r = D log Kmax − D log K. (7.26)

Calculând valoarea N (K) pentru mai multe valori ale lui K, dimensiunea fractală căutată
D poate fi determinată ca panta aproximării liniare optimale a lui log K ı̂n funcţie de
log N (K). Modul cel mai simplu de a estima D este deci de a diviza spaţiul n-dimensional
ı̂ntr-o reţea de hiper-paralelipipede de dimensiune maximă K şi de a determina numărul
de asemenea hiper-paralelipipede nevide (care conţin deci puncte din mulţimea A).
Varianta de algoritm prezentată anterior este extrem de simplă şi de la ea se poate dezvolta
o variantă de algoritm mai precis. Să notăm cu PK (i) probabilitatea de a avea i puncte din
mulţimea A ı̂ntr-un hiper-paralelipiped de dimensiune maximă K, centrat ı̂ntr-un punct
oarecare al spaţiului. Pentru o dimensiune K fixată, probabilităţile PK (i) corespund unui

153
câmp complet de evenimente, drept pentru care avem:

K 3
X
PK (i) = 1. (7.27)
i=1

Dacă ı̂ntreaga mulţime A (care ı̂n cazul texturilor corespunde ı̂ntregii imagini cu nivele
de gri având N pixeli) este acoperită cu hiper-paralelipipede de dimensiune maximă
K, atunci numărul de hiper-paralelipipede ce conţin ı̂n interior câte i puncte este N/i.
Numărul mediu de hiper-paralelipipede necesare pentru acoperirea imaginii va fi atunci:

K3 K 3
X N X 1
N (K) = PK (i) = N PK (i) ∼
= K −D (7.28)
i=1
i i=1
i

Folosind acest mod de calcul, pentru o imagine de L × C pixeli reprezentaţi pe M nivele


de gri, pseudocodul corespunzător acestui algoritm de determinare a dimensiunii fractale
este dat ı̂n tabelul 7.1.

pentru toate dimensiunile K considerate


pentru toate valorile i = 1, . . . K 3
PK (i) = 0

pentru toate poziţiile din suportul imaginii (l, c)


pentru toate dimensiunile K considerate
centrează cubul de latură K ı̂n punctul (l, c, f (l, c))
numără punctele din R3 situate ı̂n interiorul cubului, i
actualizează PK (i) = PK (i) + 1/ ((L − Kmax )(C − Kmax ))

pentru toate dimensiunile K considerate


K3
P
N (K) = PK (i)/i
i=1

estimează D din panta aproximării liniare a lui log N (K) ı̂n funcţie de log K
Tabela 7.1: Pseudocodul corespunzator algoritmului de determinare a dimensiunii fractale
a unei texturi cu nivele de gri prin metoda “cutiilor”.

Numai dimensiunea fractală D este de obicei insuficientă pentru caracterizarea eficientă a


unei texturi [45], ı̂ntrucât există texturi ce sunt vizual diferite, deşi au aceeaşi dimensiune
fractală. Parametrul de lacunaritate a fost introdus pentru a caracteriza măsura ı̂n care
textura (sau mulţimea fractală) este densă sau rară. Pentru modelul prezentat anterior de
caracterizare a fractalilor prin acoperirea cu hiper-paralelipipede (cutii), lacunaritatea Λ
se poate defini ca pătratul raportului dintre dispersia şi media variabilei aleatoare discrete
“număr de puncte ı̂n interiorul cutiei de dimensiune K”, caracterizată de probabilităţile

154
PK (i).

µ ¶2
σ
Λ= , cu (7.29)
µ
K3
X
µ= iPK (i),
i=1
K3
X
2
σ = i2 PK (i) − µ2 .
i=1

Pentru anumite clase particulare de fractali, dimensiunea fractală D şi dimensiunea


topologică E sunt legate printr-un parametru numit coeficient Hurst, H, definit de
H = E + 1 − D [45] (deci ı̂n cazul unei texturi cu nivele de gri modelată printr-o mulţime
fractală E = 3 şi H = 4 − D). Coeficientul Hurst măsoară scăderea puterii semnalului cu
frecvenţa, ı̂n spectrul Fourier de putere, presupunând un spectru cu simetrie circulară şi
cădere exponenţială. Astfel:
F(R)(f, θ) ' f −2H . (7.30)

În practică, estimarea dimensiunii fractale pe baza ecuaţiei (7.30) este simplă: spectrul
Fourier de energie al regiunii R considerate este reprezentat ı̂n coordonate polare (f, θ)
şi este măsurată variaţia energiei medii (mediată după un număr suficient de mare de
direcţii θ convenabil alese) cu frecvenţa f . Panta dreptei de aproximare a logaritmului
energiei după logaritmul frecvenţei polare este un estimat al dublului valorii coeficientului
Hurst.

log E

log f

a) b)

Figura 7.9: a) Spectrul de energie Fourier al texturii reprezentate ı̂n figura 7.1 a); b)
reprezentarea la scară dublu logaritmică a energiei ı̂n funcţie de frecvenţa polară (linie
continuă) şi dreapta de aproximarea a acesteia (linie ı̂ntreruptă). Coeficientul Hurst este
H = 1.465, iar dimensiunea fractală este D = 2.535.

155
7.4 Concluzii

Tehnicile de descriere a texturilor ce au fost prezentate ı̂n acest capitol se bazează ı̂n
cea mai mare parte pe caracterizarea statistică. Fundamentul metodelor statistice este
extragerea din procesul studiat a unui număr suficient de mare de valori astfel ca să se
realizeze un eşantion statistic semnificativ pentru fenomenul studiat. Aceasta ı̂nseamnă
deci că există o limită inferioară a numărului de pixeli din regiunea R caracterizată, sub
care mărimile statistice nu mai sunt credibile (sau de ı̂ncredere). Aceeaşi problemă apare
şi ı̂n cazul descrierii texturilor ı̂n domeniul spectral. În aceste condiţii, segmentarea bazată
pe caracterizarea fiecărui pixel dintr-o imagine printr-un vector de trăsături deduse din
parametri statistici estimaţi ı̂ntr-o vecinătate a pixelului, nu poate delimita corect zonele
situate la marginea regiunilor cu texturi diferite. De-a lundul acestor frontiere apar zone
de incertitudine, a căror grosime este determinată de jumătatea regiunii de analiză R.
De cele mai multe ori, caracterizările statistice sau prin modele nu sunt suficient de efi-
ciente din punctul de vedere al complexităţii de calcul, preferându-se descrierea texturilor
ı̂n domeniul spectral, prin bancuri de filtre liniare.

156