09 cartePAI Texturi

Capitolul 7
Caracterizarea texturilor
Termenul de textură este legat de percepţia (vizuală şi tactilă) a unui material (cel mai
adesea de tip ţesătură). Într-un cadru mai larg, putem considera textura ca o proprietate
a obiectelor sau materialelor, ce caracterizează structura lor fizică din punctul de vedere
al dimensiunii, formei, orientării, aranjamentului şi proporţiei părţilor constituente ale
acesteia [15]. Această caracteristică se referă la configuraţia structurală a unei largi ca-
tegorii de obiecte şi materiale: materiale textile urzite sau ţesute, aliaje, roci, sol, piele
şi ţesuturi organice, vegetaţie, aglomerări de granule. Textura este descrisă ı̂n termeni
lingvistici prin cuvinte ca rugozitate, contrast, fineţe, regularitate, etc., termeni a căror
exprimare matematică nu este clară [12]. Dificultatea de a defini textura conduce uneori
chiar la pseudo-definiţii recursive, ca ı̂n [41] 1 . Câteva exemple de texturi (naturale şi
artificiale) sunt prezentate ı̂n figura 7.1; colecţii de texturi sunt disponibile fie ı̂n albume,
precum clasica colecţie Brodatz , fie ı̂n arhive electronice, precum baza de texturi Vistex
[1].
După cum se remarcă şi din imaginile prezentate ı̂n figura 7.1, o textură nu poate fi definită
nici ca o regiune uniformă (din punctul de vedere al valorilor pixelilor ce o compun) şi nici
doar prin prezenţa frontierelor. La o scară dată, orice textură are acelaşi aspect, indiferent
de alegerea subregiunii de analiză. Aceste observaţii conduc la necesitatea caracterizării
texturilor prin alte mărimi decât simpla valoare a pixelilor sau variaţia locală (ı̂n sens
derivativ) a acestor valori. Vom considera că textura poate fi definită prin uniformitatea
(spaţială) a unor caracteristici specifice, calculate de cele mai multe ori pe baza unor
considerente statistice. Corespunzând diferitelor teorii privitoare la percepţia vizuală a
texturii, au fost propuse două modele principale de descriere a texturilor:
- abordarea deterministă, ce se referă la repetarea spaţială a unui motiv de bază, pe
diferite direcţii. Acestă abordare corespunde unei viziuni macroscopice, ı̂ntâlnită de altfel
ı̂n cazul ţesăturilor, fragmentelor de piele de reptilă şi a modelelor de tip mozaic (mozaicul
de pe pardoseală, parchetul). Elementul repetitiv de bază portă numele de texon sau texel
(element de textură – texture element, prin similaritate cu denumirea de pixel – picture
element).
- abordarea probabilistă (statistică), ce se referă la caracterizarea atributelor anarhice şi
omogene ı̂n acelaşi timp, care nu ţin nici de un element de bază localizabil (motiv), nici
1
“Textura este acel obiect pentru care algoritmii de extragere a texturilor dau rezultate concludente.”
139
a) b) c)
d) e) f)
Figura 7.1: Exemple de texturi: a) ţesătură de lână; b) ţesătură de bumbac; c) jaluzele

verticale din plastic; d) pavaj; e) flori de liliac; f ) aglomerare de pietre de râu.
de o frecvenţă principală de repetiţie.

Referindu-ne ı̂n continuare la abordarea cea mai generală, abordarea statistică, vom con-
sidera deci că textura este o realizare particulară a unui proces aleator, care, pentru
simplificare, este considerat staţionar. Ipoteza de staţionaritate presupune că statisticile
calculate pentru o regiune oarecare a texturii sunt independente de poziţionarea regiunii
ı̂n câmpul de observaţie (ı̂ntreaga textură); practica infirmă ı̂nsă de destule ori această
presupunere. O problemă suplimentară legată de calculul mărimilor statistice este deter-
minată de faptul că natura statistică a acestora impune calculul pentru o infinitate de
realizări ale procesului aleator considerat (şi deci o infinitate de texturi de acelaşi fel).
Cum această infinitate de realizări particulare nu este disponibilă, ı̂n practică se face
implicit ipoteza suplimentară de ergodicitate2 a procesului aleator, astfel ı̂ncât o singură
realizare (deci o singură textură) să permită calculul mărimilor statistice ca medii spaţiale.
Acest tip de caracterizare este realizată ı̂n domeniul spaţial (ı̂n domeniul valorilor imagi-
nii/texturii). Este ı̂nsă posibilă şi o caracterizare a texturii ı̂n domeniul spectral, ı̂n urma
folosirii transformatei Fourier, caz ı̂n care se vor măsura distribuţii spectrale de energie.
2
Un proces aleator se cheamă ergodic dacă mediile sale statistice sunt egale cu mediile sale temporale;
pentru o definire mai completă a conceptelor de staţionaritate şi ergodicitate se poate consulta [11]
140
7.1 Caracterizarea ı̂n domeniul spaţial
Caracterizarea texturilor ı̂n domeniul spaţial este bazată pe calculul funcţiilor de densitate
de probabilitate (de diferite ordine) ale valorilor pixelilor din regiuni de interes decupate
din textură. În cele ce urmează vom considera că estimarea mărimilor statistice se face
pentru o regiune R din textura f , regiune de formă oarecare (deşi ı̂n practică se foloseşte
ı̂n covârşitoarea majoritate a cazurilor forma pătrată), formată din Nreg pixeli. Fiecare
pixel este identificat de vectorul coordonatelor sale (coordonată de linie, coordonată de
coloană), grupate ı̂n vectorul de poziţie x.
7.1.1 Statistici de ordinul unu
Funcţia de densitate de ordinul unu asociată valorilor din regiunea R este chiar histograma
nivelelor de gri din regiune şi măsoară probabilitatea de apariţie ı̂n interiorul regiunii con-
siderate a diferitelor nivele de gri posibile (2.9). După cum s-a arătat ı̂n secţiunea 2.2,
histograma h caracterizează conţinutul regiunii din punctul de vedere al proporţiei de
amestec a diferitelor valori ale nivelelor de gri şi deci poate fi folosită pentru identificarea
texturilor. De asemenea, se pot folosi pentru caracterizare momente statistice necentrate,
centrate (se poate urmări ı̂n [11] o prezentare mai detaliată a semnificaţiei momentelor
statistice ale unei variabile aleatoare) sau absolute, calculate pe baza histogramei h.
M
(k) 1 X k
X
m = f (x) = ik h(i); (7.1)
Nreg x∈R i=0
M
(k) 1 X k
X
M = (f (x) − m1 ) = (i − m1 )k h(i); (7.2)
Nreg x∈R i=0
M
c(k) = 1 X X
M |f (x) − m1 |k = |i − m1 |k h(i), k impar. (7.3)
Nreg x∈R i=0
Caracterizarea texturilor prin momente nu este suficient de precisă; au fost sintetizate

texturi (perceptual diferite) ale căror momente statistice sunt identice până la ordinul 4
sau 5 [12]. De asemenea, trebuie remarcat faptul că atât folosirea momentelor, cât şi a
histogramei, nu poate să surprindă informaţia de plasament spaţial a valorilor, ı̂ntrucât
histograma nu ia ı̂n considerare poziţia pixelilor ı̂n interiorul regiunii, fiind deci posibile
texturi vizual diferite dar având aproape acceaşi histogramă, aşa cum este prezentat şi ı̂n
exemplul din figura 7.2.
7.1.2 Statistici de ordinul doi
Funcţiile de densitate de probabilitate de ordin superior (doi şi mai mare decât doi) iau
ı̂n considerare informaţia de poziţie spaţială a diferitelor valori posibile, prin impunerea
unei legături de plasament spaţial al setului de pixeli a cărui probabilitate de apariţie este
măsurată ı̂n regiunea R.
141
h(i)
0.01
0.005
0
0 50 100 150 200 250
i
a) b)
Figura 7.2: Insuficienţa histogramei (densitate de probabilitate de ordinul unu) pentru dis-
criminarea texturilor: a) mozaic format din două texturi: ı̂n partea superioară imaginii
este o imagine a unei ţesături (textura din 7.1 a)), ı̂n partea inferioară a imaginii este
un fragment dintr-un ornament de plafon (castelul Versailles, Franţa), b) histogramele
texturilor din figura a): pentru partea de sus a imaginii (linie punctată) şi, respectiv,
pentru partea de jos a imaginii (linie continuă) – diferenţele dintre cele două histograme
sunt minimale (10%), deşi texturile pentru care au fost calculate sunt foarte diferite.
Matricea de coocurenţă
Matricea de coocurenţă [25], [12], [33] este funcţia de densitate de probabilitate de ordinul
doi corespunzătoare valorilor din regiunea studiată, având ca elemente probabilităţile de
apariţie ı̂n regiunea considerată a unor perechi de valori de nivele de gri. Pentru regiunea
R a texturii studiate şi pentru un vector de translaţie spaţială t dat (ce defineşte separaţia
spaţială dintre cele două elemente ale perechii de pixeli a căror probabilitate de apariţie se
măsoară), componentele matricii de coocurenţă se definesc pentru toate perechile posibile
de nivele de gri (a, b), ca (7.4):
Mt (a, b) = Card {(x, x + t) ∈ R × R | f (x) = a şi f (x + t) = b} /Card {(x, x + t) ∈ R × R} .

(7.4)
Deci Mt (a, b) este probabilitatea de apariţie ı̂n regiunea R a perechii de pixeli separaţi de
vectorul de translaţie t, care au respectiv valorile nivelelor de gri a şi b. Se remarcă faptul
că matricea de coocurenţă astfel definită verifică condiţia de normare a unei densităţi de
probabilitate de ordinul doi: XX
Mt (a, b) = 1. (7.5)
a b
Pentru o imagine cu M nivele de gri, matricea de coocurenţă va fi o matrice pătrată de

dimensiune M × M . În practică, pentru reducerea calculelor, numărul de nivele de gri
este redus la 8 sau la 16, printr-o tehnică convenabilă (ı̂n general este suficientă eliminarea
ultimilor biţi din cuvântul de reprezentare binară a nivelului de gri). În concluzie, pentru
o aceeaşi textură, matricea de coocurenţă depinde de regiunea considerată, vectorul de
142
translaţie şi modalitatea de reducere a nivelelor de gri. Figura 7.3 prezintă un exemplu
de calcul a matricii de coocurenţă pentru o regiune extrasă dintr-o textură.
4 3 3 4 4 5 7 7 5 4
4 4 4 4 4 5 6 7 5 4
4 4 4 4 4 4 6 6 5 4
4 4 4 4 4 4 5 6 5 4
3 4 5 5 4 4 5 6 5 4
3 4 5 5 5 5 5 5 4 3
3 3 4 5 6 6 6 5 4 3
3 3 4 5 6 7 7 6 4 3
a) b)
0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0
3 5 6 2
0 0 72 72
0 0 0 0 0 70 70
0 0 0
4 16 8 1 3 25 4
0 0 72 72 72 72
0 0 0 70 70 70
0 0
8 6 5 1 3 12 4
0 0 0 72 72 72 72
0 0 0 70 70 70
0
1 4 3 2 2 4 2
0 0 0 72 72 72 72
0 0 0 0 70 70 70
2 1 2 2 1
0 0 0 0 72 72 72
0 0 0 0 0 70 70
c) d)
Figura 7.3: Exemplu de calcul a matricii de coocurenţă: a) regiune dintr-o textură, recuan-
tizată pe 7 nivele de gri prin truncherea reprezentării binare a nivelelor de gri; b) valorile
re-cuantizate ale nivelelor de gri pentru regiunea a); c) matricea de coocurenţă calculată
pentru vectorul de translaţie t = (0, 1); d) matricea de coocurenţă calculată pentru vectorul
de translaţie t = (1, 0). .
Având ı̂n vedere influenţa importantă a alegerii vectorului de translaţie asupra matricii
de coocurenţă, unii autori au propus utilizarea unei matrici de coocurenţă compozite,
care să integreze influenţa translaţiilor după mai multe direcţii. Astfel, ı̂n [25] matricea
de coocurenţă utilizată efectiv pentru caracterizarea texturii este media aritmetică a ma-
tricilor de coocurenţă calculate pentru vectorii de translaţie unitari, orientaţi pe direcţiile
verticală şi orizontală:
¡ ¢
M (a, b) = 0.25 M(0,1) (a, b) + M1,0 (a, b) + M(−1,0) (a, b) + M(0,−1) (a, b) . (7.6)
Distincţia ı̂ntre texturi diferite poate fi făcută ı̂n primul rând prin inspecţia (examinarea
de ansamblu) a matricii de coocurenţă, printr-o vizualizare tridimensională a matricii (de
exemplu, pentru o zonă R uniformă, matricea de coocurenţă are o singură componentă
nenulă, indiferent de vectorul de translaţie ales). Pentru o comparaţie numerică au fost
definiţi [25] mai mulţi indici de natură statistică (omogenitate, uniformitate, entropie,
contrast, etc.) ce caracterizează distribuţia componentelor matricii de coocurenţă.
Parametrul de uniformitate (sau energie) [25] (numit omogenitate ı̂n [12]) este definit ca:
XX
U= Mt2 (a, b). (7.7)
a b
Cum matricea de coocurenţă este o densitate de probabilitate de ordinul doi, verificând ca

urmare condiţia de normare a unei distribuţii de probabilitate (7.5), expresia uniformităţii
143
U va fi maximă pentru o distribuţie uniformă a probabilităţilor de apariţie a diferitelor
perechi de nivele de gri (a, b); cu cât anumite perechi de nivele de gri sunt mai prezente
ı̂n regiunea de textură considerată, cu atât mai mică va fi valoare parametrului U din
(7.7). Deci parametrul U va avea valori cu atât mai mici cu cât prezenţa ı̂n textură a unei
perechi de nivele de gri este mai pregnantă şi textura prezintă o uniformitate a nivelelor
de gri sau o repetiţie a nivelelor de gri pe direcţia translaţiei t.
Parametrul de entropie este definit de:
XX
H=− Mt (a, b) log (Mt (a, b) + δ(Mt (a, b))) . (7.8)
a b
Entropia este mare dacă o aceeaşi pereche de pixeli apare de multe ori şi este mică dacă
toate perechile de nivele de gri sunt uniform şi slab reprezentate. Entropia H este deci
un indicator al dezordinii ce caracterizează textura.
Parametrul de corelaţie este definit ca o covariaţie statistică normalizată:
1 XX
B= (a − µa )(b − µb )Mt (a, b) (7.9)
σa σb a b
În expresia (7.9) µa şi µb sunt valorile medii pe regiunea R considerată a nivelelor de gri
ce corespund pixelilor situaţi pe prima poziţie şi respectiv a doua poziţie a perechii, iar
σa şi σb sunt dispersiile corespunzătoare În principiu, pentru un vector de deplasare mic,
valorile mediilor şi dispersiilor nivelelor de gri sunt extrem de similare, putându-se face
aproximarea µa = µb = µ şi σa = σb = σ.
Parametrul de contrast [25] este definit ca:
XX
C= (a − b)2 Mt2 (a, b). (7.10)
a b
După cum se remarcă ı̂n expresia de definiţie (7.10), fiecare termen al matricii de
coocurenţă este ponderat cu distanţa la diagonală (deci cu o cantitate direct proporţională
cu diferenţa dintre cele două nivele de gri ce compun perechea). Astfel se obţine un indice
ce corespunde interpretării uzuale a contrastului şi anume, are o valoare mare atunci când
termenii depărtaţi de diagonala principală a matricii au valori mari (adică atunci când
ı̂n regiunea de textură considerată există numeroase treceri de la pixeli luminoşi la pixeli
ı̂ntunecaţi).
Parametrul de omogenitate locală [12] (numit moment invers al diferenţei ı̂n [25]) este
definit de:
XX 1
O= 2
Mt (a, b)2 . (7.11)
a b
1 + (a − b)
Acest parametru are o acţiune inversă contrastului C din (7.10), ı̂ntrucât sunt favorizate
contribuţiile valorilor apropiate de diagonala principală a matricii de coocurenţă. Aceasta
ı̂nseamnă că parametrul O va avea valori mari pentru texturile ce prezintă o variaţie mică
a nivelelor de gri ı̂n sensul translaţiei t. Acest parametru este asemănător cu ceea ce este
definit ı̂n [12] sub numele de uniformitate (7.12) sau directivitate (7.13) (parametri ce au
valori cu atât mai importante cu cât un acelaşi nivel de gri apare de mai multe ori pe
144
4 3 3 4 4 5 7 7 5 4
4 4 4 4 4 5 6 7 5 4 0 0 0 0 0 0 0 0 0 0 0
4 4 4 4 4 4 6 6 5 4 0 0 0 0 0 0 0 0 0 0 0
4 4 4 4 4 4 5 6 5 4 5 3 0 0 0 0 2 1 1 1 0
3 4 5 5 4 4 5 6 5 4 13 2 0 0 1 2 0 1 3 2 3
3 4 5 5 5 5 5 5 4 3 12 1 0 0 0 1 2 3 1 1 1
3 3 4 5 6 6 6 5 4 3 5 1 1 0 0 0 3 2 1 0 0
3 3 4 5 6 7 7 6 4 3 1 2 0 0 0 0 3 1 0 0 0
a) b) c)
Figura 7.4: Exemplu de calcul a matricii de izosegmente pentru regiunea de textură prezen-
tată ı̂n figura 7.3 b): a) valorile din regiunea texturată; b) matricea de izosegmente ori-
zontale; c) matricea de izosegmente verticale.
direcţia de translaţie):
X
U2 = Mt2 (a, a); (7.12)
a
X
D= Mt (a, a). (7.13)
a
Matricea de izosegmente
Un izosegment de nivele de gri [19] (numit uneori şi plajă sau runlength) este o mulţime
liniară, de lungime maximă, formată din pixeli consecutivi ce au acelaşi nivel de gri,
orientată pe o anumită direcţie. Lungimea unui izosegment este numărul de pixeli ce
formează respectiva mulţime. Pentru o orientare (direcţie) fixată θ, se poate determina
o matrice de izosegmente, ale cărei elemente Mθ (a, b) reprezintă numărul de izosegmente
de lungime b dată, formate din pixeli de un nivel de gri a dat şi orientate pe direcţia θ.
Matricea rezultată are M linii (egal cu numărul de nivele de gri din imagine) şi un număr
de coloane Nθ , egal cu lungimea maximă a izosegmentelor pe direcţia considerată. Figura
7.4 prezintă un exemplu de calcul a matricilor de izosegmente.
La nivel global, caracteristicile regiunii R sunt numărul de izosegmente prezente ı̂n
regiune, Niz , şi numărul de pixeli din regiune, Nreg .
M
X nθ
−1 X
Niz = Mθ (a, b); (7.14)
a=0 b=1
M
X nθ
−1 X
Nreg = bMθ (a, b). (7.15)
a=0 b=1
Matricea de izosegmente reprezintă funcţia de densitate de probabilitate a setului de

variabile aleatoare “valoare a izosegmentelor – lungime a izosegmentelor”, probabilitatea
de apariţie a unui izosegment având o valoare a şi o lungime b impuse fiind dată de:
Mθ (a, b)
Pθ (a, b) = . (7.16)
Niz
145
Aspectul matricii de izosegmente este caracteristic unui anumit tip de textură; ca şi pentru
matricea de coocurenţă se pot defini diferite mărimi caracteristice. Descriptorii de bază
ai matricii de izosegmente au fost definiţi ı̂n [19] şi sunt prezentaţi ı̂n ecuaţiile (7.17):
RF 1 – proporţia izosegmentelor scurte, RF 2 – proporţia izosegmentelor lungi, RF 3 –
heterogenitatea (non-uniformitatea) valorilor, RF 4 – heterogenitatea (non-uniformitatea)
lungimilor, RF 5 – proporţia izosegmentelor.
M −1 nθ
1 XX Mθ (a, b)
RF 1 = ; (7.17a)
Niz a=0 b=1 b2
M −1 nθ
1 XX
RF 2 = b2 Mθ (a, b); (7.17b)
Niz a=0 b=1
M −1
Ãn !2
1 X X θ
RF 3 = Mθ (a, b) ; (7.17c)
Niz a=0 b=1
nθ
ÃM −1 !2
1 X X
RF 4 = Mθ (a, b) ; (7.17d)
Niz b=1 a=0
Niz
RF 5 = . (7.17e)
Nreg
O primă extensie a setului de parametri Galloway prezentaţi ı̂n (7.17) a fost propusă ı̂n
[10] prin adăugarea a doi parametri de măsură a proporţiei de valori mici şi respectiv,
importante, definiţi ı̂n (7.18): proporţia nivelelor de gri mici LGRE (Low Gray-level
Run Emphasis) şi proporţia nivelelor de gri importante HGRE (High Gray-level Run
Emphasis). Este evident că aceşti parametri provin din simetrizarea parametrilor RF 1
(7.17a) şi RF 2 (7.17b) definiţi pentru lungimea izosegmentelor.
M −1 nθ
1 XX Mθ (a, b)
LGRE = ; (7.18a)
Niz a=0 b=1 a2
M −1 nθ
1 XX
HGRE = a2 Mθ (a, b). (7.18b)
Niz a=0 b=1
De altfel, principiul după care au fost introduşi parametrii RF1, RF2, LGRE şi HGRE
este ponderarea numărului de izosegmente de o anumită valoare şi lungime, Mθ (a, b),
printr-un factor ce depinde direct (respectiv invers) proporţional de pătratul măsurii de
interes (lungime a izosegmentului sau valoare a izosegmentului).
O nouă extensie a mulţimii de parametri este propusă de [17], prin ponderarea atât
a lungimilor izosegmentelor cât şi a valorilor izosegmentelor. Cei patru noi parametri
146
propuşi sunt definiţi de:
M −1 nθ
1 XX
LRHGE = a2 b2 Mθ (a, b); (7.19a)
Niz a=0 b=1
M −1 nθ
1 XX b2
LRLGE = Mθ (a, b); (7.19b)
Niz a=0 b=1 a2
M −1 nθ
1 XX
SRHGE = b2 a2 Mθ (a, b); (7.19c)
Niz a=0 b=1
M −1 nθ
1 XX 1
SRSGE = Mθ (a, b). (7.19d)
Niz a=0 b=1 a b2
2
Semnificaţia acestor parametri este de proporţie a izosegmentelor lungi, cu valoare impor-

tantă LRHGE (Large Run, High Gray-level Run Emphasis), proporţie a izosegmentelor
lungi cu valoare mică LRLGE (Large Run, Low Gray-level Run Emphasis), proporţie
a izosegmentelor scurte cu valori importante SRHGE (Small Run High Gray-level Run
Emphasis) şi proporţie a izosegmentelor scurte cu valori mici, SRLGE (Small Run Low
Gray-level Run Emphasis).
Corelograma
Corelograma, definită ı̂n [30], [29], este o altă măsură a aranjamentului spaţial a valorilor
pixelilor dintr-o regiune. Corelograma măsoară probabilităţile de apariţie a diferitelor
perechi de valori de nivele de gri (a, b) pentru toate perechile de pixeli din regiunea R ce
sunt situaţi la o distanţă d impusă.
Cd (a, b) = Card {(x1 , x2 ) ∈ R × R | dist(x1 , x2 ) = d, f (x1 ) = a şi f (x2 ) = b} /
(7.20)
Card {(x1 , x2 ) ∈ R × R | dist(x1 , x2 ) = d} .
Evident, corelograma depinde ı̂n mod fundamental de alegerea metricii după care se cal-
culează distanţa. Dimensiunea corelogramei este aceeaşi cu a matricei de coocurenţă;
corelograma este o matrice pătrată cu număr de linii egal cu numărul de nivele de cuanti-
zare a nivelelor de gri din imagine. În practică, corelograma este calculată pentru un set
de mai multe distanţe.
Autocorelograma este un caz particular al corelogramei, ı̂n care se măsoară probabilitatea
de apariţie a perechilor de pixeli de aceeaşi valoare, separaţi de o distanţă d impusă. A-
utocorelograma este un vector, al cărui număr de elemente este numărul de nivele de
cuantizare a nivelelor de gri din imagine:
Cd (a) = Card {(x1 , x2 ) ∈ R × R | dist(x1 , x2 ) = d, f (x1 ) = a şi f (x2 ) = a} /
(7.21)
Card {(x1 , x2 ) ∈ R × R | dist(x1 , x2 ) = d} .
7.2 Caracterizarea ı̂n domeniul spectral
Caracterizarea texturilor ı̂n domeniul spectral se bazează pe proprietatea transformărilor

(integrale) unitare de a transpune, fără pierderi, informaţia vizuală conţinută ı̂n dome-
147
niul spaţial al imaginilor ı̂ntr-un alt domeniu, echivalent, numit domeniu al frecvenţelor
spaţiale (sau domeniu spectral), după cum s-a discutat şi ı̂n capitolul ??. Caracteristicile
de variaţie a valorilor ı̂n domeniul spaţial se regăsesc, ı̂ntr-o formă modificată (depinzând
de tipul transformării unitare utilizate) ı̂n domeniul spectral. De exemplu, dacă este să
ne referim numai la spectrul rezultat ı̂n urma aplicări transformatei Fourier, frecvenţele
(spaţiale) ı̂nalte pot fi folosite pentru detecţia contururilor, frecvenţele ce concentrează
energie corespund unor structuri periodice ı̂n domeniul spaţial, iar aranjarea liniară a unor
maxime energetice poate să indice o anumită direcţie predominantă după care sunt orien-
tate componente din imagine [64], [33]. Astfel se structurează zone de interes ı̂n domeniul
spectral, ı̂n care este posibilă identificarea unor caracteristici de variaţie spaţială a va-
lorilor din textură prin măsurarea energiei spectrale corespunzătoare. Zonele de interes
din spectru sunt extrase cu ajutorul unor seturi de măşti (aperturi) definite convenabil.
Dar această operaţie nu este ı̂nsă altceva decât filtrarea liniară a texturii după un set de
filtre liniare a căror funcţie de transfer corespunde măştilor de frecvenţă dorite, ceea ce
ı̂nseamnă că descrierea unei texturi ı̂n domeniul spectral se realizează echivalent prin fil-
trarea acesteia cu un banc de filtre liniare şi măsurarea unei energii a răspunsului acestora
[49].
Măştile de bază folosite pentru măsurarea caracteristicilor energetice ce definesc textura
sunt de două feluri (reprezentate ı̂n figura 7.5) [33]: măşti inelare simetrice, de tip trece
bandă, a căror parametri de definiţie sunt lărgimea inelului (benzii de trecere) şi raza
inelului (poziţionarea frecvenţei centrale de trecere), măşti ce măsoară concentraţia de
energie pe diferite zone ale spectrului şi măşti orientate, de forma unor sectoare circulare,
ai căror parametri de definiţie sunt orientarea şi lărgimea sectorului circular, măşti ce
măsoară caracteristicile de orientare din textură şi identifică direcţiile predominante. În
mod clasic, texturile se caracterizează prin folosirea a 7 măşti inelare şi 4 măşti de tip
sector (setul complet de măşti este reprezentat ı̂n [49]).
a) b) c) d)
Figura 7.5: Măşti de caracterizare a texturilor ı̂n domeniul spectral: a), b) măşti de tip
inel având diferite raze (frecvenţe centrale ale benzii de trecere); c) d) măşti de tip sector,
având orientările 0 şi π/4. Profilul secţiunii măştilor este gaussian.
Ideea de a măsura atât repartiţia unghiulară cât şi cea de frecvenţă a energiei texturii se
regăseşte şi ı̂n metoda de caracterizare a texturilor prin filtrare cu un banc de filtre Gabor
[49], inclusă şi ca unul dintre descriptorii texturali ı̂n standardul MPEG-7 [2], Filtrul
Gabor este un filtru trece bandă, a cărui funcţie de transfer este de tip gaussian; funcţia
sa pondere este tot o gaussiană, modulată cu o componentă cosinusoidală ce corespunde
148
frecvenţei centrale (f0 ) a benzii de trecere.
µ ¶
k2 l2
h(k, l) = cos(2πf0 k) exp + . (7.22)
σx2 σy2
Modificarea frecvenţei centrale f0 face ca filtrul să selecteze din spectrul texturii o zonă
corespunzătoare unor frecvenţe mai joase (f0 mic) sau mai ridicate (f0 mare), ceea ce
corespunde evaluării ı̂n textură a unor trăsături mai grosiere, respectiv detalii mai fine,
ceea ce este echivalent cu analiza unor versiuni scalate ale texturii considerate. Toate
filtrele Gabor ce sunt definite cu o aceeaşi frecvenţă centrală f0 analizează informaţia din
textură la o aceeaşi scală.
a) b) c)
Figura 7.6: Măşti Gabor (funcţii de transfer) de caracterizare a texturilor ı̂n domeniul
spectral: a) filtru cu 1 scală şi 1 orientare; b) banc de filtre cu 3 scale şi 4 orientări; c)
banc de filtre cu 5 scale şi 2 orientări
O altă metodă clasică de analiză energetică a texturilor se bazează pe calculul unui vector
caracteristic al entropiilor energetice pentru benzi de frecvenţă de tip trece jos, cu bandă
de trecere din ce ı̂n ce mai mare. Pentru fiecare bandă de frecvenţă energiile spectrale
se normează la suma acestora, şi se calculează entropia valorilor rezultate; la rândul ei,
acestă entropie se normează la entropia maxim posibilă pentru o zonă spectrală de energie
uniformă.
7.3 Modelarea texturilor
Termenul de model [27] se foloseşte pentru orice ipoteză ce se poate aplica pentru a
explica sau a descrie legile ascunse (necunoscute) ce se presupune că guvernează sau
constrâng generarea unor date de interes. Aceasta ı̂nseamnă că se presupune adevărat şi
cunoscut un sistem de ecuaţii (dependente de parametri) ce caracterizează desfăşurarea
fenomenului fizic studiat şi se ı̂ncearcă găsirea unui set de parametri particulari care duc la
aproximarea optimă a datelor reale prin cele generate de ecuaţiile sistemului. Parametrii
astfel determinaţi vor constitui un mod de reprezentare comprimat şi aproximativ al
desfăşurării fenomenului fizic studiat, putând fi utilizaţi fie pentru generarea unei forme
aproximative a acestuia, fie pentru compararea sa cu alte procese caracterizate ı̂ntr-un
149
mod similar. În cazul particular al texturilor, modelarea ı̂nseamnă a presupune că valorile
funcţiei imagine, ı̂ntr-o regiune R oarecare, pot fi generate pe baza unui model, parametrii
modelului urmând a caracteriza textura.
În cele ce urmează vom prezenta noţiunile de bază legate de două tipuri de modele des
folosite ı̂n analiza şi prelucrarea imaginilor: modelele statistice (de tip autoregresiv) şi
modelele de tip fractal.
7.3.1 Modele statistice
Folosirea modelelor statistice (stochastice) provine din ideea fundamentală a lui Yule,
potrivit căreia o serie de timp (deci valorile unei realizări particulare ale unui proces
aleator de timp discret) cu observaţii puternic corelate poate fi generată aplicând unui
filtru liniar o serie de eşantioane statistic independente (ce provin, de cele mai multe ori,
dintr-un proces de zgomot alb, gaussian) [27]. În domeniul suportului valorilor procesului
aleator relaţia dintre intrarea şi ieşirea filtrului liniar se poate exprima ı̂n modul cel mai
general prin aceea că ieşirea la un moment dat este suma dintre o combinaţie liniară
a valorii curente şi a unor valori anterioare ale intrării (procesului de zgomot alb) şi o
combinaţie liniară a valorilor anterioare ale ieşirii. În funcţie de alegerea combinaţiilor
liniare, sunt posibile trei tipuri de modele [27], [11]: autoregresiv (AR), medie glisantă
(MA) şi combinat (ARMA). Ordinul modelului este determinat de numărul de termeni
utilizaţi ı̂n cele două combinaţii liniare de valori anterioare de la intrare (Nin ) şi respectiv
ieşire (Nout ).
În cele ce urmează ne vom interesa ı̂n mod particular de modelele autoregresive (AR),
pentru care Nin = 0 (deci nu se folosesc valori anterioare ale intrării) şi Nout ≥ 1 (deci
se foloseşte cel puţin o valoare anterioară de la ieşire). Dacă notăm cu y(n) valorile de
la ieşirea filtrului liniar (modelului) şi cu ξ(n) valorile procesului de zgomot alb de la
intrarea modelului, ecuaţia ce descrie modelul AR de ordin Nout = K este:
K
X
y(n) = ξ(n) + wi y(n − i) cu wi ∈ R. (7.23)
i=1
Se observă deci că valoarea curentă a ieşirii modelului, y(n) depinde de o combinaţie liniară
de valori ale ieşirii modelului, adică y este regresat peste el ı̂nsuşi (autoregresat), de unde
şi numele modelului. Ecuaţia (7.23) de definiţie a modelului AR poate fi ı̂nsă interpretată
şi prin posibilitatea de a realiza o descriere compactă (dar aproximativă) a desfăşurării
valorilor y(n) pe baza doar a coeficienţilor wi . Această interpretare a modelului statistic
descris de ecuaţia (7.23) este numită “analiză”.
Pentru analiza AR a unui semnal dat (pentru care valorile y(n) sunt cunoscute), din
ecuaţia (7.23) trebuie calculate cele K necunoscute wi . O variantă posibilă de rezolvare
este folosirea ecuaţiilor Yule-Walker (a căror prezentare detaliată poate fi regăsită ı̂n [27]
sau [11]). Ecuaţiile Yule-Walker se bazează pe utilizarea valorilor funcţiei de autocorelaţie
a semnalului y, Ry (k), care se presupun posibil de măsurat (evaluat experimental). Mai
150
x x x x x x x x x x x x
x x TRECUT x x x x x
x x x x x x VIITOR x x
Figura 7.7: Ordonarea pixelilor dintr-o regiune prin baleiajul uzual: pixelii predecesori
(“trecutul” semnalului de imagine) şi pixelii următori (“viitorul” semnalului de imagine)
unui pixel oarecare.
precis, avem:
K
X
Ry (k) + wi Ry (k − i) = 0, cu k = 1 . . . M (7.24a)
i=1
XK
Ry (0) + wi Ry (i) = σξ2 . (7.24b)
i=1
Pentru texturi, ca şi pentru imagini ı̂n general, corelaţia existentă ı̂ntre valorile pixelilor
ı̂nvecinaţi este semnificativă, ceea ce justifică ideea de a utiliza un model Ar pentru
caracterizare. Diferenţa esenţială faţă de cele discutate anterior provine din faptul că
semnalul de imagine este un semnal bidimensional şi aplicarea imediată a relaţiilor (7.24)
nu este posibilă. Există, desigur, posibilitatea de a rescrie ecuaţiile modelului AR şi
ecuaţiile Yule-Walker pentru cazul unui semnal cu suport bidimensional dar, cel mai
simplu (din punctul de vedere al implementării) este de a transforma (local) semnalul
de imagine ı̂ntr-un semnal unidimensional. Această transformare este echivalentă cu a
introduce o ordonare a valorilor din imagine, pentru fiecare poziţie (pixel) definindu-se
un “trecut” şi un “viitor” (aceste nume fiind asociate prin analogie cu suportul temporal
al semnalului unidimensional), adică poziţiile din suportul spaţial al imaginii ce sunt
considerate anterioare, şi respectiv ulterioare poziţiei curente. De fapt, această ordonare
nu face altceva decât să precizeze modul de baleiere a regiunii R din imagine ı̂n care se
face analiza; dacă baleierea este uzuală (pe linii de la stânga la dreapta şi de sus ı̂n jos),
structura de pixeli predecesori şi respectiv de pixeli următori ai unui pixel este prezentată
ı̂n figura 7.7.
7.3.2 Modele fractale
Noţiunea de mulţime fractală (şi conceptul asociat de geometrie fractală) oferă cadrul ma-
tematic pentru studiul a numeroase forme complexe şi neregulate ce apar ı̂n natură. Man-
delbrot [37] a demonstrat că multe suprafeţe fractale sunt generalizări ale mişcării brow-
niene (şi deci procese statistice) şi deci rezultă ca un caz limită al proceselor ce modifică
151
forma local, ı̂n mod aleator. Pentland [45] a arătat apoi că majoritatea suprafeţelor
naturale sunt fractali spaţiali izotropi şi că imaginile vizuale de intensitate ale acestor
suprafeţe sunt de asemenea fractali. Rezultă astfel posibilitatea de a caracteriza o textură
prin atributele sale de geometrie fractală [45], [12].
Caracteristica fundamentală a unui fractal (considerat ca o mulţime mărginită din spaţiul
n-dimensional Rn ) este autosimilaritatea. O mulţime A se numeşte autosimilară dacă
poate fi reprezentată prin reuniunea a N copii ale ei ı̂nsăşi, distincte (eventual suprapuse)
şi scalate omogen cu un factor r . Dimensiunea fractală a mulţimii A (numită uneori
şi dimensiune de similaritate), D, este definită de raportul logaritmilor numărului de
submulţimi şi a factorului de scală:
log N
D=− sau, echivalent, N rD = 1. (7.25)
log r
Această caracteristică de compunere/descompunere a unui fractal poate fi exemplificată

evident prin fractali generaţi ı̂n mod artificial, precum curba Koch (“fulgul de zăpadă”
Koch) sau triunghiul Sierpinski, prezentate ı̂n figura 7.8. Curba Koch se obţine prin
transformarea unui segment de dreaptă ı̂ntr-o linie frântă prin ı̂nlocuirea treimii sale
centrale cu două segmente de dreaptă ce sunt laturile triunghiului echilateral construit
având treimea centrală lipsă ca bază, procedura repetându-se pentru fiecare segment
de dreaptă nou construit. Triunghiul Sierpinski se obţine prin decuparea dintr-o placă
triunghiulară plană a triunghiului determinat de centrele laturilor, procedura repetându-
se pentru fiecare triunghi nou rezultat.
Dimensiunea fractală a unei mulţimi autosimilare este ı̂ntotdeauna diferită de dimensiunea
sa topologică (1 ı̂n cazul curbei Koch sau 2 ı̂n cazul triunghiului Sierpinski). Suprafeţele
fractale naturale nu prezintă ı̂n general această autosimilaritate simplă, deterministă, ci
sunt caracterizate de o autosimilaritate statistică, păţile scalate fiind similare mulţimii A
ı̂n sens statistic.
Deşi definiţia dimensiunii fractale este simplă şi imediată, ı̂n practică este adesea dificilă
estimarea acesteia ı̂n mod direct, folosindu-se de cele mai multe ori o aproximare numită
“box dimension”, obţinută printr-un algoritm (numit “box counting”) ce copiază pro-
cedeul de măsurare a unei dimensiuni cu o unitate de măsură de dimensiune fixă, impusă.
Esenţa unei asemenea măsurători este de a stabili de câte ori elementul de măsură este
inclus (fără suprapuneri) ı̂n mulţimea ce se măsoară, sau, echivalent, de câte elemente
este nevoie pentru a acoperi complet mulţimea de măsurat. Să presupunem că mulţimea
iniţială 3 A ⊆ Rn este acoperită cu un hiper-paralelipiped n-dimensional a cărui dimensi-
une maximă este Kmax . Deci, pentru o unitate de măsură de dimensiune Kmax , numărul
de cutii este 1. Dacă se foloseşte o unitate de măsură mai mică (deci mai precisă), de
dimensiune K (care este o fracţiune r din Kmax , K = rKmax ), vor fi necesare N (K) unităţi
(sau cutii) pentru acoperirea mulţimii A. Dar, dacă A este un fractal şi are proprietatea
de autosimilaritate, legătura dintre factorul de scală şi numărul de elemente de măsură
necesare pentru acoperire este stabilit de dimensiunea fractală D prin relaţia (7.25), cu
N = N (K). Atunci, r se cunoaşte (ca alegere a factorului de scalare a unităţii de măsură
K), iar N (K) se măsoară (prin numărare, de unde provine şi denumirea algoritmului de
3
În cazul unei imagini cu nivele de gri, mulţimea A va fi o mulţime ı̂n spaţiul tridimensional (două
coordonate spaţiale şi a treia coordonată nivelul de gri), formată din puncte de coordonate discrete.
152
a) b)
Figura 7.8: Exemple de construire a unor fractali ı̂n plan: a) curba Koch (N = 4, r = 1/3,
D = 1.262); b) Triunghiul Sierpinski (N = 3, r = 1/2, D = 1.585).
numărare a cutiilor).
log N (L) = −D log r = D log Kmax − D log K. (7.26)
Calculând valoarea N (K) pentru mai multe valori ale lui K, dimensiunea fractală căutată
D poate fi determinată ca panta aproximării liniare optimale a lui log K ı̂n funcţie de
log N (K). Modul cel mai simplu de a estima D este deci de a diviza spaţiul n-dimensional
ı̂ntr-o reţea de hiper-paralelipipede de dimensiune maximă K şi de a determina numărul
de asemenea hiper-paralelipipede nevide (care conţin deci puncte din mulţimea A).
Varianta de algoritm prezentată anterior este extrem de simplă şi de la ea se poate dezvolta
o variantă de algoritm mai precis. Să notăm cu PK (i) probabilitatea de a avea i puncte din
mulţimea A ı̂ntr-un hiper-paralelipiped de dimensiune maximă K, centrat ı̂ntr-un punct
oarecare al spaţiului. Pentru o dimensiune K fixată, probabilităţile PK (i) corespund unui
153
câmp complet de evenimente, drept pentru care avem:
K 3
X
PK (i) = 1. (7.27)
i=1
Dacă ı̂ntreaga mulţime A (care ı̂n cazul texturilor corespunde ı̂ntregii imagini cu nivele
de gri având N pixeli) este acoperită cu hiper-paralelipipede de dimensiune maximă
K, atunci numărul de hiper-paralelipipede ce conţin ı̂n interior câte i puncte este N/i.
Numărul mediu de hiper-paralelipipede necesare pentru acoperirea imaginii va fi atunci:
K3 K 3
X N X 1
N (K) = PK (i) = N PK (i) ∼
= K −D (7.28)
i=1
i i=1
i
Folosind acest mod de calcul, pentru o imagine de L × C pixeli reprezentaţi pe M nivele

de gri, pseudocodul corespunzător acestui algoritm de determinare a dimensiunii fractale
este dat ı̂n tabelul 7.1.
pentru toate dimensiunile K considerate

pentru toate valorile i = 1, . . . K 3
PK (i) = 0
pentru toate poziţiile din suportul imaginii (l, c)

centrează cubul de latură K ı̂n punctul (l, c, f (l, c))
numără punctele din R3 situate ı̂n interiorul cubului, i
actualizează PK (i) = PK (i) + 1/ ((L − Kmax )(C − Kmax ))

K3
P
N (K) = PK (i)/i
i=1
estimează D din panta aproximării liniare a lui log N (K) ı̂n funcţie de log K
Tabela 7.1: Pseudocodul corespunzator algoritmului de determinare a dimensiunii fractale
a unei texturi cu nivele de gri prin metoda “cutiilor”.
Numai dimensiunea fractală D este de obicei insuficientă pentru caracterizarea eficientă a

unei texturi [45], ı̂ntrucât există texturi ce sunt vizual diferite, deşi au aceeaşi dimensiune
fractală. Parametrul de lacunaritate a fost introdus pentru a caracteriza măsura ı̂n care
textura (sau mulţimea fractală) este densă sau rară. Pentru modelul prezentat anterior de
caracterizare a fractalilor prin acoperirea cu hiper-paralelipipede (cutii), lacunaritatea Λ
se poate defini ca pătratul raportului dintre dispersia şi media variabilei aleatoare discrete
“număr de puncte ı̂n interiorul cutiei de dimensiune K”, caracterizată de probabilităţile
154
PK (i).
µ ¶2
σ
Λ= , cu (7.29)
µ
K3
X
µ= iPK (i),
i=1
K3
X
2
σ = i2 PK (i) − µ2 .
i=1
Pentru anumite clase particulare de fractali, dimensiunea fractală D şi dimensiunea

topologică E sunt legate printr-un parametru numit coeficient Hurst, H, definit de
H = E + 1 − D [45] (deci ı̂n cazul unei texturi cu nivele de gri modelată printr-o mulţime
fractală E = 3 şi H = 4 − D). Coeficientul Hurst măsoară scăderea puterii semnalului cu
frecvenţa, ı̂n spectrul Fourier de putere, presupunând un spectru cu simetrie circulară şi
cădere exponenţială. Astfel:
F(R)(f, θ) ' f −2H . (7.30)
În practică, estimarea dimensiunii fractale pe baza ecuaţiei (7.30) este simplă: spectrul
Fourier de energie al regiunii R considerate este reprezentat ı̂n coordonate polare (f, θ)
şi este măsurată variaţia energiei medii (mediată după un număr suficient de mare de
direcţii θ convenabil alese) cu frecvenţa f . Panta dreptei de aproximare a logaritmului
energiei după logaritmul frecvenţei polare este un estimat al dublului valorii coeficientului
Hurst.
log E
log f
a) b)
Figura 7.9: a) Spectrul de energie Fourier al texturii reprezentate ı̂n figura 7.1 a); b)
reprezentarea la scară dublu logaritmică a energiei ı̂n funcţie de frecvenţa polară (linie
continuă) şi dreapta de aproximarea a acesteia (linie ı̂ntreruptă). Coeficientul Hurst este
H = 1.465, iar dimensiunea fractală este D = 2.535.
155
7.4 Concluzii
Tehnicile de descriere a texturilor ce au fost prezentate ı̂n acest capitol se bazează ı̂n
cea mai mare parte pe caracterizarea statistică. Fundamentul metodelor statistice este
extragerea din procesul studiat a unui număr suficient de mare de valori astfel ca să se
realizeze un eşantion statistic semnificativ pentru fenomenul studiat. Aceasta ı̂nseamnă
deci că există o limită inferioară a numărului de pixeli din regiunea R caracterizată, sub
care mărimile statistice nu mai sunt credibile (sau de ı̂ncredere). Aceeaşi problemă apare
şi ı̂n cazul descrierii texturilor ı̂n domeniul spectral. În aceste condiţii, segmentarea bazată
pe caracterizarea fiecărui pixel dintr-o imagine printr-un vector de trăsături deduse din
parametri statistici estimaţi ı̂ntr-o vecinătate a pixelului, nu poate delimita corect zonele
situate la marginea regiunilor cu texturi diferite. De-a lundul acestor frontiere apar zone
de incertitudine, a căror grosime este determinată de jumătatea regiunii de analiză R.
De cele mai multe ori, caracterizările statistice sau prin modele nu sunt suficient de efi-
ciente din punctul de vedere al complexităţii de calcul, preferându-se descrierea texturilor
ı̂n domeniul spectral, prin bancuri de filtre liniare.
156

09 cartePAI Texturi

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

09 cartePAI Texturi

Încărcat de

Drepturi de autor:

Formate disponibile

Capitolul 7

Figura 7.1: Exemple de texturi: a) ţesătură de lână; b) ţesătură de bumbac; c) jaluzele

de o frecvenţă principală de repetiţie.

7.1.1 Statistici de ordinul unu

Caracterizarea texturilor prin momente nu este suficient de precisă; au fost sintetizate

7.1.2 Statistici de ordinul doi

Mt (a, b) = Card {(x, x + t) ∈ R × R | f (x) = a şi f (x + t) = b} /Card {(x, x + t) ∈ R × R} .

Pentru o imagine cu M nivele de gri, matricea de coocurenţă va fi o matrice pătrată de

Cum matricea de coocurenţă este o densitate de probabilitate de ordinul doi, verificând ca

Matricea de izosegmente reprezintă funcţia de densitate de probabilitate a setului de

Semnificaţia acestor parametri este de proporţie a izosegmentelor lungi, cu valoare impor-

7.2 Caracterizarea ı̂n domeniul spectral

Caracterizarea texturilor ı̂n domeniul spectral se bazează pe proprietatea transformărilor

7.3 Modelarea texturilor

7.3.1 Modele statistice

7.3.2 Modele fractale

Această caracteristică de compunere/descompunere a unui fractal poate fi exemplificată

log N (L) = −D log r = D log Kmax − D log K. (7.26)

Folosind acest mod de calcul, pentru o imagine de L × C pixeli reprezentaţi pe M nivele

pentru toate dimensiunile K considerate

pentru toate poziţiile din suportul imaginii (l, c)

pentru toate dimensiunile K considerate

Numai dimensiunea fractală D este de obicei insuficientă pentru caracterizarea eficientă a

Pentru anumite clase particulare de fractali, dimensiunea fractală D şi dimensiunea

S-ar putea să vă placă și