Documente Academic
Documente Profesional
Documente Cultură
Segmentarea zonelor inundate din imagini luate de UAV, utilizând matricea de co-
ocurență
O metodă propusă pentru detectarea zonelor acoperite de inundații din imagini
achiziționate de un UAV consideră trăsături extrase din matricea de co-ocurență și dezvoltarea
unui algoritm de grupare k-means. Algoritmul k-means este o metodă de învățare nesupervizată,
care poate fi utilizată pentru clasificarea datelor în diferite grupări denumite clustere [174],
[175]. Parametrii de intrare pentru algoritmul k-means sunt datele care trebuie grupate și
numărul de clustere la care va fi asignat fiecare element din setul de date de intrare.
Metodologia constă în două etape:
➢ Extragerea energiei din matricea de co-ocurență asociată imaginii analizate.
➢ Segmentarea zonelor inundate din imaginea analizată folosind algoritmul k-
means.
Pentru a detecta și localiza zonele inundate, imaginea obținută cu ajutorul UAV-ului
este parcursă începând din colțul din stânga sus al imaginii folosind un pas de 50 pixeli pentru
deplasarea pe linie și pe coloană. Se extrag sub-imagini nesuprapuse cu dimensiunea de 50 ×
50 pixeli. Pentru fiecare sub-imagine extrasă, se realizează conversia în tonuri de gri, după care
se calculează matricea de co-ocurență pe cele opt direcții principale (00, 450, 900,…,3600)
folosind o distanță egală cu 5 pixeli, aleasă experimental. Din matricea de co-ocurență au fost
extrase și testate patru caracteristici: contrastul, corelația, energia și omogenitatea. Pe baza
rezultatelor experimentale, s-a stabilit că energia oferă informații relevante pentru clasificare.
După calcularea energiei pentru toate sub-imaginile s-a definit o matrice a tuturor
valorilor determinate, MEng, care stochează valoarea energiei pentru fiecare sub-imagine
extrasă. Mai departe, matricea MEng este folosită ca parametru de intrare pentru algoritmul de
grupare k-means, cu scopul de a grupa fiecare element din MEng.
În etapa următoare, s-a propus utilizarea a trei clustere astfel încât fiecare element din
MEng să fie atribuit unuia dintre cele trei clustere. Au fost propuse trei clustere deoarece prin
utilizarea unui număr mai mare, s-ar fi realizat o divizare a zonelor inundate.
În urma aplicării algoritmului k-means pe valorile matricei MEng și stabilirii unui număr
de trei clustere ca parametri de intrare, rezultatele obținute sunt salvate în matricea MCluster care
are aceeași dimensiune ca MEng, dar conține elemente având valorile 1, 2 și 3 ce corespund
numărului clusterului asignat pentru fiecare element din matricea MEng.
În etapa următoare a algoritmului, se generează o versiune a imaginii analizate pentru
fiecare cluster prin evidențierea sub-imaginilor ce au fost asignate clusterului respectiv. Astfel,
pentru fiecare cluster definit, se parcurge imaginea analizată și se extrag sub-imagini de aceeași
dimensiune 50 × 50 pixeli folosind același pas egal cu 50 pentru deplasarea pe linie și coloană.
Fiecare sub-imagine extrasă este evidențiată (cu negru în cazul algoritmului propus) în imaginea
clusterului (Cluster 1, Cluster 2 sau Cluster 3). În urma parcurgerii în totalitate a imaginii
analizate, imaginea rezultată pentru fiecare cluster este reprezentată în figura 1.
DSC04370 Cluster 1
Cluster 2
MEng Cluster 3
Ulterior, pe fiecare imagine rezultată s-a determinat procentul de inundații (tabelul 1),
iar pentru fiecare imagine testată au fost calculați parametrii de performanță (precizia și
acuratețea) [192].
Tabelul 1. Determinarea procentului de inundații din imaginile testate și a parametrilor de performanță
Imaginea testată Procent inundații Precizie Acuratețe
DSC04359 41% 99.88% 95.7%
DSC04376 50% 95.59% 94.58%
DSC04529 8% 97.37% 95.26%
DSC04881 6% 94.32% 95.18%
DSC04412 45% 82.92% 98.44%
DSC05189 60% 92.76% 91.98%
Soluția propusă este utilă deoarece se reduce foarte mult timpul de detectare a zonelor
inundate, timpul de procesare pentru detectarea zonelor inundate a fost de 40 de secunde pe un
calculator cu procesor i5-3317U, 1,70 GHz și 6 GB de memorie RAM.
Algoritmul a detectat zonele acoperite în totalitate de inundații. Zonele în care apar apă
cu vegetație sau apă cu pământ nu au fost detectate deoarece pentru determinarea valorii
energiei au fost utilizate numai sub-imagini acoperite în întregime de inundații. Rezultatele
experimentale obținute demonstrează că UAV-ul este o platformă ideală pentru monitorizarea
inundațiilor.
Descompunerea sub-imaginii pe
Descompunerea sub-imaginilor componente de culoare (R,G si H)
pe componente de culoare
𝑛
2
𝑑(𝑉𝑇 , 𝑉𝐶𝐼 ) = √∑[𝑉𝑇 (𝑖) − 𝑉𝐶𝐼 (𝑖)] (1)
𝑖=1
𝑛
2
𝑑(𝑉𝑇 , 𝑉𝐶𝑉 ) = √∑[𝑉𝑇 (𝑖) − 𝑉𝐶𝑉 (𝑖)] (2)
𝑖=1
𝑛
2
𝑑(𝑉𝑇 , 𝑉𝐶𝐶 ) = √∑[𝑉𝑇 (𝑖) − 𝑉𝐶𝐶 (𝑖)] (3)
𝑖=1
în care:
➢ 𝑉𝐶𝐼 este vectorul histogramă medie pentru clasa „inundații”;
➢ 𝑉𝐶𝑉 reprezintă vectorul histogramă medie pentru clasa „vegetație”;
➢ 𝑉𝐶𝐶 este vectorul histogramă medie pentru clasa „clădiri”.
În final, procesul de decizie este realizat pe baza condiției ca sub-imaginea testată să fie
asignată la o anumită clasă pentru cel puțin două componente de culoare. Dacă această condiție
este îndeplinită, sub-imaginea testată aparține acelei clase.
Figura 4. Imagini și sub-imagini selectate pentru calculul vectorilor histogramă LBP pentru cele
3 clase
În urma aplicării algoritmului propus, histogramele medii rezultate pe fiecare
componentă de culoare, pentru fiecare clasă, sunt prezentate în figura 5. Histogramele astfel
determinate sunt utilizate ca descriptori de texturi pentru cele trei clase.
R
H
Figura 5. Histogramele LBP medii obținute pe canalele R, G, H pentru cele trei clase
După cum se poate observa, histogramele pentru clasa „inundații”, pentru toate
componentele, evidențiază faptul că numărul de coduri LBP cu valori mai mari de 200 este mult
mai mare decât numărul de coduri LBP cu valori mai mici de 200.
Pe altă parte, histogramele claselor „vegetație” și „clădiri” conțin un număr mai mare
de coduri LBP cu valori mai mici de 200. În urma acestui lucru, există o diferență considerabilă
între clasa „inundații” și clasele „vegetație” și „clădiri”. După cum se poate observa,
histogramele LBP rezultate oferă o bună discriminare în ceea ce privește informațiile legate de
modele.
Tabelul 2 prezintă o selecție din rezultatele obținute cu ajutorul algoritmului propus,
în care sunt afișate, distanțele dintre vectorul histogramă al sub-imaginii testate și vectorii
histogramă medii ale claselor definite. Pentru că distanțele obținute au valori între 1000 și
50000, tabelul 2 conține valorile distanțelor normalizate (împărțite la 1000), cu scopul de a
simplifica prezentarea.
Citește sub-imaginea
Caracteristicile reprezentative propuse pentru o clasă sunt valorile medii pentru vectorul
histogramă HHOG și pentru intensitatea medie IG calculate pe baza sub-imaginilor ce aparțin
clasei respective. Cu scopul de a obține aceste caracteristici reprezentative, se definește
matricea CDATA_clasă (5) ce conține n linii reprezentând numărul de sub-imagini utilizate în etapa
de învățare și 10 coloane în care primele 9 coloane reprezintă cele 9 elemente ale vectorului
histogramă HHOG pentru fiecare sub-imagine și ultima coloană este valoarea intensității medii
IG. În (5), s1 reprezintă prima sub-imagine utilizată în etapa de învățare pentru clasa respectivă
și sn ultima sub-imagine, iar 𝑐𝑖 (𝑠𝑗 ), i=1,...,9, j=1,...,n semnifică elementul i din vectorul
histogramă HHOG al sub-imagini sj în timp ce 𝐼𝐺 (𝑠𝑗 ), j=1,...,n reprezintă valoarea intensității
medii pentru sub-imaginea sj.
[𝑐1 (𝑠1 ), … , 𝑐9 (𝑠1 ), 𝐼𝐺 (𝑠1 )]
𝐶𝐷𝑎𝑡𝑎_𝑐𝑙𝑎𝑠ă = [ ⋮ ⋮ ⋮ ] (5)
[𝑐1 (𝑠𝑛 ), … , 𝑐9 (𝑠𝑛 ), 𝐼𝐺 (𝑠𝑛 )]
După definirea matricei CDATA_clasă, în (6) și (7) sunt prezentate formulele de calcul
pentru caracteristicile reprezentative HHOG_clasă și IG_clasă, pentru o clasă cu un număr de n
sub-imagini utilizate pentru învățare.
∑𝑛𝑗=1 𝐶𝐷𝑎𝑡𝑎_𝑐𝑙𝑎𝑠ă (1: 9, 𝑗)
𝐻𝐻𝑂𝐺_𝑐𝑙𝑎𝑠ă = , 𝑗 = 1, … , 𝑛 (6)
𝑛
În figura 8 sunt prezentați pașii principali din cadrul etapei de învățare pentru o clasă
cu n imagini reprezentative.
Citire sub-imagine 𝑖
𝑖≤𝑛 DA
NU
După aplicarea algoritmului de mai sus pe cele două clase, rezultatul etapei de învățare
este:
➢ HHOG_inundații și IG_inundații pentru clasa inundații;
➢ HHOG_non_inundații și IG_non_inundații pentru clasa non-inundații;
➢ HHOG_vegetatie și IG_vegetație pentru clasa vegetație;
➢ HHOG_non_vegetatie și IG non_vegetație pentru clasa non-vegetație.
Pentru a stabili tipurile de regiuni dintr-o imagine testată, imaginea este parcursă cu o
fereastră glisantă, cu pasul de 30, pentru a extrage sub-imaginile care compun imaginea
respectivă. Algoritmul parcurge toate imaginea din colțul din stânga sus și o împarte în sub-
imagini de dimensiunea 128 × 128 pixeli. Pentru fiecare sub-imagine obținută, sunt calculate
caracteristicile HHOG și IG.
În final, pentru a determina apartenența sub-imaginii extrase la una din clasele
predefinite în etapa de învățare, s-a determinat distanța euclidiană între caracteristicile fiecărei
sub-imagini (HHOG , IG) (8) și caracteristicile fiecărei clase (𝐻𝐻𝑂𝐺 𝑐𝑙𝑎𝑠ă , 𝐼𝐺 𝑐𝑙𝑎𝑠ă ) (9) și a fost
identificat cazul în care distanța euclidiană a avut valoarea minimă.
9
2
𝑑𝐸 (𝐻𝐻𝑂𝐺 , 𝐻𝐻𝑂𝐺 𝑐𝑙𝑎𝑠ă ) = √∑[𝐻𝐻𝑂𝐺 (𝑖) − 𝐻𝐻𝑂𝐺 𝑐𝑙𝑎𝑠ă (𝑖)]
𝑖=1
(8)
În cele din urmă, după finalizarea celor două sarcini de testare pentru detectarea zonelor
cu inundații și detectarea zonelor cu vegetație, rezultatele pot fi comparate pentru a determina
sub-imaginile comune care au fost detectate ca aparținând ambelor clase. Identificând aceste
sub-imagini, se determină practic granițele specifice între zonele cu inundații și zonele cu
vegetație.
DSC04359 DSC04359_r
DSC04364 DSC04364_r
DSC04370 DSC04370_r
DSC04412 DSC04412_r
Figura 10. Rezultate obținute din afara localităților
În figura 11 sunt prezentate o serie de rezultate obținute pentru zone aflate în interiorul
localităților. Așa cum se poate observa din imaginile testate, algoritmul a oferit o delimitare
bună a inundațiilor și a vegetației în ambele tipuri de imagini.
În ceea ce privește zonele de delimitare, algoritmul indică o limitare în detectarea
pixelilor de inundații din zonele în care inundația se retrage, iar nivelul apei este mic. Pe de altă
parte, în zonele din localități, zonele inundate și cele acoperite de vegetație se disting bine față
de restul zonelor.
Imaginea testată Imaginea rezultată
DSC05189 DSC05189_r
DSC05192 DSC05192_r
DSC05349 DSC05349_r
DSC04529 DSC04529_r
Figura 11. Rezultate obținute pe imagini cu zone din interiorul localităților
Partea finală a algoritmului constă în determinarea valorii procentuale a zonelor
detectate din imaginile testate. În acest sens, în tabelul 5 sunt prezentate aceste valori, pentru
fiecare imagine testată. Fiecare tip de zonă, inclusiv părțile comune dintre zonele de inundații
și vegetație și zonele din imagine care nu au fost atribuite niciuneia dintre aceste clase sunt
estimate prin numărarea tuturor pixelilor atribuiți fiecărei clase și calcularea unui procent pe
baza numărului total de pixeli din imaginile testate.
Deoarece există sub-imagini amestecate (cu apă și, de asemenea, cu vegetație), s-a
definit o nouă clasă (părțile mixte) ca logică ȘI între deciziile binare ale clasificatorilor. Pentru
fiecare imagine s-a calculat procentul părților inundate, cel al zonelor acoperite de vegetație și
cel al părților comune.
Tabelul 5. Determinarea procentelor zonelor detectate
Imaginea Părți mixte Alte zone
Zona afectată de Zona acoperită de
testată
inundații vegetație
(c)
DSC04359 38.37% 58.90% 1.84% 4.57%
DSC04364 20.28% 77.43% 1.69% 3.98%
DSC04370 33.94% 60.22% 1.64% 7.49%
DSC04529 6.03% 79.28% 4.55% 26.24%
DSC04412 29.54% 65.06% 3.55% 8.95%
DSC05189 32.38% 43.67% 4.24% 28.19%
DSC05192 17.78% 58.60% 4.17% 27.79%
DSC05349 41.02% 39.33% 2.42% 22.09%
Conform soluției prezentate, suprafața totală acoperită de inundații din toate imaginile
testate se obține cu o precizie medie de 92,9% și o acuratețe medie de 95,61%, iar pentru zonele
acoperite de vegetație precizia medie obținută este de 59,92% iar acuratețea medie este 75,27%
din cauza faptului că operatorul HOG nu diferențiază zonele acoperite de vegetație de zonele
cu pământ formate în urma retragerii inundațiilor.