Documente Academic
Documente Profesional
Documente Cultură
Lab 4 Ia Mardari Ion Cr-182
Lab 4 Ia Mardari Ion Cr-182
clasificarea de imagini
Introducere
În zilele noastre, sistemele de supraveghere contribuie în mod vital la
securitatea publică. Dezvoltarea pronunțată a domeniului inteligenței
artificiale, în special inteligența artificială pentru procesarea de imagini
(Baidyk et al., 2016) (vezi Figura 1 de mai jos oferită de cei de la G2Crowd),
a facilitat analizarea videoclipurilor și a imaginilor preluate de camerele de
supraveghere (Kardas și Cicekli, 2017) și (Zhang et al., 2017).
O primă problemă care apare în mai multe studii recente a fost problema
detectării evenimentelor în supravegherea video (Cosar et al., 2017), care
necesită abilitatea de a identifica și localiza modelele spațio-temporale
specifice. În lucrarea (Guo et al., 2008) este tratată această problemă și
sunt propuse soluții pe baza monitorizării unei persoane și a acțiunilor
întreprinse de aceasta (vezi Figura 2).
O altă problemă actuală din analiza imaginilor video, care stârnește un mare
interes în cercetare, este problema de re-identificare a unei persoanei
(Ahmed et al., 2015). Re-identificarea unei persoane este o problemă
practică prin care se dorește identificarea aceleiași persoane în mai multe
imagini, care au fost realizate fie cu mai multe camere, fie cu o singură
cameră (vezi Figura 3). Re-identificarea este o funcție vitală pentru
sistemele de supraveghere, precum și pentru sistemele de interacțiune om-
calculator, pentru a facilita căutarea identității unei persoane în cantități
mari de videoclipuri și imagini (vezi Figura 4).
În mai multe situații, identificarea rasei unei persoane poate fi utilă pentru
sistemele de supraveghere. Identificarea rasei unei persoane se face în
primul rând pe baza procesării feței (Fu et al., 2014) (vezi Figura 5), dar se
folosesc și alte caracteristici pentru a îmbunătăți calitatea unui astfel de
sistem: caracteristici ce țin de aspect, regiuni discriminatorii locale,
combinarea informațiilor 2D și 3D, caracterisitic ce țin de mers, vorbit sau
gestică, etc. (vezi Figura 6).
În ultimii ani, mulți cercetători au trecut de la recunoașterea rasei pentru
grupurile de rasă populare, cum ar fi afro-americani, caucazieni și asiatici, la
grupurile sub-etnice cum ar fi coreenii, japonezii, chinezii și vietnamezii
(Bastanfard et al., 2007), (Gao et al., 2008), (Roh și Lee, 2007) și (Vo et al.,
2018).
O altă problemă în analiza video este urmărirea unei ținte vizuale, care are o
gamă largă de aplicații, cum ar fi în navigația vehiculelor, în realitatea
augmentată, în supravegherea video, etc. În Figura 12 este un exemplu din
aplicația celor de la Stanford, Online Multi-Object Tracking (MOT).
Transferul
învățării
VGG este un model de rețea neuronală convoluțională propus în (Simonyan
și Zisserman, 2015), care atinge 92,7% precizie în ImageNet (Deng et al.,
2009), un set de date de peste 14 milioane de imagini aparținând a 1000 de
clase. Modelul VGG instruit are două forme diferite – VGG-16 și VGG-19 –
structura și parametrii acestora fiind disponibili gratuit online (în Figura 14
avem macro-arhitectura lui VGG-16). În (Hoo-Chang et al., 2016), autorii au
studiat aplicarea modelelor VGG precomprimate la problemele de detectare
asistate de calculator și au obținut rezultate promițătoare.