Sunteți pe pagina 1din 41

Universitatea Babes , -Bolyai Cluj-Napoca Facultatea de Matematic s , i Informatic

Metode robuste de detect , ie a obiectelor cu aplicat , ii n detect , ia facial


Rezumatul tezei de doctorat

Conductor s , tiint , ic: Prof. univ. dr. Horia F. Pop

Doctorand: Lefkovits Szidnia

2012

Cuprinsul tezei de doctorat

1 Introducere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Publicat , ii Contribut . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . , ii originale Organizarea tezei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Sisteme de detect , ie. Contextul general 3 Sistem de detect , ie bazat pe aspect global 3.1 AdaBoost . . . . . . . . . . . . . . . . . . 3.2 Funct . . . . . , ii Haar ca clasicatori slabi 3.2.1 Clasicatori slabi . . . . . . . . . . 3.3 Clasicatorul cascad . . . . . . . . . . . . 3.4 Crearea clasicatorului propriu . . . . . .

1 3 5 6 8 13 13 17 19 20 23

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

4 Sistem de detect , ie bazat pe aspect local 4.1 Modelul de obiect deformabil . . . . . . . . 4.1.1 Denirea modelului . . . . . . . . . . 4.1.2 Determinarea parametrilor modelului 4.1.3 Algoritmul de detect . . . . . . . . , ie

33 . . . . . . . . . . . . . . . . . . . 34 . . . . . . . . . . . . . . . . . . . 34 . . . . . . . . . . . . . . . . . . . 36 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 50 53 61 61 74 80 88 122 132

4.2

. . . . . . . . . . . . 4.1.4 Transformata de distant , . . . . . . . . . . . . . . . . . . . 4.1.4.1 Algoritmul propus . . . . . . . . . . . . . . . . . Descriptori locali cu ltre Gabor . . . . . . . . . . . . . . . . . . . 4.2.1 Filtre 2D Gabor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1.1 Construct , ia unui jet idealizat 4.2.2 Selectarea caracteristicilor cu algoritmul Gentle AdaBoost 4.2.3 Crearea experimental a descriptorului local . . . . . . . . 4.2.4 Performant . . . . . . . . . . . , a descriptorului local creat

5 Concluzii s , i direct , ii de cercetare

Anexe 134 A Prelucrarea imaginilor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 A.1 Egalizarea de histogram . . . . . . . . . . . . . . . . . . . . . . . . . . 134 A.2 Normalizarea imaginii . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 i

CUPRINSUL TEZEI DE DOCTORAT

B C D

Puncte de interes LoG laplacian de gaussian . . . . . . . . . . . . . . . . . . 137 Algoritmul AdaBoost Analiza erorii s . . . . . . . . . 139 , i alegerea parametrilor Transformata Fourier a ltrelor 2D Gabor . . . . . . . . . . . . . . . . . . . . 144 147

Bibliograe

ii

Cuprinsul rezumatului

Introducere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Publicat , ii Contribut . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . , ii originale Organizarea tezei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sistem de detect , ie bazat pe aspect global Sistem de detect , ie bazat pe aspect local Concluzii s , i direct , ii de cercetare Bibliograe

1 2 4 5 7 12 27 29

iii

Mult , umiri
Adresez sincere mult , umiri domnului prof. univ. dr. Horia F. Pop, conductorul s , tiint , ic al acestei teze, pentru ajutorul oferit pe tot parcursul acestui demers s, tiint , ic. Mult , umesc, de asemenea, print , ilor mei pentru ajutorul pe care mi l-au oferit. Pasiunea pentru cercetare, ncurajrile s , i multe idei au venit din partea tatlui meu, iar mama mea m-a sust , inut moral pe tot parcursul elaborrii acestei teze.

iv

Introducere
Sistemul vizual uman are capacitatea extraordinar de a recunoas, te o varietate extrem de mare de obiecte sau categorii de obiecte din informat , ia vizual bidimensional sau tridimensional. Rezolvarea acestei sarcini a detect , iei s , i a recunoas , terii fr efort se datoreaz mai ales procesrii paralele extrem de rapide, a aptitudinii de a se dezvolta, a nvt, rii din experient , s , i a structurii except , ionale al creierului uman. Scopul principal al vederii articiale nu este nt , elegerea percept , iei umane, ci modelarea s , i crearea sistemelor automate robuste de detect , ie a obiectelor. Vederea articial este un subdomeniu al detect , iei generale de obiect, care prelucreaz imagini bidimensionale ca o proiect , ie a spat , iului tridimensional. Cercetrile n acest domeniu nu au dus la crearea unui sistem general utilizabil pentru solut , ionarea tuturor aplicat , iilor impuse de practic. Fiecare din sistemele existente este creat pentru un scop bine determinat s, i lucreaz n anumite condit , ii date. Realizarea unui sistem de detect , ie automat este o provocare pentru cercettorii din domeniu. Principala dicultate const n varietatea extrem de mare n care apar obiectele. Aceast varietate este indus de mult , imea larg a obiectelor, iar ecare obiect la rndul su poate s apar ntr-o innitate de ipostaze: de dimensiune, form, culoare, pozit, ie, iluminare, umbrire, obturare. De asemenea, formele geometrice prezint ambiguitt, i datorit proiect , iei spat , iului tridimensional n spat , iul bidimensional al imaginilor. Un factor perturbator n imaginea obiectelor este modul de iluminare cu aparit , ia umbrelor s , i a suprafet , elor absorbante sau reectoare de lumin. Dicultatea n detect , ia obiectelor este indus s , i de cantitatea mare de informat , ie cont , inut de o imagine. Un alt aspect nefavorabil const n varietatea de prezentare a aceluias , i obiect ntr-o multitudine de contexte de aparit , ie [35]. ntr-o serie de domenii de activitate detect , ia obiectelor n imaginile bidimensionale joac un rol nsemnat. Cele mai importante aplicat , ii se regsesc n aria medicinei, securitt , ii circulat , iei, securitt , ii sistemelor de acces, sistemelor de identicare s , i autenticare, a industriei cu robot , i inteligent , i, a product , iei cinematograce etc.

Introducere

Publicat , ii
Jurnale ISI Sz. Lefkovits [57] Improvements on Gabor Descriptor Retrieval for Patch Detection Computing and Informatics (ISI IF=0.66, SRI = 0.15) [sub recenzie] ISI Proceedings Sz. Lefkovits [54] Numerical Computation Method of the General Distance Transform KEPT 2011 International Conference Knowledge Engineering Principles and Techniques, Babes ISSN: 2067-1180, pp. 143152, indexed , -Bolyai University, 2011. MathSciNet, ZMath. Sz. Lefkovits [48] Performance Analysis of Face Detection Based on Haar-features Proceedings of the International Conference on Complexity and Intelligence of the Articial and Natural Complex Systems: Medical Applications of the Complex Systems: Biomedical Computing , Petru Maior University, 2008, ISBN: 978-973-7794-76-5, pp.184 192. Jurnale internat , ionale indexate BDI Sz. Lefkovits [58] Novel Gabor Filter Based Patch Descriptor 10th Jubilee International Symposium on Intelligent Systems and Informatics, IEEE Conference , Serbia, 2012 (lista Australian Research Council n clasa C) [acceptat] Sz. Lefkovits [55] Numerical Computation Method of the General Distance Transform Studia Informatica Universitatis Babes , -Bolyai, vol. 56, no. 2, 2011, pp. 6874. indexed MathSciNet, ZMath. Sz. Lefkovits [49] Assessment of Building Classiers for Face Detection Acta Universitatis Sapientiae, Electrical and Mechanical Engineering , no. 1, 2009, ISSN: 2065-5916, pp. 175186, indexed EBCSO Databases, EZB Karlsruhe Institute of Technology Jurnale internat , ionale recunoscute CNCSIS categoria B Sz. Lefkovits [53] Combining Boosted Global- and Part-aspect Face Detectors Scientic Bulletin of the Petru Maior University , vol.8, no. 1, 2011, ISSN: 1841-9267, pp. 3540.

Introducere

Conferint , e internat , ionale Sz. Lefkovits [56] Hybrid Face Detector Based on Boosted Classiers The Eighth Conference of PhD Students in Computer Science , Optimization session, University of Szeged, Hungary, Institute of Informatics, 2012 Best talk of the Session award Sz. Lefkovits [50] Teaching Improvements on Haar-based Classiers International Conference IETM-3, Mathematics and Computer Science section, Petru Maior University 2009, ISSN: 1844-2048, pp. 10501060. Sz. Lefkovits, C. Enchescu [59] Face Detection System Based on Articial Intelligence, International Conference ICELM , Decision Systems, Mathematical Modelling and Statistics section, Petru Maior University, 2008, ISBN: 973-7794-00-10, pp. 112 121 Conferint , e nat , ionale Sz. Lefkovits [52] Classication Mixture for Object Detection Zilele Academice Clujene, 2010, ISSN: 2066-5768, pp. 510

Introducere

Contribut , ii originale
abordarea detect , iei n dou faze: restrngerea domeniului de interes cu un detector rapid bazat pe aspect global urmat de o prelucrare detaliat cu un detector bazat pe aspect local [51] realizarea bazei de date pentru detect , ia bazat pe aspect global (subcapitolul 3.4, [48]) mbuntt , irea algoritmului de creare a clasicatorului cascad, scderea semnicativ a detectrilor false prin selectarea de imagini negativ semnicative (subcapitolul 3.4, [59], [49]) construirea clasicatorului facial propriu s , i determinarea performant , elor acestuia (subcapitolul 3.4, [49], [50]) denirea unui descriptor local bazat pe ltre 2D Gabor (subcapitolul 4.2, [ 56]) analizarea s , i proiectarea teoretic a ltrelor 2D Gabor (subcapitolul 4.2.1.1, [52]) experimentarea s , i evaluarea parametrilor ltrelor 2D Gabor denitorii descriptorului local (subcapitolul 4.2.3, [56]) restrngerea domeniului de valori utile pentru cei 9 parametri ai ltrelor 2D Gabor (subcapitolul 4.2.3, [56]) realizarea sistemului de selectare s , i evaluare a ltrelor caracteristice obiectului (subcapitolul 4.2.3, [58]) crearea, determinarea s , i evaluarea experimental a detectorului local propus (subcapitolul 4.2.3, [58]) elaborarea unui algoritm original pentru evaluarea transformatei generalizate de distant , (subcapitolul 4.1.4.1, [54], [55]) crearea sistemului de detect , ie de obiecte s , i implementarea acestuia cu procesare distribuit multisistem (subcapitolul 4.2.4, [52], [53], [56], [58])

Introducere

Organizarea tezei
1. Introducere. n acest capitol sunt prezentate scopul, sarcina, problematica s, i principalele aplicat , ii ale detect , iei de obiecte. Se continu cu enumerarea publicat , iilor aferente tezei s , i a contribut , iilor originale aduse n lucrare. 2. Sisteme de detect Acest capitol cont , ine aspectele generale s ,i , ie. Contextul general. structura sistemelor de detect , ie a obiectelor. Sunt prezentate, pe scurt, principalele metode s , i sistemele cele mai semnicative din domeniu. Pentru ecare parte a sistemelor de detect , ie sunt amintite tehnicile utilizate. La sfrs , itul capitolului se descrie sistemul de detect , ie propus ce va analizat n detaliu n cursul lucrrii. 3. Sistem de detect n acest capitol prezentm un sistem , ie bazat pe aspect global. bazat pe aspect global. Subcapitolele 3.1, 3.2 s , i 3.3 cont , in succint bazele teoretice. Subcapitolul 3.1 descrie algoritmul AdaBoost elaborat de Y. Freud s, i R. Schapire [32, 78]. n subcapitolul 3.2 este analizat modelul de construire a clasicatorilor slabi din funct, ii Haar, creat de P. Viola s , i M. Jones [92]. Subcapitolul 3.3 prezint ideea lui R. Lienhart et al. [61] de mbuntt , ire a performant , elor sistemului prin clasicatorul cascad. n subcapitolul 3.4 sunt prezentate problemele ascunse ce trebuie solut, ionate pentru a crea un astfel de sistem funct , ional. Aici se descriu metodele de creare ale bazelor de date precum s , i un algoritm propriu cu ajutorul cruia am reus , it s construim clasicatori [48, 59] Acest capitol se ncheie cu performant , e comparabile cu cele ale clasicatorilor existent , i. cu prezentarea experimentelor cu clasicatorul creat [49, 50] s , i concluzioneaz avantajele s ,i dezavantajele unui astfel de sistem, punctnd ctre urmtorul capitol n care se creeaz a doua parte a detectorului. Acest capitol detaliaz aspectele teore4. Sistem de detect , ie bazat pe aspect local. tice s , i practice ce alctuiesc un sistem bazat pe aspectul prt , ilor de obiect. Subcapitolul 4.1 prezint un model de obiect deformabil [28]. n subcapitolul 4.1.3 am detaliat algoritmul de detect , ie s , i am denit tabelul de stare, ceea ce nlesnes , te implementarea efectiv a modelului propus. n subcapitolul 4.1.4 propunem un algoritm propriu [54, 55] pentru evaluarea ecient a transformatei de distant , generalizat care este determinant n cazul evalurii funct , iei de cost al modelului deformabil. Acest algoritm este comparat cu algoritmul nfs, urtoarei minime [70]. Experimentele efectuate scot n evident , avantajele algoritmului propus. Dac nfs , urtoarea minim se poate calcula analitic, atunci timpii de execut , ie ai celor doi algoritmi sunt comparabili, dar dac nfs , urtoarea minim se determin numeric, atunci algoritmul propus este mult mai ecient. 5

Introducere

n subcapitolul 4.2 sunt expuse bazele teoretice ale ltrelor 2D Gabor [ 72]. n subcapitolul 4.2.1.1 propunem o metod de proiectare a ltrelor Gabor bidimensionale [ 52, 56, 58], prin care se reduce domeniul de valori ai celor 9 parametri. Din constrngerile teoretice s, i experimentale spat , iul parametrilor ltrelor s-a redus, dar nu sucient pentru a le utiliza ca descriptori locali. Se impune o alt metod de reducere a numrului ltrelor cu algoritmul Gentle AdaBoost [33]. n subcapitolul 4.2.2 prezentm implementarea acestui algoritm [56, 58]. n subcapitolul 4.2.3, prin utilizarea algoritmului Gentle AdaBoost s, i evaluarea rezultatelor cu validare pe un set de imagini, s-au putut alege ltrele cele mai caracteristice pentru pata de imagine analizat. Experimentele expuse determin inuent, a parametrilor analizat , i. Subcapitolul 4.2.4 descrie performant , ele descriptorului local creat [53, 56, 58]. Rezultatele practice se concentreaz asupra utilizrii acestuia n detect , ia ochiului uman. Avnd n vedere necesitatea de reducere a timpilor de execut , ie, se detaliaz implementarea paralel multisistem a proceselor de nvt , are s , i de detect , ie ale acestui descriptor.

Cuvinte cheie
detect , ie a obiectelor, aspect-global, aspect-local, funct , ii Haar, undine Gabor bidimensionale, analiza n domeniul frecvent , , proiectarea ltrelor, optimizarea parametrilor, baze de date marcate, nvt , are supervizat, AdaBoost, Gentle AdaBoost, generator de fundaluri, clasicator, reducerea detectrilor false, descriptor local, selectarea ltrelor, harta rspunsurilor, transformat de distant , generalizat, implementare paralel.

Sistem de detect , ie bazat pe aspect global


Sistemele bazate pe aspect global prezint obiectele ca o singur entitate indivizibil. n general, procesul de detect , ie foloses , te tehnica piramidei de imagini, adic imaginile sunt redimensionate s , i scanate cu o imagine de dimensiune standard. n acest capitol prezentm un astfel de sistem [48, 49, 50, 53, 59]. Subcapitolele 3.1, 3.2 s , i 3.3 descriu succint bazele teoretice, ce compun sistemul. Subcapitolul 3.1 prezint algoritmul AdaBoost elaborat de Y. Freud s, i R. Schapire [32, 78]. Algoritmul construies , te un clasicator puternic, alegnd dintr-o mult , ime de clasicatori slabi o serie de clasicatori cu pondere bine determinat, adaptat problemei de decizie. n subcapitolul 3.2 este analizat modelul de construire a clasicatorilor slabi din funct, ii Haar. Ideea folosirii funct , iilor dreptunghi n domeniul detect , iei de obiecte apart , ine lui C. Papageorgiu et al. [76]. Utiliznd algoritmul AdaBoost s , i funct , iile Haar ca clasicatori slabi, P. Viola s , i M. Jones [92] creeaz un sistem de detect , ie de obiecte cu performant , e deosebite de funct , ionare n timp real. Subcapitolul 3.3 prezint ideea lui R. Lienhart et al. [ 61] de mbuntt , ire a performant , elor sistemului prin modicarea clasicatorului monolitic ntr-un clasicator cascad. n studiile efectuate pn n momentul de fat , , nu am gsit nicio referint , despre metodologia de creare a clasicatorilor. Cercettorii public numai rezultatele experimentale, fr a divulga baza de date s , i tehnologia utilizat. n subcapitolul 3.4 sunt prezentate problemele ascunse [50], ce trebuie solut , ionate pentru a crea un sistem funct , ional. Aici descriem metodele de creare ale bazelor de date [49] precum s , i un algoritm propriu [48], cu ajutorul cruia am reus , it s construim clasicatori cu performant , e comparabile cu cele ale clasicatorilor existent , i.

Crearea clasicatorului propriu


Experimentele prezentate n continuare sunt executate cu programul Haartraining, parte integrant a colect , iei OpenCV [11]. Ne-am propus crearea unui clasicator propriu pentru a putea detecta orice tip de obiect. Pentru a ne us , ura munca am creat programe auxiliare pentru marcarea s , i decuparea imaginilor de diferite extensii, folosind pachetul de programe Boost C++ s, i OpenCV. Acest program auxiliar faciliteaz marcarea punctelor de interes ale fet, ei s , i decuparea la dimensiuni date. Punctele marcate folosite la decupare sunt stocate ntr-un s, ier text s , i se vor folosi s ,i

Sistem de detect , ie bazat pe aspect global

n procesul de nvt , are. Baza de date este compus din 2893 de imagini faciale distincte. Pe parcursul experimentelor am pornit de la o serie de ntrebri la care am primit rspuns realiznd propriul nostru clasicator. 1. Care este cea mai bun mrime a imaginilor de intrare? Cele mai bune rezultate au ies , it din msurrile noastre pentru o dimensiune de 18 24, avnd mai put , ine detectri false la aceeas , i rat de detect , ie. Cu ct imaginea cont 2. Cum s decupm fet , ele? , ine mai multe detalii semnicative, cu att dimensiunea imaginii este mai mare. Rezultate considerabil mai bune le-am obt , inut decupnd nu numai fat , a, ci s , i ntreg conturul capului. 3. Care sunt imaginile semnicative? Denim imaginile pozitiv-semnicative acele imagini faciale care nu sunt detectate. Aceste tipuri de imagini ar trebui s e introduse n baza de date a imaginilor pozitive. Trebuie gsite acele tipuri de fet, e care acoper lipsurile setului de antrenare. Procesul este anevoios deoarece dup modicarea setului de antrenare presupune reluarea procesului de nvt , are.

Figura 1: Generator de fundale semnicative c Sz. Lefkovits

Sistem de detect , ie bazat pe aspect global

4. Ct este dimensiunea optim a setului de antrenare? Rezultatele au demonstrat c, cu ct este mai mare s , i variat setul de nvt , are, cu att cres , te performant , a de detect , ie, dar totodat se mres , te timpul procesului de antrenare. Setul de antrenare a constat, n nal, din 2893 de imagini faciale s, i milioane de imagini fundal. 5. Cum atingem o valoare mai mic dect 5 106 pentru rata detectrilor false? n procesul de detect , ie se foloses , te tehnica piramidei de imagini. Imaginile piramidei (aceeas , i imagine la diferite scale) sunt parcurse de o fereastr glisant de dimensiune dat (dim. 18 24). Numrul de imagini de evaluat este de ordinul sutelor de mii, sau chiar de ordinul milioanelor. Acest lucru impune ca rata de detect, ie pozitiv fals s e sub 5 106 , performant , e, ce se pot obt , ine, numai dac numrul imaginilor negative din setul de antrenare este de ordinul milioanelor. Un numr mare de imagini negative ar prelungi timpul de antrenare s , i ar presupune un spat , iu de memorare excesiv de mare. Am ajuns la concluzia, c ecare etaj trebuie antrenat cu 3000-5000 de imagini faciale s , i 10000 de imagini fundal semnicative. Denim imaginile negativ-semnicative acele imagini care nu reprezint fet, e s , i totus ,i sunt indicate ca imagini faciale, adic imaginile fals pozitive. Pentru marcarea s, i decuparea imaginilor negativ-semnicative am creat algoritmul generator de fundale (gura 1). Acest generator este utilizat nainte de crearea unui etaj nou pentru a dispune de un set sucient de imagini negative. Generatorul de fundale semnicative are sarcina de a gsi peste 10000 de imagini fals pozitive cu care s se antreneze urmtorul etaj. Bazndu-ne pe experimentele efectuate, putem arma c durata procesului de select, ie a imaginilor negativ-semnicative pentru etajele 15 20 era mult mai mare ca efectiv procesul de nvt , are prin algoritmul AdaBoost.

Figura 2: Curba ROC pe etaje c Sz. Lefkovits

Sistem de detect , ie bazat pe aspect global

Performant , a clasicatorului propus


Dup obt , inerea clasicatorului ce satisfcea condit , iile anterioare, am comparat performant , ele acestuia cu clasicatorii existent , i, folosind setul de imagini de testare CMU [94] set de imagini de test de referint , n domeniu. n scopul comparrii performant , ei clasicatorilor am reprezentat rata de detect , ie n funct , ie de numrul detectrilor false, adic o curb ROC a clasicatorului. Un rezultat important este reducerea imaginilor fals detectate. Se poate observa din curba ROC a clasicatorului propriu c odat cu descres, terea ratei detectrilor false descres , te considerabil s , i rata de detect , ie. Totodat, numrul clasicatorilor slabi cres , te considerabil prin adugarea de noi etaje. Clasicatorul Clas05 s-a creat cu o baz de date ce cont , ine fet , e umane europene, tinere, fr barb, mustat , sau ochelari. Am comparat clasicatorul nostru cu cel creat de Lienhart frontalface_alt2 [11] pe o serie de fotograi de pe internet s , i cele furnizate de FotoVision Studio [1]. Putem arma, c am obt , inut rezultate mai bune, adic numrul detectrilor este similar, n schimb numrul detectrilor fals pozitive s-a redus considerabil. Se poate compara vizual performant , a clasicatorului creat cu clasicatorul frontalface_alt2 pe setul de test CMU [94] s , i pe un set de fotograi proprii (gura 3). O serie de sisteme de detect , ie bazate pe aspect global au fost elaborate de H. Rowley et al. [80], de H. Schneiderman [83], de P. Viola s , i M. Jones [92] s , i de R. Lienhart et al. [63]. Dezavantajul primordial al acestor sisteme este necesitatea unei baze de date de imagini, ce trebuie s acopere ct mai bine aspectele de aparit , ie ale obiectului. n general, se concentreaz n detect , ia unei singure clase de obiecte pentru o singur orientare spat , ial. Pentru a acoperi diferite orientri spat , iale este necesar crearea bazei de date specice orientrilor, iar pentru a distinge orientarea, se impune specializarea clasicatorului prin structuri paralele sau printr-o structur de arbore cu noduri de decizii specice. Avantajul semnicativ al acestor sisteme este rata de detect , ie s , i timpul de detect , ie ce permite utilizarea detectoarelor n aplicat , ii n timp real. Din experimentele efectuate putem concluziona, c solut, ia de detect , ie ce utilizeaz aspectul global se bazeaz pe capacitatea sistemului de a elimina ct mai rapid imaginile negative s , i fr pierderi de imagini pozitive. Dezavantajul acestor sisteme este, c detecteaz relativ multe imagini fals pozitive al cror aspect vizual nu seamn de loc cu cel al imaginilor faciale. Pentru a diminua numrul detectrilor fals pozitive propunem crearea unui sistem care, n prima faz s detecteze rapid zonele de imagine care ar putea cont, ine fet , e umane, iar n faza a doua s detecteze caracteristici faciale. Astfel, congurat, ia spat , ial a caracteristicilor Binent, eles performant detectate va mics , ora probabilitatea detectrilor fals pozitive. , ele procesului de detect , ie se mbuntt , esc n dauna timpului de procesare. Pentru detect , ia fet , ei umane am utilizat sistemul propus de Lienhart et al. [61], iar pentru detect , ia caracteristicilor faciale vom utiliza un model deformabil bazat pe ltre 2D Gabor ca descriptori locali. 10

Sistem de detect , ie bazat pe aspect global Clasicatorul propriu Clas05 Clasicatorul frontalface_alt2

Figura 3: Exemple de detect , ie c Sz. Lefkovits 11

Sistem de detect , ie bazat pe aspect local


Cercetrile recente n domeniul vederii articiale tind s deps, easc detect , ia individual de obiecte s , i se concentreaz primordial la elaborarea unor metode de detect , ie a claselor de obiecte. Se impune crearea unor modele generice bazate pe prt, i de obiect s , i pe relat , iile spat , iale ale acestora. Una din solut , iile posibile sunt modelele deformabile aplicate obiectelor vizuale. n general, ntr-un sistem de detect , ie bazat pe aspect local se pot delimita trei prt , i: punctele de interes reprezint mult , imea de puncte, unde se caut prt , ile locale de obiect. descriptorul local reprezint o descriere formal a petelor corespunztoare cu diferite prt , i de obiect. modelul de obiect reprezint formalismul n care prt , ile de obiect detectate alctuiesc obiectul de interes. Acest capitol detaliaz aspectele teoretice s , i practice, ce alctuiesc un astfel de sistem [53]. Subcapitolul 4.1 prezint un model de obiect deformabil. Partea teoretic de denire s, i determinare a parametrilor modelului este inspirat din modelul utilizat de Felzenszwalb et al. [ 28]. n subcapitolul 4.1.3 am detaliat algoritmul de detect , ie s , i am denit tabelul de stare, ceea ce nlesnes , te implementarea efectiv a modelului propus. Un factor determinant al complexitt , ii algoritmului este modelul de solut , ionare a transformatei de distant , . n subcapitolul 4.1.4 propunem un algoritm propriu [54] pentru evaluarea ecient a transformatei de distant , generalizat. Algoritmul propus [55] este comparat cu algoritmul nfs , urtoarei minime a lui Meijster [70] pentru diferite funct , ii de distant , . Dac nfs , urtoarea minim se poate calcula analitic, atunci timpii de execut , ie ai celor doi algoritmi sunt comparabili, dar dac nfs , urtoarea minim se determin numeric, atunci algoritmul propus este mult mai ecient. n subcapitolul 4.2 sunt expuse bazele teoretice ale ltrelor 2D Gabor [72]. Un ltru 2D Gabor este denit de 9 parametri, astfel numrul ltrelor utilizate este extrem de mare. Se impune restrngerea domeniului de variat , ii ale parametrilor ltrelor. Rezultatele cercetrilor biologice s , i zice reduc acest spat , iu. Astfel, am propus o metod de proiectare a ltrelor bidimensionale [58]. Din constrngerile teoretice s , i experimentale spat , iul parametrilor ltrelor s-a redus, dar nu sucient pentru a le utiliza ca descriptori locali. n subcapitolul 4.2.3, prin utilizarea algoritmului Gentle AdaBoost [33] s , i evaluarea rezultatelor cu validare pe un set de imagini, s-au putut alege ltrele cele mai caracteristice pentru pata de imagine analizat. 12

Sistem de detect , ie bazat pe aspect local

Experimentele expuse [56] determin inuent , a parametrilor analizat , i din punct de vedere informat , ional. Scopul este determinarea unui set restrns de ltre cu o utilizare ecient n localizarea s , i detect , ia unei prt , i de obiect. Subcapitolul 4.2.4 prezint performant , ele descriptorului local creat [56, 58] s , i posibilitt , ile de utilizare ale acestuia n detect , ia ochiului uman. Avnd n vedere necesitatea de reducere a timpilor de execut , ie, se detaliaz implementarea paralel multisistem a proceselor de nvt , are s , i de detect , ie ai acestui descriptor.

Modelul de obiect deformabil


n cadrul modelelor deformabile obiectele sunt codate prin propriett, ile vizuale locale ale prt , ilor s , i prin informat , ia de legtur dintre acestea. n cadrul modelelor deformabile un obiect este denit de o mult , ime de prt ,i s , i de un set de relat , ii de interconectare ntre anumite Un astfel de model se poate deni printr-un graf neorientat. G = (V, M ) n care prt , i. V = {v1 , v2 , , vn } reprezint mult , imea vrfurilor corespunztoare prt , ilor obiectului s ,i M = {(vi , vj )|vi , vj V } reprezint mult , imea muchiilor, adic conectarea prt , ilor. n general, solut , ia detect , iei n aceste modele este denit prin minimizarea unei funct , ii energetice [31]. Energia sau costul unei congurat , ii particulare depinde, pe de o parte de msura asemnrii ai a prt , ilor vi cu partea de imagine n locat , iile corespunztoare xi , iar pe de alt parte, de distant , ele dij relative ale prt , ilor conectate. Cu ajutorul acestor funct , ii se poate deni ca msur de nepotrivire a modelului de obiect, cu imaginea obiectului, funct , ia de cost C (X ) =
n

ai ( xi ) +
i=1 (vi ,vj )M

Minimizarea acestei funct , ii va determina o congurat , ie de obiect, care corespunde cel mai bine cu imaginea obiectului. Felzenszwalb et al. [28] propune n scopul ecient , ei calculelor o limitare a structurii grafului G, un model adecvat pentru funct , iile dij s , i un algoritm care t , ine cont de funct , iile dij s ,i ai , asigurnd o minimizare ecient a funct , iei de cost. Una din posibilitt , ile de determinare a parametrilor este dat de formularea statistic a modelului. Formalismul statistic nlesnes , te nvt , area parametrilor modelului din exemple. n principiu, tot , i parametrii se pot determina din setul de nvt , are, utiliznd principiul verosimilitt , ii maxime. Totodat minimizarea funct , iei de cost este echivalent cu maximizarea probabilitt , ii aposteriori de gsire a congurat , iei de obiect n imaginea analizat. Dup gsirea modelului, detect , ia const n minimizarea funct , iei de cost, denit de relat , ia (1) s , i determinarea simultan a minimului. Acest sarcin este rezolvat prin tehnica 13

dij (xi , xj ) .

(1)

Sistem de detect , ie bazat pe aspect local

programrii dinamice, n cadrul creia am detaliat tabelele de stare s, i algoritmii utilizat , i. Complexitatea algoritmului de calcul este O(h2 n). Decient , a semnicativ a algoritmului este procesul de minimizare, ce trebuie efectuat pentru toate pozit, iile posibile h, care sunt de ordinul zecilor de mii. Funct , ia de minimizat este o transformat de distant , generalizat, pentru care prezentm un algoritm de calcul original n subcapitolul 4.1.2. Acest algoritm are o complexitate O(h log h) care trebuie executat n ecare nod, parte de obiect. Rezult, astfel, o complexitate global pentru minimizarea funct, ie de cost O(n h log h).

Transformata de distant ,
Transformata de distant , este un operator matematic, care calculeaz harta de distant , a unei imagini. Aceast hart reprezint tot o imagine. Denim transformata de distant , pe mult , imea de puncte P , Da : P R+ astfel Da (y ) = min M (x, y ) = min (d (x, y ) + a (x)) .
xP xP

(2)

Algoritmul propus n acest subcapitol se propune un algoritm original pentru calcularea transformatei generale de distant , conform denit , iei (2). n contrast cu algoritmii cunoscut , i, aceast metod poate folosit n cazul cel mai general, lund n considerare dou restrict, ii denite de Paglieroni [75] d(x, y ) = f (|x1 y1 |, |x2 y2 |, . . . , |xn yn |) | x i yi | < | z i t i | f (m1 , m2 , . . . , |xi yi |, . . . , mn ) <f (m1 , m2 , . . . , |zi ti |, . . . , mn ). Ideea algoritmului se bazeaz pe urmtoarea observat n scopul gsirii minimului , ie. funct , iei de msur (2), ntr-un punct y , nu trebuie s se calculeze distant , a d(x, y ) pentru toate punctele x. Presupunnd c n procesul de minimizare s-a gsit un minim actual n x0 , punctele x, pentru care nu este necesar calculul efectiv al funct , iei de msur sunt punctele, n care valoarea funct , iei de disimilaritate a(x) este mai mare dect valoarea actual s , i este la o distant , mai mare dect punctul actual. a (x) > a (x0 ) , d (y, x) > d (y, x0 ) , y. (4) (5)

(3)

Suma celor dou funct , ii nu poate s e sub nicio form mai mic, dect valoarea funct , iei de msur n punctul actual. 14

Sistem de detect , ie bazat pe aspect local

Algoritmul se bazeaz pe ordinea disimilaritt , ii s , i a distant , ei s , i denes , te punctele de minim potent , ial. Punctele de minim potent , ial sunt punctele, n care are sens s evalum valoarea funct , iei de msur. Transformata de distant , va egal cu cea mai mic valoare a funct , iei de msur n punctele de minim potent , ial. Acest algoritm ne sugereaz o implementare recursiv. Metoda prezentat poate conceput cu ajutorul unui arbore binar de cutare. n acest arbore elementele se introduc n ordinea cresctoare disimilaritt , ii (ordinea cresctoare a lui a ). Pozit , ia elementelor n arborele binar determin pozit , ia lor fat , de pozit , ia printelui. Dac s-a inserat n arbore ecare disimilaritate a(1), . . . a(n), atunci printr-o parcurgere n preordine se solut , ioneaz transformata de distant , . Algoritmul este implementat conform pseudocodului (algoritmul 1) Algoritmul 1 Transformata de distant , (a,d) c Sz. Lefkovits Date: a, d Rezultate: Ca , argmin(Ca ) 1: sortare([a,d]) {sortare cresctoare dup a } 2: arbore:=Creare ([a,d](1)) 3: pentru i := 2..n execut Inserare(arbore,[a,d](i)) {inserare n ordinea cresctoare a lui a, 4: cu relat , ia de ordonare a nodurilor dup d } 5: sfrs , it pentru 6: (argmin, min):=MinimTD(rdcin_arbore, 1, dim([a,d])) {traversare preordine} 7: returnare Ca , argmin(Ca ) Am comparat acest algoritm (1) propus cu algoritmul prezentat de Meijster [70] s , i implementat de Felzenszwalb et al. [28]. Experimentele comparative pentru distant , ele l1 s , i l2 pledeaz n favoarea algoritmului parabolelor. n schimb, pentru un numr mare de puncte/noduri (n > 5000) algoritmul propus gses , te mai repede transformata de distant , . Experimentul inrm timpul de execut , ie, aproape liniar [27] al algoritmului parabolelor (n), care devine mai lent fat , de algoritmul propus (n log n). In cazuri generale, se utilizeaz distant , e complexe. Algoritmul lui Meijster presupune determinarea nfs , urtoarei minime, ce este un factor important n durata algoritmului. Algoritmul elimin acest inconvenient, devenind astfel mai ecient, reducnd durata de execut , ie cu 1-2 ordini de mrime.

Descriptori locali cu ltre Gabor


Reformulnd ideile expuse n capitolele anterioare, se impune realizarea unui descriptor local, ce poate utilizat ntr-un proces de detect , ie robust. Cum am mai expus, procesul de nvt , are 15

Sistem de detect , ie bazat pe aspect local

este una supervizat, n care sunt marcate prt , ile semnicative de obiect. n prima faz, se creeaz un clasicator robust, ce se bazeaz pe aspectul global al obiectului, iar n faza a doua, se creeaz un clasicator, ce se bazeaz pe aspectul local avnd rolul de reducere, de eliminare a detectrilor false. Se dores , te construirea unui descriptor de aspect local pe baza rspunsului ltrelor Gabor bidimensionale. Acest subcapitol este structurat n trei prt , i. n prima parte se prezint teoria ltrelor Gabor bidimensionale [72], subliniind relat , iile teoretice ce stau la baza proiectrii ltrelor. n partea a doua se prezint algoritmul de clasicare Gentle AdaBoost, justicarea alegerii, modul de implementare al acestuia. n ultima parte, pe baza teoriei expuse, se determin experimental un descriptor local s , i se analizeaz comportarea s , i posibilitt , ile de utilizare ale acestuia n modelul de obiect deformabil propus.

Filtre 2D Gabor
Reprezentarea imaginilor prin coecient , ii de descompunere cu undine 2D Gabor ne sugereaz ltrarea imaginii cu ltru Gabor bidimensional ntr-o serie de puncte bine stabilite. De fapt, determinarea coecient , ilor descompunerii este rezultatul procesului de convolut , ie dintre imaginea I (x, y ) s , i ltrul Gabor g (x, y ). Formula general a ltrului Gabor bidimensional este identic cu cea a undei spat , iale propus de Daugman [19, 20] 1 g (x, y ) = e k unde (x x0 )r = (x x0 ) cos + (y y0 ) sin , (y y0 )r = (x x0 ) sin + (y y0 ) cos . Astfel, ltrul Gabor bidimensional este determinat prin 9 parametri. 1 - : amplitudinea nfs , urtoarei gaussiene; k - (, ): mrimea axelor nfs , urtoarei gaussiene; - : unghiul de rotat , ie al nfs , urtoarei gaussiene; - (x0 , y0 ): punctul de maxim al nfs , urtoarei gaussiene; - (0 , 0 ): frecvent , a spat , ial a undei plane sinusoidale; - P : faza undei sinusoidale. (9) 16 (7) (8)
2 (x x0 )2 r + ( y y0 ) r 2 2

ei[(0 (xx0 )+0 (yy0 ))+P ] ,

(6)

Sistem de detect , ie bazat pe aspect local

n alegerea ltrului Gabor avem 9 grade de libertate, factor ce ngreuneaz alegerea ltrelor de utilizat. Se impune o reducere rat , ional a spat , iului parametrilor n vederea utilizrii eciente a ltrului propus. Analiza teoretic n domeniul frecvent prezentat n subcapitolul 4.2 s-a realizat n scopul gsirii anumitor legturi s , i restrict , ii ntre parametrii, ceea ce duce implicit la reducerea dimensiunii spat , iului de denit , ie s , i la limitarea teoretic a mult , imii de valori a ecrui parametru. Relat , iile, care s-au luat n considerare, sunt: 1. 1 amplitudinea nfs , urtoarei gaussiene este un factor multiplicativ, aparent fr implik cat , ie semnicativ. Se poate alege empiric o valoare constant arbitrar. Deoarece aceste undine sunt folosite cu scopul de ltrare a imaginilor s, i utilizate ca funct , ii de clasicare, se impune compararea rspunsului acestora. Pentru a realiza o comparare real, trebuie ca energia maxim, care trece prin ltre s e identic. Pe baza teoriei ltrrii s-a considerat util ca integrala nfs , urtoarei gaussiene s e egal cu unitatea, 1 1 de unde = . k

2. Pe baza considerentelor neurobiologice, orientarea nfs , urtoarei gaussiene, direct , ia axei principale se consider identic cu direct , ia de propagare a undinei plane = 0 . 3. Raportul axelor s . n general, aspectul S 1, ceea , i determin aspectul S = ce implic n domeniul spat , ial c axa principal este mai mic ca axa secundar a nfs , urtoarei. 4. Punctul (x0 .y0 ) s-a considerat a nul, deoarece este punctul central al undinei Gabor. Acest punct este luat ca referint , n expresia ltrelor. Punctul de referint , va coincide cu punctul de imagine unde se aplic ltrarea. 5. Faza P a undinei plane poate considerat nul, P = 0 deoarece punctul de referint , (x0 , y0 ) parcurge toate punctele de interes. 6. Relat , ia de legtur a parametrilor de ltrare (banda de frecvent , bw , lungimea de und 0 s , i axa ) este exprimat de 2bw 1 K = bw , (10) 2 +1 C K = . 0 Obt , inem C = . 0 K (11)

(12)

Aceast relat , ie exprim faptul c pentru o lrgime de band raportul dintre axa principal s , i lungimea de und este o constant. 17

Sistem de detect , ie bazat pe aspect local

Pe baza acestor considerente teoretice numrul parametrilor independent, i s-a redus la patru, s , i anume: 0 = 1 lungimea de und F0

S aspectul nfs , urtoarei bw lrgimea de band direct , ia de propagare a undei plane

Crearea experimental a descriptorului local


Majoritatea aplicat , iilor, care utilizeaz ltrele Gabor, folosesc un set de ltre cu parametri ales , i pe criterii empirice s , i insucient argumentate s , tiint , ic. Fiecare autor descrie modul de utilizare al ltrelor, fr a da date concrete detaliate despre dimensiunea s, i parametri ltrelor utilizate. n general, se utilizeaz un set de 40 de ltre, avnd 8 orinetri s , i 5 frecvent , e. Aceste informat , ii nu sunt suciente pentru a reproduce teoriile expuse sau de a le dezvolta s , i aplica n scopuri de cercetare proprii. Optimizarea numrului de ltre Gabor s , i implicit determinarea parametrilor acestora este un domeniu de cercetare abordat de mai mult, i autori [40, 45, 85, 93]. Aceast optimizare const n reducerea numrului de ltre, alegerea unui set minim de parametrii s , i determinarea locat , iilor semnicative, unde se aplic ltrarea. Se prezint, n continuare, modul de realizare a descriptorului de aspect local, lund considerare o anumit parte de imagine. Procesul de creare a clasicatorului local presupune dou etape distincte. n prima etap trebuie creat baza de date cu imaginile prt, ii locale, iar n etapa a doua se construies , te clasicatorul aspectului local corespunztor. Procesul de nvt , are supervizat presupune existent , a unui numr mare de imagini obiect, care trebuie s acopere ct mai bine toate aparit , iile posibile ale obiectului. La crearea descriptorului local am folosit 730 de imagini de obiect s , i 2000 de imagini fundal n setul de antrenare s , i 159 de imagini obiect s , i 500 de imagini non-obiect n setul de test. n experimentele practice trebuie s stabilim valori concrete pentru parametrii. Cercetrile neurologice limiteaz domeniul acestor valori, astfel, aspectul S ia valori ntre 1 s , i 2, iar lungimea de band bw ia valori ntre 1, 2 s , i 1, 7 octave. Unghiurile de propagare a undei Gabor se determin din relat, iile, ce stabilesc posibilitt , ile de reconstruct , ie a imaginii rspunsului ltrelor. Numrul maxim de orientri, ce merit a se lua n considerare este de 24. Astfel, orientarea l se denes , te ca un multiplu ntreg al unghiului de rotat , ie minim 0 = 2 = , unde L {6, 8, 12}. 2L L 18 (13)

Sistem de detect , ie bazat pe aspect local

Obt , inem l = l 0 un spat , iu de maxim 12 valori distincte. Orientrile luate n considerare sunt doar n cadranul 1 s , i 2 deoarece ltrele cu orientrile din cadranele 3 s , i 4 sunt complex conjugatele acestora. Pentru lungimile de und se poate considera tot spat , iul discret delimitat superior de mrimea ltrului, R = 16 s , i avnd eroarea de discretizare acceptat < R 1 2bw 1 , ln 2 ln () S 2bw + 1 (14)

iar inferior de teorema de es , antionare, adic Fmax < Fs 1 = = 0, 5 pixel/ciclu, astfel > 2. 2 2 (15)

n experimentele efectuate pentru determinarea unui clasicator de aspect local am considerat mrimea ltrului Gabor ca ind 33 33 pixeli, iar domeniul valorilor parametrilor este:

{4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 16, 18, 22} S {0, 5; 0, 66; 1; 1, 2; 1, 5; 1, 8} bw {1; 1, 5; 2} l l = 0, 11 12

- 14 valori - 6 valori - 3 valori - 12 valori.

Astfel, ntr-un singur punct se pot deni un numr de 14 6 3 12 = 3024 ltre diferite, iar rspunsul ecrui ltru este un numr complex. Domeniul de valori este cel al numerelor complexe, unde relat , ia de ordine nu exist. Se va impune analiza tipului valorii, ce trebuie utilizat pentru crearea clasicatorilor bazat , i pe rspunsul ltrelor Gabor. n experimentele efectuate am considerat util analiza informat , ional a 5 valori denite a rspunsului ltrelor: partea real, partea imaginar, modulul, argumentul s , i distribut , ia statistic. n concluzie, spat , iul analizat pentru un singur punct de imagine are o dimensiune de 15120 = 3024 5. Scopul primordial al experimentelor este de reducere a acestui spat, iu prin alegerea caracteristicilor semnicative. Pe lng spat , iul parametrilor de ltrare sunt nc o serie de factori care determin procesul de nvt , are s , i de prelucrare a imaginilor. Rezultatele experimentale vor delimita n mod coerent inuent , a ecrui factor denit n procesul de selectare s , i de decizie al creerii descriptorului local optim. Pentu analiza s , i select , ia caracteristicilor s-a utilizat algoritmul de clasicare Gentle AdaBoost [33]. Acest algoritm, pe lng proprietatea de select , ie a caracteristicilor semnicative, 19

Sistem de detect , ie bazat pe aspect local

ne furnizeaz s , i nivelul de ncredere al deciziei, utilizat n evaluarea clasicatorului obt , inut. Pentru a decide inuent , a ecrui factor asupra performant , elor descriptorului local, experimentele s-au realizat n aceleas , i condit , ii, modicndu-se numai factorul de analizat. Criteriul de evaluare a factorilor este evolut , ia erorilor n funct , ie de numrul de clasicatori. Evaluarea erorilor s-a realizat att pe setul de antrenare ct s , i pe setul de test. n experimente s-au evaluat urmtoarele erori: Eroarea de detect , ie este raportul exprimat n procente ntre numrul detectrilor false s , i numrul total de detect , ie. Rata detectrilor fals negative este raportul exprimat n procente ntre numrul detect, iilor eronate de imagini pozitive s , i numrul total al imaginilor pozitive. Rata detectrilor fals pozitive este raportul exprimat n procente ntre numrul detect, iilor eronate de imagini negative s , i numrul total de imagini negative. Experimentele detaliate s-au realizat pentru urmtorii factori: a) analiza informat , ional a rspunsului ltrelor. Aceste experimente au scopul de a decide modul de utilizare a rspunsurilor ltrelor. Partea real, partea imaginar, modulul s, i argumentul sunt valorile analizate din rspunsul complex al ltrelor Gabor. b) aspectul ltrelor S . Raportul axelor nfs , urtoarei gaussiene denes , te aspectul ltrelor. n cele mai multe lucrri de specialitate aspectul este considerat 1. Pentru a alege o valoare ( ind dimensiunea axei n direct optim a aspectului S = , ia de propagare a undei plane, ind dimensiunea axei perpendiculare pe aceast direct , ie), am experimentat prin procesul de nvt , are s , i apoi cel de testare comportarea clasicatorilor nali. c) banda de frecvent , bw . Lungimea de und n direct , ia de propagare, raportat la lungimea de und, este invers proport , ional cu lrgimea benzii, adic dac cres , te lrgimea de band, descres , te lungimea de und. La aceeas , i lungime de und s , i lrgime de band, odat cu cres , terea aspectului, cres , te s , i lt , imea ltrului. d) lungimile de und s Ca clasicatori slabi se pot considera , i numrul de orientri . mai multe ltre 2D Gabor, cu mai multe lungimi de und s , i mai multe direct , ii de propagare dect cele calculate din condit , ia de acoperire a domeniului de frecvent , cu ltre tangent , iale. n experimente am considerat un numr mai mare de lungimi de und s ,i orientri, ce se suprapun n domeniul frecvent , . Procesul de nvt , are, folosind algoritmul Gentle AdaBoost, are sarcina de a alege clasicatorii semnicativi, cu care se poate detecta ecient aspectul local impus. 20

Sistem de detect , ie bazat pe aspect local

e) parametrii procesului de nvt , are. n procesul de nvt , are, dac rata ponderii imaginilor pozitive s , i celor negative este 3:1, se constat efectul inegalitt , ii ponderilor imaginilor prin scderea considerabil a ratei detectrilor fals negative, s, i n dauna cres , terii ratei detectrilor fals pozitive. Acelas , i fenomen se poate observa s , i n procesul de testare, dar efectul ponderilor este diminuat. f) prelucarea de normalizare s , i egalizare a imaginii. Rezultatele prezentate indic un rol semnicativ al funct , iei de egalizare. Funct , ia de normalizare are un efect mai put , in ecient, deoarece imaginile setului de test prezint o dispersie a intensitt, ii punctelor cu variat , ie relativ mic. Totus , i, pentru realizarea unui detector, care este utilizat n condit , ii reale, aceast funct , ie contribuie la pstrarea performant , elor detect , iei. g) alegerea unor puncte de interes (LoG). Mult , imea punctelor, n care trebuie evaluate rspunsurile ltrelor, reprezint un factor determinant pentru performant, a detectorului de obiecte. Timpul de procesare este direct proport , ional cu numrul de puncte luate n considerare. Una din metodele de reducere a cardinalitt , ii mult , imii punctelor de procesare este de a utiliza doar mult , imea punctelor de interes. Am constatat, c att procesul de nvt , are, ct s , i cel de testare este mai performant pentru punctele marcate. Utiliznd detectorul de puncte de interes LoG, eroarea de detect , ie cres , te, n schimb, timpul de detect , ie scade considerabil. Performant , ele de detectare devin astfel considerabil mai slabe, dar scderea semnicativ a timpului de detect , ie recomand utilizarea acestui procedeu de detect , ie pentru secvent ,e de imagini.

Performant , a descriptorului local creat


Prin utilizarea metodologiei expuse n capitolul anterior, obt, inem descriptorul local cel mai performant pentru setul de imagini de nvt , are s , i de test din baza de date creat. Procesul de nvt , are utilizeaz imaginile pozitive cu pondere init , ial de 3 ori mai mare ca ponderea celor negative. Rezultatele cele mai bune le-am obt , inut, pentru puncte marcate, cu pete de imagini uniformizate de procesele de normalizare s , i egalizare. Clasicatorul performant obt , inut este compus din 40 de ltre, avnd aspectul S = 1, 8 s , i avnd congurat , ia parametrilor dat n tabelul 1. n procesul de nvt , are, rata detectrilor false devine 0 cu numai 28 de clasicatori slabi, iar imaginile pozitive ale setului de nvt , are sunt complet separate de cele negative cu 68 de clasicatori (gura 4). Pentru imaginile de test, rata erorilor fals pozitive devine chiar nul, iar eroarea global scade sub 2% cu 32 de clasicatori (gura 5).

21

Sistem de detect , ie bazat pe aspect local

Clasicator 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. GF_02718 GF_02248 GF_01574 GF_01636 GF_02493 GF_01555 GF_02313 GF_02932 GF_01825 GF_01772 GF_01592 GF_02275 GF_01618 GF_02437 GF_02932 GF_02734 GF_01979 GF_02347 GF_02609 GF_01834

18 10 4 5 14 4 11 22 6 6 4 11 4 12 22 18 8 11 16 6

[ ] 15 135 90 15 0 60 60 15 150 60 120 0 165 90 15 45 45 120 15 165

bw 1,5 1,0 2,0 1,0 1,5 1,0 1,5 1,0 1,0 2,0 2,0 1,0 1,0 1,0 1,0 1,0 2,0 1,0 2,0 1,0 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40.

Clasicator GF_02086 GF_01987 GF_01708 GF_02933 GF_01555 GF_02167 GF_01592 GF_01645 GF_02645 GF_02140 GF_02113 GF_02941 GF_01681 GF_02626 GF_02185 GF_02815 GF_02338 GF_02176 GF_01915 GF_02078

[ ]

bw 1,0 1,0 1,0 2,0 1,0 1,0 2,0 1,0 2,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 2,0

9 45 8 60 5 135 22 15 4 60 10 0 4 120 5 30 16 75 9 135 9 90 22 30 5 90 16 45 10 30 20 0 11 105 10 15 7 120 9 30

Tabelul 1: Clasicatorul cel mai performant S = 1, 8 c Sz. Lefkovits Descriptorul local creat pe lng funct , ionalitatea de descriptor are s , i rolul de detector al petei locale. Prin aplicarea descriptorului local, n toate punctele unei imagini, obt, inem imaginea-hart a rspunsului descriptorului. n prima faz, harta rspunsurilor este suprafat, a de valori reale furnizate de funct , ia de clasicare Gentle AdaBoost ( R > 0 obiect, R < 0 nonobiect). Aplicnd algoritmul prezentat n subcapitolul 4.2.4, pentru o imagine obt, inem harta rspunsurilor descriptorului. Procedeul de ltrare n 4 4 pixeli este sucient pentru detect , ia petei s , i necesar pentru reducerea de aproape 16 ori a timpului de detect , ie. Aceast hart Modelul de obiect deva utilizat n modelul de obiect n scopul detect , iei obiectului. termin congurat , iile posibile din rspunsul clasicatorilor, eliminnd petele pozitiv detectate, ce nu pot atribuite obiectului. Astfel, harta rspunsurilor trebuie evaluat conform performant , elor descriptorului local. Una din decient , ele majore ale descriptorului propus este durata mare de procesare, pentru c n procesul de nvt , are ecare ltru trebuie s e evaluat pentru toate imaginile din setul de antrenare. n procesul de detect , ie numrul convolut , iilor depinde de numrul de ltre din clasicatorul puternic s , i de numrul de puncte de interes de pe o imagine. Am 22

Sistem de detect , ie bazat pe aspect local

Figura 4: Erorile de detect , ie pe setul de antrenare ale celui mai performant clasicator c Sz. Lefkovits 23

Sistem de detect , ie bazat pe aspect local

Figura 5: Erorile de detect , ie pe setul de test ale celui mai performant clasicator c Sz. Lefkovits 24

Sistem de detect , ie bazat pe aspect local

Figura 6: Harta rspunsurilor n vecintatea obiectului c Sz. Lefkovits demonstrat, c pentru o detect , ie corect este sucient evaluarea descriptorului ntr-o ret , ea cu pasul de 4 pixeli. n scopul reducerii timpului de calcul am implementat descriptorul pe un sistem multiprocesor folosind un cluster. Aplicat , ia creat utilizeaz pachetul de programe Matlab [2]. Acest pachet de programe asigur procesarea paralel prin serverul distribuit MDCS (Matlab Distributed Computing Server). n gura 7 am reprezentat cteva exemple ale celui mai performant descriptor creat (tabelul 1 s , i gurile 4 s , i 5) cu acest sistem pentru detect , ia ochiului uman. Sistemul de detect , ie de obiect denit n acest capitol este nou prin utilizarea ltrelor 2D Gabor, ca descriptor local. Studiul amnunt , it demonstreaz, c un set de ltre alese pe criterii informat , ionale alctuies , te un descriptor sucient de general s , i totodat specic. n schimb, prin delimitarea judicioas a domeniului de valori al parametrilor ltrelor, procesul de determinare al descriptorului local se poate automatiza fr evaluarea intermediar a performant n procesul de creare al descriptorului este nevoie de o baz de date de , elor. imagini cu prt , ile obiectului de interes marcate. Se impune, ca n procesul de nvt , are petele de imagine corespunztoare prt , ilor, s e rescalate la o dimensiune standard. n procesul de detect , ie bazat pe aspect local utilizm imagini de aceeas , i dimensiune. Acest aspect se poate rezolva cu procesarea multi-rezolut , ie, sau cu un detector de aspect global. Sistemul propus utilizeaz, n prima faz, un detector rapid de aspect global, deci n procesul de detect, ie este sucient doar o simpl redimensionare a imaginii.

25

Sistem de detect , ie bazat pe aspect local

Figura 7: Exemple de imagini de test din baza de date FERET c Sz. Lefkovits Durata procesului de detect , ie este determinat de numrul de ltre utilizate s , i de numrul punctelor, n care ele se evalueaz. Pentru procesul de detect, ie am propus o procesare paralel pentru calculul rspunsurilor ltrelor. Prin procesare paralel timpul de detect, ie se poate reduce n limitele dorite. Descriptorul local creat prezint propriett, ile ltrelor Gabor de a invariante la translat , ii, rotat , ii s , i scalri. Experimentele fcute n detectarea ochiului uman cu descriptorul creat, demonstreaz performant , e de detect , ie remarcabile. Un astfel de descriptor este adecvat utilizrii n orice model bazat pe prt , i de obiect.

26

Concluzii s , i direct , ii de cercetare


Lucrarea de doctorat prezentat s , i-a propus studiul s , i realizarea unui sistem robust de detect , ie de obiecte. Caracteristica de robust a unui detector se refer la performant, a de a sigur de obiectul detect , iei s , i de a sigur, c s-au detectat toate obiectele de interes. n termeni tehnici, aceast caracteristic nseamn o rat de detect, ie mare s , i o rat a detectrilor false mic, adic aproape nul. Pentru a atinge aceste performant, e, s-a realizat un sistem format din dou prt , i. Prima parte este un sistem de detect , ie bazat pe aspect global, ce scaneaz imaginea de interes s , i utilizeaz tehnica piramidei de imagini. Caracteristica acestui sistem este o detect , ie foarte rapid, cu o rat de detect , ie ridicat, dar cu un numr mare de detectri false. Rata de detect , ie ridicat s-a putut atinge prin crearea unei baze de date de imagini pozitive (subcapitolul 3.4), care ia n considerare aproape toate aspectele de aparit, ie a obiectului de interes. Prin metodologia expus (subcapitolul 3.4) s-a creat un clasicator propriu, cu performant, e mai bune dect ale clasicatorilor publici existent , i. S-a obt , inut o rat foarte mic a detectrilor false, de aproximativ 5 106 , care totus , i nu este sucient pentru o detect , ie robust. Se detecteaz nc destul de multe zone false. Analiznd imaginile false, ajungem la concluzia, c aceste imagini nu seamn de loc cu obiectul de interes. Acesta este motivul, pentru care s-a propus, ca n faza a doua de detect , ie, s se utilizeze un detector mai lent, care s analizeze detaliile. Partea a doua este un sistem de detect , ie bazat pe aspect local. Acesta este un sistem mult mai lent, dar prelucreaz imaginea n detaliu. Sistemul analizat este alctuit din dou prt, i: modelul de obiect s , i descriptorul local. Modelul de obiect este un model deformabil cunoscut (subcapitolul 4.1), dar care se bazeaz pe informat , ia descriptorului local propus. Modelul de obiect deformabil are solut , ionare ecient prin algoritmul descris n subcapitolul 4.1.3. Ecientizarea algoritmului const n aplicarea corect a programrii dinamice s, i evaluarea rapid a transformatei de distant , generalizat cu un algoritm original (subcapitolul 4.1.4.1). Factorul primordial care determin performant , a unui sistem de detect , ie bazat pe aspect local este descriptorul local s , i modul de alegere a punctelor de interes. Am pornit de la ideea de funct , ionare al cmpului receptiv al sistemelor biologice. Am propus un descriptor local bazat pe ltre 2D Gabor. n subcapitolul 4.2.1 am analizat att teoretic, ct s, i experimental modul de creare al unui astfel de descriptor. Problema denirii limitelor ltrelor, modul de evaluare s , i realizarea efectiv a descriptorului local am realizat printr-o succesiune de experimente. Metodologia de abordare, munca sistematic s , i migloas s-a concretizat ntr-o serie de experimente reus , ite, expuse n subcapitolul 4.2.3. Rezultatele experimentale sunt concludente 27

Concluzii s , i direct , ii de cercetare

s , i contureaz posibilitt , ile de utilizare a descriptorului propus ntr-un model deformabil. Sistemul de detect , ie realizat este un sistem supervizat, ce necesit o baz de date de imagini acoperitoare ipostazelor de aparit , ie a obiectului de detectat. Prin modul de abordare sistemul ncearc s gseasc un compromis optim ntre aspectul global s, i local, ntre prelucrarea global s , i cea detaliat, ntre viteza s , i performant , a de detect , ie. Analiza teoretic s ,i experimental, prezentat n lucrare, este o baz solid pentru crearea unui sistem de detect, ie performant. Parametrii procesului de nvt , are s , i ai procesului de detect , ie se pot mbuntt , ii prin dezvoltri ulterioare. Se impune reducerea timpului de procesare determinat de numrul mare de convolut , ii s , i durata acestora. Durata unei convolut , ii se poate reduce prin dimensionarea optim a ltrelor, prin utilizarea de coecient, i de tip ntreg cu un nivel de cuantizare optimizat. Totodat, se impune utilizarea unei procesri multisistem cu sarcini de calcul distribuite judicios. Odat cu ecientizarea calculelor, se va putea aborda realizarea unui sistem de detect , ie mai complex, ce poate trata obiectele din diferite unghiuri de vedere sau cu acoperiri part , iale, ntr-o varietate innit de ipostaze s , i contexte. n afar de dezvoltrile imediate ale acestei lucrri se pot aborda o serie de subiecte de cercetare viitoare: crearea unor modele de detect , ie ce au la baz sisteme de nvt , are semisupervizate s ,i nesupervizate; crearea unor descriptori locali ce sunt alctuit , i din informat , ia vizual a petelor; studierea complex a ltrelor 2D Gabor n vecintatea punctelor de interes; crearea unor sisteme de recunoas , tere utilizabile n identicare s , i autenticare.

28

Bibliograe
[1] www.fotovision.ro. [Online; accessed 2012]. (document) [2] http://www.mathworks.com/ . [Online; accessed 2012]. (document) [3] http://www.itl.nist.gov/iad/humanid/feret/feret_master.html . [Online; accessed 2012]. [4] http://vision.ucsd.edu/~leekc/ExtYaleDatabase/ExtYaleB.html . [Online; accessed 2012]. [5] http://coreldraw.com/media/ . [Online; accessed 2012]. [6] Bioid database. https://support.bioid.com/downloads/facedb/index.php . [Online; accessed 2012]. [7] P. Addison, J. Walker, and R. Guido. Timefrequency analysis of biosignals. Engineering in Medicine and Biology Magazine, IEEE , 28(5):14 29, september-october 2009. [8] C. M. Bishop. Pattern Recognition and Machine Learning (Information Science and Statistics). Springer, 1st ed. 2006. corr. 2nd printing edition, October 2007. [9] G. Borgefors. Hierarchical Chamfer matching: A parametric edge matching algorithm. IEEE Trans. Pattern Anal. Mach. Intell. , 10:849865, November 1988. [10] G. Borgefors and I. Nystrm. Ecient shape representation by minimizing the set of centres of maximal discs/spheres. Pattern Recognition Letters , 18(5):465 471, 1997. [11] G. Bradski and A. Kaehler. Learning OpenCV: Computer Vision with the OpenCV Library. OReilly, Cambridge, MA, 2008. (document) [12] C. J. C. Burges. A tutorial on support vector machines for pattern recognition. Data Min. Knowl. Discov. , 2(2):121167, 1998. [13] J. Canny. A computational approach to edge detection. IEEE Trans. Pattern Anal. Mach. Intell., 8(6):679698, June 1986. [14] O. Cuisenaire. Distance Transformations: Fast Algorithms and Applications to Medical Image Processing. PhD thesis, Universite Chatolic de Louvain, 1999.

29

BIBLIOGRAFIE

[15] M. N. Dailey, G. W. Cottrell, C. Padgett, and R. Adolphs. Empath: A neural network that categorizes facial expressions. J. Cognitive Neuroscience , 14:11581173, November 2002. [16] N. Dalal and B. Triggs. Histograms of oriented gradients for human detection. In Computer Vision and Pattern Recognition, 2005. CVPR 2005. IEEE Computer Society Conference on, volume 1, pages 886893, 2005. [17] P. E. Daniellson. Euclidian distance mapping. Computer Vision Graphics and Image Processing, 14:227248, 1980. [18] J. Daugman. Probing the uniqueness and randomness of iriscodes: Results from 200 billion iris pair comparisons. Proceedings of the IEEE , 94(11):1927 1935, nov. 2006. [19] J. G. Daugman. Two-dimensional spectral analysis of cortical receptive eld proles. Vision Research, 20(10):847 856, 1980. (document) [20] J. G. Daugman. Uncertainty relation for resolution in space, spatial frequency, and orientation optimized by two-dimensional visual cortical lters. Journal of the Optical Society of America A: Optics, Image Science, and Vision , 2(7):11601169, 1985. (document) [21] J. G. Daugman. Complete discrete 2-D Gabor transforms by neural networks for image analysis and compression. IEEE Transactions on Acoustics Speech and Signal Processing , 36(7):11691179, 1988. [22] R. L. De Valois and K. K. De Valois. Spatial vision. Annual Review of Psychology , 31(1):309341, 1980. [23] H. Eggers. Two fast euclidean distance transformations in z2based on sucient propagation. Computer Vision and Image Understanding , 69(1):106 116, 1998. [24] R. Fabbri, L. D. F. Costa, J. C. Torelli, and O. M. Bruno. 2D euclidean distance transform algorithms: A comparative survey. ACM Comput. Surv., 40:2:12:44, February 2008. [25] H. Farzin, H. A. Moghaddam, and M.-S. Moin. A novel retinal identication system. EURASIP J. Adv. Sig. Proc. , 2008, 2008. [26] P. F. Felzenszwalb, R. B. Girshick, D. McAllester, and D. Ramanan. Object detection with discriminatively trained part based models. IEEE Transactions on Pattern Analysis and Machine Intelligence , 99(PrePrints), 2009.

30

BIBLIOGRAFIE

[27] P. F. Felzenszwalb and D. P. Huttenlocher. Distance transforms of sampled functions. Technical report, Cornell Computing and Information Science, September 2004. (document) [28] P. F. Felzenszwalb and D. P. Huttenlocher. Pictorial structures for object recognition. Int. J. Comput. Vision , 61(1):5579, 2005. (document) [29] R. Fergus. Object class recognition by unsupervised scale-invariant learning. In IEEE Computer Society Conference on Computer Vision and Pattern Recognition , volume 2, pages 264271, 2003. [30] R. Fergus. Visual Object Category Recognition . PhD thesis, Robotics Research Group Departament of Engineering Science, University of Oxford, 2005. [31] M. A. Fischler and R. A. Elschlager. The representation and matching of pictorial structures. In Computers, IEEE Transactions on , volume C-22, pages 6792, 1973. (document) [32] Y. Freund and R. Schapire. A decision-theoretic generalization of on-line learning and an application to boosting. Journal of Computer and System Sciences, vol. 55, pp. 119-139, Art. No. SS971504, , 1997. (document) [33] J. Friedman, T. Hastie, and R. Tibshirani. Additive Logistic Regression: a Statistical View of Boosting. The Annals of Statistics , 38(2), 2000. (document) [34] D. Gabor. Theory of communication. part 1: The analysis of information. Electrical Engineers - Part III: Radio and Communication Engineering, Journal of the Institution of, 93(26):429 441, 1946. [35] C. Galleguillos and S. Belongie. Context based object categorization: A critical survey. Technical Report CS2008-092, 08/2008 2008. (document) [36] D. Gao. A Discriminant Hypothesis for Visual Saliency: Computational Principles, Biological Plausibility and Applications in Computer Vision . PhD thesis, University of California, 2008. [37] C. Harris and M. Stephens. A Combined Corner and Edge Detection. In Proceedings of The Fourth Alvey Vision Conference , pages 147151, 1988. [38] C. Huang, B. Wu, H. Ai, and S. Lao. Omni-directional face detection based on real adaboost. In In International Conference on Image Processing , 2004.

31

BIBLIOGRAFIE

[39] D. Huttenlocher, G. Klanderman, and W. Rucklidge. Comparing images using the hausdor distance. Pattern Analysis and Machine Intelligence, IEEE Transactions on , 15(9):850 863, sep 1993. [40] J. Ilonen, J.-K. Kamarainen, P. Paalanen, M. Hamouz, J. Kittler, and H. Klviinen. Image feature localization by multiple hypothesis testing of Gabor features. IEEE Transactions on Image Processing , 17(3):311325, 2008. (document) [41] Y. Jie, Y. Y. fang, Z. Renjie, and S. Qifa. Fingerprint minutiae matching algorithm for real time system. Pattern Recognition, 39(1):143 146, 2006. [42] J. Jones and L. Palmer. An evaluation of the two-dimensional Gabor lter model of simple receptive elds in the cat striate cortex. Pattern Analysis and Machine Intelligence, IEEE Transactions on , 58:1,2331,258, 1987. [43] A. Jorgensen. Adaboost and histograms for fast face detection. Masters thesis, University of Stockholm, 2006. [44] T. Kadir and M. Brady. Saliency, scale and image description. Int. J. Comput. Vision , 45(2):83105, 2001. [45] P. Kalocsai. Face recognition by statistical analysis of feature detectors. Image and Vision Computing, 18(4):273278, 2000. (document) [46] Y. Ke and R. Sukthankar. PCA-SIFT: A more distinctive representation for local image descriptors. In Computer Vision and Pattern Recognition, CVPR , pages 506513, 2004. [47] T. S. Lee. Image representation using 2D Gabor wavelets. Pattern Analysis and Machine Intelligence, IEEE Transactions on , 18(10):959 971, Oct. 1996. [48] S. Lefkovits. Performance analysis of face detection systems based on haar features. In Complexity and Intelligence of the Artical and Neural Complex Systems , volume 1, pages 184192, 2008. (document) [49] S. Lefkovits. Assessments of building classiers for face detection. In International Conference On Recent Achievements in Mechatronics, Automation, Computer Sciences and Robotics MACRO, pages 175186, 2009. (document) [50] S. Lefkovits. Teaching improvements on Haar-based classiers. In International Conference IETM-3, Petru Maior University, Trgu Mures , , pages 10501060, 2009. (document)

32

BIBLIOGRAFIE

[51] S. Lefkovits. Classication mixture for object detection. In National Conference ZAC Cluj Academic Days, pages 510, 2010. (document) [52] S. Lefkovits. Algritmi de detect , ie facial studiu comparativ. Technical report, Babes ,Bolyai Cluj-Napoca, 2011. (document) [53] S. Lefkovits. Combining boosted global- and part-aspect face detectors. Scientic Bulletin of the Petru Maior University , 8(1):3540, 2011. (document) [54] S. Lefkovits. Numerical computation method of the general distance transform. KEPT 2011 International Conference Knowledge Engineering Principles and Techniques, 1(1):143152, 2011. (document) [55] S. Lefkovits. Numerical computation method of the general distance transform. Studia Informatica Universitatis Babes , -Bolyai, 53(2):6874, 2011. (document) [56] S. Lefkovits. Hybrid face detector based on boosted classiers. In The Eighth Conference of PhD Students in Computer Science, University of Szeged , volume 1, 2012. (document) [57] S. Lefkovits. Improvements on Gabor descriptor retrieval for patch detection. Computing and Informatics, 2012. (document) [58] S. Lefkovits. Novel Gabor lter based patch desciptor. In 10th Jubilee International Symposium on Intelligent Systems and Informatics SISY, IEEE Conference , volume 1, 2012. (document) [59] S. Lefkovits and C. Enchescu. Face detection system based on articial intelligence. In International Conference ICELM,Petru Maior University Trgu-Mures, Computer Science section, Decision Systems, Mathematical Modelling and Statistics , pages 112 121, 2008. (document) [60] B. Leibe. Interleaved Object Categorization and Segmentation . PhD thesis, Swiss Feredral Instituite of Technology Zurich, 2004. [61] R. Lienhart, A. Kuranov, and V. Pisarevsky. Empirical analysis of detection cascades of boosted classiers for rapid object detection. pages 297304. 2003. (document) [62] R. Lienhart, L. Liang, and E. Kuranov. A detector tree of boosted classiers for real-time object detection and tracking. In IEEE ICME2003, pages 277280, 2003. [63] R. Lienhart and J. Maydt. An extended set of haar-like features for rapid object detection. In IEEE ICIP 2002, pages 900903, 2002. (document) 33

BIBLIOGRAFIE

[64] C. Liu. Gabor-based kernel PCA with fractional power polynomial models for face recognition. Pattern Analysis and Machine Intelligence, IEEE Transactions on , 26(5):572 581, may 2004. [65] P. M. Lopez. Object Component Models using Gaobr Filters for Visual Recognition . PhD thesis, Tehnical University Lisabon, 2008. [66] R. A. Lotufo and F. A. Zampirolli. Fast multidimensional parallel euclidean distance transform based on mathematical morphology. Graphics, Patterns and Images, SIBGRAPI Conference on, 0:100, 2001. [67] D. G. Lowe. Distinctive image features from scale-invariant keypoints. International Journal of Computer Vision , 60:91110, 2004. [68] S. Marcelja. Mathematical description of the responses of simple cortical cells. J Opt Soc Am, 70(11):12971300, Nov. 1980. [69] C. R. Maurer, Jr., R. Qi, and V. Raghavan. A linear time algorithm for computing exact euclidean distance transforms of binary images in arbitrary dimensions. IEEE Trans. Pattern Anal. Mach. Intell. , 25:265270, February 2003. [70] A. Meijster, J. B. T. M. Roerdink, and W. H. Hesselink. A general algorithm for computing distance transforms in linear time. In J. Goutsias, L. Vincent, and D. S. Bloomberg, editors, Mathematical Morphology and its Applications to Image and Signal Processing, volume 18 of Computational Imaging and Vision , pages 331340. Springer US, 2002. (document) [71] K. Mikolajczyk and C. Schmid. An ane invariant interest point detector. In Proceedings of the 7th European Conference on Computer Vision, Copenhagen, Denmark , pages 128 142. Springer, 2002. Copenhagen. [72] J. R. Movellan. Tutorial on Gabor lters. (document) [73] J. Mundy. Object recognition in the geometric era: A retrospective. pages 328. 2006. [74] M. J. P. Viola. Fast multi-view face detection. Technical Report TR2003-096, Mitsubishi Electric Research Laboratories, Cambridge, July 15, 2003. [75] D. W. Paglieroni. Distance transforms: Properties and machine vision applications. CVGIP: Graphical Models and Image Processing , 54(1):56 74, 1992. (document)

34

BIBLIOGRAFIE

[76] C. P. Papageorgiou, M. Oren, and T. Poggio. 1998, a general framework for object detection. Computer Vision, 1998. Sixth International Conference on , pages 555562, 1998. (document) [77] D. Pollen and S. Ronner. Phase relationship between adjacent simple cells in the visual cortex. Science, 212:14091411, 1981. [78] E. Robert. A Brief Introduction to Boosting. Proceedings of the Sixteenth International Joint Conference on Articial Intelligence , 1999. (document) [79] A. Rosenfeld and J. Pfaltz. Distance functions on digital pictures. Pattern Recognition, 1(1):33 61, 1968. [80] H. A. Rowley, S. Baluja, and T. Kanade. Rotation invariant neural network-based face detection. pages 3844, 1998. (document) [81] Y. Sato. A Gabor wavelet pyramid based object detection algorithm. In International Symposium on Neural Networks ISNN , 2011. [82] R. E. Schapire and Y. Singer. Improved boosting algorithms using condence-rated predictions. Mach. Learn., 37:297336, December 1999. [83] H. Schneiderman. A Statistical Approach to 3D Object Detection Applied to Faces and Cars. PhD thesis, Robotics Institute, Carnegie Mellon University, Pittsburgh, PA, May 2000. (document) [84] T. Serre, L. Wolf, S. Bileschi, M. Riesenhuber, and T. Poggio. Robust object recognition with cortex-like mechanisms. IEEE Transactions on Pattern Analysis and Machine Intelligence, 29:411426, 2007. [85] L. Shen, L. Bai, D. Bardsley, and Y. Wang. Gabor feature selection for face recognition using improved Adaboost learning. In Proceedings of International Workshop on Biometric Recognition System, in conjunction with ICCV05 , pages 3949, 2005. (document) [86] F. Shih and Y.-T. Wu. The ecient algorithms for achieving euclidean distance transformation. Image Processing, IEEE Transactions on , 13(8):1078 1091, 2004. [87] T. Tamminen and J. Lampinen. Sequential Monte Carlo for bayesian matching of objects with occlusions. Pattern Analysis and Machine Intelligence, IEEE Transactions on , 28(6):930 941, june 2006.

35

BIBLIOGRAFIE

[88] M. Toews and T. Arbel. Detection over viewpoint via the object class invariant. In ICPR 06: Proceedings of the 18th International Conference on Pattern Recognition , pages 765768, Washington, DC, USA, 2006. IEEE Computer Society. [89] M. Toivanen and J. Lampinen. Incremental bayesian learning of feature points from natural images. Computer Vision and Pattern Recognition Workshop , 0:3946, 2009. [90] T. Tuytelaars and K. Mikolajczyk. Local Invariant Feature Detectors: A Survey . Now Publishers Inc., Hanover, MA, USA, 2008. [91] M. Vidal-Naquet and S. Ullman. Object recognition with informative features and linear classication. In ICCV, pages 281288, 2003. [92] P. Viola and M. Jones. Robust real-time object detection. International Journal of Computer Vision - to appear , 2002. (document) [93] D. Vukadinovic and M. Pantic. Fully automatic facial feature point detection using Gabor feature based boosted classiers. In IEEE International Conf. on Systems, Man and Cybernetics 2005 , pages 16921698, September 2005. (document) [94] B. Wang. CMU VASC image database. http://vasc.ri.cmu.edu/idb/images/face/ frontal_images/. [Online; accessed 2012]. (document) [95] X. Wang and H. Qi. Face recognition using optimal non-orthogonal wavelet basis evaluated by information complexity. In Pattern Recognition, 2002. Proceedings. 16th International Conference on , volume 1, pages 164 167 vol.1, 2002. [96] L. Wiskott, J.-M. Fellous, N. Krger, and C. von der Malsburg. Face recognition by elastic bunch graph matching. IEEE Transactions on Pattern Analysis and Machine Intelligence, 19:775779, 1997. [97] Y. Zhou, Y. Li, Z. Wu, and M. Ge. Robust facial feature points extraction in color images. Eng. Appl. Artif. Intell. , 24(1):195200, Feb. 2011.

36

S-ar putea să vă placă și