Sunteți pe pagina 1din 21

Capitolul 2.

DETECIA FEEI

Detectarea feei este primul pas n recunoaterea automat a feei. Fiabilitatea acestui segment are o
influen major asupra performanelor i posibilitilor de utilizare a ntregului sistem de recunoastere
faciala. Avnd n vedere o singur imagine sau un videoclip, un detector de fa ideal ar trebui s fie
capabil s identifice i s localizeze toate feele prezente, indiferent de poziia lor, la scar, orientare,
vrst i de expresie. n plus, detectarea ar trebui s fie realizat indiferent de condiiile de iluminare
i coninutul imaginii video.

Detectarea feei poate fi efectuat pe baza mai multor indicii: culoarea pielii (pentru fe e n imagini
color i clipuri video), micare (pentru fee in videoclipuri), facial / forma capului, aspectul facial, sau
o combinaie a acestor parametri. Cei mai de succes algoritmi de detectare a feei sunt baza i pe aspect
fr a utiliza alte indicii. Prelucrarea se face dup cum urmeaz: O imagine de intrare este scanat n
toate locaiile posibile i apoi mprit ntr-o reea de ferestre (subwindows). Detec ia fe ei este
reprezentat ca model de clasificarea a subwindows n feei i nonfe e. Clasificatorul fa /nonfa este
nvat din exemplele de antrenare cu fee si nonfee prin metode statistice.

Metodele de nvare bazate pe AdaBoost sunt cele mai de succes n ceea ce privete precizia i viteza
de detectare.

1 Antrenarea folosind aspectul feei

Metodele de detectare a feei bazate pe aspect, sunt tratate ca o problem de clasificare a fiecrei
ferestre (subwindow) scanate, ca fiind una din cele dou clase (fa si nonfa ). Aceste metode evit
dificulti n modelarea 3D a structurilor de chipuri prin luarea n considerare a posibilei apariii n
diferite condiii. Un clasificator fa/nonfa poate fi instruit de la un set de antrenare compus din
exemple de fee i nonfee aflate n condiii fireti, naturale de expresivitate (a se vedea Figura 2.1
pentru un eantion aleatoriu de 10 fee i 10 imagini cu nonfe e) . Constituirea unui astfel de
clasificator este posibil, deoarece pixelii de pe o fa sunt puternic corelati, n compara ie cu
ferestrele din imaginiele ce nu conin fee ce prezent mult mai pu in regularitatea.

Cu toate acestea, apar mari variaii determinate de modificri n aspectul facial, iluminare, i de
expresie a varietiilor de fee sau fee/nonfe e limite extrem de complexe. Modificri n vederea
facial (poziia capului) complica i mai mult situaia. Un clasificator neliniar este necesar pentru a
face fa situaiei complicate. Viteza este, de asemenea, o problem important pentru performan n
timp real. Un mare efort de cercetare a fost fcut pentru construirea clasificatorilor complexi rapizi
acestea realiznduse ncepnd cu anii 1990.

Fig. 2.1. Exemple de fee (sus) i nonfee (jos).

Turk i Pentland descrie un sistem de detectare bazat pe analiza componentelor principale (PCA)
reprezentat n subspaiu sau eigenface. ntruct probabilitatea numai n subspaiu PCA este considerat
o metod de baz PCA, Moghaddam i Pentland iau n considerare, de asemenea, probabilitatea n
complementul subspaiului ortogonal. Folosind acest sistem, probabilitatea n spaiul de imagine
(unirea celor dou subspaii) este modelat ca produsul celo dou estimri probabile, oferind astfel o
posibil detectare corect a feei. Sung i Poggio ini ial partiioneaz spaiul imaginii n mai multe
grupuri de fee i nonfee i apoi descompune n continuare fiecare cluster n eigenface i subspaii
nule. Se aplic apoi estimarea Bayesian pentru a obine caracteristici statistice utile. Sistemul lui
Rowley utilizeaz retele neuronale conectate n cascad. Printr-o fereastra glisant, imaginea de intrare
este examinat, dup care trece printr-o etap extins de preprocesare. Osuna se folose te de
antrenarea unui vectorul masin neliniar pentru a clasifica modelele de fe e si nonfe e, i Yang
utilizeaz SNoW (Sparse Network of Winnows-reele rare de ferestre) o arhitectur de instruire pentru
detectarea feei. n aceste sisteme, un algoritm bootstrap este folosit frecvent pentru a colecta exemple
semnificative de imagini cu nonfee antrennd astfel detectorul.

Schneiderman i Kanade utilizeaz informaii multirezoluie pentru diferite niveluri de func ii wavelet.
Un clasificator neliniar fa i nonfa este construit cu ajutorul statisticilor histogramelor calculate din
exemple de fee i nonfee folosind instruirea AdaBoost. Algoritmul de calcul este scump.Folosind
sistemul de cinci detectoare de vedere dureaz aproximativ 1 minut pentru a detecta feele pentru o
imagine de 320x240 pixeli, utiliznd un PC Pentium II n 450MHz.

Viol i Jones au realizat un sistem de detectare a feei rapid, robust n care instruirea algoritmului
AdaBoost este folosit pentru a constituirea clasificatorului neliniar. AdaBoost este folosit pentru a
rezolva urmtoarele trei probleme fundamentale: (1) pentru nvarea caracteristicilor efective dintr-un
set mare de caracteristici; (2) constituirea clasificatorilor simpli, fiecare se bazeaz pe una din
caracteristicile selectate i (3) creterea clasificatorilor simpli pentru a construi un clasificator puternic.
Clasificatori simpli sunt bazai pe caracteristici scalare wavelet Haar simple cum ar fi filtre orientabile.
Viol i Jones face uz de mai multe tehnici pentru calculul eficient al unui numr mare de
caracteristici, n diferite scari i locai, fiind importante pentru performana n timp real. Mai mult
dect att, cascada simplu-la-complex de clasificatori face calcul si mai eficient, respectnd principiile
de respingere patern i de cutare grosier-la-fin. Sistemul lor de detec ie a fe ei cu vizualizare
frontal este primul n timp real, si ruleaza la circa 14 cadre pe secunda la o imagine de 320x240.

Liu prezint o metod Bayesian de Discriminarea a Caracteristici (BDF). Imaginea de intrare, are o
reprezentare uni-dimensional Harr wavelet, iar proieminenele sale amplitudine sunt concatenate
ntr-un vector de intrare extins de 768 dimensiuni. Presupunnd c ace ti vectori urmeaz o distribuie
multivariat normal pentru fa, reducerea liniar a dimensiuni este efectuat pentru a se ajunge la
modurile de rezolvare PCA. Densitatea probabil de fe e este estimat folosind PCA i abaterile prin
utilizarea tehnicilor Bayesiane. Clasa de nonfee este modelat n mod similar. O decizie de clasificare
a feei/nonface se face pe baza celor dou estimri ale densitii. Clasificatorul BDF este raportat
pentru a obine rezultate favorabile care se compara cu algoritmi de recunoa tere a fe ei performan i,
cum ar fi metoda Schneiderman-Kanade. Este interesant de observat c astfel de rezultate bune sunt
realizate cu un singur Gaussian pentru fa si unul pentru nonfa . BDF este instruit cu ajutorul
seturilor de date relativ mici: 600 imagini de fe e FERET i 9 naturale (nonface) imagini astfel
clasificatorul instruit este folosit foarte bine pentru a testa imagini. Cu toate acestea, sunt necesare mai
multe detalii pentru a nelege mecanismul de baz.

Capacitatea de a detecta fee nefrontale este important pentru multe aplicaii reale, deoarece
aproximativ 75% dintre feele existente n fotografiile de acas sunt nefrontale..
Li prezint un sistem compex multivizual de detectare a feei (Multiview). Un nou algoritm de
stimulare, numit FloatBoost, propune includerea cutrii estimrilor din AdaBoost (RealBoost).
Mecanismul backtrack din algoritm permite tergerea clasificatorilor simpli, care sunt ineficien i n
ceea ce privete rata de eroare, conducnd astfel la un clasificator puternic format doar dintr-un numr
mic de clasificatoari simpli. Un set de caracteristici extinse Haar este propus pentru a face o rotaie n
afara planului (stnga-dreapta). O arhitectur grosier-fin, simpl-la-complex, numit detector-
piramid, este conceput pentru detectarea rapid a Multiview. Acest lucru conduce la primul sistem
de detectare a feei Multiview timp real. Se ruleaza pe imagine (320X 240 pixeli) n 200 ms, pe un
procesor Pentium-III de 700 MHz.

Lienhart utilizeaz un set extins de caracteristici Haar pentru a realiza rotaia n plan i antreneaz
detectorul de fa folosind Gentle Adaboost cu un mic arbore decizional CART al clasificatorilor de
baz. Rezultatele arat c aceast combinaie surclaseaz algoritmii Discrete Adaboost.

Pn n prezent antrenarea algoritmilor AdaBoost cu abordarea caracteristici Haar a atins cea mai bun
performan n termeni de precizie i vitez.

2 Preprocesare

2.1 Filtre de culoarea pielii

Pielea umana are propriile sale de distribuie de culoare care difer de cele mai multe obiecte nonfe e.
Acesta poate fi folosit pentru a filtra imaginea de intrare pentru a obine regiuni poten iale de chipuri,
i poate fi, de asemenea, utilizat pentru a construi un detector de fa folosind culoarea pielii pe baza
mediilor speciale. Un algoritm simplu de detectare a feei bazat pe culoare este format n dou etape:
(1) segmentarea regiunilor cu probabile fee i (2) mbinarea regiunilor.

Fig. 2.2. Filtre pentru culoarea pielii. Imagine de intrare (stnga) i filtrat harta culorii pielii (dreapta).

Modelul probabil de culoare a pielii, p(color|face), poate fi derivat din probele de culoarea pielii.
Acest lucru poate fi fcut n spaiu de culoare nuana-saturaie-valoare ( hue-saturation-value HSV),
sau n spaiu de culoare normalizat rou-verde-albastru (RGB). Un model de amestec gaussian pentru
p(color|face) poate duce la o mai bun prelucrare a culorii pielii. Figura 2.2 arat hrta de
segmentare a culoarii pielii. Un pixel de culoarea pielii este gsit cnd probabilitatea p(H|face) este
mai mare dect un prag (0,3), i valorile S i V sunt ntre limitele superioare i inferioare. O hart a
culoarii pielii const dintr-un numr de regiuni de culoare a pielii, care indica o potenial zon cu
fee(candidat). Regiunile rafinate ale faei pot fi obinute prin mbinarea regiunilor candidat pe baza
de culoare i informaiilor spaiale. Postprocesarea Euristic ar putea fi efectuat pentru a elimina
zonele de detecie false. De exemplu, un chip uman conine ochi n cazul n care ochii corespund
regiunilor mai ntunecate din interiorul regiunilor de confruntat.

Dei sistemul de detectare a feei bazat pe culoare poate fi computational atractiv, recunoscnd
culoarea singur, este insuficient pentru a realizarea detectare a feei de nalt precizie. Acest lucru se
datoreaz variaiei mari a culorii faciale ca urmare a iluminarii diferite, umbrei, i grupurilor etnice.
Asfel sa constatat c nivelul tonurilor de gri , mai mult dect de culoare sunt eseniale pentru
detectarea feei. Culoarea pielii este adesea combinat cu caracteristicile micarii pentru a sporii
fiabilitatea detectoarelor de fee la urmrirea video. Cu toate acestea, cele mai de succes sisteme de
detectare a feei nu se bazeaz pe informaii de culoare sau de micare, dar ating o performan destul
de bun.

2.2 Normalizarea imaginii

Metodele bazate pe aspect sunt eficiente pe subferestre cu o dimensiune fix. Prin urmare,
redimensionarea explicit sau implicit (de exemplu, la 20 x 20 pixeli) este necesar. Normalizarea
intensitii pixelilor, ajut la corectarea variaiilor parametriilor imaginii n camere precum i
modificrii condiiilor de iluminare. Sensul de a redimensiona este aparent; operaiunile de
normalizare intensitate, inclusiv normalizare valoare medie. Egalizarea histogramei, i corec iile de
iluminare, sunt descrise mai jos.

O simpl operaie de normalizare a intensitii are o execu ie liniar. O egalizare a histogramei ajut la
reducerea iluminarii extreme (Figura 2.3). ntr-o alt operaiune simpl de corecie a iluminarii,
subfereastra I (x, y) este echipat pentru montarea celui mai bun plan I(x, y) = ax+by+c, n cazul
n care valorile coeficienilor a, b i c pot fi estimai folosind metoda celor mai mici ptrate; i apoi
iluminarea extrem este redus la diferena imaginilor I''(x, y) = I (x, y) - I(x, y) (Figura 2.4). Dup
normalizare, distribuirea de imaginii n subfereastr devine mai compact i standardizat, ajutnd la
reducerea complexitii clasificrii fa/nonfa . Aceste operaiuni sunt "globale", n sensul c to i
pixelii pot fi afectai dup o astfel de operaiune. Normalizarea intensit ii se poate aplica, de
asemenea la subregiunile locale, cum este cazul caracteristicilor locale wavelet Haar.

Fig. 2.3. Efectul de normalizare liniar i egalizare a histogramei. (a) Subferastr original. (b)
Normalizare liniar . (c) Histogram egalizat.

2.3 Reprezentarea Gaussian

Distribuiile de fee si nonfe n subferestre ntr-un spaiu dimensional ridicat sunt complexe. Este
verificat c o singur distribuie gaussian nu poate explica toate variantele. Sung i Poggio propune
rezolvarea acestei probleme complexe prin partiionare datelor de antrenare a fe elor n mai multe
clustere de fee (ase), i datele de antrenare a nonfe elor n mai multe clustere de nonfe e (ase), n
cazul n care numrul clusterelor sunt alese empiric. Gruparea se realizeaz prin utilizarea unui
algoritm modificat k-means bazat pe distana Mahalanobis n spaiul imaginii sau un alt spaiu. Figura
2.5 arat centroizii rezultatelor clusterelor de feei i nonfe e. Fiecare cluster poate fi modelat n
continuare prin componentele sale principale folosind tehnica PCA. Gruparea se poate face si cu
ajutorul analizei factoriale si harta de auto-organizare (self-organizing map,SOM).

Fig. 2.4. Efectul de corecie a iluminarii, (a) Subfereastr cu imagine original I. (b) Cel mai bun plan
de iluminare I. (C) Diferena imaginilor I".

Fig. 2.5.Centroidul imaginilor a ase grupuri de fee (a) i ase grupuri nonfe e (b).

Sa ajuns la concluzia c un numr mic (de exemplu, ase) de distribuii Gaussiane nu sunt suficiente
pentru modelul de distribuie a feelor i chiar mai puin suficiente pentru modelul de distribuie a
nonfeelor. Rezultatele bune sunt realizate folosind o distribuie gaussian unic pentru fa si tot una
pentru nonfa. Cu ajutorul unui nucleu neliniar al clasificatorului vectorului masina i al clasificatorul
BDF fa/nonfa, aceastia sunt antrenai folosind seturi relativ mici de date: 600 imagini de fe e
FERET i 9 imagini naturale (nonfee), generaliznduse se pot testa foarte bine imagini.

3 Retele neuronale i metode de baz kernel

Clasificarea neliniar pentru detectare a feei poate fi efectuat prin intermediul reelelor neuronale sau
metode kernel de baz. Cu metodele neuronale un clasificator poate fi instruit direct folosind
preprocesarea i normalizarea subferestrelor de antrenare a fe elor i nonfe elor. Rowley utilizeaz
preprocesarea 20x20 a subferestrei ca intrare la o reea neuronal. Reeaua are legturi retinale la
stratul de intrare i dou niveluri de cartografiere. La primul nivel al hri avem blocuri de pixeli n
uniti ascunse. Exist 4 blocuri de 10x10 pixeli, 16 blocuri de 5x5 pixeli, i 6 dungi orizontale care se
suprapun pe 20x 5 pixeli. Fiecare bloc este conectat complet la intrarea unei reele neuronale i mapat
la unitile ascunse. Cele 26 de uniti ascunse sunt apoi mapate la unitatea de final la o singur
valoare de ieire, i este luat o decizie final pentru a clasifica subfereastra 20x20 n fa sau nonfa .
Mai multe copii ale aceleiai reele pot fi antrenate i ie irile lor combinate de arbitraj (ANDing).
Intrarea sistemului Sung i Poggio este derivat din grupurile de ase fe e i ase nonfe e. Mai precis,
acesta este un vector de 2 x 6 = 12 distane n subspaii PCA i 2 x 6 = 12 distan e de la subspatii PCA.
Caracteristica vectorului celor 24 de dimensiuni 24 ofer o bun reprezentare de clasificare a
modelelor fa i nonfa. n ambele sisteme, reele neuronale sunt antrenate de algoritmi back-
propagation.

Pentru clasificarea neliniar n cazul detectarii feei o se pot de asemenea folosi antrenarea algoritmilor
kernel SVMs cu exemple de fee i nonfee. Dei astfel de metode sunt capabile s nvee limitele
neliniare, sunt folosii un numr mare de vectori necesari pentru a capta o limit foarte neliniar. Din
acest motiv, performanta rezolvarii n timp real a fost pn acum o dificultate cu antrenarea
clasificatorilor SVM.

4 Metode de baz AdaBoost

Pentru antrenarea a lgoritmului AdaBoost, un complex i puternic clasificator neliniar


H M (x) este

realizat ca o combinaie liniar de M clasificatoare simple, uor construibile cu ajutorul formulei de


mai jos:

hm (x) {1, +1}, M fiind clasificatorii


unde x este un ablon care urmeaz s fie clasificat,
M

slabi,
m 0 sunt coeficienii de combinarea n R i m este factorul de normalizare. n
m=1

versiunea discret,
hm (x) ia o valoare discret ntre {1, +1}, n timp ce n versiunea real, ieirea

hm (x) este un numr n R. H M (x) este valorea real, dar eticheta clasei de predictie pentru x
lui

se obine ca y ( x)=sign[ H M ( x )] i rezultatul final al normalizrii este | H M (x)|.

Procedura de nvare, AdaBoost are ca scop antrenarea celei mai bune secvene clasificatorii slabi
hm (x) i combinarea celor mai bune ponderi m . Un set de exemple de antrenare N={( x 1 ,

y 1 ),...,( x N , y N )} este presupus disponibil, unde y i {+1, 1} este eticheta de clasa a

exemplelor x i R n . Distribuia exemplelor de antrenare [w1 , , w N ] , unde wi este

x i , y i ), se calculeaz i se actualizeaz n timpul de


asociat cu un exemplu de antrenare (
antrenare pentru a reprezenta distribuia exemple de instruire. Dup aceia iteraiei m, a exemplelor (
x i , y i ), greu de clasificat sunt date ponderi mai mari (m)
wi , astfel nct, la iteraia m+1,
accentul este pus mai mult pe aceste exemple. AdaBoost presupune c o procedur este disponibil
pentru a nva un clasificator slab
hm (x) din exemplele de antrenare, avnd n vedere reparti ia lui

w(m)
i .

hm (x)
Activitatea de detecie a feei dup Viola i Jones, presupune c un clasificator slab

{1,+1}este obinut prin segmentarea caracteristicilor scalare a imaginii


z k (x) R dintr-un set

complete wavelet Haar. n versiunile reale ale AdaBoost, cum ar fi RealBoost i LogitBoost, valorile
hm (x) R pot fi, de asemenea, constituite din z k (x) R.
reale ale clasificatorului slab

4.1 Caracteristici Haar

Viol i Jones propun patru tipuri de funcii de baz de scalare pentru detectarea feei, aa cum se
prezint n figura 2.6. Astfel o caracteristic bloc este situat ntr-o subregiune a unei ferestre i variaz
n funcie de forma , mrimea i localizarea din interiorul ferestrei. Pentru o fereastr de dimensiuni
20x20, pot exista zeci de mii de astfel de caracteristici pentru diferite forme, marimi si locatii.

Caracteristica k, avnd o valoare scalar


z k (x) R, poate fi considerat o transformare din

spaiul ndimensional (n = 400, dac un exemplu de fa x este de dimensiune 20x20) la linia real.
Aceste numere scalare formeaz un set extrem de complet de caracteristici pentru modelul intrinsec de
fa de dimensiuni sczute. De curnd, seturi extinse de caracteristici, au fost propuse pentru a face
rotaia capului n afara planului ct i de rotaia n planul capului.

Fig. 2.6. Patru tipuri de caracteristici dreptunghiulare wavelet Haar. O caracteristic este un scalar
calculat prin insumarea pixelilor din regiunea alb i scderea celor din regiune ntunecat.

Aceste caracteristici Haar sunt interesante pentru dou motive: (1) clasificatorii puternici fa /nonfa
pot fi constituii pe baza acestor caracteristici i (2) acestea pot fi calculate eficient folosind tabelul cu
suma ariilor sau tehnica imagini de ansamblu.

Imaginea integrant (summed-area table) II (x, y), de la locaia x, y conine suma de pixeli de mai sus
i la stnga de x, y, definit ca
Imaginea poate fi calcul ntr-o singur trecere peste imaginea original, utiliznd urmtoarea pereche
de relaii de recuren

unde S(x, y) este suma rndurilor cumulative, S(x,-1)=0 i ) II (-1, y)=0. Folosind imaginea
integrant, orice sum dreptunghiular poate fi calculat n patru matrici de referin, cum este ilustrat
n figura 2.7. Utilizarea de imagini integrante duce la economii enorme n calcul pentru caracteristici
de la diferite locaii i scale.

Fig. 2.7. Suma pixelilor din dreptunghiul D poate fi calculat cu cele patru martici de referin .
Valoarea imaginii integrante la poziia 1 este suma pixelilor din dreptunghiul A. Valoarea la pozi ia 2
este A+B, la locatia 3 este A+C, si la poziia 4 este A+B+C+ D. Suma n cadrul D poate fi calculat ca
(4+1) (2+3).

Cu imaginile integrante, variaia intensitii n dreptunghiul D de orice dimensiune i orice locaie

poate fi calculat eficient; de exemplu, V D = VV unde V = (4+1) (2+3) este suma n D,


i o simpl intensitate normalizat se poate face prin mprirea la toate valorile pixelilor din
subfereastra de procesat.

4.2 Construcia Clasificatorilor slabi

Dup cum sa menionat mai nainte, procedura de nvare AdaBoost are ca scop de antrenarea o
hm (x) i combinarea ponderilor
secvenial a celor mai buni clasificatori slabi pentru a combina

m n ecuaia (1). Acesta rezolv urmtoarele trei probleme fundamentale: (1) nva
caracteristicile efective dintr-un set mai mare; (2) formarea clasificatorilor slabi, fiecare baznduse pe
una din caracteristicile selectate; i (3) prelucrarea clasificatorilor slabi pentru a construi un
clasificator puternic.
Adaboost presupune c procedur "weak learner" este disponibil. Procedura trebuie s selecteze
caracteristica cea mai important dintr-un set de caracteristici candidate, avnd n vedere c,
clasificatorul puternic curent a nvat pn acum, i apoi cel mai bun clasificator slab se va combina
cu clasificatorul puternic existent.

n cazul AdaBoost discret, cel mai simplu tip de clasificatoarelor slab este un "ciot". Un ciot este un
arbore de decizie cu un singur nod. Cnd caracteristica este real (real-valued), un ciot poate fi
construit de valoarea caracteristici selectate la un anumit prag; cnd caracteristica are o valoare
discret (discret-valued), acesta poate fi obinut n funcie de evaluarea discret a caracteristici. Un
arbore de decizie mai general (cu mai multe noduri) compus din mai multe cioturi duce la un
clasificator slab mai sofisticat.

Pentru AdaBoost discret, un ciot poate fi construit n modul urmtor. S presupunem c am construi M
1 clasificatorilori slabi {
hm (x)|m = 1,...,M 1 } i vrem s construim
h M (x). Ciotul


M k
(x) { 1+1 } este determinat prin compararea caracteristici selectate z (x) cu
h

M dup cum urmeaz


un prag

k
h M (x) este determinat de doi parametri: caracteristic scalar
n aceast form, z i pragul

M . Cele dou pot fi determinate de unele criterii, de exemplu, (1), eroarea de clasificare minim

ponderat, sau (2), cea mai sczut rat de alarm fals la o anumit rat de detecie.

Pentru a minimiza eroarea de clasificare ponderat cu caracteristici de valori reale, trebuie s alegem
M R pentru fiecare z k minimiznd corespunztor eroarea ponderat fcut de ciot cu
un prag

k
aceste caracteristici, vom alege apoi cea mai bun caracteristic z dintre toate k ajungnd la cea

mai mic eroare ponderat.

M zk
Pentru cea mai bun performan, putem stabili un prag pentru fiecare astfel rata de

detecie specificat (cu privire la w M1 ) este realizat de ctre h M (x), corespunztoare perechii

z k , k ). Avnd n vedere acest lucru, rata de alarme false (de asemenea, cu privire la w
M1
( ), ca
k
urmare a acestei noi
h M (x) poate fi calculat. Cea mai bun pereche ( k , ) i valoarea
z

h M (x) duc la cea mai mic rat de alarme false.

Nu exist nc un alt parametru care poate fi reglat la echilibru ntre rata de detecie i rata de alarme

false: Clasa estimat de predicie y ( x)=sign[ H M ( x )] este obinut prin segmentarea

clasificatorului puternic
h M (x) la valoarea pragului implicit 0. Cu toate acestea,

y ( x)=sign[ H M ( x )T M ] cu o alt valoare


T M , pot fi reglate pentru echilibru.

Forma ecuaiei (6) este pentru Discrete AdaBoost. n cazul versiunilor reale de AdaBoost, cum ar fi
RealBoost i LogitBoost, un clasificator slab ar trebui s fie cu valori reale sau ieirea clasei de
evaluare s fie cu valori probabile. Pentru modelul cu valori reale, un clasificator slab poate fi
construit ca raportul de probabilitatea calculate de la histograma de valoari caracteristice celor dou
clase.

4.3 Realizarea Clasificatorului puternic

AdaBoost nva o secven a clasificatoarelor slabe


hm i le marete ntr-unul puternic HM

H M . Limita
eficient prin minimizarea limitei superioare de eroare de clasificare realizat de ctre
poate fi derivat ca funcie de urmtoarele pierderea exponenial

unde i este indicele exemplelor antrenate. AdaBoost realizeaz


hm (x) (m = l ,..., M), prin

M 1

minimizarea inteligent a ecuaiei (7). Avnd n vedere actuala


H M 1 (x) = m hm (x), i
m=1

h M , coeficientul cu cea mai bun combinaie m pentru noul


recentul clasificator slab nvat

clasificator puternic
H M (x)= H M1 (x)+ M h M (x) reduce la minim costul

Minimizarea este
Unde
M este rata de eroare ponderat

unde 1 [C] este 1 dac C este adevrat i 0 n caz contrar.

Fiecare exemplu este calculat dup o iteraie, w M1


i i este actualizat n funcie de performana de

clasificare
HM :

care este utilizat pentru calcularea eroari ponderate sau un alt cost pentru antrenarea clasificatorului
slab n urmtoarea rund. n acest fel, un exemplu mult mai dificil este asociat cu o dimensiune mai
mare, deci este mult mai accentuat n urmtoarea rund de nvare. Algoritmul este rezumat n
Figura 2.8.

Fig. 2.8. Algoritm de nvare AdaBoost.

4.4 Algoritm de nvare FloatBoost

AdaBoost a ncercat sporirea acuratei a unui ansamblu de clasificatoari slabi. Algoritmul AdaBoost
rezolv multe din dificultile practice de cre tere incipient a algoritmi. Fiecare clasificator slab este
instruit corespunztor pentru minimizarea eroari empirice n funcie de evolu ia celor instruii anterior.
Este demonstrat c AdaBoost are o procedur secvenial nainte de cutare folosind strategia de
selecie lrgite pentru a minimiza de o anumit marj a setului de antrenare.
O ipotez crucial euristic utilizat n astfel de proceduri secveniale este cutare nainte este
uniformitate (de exemplu, adugarea unui clasificator slab nou la actualul set nu scade valoarea
criteriului de performan). Premisa oferit de procedura secvenial n AdaBoost se stric atunci cnd
aceast ipotez este nclcat (de exemplu, cnd funcia criteriului de performan este nemonoton).

Cautarea la suprafa este o procedur de selecie secvenial caracteristica de revenire (backtracking),


menit s se ocupe cu funcia raionamentului neuniform a caracteristici criteriului de selecie. Metod
selecie secveniale directe, cum ar fi cutare secvential nainte sau secvenial napoi adaug sau terge
o trstur la un moment dat. Pentru a face acest lucru bine, proprietatea uniformit ii trebuie s fie
ndeplinite de ctre funcia criteriului de performan. Caracteristica de selec ie a criteriului
raionamentului neuniform poate fi tratat folosind o tehnica mult mai sofisticat, numit plus--
minus-r, care adaug sau terge caracteristici i apoi urmrete napoi r paii.

Metodele cutari secveniale la suprafa nainte (SFFS) permite ca numrul de pai de revenire
controlai s fie stabilii n prealabil. Concret, se adaug sau terge o singur ( = 1) trstur i, apoi
se revine cu r pai, unde r depinde de situaia actual. Aceasta este o adaptabilitate care dep e te
limitarile datorate problemei neuniformitii. mbuntirea privind calitatea caracteristicilor selectate
este realizat cu costuri de calcul a crescute din cauza cutarii extinse. Algoritmul SFFS funcioneaz
bine n mai multe aplicaii.

H
HM h1 hM
Dac ={ ,..., } este actualul set de clasificatoari slabi M , J ) este criteriul

min
msurilor costului total (de exemplu, rata de eroare) ai funciei de clasificare
H M , i Jm este
costul minim nregistrat pn n prezent cu o combinaie liniar a clasificatoarelorilor slabi m a cror
valoare foarte mare este stabilit iniial nainte de a ncepe iteraia.

Procedura de nvare a algoritmului FloatBoost este prezentat n Figura 2.9. Acesta este compus din
mai multe pri: intrarea de antrenare, de initializare, includerea dinainte, excluderea condiional, i
ieire. La pasul 2 (includerea dinainte), se adaug o la un moment dat, cele mai semnificative
clasificatoare slabe ca i n cazul algoritmului AdaBoost. La pasul 3 (excluderea condiionat),

FloatBoost ndeprteaz cel mai nesemnificativ clasificator slab din setul curent
HM al
min
clasificatorilor slabi, aceast condiie de nlturarea conduce la un cost mai mic dect J M 1 .

H M , apoi hm , , h M 1 i m
Presupunnd c clasificator slab a fost eliminat m'-lea n
trebuie s fie reantrenat. Aceti pai se repet pn cnd nu mai sunt mutari.

Pentru detectarea feei, costul acceptabil J* este riscul maxim admisibil, care poate fi definit ca o sum
ponderat a ratei de lips de detecie. Algoritmul se termin atunci cnd costul este de mai jos J* sau
M numrul maxim de clasificatoari slabi este atins.

FloatBoost are nevoie de obicei de un numr mai mic de clasificatoari slabi dect AdaBoost pentru a
atinge un anumit obiectiv, valoarea funciei J*. Bazat pe aceast observaie, avem are dou opiuni:
(1)Utilizarea clasificatorului antrenat puternic FloatBoost cu clasificatori mai slabi pentru a obine
performane similare celor folosind AdaBoost instruit cu clasificatori mai slabi; (2) continuarea
antrenrii lui FloatBoost pentru a aduga mai multi clasificatori slabi, chiar dac performana pe datele
de antrenare nu crete. Motivul pentru luarea n considerare a opiunii (2) este c, chiar dac
performana nu se mbuntete pe datele de antrenare, adugnd clasificatori mai slabi aceasta poate
conduce la mbuntiri pe date de testare, cu toate acestea, cel mai bun mod de a determina ct de
muli clasificatori slabi se pot utiliza pentru FloatBoost, precum i AdaBoost, este s se utilizeze un set
de validare pentru a genera o curb de performan i apoi se alege cea mai bun valoare.

Fig. 2.9. Algoritm FloatBoost.

4.5 Clasificatori puternici n cascad

Un clasificator puternic amplificat elimina n mod eficient o mare parte din subferestrele nonfe e
meninnd n acelai timp o rat de detecie ridicat. Cu toate acestea, un singur clasificator puternic

nu poate satisface cerina unei rate extrem de sczute a alarmelor false (de exemplu, 106 sau chiar

mai mici). O soluie este de a folosi mai multe detectoare (clasificatore puternice), de exemplu,
folosind operatorul AND.
Fig. 2.10. O cascad de n clasificatori puternici (SC). Intrare este o subfereastr X. Modelul de fa F
este trimis la urmtorul SC de clasificare numai dac a trecut de toate SC-urile anterioare, altfel iese ca
nonfaa (N). X n cele din urm este considerat a fi un chip atunci cnd trece prin toate cele n SC-uri.

Viol i Jones extinde n continuare aceast idee de antrenare n cascad formnd cascade de
clasificatoari puternici, cum este ilustrat n Figura 2.10. Un clasificator puternic este antrenat folosind
exemple bootstrapped de nonfee care trec prin cascade anterior antrenate. De obicei, sunt n cascad
10-20 clasificatori puternici. Pentru detectarea feei, subferestrele care nu reuesc s treac de un
clasificator puternic nu sunt prelucrate ulterior de ctre clasificatori puternici rma i. Aceast strategie
poate creste semnificativ viteza de detecie si duce la reducerea alarmelor false, cu un sacrificiu mic al
ratei de detectie.

5 Confruntarea cu rotaia capului

Metoda de detectare a feei Multiview ar trebui s poat detecta feele nefrontal. Exist trei tipuri de
rotaii ale capului: (1) rotaie (out-of-plan) n afara planului (stnga-dreapta), (2) rotaie n plan i (3)
rotaie din cap sus-i-jos. Adoptnd o strategie grosier-la-fin de a vizualiza-partiia, arhitectura
detector-piramid const din mai multe niveluri de la nivel superior grosier la nivelul inferior fin.

Rowley propune utilizarea a doi clasificatoari de reele neuronale pentru detectarea frontal a fe ei
supuse rotaie n plan. Primul este rutarea reelei , antrenate pentru a estima orientarea fe ei asumate n
subfereastr, dei fereastra poate conine un model nonfa . Intrrile reelei dintr-o subfereastr 20x20
au intensitatea valorilor preprocesate. Unghiul de rotaie este reprezentat de o serie de 36 uniti de
ieire, n care fiecare unitate reprezint un interval unghiular. Cu estimarea orientri, subfereastra este
oprit din rotire pentru poteniala poziie vertical a fe ei. A doua reea neuronal este un detector de
fa frontal, normal, de poziie vertical.

Li a construit un detector-piramid pentru a detecta prezena drept a chipurilor, avnd planul de


rotaie exterior n intervalul = [90 ,+ 90 ] i rotaia n plan n intervalul = [45, +45].
Rotaie n plan = [45, +45] pot fi tratate dup cum urmeaz: (1) mprirea lui n trei
1 2 3
subintervale: = [45,15], = [15,+15] i = [+15,+45]. (2) se aplic
detector-piramida pe imaginea original i dou imagini derivate din original; cele dou imagini sunt
obinute prin rotirea originalului n planul imaginii de 30 (Figura 2.11). Acest lucru se refer n
mod eficient la planul de rotaie de [45,+45]. Rotaiea din cap sus-jos este tratat de tolerana
detectoarelor de fa.
Fig. 2.11. La mijloc: Imaginea conine subieci cu fee n planul rotaie. La stnga i la dreapta: n-plan
rotit cu 30 .

Proiectarea unui detector-piramida folosete strategia grosier-la-fin i simplu-la-complexul.


Arhitectura este ilustrat n Figura 2.12. Acest design arhitectural este pentru detectarea de chipuri care
2
fac obiectul out-of-plan, cu rotaia = [90 ,+ 90 ] i rotaia n plan = [15,+15]. Rotaia
complet n plan = [45, +45] este tratat prin aplicarea unui detector-piramida pe imaginea rotit
cu 30 .

Fig. 2.12. Detector-piramid Multiview pentru detectarea feei.

Grosier-la-fin Partiiile de rotaie n afara planului pentru trei niveluri ale detectorului-piramida sunt
ilustrate n Figura 2.13. La trecerea de la grosier la fin, ntreaga gam de unghiuri de rotaie ( ) out-
of-plan sunt mprite n domenii din ce n ce mai nguste. Dei nu exist suprapuneri ntre intervale la
fiecare nivel, exist un detector de fa instruit pentru a vizualiza feele vecine. Prin urmare, ne
confruntm cu detectarea pe apte canale la nivelul inferior al unui detector-piramida ce trebuiesc s
fie unite pentru a obine rezultatul final. Acest lucru este ilustrat n Figura 2.14.
Fig. 2.13. Partiie vizualizat n afara planului (Out-of-plan). Rotaie cap Out-of-plan (rndul 1),
evaluare vizualizare facial (rndul 2), i vizualizare partiie grosier-la-fin la nivelul trei al
detectorului piramida (rndurile 3-5).

Simplu-la-complex Un numr mare de rezultate de scanare a imaginii de intrare in subferestre. De


exemplu, pot exista zeci de sute de mii de scanri pentru o imagine de dimensiune 320x240, numrul
real, depinde de modul n care imaginea este scanat (de exemplu, n ceea ce privete factorul de
cretere scal). Pentru creterea eficienei, este esenial s se elimine subferestrele cu multe posibile
nonfee , ct mai devreme posibil, astfel nct subferestrele posibil cu fe e, sunt prelucrate n
continuare n etapele ulterioare. Prin urmare, detectoare n stadii incipiente sunt concepute pentru a fi
simple, astfel nct acestea s poat respinge subferestrele nonfe e cu calcule rapide i puine, n timp
ce de la etap urmtoare detectoarele sunt mai complexe i necesit mai mult de calcul.

Fig. 2.14. mbinarea canalelor diferite. De la stnga la dreapta: Canale de vizualizare fe e fontale,
stnga, dreapta, iar rezultatul final dup mbinare.

6 Postprocesarea

O singur fa ntr-o imagine poate fi detectat de mai multe ori n locatii apropiate sau pe scri
multiple. Alarmele false pot s apar, dar de obicei este mai mic consistena detectiilor de fa e
multiple. Numar de detectii multiple n locaii vecine poate fi utilizat ca o indicaie eficace pentru
existena unei fee la acea locaie. Aceast presupunere elemente euristice pentru rezolvarea
ambiguitii cauzate de detectarea i eliminarea mai multor detectii multe false.

O detectie este confirmat, dac numar de detectii multiple este mai mare dect o anumit valoare, i
avnd n vedere confirmarea, detectiile multiple sunt mbinate pentru consisten a unui tot unitar. Acest
lucru este practicat n majoritatea sistemelor de detectare a feei. Figura 2.15 prezint o fotografie.
Imaginea din stnga arat o ieire tipic de detec ie iniial, n cazul n care fata este detectat de patru
ori cu patru alarme false pe pnz. Pe dreapta este rezultatul final dup prelucrare. Dup
postprocesare, detectiile multiple sunt unite ntr-o singur fa i alarmele false sunt eliminate. Figurile
2.16 i 2.17 arat cteva exemple tipice frontale i Multiview de detectare a feei; imaginile de fe e
Multiview sunt din baza de date a Carnegie Mellon University (CMU).
Fig. 2.15. Prelucrarea deteciilor multiple.

7 Evaluarea performantelor

Rezultatul de detectare a feei de la o imagine este afectat de cele dou componente de baz:
clasificatorul fa/nonfa i postprocesarea (fuziunea). Pentru a intelege cum functioneaza sistemul, se
recomand ca cele dou componente s fie evaluate separat, cu dou tipuri de date de antrenare. Prima
const din pictograme de o dimensiune fix (folosite pentru antrenare). Acest proces are scopul de a
evalua performana clasificatorilor fa/nonfa (incluznd preprocesarea), fr a fi afectat comasarea.
Al doilea tip de date de testare este format din imagini normale. n acest caz, rezultatele de detectare a
feei sunt afectate de clasificatorii instruii i care fuzioneaz; performana sistemului global este
evaluat.
Fig. 2.16. Rezultatele de detectare a feei frontal.

7.1 Msuri de performan

Performan detectari feei este n primul rnd msurat prin dou rate: rata corect de detectie (care
este de 1 minus ritmul de detecie) i rata de alarme false. Performana poate fi observat prin trasarea
curbelor caracteristice pe receptorul de operare (ROC). Figura 2.18 arat un tipic curba ROC pentru
detectarea feei. Un sistem ideal de detectare a feei ar trebui s aib o rat de detecie de 100%, cu o
rat de alarm fals de 0, dei, n general n sistemele actuale nu se poate realiza acest lucru. n
sistemele practice, creterea ratei de detecie este de obicei nsoit de o cretere a ratei de alarme
false. n cazul n care o funcie poten ial este folosit pentru a distinge ntre subferestrele feei i
nonfeei, cu o valoare de ieire mare indicnd de detectare a feei i cu o valoare mic pentru nonfe e,
un compromis ntre cele dou rate se poate face prin ajustarea pragului decizional. n cazul AdaBoost
metoda de nvare, pragul de ecuaia. (1) este antrenat de la pictograme de fa de instruire i de
pictograme bootstrapped nonfee. Deci un ritm specificat (de obicei, rata de alarme false) este sub
control pentru setul de antrenare.
Fig. 2.17. Rezultatele de detectare a feei Multiview.

Fig. 2.18. Curba tipic ROC pentru detectarea feei.

7.2 Compararea algoritmilor Stimularea-Based

Metode de baz AdaBoost (cu caracteristici locale wavelet Haar), pn acum au furnizat cele mai bune
solutii de detectare a feei n ceea ce privete ratele statistice i de vitez. Acestea ofer o evaluare
comparativ pe algoritmi de stimulare (DAB: discret Adaboost; RAB: Real Adaboost; i GAB: blnd
(gentle) Adaboost), folosind diferite seturi de antrenare i diferi i clasificatori slabi. Rezultatele ofer
referine empirice pentru ingineri de detectare a feei.

Stimularea Algoritmilori

Exist 20 de nivele de clasificatori n cascad care au fost antrenati cu DAB, RAB, i GAB utiliznd
setul de caracteristici Haar ale lui Viola i Jones i cioturi de clasificatori slabi. Este raportat c GAB a
depit creterile celorlali doi algoritmi ; de exemplu, la o rat absolut de alarme false de 10 pe set de
antrenare CMU, RAB au detectat doar 75,4% i DAB doar 79,5% din toate feele frontale, i GAB a
realizat 82,7% la un factor de rescalare de 1,1. De asemenea, un factor de redimensionarea mai mic de
1,1 pentru imagini scanate a fost benefic o rat de detecie ridicat. De exemplu, la 10 alarme false pe
setul de testare CMU, GAB a imbunatatit rat de detecie de 68,8% la 82,7% cnd factorul de
redimensionarea a sczut de la 1.2 la 1.1.

Clasificatorilori Slabi : Arbori versus cioturi

Cioturile sunt de tipul arbori simpli clasificatori slabi (WCs), care pot fi utilizate n discret AdaBoost.
Un ciot, la fel ca n ecuaia (6), este un arbore cu singur nod care nu permite nvarea dependen a
caracteristicilor. n general, pentru dependen a modelului pentru n noduri scindate sunt necesare n - 1
variabile. Tabelul 2.1 compar arborele clasificatoarilor slabi CART cu diferite numere de noduri n
ceea ce privete eficacitatea respingerii subferestrelor nonfe e. Este de observat c RAB este cel mai
eficient.

Tabelul 2.1. Numrul mediu de caracteristici evaluate pe subferestre nonfe e de mrimea 20x20

Caracteristici Haar de baz fa de extinse

Dou sisteme de detectare a feei au fost instruite: unul cu caracteristica de baz Haar, cu setul Viola i
Jones i unul cu caracteristica extins Haar, stabilind adugarea de caracteristicile de baz Haar la
rotirea versiuni. n medie, rata de alarme false a fost de aproximativ cu 10% mai mic pentru setul de
caracteristici extinse Haar. n acelai timp, complexitatea de calcul a fost comparabil. Acest lucru
sugereaz c, cu ct setul de caracteristici Haar este mai complex, cu att cre te i memoria n faza de
antrenare, ctigul fiind obinut pentru faza de detectare.

Dimensiunea subferestrei

Diverse dimensiuni ale subferestrei, variind de la 16x16 pana la 32x32, au fost folosite pentru
detectarea feei. Experimentele arat c o dimensiune a subferestrei de 20x20 atinge cea mai mare rat
de detecie de la un numr absolut de alarme false ntre 5 i 100 pe setul de chipuri frontale de test
CMU. O dimensiune a subferestrei de 24x24 a fost mai bun pentru mai puin de cinci alarme false.

8 Concluzii
Detecia feei este primul pas n recunoaterea automat a feei ct i n alte aplicaii i elementele
biometrice integrate din managementul multimedia. Avnd n vedere complexitatea varieta olor feei i
nonfeei, de detectarea feei foarte precise, cu o rat de detecie ridicat i rata sczut alarm fals a
fost o provocare. Acum, aceast problem dificil a fost aproape rezolvat pentru a ndeplini cerinele
minime ale celor mai multe aplicaii practice.

Metode de nvare AdaBoost de baz pentru detectarea feei au fost mai eficiente dect cele
dezvoltate pn n prezent. n ceea ce privete detectarea i ratele de alarm fals, ele sunt comparabile
cu metoda de reele neuronale a lui Rowley, dar sunt de mai multe ori mai rapide.

n ceea ce privete abordarea AdaBoost, urmtoarele concluzii pot fi trase n ceea ce privete seturile
de caracteristici, stimularea algoritmilor, clasificatorii slabi, dimensiunea subferestrelor, i mrimea
setului de antrenare n funcie de studiile raportate:

Un set complet de caracteristici Haar sunt eficiente pentru detectarea feei. Utilizarea metodei de
calcul a imagini integrante a acestor caracteristici eficiente atinge invarianta la scar. Caracteristicile
extinse Haar, ajut la detectarea feelor nefrontale.

Antrenarea algoritmului AdaBoost poate selecta cel mai bun subset de caracteristici mari construind
un clasificator neliniar puternic.

Structura cascad mbuntete semnificativ viteza de detectare i reduce n mod eficient alarmele
false, cu un sacrificiu mic al ratei de detectie.

FloatBoost eficient mbuntete stimularea rezultatelor de nvare. Acestea rezult ntr-un


clasificator care are nevoie de mai puini clasificatori slabi dect cei obinu i cu ajutorul AdaBoost
pentru a atinge o rat de eroare similar, sau mai mic. Versiunile mai putin performante de Adaboost,
cum ar fi GentleBoost i LogitBoost, pot fi preferabile n locul lui Adaboost discrete i real n relaiile
cu datele de antrenare care pot conine aberani.

Dimensiunea optim subwindow de intrare pentru detectare a feei frontal pare a fi 20x20.

Dei tehnologia de detectare a feei este acum suficient de avansat pentru a ndeplini cerinele minime
ale multor aplicaii practice, este necesar mult studiu pentru detectare automat a feei obinnd
performane comparabile cu performanelor umane. Abordarea Haar AdaBoost este eficace i
eficient. Cu toate acestea, abordarea actual a ajuns aproape de limita de rezolvare. n acest sens mai
sunt posibilele mbuntiri prin proiectarea seturilor suplimentare de caracteristici care sunt
complementare celor existente i de a adopta tehnici mai avansate de antrenare, care ar putea duce la
clasificatoari mai complexi evitnd n acelai timp problema overfitting.

S-ar putea să vă placă și