Documente Academic
Documente Profesional
Documente Cultură
Studiu comparativ
Universitatea Politehnica Bucureti
Facultatea de Automatic i Calculatoare
Departamentul de Automatic i Ingineria Sistemelor
LUCRARE DE CERCETARE
Detecia i urmrirea obiectelor.
Studiu comparativ
Masterand
Cricon Iulian
Coordonator
Conf.dr.ing. Ciprian Lupu
Bucureti, 2014
Detecia i urmrirea obiectelor. Studiu comparativ
Abstract:
Scopul acestei lucrri este de a revizui metodele de identificare i de urmrire de
ultim or, de a le clasifica n diferite categorii si de a identifica noile tendine.
Identificarea i urmrirea obiectelor, n general, este o problem dificil. Dificulti n
urmrirea obiecte pot aprea ca urmare a micrilor brute, a schimbrii aspectelor att
ale obiectului ct i ale mediului, ale folosirii unor structuri de obiecte non-rigide sau
datorit ocluziei obiectelor i a micarii camerei.
Urmarirea este efectuat n contextul unor aplicaii de supervizare care necesit
locaia i / sau forma obiectului n fiecare cadru. De obicei, ipoteze sunt fcute pentru a
constrnge problema de urmrire n contextual unei anumite aplicaii.
n acest studiu, clasificm metodele de urmrire pe baza obiectului i ale
tipologiilor de cadru i oferim descrieri detaliate ale metodelor reprezentative din fiecare
categorie, examinnd avantajele i dezavantajele. Mai mult de att, vom discuta despre
problemele importante legate de urmrire, inclusiv utilizarea caracteristicilor adecvate
ale imaginilor, de selecia modelelor de micare, i de detecia obiectelor.
Detecia i urmrirea obiectelor. Studiu comparativ
CUPRINS
1. Introducere ......................................................................................................................................... 4
2. Reprezentarea obiectelor ................................................................................................................... 6
3. Selectarea caracteristicilor pentru urmrire ....................................................................................... 9
4. Detectarea obiectelor ....................................................................................................................... 12
4.1 Detecia punctelor .......................................................................................................................... 12
4.2 Modelarea fundalului ...................................................................................................................... 14
4.3 Segmentarea ................................................................................................................................... 18
4.3.1 Translaia la medie ................................................................................................................... 18
4.3.2 Reduceri de graf ................................................................................................................ 19
4.3.3 Contururi active ........................................................................................................................ 20
4.4 Clasificatori supervizai .............................................................................................................. 22
4.4.1 Stimularea adaptiv .................................................................................................................. 23
4.4.2 Mecanisme de vectori suport ............................................................................................... 24
5. Urmrirea obiectelor ......................................................................................................................... 25
6. Concluzii ............................................................................................................................................ 26
7. Bibliografie ............................................................................................................................................ 27
Detecia i urmrirea obiectelor. Studiu comparativ
1. Introducere
Urmrirea obiectelor este o sarcin important n domeniul computer vision.
Proliferarea calculatoarelor de mare putere, disponibilitatea camerelor video de nalt
calitate, precum i nevoia tot mai mare a unei analize video automate a generat un mare
interes n algoritmii de urmrire a obiectelor. Identificm trei etape cheie n analiza
imaginilor: detectarea obiectelor n micare relevante, urmrirea acestor obiecte cadru
cu cadru i analiza obiectelor urmrite pentru a identifica comportamentul lor. Prin
urmare, utilizarea algoritmilor de urmrire este pertinent pentru operaiile de:
- recunoaterea micrilor, care reprezint n fapt, identificare oamenilor bazat pe
mers, detecia automat a obiectelor etc;
- supraveghere - automat, care const n monitorizarea unei scene pentru a detecta
activiti suspecte sau evenimente improbabile;
- indexare video - adnotare i recuperare coninut multimedia automat n baze de
date;
- interaciune om - calculator, care presupune recunoaterea gesturilor, urmrirea
ochilor pentru introducerea n sisteme de calcul;
- monitorizarea traficului, ce presupune colectarea n timp real a statisticilor de trafic
pentru direcionarea i monitorizarea fluxul de trafic;
- sistem de navigaie cu capabiliti de planificare a traseului i de evitare a
obstacolelor n timp real bazat pe video;
n forma sa cea mai simpl, urmrirea poate fi definit ca problema de estimare a
traiectoriei unui obiect n planul imaginii, n timp ce se deplaseaz ntr-un mediu. Cu
alte cuvinte, obiectelor urmrite le este atribuit contant o etichet n diferite cadre ale
unui video. n plus, n funcie de domeniul de urmrire, se pot obine, de asemenea,
informaii referitoare la obiect, cum ar fi orientarea, aria, sau forma. Obiecte urmrite
poe fi complexe datorit:
- pierderilor de informatii cauzate de proiecie 3D pe o imagine 2D;
- zgomotul din imagini;
- micri complexe ale obiectului;
- obiecte de natur non-rigid sau articulate;
Detecia i urmrirea obiectelor. Studiu comparativ
- ocluzii pariale sau complete ale obiectelor urmrite;
- forme complexe ale obiectului;
- modificri de iluminare n cadru;
- cerine de procesare n timp real.
Urmrirea se poate simplifica prin impunerea unor constrngeri cu privire la
micarea i / sau aspectul obiectelor. De exemplu, aproape toi algoritmii de urmrire
presupun c micarea obiectului este neted, fr schimbri brute. Se poate constrnge
i mai mult micarea obiectului fie la o vitez constant sau acceleraie constant pe baza
datelor existente anterior. Cunotine iniiale legete de numrul i mrimea obiectelor,
sau de aspect i form, pot fi de asemenea folosite pentru a simplifica problema.
Au fost propuse numeroase abordri pentru urmrirea obiectelor. Acestea difer
n primul rnd n funcie de modul de abordare al urmtoarelor ntrebri: care
reprezentare a obiectului este potrivit pentru urmrirea? Ce caracteristici de imagine ar
trebui s fie folosite? Cum ar trebui s fie modelate micarea, aspectul, i forma
obiectului? Rspunsurile la aceste ntrebri depind de context, de mediul n care se
efectueaz urmrirea i de utilizarea final pentru care se solicit informaiile referitoare
la locaia obiectului. Un numr mare de metode de urmrire care ncearc s rspund
la aceste ntrebri au fost propuse pentru o varietate de scenarii care se pot grupa n 3
categorii (ACM Computing, Vol.. 38, No. 4, articolul 13), pentru care vom oferi descrieri
complete i prezentri ale metodelor reprezentative din fiecare categorie.
Mai mult dect att, vom prezenta noile tendine i idei din perspectiva
dezvoltrii de noi metode de urmrire. Ne axam pe metodologiile folosite n urmrirea
obiectelor, n general, i nu pe aplicaii adaptate pentru anumite obiecte, de exemplu,
cele pentru persoane care folosesc cinematica uman ca baz a punerii lor n aplicare.
Exist progrese substaniale n aplicaii de urmrire a persoanelor care folosesc modele
de obiecte articulate, discutate i clasificate de Aggarwal i Cai [1999], Gavrilla [1999] i
Moeslund i Granum [2001]. Cu toate acestea, vom include i aplicaii folosite pe obiecte
articulate care sunt aplicabile i la alte obiecte.
Urmm o abordare de jos n sus n descrierea problemelor care trebuie abordate
n construirea unei aplicaii de urmrire. Prima problem o reprezint definirea adecvat
a obiectului. Vom descrie unele forme comune de reprezentri ale obiectelor, de
exemplu, puncte, forme geometrice primitive i contururi de obiecte i reprezentri ale
aspectului general. Urmtoarea problem este dat de selecie caracteristicilor imaginii
ce urmeaz a fi utilizate ca date de intrare. Vom discuta despre diferite caracteristici de
Detecia i urmrirea obiectelor. Studiu comparativ
imagine, cum ar fi culoarea, micare, margini etc, care sunt frecvent utilizate n urmrirea
obiectelor. Toi algoritmii de urmrire necesita detectarea obiectelor, fie n primul cadru
sau n fiecare cadru. Performanele unui algoritm de urmrire depind de apariiile
obiectelor, de formele acestora, de numrul lor, de miscarea camerei i a obiectelor,
precum i de condiiile de iluminare. Vom clasifica i descrie metodele de urmrire
existente explicnd punctele forte i punctele slabe ntr-o seciune rezumat la sfritul
fiecrei categorii i vom prezenta aspectele importante pentru urmrirea obiectelor. n
cele din urm, vom prezenta concluziile i direciile n cercetare pentru algoritmii de
urmrire.
2. Reprezentarea obiectelor
ntr-un scenariu de urmrire, un obiect poate fi definit ca ceva care este de interes
pentru analiz suplimentar. De exemplu, brci pe mare, peti n interiorul unui acvariu,
vehicule pe un drum, avioane in aer, oameni care merg pe jos pe un drum, sau bule n
ap sunt un set de obiecte care ar putea fi importante pentru a fi urmrite ntr-un
domeniu specific. Obiectele pot fi reprezentate prin forma i aspectul lor. n aceast
seciune, vom descrie mai nti formele obiectului folosite de obicei pentru urmrire i
apoi ne vom referi la formele comune i reprezentri ale aspectelor obiectelor.
- puncte. obiectul este reprezentat de un punct, care este, centrul de greutate
(figura 1 (a)) [Veenman i colab. 2001] sau de un set de puncte (figura 1 (b)) [Serby i col.
2004]. n general, reprezentarea sub forma de puncte este potrivit pentru urmrirea
obiectelor care ocup mici regiuni ntr-o imagine.
- forme geometrice primitive. Forma obiectului este reprezentat de un
dreptunghi, elips (Figura 1 (c), (d) [Comaniciu i col. 2003], etc. Micarea obiectelor
pentru astfel de reprezentri este, de obicei modelat prin translatare sau proiecie. Dei
forme geometrice primitive sunt mai potrivite pentru reprezentarea obiectelor rigide
simple, ele sunt, de asemenea, utilizate i pentru urmrirea obiectelor non-rigide.
- siluete i contururi. Reprezentarea prin contur definete limita unui obiect
(Figura 1 (g), (h). Regiunea din interiorul conturului se numete silueta obiectului (a se
vedea figura 1 (i)). Reprezentri prin siluete i contururi sunt potrivite pentru urmrirea
formelor complexe non-rigide [Yilmaz i col. 2004].
- forme de modele articulate. Obiecte articulate sunt compuse din pri ale
corpului, care sunt conectate prin articulatii. De exemplu, corpul uman este un obiect
Detecia i urmrirea obiectelor. Studiu comparativ
articulat cu trunchi, picioare, mini, cap i picioarele legate de articulaii. Relaiile dintre
pri sunt guvernate de modele de micare cinematice, de exemplu, unghi comun, etc.
Pentru a reprezenta un obiect articulat, se pot modela elementele constitutive folosind
cilindri sau elipse cum se arat n figura 1 (e).
- modele scheletice. Scheletul obiectului poate fi extras prin aplicarea
transformrii axei mediane pe silueta obiectului [Ballard i Brown 1982, cap. 8]. Acest
model este frecvent folosit ca o forma de reprezentare pentru recunoaterea obiectelor
[Ali i Aggarwal 2001]. Reprezentarea scheletic poate fi folosit pentru a modela obiecte
att articulate ct i rigide (vezi Figura 1 (f)).
Fig. 1. Reprezentri obiecte. (a) Centroid, (b) mai multe puncte, (c) form
dreptunghiular , (d) form eliptic, (e) forme din multiple seciuni, (f) schelet, (g)
contur complet (h) punctele de control de pe contur, (i) siluet.
Exist un numr de metode prin care se pot reprezenta caracteristicile de aspect
ale obiectelor. Reprezentrile dup form pot fi de asemenea combinate cu
reprezentrile dup aspect [Cootes i colab. 2001] pentru urmrire. Reprezentrile cele
mai frecvente folosite n urmrire n funcie de aspectul obiectelor sunt:
- densitatea de probabilitate a aspectului obiectului. Estimrile de densitate de
probabilitate ale aspectului obiectului pot fi parametrice, cum ar fi distribuia Gaussian
[Zhu i Yuille 1996] i un amestec de distribuii Gaussiene [Paragios i Deriche 2002], sau
neparametric, precum Parzen-Window [Elgammal i col. 2002] i histograme
[Comaniciu i colab. 2003]. Densiti de probabilitate ale caracteristicilor aspectului
obiectului (culoare, textura) pot fi calculate din regiunile de imagine specificate de
modelul formei obiectului (regiunea interioar a unei elipse sau un contur).
Detecia i urmrirea obiectelor. Studiu comparativ
- abloane. abloanele sunt formate utiliznd forme geometrice simple sau siluete
[Fieguth i Terzopoulos 1997]. Un avantaj ale ablonului este c acesta conine att
informaii spaiale ct i referitoare la aspectul obiectului. Cu toate acestea, abloanele
codifica aspectul obiectului generat dintr-o singur referin. Astfel, ele sunt potrivite
doar pentru urmrirea obiectelor a cror ipostaz nu variaz considerabil n cursul
procesului de urmrire.
- modele active ale aspectului. Modelele active ale aspectului obiectului sunt
generate prin modelarea simultan a formei i a aspectului obiectului [Edwards i col.
1998]. n general, forma obiectului este definit de un set de repere. Similar cu
reprezentarea pe baz de contur, reperele se pot afla pe contur sau, alternativ, n
interiorul regiunii obiectului. Pentru fiecare reper, un vector ce conine aspectul
obiectului este stocat i care poate conine culoarea, textura, sau gradient. Modelele
active ale aspectului unui obiect necesit o etap de antrenare unde att forma ct i
aspectul obiectului este nvat dintr-un set de probe.
- modele multiple ale aspectului. Aceste modele codifica ipostaze diferite ale unui
obiect. O abordare pentru a reprezenta ipostazele diferite ale obiectului este de a genera
un subspaiu din aceste ipostze. Astfel de abordri, de exemplu, analiza componentei
principale (Principal Component Analysis - PCA) i Analiza componentel independente
(Independent Component Analysis - ICA), au fost folosite pentru reprezentri att ale
formei ct i ale aspectului [Mughadam i Pentland 1997; Negru i Jepson 1998]. O alt
abordare pentru a afla ipostazele diferite ale unui obiect este de a antrena un set de
clasificatori, de exemplu, vectori de sprijin [Avidan 2001] sau reele Bayesian [Park i
Aggarwal 2004]. O limitare a acestei abordri este c aspectele obiectelor pentru fiecare
ipostaz sunt necesare nainte.
n general, exist o relaie puternic ntre reprezentarea obiectelor i algoritmii de
urmrire. Reprezentrile obiectelor sunt de obicei alese n funcie de domeniu de
aplicare. Pentru obiectele urmrite, care apar foarte mici ntr-o imagine, reprezentarea
prin puncte este, de obicei adecvat. De exemplu, Veenman i colab. [2001] utilizeaz
reprezentarea prin puncte pentru a urmri seminele ntr-o bol aflat n micare. n mod
similar, Shafique i Shah [2003] folosesc reprezentarea prin puncte pentru a urmri
psrile. Pentru obiectele ale cror forme pot fi aproximate prin dreptunghiuri sau
elipse, reprezentrile prin forme geometrice primitive sunt mai adecvate. Comaniciu
colab. [2003] folosesc reprezentarea printr-o form eliptic i genereaz o histograma de
culoare calculat n regiunea eliptic pentru modelarea aspectului obiectului. n 1998,
Black i Jepson au folosit vectori proprii pentru a reprezenta aspectul obiectelor. Vectorii
proprii au fost generai de abloane de form dreptunghiular. Pentru urmrirea
Detecia i urmrirea obiectelor. Studiu comparativ
obiectelor cu forme complexe, de exemplu, persoane, o reprezentare bazat pe contur
sau siluet este necesar. Haritaoglu colab. [2000] a folosit reprezentarea prin siluete
pentru a urmri obiectele ntr-o aplicaie de supraveghere.
3. Selectarea caracteristicilor pentru urmrire
Selectarea caracteristicile potrivite joaca un rol critic n urmrire. n general, cel
mai de dorit proprietate a unui element vizual este unicitatea, astfel nct obiectele pot
fi cu uurin depistate. Selecie caracteristicilor este strns legat de reprezentarea
obiectului.
De exemplu, culoarea este folosit ca o caracteristic pentru reprezentri ale
aspectului obiectului bazate pe histogram, n timp ce pentru reprezentri pe baza de
contur, conturul obiecte sunt de obicei utilizate ca i caracteristici. n general, muli
algoritmi de urmrire utilizeaz o combinaie a acestor caracteristici. Detaliile cu privire
la caracteristicile vizuale comune sunt:
- culoarea. Culoarea aparent a unui obiect este influenat n principal de doi
factori fizici, 1) Distribuia spectral a luminii i 2) gradul de reflexie al suprafeei
obiectului. n procesare a imaginii, modelul de culoare RGB (rosu albastru, verde) este
de obicei folosit pentru a reprezenta culoarea. Cu toate acestea, modelul RGB nu este un
model uniform perceptual prin faptul c diferenele dintre culori n modelul RGB nu
corespund diferenelor de culoare percepute de oameni [Paschos 2001]. n plus,
dimensiunile RGB sunt puternic corelate. n contrast, L * u * v * i L * a * b * sunt modele
de culoare uniform perceptual, n timp ce HSV (Nuan, Saturaie, Valoare) este un
model aproximativ uniform. Cu toate acestea, aceste modele de culoare sunt sensibile la
zgomot [Song i col. 1996]. Prin urmare, nu exist nicio concluzie privind care model de
culoare este mai eficient, o varietate de spaii de culoare fiind folosite n urmrire.
- marginile. Marginile obiectelor genereaz, de obicei, schimbri puternice n
intensiti de imagine. Detecia marginilor este folosita pentru a identifica aceste
schimbri. O proprietate important a marginilor este c ele sunt mai puin sensibile la
lumin n raport cu caracteristicile de culoare. Algoritmii care detecteaz marinea
obictelor folosesc, de obicei, ca i caracteristic reprezentiv margine. Datorit simplitii
i preciziei sale, cea mai populara metoda de detectare a marginilor este Detector de
margini Canny [Canny 1986]. O evaluare a algoritmilor de detecie a marginilor este
furnizat de Bowyer i col. [2001].
Detecia i urmrirea obiectelor. Studiu comparativ
- fluxul optic. Flux optic este un cmp dens de vectori de deplasare care definete
translatarea fiecrui pixel ntr-o regiune. Acesta este calculat folosind constrngeri de
luminozitate, care presupune o luminozitate constant a pixelilor n cadre consecutive
[Horn i Schunk 1981]. Flux optic este de obicei folosit ca o caracteristic n segmentarea
i urmrirea pe baz de micare. Tehnici populare pentru determinarea fluxului optic
includ metodele Horn i SCHUNCK [1981], Lucas i Kanade [1981], Negru i Anandan
[1996] i Szeliski i Couglan [1997], un studiu comparativ al performanelor metodelor
de determinare a fluxului optic este Barron i colab. [1994].
- textura. Textura este o msur a variaiei intensitii unei suprafee care
cuantific proprieti, cum ar fi netezimea i regularitatea. Comparativ cu culoare,
textura necesit un pas de prelucrare pentru a genera descriptorii. Exist diferii
descriptori de textura: matricea concurenta de nivele gri (GLCMs) [Haralick et al. 1973]
(o histogram 2D care arat corelaia intensitilor ntr-o direcie i distan specificat),
msurtorile de textur Law [Laws 1980] (25 de filtre 2D generate de cinci filtre 1D
corespunztoare nivel, margine, locaie, und i pulsaie), unde [Mallat 1989] (seturi de
filtre ortogonale), i piramide orientabile [Greenspan i col. 1994]. Asemntor cu
caracteristicile de margine, caracteristicile de textur sunt mai puin sensibile la
schimbrile de iluminare comparativ cu culoarea.
n general, caracteristicile sunt alese manual de ctre utilizator n funcie de
domeniu de aplicare al algoritmului de urmrire. Cu toate acestea, problema de selecie
automat a caracteristicilor devinde din ce n ce mai important. Metodele pentru
selectarea automat a caracteristicilor pot fi mprite n metode de filtrare i metode de
nveli [Blum i Langley 1997]. Metodele de filtrare ncerc selectarea caracteristicilor
bazate pe un criteriu general, de exemplu, caracteristicile ar trebui s fie necorelate.
Metodele de nveli selecteaz caracteristicile bazate pe utilitatea acestora ntr-un
domeniu specificic, de exemplu, clasificarea performanelor folosind un subset de
caracteristici. Analiza componentelor principale (ACP) este un exemplu de metode de
filtrare pentru reducerea caracteristicilor. ACP implic transformare a unui numr de
(posibil) variabile corelate ntr-un (mic) numr de variabile necorelate numite
componentele principale. Prima component principal este rspunztoarea de o ct mai
mare variabilitate a datelor posibil, i fiecare componenta ulterioar pentru o ct mai
mare parte din variabilitatea rmas e acoperit. O metod de nveli ce selecteaz
caracteristicile discriminatorii pentru urmrirea unei anumite clase de obiecte este
algoritmul Stimulri adaptive [Tieu i Viola 2004]. Stimulri adaptive este o metod
pentru identificarea unui clasificator puternic bazat pe o combinaie de clasificatori
aproximativ inexaci.
Detecia i urmrirea obiectelor. Studiu comparativ
Avnd un set mare de caracteristici, un clasificator poate fi instruit pentru fiecare
caracteristic. AdaBoost, va calcula o combinaie ponderat a clasificatorilor
(caracteristici reprezentative) care maximizeaz performanele de clasificare ale
algoritmului. Cu ct mai mare ponderea caracteristicii, cu att mai discriminatorie este.
Pentru urmarire se pot folosi primele n caracteristici cu ponderea cea mai mare.
Categorie
Metode reprezentative
Detecia punctelor Detectorul Moravec [Moravec 1979],
Detectorul Harris [Harris and Stephens 1988],
Transformarea caracteristiclor invariate scalate (SIFT)
[Lowe 2004].
Detectorul de puncte afin invariant [Mikolajczyk and
Schmid 2002].
Segmentarea Translaia la medie [Comaniciu and Meer 1999],
Graph-cut [Shi and Malik 2000],
Contururi active [Caselles et al. 1995].
Modelarea fundalului Amestec de distribuii Gaussiene [Stauffer and Grimson
2000],
Eigenbackground[Oliver et al. 2000],
Wall flower [Toyama et al. 1999],
Texturi dinamice de fundal [Monnet et al. 2003].
Clasificatori supervizai Mecanisme de vectori support [Papageorgiou et al. 1998],
Reele neuronale [Rowley et al. 1998],
Stimulri adaptive[Viola et al. 2003].
Tabelul. 1. Categorii de detecie ale obiectelor.
Dintre toate caracteristicile, culoarea este una dintre caracteristicile cele mai
utilizate pe scar larg n algoritmii de urmrire. Comaniciu i colab. [2003] folosesc o
histograma de culoare pentru a reprezenta aspectul obiectului. n ciuda popularitii,
cele mai multe modele de culoare sunt sensibile la variaiile de iluminare. Prin urmare
n scenarii n cazul n care acest efect este inevitabil, alte caracteristici sunt incluse n
modelul de aspect al obiectului. Cremers i colab. [2003] folosesc fluxul optic ca o
caracteristic de urmrire a conturului. Jepson i colab. [2003] folosesc rspunsurile
filtrelor orientabile pentru urmrire. Alternativ, o combinaie a acestor caracteristici este
de asemenea utilizat pentru a mbunti performanele de urmrire.
Detecia i urmrirea obiectelor. Studiu comparativ
4. Detectarea obiectelor
Fiecare metod de urmrire necesit un mecanism de detectare a obiectului, fie n
fiecare cadru sau atunci cnd obiectul apare pentru prima dat n. O abordare comun
pentru detectarea obiectului este de a utiliza informaii ntr-un singur cadru. Cu toate
acestea, unele metode de detectare a obiectelor folosesc informaia temporal calculat
dintr-o secven de cadre pentru a reduce numrul de detecii false. Aceast informaie
temporal este, de obicei, sub form de cadru cu diferene succesive, care subliniaz
schimbarea regiuni n cadre consecutive. Avnd regiunile obiectului algoritmul are
sarcina de a efectua corespondena obiectului dintr-un cadru n altul pentru a efectua
urmrirea acestuia. Mai multe metode de detectare ale obiectelor au fost prezentate n
tabelul 1, iar n continuare vom prezenta cele mai populare metode.
4.1 Detecia punctelor
Algoritmii de detecia a punctelor sunt folosii pentru a gsi puncte de interes n
imagini care au o textur expresiv n regiunile respective. Puncte de interes au fost
folosite mult timp n contextul problemelor de urmrire. O calitate de dorit a unui punct
de interes este invarianta la schimbri n iluminare i locaia camerei. n literatura de
specialitate, detectoare de puncte de interes frecvent utilizate includ operator de interes
Moravec [Moravec 1979], detectorul de punctul de interes Harris [Harris i Stephens
1988], detectorul KLT [Shi i Tomasi 1994] i detectorul SIFT [Lowe 2004]. Mikotajczyk
i Schmid [2003] prezint o evaluare comparativ a detectoarelor de puncte de interes.
Pentru a gsi puncte de interes, operatorul Moravec calculeaz variaia intensitile
de imagine ntr-o seciune de 4 4 n direciile orizontale, verticale, diagonale, i
antidiagonale i selecteaz minimul dintre cele patru variante ca valori reprezentative
pentru cadru. Un punct este declarat punct de interes n cazul n care variaia sa de
intensitate este un maxim local ntr-o seciune de 12 12.
Detecia i urmrirea obiectelor. Studiu comparativ
Fig. 2. Puncte de interes detectate aplicnd operatorii (a) Harris, (b) KLT i (c) SIFT
Detectorul Harris calculeaz derivatele de oridnul I ale imaginii pentru (
), n
direciile x i y pentru a evidenia variaiile de intensitate direcionale, apoi o matrice pe
stare, care codific aceast variaie, este evaluat pentru fiecare pixel dintr-o seciune
mic:
= (
2
)
(1)
Un punct de interes este identificat cu ajutorul determinantului i urmei lui M care
msoar variaia ntr-o seciune local
= det() ()
2
(2)
unde k este constant. Punctele de interes sunt marcate de limita R dup aplicarea
criteriului de eliminare non-maximal (Figura 2 (a)). Aceeai matrice M din ecuaia (1)
este folosit la pasul de detecie al punctelor de interes a metodei de urmrire KLT.
Punctul de interes R, se calculeaz folosind valoarea proprie minim a lui M,
. Sunt
selectate punct de interes relevante prin limita R, dintre care KLT le elimin pe cele care
sunt spaial aproape unul de altul (Figura 2 (b)).
Cantitativ att detectorul Harris ct i cel KLT subliniaz variaiile de intensitate,
folosind msurtori foarte similare. De exemplu, R n Harris este legat de polinomul
caracteristic folosit pentru a gsi valorile proprii ale matricei M:
2
+det() () = 0
(3)
Detecia i urmrirea obiectelor. Studiu comparativ
n timp ce KLT calculeaz valorile proprii direct. n practic, ambele metode pot gsi
aproape acelai puncte de interes. Singura diferen este criteriul suplimentar KLT care
impune o distana spaial predefinit dintre punctele de interes detectate.
n teorie, matricea M este invariant att la rotaie ct i la translaie. Cu toate acestea,
ea nu este invariant la transformri afine sau proiecii. n scopul de a introduce
detectarea robust a punctelor de interes n diferite transformri, Lowe [2004] a introdus
Transformarea caracteristiclor invariate scalate SIFT (Scale Invariant Feature Transform)
metod care este compus din patru etape. n primul rnd, un spaiu de dimensiuni este
construit prin convoluia imaginii cu filtre de distribuie Gaussiene la diferite
dimensiuni. Imaginile ca rezultat al convoluiei sunt folosite pentru a genera imagini
diferene de distribuii Gaussiene (DoG). Puncte de interes relevante sunt apoi
selectate din minimele i maximele dn imaginile DoG pentru toate dimensiunile.
Urmtorul pas actualizeaz locaia fiecrui punct relevant prin interpolarea valorilor de
culoare utiliznd pixeli adiaceni. n a treia etap, punctele relevante cu contrast sczut
sau care sunt situate de-alungul marginilor sunt eliminate. n cele din urm, punctelor
de interes rmase le sunt atribuite orientri bazate pe vrfurile din histogramele de
direcii de gradient ntr-o arie restrns n jurul unui punct relevant. Detectorul SIFT
genereaz un numr mai mare de puncte de interes comparativ cu alte detectoare. Acest
lucru se datoreaz faptului c sunt cumulate punctele de interes de la diferite
dimenisiuni i rezoluii. Empiric, s-a artat n Mikotajczyk i Schmid [2003], c metoda
SIFT surclaseaza cele mai multe detectoare de puncte i nu este la fel de sensibil la
deformri ale imaginilor.
4.2 Modelarea fundalului
Detectarea obiectelor poate fi realizat prin construirea unei reprezentri a unui
cadru numit model de fundal i apoi prin identificarea modificrilor fa de model
pentru fiecare cadru consecutiv. Orice modificare semnificativ ntr-o regiune a imaginii
de la modelul de fundal semnific o micare a unui obiect. Pixelii care constituie
regiunile n curs de schimbare sunt marcate pentru mai multe prelucrri. De obicei, un
algoritm de conectate a componentelor este aplicat pentru a obine regiunile conectate
corespunztoare obiectelor. Acest proces este extragerea fundalului. Itentificarea
modificrilor ntre dou cadre adiacente a fost studiat nc de la sfritul anilor '70 [Jain
Detecia i urmrirea obiectelor. Studiu comparativ
i Nagel 1979]. Cu toate acestea, extragerea fundalului a devenit popular odat cu Wren
i colab. [1997]. Pentru a nva schimbrile graduale ce se petrec n timp, Wren i colab.
propune modelarea culorii fiecrui pixel, I (x, y), a unui fundal staionar cu un singur
model de distribuie Gaussian 3D (Y, U i V)
I (x, y) ~ N( (x, y), (x, y))
(4)
Parametrii modelului, valoarea medie a (x, y) i covariana (x, y), sunt nvate prin
observarea culorilor n mai multe cadre consecutive. Odat ce modelul de fundal este
derivat, pentru fiecare pixel (x, y) din cadrul de intrare, probabilitatea ca culoarea de
fundal a acestuia s proven din (4) este calculat, iar pixelii care se abat de la modelul de
fundal sunt etichetai ca pixelii de prim-plan. Cu toate acestea, o singur distribuie
gaussian nu este reprezint un model adaptat pentru scene exterioare [Gao i colab.
2000], deoarece multe culori pot fi observate ntr-o anumit locaie datorit micrii
repetitive a obiectului, umbre, sau reflexii. O mbuntire substanial n modelarea
fundalului se realizeaz prin utilizarea unor modele statistice multimodale pentru a
descrie culoarea de fundal pentru fiecare pixel. De exemplu, Stauffer i Grimson [2000]
folosesc un amestec de distribuii Gaussiene pentru a modela culoarea pixelilor. n
aceast metod, un pixel n cadrul curent este comparat cu modelul fundalului prin
comaprndul cu fiecare distribuie Gaussian din model. Dac se gsete o potrivire,
media i variana distribuiei Gaussiane identificate este actualizat, altfel o nou
distribuie Gaussian cu media egal cu culoarea pixelului curent i cu o varian iniial
este introdus n amestec. Fiecare pixel este clasificat n baza faptului dac distribuia
Gaussian asociat reprezint modelul fundalului. Regiunile n micare, care sunt
detectate folosind aceast abordare, mpreun cu modelele de fundal sunt prezentate n
Figura 3.
Detecia i urmrirea obiectelor. Studiu comparativ
Fig. 3 Amestec de modele de distribuii Gaussine pentru extragerea fundalului. (a)
cadru n care o persoan merge pe jos. (b) media distribuiilor Gaussiene cu cea mai
mare pondere la fiecare poziie a pixelilor. Aceste medii reprezint culorile temporale
cele mai constante la nivel de pixel i, prin urmare, ar trebui s reprezinte fundalul
staionar. (c) mediile distribuiilor Gaussiane cu cea de-a doua cea mai mare pondere;
aceste medii reprezint culorile care sunt observate mai puin frecvent. (d) rezultatul
extragerii fundalului. Prim plan-ul format din pixelii din cadrul curent care au
corespuns unui distribuii Gaussiane cu pondere redus.
O alt abordare este de a ncorpora informaii din anumite regiuni din cadru n loc
de a folosi doar informaii bazate pe culoare. Elgammal i Davis [2000] folosesc un
estimator de nucleu al funciei de densitate, un model neparametric, pentru a modela
fundalul la nivel de pixel. n timpul procesului de extracie, pixelul curent este comparat
nu doar cu pixelul corespunztor din modelul de fundal, ci i cu pixelii din jur. Astfel,
aceast metod poate s compenseze bruiajul camerei sau micri mici n fundal. Li i
Leung [2002] folosesc caracteristicile de textura si culoare pentru a efectua extragerea de
fondul pe seciuni de 5 5 pixeli. Deoarece textura nu variaz foarte mult cu schimbrile
de iluminare, metoda este mai puin sensibil la iluminare. Toyama i colab. [1999]
propune un algoritm pe trei niveluri care s se ocupe de problema extragerii fundalului.
n plus fa de extragerea la nivel de pixeli, autorii folosesc informaiile de la nivel de
regiune i de cadru. La nivel de pixel, autorii propun utilizarea filtrrii Wiener pentru a
face predicii probabilistice legate de culoare de fundal. La nivelul regiunii, regiunile din
prim-plan formate din culori omogene sunt completate. La nivel de cadru, n cazul n
care cei mai muli pixeli dintr-un cadru se schimb brusc, se presupune c modelele de
fundal bazate pe pixeli nu mai sunt valabile. n acest moment, modelul bazat pe pixeli
este schimbat cu unul stocat sau modelul este reiniializat.
O abordare alternativ pentru extragerea fundalului este de a reprezenta variaiile
de intensitate ale unui pixel ntr-o secven de cadre ca stri discrete corespunztoare
evenimentelor din locaie. De exemplu, pentru a urmri maini pe o autostrada, pixelii
din imagine pot fi n fundal, n prim-plan (main), sau n umbr. Rittscher i colab.
Detecia i urmrirea obiectelor. Studiu comparativ
[2000] folosesc modelele Hidden Markov (HMM) pentru a clasifica blocuri mici ale unei
imagini ca aparinnd uneia dintre aceste trei stri. n contextul de a detecta schimbrile
de iluminare ntr-o camer, Stenger et al. [2001] folosete HMM pentru extracia
fundalului. Avantajul de a folosi HMM este c anumite evenimente, care sunt greu de
modelat n mod corect utiliznd abordri de modelare ale fundalului nesupravegheate,
pot fi nvate prin folosirea unor abloane. n loc de a modela variaia individual a
pixelilor, Oliver i col. [2000] propune o abordare holistic prin descompunerea valorilor
proprii. Pentru k cadre de intrare,
, unde i <
< k, care s cuprind toate iluminrile posibile din cmpul vizual (FOV). Astfel, aceast
metod este mai puin sensibil la schimbrile de iluminare. Obiectele din prim-plan
sunt detectate prin proiecia imaginii curente pe vectorul valorilor proprii i identificarea
diferenei dintre imaginea reconstruit i cea real. Figura 4 prezint regiunile de obiecte
detectate utiliznd abordarea valorilor proprii.
Fig. 4 Extragerea fundalului bazat pe descompunearea valorilor proprii (cadrul
este contruit cu obiecte din cmpul vizual): (a) o imagine de intrare cu obiecte, (b)
imagine reconstruit dup proiecia imaginii de intrare pe vectorul valorilor proprii, (c)
diferena dintre cele dou imagini n care obiectele din primplan sunt clar identificabile
O limitare a abordrilor menionate mai sus este faptul c acestea necesit un fundal
static. Aceast limitare se adreseaz de ctre Monnet i colab. [2003], i Zhong i Sclaroff
[2003]. Ambele metode sunt n msur s compenseze variaiile n timp ale fundalului
(de exemplu, valuri, micarea norilor i a scrilor rulante). Aceste metode modeleaz
regiunile imaginilor ca un model de tip autoregresiv medie mobila (ARMA), procese
care ofer o modalitate de a nva i prezice modelele de micare ntr-un cadru. Un
proces ARMA este o serie de timp format din sume de componente autoregresive i
medii mobile, unde un proces autoregresiv poate fi descris ca o sum ponderat a
valorilor sale anterioare i o eroare de tip zgomot alb.
Detecia i urmrirea obiectelor. Studiu comparativ
Ce mai multe metode de urmrire de ultim generaie pentru radare fixe, de
exemplu, Haritaoglu colab. [2000] i Collins i colab. [2001] utilizeaz metode de
extragere a fundalului pentru a detecta regiuni de interes. Acest lucru se datoreaz
faptului c metodele recente de extragere au capacitile necesare de a modela
schimbrile de iluminare, zgomotul i micarea periodic a regiunilor din fundal i, prin
urmare, pot detecta cu precizie obiectele ntr-o varietate de circumstane. Mai mult dect
att, aceste metode sunt eficiente computaional. n practic, extragerea fundalului ofer
n multe cazuri regiuni incomplete ale obiectului, deoarece obiectele se pot afla n mai
multe regiuni, sau pot exista guri n interiorul obiectului, datorit faptului c nu exist
nicio garanie c elementele careacteristice ale obiectelor vor fi diferite de caracteristicile
fundalului. Cea mai important limitare a extragerii fundalului este cerina unor camere
staionare. Micare camerei denatureaz, de obicei, modelele de fundal. Aceste metode
pot fi aplicate la imaginile achiziionate de camere mobile prin regenerarea modelelor
de fundal la intervale reduse de timp, de exemplu, trei cadre, de la zero [Kanade i col.
1998] sau prin compensarea micarii senzorului, de exemplu, crearea unui mozaic de
fundal (imagine panoramic) [Rowe i Blake 1996; Irani i Anandan 1998]. Cu toate
acestea, ambele soluii necesit ipoteza unei suprafee plane i micari reduse n cadre
succesive.
4.3 Segmentarea
Scopul algoritmilor de segmentare a imaginii este de a mpri imaginea n regiuni
similare. Fiecare algoritm de segmentare abordeaz dou probleme, criteriile pentru
obinerea unei bune partiionri i metoda pentru obinerea unei partiionari eficiente
[Shi si Malik 2000]. Vom discuta despre tehnici de segmentare recente care sunt relevante
n urmrirea obiectelor.
4.3.1 Translaia la medie
Pentru problema de segmentare a imaginii, Comaniciu i Meer [2002] propun
abordarea prin translatare la medie pentru localizarea nodurilor n planul definit de
culoare i locaie [l, u, v, x, y], unde [l, u, v] reprezint culoarea i [x, y] reprezint locaia.
Avnd o imagine, algoritmul este iniializat cu un numr mare de noduri centrale
ipotetice alese aleator. Apoi, fiecare nod central este mutat la media datelor aflate n
interiorul elipsoidului multidimensional centrat n mijlocul nodului central. Vectorul
definit de vechiul i noul nod central este numit vectorul de translaie a mediei. Vectorul
Detecia i urmrirea obiectelor. Studiu comparativ
este calculat iterativ pn cnd poziiile nodurilor centrale rmn constante. De
menionat faptul c, n timpul iteraiilor, unele noduri centrale pot fi unificate. n figura
5 (b), este prezentat segmentarea folosind translaia la medie. Metoda poate fi utilizat
pe diverse aplicaii, cum ar fi detecia marginilor, regularizarea imaginilor [Comaniciu
i Meer 2002] i n urmrire [Comaniciu et al. 2003].
Segmentarea folosind translaia la medie necesit reglarea fin a diverilor parametri
pentru a obine o mai bun segmentare, de exemplu, selectarea culorii i a limitei pentru
dimensiunea minim a regiunii considerabil afectate de segmentarea rezultat.
4.3.2 Reduceri de graf
Segmentarea imaginii poate fi de asemenea formulate ca o problem de partiionare
de graf-uri, n care nodurile (pixelii), V = {u, v,. . .}, unui graf (imagine), G, sunt mprite
n N subgrafuri disjuncte (regiuni),
= ,
= , i j prin eliminarea
arcurilor ponderate ale graf-ului. Costul total dintre arcurile eliminate dintre 2
subgrafuri se numete reducere (engl. cut). Costul este de obicei dat de similaritile ntre
culoarea, luminozitatea i textura dintre noduri. Wu i Leahy [1993] utilizeaz criteriul
reducerii minime, cu obiectivul de a gsi partiiile care s minimizeze o reducere. n
demersul lor, ponderile sunt definite pe baza similitudinii de culoare. O limitare a
reducerilor de graf este tendina de a suprasegmenta imaginea. Acest efect se datoreaz
creterii costurilor unei reduceri cu numrul de arcuri care fac legtura ntre dou grafuri
partiionate.
Shi si Malik [2000] propune reducerea normalizat pentru a evita problematica
suprasegmentrii. n abordarea lor, reducerea nu depinde numai de suma consturilor
arcurilor din reducere, ci i de raportul dintre totalul costurilor nodurilor din fiecare
partiie fa de totalul costurilor tuturor nodurilor din graf. Pentru segmentarea bazat
pe imagine, costurile dintre noduri sunt definite prin produsul dintre similitudinea
culorilor i proximitatea spaial. Odat ce costurile dintre fiecare pereche de noduri sunt
calculate sunt construite o matrice de cost W i o matrice diagonal D, unde
,
=
,
=1
. Segmentarea se face nti prin calcularea vectorilor proprii i a valorilor
proprii ale sistemului generalizat (D W) y =
() +
() +
()
1
0
(5)
unde s este lungimea arcului conturului ,
include energia imaginii, i
, de obicei,
include un termen de curbur de ordinul nti () sau un termen de continuitate de
ordinul 2 (
2
) pentru a gsi cel mai restrns contur. Energia imaginii,
, poate fi
calculat att la nivel local ct i la nivel global. Informaia local este, de obicei, sub
forma unui gradient al imaginii i se evalueaz n jurul conturul [Kass i colab. 1988;
Caselles colab. 1995]. n contrast, caracteristicile globale sunt calculate n interiorul i n
afara regiunii obiectului. Caracteristici globale includ culoarea [Zhu i Yuille 1996;
Yilmaz i colab. 2004; Ronfard 1994] i textura [Paragios i Deriche 2002].
Detecia i urmrirea obiectelor. Studiu comparativ
Diferii cercetatorii au folosit termeni diferii pentru termenul
=
||, unde g este funcia sigmoid. Comparativ cu gradientul, o funcie de gradient
definete conturul obiectului ca o curb geodezic n spaiul Riemannia [Caselles i
colab. 1995]. Cu toate acestea, gradientul imaginii furniza informaii foarte locale i este
sensibil la minimele locale. Pentru a depi aceast problem, cercettorii au introdus in
energia imaginii informaii din regiunile acesteia. n 1996, Zhu i Yuille au propus
utilizarea informaiilor din regiuni n detrimentul gradientului imaginii. Cu toate
acestea, utilizarea informaiilor din regiuni n energia imaginii nu conduce la o bun
localizare a conturului obiectului. Recent, metode care combina informaiilor din regiuni
i gratientul imaginii n energia imaginii au devenit populare. Paragios i Deriche [2002]
propune, folosind o combinaie convex a energiilor imaginii date de gradient i de
informaiile din regiunile imaginii,
+(1 )
. n special,
autorii modeleaz apariia n