Documente Academic
Documente Profesional
Documente Cultură
Plan Curs
Aplicaii & bibliografie M1. Informaia video
M2. Filtrare spaio-temporal M3. Informaia de culoare M4. Informaia temporal M5. Informaia de micare A1. Clasificarea automat dup gen
Bucureti, 2010
> televiziune:
compresie, transmisie, filtrare semnal video digital, HDTV, ...
> ...
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 2 Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 3
imagine
imagine digital = ansamblu de valori plasate dup o form spaial ntr-un spaiu cel puin bidimensional (matrice)
fiecare pixel al imaginii este caracterizat prin: - valoare legat de culoarea transmis (ex. alb, rou, etc.) - poziie n imagine informaie spaial. forma pixelului: ptrat, rotund, rectangular (grid) + dimensiunea pixelului fac legtura dintre imagine i realitatea fizic.
rezoluia de pixeli = numrul de pixeli pe orizontal X numrul de pixeli pe vertical (dimensiune imagine) rezoluie mare nseamn o mai bun reprezentare a realitii (mai multe detalii)
=
imagine color RGB (8+8+8 bii/pixel)
10
video
film 35mm
wide
film cinema
film cinema
11
...
img.1 img.2 img.3 img.4 img.5 img.6 timp
rezoluie temporal (frame rate) = numr de imagini pe secund; timp real: PAL/SECAM 25 cadre/s sau NTSC 30 cadre/s, high speed: 50 - 200,000,000 cadre/s.
2 culori
amplitudine X X
eantionare i cuantizare
sistem de calcul
cuantizare
p = progresive, este afiat imaginea integral, i = interlaced, sunt afiate separat liniile impare i apoi cele pare.
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 14
X T eantionare perioad T
X timp
15
principiu: reducerea redundanei datelor (anumite informaii se repet sau pot fi deduse pe baza altora) redundan spaial = valorile pixelilor vecini sunt corelate la nivel de cadru:
detaliu 1
cadru i
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 16
detaliu 2
17
...
img.1 img.2 img.3 img.4 img.5 img.6 timp
redundan psihovizual = SVU este bazat pe aproximare, ochiul este puin sensibil la detalii lng contururi sau schimbri de cadru: percepem un dreptunghi cu toate c nu exist !
[M. Schmolesky,The Primary Visual Cortex, 2007]
separarea luminozitii (Y) de componentele cromatice (CB i CR) asigur o compresie mai bun cu pierderea minim a calitii perceptuale,
(detalii M2 Informaia de Culoare)
http://www.michaelbach.de/ot/
2. subeantionare spaial:
ochiul uman percepe mai multe detalii fine la nivel de intensitate (Y) dect n nuan i saturaie (CB i CR): downsampling CB i CR: 4:2:2 (1/2 pe oriz.) sau 4:2:0 (1/2 pe oriz. & vert.)
18 Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 19
imagine
fiecare component este mprit n blocuri nesuprapuse de regul de 8x8 pixeli (n funcie de subeantionare);
unde u(m,n) reprezint imaginea de dimensiune NxN, k ~ frecvena vertical iar l ~ frecvena orizontal, v(k,l) este imaginea transformatei, iar (k) este o constant dat de:
imaginea poate fi interpretat ca o oscilaie cosinus (frecvenial), informaie frecvena + amplitudine + DC (eventual)
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 20
(k ) =
1 N 2 N
k =0 altfel
C 1 = C T , U = C T V C
imaginea U poate fi scris ca:
(1,0)
(1,1)
(1,2)
(1,3)
(1,4)
U = Bk ,l v(k , l )
k = 0 l =0
N 1 N 1
v(0,0) v(1,0)
v(0,1) v(1,1)
(2,0)
(2,1)
(2,2)
(2,3)
(2,4)
(3,0)
(3,1)
(3,2)
(3,3)
(3,4)
Bk ,l = ck clT
unde k a matricei
(4,0)
(4,1)
(4,2)
(4,3)
(4,4)
ck reprezint coloana CT .
22
v(4,4)
imagine U
log10(|V|) (pseudoculori)
- energia este concentrat n doar civa coeficieni de frecvene joase; - primul coeficient este cel mai important (DC = valoare medie);
pierdere detalii
coeficienii DCT sunt scalai individual (mprii la o constant ~ tabel de cuantizare) i rotunjii la primul ntreg; = eliminare detalii (coeficieni 0) i valori mici pentru frecvene joase;
6. codarea entropiei:
coeficienii sunt parcuri n ordinea importanei, matrice i apoi codai fr pierdere: > RLE (run-length encoding); + Huffman; > pentru coeficienii DC se codeaz doar diferenele (DPCM = Differential Pulse Code Modulation); parcurgere n zig-zag
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 26
vector
flux M-JPEG
JPEG1
JPEG2
JPEG3
JPEG4
...
timp ...
- datorit codrii individuale fluxul video poate fi editat - rat de compresie ntre 2:1 i 20:1 (stocare DVC Digital Videotape); > ineficient !
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 28
3
...
cadru 2
> codm i eroarea de aproximare (rezidual); precizie estimare , eroare ; > dac estimarea nu are o precizie acceptabil bloc codat intra.
I-picture
... ...
P-picture 1 P-picture 2 I/P-picture I/P-picture
> P-picture 1 este dedus/estimat (predicted) din I-picture; P-picture 2 este dedus din P-picture 1.
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 34
B-picture 1
B-picture 2
35
secvena video
...
seq.1 seq.2 ... seq.N
I-picture P3 P6
I-picture SC seq.
video param. bitstream param.
QT
GOP1
GOP2
...
GOPM
- SC = Start Code; - video param.: lime, nlime, rat aspect, frame rate; - bitstream param.: rat de bii, buffer, constrngeri hardware;
B1 B2 B4 B5 B7 B8 GOP = IBBPBBPBB
36
37
QT
GOP1
GOP2
Slice1
Slice2
...
SliceL
SC GOP
time code
GOP param.
Imag.1
Imag.2
...
Imag.P
SC Slice
vert. pos.
Q scale
MacroB.1 MacroB.2
...
MacroB.P
SC Imag.
tip
buffer param.
param. codare
Slice1
Slice2
...
SliceL
Adres
tip
vector micare
Q scale
CBP
Bloc1
...
Bloc6
...
AC6,63
- time code: cod de timp SMPTE (ore:minute:secunde:cadru); - GOP param.: descriu structura GOP (broken, open, ...); - tip: I, P sau B-picture; - param. codare: precizie pixeli ? - Slice: poriune din imagine (secven blocuri, +rol de re-sincronizare).
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 38
- Q scale: cum este scalat tabela de cuantizare; - MacroBloc1-6 = 4x 8x8 blocuri Y, 1x 8x8 bloc CB i 1x 8x8 bloc CR; - tip: are vector de micare? ce tip? - CBP = Coded Block Pattern, modul de codare ale celor 6 blocuri.
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 39
profil nivel High 1920x1152@60fps High 1440x1152@60fps Main 720x576@30fps Low 352x288@30fps Simple 15Mb/s Spatially SNR video pentru teleconferine, ntrzieriHigh mici Main (low-delay) scalable scalable 80Mb/s 60Mb/s 15Mb/s 4Mb/s 15Mb/s 4Mb/s 60Mb/s 100Mb/s 80Mb/s 20Mb/s -
40
41
42
43
cmp 1-1
cmp 1-2
cadru 2 x o x o x o x o
cadru 1 x o x o x o x o
referin
cadru 2 x o x o x o x o
o o o o
dv
x x x x
o o o o
x x x
referin referin dual-prime: predicie pe baza a doi vectori din cmpurile de referin;
47
1-2 straturi de detaliu (enhancement-layers) permit mbuntirea calitii: - rezoluie spaial mai mare, - rezoluie temporal mai mare, ...
basis: coeficieni DCT cuantizai la o calitate moderat (rat de bit ); enhancement: diferena dintre coeficienii DCT necuantizai i cei cuantizai; n funcie de preferine se decodeaz doar basis sau ambele straturi. 2. scalabilitate spaial
basis: subeantionare spaial prin decimare pentru o rezoluie mic; enhancement: supraeantionare prin interpolare + stocare predicie micare; furnizez simultan rezoluii diferite n funcie de terminalul utilizatorului ex.: trecere de la SDTV la HDTV;
48
49
),
depirea erorilor (error resilience): erori ce apar: n antet secven, antet cadre, antet slice, antet macrobloc, coeficieni DCT, vectori de micare, ... problem! - vectori de micare ascuni (concealement motion vectors) n antetul macroblocurilor, dac datele din macrobloc sunt corupte compensare din cadrul anterior;
50 Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 51
X
ex. scen audio-vizual
55
+ -
DCT
cuantizare
+
predicie coeficieni compensare micare estimare micare codare form
- precizie quarter-sample (QPel) = precizia deplasrii este de pixeli, vectori de micare fracionari posibil prin interpolare;
000000 000000 0
buffer imag.
codare textur: - proces similar cu MPEG-1 i MPEG-2: macroblocuri blocuri DCT ... - dac un macrobloc depete un VOP de o anumit form, este bordat cu 0 pe acea regiune = compresie
56 Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 57
camera
imagine iniial
estimare prim-plan
imagine reconstituit
VOP
[H. Watanabe, K. Jinzenji, Sprite Coding in Object-based Video Coding Standard: MPEG-4, 2001] 59
63
full: 264.611KB M-JPEG: 3.518KB (75:1) MPEG-1: 1.040KB (254:1) MPEG-2: 1.042KB (254:1) MPEG-4 p10: 1.017KB (260:1)
zoom 600%
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 65
MPEG-2: 1.042KB
M-JPEG
MPEG-1: 1.040KB
M-JPEG: 3.518KB
66
67
MPEG-4 p2
MPEG-2
MPEG-1
full
full
full
MPEG-2: 364KB
MPEG-1: 359KB
68
69
Formate video
> tehnici de codare: algoritmi/metode de compresie video; > codec video: un dispozitiv sau program ce furnizeaz un pachet de proceduri ce permit compresia (encoding) i decompresia (decoding) datelor video digitale; implementarea tehnicilor de codare; > fiier video: un container ce specific modul de stocare pe disc a informaiei video codate. > player video: un pachet de utilitare ce furnizeaz o interfa grafic de vizualizare a coninutului video; se folosesc de codec-urile existente n sistem,
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 70
Formate video
codec-uri video:
- proprietar DivX, Inc. (fost DivXNetworks, Inc.), - include MPEG-4 Part 2 ASP i H.264/MPEG-4 Part 10 AVC. [http://www.divx.com] - open source, concurena direct DivX (XviD), - multiplatform, include MPEG-4 Part 2 ASP. [http://www.xvid.org] - realizat de 3ivx Technologies, sisteme embedded (vitez de prelucrare redus) - include MPEG-4 Part 2 ASP. [http://www.3ivx.com] - RealVideo, proprietar RealNetworks, destinat flux video n reea (streaming, coninutul video este vizualizat progresiv), - mai multe versiuni rv10-rv20: H.263, rv30-40: H.264, ... [http://www.realnetworks.com]
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 71
Formate video
codec-uri video (continuare):
- WMV: Windows Media Video (rspuns la RealVideo), - iniial bazat pe MPEG-4 Part 2 ASP i apoi modificat, - destinat streaming Internet (fiiere foarte mici), - suport o rat de bit variabil, constant sau medie. - Cinepak dezvoltat de SuperMac Apple QuickTime, - codare pentru rat de transfer CD-ROM, - DCT, folosete cuantizare vectorial. -IndeoVideo dezvoltat de Intel DVI Digital Video Interactive, - vizualizare video n timp real fr accelerare hardware, - bazat pe transformarea wavelet. [http://ligos.com/index.php/home/products/indeo] - On2 VP6 dezvoltat de TrueMotion, - folosit de Flash Video (Google YouTube, VP8 open source),
Formate video
fiiere video (containere) uzuale: .3GP - 3rd Generation Partnership Project, video destinat 3G (comunicaii mobile) sau Internet. .ASF - Microsoft Advanced Systems Format File, se specific structura datelor audio i video dar nu modul de codare (+ metadata: bibl. etc.). .AVI - Microsoft Audio Video Interleave File, datele sunt mprite n blocuri ("chunks) i identificate pe baza FourCC (4-Character Code): - "hdrl : antet, metadata video (rezoluie, frecven, etc.), - "movi: datele audio/visuale propriu-zise, - "idx1 (opional): offset data chunks. .FLV - Flash Video File, conine antet, date audio-video intercalate (interleaved), pachete de metadata. .MOV - Apple QuickTime Movie, compatibil cu platforme Macintosh dar i Windows.
72 Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU
[surs http://www.fileinfo.com/filetypes/video] 73
Formate video
fiiere video (containere) uzuale: .MP4 - MPEG-4 Video File, Part 14, poate stoca i alte date precum subtitrri i este adaptat la streaming Internet. .MPG - MPEG Video File, de regul stocheaz format MPEG-1 i 2. .RM - Real Media File, container pentru streaming ce conine date audiovideo sau un link Internet la o surs multimedia (radio sau TV pe Internet). .SWF - Flash Movie, animaie realizat n Adobe Flash, conine text, grafic vectorial, bitmap, interactivitate; vizualizare de regul n Web browser. .VOB - DVD Video Object File, formatul MPEG-2 pentru DVD (localizare de regul n director VIDEO_TS); conine audio, video i subtitrri. .WMV - Windows Media Video File, bazat pe containerul ASF i include codare de tip Windows Media Video (WMV).
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 74
mov=aviread(nume_fisier);
> deschide fiierul nume_fisier.avi din calea curent, decomprim toate cadrele video i le stocheaz ntr-un vector de structuri numit mov; atenie: film prea lung = out of memory ! > mov este un vector linie de dimensiune 1-by-N, unde N este numrul total de cadre din secvena video (numerotare de la 1);
truecolor indexat
cdata
imagesc(mov(10).cdata);
mov=aviread(nume_fisier, index);
> deschide fiierul nume_fisier.avi din calea curent i decomprim doar cadrele specificate de index: - un singur cadru, index=constant; - mai multe cadre, index=vector (aceeai convenie ca anterior). n prelucrarea video de regul se lucreaz ntr-o fereastr temporal centrat n cadrul curent analizat:
fereastr w cadre cadrul i timp
mov_w=aviread(nume_fisier, i-10:i+10);
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 76 Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 77
mov_info=aviinfo(nume_fisier);
> deschide fiierul nume_fisier.avi din calea curent, i extrage n structura mov_info informaii despre coninutul video: .Filename: 'HDMPEG4@528kbps.avi .FileSize: 390732 .FileModDate: '01-Nov-2010 15:14:38 .NumFrames: 98 .FramesPerSecond: 25 .Width: 1280 .Height: 720 .ImageType: 'truecolor .VideoCompression: 'DIVX .Quality: 0 .NumColormapEntries: 0
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 78
% adaugare cadre for i=1:125 cadru=zeros(480,640,3); adugare secvenial de new_mov=addframe(new_mov,cadru); cadre la secvena new_mov, end new_mov=close(new_mov); nchidere flux video
(obligatorie).
79
AVIFileInit();
iniializare librrie AVIFile (o singur dat); AVIFileExit(); la terminare program! pointer la o interfa IAVIFile (deschidere i manipulare fiiere); pointer la o locaie de memorie n care va fi stocat un handle ctre un flux de date (video, audio, ...); pointer la o interfa IGetFrame (extragere, decompresie ... ); antet fiier DIB (Device Independent Bitmap) i fiier AVI acces cadre.
80
PAVIFILE avi; PAVISTREAM pStream; PGETFRAME pFrame; BOOL MovieIsOpen; BITMAPINFOHEADER bih; AVIFILEINFO avi_info;
// nchidere flux anterior boolean (definit, nu este if (MovieIsOpen) standard!) { eliberare resurse folosite MovieIsOpen=False; la decompresie cadre; if (pFrame) AVIStreamGetFrameClose(pFrame); if (pStream) nchidere flux de date; AVIStreamRelease(pStream); if (avi) nchidere fiier avi; AVIFileRelease(avi); pFrame=NULL; pStream=NULL; avi=NULL; pointeri nuli; }
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 81
// deschidere fisier nou i returneaz n avi int res; pointerul la interfaa res=AVIFileOpen(&avi, szFileName, acestuia; OF_SHARE_DENY_WRITE, NULL); if (res!=AVIERR_OK) { // unable to open the AVI file! ... }
// deschidere flux de date nou MovieIsOpen=True; res=AVIFileGetStream(avi, pStream, streamtypeVIDEO, 0); if (res!= AVIERR_OK) { // stream open error! ... } AVIFileInfo(avi, &avi_info, sizeof(AVIFILEINFO));
82
// pregatire accesare cadre video int FrameNumber=AVIStreamLength(*pStream); if (FrameNumber==-1) { // stream length is zero! } int FirstFrame=AVIStreamStart(*pStream); if (FirstFrame==-1) { // error retrieving the first frame! }
eroare, nu exist nici un cadrul video; cutare poziie de plecare n flux = primul cadru video; eroare;
antet DIB bih; // deschidere flux de cadre video (la adresa ZeroMemory(&bih, sizeof(BITMAPINFOHEADER)); pointerului bih se bih.biBitCount=24; bih.biClrImportant=0; iniializeaz cu 0 bih.biClrUsed = 0; bih.biCompression = BI_RGB; memorie pentru bih.biPlanes = 1; bih.biHeight = avi_info.dwHeight; antet); bih.biWidth = avi_info.dwWidth; bih.biSize = sizeof(BITMAPINFOHEADER); pregtete decompresia bih.biSizeImage = bih.biWidth*bih.biHeight*3; din fluxul pStream i d controlul prin pFrame *pFrame=AVIStreamGetFrameOpen (imaginile conform bih) (*pStream, &bih); if (*pFrame==NULL) eroare la format imagine; { // frame format error! }
84 Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 85
// copiere cadru video unsigned char *pDataImage= NULL; unsigned char *pDIB = (unsigned char*) AVIStreamGetFrame(*pFrame, 100); if (pDIB==NULL) { // frame decompression failed! }
BITMAPINFOHEADER BmpInfo; copiere date pDIB memcpy(&BmpInfo.biSize, pDIB, pDataImage (pentru a modifica imaginea). sizeof(BITMAPINFOHEADER)); pDataImage = new unsigned char[BmpInfo.biSizeImage]; memcpy(pDataImage, pDIB+ sizeof(BITMAPINFOHEADER), BmpInfo.biSizeImage);
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 86
// modificare cadru, afiare etc. parcurgere imagine pe for (int y=0; y<BmpInfo.biHeight; y++) linii i coloane; for (int x=0; x<BmpInfo.biWidth; x++) { componenta de int Red=pDataImage[(BmpInfo.biHeight-1-y)* rou (y,x) BmpInfo.biWidth*3+x*3+2]; componenta de int Green=pDataImage[(BmpInfo.biHeight-1-y)* BmpInfo.biWidth*3+x*3+1]; verde (y,x) int Blue=pDataImage[(BmpInfo.biHeight-1-y)* componenta de BmpInfo.biWidth*3+x*3]; albastru (y,x) } ... dup calcule eliberare memorie pDataImage delete pDataImage; (copia cadrului decomprimat).
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 87
> ffmpeg: utilitar conversie ntre diverse formate video (linie de comand); > ffserver: server de streaming multimedia live; > ffplay : media player; > libavutil : librrie de funcii specifice de programare (numere aleatoare, structuri de date, funcii matematice, ...); > libavcodec : librrie de codec-uri audio-video (codor-decodor); > libavformat : librrie multiplexare-demultiplexare pentru containere; > libswscale : librrie de funcii optimizate pentru scalare i conversie din diverse spaii de culoare; > libavdevice : librrie de renderizare i extragere cadre ...
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 88 Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 89
demo
list fiiere de convertit (implicit fiierul rezultat este salvat n acelai director)
demo
91
92
93
> se estimeaz c n viitorul apropiat >60% din datele vehiculate pe Internet vor fi video (ex. YouTube ~ upload 24h pe minut);
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 94
> soluia existent: sistemele de indexare automat dup coninut sau Content-based Indexing Systems (sunet: CBAR, imagini: CBIR, video: CBVR, etc.)
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 95
[rezumate]
sistemul de navigare
0001010010 1100011010 1111110001 0011110110 0001111111 informaie brut program: Windows 7 Explorer
sistemul de cutare
adnotare coninut
96
97
Sistemul de navigare
> permite accesul utilizatorului la informaiile din baza de date, (concretizarea sistemului de indexare):
Sistemul de navigare
> permite accesul utilizatorului la informaiile din baza de date, (exemple, continuare):
100
101
Paradigme
[C. Snoek, A. Smeulders, Tutorial on Video Search Engines, 2010]
> exist o multitudine de reprezentri ale aceluia obiect: iluminare diferit, perspectiv, suprapunere obiecte, etc.
sensory gap
> discrepan ntre informaiile extrase n mod automat i semnificaia semantic pe care le-o putem atribuii acestora,
0 01001 0001 1010 01 1100 0001 11 1 0 111 11011 0011 1111 11 0001
main
semantic gap
copac
102
103
Paradigme
[C. Snoek, A. Smeulders, Tutorial on Video Search Engines, 2010]
interface gap
104
105
Surse de informaie
> video = informaie spaio-temporal: culoare: coninut vizual; textur: materiale din scen; form: obiecte, personaje; structura temporal: ritm, aciune; micare local sau global; sunet muzic, vorbire; alte surse ex. culoare piele, text ncrustat, etc.
specifice video motenite de la sistemele de indexare de imagini
MPEG-7
Moving Picture Experts Group (2002 prezent) = Multimedia Content Description Interface: standard de descriere a coninutului multimedia, al patrulea pas major: indexarea coninutului video.
[http://mpeg.chiariglione.org/]
Obiective principale:
> gestionarea informaiei audio-vizuale la nivel: audio, voce, video, imagini, grafic i 3D; > furnizarea de metode rapide de cutare, filtrare i identificare a coninutului multimedia (cutarea multimedia la fel de simpl precum cea textual); > descriptori de coninut (numerici, structuri, modele , colecii ...); > descrierea modului de relaionare a obiectelor pentru a forma scena; > independen fizic ntre partea de descriere i informaia propriu-zis (totui sunt relaionate, multiplexate);
106
107
MPEG-7
Descrierea coninutului multimedia (Multimedia Description Schemes) = structuri de metadate ce descriu i adnoteaz coninutul AV: textuale (XML ce poate fi citit editare, cutare, filtrare) binare (comprimate stocare sau transmisie) Descriptors (D): descrierea low-level a proprietilor scenei audio-vizuale (culoare, textur, micare, ...) + proprieti fizice (locaie, timp, calitate, ...); a fi extrase automat! Description Schemes (DSs): descrierea high-level a coninutului AV (regiuni, segmente, obiecte, evenimente, ...) necesit intervenie uman! Description Definition Language (DDL): descrierea pe baza XML a relaiilor structurale ntre descriptori (creare i modificare de DSs i D); System tools: binarizare, sincronizare, transport + stocare descriptori;
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 108
culoare
- scalable color: histogram de culoare HSV (scalabil nr. culori, bii, ...); - color layout: distribuia spaial a culorilor (foarte compact, independent de rezoluie); - color structure: informaie despre coninutul de culoare (histogram) dar i structur (prin element structurant); - GoP color: extensia descriptorului de culoare scalabil pentru secvene de imagini (histograma medie, median i intersecie = minim least common).
[T. Sikora, The MPEG-7 Visual Standard for Content Description - An Overview, 2001] Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 109
textur
- texture browsing: caracterizare perceptual precum regularitate, direcionabilitate i granularitate; - edge histogram: distribuia spaial a 4 tipuri de orientri de contur (vertical, orizontal, 45, 135); - region shape: distribuia pixelilor ntr-un obiect 2D (obiecte complexe = regiuni disconecte, bazate pe 2D Angular Radial Transformation - transf. unitar);
form
- region locator: localizarea regiunilor la nivel de cadru prin specificarea unui dreptunghi sau poligon (scalabil); - spatio-temporal locator: localizarea spaio-temporal a regiunilor (micare obiecte); poate descrie i obiecte ce nu sunt conectate spaial;
form
localizare
- contour shape: proprieti obiect pe baza formei conturului (bazate pe reprezentarea n Curvature ScaleSpace reprezentare 1D a conturului);
Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 110 Analiza i Prelucrarea Secvenelor de Imagini, .l. Bogdan IONESCU 111
micare
- motion activity: ~nivelul de aciune (lent, rapid, aciune), bazat pe dispersia amplitudinii vectorilor de micare (pot avea o reprezentare spaial i temporal);
112
113