Documente Academic
Documente Profesional
Documente Cultură
Frecvența spațială este dată de numărul de perioade ale unui stimul sinusoidal raportat la
unghiul de vizualizare; se măsoară în cpd – cycles per degree. Frecvența spațială este așadar o
măsură pentru cât de des se repetă componentele sinusoidale ale unei structuri raportat la o
unitate a unghiului de vizualizare (componentele sinusoidale fiind cele determinate cu
transformata Fourier).
Frecvențele spațiale înalte presupun un număr mai mare de perioade ale stimulului
sinusoidal cuprinse în unitatea de unghi de vizualizare, față de frecvențele joase. În consecință,
frecvențele spațiale înalte sunt specifice detaliilor fine și informației structurale (modificări
bruște în imagine), în timp ce frecvențele joase sunt date de forma și orientarea generală sau de
proporții.
1.2 Exerciții
1. Rulați programul Matlab care filtrează o imagine de test cu un filtru gaussian trece-jos,
apoi cu un filtru trece-sus. Reluați pentru cel puțin încă o imagine de test. Explicați diferențele
dintre imaginile filtrate trece-jos și cele filtrate trece-sus.
2. Programul VcDemo
2.1 Introducere
VcDemo este un program de învăţare a tehnicilor de compresie a imaginilor şi a
secvențelor video. Se dorește testarea unor algoritmi de compresie (de complexitate variabilă)
fără a avea în vedere implementarea lor propriu-zisă. Din această cauză programul utilizează
meniuri de dialog şi permite utilizatorului să experimenteze cu diferiţi parametri specifici
operaţiei de compresie.
Vizualizarea rezultatelor compresiei contribuie la înţelegerea performanţelor unui anumit
algoritm. O modalitate efectivă de lucru cu VcDemo este testarea de combinaţii de parametri,
identificarea cauzelor artefactelor de compresie precum şi comparația performanțelor de
compresie atât vizual cât şi numeric.
PSNR Calitate
> 40dB Foarte bună
30 – 40dB Bună
< 30dB Slabă
Aceste rezultate sunt salvate pentru fiecare imagine comprimată afişată în spaţiul de lucru
şi pot fi obţinute apăsând click-dreapta pe o imagine, iar apoi selectând „Image Information”.
Cea mai simplă metodă de a închide toate meniurile şi imaginile obţinute dintr-o imagine
de start este închiderea imaginii de start.
Secvenţe BMP
O secvenţă de imagini BMP este de exemplu: imag1.bmp, imag2.bmp, ..., imag9.bmp,
imag10.bmp, etc. Programul nu cunoaşte lungimea acestei secvenţe. Pentru a indica programului
că există o secvenţă imag, imaginile trebuie organizate după cum urmează:
...\adir\imag.seq
...\adir\imag1.bmp
...\adir\imag2.bmp
...\adir\imag3.bmp
etc.
Programul caută fişiere cu extensia *.seq şi după selectare va încărca această imagine ca
prima imagine a secvenţei. De aceea imag.seq trebuie să fie identică cu imag1.bmp (o copie cu
extensie diferită). Toate celelalte cadre vor fi încărcate din subdirectorul imag, până când
următoarea imagine nu mai poate fi găsită şi se constată că s-a ajuns la ultima imagine.
Secvenţele de imagini pot fi deschise selectând „File/Open Sequence”. Secvenţele cu
extensii *.yuv, *.y sau *.seq sunt listate şi pot fi deschise. Se va afişa doar primul cadru. Se pot
apoi activa modulele programului care lucrează cu secvenţe de imagini.
3. Codarea erorii predicţiei (cuantizarea + codarea VLC = cu număr variabil de biţi) se poate face
cu un număr mai mic de biţi.
4.3 Exerciţii
1. Alegeţi imaginea de test „Lena256B.bmp”. Se alege primul model de predicţie.
Observaţi SNR-ul pentru fiecare din cele 6 rate de bit.
2. Realizaţi compresia folosind diferite modele de predicţie şi diferiţi parametri
(Bitrate, Levels etc.). Comparaţi imaginile rezultate.
5.3 Exerciţii
1. Deschideţi imaginea ”Lena256B.bmp” şi realizaţi descompunerea pe subbenzi.
Pentru un număr diferit de coeficienţi ai filtrului observaţi imaginea rezultată
codată.
2. Pentru aceeaşi imagine, alegeţi o structură de descompunere şi un anumit filtru.
Modificând tipul de codare al subbenzilor, între DPCM şi PCM, observaţi cum
apare imaginea codată şi funcţie de parametrul c.
3. Selectaţi un filtru cu 16 coeficienţi, o descompunere pe 28 subbenzi şi alegeţi
compresia PCM pentru toate subbenzile. Alegeţi o valoare optimă pentru c.
Observaţi câştigul SNR în cazul codării entropice.
4. Deschideţi imaginile “Zone256B.bmp” şi “Noise256B.bmp”. Repetaţi punctul
(1) pentru aceste imagini.
Figura 5.2 Coeficienţi DCT compresaţi (scalaţi pentru vizibilitate maximă) pentru cele
două tipuri de afişare (stănga: colecţii, dreapta: blocuri DCT)
6.3 Exerciţii
1. Alegeţi o imagine. Transformaţi această imagine în coeficienţi DCT. Observaţi
calitatea imaginii reconstruite neaplicând codare, doar IDCT (deselectaţi opţiunea
“Encoding of DCT Coeffs”).
2. Folosind imaginea aleasă la punctul (1), codaţi coeficienţi DCT (selectaţi opţiunea
“Encoding of DCT Coeffs”) şi selectaţi diferite combinaţii de parametrii pentru
codare (Size, Coefs, Bitrate etc.). Verificaţi imaginea reconstruită şi observaţi
modificarea SNR-ului.
3. Pentru imaginea “Lena256B.bmp” selectaţi transformata DCT 8x8 şi compresie PCM
pentru toţi coeficienţii DCT. Variaţi parametrul c. Observaţi diferenţele dintre
numărul de bpp selectat, cel prezis şi cel rezultat în urma compresiei. Care sunt
valorile optime pentru parametrul c?
4. Repetaţi punctul (2) utilizând setările corecte pentru parametrul c, pentru alte
două cazuri, şi anume:
Tehnici de compresie a semnalelor multimedia – Lucrarea 2
a. compresie DPCM pentru toţi coeficienţii
b. compresie DPCM pentru primul coeficient DCT şi compresie PCM pentru
restul de coeficienţi.
5. Examinaţi urmările erorilor asupra compresiei DCT pentru diferite probabilităţi de
eroare, diferite mărimi ale blocurilor DCT şi diferite modele DPCM de predicţie.
Explicaţi structura imaginii afişate. Comparaţi efectele prezenţei erorilor asupra
coeficienţilor DCT şi asupra imaginii decodate.