Sunteți pe pagina 1din 13

Tehnici de compresie a semnalelor multimedia – Lucrarea 2

Filtrarea imaginilor. Compresie în VcDemo.


1. Filtrarea imaginilor
1.1 Frecvența spațială

Unghiul de vizualizare este unghiul subântins în centrul ochiului de către un stimul


vizual; se măsoară în grade.

Frecvența spațială este dată de numărul de perioade ale unui stimul sinusoidal raportat la
unghiul de vizualizare; se măsoară în cpd – cycles per degree. Frecvența spațială este așadar o
măsură pentru cât de des se repetă componentele sinusoidale ale unei structuri raportat la o
unitate a unghiului de vizualizare (componentele sinusoidale fiind cele determinate cu
transformata Fourier).

Frecvențele spațiale înalte presupun un număr mai mare de perioade ale stimulului
sinusoidal cuprinse în unitatea de unghi de vizualizare, față de frecvențele joase. În consecință,
frecvențele spațiale înalte sunt specifice detaliilor fine și informației structurale (modificări
bruște în imagine), în timp ce frecvențele joase sunt date de forma și orientarea generală sau de
proporții.

1.2 Exerciții
1. Rulați programul Matlab care filtrează o imagine de test cu un filtru gaussian trece-jos,
apoi cu un filtru trece-sus. Reluați pentru cel puțin încă o imagine de test. Explicați diferențele
dintre imaginile filtrate trece-jos și cele filtrate trece-sus.

I = rgb2gray(imread('court.jpg')); % RGB -> im.de intensitate


A = fftshift(fft2(double(I))); % transf.Fourier a im.de intensitate
[M N] = size(A);
R = 10;
X = 0:N-1; Y = 0:M-1;
[X Y] = meshgrid(X,Y);
Tehnici de compresie a semnalelor multimedia – Lucrarea 2
m_x = 0.5*N; m_y = 0.5*M;
Lo = exp(-((X-m_x).^2+(Y-m_y).^2)./(2*R).^2); % filtru gaussian trece-jos
Hi = 1-Lo; % filtrul trece-sus = 1-filtrul trece-jos
% imagine filtrata = ifft(fct_transfer_filtru * fft(imaginea_originala))
B1 = ifft2(ifftshift(A.*Lo));
B2 = ifft2(ifftshift(A.*Hi));
figure(1),subplot(221),imshow(I),colormap gray, xlabel('im.orig.')
subplot(222),imshow(abs(A),[-12,300000]),colormap gray,xlabel('fft(iorig.)')
subplot(223),imagesc(abs(B1)),colormap gray,xlabel('im.filtrata trece-jos')
subplot(224),imagesc(abs(B2)),colormap gray,xlabel('im.filtrata trece-sus')
figure(2),mesh(X,Y,Lo),axis([0 N 0 M 0 1]),title('H(f)-filtru Gaussian trece-
jos')
figure(3),mesh(X,Y,Hi),axis([ 0 N 0 M 0 1]),title('H(f)-filtru trece-sus')

2. Programul VcDemo
2.1 Introducere
VcDemo este un program de învăţare a tehnicilor de compresie a imaginilor şi a
secvențelor video. Se dorește testarea unor algoritmi de compresie (de complexitate variabilă)
fără a avea în vedere implementarea lor propriu-zisă. Din această cauză programul utilizează
meniuri de dialog şi permite utilizatorului să experimenteze cu diferiţi parametri specifici
operaţiei de compresie.
Vizualizarea rezultatelor compresiei contribuie la înţelegerea performanţelor unui anumit
algoritm. O modalitate efectivă de lucru cu VcDemo este testarea de combinaţii de parametri,
identificarea cauzelor artefactelor de compresie precum şi comparația performanțelor de
compresie atât vizual cât şi numeric.

2.2 Folosirea programului


După pornirea programului se va încărca o imagine bmp de lucru. Aceasta se face
selectând „File/Open Image” sau apăsând butonul corespunzător. La alegerea imaginii trebuie
avut în vedere faptul că unele metode de compresie sunt restricţionate fie la dimensiuni pare ale
imaginilor, fie la dimensiuni puteri ale lui 2. O alegere bună ar fi o imagine de 256x256 pixeli,
care poate fi folosită pentru toţi algoritmii de compresie şi care are loc în spaţiul de lucru.

Figura 1.1 Fereastră după activarea unui modul de compresie


Tehnici de compresie a semnalelor multimedia – Lucrarea 2
Pot fi folosite şi imagini de dimensiuni mai mari, dar ele sunt câteodată afişate în ferestre
mai mici datorită lipsei de spaţiu (pentru vizualizare la marime originală daţi dublu-click pe
imagine).
Toate rutinele de compresie pentru imagini funcţionează pe imagini cu nuanţe de gri pe 8
biţi, deci formatul imaginii de intrare este convertit la 256 de nivele de gri.
După încărcarea imaginii, meniul de opţiuni şi butoanele specifice fiecărui tip de
compresie devin active. Dacă unele dintre opţiunile de compresie nu sunt active, atunci acest
lucru se datorează dimensiunilor imaginii de start active sau tipului imaginii (imagine fixă,
secvenţă video, secvenţă MPEG).

Apăsarea butonului corespunzător unei tehnici de compresie va produce apariţia meniului


cu parametrii de compresie. Meniul este întotdeauna poziţionat în partea dreaptă (vezi Figura
1.1). După apăsarea butonului „Apply” va începe compresia folosind setul curent de parametri.
Partea de jos a meniului cu parametri are o casetă de text în care vor fi afişate rezultatele
compresiei, ca de exemplu:

În tabelul următor este prezentată o dependenţă subiectivă a calităţii imaginii în funcţie


de valoarea PSNR:

PSNR Calitate
> 40dB Foarte bună
30 – 40dB Bună
< 30dB Slabă

Aceste rezultate sunt salvate pentru fiecare imagine comprimată afişată în spaţiul de lucru
şi pot fi obţinute apăsând click-dreapta pe o imagine, iar apoi selectând „Image Information”.
Cea mai simplă metodă de a închide toate meniurile şi imaginile obţinute dintr-o imagine
de start este închiderea imaginii de start.

Folosirea secvenţelor de imagini


VcDemo foloseşte două tipuri de secvenţe: fişiere de date YUV şi succesiuni
de imagini bmp.
Tehnici de compresie a semnalelor multimedia – Lucrarea 2
Secvenţe YUV
Reprezentarea imaginilor color în formatul YUV (Y luminanţa, U şi V crominanţa) se
face pornind de la reprezentarea RGB (Red Green Blue) astfel:
Y = 0.3R + 0.59G + 0.11B
U = 0.493(B − Y)
V = 0.877(R − Y)
Secvenţele YUV conţin șiruri de imagini brute fără header. Datele sunt stocate ca o
succesiune de blocuri Y-U-V.
Formatul de stocare poate fi doar luminanţă sau luminanţă-crominanţă în format 4:2:0 sau
4:2:2. Pentru fiecare secvenţă trebuie să existe un fişier header cu acelaşi nume. De exemplu:
...\adir\secv.yuv
conţine date YUV cu format descris în secv.hdr. Secvenţe doar de luminanţă sunt conţinute în
fişiere cu extensia .y.

Secvenţe BMP
O secvenţă de imagini BMP este de exemplu: imag1.bmp, imag2.bmp, ..., imag9.bmp,
imag10.bmp, etc. Programul nu cunoaşte lungimea acestei secvenţe. Pentru a indica programului
că există o secvenţă imag, imaginile trebuie organizate după cum urmează:
...\adir\imag.seq
...\adir\imag1.bmp
...\adir\imag2.bmp
...\adir\imag3.bmp
etc.
Programul caută fişiere cu extensia *.seq şi după selectare va încărca această imagine ca
prima imagine a secvenţei. De aceea imag.seq trebuie să fie identică cu imag1.bmp (o copie cu
extensie diferită). Toate celelalte cadre vor fi încărcate din subdirectorul imag, până când
următoarea imagine nu mai poate fi găsită şi se constată că s-a ajuns la ultima imagine.
Secvenţele de imagini pot fi deschise selectând „File/Open Sequence”. Secvenţele cu
extensii *.yuv, *.y sau *.seq sunt listate şi pot fi deschise. Se va afişa doar primul cadru. Se pot
apoi activa modulele programului care lucrează cu secvenţe de imagini.

Folosirea secvenţelor comprimate MPEG


Pot fi folosite fişiere cu extensia *.mpg (folosită in general pentru fluxuri mpeg), *.m1v
(flux video mpeg-1) şi *.m2v (flux video mpeg-2)

Secvenţele MPEG pot fi deschise selectând „File/Open MPEG Stream”. Secvenţele


mpeg cu extensia .mpg sunt listate şi pot fi deschise. Din meniul „pull-down” pot fi selectate şi
fişierele cu extensia *.m1v şi *.m2v. După deschiderea fişierului va fi afişată doar o fereastră
colorată. Doar după activarea modulului de decompresie mpeg, fereastra va fi redimensionată şi
va fi afişată secvenţa video.

3. Decimarea imaginilor (SS)


3.1 Aspecte teoretice
Compresia imaginii se realizează prin reducerea rezoluţiei imaginii cu factorul de
decimare M, ceea ce corespunde unei scăderi substanţiale a calităţii. Decimarea cu un factor M
este echivalentă cu reeşantionarea imaginii cu o frecvenţă de eşantionare de M ori mai mică.
Tehnici de compresie a semnalelor multimedia – Lucrarea 2
Pentru evitarea fenomenului de aliere spectrală înaintea decimatorului se foloseşte un
filtru trece-jos.

Figura 2.1 Decimarea imaginii

3.2 Opţiunile de compresie


Opţiunile de compresie sunt prezentate în Figura 2.2. Există 3 tab-uri cu parametri:

Figura 2.2 Opţiuni de compresie pentru decimare

Factor: Setează factorul de decimare. Imaginea decimată poate fi


vizualizată sub forma sa decimată, adică de dimensiune mai mică,
sau poate fi mărită până la dimensiunea imaginii originale folosind
replicarea pixelilor.
Filter: În general înaintea decimării se realizează o filtrare anti-aliere. În
tab-ul „Filter” poate fi selectată aplicarea filtrului antialiere, şi
lungimea filtrului trece-jos (numărul de coeficienţi). Cu cât filtrul
are o lungime mai mare, cu atât este mai abruptă panta funcţiei de
transfer a filtrului.
Spectrum: Pentru a observa decimarea în domeniul spectral, se poate afişa
spectrul imaginii decimate (sau originale). VcDemo foloseşte
estimatorul periodogram (cu ferestre) pentru calculul spectrului.
Utilizatorul poate selecta tipul de fereastră, ce este folosită pentru a
suprima frecvenţele de scăpare. De observat că calculul spectrului
nu are nici o influenţă asupra procesului propriu-zis de decimare.
Tehnici de compresie a semnalelor multimedia – Lucrarea 2
3.3 Exerciţii
1. Pentru imaginea „Build512B.bmp” vizualizaţi spectrul. Componenta DC a
imaginii este în centrul spectrului. Decimaţi imaginea cu diferiţi factori. Cum
se modifică spectrul?
2. Decimaţi cu factorul 4, fără antialiere şi cu un filtru anti-aliere de lungime 17.
Observaţi diferenţele în imagini şi spectru.
3. Încercaţi şi alte imagini de test. Este observabilă alierea spectrală?

4. Codarea diferenţială PCM (DPCM)


4.1 Aspecte teoretice
Codarea DPCM este un caz particular al tehnicii de compresie denumită codare
predictivă, tehnică prin care informaţia deja transmisă este folosită pentru a prezice valori
viitoare, diferenţa dintre ele fiind codată. Codarea DPCM se bazează pe faptul că orice este
prezis din semnal la codare poate fi reconstruit la decodare. Etapele codării DPCM:
1. Prezicerea valorii pixelului curent x(i, j) din valorile pixelilor adiacenţi x(i −1, j) , x(i −1, j
−1) , x(i, j −1) ...
2. Calculul diferenţei (eroarea de predicţie) între valoarea curentă şi valoarea prezisă:

3. Codarea erorii predicţiei (cuantizarea + codarea VLC = cu număr variabil de biţi) se poate face
cu un număr mai mic de biţi.

4.2 Opţiuni de compresie


Opţiunile de compresie sunt prezentate în Figura 3.1. Există patru tab-uri cu următorii
parametri:

Figura 3.1 Opţiunile de compresie pentru codarea DPCM

Model: Pot fi folosite 4 modele diferite de predicţie. Diferenţele


principale sunt între modelele din stânga (predicţie 1-D verticală)
şi celelalte trei (predicţii 2-D).
Bit Rate: Se selectează rata de bit DPCM (doar numere întregi). Este aplicat
un cuantizor Lloyd-Max optimizat pentru o funcţie de densitate de
probabilitate de tip Laplacian. În caseta de text va fi afişat un
estimat al ratei de bit propriu-zise în urma codării VLC
Tehnici de compresie a semnalelor multimedia – Lucrarea 2
(Huffmann). Acest număr ar trebui folosit la reprezentarea grafică
a raportului semnal-zgomot (SNR) în funcţie de rata de bit.
Levels: Se poate alege între un cuantizor cu un număr par sau impar de
nivele.
Errors: Se permite adăugarea înaintea decodării a unui număr aleator de
erori de bit în fluxul codat. Astfel se pot vedea efectele erorilor
(simple) de canal. Pot fi selectate diferite rate de erori de bit.

Fereastra Prediction Error (eroare de predicţie):


În această fereastră este reprezentată diferenţa de predicţie din interiorul buclei
DPCM. Valorile nule sunt reprezentate în gri, iar valorile pozitive sau negative sunt
reprezentate mai deschis sau mai închis decât valoarea de gri generală. Diferenţa de predicţie
este scalată pentru vizibilitate maximă.

4.3 Exerciţii
1. Alegeţi imaginea de test „Lena256B.bmp”. Se alege primul model de predicţie.
Observaţi SNR-ul pentru fiecare din cele 6 rate de bit.
2. Realizaţi compresia folosind diferite modele de predicţie şi diferiţi parametri
(Bitrate, Levels etc.). Comparaţi imaginile rezultate.

5. Codarea în subbenzi (SBC)


5.1 Aspecte teoretice
Să presupunem că un semnal are cea mai mare parte a energiei concentrate în domeniul
frecvenţelor joase (de exemplu o imagine, deoarece componentele pe frecvenţe înalte reprezintă
detaliile fine).
O transmisie mai eficientă se poate realiza divizând domeniul de frecvenţă în două sau
mai multe subbenzi:

Figura 4.1 Codarea şi decodarea în subbenzi


unde H1(z) este un filtru trece-jos, iar filtrele Hk(z), k=2,3,...,M, sunt filtre trece bandă şi au
caracteristicile:

Figura 4.2 Caracteristica filtrelor de descompunere


Tehnici de compresie a semnalelor multimedia – Lucrarea 2
Prin decimare se păstrează numărul de eşantioane constant şi se repartizează eşantioanele
pe subbenzi. Pentru primul semnal, CODEC 1 va aloca un anumit număr de biţi (de obicei tot
atâţia cât erau şi în imaginea originală). Deoarece energia conţinută în al doilea semnal este mai
mică, CODEC 2 poate aloca mai puţini biţi.
Codorul şi decodorul pot fi de tip PCM, DPCM, DCT (Discrete Cosinus Transform), etc.
Rezultă în final pentru semnalul codat o rată de bit mai scăzută decât cea a semnalului original.
Se poate aloca diferit numărul de biţi per eşantion pentru fiecare subbandă, în funcţie de
caracteristicile semnalului în acea subbandă. Pentru aceasta se folosesc filtre de analiză pentru
fiecare subbandă.

5.2 Opţiunile de compresie


Opţiunile de compresie sunt arătate în Figura 4.3. Există 5 tab-uri cu următorii
parametrii:

Figura 4.3 Opţiuni de compresie pentru codarea în subbenzi

Decompr: Aici poate fi selectată structura de descompunere în subbenzi. Este


posibilă alegerea a 6 modele diferite de descompunere. Cuantizarea
subbenzilor poate fi oprită pentru a putea măsura calitatea filtrelor care
realizează descompunerea în subbenzi şi reconstrucţia.
Filter: Aici se poate alege numărul de coeficienţi ai filtrelor trece-jos de analiză.
Celelalte filtre sunt derivate din filtrul trece-jos de analiză. Filtrele
folosite sunt cele proiectate de Johnson.
Subs: Se poate selecta modul de cuantizare a subbenzilor. Subbanda 1 (de
joasă frecvenţă) poate fi comprimat[ independent de celelalte subbenzi.
Se poate alege între codarea PCM sau DPCM. Cuantizorii folosiţi
depind de funcţia de densitate de probabilitate selectată. Valoarea c
reprezintă parametrul de formă a funcţiei de densitate de probabilitate de
tip Gaussian generalizată.
Bitrate: Pot fi alese diferite rate de bit. În mod normal la ieşirea cuantizorilor este
aplicată o codare entropică (Huffman), dar pentru a putea experimenta
cu erori de bit de canal, această opţiune se poate activa sau dezactiva.
Tehnici de compresie a semnalelor multimedia – Lucrarea 2

Figura 4.4 Funcţia densitate de probabilitate de tip Gauss generalizată

Errors: Se permite adăugarea înaintea decodării a unor erori de bit aleatoare in


fluxul de bit codat. Astfel se pot vedea efectele erorilor (simple) de
canal. Pot fi selectate diferite rate de erori de bit. Erorile de bit pot fi
introduse doar dacă codarea entropică la ieşirea cuantizoarelor a fost
dezactivată.

Subbenzile originale şi comprimate


Subbenzile imaginii de comprimat sunt arătate în dreapta imaginii de start. Un exemplu
este reprezentat în Figura 4.5 (imaginea din stânga). Subbenzile sunt organizante în funcţie de
schema de descompunere aleasă. Subbanda de frecvenţă joasă este arătată în colţul din stânga
sus, iar subbenzile de frecvenţă crescătoare în dreapta şi jos. Subbenzile sunt scalate pentru a se
putea vedea cât mai clar informaţia din fiecare subbandă. „Gri” înseamnă o valoare nulă, iar
valorile negative şi pozitive sunt de nuanţe mai închise, respectiv mai deschise decât valoarea
zero. Varianţa propriu-zisă a subbenzilor poate fi găsită în fereastra de text.
După cuantizare şi codare subbenzile sunt transmise şi decodate la receptor. Subbenzile
decodate sunt afişate imediat sub fereastra cu subbenzile originale (vezi Figura 4.5, imaginea din
dreapta). Subbenzile care au primit zero biţi după alocarea biţilor sunt complet gri. Rezultatele
alocării propriu-zise a biţilor pot fi găsite în fereastra de text. Din nou subbenzile au fost scalate
pentru vizibilitate maximă. Efectele erorilor de canal sunt de asemenea vizibile în subbenzile
individuale.
Tehnici de compresie a semnalelor multimedia – Lucrarea 2

Figura 4.5 Subbenzile originală şi comprimată. Subbenzile sunt scalate pentru


vizibilitate maximă

5.3 Exerciţii
1. Deschideţi imaginea ”Lena256B.bmp” şi realizaţi descompunerea pe subbenzi.
Pentru un număr diferit de coeficienţi ai filtrului observaţi imaginea rezultată
codată.
2. Pentru aceeaşi imagine, alegeţi o structură de descompunere şi un anumit filtru.
Modificând tipul de codare al subbenzilor, între DPCM şi PCM, observaţi cum
apare imaginea codată şi funcţie de parametrul c.
3. Selectaţi un filtru cu 16 coeficienţi, o descompunere pe 28 subbenzi şi alegeţi
compresia PCM pentru toate subbenzile. Alegeţi o valoare optimă pentru c.
Observaţi câştigul SNR în cazul codării entropice.
4. Deschideţi imaginile “Zone256B.bmp” şi “Noise256B.bmp”. Repetaţi punctul
(1) pentru aceste imagini.

6. Transformata Cosinus Discretă (DCT)


6.1 Aspecte teoretice
• Conversie imagine – frecvenţă.
• Importanţa informaţiei de frecvenţă:
- variaţii lente de intensitate în imagine sunt cel mai bine percepute de ochi.
- variaţiile lente corespund frecvenţelor joase.
- tranziţiile bruşte (pixelii de zgomot) corespund frecvenţelor înalte şi nu sunt
perceptibile.
Pentru un bloc din imagine de 8 x 8 pixeli, DCT este dată de:

• Coeficientul C00 se numeşte coeficient DC şi reprezintă frecvenţa spaţială 0 sau media


valorilor pixelilor din bloc.
• Ceilalţi coeficienţi se numesc coeficienţi AC şi reprezintă frecvenţele spaţiale orizontale
şi verticale din bloc.
• DCT nu realizează compresia datelor.
• Pentru decodare se foloseşte Transformata Cosinus Discretă Inversă (IDCT).

6.2 Opţiuni de compresie


Opţiunile de compresie sunt arătate în Figura 5.1. Există trei tab-uri cu următorii
parametrii:
Tehnici de compresie a semnalelor multimedia – Lucrarea 2

Figura 5.1 Opţiunile de compresie pentru DCT

Size: Aici se poate selecta dimensiunea blocurilor pe care se calculează


Transformata DCT (2x2, 4x4, 8x8, 16x16). Cuantizarea coeficienţilor
DCT poate fi oprită pentru a măsura calitatea Transformatei DCT
Directă şi Inversă.
Coefs: Aici poate fi selectat tipul de cuantizare a coeficienţilor DCT.
Coeficientul DC (coeficientul 1) poate fi compresat independent de
coeficienţii DCT de frecvenţe mai mari. Se poate alege între codarea
PCM şi DPCM. Cuantizorii folosiţi pentru fiecare din coeficienţii DCT
depind de funcţia de densitate de probabilitate aleasă. Valoarea c
reprezintă parametrul de formă a funcţiei de densitate de probabilitate
de tip Gaussian generalizată.
Bitrate: Pot fi alese diferite rate de bit. În mod normal la ieşirea cuantizorilor
este aplicată o codare entropică (Huffman), dar pentru a putea
experimenta cu erori de bit de canal, această opţiune se poate activa
sau dezactiva.
Errors: Se permite adăugarea înaintea decodării a unor erori de bit aleatoare in
fluxul de bit codat. Astfel se pot vedea efectele erorilor (simple) de
canal. Pot fi selectate diferite rate de erori de bit. Erorile de bit pot fi
introduse doar dacă codarea entropică la ieşirea cuantizoarelor a fost
dezactivată.
Display: Coeficienţii DCT obţinuţi după transformare şi cuantizare pot fi
reprezentaţi în două moduri:
- Ca o coleţie de coeficienţi DCT. În acest caz coeficienţii
DCT cu acelaşi index din toate blocurile DCT formează un
singur set. Aceste seturi de coeficienţi sunt ca şi subbenzile în
codarea în subbenzi şi permit înţelegerea uşoară a
rezultatului alocării de biţi
- Ca blocuri DCT la locaţia spaţială corectă. În acest caz
coeficienţii DCT sunt reprezentaţi ca nişte blocuri NxN care
se află la poziţia spaţială corespunzătoare celor NxN pixeli, pentru
care se calculează aceşti coeficienţi. Din motive de vizibilitate
coeficienţii DCT sunt scalaţi. Acest mod de afişare explică
conţinutul de frecvenţe locale ale unei imagini şi, după alocarea
biţilor, arată ce părţi ale imaginii sunt greu sau uşor de
comprimat.
Tehnici de compresie a semnalelor multimedia – Lucrarea 2

Coeficienţii DCT originali şi comprimaţi:


Coeficienţii DCT a imaginii ce trebuie comprimată sunt arătaţi în dreapta imaginii de
start. Coeficienţii DCT sunt organizaţi în funcţie de modul Display selectat. Pentru a
vizualiza informaţia din subbenzi, subbenzile sunt scalate pentru vizibilitate maximă. „Gri”
înseamnă o valoare nulă, iar valorile negative şi pozitive sunt de nuanţe mai închise,
respectiv mai deschise decât valoarea zero. Varianţa propriu-zisă a subbenzilor poate fi găsită
în fereastra de text.

După cuantizare şi codare coeficienţii DCT sunt transmişi şi decodaţi la receptor.


Coeficienţii DCT cuantizaţi sunt afişaţi imediat sub fereastra cu coeficienţii DCT originali (vezi
Figura 5.2, imaginea din stânga). Coeficienţii DCT care au primit zero biţi după alocarea biţilor
sunt complet gri. Rezultatele alocării propriu-zise a biţilor pot fi găsite în fereastra de text. Din
nou coeficienţii DCT au fost scalaţi pentru vizibilitate maximă. Efectele erorilor de canal sunt de
asemenea vizibile în coeficienţii DCT individuali. Coeficienţii DCT cuantizaţi sunt organizaţi în
funcţie de modul de Display selectat. Imaginea din dreapta din Figura 5.2 arată coeficienţii DCT
cuantizaţi dacă opţiunea DCT Blocks este selectată.

Figura 5.2 Coeficienţi DCT compresaţi (scalaţi pentru vizibilitate maximă) pentru cele
două tipuri de afişare (stănga: colecţii, dreapta: blocuri DCT)

6.3 Exerciţii
1. Alegeţi o imagine. Transformaţi această imagine în coeficienţi DCT. Observaţi
calitatea imaginii reconstruite neaplicând codare, doar IDCT (deselectaţi opţiunea
“Encoding of DCT Coeffs”).
2. Folosind imaginea aleasă la punctul (1), codaţi coeficienţi DCT (selectaţi opţiunea
“Encoding of DCT Coeffs”) şi selectaţi diferite combinaţii de parametrii pentru
codare (Size, Coefs, Bitrate etc.). Verificaţi imaginea reconstruită şi observaţi
modificarea SNR-ului.
3. Pentru imaginea “Lena256B.bmp” selectaţi transformata DCT 8x8 şi compresie PCM
pentru toţi coeficienţii DCT. Variaţi parametrul c. Observaţi diferenţele dintre
numărul de bpp selectat, cel prezis şi cel rezultat în urma compresiei. Care sunt
valorile optime pentru parametrul c?
4. Repetaţi punctul (2) utilizând setările corecte pentru parametrul c, pentru alte
două cazuri, şi anume:
Tehnici de compresie a semnalelor multimedia – Lucrarea 2
a. compresie DPCM pentru toţi coeficienţii
b. compresie DPCM pentru primul coeficient DCT şi compresie PCM pentru
restul de coeficienţi.
5. Examinaţi urmările erorilor asupra compresiei DCT pentru diferite probabilităţi de
eroare, diferite mărimi ale blocurilor DCT şi diferite modele DPCM de predicţie.
Explicaţi structura imaginii afişate. Comparaţi efectele prezenţei erorilor asupra
coeficienţilor DCT şi asupra imaginii decodate.

S-ar putea să vă placă și