Documente Academic
Documente Profesional
Documente Cultură
Rezumat
Aceasta lucrare isi propune a fi o introducere in metodele de compresie a imaginilor binare.
De aceea tratarea subiectului nu se pretinde a fi exhaustiva. Se urmareste familiarizarea studentilor
cu diversele procedee de codare exacta dezvoltate pina in prezent. Vor fi luate in considerare trei
metode de codare exacta a imaginilor binare: (a) White Block Skipping (WBS), (b) Run Length
Coding (RLC) si (c) Block Coding (BC). Prima metoda, WBS, va fi analizata din punctul de
vedere al factorului de compresie si al modelului de Lant Markov asociat. A doua metoda, RLC,
va cuprinde analiza atit a Codarii Lungimii Sirurilor Independent de Culoare cit si Codarea
Lungimii Sirurilor Functie de Culoare. Si in cazul RLC va fi dezvoltat modelul Lantului Markov
asociat. Pentru a treia metoda va fi calculat factorul de compresie maxim, corespunzator unei
codari absolut optimale, iar apoi va fi implementat codul Huffman asociat statisticii preluate dintro imagine si din mai multe imagini. Cele trei metode studiate vor fi apoi comparate din punctul de
vedere al factorului de compresie. In final se vor face considerente asupra altor metode de codare
a imaginilor binare si asupra standardelor existente.
1. Introducere
A comprima un mesaj inseamna a pastra numai acei parametri care sint esentiali pentru
destinatar. Ceilalti parametri nu se transmit, respectiv nu se stocheaza.
Sistemele de compresie pot fi grupate in doua categorii:
- sisteme care utilizeaza procedee care conserva entropia sursei, dar reduc redundanta ( codare
exacta).
- sisteme care utilizeaza procedee care reduc entropia sursei ( o parte din informatie se pierde).
In cele ce urmeaza va fi tratata doar codarea exacta, deci la receptor, prin decodare va
putea fi reprodusa exact sursa initiala.
Conform primei teoreme a lui Shanon [1], printr-o codare corespunzatoare, sursa de
entropie H poate fi transformata intr-o sursa de entropie maxima H MAX ( sau aproape de
maximum), respectiv se efectueaza o operatie de reducere a redundantei. Simbolurile sursei de
entropie maxima, respectiv de redundanta zero, sint codate in cuvinte de lungime medie minima si
in consecinta eficienta transmisiunii este maxima, iar stocarea lor se poate face in memorii de
capacitate mai mica decit in absenta codarii.
Imaginile binare sint semnale discrete, bidimensionale, cu suport finit care pot lua doar
doua valori ( negru = "0" si alb = "1" ). Aceste imagini se intilnesc in practica sub forma de pagini
tiparite, scrisori, documente, ziare, harti geografice, harti meteorologice, fise cu amprente etc. Ca
urmare transmisia si stocarea unor astfel de imagini este intilnita astazi in diverse domenii de
activitate incepind cu uzuala, de acum, transmisie prin fax si terminind cu bazele de date de
amprente utilizate in criminalistica. Datorinta volumului mare de memorie pe care il necesita o
imagine binara ( un format standard de scrisoare de 8.5 x 11 inch esantionat la 200 puncte/inch
contine aprox. 3,7 Mbiti ) apar avatajoase diversele metode de compresie, care reduc timpul de
transmisie, largimea de banda necesara transminiei si necesarul de capacitate de stocare.
Compresia exacta este posibila datorita redundantei existente in imaginile binare. Astfel se
constata existenta unei corelatii bibimensionale puternice intre elementele (pixeli) alaturate ale
imaginii.Unele imagini binare sint caracterizate de zone intinse de nivel "1" (alb). De aici apare
ideea utilizata de WBS [2], adica "sarirea blocurilor de alb".
Tehnica RLC [2], [3] exploateaza eficient corelatia orizontala a elemetelor imaginii prin
gruparea lor in siruri negre si siruri albe, rezultind deci "codarea lungimii sirurilor".
(10)
unde:
ip i
(11)
i 1
iar:
l
c
li pi
(12)
i 1
p logp
i 1
(14)
Asadar, limita superioara a factorului de compresie care poate fi obtinut prin RLC-IC este:
n
QMAX = (
ip i ) / ( p i log p i )
i 1
i 1
(15)
In practica se utilizeaza o codare optimala de tip Huffman, care nu este insa absolut
optimala. Din acest motiv raportul de compresie obtinut este mai mic decit QMAX.
Observatia 2:
Pentru o imagine data, probabilitatea pi poate fi evaluata astfel:
pi = Ni / Nt ,
(16)
unde:
Ni
reprezinta numarul de siruri avind lungimea "i";
Nt
reprezinta numarul total de siruri din imagine.
Modalitatea de codare a lungimii sirurilor cea mai simpla (dar in acelasi timp cea mai putin
eficienta) este codarea binara. Aceasta codare presupune ca fiecarui sir sa-i fie alocat cuvintul de
cod format din reprezentarea in baza 2 a lungimii sirului. Este clar ca tote cuvintele de cod vor
avea aceeasi lungime:
(17)
l i = l c = log n ,
unde n reprezinta lungimea unei linii din imagine.
Utilizind codul binar, se poate deci defini o limita inferioara a raportului de compresie:
n
QMIN = (
ip i ) / log n
(18)
i 1
(20)
H
H
p Wi log p Wi
(21)
(22)
i 1
n
p Bi log p Bi
i 1
pWi
pBi
l
B
ip Wi
p Wi 1)
(23)
(24)
i 1
n
i 1
n
i 1
i 1
Din relatiile (10), (20), (21) si (22) rezulta ca limita superioara a factorului de compresie
este:
QMAX = 1 / HWB
(25)
sau echivalent:
n
Q MAX = -1 / [ PW (
p Wi log p Wi ) / ( ip Wi ) + PB ( p Bi log p Bi ) / ( ip Bi ) ]
i 1
i 1
i 1
i 1
Observatia 3:
Pentru o imagine data probabilitatile pWi si pBi pot fi evaluate cu relatiile:
(26)
(27)
(28)
unde:
NWi
NBi
NtW
NtB
N Wi N Bi
i 1
(32)
i 1
p i log p i
(37)
i 1
Entropia
sirurilor
albe
Entropia
sirurilor
negre
QMAX
Metoda
CCITT-1
QREAL
Metoda
CCITT-1
QREAL
Metoda
CCITT-2
5.230
3.592
16.02
15.16
21.6
2
3
4
5
6
7
8
167.9
71.50
36.38
66.41
90.65
39.07
64.30
14.02
8.468
5.673
6.966
8.001
4.442
60.56
5.989
5.189
4.574
5.280
5.063
5.320
4.427
4.457
3.587
3.126
3.339
3.651
3.068
5.310
17.41
9.112
5.461
8.513
11.32
5.188
11.52
16.67
8.350
4.911
7.927
10.78
4.990
8.665
32.4
14.6
6.5
13.2
23.2
6.5
20.7
realizarea particulara). Insa imaginile binare (si imaginile in general) sint recunoscute ca semnale
nestationare. Atunci, codul Huffman implementat pe baza probabilitatii de aparitie a blocurilor
dintr-o imagine este un cod optimal doar pentru imaginea respectiva, nu si pentru altele. De aici ar
rezulta ca procesul de codare ar trebui sa implementeze un cod Huffman pentru fiecare imagine, a
carui tabela sa fie transmisa la receptie. Insa timpul de generare a codului si supraincarcarea
provenita din dimensiunea mare a tabelei de cod ( 512 intrari) care se transmite, fac ca acest
procedeu sa fie complet ineficient. De aceea se prefera generarea unui cod Huffman general pe
baza statisticilor culese de la mai multe tipuri de imagini. In acest fel codul obtinut, desi nu este
optimal este totusi adaptat statistic pentru mai multe tipuri de imagini.
b) Obtinerea rezultatelor experimentale
Se utilizeaza optiunile specificate la punctul 7.a) pentru a aplica metodele de codare WBS,
RLC-IC, RLC-FC si BC pentru imaginile de test care se gasesc in directorul curent.
Pentru metodele WBS, RLC-IC si RLC-FC se vor trasa graficele corespunzatoare
factorilor de compresie maximi pentru diferite imagini de test.
Pentru metoda BC se va determina factorul de compresie maxim si factorul de compresie
real pentru diferite imagini de test si se vor trasa graficele corespunzatoare. Apoi se vor colecta
statisticile imaginilor de test cu optiunea "Make Prob" aplicata asupra fiecarei imagini si se va
determina factorul de compresie real prin utilizarea codului Huffman general.
Se vor justifica rezultatele.
8. Intrebari si teme
8.1. Justificati relatia (4) de la metoda WBS.
8.2. Explicati relatia (20) ( expresia entropiei sirurilor albe si negre de la metoda RLC-FC).
8.3. Demonstrati relatiile (29) si (30) de la metoda RLC-FC.
8.4. Demonstrati relatia (31) de la metoda RLC-FC.
Indicatie: Se are in vedere faptul ca
i 1
i 1
p Wi 1 si p Bi 1.
deci probabilitatea de aparitie a unui pixel alb urmat de alti N-1 pixeli albi.
Pe de alta parte probabilitatea de aparitie a unui pixel alb si a unui pixel negru este:
P( W,B ) = P( W ) P( B/W ) = P( B )P( W/B )
(2A)
sau:
P( W ) q0 = P( B ) q1
(3A)
In plus :
P( W ) + P( B ) = 1
(4A)
Rezolvind sistemul format din ecuatiile (3A) si (4A) rezulta:
P( W ) = q1 / ( q0 + q1 )
(5A)
P( B ) = q0 / ( q0 + q1 )
(6A)
Introducind (5A) in (1A) se obtine relatia (6).