Sunteți pe pagina 1din 32

Capitolul 4

SISTEME DE TELEVIZIUNE DIGITAL


4.1 Probleme specifice n televiziunea digital
Ochiul, receptorul sistemului vizual uman, este un receptor de tip analogic.
Televiziunea analogic (cu definiie normal) transmite imagini color i
sunetul nsoitor ntr-o band de 6-8 MHz n cazul distribuiei terestre i ntr-o
band de 18-30 MHz n cazul distribuiei prin satelit sau prin reele terestre de
microunde (pentru a realiza un raport S/Z mare la modulaia FM).
Un semnal digital TV de calitate ar putea fi transmis ntr-o band de
frecven mult mai mic, dependent i de raportul semnal / zgomot de pe canalul
de comunicaie.
Dar lrgimea de band n care poate fi transmis semnalul TV digital nu este
singurul argument n favoarea televiziunii digitale. Al doilea argument important
este avantajul prelucrrii i transmisiei digitale fa de prelucrarea i transmisia
analogic a semnalelor. Calitatea original a semnalului poate fi refcut ori de cte
ori este nevoie n transmisie, nregistrare sau prelucrare n studiouri de televiziune,
ceea ce nu este valabil pentru semnalul analogic. Se pot folosi tehnici de codare
pentru protecie la perturbaii specifice canalelor digitale.
Trebuie totodat remarcat faptul c exist o tendin evident spre
dezvoltarea masiv a reelelor digitale integrate tip ISDN (Integrated Service
Digital Network), care sunt deosebit de avantajoase pentru distribuia televiziunii
digitale.
n sistemele TV digitale trebuie transmis i sunetul nsoitor (mono sau
stereo) precum i semnalele de sincronizare pe orizontal i vertical n acelai
timp cu secvenele video.
Un alt aspect important este c la transmisia digital a semnalului de
televiziune se poate realiza uor criptarea, necesar att pentru rezolvarea unor
probleme legate de licena de transmisie pe anumite zone ct i pentru sistemele de
tip televiziune interactiv.
Nu n ultimul rnd trebuie spus c transmisia digital a semnalului de
televiziune elimin problemele create n studiourile analogice la conversia de
standard i sistem atunci cnd sursele de program TV sunt din ri cu standarde i
norme TV diferite.
Evoluia spre televiziunea digital a nceput n studiourile de televiziune prin
adoptarea standardului digital internaional de studio 4:2:2, ceea ce permite
transmisia semnalului ntre studiouri fr transcodri. La cellalt capt al lanuluireceptorul TV au aprut funcii noi. Dei semnalul TV este n continuare analogic
1

n majoritatea situaiilor (din considerente de compatibilitate), televizoarele ncep


s fie dotate cu convertoare A/D i D/A rapide, cu memorii de unul sau mai multe
cadre i cu circuite specializate, care permit prelucrri digitale n timp real asupra
semnalului TV : filtrri pentru mbuntirea raportului semnal/zgomot, afiarea
unei imagini fr plpire (cu 100 Hz), efecte speciale (zoom, imagine n imagine,
afiarea unor informaii), prelucrri ale unor semnale codate, etc. Exist i
receptoare n care, cu excepia prii de nalt frecven (tuner, AFI, demodulator)
i a blocurilor de putere, toate celelalte prelucrri sunt realizate digital.
Ulterior acestor dezvoltri de la capetele lanului de televiziune, n momentul
actual se transmite din ce n ce mai mult semnalului TV n form digital ntr-o
band acceptabil i la un pre accesibil al receptorului, prin diverse metode : prin
satelit, prin emitoare terestre, prin cablu, prin internet (Video over IP), telefonie
mobil, etc.
4.2 Etapele conversiei digitale a semnalului de televiziune
Etapele conversiei analog digital pentru semnalul de televiziune sunt cele
clasice care se aplic oricrui semnal dependent de timp eantionarea, cuantizarea
i codarea cu particulariti specifice care in seama de band, structura spectrului
i particularitile sistemului vizual uman.
4.2.1 Eantionarea semnalelor de televiziune
Teorema eantionrii a lui Nyquist trebuie evident respectat i n acest caz,
ceea ce nseamn c frecvena de eantionare trebuie s fie destul de mare. De
exemplu, pentru un semnal video cu rezoluie normal care are banda de 5 MHz
trebuie aleas o frecven de eantionare peste 10 MHz (avnd n vedere c filtrele
de pre- i posteantionare trebuie s fie realizabile). n acest fel se elimin
posibilitatea de aliere a spectrului de baz cu spectrele repetate.
n aceast zon de frecven este util s se aleag o frecven de eantionare
f E a crei valoare s fie un multiplu al frecvenei liniilor fH. n acest fel se obine o
structur de eantionare ortogonal :

fE = n fH
De unde rezult :

TH = n T E

n acest fel pe o linie de explorare ncap un numr ntreg de eantioane, deci pe linii
succesive eantioanel cad unele sub altele. Este un avantaj pentru redarea corect a
contururilor verticale abrupte.
Un alt aspect ce trebuie s fie luat n calcul este cel legat de posibilitatea
realizrii subeantionrii dac se ine seama de structura particular a spectrului
semnalului de imagine, care conine benzi spectrale nguste (circa 5-6 Hz) centrate
pe multipli ai frecvenei liniilor, frecvenei semicadrelor i combinaii liniare ale
acestora. Prin alegerea corespunztoare a frecvenei de eantionare se poate asigura
intercalarea benzilor din spectrul original cu cele din spectrul repetat (care are
evident aceeai structur) fr apariia efectului de aliere valabil atunci cnd
spectrul este continuu. Se poate de exemplu eantiona semnalul PAL cu dublul
frecvenei subpurttoarei de culoare (aproximativ 8,86 MHz) care este sub
frecvena Nyquist de 10 MHz (pentru o band a semnalului PAL de 5 MHz).
Eantionarea se poate face pe componente (R, G, B sau Y, R-Y, B-Y) sau pe
semnal videocomplex (PAL, SECAM sau NTSC). Din punct de vedere al calitii
imaginii este recomandat eantionarea pe componente, lucru care se realizeaz n
standardul digital de studio. Se utilizeaz eantionarea pe componente pe luminan
Y i diferene de culoare R-Y i B-Y n locul celei pe semnale primare R, G, B,
deoarece banda semnalelor diferen de culoare (i n consecin frecvena de
eantionare) poate fi redus cel puin la jumtate.
Eantionarea semnalului videocomplex este realizat n receptoarele cu
prelucrare digital n care, dup demodularea semnalului i obinerea semnalului
videocomplex n banda de baz, toat prelucrarea ulterioar se face digital. n acest
caz pentru PAL este util de ales o frecven de eantionare egal cu de 4 ori
frecvena subpurttoarei de culoare (aproximativ 17,72 MHz) ceea ce permite
realizarea uoar a decodorului de culoare digital PAL, deoarece sunt 4 eantioane
pe o perioad de subpurttoare. Se poate observa c n acest caz frecvena de
eantionare este i multiplu al frecvenei liniilor, adic structura de eantionare este
ortogonal.
4.2.2. Cuantizarea semnalelor de imagine
Cuantizarea semnalelor de imagine nseman alegerea unor nivele de decizie
i de cuantizare astfel nct valoarea analogic a fiecrui eantion s fie rotunjit la
valoarea cea mai apropiat de cuantizare. Aceast operaie introduce o eroare la
reconstituirea eantioanelor dup conversia digital analog, deoarece valoarea
eantionului reconstituit nu mai este riguros egal cu valoarea eantionului original.
Apare aa-numitul zgomot de cuantizare. Pentru ca acesta s nu afecteze calitatea

imaginii este necesar ca numrul i dispunerea nivelelor de cuantizare s in seama


de calitile de percepie ale sistemului vizual uman.
Cel mai suprtor mod n care zgomotul de cuantizare ar putea afecta
imaginea ar fi n cazul n care n zona respectiv de imagine este o variaie
continu de strlucire. Dup cuantizare la trecerea de la un nivel de cuantizare la
altul ar putea apare efectul de contur fals.
Se tie c percepia variaiilor de luminan este discontinu i neliniar.
Astfel, dac luminana variaz ntr-o zon de imagine, ochiul va percepe acest lucru
doar dac se depete un anumit prag B. Acest prag depinde ns de luminana B
a zonei de imagine respective, raportul B / B este constant i egal cu aproximativ
0,02. Dac distana dintre dou nivele de cuantizare este mai mic dect cel mai
mic B perceptibil de ctre ochi, atunci zgomotul de cuantizare nu afecteaz
imaginea.
Din punct de vedere al realizrii caracteristicii de cuantizare, aceasta va fi o
caracteristic n trepte situat n cadranul unu dac semnalul este unipolar (cum
este de exemplu semnalul de luminan Y sau semnalele primare R, G, B) sau
simetric n cadranele unu i trei dac este vorba de cuantizarea semnalelor
diferen de culoare R-Y i B-Y care sunt semnale bipolare. Treptele caracteristicii
pot fi egale sau inegale. Dac se utilizeaz cuantizarea uniform nivelele de decizie
i de cuantizare sunt egal deprtate. Dac nivelele de decizie i de cuantizare nu
sunt uniforme se spune c avem un cuantizor neuniform.
Alegerea caracteristicii de cuantizare trebuie s duc la minimizarea
zgomotului de cuantizare i ine seama n acest scop de statistica semnalului. Dac
distribuia de probabilitate a nivelelor eantioanelor este uniform, atunci
cuantizorul optim este cuantizorul uniform. Acesta este i cel mai simplu de realizat
practic, pentru c pragurile comparatoarelor din convertorul A / D sunt egale.
Atunci cnd distribuia de probabilitate a eantioanelor semnalului nu este
uniform, cu alte cuvinte exist probabiliti diferite ca un nivel s apar la intrarea
cuantizorului, cuantizorul optim ce minimizeaz zgomotul de cuantizare este cel
neuniform. Construcia practic a acestuia se face folosind tot un cuantizor uniform
dar care este precedat de un circuit cu o caracteristic neliniar numit compresor.
Rolul compresorului este de a face ca la ieirea sa nivelele de cuantizare s
aib distribuie de probabilitate uniform, ceea ce face posibil utilizarea
cuantizorului uniform. Dup prelucrarea semnalului digital (transmisie, memorare,
etc.) cnd este necesar conversia D/A a semnalului video, este nevoie de realizarea
unei operaii inverse celei a compresorului astfel nct semnalul s nu fie
distorsionat. Aceast operaie se numete expandare i se realizeaz dup conversia
D/A. De exemplu, dac funcia neliniar a compresorului este una logaritmic,
atunci funcia expandorului este una exponenial.

Operaia de comprimare i expandare se numete compandare. Trebuie


precizat c prelucrri asemntoare se fac i pentru semnalul audio.

4.2.3 Codarea semnalului video


Ultima etap n prelucrarea necesar conversiei analog-digitale a semnalului
video este codarea. Aceasta nseamn ca fiecrui nivel de cuantizare s i se aloce
un cod binar. Cea mai simpl codare este codarea cu modulaia impulsusrilor n cod
MIC (n englez PCM = Pulse Code Modulation). Aceasta nseamn c fiecrui
nivel de cuantizare qk s i se aloce codul binar natural ce reprezint numrul k. De
exemplu, pentru codarea PCM a semnalului video cuantizat uniform cu 256 nivele
(8 bii pe eantion) rezult urmtoarea alocare :
q0 . 0000 0000
q1 0000 0001

q255 1111 1111


Toate celelalte metode de codare se raporteaz la codarea PCM atunci cnd
se calculeaz viteza de transmisie necesar pentru semnalul video digital. De
exemplu, dac frecvena de eantionare este de 12 MHz (suficient pentru o band
video de 5 MHz) i se cuantizeaz uniform cu 8 bii pe eantion, viteza serial de
transmisie a semnalului video digital este :
V [Mbit/s] = 12 x 8 = 96 Mbit/s
Aceasta este o vitez foarte mare pentru orice canal de comunicaie. Ea poate
fi redus prin metode de compresie spectru la valori rezonabile de 2-4 Mbit/s sau
chiar mai mult exploatnd dou elemente :
1. Caracteristica sistemului vizual uman.
2. Statistica semnalului video.
Raportul de compresie obinut se exprim fie ca un numr fa de metoda
standard PCM (de exemplu se obine o compresie 8 : 1) sau ca numrul
echivalent de bii pe eantion necesar transmisiei (pentru acelai exemplu 1 bit /
eantion).

4.3 Standardul digital de studio i familiile de standarde corespunztoare


Recomandarea 601 a CCIR (ITU-R 601) prevede pentru studiouri un
standard principal digital cu codare pe componente, standardul 4:2:2 ai crui
parametri principali sunt prezentai n tabelul 4.1. Frecvena de eantionare este un
multiplu ntreg al frecvenei liniilor att pentru standardul cu 625 linii/50 Hz ct i
pentru standardul cu 525 linii/60 Hz deoarece :
f H ( 625

f H ( 525

15625
143
=
15734 , 265
144

Multiplii comuni ai acestor frecvene sunt multiplii frecvenei de 2,25 MHz.


Valorile convenabile ale frecvenei de eantionare sunt : 11,25 MHz (5x2,25) ; 13,5
(6x2,25) ; 15,75 (7x2,25) . Pentru standardul principal s-a ales valoarea de 13,5
MHz.
13,5MHz = 858 f H (525 ) = 864 f H ( 625 )

Parametrii
Semnale
Eantioane/linie
Y
R-Y, B-Y
Structura de
eantionare
Frecvena de
eantionare
Y
R-Y, B-Y
Codare
Nr. de eantioane
pe linia activ
Y
B-Y, R-Y

Tabelul 4.1
Sistemul 525 linii/60 Hz
Y, R-Y, B-Y

Sistemul 625 linii/50 Hz


Y, R-Y, B-Y

858
864
429
432
Ortogonal, eantioanele R-Y i B-Y coincid cu
eantioanele impare ale lui Y

13,5 MHz
6,75 MHz
PCM uniform cu 8 bit pe eantion
720
360

13,5 MHz
6,75 MHz

720
360

Relaia dintre
nivelul
semnalului video
i nivelele de
cuantizare
Y

nivel 16=nivel de negru, nivel 235=nivel de alb

R-Y, B-Y

224 nivele cu nivelul 128=nivel de zero

Lungimea liniei active este aceeai pentru ambele sisteme de explorare i anume
720 eantioane pentru luminan i 360 eantioane pentru fiecare semnal de
crominan.
Debitul de informaie pentru standardul principal este :
VY = 13,5MHz 8bit = 108Mbit / s

pentru semnalul de luminan i :


VC = 2 6,75MHz 8bit = 108Mbit / s

pentru semnalul de crominan deci n total :


V = VY + VC = 216 Mbit / s

Exist multe situaii n care calitatea imaginii este diferit de cea din
standardul principal. De aceea, plecnd de la standardul principal s-a creat o familie
de standarde care au proprietatea c frecvenele lor de eantionare se afl ntr-un
raport de numere ntregi cu standardul principal 4:2:2 (tabelul 4.2).

Standa Frecvena
de
rd
eantionare
Y
4:4:4 13,5 MHz

Tabelul 4.2
Frecvena
Frecvena
de
de
eantionare eantionare
R-Y
B-Y
13,5 MHz
13,5 MHz

4:2:2

13,5 MHz

6,75 MHz

6,75 MHz

216

4:1:1

13,5 MHz

3,375 MHz

3,375 MHz

162

Debitul de Aplicaii
informaie
[Mbit/s]
324

Calitate
ridicat
la
ncrustare
Standard
primar
de
studio
Transmi-siuni
de
calitate
nalt

2:1:1

6,75 MHz

3,375 MHz

3,375 MHz

108

3:1:0

10,125
MHz

3,375 MHz

3,375 MHz

108

Jurnalistic
electronic
(ENG)
Calitate
identic cu cea
din PAL

Standardele de ordin superior sunt 8:4:4 i 4:4:4. Standardul 8:4:4 este un standard
de explorare progresiv cu 625 linii/semicadru. Dup prefiltrare vertical-temporal
i eliminarea unei linii din dou se obine semnal ntreesut 4:2:2. Dup stocare
acest semnal poate fi postfiltrat i aplicat pe un monitor cu afiare cu 625
linii/semicadru. Standardul 4:4:4 eantioneaz semnalele R, G, B sau Y, R-Y, B-Y
cu aceeai band iniial.
Standarde de ordin inferior (sau substandarde) sunt 4:1:1 ; 2:1:1 ; 4:1:0 (semnale
diferen de culoare transmise secvenial) i 3:1:0. Standardul 4:1:1 poate fi
transmis cu 140 Mbit/s (nivelul cuaternar al ierarhiei digitale de transmisie) dac se
utilizeaz intervalul de stingere pe orizontal.
Construirea unui standard inferior din standardul principal nu nseamn numai
reducerea frecvenelor de eantionare ci i modificarea structurii de eantionare
care devine neortogonal ceea ce reduce rezoluia pe direcie diagonal. Standardul
3:1:0 realizeaz eantionarea n ah pe cadre a semnalului de luminan la 3/4 din
frecvena standardului principal i transmisia secvenial a semnalelor diferen de
culoare. La standardul 2:1:1 se face o eantionare neortogonal la jumtate din
frecvena standardului principal ceea ce permite meninerea unei rezoluii pe
orizontal de 6 MHz pentru luminan i de 3 MHz pentru crominan n timp ce
rezoluia pe diagonal scade. Att standardul 3:1:0 ct i standardul 2:1:1 produc o
oarecare degradare a calitii imaginii, dar aceasta este suficient de mic, ceea ce
permite obinerea unei caliti comparabile cu cea a semnalului PAL (aa numitul
"nivel auxiliar" sau nivel reportaj "ENG=Electronic News Gathering").
Recomandarea 601 a CCIR a lsat ns nerezolvate dou probleme importante :
1) Forma filtrelor trece-jos necesare nainte de conversia A/D i dup conversia
D/A.
2) Realizarea interfeelor pentru transmisia semnalelor n unul din aceste standarde.
Filtrele trece-jos trebuie s ndeplineasc urmtoarele condiii :
- distorsionri ct mai mici ale semnalelor din banda de trecere ;
- posibilitatea cascadrii codec-urilor (codor-decodor) fr degradri semnificative
ale semnalului ;
- complexitate acceptabil (deci dimensiuni i costuri reduse).
Este necesar un compromis deoarece o band de trecere mare i o rejecie
puternic a frecvenelor de aliere mai mari sau egale cu jumtate din frecvena de
8

eantionare implic o cdere abrupt a caracteristicii filtrului i deci oscilaii ale


caracteristicii de amplitudine n banda de oprire. Riplul caracteristicilor de
amplitudine i timp de grup poate fi redus mrind complexitatea filtrului.
Amplitudinea acestui riplu se va multiplica cu numrul de codec-uri cascadate dac
se utilizeaz filtre identice.
CCIR i EBU au dat unele direcii de proiectare a acestor filtre :
- Se va specifica o band de trecere (dac este posibil pn la 5,5 MHz) pentru
luminan ;
- Se va realiza o atenuare mare (40 dB) a benzii translatate (n cazul anterior 8-13,5
MHz) ;
- Rejecia la jumtate din frecvena de eantionare va fi moderat (12 dB sau chiar
mai puin) pentru a se realiza un compromis ntre oscilaii n banda de oprire i
aliere ;
- Msuri comparabile (n raport 2:1 pentru standardul principal) se vor aplica
semnalelor diferen de culoare urmnd ca filtrarea s se efectueze o singur dat la
surs sau la afiare chiar i n cazul cascadrii unor codec-uri.
n ceea ce privete interfeele pentru transmisia semnalelor digitale din
standardul 4:2:2 pe distane de pn la maximum civa kilometri se pot utiliza
interfee seriale sau paralel. n interfeele paralel se transmit simultan cei 8 bii plus
un semnal de ceas. Cele trei fluxuri de cuvinte Y, R-Y, B-Y sunt multiplexate n
timp pentru a forma un singur flux de cuvinte cu viteza de 27 Mbit/s. O astfel de
interfa permite utilizarea unor circuite integrate ieftine. O interfa serial cu
viteza de 243 Mbit/s a fost realizat de EBU i SMPTE.
4.4 Metode de compresie a imaginilor
Viteza mare de bit pentru fluxul de date n standardul digital de studio
impune utilizarea unor metode de compresie de spectru pentru reducerea
semnificativ a acestei viteze.
Pentru compararea performanelor diverselor metode de compresie se
utilizeaz mai multe criterii.
Primul dintre ele este raportul de compresie care este egal cu raportul dintre
viteza de bit n transmisia cu modulaia impulsurilor n cod (PCM) i viteza de
transmisie dup compresie.
Al doilea criteriu este calitatea imaginii recepionate. Obiectivul urmrit de
CCIR este de a evita recepia unei imagini de calitate mai slab dect cea produs
de o transmisie analogic. Calitatea este evaluat prin teste subiective n raportul
CCIR 405-4 i Recomandarea 500-2.
Al treilea criteriu este complexitatea procesului, care trebuie limitat la
minimum deoarece determin complexitatea i costul echipamentului de codare i
decodare.
9

Al patrulea criteriu este sensibilitatea sistemului de decodare la erorile din


lanul de transmisie i efectul acestor erori asupra imaginii (Raportul CMTT 967).
Reducerea vitezei de transmisie se bazeaz pe proprietile sursei de semnal
i pe proprietile sistemului vizual uman. Acestea vor fi trecute n revist n
continuare.
1) Proprietile sursei.
Au fost fcute n decursul timpului multe msurtori statistice asupra imaginilor i
a secvenelor de imagini i au fost propuse cteva modele, n general modele
staionare. n afara studiilor teoretice este de menionat c trebuie utilizate
proprietile structurale ale imaginilor, care sunt sensibile la rupturi locale ale
staionaritii (de ex. margini). n general, s-a dovedit eficient s se analizeze
imaginile i secvenele de imagini printr-un model de tip "mozaic", un model
nestaionar unde fiecare component a "mozaicului" are proprietile sale statistice.
Principalele configuraii locale sunt :
- zone cvasi-uniforme, adic zone n care gradientul spaial este mai mic dect de
exemplu 2 % din gama dinamic a unui pixel iar extensia spaial mai mare
dect cteva zeci de pixeli n fiecare direcie ;
- zone cu detalii cu contrast sczut, adic zone cu contrast local mai mic de 5 %
din gama dinamic, fiecare detaliu fiind mic n direcie spaial (civa pixeli) ;
- zone cu detalii cu contrast mare, cu contrast i gradient mai mare dect de
exemplu 15 % din gama dinamic, fiecare detaliu fiind mic n spaiu ;
- margini, cu contrast mai mare dect 15 %, limea tranziiei de unul sau doi
pixeli, tranziia ntinzndu-se longitudinal pe civa zeci de pixeli.
Primele trei tipuri sunt configuraii de tip "suprafa" i sunt mai mult sau mai
puin staionare, Ultima poate fi considerat de tip "linie" i corespunde la
ntreruperi ale staionaritii. Este evident c nu exist delimitri foarte clare ntre
aceste patru categorii, zonele uniforme devin texturate pe msur ce contrastul
crete iar zonele texturate devin un mozaic de zone uniforme i margini pe msur
ce distana focal crete.
De asemenea, fiecare din aceste configuraii spaiale devine o configuraie
spaio-temporal dac se consider i axa timpului. Ele vor fi supuse modificrilor
n timp i micrii. S-a propus s se fac distincie ntre micarea obiectelor i
micarea camerei, aceasta din urm fiind o micare global. S-a propus i
introducerea unor parametri relevani ca vectorul de micare, amplitudinea sa n
spaiu, geometria sa (translaie, zoom) i posibilitatea de urmrire a micrii
datorat abilitii ochiului de a urmri micrile.
n descrierea general spaio-temporal se consider secvenele de imagini ca
eantioane ale unui model dinamic de tip mozaic. Din cauza lipsei de date statistice
adecvate acest model este un model calitativ structural suficient pentru studiul
compresiei de date a semnalului video.
10

2) Proprietile sistemului vizual uman.


Acestea pot fi studiate din diferite aspecte : anatomice, fiziologice, psihofizice
(detecie, percepie) i psihologice (cunoatere, semiotic).
Pentru aplicaii legate de codarea semnalelor de televiziune sunt utile datele
psihovizuale care dau praguri de detecie (msurtori directe sau modele) sau nivele
de percepie subiectiv ca funcii de parametrii stimulilor vizuali crora subiecii
trebuie s le rspund. Avnd ca obiectiv un standard de calitate nalt pentru
sisteme TV sunt utile mai ales datele de detecie. Pragurile de detecie se pot aplica
condiiilor de vizualizare aa cum se definesc n Recomandarea CCIR 500. Datele
se obin prin aa numita metod a "stimulului constant" care const n a prezenta n
ordine aleatoare stimuli predeterminai cu valori selectate ale parametrilor.
Procentele de cazuri n care se vd stimulii sunt interpolate pentru a defini un prag
de detecie de 50%. Se poate folosi ntreaga scal de vizibilitate a stimulului pentru
a defini un prag de perceptibilitate ntre cele dou grade mai nalte, "imperceptibil"
i "perceptibil dar nu suprtor". Literatura de specialitate conine foarte multe date
de acest tip dar de multe ori acestea sunt dificil de aplicat la problemele de
optimizare a codrii. n majoritatea cazurilor defectele codrii corespund unor
stimuli vizuali mai compleci i apar n imagini sau n secvene de imagini reale n
contrast cu formele de test simple utilizate n experimentele psihovizuale (de obicei
fundal uniform, margini sintetice foarte precise, etc).
n continuare se vor trece n revist principalele metode de compresie
utilizate n televiziune.
Exist dou constrngeri specifice care determin tipurile de algoritmi ce pot
fi utilizai pentru televiziune. n primul rnd este necesar o operare n timp real, cu
o vitez mare (de ordinul zecilor de megabii pe secund) , pe un canal cu vitez de
transmisie fix. Aceasta face s fie preferate schemele de codare cu vitez fix sau,
pentru algoritmi care produc viteze variabile, este necesar s se utilizeze registre tip
buffer i metode de evitare a suprancrcrii registrelor. n al doilea rnd,
constrngerile sursei nu permit ca unii algoritmi care sunt eficieni, de exemplu
pentru videoconferin, s fie la fel de eficieni pentru televiziune. De asemenea nu
este posibil utilizarea schemelor de codare adaptiv cu transformare care sunt
foarte eficiente pentru imagini fixe, sau a schemelor de codare pentru grafice i
facsimil.
Avnd n vedere aceste considerente variantele posibile de codare pentru
compresie sunt :
- PCM (Pulse Code Modulation) i scheme de codare nrudite : cuantizare
liniar, cuantizare neliniar i cuantizare adaptiv, eantionare cu diferite
frecvene i structuri, cu filtrare pre- i posteantionare fix sau adaptiv.
- DPCM (Differential PCM) : scheme de codare cu predicie spaial
(intrasemicadru) sau spaio-temporal (intersemicadru sau intercadru) cu
11

predicie fix sau adaptiv, cu cuantizare fix sau adaptiv, urmat uneori de
codare cu lungime de cod variabil a semnalului diferen. Pentru mrirea
eficienei prediciei se poate folosi estimarea micrii sau a marginilor.
- Codare cu transformare : transformri pe blocuri, spaiale sau spaio-temporale,
de tip Hadamard, cosinus, etc., cu cuantizare zonal (fix sau adaptiv) sau
codare cu prag ;
- Scheme hibride : cu DPCM n unele dimensiuni i transformare n altele.
Codarea cu transformare este ntr-adevr o metod foarte eficient realiznd
factori de compresie mari, dar pretinde foarte multe operaii de calcul ce trebuie
efectuate n timp real pentru codarea semnalului de televiziune.
Dimpotriv, codarea cu DPCM este mai uor de realizat practic i are avantajul
c separarea celor dou funcii (predicie i cuantizare) permite o bun adaptare la
proprietile semnalului (predicie) i ale observatorului uman (cuantizare).
4.4.1 Codarea cu predicie
Codarea cu predicie este o metod larg utilizat pentru eliminarea
redundanei din semnalul de televiziune. Codarea cu predicie se bazeaz pe
observaia c ntre eantioanele semnalului de televiziune exist o corelaie destul
de puternic. Codarea este cu att mai eficient cu ct aceast corelaie este mai
mare. Predicia valorii unui eantion se bazeaz pe valoarea eantioanelor
anterioare. Valoarea prezis nu va fi chiar valoarea eantionului curent dar va putea
fi foarte aproape de aceasta. Dac se transmite numai diferena dintre eantionul
curent i cel prezis, volumul de informaie transmis poate fi redus semnificativ.
Deci n codarea cu predicie redundana previzibil poate fi eliminat din semnalul
de intrare, ceea ce permite compresia datelor.
Eantionul prezent x(k ) este estimat din valoarea eantioanelor anterioare
x (k i ) . n codarea cu predicie liniar eantionul prezis este o combinaie liniar a
valorilor eantioanelor precedente :
N

x (k ) = a i x(k i )
i =1

unde ai snt coeficieni constani iar x(k i ) este valoarea eantionului anterior cu i
perioade de tact. Dac se aplic transformata Z rezult :
x ( z ) = P( z ) x( z )

unde :
N

P ( z ) = ai z i
i =1

Eroarea de predicie este :

e( z ) = x ( z ) x ( z ) = [1 P ( z )] x ( z )

12

Eroarea de predicie este codat i transmis la receptor. La receptor x(z ) este


reconstituit din semnalul recepionat e(z ) . Dac exist o corelaie puternic n
semnalul de televiziune, eroarea de predicie este relativ mic n raport cu semnalul
de intrare, deci poate fi codat cu un numr mai mic de bii. Principiul acestei
prelucrri este prezentat n fig. 4.1.

+
+
-

e
+

^x

+
^x

+
P(z)

P(z)

Fig. 4.1 Schema bloc a codrii cu predicie


Predicia este o filtrare liniar cu funcia de transfer P (z ) i este realizat cu un
filtru digital nerecursiv. Funcia de transfer a codorului este 1 P ( z ) . Decodorul este
un filtru digital cu funcia de transfer 1[1 P( z )] . Dac se face predicia utiliznd
doar eantionul precedent, adic

x ( k ) = x ( k 1)

atunci funcia de transfer a codorului este 1 z 1 (un circuit de difereniere) iar


funcia de transfer a decodorului este 1 /(1 z 1 ) (un circuit de integrare). De obicei
codarea cu predicie este realizat ntr-o configuraie cu bucl de reacie. Prezena
cuantizorului n bucla de reacie evit acumularea erorilor de cuantizare. Codarea
DPCM are i avantajul de a elimina un eventual comportament nestaionar al
semnalului.
Proiectarea optim a unui predictor nseamn nseamn alegerea unui numr
suficient de mare de eantioane anterioare i alegerea valorilor coeficienilor ai
(deci determinarea funciei de transfer P (z ) ) pentru care eroarea medie ptratic de
predicie este minim :
N

E[e 2 ( k )] = E[{x( k ) ai x(k i )}2 ]


i =1

unde E[] reprezint media statistic. Derivnd parial n raport cu ai i egalnd


rezultatul cu zero se obine sistemul de ecuaii :

13

a
i =1

E[ x(k i ) x(k j )] = E[ x(k ) x(k j )]

j = 1,2,... N

Dac se noteaz funcia de autocorelaie a semnalului x cu :


Ri = E[ x(k ) x(k i )]

sistemul se poate scrie matricial :


R0
R
1
.

.
RN 1

.
.
.
.
.

R1
R0
.
.
RN 2

. RN 1 a1 R1
. RN 2 a2 R2
.
. . = .

.
. . .
. R0 a N RN

Dac se rezolv ecuaia matricial se pot obine valorile coeficienilor de predicie.


Puterea erorii de predicie minimizate este :
N
R
E[e 2 (k )]Min = R0 [1 ai i ]
i =1
R0

n cadrul experimentrilor s-a constatat c proprietile statistice ale erorii de


predicie pot fi descrise cu ajutorul distribuiei Laplace :
w( D) =

2 D
1
exp

p
2 p

Funcia de autocorelaie a semnalului de televiziune poate fi aproximat cu expresia


:
Ri = R(i) = exp[ i ]

unde este o constant. Se poate demonstra, folosind ecuaiile de mai sus, c n


acest caz predictorul optim este de ordinul unu iar coeficienii sunt dai de relaia :
a1 =

R1
= ; ai = 0 i 1
R0

unde este coeficientul de corelaie ntre dou eantioane vecine. Puterea erorii de
predicie minime este :
PeMin

R 2
= R0 1 1 = R0 (1 2 )
R0

Cu ct este mai mare puterea erorii de predicie minime este mai mic fa de
puterea semnalului. Dac se dorete ca eroarea medie de predicie s fie egal cu
zero, atunci este necesar ca predicia s se fac n conformitate cu ecuaia :
x ( k ) = x ( k 1) + m (1 )
14

unde m este media semnalului. n cazul imaginilor este util predicia


bidimensional. n predicia bidimensional sunt utilizate i eantioane din liniile
precedente ale aceluiai cmp. De obicei corelaia este puternic doar cu elementele
liniei anterioare din acelai cmp. Coeficienii funciei de predicie se determin n
cazul bidimensional pe acelai principiu ca i n cazul unidimensional, punnd
condiia minimizrii erorii ptratice medii de predicie.
Funcia de autocorelaie bidimensional a imaginii pentru zone staionare n sens
larg este de forma :
R(m, n) = R(0,0) exp[ m n ]

Valorile experimentale obinute sunt urmtoarele :


- Pentru imagini de tip prim-plan (cu suprafee uniforme relativ multe)
= 0,125 0,090

= 0,240 0,120

- Pentru imagini cu multe detalii :


= 0,231

= 0,307
- Pentru imagini tip prim plan H = 0,882 0,914; V = 0,786 0,887

- Pentru imagini cu multe detalii H = 0,794; V = 0,735


Dac funcia de autocorelaie bidimensional are forma din relaia de mai sus,
atunci se poate demonstra c :
E[e( m, n) e( r , s )] = 0

pentru m r; n s
Cu alte cuvinte semnalul de eroare de predicie este necorelat. n cazul n care
funcia de autocorelaie bidimensional este de alt form dect cea de mai sus,
atunci este necesar s se utilizeze mai mult de 3 elemente vecine ale eantionului
curent pentru a se obine o bun estimare. n aplicaiile practice, deoarece
proprietile statistice ale imaginii sunt nestaionare i neuniforme spaial, se
prefer s se varieze funcia de predicie adaptiv, n funcie de proprietile locale
ale imaginii. Un mod tipic de adaptare este de a selecta un predictor optim din mai
multe funcii de predicie (fig. 4.2). Alegerea funciei de predicie optime se face
observnd elementele anterioare ale imaginii din vecintatea elementului
considerat. Aceasta este o schem de predicie neliniar n care funcia de predicie
variaz cu statistica local a imaginii. Predicia adaptiv este eficace pentru
scderea erorii de predicie la tranziia dintre dou zone cu proprieti statistice
diferite.
Funcia rat-distorsiune n codarea cu predicie
Funcia rat-distorsiune arat legtura care exist ntre distorsiunile admise ntr-o
metod de compresie care reduce entropia sursei iniiale i valoarea minim la care
poate fi redus debitul de informaie al sursei efective.

15

Fie x(t ) un vector N-dimensional care reprezint ntr-un spaiu metric semnalul
generat de surs i y (t ) vectorul N-dimensional care reprezint semnalul
comprimat transmis. Distorsiunea introdus prin compresie poate fi msurat dac
se definete distana d ( x, y ) ntre cele dou semnale. Se poate alege distana :

e
Cuantizor

+
^x

P1
+

PN

Fig. 4.2 Predicie adaptiv cu predictori comutai


N 1

d ( x, y ) = d ( xi , y i )
i =0

unde :
d ( xi , y i ) = E[( xi y i ) 2 ]

unde x0 ,.....x N 1
i
y0 ,..... y N 1 sunt componentele nainte i respectiv dup
compresie.
Reducerea entropiei n procesul de compresie este echivalent cu efectul
perturbaiilor asupra unui canal de transmisiune. Circuitul de compresie poate fi
considerat un canal afectat de perturbaii i se poate defini transinformaia :
I ( X , Y ) = H (Y ) H (Y / X )

Eroarea medie H (Y / X ) este cu att mai mare cu ct distorsiunile introduse prin


compresie sunt mai importante. Funcia rat-distorsiune este definit prin relaia :
R ( D ) = min[ I ( X , Y )] = min[ H (Y ) H (Y / X )]

unde minimul este n raport cu probabilitile p( y j / xi ) i este supus condiiei ca


distorsiunile d ( x, y ) s nu depeasc valoarea D admis :
d ( x, y ) D

16

Funcia R (D ) reprezint debitul de informaie minim la ieirea circuitului de


compresie care garanteaz c distorsiunea D nu este depit. Deci o compresie
efectuat de o transformare care reduce entropia transform sursa cu debit H ( X )
bii/s ntr-o nou surs cu debit R (D ) mai mic astfel nct distorsiunile s nu
depeasc o valoare admis D. Se poate deci defini raportul de compresie maxim :
C=

H(X )
R( D)

care reprezint de fapt o limit superioar ce nu poate fi depit prin nici un


procedeu de compresie fr depirea limitei admise D pentru distorsiuni.
Teorema codrii surselor a lui Berger este urmtoarea :
" Pentru codarea unei surse discrete fr memorie, exist, atunci cnd distorsiunea
este mai mic dect D , un cod bloc C cu viteza de bit R atunci cnd lungimea
blocului este suficient de mare ".
R = R( D) +

Reciproca acestei teoreme este :


" Dac este disponibil o vitez de bit R pentru codarea unei surse discrete fr
memorie, atunci nu poate fi depit o distorsiune D ( R ) ".
Pentru o surs staionar continu, fr memorie, caracterizat de funcia de
distribuie gaussian :
x2
p ( x) =
exp
2
2
2
Valoarea funciei R ( D ) este :
1

2
1
[bii/simbol]
RG ( D) = log 2
2
D

iar distorsiunea :
0 D 2

Pentru orice rat de informaie R RG (D) , sistemele de compresie care sunt


proiectate s ating o distorsiune D pentru o surs cu distribuie gaussian cu
valoare medie nul i dispersie 2 , vor asigura o distorsiune care nu depete
valoarea D pentru orice alt surs staionar avnd valoare medie nul i aceeai
dispersie. Cu alte cuvinte, dintre toate sursele continue fr memorie, staionare i
ergodice, cu valoare medie nul i cu aceeai dispersie, cea care necesit cea mai
mare valoare a funciei R ( D ) este sursa gaussian :
2
1

R ( D) RG ( D) = log 2
2
D

Sursele reale sunt n majoritatea cazurilor surse cu memorie. Pentru surse cu


memorie, staionare i ergodice, calculul funciei rat-distorsiune se face, n funcie

17

de momentele de ordinul unu i doi, utiliznd rezultatele obinute n calculul


funciei R ( D ) pentru surse fr memorie.
4.4.2 Codarea cu transformate
Metodele de compresie care utilizeaz transformate reduc corelaia dintre
eantioane prin trecerea n spaiul transformat n care corelaia dintre coeficienii
transformatei este redus semnificativ. Raportul de compresie obinut este cu att
mai mare cu ct de obine o decorelare mai puternic a coeficienilor din spaiul
transformat.
Schema bloc a transmisiei cu codare cu transformate este prezentat n fig.
4.3.

Transformare
direct

Cuantizor
i
Codor

Selector

Canal de
transmisie

Transformare
invers

Decodor

Fig. 4.3 Codarea cu transformate. Schema bloc


Transformarea se face pe blocuri 8 x 8 sau 4 x 4 din motive de complexitate
a calculelor care trebuie efectuate la imaginile cu micare n timp real. La intrarea
etajului de transformare direct se aplic eantioanele f(x,y) ale blocului N x N (de
ex. 8 x 8). Transformarea direct se efectueaz conform relaiei (care poate fi scris
N

F (u , v ) = f (x, y ) A( x, y, u , v )
x =1 y =1

i matricial).
A(x,y,u,v) este nucleul transformrii directe.
Blocul de selecie va face selectarea coeficienilor ce vor fi transmii dup
dou criterii posibile :
1. Selecie zonal
2. Selecie cu prag.

18

Selecia zonal presupune alegerea unei anumite zone din spaiul transformat (zona
de joas frecven) i transmisia numai a acelor coeficieni, ceilali coeficieni
urmnd a fi considerai egali cu zero la recepie.
Selecia cu prag presupune fixarea unui anumit prag de amplitudine de la care se
consider c valoarea coeficienilor din spaiul transformat este semnificativ i
transmisia numai a coeficienilor care depesc acest prag, ceilali coeficieni find
considerai egali cu zero. n acest caz trebuie ns transmis i informaia despre
localizarea coeficienilor nenuli din spaiul transformat.
La recepie transformata invers permite trecerea napoi n spaiul imaginii :
N

f ( x, y ) = F (u , v ) S (u , v ) B( x, y, u , v )
u =1 v =1

Unde s-a notat cu B(x,y,u,v) nucleul transformrii inverse i cu S(u,v) funcia de


selecie a coeficienilor ce urmeaz a fi transmii (egal cu 1 pentru coeficienii ce
vor fi transmii i cu 0 pentru coeficienii ce nu vor fi transmii i vor fi considerai
la recepie egali cu 0).
Transformrile bidimensionale utilizate trebuie s fie unitare (matricea
transformrii s fie unitar) i s aib algoritm de calcul rapid. Transformata optim
care elimin complet corelaia dintre coeficieni n spaiul transformat este
transformarea Karhunen-Loeve, dar aceasta nu are algoritm de calcul
rapid.Transformri suboptimale cu algoritm de calcul rapid sunt transformrile
Fourier rapid, Walsh-Hadamard, Cosinus discret (DCT = Discrete Cosine
Transform) ;I transformarea wavelet..
4.4.3 Codarea vectorial
Codarea vectorial se bazeaz pe rezultatele teoremei rat-distorsiune a lui
Shannon, care arat c performanele metodelor de compresie de date sunt
ntotdeauna mai bune atunci cnd se codeaz vectori n locul scalarilor, chiar dac
sursa este fr memorie.
Codarea vectorial este foarte mult utilizat n codarea imaginilor statice.
Schema bloc pentru o metod de compresie cu cuantizare vectorial este dat n
fig. 4.4. Codorul i decodorul utilizeaz o list de coduri Y , care conine cuvinte
de cod (vectori de cod) y de dimensiune k notai cu un indice j [0, Y 1] .
Imaginea este mprit n blocuri de pixeli de dimensiune n m . Fiecare bloc
poate fi considerat un vector u de dimensiune k = m n . Pentru fiecare bloc codorul
selecteaz cuvntul de cod y care d cea mai mic distorsiune d (u , y ) . Indicele j
al cuvntului de cod este transmis pe canal. Dac nu exist zgomot, decodorul
reface cuvntul de cod y din indicele j i rezult u = y .
Din punct de vedere matematic cuantizarea vectorial este o funcie de la un
spaiu k -dimensional la un set finit de simboluri J :

19

VQ : {u = (u1 , u 2 ,...u k )} J

Viteza de transmisie este :

R = log 2 (Y ) [bii/vector]
Viteza de transmisie pe eantion este R / k [bii/eantion]. De obicei Y este o
putere a lui 2 i atunci R este numr ntreg.

Performanele sistemului cu codare vectorial depind de structura listei de


coduri. Exist mai multe criterii pentru a proiecta n mod optim o list de coduri.
Unul dintre ele const n minimizarea distorsiunii medii (tipic eroarea medie
ptratic MSE). Alt criteriu urmrete maximizarea entropiei listei de coduri, ceea
ce nseamn c fiecare cuvnt de cod este utilizat n medie de acelai numr de ori.
De obicei lista de coduri este fixat la codor i la decodor. n codarea vectorial
adaptiv lista de coduri este modificat odat cu modificarea caracteristicilor
statistice ale imaginii. Se creaz noi liste de coduri pe parcursul funcionrii
sistemului care le nlocuiesc pe cele vechi.
n trecut codarea vectorial a fost mai puin utilizat din cauza complexitii
calculelor att n procesul de codare ct i n procesul de nvare. n ambele
procese se calculeaz distorsiunile pentru fiecare cuvnt de cod din list i se
compar ntre ele pentru a gsi cuvntul de cod care d distorsiunea cea mai mic.
Deoarece se utilizeaz blocuri n codarea vectorial exist posibilitatea ca structura
de blocuri s fie vizibil pe imagine.
n acelai timp, codarea vectorial prezint avantaje semnificative, pe lng
compresia pe care o realizeaz. Se pot construi liste de cuvinte de cod pentru care
entropia este aproape de valoarea maxim posibil. Rezult astfel c se poate face
codare cu cuvinte de cod cu lungime fix cu toate avantajele ce decurg de aici n
privina comportrii sistemului n prezena erorilor de pe canal. De asemenea,
cuvintele de cod pot fi aranjate astfel nct cele care sunt apropiate n distan
Euclidian s aib indici de cod apropiai n distan Hamming. Rezultatul obinut
este c erorile de transmisie determin decodorul s selecioneze un cuvnt apropiat
de cel original. Se obine astfel compresie maxim (pe baza entropiei) i o
sensibilitate redus la erorile de transmisie.
O metod clasic de proiectare a listei de cuvinte de cod este algoritmul
LBG, care este un algoritm optimizat local utilizat n mod frecvent la proiectarea
cuantizorilor vectoriali pentru imagine i semnal vocal.
n ultimul timp au fost propuse pentru proiectarea codorilor vectoriali reele
artificiale neuronale (ANN=Artificial Neural Network) care elimin limitrile
algoritmilor tradiionali. Reelele ANN sunt formate dintr-un numr mare de uniti
de calcul simple interconectate ntre ele, care pot lucra n paralel. Algoritmii de
proiectare cu ANN nu necesit acces n acelai timp la ntregul set de date pentru
nvare.

20

Lista de coduri

Vector intrare u

Selectare cod y din Y cel mai apropiat


de U

Canal de
transmisie
Lista de coduri

Vector ieire u^

Reface codul y din Y care are indicele j

Codul y folosit la reconstructia imaginii

Fig.4.4 Principiul codrii vectoriale


Cuantizarea vectorial diferenial (DVQ=Differential Vector Quantization)
nlocuiete cuantizorul scalar din schema DPCM cu un cuantizor vectorial. Rezult
un sistem care mbin multe din avantajele celor dou metode de compresie.
Un rol important n DVQ joac mrimea blocurilor de imagine considerate.
n general blocurile mai mari mresc raportul de compresie dar degradeaz
calitatea. De obicei se lucreaz cu blocuri 2 x 2 ( k = 4 ), 3 x 3 (k=9), 4 x 4 (k=16).
S-a constatat c blocurile mai mari de 2 x 2 introduc o structur vizibil pe
imagine, care nu este acceptabil pentru imagini de foarte bun calitate. De
asemenea, blocurile 2 x 2 permit prelucrarea n timp real.
S-a constatat, prin teste pe secvene de imagini, c eroarea ptratic medie
MSE depinde de numrul de bii/eantion. Pentru un numr fix de cuvinte de cod
blocurile de dimensiune 2 x 2 necesit mai puine cicluri de nvare. Trebuie spus
c, dac prelucrarea n timp real se dovedete posibil, este util s se realizeze un
sistem DVQ intercadre. De asemenea, cuantizorul vectorial poate fi fcut adaptiv,
arhitectura reelei neuronale artificiale ANN putnd fi folosit pentru reactualizarea
21

listei de cuvinte de cod pe msur ce se modific proprietile statistice ale


imaginii.
4.5 Standarde de compresie digital a imaginilor
4.5.1 Standardul JPEG
Standardul JPEG (Joint Photographic Experts Group) este utilizat pentru
compresia imaginilor fixe. Grupul JPEG a fost creat n 1988 sub egida ISO ca un
proiect comun al ISO i al comisiei Q16 CCITT. n anul 1992 a devenit standard
ISO. Rata de compresie poate ajunge pn la 15:1. Exist i o variant pentru
secvene de imagini MJPEG (Motion JPEG). Standardul JPEG permite patru
moduri de operare :
Codare secvenial DCT , n care fiecare component de imagine (YUV) este
codat ntr-o singur explorare de la stnga la dreapta i de sus n jos.
Codare progresiv DCT, n care imaginea este codat n explorri succesive
pentru a produce o imagine rapid, decodat brut atunci cnd timpul de
transmisie este lung.
Codare fr pierderi, n care imaginea este codat pentru a garanta o refacere
exact dup decodare. Se utilizeaz algoritmi de codare cu predicie n locul
codrii cu DCT.
Codare ierarhic, n care imaginea este codat cu rezoluii multiple.
Imaginea surs ce trebuie codat const din 1 pn la 255 de planuri de imagine
fiecare cu alt numr de pixeli. De exemplu se pot coda imagini n format RGB (3
plane cu aceeai rezoluie) sau YUV (3 plane cu rezoluii diferite). Toi pixelii
dintr-un plan sunt codai cu acelai numr de bii.
Schema bloc a codorului i a decodorului JPEG pentru codarea secvenial este
prezentat n fig.9.4.
Codorul JPEG const din trei blocuri principale :
Blocul de transformare cosinus discret (DCT)
Cuantizorul
Codorul entropic
La intrarea codorului eantioanele din gama [0, 2p 1] sunt translatate n gama [2p-1 , 2p-1-1]. De exemplu, pentru imagini cu p=8, eantioanele originale din gama
[0, 255] sunt translatate n gama [-128, 127].
Apoi imaginea este divizat n blocuri de eantioane de dimensiune 8x8, asupra
crora se efectueaz transformata cosinus discret (DCT) :
F (u , v ) =

(2 x + 1)u cos (2 y + 1)v


C (u ) C (v ) 7 7

f ( x, y ) cos

2
2 x =0 y =0
16
16
22

unde
C (0 ) =

1
2

iar pentru u i v diferite de 0


C (u ) = C (v ) = 1

Coeficientul F(0,0) se numete coeficient DC iar ceilali 63 de coeficieni se


numesc coeficieni AC. Pentru p=8 coeficienii DCT sunt n gama [-1024,+1023],
ceea ce implic trei bii adiionali pentru reprezentarea lor.
Pentru un bloc tipic de imagine majoritatea coeficienilor DCT au valori zero sau
apropiate de zero. Pe acest lucru se bazeaz compresia de spectru.
Codor JPEG
Imagine surs
Blocuri 8 x 8

DCT

Cuantizor

Codor
entropic

Tabel

Tabel

Imagine
comprimat

Decodor JPEG

Imagine
comprimat

Decodor
entropic

Decuantizare

Tabel

Tabel

IDCT

Imagine
reconstruit

Fig.4.5 Codor i decodor JPEG. Schema bloc


n etajul urmtor, cuantizorul, cei 64 de coeficieni DCT sunt cuantizai
utiliznd un tabel de cuantizare cu 64 de elemente specificat de aplicaie.

23

F (u , v )
Fq (u , v ) =

Q(u , v )

Cuantizarea reduce amplitudinea coeficienilor care a cror contribuie este


neglijabil la calitatea imaginii, avnd ca scop creterea numrului de coeficieni
DCT egali cu zero. Cuantizarea se face n conformitate cu urmtoarea ecuaie :
unde [ ] simbolizeaz partea ntreag iar Q(u,v) sunt coeficienii specificai n
tabelul de cuantizare. Fiecare element Q(u,v) este un numr ntreg cuprins ntre 1
i 255, care specific pasul de cuantizare pentru coeficientul DCT corespunztor.
Dup cuantizare cei 63 de coeficieni AC sunt ordonai ntr-o secven n zigzag. Aceast ordonare n zig-zag va facilita n pasul urmtor codarea entropic
pentru c se poate vedea pe imagini reale c probabilitatea ca s fie n aceast
secven coeficieni egali cu zero crete monoton cu indexul coeficienilor.
Coeficienii DC, care sunt valoarea medie a eantioanelor dintr-un bloc 8x8,
sunt codai printr-o tehnic de codare adaptiv, prin transmisia diferenei dintre doi
coeficieni DC de la dou blocuri adiacente. Acest lucru se face pentru c exist o
corelaie puternic ntre coeficienii DC de la blocuri adiacente.
n final, codarea entropic ofer o compresie de spectru adiional.
Standardul JPEG specific dou metode de codare entropic : codarea Huffman i
codarea aritmetic. Standardul de baz secvenial JPEG utilizeaz codare
Huffman. Codarea Huffman convertete coeficienii DCT ntr-o secven binar
compact utiliznd dou etape :
1. Formarea secvenei de simbol intermediare
2. Conversia acestei secvene n secven binar cu tabelele Huffman.
n secvena de simboluri intermediare fiecare coeficient AC este reprezentat
printr-o pereche de simboluri :
Simbol 1 (RUNLENGTH, SIZE)
Simbol 2 (AMPLITUDINE)
RUNLENGTH este numrul de coeficieni AC consecutivi cu valoare zero care
preced un coeficient AC diferit de zero. Gama sa de valori este ntre 0 i 15, ceea
ce necesit 4 bii.
SIZE este numrul de bii necesari pentru codarea AMPLITUDE. Numrul de bii
pentru AMPLITUDE este ntre 0 i 10 bii, astfel nct sunt necesari 4 bii pentru a
coda SIZE.
AMPLITUDE este amplitudinea coeficientului AC diferit de zero care poate fi n
gama [+1024, -1023], ceea ce necesit 10 bii pentru codare.
De exemplu, dac secvena coeficenilor AC este :
0,0,0,00,0,476
reprezentarea secvenei de simboluri este :
(6,9) (476)
unde RUNLENGTH=6, SIZE=9, AMPLITUDE=476.

24

Dac RUNLENGTH este mai mare dect 15, atunci simbolul (15,0) este
interpretat ca extensia cu RUNLENGTH=16. Pot exista pn la trei extensii
consecutive (15,0).
Pentru coeficienii DC reprezentarea simbolurilor intermediare este :
1. Simbol-1 (SIZE)
2. Simbol-2 (AMPLITUDE)
Deoarece coeficienii DC sunt codai diferenial aceast gam este dubl fa de
gama coeficenilor AC i este [-2048,2047].
A doua etap n codarea Huffman este conversia secvenei intermediare de
simboluri n secven binar. Simbolurile sunt nlocuite coduri cu lungime
variabil, ncepnd cu coeficientul Dc i continund cu coeficienii AC. Fiecare
Simbol-1 (pentru coeficienii AC i DC este codat cu un cod cu lungime variabil
(VLC=Variable Length Code) obinut dintr-un tabel Huffman specificat pentru
fiecare componenta de imagine YUV. Simbolurile-2 sunt codate utiliznd un cod
cu lungime variabil de tip VLI (Variable Length Integer, a crui lungime n bii
este dat n tabelul 4.3.

Lungime cod
1
2
3
4
5
6
7
8
9
10

Tabelul 4.3
Gama amplitudinilor
(-1,1)
(-3,2) (2,3)
(-7,4) (4,7)
(-15,-8) (8,15)
(-31,-16) (16,31)
(-63,-32) (32,63)
(-127,-64) (64,127)
(-255,-128) (128,255)
(-511,-256) (256,511)
(-1023,-512) (512,1023)

Decodarea standardului secvenial JPEG cuprinde n ordine invers toate


etapele procesului de codare aa cum se prezint n figura 9.4.
Decodorul entropic (Huffman) este primul bloc n care secvena binar este
convertit ntr-o secven de simboluri utiliznd tabelele Huffman (pentru
coeficienii codai VLC) i decodarea VLI, dup care simbolurile se convertesc n
coeficieni DCT. Apoi se face decuantizarea conform ecuaiei :
Fq (u, v ) = Fq (u , v ) Q(u, v )

25

Unde Q(u,v) sunt coeficienii de cuantizare din tabelul de cuantizare utilizat i la


codare.
Este efectuat apoi transformarea cosinus discret invers (IDCT) care face
transformarea n domeniul spaial :
F ( x, y ) =

(2 x + 1)u cos (2 y + 1)v


1 7 7
C (u )C (v )F (u, v ) cos

4 u =0 v =0
16
16

unde C(u) i C(v) au aceleai expresii ca la transformarea cosinus discreta direct..


Ultimul pas const n translatarea eantioanelor n gama [0, 2p-1].
4.5.2 Standardele din familia MPEG
Standardele MPEG (Moving Picture Experts Group) sunt propuse pentru
compresia imaginilor cu micare.
Primul standard introdus n 1991 (MPEG-1 , ISO/IEC 11172 din 1993) este
destinat compresiei imaginilor video cu micare cu rezoluie 320x240 (calitate
VHS) pn la viteze de transmisie de 1-1,5 Mbit/s.
Standardul MPEG-2 introdus n 1994 (ISO/IEC 13818 din 1996) este
destinat transmisiei imaginilor de cu rezoluie mai bun (720x480), similar cu cea
din standardului digital de studio. Fluxul de date MPEG-2 ajunge la 4-10 Mbit/s.
Standardul permite transmisia imaginilor cu ntreesere. MPEG-2 permite
transmisia imaginilor pentru o larg varietate de aplicaii care necesit rezoluii
diverse cum sunt comunicaiile video prin reele ISDN utiliznd ATM.
]
Metoda de compresie n standardele MPEG-1 i MPEG-2 este hibrid i
utilizeaz transformata cosinus discret (DCT) intracadru i codare cu predicie cu
compensarea micrii intercadre. Raportul de compresie poate ajunge pn la
200 : 1.
Pentru televiziunea de nalt definiie (HDTV = High Definition Television)
s-a stabilit iniial s se creeze un standard special, MPEG-3. Ulterior s-a constatat
c nu este necesar un astfel de standard i c se poate folosi tot standardul MPEG2, evident cu creterea vitezei de transmisie dup compresie fa de viteza necesar
pentru semnale video pentru imagini cu rezoluie normal codate MPEG-2.
Standardele MPEG-1 i MPEG-2 au creat posibilitatea dezvoltrii
televiziunii digitale i, de asemenea posibilitatea televiziunii interactive pe CDROM i apoi pe DVD (Digital Video Disk)..
Standardul MPEG-4 (ISO/IEC 14496-2 din anul 2000) a fost dezvoltat
pentru a oferi utilizatorilor un nou nivel de interaciune cu coninutul vizual.
Metodele de compresie sunt diferite de cele din standardele MPEG-1 i MPEG-2.
Standardul MPEG-4 ofer tehnologii pentru a vizualiza, accesa i manevra obiecte
n locul eantioanelor, tehnologii robuste la erori i pentru o gam larg de viteze

26

de transmisie. Domeniile de aplicaie sunt televiziunea digital, aplicaii grafice


interactive (coninut sintetic) i multimedia interactiv.
n loc s considere imaginea ca fiind format din eantioane (pixeli) de
diverse amplitudini i cu variaie n timp pentru imagini cu micare (aa cum se
ntmpl la MPEG-1 i MPEG-2), standardul MPEG-4 consider imaginea format
din obiecte care se afl n faa unui fundal, att obiectele ct i fundalul putnd s-i
modifice n timp poziia i forma pentru imagini cu micare. Este un mod de
descriere a imaginilor mai apropriat de ceea ce se ntmpl n cadrul sistemului
vizual uman, lucru ce poate explica obinerea unor imagini de bun calitate la
viteze de bit relativ sczute.
Standardele MPEG-1 i MPEG-2
Tabelul 4.4 prezint mai multe formate de secvene video i parametrii
corespunztori ai standardului MPEG-1 i MPEG-2.
FORMAT
SIF
CCIR 601
EDTV
HDTV

Tabelul 4.4
PARAMETRI
VITEZ DE
VIDEO
BIT DUP
COMPRESIE
352x240 30 Hz
1,2-3 Mbit/s
720X486 30 Hz
5-10 Mbit/s
960x486 30 Hz
7-15 Mbit/s
1920x1080
20-40 Mbit/s
30Hz

STANDARD
MPEG
MPEG-1
MPEG-2
MPEG-2
MPEG-2

Standardul MPEG-2 este utilizat att pentru aplicaii simetrice ct i pentru


aplicaii asimetrice. Aplicaiile asimetrice sunt caracterizate prin utilizarea
frecvent a decompresiei, n timp ce procesul de compresie este efectuat o singur
dat. Exemplele includ televiziunea digital ca i aplicaii interactive (filme la
cerere, educaie la distan, etc).
Aplicaiile simetrice necesit o utilizare egal a proceselor de compresie i
decompresie. Exemple de astfel de aplicaii sunt pota multimedia i
videoconferina.
Standardul MPEG-2 const din trei pri :
1. Sincronizarea i multiplexarea secvenelor video i audio.
2. Video.
3. Audio.
Se prezint n continuare principiile standardului video.
Se definesc 8 frecvene de cadre :
23,976 Hz ; 24 Hz ; 25 Hz ; 29,97 Hz ; 30 Hz ; 50 Hz ; 59,94 Hz ; 60 Hz .
27

Fiecare imagine se mparte n zone numite macroblocuri cu dimensiunea de 16 x


16 pixeli pentru Y i 8 x 8 pixeli pentru U i V.
n standardul MPEG-2 cadrele de imagine sunt codate utiliznd trei algoritmi
diferii, aa cum se prezint n figura 4.6.
1
I

2
B

3
B

4
B

5
P

6
B

7
B

8
B

9
I

Fig.4.6 Tipuri de cadre n standardul MPEG-2


Cadrele de tip I sunt codate intracadru utiliznd transformata cosinus discret
(DCT) n mod sismilar cu standardul JPEG. Aceste cadre sunt puncte de acces
aleator n fluxul de date MPEG-2 i au cea mai sczut rat de compresie.
Cadrele de tip P sunt codate cu predicie temporal avnd ca referin cadre
de tip P sau de tip I anterioare. Raportul de compresie pentru aceste cadre este net
superior fa de cadrele I.
Cadrele de tip B sunt codate bidirecional n timp utiliznd dou cadre de
referin (unul anterior i unul posterior) care pot fi de tip I sau P. Aici se obine
rata de compresie cea mai mare.
Din cele expuse mai sus rezult c ordinea de decodare va fi diferit de
ordinea de codare. Cadrul P (5) trebuie s fie decodat naintea cadrelor B (2,3,4),
iar cadrul I (9) naintea cadrelor B (6,7,8). La transmisia semnalului MPEG ordinea
de transmisie trebuie s fie 1,5,2,3,4,9,6,7,8.
Dac este necesar acces aleator rapid cea mai bun soluie ar fi codarea
tuturor cadrelor drept cadre I (MPEG devine identic cu MJPEG). Cea mai mare
rat de compresie se obine cu un numr ct mai mare de cadre de tip B.
Procesul de codare pentru cadrele de tip B i P include estimarea micrii pentru
extragerea informaiei de micare din secvena video. Pentru fiecare bloc 16 x 16
din cadrele B i P se calculeaz unul sau doi vectori de micare. Pentru cadrele B se
calculeaz un vector de micare, iar pentru cadrele B interpolate se calculeaz doi
vectori de micare. Standardul MPEG-2 nu indic un anumit algoritm pentru
28

estimarea micrii dar specific modul de codare a rezultatului. Se codeaz vectorul


de micare i diferena dintre blocuri. Zona de cutare (amplitudinea vectorului de
micare) nu este definit n standard dar este restrns prin definirea gamei
vectorului. Cu ct zona de cutare este mai mare, cu att estimarea micrii este
mai bun (dei calculul este mai complex) i rata de compresie mai mare.
Standardul MPEG-4
Aplicaiile multimedia atrag atenia din ce n ce mai mult industriei
telecomunicaiilor, a bunurilor de consum electronice i industriei de calculatoare.
ntr-un sens larg multimedia este cadrul general de interaciune cu informaiile
provenite din mai multe surse, inclusiv video.
Un standard multimedia este de ateptat s ofere suport pentru un mare
numr de aplicaii. Aceste aplicaii se traduc ntr-un set specific de cerine care pot
s fie foarte diferite. Un domeniu comun pentru majoritatea aplicaiilor este
necesitatea de a suporta interactivitatea cu diverse tipuri de date. Aplicaiile legate
de informaia vizual pot fi gruoate pe baza mai multor trsturi :
a)
Tipul datelor (imagini fixe, imagini stereoscopice, video, etc.) ;
b)
Tipul sursei (imagini naturale, imagini generate pe calculator, text i
grafic, imagini medicale, etc.) ;
c)
Tipul de comunicaie (mergnd de la comunicaii punct la punct pn
la comunicaii multipunvt la multipunct) ;
d)
Tipul funcionalitilor dorite ( manevrarea obiectelor, editare on-line,
transmisie progresiv, rezisten la erori, etc.).
Standardele de compresie video MPEG-1 i MPEG-2, dei foarte bine
adaptate la mediul pentru care au fost proiectate, nu sunt suficient de flexibile
pentru a ndeplini cerinele aplicaiilor multimedia. Aceasta a fost motivaia care a
dus la crearea standardului MPEG-4.
Televiziunea digital nlocuiete din ce n ce mai mult astzi televiziunea
analogic, att n transmisia ct i n memorarea imaginilor (vezi trecerea de la
casetele video analogice la DVD), lucru posibil i prin dezvoltarea standardului
MPEG-2. n aceste apicaii coninutul omaginii este reprezentat digital, cu efecte
evidente asupra calitii imaginii, dar coninutul rmne acelai pentru utilizator.
Odat ce coninutul este
Standardul MPEG-4 const dintr-o colecie de instrumente pentru codarea
formei, compensarea i estimarea micrii, codarea zonelor cu texturi, rezistena la
erori i scalabilitate.
1. Codarea formei poate fi realizat n mod binar (forma fiecrui obiect fiind
descris printr-o masc binar) , sau n modul corespunztor unei scri de
gri (permind astfel transparema obiectelor afiate i reducnd
fenomenele de aliere la marginile obiectului).
29

2. Compensarea micrii se face pe blocuri, cu modificarea corespunztoare


pentru marginile obiectului. Mrimea blocurilor poate fi 16 x 16 sau 8 x
8, cu rezoluie spaial de jumtate de eantion.
3. Codarea zonelor cu texturi se bazeaz pe utilizarea transformatei cosinus
discret (DCT) pe blocuri 8 x 8, cu modificri corespunztoare pentru
blocurile de la marginea obiectelor. Zonele statice cu texturi se pot coda
cu transformarea wavelet.
4. Rezistena la erori se realizeaz prin utilizarea unor markeri de
sincronizare, coduri de extensie pentru header i coduri reversibile cu
lungime variabil.
5. Scalabilitatea se realizeaz att spaial ct i temporal. MPEG-4 realizeaz
scalabilitate pe baz de obiect, cu restricia ca forma obiectului s fie
rectangular.
Punctele de conformitate pentru MPEG-4 sunt definite ca Profilul Simplu
(Simple Profile), Profilul Nucleu (Core Profile) i Profilul Principal
(Main Profile). Primele dou profile sunt specifice pentru imagini cu
rezoluie tipic QCIF i CIF (vezi paragraful 4.5.3.), cu viteze de bit dup[
compresie de 64 kbit/s, 128 kbit/s, 384 kbit/s i 2 Mbit/s. Profilul
principal se folosete pentru imagini cu rezoluie tipic CIF, ITU-R 601 i
HDTV, cu viteze de bit dup compresie de 2 Mbit/s, 15 Mbit/s i 38,4
Mbit/s.
4.5.3 Alte standarde de compresie a imaginilor
Recomandarea CCITT H.261 din 1990 (cunoscut i sub denumirea de p x
64) este optimizat pentru a obine rapoarte foarte mari de compresie pentru
imagini color cu micare. Ea se utilizeaz n videotelefonie i videoconferin.
Algoritmul de compresie combin codarea intracadru DCT cu codarea cu
predicie intercadre. Deoarece n aplicaiile de videoconferin i videotelefonie nu
exist micare foarte rapid, iar majoritatea timpului micarea lipsete, algoritmul
utilizeaz strategii de estimare i compensare a micrii limitate spaial la 15 pixeli.
Se pot obine rapoarte de compresie ntre 100 : 1 i 2000 : 1.
Standardul este utilizat pe canale ISDN cu viteze de transmisie multipli ai
vitezei de baz de 64 Kbit/s. Numrul p poate fi cuprins ntre 1 i 30, de unde
rezult c viteza de transmisie este cuprins ntre 64 Kbit/s i 2 048 Kbit/s. Pentru p
egal cu 1 sau 2 se pot implementa doar comunicaii de tip videotelefon. Pentru p
mai mare dect 6 se poate transmite o videoconferin.
Spre deosebire de JPEG care admite o mare varietate de formate de imagine,
standardul H.261 precizeaz foarte exact formatul de imagine. Imaginile au
frecvena cadrelor de 29,97 Hz (59,94 Hz : 2) iar n procesul de codare este posibil
30

s se genereze o secven comprimat cu 10 15 cadre/s. Componentele imaginii ,


luminana i cele dou diferene de culoare sunt subeantionate conform Rec. CCIR
601 (standardul digital de studio) la 6,75 MHz pentru luminan i 3,375 MHz
pentru cele dou diferene de culoare.
Sunt specificate dou formate de rezoluie cu raport de aspect al imaginii de
4/3 :
a) Formatul comun intermediar (CIF=Common Intermediate Format) cu
rezoluie egal cu 288 linii x 352 pixeli pentru semnalul de luminan i
144 linii x 176 pixeli pentru semnalele diferen de culoare.
b) Formatul sfert CIF (QCIF=Quarter CIF) care are rezoluia redus la
jumtate pe fiecare direcie (orizontal i vertical) fa de formatul CIF
(144 linii x 176 pixeli pentru luminan i 72 linii x 88 pixeli pentru
diferenele de culoare), adic o rezoluie de 4 ori mai mic pe ansamblu
dect la formatul CIF.
Formatul QCIF necomprimat are viteza de transmisie de 9,115 Mbit/s , iar formatul
CIF necomprimat are viteza de transmisie de 36,45 Mbit/s.
Algoritmul de codare cuprinde :
- Codare intracadru (corespunde codrii tip I din MPEG).
- Codare intercadre (corespunde codrii tip P din MPEG).
Conform standardului H.261 nu este obligatoriu ca dispozitivul codor s
determine un vector de micare, de unde rezult c o implementare simpl
consider doar diferenele dintre macroblocurile situate n aceeai poziie n
cadre succesive (vector de micare egal cu 0). Dac se utilizeaz o implementare
mai complex componentele vectorului de micare se codeaz entropic cu un
sistem VLC (Variable Length Coding). Cuantizarea este liniar i pasul de
cuantizare se regleaz n conformitate cu cantitatea de date din registrul tampon
(buffer). Acest mecanism foreaz o vitez de date constant la ieirea
codorului.
Recomandarea 723 CCIR este un alt standard de compresie pentru
transmisia semnalelor video care se refer la codarea pentru transmisie a imaginilor
din standardul digital de studio 4 : 2 : 2. Viteza de transmisie este cuprins ntre 34
Mbit/s i 140 Mbit/s.

31

32

S-ar putea să vă placă și

  • Meniu 1400 Cal
    Meniu 1400 Cal
    Document8 pagini
    Meniu 1400 Cal
    Anonymous h87K4sT
    Încă nu există evaluări
  • Microcontrolere Introducere PDF
    Microcontrolere Introducere PDF
    Document19 pagini
    Microcontrolere Introducere PDF
    Alex Agape
    Încă nu există evaluări
  • Teorie
    Teorie
    Document72 pagini
    Teorie
    Anonymous h87K4sT
    0% (1)
  • Filtre LC
    Filtre LC
    Document3 pagini
    Filtre LC
    Anonymous h87K4sT
    Încă nu există evaluări
  • Dieta Militara
    Dieta Militara
    Document3 pagini
    Dieta Militara
    Anonymous h87K4sT
    Încă nu există evaluări
  • Amandina Vegana
    Amandina Vegana
    Document2 pagini
    Amandina Vegana
    Anonymous h87K4sT
    Încă nu există evaluări
  • Lab 3 Alex
    Lab 3 Alex
    Document14 pagini
    Lab 3 Alex
    Anonymous h87K4sT
    Încă nu există evaluări
  • Caiet Sarcini 1
    Caiet Sarcini 1
    Document126 pagini
    Caiet Sarcini 1
    Anonymous h87K4sT
    Încă nu există evaluări