Sunteți pe pagina 1din 32

Capitolul 4 SISTEME DE TELEVIZIUNE DIGITAL 4.

1 Probleme specifice n televiziunea digital Ochiul, receptorul sistemului vizual uman, este un receptor de tip analogic. Televiziunea analogic (cu definiie normal) transmite imagini color i sunetul nsoitor ntr-o band de 6-8 MHz n cazul distribuiei terestre i ntr-o band de 18-30 MHz n cazul distribuiei prin satelit sau prin reele terestre de microunde (pentru a realiza un raport S/Z mare la modulaia FM). Un semnal digital TV de calitate ar putea fi transmis ntr-o band de frecven mult mai mic, dependent i de raportul semnal / zgomot de pe canalul de comunicaie. Dar lrgimea de band n care poate fi transmis semnalul TV digital nu este singurul argument n favoarea televiziunii digitale. Al doilea argument important este avantajul prelucrrii i transmisiei digitale fa de prelucrarea i transmisia analogic a semnalelor. Calitatea original a semnalului poate fi refcut ori de cte ori este nevoie n transmisie, nregistrare sau prelucrare n studiouri de televiziune, ceea ce nu este valabil pentru semnalul analogic. Se pot folosi tehnici de codare pentru protecie la perturbaii specifice canalelor digitale. Trebuie totodat remarcat faptul c exist o tendin evident spre dezvoltarea masiv a reelelor digitale integrate tip ISDN (Integrated Service Digital Network), care sunt deosebit de avantajoase pentru distribuia televiziunii digitale. n sistemele TV digitale trebuie transmis i sunetul nsoitor (mono sau stereo) precum i semnalele de sincronizare pe orizontal i vertical n acelai timp cu secvenele video. Un alt aspect important este c la transmisia digital a semnalului de televiziune se poate realiza uor criptarea, necesar att pentru rezolvarea unor probleme legate de licena de transmisie pe anumite zone ct i pentru sistemele de tip televiziune interactiv. Nu n ultimul rnd trebuie spus c transmisia digital a semnalului de televiziune elimin problemele create n studiourile analogice la conversia de standard i sistem atunci cnd sursele de program TV sunt din ri cu standarde i norme TV diferite. Evoluia spre televiziunea digital a nceput n studiourile de televiziune prin adoptarea standardului digital internaional de studio 4:2:2, ceea ce permite transmisia semnalului ntre studiouri fr transcodri. La cellalt capt al lanuluireceptorul TV au aprut funcii noi. Dei semnalul TV este n continuare analogic
1

n majoritatea situaiilor (din considerente de compatibilitate), televizoarele ncep s fie dotate cu convertoare A/D i D/A rapide, cu memorii de unul sau mai multe cadre i cu circuite specializate, care permit prelucrri digitale n timp real asupra semnalului TV : filtrri pentru mbuntirea raportului semnal/zgomot, afiarea unei imagini fr plpire (cu 100 Hz), efecte speciale (zoom, imagine n imagine, afiarea unor informaii), prelucrri ale unor semnale codate, etc. Exist i receptoare n care, cu excepia prii de nalt frecven (tuner, AFI, demodulator) i a blocurilor de putere, toate celelalte prelucrri sunt realizate digital. Ulterior acestor dezvoltri de la capetele lanului de televiziune, n momentul actual se transmite din ce n ce mai mult semnalului TV n form digital ntr-o band acceptabil i la un pre accesibil al receptorului, prin diverse metode : prin satelit, prin emitoare terestre, prin cablu, prin internet (Video over IP), telefonie mobil, etc. 4.2 Etapele conversiei digitale a semnalului de televiziune Etapele conversiei analog digital pentru semnalul de televiziune sunt cele clasice care se aplic oricrui semnal dependent de timp eantionarea, cuantizarea i codarea cu particulariti specifice care in seama de band, structura spectrului i particularitile sistemului vizual uman. 4.2.1 Eantionarea semnalelor de televiziune Teorema eantionrii a lui Nyquist trebuie evident respectat i n acest caz, ceea ce nseamn c frecvena de eantionare trebuie s fie destul de mare. De exemplu, pentru un semnal video cu rezoluie normal care are banda de 5 MHz trebuie aleas o frecven de eantionare peste 10 MHz (avnd n vedere c filtrele de pre- i posteantionare trebuie s fie realizabile). n acest fel se elimin posibilitatea de aliere a spectrului de baz cu spectrele repetate. n aceast zon de frecven este util s se aleag o frecven de eantionare f E a crei valoare s fie un multiplu al frecvenei liniilor fH. n acest fel se obine o structur de eantionare ortogonal :

fE = n fH
De unde rezult :

TH = n T E

n acest fel pe o linie de explorare ncap un numr ntreg de eantioane, deci pe linii succesive eantioanel cad unele sub altele. Este un avantaj pentru redarea corect a contururilor verticale abrupte. Un alt aspect ce trebuie s fie luat n calcul este cel legat de posibilitatea realizrii subeantionrii dac se ine seama de structura particular a spectrului semnalului de imagine, care conine benzi spectrale nguste (circa 5-6 Hz) centrate pe multipli ai frecvenei liniilor, frecvenei semicadrelor i combinaii liniare ale acestora. Prin alegerea corespunztoare a frecvenei de eantionare se poate asigura intercalarea benzilor din spectrul original cu cele din spectrul repetat (care are evident aceeai structur) fr apariia efectului de aliere valabil atunci cnd spectrul este continuu. Se poate de exemplu eantiona semnalul PAL cu dublul frecvenei subpurttoarei de culoare (aproximativ 8,86 MHz) care este sub frecvena Nyquist de 10 MHz (pentru o band a semnalului PAL de 5 MHz). Eantionarea se poate face pe componente (R, G, B sau Y, R-Y, B-Y) sau pe semnal videocomplex (PAL, SECAM sau NTSC). Din punct de vedere al calitii imaginii este recomandat eantionarea pe componente, lucru care se realizeaz n standardul digital de studio. Se utilizeaz eantionarea pe componente pe luminan Y i diferene de culoare R-Y i B-Y n locul celei pe semnale primare R, G, B, deoarece banda semnalelor diferen de culoare (i n consecin frecvena de eantionare) poate fi redus cel puin la jumtate. Eantionarea semnalului videocomplex este realizat n receptoarele cu prelucrare digital n care, dup demodularea semnalului i obinerea semnalului videocomplex n banda de baz, toat prelucrarea ulterioar se face digital. n acest caz pentru PAL este util de ales o frecven de eantionare egal cu de 4 ori frecvena subpurttoarei de culoare (aproximativ 17,72 MHz) ceea ce permite realizarea uoar a decodorului de culoare digital PAL, deoarece sunt 4 eantioane pe o perioad de subpurttoare. Se poate observa c n acest caz frecvena de eantionare este i multiplu al frecvenei liniilor, adic structura de eantionare este ortogonal. 4.2.2. Cuantizarea semnalelor de imagine Cuantizarea semnalelor de imagine nseman alegerea unor nivele de decizie i de cuantizare astfel nct valoarea analogic a fiecrui eantion s fie rotunjit la valoarea cea mai apropiat de cuantizare. Aceast operaie introduce o eroare la reconstituirea eantioanelor dup conversia digital analog, deoarece valoarea eantionului reconstituit nu mai este riguros egal cu valoarea eantionului original. Apare aa-numitul zgomot de cuantizare. Pentru ca acesta s nu afecteze calitatea

imaginii este necesar ca numrul i dispunerea nivelelor de cuantizare s in seama de calitile de percepie ale sistemului vizual uman. Cel mai suprtor mod n care zgomotul de cuantizare ar putea afecta imaginea ar fi n cazul n care n zona respectiv de imagine este o variaie continu de strlucire. Dup cuantizare la trecerea de la un nivel de cuantizare la altul ar putea apare efectul de contur fals. Se tie c percepia variaiilor de luminan este discontinu i neliniar. Astfel, dac luminana variaz ntr-o zon de imagine, ochiul va percepe acest lucru doar dac se depete un anumit prag B. Acest prag depinde ns de luminana B a zonei de imagine respective, raportul B / B este constant i egal cu aproximativ 0,02. Dac distana dintre dou nivele de cuantizare este mai mic dect cel mai mic B perceptibil de ctre ochi, atunci zgomotul de cuantizare nu afecteaz imaginea. Din punct de vedere al realizrii caracteristicii de cuantizare, aceasta va fi o caracteristic n trepte situat n cadranul unu dac semnalul este unipolar (cum este de exemplu semnalul de luminan Y sau semnalele primare R, G, B) sau simetric n cadranele unu i trei dac este vorba de cuantizarea semnalelor diferen de culoare R-Y i B-Y care sunt semnale bipolare. Treptele caracteristicii pot fi egale sau inegale. Dac se utilizeaz cuantizarea uniform nivelele de decizie i de cuantizare sunt egal deprtate. Dac nivelele de decizie i de cuantizare nu sunt uniforme se spune c avem un cuantizor neuniform. Alegerea caracteristicii de cuantizare trebuie s duc la minimizarea zgomotului de cuantizare i ine seama n acest scop de statistica semnalului. Dac distribuia de probabilitate a nivelelor eantioanelor este uniform, atunci cuantizorul optim este cuantizorul uniform. Acesta este i cel mai simplu de realizat practic, pentru c pragurile comparatoarelor din convertorul A / D sunt egale. Atunci cnd distribuia de probabilitate a eantioanelor semnalului nu este uniform, cu alte cuvinte exist probabiliti diferite ca un nivel s apar la intrarea cuantizorului, cuantizorul optim ce minimizeaz zgomotul de cuantizare este cel neuniform. Construcia practic a acestuia se face folosind tot un cuantizor uniform dar care este precedat de un circuit cu o caracteristic neliniar numit compresor. Rolul compresorului este de a face ca la ieirea sa nivelele de cuantizare s aib distribuie de probabilitate uniform, ceea ce face posibil utilizarea cuantizorului uniform. Dup prelucrarea semnalului digital (transmisie, memorare, etc.) cnd este necesar conversia D/A a semnalului video, este nevoie de realizarea unei operaii inverse celei a compresorului astfel nct semnalul s nu fie distorsionat. Aceast operaie se numete expandare i se realizeaz dup conversia D/A. De exemplu, dac funcia neliniar a compresorului este una logaritmic, atunci funcia expandorului este una exponenial.

Operaia de comprimare i expandare se numete compandare. Trebuie precizat c prelucrri asemntoare se fac i pentru semnalul audio.

4.2.3 Codarea semnalului video Ultima etap n prelucrarea necesar conversiei analog-digitale a semnalului video este codarea. Aceasta nseamn ca fiecrui nivel de cuantizare s i se aloce un cod binar. Cea mai simpl codare este codarea cu modulaia impulsusrilor n cod MIC (n englez PCM = Pulse Code Modulation). Aceasta nseamn c fiecrui nivel de cuantizare qk s i se aloce codul binar natural ce reprezint numrul k. De exemplu, pentru codarea PCM a semnalului video cuantizat uniform cu 256 nivele (8 bii pe eantion) rezult urmtoarea alocare : q0 . 0000 0000 q1 0000 0001 q255 1111 1111 Toate celelalte metode de codare se raporteaz la codarea PCM atunci cnd se calculeaz viteza de transmisie necesar pentru semnalul video digital. De exemplu, dac frecvena de eantionare este de 12 MHz (suficient pentru o band video de 5 MHz) i se cuantizeaz uniform cu 8 bii pe eantion, viteza serial de transmisie a semnalului video digital este : V [Mbit/s] = 12 x 8 = 96 Mbit/s Aceasta este o vitez foarte mare pentru orice canal de comunicaie. Ea poate fi redus prin metode de compresie spectru la valori rezonabile de 2-4 Mbit/s sau chiar mai mult exploatnd dou elemente : 1. Caracteristica sistemului vizual uman. 2. Statistica semnalului video. Raportul de compresie obinut se exprim fie ca un numr fa de metoda standard PCM (de exemplu se obine o compresie 8 : 1) sau ca numrul echivalent de bii pe eantion necesar transmisiei (pentru acelai exemplu 1 bit / eantion). 4.3 Standardul digital de studio i familiile de standarde corespunztoare
5

Recomandarea 601 a CCIR (ITU-R 601) prevede pentru studiouri un standard principal digital cu codare pe componente, standardul 4:2:2 ai crui parametri principali sunt prezentai n tabelul 4.1. Frecvena de eantionare este un multiplu ntreg al frecvenei liniilor att pentru standardul cu 625 linii/50 Hz ct i pentru standardul cu 525 linii/60 Hz deoarece :
f H ( 625 f H ( 525
) )

15625 143 = 15734 , 265 144

Multiplii comuni ai acestor frecvene sunt multiplii frecvenei de 2,25 MHz. Valorile convenabile ale frecvenei de eantionare sunt : 11,25 MHz (5x2,25) ; 13,5 (6x2,25) ; 15,75 (7x2,25) . Pentru standardul principal s-a ales valoarea de 13,5 MHz.
13,5MHz = 858 f H (525) = 864 f H ( 625)

Parametrii Semnale Eantioane/linie Y R-Y, B-Y Structura de eantionare Frecvena de eantionare Y R-Y, B-Y Codare Nr. de eantioane pe linia activ Y B-Y, R-Y

Tabelul 4.1 Sistemul 525 linii/60 Hz Y, R-Y, B-Y

Sistemul 625 linii/50 Hz Y, R-Y, B-Y

858 864 429 432 Ortogonal, eantioanele R-Y i B-Y coincid cu eantioanele impare ale lui Y

13,5 MHz 6,75 MHz PCM uniform cu 8 bit pe eantion 720 360

13,5 MHz 6,75 MHz

720 360

Relaia dintre nivelul semnalului video i nivelele de cuantizare Y R-Y, B-Y

nivel 16=nivel de negru, nivel 235=nivel de alb 224 nivele cu nivelul 128=nivel de zero

Lungimea liniei active este aceeai pentru ambele sisteme de explorare i anume 720 eantioane pentru luminan i 360 eantioane pentru fiecare semnal de crominan. Debitul de informaie pentru standardul principal este :
VY = 13,5MHz 8bit = 108Mbit / s

pentru semnalul de luminan i :


VC = 2 6,75MHz 8bit = 108Mbit / s

pentru semnalul de crominan deci n total :


V = VY + VC = 216 Mbit / s

Exist multe situaii n care calitatea imaginii este diferit de cea din standardul principal. De aceea, plecnd de la standardul principal s-a creat o familie de standarde care au proprietatea c frecvenele lor de eantionare se afl ntr-un raport de numere ntregi cu standardul principal 4:2:2 (tabelul 4.2). Standa Frecvena rd de eantionare Y 4:4:4 13,5 MHz 4:2:2 4:1:1 2:1:1 13,5 MHz 13,5 MHz 6,75 MHz Tabelul 4.2 Frecvena Frecvena de de eantionare eantionare R-Y B-Y 13,5 MHz 13,5 MHz 6,75 MHz 3,375 MHz 3,375 MHz 6,75 MHz 3,375 MHz 3,375 MHz Debitul de Aplicaii informaie [Mbit/s] 324 216 162 108 Calitate ridicat la ncrustare Standard primar de studio Transmi-siuni de calitate nalt Jurnalistic

3:1:0

10,125 MHz

3,375 MHz

3,375 MHz

108

electronic (ENG) Calitate identic cu cea din PAL

Standardele de ordin superior sunt 8:4:4 i 4:4:4. Standardul 8:4:4 este un standard de explorare progresiv cu 625 linii/semicadru. Dup prefiltrare vertical-temporal i eliminarea unei linii din dou se obine semnal ntreesut 4:2:2. Dup stocare acest semnal poate fi postfiltrat i aplicat pe un monitor cu afiare cu 625 linii/semicadru. Standardul 4:4:4 eantioneaz semnalele R, G, B sau Y, R-Y, B-Y cu aceeai band iniial. Standarde de ordin inferior (sau substandarde) sunt 4:1:1 ; 2:1:1 ; 4:1:0 (semnale diferen de culoare transmise secvenial) i 3:1:0. Standardul 4:1:1 poate fi transmis cu 140 Mbit/s (nivelul cuaternar al ierarhiei digitale de transmisie) dac se utilizeaz intervalul de stingere pe orizontal. Construirea unui standard inferior din standardul principal nu nseamn numai reducerea frecvenelor de eantionare ci i modificarea structurii de eantionare care devine neortogonal ceea ce reduce rezoluia pe direcie diagonal. Standardul 3:1:0 realizeaz eantionarea n ah pe cadre a semnalului de luminan la 3/4 din frecvena standardului principal i transmisia secvenial a semnalelor diferen de culoare. La standardul 2:1:1 se face o eantionare neortogonal la jumtate din frecvena standardului principal ceea ce permite meninerea unei rezoluii pe orizontal de 6 MHz pentru luminan i de 3 MHz pentru crominan n timp ce rezoluia pe diagonal scade. Att standardul 3:1:0 ct i standardul 2:1:1 produc o oarecare degradare a calitii imaginii, dar aceasta este suficient de mic, ceea ce permite obinerea unei caliti comparabile cu cea a semnalului PAL (aa numitul "nivel auxiliar" sau nivel reportaj "ENG=Electronic News Gathering"). Recomandarea 601 a CCIR a lsat ns nerezolvate dou probleme importante : 1) Forma filtrelor trece-jos necesare nainte de conversia A/D i dup conversia D/A. 2) Realizarea interfeelor pentru transmisia semnalelor n unul din aceste standarde. Filtrele trece-jos trebuie s ndeplineasc urmtoarele condiii : - distorsionri ct mai mici ale semnalelor din banda de trecere ; - posibilitatea cascadrii codec-urilor (codor-decodor) fr degradri semnificative ale semnalului ; - complexitate acceptabil (deci dimensiuni i costuri reduse). Este necesar un compromis deoarece o band de trecere mare i o rejecie puternic a frecvenelor de aliere mai mari sau egale cu jumtate din frecvena de eantionare implic o cdere abrupt a caracteristicii filtrului i deci oscilaii ale
8

caracteristicii de amplitudine n banda de oprire. Riplul caracteristicilor de amplitudine i timp de grup poate fi redus mrind complexitatea filtrului. Amplitudinea acestui riplu se va multiplica cu numrul de codec-uri cascadate dac se utilizeaz filtre identice. CCIR i EBU au dat unele direcii de proiectare a acestor filtre : - Se va specifica o band de trecere (dac este posibil pn la 5,5 MHz) pentru luminan ; - Se va realiza o atenuare mare (40 dB) a benzii translatate (n cazul anterior 8-13,5 MHz) ; - Rejecia la jumtate din frecvena de eantionare va fi moderat (12 dB sau chiar mai puin) pentru a se realiza un compromis ntre oscilaii n banda de oprire i aliere ; - Msuri comparabile (n raport 2:1 pentru standardul principal) se vor aplica semnalelor diferen de culoare urmnd ca filtrarea s se efectueze o singur dat la surs sau la afiare chiar i n cazul cascadrii unor codec-uri. n ceea ce privete interfeele pentru transmisia semnalelor digitale din standardul 4:2:2 pe distane de pn la maximum civa kilometri se pot utiliza interfee seriale sau paralel. n interfeele paralel se transmit simultan cei 8 bii plus un semnal de ceas. Cele trei fluxuri de cuvinte Y, R-Y, B-Y sunt multiplexate n timp pentru a forma un singur flux de cuvinte cu viteza de 27 Mbit/s. O astfel de interfa permite utilizarea unor circuite integrate ieftine. O interfa serial cu viteza de 243 Mbit/s a fost realizat de EBU i SMPTE. 4.4 Metode de compresie a imaginilor Viteza mare de bit pentru fluxul de date n standardul digital de studio impune utilizarea unor metode de compresie de spectru pentru reducerea semnificativ a acestei viteze. Pentru compararea performanelor diverselor metode de compresie se utilizeaz mai multe criterii. Primul dintre ele este raportul de compresie care este egal cu raportul dintre viteza de bit n transmisia cu modulaia impulsurilor n cod (PCM) i viteza de transmisie dup compresie. Al doilea criteriu este calitatea imaginii recepionate. Obiectivul urmrit de CCIR este de a evita recepia unei imagini de calitate mai slab dect cea produs de o transmisie analogic. Calitatea este evaluat prin teste subiective n raportul CCIR 405-4 i Recomandarea 500-2. Al treilea criteriu este complexitatea procesului, care trebuie limitat la minimum deoarece determin complexitatea i costul echipamentului de codare i decodare.

Al patrulea criteriu este sensibilitatea sistemului de decodare la erorile din lanul de transmisie i efectul acestor erori asupra imaginii (Raportul CMTT 967). Reducerea vitezei de transmisie se bazeaz pe proprietile sursei de semnal i pe proprietile sistemului vizual uman. Acestea vor fi trecute n revist n continuare. 1) Proprietile sursei. Au fost fcute n decursul timpului multe msurtori statistice asupra imaginilor i a secvenelor de imagini i au fost propuse cteva modele, n general modele staionare. n afara studiilor teoretice este de menionat c trebuie utilizate proprietile structurale ale imaginilor, care sunt sensibile la rupturi locale ale staionaritii (de ex. margini). n general, s-a dovedit eficient s se analizeze imaginile i secvenele de imagini printr-un model de tip "mozaic", un model nestaionar unde fiecare component a "mozaicului" are proprietile sale statistice. Principalele configuraii locale sunt : - zone cvasi-uniforme, adic zone n care gradientul spaial este mai mic dect de exemplu 2 % din gama dinamic a unui pixel iar extensia spaial mai mare dect cteva zeci de pixeli n fiecare direcie ; - zone cu detalii cu contrast sczut, adic zone cu contrast local mai mic de 5 % din gama dinamic, fiecare detaliu fiind mic n direcie spaial (civa pixeli) ; - zone cu detalii cu contrast mare, cu contrast i gradient mai mare dect de exemplu 15 % din gama dinamic, fiecare detaliu fiind mic n spaiu ; - margini, cu contrast mai mare dect 15 %, limea tranziiei de unul sau doi pixeli, tranziia ntinzndu-se longitudinal pe civa zeci de pixeli. Primele trei tipuri sunt configuraii de tip "suprafa" i sunt mai mult sau mai puin staionare, Ultima poate fi considerat de tip "linie" i corespunde la ntreruperi ale staionaritii. Este evident c nu exist delimitri foarte clare ntre aceste patru categorii, zonele uniforme devin texturate pe msur ce contrastul crete iar zonele texturate devin un mozaic de zone uniforme i margini pe msur ce distana focal crete. De asemenea, fiecare din aceste configuraii spaiale devine o configuraie spaio-temporal dac se consider i axa timpului. Ele vor fi supuse modificrilor n timp i micrii. S-a propus s se fac distincie ntre micarea obiectelor i micarea camerei, aceasta din urm fiind o micare global. S-a propus i introducerea unor parametri relevani ca vectorul de micare, amplitudinea sa n spaiu, geometria sa (translaie, zoom) i posibilitatea de urmrire a micrii datorat abilitii ochiului de a urmri micrile. n descrierea general spaio-temporal se consider secvenele de imagini ca eantioane ale unui model dinamic de tip mozaic. Din cauza lipsei de date statistice adecvate acest model este un model calitativ structural suficient pentru studiul compresiei de date a semnalului video.
10

2) Proprietile sistemului vizual uman. Acestea pot fi studiate din diferite aspecte : anatomice, fiziologice, psihofizice (detecie, percepie) i psihologice (cunoatere, semiotic). Pentru aplicaii legate de codarea semnalelor de televiziune sunt utile datele psihovizuale care dau praguri de detecie (msurtori directe sau modele) sau nivele de percepie subiectiv ca funcii de parametrii stimulilor vizuali crora subiecii trebuie s le rspund. Avnd ca obiectiv un standard de calitate nalt pentru sisteme TV sunt utile mai ales datele de detecie. Pragurile de detecie se pot aplica condiiilor de vizualizare aa cum se definesc n Recomandarea CCIR 500. Datele se obin prin aa numita metod a "stimulului constant" care const n a prezenta n ordine aleatoare stimuli predeterminai cu valori selectate ale parametrilor. Procentele de cazuri n care se vd stimulii sunt interpolate pentru a defini un prag de detecie de 50%. Se poate folosi ntreaga scal de vizibilitate a stimulului pentru a defini un prag de perceptibilitate ntre cele dou grade mai nalte, "imperceptibil" i "perceptibil dar nu suprtor". Literatura de specialitate conine foarte multe date de acest tip dar de multe ori acestea sunt dificil de aplicat la problemele de optimizare a codrii. n majoritatea cazurilor defectele codrii corespund unor stimuli vizuali mai compleci i apar n imagini sau n secvene de imagini reale n contrast cu formele de test simple utilizate n experimentele psihovizuale (de obicei fundal uniform, margini sintetice foarte precise, etc). n continuare se vor trece n revist principalele metode de compresie utilizate n televiziune. Exist dou constrngeri specifice care determin tipurile de algoritmi ce pot fi utilizai pentru televiziune. n primul rnd este necesar o operare n timp real, cu o vitez mare (de ordinul zecilor de megabii pe secund) , pe un canal cu vitez de transmisie fix. Aceasta face s fie preferate schemele de codare cu vitez fix sau, pentru algoritmi care produc viteze variabile, este necesar s se utilizeze registre tip buffer i metode de evitare a suprancrcrii registrelor. n al doilea rnd, constrngerile sursei nu permit ca unii algoritmi care sunt eficieni, de exemplu pentru videoconferin, s fie la fel de eficieni pentru televiziune. De asemenea nu este posibil utilizarea schemelor de codare adaptiv cu transformare care sunt foarte eficiente pentru imagini fixe, sau a schemelor de codare pentru grafice i facsimil. Avnd n vedere aceste considerente variantele posibile de codare pentru compresie sunt : - PCM (Pulse Code Modulation) i scheme de codare nrudite : cuantizare liniar, cuantizare neliniar i cuantizare adaptiv, eantionare cu diferite frecvene i structuri, cu filtrare pre- i posteantionare fix sau adaptiv. - DPCM (Differential PCM) : scheme de codare cu predicie spaial (intrasemicadru) sau spaio-temporal (intersemicadru sau intercadru) cu
11

predicie fix sau adaptiv, cu cuantizare fix sau adaptiv, urmat uneori de codare cu lungime de cod variabil a semnalului diferen. Pentru mrirea eficienei prediciei se poate folosi estimarea micrii sau a marginilor. - Codare cu transformare : transformri pe blocuri, spaiale sau spaio-temporale, de tip Hadamard, cosinus, etc., cu cuantizare zonal (fix sau adaptiv) sau codare cu prag ; - Scheme hibride : cu DPCM n unele dimensiuni i transformare n altele. Codarea cu transformare este ntr-adevr o metod foarte eficient realiznd factori de compresie mari, dar pretinde foarte multe operaii de calcul ce trebuie efectuate n timp real pentru codarea semnalului de televiziune. Dimpotriv, codarea cu DPCM este mai uor de realizat practic i are avantajul c separarea celor dou funcii (predicie i cuantizare) permite o bun adaptare la proprietile semnalului (predicie) i ale observatorului uman (cuantizare). 4.4.1 Codarea cu predicie Codarea cu predicie este o metod larg utilizat pentru eliminarea redundanei din semnalul de televiziune. Codarea cu predicie se bazeaz pe observaia c ntre eantioanele semnalului de televiziune exist o corelaie destul de puternic. Codarea este cu att mai eficient cu ct aceast corelaie este mai mare. Predicia valorii unui eantion se bazeaz pe valoarea eantioanelor anterioare. Valoarea prezis nu va fi chiar valoarea eantionului curent dar va putea fi foarte aproape de aceasta. Dac se transmite numai diferena dintre eantionul curent i cel prezis, volumul de informaie transmis poate fi redus semnificativ. Deci n codarea cu predicie redundana previzibil poate fi eliminat din semnalul de intrare, ceea ce permite compresia datelor. Eantionul prezent x(k ) este estimat din valoarea eantioanelor anterioare x(k i ) . n codarea cu predicie liniar eantionul prezis este o combinaie liniar a valorilor eantioanelor precedente :
(k ) = ai x(k i ) x
i =1 N

unde ai snt coeficieni constani iar x(k i) este valoarea eantionului anterior cu i perioade de tact. Dac se aplic transformata Z rezult :
( z ) = P( z ) x( z ) x

unde :
P ( z ) = ai z i
i =1 N

Eroarea de predicie este :

( z ) = [1 P( z )] x( z ) e( z ) = x ( z ) x

12

Eroarea de predicie este codat i transmis la receptor. La receptor x( z ) este reconstituit din semnalul recepionat e( z ) . Dac exist o corelaie puternic n semnalul de televiziune, eroarea de predicie este relativ mic n raport cu semnalul de intrare, deci poate fi codat cu un numr mai mic de bii. Principiul acestei prelucrri este prezentat n fig. 4.1.

+ + P(z) ^ x

e + + ^ x + P(z)

Fig. 4.1 Schema bloc a codrii cu predicie Predicia este o filtrare liniar cu funcia de transfer P( z ) i este realizat cu un filtru digital nerecursiv. Funcia de transfer a codorului este 1 P( z ) . Decodorul este un filtru digital cu funcia de transfer 1[1 P( z )] . Dac se face predicia utiliznd doar eantionul precedent, adic
(k ) = x(k 1) x

atunci funcia de transfer a codorului este 1 z 1 (un circuit de difereniere) iar funcia de transfer a decodorului este 1 /(1 z 1 ) (un circuit de integrare). De obicei codarea cu predicie este realizat ntr-o configuraie cu bucl de reacie. Prezena cuantizorului n bucla de reacie evit acumularea erorilor de cuantizare. Codarea DPCM are i avantajul de a elimina un eventual comportament nestaionar al semnalului. Proiectarea optim a unui predictor nseamn nseamn alegerea unui numr suficient de mare de eantioane anterioare i alegerea valorilor coeficienilor a i (deci determinarea funciei de transfer P( z ) ) pentru care eroarea medie ptratic de predicie este minim :
E[e 2 (k )] = E[{x(k ) ai x(k i )}2 ]
i =1 N

unde E[] reprezint media statistic. Derivnd parial n raport cu ai i egalnd rezultatul cu zero se obine sistemul de ecuaii :

13

a
j = 1,2,...N
i =1

E[ x(k i ) x(k j )] = E[ x(k ) x(k j )]

Dac se noteaz funcia de autocorelaie a semnalului x cu :


Ri = E[ x(k ) x(k i )]
R1 R0 . . RN 2

sistemul se poate scrie matricial :


R0 R 1 . . RN 1 . . RN 1 a1 R1 . . RN 2 a 2 R2 . . . . = . . . . . . . . R0 RN a N

Dac se rezolv ecuaia matricial se pot obine valorile coeficienilor de predicie. Puterea erorii de predicie minimizate este :
N Ri E[e 2 (k )]Min = R0 [1 ai ] R i =1 0

n cadrul experimentrilor s-a constatat c proprietile statistice ale erorii de predicie pot fi descrise cu ajutorul distribuiei Laplace :
w( D) = 2 D 1 exp 2 p p

Funcia de autocorelaie a semnalului de televiziune poate fi aproximat cu expresia :


Ri = R(i ) = exp[ i ]

unde este o constant. Se poate demonstra, folosind ecuaiile de mai sus, c n acest caz predictorul optim este de ordinul unu iar coeficienii sunt dai de relaia :
a1 = R1 = ; ai = 0 i 1 R0

unde este coeficientul de corelaie ntre dou eantioane vecine. Puterea erorii de predicie minime este :
PeMin R 2 2 1 = R0 1 R = R0 (1 ) 0

Cu ct este mai mare puterea erorii de predicie minime este mai mic fa de puterea semnalului. Dac se dorete ca eroarea medie de predicie s fie egal cu zero, atunci este necesar ca predicia s se fac n conformitate cu ecuaia :
(k ) = x(k 1) + m (1 ) x
14

unde m este media semnalului. n cazul imaginilor este util predicia bidimensional. n predicia bidimensional sunt utilizate i eantioane din liniile precedente ale aceluiai cmp. De obicei corelaia este puternic doar cu elementele liniei anterioare din acelai cmp. Coeficienii funciei de predicie se determin n cazul bidimensional pe acelai principiu ca i n cazul unidimensional, punnd condiia minimizrii erorii ptratice medii de predicie. Funcia de autocorelaie bidimensional a imaginii pentru zone staionare n sens larg este de forma :
R (m, n) = R (0,0) exp[ m n ]

Valorile experimentale obinute sunt urmtoarele : - Pentru imagini de tip prim-plan (cu suprafee uniforme relativ multe)
= 0,125 0,090 = 0,240 0,120

- Pentru imagini cu multe detalii :


= 0,231

= 0,307

- Pentru imagini tip prim plan H = 0,882 0,914; V = 0,786 0,887 - Pentru imagini cu multe detalii H = 0,794; V = 0,735 Dac funcia de autocorelaie bidimensional are forma din relaia de mai sus, atunci se poate demonstra c :
E[e(m, n) e(r , s )] = 0

pentru m r; n s Cu alte cuvinte semnalul de eroare de predicie este necorelat. n cazul n care funcia de autocorelaie bidimensional este de alt form dect cea de mai sus, atunci este necesar s se utilizeze mai mult de 3 elemente vecine ale eantionului curent pentru a se obine o bun estimare. n aplicaiile practice, deoarece proprietile statistice ale imaginii sunt nestaionare i neuniforme spaial, se prefer s se varieze funcia de predicie adaptiv, n funcie de proprietile locale ale imaginii. Un mod tipic de adaptare este de a selecta un predictor optim din mai multe funcii de predicie (fig. 4.2). Alegerea funciei de predicie optime se face observnd elementele anterioare ale imaginii din vecintatea elementului considerat. Aceasta este o schem de predicie neliniar n care funcia de predicie variaz cu statistica local a imaginii. Predicia adaptiv este eficace pentru scderea erorii de predicie la tranziia dintre dou zone cu proprieti statistice diferite. Funcia rat-distorsiune n codarea cu predicie Funcia rat-distorsiune arat legtura care exist ntre distorsiunile admise ntr-o metod de compresie care reduce entropia sursei iniiale i valoarea minim la care poate fi redus debitul de informaie al sursei efective.

15

Fie x(t ) un vector N-dimensional care reprezint ntr-un spaiu metric semnalul generat de surs i y(t ) vectorul N-dimensional care reprezint semnalul comprimat transmis. Distorsiunea introdus prin compresie poate fi msurat dac se definete distana d ( x, y ) ntre cele dou semnale. Se poate alege distana :

x + ^ x + -

e Cuantizor

P1 +

PN

Fig. 4.2 Predicie adaptiv cu predictori comutai


d ( x, y ) = d ( x i , y i )
i =0 N 1

unde :
d ( xi , y i ) = E[( xi y i ) 2 ]

unde x0 ,.....x N 1 i y0 ,..... y N 1 sunt componentele nainte i respectiv dup compresie. Reducerea entropiei n procesul de compresie este echivalent cu efectul perturbaiilor asupra unui canal de transmisiune. Circuitul de compresie poate fi considerat un canal afectat de perturbaii i se poate defini transinformaia :
I ( X , Y ) = H (Y ) H (Y / X )

Eroarea medie H (Y / X ) este cu att mai mare cu ct distorsiunile introduse prin compresie sunt mai importante. Funcia rat-distorsiune este definit prin relaia :
R( D) = min[ I ( X , Y )] = min[ H (Y ) H (Y / X )]

unde minimul este n raport cu probabilitile p( y j / xi ) i este supus condiiei ca distorsiunile d ( x, y ) s nu depeasc valoarea D admis :
d ( x, y ) D

16

Funcia R( D) reprezint debitul de informaie minim la ieirea circuitului de compresie care garanteaz c distorsiunea D nu este depit. Deci o compresie efectuat de o transformare care reduce entropia transform sursa cu debit H ( X ) bii/s ntr-o nou surs cu debit R( D) mai mic astfel nct distorsiunile s nu depeasc o valoare admis D. Se poate deci defini raportul de compresie maxim :
C= H(X ) R( D)

care reprezint de fapt o limit superioar ce nu poate fi depit prin nici un procedeu de compresie fr depirea limitei admise D pentru distorsiuni. Teorema codrii surselor a lui Berger este urmtoarea : " Pentru codarea unei surse discrete fr memorie, exist, atunci cnd distorsiunea este mai mic dect D , un cod bloc C cu viteza de bit R atunci cnd lungimea blocului este suficient de mare ".
R = R( D) +

Reciproca acestei teoreme este : " Dac este disponibil o vitez de bit R pentru codarea unei surse discrete fr memorie, atunci nu poate fi depit o distorsiune D( R) ". Pentru o surs staionar continu, fr memorie, caracterizat de funcia de distribuie gaussian :
x2 exp p ( x) = 2 2 2 Valoarea funciei R( D) este : 1

2 1 RG ( D) = log 2 D [bii/simbol] 2

iar distorsiunea :
0 D 2

Pentru orice rat de informaie R RG ( D) , sistemele de compresie care sunt proiectate s ating o distorsiune D pentru o surs cu distribuie gaussian cu valoare medie nul i dispersie 2 , vor asigura o distorsiune care nu depete valoarea D pentru orice alt surs staionar avnd valoare medie nul i aceeai dispersie. Cu alte cuvinte, dintre toate sursele continue fr memorie, staionare i ergodice, cu valoare medie nul i cu aceeai dispersie, cea care necesit cea mai mare valoare a funciei R( D) este sursa gaussian :
2 1 R ( D) RG ( D) = log 2 D 2

Sursele reale sunt n majoritatea cazurilor surse cu memorie. Pentru surse cu memorie, staionare i ergodice, calculul funciei rat-distorsiune se face, n funcie

17

de momentele de ordinul unu i doi, utiliznd rezultatele obinute n calculul funciei R( D) pentru surse fr memorie. 4.4.2 Codarea cu transformate Metodele de compresie care utilizeaz transformate reduc corelaia dintre eantioane prin trecerea n spaiul transformat n care corelaia dintre coeficienii transformatei este redus semnificativ. Raportul de compresie obinut este cu att mai mare cu ct de obine o decorelare mai puternic a coeficienilor din spaiul transformat. Schema bloc a transmisiei cu codare cu transformate este prezentat n fig. 4.3.
Cuantizor i Codor

Transformare direct

Selector

Canal de transmisie

Decodor

Transformare invers

Fig. 4.3 Codarea cu transformate. Schema bloc Transformarea se face pe blocuri 8 x 8 sau 4 x 4 din motive de complexitate a calculelor care trebuie efectuate la imaginile cu micare n timp real. La intrarea etajului de transformare direct se aplic eantioanele f(x,y) ale blocului N x N (de ex. 8 x 8). Transformarea direct se efectueaz conform relaiei (care poate fi scris
F (u , v ) = f ( x, y ) A( x, y, u , v )
x =1 y =1 N N

i matricial). A(x,y,u,v) este nucleul transformrii directe. Blocul de selecie va face selectarea coeficienilor ce vor fi transmii dup dou criterii posibile : 1. Selecie zonal 2. Selecie cu prag.

18

Selecia zonal presupune alegerea unei anumite zone din spaiul transformat (zona de joas frecven) i transmisia numai a acelor coeficieni, ceilali coeficieni urmnd a fi considerai egali cu zero la recepie. Selecia cu prag presupune fixarea unui anumit prag de amplitudine de la care se consider c valoarea coeficienilor din spaiul transformat este semnificativ i transmisia numai a coeficienilor care depesc acest prag, ceilali coeficieni find considerai egali cu zero. n acest caz trebuie ns transmis i informaia despre localizarea coeficienilor nenuli din spaiul transformat. La recepie transformata invers permite trecerea napoi n spaiul imaginii :
f ( x, y ) = F (u, v ) S (u, v ) B( x, y, u, v )
u =1 v =1 N N

Unde s-a notat cu B(x,y,u,v) nucleul transformrii inverse i cu S(u,v) funcia de selecie a coeficienilor ce urmeaz a fi transmii (egal cu 1 pentru coeficienii ce vor fi transmii i cu 0 pentru coeficienii ce nu vor fi transmii i vor fi considerai la recepie egali cu 0). Transformrile bidimensionale utilizate trebuie s fie unitare (matricea transformrii s fie unitar) i s aib algoritm de calcul rapid. Transformata optim care elimin complet corelaia dintre coeficieni n spaiul transformat este transformarea Karhunen-Loeve, dar aceasta nu are algoritm de calcul rapid.Transformri suboptimale cu algoritm de calcul rapid sunt transformrile Fourier rapid, Walsh-Hadamard, Cosinus discret (DCT = Discrete Cosine Transform) ;I transformarea wavelet.. 4.4.3 Codarea vectorial Codarea vectorial se bazeaz pe rezultatele teoremei rat-distorsiune a lui Shannon, care arat c performanele metodelor de compresie de date sunt ntotdeauna mai bune atunci cnd se codeaz vectori n locul scalarilor, chiar dac sursa este fr memorie. Codarea vectorial este foarte mult utilizat n codarea imaginilor statice. Schema bloc pentru o metod de compresie cu cuantizare vectorial este dat n fig. 4.4. Codorul i decodorul utilizeaz o list de coduri Y , care conine cuvinte de cod (vectori de cod) y de dimensiune k notai cu un indice j [0, Y 1] . Imaginea este mprit n blocuri de pixeli de dimensiune n m . Fiecare bloc poate fi considerat un vector u de dimensiune k = m n . Pentru fiecare bloc codorul selecteaz cuvntul de cod y care d cea mai mic distorsiune d (u, y ) . Indicele j al cuvntului de cod este transmis pe canal. Dac nu exist zgomot, decodorul = y. reface cuvntul de cod y din indicele j i rezult u Din punct de vedere matematic cuantizarea vectorial este o funcie de la un spaiu k -dimensional la un set finit de simboluri J :

19

VQ : {u = (u1 , u 2 ,...u k )} J
R = log 2 (Y ) [bii/vector] Viteza de transmisie pe eantion este R / k [bii/eantion]. De obicei Y este o putere a lui 2 i atunci R este numr ntreg.

Viteza de transmisie este :

Performanele sistemului cu codare vectorial depind de structura listei de coduri. Exist mai multe criterii pentru a proiecta n mod optim o list de coduri. Unul dintre ele const n minimizarea distorsiunii medii (tipic eroarea medie ptratic MSE). Alt criteriu urmrete maximizarea entropiei listei de coduri, ceea ce nseamn c fiecare cuvnt de cod este utilizat n medie de acelai numr de ori. De obicei lista de coduri este fixat la codor i la decodor. n codarea vectorial adaptiv lista de coduri este modificat odat cu modificarea caracteristicilor statistice ale imaginii. Se creaz noi liste de coduri pe parcursul funcionrii sistemului care le nlocuiesc pe cele vechi. n trecut codarea vectorial a fost mai puin utilizat din cauza complexitii calculelor att n procesul de codare ct i n procesul de nvare. n ambele procese se calculeaz distorsiunile pentru fiecare cuvnt de cod din list i se compar ntre ele pentru a gsi cuvntul de cod care d distorsiunea cea mai mic. Deoarece se utilizeaz blocuri n codarea vectorial exist posibilitatea ca structura de blocuri s fie vizibil pe imagine. n acelai timp, codarea vectorial prezint avantaje semnificative, pe lng compresia pe care o realizeaz. Se pot construi liste de cuvinte de cod pentru care entropia este aproape de valoarea maxim posibil. Rezult astfel c se poate face codare cu cuvinte de cod cu lungime fix cu toate avantajele ce decurg de aici n privina comportrii sistemului n prezena erorilor de pe canal. De asemenea, cuvintele de cod pot fi aranjate astfel nct cele care sunt apropiate n distan Euclidian s aib indici de cod apropiai n distan Hamming. Rezultatul obinut este c erorile de transmisie determin decodorul s selecioneze un cuvnt apropiat de cel original. Se obine astfel compresie maxim (pe baza entropiei) i o sensibilitate redus la erorile de transmisie. O metod clasic de proiectare a listei de cuvinte de cod este algoritmul LBG, care este un algoritm optimizat local utilizat n mod frecvent la proiectarea cuantizorilor vectoriali pentru imagine i semnal vocal. n ultimul timp au fost propuse pentru proiectarea codorilor vectoriali reele artificiale neuronale (ANN=Artificial Neural Network) care elimin limitrile algoritmilor tradiionali. Reelele ANN sunt formate dintr-un numr mare de uniti de calcul simple interconectate ntre ele, care pot lucra n paralel. Algoritmii de proiectare cu ANN nu necesit acces n acelai timp la ntregul set de date pentru nvare.

20

Lista de coduri

Vector intrare u

Selectare cod y din Y cel mai apropiat de U

Canal de transmisie Lista de coduri

^ Vector ieire u

Reface codul y din Y care are indicele j Codul y folosit la reconstructia imaginii

Fig.4.4 Principiul codrii vectoriale Cuantizarea vectorial diferenial (DVQ=Differential Vector Quantization) nlocuiete cuantizorul scalar din schema DPCM cu un cuantizor vectorial. Rezult un sistem care mbin multe din avantajele celor dou metode de compresie. Un rol important n DVQ joac mrimea blocurilor de imagine considerate. n general blocurile mai mari mresc raportul de compresie dar degradeaz calitatea. De obicei se lucreaz cu blocuri 2 x 2 ( k = 4 ), 3 x 3 (k=9), 4 x 4 (k=16). S-a constatat c blocurile mai mari de 2 x 2 introduc o structur vizibil pe imagine, care nu este acceptabil pentru imagini de foarte bun calitate. De asemenea, blocurile 2 x 2 permit prelucrarea n timp real. S-a constatat, prin teste pe secvene de imagini, c eroarea ptratic medie MSE depinde de numrul de bii/eantion. Pentru un numr fix de cuvinte de cod blocurile de dimensiune 2 x 2 necesit mai puine cicluri de nvare. Trebuie spus c, dac prelucrarea n timp real se dovedete posibil, este util s se realizeze un sistem DVQ intercadre. De asemenea, cuantizorul vectorial poate fi fcut adaptiv, arhitectura reelei neuronale artificiale ANN putnd fi folosit pentru reactualizarea
21

listei de cuvinte de cod pe msur ce se modific proprietile statistice ale imaginii. 4.5 Standarde de compresie digital a imaginilor 4.5.1 Standardul JPEG Standardul JPEG (Joint Photographic Experts Group) este utilizat pentru compresia imaginilor fixe. Grupul JPEG a fost creat n 1988 sub egida ISO ca un proiect comun al ISO i al comisiei Q16 CCITT. n anul 1992 a devenit standard ISO. Rata de compresie poate ajunge pn la 15:1. Exist i o variant pentru secvene de imagini MJPEG (Motion JPEG). Standardul JPEG permite patru moduri de operare : Codare secvenial DCT , n care fiecare component de imagine (YUV) este codat ntr-o singur explorare de la stnga la dreapta i de sus n jos. Codare progresiv DCT, n care imaginea este codat n explorri succesive pentru a produce o imagine rapid, decodat brut atunci cnd timpul de transmisie este lung. Codare fr pierderi, n care imaginea este codat pentru a garanta o refacere exact dup decodare. Se utilizeaz algoritmi de codare cu predicie n locul codrii cu DCT. Codare ierarhic, n care imaginea este codat cu rezoluii multiple. Imaginea surs ce trebuie codat const din 1 pn la 255 de planuri de imagine fiecare cu alt numr de pixeli. De exemplu se pot coda imagini n format RGB (3 plane cu aceeai rezoluie) sau YUV (3 plane cu rezoluii diferite). Toi pixelii dintr-un plan sunt codai cu acelai numr de bii. Schema bloc a codorului i a decodorului JPEG pentru codarea secvenial este prezentat n fig.9.4. Codorul JPEG const din trei blocuri principale : Blocul de transformare cosinus discret (DCT) Cuantizorul Codorul entropic La intrarea codorului eantioanele din gama [0, 2p 1] sunt translatate n gama [2p-1 , 2p-1-1]. De exemplu, pentru imagini cu p=8, eantioanele originale din gama [0, 255] sunt translatate n gama [-128, 127]. Apoi imaginea este divizat n blocuri de eantioane de dimensiune 8x8, asupra crora se efectueaz transformata cosinus discret (DCT) :
F (u , v ) =

(2 x + 1)u cos (2 y + 1)v C (u ) C (v ) 7 7 f ( x, y ) cos 16 16 2 2 x =0 y =0


22

unde
C (0 ) =
1 2

iar pentru u i v diferite de 0


C (u ) = C (v ) = 1

Coeficientul F(0,0) se numete coeficient DC iar ceilali 63 de coeficieni se numesc coeficieni AC. Pentru p=8 coeficienii DCT sunt n gama [-1024,+1023], ceea ce implic trei bii adiionali pentru reprezentarea lor. Pentru un bloc tipic de imagine majoritatea coeficienilor DCT au valori zero sau apropiate de zero. Pe acest lucru se bazeaz compresia de spectru.
Codor JPEG Imagine surs Blocuri 8 x 8 DCT Cuantizor Codor entropic Imagine comprimat

Tabel

Tabel

Decodor JPEG

Imagine comprimat

Decodor entropic

Decuantizare

IDCT

Imagine reconstruit

Tabel

Tabel

Fig.4.5 Codor i decodor JPEG. Schema bloc n etajul urmtor, cuantizorul, cei 64 de coeficieni DCT sunt cuantizai utiliznd un tabel de cuantizare cu 64 de elemente specificat de aplicaie.

F (u , v ) Fq (u , v ) = Q(u , v )

23

Cuantizarea reduce amplitudinea coeficienilor care a cror contribuie este neglijabil la calitatea imaginii, avnd ca scop creterea numrului de coeficieni DCT egali cu zero. Cuantizarea se face n conformitate cu urmtoarea ecuaie : unde [ ] simbolizeaz partea ntreag iar Q(u,v) sunt coeficienii specificai n tabelul de cuantizare. Fiecare element Q(u,v) este un numr ntreg cuprins ntre 1 i 255, care specific pasul de cuantizare pentru coeficientul DCT corespunztor. Dup cuantizare cei 63 de coeficieni AC sunt ordonai ntr-o secven n zigzag. Aceast ordonare n zig-zag va facilita n pasul urmtor codarea entropic pentru c se poate vedea pe imagini reale c probabilitatea ca s fie n aceast secven coeficieni egali cu zero crete monoton cu indexul coeficienilor. Coeficienii DC, care sunt valoarea medie a eantioanelor dintr-un bloc 8x8, sunt codai printr-o tehnic de codare adaptiv, prin transmisia diferenei dintre doi coeficieni DC de la dou blocuri adiacente. Acest lucru se face pentru c exist o corelaie puternic ntre coeficienii DC de la blocuri adiacente. n final, codarea entropic ofer o compresie de spectru adiional. Standardul JPEG specific dou metode de codare entropic : codarea Huffman i codarea aritmetic. Standardul de baz secvenial JPEG utilizeaz codare Huffman. Codarea Huffman convertete coeficienii DCT ntr-o secven binar compact utiliznd dou etape : 1. Formarea secvenei de simbol intermediare 2. Conversia acestei secvene n secven binar cu tabelele Huffman. n secvena de simboluri intermediare fiecare coeficient AC este reprezentat printr-o pereche de simboluri : Simbol 1 (RUNLENGTH, SIZE) Simbol 2 (AMPLITUDINE) RUNLENGTH este numrul de coeficieni AC consecutivi cu valoare zero care preced un coeficient AC diferit de zero. Gama sa de valori este ntre 0 i 15, ceea ce necesit 4 bii. SIZE este numrul de bii necesari pentru codarea AMPLITUDE. Numrul de bii pentru AMPLITUDE este ntre 0 i 10 bii, astfel nct sunt necesari 4 bii pentru a coda SIZE. AMPLITUDE este amplitudinea coeficientului AC diferit de zero care poate fi n gama [+1024, -1023], ceea ce necesit 10 bii pentru codare. De exemplu, dac secvena coeficenilor AC este : 0,0,0,00,0,476 reprezentarea secvenei de simboluri este : (6,9) (476) unde RUNLENGTH=6, SIZE=9, AMPLITUDE=476.

24

Dac RUNLENGTH este mai mare dect 15, atunci simbolul (15,0) este interpretat ca extensia cu RUNLENGTH=16. Pot exista pn la trei extensii consecutive (15,0). Pentru coeficienii DC reprezentarea simbolurilor intermediare este : 1. Simbol-1 (SIZE) 2. Simbol-2 (AMPLITUDE) Deoarece coeficienii DC sunt codai diferenial aceast gam este dubl fa de gama coeficenilor AC i este [-2048,2047]. A doua etap n codarea Huffman este conversia secvenei intermediare de simboluri n secven binar. Simbolurile sunt nlocuite coduri cu lungime variabil, ncepnd cu coeficientul Dc i continund cu coeficienii AC. Fiecare Simbol-1 (pentru coeficienii AC i DC este codat cu un cod cu lungime variabil (VLC=Variable Length Code) obinut dintr-un tabel Huffman specificat pentru fiecare componenta de imagine YUV. Simbolurile-2 sunt codate utiliznd un cod cu lungime variabil de tip VLI (Variable Length Integer, a crui lungime n bii este dat n tabelul 4.3. Tabelul 4.3 Gama amplitudinilor (-1,1) (-3,2) (2,3) (-7,4) (4,7) (-15,-8) (8,15) (-31,-16) (16,31) (-63,-32) (32,63) (-127,-64) (64,127) (-255,-128) (128,255) (-511,-256) (256,511) (-1023,-512) (512,1023)

Lungime cod 1 2 3 4 5 6 7 8 9 10

Decodarea standardului secvenial JPEG cuprinde n ordine invers toate etapele procesului de codare aa cum se prezint n figura 9.4. Decodorul entropic (Huffman) este primul bloc n care secvena binar este convertit ntr-o secven de simboluri utiliznd tabelele Huffman (pentru coeficienii codai VLC) i decodarea VLI, dup care simbolurile se convertesc n coeficieni DCT. Apoi se face decuantizarea conform ecuaiei :
Fq (u, v ) = Fq (u , v ) Q(u, v )

25

Unde Q(u,v) sunt coeficienii de cuantizare din tabelul de cuantizare utilizat i la codare. Este efectuat apoi transformarea cosinus discret invers (IDCT) care face transformarea n domeniul spaial :
F ( x, y ) =

(2 x + 1)u cos (2 y + 1)v 1 7 7 C (u )C (v )F (u, v ) cos 4 u =0 v =0 16 16

unde C(u) i C(v) au aceleai expresii ca la transformarea cosinus discreta direct.. Ultimul pas const n translatarea eantioanelor n gama [0, 2p-1]. 4.5.2 Standardele din familia MPEG Standardele MPEG (Moving Picture Experts Group) sunt propuse pentru compresia imaginilor cu micare. Primul standard introdus n 1991 (MPEG-1 , ISO/IEC 11172 din 1993) este destinat compresiei imaginilor video cu micare cu rezoluie 320x240 (calitate VHS) pn la viteze de transmisie de 1-1,5 Mbit/s. Standardul MPEG-2 introdus n 1994 (ISO/IEC 13818 din 1996) este destinat transmisiei imaginilor de cu rezoluie mai bun (720x480), similar cu cea din standardului digital de studio. Fluxul de date MPEG-2 ajunge la 4-10 Mbit/s. Standardul permite transmisia imaginilor cu ntreesere. MPEG-2 permite transmisia imaginilor pentru o larg varietate de aplicaii care necesit rezoluii diverse cum sunt comunicaiile video prin reele ISDN utiliznd ATM. ] Metoda de compresie n standardele MPEG-1 i MPEG-2 este hibrid i utilizeaz transformata cosinus discret (DCT) intracadru i codare cu predicie cu compensarea micrii intercadre. Raportul de compresie poate ajunge pn la 200 : 1. Pentru televiziunea de nalt definiie (HDTV = High Definition Television) s-a stabilit iniial s se creeze un standard special, MPEG-3. Ulterior s-a constatat c nu este necesar un astfel de standard i c se poate folosi tot standardul MPEG2, evident cu creterea vitezei de transmisie dup compresie fa de viteza necesar pentru semnale video pentru imagini cu rezoluie normal codate MPEG-2. Standardele MPEG-1 i MPEG-2 au creat posibilitatea dezvoltrii televiziunii digitale i, de asemenea posibilitatea televiziunii interactive pe CDROM i apoi pe DVD (Digital Video Disk).. Standardul MPEG-4 (ISO/IEC 14496-2 din anul 2000) a fost dezvoltat pentru a oferi utilizatorilor un nou nivel de interaciune cu coninutul vizual. Metodele de compresie sunt diferite de cele din standardele MPEG-1 i MPEG-2. Standardul MPEG-4 ofer tehnologii pentru a vizualiza, accesa i manevra obiecte n locul eantioanelor, tehnologii robuste la erori i pentru o gam larg de viteze

26

de transmisie. Domeniile de aplicaie sunt televiziunea digital, aplicaii grafice interactive (coninut sintetic) i multimedia interactiv. n loc s considere imaginea ca fiind format din eantioane (pixeli) de diverse amplitudini i cu variaie n timp pentru imagini cu micare (aa cum se ntmpl la MPEG-1 i MPEG-2), standardul MPEG-4 consider imaginea format din obiecte care se afl n faa unui fundal, att obiectele ct i fundalul putnd s-i modifice n timp poziia i forma pentru imagini cu micare. Este un mod de descriere a imaginilor mai apropriat de ceea ce se ntmpl n cadrul sistemului vizual uman, lucru ce poate explica obinerea unor imagini de bun calitate la viteze de bit relativ sczute. Standardele MPEG-1 i MPEG-2 Tabelul 4.4 prezint mai multe formate de secvene video i parametrii corespunztori ai standardului MPEG-1 i MPEG-2. FORMAT SIF CCIR 601 EDTV HDTV Tabelul 4.4 PARAMETRI VITEZ DE VIDEO BIT DUP COMPRESIE 352x240 30 Hz 1,2-3 Mbit/s 720X486 30 Hz 5-10 Mbit/s 960x486 30 Hz 7-15 Mbit/s 1920x1080 20-40 Mbit/s 30Hz STANDARD MPEG MPEG-1 MPEG-2 MPEG-2 MPEG-2

Standardul MPEG-2 este utilizat att pentru aplicaii simetrice ct i pentru aplicaii asimetrice. Aplicaiile asimetrice sunt caracterizate prin utilizarea frecvent a decompresiei, n timp ce procesul de compresie este efectuat o singur dat. Exemplele includ televiziunea digital ca i aplicaii interactive (filme la cerere, educaie la distan, etc). Aplicaiile simetrice necesit o utilizare egal a proceselor de compresie i decompresie. Exemple de astfel de aplicaii sunt pota multimedia i videoconferina. Standardul MPEG-2 const din trei pri : 1. Sincronizarea i multiplexarea secvenelor video i audio. 2. Video. 3. Audio. Se prezint n continuare principiile standardului video. Se definesc 8 frecvene de cadre : 23,976 Hz ; 24 Hz ; 25 Hz ; 29,97 Hz ; 30 Hz ; 50 Hz ; 59,94 Hz ; 60 Hz .
27

Fiecare imagine se mparte n zone numite macroblocuri cu dimensiunea de 16 x 16 pixeli pentru Y i 8 x 8 pixeli pentru U i V. n standardul MPEG-2 cadrele de imagine sunt codate utiliznd trei algoritmi diferii, aa cum se prezint n figura 4.6.
1 I 2 B 3 B 4 B 5 P 6 B 7 B 8 B 9 I

Fig.4.6 Tipuri de cadre n standardul MPEG-2 Cadrele de tip I sunt codate intracadru utiliznd transformata cosinus discret (DCT) n mod sismilar cu standardul JPEG. Aceste cadre sunt puncte de acces aleator n fluxul de date MPEG-2 i au cea mai sczut rat de compresie. Cadrele de tip P sunt codate cu predicie temporal avnd ca referin cadre de tip P sau de tip I anterioare. Raportul de compresie pentru aceste cadre este net superior fa de cadrele I. Cadrele de tip B sunt codate bidirecional n timp utiliznd dou cadre de referin (unul anterior i unul posterior) care pot fi de tip I sau P. Aici se obine rata de compresie cea mai mare. Din cele expuse mai sus rezult c ordinea de decodare va fi diferit de ordinea de codare. Cadrul P (5) trebuie s fie decodat naintea cadrelor B (2,3,4), iar cadrul I (9) naintea cadrelor B (6,7,8). La transmisia semnalului MPEG ordinea de transmisie trebuie s fie 1,5,2,3,4,9,6,7,8. Dac este necesar acces aleator rapid cea mai bun soluie ar fi codarea tuturor cadrelor drept cadre I (MPEG devine identic cu MJPEG). Cea mai mare rat de compresie se obine cu un numr ct mai mare de cadre de tip B. Procesul de codare pentru cadrele de tip B i P include estimarea micrii pentru extragerea informaiei de micare din secvena video. Pentru fiecare bloc 16 x 16 din cadrele B i P se calculeaz unul sau doi vectori de micare. Pentru cadrele B se calculeaz un vector de micare, iar pentru cadrele B interpolate se calculeaz doi vectori de micare. Standardul MPEG-2 nu indic un anumit algoritm pentru
28

estimarea micrii dar specific modul de codare a rezultatului. Se codeaz vectorul de micare i diferena dintre blocuri. Zona de cutare (amplitudinea vectorului de micare) nu este definit n standard dar este restrns prin definirea gamei vectorului. Cu ct zona de cutare este mai mare, cu att estimarea micrii este mai bun (dei calculul este mai complex) i rata de compresie mai mare. Standardul MPEG-4 Aplicaiile multimedia atrag atenia din ce n ce mai mult industriei telecomunicaiilor, a bunurilor de consum electronice i industriei de calculatoare. ntr-un sens larg multimedia este cadrul general de interaciune cu informaiile provenite din mai multe surse, inclusiv video. Un standard multimedia este de ateptat s ofere suport pentru un mare numr de aplicaii. Aceste aplicaii se traduc ntr-un set specific de cerine care pot s fie foarte diferite. Un domeniu comun pentru majoritatea aplicaiilor este necesitatea de a suporta interactivitatea cu diverse tipuri de date. Aplicaiile legate de informaia vizual pot fi gruoate pe baza mai multor trsturi : a) Tipul datelor (imagini fixe, imagini stereoscopice, video, etc.) ; b) Tipul sursei (imagini naturale, imagini generate pe calculator, text i grafic, imagini medicale, etc.) ; c) Tipul de comunicaie (mergnd de la comunicaii punct la punct pn la comunicaii multipunvt la multipunct) ; d) Tipul funcionalitilor dorite ( manevrarea obiectelor, editare on-line, transmisie progresiv, rezisten la erori, etc.). Standardele de compresie video MPEG-1 i MPEG-2, dei foarte bine adaptate la mediul pentru care au fost proiectate, nu sunt suficient de flexibile pentru a ndeplini cerinele aplicaiilor multimedia. Aceasta a fost motivaia care a dus la crearea standardului MPEG-4. Televiziunea digital nlocuiete din ce n ce mai mult astzi televiziunea analogic, att n transmisia ct i n memorarea imaginilor (vezi trecerea de la casetele video analogice la DVD), lucru posibil i prin dezvoltarea standardului MPEG-2. n aceste apicaii coninutul omaginii este reprezentat digital, cu efecte evidente asupra calitii imaginii, dar coninutul rmne acelai pentru utilizator. Odat ce coninutul este Standardul MPEG-4 const dintr-o colecie de instrumente pentru codarea formei, compensarea i estimarea micrii, codarea zonelor cu texturi, rezistena la erori i scalabilitate. 1. Codarea formei poate fi realizat n mod binar (forma fiecrui obiect fiind descris printr-o masc binar) , sau n modul corespunztor unei scri de gri (permind astfel transparema obiectelor afiate i reducnd fenomenele de aliere la marginile obiectului).
29

2. Compensarea micrii se face pe blocuri, cu modificarea corespunztoare pentru marginile obiectului. Mrimea blocurilor poate fi 16 x 16 sau 8 x 8, cu rezoluie spaial de jumtate de eantion. 3. Codarea zonelor cu texturi se bazeaz pe utilizarea transformatei cosinus discret (DCT) pe blocuri 8 x 8, cu modificri corespunztoare pentru blocurile de la marginea obiectelor. Zonele statice cu texturi se pot coda cu transformarea wavelet. 4. Rezistena la erori se realizeaz prin utilizarea unor markeri de sincronizare, coduri de extensie pentru header i coduri reversibile cu lungime variabil. 5. Scalabilitatea se realizeaz att spaial ct i temporal. MPEG-4 realizeaz scalabilitate pe baz de obiect, cu restricia ca forma obiectului s fie rectangular. Punctele de conformitate pentru MPEG-4 sunt definite ca Profilul Simplu (Simple Profile), Profilul Nucleu (Core Profile) i Profilul Principal (Main Profile). Primele dou profile sunt specifice pentru imagini cu rezoluie tipic QCIF i CIF (vezi paragraful 4.5.3.), cu viteze de bit dup[ compresie de 64 kbit/s, 128 kbit/s, 384 kbit/s i 2 Mbit/s. Profilul principal se folosete pentru imagini cu rezoluie tipic CIF, ITU-R 601 i HDTV, cu viteze de bit dup[ compresie de 2 Mbit/s, 15 Mbit/s i 38,4 Mbit/s. 4.5.3 Alte standarde de compresie a imaginilor Recomandarea CCITT H.261 din 1990 (cunoscut i sub denumirea de p x 64) este optimizat pentru a obine rapoarte foarte mari de compresie pentru imagini color cu micare. Ea se utilizeaz n videotelefonie i videoconferin. Algoritmul de compresie combin codarea intracadru DCT cu codarea cu predicie intercadre. Deoarece n aplicaiile de videoconferin i videotelefonie nu exist micare foarte rapid, iar majoritatea timpului micarea lipsete, algoritmul utilizeaz strategii de estimare i compensare a micrii limitate spaial la 15 pixeli. Se pot obine rapoarte de compresie ntre 100 : 1 i 2000 : 1. Standardul este utilizat pe canale ISDN cu viteze de transmisie multipli ai vitezei de baz de 64 Kbit/s. Numrul p poate fi cuprins ntre 1 i 30, de unde rezult c viteza de transmisie este cuprins ntre 64 Kbit/s i 2 048 Kbit/s. Pentru p egal cu 1 sau 2 se pot implementa doar comunicaii de tip videotelefon. Pentru p mai mare dect 6 se poate transmite o videoconferin. Spre deosebire de JPEG care admite o mare varietate de formate de imagine, standardul H.261 precizeaz foarte exact formatul de imagine. Imaginile au frecvena cadrelor de 29,97 Hz (59,94 Hz : 2) iar n procesul de codare este posibil
30

s se genereze o secven comprimat cu 10 15 cadre/s. Componentele imaginii , luminana i cele dou diferene de culoare sunt subeantionate conform Rec. CCIR 601 (standardul digital de studio) la 6,75 MHz pentru luminan i 3,375 MHz pentru cele dou diferene de culoare. Sunt specificate dou formate de rezoluie cu raport de aspect al imaginii de 4/3 : a) Formatul comun intermediar (CIF=Common Intermediate Format) cu rezoluie egal cu 288 linii x 352 pixeli pentru semnalul de luminan i 144 linii x 176 pixeli pentru semnalele diferen de culoare. b) Formatul sfert CIF (QCIF=Quarter CIF) care are rezoluia redus la jumtate pe fiecare direcie (orizontal i vertical) fa de formatul CIF (144 linii x 176 pixeli pentru luminan i 72 linii x 88 pixeli pentru diferenele de culoare), adic o rezoluie de 4 ori mai mic pe ansamblu dect la formatul CIF. Formatul QCIF necomprimat are viteza de transmisie de 9,115 Mbit/s , iar formatul CIF necomprimat are viteza de transmisie de 36,45 Mbit/s. Algoritmul de codare cuprinde : - Codare intracadru (corespunde codrii tip I din MPEG). - Codare intercadre (corespunde codrii tip P din MPEG). Conform standardului H.261 nu este obligatoriu ca dispozitivul codor s determine un vector de micare, de unde rezult c o implementare simpl consider doar diferenele dintre macroblocurile situate n aceeai poziie n cadre succesive (vector de micare egal cu 0). Dac se utilizeaz o implementare mai complex componentele vectorului de micare se codeaz entropic cu un sistem VLC (Variable Length Coding). Cuantizarea este liniar i pasul de cuantizare se regleaz n conformitate cu cantitatea de date din registrul tampon (buffer). Acest mecanism foreaz o vitez de date constant la ieirea codorului. Recomandarea 723 CCIR este un alt standard de compresie pentru transmisia semnalelor video care se refer la codarea pentru transmisie a imaginilor din standardul digital de studio 4 : 2 : 2. Viteza de transmisie este cuprins ntre 34 Mbit/s i 140 Mbit/s.

31

32