Sunteți pe pagina 1din 124

Formarea si transmiterea semnalelor digitale de televiziune

Introducere n transmisia digital a imaginilor

Compresia semnalelor video si audio.

Standardul MPEG-2
Compresia semnalului video

Introducere
Esantionarea semnalului video
Codarea MPEG2. Etape n realizarea compresiei semnalului video

Compresia semnalului audio

Standardul MPEG-4
Introducere
MPEG-4 partea a 10-a sau H264
Comparatie ntre MPEG-4 si MPEG-2

Fluxul de date MPEG


Pachete elementare ale fluxului de date
Transport Stream Packet
Informatii necesare receptorului DVB-T

Bazele modulatiei digitale

Introducere
Mixer
Modulatorul de amplitudine
Modulatorul IQ
Demodulatorul IQ

Transmisia digital reprezint orice transmisie n care


informatia util este n format digital. Indiferent dac
este cazul unui semnal video, audio sau de date,
informatia se prezint sub forma unui sir de biti.
Nu trebuie confundat informatia transmis cu
purttoarea acestei informatii, care este ntotdeauna
analogic, respectiv o oscilatie de nalt frecvent,
putndu-se folosi canalele obisnuite de comunicatii: prin
satelit, emittoare terestre, cablu, fibr optic.
Necesitatea trecerii de la utilizarea semnalelor TV
analogice la utilizarea semnalelor TV digitale a aprut
datorit faptului c, n format digital:

este utilizat pentru transmitere o lrgime de band mai mic


se reduc costurile de operare pe program transmis, deci servicii
mai ieftine),
prelucrarea semnalului n format digital este mult mai usoar.

n domeniul televiziunii, prima desprtire de traditionalul sistem TV


analogic s-a realizat prin introducerea sistemului hibrid analog-digital
D2MAC (D2 dou semnale , sunet si informatia de sincronizare sunt
transmise digital; MAC = Multiplexed Analogue Component
componentele de luminant si crominant). Acest sistem a fost
dezvoltat pentru transmisiile TV prin satelit, dar acesta nu a prins la
public, n prezent fiind folosit doar de unele tri nordice.
n cadrul studiourilor TV, semnalele digitale de televiziune au ptruns
ncepnd cu anii 90 prin utilizarea semnalelor digitale necomprimate,
n conformitate cu recomandarea CCIR 601. Aceste semnale au
debitul de informatie (data rate) de 270 Mbit/s, care este foarte
potrivit pentru distributie si prelucrare n cadrul studioului, dar nu si
pentru transmitere la utilizatorul final.
Evenimentul cheie n cadrul televiziunii digitale destinate publicului
larg poate fi considerat definitivarea standardului JPEG (JPEG = Joint
Photographic Experts Group). Acesta este utilizat pentru compresia
imaginilor fixe, rata de compresie putnd ajunge pn la 15:1.
Compresia imaginilor se bazeaz pe folosirea transformatei cosinus
discret (DCT = Discrete Cosine Transform). Astazi standardul JPEG
este foarte folosit n domeniul digital, nregistrnd un succes deosebit
n cadrul fotografiei digitale.

Transformata cosinus discret este algoritmul de baz si pentru


MPEG (MPEG = Moving Picture Experts Group) care a dezvoltat n
1993 standardul MPEG-1 iar apoi MPEG-2 si MPEG-4.
MPEG-1 este utilizat pentru imagini video n miscare cu data rate de pn la 1,5
Mbit/s utiliznd ca mediu de stocare CD-ul.
MPEG-2 este utilizat ca standard de baz n televiziunea digital din intreaga
lume, desi, n ultimul timp este nlocuit din ce n ce mai mult cu standardul
MPEG-4, care este o dezvoltare a standardului MPEG-2.

Standardul MPEG-2 este capabil s realizeze compresia semnalului


TV digital de la 270 Mbit/s la 2-6 Mbit/s.
Prin compresia semnalului audio digital rata de date este redus
de la 1,5 Mbit/s la 100-400 kbit/s.
Avnd n vedere aceste rate mari de compresie, acum se poate
realiza combinarea unui numr de programe sub forma unui
singur flux de date ce poate fi transmis n banda unui singur canal
TV analogic (6; 7 sau 8MHz functie de standard).

La nceputul anilor 90 a demarat un proiect european DVB =


Digital Video Broadcasting, n cadrul cruia au fost dezvoltate trei
metode de transmisie: DVB-S, DVB-C si DVB-T.
Metoda de transmisie prin satelit DVB-S este utilizat ncepnd cu
anul 1995. n cadrul acesteia este utilizat modulatia QPSK
(Quadrature Phase Shift Keying= in cuadratur cu deplasarea
fazei ), lrgimea canalului este n jur de 33MHz, iar rata de date
total de 38 Mbit/s. Se pot transmite 6, 8 sau chiar 10 programe
TV n cadrul unui canal, functie de data rate-ul acestora si de
numrul sunetelor nsotitoare.
n cadrul transmisiei prin cablu coaxial, DVB-C, este utilizat
modulatia 64QAM (64 Amplitude Quadrature
Modulation=(64)modulatie de amplitudine in cuadratura) ce
asigur tot un data rate de 38 Mbit/s, dar ntr-un canal cu lrgimea
de band de numai 8 MHz. DVB-C este n uz ncepnd din 1995.
Sistemul de transmisie digital TV terestr DVB-T a debutat n anul
1998 n Anglia, utiliznd modul de transmisie 2k, n prezent
asigurndu-se acoperirea national a acestei tri. Data rate-ul
asigurat de DVB-T este de 5-31 Mbit/s iar lrgimea canalului de
transmisie corespunde cu cel pentru TV analogic (6, 7 sau 8MHz,
functie de standard).

n cadrul acestei metode de transmisie sunt utilizate mai multe purttoare


de radiofrecvent, ortogonale ntre ele (OFDM = Orthogonal Frequency
Division Multiplex= multiplexare cu diviziune ortogonal de frecven),
fiecare dintre acestea fiind modulate QPSK, 16QAM sau 64QAM.
Trebuie mentionat c si semnalele DVB-S si DVB-C pot fi transmise terestru
utiliznd sistemul MMDS = Multipoint Multi-channel (Microwave)
Distribution System.
n mod intuitiv, n figura de mai jos sunt descrise etapele de baz n
sistemele de televiziune digital:

Standardul MPEG-2

Semnalul digital standard (SDTV = Standard Definition Television) are viteza de transmisie de
270 Mbit/s, mult prea mare pentru a putea fi transmis pe canalele obinuite. Este necesar o
puternic compresie a acestuia, de la 270 Mbit/s la 2-6 Mbit/s, pentru aceasta utilizndu-se
mecanisme de reducere a informatiei redundante i irelevante din fluxul de date.

Compresia semnalului video


Introducere

Pentru a realiza reducerea vitezei de transmisie (a debitului de informatie) pentru un flux de


date, trebuie s extagem din acesta informatia redundant sau informatia irelevant.

Informatia redundant este informatia care exist de mai multe ori n fluxul de date, sau biti
care nu contin informatie, sau informatie care poate fi reconstituit la receptie, fr pierderi,
prin procedee matematice.

O cale de reducere a redundantei este utilizarea codurilor cu lungime variabil. De exemplu, dac n fluxul
de date exist un ir de 15 zerouri, n locul acestora poate fi transmis mesajul de 15 ori zero printr-un
cod special care este mult mai scurt.

Fcnd o paralel, codul Morse este un exemplu de reducere a redundantei. Literele care
sunt folosite mai des au alocate secvente de cod mai scurte dect cele care sunt utilizate
mai rar. n tehnica transmiterii informatiei acest tip de codare este numit codare Huffman.

n cazul semnalului video, informatia irelevant este informatia care nu poate fi perceput de
simturile umane.

Astfel, dac tinem cont c ochiul uman contine mai putini receptori sensibili la culoare dect la lumin,
putem s renuntm la detaliile fine de culoare, ceea ce nseamn o reducere a benzii semnalului
corespunzator.
De asemenea, ochiul integreaz i liniile fine din imagine, acest fapt constituind principala cale de atac n
utilizarea metodelor de compresie n standardele JPEG i MPEG.


Reducere viteza de
transmisie

Micsorarea redundantei
(fr piederi de
informatie)

Reducerea informatiei
irelevante
(cu pierderi de informatie)

n standardul MPEG reducerea vitezei de transmisie se face n


urmtorii pasi:

Reducerea rezolutiei semnalului obtinut conform CCIR 601 de la


10 biti la 8 biti (reducerea irelevantei);
Excluderea intervalelor de stingere pe vertical si pe orizontal
(reducerea redundantei);
Reducerea rezolutiei pe vertical a semnalului de culoare
(reducerea irelevantei);
Modularea diferential n cod a impulsurilor pentru imaginile n
miscare (reducerea redundantei);
Utilizarea transformatei cosinus discrete (DCT), urmat de
cuantizare (reducerea irelevantei);
Scanare n zig-zag si codare cu lungime variabil (codare
Huffman)(reducerea redundantei);

10

Eantionarea semnalului video

Recomandarea CCIR 601 (ITU BT.R601)(ITU=International


Telecommunication Union) prevede pentru studiouri codarea pe
componente a semnalului video complex color, dup cum reiese din
figur

11

Standardul pentru studiouri trebuie s asigure, dup codare, compatibilitatea


semnalului att pentru standardul cu 625 linii/ 50Hz, ct si pentru standardul cu
525 linii/ 60Hz. Pentru a asigura aceast compatibilitate, frecventa de
esantionare trebuie s fie un multiplu ntreg al celor dou frecvente de linii.

Cum fH (625) / fH (525) = 15625/ 15734,265 = 143/ 144 rezult c frecventa de


esantionare trebuie s fie multiplu ntreg al frecventei de 2,25 MHz. Tinnd cont
de frecventa maxim a semnalului de luminant, valorile convenabile pentru
frecventa de esantionare sunt: 11,25 MHz (5x2,25); 13,5 MHz (6x2,25); 15,75
MHz (7x2,25MHz). S-a ales frecventa de esantionare de 13,5 MHz:

13,5 MHz = 858 fH (525) = 864 fH (625)

Coeficientii de multiplicare ai frecventelor de linii reprezint numrul de


esantioane ce rezult pentru o linie, n cazul semnalului de luminant.
Semnalele de crominant avnd banda mai mic sunt esantionate cu frecventa
de 6,75 MHz (3x2,25). n acest caz numrul de esantioane este la jumtate fat
de cel pentru semnalul de luminant.
Fiecrui esantion al semnalului analogic i va corespunde un pixel n formatul
digital.
Spre deosebire de televiziunea analogic, n televiziunea digital sunt transmise
numai cadre (frames) nu si semicadre (fields), acestea fiind reconstruite la
receptie.

12

Codarea MPEG. Etape n realizarea compresiei


semnalului video:
Reducerea vitezei de transmisie prin reducerea cuantizrii semnalului obtinut
conform CCIR 601 de la 10 biti la 8 biti
n

cazul semnalului video analogic, dac raportul semnal/ zgomot


ponderat, referitor la nivelul de alb ,este mai bun de 48dB (valori
normale fiind de peste 63dB) zgomotul nu este perceput de ochiul
uman.
n cazul semnalului digital, dac se realizeaz conversia analogdigital utiliznd pentru cuantizare 8 biti n loc de 10, va rezulta
creterea zgomotului de cuantizare (creterea S/N[dB] = 6xN, N=2,
deci 12dB), dar nu este depit pragul de perceptibilitate al ochiului.
Reducerea debitului de informatie n acest caz, este prezentat mai
jos:
Debit semnal luminant = 13,5 MHz x 8 (10) biti = 108 (135) Mbit/s
Debit semnale crominant = 2 x 6,75 MHz x 8 (10) biti = 108 (135)
Mbit/s
Debit total semnal video = 2 x 108 (135) Mbit/s = 216 (270) Mbit/s

Prin

cuantizarea cu 8 biti n loc de 10, s-a obtinut o reducere a


vitezei de transmisie cu 54 Mbit/s (20%).

13

Reducerea vitezei de transmisie prin excluderea intervalelor de stingere pe


vertical si pe orizontal

Potrivit

standardului ITU BT.R601 intervalele de stingere pe orizontal si pe vertical nu


contin nici o informatie relevant, nici mcar teletext.
n consecint, n MPEG intervalele de stingere pe orizontal si pe vertical sunt scoase
complet din continutul cadrului. Acestea pot fi reconstituite la receptie fr probleme
(inclusiv toate celelalte semnale continute).
n Fig.2.2 este prezentat cadrul TV cu ponderile intervalelor de stingere din totalul
imaginii.

14

n urma esantionrii rezult un numr de 864 de esantioane/ linie,


respectiv de pixeli, iar dac se renunt la intervalul de stingere pe
H obtinem 720 pixeli activi. Pentru semnalele de culoare numrul
de pixeli/ linie activ va fi de 360.
tinnd cont de ponderile celor dou intervale de stingere, prin
netransmiterea lor se realizeaz o reducere redundantei de aprox.
25%.
Reducerea vitezei de transmisie prin reducerea rezolutiei pe
vertical a semnalului de culoare

n Fig. 2.3, de mai jos, sunt reprezentate esantionarile semnalelor


de luminant si crominant pentru mai multe tipuri de semnale
MPEG:
MPEG-4:4:4;
MPEG-4:2:2 (semnal de studio conform recomandrii CCIR 601, respectiv
standardului ITU BT.R601);
MPEG-4:2:0 (semnalul utilizat pentru transmisiunile DVB).

15

Fig. 2.3
16

n cazul MPEG-2 la patru pixeli de luminant sunt asociati doi


pixeli de cominant, unul pentru Cr si unul pentru Cb.
Prin acest mod de reducere a irelevantei se realizeaz reducerea
cu 25% a debitului informatiei transmise.
Pn acum, prin pasii urmati s-au realizat urmtoarele reduceri ale
debitului de informatie:

Semnal studio (conform ITU BT.R601)


= 270 Mbit/s
Reducerea cuantizrii de la 10 la 8 biti (-20%)
= 216 Mbit/s
Excluderea intervalelor de stingere H si V (-25%)
= 166 Mbit/s
Reducerea rezolutiei pe vertical a semnalelor de culoare (-25%) = 124,5
Mbit/s

Debitul de informatie de 124,5 Mbit/s este oricum departe de


scopul propus si anume obtinerea unui debit de 2-6 Mbit/s, cu un
maxim de 15 Mbit/s. Pentru atingerea obiectivului trebuie urmati
si ceilalti pasi a cror complexitate este mult mai mare.

17

Reducerea vitezei de transmisie prin modularea diferential n cod a


impulsurilor pentru imaginile n miscare
Imaginile

n miscare (consecutive) difer ntre ele foarte putin. Ele


contin zone stationare care nu se schimb de la un cadru la altul, zone
care-si schimb doar pozitia, precum si obiecte noi care apar n imagine.
Dac am transmite fiecare cadru complet, de fiecare dat vom
transmite si informatie care se repet iar si iar, rezultnd un debit mare
de informatie. Concluzia care se desprinde de aici este c putem
micsora debitul informatiei dac vom transmite numai diferentele de la
un cadru la altul.
Aceast metod de micsorare a redudantei se numeste modularea
diferentiala a impulsurilor (DPCM = Differential Pulse Code Modulation).
n urma esantionrii si digitizrii se obtin esantioane cu valori discrete
asezate la intervale echidistante, egale cu intervalele de esantionare
(ts), dup cum se observ n Fig. 2.4.
Diferentele dintre esantioanele alturate fiind mici, dac se transmite
doar diferenta dintre ele (DPCM), se salveaz din capacitatea de
transmisie (Fig. 2.5).

18

19

O problem care apare la modularea diferential este


sincronizarea lent a demodulatorului la nceputul transmisiei, sau
desincronizarea acestuia atunci cnd apar erori de transmisie.
Pentru rezolvarea acestei situatii, se transmit esantioane
complete la intervale egale de timp (Fig. 2.6).

20

nainte ca imaginea s fie codat, aceasta este mprtit n blocuri


ptrate cu dimensiunea de:
16x16 pixeli pentru semnalul de luminant
8x8 pixeli pentru semnalele de culoare.

Pentru semnalul MPEG-2 MP@ML, esantionarea este 4:2:0 iar fiecrui


bloc de luminant 16x16 pixeli i corerespunde cte un bloc de 8x8
pixeli Cb, respectiv 8x8 pixeli Cr.

Acest tip de aranjament poart denumirea de macrobloc. Un singur


cadru este compus dintr-un numr de macroblocuri, astfel nct
numrul de pixeli pe orizontal si pe vertical s fie divizibil cu 16,
respectiv 8 (Y: 720x576 pixeli).

21

Codarea imaginii n MPEG se face utiliznd trei


algoritmi diferiti, ce se bazeaz pe utilizarea
transformatei cosinus discrete

Codarea intracadru. Aceste cadre sunt notate cu I si sunt


cadre codate complet. Cadrele de tip I sunt inserate aleator
n fluxul de date si au cea mai sczut rat de compresie;
Codarea cu predictie temporal nainte. Cadrele rezultate
sunt notate cu P. Codarea cu predictie temporal poate avea
ca referint cadre de tip I sau cadre de tip P. Aceste cadre
au raportul de compresie net superior cadrelor de tip I.
Calcularea diferentei se face la nivel de macrobloc, respectiv
fiecare macrobloc din cadrul urmtor este comparat cu
macroblocul corespunzator cadrului precedent. Din
compararea a dou macroblocuri rezult urmtoarele
situatii:
Elementele imaginii s-au deplasat ntr-o directie oarecare, ceea ce
nseamn c avem o imagine n miscare;
Elementele imaginii nu s-au deplasat;
Elementele de imagine din macrobloc sunt complet noi fat de
cele din precedentul.

22

n primul caz, diferenta care se calculeaz si se transmite se numeste


vector de miscare.
Detectarea miscrii se face ntr-o arie de 64x64 pixeli pentru un
macrobloc de 16x16 pixeli (Fig.2.8) si numai pentru semnalul de
luminant. Precizia estimrii este de 0,5 pixeli. mpreun cu vectorul
de miscare se poate transmite si informatie legat de diferent.
Pentru semnalul MPEG-2 avnd imaginea format din 720x576 pixeli
vor rezulta (720/16)x(576/16) = 1620 vectori de miscare.

23

Determinarea vectorului de miscare este ilustrat n figura de mai


jos:

24

Mai jos sunt prezentate dou cadre succesive si rezultatul comparrii lor.

25

Codarea cu predictie temporal bidirectional. Cadrele


rezultate sunt notate cu B. Predictia se face att nainte ct
si napoi, prin utilizarea a dou cadre de referint, care pot fi
de tip I sau P sau unul I si celalalt P. n acest caz se obtine
cea mai mare rat de compresie. Determinarea vectorului de
miscare este ilustrat n figura urmtoare:

26

Cadrele de tip P si/sau B cuprinse ntre dou cadre de tip I


formeaz o structur numita Group Of Pictures = GOP care
are lungimea uzual de 12 cadre.
Un cadru de tip B este cuprins ntotdeauna ntre dou cadre
de tip I sau P.
ns, la transmiterea unei structuri GOP pozitia cadrelor
poate fi schimbat din considerente de micsorare a
memoriei la receptie.
Pentru a se restabili ordinea original, numerele cadrelor
sunt codate formnd DTS (Decoding Time Stamp ;stamp
=stampila,eticheta). (Acest lucru va fi tratat mai trziu n
cadrul fluxului de date MPEG.)

27

n figura de mai jos este prezentat ordinea cadrelor I, P si B.

28

Reducerea vitezei de transmisie prin utilizarea transformatei


cosinus discrete (DCT) urmat de cuantizare
Transformata

cosinus discret (DCT = Discrete Cosine Transform) a


fost folosit cu succes nc de la sfrsitul anilor 80 la compesia
imaginilor statice n JPEG.
De asemenea, DCT este algoritmul de baz n metoda de codare
MPEG.
Dup cum am mai spus, ochiul uman percepe diferit detaliile
grosiere ale imaginii fat de detaliile fine ale acesteia, fiind mai
putin sensibil la cele din urm.
Cunoscnd acest amnunt, putem accepta un zgomot mai mare n
zona frecventelor nalte fat de zona frecventelor joase, printr-o
cuantizare mai grosier a acestor frecvente.
Rmne de rezolvat separarea frecventelor joase de cele medii si
nalte pentru a realiza cuantizarea diferit a acestora.
Aceast separare se face prin utilizarea DCT care, ca si
transformata Fourier, realizeaz trecerea din domeniul timp n
domeniul frecvent.

29

Pentru un spatiu cu dou dimensiuni NxN, DCT este definit ca


mai jos:

Unde: IDCT este transformata cosinus discret invers


x si y sunt coordonatele spatiale ale blocului cu dimensiunea NxN
u si v sunt coordonatele spatiale ale blocului coeficientilor DCT (tot cu
dimensiunea NxN)

30

Dup cum s-a precizat anterior, imaginea este mprtit n blocuri


cu dimensiunea de 8x8 pixeli, deci n acest caz N=8.
Dup esantionare, se obtine un bloc cu 8x8=64 valori ale pixelilor,
asupra crora se aplic DCT.
Va rezulta tot un bloc de 8x8 valori ale pixelilor, dar acum n
domeniul frecvent.

31

nainte de aplica DCT asupra blocului se translateaz domeniul


valorilor acestora de la 0 255 la -128 127 prin scderea cu
128.
n cadrul primului rnd, primul coeficient F(0,0) reprezint
componenta continu a ntregului bloc (DC coefficient; ceilalti
coeficienti din bloc reprezint componente alternative - AC
coefficients).
Cel de al doilea coeficient corespunde energiei frecventei celei
mai joase n directie orizontal,
Ultimul coeficient corespunde energiei frecventei celei mai nalte
n directie orizontal (respectiv celui mai fin detaliu).
Similar stau lucrurile si pentru prima coloan, coeficientii
corespunznd, n directie vertical, frecventelor de la valori joase
la valori nalte.
Pentru un bloc tipic de imagine majoritatea coeficientilor sunt zero
sau au valori apropiate de zero, pe acest lucru bazndu-se
compresia de spectru.

32

Reprezentarea grafic a coeficientilor DCT prin cele 64 de


frecvente este dat mai jos:

33

Compresia semnalelor video si audio

Urmtorul pas este cuantizarea.


Fiecare din cei 64 de coeficienti este cuantizat folosind un tabel de
cuantizare cu 64 de elemente.
Cuantizarea reduce amplitudinea coeficientilor a cror contributie
este neglijabil la calitatea imaginii, scopul fiind cresterea
numrului coeficientilor DCT egali cu zero.
Ecuatia de cuantizare este:
Fq (v,u) = [F(v,u)/Q(v,u)]

unde [ ] reprezint partea ntreag iar Q(v,u) sunt coeficientii


specificati n tabelul de cuantizare.

35

ntregul proces de aplicare a DCT si cuantizare este ilustrat n continuare:

36

n standardul MPEG sunt definite tabele de cuantizare dar, n practic,


orice codor poate s le nlocuiasc cu altele.
Avnd n vedere c acestea sunt necesare la decodare ele sunt
transmise ctre receptor mpreun cu informatia legat de imagine.
Matricea de cuantizare poate fi schimbat de la un bloc la altul pentru
a obtine o compresie maxim. n acest caz, pentru a reduce debitul de
date alocat transmiterii tabelului de cuantizare se poate transmite
doar un factor de scal. Acesta reprezint un numr cu care se
multiplic termenii din tabel fr a mai fi necesar redefinirea
ntregului tabel.
Aplicarea DCT urmat de cuantizare se face pentru fiecare bloc de 8x8
pixeli, att pentru luminant, ct si pentru semnalele de crominant.
Dup cum am mai artat, pentru esantionare tip 4:2:0, la patru
blocuri de 8x8 pixeli pentru luminant, se asociaza un bloc de 8x8
pixeli pentru Cr si un bloc de 8x8 pixeli pentru Cb, toate formnd un
macrobloc.
Acest mod de codare se aplic tuturor cadrelor de tip I.
n cazul cadrelor de tip P si B, DCT se aplic numai diferentelor (tot cu
dimensiunea de 8x8 pixeli) dintre macroblocul din cadrul precedent (si
cadrul urmtor pentru cadre B) si macroblocul cadrului curent, tinnd
cont de translatarea dat de vectorul de miscare.

37

Reducerea vitezei de transmisie prin utilizarea scanrii n zig-zag


Dup

cum se observ, n urma cuantizarii coeficientilor DCT se


obtine un numr foarte mare de valori zero.
Trebuie gasit o solutie de a ordona coeficientii DCT astfel nct s
avem o succesiune de zerouri ct mai lung, n ideea c este mult
mai simplu s transmitem, folosind coduri tip run length coding
(RLC) prin care secvente de caractere identice sunt nlocuite prin
numrul de caractere care se repet urmat de caracterul respectiv.
De exemplu informatia 10*0 este mult mai simplu de transmis,
dect 0, 0, ........0 (10 zerouri).
Solutia de ordonare este citirea n zig-zag a coeficientilor DCT, dup
cum se observ n figur:

38

n urma scanrii n zig-zag si utilizrii RLC avem:

173, 12, 2x0, -2, 0, 4, 0, -4, 6x0, -2, 13x0, -2, 34x0

Aceast metod de micsorare a redundantei, mpreun cu


utilizarea DCT si a cuantizrii, dau cea mai mare rat de compresie
a debitului informatiei.

39

Reducerea vitezei de transmisie prin utilizarea codrii Huffman

Codarea

Huffman poate fi nteleas fcnd o paralel cu codul

Morse.
n cazul n care trebuie transmise mai multe simboluri, acestora le
sunt alocate coduri care au lungimea functie de probabilitatea de
aparitie a simbolurilor.
Cu ct probabilitatea este mai mic, cu att lungimea cuvntului de
cod este mai mare.
Codarea n acest caz foloseste coduri cu lungime variabil
denumite VLC (VLC = Variable Length Coding).
Prin codarea Huffman se realizeaz, de fapt, o recodare a cuvintelor
de cod rezultate dup aplicarea DCT, scanarea n zig-zag si RLC.

40

CONCLUZII

Prin

utilizarea utilizarea metodelor de reducere a redundantei si de reducere a


irelevantei, prezentate pn acum, este posibil reducerea debitului de informatie de la
valoarea initial de 270 Mbit/s (conform ITU BT.601) la 26 Mbit/s, cu o valoare maxim
de 15 Mbit/s.
Inima realizrii acestei compresii poate fi considerat metoda codrii diferentiale a
impulsurilor cu compensarea miscrii, n combinatie cu transformata cosinus discret.
Semnalul MPEG-2 poate fi organizat pe profile (algoritm al metodelor folosite) si
niveluri (limitri ale valorilor unor parametri, cum ar fi rezolutia imaginii sau debitul de
informatie):

41

Semnalul MPEG-2 destinat transmisiilor cu utilitate public, respectiv semnal TV cu


definitie standard, are formatul 4:2:0, prezint o reducere a rezolutiei semnalului de
culoare att n directie orizontal, ct si n directie vertical si este numit Main Profile
@ MainLevel.
n figur este prezentat schema bloc a codorului MPEG:
Nota:DPCM=Differential Pulse Code Modulation

42

Compresia semnalului audio


Sistemul

de compresie audio folosit n MPEG are la baza sistemul


MUSICAM dezvoltat de CCETT, IRT (Institut fr Rundfunktechnik) si
Philips pentru DAB (Digital Audio Broadcasting).
Compresia MUSICAM se bazeaz pe principii de mascare psihoacustice (date de particularittile de percepere a suntelor de ctre
urechea uman), variind pasii de cuantizare pe benzi nguste ale
semnalului audio n functie de gradul de intensitate al acestuia.
S-a stabilit c urechea uman nu poate percepe sunetele din
vecintatea unui puls foarte puternic, practic acesta mascnd
sunetele din vecinate, ceea ce face ca acestea s nu mai fie utile,
deci nici necesare la transmisie.
La conversia analog-digital a semnalelor audio se foloseste
esantionarea cu frecventa de 32 kHz, 44,1 kHz sau 48 kHz (acum
chiar si 96 kHz).

43

Esantionarea cu 48 kHz la o rezolutie de 16 biti d un debit al


informatiei de 786 kbit/s pentru un canal, ceea ce nseamn aprox.
1,5 Mbit/s pentru un semnal stereo.

Obiectivul compresiei audio este s reducem debitul informatiei de


la 1,5Mbit/s la 100-400 kbit/s.
Evolutia metodelor de compresie a semnalului audio este
prezentat mai jos.

44

Modelul psiho-acustic al urechii umane

continuare vom arta care dintre caracteristicile psiho-acustice


ale urechii umane sunt interesante din punct de vedere al codrii
audio.
Sensibilitatea urechii este puternic dependent de frecvent.
Sunetele cu frecventa sub 20 Hz si cu frecventa de peste 20 kHz
nu sunt percepute.
Maximul sensibilitatii este situat ntre 3 si 4 kHz, iar n afara acestei
game sensibilitatea scade att ctre frecventele joase ct si spre
cele nalte.
Pragul de audibilitate este ilustrat cu ajutorul curbei FletcherMunsen:

45

Toate frecventele situate sub pragul de audibilitate nu vor fi


transmise, ele sunt irelevante pentru urechea uman.

46

O alt caracteristic a urechii ce este exploatat n procesul de codare este caracteristica de


mascare.

De exemplu, dac unei persoane i se aplic un semnal de test sinusoidal cu frecventa de 1


kHz si amplitudine constant nsotit de alte semnale cu frecvente apropiate si amplitudini
variabile se va constata c celelalte frecvente sunt percepute numai dac amplitudinile
acestora vor depasi anumite nivele, dup cum se vede n reprezentarea urmtoare.

Forma pragurilor de mascare este dependent de frecvent, frecventele nalte avnd o


form mai larg a pragurilor de mascare.

Frecventele ale cror amplitudini sunt situate sub pragurile de mascare nu vor fi transmise.

Fenomenul de mascare nu apare doar n domeniul frecvent ci si n domeniul timp.

47

Principiile de baz n codarea semnalelor audio (MPEG layer I, II)


Dup

cum am vzut n prezentarea modelului psiho-acustic al urechii umane,


datorit fenomenului de mascare, anumite semnale, cu frecvente aflate n
apropierea frecventei semnalului de mascare, nu vor fi transmise.
Se impune asadar, separarea componentelor n domeniul frecvent functie de
amplitudinea acestora.
Aceast separare este posibil prin utilizarea transformatei Fourier rapide (FFT =
Fast Fourier Transform).
Simultan

cu analizarea spectral a semnalului audio se face si o mprtire n


subbenzi a acestuia, din urmtoarele motive:
Mstile difer functie de frecvent;
Se poate ntmpla ca o subband s fie complet mascat de componentele dintr-o
alt subband;
Sensibilitatea urechii variind cu frecventa, face posibil cuantizarea cu finete
diferit, astfel nct s se mentin zgomotul sub pragul audibil;
n cadrul fiecrei subbenzi se face analiza semnalelor pentru a vedea dac acestea
nu sunt armonici ale semnalelor din benzile inferioare. Numai semnalele care nu
reprezint armonici vor fi complet suprimate dac se afla sub pragul de mascare.
Numrul

de subbenzi este 32, fiecare cu lrgime de 750 Hz.


Fiecare band este cuantizat separat.

48

Codarea pe subbenzi este prezentat n schema bloc de mai jos.

Dup cum se observ n schema bloc, fiecare subband este cuantizat separat,
iar procesul de cuantizare este controlat de blocurile FFT si modelul psihoacustic.
Pentru MPEG Layer II rezultatele FFT pentru 1024 de esantioane sunt transferate
blocului psiho-acustic la fiecare 24 ms.
Acesta ia decizii asupra finetii cuantizrii sau a necuantizrii pentru cele 32 de
subbenzi.

49

n codarea MPEG esantioanele sunt grupate n cadre


pentru fiecare subband;
Un cadru contine un anumit numr de esantioane.
Pentru Layer I un cadru este format din 12 esantioane,
Pentru Layer II un cadru este format din 3x12
esantioane.
Pentru fiecare bloc de 12 esantioane este determinat
valoarea celui mai mare esantion, care se va
considera factor de scal pentru reducerea
redundantei.
Factorul de scal este necesar la decodare si va fi
continut n fluxul elementar audio.

50

Standardul MPEG-4

Consideratii generale

Standardul

MPEG4 (ISO/IEC 14496) a fost finalizat n octombrie 1998


si a ajuns la nivelul de standard international (IS) n primele luni ale
anului 1999.
Predecesorii lui MPEG-4, MPEG 1 si MPEG 2 au fcut posibil redarea
continutului video interactiv de pe formatele CD/ DVD, sau prin
intermediul televiziunii digitale.
MPEG-4
a fost conceput lundu-se n considerare succesul
nregistrat n domeniile :
Televiziune digital
Aplicatii grafice interactive (continut sintetic- generat pe calculator)
Continut multimedia interactiv (pe Internet, distribuirea si accesul la continut)

MPEG-4

pune la dispozitie elementele tehnologice standardizate


necesare producerii, distribuirii si accesului la continut n aceste trei
domenii.
Standardul MPEG-4 ofer un set de tehnologii pentru a satisface
nevoile autorilor, provider-ilor de servicii de retea si a utilizatorilor de
finali (end users).

51

Pentru autori, MPEG-4 permite producerea de coninut multimedia care poate fi


refolosit mult mai usor, are o flexibilitate mai mare dect s-a oferit pn acum prin
intermediul unor tehnologii individuale cum ar fi televiziunea digital, grafica
animat, paginile de internet i extensiile acestora.
Prin facilitile oferite este mai usoar protejarea drepturilor de autor asupra
coninutului.
Pentru provider-ii de servicii de reea, standardul ofer informatie sub o form
transparent, care poate fi tradus si interpretat n mesaje specifice diferitelor
retele, pentru a asigura un transport optimizat n retea.
Pentru utilizatorii de rnd, MPEG-4 aduce un nivel mai ridicat de interactiune cu
continutul media, n limitele stabilite de autor.
Redarea continutului este posibil n cadrul unei game largi de retele, inclusiv n cele
cu o rat de transfer mai scazut, chiar si n cele mobile.
MPEG-4 realizeaz obiectivele descrise mai sus prin modalitti standardizate de a:

reprezenta unittile de continut de natur video, audio sau audio- vizual, denumite obiecte media.
Obiectele media pot fi de origine natural (nregistrate cu ajutorul unei camere sau a unui microfon), sau
sintetic (generate prin intermediul calculatorului)
descrie compozitia acestor obiecte, pentru a genera obiecte media compuse care vor forma scene audiovizuale.
multiplexa si sincroniza datele asociate obiectelor media, n vederea transportului n cadrul unei retele.
interactiona cu scena audio-vizual generat la receptor.

Standardul MPEG-4 contine 10 prti, sectiuni care contin specificatii, unelte, limbaje
de codare, algoritmi de compresie a sunetului si a imaginii, algoritmi de testare,
proceduri de transport si gestionare n cadrul retelelor etc.
Fiecare din aceste prti este definit prin indicativul ISO/IEC 14496 1..10.
Ultima parte elaborat o constituie standardul ITU-T H.264 sau AVC (Advanced Video
Coding).

52

Standardul ITU-T H.264/AVC sau MPEG-4 part 10


H.264,

MPEG-4 Part 10, sau AVC (de la Codare Video Avansat), este un
standard de codare video digital, care se remarc printr-o rat de compresie
ridicat.
A fost scris de ctre Video Coding Experts Group (VCEG) de la
ITU(International Telecommunication Union), mpreun cu Moving
Picture Experts Group (MPEG) de la ISO/IEC, ca produs colectiv al
parteneriatului cunoscut sub numele de Joint Video Team (JVT).
Standardul ITU-T H.264 si standardul ISO/IEC MPEG-4 Part 10 (fostul, ISO/IEC
14496-10) sunt identice din punct de vedere tehnic.
Documentul final pentru prima versiune a standardului a fost finalizat n mai
2003.

53

H.264 este numele corespunztor linei de standarde video H.26x a


ITU-T,
AVC se nrudeste cu partea MPEG a colaborrarii care a definitivat
standardul, si asta dup ce eforturile initiale din ITU-T denumeau
standardul H.26L.
De obicei, standardul este numit H.264/AVC (sau AVC/H.264 sau
H.264/MPEG-4 AVC sau MPEG-4/H.264 AVC), pentru a sublinia
mostenirea comun.
Numele H.26L, care face referint la istoria ITU-T, este mult mai
putin cunoscut, dar se foloseste totusi.
Ocazional, el mai este numit si "codecul JVT", evocnd organzatia
JVT care l-a dezvoltat.
Acest parteneriat si multiplele denumiri nu sunt un lucru nou,
pentru c si codecul video cunoscut sub numele de MPEG-2 a
aprut de asemenea din parteneriatul dintre MPEG si ITU-T, iar
codecul video MPEG-2 este cunoscut n comunitatea ITU-T drept
H.262.

54

Scopul proiectului H.264/AVC a fost acela de a crea un standard care s asigure


o bun calitate a imaginii n conditiile unor rate de codare a informatiei net
inferioare (ex: jumtate sau chiar mai putin) fat de ceea ce necesitau
standardele anterioare (ex: fat de MPEG-2, H.263, sau MPEG-4 Part 2), si asta
fr s mreasc prea mult complexitatea implementrilor care ar fi dus la
preturi ridicate pentru scopuri practice.
Un scop adiacent a fost acela de a asigura un mecanism flexibil care s permit
standardului s fie utilizat pentru o gam larg de aplicatii (pentru transmisii cu
rate de transfer att reduse ct si nalte, pentru rezolutii video nalte sau joase)
si de a functiona bine cu o plaj ct mai larg de retele si sisteme (ex:
transmisii broadcast, stocri pe suport DVD, retele cu comutare RTP/IP, si
sisteme telefonice multimedia ITU-T).
JVT a ncheiat recent munca de dezvoltare a unor extensii fat de standardul
original, cunoscute sub numele de Fidelity Range Extensions (FRExt).
Aceste extensii au menirea de a suporta codarea video la o rezolutie si mai
nalt, prin mrirea acuratetei esantionrii (incluznd codarea pe 10 biti si cea
pe 12 biti) si redarea informatiei de culoare la o rezolutie si mai nalt
(incluznd structuri de codare cunoscute drept YUV 4:2:2 si YUV 4:4:4).
Mai multe caracteristici noi au fost de asemenea introduse n proiectul Fidelity
Range Extensions (precum codare eficient fr pierderi ntre imagini, suport
pentru spatii de culori aditionale, si o transformat de culoare rezidual).
Munca de proiectare pentru Fidelity Range Extensions FRExt - a fost ncheiat
n iulie 2004, iar documentul a fost finalizat n septembrie 2004.

55

Schema bloc a codorului H264-AVC

Dup cum s-a mai spus, scopul principal al standardului


H.264/AVC este de a furniza o calitate video mai mare n
comparatie cu celelalte standarde de codare video.

56

Cu toate acestea, abordarea de baz a standardului H.264/AVC


este similar cu cu cea a standardelor precedente MPEG-2 si
MPEG-4 partea a 2-a si const n urmtoarele etape principale:
mprtirea fiecrui cadru video n blocuri de pixeli;
exploatarea redundantei spatiale existente n interiorul cadrului video,
prin codarea blocurilor originale, la care se adaug predictia spatial,
aplicarea transformatei cosinus discrete, cuantizarea si codarea
entropiei (diferentelor);
exploatarea dependentei spatiale ce exist ntre blocuri ce apartin
cadrelor succesive, ceea
ce face necesar transmiterea doar a
diferentei existente ntre acestea, utiliznd estimarea miscrii
(deplasrii) si compensarea;
exploatarea redundantei diferentelor dintre blocurile ce apartin cadrelor
succesive.

Pentru a realiza o compresie cu eficient si mai mare fat de


MPEG-4, n standardul H.264/AVC tipul de codare n interiorul unui
cadru poate s difere de la o fsie (slice) la alta.

57

Codarea intracadru I
Aceste cadre sunt codate complet (poate fi reconstituit complet
fr a avea la dispozitie informatii din alte cadre),
Spre deosebire de compresia MPEG-2, n cazul H.264/AVC este
exploatat redundanta spatial din cadrul procesat, ceea ce duce la
cresterea eficientei codrii.
Codarea cu predictie intracadru pentru luminant
Ca si la MPEG-2, pentru luminant, imaginea este mprtit n
macroblocuri de 16x16 pixeli, dar se codeaz ca atare numai pentru
portiuni ale acesteia cu putine detalii.
Pentru portiunile cu multe detalii, macroblocul este mprtit n
blocuri de 4x4 pixeli.
O astfel de mprtire este necesar pentru a putea utiliza codarea
cu predictie folosind informatia de la blocurile adiacente deja
codate.

58

Fie imaginea de mai jos si reprezentearea unui macrobloc al


acesteia:

59

Pentru codarea cu predictie a blocurilor de 4x4 pixeli se folosesc


nou moduri, binenteles dac toti pixelii necesari (esantioanele)
codati anterior si reconstruiti (A-M) sunt disponibili (exceptie fac
E,F,G,H care, dac lipsesc, sunt nlocuiti cu valoarea lui D):

60

61

Modul 0 este modul de predictie vertical,


Modul 1 este modul de predictie orizontal,
Modul 2 este modul de predictie DC (componenta continu) ce
reprezint media valorilor codate ale pixelilor codati anterior si alturati
blocului pe orizontal si pe vertical, mai putin M,
Modurile 3-7 sunt moduri de predictie directionale.

Dac este folosit modul 1 de predictie orizontal, atunci blocul prezis va


avea valoarea pixelilor a,b,c,d egal cu valoarea lui I, valoarea pixelilor
e, f, g, h va fi egal cu valoarea lui J , s.a.m.d. . nainte de codare,
trebuie s se obtin valorile reziduale (numai acestea vor fi transmise);
adic, din valoarea pixelilor a, b, c, d se va scdea valoarea lui I r, din
valoarea pixelilor e, f, g, h se va scadea valoarea lui Jr, etc.
Daca este folosit modul 0 de predictie vertical, atunci valoarea pixelilor
a, e, i, m va fi egal cu valoarea lui A, valoarea pixelilor b, f, j, n va fi
egal cu valoarea lui B, etc. Se calculeaz apoi valorile reziduale.
n urma predictiei se obtin valori reziduale (diferente) si numai acestea
sunt codate.

62

Mai jos sunt reprezentate rezultatele celor nou moduri de predictie (0-8), mpreun
cu valoarea sumei absolute a erorilor, SAE (Sum of Absolute Errors) pentru fiecare
mod.

Cea mai mic eroare pentru acest caz


este nregistrat pentru modul 7
(vertical stnga).

63

Pentru portiunile de imagine n care sunt prezente putine detalii se


codeaz cu predictie ntreg macroblocul de 16x16 pixeli, n acest
caz fiind folosite doar patru moduri de predictie:
Modul 0 este modul de predictie vertical,
Modul 1 este modul de predictie orizontal,
Modul 2 este modul de predictie DC (componenta continu) ce
reprezint media valorilor codate ale pixelilor codati anterior si alturati
macroblocului blocului pe orizontal si pe vertical,
Modul 3 este modul plan, adecvat variatiilor line de luminant.

64

Mai jos este prezentat codarea cu predictie a macroblocului


propus de exemplu:

65

Rezultatul celor patru moduri de predictie

66

Codarea cu predictie intracadru pentru crominant


Fiecare bloc de 8x8 pixeli corespunztor pentru cele dou
componente ale crominantei se codeaz cu predictie, ca si n cazul
luminantei, folosind ca referint valorile pixelilor din stnga si de
deasupra blocului.
Sunt disponibile patru moduri de predictie (similare celor pentru
macroblocul de luminant):

Modul
Modul
Modul
Modul

0
1
2
3

este
este
este
este

modul
modul
modul
modul

DC,
orizontal,
vertical,
plan.

Cele

dou blocuri de crominant 8x8 corespunztoare aceluiasi


macrobloc 16x16 de luminant se codeaz folosind acelasi mod de
predictie.
Pentru o decodare corect este necesar ca encoderul sa transmit
si o informatie legat de modul de predictie utilizat, dar aceasta ar
insemna un numr mare de biti necesari a fi transmisi pentru toate
blocurile de 4x4 pixeli.

67

Totusi trebuie s se tin seama c aceste blocuri de 4x4 pixeli sunt


strns corelate.
De exemblu probabilitatea ca modul de predictie pentru blocul
curent (C) sa fie acelasi ca la blocurile anterioare din stnga (B) si
de deasupra (A) duce la posilbilitatea ca s se lase decizia
decodorului s fac alegerea privind modul respectiv, prin
calcularea celui mai posibil mod de predictie pentru blocul curent
C.

Dac toate blocurile din exemplu sunt parte din aceiasi fsie de
imagine (slice), cel mai probabil mod de predictie pentru C l
reprezint minimul dintre modurile pentru A si B.
Dac nu se afl n aceiasi fsie, atunci cel mai probabil mod este
modul 0 (DC) de predictie.

68

Pentru reducerea numrului de biti transmisi, codorul transmite un


indicator (flag), corespunztor utilizrii modului cel mai probabil
(use most probable mode).
Dac acesta este 1, atunci se utilizeaz modul cel mai
probabil
Dac este 0, atunci este transmis un alt parametru, denumit
remaining_mode_selector.
Dac acesta are valoarea mai mic dect
use_most_probable_mode, atunci modul de predictie este setat pe
remaining_mode_selector, dac nu este setat modul cu valoare
use_most_probable_mode+1.
n acest fel, remaining_mode_selector are doar 8 valori (0-7),
pentru a selecta una din cele 9 valori corespunztoare modului de
predictie (0-8).

69

Codarea intercadre cu predictie P

Codarea

cu predictie intercadre profit de redundanta temporal ce exist


ntre cadre succesive, prin utilizarea estimrii si compensrii miscrii
diferitelor elemente ce compun imaginea.
Procesul de gsire a predictiei cea mai apropiat de realitate se numeste
estimarea miscrii, iar extragerea rezultatului predictiei din macroblocul
curent se numeste compensarea miscrii.
Codarea cu predictie intercadre creaz un model de predictie plecnd de la
unul sau mai multe cadre anterioare, codate deja.
Pentru compensarea miscrii, standardul AVC permite, n cazul semnalului
de luminant, utilizarea macroblocurilor de 16x16 pixeli dar si a blocurilor
mai mici, mergnd pn la 4x4 pixeli.
Macroblocul poate fi mprtit n diviziuni, sau partitii, de 8x16, 16x8 si 8x8
pixeli, ca mai jos:

70

Dac si numai dac macroblocul este mprtit n partitii de 8x8 pixeli, el


poate fi mprtit mai departe n subpartitii de 4x8, 8x4 si 4x4 pixeli.

Functie de caracteristicile imaginii, cu detalii fine sau portiuni uniforme, se


pot alege dimensiuni diferite ale blocurilor.
Pentru fiecare bloc este necesar s se calculeze un vector de miscare.
Cu ct dimensiunile blocurilor vor fi mai mici, cu att va fi mai mare
numrul de biti transmisi, dar va creste acuratetea imaginii.

n cazul semnalului de crominant, rezolutia fiind la jumtate fat de


luminant, diviziunile blocurilor (exceptnd cazul egalittii numrului de
pixeli de pe orizontal cu cei de pe vertical) vor avea dimensiunea de
4x8, 8x4, 4x2, 2x4 si 2x2.

71

n imaginea de mai jos este prezentat un cadru cu valorile reziduale, dar fr compensarea
miscrii.
Suprapus peste imagine se observ un caroiaj, care reprezint rezultatul deciziei codorului
n stabilirea dimensiunii blocurilor n scopul obtinerii unor valori reziduale si vectori de
miscare cu valori minime.

Pentru semnalul de luminant rezolutia cu care se poate face predictia miscrii este de un
sfert de pixel (fat de o jumatate de pixel la MPEG-2).
Cum n imaginea de referint nu exist valori ale esantioanelor la nivel de subpixel, pentru a
putea realiza rezolutia respectiv pentru vectorul de miscare se vor interpola valorile
esantioanelor alturate.
Compensnd miscarea la nivel de sub-pixel, se realizeaz o mai bun compresie, dar cu
pretul cresterii complexittii encoderului.

72

Mai jos este prezentat un exemplu de predictie la nivel de ntreg de pixel,


respectiv subpixel.

Aceast acuretete a predictiei deplasrii blocurilor se traduce ns printr-un


numr destul de mare de biti necesari pentru transmiterea vectorilor de
miscare. Este deci necesar reducerea acestora.
n acest scop s-a plecat de la faptul c partitiile nvecinate sunt strns
corelate, deci, ca si n cazul predictiei intracadru, vectorii de miscare pot fi
prezisi din vectorii corespunztori partitiilor nvecinate, care au fost codati
deja. Din valoarea predictiei se scade valoarea vectorului curent, iar
diferenta este codat si transmis.
Valoarea predictiei este calculat ca media vectorilor de miscare din
partitiile sau subpartitiile macroblocului situate imediat deasupra, n
diagonala de sus ctre dreapta sau imediat n stnga partitiei sau
subpartitiei curente.

73

Codarea intercadre cu predictie B


n cazul predictiei bidirectionale avem doi vectori de miscare,
reprezentnd estimrile fat de imaginile de referint situate
nainte, respectiv dup, imaginea curent.
Spre deosebire de MPEG-2, se pot utiliza ca referint si cte dou
cadre transmise nainte sau cte dou cadre transmise dup
imaginea de referint, asa cum se vede n figura urmtoare.

74

Codarea cu predictie bidirectional permite si un mod special


modul direct.
n acest caz vectorii de miscare pentru un macrobloc nu sunt
transmisi n mod explicit, iar encoderul trebuie s introduc n
header-ul fsiei informatia c predictia este bidirectional n
modul direct.
n acest caz decodorul va calcula vectorul de miscare din cel
corespunztor macroblocului cu aceeasi pozitie n cadrul de
referint, aplicndu-i un factor de scar, sau va fi dedus din
vectorii de miscare corespunztori regiunilor nvecinate.
n cazul codrii cu predictie bidirectional se pot pondera diferit
cele dou contributii, n special cnd se schimb scenele video,
realizndu-se o ntreptrundere flexibil ntre acestea.

75

Codare cu predictie SP si SI
Aceste

tipuri de codri sunt caracteristice modului extins.


Sunt utilizate n situatiile cnd n paralel sunt transmise dou stream-uri
corespunztoare aceluiasi program, de exemplu unul cu un data rate
mare, iar cellalt mai mic:
Data rate-ul mare corespunde unei bune calitti, dar necesit si un
mediu de transmisie adecvat.
Cnd mediul de transmisie se deterioreaz este necesar comutarea
ntre cele dou stream-uri.
Pentru ca aceast comutare s se faca fr discontinuitti, este
necesar inserarea la intervale regulate (n locatii de comutare numite
switching points) cadre sau fsii codate intracadru I SI pentru ca
orice cadru codat cu predictie din stream-ul pe care se face comutarea
s poat fi decodat.
ns inserarea de cadre sau fsii tip I determin o crestere brusc a
data rate-ului. De aceea inserarea lor este fcut doar cnd se trece la
un cadru/secvent cu totul nou si nu mai putem beneficia de avantajele
predictiei intercadru.
n celelalte cazuri se insereaza n punctele de comutare cadre/fsii
codate cu predictie de tip
P SP.

76

Filtru antiblocare

Tot n cadrul sectiunii de codare cu predictie a codorului H.264/AVC


se afl si filtrul adaptiv antiblocare (De-blocking Loop Filter)
Acesta actioneaz asupra marginilor orizontale si verticale ale
blocurilor n scopul eliminarii artefactelor.
Filtrul antiblocare este situat dup transformata invers.
Procesul de filtrare n sine este complex si optional pentru fiecare
fsie a imaginii,
Pe lng o mbunttire a calittii imaginii realizeaz si o reducere
a bit-rate-ului.

77

Transformare si cuantizare

Ca

si n cazul MPEG-2, este necesar separarea componentelor


spectrale pentru a putea realiza o compresie diferit a acestora.
Spre deosebire de MPEG-2, H.264/AVC nu aplic transformata
blocurilor de 8x8, ci unor blocuri mai mici dup cum urmeaz:
transformata Hadamard este aplicat componentei continue-DC pentru
luminant
din
sub-blocurile
de
4x4
pixeli
corespunztoare
macroblocurilor codate cu predictie 16x16;
transformata Hadamard este aplicat componentei continue-DC pentru
crominant din sub-blocurile de 4x4 pixeli;
transformata integral bazat pe transformata cosinus discret DCT
este aplicat celorlalte valori reziduale din blocurile de 4x4 pixeli.
Dup

transformare, fiecrui rezultat i se aplic cuantizarea n


scopul reducerii valorilor si mririi numrului de zerouri.
Functie de pozitia sa n cadrul blocului, fiecrui element i se aplic
un alt factor de cuantizare care poate avea 52 de valori.

78

Fie Yij (i,j=0-4) valoarea obtinut n urma transformarii integrale si


Qstep mrimea pasului factorului de cuantizare. Dup cuantizare
vom avea:
Zij=valoarea rotunjita(Yij/ Qstep)

Qstep depinde de un parametru, numit parametru de cuantizare QP


(Quantisation Parameter):

Valorile pentru QP pot s difere pentru luminant si crominant.


Fidelitatea semnalelor de crominant poate fi sporit prin
utilizarea unor pasi mai fini dect n cazul luminantei, n special
cnd luminanta este cuantizat mai grosier.
Pentru a fi transmise valorile obtinute este necesar scanarea lor.

79

Scanare
Scanarea

valorilor coeficientilor din blocul de 4x4 se face, ca si n


cazul transmiterii cadrelor din MPEG-2, n zig-zag, dup modelul
urmtor:

scopul gruprii zerourilor n siruri ct mai lungi.


Valoarea din pozitia de start corespunde valorii componentei
continue.

80

n cazul n care imaginea este transmis intretesut, acest lucru se


va specifica n header-ul fiecrei fsii.
Semnalul de luminant va fi procesat n acest caz n perechi de
macroblocuri cu ltimea de 16 pixeli si nltimea de 32 de pixeli.
Codorul va face alegerea cum trateaz n cadrul fsiei de imagine
perechea respectiv, alegnd optimul pentru fiecare regiune a
imaginii:
dou macroblocuri de cadru;
dou macroblocuri de cmp (semicadru).

81

n acest caz modelul de scanare nu mai este n zig-zag, ci ca mai


jos:

82

Codarea entropiei
Dup

realizarea proceselor de predictie, de transformare si


cuantizare si de determinare a vectorilor de miscare, se obtine o
cantitate relativ mare de informatie, respectiv un data rate mare,
care ar trebui redus ca debit.
Dup cum s-a vazut n cazul MPEG-2, sunt utilizate coduri cu
lungimi variabile, tabelele utilizate pentru acestea depinznd de
tipul datelor respective, adic vectori de miscare, rezultatul
transformrilor si cuantizrilor.
n cazul H.264/AVC este utilizat un singur tabel universal pentru
codul cu lungime variabil UVLC (Universal Variable Length Coding)
pentru toate simbolurile, mai putin pentru rezultatul (coeficientii)
transformrilor.
n ciuda simplittii sale, aceast codare are dezavantajul c nu
poate s profite de corelatia dintre diferite simboluri.

83

Pentru codarea coeficientilor transformrilor se utilizeaz codarea


adaptiv CAVLC (Context Adaptive Variable Length Coding) sau
CABAC (Context Adaptive Binary Arithmetic Coding).
CAVLC este creat n scopul utilizrii ctorva caracteristici ale
blocurilor 4x4 cuantizate:
dup transformare si cuantizare blocurile contin n cea mai mare parte zerouri.
CAVLC utilizeaza RLC-uri (Run Level Coding) pentru a reprezenta sirurile
compacte de zerouri;
nainte de zerouri, cei mai desi coeficienti ntlniti sunt 1.
CAVLC codific numrul de astfel de coeficienti n mod compact (trailing 1s).
Semnul este codat printr-un singur bit (0= +; 1= -);
sunt corelate numerele de coeficienti non-zero din blocurile nvecinate.

Tabelul utilizat la codarea coeficientilor non-zero este ales n


functie de numrul de coeficienti non-zero din blocurile nvecinate
si de valoarea (mrimea) acestora.

84

Parametri care trebuie codati sunt dati n tabelul de mai jos:


Parametru
Descrierea parametrului
Secvent, imagine, elemente de Header-e si parametri
sintax ale fsiilor
Tipul macroblocului
Metoda de predictie utilizat
pentru fiecare macrobloc
Structura blocurilor codate
Sunt indicate care blocuri
din
macrobloc
contin
coeficienti codati
Parametrul de cuantizare (QP)
Este transmis doar
diferenta fat de valoarea
anterioara a lui QP
Indexul cadrului de referint
Identific ce cadru este
utilizat ca referint pentru
interpredictie
Vector de miscare
Este transmis diferenta fat
de vectorul de miscare
prezis
Datele reziduale
Diferentele dintre valorile
curente si cele prezise
pentru fiecare bloc de 4x4
(pentru luminant) si 2x2
(pentru crominant)
85

Profile si niveluri pentru standardul H.264/AVC


H.264/AVC

contine un set bogat de instrumente de codare, dar nu


toate sunt necesare n orice aplicatie.
Pentru a nu complica inutil fiecare encoder, respectiv decoder, s-au
definit profilele ca fiind subseturi de instrumente de codare.
H.264/AVC are trei profile definite:
- Profil de baz - Baseline (BP);

- Profil principal Main (MP);


- Profil extins Extended (XP).
Profilul

de baz este utilizat de regul pentru aplicatii gen


videoconferint, unde este necesar s se efectueze codarea n timp
real
Profilul principal este utilizat n broadcasting si cinema digital,
Profilul extins pentru video streaming pe retele, de exemplu
internet.

86

87

Instrumente de mbunttire a protectiei la erori:


FMO

n mod uzual codarea macroblocurilor se face n ordinea scanrii (rastrului) imaginii.


n acest caz, dac n fluxul de date apar erori de transmisie, pot fi afectate portiuni de
imagine relativ mari, deoarece n procesul de codare ne-am bazat pe faptul c blocurile/
macroblocurile nvecinate sunt strns corelate.
Pentru a prentmpina astfel de probleme, macroblocurile codate vor fi transmise n alt
ordine dect cea natural, ordinea fiind prestabilit conform unei hrti de alocare a
macroblocurilor ce compun o fsie.
Astfel, n cazul aparitiei unei perturbatii, macroblocurile afectate vor fi mprstiate si nu
grupate pe cuprinsul fsiei, astfel fiind mai greu de observat.

ASO

RS

DP

= Flexible Macroblock Ordering.

= Arbitrary Slice Ordering.

Ordonarea arbitrar a fsiilor n procesul de codare face ca decodorul s nu astepte ca


toate fsiile ce compun imaginea s soseasc si s fie aranjate corespunztor, ceea ce
duce la o latent mic n procesul de decodare, foarte util comunicatiile video n timp
real.

= Redundant Slices.
Se permite transmitera unor duplicate ale fsiilor n cazul retelelor predispuse la
transmisia cu erori, crescnd astfel probabilitatea transmiterii unei fsii practic fr erori.

= Data Partitioning.
Datele corespunztoare unei fsii codate sunt mprtite n dou sectiuni decodabile
potrivit importantei lor n acuratetea imaginii reconstruite.

88

Din punct de vedere al nivelelor (valori limit ca dimensiunea imaginii si frecventa cadrelor),
H.264/AVC are definite 16 nivele.

89

Din punct de vedere al data rate-ului, prima variant a standardului H.264/AVC permite, pentru
aceeasi calitate a imaginii, o njumttire a acestuia fat de standardul MPEG-2.

Varianta mai nou acestuia, H.264/ AVC High Profile (FRExt=Fidelity Range Extension) permite
reducerea la o treime a data rate-ului fat de standardul MPEG-2.

90

Fluxul de date MPEG

n urma compresiei (codrii) semnalelor


video si audio se obtin fluxurile
elementare ES (Elementary Streams).

Acestea sunt divizate n pachete cu


lungimi variabile numite pachete de
fluxuri elementare PES (Packetized
Elementary Streams).

91

Fluxul elementar (ES) Video

Dup cum s-a vzut la compresia semnalelor video, imaginea este


format din blocuri cu dimensiunea de 8x8 pixeli, iar pentru
semnalul MPEG-2 patru blocuri de 8x8 pixeli Y mpreun cu un bloc
de 8x8 pixeli Cr si un bloc de 8x8 pixeli Cb alctuiesc un macrobloc.
Cum fiecare macrobloc poate avea grade diferite de cuantizare,
respectiv compresie, trebuie s se transmit si informatia legat de
factorul de scal.
Mai multe macroblocuri ce apartin aceluiasi rnd formeaz o fsie,
o felie de imagine.
Fiecare fsie debuteaz cu un header care contine informatia de
resincronizare n caz de erori la receptie. Astfel, dac decodorul
rateaz o fsie, o nlocuieste cu o fsie corespunztoare din cadrul
precedent, dup care resincronizeaz la fsia urmtoare.

92

Mai multe fsii de imagine formeaz un cadru, care la rndul lui are
un header unde sunt continute informatii legate de tipul cadrului
respectiv (I, P sau B) si de timp pentru a se reconstitui la decodare
ordinea original a cadrelor tinnd cont de modul de predictie.

93

Mai multe cadre, de regul 12, produc un GOP (Group Of Pictures)


care si el debuteaz cu un header.
Un decoder MPEG se va cala pe semnal si va ncepe s reproduc
imaginea numai dup ce va receptiona startul unui GOP, adic
primul cadru tip I.
Unul sau mai multe GOP sunt asociate ntr-o secvent care si ea
va debuta cu un header, care contine n principal matricea de
cuantizare.
Structura fluxului elementar video este dat mai jos.

94

Fluxul elementar (ES) Audio


Ca

si n cazul fluxului elementar video, informatia audio este


precedat de un header care contine informatii legate de:

Sincronizare
Tipul layer-lui
Frecventa de esantionare
Modul audio: mono, stereo, joint stereo, dou canale independente
Preaccentuare

Header-ul

este urmat de factorul de scal (este necesar a fi


transmis datorit reducerii redundantei prin ponderarea
celorlalte valori ale esantioanelor).
Dup cum am vzut la compresia semnalului audio,
informatia legat de acesta este reprezentat

pentru Layer I de 384 de esantioane grupate cte 12 esantioane /


subband x 32 subbenzi
si
pentru Layer II de1152 de esantioane grupate cte 12 esantioane x
3 grupe/ subband x 32 subbenzi.

95

Pachete elementare ale fluxului de date

Toate fluxurile elementare n MPEG sunt mai nti mpachetate n pachete cu


lungimi variabile numite pachete de fluxuri elementare PES (Packetized
Elementary Streams).
Acestor pachete elementare, care au initial dimensiunea maxim de 64 kbytes
(cu exceptia PES video) li se adaug un header(=antet), structura acestuia fiind
urmtoarea:
header cu dimensiunea minima de 6 bytes:
Primii 3 bytes ai header-ului reprezint informatia de start start code prefix si au ntotdeauna
acelasi continut 00 00 01;
Urmtorul byte ce urmeaz startului este byte de identificare al informatiei continute de
fluxul de date stream ID si anume dac este flux de informatie video, audio sau alte date
auxiliare;
Urmtorii 2 bytes dau informatie despre lungimea pachetului (packet length).

header optional (optional PES header) ce este transmis ca o extensie a header-lui


PES si este adaptat cerintelor fluxului elementar ce urmeaz a fi transmis.
Acesta contine, pe lng alte informatii, 11 biti indicatori de stare (flags) care ne arat ce
cmpuri optionale sunt prezente, ca de exemplu PTS (Presentation Time Stamps) si DTS
(Decoding Time Stamps) care sunt importante pentru sincronizarea datelor audio si video la
receptie.

Headerele preced fluxurile elementare video si audio (payload part).

96

Structura unui pachet elementar, pe componente este dat n


figurile urmatoare:

97

98

Semnificatiile cmpurilor optionale sunt urmtoarele:

PTS = Presentation Time Stamp contine cei mai semnificativi 33 de


biti din 42 totali ai STC (System Time Clock = provine din dublul
frecventei de esantionare a semnalului de luminant 13,5 MHz si
este utilizat ca frecvent de referint pentru toti pasii de codare).
Este transmis receptorului la fiecare 700 ms fiind necesar
sincronizrii imaginii cu sunetul.
DTS = Decoding Time Stamps. n scopul salvrii spatiului de
memorare la decodor cadrele I, P sau I,P,B nu sunt transmise n
ordinea natural, ordine care trebuie reconstituit la receptie pe baza
informatiei DTS.
ESCR = Elementary Stream Clock Reference - semnalul de referint de
27 MHz (vezi PTS).
ES rate = rata fluxului elementar.
DSM = Digital Storage Medium informatie necesar pentru controlul
dispozitivelor de nregistrare.
Copy info informatie despre materialul transmis dac este original
sau copie.
PES CRC; CRC = Cyclic Redundancy Check bit de control al erorilor.
Se poate verifica (prin suma de control) dac transmisia a fost
afectat de erori.

99

Transport Stream Packet

PES reprezint pachete cu structura relativ lung,


ceea ce le face inadecvate transmiterii mai multor
programe multiplexate ntr-un singur flux de date.
Pentru a rezolva aceast problem, n standardul
MPEG, se utilizeaz divizarea pachetelor PES n
pachete mai mici de dimensiuni fixe de 184 bytes.
Acestor pachete de 184 bytes li se adaug un
header de 4 bytes rezultnd pachete cu lungimea
de 188 bytes Transport Stream Packets, pe scurt
TSP.
Pachetele TSP sunt multiplexate, mai inti n
cadrul fiecarui program, iar apoi pentru mai multe
programe, formnd n final un flux de date MPEG-2
numit Transport Stream, pe scurt TS.

10
0

Structura unui pachet MPEG-2 TS este dat mai jos.

Header-ul TSP debuteaz cu un byte de sincronizare al pachetului, care are tot timpul
aceeasi valoare, si anume 47Hex.
Potrivit MPEG decodorul se sincronizeaz dupa ce s-au receptionat 5 TSP.
O alt component important este informatia legat de identificarea pachetului,
format din 13 biti, notat pe scurt PID (PID = Packet Identifier). PID descrie
continutul payload precum si locul n cadrul PES.
Dup byte-ul de sincro urmeaz un bit de eroare, care indic dac transmisia s-a
fcut eronat sau nu. Acest bit este setat la receptie, iar n cazul n care erorile nu pot
fi corectate, informatia continut n TSP-ul respectiv nu mai este decodat.

10
1

n DVB protectia primar la erori se face utiliznd codul corector


de erori Reed Solomon.
ntr-unul din primele etaje ale modulatorului (orice variant DVB-T,
DVB-C sau DVB-S) celor 188 bytes ai TSP li se adaug nc 16
bytes necesari corectiei erorilor.
Acestia pot s corecteze pn la 8 erori pe pachet.
n unele cazuri este necesar ca dimensiunea header-ului s fie mai
mare de 4 bytes.
Cum dimensiunea de 188 bytes nu poate fi depasit, dup header
va fi introdus un cmp optional numit cmp de adaptare.

102

Informatii necesare receptorului DVB-T

Pentru a extrage din fluxul de date


informatiile necesare decodrii unui
anumit program, receptorul are nevoie de
anumite informatii.
Pe lng acestea si utilizatorul are nevoie
de anumite informatii despre programul
respectiv, informatii care fac n acest fel
receptorul mult mai prietenos n
utilizare.

103

Informatia de sincronizare pentru TS

La aplicarea semnalului MPEG-2 la intrarea decodorului, acesta


trebuie s se sincronizeze cu fluxul de date.
n acest scop sunt cutati sincro bytes, care asa cum am aratat au
tot timpul aceeasi valoare 47Hex.
De asemenea stim c acestia se repet la intervale fixe de 188
bytes.
Dac este detectat un byte cu valoarea 47Hex, decodorul va cuta
dup 188 bytes urmtorul byte 47Hex.
Dac nu-l gaseste, nseamn c un cuvnt de cod a avut
accidental aceast valoare (ceea ce este foarte posibil) si este
cutat un alt byte cu valoarea 47Hex.
Conform standardului MPEG sincronizarea decodorului are loc dup
ce sunt receptionate 5 TPS, iar desincronizarea are loc dup
pierderea a 3 TPS.

104

Informatia despre continutul de programe al TS

TS poate s contin de la un program cu imagine si un sunet aferent


pn la 20 30 de programe sau chiar mai multe, unele doar cu
sunet, altele cu imagine + un sunet, altele cu imagine + dou sau mai
multe sunete.
Este necesar s includem n TS liste cu aceste programe, care s
informeze beneficiarul despre continutul acestuia.
Aceste liste sunt furnizate n program specific information, pe scurt
PSI.
Acestea reprezint tabele care sunt transmise ocazional n partea de
payload a TPS.
Primul tabel este tabelul asociat programelor transmise si este numit
pe scurt PAT (PAT = Program Association Table).
PAT este transmis la fiecare 0,5s si ne arat cte programe contine TS.
PAT este un TSP special care are n header PID=0 si contine n partea
de payload PID-urile altor tabele care se numesc program map
tables (PMT).
La randul lor PMT-urile sunt tot TSP speciale care contin n partea de
payload PID-urile pentru fluxurile elementare continute de programele
respective (audio, video, date).

105

n continuare este prezentat structura PAT si PMT.

106

107

Accesarea programelor

Accesarea programelor continute n cadrul unui TS se face pe baza


PID-urilor video si audio aferente acestora.
Receptoarele permit accesarea direct a programului, dac
utilizatorul cunoaste valorile PID (puse la dispozitie de furnizorul
de program),
Dac utilizatorul nu cunoaste valorile PID, receptoarele permit
scanarea TS disponibile si selectia ulterioar.

108

Informatiile de sincronizare pentru program

Odat identificate PID-urile pentru pachetele audio si video aferente unui


program, acestea sunt extrase din PES (demultiplexare) si furnizate decodorului.
Acesta, ca s-si poat ndeplini sarcinile, are nevoie de anumite informatii
pentru sincronizare.

Primul pas n acest sens este sincronizarea ceasului receptorului cu ceasul emittorului.
Dup cum am artat n prezentarea pachetelor fluxului elementar, un semnal de 27 MHz, ce
reprezint dublul frecventei de esantionare a semnalului de luminant 13,5 MHz, este utilizat
ca frecvent de referint pentru toti pasii de codare, fiind semnal de ceas pentru System Time
Clock (STC).
STC este n esent un numrator de 42 biti ce se reseteaz dup fiecare umplere.
La receptie este necesar de asemenea un numrator de 42 biti si un oscilator de 27 MHz.
Cele dou oscilatoare de la emisie si de la receptie, precum si cele dou numratoare trebuie sa
fie n sincronism.
Acest lucru este posibil prin transmiterea informatiei de sincronizare ce se numeste Program
Clock Refence (PCR). PCR reprezint tocmai continutul numratorului la un anumit moment.
Fluxul de date transport cu sine un semnal de ceas de precizie care controleaz toate procesele
de codare/ decodare, reprezentat de PCR.
La receptie, dac ceasul receptorului nu este sincronizat cu cel de la codor, un circuit PLL
realizaz sincronismul acestuia. n paralel cu sincronizarea ceasului, continutul numrtorului
este ncrcat cu valoarea continut n PCR.
PCR este ncorporat n fluxul de date al unui program MPEG-2 sau MPEG-4 (fluxul elementar ES)
cel putin o dat la fiecare 0.7s, n MPEG-2 TS cel putin o dat la fiecare 0.1s, iar n DVB TS cel
putin o dat la fiecare 40ms.

109

Dup cum am vzut la structura PES, n fluxul elementar sunt


incluse nc dou informatii de timp necesare pentru sincronizarea
decodorului:
PTS = Presentation Time Stamp contine cei mai semnificativi 33
de biti din 42 totali ai STC, informatie ce este necesar
sincronizrii imaginii cu sunetul si
DTS = Decoding Time Stamps, ce este necesar refacerii ordinii
naturale, la decodor, a cadrelor I, P sau I,P,B.

110

Informatii suplimentare continute n Transport Stream

n scopul usurrii utilizrii receptoarelor digitale, n cadrul TS sunt introduse


tabele particulare care formeaz Service Information (SI).
DVB prevede urmtoarele tabele particulare:
NIT = Network Information Table contine informatii legate de: calea de
transmisie (satelit, cablu, terestr); numele furnizorului de programe, date ale
semnalului de RF, tipul modulatiei, protectia la erori, alti paremetri ai
transmisiei;
SDT = Service Descriptor Table contine informatii despre programele
transmise, numele acestora, PID-urile respective;
BAT = Bouquet Association Table face o trecere n revist a tuturor
programelor, grupndu-le functie de continutul informatiilor transmise: stiri,
sport muzic, etc acestea formnd asa numite buchete. Un program poate fi
regsit n mai multe buchete. Este util cnd se doreste vizionarea doar a unui
anumit tip de programe ntr-un anumit interval orar.
RST = Running Status Table este utilizat pentru controlul video recorderelor
(similar cu VPS = Video Programming System din televiziunea analogica);
TDT/TOT = Time and Date Table/ Time Offset Table sunt folosite pentru a
transmite utilizatorului (dac receptorul permite) informatii despre data si ora
curente.

111

Introducere

Din punct de vedere al modulatiei folosite, cele mai


multe sisteme de comunicatii se mpart n trei categorii :
utilizarea eficient a spectrului,
folosirea eficient a puterii si
eficienta costurilor.

n ceea ce ne priveste, interesul este orientat ctre


reducerea benzii de frecvent necesar transmiterii
semnalului.
n acest scop vom trece n revista urmtoarele tipuri de
modulatii digitale:
QPSK si
QAM (16 QAM si 64 QAM).

Componenta principal n cazul acestor tipuri de modulatii


este modulatorul n cuadratur sau modulator I/Q (I=in
phase; Q=quadrature phase).

112

Mixerul

Acesta

reprezint o parte electronic n cadrul modulatorului n


cuadratur.
n esent mixerul este un multiplicator.

La

iesirea mixerului vom avea benzile laterale modulate n


amplitudine cu purttoarea suprimat (componentele spectrale cu
frecvente mai mari decat fc+fs vor fi filtate cu un FTJ.

113

Modulatorul de amplitudine

cazul modulatiei de amplitudine informatia este


continut n amplitudinea purttoarei.
La iesirea modulatorului de amplitudine, din punct de
vedere al spectrului, vom regsi:
purttoarea mpreun cu
dou benzi laterale situate simetric fat de aceasta .
Un

mixer poate fi utilizat pentru realizarea unei


modulatii de amplitudine.
n cazul particular cnd semnalul modulator nu are
component continu, la iesire nu se vor regsi dect
benzile laterale fr frecventa purttoare.
Aceast caracteristic este util n modulatia QAM .
114

Modulatorul n cuadratur (modulator


IQ)
n

televiziunea color analogic modulatorul n cuadratur este


folosit n sistemele PAL si NTSC la transmiterea informatiei de
culoare.
Schema bloc a unui modulator n cuadratur este prezentat n
figura de mai jos:

115

Modulatorul n cuadratur contine dou mixere care primesc


semnal de la acelasi oscilator local:
mixerul I primeste semnal cu faz zero,
iar mixerul Q primeste semnal defazat cu 90.

Semnalele decalate ntre ele cu 90 sunt n cuadratur si nu se


influenteaz ntre ele, deci sunt independente.
n acest fel rezult dou ci independente I si Q pe care le
urmeaz semnalul.
Dup mixare acestea sunt nsumate.
Calea I primeste un semnal cosinusoidal, iar calea Q primeste un
semnal sinusoidal.
Un modulator IQ poate realiza:
o modulatie pur de amplitudine,
o modulatie pura de faz sau
o combinatie ntre acestea.

116

Pentru a ntelege functionarea modulatorului n cuadratur vom considera


urmtoarele cazuri particulare:

Semnalul pe calea I are valorile 1, iar pe calea Q valoarea zero.


La iesirea mixerului semnalul va arta n felul urmtor:

11
8

Semnalul pe calea Q are valorile 1, iar pe calea I valoarea zero.

La iesirea mixerului semnalul va arata n felul urmator:

119

Pe ambele ci semnalele au valorile 1.

n acest caz sunt posibile patru combinatii, numite constelatii.

Cazul particular de mai sus este cazul modulatiei QPSK (Quadrature Phase
Shift Keying), cnd este comutat numai faza semnalului, constelatiile
posibile fiind 45, 135, 225 si 315.
Cum pentru fiecare combinatie posibil sunt necesare dou valori pentru
cile I si Q, rezult c putem transmite simultan doi biti.

120

n practic, trebuie s furnizm celor dou ci I si Q datele


continute n fluxul pe care dorim s-l transmitem.
mprtirea lor se face de ctre un circuit hart (n englez
mapper), care, pe baza unui tabel furnizeaz cele dou semnale
i(t) si q(t).

121

n cazul QPSK avem data rate la iesirea modulatorului la jumtate fat de data rate a
fluxului de date de la intrare.
n consecint banda necesar transmiterii informatiei se reduce la jumatate.
Pornind de la QPSK putem s trecem la modulatii de ordin superior.
Astfel dac variem simultan faza si amplitudinea obtinem celelalte tipuri de
modulatii folosite n DVB-T: 16QAM, 64QAM.
Constelatiile pentru aceste tipuri de modulatii sunt date n figurile urmtoare:

n cazul 16QAM se pot transmite simultan patru biti iar n cazul 64QAM se pot
transmite simultan sase biti, banda necesar reducndu-se corespunztor.

122

Demodulatorul IQ

La

receptie, pentru a se putea realiza demodularea este necesar refacerea


purttoarei.
Pentru aceasta, semnalul de la intrare (semnalul modulat digital) este
multiplicat de dou ori.
n acest fel frecventa a crei valoare este egal cu de patru ori frecventa
purttoare se poate extrage folosind un filtru trece banda.
Schema bloc a demodulatorului este data n figur:

123

Mai departe, sunt ilustrate formele de unda ale semnalelor n diferite


puncte ale demodulatorului.

Se observ c semnalele demodulate i(t) si q(t) au suprapuse semnale


care au frecvent dubl fat de semnalul de baz.
Aceast situatie se rezolv prin introducerea unor filtre trece jos pn n
circuitul de-mapper.
Este foarte important ca tabelele dup care lucreaz circuitele mapper si
de-mapper s fie identice.

124

Foarte des demodularea semnalelor modulate n cuadratur este


realizat cu circuite de demodulare care se bazeaz pe
esantionarea semnalului de baz cu o frecvent de patru ori mai
mare ca cea a semnalului modulat (o perioad complet a
purttoarei este esantionat n patru puncte.
Este foarte important ca frecventa de esantionare sa fie n
sincronism cu purttoarea.
Aceast metod se numeste demodulare I/Q cu fs/4

125

S-ar putea să vă placă și