Documente Academic
Documente Profesional
Documente Cultură
Standardul MPEG-2
Compresia semnalului video
Introducere
Esantionarea semnalului video
Codarea MPEG2. Etape n realizarea compresiei semnalului video
Standardul MPEG-4
Introducere
MPEG-4 partea a 10-a sau H264
Comparatie ntre MPEG-4 si MPEG-2
Introducere
Mixer
Modulatorul de amplitudine
Modulatorul IQ
Demodulatorul IQ
Standardul MPEG-2
Semnalul digital standard (SDTV = Standard Definition Television) are viteza de transmisie de
270 Mbit/s, mult prea mare pentru a putea fi transmis pe canalele obinuite. Este necesar o
puternic compresie a acestuia, de la 270 Mbit/s la 2-6 Mbit/s, pentru aceasta utilizndu-se
mecanisme de reducere a informatiei redundante i irelevante din fluxul de date.
Informatia redundant este informatia care exist de mai multe ori n fluxul de date, sau biti
care nu contin informatie, sau informatie care poate fi reconstituit la receptie, fr pierderi,
prin procedee matematice.
O cale de reducere a redundantei este utilizarea codurilor cu lungime variabil. De exemplu, dac n fluxul
de date exist un ir de 15 zerouri, n locul acestora poate fi transmis mesajul de 15 ori zero printr-un
cod special care este mult mai scurt.
Fcnd o paralel, codul Morse este un exemplu de reducere a redundantei. Literele care
sunt folosite mai des au alocate secvente de cod mai scurte dect cele care sunt utilizate
mai rar. n tehnica transmiterii informatiei acest tip de codare este numit codare Huffman.
n cazul semnalului video, informatia irelevant este informatia care nu poate fi perceput de
simturile umane.
Astfel, dac tinem cont c ochiul uman contine mai putini receptori sensibili la culoare dect la lumin,
putem s renuntm la detaliile fine de culoare, ceea ce nseamn o reducere a benzii semnalului
corespunzator.
De asemenea, ochiul integreaz i liniile fine din imagine, acest fapt constituind principala cale de atac n
utilizarea metodelor de compresie n standardele JPEG i MPEG.
Reducere viteza de
transmisie
Micsorarea redundantei
(fr piederi de
informatie)
Reducerea informatiei
irelevante
(cu pierderi de informatie)
10
11
12
Prin
13
Potrivit
14
15
Fig. 2.3
16
17
18
19
20
21
22
23
24
Mai jos sunt prezentate dou cadre succesive si rezultatul comparrii lor.
25
26
27
28
29
30
31
32
33
35
36
37
38
173, 12, 2x0, -2, 0, 4, 0, -4, 6x0, -2, 13x0, -2, 34x0
39
Codarea
Morse.
n cazul n care trebuie transmise mai multe simboluri, acestora le
sunt alocate coduri care au lungimea functie de probabilitatea de
aparitie a simbolurilor.
Cu ct probabilitatea este mai mic, cu att lungimea cuvntului de
cod este mai mare.
Codarea n acest caz foloseste coduri cu lungime variabil
denumite VLC (VLC = Variable Length Coding).
Prin codarea Huffman se realizeaz, de fapt, o recodare a cuvintelor
de cod rezultate dup aplicarea DCT, scanarea n zig-zag si RLC.
40
CONCLUZII
Prin
41
42
43
44
45
46
Frecventele ale cror amplitudini sunt situate sub pragurile de mascare nu vor fi transmise.
47
48
Dup cum se observ n schema bloc, fiecare subband este cuantizat separat,
iar procesul de cuantizare este controlat de blocurile FFT si modelul psihoacustic.
Pentru MPEG Layer II rezultatele FFT pentru 1024 de esantioane sunt transferate
blocului psiho-acustic la fiecare 24 ms.
Acesta ia decizii asupra finetii cuantizrii sau a necuantizrii pentru cele 32 de
subbenzi.
49
50
Standardul MPEG-4
Consideratii generale
Standardul
MPEG-4
51
reprezenta unittile de continut de natur video, audio sau audio- vizual, denumite obiecte media.
Obiectele media pot fi de origine natural (nregistrate cu ajutorul unei camere sau a unui microfon), sau
sintetic (generate prin intermediul calculatorului)
descrie compozitia acestor obiecte, pentru a genera obiecte media compuse care vor forma scene audiovizuale.
multiplexa si sincroniza datele asociate obiectelor media, n vederea transportului n cadrul unei retele.
interactiona cu scena audio-vizual generat la receptor.
Standardul MPEG-4 contine 10 prti, sectiuni care contin specificatii, unelte, limbaje
de codare, algoritmi de compresie a sunetului si a imaginii, algoritmi de testare,
proceduri de transport si gestionare n cadrul retelelor etc.
Fiecare din aceste prti este definit prin indicativul ISO/IEC 14496 1..10.
Ultima parte elaborat o constituie standardul ITU-T H.264 sau AVC (Advanced Video
Coding).
52
MPEG-4 Part 10, sau AVC (de la Codare Video Avansat), este un
standard de codare video digital, care se remarc printr-o rat de compresie
ridicat.
A fost scris de ctre Video Coding Experts Group (VCEG) de la
ITU(International Telecommunication Union), mpreun cu Moving
Picture Experts Group (MPEG) de la ISO/IEC, ca produs colectiv al
parteneriatului cunoscut sub numele de Joint Video Team (JVT).
Standardul ITU-T H.264 si standardul ISO/IEC MPEG-4 Part 10 (fostul, ISO/IEC
14496-10) sunt identice din punct de vedere tehnic.
Documentul final pentru prima versiune a standardului a fost finalizat n mai
2003.
53
54
55
56
57
Codarea intracadru I
Aceste cadre sunt codate complet (poate fi reconstituit complet
fr a avea la dispozitie informatii din alte cadre),
Spre deosebire de compresia MPEG-2, n cazul H.264/AVC este
exploatat redundanta spatial din cadrul procesat, ceea ce duce la
cresterea eficientei codrii.
Codarea cu predictie intracadru pentru luminant
Ca si la MPEG-2, pentru luminant, imaginea este mprtit n
macroblocuri de 16x16 pixeli, dar se codeaz ca atare numai pentru
portiuni ale acesteia cu putine detalii.
Pentru portiunile cu multe detalii, macroblocul este mprtit n
blocuri de 4x4 pixeli.
O astfel de mprtire este necesar pentru a putea utiliza codarea
cu predictie folosind informatia de la blocurile adiacente deja
codate.
58
59
60
61
62
Mai jos sunt reprezentate rezultatele celor nou moduri de predictie (0-8), mpreun
cu valoarea sumei absolute a erorilor, SAE (Sum of Absolute Errors) pentru fiecare
mod.
63
64
65
66
Modul
Modul
Modul
Modul
0
1
2
3
este
este
este
este
modul
modul
modul
modul
DC,
orizontal,
vertical,
plan.
Cele
67
Dac toate blocurile din exemplu sunt parte din aceiasi fsie de
imagine (slice), cel mai probabil mod de predictie pentru C l
reprezint minimul dintre modurile pentru A si B.
Dac nu se afl n aceiasi fsie, atunci cel mai probabil mod este
modul 0 (DC) de predictie.
68
69
Codarea
70
71
n imaginea de mai jos este prezentat un cadru cu valorile reziduale, dar fr compensarea
miscrii.
Suprapus peste imagine se observ un caroiaj, care reprezint rezultatul deciziei codorului
n stabilirea dimensiunii blocurilor n scopul obtinerii unor valori reziduale si vectori de
miscare cu valori minime.
Pentru semnalul de luminant rezolutia cu care se poate face predictia miscrii este de un
sfert de pixel (fat de o jumatate de pixel la MPEG-2).
Cum n imaginea de referint nu exist valori ale esantioanelor la nivel de subpixel, pentru a
putea realiza rezolutia respectiv pentru vectorul de miscare se vor interpola valorile
esantioanelor alturate.
Compensnd miscarea la nivel de sub-pixel, se realizeaz o mai bun compresie, dar cu
pretul cresterii complexittii encoderului.
72
73
74
75
Codare cu predictie SP si SI
Aceste
76
Filtru antiblocare
77
Transformare si cuantizare
Ca
78
79
Scanare
Scanarea
80
81
82
Codarea entropiei
Dup
83
84
86
87
ASO
RS
DP
= Redundant Slices.
Se permite transmitera unor duplicate ale fsiilor n cazul retelelor predispuse la
transmisia cu erori, crescnd astfel probabilitatea transmiterii unei fsii practic fr erori.
= Data Partitioning.
Datele corespunztoare unei fsii codate sunt mprtite n dou sectiuni decodabile
potrivit importantei lor n acuratetea imaginii reconstruite.
88
Din punct de vedere al nivelelor (valori limit ca dimensiunea imaginii si frecventa cadrelor),
H.264/AVC are definite 16 nivele.
89
Din punct de vedere al data rate-ului, prima variant a standardului H.264/AVC permite, pentru
aceeasi calitate a imaginii, o njumttire a acestuia fat de standardul MPEG-2.
Varianta mai nou acestuia, H.264/ AVC High Profile (FRExt=Fidelity Range Extension) permite
reducerea la o treime a data rate-ului fat de standardul MPEG-2.
90
91
92
Mai multe fsii de imagine formeaz un cadru, care la rndul lui are
un header unde sunt continute informatii legate de tipul cadrului
respectiv (I, P sau B) si de timp pentru a se reconstitui la decodare
ordinea original a cadrelor tinnd cont de modul de predictie.
93
94
Sincronizare
Tipul layer-lui
Frecventa de esantionare
Modul audio: mono, stereo, joint stereo, dou canale independente
Preaccentuare
Header-ul
95
96
97
98
99
10
0
Header-ul TSP debuteaz cu un byte de sincronizare al pachetului, care are tot timpul
aceeasi valoare, si anume 47Hex.
Potrivit MPEG decodorul se sincronizeaz dupa ce s-au receptionat 5 TSP.
O alt component important este informatia legat de identificarea pachetului,
format din 13 biti, notat pe scurt PID (PID = Packet Identifier). PID descrie
continutul payload precum si locul n cadrul PES.
Dup byte-ul de sincro urmeaz un bit de eroare, care indic dac transmisia s-a
fcut eronat sau nu. Acest bit este setat la receptie, iar n cazul n care erorile nu pot
fi corectate, informatia continut n TSP-ul respectiv nu mai este decodat.
10
1
102
103
104
105
106
107
Accesarea programelor
108
Primul pas n acest sens este sincronizarea ceasului receptorului cu ceasul emittorului.
Dup cum am artat n prezentarea pachetelor fluxului elementar, un semnal de 27 MHz, ce
reprezint dublul frecventei de esantionare a semnalului de luminant 13,5 MHz, este utilizat
ca frecvent de referint pentru toti pasii de codare, fiind semnal de ceas pentru System Time
Clock (STC).
STC este n esent un numrator de 42 biti ce se reseteaz dup fiecare umplere.
La receptie este necesar de asemenea un numrator de 42 biti si un oscilator de 27 MHz.
Cele dou oscilatoare de la emisie si de la receptie, precum si cele dou numratoare trebuie sa
fie n sincronism.
Acest lucru este posibil prin transmiterea informatiei de sincronizare ce se numeste Program
Clock Refence (PCR). PCR reprezint tocmai continutul numratorului la un anumit moment.
Fluxul de date transport cu sine un semnal de ceas de precizie care controleaz toate procesele
de codare/ decodare, reprezentat de PCR.
La receptie, dac ceasul receptorului nu este sincronizat cu cel de la codor, un circuit PLL
realizaz sincronismul acestuia. n paralel cu sincronizarea ceasului, continutul numrtorului
este ncrcat cu valoarea continut n PCR.
PCR este ncorporat n fluxul de date al unui program MPEG-2 sau MPEG-4 (fluxul elementar ES)
cel putin o dat la fiecare 0.7s, n MPEG-2 TS cel putin o dat la fiecare 0.1s, iar n DVB TS cel
putin o dat la fiecare 40ms.
109
110
111
Introducere
112
Mixerul
Acesta
La
113
Modulatorul de amplitudine
115
116
11
8
119
Cazul particular de mai sus este cazul modulatiei QPSK (Quadrature Phase
Shift Keying), cnd este comutat numai faza semnalului, constelatiile
posibile fiind 45, 135, 225 si 315.
Cum pentru fiecare combinatie posibil sunt necesare dou valori pentru
cile I si Q, rezult c putem transmite simultan doi biti.
120
121
n cazul QPSK avem data rate la iesirea modulatorului la jumtate fat de data rate a
fluxului de date de la intrare.
n consecint banda necesar transmiterii informatiei se reduce la jumatate.
Pornind de la QPSK putem s trecem la modulatii de ordin superior.
Astfel dac variem simultan faza si amplitudinea obtinem celelalte tipuri de
modulatii folosite n DVB-T: 16QAM, 64QAM.
Constelatiile pentru aceste tipuri de modulatii sunt date n figurile urmtoare:
n cazul 16QAM se pot transmite simultan patru biti iar n cazul 64QAM se pot
transmite simultan sase biti, banda necesar reducndu-se corespunztor.
122
Demodulatorul IQ
La
123
124
125