Documente Academic
Documente Profesional
Documente Cultură
Analog şi digital
Capitolul 4
134
Televiziune. Analog şi digital
Progresul televiziunii digitale destinate publicului larg l-a constituit
lansarea standardului JPEG (Joint Photographic Experts Group) folosit pentru
compresia informaţiior digitale referitoare la imaginile fixe - fotografia digitală.
Rata de compresie în cazul standardului JPEG putând ajunge până la 15:1. Pentru
compresia imaginilor se foloseşte transformata cosinus discretă DCT (Discrete
Cosine Transform).
Transformata cosinus discretă reprezintă algoritmul de bază şi pentru
standardul MPEG (Moving Picture Experts Group) care, după anul 1988 de
constituire, a dezvoltat seria de standarde internaţionale pentru compresia
semnalelor video şi audio digitale: MPEG-1 în 1993 iar în 1995 standardul
MPEG-2.
MPEG-1, sub standardul ISO/IEC 11172, este utilizat pentru imagini video
în mişcare care sunt stocate pe CD-ROM. Formatul asigură o compresie de 52:1 şi
un debit de informaţie de pâna la 1,5 Mbit/s. Debitul de informaţie se referă la
rata de bit (bit rate).
MPEG-2, lansat sub standardul ISO/IEC 13818, este utilizat ca standard de
bază în televiziunea digitală, fiind capabil să realizeze compresia semnalului TV
digital de la 270 Mbit/s la 2-6 Mbit/s, deci de c.c.a. 200:1. Semnalului audio
digital este compresat de la o rată de bit de la 1,5 Mbit/s la (100-400) kbit/s.
MPEG-2, experimentat din 1993 a fost standardizat în 1995 şi este capabil de a
realiza, în cazul televiziunii digitale standard – SDTV, o compresie la o rată de bit
de (3 – 15) Mbit/s iar în cazul televiziunii de înaltă definiţie rata de bit ajunge la
(15 – 30) Mbit/s.
Având în vedere aceste rate mari de compresie, acum se poate realiza
combinarea unui număr de câteva programe sub forma unui singur flux de date
care poate fi transmis în banda unui singur canal TV analogic (6; 7 sau 8) MHz, în
funcţie de standard.
MPEG-4 este superior formatului MPEG-2 şi este destinat în special
televiziunii digitale interactive (IDTV - Interactive Digital Television), asigurând
o compresie mai mare de 200:1.
MPEG-7 este un standard orientat pe obiecte în cadrul procesului de
compresie şi de transmisie.
MPEG Layer 3 (MP3) este un standard de codare audio de înaltă calitate,
adoptat ISO/IEC Moving Picture Experts Group în 1992. Poate lucra la o rată de
bit de 192 kbps şi este compatibil codărilor Layer 1 şi Layer 2.
136
Televiziune. Analog şi digital
Tehnicile de compresie utilizate în codarea imaginilor TV prin aplicarea
MPEG se bazează pe următoarele particularităţi[12]:
• sistemul vizual uman este mai sensibil la luminanţa imaginii decât la
crominanţa acesteia. Ca urmare, se vor transmite mult mai puţine
informaţii (date) despre culoare;
• ariile adiacente din interiorul unei zone de imagine au pixeli cu
aceeaşi luminanţă şi aceeaşi crominanţă. Ca urmare, pentru aceste
arii codarea va conţine mai puţine informaţii (date);
• cuantizare – codificarea se va aplica numai diferenţelor dintre
imaginea unui cadru şi a următorului cadru. Aceste proces este precis
definit printr-o structură GOPs (Group Of Pictures) formată din 12
cadre de imagine, rezultat al diferenţei de predicţie precedate de un
cadru de imagine complet cuantizat – codificat;
• adoptarea formatului digital de codare 4:2:0 MP@ML (Main Profile
@ Main Level) prin care la fiecare 4 eşantioane de luminanţă se
transmit numai 2 eşantioane de crominanţă.
137
Televiziune. Analog şi digital
Din raportul:
858 ⋅ f H (525 )
13,5MHz = (4.2)
864 ⋅ f H ( 625 )
EAV
Stingere Verticală
SAV
Stingere orizontală
12 µs 52 µs (linia activă)
EAV SAV
Eşantion de Luminanţă – Y
Eşantion de Culoare - Cr
Eşantion de Culoare - Cb
142
Televiziune. Analog şi digital
Calculul ratei de bit pentru două standarde des utilizate (4:2:2 şi 4:2:0) în
acord cu eşantionarea unui cadru de imagine cu 576 de linii şi 720 eşantioane pe
linie (pentru sistemul PAL), la o frecvenţă de cadre de 25 Hz şi o codare cu 8 biţi
pe eşantion, se prezintă:
• pentru 4:2:2
((720x576)eşY x 8 biţi x 25Hz) + ((360x576)eşCr x 8 biţi x 25Hz) +
((360x576)eşCb x 8 biţi x 25Hz) = 166 Mbit/s
• pentru 4:2:0
((720x576)eşY x 8 biţi x 25Hz) + ((360x288)eşCr x 8 biţi x 25Hz) +
((360x288)eşCb x 8 biţi x 25Hz) = 124 Mbit/s
1 2 5
16 Y Y 8 pixeli
Cr
pixeli (linii)
(linii) 3 4 6 8 pixeli
Y Y Cb (linii)
16 pixeli 8
pixeli
Fig.4.4. Structura unui macrobloc dintr-o fâşie a unui cadru TV
pentru standardul 4:2:0 în procesare MPEG
144
Televiziune. Analog şi digital
2 N −1 N −1
(2 x + 1)uπ (2 y + 1)vπ
F (u , v) = ⋅ C (u ) ⋅ C (v) ⋅ ∑∑ f ( x. y ) ⋅ cos ⋅ cos (4.3.)
N X =0 Y =0 2N 2N
în care:
1 pentru u,v = 0
C (u ), C (v) = 2
0 pentru u,v ≠ 0
2 N −1
(2 x + 1)uπ (2 y + 1)vπ
f ( x, y ) =
N
∑∑ C (u ) ⋅ C (v) ⋅ F (u, v) ⋅ cos
X =0 Y =0 2N
⋅ cos
2N
(4.4)
147
Televiziune. Analog şi digital
F (v , u )
Fq (u , v) = (4.5)
Q ( v, u )
în care:
F(u,v) - reprezintă partea întreagă a coeficienţilor DCT;
Q(v,u) - reprezintă coeficienţii de cuantizare specificaţi în
tabele de cuantizare.
frecvenţă frecvenţă 8 14 17 20 24 25 27 32
minimă maximă
17 14 20 22 25 27 32 35
18 20 24 25 27 32 32 36
F(0,0)
compon 20 20 24 25 27 32 35 38
20 24 25 27 30 33 38 46
frecvenţă
minimă 24 25 27 30 33 38 46 56
24 25 27 32 36 44 54 67
frecvenţă 26 27 33 36 44 52 67 81
maximă
Q(u,v)
a) Reprezentarea grafică a coeficienţilor DCT b) Matrice de cuantizare cu 64 elemente
Fig.4.5. Graficul coeficienţilor DCT şi matricea de cuantizare cu 64 coeficienţi
Sfârşitul unui bloc de date este marcat printr-un marker de tipul EOB – End
Of Block. Procesul de codare continuă prin utilizarea codurilor cu lungime
variabilă ca procedeu de reducere a vitezei de transmisie (codarea Huffman).
153 0 0 0 0 0 0 0
14 -4 0 -2 0 0 0 0
0 0 0 0 0 0 0 0
2 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
-2 0 0 0 0 0 0 0
0 -2 0 0 0 0 0 0
0 0 0 0 0 0 0 0
150
Televiziune. Analog şi digital
Se obţine astfel în final, spre exemplificare, codul reprezentativ pentru un
un bloc de date prin folosirea codurilor de lungime variabilă din tabel, a spaţiilor
şi a virgulei:
0000 0000 1101 00, 0010 0001 0, 0010 0001 0, 000 0011 000, 0010 10, 10
În concluzie, utilizarea metodelor de reducere a debitului de informaţie,
prezentate mai sus, asigură reducerea debitului de la valoarea iniţială de 270
Mbit/s, obţinută în procesul digitizării semnalelor de televiziune în studioul TV
potrivit standardului ITU-R BT 601, la 2-6 Mbit/s, cu o valoare maxim posibilă
de 15 sau 30 Mbit/s. Baza obţinerii acestei compresii poate fi considerată: codarea
diferenţială a impulsurilor în cod cu compensarea mişcării şi aplicarea
transformatei cosinus discrete aşa cum este prezentat procesul în figura 4.7.
IQ
IDCT
MCP
Flux
de biţi ieşire video
VLD IQ IDCT
codaţi
MCP
152
Televiziune. Analog şi digital
4.2.3. Procedee de compresie semnalului audio folosite în MPEG
16 biti
FTB
CAD
15-20000 Hz
768 kbit/s
Canal
L
Generator
comandă comandat fE = 48 kHz
eşantionare pentru fE
Canal
R
16 biti
FTB CAD
15-20000 Hz
768 kbit/s
153
Televiziune. Analog şi digital
MASCAM ASPEC
IRT, 1988 Fraunhofer Gesellschaft, Thomson
(codare pe sub benzi) (codare cu transformate, utilizează DCT)
MUSICAM
IRT, CCET, Philips,
1989
numai dacă amplitudinea acestora va depăşi un anumit nivel, nivel care diferă de
la o zonă la alta de frecvenţă din domeniul audio (20 Hz – 20 kHz).
SPL SPL[dB]
[dB]
f[kHz]
f[kHz]
a) reprezentare la scară liniară b) reprezentare la scară logaritmică
Fig.4.10. Caracteristica de audibilitate a urechii umane (A)
SPL - nivelul presiunii audio; B – curba de mascare;
C – semnal de mascare; D – semnal mascat
Totalitatea nivelurilor dispuse în jurul unui semnal de nivel ridicat sub care
nu mai sunt percepute alte semnale audio determină curba de mascare (fig.4.10.b.
litera B). Lărgimea curbei de mascare diferă în funcţie de domeniul de frecvenţă
din plaja semnalelor audio, fiind mai largă în zona frecvenţelor înalte şi mai
îngustă în zona frecvenţelor joase. Deci, forma pragurilor de mascare este
dependentă de frecvenţă, la frecvenţele înalte având o formă mai largă.
Componentele a căror frecvenţe sunt situate sub pragurilor de mascare nu
vor fi transmise.
Principiile de bază în codarea semnalelor audio (MPEG Layer I, II) au la
bază caracteristicile modelului psiho-acustic al urechii umane. Datorită
fenomenului de mascare, un număr mare de componente audio nu vor fi
transmise. Se impune separarea acestor componente în domeniul frecvenţă funcţie
de amplitudinea acestora. Această separare este posibilă prin utilizarea
transformatei Fourier rapidă FFT (Fast Fourier Transform).
Simultan cu analizarea spectrală a semnalului audio se face şi o împărţire în
subbenzi a acestuia în baza următoarelor considerente:
• Măştile corespunzătoare curbelor de mascare diferă funcţie de
frecvenţă;
• Se poate întâmpla ca o subbandă să fie complet mascată de
componentele dintr-o altă subbandă;
155
Televiziune. Analog şi digital
• Sensibilitatea urechii variază cu frecvenţa ceea ce face posibilă
cuantizarea cu fineţe diferită astfel încât să se menţină zgomotul sub
pragul audibil;
• În cadrul fiecărei subbenzi se face analiza semnalelor pentru a vedea
dacă acestea nu sunt armonici ale semnalelor din benzile inferioare.
Numai semnalele care nu reprezintă armonici ale altor semnale ce se
transmit vor fi complet suprimate dacă se află sub pragul de mascare.
Numărul de subbenzi în care este împărţit domeniul audio (20 Hz la
20 kHz) este de 32, fiecare subbandă are o lărgime de 750 Hz.
• Fiecare subandă este cuantizată separat, proces care este însoţit şi de
eliminarea componentelor aflate sub pragul de audibilitate şi a
componentelor aflate sub pragul de mascare.
Codarea pe subbenzi este prezentată în schema bloc în figură 4.11, din care
se observă că fiecare subbandă este cuantizată separat iar cuantizarea este
controlată de blocurile FFT şi modelul psiho-acustic.
Intrare
semnal FTB
audio 1 Q
FTB
Q Semnal audio
2
comprimat la
∑
(100-400)kbit/s
FTB
32 Q
FFT Model
512 puncte pt. Layer I psihoacustic
1024 puncte pt. Layer II
Pentru MPEG Layer II, rezultatele FFT pentru 1024 de eşantioane sunt
transferate blocului psiho-acustic la fiecare 24 ms care ia decizii asupra fineţii
cuantizării sau a necuantizării pentru cele 32 de subbenzi.
În codarea MPEG eşantioanele sunt grupate în cadre pentru fiecare
subbandă, un cadru conţinând un anumit număr de eşantioane. Pentru Layer I un
156
Televiziune. Analog şi digital
cadru este format din 12 eşantioane, iar pentru Layer II un cadru este format din
3x12 = 36 eşantioane.
Pentru fiecare bloc de 12 eşantioane este determinată valoarea celui mai
mare eşantion care se va considera factor de scală pentru reducerea redundanţei
în transmisie. Factorul de scală fiind necesar la decodare va fi conţinut în fluxul
elementar audio în header-ul pachetelor de date audio.
pachete mai mici de dimensiuni fixe de 184 bytes. Acestor pachete de 184 bytes li
se adaugă un header de 4 bytes rezultând astfel pachete cu lungimea de 188 bytes
denumite „Transport Stream Packets”, pe scurt TSP.
Pachetele TSP sunt multiplexate, mai întâi în cadrul fiecărui program iar
apoi sunt din nou multiplexate în cazul transmiterii mai multor programe TV. Se
formează în final un flux de date MPEG numit Transport Stream Multipex, pe
scurt TSM.
Structura unui pachet MPEG-2 TSP este dată în figură 4.16.
Header-ul unui TSP începe cu un byte de sincronizare al pachetului, care
are tot timpul aceeaşi valoare şi anume 47Hex. Potrivit MPEG decodorul se
sincronizează după ce s-au recepţionat 5 TSP. O altă componentă importantă este
informaţia legată de identificarea pachetului, formată din 13 biţi, notată pe scurt
PID – (Packet Identifier).
PID descrie conţinutul payload precum şi locul în cadrul PES. După byte-ul
de sincronizare urmează un bit de eroare care indică dacă transmisia
s-a făcut eronat sau nu. Acest bit este setat la recepţie, iar în cazul în care erorile
nu pot fi corectate, informaţia conţinută în TSP -ul respectiv nu mai trebuie să fie
decodată.
204 bytes
16 bytes
RS de
corectie
162
Televiziune. Analog şi digital
În unele cazuri este necesar ca dimensiunea header-ului să fie mai mare de
4 bytes, şi, deoarece dimensiunea de 188 bytes a pachetului de transport TSP nu
poate fi depăşită, după TS-header în interiorul celor 184 bytes ai payload va fi
introdus un câmp opţional numit câmp de adaptare.
163
Televiziune. Analog şi digital
4.2.7. Informaţii suplimentare ce se transmit în fluxul digital TV
c. Accesarea programelor
Accesarea programelor conţinute în cadrul unui TS se face pe baza PID-
urilor video şi audio aferente acestora. Receptoarele permit accesarea directă a
164
Televiziune. Analog şi digital
165
Televiziune. Analog şi digital
Tipurile de modulaţii cel mai mult utilizate sunt: QPSK - Quadrature Phase
Shift Keying, QAM - Quadrature Amplitude Modulation şi OFDM – Orthogonal
Frequency Division Multiplexing.
Modulaţia QPSK este o modulaţie de fază utilizată în televiziunea digitală
standard pentru legături terestre în domeniul microundelor (prin radiorelee) şi
pentru distribuţia programelor TV prin satelit.
Modulaţia QAM este o modulaţie de fază şi de amplitudine utilizată în
transmisiile TV prin cablu şi în cadrul legăturile terestre prin microunde.
Modulaţia QAM are două variante mai des utilizate în televiziune 16-QAM şi 64-
QAM, variante care diferă doar prin numărul de biţi alocat fiecărui simbol.
Modulaţia OFDM este cunoscută şi sub forma: modulaţia COFDM –
Coded Orthogonal Frequency Division Multiplexing. Acest tip de modulaţie are
la bază o mulţime (de ordinul miilor) de frecvenţe purtătoare care au
particularitatea de a fi egal decalate (distanţate) în frecvenţă şi fiecare fiind
modulate de tip QPSK sau QAM. Acest tip de modulaţie este utilizat în
televiziunea digitalaă terestra (DVB-T) şi televiziunea terstră mobilă (DVB-H).
Modulaţia 8VSB – 8 Vestigial Side Band, este o modulaţie în amplitudine
cu 8 nivele de amplitudineşi rest de bandă laterală, este un tip de modulaţie parţial
utilizată în transmisiile terestre din U.S.A. (ATSC – standarde elaborate de
Advanced Television Systems Committee).
Componenta principală în cazul modulaţiilor de tip QPSK şi QAM este
modulatorul în cuadratură cunoscut sub denumirea de modulator I/Q în care
semnificaţia notaţiilor este: I - in phase (în unghi); Q – amplitudine (distanţa faţă
de centrul constelaţiei) [3].
166
Televiziune. Analog şi digital
Mixerul reprezintă o parte a modulatorului format dintr-un circuit
electronic cu rol de multiplicator. La ieşirea mixerului se obţin benzile laterale ale
semnalului modulate în amplitudine cu purtătoarea suprimată.
În cazul modulaţiei de amplitudine informaţia este conţinută în
amplitudinea purtătoarei. La ieşirea modulatorului de amplitudine, din punct de
vedere al spectrului, se regăseşte purtătoarea împreună cu două benzi laterale
situate simetric faţă de aceasta. Un mixer poate fi utilizat pentru realizarea unei
modulaţii de amplitudine. În cazul particular când semnalul modulator nu are
componentă continuă, la ieşire nu se vor regăsi decât benzile laterale fără
frecvenţa purtătoare. Această caracteristică este utilă în cazul modulaţiei în
cuadratură QAM.
Defazor
900
Sumator
Oscilator
167
Televiziune. Analog şi digital
Frecvenţa oscilatorului este de 70 MHz sau de 36 MHz. Se lucrează astfel
pe o frecvenţă mică urmând ca în sistemul de emisie să realizeze o conversie în
banda de bază a emisiei, la frecvenţe de ordinul sutelor de MHz în cazul
transmisiei terestre cu acoperire locală, sau a zecilor de GHz în cazul transmisiilor
prin radioreleu.
Un modulator I/Q poate realiza o modulaţie pură de amplitudine, o
modulaţie pură de fază sau o combinaţie între acestea în funcţie de tipul acestuia.
Reprezentarea polară a semnalului de la ieşirea modulatorului este dată în figura
4.18.
Q Q
Aq φ
Ai I I
a) b)
Aq2
ϕ = arctg (4.8)
Ai2
Q Q
I I
a) b)
În concluzie:
conform cu schema de modulaţie utilizată, fluxurile de date digitale (TS) sunt
transmise în secvenţe de 2, 4 sau 6 biţi (şi 3 biţi în cazul modulaţiei 8 VSB);
numărul diferitelor poziţii ale fazei şi/sau amplitudini pe care le poate avea
purtătoarea în diagrama de constelaţie într-o secundă defineşte parametrul
denumit Rată de Simbol (Symbol Rate);
frecvenţa datelor (Rata de Bit – Bit Rate) a fluxului (TS) de la intrarea
modulatorului depinde de: tipul de modulaţie utilizat, Rata de Simbol stabilită,
şi mărimea datelor adăugate pentru corecţia erorilor în receptor (FEC –
Forward Error Corection).
I i(t)
iqmod(t) data(t)
Circuit de
demapare
Q q(t)
Defazor
900
Circuite de
refacere a Fig.4.21. Schema bloc
purtătoarei a demodulatorului I/Q
data(t)
i(t)
q(t)
I(t)
Q(t)
iqmod(t)
i(t) demodulator
q(t) demodulator
Diagrama de
constelaţii
171
Televiziune. Analog şi digital
Se observă că semnalele demodulate i(t) şi q(t) au suprapuse semnale care
au frecvenţa dublă faţă de semnalul de bază. Această situaţie se rezolvă prin
introducerea unor filtre trece-jos până în circuitul de-mapper.
Este foarte important ca tabelele după care lucrează circuitele de mapare
(mapper) şi demapare (de-mapper) să fie identice. Foarte des demodularea
semnalelor modulate în cuadratură este realizată cu circuite de demodulare care se
bazează pe eşantionarea semnalului de bază cu o frecvenţă de patru ori mai mare
ca cea a semnalului modulat (o perioadă completă a purtătoarei este eşantionată în
patru puncte (fig.4.23).
De asemenea este foarte important ca frecvenţa de eşantionare să fie în
sincronism cu purtătoarea. Această metodă defineşte demodularea I/Q cu fs/4.
172