Documente Academic
Documente Profesional
Documente Cultură
Curs1 Moodle 2
Curs1 Moodle 2
Titular disciplină:
Conf. Dr. Ing. Ruxandra ŢAPU
– Octombrie 2020 –
Cuprins
Introducere
Necesitatea compresiei
Digitizarea imaginilor
Metode de evaluare a algoritmilor de compresie
• Calitatea compresiei
• Rata sau gradul de compresie
• Viteza de compresie şi de decompresie
• Latenţa (Întârzierea)
• Capabilităţile de editare
• Codoare video cu flux constant/variabil
• Toleranţa la erori a codecurilor video
Termenul de compresie se referă la procesul prin care datele sunt reduse astfel încât să satisfacă
cerinţele impuse de rata de transfer sau de spaţiul de stocare disponibil.
Rata de bit (rata de compresie) – este exprimată în unitatea de biţi pe secundă (bps) în cazul
transferului prim medii de transmisie sau în unităţi de biţi per pixel (bpp) în aplicaţii de stocare a
imaginilor/fluxurilor video.
Compresia datelor este necesară atât pentru transmiterea unei cantităţi mari de informaţie la o
viteză ridicată cât şi pentru reducerea capacităţilor de stocare.
Compresia datelor este realizată în principal prin exploatarea redundanţei vizuale existentă în
orice flux video.
Redundanţa presupune că pixelii dintr-un cadru video şi cei aferenţi cadrelor succesive nu sunt
independenţi din punct de vedere statistic. Din contră, aceştia sunt corelaţi până la un anumit
nivel.
Redundanţa spaţială
Redundanţa temporală
Redundanţa temporală – este definită pe baza corelaţiei statistice dintre pixelii mai multor cadre
succesive ale unui flux video (redundanţă intercadru).
Imaginea continuă Ia(x,y) din spaţiul 2D este împărţită în N rânduri şi M coloane. Intersecţia unui
rând cu o coloană defineşte un pixel.
Eşantionarea reprezintă procesul prin care un semnal continuu în timp este înlocuit cu valorile
discrete pe care acesta le ia la anumite momente echidistante în timp
x(t) xe(t)
0 t 0 t
Teorema lui Shannon arată că semnalul original poate fi refăcut din eşantioanele sale dacă
frecvenţa de eşantionare este de două ori mai mare decât frecvenţa maximă a spectrului
semnalului continuu.
Pagina 12 Facultatea de Electronică, Telecomunicaţii şi
SCM– curs 1
Tehnologia Informaţiei
Digitizarea imaginilor
Cuantizarea amplitudinilor - întreg domeniu de amplitudini a semnalului este împărţit într-un
număr finit de intervale de cuantizare. Două intervale vecine sunt separate prin aşa numita
amplitudine de decizie, iar în centrul fiecărui interval se găseşte nivelul de reconstrucţie.
Valori cuantizate
3 y7
2 y6
1 y5
y4 0
- - - 0.5 1.5 2.5
2.5 1.5 y0.5 Valori continue
3 -1
y2
-2
y1 -3
Principalele dezavantaje ale semnalului video reprezentat în format digital sunt date de:
nivelul ridicat al erorilor de cuantizare;
nevoia unei benzi de comunicaţii cu o capacitate mai mare, comparativ cu semnalul
analogic;
nevoia sincronizării emiţătorului cu receptorul;
La sursă, reducerea ratei datelor se efectuează prin intermediul unui codor (compresor).
Datele comprimate sunt apoi trecute printr-un canal de comunicaţie, iar în final sunt refăcute la
rata iniţială de transmisie prin intermediul unui decodor (expandor).
Raportul dintre debitul sursei şi cel al canalului poartă denumirea de factor de compresie.
Fiecare subiect apreciază calitatea imaginii reconstruite utilizând scara MOS (Mean Opinion
Score). Calitatea compresiei este evaluată în final pe baza unui scor mediu al opiniilor tuturor
subiecţilor.
În cazul particular al unui codor audio ce prezintă în structura lui un dispozitiv de înregistrarea a
vocii ce suportă un debit maxim de 7 biţi/eşantion/canal x 1 canal x 8 eşantioane/s = 56kbiţi/s
de la microfon până la stocare, atunci sistemul este de neutilizat.
Televiziunea la cerere (Video-on-Demand VoD) este un o altă aplicaţie pentru care viteza de
compresie a datelor este un parametru critic (aplicaţie în timp real).
Întârzierea semnalului audio are un impact semnificativ şi în industria jocurilor (în special pentru
jocurile de acţiune cu tematică muzicală - rhythm games) unde se impune o sincronizare precisă
între semnalul audio şi grafica 2D/3D pentru a finaliza cu succes misiunea.
Numai cadrele de tip I pot fi procesate direct de utilizator. Cadrele P sau B nu sunt complet
definite, acestea conţin în structura lor doar diferenţa de informaţie între un cadru I şi cadrul
curent, deci nu pot fi procesate fără decompresie.
Codarea cu rată de bit constantă (CRBC) presupune că datele la ieşire unui codec video au un
debit constant.
În ceea ce priveşte stocarea datelor CRBC nu reprezintă o soluţie optimă deoarece nu s-ar aloca
date suficiente pentru secţiunile complexe, în timp ce pentru secţiunile netexturate s-ar pierde o
cantitate mare de date.
Codarea cu o rată de bit variabilă (CRBV), ce modifică debitul de date în funcţie de segmentul
temporal. CRBV permite alocare unor rate de bit superioare pentru segmentele complexe, în
timp ce pentru zonele netede debitul poate fi redus.
Dezavantajul major al acestei metode este dat de faptul că rata de bit medie (şi, prin urmare,
dimensiunea fişierului) nu vor fi cunoscute din timp, ci doar la sfârşitul procesului de codare.
Zgomotul canalului de transmisiune poate afecta calitatea semnalului video, prin inversarea
semnalului binar de la 0 la 1 şi invers, fenomen cunoscut în literatura de specialitate sub
denumirea de eroare de probabilitate sau eroarea ratei de bit.
În cazul tehnicilor de codare PCM fiecare pixel este codat în mod independent. De aceea
inversarea biţilor în timpul transmisiei poate afecta doar valoarea nivelului de gri al pixelului
corespunzător din imaginea reconstruită. Ceilalţi pixeli ai imaginii rămân nemodificaţi.
Pentru tehnicile de compresie DPCM efectul erorilor de transmisie devine mai sever. Dacă
presupunem că un bit se inversează în decursul procesului de transmisie, acesta va determina
eronarea pixelului corespunzător dar şi a tuturor pixelilor care au fost codaţi predictiv pe baza
pixelului afectat. În acest fel eroare de transmisie se propagă.