Sunteți pe pagina 1din 12

UNIVERSITATEA “STEFAN CEL MARE’’ DIN SUCEAVA

FACULTATEA DE INGINERIE ELECTRICĂ ȘI ȘTIINȚA CALCULATOARELOR

REȚELE DE COMUNICAȚII ȘI CALCULATOARE

Noțiuni de bază despre compresia


semnalelor video

Student: Leonte Andrei

Grupa:31111b

Suceava, 2018
Cuprins
Introducere......................................................................................................................... 3
Video analogic...................................................................................................................3
Video digital...................................................................................................................... 4
Compresia semnalelor audio-video digitale.......................................................................7
Compresia video................................................................................................................9
MPEG........................................................................................................................... 10
MPEG1......................................................................................................................... 10
MPEG2......................................................................................................................... 10
MPEG1 şi MPEG2.......................................................................................................10
MPEG3......................................................................................................................... 11
MPEG4......................................................................................................................... 11
MPEG7 şi MPED21.....................................................................................................11
Bibliografie...................................................................................................................... 12
Introducere

Prelucrarea numerică a semnalelor video reprezintă un ansamblu de teorii și tehnici folosite în


înregistrarea, sinteza, codarea, transmiterea, reproducerea, recunoașterea, estimarea, detecția,
filtrarea, îmbunătățirea secvențelor video. Domeniile de aplicabilitate sunt: transmisiunile video,
medicina, biologia, astronomia, industria, comunicațiile, efectele speciale, educația la distanță.
Echipamentele de prelucrare a imaginilor și semnalelor video realizează o serie de operații:

 Achiziția imaginilor realizată cu camera video sau scaner;


 Prelucrarea imaginilor și semnalelor video folosind calculatorul sau procesoare de semnal
(DSP);
 Memorarea imaginilor și semnalelor video pe diferite medii de stocare;
 Redarea imaginilor și semnalelor video utilizând monitorul, televizorul, imprimanta;
 Transmisia imaginilor și semnalelor video pe diferite rețele de comunicații.

În marea majoritate a cazurilor informația pe care dorim să o prelucrăm și să o transmitem este


de natură analogică. Mai mult, informația este destinată într-o majoritate covârșitoare omului,
deci aceasta trebuie redată sub formă analogică. Plecând de la imperfecțiunile simțurilor umane,
mai întâi s–au creat standarde pentru prelucrarea și transmiterea informației sub formă analogică
și o dată cu tehnologia digitală, standarde privind conversia din analogic în digital și invers,
adăugând formate, coduri și protocoale utilizate în rețele și medii de stocare.

Video analogic
Prima formă de transmitere a imaginii în mișcare a fost televiziunea. Odată cu aceasta s–au
căutat și găsit modalități de a folosi la maxim o lărgime de bandă în spectrul radio astfel încât la
receptor imaginea să fie o redare cât mai fidelă a celei din cadrul transmis. Astfel, fiecare
imagine completă este numită cadru. El se obține prin explorarea linie cu linie a imaginii pe care
vrem să o transmitem, realizând astfel o primă eúantionare, în timp. Aceste cadre trebuiesc
transmise astfel încât discontinuitățile dintre ele să nu fie observate.

Rata minimă, pentru care ochiul nu percepe caracterul discontinuu al cadrelor este de 50 Hz. La
explorarea progresivă (Figura 1a) cadrul este redat linie după linie în ordine naturală. În schimb,
la explorarea întrețesută (Figura 1b) fiecare cadru este împărțit în două câmpuri, furnizând astfel
un echilibru între rezoluția temporală și cea verticală. În primul câmp sunt redate liniile cu număr
impar iar în următorul cele cu număr par. Principalele sisteme de televiziune analogică folosite la
ora actuală în lume sunt NTSC (National Television System Committee), folosit în America de
Nord, America Centrala și Japonia, PAL (Phase Alternating Lines), folosit in majoritatea țărilor
din Europa, Africa, Australia, America de Sud și China, și SECAM (Systeme Electronique
Couleur Avec Memoire), folosit in Franța, Rusia și fostele țări sovietice. În Tabelul 1 sunt
prezentate principalele caracteristici ale acestor sisteme de televiziune. Televiziunea digitală
introduce eșantionarea și pe linii făcând legătura dintre standardele de televiziune și cele folosite
la redarea pe ecranele monitoarelor calculatoarelor personale, unde se utilizează explorarea
progresivă. Legătura dintre rezoluția pe orizontală, banda video și rata cadrelor este dată de
Ecuația (1).

Figură 1- Explorarea imaginii a) progresivă; b) întrețesută

Tabel 1- Parametrii video standard

 BW este banda video;


 FR este rata cadrelor;
 NL este numărul de linii/cadru;
 HR este rezoluĠia pe orizontală;
 ρ este partea de timp alocată semnalului video activ dintr-o linie.
Ecuație 1

Video digital
Dezvoltarea tehnologiei de integrare pe scară largă a facilitat trecerea de la tehnica analogică la
cea digitală. S-au făcut progrese imense în domenii cum ar fi comunicațiile informaționale
digitale (rețele de calculatoare, e-mail), audio digital (CD player, telefonie digitală, compresia
semnalelor audio), dar și în domeniul prelucrării video digitale. Procesarea video digitală este un
domeniu aflat încă la începuturi, dar care are o aplicabilitate tot mai mare. Aplicațiile video
digitale folosite sau încă în lucru sunt comunicațiile în timp real (videoconferința/videofonul în
ISDN, comunicațiile video în rețelele de bandă largă ATM), televiziunea digitala, televiziunea de
înaltă rezoluție (HDTV), aplicații multimedia PC (Compact Disk Interactive (CD-I), Digital
Video Interactive (DVI), 1. Noțiuni de bază în prelucrarea semnalelor video 7 VideoCD, Digital
Video Disk (DVD), Blu-ray Disc (BD) ) și Packet Video (standardele de compresie MPEG-
1,2,4). Odată cu aplicațiile video digitale apar însă și debite mari de date. Prezentăm în
continuare datele brute pentru audio și video digital:

 calitatea audio digitală a CD-ului: 44kHz rată de eúantionare u 16biți/eșantion, rezultă un


flux de aproximativ 700 kbps
 video de înaltă definiție: 1280 peli x 720 linii luminanță, 640 peli x 360 linii crominanță
u 60 cadre/s x 8 biți/pel/canal, rezultă aproximativ 663.5 Mbps . În Tabelul 1.2 sunt
prezentate câteva standarde video digitale de studio:

Tabel 1.2- Standarde video digital de studio

Tabel 1.3-Formate HDTV


High Definition TeleVision (HDTV) este un standard de televiziune digitală ce suportă video de
rezoluție mult mai mare decât sistemele de televiziune tradiționale. Rețelele de acces disponibile
în acest moment pentru traficul de date și fluxurile de date maxime pe care le permit, sunt
enumerate în Tabelul 1.4. Din Tabelele Tabelul 1.2, Tabelul 1.3 și Tabelul 1.4 se observă că
fluxurile brute de date în cazul imaginilor în mișcare sunt foarte mari în comparație cu fluxurile
de date maxime din sistemele de transmisiune folosite la ora actuala, ceea ce duce la ideea
folosirii tehnicilor de compresie pentru obținerea unor fluxuri de date mai scăzute, ce pot fi
folosite în transmisiunile actuale. Cele mai importante astfel de standarde de compresie și
domeniile lor de aplicabilitate sunt:

 CCITT G3/G4 (standarde CCITT grup 3, respectiv 4) - folosite pentru compresia


imaginilor binare (non-adaptivă); codează imaginea sursa linie cu linie
 JBIG (Joint Bi-level Image experts Group) - standard de compresie fără pierderi folosit
pentru imagini binare, ce oferă o rata de compresie de maxim 20:1 x JPEG (Joint Picture
expert Group) - standardul de compresie pentru imagini cu nuanțe de gri și color cel mai
folosit la ora actuala; oferă rate de compresie de la 5:1 la 50:1
 JPEG2000 - standard de compresia a imaginilor cu nuanțe de gri și color derivat din
JPEG, care folosește compresia bazată pe wavelet și oferă imagini de calitate foarte bună
și rate de compresie foarte mari de până la 300:1
 H.261 - standard de codare video folosit în aplicații ISDN cu flux de date multiplu de
64kbps (numit și pu64 kbps); oferă rate de compresie de la 25:1 la 100:1
 H.263 – standard de compresie video inițial pentru aplicații PSTN (mai puțin de 64
kbps), dar actual și pentru fluxuri de date mai mari; urmează să înlocuiască standardul
H.261; are rate de compresie cuprinse între 6:1 și 140:1
 MPEG-1 (Motion Picture Expert Group) – standard de compresie a imaginilor în mișcare
și a sunetului asociat pentru stocare pe medii digitale cu rată de bit de până la
aproximativ 1,5 Mbps

Tabel 1.4- Rețele de acces


 MPEG-2 – îmbunătățire a standardului MPEG-1 ce folosește codarea generică (1.5-
20 Mbps)
 MPEG-4 – o nouă îmbunătățire a standardului MPEG cu codare bazată pe obiecte
 H.264/MPEG-4 AVC (Advanced Video Coding)- standard de compresie video de
generație mai nouă; unul dintre cele mai folosite formate pentru înregistrare,
compresie și distribuție de video de înaltă definiție; unul dintre standardele utilizate la
Blue-Ray Disc

Având acum o imagine de ansamblu asupra sistemelor video analogice și digitale, putem face o
comparație între ele:

 Reprezentarea digitală este robustă; corecția erorilor minimizează efectul distorsiunilor


din mediile de transmisie/stocare, efectul zgomotului și a altor degradări.
 Informația video digitală poate fi transmisă cu lărgime de bandă mai mică decât aceeași
informație în formă analogică, de aceeași calitate, folosind compresia digitala
 Sistemele video digitale pot fi aplicate cu succes în domenii ca multimedia, televiziune și
comunicații în timp real (videofon și videoconferință) într-o arhitectură unificată.
 Informația video digitală dovedește flexibilitate în procesarea semnalului pentru
îmbunătățire, conversia standardelor, compunerea imaginilor, efecte speciale, editare
neliniară, etc.

În comparație cu procesarea imaginilor statice, procesarea video folosește în plus și alte


tehnici:

 Unele sarcini, cum ar fi estimarea mișcării sau analiza unei scene variabile în timp nu
poate fi făcută pe baza unei singure imagini.
 Utilizarea redundanței temporale care există în mod natural într-o secvență de imagini
pentru a dezvolta algoritmi eficienți:
- filtrare compensată de mișcare
- predicție compensată de mișcare
Domeniul video digital este în continuă dezvoltare. Provocările în acest domeniu sunt
analiza mișcării (estimarea și segmentarea mișcării bidimensionale, mișcarea
tridimensionala, estimarea structurii și segmentarea ei, urmărirea obiectelor în imagine,
ocluzie, deformare), filtrarea și conversia standardelor (înlăturarea încețoșării imaginii -
deblurring, filtrarea zgomotului, ascuțirea marginilor, conversia frecvenței cadrelor și
deîntrețeserea, mărirea rezoluției), compresia (JPEG, H.261/H.263/H.264, MPEG 1,2,4,7,
codarea în subbenzi (Wavelet) și codarea bazată pe model), etc.

Compresia semnalelor audio-video digitale


Termenul de compresie a datelor a apărut în jurul anului 1940 prin lucrările lui Shanon și
Fano care au dezvoltat un algoritm eficient de compresie, însă în scurt timp acesta a fost
îmbunătățit de Huffman prin minimizarea redundanței (1952). El a rămas neschimbat până în
1977 când Ziv și Lempel au stabilit o maniera total diferită de compresie, denumită schema de
dictionary (dictionary scheme). Mulți din algoritmii de compresie utilizați în prezent utilizează
variante ale acestor scheme de bază.
Într-un sens cât mai general, o imagine este o descriere a variaţiei unui parametru pe o
suprafaţă, de obicei dreptunghiulară caracterizată, la nivelul oricărui punct al ei, de o anumită
culoare. Ideal, culoarea variază continuu în oricare direcţie. Din păcate, în sistemele numerice,
nu se pot utiliza mărimi care variază continuu, ci doar forma discretizată a acestora. Astfel, o
imagine trebuie să fie discretizată înainte de a se pune problema reprezentării numerice.
Discretizarea constă în împărţirea imaginii într-un caroiaj asemănător unei table de şah. Fiecare
porţiune de imagine delimitată de acest caroiaj va fi considerată ca având o culoare uniformă - o
medie a culorii existente pe această secţiune. Aceste secţiuni mai sunt denumite şi pixeli sau
puncte, numărul acestora definind rezoluţia imaginii.
De exemplu cazul unei imagini cu o rezoluție 640x480 pixeli, imaginea conține 307200
puncte, fiecare punct necesitând 24 biți (pentru o reprezentare de calitate a culorii). Rezultă o
dimensiune de 921.600 octeti (900KB) ceea ce este destul de mult. Pentru a stoca o imagine
avem nevoie de spațiu considerabil, iar pentru transmiterea ei avem nevoie de un canal de
transmisiune de banda largă, de care nu dispunem întotdeauna. Cel mai frecvent imaginile se
codifică într-o formă comprimată existând în momentul de față un număr mare de tehnici de
compresie și un număr și mai mare de formate (GIF, JPEG, WIF). În timpul compresiei imaginii,
datele care apar de mai multe ori sau cele fără valoare sunt eliminate sau salvate într-o formă mai
scurtă, astfel reducându-se mărimea fișierului. Când imaginea este afișată atunci se pornește un
proces invers compresiei.
Compresia datelor este considerată adesea ca o codare, în timp ce codarea este un termen
foarte general referindu-se la orice reprezentare specială ce satisface un anumit scop. Teoria
informației s-a ocupat de studiul eficient al metodelor de codare, ținând seama de probabilitatea
de eroare și de viteza de transmisie. Compresia datelor poate fi vazută ca o latură a teoriei
informației în care obiectivul principal este de a minimiza cantitatea de date ce trebuie transmisă.
În acest fel se reduce costul transmisiei și/sau al memorării. Simplu, este foarte avantajos să
comprimi un fișier la jumătate din mărimea lui inițială. O caracaterizare simplă a compresiei este
aceea ce se referă la transformarea unui șir de caractere într-o anumită reprezentare (cum este
ASCII) într-un nou șir (de biți, de exemplu), care conține aceeași informație, dar are lungimea
mai mică pe cât posibil.Compresia imaginilor reprezintă totalitatea metodelor ce au drept scop
reducerea cantităţii de date necesare pentru reprezentarea unei imagini.
Compresia este folosită în special pentru stocarea sau transmiterea imaginilor, realizarea
acesteia fără pierderi este necesară pentru multe aplicații de înaltă performanță, cum ar fi
geofizică, telemetrie, evaluare nedistructivă și imagistică medicală, care necesită recuperări
exacte ale imaginilor originale. Datorita dezvoltarii în domeniul multimedia a imaginilor digitale,
a rezultat utilizarea unei cantități mari de date necesare reprezentării imaginilor. Acest lucru
determină utilizarea unui spațiu mare de stocare pe disc și timp îndelungat pentru transmiterea
lor pe internet, fiind scumpe, reprezintă cauza principală a utilizării compresiei imaginii.
Compresia imaginii abordează problema de reducere a spațiului necesar pentru a reprezenta o
imagine digitală, obținând o reprezentare compactă a unei imagini, reducând astfel cerințele de
stocare sau de transmisie a imaginii. Ideea cheie aici este eliminarea redundanței datele
prezentate într-o imagine pentru a reduce dimensiunea acesteia fără a afecta informațiile
esențiale. Cea mai buna calitate a imaginii la o anumită rată de biți reprezintă obiectivul principal
al comprimării imaginii, existând și alte proprietăți importante ale schemelor de compresie a
imaginilor:
Scalabilitatea se referă, în general, la o reducere a calității obținută prin manipularea bitului
sau a fișierului. Aceasta purtând și alte denumiri cum ar fi codificarea progresivă sau fluxurile
bitrate încorporate. În ciuda naturii sale contradictorii, scalabilitatea poate fi găsită și în codecuri
fără pierderi, de obicei sub formă de scanări de pixeli grosiere. Scalabilitatea este utilă în special
pentru previzualizarea imaginilor în timpul descărcării acestora sau pentru furnizarea de acces la
calitate variabilă, de exemplu, la baze de date. Există mai multe tipuri de scalabilitate: stratul
progresiv, rezoluția progresivă, componenta progresivă, regiunea de codificare a interesului,
meta informația și puterea de procesare.
Calitatea unei metode de comprimare este adesea măsurată prin raportul semnal-zgomot de
vârf. Ea măsoară cantitatea de zgomot introdusă printr-o comprimare pierdută a imaginii, totuși,
judecata subiectivă a privitorului este, de asemenea, considerată o măsură importantă, probabil
cea mai importantă măsură.
Atunci când se doreşte compresia datelor trebuie ţinut cont de tipul datelor şi de cum sunt
interpretate ele. De exemplu pixel-ii dintr-o imagine pot fi distorsionaţi dar să conţină încă
informaţia utilă. Uneori un singur bit greşit poate crea probleme deosebite. Semnalele video şi
audio sunt de regulă compresate cu pierdere de informaţie, în timp ce datele digitale sunt
compresate fără pierdere. Aceste două variante pot fi detaliate astfel:

• compresie fără pierdere – informaţia obţinută după decompresare este identică cu cea inţială.
Pentru programe sau fişiere, orice pierdere va duce la un fişier corupt.

• compresia cu pierderi – informaţia compresată nu se poate extrage în întregime la


decompresie. Acest gen de compresie necesită analiza datelor mai întâi şi aflarea datelor care au
cel mai redus efect asupra datelor (diferenţa între o imagine cu 24 biţi de culoare este mică faţă
de o imagine cu 10 biţi). Compresia unei imagini înseamnă şi reducerea rezoluţiei.

Compresia video
Compresia imaginilor, ca şi cea a sunetelor este posibilă datorită existenţei unei redundanţe sau
prin specularea unei repetabilităţi. Algoritmii de compresie asigură eliminarea acestei
redundanţe, reţinând numai informaţiile absolut necesare pentru reconstituirea imaginii sau
sunetului. Din punct de vedere al decompresiei, se constată o relaţie de inversă proporţionalitate
între factorul de compresie obţinut şi calitatea imaginilor (respectiv a sunetului).

Datorită complexităţii lor ridicate, compresia şi decompresia imaginilor sunt operaţii extrem de
costisitoare în ce priveşte resursele de calcul necesare. Din acest motiv, între reducerea fluxului
de date şi calitatea imaginilor se fac deseori compromisuri. Micşorarea debitului informaţional
precum şi a volumului de stocare se poate face atât cu pierdere de informaţie, cât şi fără pierdere
de informaţie. In general, pentru compresia datelor ne interesează o soluţie fără pierdere de
informaţii, ceea ce garantează reproducerea calităţii imaginii originale, în schimb rata de
compresie este în acest caz destul de scăzută. Pentru audio şi video, o compresie cu pierdere de
informaţii (lossy compression) este însă de cele mai multe ori acceptabilă, deoarece ochiul şi
urechea umană filtrând o bună parte a informaţiei primite, transmite creierului numai trăsăturile
esenţiale.

O compresie cu pierdere de informaţie neesenţială este deci "transparentă" ochiului şi urechii,


astfel încât diferenţa dintre informaţia originală şi informaţia prelucrată este uneori insesizabilă.
Ea sacrifică precizia în favoarea obţinerii unui fişier mult mai redus întrucât pentru video se
înregistrează o redundanţă mare, atât spaţială, adică a detaliilor de conţinut a cadrelor, cât şi
temporală, adică a diferenţelor constatate între cadrele succesive, transparenţa nu se pierde la o
compresie chiar de 20 de ori, deşi de multe ori este posibilă o compresie mult mai mare.
Redundanţa spaţială este exploatată de tehnicile decompresie intra-cadre, care tratează imaginile
una după alta, în mod individual. Acestea se bazează fie pe eliminarea detaliilor nesemnificative,
fie pe codificarea culorilor pe mai puţini biţi sau pe considerarea culorilor vecine ca fiind
identice, în schimb, la compresia bazată pe redundanţă temporală, inte-cadre, sunt luate în
considerare numai aspectele care ţin de diferenţele semnalate într-o imagine în raport cu
precedenta. Algoritmii de compresie video real-time cunoscuţi sunt: JPEG, MPEG, P*64, DVI,
M-JPEG; ei se bazează pe cele două tipuri de redundanţă şi sunt disponibili pentru a comprima
informaţia video digitală, cu rate cuprinse de la 50:1 până la 200:1.

Dintre aceştia MPEG s-a impus ca normă oficială de compresie a imaginilor video. El poartă
numele grupului de lucru desemnat în 1988 să dezvolte standarde pentru reprezentarea codificată
a imaginii în mişcare, a sunetului asociat şi a combinaţiei lor. Acest grup numit MPEG (Motion
Picture Experts Group) lucrează sub coordonarea ISO (International Standards Organization) şi a
IEC (International Electro-Technical Commission).

MPEG defineşte tehnicile standard pentru compresia şi decompresia semnalelor video şi audio
şi furnizează informaţii suplimentare pentru sincronizarea semnalelor. Pentru a face faţă nevoilor
crescânde de standarde pentru multimedia, grupul MPEG şi-a orientat lucrările pe mai multe
direcţii, existând deja numeroase specificaţii ale acestuia:

MPEG1 - "Coding for Moving Pictures and Associated Audio for Digital Storage Media at

up to about 1,5 Mbps". Este un standard internaţional (IS1172 / octombrie 1992) ce priveşte
numerizarea video cu sunet sincron, pentru aplicaţii pe CD-ROM, cu debite de până la 1,5
Mbits/s.

MPEG2 - "Generic Coding of Moving Pictures and Associated Audio". Similar MPEG1,acest
standard internaţional (IS-13818 / noiembrie 1994) include extensii, ce pot acoperi cerinţele unei
game largi de aplicaţii video numerizat, de înaltă calitate, pentru publicul larg: bănci de
imagini,enciclopedii multimedia, etc. MPEG2 cere pentru video numerizat, de calitatea emisiunii
TV, un debit cuprins între 4 şi 9 Mbits/s. în plus, MPEG2 s-a dovedit eficient şi pentru TV de
înaltă definiţie şi s-a dezvoltat în ideea de a suporta formate de afişaj progresiv şi intercalat.
Ulterior, MPEG2 a evoluat pentru a suporta şi transmisii video, la o rată de transfer de 2-15
Mbits/s prin cablu, prin satelit sau prin alte canale de comunicaţie. în forma omologată la
mijlocul anului 1994, standardul MPEG2 este definit ca un standard destinat televiziunii, în
principal prin satelit, pentru imagini de 724*480 pixeli (NTSC) şi de 720*576 pixeli (PAL) la
debite de transfer mergând până la 40 Mbits/s.
MPEG1 şi MPEG2 au o structură constituită din 4 părţi principale, ce se referă una la întregul
sistem, prin descrierea sincronizării şi multiplexării semnalelor video şi audio, una la
componenta video, cuprinzând compresia semnalelor video, una la componenta audio, insistând
pe compresia semnalelor audio şi o alta privind testele de conformitate a operaţiilor, descriind
procedurile pentru determinarea caracteristicilor fluxurilor de date şi a procesului de decodare,
precum şi procedurile pentru testarea conformităţii cu cerinţele specificate în primele trei părţi.

MPEG3 -este o specificaţie care nu există de sine stătător, ea fuzionând cu MPEG2 pe măsura
evoluţiei acesteia. Având ca obiectiv iniţial aplicaţiile televiziunii de înaltă definiţie (TVHD),
MPEG3 lucrează cu o eşantionare de până la 1920*1080*30Hz şi cu debite cuprinse între 20 şi
40 Mbits/s. Mergându- e pe un compromis optim între frecvenţa de eşantionare şi comprimarea
fluxului de biţi s-a observat că standardul MPEG3 poate fi susţinut prin cerinţele reformulate ale
standardului MPEG2.

MPEG4-este denumită şi "Very Low Bit Rate Audio-Visual Coding". Pentru acest standard

prima listă de propuneri a fost deschisă la 1 octombrie 1995, el,fiind destinat codificării video
numeric la debite joase, cuprinse între 4800 şi 64000 bits/s pentru imagini de 170*144*10 Hz.
Primele versiuni ale standardului au fost anunţate pentru sfârşitul anului 1996, dar definitivarea
lui este prevăzută pentru anul 1998. Obiectivele acestui standard vizează comunicaţiile
multimedia interactive, videofonia, poşta electronică multimedia, ziare interactive, bazele de
date. Datorită acestor debite scăzute, se permite, spre exemplu, videofonie digitală pe linii
telefonice analogice. Ca suport software se mizează pe perfectarea unor noi tehnici de
comprimare ultraperformante, pe bază de fractali şi funcţii iterate.

MPEG7 şi MPED21 se folosesc pentru inserarea de adnotări şi alte metadate video.

Standardul de compresie video MPEG1 se încadrează în clasa generală a algoritmilor hibrizi de


tip predicţie-transformare, ceea ce înseamnă că mai multe tehnici de compresie sunt angajate
combinat, pentru creşterea performanţei globale a sistemului, şi anume:

 analiza spectrală ce utilizează Transformarea Cosinus Discretă- DCT, prin care


repetabilitatea este surprinsă printr-o suprapunere de funcţii periodice, de tip sinusoidal.
Prin transformări matematice, de tipul funcţiilor Fourier, Cosinus Discret, Walsh-
Hadamard, datele iniţiale ale unui bloc de 8 * 8 pixeli sunt asociate frecvenţelor spaţiale.
în acest fel, blocul de 8 * 8 pixeli setransformă într-un ansamblu de 64 de valori discrete,
coeficienţi DCT. Dintre aceştia se vor reţine numai aceia care sunt semnificativi. Aceşti
coeficienţi vor fi cuantificaţi cu valori cuprinse între 0 şi 255, asigurându-se eliminarea
informaţiei vizuale nepercepute.
 codajul de tip Huffman, pentru date;

codajul predictiv, pentru mişcări înainte şi înapoi, prin care anumite mişcări sunt reconstituite în
totalitate prin interpolare, plecând de la imaginile anterioare şi de la cele posterioare;

 codajul diferenţial, ce presupune reţinerea doar a diferenţelor faţă de o altă imagine.


Stocarea fără comprimare a cadrelor care se succed într-o secvenţă video, pe un anumit suport
de informaţie, conduce la depăşirea rapidă a spaţiul disponibil fără a mai lua în considerare şi
ritmul lent de redare. MPEG reuşeşte să rezolve problema limitării resurselor prin operaţia de
comprimare.

Compresia video MPEG este una de tip asimetric, în sensul că operaţia de codificare este mult
mai complexă şi cu timpi de desfăşurare mai mari decât cea de decodificare. Semnalul video şi
audio comprimat prin această operaţie trebuie să-şi păstreze sincronizarea iniţială. Pentru a
menţine informaţia de timp asociată acţiunii în mişcare, codorul foloseşte un ceas intern, prin
care se asigură integrarea şi vehicularea acesteia împreună cu semnalul digitizat.

Toţi algoritmii folosiţi de acest standard au ca scop fie reducerea informaţiilor redundante sau
care se repetă, fie aproximarea unora pornind de la cele existente şi care sunt deja stocate.Mai
concret, pentru imaginile video, compresia MPEG acţioneză prin reducerea caracteristicilor de
luminanţă şi chrominanţă ale semnalului YUV. Aceste caracteristici sunt gestionate în bloc, prin
convertirea lor în frecvenţe, care sunt apoi cuantificate.

Această transformare produce o reducere a dimensiunii secvenţelor video. Astfel se foloseşte un


format SIF (Standard Image File) pentru comprimare, ce prevede o numerizare pe trei
componente YUV, de forma 4:2:0 şi nu 4:2:2, pentru a asigura reducerea debitelor de transfer.
Pentru acest format, atât pentru standardul PAL, adică 352 * 288 pixeli la 25 de cadre pe
secundă, cât şi pentru standardul NTSC, adică 352 * 240 pixeli la 30 de cadre pe secundă, se
obţine o reducere substanţială la 176 * 144 pixeli pentru semnalul PAL şi respectiv de 176 * 120
pixeli, pentru NTSC. Rezoluţiile admise pentru reducere pot fi de la cele prevăzute de CCIR
-601 (704 * 480), până la cele mai mari, de dimensiune 4095 * 4095.

Bibliografie
Lossless Image Compression Technique Using Combination Methods
(http://file.scirp.org/pdf/JSEA20121000001_59114627.pdf)

Image compression and decompression (http://www.engpaper.com/image-compression-and-


decompression.htm)

Image compression (https://en.wikipedia.org/wiki/Image_compression)

Dictionary approaches to image, compression and reconstruction


(https://ntrs.nasa.gov/archive/nasa/casi.ntrs.nasa.gov/19990009121.pdf)

Notiuni de baza în prelucrarea semnalelor video

http://www.comm.pub.ro/preda/apdsv/cursuri/APDSV_Cap1.pdf

Multimedia Note de curs 1

http://www.academia.edu/11439484/Multimedia_Note_de_curs_1

S-ar putea să vă placă și