Sunteți pe pagina 1din 9

2.

2 Sisteme video analoage

Captura şi reproducerea de imagini şi video

Imaginile sunt capturate folosind o cameră de filmat, în maniera următoare:


lentilele camerei permit crearea imaginii pe suprafaţa fotosensibilă a senzorului din
interior. Luminozitatea fiecărui punct este convertită apoi de stratul fotosensibil într-o
sarcină electrică. Încărcarea electrică a fiecărei sarcini este proporţională cu luminozitatea
punctului. Suprafaţa fotosensibilă este apoi scanată de la stânga la dreapta şi de sus în
jos, pentru a citi sarcinile electrice. În felul acesta o imagine este convertită într-un
semnal electric continuu. Scanarea se face foarte rapid (cca. 1/2000s) astfel încât întreaga
imagine este capturată înainte de a se deplasa prea mult.

Fig.1 Scanarea unei imagini

Figura 1 prezintă un exemplu de tipar de scanare. Scanarea imaginii porneşte din


colţul stânga sus şi merge orizontal, executând o scanere orizontală, pe linii. Linia
scanată nu este strict orizontală, scanner-ul deplasându-se uşor în jos, pe măsură ce se
deplasează spre dreapta. În momentul când marginea din dreapta este atinsă, capul de
scanare se deplasează rapid în marginea din stânga a imaginii şi reia scanarea cu
următoarea linie. Procesul durează până când întreaga imagine este scanată linie cu linie.
În timpul scanării fiecărei linii în parte, semnalul electric generat de scanner reprezintă de
fapt intensitatea luminii a fiecărui punct scanat din imagine. Pe perioada când capul de
scanare se deplasează din marginea dreaptă a imaginii spre marginea din stânga
(horizontal blanking interval) este recomandat să se oprească senzorul, astfel încât să nu
se genereze semnal la ieşire (blanking level).
Semnalul obţinut la o scanare completă a imaginii este o secvenţă de semnale
obţinute pe linii, separate prin horizontal blanking intervals. Această colecţie de linii
formează un frame.
Când scanarea este completă, capul scanerului se deplasează în colţul stânga sus
şi reia procesul de scanare, generând un nou frame. Astfel mişcarea este de fapt capturată
ca o secvenţă de frame-uri. Intervalul de timp dintre 2 frame-uri succesive este foarte
mic. El se numeşte vertical blanking interval.
Cel mai cunoscut dispozitiv pentru generare de imagini este tubul catodic (CRT).
CRT-urile sunt folosite în special la televizoare şi calculatoare. Există un strat fluorescent
de fosfor în interiorul tubului care este scanat de un fascicul de electroni în exact aceeaşi
manieră ca şi scanarea unei imagini în aparatul de fotografiat (filmat).

1
Atunci când fasciculul de electroni atinge stratul fluorescent, fosforul va emite
lumină pentru o perioadă scurtă de timp. Luminozitatea depinde de puterea fasciculului.
În timpul afişării unei imagini, dacă folosim semnalul electric generat de procesul de
scanare al camerei pentru a modifica puterea fasciculului, imaginea originală poate fi
reprodusă. Atunci când frame-urile se derulează suficient de repede, va rezulta o secvenţă
video continuă. În practică, semnalul electric trimis de la camera spre dispozitiv trebuie
să conţină şi alte informaţii pentru a asigura că ceea ce se prezintă este în concordanţă cu
scanarea senzorului din cameră. Aceste informaţii se numesc informaţii de sincronizare
(sync information).
Acestea sunt principiile de bază ale capturii şi reproducerii de imagini.

Frame Rates

Rata de frame-uri a unui film video este determinat de 3 factori majori. În primul
rând trebuie să fie suficient de mare încât mişcarea să pară naturală. S-a arătat că pentru
un frame rate de 25 fps (frame-uri pe secundă) sau mai mult, mişcarea pare naturală. Cu
toate acestea, pentru diferite tipuri de mişcare, cum ar fi o roată în mişcare, 25 de frame-
uri nu sunt suficiente. În aceste cazuri apare distorsiunea. Acest lucru se întâmplă din
acelaşi motiv ca şi distorsiunile audio dacă rata de eşantionare este prea scăzută sau dacă
frecvenţa semnalului de eşantionat este prea mare. Distorsiunile sunt un defect care poate
proveni de la eşantionare, transmisie sau afişare a imaginilor care sunt continue în spaţiu
şi timp.
În al doilea rând cu cât avem mai mare frame rate-ul, cu atât este necesară o rată
de transfer mai mare pentru transmiterea semnalului video. Frame rate-ul mare implică
faptul că mai multe imagini trebuie transmise în aceeaşi cuantă de timp, deci este
necesară o rată de transfer mai mare. Din aceste considerente, pentru a avea atât o rată de
transfer mai mică, dar şi mişcarea să pară cât mai natural, este nevoie să folosim 25 fps.
În cel de-al 3-lea rând, am precizat mai devreme că atunci când fosforul este atins
de fasciculul de electroni, va emite lumină pentru o scurtă perioadă de timp, în mod
normal câteva milisecunde. După această perioadă va înceta să mai emită lumină dacă nu
mai este atins din nou de fasciculul de electroni. Cu alte cuvinte, imaginea de pe ecran va
dispare dacă nu este reafişată după această perioadă scurtă (reîmprospătată). Dacă
intervalul de reîmprospătare este prea mare, imaginea va da impresia că clipeşte. Studiile
au arătat că este necesar un refresh (reîmprospătare) de cel puţin 50 ori pe secundă pentru
a preveni clipirea. Dar dacă frame rate-ul este mărit la 50fps, rata de transfer se va mări
substanţial. Pentru a rezolva această problemă la televizoare, se foloseşte o tehnică
numită interlace(împletire). Prin această tehnică pentru a se reproduce un frame complet
se foloseşte mai mult de o scanare verticală. Fiecare scanare verticală se numeşte câmp.
Cu un raport de 2:1, o scanare verticală (numită şi câmpul impar) arată toate liniile
impare din câmp, iar la cea de-a doua scanare verticală (câmpul par) arată liniile pare.
(fig. 2). Astfel la 25 de fps, vom avea o rată de 50 câmpuri pe secundă.
.

2
Fig.2 Scanarea unei imagini folosind metoda interlaced: liniile pline prezintă
scanarea liniilor din câmpul impar, iar cele punctate reprezintă scanarea liniilor din
câmpul par.
Bazat pe factorii prezentaţi anterior, la ora actuală se folosesc în transmisia TV, 2
tipuri de frame rate-uri: cele cu 25fps (50 câmpuri) este folosit în televiziunile europene,
China şi Australia (PAL), iar cele cu 30fps (60 câmpuri) sunt folosite în America de Nord
şi Japonia (NTSC).

Aspectul imaginii

Raportul dintre lăţimea şi lungimea unei imagini se numeşte aspectul imaginii


(aspect ratio). De el depinde cel mai mult esteticul imaginii.
Nu există un raport universal, acceptat ca şi standard, dar cel mai folosit este 16:9.
De reţinut că dimensiunea ecranului în mod curent se referă la diagonala sa. Deci
un televizor cu diagonala de 63cm şi un raport al imaginii de 4:3, va avea lăţimea
ecranului de 50 cm, iar înălţimea de 38.

Rezoluţia

Rezoluţia unei imagini are două componente: o rezoluţie verticală şi o rezoluţie


orizontală. Rezoluţia orizontală se referă la a reproduce pe orizontal cât mai fin detaliile.
În practică rezoluţia orizontală este măsurată prin numărul maxim de linii verticale alb şi
negre, alternative, care pot fi reproduse. Cu cât mai multe linii pot fi reproduse, cu atât
rezoluţia este mai mare. Un televizor cu rezoluţia orizontală de 480 linii poate reproduce
240 linii albe şi 240 negre, alternativ, pe orizontală la o distanţă proporţională cu
dimensiunea ecranului. Dacă televizorul are un raport al imaginii de 4:3, atunci el va
putea reproduce 320 linii albe şi 320 linii negre, pe tot ecranul.
Rezoluţia verticală specifică numărul de linii orizontale dintr-un frame. Cu cât
avem mai multe linii, cu atât este mai mare rezoluţia verticală. Televizoarele folosesc fie
525 linii (America şi Japonia), fie 625 linii (Europa).

Imagini video color / TV

Până acum s-a presupus că s-au reprodus numai imagini alb-negru. În acest
capitol vom discuta despre captura şi redarea imaginilor şi filmelor color.
Toate televizoarele color se bazează pe teoria celor 3 stimuli pentru reproducerea
culorilor, ceea ce spune că orice culoare poate fi reprodusă prin combinarea a 3 culori de

3
bază. Culorile folosite la televizoare sunt roşu, verde şi albastru. Cu aceste 3 culori se
poate reproduce aproape orice culoare din natură.
Pentru a captura imagini color camera împarte lumina captată în lumină roşie,
lumină verde şi albastră. Acestea sunt captate de 3 senzori diferiţi: un senzor pentru
lumină roşie, unul pentru lumină verde şi altul pentru lumină albastră, fiecare din cele 3
componente fiind convertit în semnal electric.
Într-un tub catodic sunt 3 tipuri de fosfor fluorescent, care emite lumină roşie,
verde, şi albastră, atunci când este atins de fasciculul de lumină. El este astfel aranjat
încât pentru fiecare poziţie în parte se regăsesc toate cele 3 tipuri de fosfor. Prin
amestecul celor 3 culori va rezulta un punct de o altă culoare. În tubul catodic vom avea 3
fascicule de electroni, aranjate în aşa fel încât fiecare în parte loveşte doar un singur strat
de fosfor. Intensitatea fiecărui fascicul este controlată de semnalul electric generat de
cameră la scanare, reprezentând cantitatea de lumină roşie, verde sau albastră. În felul
acesta orice culoare poate fi reprodusă pe un display.

Standarde existente pentru televiziunea color

Pentru imaginile color avem nevoie de 3 semnale diferite, corespunzătoare pentru


culoarea roşu, verde şi albastru, plus informaţiile necesare pentru sincronizarea dintre
camera de filmat şi display. Dacă semnalele se transmit separat de sursă (staţie de
emisie) către televizoare, este necesară o rată de transfer de 3 ori mai mare decât la
transmisia alb-negru. Acest lucru este mult prea costisitor. În plus, atunci când a fost
introdusă televiziunea color erau deja mult prea multe televizoare alb-negru. Dacă
culorile roşu, verde şi albastru ar fi fost transmise separat, aceste televizoare deja
existente nu ar mai fi putut decoda şi afişa imaginile. Pentru a rezolva acest lucru se
folosesc formate mixte.
Nu există un singur standard universal acceptat, ci 3: NTSC, PAL şi SECAM.
Toate aceste formate se bazează pe principiul bazat pe luminozitate şi cromatică.
Acest principiu spune că cele 3 culori primare pot fi convertite în 2 părţi: luminozitate şi
cromatică.
Luminozitatea este un semnal video monocrom care controlează doar intensitatea
luminoasă a imaginii. Cromatica conţine doar informaţiile despre culoare şi are 2
componente. Deoarece ochiul uman nu este foarte sensibil la informaţiile despre culoare,
rata de transfer a acestor 2 componente este redusă înainte de transmisie. Intr-un sistem
compozit luminozitatea şi cromatica sunt combinate printr-o schemă de multiplexare în
frecvenţă pentru a putea fi transmise pe un singur canal. Semnalul pentru luminozitate
este transmis ca un semnal alb-negru normal, iar semnalul pentru cromatică este adăugat
ca un subsemnal de frecvenţă înaltă, aflat la capătul benzii de transmisie. Atunci când
frecvenţa subsemnalului este aleasă corect, interferenţa dintre cele două semnale va fi
aproape neglijabilă.
Un astfel de sistem este capabil să transmită semnal color pe un singur canal, care
are aceeaşi lărgime de bandă ca fiecare dintre cele 3 semnale: roşu, verde şi albastru. De
asemenea se rezolvă si compatibilitatea dintre televiziunea color şi alb-negru:
televizoarele alb-negru pot afişa imagini alb-negru decodând numai semnalul cu
luminozitatea.

4
Distanţa de privire

Receptarea calităţii imaginii depinde de parametrii discutaţi mai sus, dar depinde
şi de distanţa de la care se priveşte (viewing ratio). Se defineşte ca raportul dintre distanţa
dintre cel care priveşte şi ecran, şi dimensiunea ecranului. Televizoarele actuale sunt
optimizate pentru un raport între 5 şi 6. Dacă avem un raport mai mare, în general,
calitatea imaginii pare mai bună, dar detaliile din imagine sunt greu de observat.
Televizoarele destinate pentru raporturi de vizualizare mici, trebuie să aibă o rezoluţie
mare.

Lărgimea de bandă necesară pentru imagini video analoage

Lărgimea de bandă necesară pentru transmisii analoage depinde de parametrii


procesului de scanare. Presupunând că frame rate-ul este F, numărul de linii scanate într-
un frame este N, rezoluţia orizontală este H, perioada pentru transmisia semnalului a unei
scanări orizontale este C, iar raportul aspectului este A, atunci frecvenţa necesară se poate
deduce astfel:

B = F x ( cicluri pe frame )
Cicluri pe frame = N x ( cicluri pe linie )
Cicluri pe linie = 0.5 x A x H / C

Unde 0,5 este raportul dintre numărul de cicluri la numărul de linii distinse. Vom
obţine:

B = 0.5  A  F  H  N / C

Salvarea şi transmisia de imagini video analoage.

Cea mai folosită metodă pentru păstrarea imaginilor analoage sunt casetele video
(magnetice) şi discurile. Există numeroase tipuri de casete şi dispozitive de înregistrare.
Dacă casetele profesionale pot înregistra aproximativ 500 de linii rezoluţie, cele normale
(HSV) pot înregistra la o rezoluţie de numai 240 linii. Cele mai multe casete înregistrează
până la 2 – 3 ore.
Discurile (video CD) pot înregistra aproximativ o oră de imagini video de foarte
mare calitate. Cele mai multe sunt read-only iar dispozitivele de înregistrare pentru ele
sunt încă destul de scumpe.

2.3 Reprezentarea imaginilor video digitale

Un sistem video digital generic

În sistemele video analoage discutate anterior, o cameră converteşte imaginile în


semnale video analoage. Acest semnal este transmis (sau înregistrat şi transmis ulterior)
unui receptor pentru a fi afişat, ca în figura următoare (fig. 3) :

5
înregistrare

Camera Transmisie Receptor Display

Figura 3 - Sistem video analog

Imaginea afişată pe ecran constă din mai multe linii scanate, şi mai multe imagini
sunt afişate în fiecare secundă. Datorită limitării ochilor noştri şi a proprietăţii retinei de a
păstra imaginea formată o perioadă de timp după ce ea a dispărut, percepem totul ca o
imagine continuă cu mişcare naturală.
Într-un sistem video digital camera şi displayul funcţionează într-o manieră
asemănătoare dar, între cameră şi display, semnalul analog este convertit într-o formă
digitală, iar toate componentele dintre cele două lucrează cu semnele digitale. De aceea
este necesar plasarea unui convertor analog-digital la ieşirea camerei, iar înainte de
intrarea în display un convertor digital-analog. (fig. 4)
înregistrare
Codificare şi
Camera ADC procesare Transmisie

Decodare şi
Display DAC procesare Receptor

Figura 4 - Un sistem video digital

Deşi unele camere folosesc convertoare analog-digitale, deci ieşirea este în format
digital, convertoarele şi camerele sunt 2 entităţi distincte. Motivul principal pentru care
se face conversie din semnal analog în semnal digital este acela că semnalele digitale sunt
mai uşor de prelucrat, codificat şi de integrat cu alte dispozitive digitale. Din acest motiv
este mai comod să prelucrăm semnale digitale, în locul celor analoage. De exemplu am
putea redesena figura 4 pentru semnale audio digitale, înlocuind doar camera cu un
microfon, iar displayul cu un difuzor.
Pentru imaginile video digitale, cele mai utilizate medii de stocare sunt hard-disk-
urile şi CD-urile. Dipozitivele de prelucrare, transmisie şi recepţie sunt calculatoarele.
Scopurile principale ale sistemelor video digitale este acela ca imaginea finală să
nu aibă o calitate mai mică decât cea analoagă, originală.

Procesul de conversie analog - digitală

Principiul de bază pentru ADC este acelaşi ca şi la conversia ADC pentru semnale
audio. Parametrii de bază care trebuie definiţi sunt rata de eşantionare şi numărul de
nivele de cuantificări.

6
Rata de eşantionare

Rata de eşantionare poate fi dedusă intuitiv din parametrii scanării imaginii.


(rezoluţia orizontală, rezoluţia verticală, frame rate-ul, raportul aspectului imaginii).
Pentru a recrea alternarea liniilor alb-negru verticale, folosite pentru calculul rezoluţiei
orizontale, avem nevoie de cel puţin un frame mostră. Aceasta înseamnă că rata de
eşantionare trebuie să fie cel puţin la fel ca şi rata la care sunt afişate aceste linii verticale.
Rata de eşantionare S minimă poate fi calculată astfel:

S = A  F  H  N / C , unde

A – raportul aspectului
F – frame rate-ul
H – rezoluţia orizontală
N – numărul de scanări per frame
C – cuanta dintre intervalul de scanare, dedicată transmisiei semnalului

De exemplu pentru un sistem PAL, avem: A = 4/3, f = 25, H = 409, N = 625 iar
C=0.80, deci vom avea S = 10.6 MHz.
Desigur că putem calcula rata de eşantionare direct din lărgimea de bandă a
semnalului, conform teoremei lui Nyquist: dacă lărgimea de bandă pentru semnalul
analog este f MHz, atunci rata de eşantionare trebuie să fie cel puţin 2f MHz
Fiecare punct reprezintă cel mai mic element dintr-o imagine, numit pixel.
Vizual, o rată de eşantionare mai mică produce efectul numit pixelare: fiecare pixel este
reprezentat printr-un mic pătrat (în loc de un singur punct). El este efectul distorsiunilor
cauzate de o rată de eşantionare scăzută

Nivele de cuantificare

Numărul de nivele de cuantificare necesar este direct proporţional cu


amplitudinea şi invers proporţional cu mărimea pasului de cuantificare. Pasul de
cuantificare, care este egal cu zgomotul maxim de cuantificare, trebuie sa fie mai mic
decât marja de discriminare a vederii umane
Vederea umană funcţionează la o mare varietate de nivele de intensitate. La un
anumit nivel de adaptare, vederea umană poate distinge nuanţe diferite de luminare, până
la aproximativ 1% lumină într-un cadru. Cu alte cuvinte capabilitatea noastră de a
distinge diferenţele de nuanţe de lumină este de 100:1. Intensităţile mai mici de 1% apar
negre. Ele nu pot fi distinse. Contrastul este definit ca raportul dintre cele mai luminoase
şi cele mai întunecate elemente din imagine.
Noi putem distinge că două intensităţi sunt diferite dacă diferă cu mai mult de 1%.
Această proprietate mai este numită şi sensibilitatea contrastului, care se defineşte ca
diferenţa dintre două zone la care de abia se disting diferenţele de intensitate. Din aceste
considerente, pentru a păstra calitatea originală a imaginii, pasul de cuantificare trebuie să
fie egal sau mai mic decât sensibilitatea contrastului de 1%.

7
Bazându-ne pe sensibilitatea vizuală de 1 la 100 şi a pasului de cuantificare de 1%
a valorii luminozităţii, avem nevoie de aproximativ 460 cuantificări. Aceasta este
calculată astfel:
H =L  (1 + p)n

Unde H reprezintă maximul nivelului de intensitate, L este minimul nivelului de


intensitate, p este mărimea pasului, reprezentat ca procent din intensitatea nivelului
curent, iar n este numărul de cuantificări necesar pentru a acoperi plaja de intensităţi
dintre L şi H.
Pentru a reprezenta 460 de nivele sunt necesari 9 biţi. Calitatea imaginilor de la
televizoarele actuale, au un raport al contrastului între 10:1 şi 20:1. Pentru acest tip de
imagini, 8 biţi sunt suficienţi.

Digitalizarea imaginilor video color

Până acum ne-am confruntat cu reprezentarea digitală a imaginilor video


monocrome (componenta de luminozitate). Pentru reprezentarea componentelor
imaginilor color se folosesc aceleaşi principii ca şi la digitalizarea luminozităţii. Pentru
imaginile video color compuse din cele 3 culori primare, trebuie să digitalizăm separat
fiecare componentă în parte. În cazul nostru fiecare pixel în parte este reprezentat de un
set de 3 numere, corespunzând celor 3 culori primare. Fiecare componentă de culoare
necesită aceeaşi lungime de bandă ca şi pentru semnalul de luminozitate şi necesită
aceleaşi nivele de cuantificare. Deci imaginile video color necesită de 3 ori lărgimea de
bandă faţă de imaginile alb-negru. De exemplu un semnal video PAL are o lărgime de
bandă de 5.5 MHz, deci vom avea nevoie să îl cuantificăm la puţin mai mult de 11 MHz,
în mod normal la 13.5 MHz.
Ce am calculat mai sus este pentru semnale brute, neprelucrate, de reprezentare a
semnalelor digitale. În practică, semnalul video este convertit mai întâi în componentele
luminozitate şi cromatică şi de abia apoi în formă digitală. Deoarece ochiul uman este
mai puţin sensibil la componentele cromatice, lărgimea de bandă pentru ele poate fi
redusă. Deci având o lărgime de bandă mai mică pentru componentele cromatice, pe
total, rata de transfer pentru reprezentarea imaginilor digitale este mai mică. Această
formă de compresie se bazează pe proprietăţile de percepţie ale ochiului uman. Atunci
când convertim în semnal digital luminozitatea şi cromatica separat, componentele de
cromatică pot fi eşantionate la jumătate faţă de componenta de luminozitate.

Reprezentarea bitmap a imaginilor şi filmelor digitale

La procesul de conversie analog-numerică nu este nevoie eşantionăm semnalul


video şi în perioadele dintre scanări (horizontal and vertical blanking periods). In timpul
procesului de afişare a imaginii, cât timp se ştie numărul de pixeli pe linia scanată şi
numărul de linii dintr-un frame, semnalele de sincronizare pot fi generate local.
O imagine digitală constă dintr-o înşiruire de pixeli. Numărul de coloane este egal
cu numărul de pixeli dintr-o linie, iar numărul de rânduri este egal cu numărul de linii

8
scanate. De aceea, atunci când vorbim de imagini monocrome este normal să le vedem ca
pe un tabel bidimensional. Fiecare element este intensitatea pixelului corespunzător din
imagine. Pentru imaginile color, fiecare pixel are un set de 3 valori, corespunzătoare celor
3 culori primare, sau unul pentru luminozitate şi 2 pentru cromatică. De aceea este
convenabil să vedem o imagine digitală color ca 3 tabele bidimensionale. Atunci când
valorile pixelilor sunt reprezentate în componente pentru luminozitate şi cromatică,
dimensiunea tabelului pentru cele 2 componente de cromatică poate fi mai redusă decât
pentru luminozitate. Pe parcursul procesului de afişare a imaginii toate aceste 3
componente trebuiesc combinate pentru a reproduce imaginea originală.
Aranjamentul acestor pixeli într-o zonă coniguă de memorie este denumită hartă
de biţi (bitmap). Această denumire vine de la ideea că mapăm imaginea fizică compusă
din pixeli, în zone adiacente de memorie. Într-un bitmap există o locaţie de memorie
(posibil chiar 3 pentru imaginile color) unică, corespunzând fiecărui pixel din imagine.
Bitmap-urile sunt cel mai folosite pentru displayuri. Memoria folosită pentru a păstra
imagini bitmap se numeşte framestore sau frame buffer.

Alte surse de imagini digitale

Până acum singura sursă discutată de imagini video este camera de filmat
(fotografiat) . Deşi este foarte importantă, mai sunt şi altele. O alta este scanerul, care
converteşte documente şi imagini tipărite într-o reprezentare digitală. Imaginile scanate
pot fi de asemenea color, în nuanţe de gri, sau alb-negru.
Imaginile generate pe calculator sunt de asemenea imagini digitale, atunci când
sunt salvate într-un bitmap şi nu în formă vectorială.
Deşi imaginile digitale pot proveni din numeroase surse, ele sunt tratate în aceeaşi
manieră, de calculator: fiecare imagine este un tabel bidimensional (sau 3 tabele
bidimensionale) de pixeli. Imaginile video digitale sunt secvenţe de imagini statice,
afişate cu o anumită rată. Cu toate acestea, valorile pixelilor din imagini provenite din
surse diferite pot avea înţelesuri diferite, deşi toate pot fi reprezentate în format RGB.

S-ar putea să vă placă și