Sunteți pe pagina 1din 32

9.

ECHIPAMENTE DE SUNET
Încă de la introducerea pe piaţă, în 1982, a primului PC, aproape fiecare
calculator a fost prevăzut cu un mic difuzor intern. Semnalul sonor este produs
prin variaţia tensiunii aplicate difuzorului, la frecvenţe controlate prin soft.
Deşi, la început, rolul difuzorului era doar de avertizare, extinderea în
special a jocurilor a îndreptat atenţia către dezvoltarea modalităţilor de
producere, stocare, prelucrare şi redare a sunetului.
În esenţă, această tehnologie de prelucrare şi producere a sunetelor
cu ajutorul computerului are la bază trei etape de prelucrare:
• eşantionarea semnalului analogic cu o anumită frecvenţă de
eşantionare, cu ajutorul unui circuit sample & hold;
• digitizarea semnalului, cu ajutorul unui convertor analog-digital;
• stocarea biţilor într-un format numeric specificat.
Forma analogică a semnalului este exprimată digital printr-un număr
de biţi care indică valoarea (înălţimea) sunetului (pe axa OY), iar unitatea de
timp (axa OX) este dată de frecvenţa de eşantionare.
Frecvenţele de eşantionare mai uzuale sunt 11,025 kHz, 22,05 kHz şi
44,1 kHz. În sisteme DAT, se mai utilizează şi frecvenţele de 32 kHz şi 48 kHz.
Frecvenţele de 11,025 kHz şi 22,05 kHz au fost utilizate de firmele AdLib
şi Creative Labs în primele versiuni ale cartelelor de sunet. Azi, se utilizează
frecvenţa de 44,1 kHz, caracteristică pentru CD-DA, ceea ce asigură o bandă de
peste 20 kHz, mai mult decât suficientă pentru cea mai „ciulită” ureche.
Numărul biţilor pe care se exprimă un eşantion, aşa-numita rezoluţie,
determină spectrul dinamic (raportul dintre sunetul cu cea mai mare şi cel cu
cea mai mică intensitate). Astfel, o eşantionare pe 8 biţi duce la un spectru
dinamic de 48 dB, iar pentru 16 biţi se ajunge la un spectru dinamic de 96 dB.

9.1. FORMATE AUDIO UZUALE


Pentru stocarea sunetului, s-au stabilit de-a lungul timpului numeroase
tipuri de fişiere, care definesc formate audio dintre cele mai diverse.
WAV este un format la care fişierele provin din prelucrarea unui sunet
original în format MIC (PCM). După eşantionare şi digitizare, fişierului i se
Echipamente multimedia

adaugă un antet (header), în care se specifică, printre altele, frecvenţa de


eşantionare şi numărul de biţi pe care este memorată amplitudinea semnalului.
VOC este un format introdus de Creative Labs pentru primele
cartelele soundblaster. Iniţial, nu avea antet, parametrii trebuind setaţi manual.
MID este o extensie care provine de la MIDI (Musical Instruments
Digital Interface), fiind folosit pentru instrumentele muzicale electronice cu
clape, cuplate cu un calculator. Este util pentru a permite prelucrarea sunetelor
pe un alt instrument decât cel pe care au fost create. Pot fi redate cu ajutorul
cipului FM sau wavetable, cu care este echipată cartela de sunet.
MOD este un format de fişier care conţine atât sunete originale,
asemănătoare cu cele de tip WAV, cât şi sunete predefinite, culese de la
instrumente acustice, care, prin interpolare, pot genera întreaga gamă de
sunete a instrumentelor respective. Este util în sinteza wavetable.
MP3 (MPEG Audio Layer 3) este un format lossy (cu pierderi), care
are avantajul unei calităţi ridicate la bitrate-uri scăzute, ceea ce i-a adus o
popularitate foarte mare (vezi paragraful 10.2.3.1). O dată cu răspândirea
Internetului şi, implicit, a reţelelor de tip peer-to-peer, fenomenul MP3 a luat
amploare, devenind un mijloc eficient de transfer şi stocare a muzicii pe
calculator.
MPC (Musepack, denumit în trecut MPEG Plus) este considerat cel
mai bun format de compresie audio lossy. Dezvoltat iniţial pe baza standardului
MPEG Layer 2 (MP2), îmbunătăţirile aduse acestuia din urmă îi permit oferirea
unei calităţi deosebite la bitrate-uri de peste 160 kbps. Dezavantajul principal
este calitatea la bitrate-uri mici, comparabilă cu MP3. Lucrează nativ cu tehnica
VBR, iar pentru definirea calităţii există un număr nelimitat de paşi, parametrul
quality luând valori între 0 şi 10, cu o precizie oricât de mare.
OGG este un format gratuit al firmei Vorbis, care are la bază un
algoritm care – în loc să elimine complet frecvenţele înalte sau să le păstreze,
dar să permită apariţia artefactelor – generează un fel de zgomot de fond, deloc
supărător, care păcăleşte urechea umană, frecvenţele înalte fiind denaturate în
aşa fel încât chiar şi la un bitrate de 50 kbps calitatea audio este acceptabilă,
iar, în acelaşi timp, frecvenţele înaltele sunt redate decent. Dezavantajul
principal: nu este capabil să ofere o calitate foarte bună la bitrate-uri mari.
MP3Pro este o extensie a formatului MP3, compatibilă cu acesta.
Calitatea suplimentară este obţinută exclusiv pe baza ratei de eşantionare de
22 kHz, rezultând un bitrate teoretic între 24 şi 144 kbps. Astfel, alături de
informaţia propriu-zisă, este introdusă, cu ajutorul tehnologiei SBR (Spectral
Band Replication), o secţiune responsabilă cu estimarea frecvenţelor înalte.
184
Echipamente de sunet

VQF, bazat pe tehnica TwinVQ (Transform domain Weighted


INterleave Vector Quantization), este un format dezvoltat de NTT Labs în urmă
cu mulţi ani şi achiziţionat de Yamaha mai târziu, el dorindu-se a fi, în esenţă, o
alternativă superioară lui MP3. Minusurile sunt, în ordine, calitatea bună doar la
bitrate-uri mici, limitarea la 96 kbps (corespunzător unui MP3 la < 128 kbps),
viteza de codare extrem de redusă şi promovarea slabă (proprietar: Ahead).
AAC (Advanced Audio Coding) este considerat ca fiind succesorul
formatului MP3, având şanse mari să se impună. Are avantajul posibilităţii
codării unui număr mare de canale (15), precum şi a unei rate maxime de
eşantionare de 96 kHz. De aceea, este folosit uneori la codarea sunetului
discurilor DVD, însă avantajele sale nu îl fac recomandat pentru audiofili. Este
de calitate în special la biterate-uri mici.
AC3 (Audio Coding algorithm 3) este formatul audio dezvoltat de
Dolby şi utilizat în cinematografie şi, mai nou, în codarea sunetului pentru
filmele stocate pe DVD. Se diferenţiază de alte formate prin faptul că este
conceput pentru a stoca şase canale (5.1, ultimul canal conţinând doar
frecvenţe joase, sub 120 Hz). Algoritmul este de tip transformată, iar bitrate-urile
utilizate sunt cuprinse între 32 şi 640 kbps. Codoarele de calitate sunt foarte
scumpe, de aceea formatul nu este recomandat utilizatorilor obişnuiţi.
WMA (Windows Media Audio) este formatul pe care Microsoft a
încercat, fără succes, să-l impună pe piaţă în faţa lui MP3. Popularitatea sa
relativ mare se datorează lui Windows Media Player. Fiind un codec de tip
transformată, este mai eficient la bitrate-uri mici în comparaţie cu MP3,
producând, în acelaşi timp, un sunet metalic, nu departe de cel obţinut de
OGG. Bitrate-ul maxim în versiunea iniţială (7), de 192 kbps, nu permitea decât
o calitate audio decentă, WMA fiind eficient doar la bitrate-uri sub 128 kbps.
Versiunile 8 şi 9 au oferit îmbunătăţiri remarcabile, dar fără a depăşi concurenţa.
RealAudio este un format vechi şi foarte răspândit în trecut, din cauza
utilizării sale în domeniul streaming-ului (cel mai adesea, pentru posturi de
radio on-line). Fiind format proprietar, utilizat în scopuri comerciale avantajele
sale sunt minime. De-a lungul vremii, au fost dezvoltate diverse variante, printre
care se remarcă modul de compresie lossless (fără pierderi), introdus recent.
WavPack este un format promiţător, conceput în primul rând pentru
compresia lossless. Algoritmul lossy oferă o calitate relativ bună, dar este
limitat inferior la un bitrate minim de circa 260 kbps. Avantajele lui sunt legate
de faptul că este absolut gratuit şi de facilităţile deosebite pe care le oferă. Cea
mai importantă este modul de compresie hibrid, care generează două fişiere:

185
Echipamente multimedia

primul conţinând secvenţa audio comprimată lossy, iar al doilea, de obicei mai
mare, diferenţele faţă de original.
OptimFROG este un format care oferă, pe lângă excelenta compresie
lossless, şi una cu pierderi, numită DualStream. Bitrate-urile obţinute sunt mari,
între 200 şi 500 kbps, iar calitatea – excelentă, superioară lui WavPack şi
comparabilă cu cea a oricărui format modern. Totuşi, formatul nu oferă
suficiente avantaje pentru a fi utilizat pe scară largă, calitatea sunetului fiind
uşor depăşită de alte formate în cazul unui bitrate similar. De asemenea,
OptimFROG permite folosirea modului hibrid.
ATRAC3 (Adaptive TRansform Acoustic Coding 3) este un format
proprietar Sony, introdus pentru MiniDisc-urile sale. Pe piaţa PC-urilor a apărut
ca un codec ACM (Audio Compression Manager), având disponibile doar trei
bitrate-uri: 66, 105 şi 132 kbps, calitatea fiind redusă, în principal, datorită
zgomotului de fond puternic. Există însă versiuni mai calitative, precum
ATRAC3plus, care creşte substanţial calitatea, oferind, la cei maximum 256
kbps, un sunet apropiat unui MP3 la acelaşi bitrate.
AUPECg2 (Auckland University Perceptual Entropy Coder generation 2)
este un format vechi şi care sună decent, comparabil cu MP3 la 128 kbps, dar a
cărui calitate nu poate creşte, indiferent de creşterea bitrate-ului. De remarcat,
existenţa unui plug-in pentru Winamp.
LBPack (Low Bitrate Pack) este un codor atât de lent, încât nu poate
avea nicio utilitate practică (o melodie este codată în 5-10 minute pe un sistem
modern), dar care surprinde prin calitatea foarte bună la bitrate-uri scăzute,
chiar şi la 15 kbps sunetul fiind clar, cu toate frecvenţele prezente, dar suferind
de zgomot de fond. La bitrate maxim (146 kbps), însă, calitatea lasă de dorit.
RaveSound sau QDMC (QDesign Music Codec) este urmaşul lui
LBPack, devenind codecul audio oficial, prezent în Apple QuickTime 3.
Versiunea personală oferă posibilitatea unui bitrate maxim de 48 kbps, iar
varianta profesională urcă până la 128 kbps. Este unul dintre cele mai agresive
formate existente, în sensul că oferă calitate bună la bitrate-uri foarte scăzute,
dar, o dată cu mărirea bitrate-ului, creşterea calităţii se plafonează.
PAC (Perceptual Audio Coding) face parte din software-ul AudioLib. Este
asemănător din toate punctele de vedere lui MP3. Muzica astfel codată este
integrată într-o bază de date, singura modalitate de a o asculta fiind folosirea
acestui software. În versiunea a doua, denumită ePAC (Enhanced Perceptual
Audio Coding), softul suferă îmbunătăţiri majore, în primul rând, de interfaţă.
Astrid/Quartex AAC este un format care nu are nimic de-a face cu
AAC, chiar dacă sună surprinzător de bine la un bitrate de doar 96 kbps. La
186
Echipamente de sunet

realizarea acestui codor, au contribuit în cea mai mare măsură sursele preluate
de la AudioLib. Executabilele au fost criptate, pentru mai multă siguranţă.
APE este un format lossless, la care softul pentru codec poartă
numele de Monkey’s Audio şi oferă, ca în cazul arhivatoarelor, mai multe nivele
de compresie: Fast, Normal, High, Extra High şi Insane, al doilea şi al treilea
fiind cele recomandate, iar ultimele două având ca dezavantaj principal
procentul mare de procesor consumat la decodare şi, deci, imposibilitatea
rulării piesei muzicale pe sisteme foarte lente.
FLAC (Free Lossless Audio Codec) este tot un format fără pierderi,
care oferă 9 nivele de compresie (de la 0 la 8, valoarea 5 fiind recomandată),
atât timpul, cât şi rata de compresie diferind în funcţie de acest parametru.
Formatul FLAC este susţinut de Xipg.org, organizaţia non-profit care se află în
spatele formatului Vorbis. Dezavantajul lui, la fel ca al oricărui format lossless,
este că rata de compresie este mică şi produce fişiere de dimensiuni mari. Este
ideal, însă, pentru înregistrările de muzică clasică.
Alte formate de compresie lossless care merită amintite sunt
WavPack, RK Audio, Shorten, TTA şi La. Acestea oferă, uneori, rate de
compresie mai bune, dar nu prezintă suficiente avantaje pentru a detrona
formatele APE sau FLAC. Alte tipuri de fişiere de sunet reprezintă formate
proprietar sau sunt dedicate unor aplicaţii specifice: .rol, .snd, .sou, .au, .ul, .iff,
.aif, .fssd etc.

9.2. CARTELE DE SUNET


Cartelele de sunet (hardware-ul de sunet) pot fi împărţite în două categorii:
• în prima categorie, numită low-end, intră PC-ul cu difuzorul intern
plus electronica aferentă, precum şi primele generaţii de
soundblaster-e (cu eşantionare la frecvenţa de 11,025 kHz şi
rezoluţie pe 8 biţi);
• în cea de-a doua categorie, high-end, intră cartelele de sunet
specializate, cum sunt cele moderne, produse de firme specializate.
Un alt criteriu de clasificare al cartelelor de sunet este cel care ţine
cont de modalitatea de sinteză a sunetului: FM, wavetable, substractivă (sau
analogică), cu ghiduri de undă (sau prin modelarea fizică a instrumentelor),
MIDI, cu modulaţie de fază, cu reţele neurale, sinteză software, aditivă etc.
O schemă bloc pentru o cartelă de sunet cu sinteză FM este
reprezentată în figura 9.1. Schema fiind foarte clară, nu mai necesită explicaţii.
187
Echipamente multimedia

Fig. 9.1. Schema bloc a unei cartele de sunet cu sinteză FM.

O schemă bloc pentru o cartelă de sunet cu sinteză wavetable este


reprezentată în figura 9.2.

Fig. 9.2. Schema bloc a unei cartele de sunet cu sinteză wavetable.

Componenta unui sistem de calcul care se ocupă cu prelucrarea


semnalelor audio se numeşte interfaţă audio (placă de sunet, sound card sau
soundblaster). Arhitectura acestui dispozitiv (vezi figura 9.3) se compune din
următoarele elemente:
188
Echipamente de sunet

Fig. 9.3. Schema de principiu a unui soundblaster.

189
Echipamente multimedia

• mixerul analogic – este format din multiplexoare analogice,


amplificatoare/atenuatoare programabile şi sumatoare analogice.
Acceptă ca intrări semnalele de la convertoarele digital-
analogice (CDA) din codec, conectorul CD-in, intrarea de
microfon, intrarea line-in, intrarea pentru PC-speaker şi semnalul
generat de blocul de sinteză FM. Permite controlarea proporţiei
în care fiecare sursă de semnal participă la semnalul de ieşire
rezultat. De asemenea, permite selectarea sursei de intrare care
va fi eşantionată şi reţinută de placa de sunet.
• audio codecul – conţine convertoarele digital-analogice (CDA) şi
analog-digitale (CAD) ale plăcii de sunet. Este direct conectat la
mixer (prin semnale analogice) şi la liniile digitale ale plăcii.
Realizează transformarea numeric-analogică a informaţiei de pe placă.
• generatorul FM şi tabela cu forme de undă – sunt facilităţile de
generare de sunet (sinteza audio). Sinteza sunetului va fi
discutată detaliat în paragraful 9.3.
• intrarea/ieşirea – pentru joystick (jocuri) sau MIDI.
O cartelă audio profesionistă, pe lângă rezoluţie pe 16, 32 sau 64 biţi
şi eşantionare la 44,1 kHz, este necesar să mai aibă un procesor DSP, care să
preia cea mai mare parte din sarcina procesorului sistemului gazdă.
De asemenea, este necesar un soft de înregistrare, editare, mixare şi
prelucrare a fişierelor de sunet, un conector MIDI, un secvenţiator MIDI cu
implementarea standardului MIDI (vezi paragraful 9.3.5) şi o intrare de CD-ROM.

9.3. SINTEZA SUNETULUI


În domeniul sunetului pe PC, există tehnologii care deja sunt depăşite,
precum şi tehnologii care au fost implementate mai recent pe computere.

9.3.1. Sinteza FM
Este una din primele metode care au ca produs final sunetul produs de
un sintetizator electronic. Îşi are începuturile în 1976 şi constă, în esenţă, în
modificarea unui semnal sinusoidal cu ajutorul altui semnal sinusoidal. Evident,
rezultatul iniţial suna artificial; mai târziu, tehnologia a fost îmbunătăţită, dar
sunetul astfel produs tot fals sună. Sinteza FM se bazează pe folosirea funcţiilor

190
Echipamente de sunet

Bessel şi vine cu un aparat matematic complex. În continuare, se va prezenta


variantă simplificată a sintezei FM, pusă la punct de firma Korg, şi care constă
în ponderarea dinamică a armonicilor care, însumate, vor da timbrul sunetului.
Pentru generarea unui sunet este nevoie de următoarele date iniţiale:
• numărul eşantioanelor generate pe o perioadă (K0);
• numărul armonicilor care intervin în timbrul sunetului respectiv (N);
• intervalul de timp între două eşantioane succesive (T).
Aceste date sunt oferite de calculator procesorului DSP de pe placa de
sunet. Valorile intermediare sunt calculate astfel:
• N = (20 kHz)/f0, unde f0 este frecvenţa fundamentalei sunetului care
se vrea generat. Pentru un N > 32, se ia N = 32.
• Ki = (20 kHz)/(i×f0), cu i = 1÷N, iar pentru un K < 4, se ia K = 4.
• K0 = N×Ki, pentru fiecare i = 1÷N.
• dk = 1024 div K0, pentru fiecare i = 1÷N (incrementul care
actualizează la fiecare pas pointer-ul care adresează tabela sinus).
Pentru generarea unui sunet, se procedează astfel.
1. Se încarcă din EPROM în memoria internă de date cele 1024
eşantioane ale unei perioade a funcţiei sinus.
2. În memoria externă de date, se încarcă ponderile armonicilor. Tabela
de ponderi este organizată în zone de 32 de octeţi şi conţine atâtea
zone câte schimbări de spectru au loc în timpul generării sunetului.
3. Se încarcă apoi valorile K0, N, T şi dk. Incrementul dk este
încărcat într-un registru index, cu care se va actualiza registrul
care adresează tabela funcţiei sinus. Cu T este încărcat registrul
de numărare al timer-ului integrat, care va genera o întrerupere la
fiecare 5×T ns (ceasul fiind cel de 400 MHz). Rutina de servire a
acestei întreruperi trimite eşantionul curent la convertorul DA.
4. După primirea datelor iniţiale, se trece la generarea sunetului. Un
eşantion al semnalului se calculează cu relaţia:
N
Y j = ∑ S ji × A( i + B ) ,
i =1

pentru j = 1÷1024, unde Sji este eşantionul de ordin j din cadrul


unei perioade a armonicei i, A(...) este tabela de ponderi, iar B
este adresa de bază a zonei curente de 32 de octeţi. Pentru
modificarea spectrului în timpul generării, se modifică valoarea lui
B şi se trece la un alt segment de 32 de ponderi.
191
Echipamente multimedia

9.3.2. Sinteza wavetable


Este o tehnologie care îşi are începuturile în 1984, fiind pusă la punct
de firma Ensoniq Corp. Sinteza wavetable constă, în esenţă, în prelevarea de
sunete de înaltă calitate de la instrumente acustice, sunete stocate sub numele de
wavefiles, waveform files sau wavetables. Apoi, prin extrapolare, cartela sintetizează
întreaga diversitate de sunete pe care respectivul instrument o poate genera.
Extrapolarea are la bază următoarea idee: în cadrul timbrului
eşantionului de sunet cules, există armonici care au o anumită ponderare faţă
de valoarea fundamentalei, f0. În cazul generării unui sunet pe altă frecvenţă, f1,
se ia din sunetul iniţial armonica de la f1 şi se consideră fundamentală, apoi se
adaugă în jurul ei armonici ponderate, la fel ca în sunetul iniţial.
Elementul de bază al sintezei wavetable este un generator static de
unde, care foloseşte un tabel circular de valori secvenţiale ale undei, un
acumulator de fază pentru generarea de adresă şi metode de interpolare între
fişierele wavetable vecine. În figura 9.4 este ilustrat mecanismul sintezei wavetable.

Fig. 9.4. Schema bloc a sintezei wavetable.

Formele de undă rezidente în memorie utilizează mai multe fişiere


wavetable, cu sunetul înregistrat pe o perioadă sau mai multe (kT), incluzând şi
timpii de atac (attack), amortizare (decay), susţinere (sustain) şi descreştere
(release), aşa cum se poate observa în figura 9.5.

Fig. 9.5. Intervalele semnificative din emisia unui sunet produs de un instrument.

192
Echipamente de sunet

Timpul de atac (attack) este intervalul cuprins între momentul declanşării


sunetului şi momentul în care anvelopa acestuia ajunge la maxim.
Timpul de amortizare (decay) este intervalul în care anvelopa scade la
nivelul dictat de parametrul susţinere.
Timpul de susţinere (sustain) este intervalul în care instrumentul menţine
sunetul emis la un nivel constant (nu este prezent la toate instrumentele).
Timpul de descreştere (release) este intervalul în care, după încetarea
emisiei sonore a instrumentului, anvelopa scade de la nivelul de susţinere la zero.
Aceşti timpi sunt specifici fiecărui instrument în parte. Este evident că
un sunet de pian, de chitară sau de percuţie va avea timpul de susţinere foarte
mic, timpul de descreştere începând, practic, din momentul în care se termină
timpul de atac.
Deci, în memoria RAM a calculatorului se vor transfera fişiere care
conţin sunete eşantionate, prelevate de la instrumente acustice, plus diferite
informaţii care ţin de volum, balans, frecvenţă de răspuns, antialiere,
supraeşantionare, precum şi de mixajul între canale. De asemenea, conţin
informaţii privind full vibrato şi full tremolo (modulaţiile în frecvenţă şi, respectiv,
în amplitudine).
Pe durata unui sunet, apar următoarele momentele semnificative:

start sound start loop end loop end sound

Între start sound şi start loop, apare caracteristica de atac, iar între end
loop şi end sound, caracteristica de descreştere.
În cadrul buclei (loop), are loc sunetul propriu-zis, iar bucla durează
cât timp este necesar pentru a acoperi durata sunetului. O asemenea buclă nu
există în cazul sunetelor care nu au timp de susţinere.
Alte facilităţi, precum efectele de reverb, phasing sau distors, sunt
implementate în driver-e.

9.3.3. Sinteza substractivă (analogică)


Sinteza substractivă este denumită adesea sinteză analogică,
deoarece majoritatea sintetizatoarelor cu sinteză substractivă folosesc metode
analogice pentru a genera sunetele. În forma cea mai simplă, sinteza
substractivă se bazează pe schema bloc reprezentată în figura 9.6.
193
Echipamente multimedia

Fig. 9.6. Schema bloc a sintezei substractive.

Oscilatorul este folosit pentru a genera un sunet, filtrul este folosit


pentru a reţine o parte din spectrul armonic, iar amplificatorul este folosit pentru
a controla amplitudinea sunetului în timp, cu scopul de a simula anvelopa
amplitudinii unui instrument natural. Pe scurt, în cadrul sintezei substractive se
porneşte de la un sunet, se filtrează părţile nedorite din spectrul de frecvenţe şi
se controlează volumul în timp.

9.3.3.1. Oscilatorul

Oscilatorul generează o formă de undă cu o anumită frecvenţă. Există


multe tipuri de oscilatoare în cadrul unui sintetizator analogic. Oscilatorul
principal este oscilatorul comandat de claviatură. Aceasta înseamnă că atunci
când se apasă o clapă, oscilatorul generează formă de undă cu frecvenţa
corespunzătoare.
Exemplu. La apăsarea notei la’ – sub do-ul central – frecvenţa undei
produse va fi de 440 Hz.
Forma undei generate de oscilator determină timbrul, caracteristica
sau strălucirea sunetului. În timp ce înălţimea este determinată de frecvenţa
fundamentală, timbrul este format din multe alte frecvenţe (armonice), care dau
instrumentului identitate. Fiecare tip de formă de undă (dreptunghiulară, dinte
de fierăstrău, impuls, zgomot alb etc.) are armonice diverse.

9.3.3.2. Filtrul

Filtrul este folosit pentru a îndepărta frecvenţe din spectrul formei de


undă, alterând astfel timbrul. Se folosesc mai multe tipuri de filtre: filtru trece-jos
(FTJ), filtru trece-bandă (FTB) şi filtru trece-sus (FTS), ale căror funcţii pondere
(în domeniul timp) şi funcţii de transfer (în domeniul frecvenţă) sunt cunoscute.
Parametrii filtrelor sunt: frecvenţa de tăiere (care determină banda de
tăiere sau banda de trecere), frecvenţa de rezonanţă şi panta.
194
Echipamente de sunet

9.3.3.3. Amplificatorul

Ultimul proces major în producerea unui sunet este volumul.


Amplificatorul foloseşte o anvelopă pentru a controla amplitudinea sunetului în
timp. Anvelopa este activată prin apăsarea clapelor claviaturii. Generatorul de
anvelopă are, de obicei, cei 4 parametri cunoscuţi (vezi paragraful 9.3.2): atac,
amortizare, susţinere şi descreştere.

9.3.3.4. Modulaţia

Modulaţia este folosită pentru a face sunetul mai expresiv. Anvelopa


de volum a fost studiată în corelaţie cu etapele unui sunet, însă anvelopele pot
fi folosite şi pentru a modula alţi parametrii. De exemplu, o anvelopă poate
modula frecvenţa de tăiere a filtrului sau frecvenţa oscilatorului comandat de
claviatură.
Un semnal modulator uzual în cadrul sintetizatoarelor substractive este
un LFO (Low Frequency Oscillator) – oscilator de joasă frecvenţă: 0,1÷10 Hz.
Formele de undă folosite sunt triunghiulară, dreptunghiulară, dinte de fierăstrău
şi sinusoidală.
Exemple.
1. LFO modulează frecvenţa oscilatorului comandat de claviatură,
rezultând un vibrato (formă de undă sinusoidală sau triunghiulară), un tril (formă
de undă dreptunghiulară, variaţie rapidă a înălţimii sunetului) sau o sirenă
(formă de undă dinte de fierăstrău).
2. LFO modulează frecvenţa de tăiere a filtrului, iar, dacă valoarea
frecvenţei de rezonanţă este mare, se obţine efectul wah-wah.
3. LFO modulează amplitudinea semnalului, forma de undă
sinusoidală sau triunghiulară producând un tremolo (variaţii line ale amplitudinii).
4. Velocitatea (viteza cu care sunt lovite clapele) poate modula
amplitudinea semnalului, timpul de atac al anvelopei de amplitudine, frecvenţa
de tăiere a filtrului, anvelopa filtrului etc.

9.3.3.5. Metode de îmbogăţire a spectrului armonic

Multe sintetizatoare permit ca două sau multe oscilatoare să fie


mixate. Forma de undă care rezultă este suma celor două forme de undă
implicate. Spectrul noii forme de undă este, de asemenea, suma spectrelor
armonicelor celor două forme de undă.
195
Echipamente multimedia

O altă metodă de diversificare a timbrului (şi, totodată, de îmbogăţire a


spectrului armonic) este oscillator sync. Această metodă foloseşte două
oscilatoare, dintre care unul (master) îl resetează pe celălalt (slave) la fiecare
nouă perioadă. Forma de undă a oscilatorului master este irelevantă,
importantă fiind doar frecvenţa sa (vezi figura 9.7).

Fig. 9.7. Forma de undă sync din două variante de perechi de oscilatoare master-slave.

Sync skew manipulează frecvenţa oscilatorului slave pe durata unei


perioade a oscilatorului master. Efectul produs este frecvenţa crescută la
sfârşitul fiecărei perioade, în cazul modulaţiei sync skew positive, şi la începutul
fiecărei perioade, în cazul modulaţiei sync skew negative. Sync skew afectează
şi formele de undă standard: dreptunghiulară (vezi figura 9.8) şi dinte de
fierăstrău (vezi figura 9.9).

Fig. 9.8. Efectul skew (negativ şi pozitiv) aplicat formei de undă dreptunghiulare.

196
Echipamente de sunet

Fig. 9.9. Efectul skew (negativ şi pozitiv) aplicat formei de undă dinte de fierăstrău.

Formant width este un parametru care controlează amplitudinea


ciclurilor oscilatorului slave. Efectul produs este creşterea amplitudinii
armonicelor (vezi figura 9.10).

Fig. 9.10. Formant width aplicat formelor de undă sync, dreptunghiulară şi dinte de fierăstrău.

Skew şi formant width se pot folosi împreună, pentru a crea forme de


undă noi (vezi figura 9.11).

Fig. 9.11. Efectul combinat skew & formant width aplicat aceloraşi forme de undă.
197
Echipamente multimedia

Ring modulation este similar modulaţiei FM, semnalele celor două


oscilatoare fiind multiplicate. Ieşirea furnizează suma şi diferenţa dintre semnalele
de intrare (vezi figura 9.12). Sunetele create au caracter metalic şi de clopot.

Fig. 9.12. Efectul ring modulation aplicat aceloraşi forme de undă.

Toate aceste metode îmbogăţesc spectrul armonic al formelor de undă


de bază. Unda urmează calea unui filtru, pentru a înlătura armonice nedorite.
Filtrul este o unealtă de bază în cadrul sintetizatorului analogic. După cum se
observă din figura 9.13, diferite forme de undă sunt produse de oscilatoare
diferite folosind metode diferite. Oscilatoarele, generatorul de zgomot şi ieşirile
modulatoarelor în inel sunt mixate, iar ieşirea mixerului este servită filtrului.

Fig. 9.13. Generarea diferitelor forme de undă printr-un număr de 6 oscilatoare,


care combină mai multe metode de îmbogăţire a spectrului armonic.

9.3.4. Sinteza cu ghiduri de undă


Sinteza cu ghiduri de undă (sau prin modelarea fizică a instrumentelor)
a fost introdusă în anii '90. A fost preluată din tehnologia de producere a muzicii
electronice şi are la bază teoria ghidurilor de undă. Esenţa constă în crearea
unor instrumente virtuale prin modularea unor parametri ai ecuaţiei undelor.
198
Echipamente de sunet

Cel mai simplu model de ghid de undă îl reprezintă fluierul (vezi figura
9.14): un tub rezonant deschis sau închis, cu o reţea de orificii pentru
modificarea frecvenţei de rezonanţă şi o ancie (element vibrator).

Fig. 9.14. Fluierul ca model al tubului de rezonanţă deschis (stânga) şi închis (dreapta).

Modelul matematic analog este o linie de întârziere bidirecţională, iar


orificiile pot fi privite ca nişte reţele transversale care împart energia între
diverse frecvenţe. Ancia poate fi implementată ca un oscilator neliniar. În loc să
se calculeze variabilele fizice ale ecuaţiei undelor pentru fiecare sunet în parte
şi pentru fiecare instrument (ceea ce ar fi o muncă sisifică), se rezolvă ecuaţia
undelor pentru un caz particular, apoi aceste unde sunt simulate în modelul digital
al instrumentului, obţinându-se în final, prin sumarea undelor, sunetul la ieşire.
În cazul teoretic al mediului fără pierderi, simularea unei unde în
mişcare se poate face cu ajutorul unei linii digitale de întârziere. În soft, o linie
de întârziere poate fi implementată ca o secvenţă simplă de fetch şi store, cu
un pointer actualizat pentru fiecare eşantion. În realitate, există dispersie şi
pierderi dependente de frecvenţă, dar s-a descoperit că acestea pot fi grupate
şi modelate punctual, deci, simularea tot printr-o linie fără pierderi se va face.
Rezultatul net este o scădere de aproximativ 1.000 de ori a puterii de calcul
necesare pentru algoritmii de sinteză, faţă de rezolvarea directă a ecuaţiei undelor.
Un amănunt interesant, care face această tehnologie atractivă, este
noţiunea de microfon virtual. O familie întreagă de instrumente (de exemplu,
instrumentele cu corzi) poate fi simulată printr-unul singur, numit metainstrument.
Caracteristicile fiecărui instrument din familia respectivă pot fi create prin simpla
deplasare a unui microfon virtual în diferite locaţii ale metainstrumentului.
Printre tendinţele actuale, mai există tehnici de sinteză a sunetului
utilizând modulaţia de fază (Phase Modulation) şi reţele neurale, dar şi sinteza
aditivă sau sinteza software (Software Synthesis) etc.

9.3.5. Sinteza MIDI


Standardul general MIDI a fost lansat în 1991, pentru implementarea
pe diferitele staţii de lucru. Conform specificaţiei MIDI, fluxul de date este
bidirecţional, la fiecare octet adăugându-se un bit de start şi unul de stop.
199
Echipamente multimedia

Este un protocol hardware şi software care permite ca anumite


instrumente muzicale să poată intercomunica. Evenimentele vehiculate pe
magistrala MIDI pot fi înregistrate ca fişiere de tip MIDI, pentru modificări sau
execuţii ulterioare. Multe plăci de sunet actuale sunt prevăzute cu interfaţă
MIDI. Cele care nu sunt, pot, în schimb, să interpreteze fişiere MIDI utilizând
propriile resurse. Din punct de vedere hardware, fiecare unitate MIDI este
prevăzută cu trei tipuri de semnale, care sunt utilizate pentru interconectarea
de tip serial (lanţ sau secvenţă MIDI):
• MIDI in: conectorul prin care unitatea MIDI recepţionează toate
informaţiile;
• MIDI out: conectorul prin care unitatea transmite spre exterior
informaţia produsă;
• MIDI through: conectorul prin care unitatea retransmite înapoi
spre exterior tot ceea ce găseşte pe linia MIDI in.
Câţiva dintre termenii utilizaţi frecvent în standardul MIDI sunt:
• sintetizator (synthesizer): generator de sunet (cu acuitatea,
intensitatea şi nuanţa tonului variabile);
• secvenţiator MIDI (sequencer): unitate fizică sau program care
implementează standardul MIDI, putând să memoreze şi să
modifice datele muzicale codificate MIDI;
• tastatura MIDI: produce intensitatea sunetului şi dă efecte speciale;
• pista (track): unitate logică utilizată pentru organizarea înregistrărilor;
• canal (channel): utilizat pentru separarea informaţiei pe magistrala
MIDI (există minimum 16 canale MIDI pe o magistrală);
• voce MIDI (voice): element din sintetizator care produce sunetul,
la rezultatul final putând contribui mai multe voci independente.
Cele mai multe mesaje MIDI (care pot fi generate de un controler MIDI –
instrument sau MIDI sequencer) sunt de tip channel messages. Acestea constau
dintr-un octet de stare (status byte) şi unul sau doi octeţi de date. Status byte
include 4 biţi cu adresa canalului (unul din cele disponibile). Primul octet de
date indică clapa care a fost apăsată, iar cel de-al doilea controlează volumul.
Generatoarele de sunet pot avea 16, 24, 48, 64 de voci sau chiar mai
multe, vocea aici însemnând un sunet la un moment dat. Ansamblul sunetelor
care pot fi produse simultan formează un timbru (patches, programs, algorithms).
Standardul general MIDI specifică tipurile de timbruri şi încorporează funcţiile
de pe Roland General Synthesizer. Astfel, sunt necesare minimum 128 timbruri
pentru instrumentele acustice şi, de exemplu, 46 tipuri de percuţie.

200
Echipamente de sunet

9.4. SUNETUL 3D
În viaţa de zi cu zi, pot fi percepe sunete venind din diferite direcţii.
Urechea umană este capabilă de a defini cu mai multă sau mai puţină precizie
direcţia sunetului şi distanţa până la sursa de provenienţă. Deci, este de dorit
ca sistemele de reproducere a sunetelor să ofere un sunet tridimensional.

9.4.1. Evoluţia sistemelor de sunet


Sunetul stereo a fost primul pas către un sunet multidimensional. Dar
sistemul stereo obişnuit sau căştile nu pot garanta satisfacerea totală a
audiofililor. Un sunet stereo are un defect esenţial: a fost netezit şi restricţionat de
unghiul format de direcţiile boxelor (nu sună natural). O posibilitate de conectare a
unui set de 4 difuzoare la un amplificator stereo, pentru a reda un surogat de
sunet 3D, a fost implementat pe placa Gravis UltraSound (vezi figura 9.15).

Fig. 9.15. Un exemplu de sistem audio pseudo-3D.

Difuzoarele din spate este indicat să aibă puteri mai mici. Prin
utilizarea celor 3 potenţiometre (50 Ω, 10 W), se poate deplasa punctul de
focalizare în spaţiul dintre difuzoare.
Quadrofonia a fost pasul următor în înregistrarea şi redarea sunetului.
Au fost proiectate sistemele quadrofonice incompatibile JVC CD-4, CBS SQ şi
Sansui QS, dar experţii nu le-au prea apreciat, iar utilizatorii au observat că nu
redau în totalitate sunetul real. Primele sisteme quadrofonice nu ofereau o
panoramă stereo circulară, ascultătorul percepea un sunet stereo în faţă şi altul
similar în spate. Fără sunet 3D complet, quadrofonia a dat greş, producătorii
decizând să crească numărul canalelor de sunet. Ca rezultat, au apărut mulţi
monştri multicanal (vezi figura 9.16).
201
Echipamente multimedia

Fig. 9.16. Sistem multicanal de reproducere a sunetului.

9.4.2. Sunetul biacustic


Înregistrarea sunetului biacustic este cea mai bună metodă de imitare
a sunetului 3D. În acest caz, informaţia audio este înregistrată de microfoane
aşezate în urechea unui ascultător real sau artificial, care simulează simţul
auzului uman (vezi figura 9.17).

Fig. 9.17. Cap artificial pentru microfoane 3D.

Semnalul de la fiecare microfon este preluat de amplificatoare


separate de joasă frecvenţă şi, apoi, redat de căşti stereo. Un astfel de sistem
oferă posibilitatea creării iluziei unui sunet viu, natural. Dar este nevoie de căşti
stereo de înaltă calitate şi de un cap artificial proiectat după propriul cap al
fiecărei persoane pentru a aprecia avantajele în totalitate. Este recomandată
folosirea unui microfon special, plasat în propria ureche, pentru a atinge
maximum de efecte. Alte persoane vor simţi diferenţele dintre imitaţia sunetului
şi sunetul real, datorită caracteristicilor diferite ale auzului la diferite persoane.
Redarea unui sunet înregistrat biacustic prin intermediul unor boxe
poate reduce la zero toate avantajele sale. Semnalele din boxele din stânga şi
din dreapta pot ajunge în urechile din dreapta şi, respectiv, stânga. Ca rezultat,
sunetul este distorsionat. Este posibilă eliminarea unui astfel de defect folosind
dispozitive speciale de procesare a semnalului, cunoscute ca procesoare
202
Echipamente de sunet

bifonice. Acestea oferă posibilitatea unui efect biacustic pentru ascultarea unei
înregistrări biacustice prin intermediul boxelor. Înregistrarea făcută de
microfoane este redată după ce este procesată de procesorul bifonic, în care
valorile semnalelor defazate, întârziate şi egalizate din canalele stânga şi
dreapta sunt scăzute din cele ale canalelor dreapta şi, respectiv, stânga.
Semnalele venind de la boxe la ureche sunt însumate, astfel încât urechile
dreapta şi stânga aud semnalele de la canalele corespunzătoare.
De aceea, un efect bifonic este asemănător unuia binaural.
Reproducerea efectului binaural este singura diferenţă. Cu toate că zona în
care se pot recepţiona efectele bifonice este redusă, prin prezenţa în acel loc, o
persoană este capabilă să determine distanţa faţă de sursa sunetului şi poziţia
acesteia în timpul înregistrării. Un sunet stereo oferă doar o idee asupra locaţiei
sunetului pe o linie între cele două boxe. În plus, procesoarele bifonice pot
extinde baza stereo a unei înregistrări obişnuite. Desigur, un procesor bifonic
poate fi realizat soft, pe baza metodelor de procesare a sunetului în timp real.

9.4.3. Teoria sunetului 3D


Sursele reale de sunet pot fi considerate ca fiind puncte, deci, surse
mono. Un efect stereo apare atunci când sunetul este perceput simultan de cele
două urechi. Caracteristicile de frecvenţă ale urechii umane depind de azimut
(latitudine), locaţia sursei de sunet şi distanţa până la ea. În plus, acestea se pot
schimba în mod diferit pentru fiecare ureche. Caracteristica medie de frecvenţă
pentru urechea dreaptă şi cea stânga sunt egale, dacă în planul de simetrie al
capului există o singură sursă de sunet. În figura 9.18 se poate observa diferenţa
dintre răspunsul în timp şi răspunsul în frecvenţă obţinute de la microfoane din
interiorul urechii, atunci când sursa de sunet nu este pe suprafaţa de simetrie.

Fig. 9.18. Răspunsul în frecvenţă al urechilor umane la o sursă de sunet asimetrică.


203
Echipamente multimedia

Numeroase date arată alterarea considerabilă a răspunsului în


frecvenţă al urechii, atât timp cât distanţa şi direcţia sursei de sunet se
schimbă. Valorile diferite ale amplitudinilor şi întârzierilor semnalului sunt mai
evidente. Aparent, un creier uman analizează datele pentru a localiza sursa de
sunet în spaţiul 3D. Deci, senzaţia de localizare în spaţiu a sunetului este
legată de caracteristicile simţului auzului uman. Dacă se cunoaşte valoarea
medie a caracteristicilor urechii umane, se pot proiecta filtre digitale pentru a
imita aceste caracteristici. Mult mai detaliat este modelul spaţiu-frecvenţă al
urechii, filtrele fiind mai complicate. Imitarea unui sunet artificial 3D este
următorul pas: semnalele de la sursele mono sunt procesate de cupluri de filtre
digitale cu parametri corespunzători locaţiei dorite a sursei de sunet.
Sunt prezentaţi câţiva termeni specifici din teoria sunetului 3D.
ITD (Interaural Time Difference) – reprezintă diferenţa în timp a sosirii
aceluiaşi semnal audio la urechile unui auditor (diferenţa dintre momentul în
care un sunet ajunge la urechea stângă şi momentul în care acelaşi sunet
ajunge la urechea dreaptă). ITD apare datorită faptului că urechile nu se află în
acelaşi punct, ci sunt aşezate de o parte şi de cealaltă a capului. Cei
aproximativ 15 cm care reprezintă, în medie, distanţa dintre urechi sunt foarte
importanţi, deoarece duc la apariţia unei diferenţe în timp, e drept, extrem de
mică (circa 560 µs), între sosirea sunetului la fiecare ureche. Această diferenţă
este sesizabilă de către creier, care o foloseşte drept prim criteriu în aprecierea
poziţiei în spaţiu a unei surse de sunet.
IID (Interaural Intensity Difference) – reprezintă diferenţa dintre intensitatea
(amplitudinea, volumul) la care acelaşi sunet este perceput de fiecare ureche în
parte. Mai este cunoscută şi sub numele IAD (Interaural Amplitude Difference).
HRTF (Head-Related Transfer Functions) – este o bibliotecă de funcţii
care descriu modul în care parametrii sunetului (în special, timbrul şi spectrul)
se modifică în funcţie de amplasamentul sursei sunetului în raport cu auditorul.
Aceste funcţii iau în calcul caracteristicile dimensionale, de material şi de formă
ale capului, ale urechii şi ale porţiunii superioare a toracelui. Scopul definirii
acestor funcţii este crearea unor filtre, cu ajutorul cărora să poată fi simulat în
mod artificial amplasamentul spaţial al unui sunet.
La crearea pe cale experimentală a unui model HRTF, se utilizează o
anumită aşezare a boxelor, care determină un unghi cu vârful în poziţia
auditorului şi cu laturi care trec prin axele boxelor. În plus, este importantă şi
distanţa dintre boxe şi auditor, precum şi caracteristicile acustice ale
difuzoarelor cu care sunt dotate boxele. În cele din urmă, dacă utilizatorul
obişnuit foloseşte o dispunere mult diferită faţă de cea cu care a fost creat
204
Echipamente de sunet

algoritmul HRTF al plăcii de sunet, se pierde mult din calitatea poziţionării


spaţiale a sunetului.
De acest fapt sunt tot mai conştienţi atât producătorii de plăci de
sunet, cât şi dezvoltatorii de software, inclusiv jocuri. În consecinţă, există un
efort de a standardiza oarecum amplasamentul şi dimensiunile sistemului audio
folosit, fie şi numai prin crearea unor categorii aproximative, în care utilizatorul
să îşi recunoască şi să îşi selecteze propria configuraţie.

9.4.4. Configurarea sunetului surround


Principalul avantaj al sunetului surround este posibilitatea de localizare
spaţială a sunetului, inclusiv aria din spatele utilizatorului şi, într-o mai mică sau
mai mare măsură, spaţiul lateral al scenei. Numărul mai mare al difuzoarelor
este responsabil pentru acoperirea sonoră a întregului spaţiu de audiţie.
Când vine vorba despre sisteme audio, termenii de 4.1, 5.1, 6.1 şi 7.1
reprezintă numărul de elemente din sistemul audio. Diferenţa dintre acestea
este foarte simplă: totul depinde de numărul boxelor surround (în afara celor din
faţă şi centru). Astfel, sistemele 4.1 şi 5.1 au două boxe surround (4.1 nu are,
însă, boxa de centru), 6.1 are 3 boxe surround, iar 7.1 are 4 boxe surround.

9.4.4.1. Sistemul 4.1

În cazul unui sistem clasic 4.1, poate apărea următoarea problemă:


aşezarea clasică a unui sistem 4.1 creează zone moarte în lateral şi imediat în
spatele ascultătorului (vezi figura 9.19).

Fig. 9.19. Amplasarea incintelor acustice în sistemul de sunet 4.1.


205
Echipamente multimedia

Sistemele clasice 4.1 sunt compuse din următoarele canale: LF (Left Front)
– stânga faţă, RF (Right Front) – dreapta faţă, LR (Left Rear) – stânga spate, RR
(Right Rear) – dreapta spate şi LFE (Low Frequency Emissions) – subwoofer.
Din documentaţiile Sensaura, rezultă configuraţia de test a acestei
firme (vezi figura 9.20), configuraţie care este probabil „cea mai standard”, dat
fiind suportul extins oferit de Sensaura programatorilor DirectX de la Microsoft.

Fig. 9.20. Amplasarea incintelor acustice în sistemul de sunet Sensaura.

Boxele, atât perechea de faţă, cât şi cea de spate, trebuie să facă un


unghi de 60° cu vârful în auditor. Boxa de centru faţă şi cea de centru spate se
aşează, fireşte, pe axa centrală. Poziţia subwoofer-ului, dată fiind lungimea
mare de undă a frecvenţelor joase, este mai puţin importantă.
Chiar dacă există îndoieli în ceea ce priveşte corectitudinea
plasamentului audio tridimensional în jocuri, aceasta nu trebuie să ducă la
ridicarea unor probleme prea mari. În primul rând, algoritmii HRTF actuali sunt
destul de toleranţi la variaţiuni în poziţia boxelor şi auditorului. Aceasta cu atât mai
mult în situaţia în care se foloseşte un sistem audio 5.1, unde eventualele erori
pot surveni numai la poziţionarea în înălţime a sunetului, iar, dacă aceasta este
critică, se pot folosi căşti. Nu este recomandabilă sub nicio formă utilizarea unui
sistem de boxe stereo, dacă poziţionarea 3D a sunetului este foarte importantă.

9.4.4.2. Sistemul 5.1

Sistemele 5.1 conţin, în plus, un canal Center (C), destinat unei incinte
amplasate între LF şi RF, responsabilă cu accentuarea dialogurilor şi cu realismul
scenelor. LR şi RR sunt înlocuite cu Left (L) şi Right (R) sau Left surround (Ls) şi
Right surround (Rs), pentru acoperirea mai bună a laturilor. Rămâne, însă,
problema acoperirii zonei din spatele ascultătorului (vezi figura 9.21).
206
Echipamente de sunet

Fig. 9.21. Amplasarea standard a incintelor acustice în sistemul de sunet 5.1.

Sistemele audio Xear 3D conţin două componente majore: Speaker


Shifter şi Earphone Plus.
Speaker Shifter (figura 9.22) permite utilizatorului să obţină un sistem
virtual 5.1 indiferent de dispozitivul de ieşire folosit (căşti, 2CH/4CH). În plus,
utilizatorul are posibilitatea de a poziţiona virtual boxele în GUI (Graphical User
Interface) oriunde doreşte, fără a le muta fizic pe cele actuale pentru a spori
ieşirea canalului. Această tehnologie revoluţionară este îndrăgită de cei care se
plâng mereu de volumul insuficient de puternic al ieşirii din centru sau a celei
de frecvenţe joase de pe DVD.

Fig. 9.22. Xear 3D Speaker Shifter.

Chiar dacă sistemele 5.1 sunt, în general, agreate de majoritatea


ascultătorilor, există, totuşi, oameni care nu vor să instaleze boxele de spate, din
cauze de cost şi ocupare de spaţiu. Earphone Plus (vezi figura 9.23) rezolvă toate
aceste probleme, oferind o compensare a boxelor spate într-un sistem multicanal.
207
Echipamente multimedia

Fig. 9.23. Xear 3D Earphone Plus.

Prin simpla folosire a unei perechi de căşti pe două canale cu galene


deschise, utilizatorul poate percepe şi semnalul din faţă, în timp ce îl ascultă pe
cel din spate. Nu există pierderi de bas.
Xear 3D Speaker Shifter permite utilizatorului obţinerea unui sistem
audio 5.1 inteligent, chiar dacă, de fapt, foloseşte o pereche de căşti sau boxe
2CH (vezi figura 9.24).

Fig. 9.24. Sistemele de sunet 5.1 Xearphone şi 2-speaker Theater.

Dacă în sistemele actuale 5.1 este deja utilizat Xear 3D Speaker Shifter,
aceasta permite utilizatorului mutarea boxelor în poziţiile preferate, fără a muta fizic
ceva pentru a obţine o mai bună ieşire pe un canal individual (vezi figura 9.25).

Fig. 9.25. Sistemul audio Enhanced 5.1 Home Theater.


208
Echipamente de sunet

Privitor la implementarea 3D VR, nu doar imaginile vizuale 3D prezintă


interes, ci şi ceea ce aud oamenii în lumea reală. Una dintre implementările
majore ale 3D VR este jocul 3D pe PC. Xear 3D Engine suportă o bibliotecă
puternică HRTF şi EnvironmentFX în timp real, expunând efecte audio inteligente.
La utilizarea sistemului Xear 3D Engine, utilizatorii de jocuri pot percepe instantaneu
efectele de sunet atunci când sunt schimbate setările, fără confuzii de direcţie.
Sistemele 6.1 şi 7.1 acoperă complet spaţiul audio, prin introducerea
uneia, respectiv, a două incinte suplimentare în spatele ascultătorului.

9.4.4.3. Sistemul 6.1

În sistemul 6.1, incinta responsabilă cu redarea celui de-al şaselea


canal, SB (Surround Back), se amplasează opus faţă de incinta Center (vezi
figura 9.26). Sunetul pentru incinta unică SB este creat prin mixare între
canalele SBL (Surround Back Left) şi SBR (Surround Back Right), în cazul unui
material audio pe 8 canale, de tip 7.1.

Fig. 9.26. Amplasarea incintelor acustice în sistemul audio 6.1 THX SurroundEX.

9.4.4.4. Sistemul 7.1

Pentru incintele acustice ale sistemului de sunet 7.1, cele două incinte
suplimentare faţă de sistemele 5.1 redau canalele de surround spate, separat
pentru stânga şi dreapta: SBL – Surround Back Left şi SBR – Surround Back
Right (vezi figura 9.27). Spaţiul audio este, astfel, complet acoperit.
209
Echipamente multimedia

Fig. 9.27. Amplasarea incintelor acustice în sistemul audio 7.1.

9.4.5. Codarea materialului audio 3D

9.4.5.1. Standardele Dolby

Dolby Laboratories a lansat de-a lungul timpului mai multe standarde


de codare a semnalului audio, acestea devenind la vremea respectivă
standarde de facto în industria home entertainment.
Dolby Surround foloseşte o codare de tip matriceal. Cele 4 canale
sunt codate ca două canale distincte, din care decodorul extrage informaţia
pentru incintele Left, Right şi Back, iar canalul Ghost Center este extras prin
mixare din canalele Left şi Right. În lipsa decodării Dolby Surround, semnalul
se poate folosi fără pierderi semnificative de informaţie pe un sistem stereo.
Acesta este principalul avantaj al formatului, conferindu-i, astfel, versatilitate.
Totuşi, prin codarea pe două canale, cele patru surse audio iniţiale nu pot fi redate
identic. Dolby a devenit liderul în dezvoltarea sistemelor de reproducere multicanal.
Sistemul Dolby Surround a fost instalat iniţial în peste 14.000 de cinematografe.
Dolby Pro Logic este varianta originală de decodare a conţinutului
Dolby Surround. Pentru un material stereo, decodorul încearcă recrearea unor
canale care nu sunt prezente în materialul audio. Calitatea expandării spaţiului
audio depinde de caracteristicile materialului, dar efectul nu este întotdeauna
cel urmărit. Varianta II a acestui sistem este mai performantă la redarea
semnalului Dolby Surround şi oferă rezultate plăcute la audiţia muzicală pe un
sistem de incinte acustice surround. Dolby Pro Logic IIx este un model mai nou
de decodare Dolby Surround analogic şi foloseşte un sistem de decodare
matriceală, care recreează două canale surround spate pentru sistemele 6.1 şi
7.1 Avantajul acestui decodor este posibilitatea de folosire pentru redarea
semnalului Dolby Digital codat 5.1 (vezi figura 9.28) sau, în unele cazuri, ale
semnalului codat cu standardul DTS (vezi paragraful 9.4.5.2).
210
Echipamente de sunet

Fig. 9.28. Amplasarea incintelor acustice pentru redarea sunetului codat Dolby 5.1.

Atunci când cererea de sisteme super-multicanal a scăzut, Dolby a


inventat sistemul mai auster numit Dolby Surround Digital (DSD). Acesta era
alcătuit iniţial din doar 6 boxe (stânga, centru, dreapta, subwoofer şi surround
stânga şi dreapta), fiind destinat folosirii domestice (vezi figura 9.29).

Fig. 9.29. Sistemul audio Dolby Surround Digital (DSD).

Dolby Surround Digital foloseşte compresia digitală a informaţiei audio.


Ultimele versiuni ale formatului pot coda foarte eficient 6.1 sau 7.1 canale într-un
singur flux de date. Redarea formatului AC3 (Audio Coding algorithm 3) implică
folosirea unei conexiuni digitale. Dolby Surround Digital este folosit ca metodă
standard de codare audio pentru DVD şi HDTV. Cel mai frecvent, materialul
audio este destinat audiţiei pe 5.1 canale sau pe un sistem stereo obişnuit.
Semnalul 2.0 poate fi, la rândul lui, un semnal pe 4 canale codat DSD.
Este ridicol, dar sistemul DSD are o asemănare uimitoare cu sistemul
rusesc ABC, proiectat în anii '70. Principala caracteristică a ambelor sisteme
este poziţia boxelor spate: acestea sunt aşezate exact în dreptul ascultătorului,
la stânga şi la dreapta, şi nu în spatele acestuia. Această dispunere oferă o
panoramă circulară a sunetului, dar nici aici nu există o a treia dimensiune reală.
211
Echipamente multimedia

Dolby Digital EX este o extensie a sistemului DSD şi include în fluxul


audio un canal Back, codat matriceal în canalele Left surround şi Right
surround. Audiţia se poate face pe un sistem 5.1 sau, cu performanţe mai bune
pentru poziţionarea sunetelor în spatele ascultătorului, pe un sistem 6.1 (vezi
figura 9.30).

Fig. 9.30. Sistemul audio Dolby Digital EX.

9.4.5.2. Standardele DTS (Digital Theater System)

Standardul DTS (Digital Theater System) este similar standardului


Dolby Surround Digital, necesitând, de regulă, un decodor special sau unul
multiformat (de exemplu, ProLogic IIx). Calitatea audiţiei este similară, însă
eficienţa compresiei este mai slabă decât în cazul DSD.
DTS-ES este echivalent formatului Dolby Digital EX, dar, suplimentar,
permite codarea în fluxul de date a unui canal discret de Back surround, care
nu mai este multiplexat (mono).
DTS Neo:6 este decodorul matriceal care generează 5.1 canale
surround din semnal DTS, DSD sau stereo. În prezenţa unui sistem surround
6.1, se poate decoda şi semnal DTS-ES.
DTS permite codarea semnalului audio cu pierderi, fără pierderi sau
printr-o combinaţie a celor două, în funcţie de specificul materialului şi necesităţi.
Se poate constata că semnalul DTS are o dinamică mai bună decât semnalul
DSD, însă este evidentă şi economia de spaţiu rezultată din folosirea DSD.
212
Echipamente de sunet

9.4.5.3. Standardul SDDS (Sony Dynamic Digital Sound)

Standardul SDDS (Sony Dynamic Digital Sound) este un format


destinat exclusiv sălilor de cinema. Acesta foloseşte o compresie medie de 5:1,
cu menţinerea permanentă a unei redundanţe a datelor de cel puţin 100%,
pentru a asigura corecţia erorilor. Acest lucru este important, întrucât o peliculă
cu sunet SDDS poate rula de cel puţin 500 ori fără nicio pierdere a calităţii
sunetului. Sistemul dispune de posibilitatea de a coda până la 8 canale.
Se remarcă faptul că acest sistem a fost optimizat pentru sălile de
cinema, rata de eşantionare (44,1 kHz) şi gama dinamică (105 dB) fiind
adecvate, dar departe de domeniul Hi-Fi actual, iar frecvenţele joase de până la
5 Hz pot fi redate exclusiv de difuzoare de dimensiuni foarte mari, cum sunt
cele folosite în cinematografe. Separarea canalelor este bună (> 80 dB) şi
conduce la o experienţă surround convingătoare.

9.4.5.4. Standardele THX (Tomlinson Holman's eXperiment)

THX nu este un standard propriu-zis, nici în ceea ce priveşte codarea


şi nici decodarea semnalului audio. THX sunt iniţiale provenind de la Tomlinson
Holman's eXperiment, o campanie a Lucasfilm de certificare a sălilor de
cinema, extinsă apoi şi la produsele cu destinaţia home theater.
THX se ocupă cu certificarea sistemelor hardware de redare a
sunetului şi are mai multe categorii. Aceste categorii sunt destinate departajării
echipamentelor Hi-Fi de cele mainstream şi ale celor pentru spaţii uzuale de
cele destinate spaţiilor de audiţie mari. THX Surround EX este un format similar
lui Dolby Digital EX, cu diferenţa că la decodare se creează două canale de
surround back, care nu sunt distincte, de unde şi necesitatea folosirii unui
sistem de incinte acustice 7.1. Decodorul poate fi folosit cu succes şi pe
sistemele de sunet 6.1, cu mici pierderi de spaţialitate a sunetului din spatele
auditorului.

9.4.5.5. Sunet surround digital de ultimă generaţie

Datorită faptului că nu toate cinematografele sunt echipate cu (toate)


sistemele de decodare a sunetului surround digital, pentru compatibilitate,
pistele analogice de pe marginea peliculei se păstrează, iar informaţia digitală
de sunet surround este amplasată după cum se poate observa din figura 9.31,
în cazul sistemelor de sunet DSD, DTS şi SDDS.
213
Echipamente multimedia

sistemul de sunet DSD sistemul de sunet DTS sistemul de sunet SDDS

Fig. 9.31. Amplasarea informaţiei digitale de sunet surround pe peliculă.

În teorie, se pot dispune pe aceeaşi peliculă atât canale de sunet


DSD, DTS, cât şi SDDS, alături de pistele analogice, însă acest lucru nu este
practic şi, în plus, există parteneriate între studiourile de film şi companiile care
produc sisteme de sunet. În prezent, sistemul SDDS este cel mai recent, însă
în plină ascensiune în ceea ce priveşte numărul de săli echipate, în timp ce
lider rămâne sistemul DTS.

9.4.6. Concluzii
Poziţionarea corectă a incintelor acustice satelit este esenţială pentru
audiţia optimă a materialului audio surround.
Mai mulţi sateliţi nu înseamnă întotdeauna mai bine. Trebuie avut în
vedere faptul că întreg sistemul de sunet (placa de sunet, decodorul,
amplificatorul, incintele) să fie de calitate şi să fie capabil să redea precis
materialul vizat.
Prezenţa unei certificări THX asigură (de cele mai multe ori) o calitate
a poziţionării şi a sunetului mai mult decât satisfăcătoare. Pentru decodarea
semnalului surround (de exemplu, DSD-ES), este necesar un decodor
specializat, care poate să nu fie inclus în sistemul de incinte acustice surround.
Acest lucru depinde de producător şi de model, fiind relativ independent de
calitatea produsului sau a sunetului redat.
Opţiunile în materie de sunet surround pentru uzul domestic sunt
multiple şi există numeroase produse care să satisfacă orice pretenţii de
calitate sau limite financiare.

214

S-ar putea să vă placă și