Sunteți pe pagina 1din 90

CAPITOLUL 1

INTRODUCERE.
SUNETUL. CARACTERIZAREA CÂMPULUI SONOR

1.1 Noţiuni introductive. Definiţii. Sunetul. Câmpul sonor

Prin cuvântul „sunet” identificăm două noţiuni uşor diferite. Pe de o parte sunetul este
o oscilaţie/variaţie/perturbaţie a unei mărimi fizice cum ar fi presiunea, deplasamentul
particulei, viteza particulei, etc., într-un mediu în care se manifestă forţe interne de revenire
(ex: mediu elastic, vâscos). Într-un alt context, prin sunet se înţelege senzaţia auditivă pe
care oscilaţia definită anterior o induce observatorului. Pentru a le separa atunci când
confuzia este posibilă, preferăm să introducem două noţiuni deferite: sunetul fizic şi
respectiv senzaţia de sunet. Să remarcăm că prezenţa sunetului fizic nu este întotdeauna
însoţită de senzaţia de sunet. Experienţa cotidiană ne arată că dacă perturbaţia care defineşte
sunetul fizic este prea mică, sau dacă anumite caracteristici spectrale ale acesteia nu cad într -
o anumită plajă, atunci senzaţia sonoră nu mai apare. În plus, pentru acelaşi sunet fizic,
senzaţia de sunet indusă poate fi semnificativ dependentă de fiecare individ (observator) în
parte. În materialul ce urmează ne va interesa numai situaţia în care sunetele (f izice) produc
senzaţia de sunet majorităţii observatorilor umani, fără apariţia unui disconfort sau fără
distrugerea/afectarea permanentă a auzului. De asemenea, atunci când senzaţia de sunet este
implicată, vom considera relevante numai rezultatele obţinu te prin mediere statistică asupra
unui număr relevant de subiecţi umani otologic normali.

În momentul în care o sursă sonoră, cu o anumită putere, produce un sunet are loc un
proces prin care energia este transferată de la sursă către moleculele adiacente din mediul
înconjurător şi de aici, din moleculă în moleculă, perturbaţia se poate transmite la distanţe
mari. În cele ce urmează, dacă nu este specificat explicit altfel, mediul de transmisie tipic
este aerul. Perturbaţia pe care o produce sursa sonoră se transmite astfel din aproape în
aproape (se propagă spaţial) prin intermediul undelor sonore.

Definită riguros, o undă sonoră este o perturbaţie ce se propagă într-o anumită


direcţie astfel încât mărimea ce serveşte ca măsură a perturbaţiei respective es te o funcţie de
timp şi poziţie care, pentru oricare două poziţii vecine, este similară cu excepţia unei
diferenţe de timp. Viteza de propagare a perturbaţiei este egală cu raportul dintre distanta
între două poziţii vecine şi diferenţa de timp corespunzăt oare perturbaţiilor acestora.
Regiunea din spaţiu în care sunt prezente undele sonore se numeşte câmp sonor.

Disciplina care studiază sunetul luând în considerare producerea, propagarea, precum


şi efectele pe care acesta le induce, se numeşte acustică.
2 Capitolul 1. Introducere. Sunetul. Caracterizarea câmpului sonor

Dorim să caracterizăm şi să reprezentăm câmpul sonor. Mărimile care realizează acest


deziderat în mod convenabil şi care şi-au dovedit pe deplin aplicabilitatea în domeniul
ingineriei audio sunt: presiunea sonoră, viteza particulelor mediului, intensitatea sonoră,
energia sonoră şi puterea acustică. În continuarea acestui paragraf intenţionăm o scurtă
trecere în revistă a acestora.

Dintre toate semnalele sonore întâlnite există unul care joacă un rol aparte – tonul
pur. Acesta este unul din semnalele periodice elementare şi poate fi descris matematic prin
intermediul expresiei

x  t   A sin 0t    (1.1)

El este descris complet prin intermediul triadei Amplitudine – A /perioadă – T0 / fază iniţială
–  . Frecvenţa tonului pur este inversul perioadei – f 0  1/ T0 iar pulsaţia (frecvenţa
unghiulară) este definită ca 0  2 f 0  2 / T0 .

Sunetul fizic de tip ton pur (sinusoidal) generează senzaţie sonoră numai dacă
amplitudinea A este suficient de mare iar frecvenţa este în domeniul 20Hz – 20kHz. Luând
în considerare drept mediu de propagare aerul aflat în condiţii de temperatură, presiune
atmosferică şi umiditate normale (situaţie valabilă în marea majoritate a cazurilor pe care le
vom trata pe parcursul acestui material) experimentele arată că propagarea sunetului se face
cu viteza de aproximativ

c  344m/s  1238km/h (1.2)

Utilizând relaţia ce leagă frecvenţa stimulului acustic, viteza de propagare în mediul


respectiv şi lungimea de undă (în acelaşi mediu)

0 f 0  c (1.3)

se obţin, pentru domeniul audibil, valorile limită pentru lungimile de undă

17, 2 m f 0  20Hz

 0  34cm f 0  1 kHz (1.4)
1,72cm f 0  20kHz

Aceste valori ne arată că în experienţele cotidiane, relaţia dintre câmpul sonor şi diversele
obiecte (obstacole) cu care acesta interacţionează poate fi guvernată de oricare din situaţiile:
- lungime de undă >> dimensiuni obiect
- lungime de undă << dimensiuni obiect
- lungime de undă comparabilă cu dimensiunile obiect
- lungime de undă >> distanţa dintre sursa sonoră şi observator (ascultător)
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU 3

- lungime de undă << distanţa dintre sursa sonoră şi observator


- lungime de undă comparabilă cu distanţa dintre sursa sonoră şi observator

În ceea ce priveşte descrierea geometrică a surselor sonore, este convenabil să tratăm


câteva cazuri simple, elementare. Remarcăm astfel trei tipuri: surse punctuale, surse
rectilinii (filiforme) şi respectiv, surse plane

O sursă sonoră punctuală este una în care toate dimensiunile sale sunt mult mai mici
decât lungimea de undă minimă, corespunzătoare celei mai mari frecvente din componenţa
spectrală (a perturbaţiei). În conjuncţie cu un mediu omogen şi izotrop, sursa punctuală
generează un câmp de unde sferice. Un din caracteristicile acestui tip de câmp îl constituie
faptul că nivelul presiunii sonore scade radial cu 6dB atunci când distanţa fa tă de sursă se
dublează (vezi Figura. 1.1a). O aproximare rezonabilă a acestei situaţii se întâlneşte în
experimentele în care observatorul este plasat la o distanţa suficient de mare de sursa sonoră,
neexistând suprafeţe sonore reflectorizate care să împi edice/modifice radiaţia liberă a
energiei sursei.

Cel de al doilea caz de sursă, sursa rectilinie (sau filiformă), apare atunci când sursa
sonoră are pe o direcţie dimensiuni mult mai mari decât pe celelalte două . Din exemplele
întâlnite curent în practică fac parte ţevi care transportă un fluid turbulent, şosele cu trafic
intens, sau o coloană cu difuzoare. În conjuncţie cu mediul omogen şi izotrop, acest tip de
sursă generează unde sonore cilindrice, ce pot fi caracterizate prin faptul că presiunea
sonoră scade radial (faţă de axa lungă a sursei) cu 3dB la fiecare dublare a distanţei (vezi
Figura. 1.1b).
a) Sursă punctuală

b) Sursă rectilinie

c) Sursă plană

Fig. 1.1 Tipuri elementare de surse şi de unde sonore

În final, sursa sonoră plană este generată de obiecte care au dimensiu nile pe două
direcţii mult mai mari decât pe cea de a treia. În practică acesta este cazul cel mai puţin
întâlnit, şi poate fi reprezentată ideal de un perete radiant de întindere infinită sau cel puţin
de dimensiuni mult mai mari decât lungimea de undă minimă şi decât distanţa dintre acesta şi
observator. Un alt exemplu uşor de imaginat constă într-un piston care acoperă integral
4 Capitolul 1. Introducere. Sunetul. Caracterizarea câmpului sonor

capătul unui tub şi care printr-o mişcare oscilatorie generează o undă sonoră ce se propagă
de-a lungul acestuia. De data aceasta suprafaţa de undă este plană şi dacă se ignoră pierderile
de energie datorate frecării cu pereţii tubului, presiunea sonoră rămâne constantă odată cu
modificarea distanţei faţă de piston (vezi Figura. 1.1c).

Să revenim la cazul sursei sonore punctuale în conjuncţie cu mediul omogen şi izotrop


în care se formează unde sferice. În acest caz energia sursei se propagă radial nestingherită
(liber) dinspre sursă spre exterior, motiv pentru care câmpul sonor rezultat se numeşte câmp
liber, sau câmp de undă progresivă. De multe ori însă energia sursei sonore nu se propagă
nestingherită în toate direcţiile. De exemplu, când sursa sonoră este plasată într -o cameră,
sunetul radiat ajunge la diversele suprafeţe ale acesteia (pereţi, podea, tavan, ferestre, alte
obiecte din cameră) şi este reflectat, refractat, şi/sau absorbit de acestea. Într-o cameră cu
pereţi perfect reflectorizanţi acustic, întreaga energie a undelor incidente este reflectată
rezultând ceea ce se numeşte câmp difuz. Într-un astfel de câmp, energia tinde să aibă o
distribuţie spaţială uniformă. Într-o cameră cu pereţii perfect absorbanţi (energia reflectată
de pereţi este nulă) energia sursei sonore se propagă radial, progresiv, caz în care se respectă
condiţia de câmp liber. O astfel de cameră, extrem de utilă pentru diverse măsurători acustice
se numeşte cameră anecoidă. Dacă vom considera acum situaţia particulară în care sursa
sonoră este plasată într-o incintă cu dimensiuni mult mai mici decât lungimea de undă
(corespunzând frecvenţei maxime din spectrul semnalului) atunci presiunea sonoră tinde să
devină aceeaşi în orice punct al incintei. Câmpul particular astfel rezultat poartă numele de
câmp de presiune.

1.2 Parametrii câmpului sonor

Dintre mărimile prin intermediul cărora se poate descrie convenabil câmpul sonor se
numără presiunea sonoră, intensitatea sonoră şi viteza particulelor mediului. Astăzi, toate
aceste mărimi pot fi măsurate relativ comod şi cu precizie ridicată. Totuşi dintre toate
acestea, presiunea sonoră joacă un rol deosebit şi se dovedeşte a fi de mare importanţă.
Într-un punct al câmpului sonor, presiunea sonoră instantanee p , este mărimea fizică
scalară (cu semn) numeric egală cu abaterea presiunii instantanee totale pi din acel punct
faţă de presiunea ambientală medie ps , numită şi presiune statică 1.

p  t   pi  t   ps (1.5)

În Sistemul internaţional (SI), unitatea de măsură pentru presiunea sonoră este  N/m 2  sau
Pa  . Prin definiţie,

1
Presiunea statică într-un punct este presiunea existentă în acel punct în absenţa undelor sonore.
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU 5

N
1Pa=1 (1.6)
m2

Presiunea sonoră efectivă, numită simplu şi presiune sonoră reprezintă valoarea


eficace (efectivă) a presiunii sonore. Ca mărime temporală globală (o caracteristică valabilă
pe întreaga axă a timpului) [Ne1], ea se poate calcula utilizând expresia [AS1]

1
p  lim  p 2  t  dt (1.7)
T  T T

În aplicaţiile practice ne interesează mai puţin caracterizarea câmpului sonor prin mărimi
globale, definite (şi ca atare valabile) pe întreaga axă a timpului ( t   ,   ). Fie datorită
nestaţionarităţii inerente, fie cel puţin din raţiuni legate de posibilitatea efectivă de realizare
a măsurătorilor ne interesează caracterizarea câmpului sonor cu valabilitate numai într-o
vecinătate temporală rezonabilă plasată convenabil în jurul momentului de interes. Aceasta
conduce la lucrul cu estimatori pe termen scurt 2 ai mărimilor fiind necesară limitarea şi
definirea exactă a domeniului de integrare T . Conform specificaţiilor larg adoptate, valoarea
efectivă a semnalului devine

Not 1
p  pRMS   p 2  t  dt . (1.8)
T T

Pentru presiuni sonore instantanee periodice (cu perioadă T0 ) valoarea efectivă se va calcula
prin integrare pe un număr întreg de perioade T  kT0 , k  *
 sau pe o durată mult mai lungă
în comparaţie cu perioada T  T0  . Pentru semnalele de tip impuls (neperiodice) intervalul
de mediere T trebuie să fie suficient de lung astfel încât rezultatul obţinut să nu fie senzitiv
la modificarea acestuia [AS1].

Într-un mediu (aer) în care se propagă o undă sonoră stabilindu-se astfel un câmp
sonor, viteza de variaţie a poziţiei unui volum infinitezimal (considerat un întreg şi numit
aici particulă) din respectivul mediu poartă numele de viteză a particulei de aer („particle
velocity”). În măsurătorile reale, pentru a fi considerat „infinitezimal”, volumul de aer
trebuie să aibă dimensiunile mult mai mici decât lungimea de undă. Termenii viteză
instantanee v  t  precum şi viteză efectivă v sau simplu viteză a particulei de aer au un
înţeles ce corespunde termenilor similari folosiţi pentru presiune. Unitatea de măsură (în SI)
pentru viteză este  m/s  .

În prezenţa unei unde sonore, energia sonoră pentru o anumită parte a câmpului sonor
reprezintă energia totală pentru respectiva parte a mediului din care se scade energia care ar
2
Pentru o abordare sistematică a modului în care, pornind de la caracteristici pe termen lung se construiesc estimatori pe
termen scurt, precum şi pentru o analiză a performanţelor acestor estimatori, cititorul este invitat să parcurgă capitolul
Mărimi pe termen scurt derivate din caracteristici pe termen lung din reperul bibliografic [Ne1]
6 Capitolul 1. Introducere. Sunetul. Caracterizarea câmpului sonor

exista în aceeaşi zonă în absenţa undei sonore. În SI unitatea de măsură este J. Puterea
acustică reprezintă mărimea fizică numeric egală cu energia sonoră transmisă în unitatea de
timp. Unitatea de măsură este  W .
Conceptul de putere acustică este mai bine înţeles dacă se ia în considerare analogia
între mărimile acustice şi cele electrice sau mecanice. Astfel, în analogia de tip impedanţă
forţei (presiunea înmulţită cu suprafaţa) şi vitezei particulei îi corespund prin analogie
tensiunea şi respectiv curentul electric. Să considerăm un element de suprafaţă S aşezat
perpendicular (normal) pe direcţia de deplasare a particulei. Presupunând ca pe respectivul
element de suprafaţă presiunea instantanee p  t  este aceeaşi în orice punct, putem exprima
forţa ce acţionează pe suprafaţă cu ajutorul relaţiei

F t   p t  S . (1.9)

Dacă suprafaţa S se deplasează cu viteza instantanee v  t  atunci puterea acustică


instantanee asociată suprafeţei date este

w  t   F t  v t   p t  v t  S . (1.10)

Prin împărţirea ecuaţiei (1.10) la suprafaţă se obţine Intensitatea sonoră instantanee


i  t  . Această mărime fizică, notat cu i  t  este numeric egală cu puterea acustică raportată la
unitatea de suprafaţă (plasată normal la direcţia de deplasare).

i t   p t  v t  . (1.11)

Impedanţa ca mărime generală în acustică este definită, la o frecvenţă dată, drept


raportul între o mărime dinamică (forţă, presiune sonoră, etc) şi o mărime cinematică (viteza
particulei, etc). În mod normal, termenul impedanţă este utilizat în contextul sistemelor
liniare şi în situaţia în care semnalele sunt (staţionar) sinusoidale. În cazuri nestaţionare,
impedanţa ca funcţie de frecvenţă este definită ca raport între imaginile Fourier sau Lapal ce
pentru respectivele mărimi.

Pentru un câmp sonor format dintr-o undă sonoră plană (sau sferică, la distanţă mare
de sursă) viteza fluidului în direcţia de propagare este legată de presiune prin relaţia

p2 t 
v t   , (1.12)
c

unde  este densitatea de echilibru a mediului (în kg/m3 ) iar c este viteza de propagare a
sunetului (în m/s ) pentru respectivul mediu (vezi Capitolul 4). Luând în considerare definiţia
anterioară, produsul  c se numeşte impedanţă caracteristică a mediului şi se notează cu Z c .
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU 7

În consecinţă, intensitatea sonoră instantanee în direcţia de propagare pentru o un dă sonoră


plană/sferică devine

p2 t 
i t   (1.13)
Zc

În ingineria audio mărimile medii sunt de cele mai multe ori preferate celor instantanee
deoarece în cele din urmă ele sunt cele care se dovedesc a avea relevanţă perceptuală
crescută. Acesta este si motivul pentru care de regulă termeni singulari cum ar fi intensitate
sau putere (fără a fi însoţiţi de un adjectiv) implică o operaţie de mediere temporală.

În acest context, introducem Intensitatea sonoră într-un punct drept mărime fizică
numeric egală cu puterea acustică medie transmisă într-o direcţie specificată printr-o
suprafaţă unitară plasată în punctul respectiv şi aşezată normal în raport cu direcţia
specificată. Intensitatea sonoră reprezintă valoarea medie a intensităţii sonore instantanee şi
poate fi calculată cu ajutorul relaţiei

1
p  t  v  t  dt .
T  T T
I  lim (1.14)

În SI intensitatea sonoră se măsoară în  W/m 2  . În conjuncţie cu (1.13) relaţia anterioară,


pentru o undă plană (sau sferică, la distanţă mare de sursă) devine

p2
I . (1.15)
Zc

Exemplu
 Să consideră o sursă punctuală de putere acustică P ce produce în mediul înconjurător
considerat izotrop şi omogen o undă sferică. En ergia se propagă radial de la sursa sonoră
punctuală spre exterior fără a fi stingherită de alte obstacole. În felul acesta se respectă
condiţia de câmp liber. Fronturile de undă au formă sferică, iar centrul acestor sfere este
plasat în sursa sonoră. Să remarcăm că energia radiată de sursă este regăsită integral pe toate
aceste sfere, fiind distribuită uniform pe suprafaţa acestora. Fie acum un observator plasat la
distanţa r1 de sursă. În acest punct el măsoară presiunea efectivă p1 . Având în vedere că
punctul de observaţie aparţine unui front de undă sferic cu suprafaţa 4 r12 , dacă observatorul
se află la distanţă suficient de mare de sursă, presiunea şi viteza sunt în fază. şi ca ur mare se
poate afirma că p1 respectă relaţia

p12 P P
I1    s. (1.16)
Z c  r12
S1

În relaţia de mai sus S1 este o suprafaţa infinitezimală centrată în punctul de interes,


în care s-a măsurat presiunea p1 .
8 Capitolul 1. Introducere. Sunetul. Caracterizarea câmpului sonor

Ps

Ps

Fig. 1.2 Tipuri elementare de surse şi de unde sonore

Intenţionam să mutăm radial observatorul la distanţa r2 faţă de sursă şi să evaluam, şi


de acesta data presiunea efectivă (devenita acum p2 ). Având în vedere că frontul de undă
este sferic, aceeaşi putere acustică PS care în experimentul anterior străbate suprafaţa S1 va
fi repartizată acum o suprafaţă S 2 mai mare. Raportul între suprafeţele S1 şi S 2 este acelaşi
cu raportul între sferele de rază r1 şi respectiv r2 , astfel că p2 respectă relaţia

p22 P P
I2    s . (1.17)
Zc  r2 S2
2

1.3 Nivelul sonor

Paralela (corespondenţa formală) între mărimile acustice şi cele electrice este


evidentă: intensitate sonoră – putere electrică, presiune sonoră – tensiune electrică,
impedanţă sonoră – impedanţa electrică (viteză – intensitate electrică) [St1][Har]. În ambele
situaţii există o perturbaţie iniţială (cauza) – tensiunea electrică care poate fi pozitivă sau
negativă, şi respectiv presiunea sonoră care la rândul său poate reprezenta o compresie
(valori pozitive) sau o dilatare (valori negative). Prin ridicarea la pătrat a perturbaţiei se
obţine o mărime de natură energetică, nenegativă – puterea electrică sau corespondentul său
acustic, intensitatea sonoră.

Nivelele sonore sunt strâns legate de măsurarea intensităţii şi respectiv a presiunii


sonore. Nivelele se exprimă în dB şi permit compararea a două sunete. Prin analogie cu
mărimile electrice, definim diferenţa de nivel între sunetul 2 şi sunetul 1 prin
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU 9

I2
 LI  dB  LI 2  LI1  10 lg , (1.18)
I1

în care I 1 şi I 2 reprezintă intensităţi (medii) ale celor două sunete. Pornind de la presiunile
sonore corespunzătoare celor două semnale, se poate defini diferenţa de nivel sonor (în
presiune)

p2
Lp  dB  Lp2  Lp1  20 lg , (1.19)
p1

în care p1 şi p2 sunt valorile efective ale presiunii sonore.

Pentru a oferi o primă imagine referitoare la dinamica pe care urechea trebuie să o


acopere, este suficient să remarcăm că, în mod uzual, într-o zi obişnuită sunetele pe care le
întâlnim au intensitatea sonoră plasată în rapoarte de până la 106 , ceea ce ar corespunde unei
diferenţe de nivel sonor

LI  LI2  LI1  10lg106  60dB . (1.20)

Pentru o zi deosebită, în care mai întâi se fac unele experienţe psihoacustice în


apropierea pragului de audibilitate iar ulterior se participară la un concert rock live,
intensitatea sonoră poate să varieze cu 12 ordine de mărime, ceea ce ar corespunde la

LI  LI2  LI2  10lg1012  120dB . (1.21)

Acest experiment simplu arată că auzul uman este capabil să opereze cu semnale sonore cu
intensităţi care acoperă o plajă extrem de largă [Har].

O scală „absolută” în decibeli se poate obţine numai dacă se convine asupra unei
referinţe, pentru care să se considere că nivelul ( L1 din (1.18) sau (1.19)) este 0. Există două
astfel de referinţe, una pentru presiune şi cealaltă pentru intensitate, ambele fiind legate de
pragul de audibilitate uman, determinat într-o conjunctură specifică. Pentru presiune,
valoarea efectivă de referinţă, notată pref , este

pref  2 105 Pa  20μPa . (1.22)

şi corespunde cu aproximaţie, mediei statistice a pragului de audibilitate pentru ascultători


otologic normali, când stimulul acustic audiat este sinusoidal, cu frecvenţa de 1000Hz.
În aceste condiţii, unui semnal sonor oarecare, caracterizat de presiunea efectivă p , îi
corespunde nivelul presiunii sonore Lp , calculabil cu relaţia

p p
Lp [dB SPL]  20lg  20lg ef 5 , (1.23)
pref 2 10
10 Capitolul 1. Introducere. Sunetul. Caracterizarea câmpului sonor

în care, pentru a arăta că măsurarea se face în raport cu presiunea de referinţă precizată în


(1.22), se spune că Lp este exprimat în [dB SPL] (SPL=”Sound Presure Level”).
În mod evident există o referinţă şi pentru intensitatea sonoră. Există avantaje
incontestabile dacă, pentru o undă plană, intensitatea de referinţă I ref este obţinută din
valoarea presiunii de referinţă pref prin intermediul relaţiei

p ref2
I ref  . (1.24)
Zc

În SI, impedanţa acustică a aerului este 415  kg/m s  , astfel că I ref


2
 devine

4 1010
I ref   0.964 1012 1012 [W/m2 ] . (1.25)
415

Pentru simplitate, această valoare este aproximată cu 1012 W/m2 , caz în care nivelul
intensităţii unui semnal sonor (cu intensitatea sonoră I ) se calculează cu relaţia

I I
LI  10lg  10lg . (1.26)
I ref 1012

Alegerea în conformitate cu (1.24) a intensităţii de referinţă I ref este convenabilă


deoarece pentru aer, nivelul intensităţii sonore devine numeric egal cu cel al presiunii
sonore, motiv care permite folosirea aceleiaşi notaţii
Not
LI  Lp  L [dB SPL]. (1.27)

Remarcând că indiferent dacă se porneşte de la presiune sau de la intensitate,


pentru aer se obţine aceeaşi valoare a nivelului unui semnal în [dB SPL], în principiu,
pentru determinarea nivelului sonor se poate măsura fie presiunea fie intensitatea. În
practică, se obişnuieşte să se măsoare presiunea cu ajutorul unui microfon sensibil la
această mărime fizică, iar rezultatul se converteşte direct în dB SPL, interpretându-se,
după necesităţi, ca nivel al presiunii sau al intensităţii sonore. Totuşi, realitatea acustică
nu este atât de simplă deoarece în mod riguros, relaţia (1.12) este valabilă numai pentru
unde plane şi ca urmare nu se poate aplica pentru măsurători realizate lângă frontierele
acustic reflectorizante sau absorbante. Mai mult, chiar şi pentru unde plane, impedanţa
aerului nu este constantă. Într-adevăr, între limitele extreme pentru condiţiile mediului
(presiune atmosferică şi temperatură), impedanţa Z c   c variază cu 20 % în raport cu
valoarea nominală de 415 kg/m 2s [Har]. În consecinţă, valorile declarate pentru nivelul
intensităţii sonore pot avea abateri de până la 1.5dB faţă de cele corecte. Din fericire,
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU 11

sunt foarte puţine situaţii în care este important să se determine nivelul absolut al
intensităţii sonore cu o acurateţe mai bună de 2dB. .
CAPITOLUL 2

SUNETUL CA ZGOMOT. MĂSURĂTORI DE ZGOMOT.


SONOMETRUL

2.1 Sonometrul. Principii. Arhitectura

În practică, nivelul presiunii sonore este determinat cu ajutorul unui instrument numit
sonometru. Având în vedere modul în care această mărime (nivelul presiunii sonore) a fost
definită (vezi (1.23) (1.22) şi (1.8)) arhitectura de principiu a sonometrului va trebui să
includă în mod obligatoriu următoarele blocuri:
- Sonda de presiune
- Preamplificatorul
- Detector de intrare în limitare
- Amplificatorul calibrat
- Integratorul (Blocul RMS)
- Blocul de logaritmare
- Blocul de afişare
Acestea vor constitui un lanţ de procesare ca cel prezentat în Figura 2.1
Câmp sonor

p t 
Sondă de presiune

C t 
Preamplif.
u t  p t  Detector
limitare
Amplificator
calibrat uref pref

u  t  / uref
RMS T ( F/S/I)
u / uref  p / pref
20lg() Afişare
L p [dBSPL]

Fig. 2.1 Arhitectura de principiu a sonometrului


În continuare vom trece în revistă fiecare din blocurile constituente.
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU 13

Sonda de presiune
După cum îi sugerează numele sonda de presiune este dispozitivul prin intermediul
căruia se explorează câmpul sonor şi care are drept principală funcţie transducţia
mărimii acustice de interes - presiunea într-una electrică (tensiune, curent, capacitate,
sarcină, etc). Acest dispozitiv poartă numele de microfon sensibil la presiune şi el va
furniza la ieşire o mărime electrică C  t  aflată într-o relaţie de strictă monotonie cu
presiunea instantanee p  t  din punctul de interes. Soluţia constructivă utilizată practic
astăzi în majoritatea covârşitoare a situaţiilor o reprezintă microfonul condensator de
măsură. În acest caz, mărimea electrică de ieşire este partea variabilă a capacitaţii şi
după cum se va dovedi în paragraful §2.4.2, ea este invers proporţională cu presiunea
instantanee

1
C t  . (2.28)
p t 

Prin intermediul microfonului este astfel sondat câmpul acustic şi se măsoară în


mod direct presiunea sonoră. În mod evident este de dorit ca mărimea măsurată să nu
fie influenţată (semnificativ) de prezenţa sondei (microfonului). Conform principiului
de incertitudine, influenţa există întotdeauna dar atunci când ea nu poate fi considerată
neglijabilă (nesemnificativă), este de dorit măcar să fie ţinută sub control, urmărindu-
se de fapt existenţa uni procedeu prin care măsurătorile rezultate să poată fi (suficient
de bine) corectate. Pentru ca aceste corecţii să fie posibile, geometria microfoanelor
de măsură precum şi sistemul mobil al membranei mobile trebuie să fie foarte simple.
Să remarcăm în acest context forma cilindrică a microfoanelor de măsură (vezi
paragraful §2.4.1).

Influenţa microfoanelor de măsură asupra presiunii sonore măsurată se


manifestă în special la frecvenţe mari, atunci când dimensiunile microfonului şi
lungimea de undă au acelaşi ordin de mărime. De asemenea rezultatele măsurătorilor
sunt dependente şi de tipul câmpului sonor explorat (câmp de presiune, câmp liber sau
câmp difuz). Stabilirea corecţiilor necesare implică realizarea unor măsurători de
laborator şi confirmarea prin calcul analitic (îndeplinirea acestui deziderat devine
posibilă datorită geometriei simple a microfoanelor de măsu ră).

Corecţiile pentru influenţa microfoanelor de măsură asupra câmpului sonor


explorat pot fi încorporate în proiectarea microfonului sau pot realizate prin post -
procesarea rezultatelor.

Pentru ca un microfon să poată fi utilizat în condiţii bune la real izarea


măsurătorilor, el trebuie să satisfacă un anumit număr de cerinţe. Dintre acestea, cele
mai importante se referă la:
 Performanţe acustice şi electrice bune
14 Capitolul 2. Sunetul ca zgomot. Măsurători de zgomot. Sonometrul

- caracteristica de amplitudine constantă pentru un domeniu spectral


suficient de larg
- gama dinamică mare
- zgomot intern mic
- distorsiuni mici
- influenţă mică asupra câmpului acustic explorat

 Influenţa redusă în raport cu condiţiile de mediu


- senzitivitate redusă la modificarea presiunii, temperaturii şi umidităţii
atmosferice ambientale
- senzitivitate redusă la vibraţii, câmp magnetic, câmp electromagnetic
- robusteţe mecanică ridicată, rezistenţă sporită la şoc
- rezistenţă chimică ridicată, rezistenţă la coroziune

 Stabilitate ridicată pentru senzitivitate şi pentru răspunsul în frecventă


- fluctuaţii reduse pe termen scurt (erori aleatoare)
- abatere mică pe termen lung (erori sistematice)

 Existenţa premizelor pentru măsurarea / calculul proprietăţilor


- posibilitatea de a realiza practic calibrarea folosind metode cu
acurateţe ridicată
- formă simplă pentru a putea descrie analitic proprietăţile dinamice

 Specificaţii detaliate
- disponibilitatea rezultatelor măsurătorilor şi calculelor privind
caracteristicile microfonului în diferite condiţii de test
- specificaţii ale performanţelor individuale ale microfonului
posibilitatea recalibrării periodice

Preamplificatorul
Rolul acestui etaj devine imediat vizibil dacă remarcam câteva particularităţi
ale sondelor de presiune (microfoanelor). Pe de o parte semnalul furnizat de sondele
de presiune (foarte) mic şi de cele mai multe ori iar pe de altă parte comportamentul
microfoanelor este departe de cazul ideal al unei surse de tensiune sau de curent.
Preamplificatorul este construit în strânsă legătură cu tipul şi principul de funcţionare
al sondei de presiune asigurând corecta funcţionare a acesteia, conversia mărimii C  t 
în tensiune electrică (dacă este cazul), amplificarea precum şi adaptarea de impedanţă
între etaje, astfel încât pentru întreg ansamblul sondă - preamplificator să se obţină:
 O dependentă liniară între presiunea instantanee p  t  şi tensiunea u  t  de la
ieşirea preamplificatorului
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU 15

 Un raport semnal zgomot bun (în acest sens se ştie că factorul de zgomot al
primului etaj de amplificare este cel cu importanţa cea mai mare)

 Un nivel rezonabil al semnalului de la ieşire astfel încât etajele următoare să nu


afecteze semnificativ raportul semnal zgomot
Din punctul de vedere al teoriei sistemelor ansamblul sondă de presiune –
preamplificator trebuie să poată fi asimilat cu un sistem analogic liniar şi invariant în timp
(clasa SALIT [St3])

Detectorul de intrare în limitare


Circuitul cu acest nume monitorizează semnalul de la ieşirea
preamplificatorului (valorile instantanee) semnalând depăşirea unui prag prestabilit şi
indicând în acest mod ieşirea preamplificatorului din regimul de funcţionare liniară
(de semnal mic).

Amplificatorul
Prin intermediul acestui bloc semnalul este amplificat şi adus la un nivel care
să permită în continuare operarea comodă. Câştigul amplificatorului este reglabil
permiţând astfel calibrarea lanţului de măsură. În felul acesta la ieşirea
amplificatorului se obţine un semnal aflat într-o cunoscută şi constantă
proporţionalitate cu raportul p  t  / pref , realizându-se conceptual normarea la
presiunea de referinţă ( 20μPa ). După realizarea calibrării, în timpul măsurătorilor şi
acest bloc poate fi considerat în clasa SALIT.

Blocul RMS
Acest bloc este responsabil cu calculul valorii efective. Ea va fi obţinută, în
ordine prin ridicarea la pătrat a semnalului furnizat de amplificator, integrare pe un
domeniu temporal finit (T) urmată de extragerea radicalului. Conform standardelor de
măsură se utilizează trei constante diferite de integrare, pe care utilizatorul le va alege
în funcţie de caracteristicile semnalului măsurat. Acestea sunt 125 ms, 1s şi respectiv
35ms. Primul mod de lucru („Fast”) permite realizarea măsurătorilor în bune condiţii
pentru semnale ce conţin componente armonice cu frecvenţa mai mare de 80Hz
(practic marea majoritate a semnalelor sonore uzuale staţionare pot fi comod măsurate
în acest mod). Folosind această constantă de timp vor fi realizate şi afişate 8
măsurători într-o secundă astfel că beneficiem de măsurători relevante şi pentru
semnale sonore nestaţionare, care-şi schimbă caracteristicile destul de rapid. În
situaţia în care se lucrează cu semnale staţionare pe durată relativ lungă şi care conţin
componente de armonice cu frecvenţă mai mică (până la cel puţin 10Hz) putem utiliza
cea de a doua constantă de integrare. De această data vor fi realizate şi afişate câte o
măsurătoare la fiecare secundă astfel că acest mod de lucru („Slow”) este recomandat
16 Capitolul 2. Sunetul ca zgomot. Măsurători de zgomot. Sonometrul

pentru stimuli sonori cu caracteristici lent variabile în timp. Cea de a treia constantă
de integrare (35ms) a fost introdusă iniţial pentru măsurarea şi compararea unor
stimuli acustici de tip impuls („Impulse”).

Deşi senzaţia auditivă produsă de semnalele sonore cu durată scurtă scade pe


măsură ce se micşorează durata lor totuşi, pericolul de a afecta permanent sau
temporar auzul rămâne. Din acest motiv sonometrul mai are un mod de lucru („Peak”)
prin care în locul valorii efective p se determină valoarea de vârf pmax a presiunii.

Blocul de logaritmare
Acesta este blocul prin care valoarea normată a presiunii sonore este convertită
(logaritmic) în decibeli. Dacă blocul anterior calculează valoarea efectivă a presiunii atunci
conversia se face aplicând relaţia 20log10   . Dacă, pentru eficienţă, blocul anterior după
efectuarea intergrări nu realizează şi extragerea rădăcinii pătrate atunci se va aplica relaţia
10log10   .

Blocul de afişare
Blocul de afişare este responsabil cu prezentarea rezultatului măsurătorii într -o formă
convenabilă (grafică, numerică, analogică, etc.) De asemenea el va menţine afişată valoarea
măsurată un timp prestabilit pentru a oferi utilizatorul posibilitatea citirii comode. Într -o
accepţie extinsă blocul de afişare poate exporta/transmite/stoca rezultatele măsurătorilor în
forma dorită.

2.2 Ponderarea în frecvenţ ă. Sonometrul ca analizor de sunet

În multe situaţii se preferă realizarea unor măsurători relevante din punct de vedere
perceptual. De exemplu ne interesează cât de supărător este zgomotul pe care îl produce un
instalaţia de aer condiţionat aflată in funcţiune într -o cameră de audiţie. În acest context de
vor interesa mai puţin în mod direct parametrii câmpului sonor din perspectiva sunetului fizic
(parametri obiectivi) ci ne va interesa mai mult să realizăm o măsurătoare care să exprime
senzaţia pe care sunetul o induce. Din nefericire nu există o relaţie simplă între un parametru
obiectiv simplu şi clar cum este nivelul presiunii sonore (exprimat în dB SPL) şi mărimea
perceptuală asociată (tăria sonoră – vezi Capitolul 3). Tăria sonoră percepută de un ascultător
atunci când acestuia i se prezintă un anumit stimul sonor depinde atât de nivelul cât şi de
compoziţia spectrală a respectivului stimul. Din acest motiv încă de la primele sonometre
(analogice) s-a dorit introducerea măcar aproximativă a unor mecanisme prin care nivelul
presiunii sonore să fie măsurat luând în considerare şi anumite particularităţi ale auzului
uman.
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU 17

Cea mai simplă soluţie constă în introducerea înainte de blocul care realizează
amplificarea a unor filtre care să pondereze în domeniu frecvenţă semnalul măsurat. Sunt
standardizate câteva curbe de ponderare numite „A”, „B” „C” şi „D” (vezi Figura 2.2).
Dintre acestea, două („A” şi „C”) sunt extrem de răspândite. Curba „A” este implementată în
toate sonometrele. Pentru a face distincţia între nivelul presiunii sonore măsurat fără sau cu
diverse filtre de ponderare s-a adoptat notaţiile şi unităţile de măsură:
- Llin Nivelul presiunii sonore măsurat fără curbă de ponderare. Unitatea de măsură
corespondentă este [dB SPL]
- LA Nivelul presiunii sonore măsurat în prezenţa curbei de ponderare „A”. Unitatea
de măsură corespondentă este [dB A]
- LB Nivelul presiunii sonore măsurat în prezenţa curbei de ponderare „ B”. Unitatea
de măsură corespondentă este [dB B]
- LC Nivelul presiunii sonore măsurat în prezenţa curbei de ponderare „C”. Unitatea
de măsură corespondentă este [dB C]
- LD Nivelul presiunii sonore măsurat în prezenţa curbei de ponderare „ D”. Unitatea
de măsură corespondentă este [dB D]

f [Hz]

Fig. 2.2 Curbele de ponderare perceptuală „A”, „B”, „C”, „D”

Curbele de ponderare prezentate mai sus reprezintă aproximării ale curbelor de egală
tărie (izofone) (vezi Capitolul 3). Curbele izofone sunt ridicate pentru stimuli sonori tonali
(sinusoidali). În consecinţă utilizarea lor poate fi considerată adecvată atunci când se
măsoară astfel de sunete şi doar orientative când se măsoară stimuli sonori cu o structură
spectrală mai bogată. Deoarece auzului uman nu prezintă o caracteristică de amplitudine
plată impune utilizarea curbelor de ponderare. Forma curbelor izofone depinde însă şi de
nivelul respectivelor componente tonale. Acesta este motivul pentru care au fost
standardizate mai multe curbe de ponderare, fiecare dintre ele încercând să realizeze o
compensare aproximativă rezonabilă a unei anumite curbe izofone. Astfel curba „A” este
bazată pe curba izofonă de 40 foni (vezi Figura 2.3) în timp ce curbele de ponderare „B” şi
„C” pornesc de la curbele izofone de 70 şi respectiv 100 foni. Curba „D” este una specială,
18 Capitolul 2. Sunetul ca zgomot. Măsurători de zgomot. Sonometrul

adecvată măsurătorilor din aviaţie. Toate curbele de ponderare sunt normate astfel încât
punctul de coordonate 1000Hz – 0dB este comun (vezi Figura 2.2)

f [Hz]

Curba de ponderare
“A”

f [Hz]

Fig. 2.3 Geneza curbei „A” de ponderare


Se porneşte de la profilul curbelor izofone (poza din dreapta) şi se extrage curba izofonă de 40 foni. Un
stimul tonal cu nivelul (în dB SPL) specificat prin aceasta izofonă se aude la fel de tare ca un stimul tonal de
1 kHz cu nivelul de 40 dB SPL. Această curbă (figura stânga sus) este normată la valoarea de la frecvenţa de
1 kHz şi este „inversată” pentru a obţine o descriere în frecvenţa pentru comportamentul sistemului auditiv
uman şi ulterior este aproximată prin curba de ponderare A (figura stânga jos)

Utilizând filtrele A, B, C, sau D sonometrul permite caracterizarea perceptuală globală,


evaluându-se nivelul sonor prin intermediul unui număr ce caracterizează unitar întregul
domeniu frecvenţial audio. Deşi sunt asociate ponderi diferite pentru diferitele componente
spectrale în final totul este integrat într-un singur număr pentru tot domeniul spectral. Nu
este deloc greu să ne imaginăm utilitatea unei informaţii ceva mai detaliate, în care domeniul
de frecvenţe de interes să fie împărţit în subdomenii, urmând să se evalueze contribuţia
energetică (nivelul sonor) la nivelul fiecărei subbenzi în parte. Soluţia devine evidentă -
utilizarea bancurilor de filtre. În conjuncţie cu utilizarea sonometrelor sunt răspândite două
tipuri de bancuri de filtre. Ele diferă prin modul în care se realizeaz ă divizarea domeniului
spectral. O primă variantă o constituie bancurile de filtre uniforme, pentru care toate canalele
au aceeaşi lărgime de bandă (indiferent de frecvenţa centrală a respectivului canal).
Sonometrele dotate cu astfel de filtre sunt utile în aplicaţiile în care se urmăreşte o
caracterizară obiectivă a sursei de zgomot şi în care accentul este pus pe analiza sursei
sonore şi a vibraţiilor cauzate de aceasta. În situaţia în care se urmăreşte cu precădere analiza
efectelor pe care o sursă de zgomot le induce unui ascultător, se preferă divizarea domeniului
spectral în subbenzi inegale într-un mod cât mai apropiat de modul în care urechea umană o
face (vezi conceptul de benzi critice din Capitolul 3). O aproximare simplă şi elegantă a
acestor benzi critice o porneşte de la bancurile de filtre de octavă, pentru care banda fiecărui
canal creşte odată cu creşterea frecventei centrale a canalului respectiv. Dacă bancurile de
filtre uniforme conţin filtre cu aceeaşi lărgime de bandă în raport cu o axă liniară a frecvenţei
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU 19

(vezi Figura 2.4 sus), bancurile de filtre de octavă sunt caracterizate tot de subbenzi egale
dar în raport cu o axă logaritmică a frecvenţei (vezi Figura 2.4. jos).

Frecvenţa
[Hz]
Utilizare la analiza vibraţiilor

Octavă Octavă Octavă

Frecvenţa
[Hz]
Utilizare la analiza acustică (perceptuală)

Fig. 2.4 Bancuri de filtre uniforme (sus) şi de octavă (jos)

În cele ce urmează vom nota cu f o frecventa centrală a unui canal, cu f1 şi f 2


frecventele la care atenuarea introdusă este de 3dB şi cu B lărgimea de bandă (la 3dB) a
respectivului canal. Ca pentru orice filtru sunt valabile relaţiile generale


 f0  f1 f 2
 (2.29)
 B  f 2  f1

În cazul filtrelor de octavă (denumirea este preluată de la intervalele muzicale) se


impune condiţia

f 2  2 f1 (2.30)

Odată ce frecventa centrală f o este cunoscută, se pot determina imediat şi celelalte


caracteristici ale filtrului de octavă

 f0
 f1  2 0.707 f 0

 f 2  f 0 2 1.41 f 0 (2.31)

 B  f1 0.707 f 0


Conform specificaţiilor din standard pentru bancurile de filtre de octavă frecvenţe le


centrale sunt predefinite. Un astfel de banc de filtre acoperă întreg domeniul audio (vezi
Figura 2.5.). Deşi filtrele de octavă îşi dovedesc utilitatea, totuşi există destul de multe
20 Capitolul 2. Sunetul ca zgomot. Măsurători de zgomot. Sonometrul

situaţii în care se doreşte partiţionarea întregului domeniului spect ral în subbenzi mai
apropiate de benzile critice specifice auzului uman. În raport cu acestea filtrele de octava au
banda prea largă. O aproximare rezonabilă a benzilor critice se obţine prin construcţia
bancurilor de filtre cu benzi de 1/3 de octavă. Acestea sunt definite prin

f2  21/3 f1 , (2.32)

ceea ce conduce la

 f
 f1  0 0.89 f 0
 6
2

 f 2  f 0 2 1.122 f 0
6
(2.33)

 6 1 
 B  f  2  6  0.23 f 0
  2

Şi pentru aceste frecvenţele centrale sunt standardizate astfel încât să realizeze o acoperire
corectă a domeniului audio (vezi Figura 2.5)
B = 1/1 Octavă
B = 1/1 Octavă
1/1 Octavă

Frecvenţa
[Hz] Frecvenţa
[Hz]

B = 1/3 Octavă
B = 1/3 Octavă 1/3 Octavă

Frecvenţa
Frecvenţa
[Hz]
[Hz]

Fig. 2.5 Bancuri de filtre de octavă (sus) şi de 1/3 de octavă (jos)

Într-un sonometru bancurile de filtre se plasează în acelaşi loc ca şi fil trele de


ponderare. În consecinţă schema bloc de principiu a sonometrului evoluează spre cea a unui
analizor de sunet (vezi Figura 2.6). În funcţie de categoria din care face parte se poate
recurge la o implementare de tip comutat (mai ieftină) sau la una de tip paralel (mai scumpă).
Astfel, într-o implementare serială, înaintea unei măsurători schema sonometrului este
configurată astfel încât semnalul de la ieşirea preamplificatorului să fie aplicat unui singur
bloc de filtrare (unul din filtrele de ponderare sau unui canal din bancului de filtre). Ulterior
se realizează măsurătoarea şi întregul proces se reia pentru un alt filtru de ponderare sau
pentru un alt canal. Avantajul unei astfel de abordări constă în faptul că, pe ansamblu,
implementarea poate fi mai ieftină deoarece o parte din resurse se reutilizează la trecerea de
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU 21

la un filtru/canal la altul. Pe de altă parte însă, dacă se doreşte o analiza care să conţină atât
nivelul sonor exprimat în dB SPL, dB A, dB C, precum şi eventual o analiză cu filtre de 1/3
de octavă timpul total necesar va deveni foarte lung. Pe lingă faptul că acest lucru este
neplăcut pentru operator, trebuie şi ca stimulul sonor să nu -şi modifice caracteristicile în tot
acest timp.
Câmp sonor

p t 
Sondă de presiune

Preamplif.
Detector
limitare

Amplificator
calibrat uref pref

RMS/Peak T (F/S/I)

20lg() Afişare
L p lin , L pA , L pB , L pC , L pD

Fig. 2.6 Schema bloc de principiu a unui analizor de sunet analogic

O soluţie mult mai convenabilă din punctul de vedere al timpului consumat pentru
măsurătoare şi astfel semnificativ mai relaxată din punctul de vedere al condiţiilor de
staţionaritate pentru semnalul măsurat, face uz de o implementare în care să existe şi să se
utilizeze simultan toate filtrele de ponderare precum şi canalele bancului de filtre. În această
situaţie să remarcăm că vor trebui să existe mai multe instanţe pentru blocurile de integrare
(RMS) precum şi pentru cel care realizează conversia în dB. În mod evident costul unei astfel
de implementări este mai mare.

Odată cu creşterea complexităţii de procesare şi cu transformarea sonometrului dintr -


un aparat simplu cu care se măsoară nivelul presiunii sonoră într-unul capabil să realizeze
descompunerea şi analiza pe subbenzi, devine atractivă utilizarea tehnicilor numerice.
Acestea permit realizarea facilă a unor operaţii complexe de filtrare şi prelucrare, permit
adăugarea unor funcţii noi de memorare, stocare sau adnotare şi nu în ultimul pot îmbunătăţi
substanţial modul prin care rezultatele măsurătorilor sunt puse la dispoziţia utilizatorului.
Dacă la toate acestea mai adăugăm creşterea flexibilităţii, apariţia posibilităţilor de
configurare multiplă sau reconfigurare precum şi adăugarea unor funcţii noi prin simpla
upgradare cu noi versiuni îmbunătăţite de software înţelegem de ce astăzi,
sonometrele/analizoarele de sunet de vârf fac uz de tehnica digitală. Aceste deziderate se
obţin prin achiziţia semnalului calibrat (de la ieşirea amplificatorului) şi prin includerea unei
22 Capitolul 2. Sunetul ca zgomot. Măsurători de zgomot. Sonometrul

puternice unităţi de prelucrare digitală (blocul DSP). Aceasta din urmă preia sarcinile
implementării bancurilor de filtre, realizării integrării temporale, a detecţiei de vârf sau a
conversiei logaritmice. Cu ceastă ocazie la dispoziţia utilizatorului poate fi pusă o suprafaţă
de afişare complexă şi prietenoasă. În felul acesta (vezi Figura 2.7) el poate urmării simultan
atât caracteristicile globale ale semnalului ( Llin , LA , LB , LC , LD ) cât şi informaţiile spectrale
individuale furnizate de analiza FFT, precum şi a rezultatelor integrale pe subbenzi de 1/3 de
octavă şi de octavă întreagă
Câmp sonor

p t 
Sondă de presiune

Preamplif.
Detector
limitare

Amplificator
calibrat uref pref

ADC

DSP Afişare

Fig. 2.7 Analizorul de sunet digital.


Schema bloc de principiu a unui (stângă). Suprafaţa de afişare (dreapta)

2.3 Măsurarea nivelului intensităţii sonore. Sonda de intensitate.


Sonometrul cu două canale

În conformitate cu relaţiile (1.11) şi (1.14) intensitatea sonoră este media intensităţii


sonore instantanee şi, pentru o durată de integrare specificată T, ea poate fi calculată cu
relaţia

1 1
I  i  t  dt   p  t  v t  dt . (2.34)
T T T T

Atunci când se investighează un câmp de unde plane sau unul sferic dar la distanţă
suficient de mare de sursă, presiunea instantanee p  t  şi viteza insantanee a particulei aer
v  t  sunt mărimi în fază astfel că relaţia (1.15) însoţită de alegerea convenabilă a intensităţii
de referinţă I ref ne permite să sondăm câmpul numai cu ajutorul unei sonde de presiune şi să
statuăm că LI  LP (în dB SPL). Există însă şi situaţii în care aproximarea de mai sus nu este
valabilă şi dorim să determinăm prin măsurare nivelul intensităţii sonore
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU 23

1
LI  10log10
TI ref  p t  v t  dt .
T
(2.35)

Pentru măsurarea intensităţii sonore este astfel necesar să măsurăm, direct sau
indirect, atât presiunea instantanee cât şi viteza instantanee a particulei de aer. Măsurarea
presiunii instantanee se poate face relativ simplu şi cu precizie ridicată folosind drept sondă
un microfon condensator sensibil la presiune. În ceea ce prive şte viteza particulei de aer
lucrurile stau diferit deoarece nu avem astăzi la dispoziţie nici un senzor capabil să
convertească direct şi cu precizie suficient ridicată viteza într-o mărime electrică. De aceea
viteza va fi măsurată indirect prin intermediul a două microfoane sensibile la presiune.

Pentru a înţelege principiul de măsură a vitezei vom porni de la legea a II -a a


dinamicii (Newton) care leagă forţa instantanee F ce se exercită asupra unei particule de
masă m de acceleraţia a pe care acesta o capătă.

F  t   ma  t  , (2.36)

Fie acum x direcţia de interes. Dacă se cunoaşte proiecţia forţei pe respectiva direcţie se
poate afirma că acceleraţia pe direcţia dată x este

1
ax  t   Fx  t  , (2.37)
m

în care acceleraţia este explicitată în funcţie de viteza instantanee prin

d
ax  t   vx  t  . (2.38)
dt

Combinând cele două relaţii se obţine relaţia ce ne permită să calculăm viteza instantan ee (în
direcţia x ) a unei particule, pentru orice moment de timp t , dacă sunt cunoscute masa şi
forţa (proiecţia pe direcţia x ) care acţionează asupra sa

1
vx  t    Fx   d .
t
(2.39)
 m

În dinamica fluidelor, aplicarea legii lui Newton conduce la relaţia

1
a t    p  t  , (2.40)

care leagă acceleraţia particulei de aer de densitatea acesteia şi de gradientul presiunii din
punctul de interes. Axându-ne din nou pe direcţia x , viteza instantanee a volumului
infinitezimal ce constituie particula de aer va fi legată de componenta pe direcţia x a
gradientului presiunii prin expresia
24 Capitolul 2. Sunetul ca zgomot. Măsurători de zgomot. Sonometrul

1 
vx  t     p  , x  d .
t
(2.41)
  x

Relaţia (2.41) sugerează ideea determinării indirecte a vitezei instantanee într -o


anumită direcţie prin măsurarea gradientului de presiune pe direcţia dorită. În felul acesta
viteza poate fi determinată folosind numai măsurători ale presiunii. Pentru simplitate vom
aproxima gradientul presiunii utilizând metoda diferenţei centrate.

Fia astfel punctul de interes O. Intenţionăm să măsurăm intensitatea sonoră pe direcţia


x . Pentru aceasta construim o sondă specială formată din două microfoane de presiune
identice Mic1 şi Mic2 plasate fată în faţă, la distanţa d . Cele două microfoane sunt aliniate
pe direcţia x , iar punctul de măsură O este plasat la mijlocul distanţei d (vezi Figura 2.8).

d
Mic1 Mic 2
O
p t  x

p1  t  p2  t 

Fig. 2.8 Măsurarea vitezei cu două microfoane de presiune

În acest mod, având la dispoziţie semnalul livrat de cele două microfoane de presiune
apropiate, putem aproxima viteza instantanee a particulei de aer, pe direcţia x (direcţia
centrelor microfoanelor) cu ajutorul expresiei

1
vx  t     p2    p1    d .
t
(2.42)
d 

Pentru estimarea presiunii p  t  din punctul O se pot utiliza încă odată semnalele furnizate de
cele două microfoane

p1  t   p2  t 
p t  . (2.43)
2

În felul acest putem obţine expresia finală pentru intensitatea sonoră instantanee

p1  t   p2  t  t
ix  t      p2    p1   d , (2.44)
2 d
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU 25

şi ulterior pentru intensitatea sonoră

1
T  p1 t   p2 t    p2    p1   d dt .
t
I x  10lg (2.45)
2T  dI ref

După cum se constată măsurarea intensităţii sonore implică pe de o parte construcţia


unei sonde speciale iar pe de altă parte dublarea unei bune părţi a sonometrului deoarece
sunt necesare două canale distincte de achiziţie (microfon, preamplificator, detector de
limitare, amplificator calibrat, filtru de ponderare, convertor AD - (vezi Figura 2.9))
Câmp sonor

p1  t  p2  t 
Sonda de intensitate

Preamplif. Preamplif.

Detector u1  t  p1  t  u2  t  p2  t  Detector
limitare limitare

Amplificator Amplificator
calibrat calibrat uref pref

ADC ADC

DSP Afişare

Fig. 2.9 Analizorul de sunet digital.


Schema bloc de principiu a unui analizor cu două canale (stângă).
Sonda pentru măsurarea intensităţii sonore (dreapta)

2.4 Microfonul condensator de măsură. Construcţie. Principiu de


funcţionare. Utilizare

Microfoanele de măsură sunt microfoane cu performanţe ridicate, atent proiectate


realizate şi calibrate astfel încât să devină posibilă utilizarea lor fiabilă în experimente prin
care se cuantifică (măsoară) diverse caracteristici ale unui semnal sonor. Microfoanele de
măsură se constituie în cea mai performantă clasă din punct de vedere al acurateţei şi
reproductibilităţii.

În pofida standardelor de fabricaţie foarte ridicate, limitările de natură fizică şi


tehnologică determină ca un acelaşi microfon să nu fie adecvat tuturor situaţiilor de măsură.
În consecinţă, la ora actuală există mai multe tipuri de microfoane, cu arie de aplicabilitate
diferită. În plus, pentru a beneficia de un comportament stabil şi predictibil, microfoan ele de
26 Capitolul 2. Sunetul ca zgomot. Măsurători de zgomot. Sonometrul

măsură sunt calibrate caracteristicile lor devin astfel clar definite. Din acest motiv un
microfon de măsură trebuie să fie însoţit de date şi grafice de calibrare.

În mod practic astăzi mai toate microfoanele de măsură sunt microfoane de tip
condensator, sensibile la presiune astfel că mărimea acustică măsurată direct este presiunea.
Chiar şi atunci când pentru utilizator mărimile de interes sunt viteza particulelor mediului
sau intensitatea sonoră acestea sunt determinate tot prin intermediul micro foanelor sensibile
la presiune. Atât intensitatea sonoră cât şi viteza pot fi obţinute în urma măsurării simultane
a presiunii sonore în două puncte diferite. În mod tipic, în funcţie de domeniul de frecvenţe
explorat, cele două puncte de măsură ale presiunii sunt plasate la o distanţă de 6-50mm. În
consecinţă pentru astfel de măsurători privind viteza sau intensitatea sonoră sunt necesare
două microfoane sensibile la presiune identice precum şi un sistem de măsură (sonometru)
echipat cu două canale.

2.4.1. Microfonul condensator de măsură. Construcţia. Tehnologia.


Materialele

În forma clasică, microfonul condensator sensibil la presiune produs de B&K este


prezentat în Figura 2.10

Elementul de bază pentru acest tip de microfon îl constituie un capacitor format din
două armături plan-paralele. Una dintre ele este groasă, rigidă, ferm fixată mecanic (de
carcasa microfonului) prin intermediul unui izolator electric şi conectată electric cu
exteriorul cu ajutorul unui terminal (bun conductor electric şi tratat împotriv a coroziunii).
Cealaltă armătură metalică – mobilă, subţire, rigidă şi foarte uşoară – poartă numele de
membrană sau diafragmă. Membrana este de fapt o folie metalică (sau dintr -un material cu
acoperire metalică) foarte subţire tensionată în mod controlat pentru a-i conferi rigiditatea şi
planeitatea necesară. Membrana mobilă este prinsă printr-un sistem de fixare specific astfel
încât poziţia sa să fie paralelă cu fata plană a armăturii fixe. Din punct de vedere electric ea
este în contact cu carcasa microfonului care se constituie în terminalul rece (masa)
microfonului. Membrana mobilă este acoperită cu un capac protector prevăzut cu perforaţii
(„diafragm protection grid”). Membrana, carcasa microfonului şi izolatorul care fixează
armătura fixă formează cavitatea internă a microfonului („cartridge internal cavity”), cavitate
ce este conectată cu exteriorul (pentru egalizarea presiunii statice atmosferice) printr -o mică
deschidere („vent”). Cele două armături sunt separate printr -un dielectric (aer) şi formează
un condensator a cărui variaţie de capacitate va reprezenta semnalul util generat de microfon.
Din acest motiv vom numi „activă” capacitatea formată de membrana mobilă şi armătura
fixă. Capacitatea sa statică (exprimată în Farazi) poate fi aproximată c u relaţia

S
C   0 r (2.46)
d
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU 27

unde: S (în m2 ) este suprafaţa comună a armăturilor, d (în m ) distanţa între armături,
 0  8,854 1012 F / m este permitivitatea electrică a vidului iar  r este permitivitatea statică
relativă a dielectricului (aer).

Capac protector

Membrană
Sistem prindere
(armătură mobilă)
armătură mobilă
Faţa plană a
armăturii fixe
Carcasă metalică
(terminal „rece”) Armătură fixă
(backplate)

Cavitate Izolator
internă
Inel fixare

Electrod
(terminal „cald”)

Fig. 2.10 Construcţia microfonului condensator de măsură

În funcţie de tipul microfonului membrana mobilă are o grosime cuprinsă între 1.5 şi
8 μm , grosime care este realizată cu o toleranţă mai bună de 10%. La echilibru static distanţa
d între membrana mobilă şi armătura fixă este de tipic 20 μm . Valoarea nominală a lui d
este de asemenea dependentă de tipul microfonului şi poate lua valori între 15 şi 30 μm .
Luând în calcul detaliile constructive rezultă pentru capacitatea statică formată de membrana
mobilă şi de armătura fixă (capacitatea activă) valori tipice î ntre 2 şi 60pF, fiind în principal
determinată de diametrul armăturii fixe. Constructiv, celelalte capacităţi nedorite (cum ar fi
capacitatea parazită formată între armătura fixă şi carcasa microfonului) sunt menţinute la
valori cât mai mici. Armătura fixă este direct conectată la terminalul „cald” al microfonului
şi este izolată de carcasă (terminalul „rece”) cu ajutorul unui izolator performant. Acest
izolator trebuie să fie mecanic rezistent şi stabil iar rezistenţa sa electrică de pierderi trebuie
să fie foarte mare (de ordinul a 1017  ( 100000000 GΩ !) în condiţii ambientale normale).
28 Capitolul 2. Sunetul ca zgomot. Măsurători de zgomot. Sonometrul

Pentru a satisface aceste cerinţe izolatorul este fabricat din safir, rubin sau cuarţ mono -
cristalin şi este atent polizat asigurând o planeitate mai bună de 0,5 μm . În plus, pe suprafaţa
acestuia este aplicat, printr-un proces realizat la temperaturi înalte, un strat subţire, invizibil
de silicon. Acesta din urmă îşi aduce contribuţia la operarea în condiţii ambien tale
defavorabile d.p.d.v a umidităţii şi a temperaturii.

Un microfon de măsură trebuie să aibă o stabilitate foarte bună în timp. De asemenea


proprietăţile acestuia trebuie să fie puţin influenţate de condiţiile de mediu (temperatură
presiune statică ambientală şi respectiv umiditate). Unul din cei mai importanţi parametri ai
microfonului – senzitiviatatea – este invers proporţională cu tensiunea din membrana mobilă.
Întrucât pentru un microfon de măsură această senzitivitate trebuie să fie mare şi stabilă în
timp pentru un domeniu larg de frecvenţe rezultă că cerinţele de bază pentru această
diafragmă sunt formate din masa foarte mică şi tensiunea mecanică internă de întindere
foarte mare. Pentru a rezista la tensiuni mecanice de circa 600 N/m2 B&K foloseşte membrane
de Ni cu granulaţie fină (pentru microfoanele cu design clasic) sau din aliaje de oţel
inoxidabil (pentru microfoanele cu structură alternativă). În timpul procesului de producţie
sunt aplicate diverse tratamente termice controlate atent şi care îşi aduc contribuţia la
stabilitatea senzitivităţii microfonului. Se obţin astfel pentru cele mai multe tipuri de
microfoane valori ale abaterii sistematice mai mici de 1dB în 500ani pentru o funcţionare la
temperatura camerei. Pentru a micşora dependenţa senzitivităţii de temperatura ambiantă este
necesar ca tensiunea mecanică din membrană să fie păstrată constantă când temperatura
variază. Pentru aceasta trebuie echilibrată dilatarea termică a carcasei şi a membranei
microfonului. Acesta este unui din motivele pentru care carcasa microfonului este realizată
din monel (un aliaj de nichel, cupru şi fier cu adaos de aluminiu şi titan). În plus acest aliaj
este foarte rezistent la coroziune (dar este şi foarte dificil de prelucrat mecani c datorită
durităţii ridicate).

După cum se va vedea în paragrafele următoare operarea microfonului condensator


necesită aplicarea unei tensiuni de polarizare între membrana mobilă şi armătura fixă.
Creşterea eficienţei transductorului necesită tensiuni de polarizare mari. Întrucât distanţa
tipică între armături este de 20 μm iar tensiunea uzuală de polarizare este de circa 200V
rezultă o intensitate a câmpului electric de 10kV/mm. Această valoare depăşeşte de câteva
ori tensiunea de străpungere a aerului. Operarea microfonului fără străpungere într -un astfel
de câmp electric se datorează faptului că distanţa între electrozi este atât de mică încât se
previne fenomenul de multiplicare normală a ionilor. Multiplicarea ionilor apare dar este
ţinută la un nivel mic astfel că nu conduce la apariţia unor descărcări electrice semnificative
sau la apariţia unui zgomot intern sesizabil. Totuşi, pentru a menţine la limita de stabilitate
valorile mari ale intensităţii câmpului electric pe toată întinderea armăturilor este necesară
atingerea unui grad ridicat de planeitate a suprafeţelor electrozilor. Din acest motiv sunt puse
la punct proceduri specifice de polizare, şlefuire, curăţare şi testare a componentelor
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU 29

mecanice cheie. În final asamblarea elementelor constituente se face într-o cameră cu


atmosferă strict controlată d.p.d.v. al impurităţilor

Faţă de structura clasică prezentată anterior, s-a dezvoltat şi o structură alternativă


(vezi Figura 2.11). Deosebirile principale ţin de construcţia armăturii fixe precum şi de
modul de îmbinare a diverselor părţi constituente. La versiunea alternativă armătura fixă este
integrată cu izolatorul şi este obţinută prin aplicarea unei pelicule metalice subţiri direct pe
una din feţele acestuia (izolatorului). Această soluţie scade complexitatea constructivă. În
plus dacă la structura convenţională asamblarea diverselor părţi ale microfonului se
realizează prin îmbinări cu filet, la versiunea alternativă se utilizează asamblarea prin
presare. Din punct de vedere practic soluţia clasică oferă proiectantului mai multe grade de
libertate în optimizarea răspunsului în frecvenţă în timp ce soluţia alternativă reduce
costurile de producţie în detrimentul unor toleranţe mai mari relativ la răspunsul în frecvenţă.
Membrană Armătură fixă
(armătură mobilă) (backplate)
Membrană Armătură fixă
(armătură mobilă) (backplate)
Carcasă metalică Izolator
(terminal „rece”)
Carcasă metalică
Izolator (terminal „rece”)

Cavitate
Izolator
internă

Electrod
(terminal „cald”)

a) b)

Fig. 2.11 Design clasic a) şi alternativ b) pentru microfonul condensator de măsură

2.4.2. Principiul de funcţionare. Preamplificatorul de microfon

Redus la principalele sale elemente mecanice constitutive, microfonul conden sator de


măsură este format dintr-o membrană mobilă capsulată pe o parte. În acest mod, la
introducerea microfonului într-un câmp sonor, presiunea sonoră determină o deplasare
măsurabilă a membranei mobile. Întrucât membrana reprezintă în acelaşi timp şi a rmătura
mobilă a unui condensator, deplasarea acesteia va avea drept efect modificarea capacităţii,
capacitate ce poate fi „citită” convenabil prin intermediul unei tensiuni electrice. Exista mi
multe procedee de conversie a capacitaţii în tensiune, dar te hnologic două dintre ele s-au
dovedit a avea o importanţă majora. La unul din procedee, condensatorul format de
membrana mobilă şi de armătura fixă este inclus într-un circuit de radiofrecvenţă (de tip
30 Capitolul 2. Sunetul ca zgomot. Măsurători de zgomot. Sonometrul

punte) unde modificările de capacitate vor conduce la apariţia unei modulaţii de frecvenţă
sau de fază. În continuare, utilizarea unor tehnici uzuale de demodulare vor permite livrarea
la ieşire a unei tensiuni electrice ce va urmări valorile presiunii sonore aplicate asupra
membranei mobile. Un astfel de principiu de conversie capacitate-tensiune ar putea să
funcţioneze la frecvenţe oricât de mici (chiar şi pentru frecvenţă 0) deschizând astfel drumul
către domeniul infrasunetelor, dar în practică, deşi se fabrică astfel de microfoane, utilizarea
metodei se întâlneşte (foarte) rar la microfoanele de măsură. Motivele acestei răspândiri
reduse ţin de complexitatea constructivă mare a soluţiei, relativa instabilă şi tendinţa de a
avea nivele de zgomot destul de mari.

Cel de al doilea principiu de conversie este mult mai simplu şi ca urmare este folosit
(aproape) în exclusivitate pentru microfoanele condensator de măsură. El se bazează pe
menţinerea unei sarcini constante pe capacitorul format de armătura fixă şi cea mobilă. La
aplicarea unei sarcini Q0 un condensator C va avea la bornele sale tensiunea

Q0
U , (2.47)
C

deci invers proporţională cu capacitatea. Explicitând valoarea capacităţii în raport cu valorile


elementelor constituente se obţine

Q0
U d (2.48)
 0 r S

ceea ce sugerează o convenabilă directă proporţionalitate între tensiunea U de la ieşire şi


distanţa d dintre armături.
Pentru aplicarea sarcinii constante Q0 se utilizează o metodă de polarizare (vezi
Figura 2.12). În cazul polarizării externe sarcina este aplicată de la o sursă de tensiune
constantă auxiliară, prin intermediul unei rezistenţe mari. Valoarea R p a acestei rezistenţe
trebuie să fie suficient de mare pentru a menţine constantă sarcina Q0 atunci când capacitatea
C se modifică în funcţie de deplasarea membranei mobile. În mod tipic, rezistorul de
polarizare este situat în domeniul 1  10GΩ .
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU 31

MICROFON PREAMPLIFICATOR
Membrană Armătură fixă

Sursă de
Presiune tensiune
Rezistenţă de (polarizare)
polarizare

Condensator Amplificator
de cuplaj de tensiune

Fig. 2.12 Polarizarea externă a microfonului condensator. Preamplificatorul de microfon.

Să considerăm un experiment prin care introducem microfonul într-un câmp sonor nul.
În absenţa câmpului sonor membrana mobilă se va stabiliza într -o poziţie de echilibru numită
poziţie de referinţă aflată la distanţa d 0 . La aplicarea unei tensiuni de polarizare constante,
pe capacitorul de măsură se va regăsi sarcina electrică Q0 . Notând cu U 0 valoarea tensiunii
de polarizare aplicată şi cu d 0 distanţa între armătura mobilă şi cea fixă în absenţa câmpului
sonor (în repaus), utilizarea directă a relaţiilor (2.47) şi (2.48) conduce la

Q0
U0  , (2.49)
C0

în care
S
C0   0  r , (2.50)
d0

reprezintă capacitatea microfonului cu membrana în aceeaşi poziţie de repaus.

La apariţia câmpului sonor membrana mobilă se deplasează ca urmare a variaţiilor de


presiune instantanee. În consecinţă, în prezenţa câmpului sonor, capacitatea instantanee a
microfonului Ci  t  devine o funcţie de timp ce poate fi descompusă în

Ci  t   Co  C  t  . (2.51)

În relaţia anterioară, prin C  t  s-a notat partea variabilă a capacităţii instantanee. Aplicând
relaţia constitutivă a capacităţii se obţine

S
Ci  t   C0  C  t    0 r , (2.52)
d0  d  t 

exprimând astfel în mod direct legătura dintre partea variabilă a capacităţii instantanee şi
deplasarea instantanee d  t  a membranei mobile faţă de poziţia de repaus. Între cele două
32 Capitolul 2. Sunetul ca zgomot. Măsurători de zgomot. Sonometrul

experimente (microfonul polarizat în absenţa câmpului sonor şi respectiv microfonul


polarizat cu aceeaşi tensiune U 0 dar aflat în prezenţa câmpului sonor) sarcina electrică

Q0  U 0C0 (2.53)

se conservă. În consecinţă, modificarea capacităţii instantanee va determina variaţii ale


tensiunii instantanee U i  t  de la bornele capacitorului de măsură în acord cu relaţia

Q0
Ui  t   U 0  u  t   . (2.54)
C0  C  t 

Mărimea notată cu u  t  reprezintă partea variabilă a tensiunii instantanee, adică


fracţiunea din tensiunea totală de la bornele condensatorului datorată deplasării instantanee
d  t  a membranei mobile faţă de poziţia de repaus. Combinând relaţiile (2.49) şi (2.54) cu
(2.50) şi (2.52) rezultă succesiv

U0  u t  C0
 , (2.55)
U0 C0  C  t 

u  t  d0  d  t 
1  , (2.56)
U0 d0

sau echivalent

d t 
u t   U0 . (2.57)
d0

Relaţia (2.57) ne arată în mod clar dependenţa liniară între deplasarea membranei mobile (la
rândul său direct proporţională cu presiunea sonoră aplicată) şi tensiunea u  t  de la ieşire.

Folosind expresia dedusă pentru tensiunea de ieşire putem identifica un număr de


metode care să crească eficienta transducţiei. În acest sens ne interesează ca la o variaţie dată
a poziţiei membranei mobile să obţinem la ieşire o tensiune u  t  cât mai mare. În acest
context se dovedeşte utilă exprimarea senzitivităţii microfonului. Pornind de la aceeaşi
expresie (2.57) remarcăm că senzitivitatea S M satisface relaţia

Def
u U 0
SM   , (2.58)
d d 0

şi putem afirma că eficacitatea transducţiei presiune sonoră – tensiune electrică creşte odată
cu creşterea tensiunii de polarizare U 0 şi respectiv cu reducerea distanţei de repaus între
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU 33

armătura mobilă şi cea fixă. Totuşi există limitări pentru aceste soluţii deoarece creşterea
tensiunii U 0 , respectiv reducerea distanţei d 0 sunt limitate de străpungerea dielectricului
dintre cele două armături (pentru aer tensiunea de străpunger e este 3kV/mm  3V/μm ).

2.4.3. Microfonul condensator de măsură cu electret

Utilizarea microfonului condensator de măsură necesită aplicarea unei tensiuni de


polarizare. Dacă pentru microfoanele condensator uzuale această tensiune are valori cuprinse
între 15 şi 48 volţi la microfoanele de măsură se poate ajunge la tensiuni de ordinul 200V.
Operarea cu surse externe de polarizare nu este întotdeauna foarte comodă, cel puţin atunci
când se operează cu echipamente portabile. Din acest motiv s-a căutat o soluţie pentru
evitarea surselor de polarizare externe. Microfonul condensator pre polarizat cu electret îl
constituie răspunsul la aceasta problemă. Electretul este un polimer selectat şi stabilizat în
mod special şi care se aplică pe faţa superioară a armăturii fixe (vezi Figura 2.13)
Membrană
Sarcini imagine

Aer

Sarcini „fixate”
Electret

Sarcini imagine
Armătură fixă

Membrană

Armătură fixă
Fig. 2.13 Prepolarizarea. Microfonul cu electret.

Electretul este un dielectric ce conţine un surplus de sarcini electrice „fixate”, prin


intermediul cărora se produce un câmp electric în zona liberă (aer) dintre electret şi
membrana mobilă. Sarcinile „fixate” amintite mai sus rămân în permanenţă în electret şi prin
procesul de fabricaţie se asigură stabilitatea acestora pentru circa 1000 ani. Ele sunt plasate
în vecinătatea suprafeţei electretului (faţa dinspre armătura mobilă) şi atrag o sarcină egală şi
de sens contrar (sarcini imagine). O parte din aceste sarcini atrase se găsesc pe suprafaţa
superioară a armăturii fixe în timp ce restul apar pe suprafaţa inferioară a membranei m obile.
Distribuţia între sarcinile induse pe cele două armături metalice depinde de raportul dintre
cele două capacităţi formate cu dielectric de tip electret (suprafaţa superioară a electretului –
34 Capitolul 2. Sunetul ca zgomot. Măsurători de zgomot. Sonometrul

armătură fixă) sau aer (suprafaţa superioara a electretului – membrana mobilă). În felul
acesta se produc două câmpuri electrice cu orientare opusă. Capacitatea utilă a microfonului
este cea formată între electret şi membrana mobilă. Întrucât capacitatea care apare între
sarcinile stocate în electret şi armătura fixă este conectată în serie cu cea utilă rezultă că în
mod uzual, microfoanele cu electret vor avea o capacitate nominală mai mică (tipic cu 20 -
25%) decât microfonul corespondent fără electret.

Microfoanele prepolarizate cu electret sunt în general mai c omplexe decât cele


tradiţionale şi sunt în principal utilizate atunci când se operează cu sonometre portabile,
alimentate de la baterii. Întrucât nu necesită tensiuni de polarizare şi ca urmare construcţia
preamplificatorului este mai simplă acest tip de microfon este preferat şi în situaţiile în care
spaţiul avut la dispoziţie este mai mic
.
Inginerie audio Prof. dr. ing. Cristian NEGRESCU
CAPITOLUL 3

NOŢIUNI DE PSIHOACUSTICĂ 1

3.1 Noţiuni de anatomie şi fiziologie a organului auditiv uman

Principalele componente ale organului auditiv uman sunt prezentate în Fig. 5.1.
Urechea externă, compusă din pavilionul urechii şi conductul extern transmite excitaţia
mecanică de la exterior până la nivelul timpanului. Acest traseu formează un sistem acustic
rezonant. Caracteristica de frecvenţă a acestuia prezintă o zonă plată cu un câştig de
aproximativ 0dB pentru domeniul de frecvenţă sub 1 kHz. Câştigul creşte cu 15 -20dB în
vecinătatea frecvenţei de 3.4kHz, pentru ca ulterior, către frecvenţe mari, acesta să scadă
printr-un profil complex de rezonanţe [Sha]. Oscilaţiile sonore preluate de timpan su nt
transmise prin intermediul osişoarelor urechii medii (ciocan, nicovală şi scăriţă) la nivelul
ferestrei ovale a cochleei. Sistemul mecanic al urechii medii poate fi aproximat într -o primă
fază cu un transformator de presiune, combinat cu un filtru trece sus cu factor de calitate 0.7
şi cu frecvenţă de tăiere 350Hz [Lyn], [Kat], [Kah]. Funcţia de transfer pentru urechea medie
prezintă un maxim în jurul frecventei de 1kHz. Cavitatea urechii medii şi legătura între
fereastra rotundă a cochleei şi faringe prin intermediul trompei lui Eustache asigură drenarea
lichidelor din cochlee.

Fig. 5.1. Organul auditiv uman

1
Prezentul material este un extras din Capitolul 1 al cărţi „Codecuri perceptuale audio multicanal”, autor C.Negrescu, Ed.
Printech, Bucuresti 2005
Pag. 34 Capitolul 3. Noţiuni de psihoacustică

Problemele care apar în cadrul urechii externe sau medii pot conduce la scăderea
acuităţii auditive sau chiar la pierderea auzului chiar şi atunci când cochleea (urechea
internă), care reprezintă “transductorul mecano-neural” funcţionează corect. În acest sens, ca
exemplu, poate fi dată înfundarea trompei lui Eustache care conduce la umplerea urechii
medii cu fluid şi are printre efecte reducerea substanţială a capacităţii auditive. O afecţiune
des întâlnesc în patologia pediatrică este otita, în care din nou are loc umplerea cavităţii
urechii medii, dar de data aceasta cu secreţii asociate infecţiilor (apare curent drept
complicaţii în cazul răcelilor). Afecţiunile legate de pierderea conductivităţii la urechea
externă sau medie sunt în mod normal tratate medicamentos şi/sau chirurgical şi mai rar cu
ajutorul protezelor auditive.
Comportamentul frecvenţial al ansamblului ureche externă – ureche medie va fi
caracterizată de un maxim de bandă destul de largă, plasat în jurul frecventei de 3 kHz. În
consecinţă mărimea stimulului la intrarea în sistemul nervos nu va depinde numai de
intensitatea sonoră ci şi de frecvenţa componentelor spectrale constituente.
Cochleea este locul în care excitaţia mecanică este transformată în excitaţie chimică
(nervoasă) capabilă de a fi transmisă la creier, în vederea prelucrării. Structura spiralată a
cochleei (vezi Fig. 5.1.) este împărţită în trei secţiuni (etajul timpanic, etajul mediu şi etajul
vestibular), toate umplute cu lichid limfatic (vezi Fig. 5.2.).
Etajul timpanic este conectat, prin intermediul ferestrei ovale, cu urechea medie.
Etajul mediu, (activ din punct de vedere acustic) este delimitat de două ţesuturi
conjunctivale, numite membrana bazilară şi respectiv membrana Reissner şi este umplut cu
lichidul (endolimfa) generat de epiteliul secretor.

Fig. 5.2. Cochleea – Secţiune transversală

Zona transductivă propriu-zisă este constituită din structura numită organul Corti (vezi
Fig. 5.3.). Această structură cuprinde ca element central, celulele cu cili (celule Corti). Ele se
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag.35

sprijină pe membrana bazilară prin intermediul unor prel ungiri digitale, iar în partea
superioară, dotată cu cili, oferă suport membranei tectoriale. Celulele Corti sunt cele care
preiau stimulul acustic prin intermediul cililor şi îl transformă în impuls neural preluat prin
dendritele celulelor ganglionare auditive. Există patru rânduri de celule Corti (trei externe –
3x12000=36000celule şi unul intern – 1x 3500). Cea mai mare parte a fibrelor neurale
amielinice (95%) sunt conectate la cele aproximativ 3500 celule Corti interne (sunt circa 10
conexiuni dendritice la fiecare celulă Corti internă) [Pick]. Pentru celulele Corti externe sunt
alocate numai circa 5% din totalul conexiunilor nervoase.

Fig. 5.3. Organul Corti

Privită longitudinal cochleea are o secţiune mai mare la intrare (capătul cu fereastra
ovală) şi mai mică spre capătul celălalt al melcului (helicotrema). Astfel, în totalitate,
cochleea se constituie într-o structură rezonantă progresivă.
Psihologul şi fizicianul german Herman von Helmholtz (1821-1894), fără o
demonstraţie riguroasă emite ipoteza conform căreia urechea internă (cochleea) analizează
tonurile prin intermediul frecvenţei lor, diferite frecvenţe excitând diferiţi neuroni.
Experimente îngrijite concepute şi realizate de Georg von Békésy (1899-1972) confirmă
această ipoteză, o dezvoltă semnificativ şi pun în evidenţa mecanismul.
La aplicarea unui stimul acustic, datorită presiunii oscilatorii exercitate de scariţă
asupra membranei ce acoperă ferestra ovală, apare o undă mecanică ce se transmite de-a
lungul etajului vestibular al melcului către apex, loc în care apare conexiunea cu etajul
timpanic. În acelaşi timp unda este transmisă endolimfei din etajul mediu prin intermediul
membranie Reisner, cauzând astfel mişcarea membranei bazilare. În continuare mişcarea este
transmisă perilimfei din etajul timpanic iar forţele asociate acesteia sunt disipate în aerul din
cavitatea timpanică prin mişcarea membranei ce acoeră fereastra rotundă. Dacă stimulul
aplicat este un ton pur (semnal sinusoidal), membrana bazilară nu vibrează unitar, cu aceeaşi
amplitudine pe toată întinderea ei. De ce? Pe măsura ce unda se propagă, de la fereastra
Pag. 36 Capitolul 3. Noţiuni de psihoacustică

ovală spre helicotremă, amplitudinea de oscilaţie se modifică. Când respectiva undă ajunge
în apropierea regiunii cu o frecvenţă proprie de rezonanţă mecanică apropiată de frecvenţa
excitaţiei (să ne amintim că excitaţia este sinusoidală şi deci caracterizată de o frecvenţă
dată) viteza de deplasare scade, iar amplitudinea oscilaţiei începe să crească. Odată cu
deplasarea către helicotremă amplitudinea undei creşte până la o valoare maximă, după care
va descreşte rapid. Membrana bazilară vibrează cu un maxim la o poziţie bine determinată şi
dependentă de frecvenţa stimulului acustic sinusoidal aplicat. Pentru excitaţii cu frecvenţă
mare (către 20kHz), vibraţiile membranei bazilare au maximul amplitudinii localizat lângă
fereastra ovală. În rest, oscilaţiile membranei bazilare au un nivel foarte scăzut. Pentru
excitaţii sinusoidale cu frecvenţă mică (catre 20Hz), membrana bazilară vibrează oarecum în
ansamblul ei, dar totuşi există un maxim de oscilaţie, care este plasat către vârful cochleei. În
literatura de specialitate, pentru un stimul tonal pur de frecvenţă dată, locaţia de pe
membrana bazilară care corespunde maximului amplitudinii poartă numele de poziţie
caracteristică. În mod dual, frecvenţa stimulului sinusoidal care excită cel mai bine (cu
amplitudine maximă) un anumit loc de pe membrana bazilară poartă numele de frecvenţă
caracteristică.
Acest concept sugerează existenţa unei transformări frecvenţă – poziţie (pe membrana
bazilară). Ca exemplu să considerăm un stimul tonal complex, alcătuit din suma a trei
sinusoide, cu frecvenţele f1 = 600 Hz, f 2 = 1600 Hz şi respectiv f 3 = 6400 Hz. În Fig. 5.4. [Pai]
este prezentată într-o formă simplificată distribuţia, de-a lungul cochleei, a oscilaţilor
membranei bazilare.
Se remarcă în mod explicit, pe membrana bazilară, trei zone distincte pentru care
amplitudinile oscialţiilor sunt semnficative. Pot fi uşor identificate poziţiile caracteristice
pentru frecvenţele 400Hz, 1600Hz şi 6400Hz, şi de asemenea se poate verifica uşor
monotonia dependenţei frecvenţă – poziţie caracteristică. Imaginea din Fig. 5.4. este desenată
cu intrarea în cochlee (fereastra ovală) spre dreapta deoarece în acest mod, parcurgerea
desenului de la stânga la dreapta sugerează în mod direct corespondenţa locaţiilor de pe
membrana bazilară cu poziţiile de pe o axă frecvenţială ipotetică pentru care frecvenţa creşte
(neliniar) de la stânga la dreapta.
Deplasarea membranei
bazilare
400 Hz 1600 Hz 6400 Hz

32 24 16 8 0 [mm]

Helicotrema Fereastra ovală


(intrarea în cochlee)
Fig. 5.4. Transformarea frecvenţă – poziţie de-a lungul membranei bazilare
(Axa orizontală este marcată în mm, măsuraţi de la fereastra ovală)
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag.37

Se remarcă în mod explicit, pe membrana bazilară, trei zone dist incte pentru care
amplitudinile oscilaţiilor sunt semnificative. Pot fi uşor identificate poziţiile caracteristice
pentru frecvenţele 400Hz, 1600Hz şi 6400Hz, şi de asemenea se poate verifica uşor
monotonia dependenţei frecvenţă – poziţie caracteristică. Imaginea din Fig. 5.4. este
desenată cu intrarea în cochlee (fereastra ovală) spre dreapta deoarece în acest mod,
parcurgerea desenului de la stânga la dreapta sugerează în mod direct coresp ondenţa
locaţiilor de pe membrana bazilară cu poziţiile de pe o axă frecvenţială ipotetică pentru care
frecvenţa creşte (neliniar) de la stânga la dreapta.

De-a lungul membranei bazilare celulele Corti transformă stimulul mecanic într -unul
nervos şi îl transmit către creier. Astfel, la o anumită frecvenţă, vor fi excitaţi peste pragul
de sensibilitate un grup specific de neuroni, (cei conectaţi la porţiunea care rezonează).
Creierul este cel responsabil cu asocierea unei senzaţii sonore specifice frecvenţei date. Să ne
amintim însă că fiecare celulă Corti este conectată la un neuron prin mai multe dendrite, iar
această mapare „SIMO” („Single Input Multi Ouput”), cu paralelismul ei, sugerează
importanta deosebită pe care o are păstrarea acestei analize frecve nţiale originale realizate la
nivelul membranei, prin intermediul proprietăţilor mecanice specifice.
Privind din nou Fig. 5.4.
Alfonso CORTI (1822-1876) să remarcăm că pentru un
Alfonso Corti s-a născut în 1822 la Pavia, în Italia. În stimul sinusoidal cu frecvenţă
1840 s-a mutat la Padova pentru a studia medicina la celebra dată nu sunt excitaţi numai
universitate din oraş. În 1846 s-a mutat la Viena, unde sub neuronii care prin intermediul
conducerea anatomistului ungur Josef Hyrtys şi-a obţinut celulelor Corti corespund exact
licenţa în medicină, cu o teză despre circulaţia sangvină la poziţiei caracteristice
reptile. Cu ocazia reprimării revoluţiei din 1848 institutul la respective. Într-adevăr
care lucra a fost ocupat de soldaţi, Corti pierzându-şi oscilaţiile membranei bazilare
manuscrisele şi preparatele anatomice. În 1849 şi-a început au amplitudini semnificative
cercetările privitoare la sistemul auditiv al mamiferelor, pe o întreagă vecinătate care
lucrând la Laboratorul Koelliker din Wurzburg. În 1851 înconjoară nesimetric poziţia
publică lucrarea „Recherches sur l’organ de l’ouie des caracteristică2. Vom vedea mai
mammiferes”. În acelaşi an, după moartea tatălui său târziu ce consecinţe are acest
moşteneşte titlul (marchiz) şi poziţia acestuia. Întorcându-se
fenomen. Deocamdată să mai
la Pavia îşi pierde interesul pentru cercetarea ştiinţifică şi
remarcăm că această vecinătate
renunţă la aceasta. S-a stins din viaţă în 1876.
nu are aceeaşi lărgime pentru
toate cele trei situaţii fiind dependentă de frecvenţa stimulului corespunzător.

2
Vecinătatea pentru care oscilaţiile membranei bazilare au amplitudini semnificative este plasată
nesimetric în jurul poziţiei de maxim (cea care corespunde frecvenţei caracteristice). Ea se întinde
semnificativ mai mult spre fereastra ovală (spre domeniul care corespunde unor frecvenţe mai mari
decât frecvenţa caracteristică) şi mai puţin spre domeniul de frecvenţe joase (mai mici decât frecvenţa
caracteristică).
Pag. 38 Capitolul 3. Noţiuni de psihoacustică

Ideea conform căreia locul (pe membrana bazilară) în care este plasată excitaţia
serveşte la „codarea” frecvenţei într-un mod specific şi predestinat este cunoscută sub
denumirea teoria auzului prin locaţie. Organizarea sistemului auditiv prin care frecvenţe
diferite excită în mod preferenţial diferiţi neuroni este cunoscută sub numele de organizare
tonotopică. Se pare că de la nervul auditiv până la zona specifică auzului de pe cortex,
întreaga sub-secţiune a sistemul auditiv este organizată tonotopic [Rom].
Deoarece sistemul auditiv uman are un comportament destul de asemănător cu cel al
unui analizor de frecvenţă, semnalele sinusoidale (tonurile pure) ocupă o poziţie privilegiată
în întreg domeniul audio.

3.2 OBIECTIV ŞI SUBIECTIV ÎN PERCEPŢIA SUNETELOR

Conform definiţiei de dicţionar substantivul sunet are mai multe semnificaţii. Ele pot
fi împărţite în două categorii.
Pe de o parte remarcăm un înţeles „obiectiv”, bine precizat, al cuvântului sunet:
vibraţie mecanică transmisă printr-un mediu elastic. Pe de altă parte substantivul sunet are şi
un număr de înţelesuri „subiective”, în care într-un fel sau altul este implicată o fiinţă vie (de
obicei omul). Astfel, acelaşi cuvânt „sunet” semnifică senzaţia produsă de stimularea
organului auditiv prin vibraţii transmise prin aer sau un alt mediu, dar în mod particular,
poate să semnifice chiar şi un anumit set de caracteristici subiective mai dificil de definit
(sunetul specific al unui set de boxe, sunetul ca stil muzical – de exemplu sunetul formaţiei
Queen, etc.).
Pentru a distinge între cele două categorii vom folosi pe parcursul prezentului material
noţiunea de sunet fizic ca entitate care există independent de ascultător şi care poate fi
măsurată prin intermediul unor aparate specifice [Sta]. Senzaţia de sunet este generată de
sunetul fizic în anumite condiţii şi corespunde răspunsului senzorial al ascultătorului la
stimulul sonor extern. Sunetul fizic poate fi caracterizat prin intermediul unor mărimi fizice
obiective. Lor le vor corespunde la nivelul senzaţiei de sunet un număr de mărimi subiective.
Astfel, presiunea sau intensitatea sonoră, ca mărimi obiective sunt în strânsă legătură cu ceea
ce senzorial se numeşte tărie sonoră (mărime subiectivă) (în limba engleză se utilizează
cuvântul „loudness”)). Cu cât stimulul sonor va avea un nivel al presiunii/intensităţii sonore
mai ridicat, cu atât sunetul va fi considerat mai tare pe o scară de la slab la puternic. De
asemenea putem identifica o corespondentă monotonă între frecvenţa unui stimul sinusoidal
(ton pur) şi ceea ce este perceput drept înălţime a sunetului (pe o scară grav-înalt) (în limba
engleză se utilizează cuvântul „pitch”). În sfârşit, mărimea subiectivă numită timbru (în
limba engleză „timbre” sau „tone color”) cuprinde acea caracteristică a senzaţiei de sunet
care este independentă de tărie şi înălţime şi este determinată de structura spectrală
particulară (ca mărime obiectivă) a sunetului fizic.
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag.39

În pofida corespondenţelor menţionate anterior (prezentate unitar în Tabelul 3.1)


precum şi a „ortogonalităţii” mărimilor subiective tărie, înălţime şi timbru, trebuie menţionat
faptul că din punct de vedere psihoacustic lucrurile nu sunt chiar simple. Pentru aceasta să
încercăm să răspundem la o întrebare aparent banală.

Tabelul 3.1 Corespondenţa între mărimile obiective şi cele subiective


Mărimea subiectivă
Mărimea obiectivă
corespondentă
Presiune, Intensitate sonoră Tărie
Frecvenţa Înălţime
Structură spectrală = sunet complex Timbru

Cum sună un ton pur?

Din perspectiva percepţiei sonore, la fel ca orice sunet în ge neral, un ton pur
(sinusoidal) poate fi caracterizat prin înălţime („pitch”), tărie („loudness”) şi timbru („tone
color”). Pentru început să luăm în considerare timbrul. Deşi aici lucrurile ar trebui să fie
simple, (un ton pur nu are decât o singură componentă – fundamentala), totuşi vom constata
că timbrul perceput de un ascultător nu este unic, ci variază în funcţie de frecvenţă. Astfel,
un ton pur de frecvenţă joasă este perceput ca fiind lipsit de strălucire, bont („dull”). Un ton
pur cu frecvenţă ridicată va fi catalogat de ascultător drept strălucitor („bright”) sau
pătrunzător („piercing”). Ce înseamnă în acest context frecvenţă joasă sau înaltă, pare a se
stabili în funcţie de domeniul spectral ocupat de semnalul vocal şi de instrumentele muzicale
curente. Un ton pur cu frecvenţa sub 200Hz (frecvenţa fundamentală pentru semnalul vocal al
unui vorbitor feminin) este considerat lipsit de strălucire probabil pentru că în viaţa de zi cu
zi nu avem semnale cu fundamentala sub această limită şi neînsoţite d e eventuale armonici
superioare care să adauge o strălucire suplimentară. Un ton pur cu frecventa peste 2000Hz
este descris prin atributul strălucitor. Dacă este şi intens (cu tărie ridicată) el devine strident
(„shrill”). Probabil această percepţie poate fi explicată parţial prin faptul că 2000Hz este o
frecvenţa apropiată de domeniul 3000-5000Hz unde auzul uman este foarte sensibil.
Sensibilitatea crescută în acest domeniu face ca sunetul să fie auzit mai tare. Pe de altă parte
sunete a căror componente spectrale maxime să fie plasate peste 2000Hz se întâlnesc destul
de rar în mod obişnuit. Semnalul vocal are cea mai mare parte a energiei repartizată spectral
sub această limită, şi spre deosebire de instrumentele muzicale medievale, cele moderne
îndeplinesc în cea mai mare parte (nu toate) această condiţie (marea majoritate a
instrumentelor cu corzi sau cele de suflat cu corp din lemn).

Un fapt remarcabil care nu este specific numai sunetului ci şi altor corelaţii obiectiv –
subiectiv este că mărimea subiectivă apare (există) numai în anumite condiţii, constituind
domeniul de existenţă al senzaţiei în cauză, în cazul de faţă al senzaţiei sonore [St2].
Pag. 40 Capitolul 3. Noţiuni de psihoacustică

3.3 INTENSITATEA ŞI TĂRIA SONORĂ

3.3.1 Generalităţi

Intensitatea sunetului este o mărime fizică, care poate fi măsurată cu ajutorul unui
instrument acustic adecvat. Mărimea perceptuală corespondentă, tăria sunetului este prin
contrast o mărime psihologică, şi poate fi măsurată (evaluată) numai de ascultător sau de un
instrument care emulează comportamentul acestuia. Urmărind cele prezentate anterior, este
de aşteptat ca intensitatea sonoră şi tăria percepută să nu fie identice. Pe de o parte,
geometria urechii este deosebit de complexă şi in consecinţă funcţia de transfer echivalentă
nu va avea o caracteristică de amplitudine plată. Pe de altă parte, în procesul auditiv intervin
neuronii şi cortexul cu un comportament puternic neliniar. În consecinţă, chiar dacă avem de
a face cu semnale sonore simple, sinusoidale, şi care pot fi caracterizate complet prin
amplitudine (sau echivalent prin intensitate sonoră), prin frecvenţă şi prin faza iniţială,
experimentele ne arată că tăria (percepută) a sunetului va fi dependentă atât de intensitate cât
şi de frecvenţă.

3.3.2 Nivelul tăriei sonore. Fonul. Curbele izofone

Un prim pas în construcţia unei scări pentru tăria sonoră implică compensarea
dependenţei de frecvenţă pentru tonuri pure. O astfel de măsură este nivelul tăriei sonore
exprimat in foni3. Pentru un ton sinusoidal cu frecvenţă şi nivel oarecare, nivelul tărie i
sonore exprimat în foni, este numeric egal cu nivelul presiunii sonore exprimat în decibeli
(dB SPL) al unui ton sinusoidal cu frecvenţa de 1000Hz pe care ascultătorul îl percepe cu
aceeaşi tărie sonoră (la fel de puternic). Astfel, prin definiţie, două tonuri sinusoidale cu
acelaşi număr de foni sunt percepute ca având aceeaşi tărie sonoră. În acest context prezintă
importantă curbele de egală tărie, numite şi curbe izofone.
Pentru construcţia unei curbe izofone, experimentul debutează cu audiţia unui to n
sinusoidal cu frecvenţa de 1000Hz şi cu o presiune sonoră oarecare. Pentru a fixa lucrurile să
alegem nivelul presiunii sonore la 20dB SPL. Ulterior, frecvenţa tonului este schimbată de la
1000Hz la (să zicem) 100Hz. În mod experimental ascultătorul cons tată că, dacă păstrează
nemodificată amplitudinea semnalului, noul ton va fi perceput mai slab. Pentru a -l percepe cu
aceeaşi tărie ca pe primul, el va trebui să-i crească treptat nivelul, ajungând la o presiune
sonoră de aproximativ 37dB SPL. Cele două puncte (1000Hz cu 20dB SPL şi 100Hz cu 37dB
SPL) aparţin aceleiaşi curbe izofone (de egală tărie sonoră). Repetând experimentul cu
diverse valori ale frecvenţei tonului şi ajustând nivelul presiunii sonore în consecinţă, se
poate construi, punct cu punct, întreaga curbă izofonă. Aceasta va purta, prin definiţie,

3
Termenul de limbă engleză este “phons” şi rimează în scris cu “Johns”, dar se recomandă a se
pronunţa ca şi “phones”, deoarece unitatea de măsură a fost inventată de Barkhausen şi acesta este
modul în care el ar fi pronunţat-o [Fl1].
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag.41

numele de curba de egală tărie la 20foni (deoarece 1000Hz este frecvenţa de referinţă pentru
măsurătorile exprimate în foni).
Curbele izofone sunt specifice fiecărui ascultători în parte dar alura lor este aceeaşi
pentru toate persoanele otologic normale. Pentru obţinerea unor curbe care pot fi utilizate în
aplicaţii, se realizează medieri statistice, care implică un număr mare de ascultători. Curbele
izofone recomandate de ISO (International Standards Organization) sunt prezentate în
Fig. 5.5.
Deşi reprezintă un pas important, nivelul tăriei sonore exprimat în foni nu este o
măsură a tăriei sonore ci reprezintă doar o scală logaritmică (în dB) compensată în frecvenţă.

Fig. 5.5. Curbele izofone conform ISO

3.3.3 Pragul de audibilitate

Curba izofonă plasată cel mai jos în graficul din Fig. 5.5. se numeşte prag de
audibilitate în linişte sau prag de audibilitate absolut. Pragul de audibilitate reprezintă
minimul energetic (exprimat în dB SPL) necesar unui stimul tonal pur pentru ca el să fie
detectat de ascultător, în condiţii de linişte.
Presiunea sonoră [dB]
80

60

40

20

0
0 2 4 6 8 10 12 14 16
Frecvenţa [kHz]

Fig. 5.6. Pragul de audibilitate absolut


Pag. 42 Capitolul 3. Noţiuni de psihoacustică

Măsurătorile pentru pragul de audibilitate (vezi Fig. 5.6.) se fac într-un mediu
anecoic, semnalul sinusoidal de test fiindu-i prezentat ascultătorului prin intermediul unui
difuzor, în absenţa altor stimuli acustici (linişte). Dependenţa de frecvenţă a pragului de
audibilitate a fost măsurată încă din 1940 când Fletcher a publicat un raport cu rezultatele
testelor unui studiu privind acuitatea auditivă pentru un număr de ascultători [Fle]. Minimul
din apropierea frecvenţei de 4000Hz se datorează rezonanţei urechii externe. Dacă
măsurătorile sunt efectuate prin intermediul căştilor, rezultatele pentru pragul de audibilitate
diferă în această regiune spectrală deoarece este modificată geometria urechii externe. De
asemenea, când sunt utilizate căştile, măsurătorile arată că pentru dom eniul frecvenţelor
joase, pragul de audibilitate devine mai mare, deoarece zgomotul în această bandă creşte ca
urmare a ocluziei urechii (poate datorită circulaţiei sangvine [Yos]).

Acuitatea auzului este cu totul deosebită, fiind demn de remarcat faptul că la 1000Hz
pragul de audibilitate în linişte corespunde unei oscilaţii a timpanului care implică deplasări
−11
cu amplitudine mai mică decât diametrul unui atom de hidrogen ( 5 10 m).
Conform [Ter], pragul de audibilitate în linişte (absolut) LTq exprimat în dB SPL,
poate fi determinat cu aproximaţie, folosind relaţia empirică

LTq dB SPL = 3.64  f


−0.6( f −3.3)
2
−0.8
− 6.5  e + 10−3 f 4 , (5.1)

în care frecvenţa f este


Harvey FLETCHER (1884-1981)
exprimată în kHz. S-a
Harvey Fletcher s-a născut la data de 11 Septembrie 1884 în dovedit că relaţia (5.1)
Provo, Utah, SUA. Din 1908 până în 1991 a fost student al
aproximează suficient
Departamentului de Fizică al Universităţii din Chicago, timp în care a
de bine rezultatele
adus importante contribuţii la celebrul experiment cu picătura de ulei
obţinute în urma unor
cu care s-a determinat sarcina electronului. În 1916 şi-a început
experimente exhaustive
lucrul la Departamentul de cercetare al companiei Western Elecric,
şi ca urmare, ea se
viitorul Bell Labs. Lucrând la optimizarea comunicaţiilor telefonice
utilizează cu succes în
adoptă o primă abordare principială în domeniul vorbirii şi mai ales
aplicaţiile curente.
al auzului. Cercetările sale se concretizează într-o sistematică a
aplicării acusticii în electronică, o tehnologie care a fost disponibilă Totuşi, subliniem aici
numai la laboratoarele Bell şi care şi-a pus semnificativ amprenta din nou caracterul
asupra cercetării audio. Printre conceptele dezvoltate se numără: statistic al pragului de
măsurarea tăriei sonore, curbele izofone, sumarea tăriei, indicele de audibilitate.
articulare şi benzile critice. Grupul său de cercetare şi-a adus În general se
contribuţia semnificativă la inventarea audiometrului electronic şi a presupune că puternica
protezelor auditive precum şi la dezvoltarea reproducerii stereofonice dependenţă de frecvenţă
a sunetelor. În 1952 se întoarce la Provo, unde a lucrat la sinteza a pragului de
electronică muzicală. S-a stins din viaţă în Utah, la 23 Iulie 1981.
audibilitate în linişte se
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag.43

datorează filtrării mecano-acustice la nivelul urechii externe şi medii. Deoarece filtrarea


acustică are caracter (aproximativ) liniar ar fi de aşteptat ca aceasta dependenţă să nu fie
influenţată de nivelul presiunii sonore la care se face testul. Totuşi, dacă studiem Fig. 5.5.
remarcăm că odată cu creşterea presiunii sonore, deşi curbele izofone îşi păstrează alura,
devin „mai plate”. Se consideră că acest efect se realizează la nivel neuronal. O explicaţie
posibilă face apel la faptul că, pentru domeniul frecvenţial până la 1000Hz are loc, odată cu
creşterea intensităţii sonore, şi o sporire a împrăştierii (spaţiale) a excitaţiei l a nivelul
membranei bazilare. Pe măsură ce această împrăştiere creşte, mai mulţi neuroni sunt excitaţi
prin intermediul celulelor Corti accentuând astfel tăria (percepţia intensităţii) într -o manieră
care să compenseze oarecum atenuarea frecvenţelor joase de către sistemul periferic. O altă
explicaţie posibilă face apel la existenţa fibrelor neurale cu praguri de activare diferite.
Astfel s-ar putea ca repartiţia între cele două categorii de fibre (cu praguri de activare mici şi
cu praguri de activare mari) să fie diferită pentru zona frecvenţelor joase în raport cu zona
corespunzătoare frecvenţelor înalte [Har].

3.3.4 Pragul diferenţial pentru intensitatea/presiunea sonoră. Legea


Weber

Aplicat la o mărime oarecare, pragul diferenţial se defineşte drept cea mai mică
modificare cantitativă detectabilă a respectivei mărimi. Pragul diferenţial este o măsură a
rezoluţiei unui proces receptiv determinând astfel cantitatea de informaţie care poate fi
transmisă prin modulaţia respectivei mărimi particulare. Se obi şnuieşte ca pragul diferenţial
pentru intensitate sonoră să fie comparat cu o situaţie ideală, materializată prin legea Weber.
Această lege statuează faptul că pragul diferenţial pentru o mărime dată este direct
proporţional cu valoarea respectivei mărimi. Dacă ar fi valabilă pentru intensitatea sonoră,
legea Weber ar fi scrisă sub forma
I
= constant , (5.2)
I
unde I este valoarea intensităţii pentru semnalul audiat curent iar I  0 este cea mai mică
cantitate pentru care semnalul cu intensitate I  I este perceput ca având o tărie diferită de
cea iniţială. Se remarcă uşor că respectarea legii Weber este echivalentă cu faptul că pragul
diferenţial I pentru intensitate (exprimat în dB) este constant, indiferent de nivelul
intensităţii I la care acesta este măsurat.
Valorile pragului diferenţial (în dB) pentru intensitatea/presiunea sonoră exprimată în
dB SPL, aşa cum au fost măsurate în 1980 [Hou], sunt prezentate în Fig. 5.7. Pentru
realizarea măsurătorilor au fost utilizate două tipuri de semnale de test: zgomot alb şi ton pur
(sinusoidal) cu frecvenţa de 1000Hz.
Din studiul curbelor din figura de mai sus se remarcă uşor că pentru semnale de bandă
largă, de tip zgomot alb, la nivele ale intensităţii sonore mai mari de 20dB SPL, evoluţia
Pag. 44 Capitolul 3. Noţiuni de psihoacustică

pragului diferenţial este aproape constantă, în jurul valorii 0.65dB, ceea ce arată că se
respectă legea Weber. Lucrurile stau diferit dacă stimulul este de tip sinusoidal. Pen tru
acelaşi domeniu (peste 20dB SPL), odată cu creşterea nivelului intensităţii/presiunii la care
se face măsurătoarea, pragul diferenţial scade relativ încet dar sistematic (de la 1.2dB la
circa 0.4 dB).
Studiile efectuate în legătură cu pragul diferenţi al pentru intensitate prezintă o
importantă deosebită deoarece acestea au un impact semnificativ asupra modelelor
psihoacustice pe care aplicaţiile le-ar putea folosi.

Fig. 5.7. Pragul diferenţial pentru intensitate/presiune sonoră


1 – Semnal de test de tip zgomot alb
2 – Semnal de test de tip sinusoidal (1000Hz)

3.3.5 Noţiuni de psihometrie. Legea puterii

După cum precizam anterior, nivelul tăriei sonore exprimat în foni nu este o măs ură a
tăriei sonore ci reprezintă doar o scală logaritmică (în dB) compensată în frecvenţă. Într -
adevăr privind doar graficul din Fig. 5.5. nu putem spune cu cât se aude mai tare un sunet de
20 foni în comparaţie cu unul de 10foni.
Notând cu S măsura tăriei sonore, legătura dintre aceasta şi intensitatea sonoră I ,
2
măsurată în [ W/m ], devine

S = kI p , (5.3)

Notând cu S măsura tăriei sonore, legătura dintre aceasta şi intensitatea sonoră I,


2
măsurată în [ W/m ], devine
lg S = lg k + p lg I . (5.4)
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag.45

Introducând în ecuaţie nivelul intensităţii/presiunii sonore exprimate în [dB SPL],


L = 10lg ( I / I ref ) rezultă imediat
p
lg S = lg kI refp + L. (5.5)
10

ceea ce semnifică faptul că logaritmul estimatului tăriei sonore este o funcţie liniară de
nivelul intensităţii/presiunii sonore, evident exprimat în [dB SPL]. Pa nta acestei funcţii
liniare este direct proporţională cu exponentul p din legea (5.3).
Experimente îngrijit concepute arată că tăria sonoră creşte în mod diferit pentru
stimuli de bandă largă şi pentru stimuli de bandă îngustă.
În acest sens rezultatele experimentale au permis ca majoritatea cercetătorilor din
domeniu să accepte pentru stimuli de bandă largă o valoare a exponentului p = 0.25 în
timp ce pentru stimuli tonali p = 0.3. pare a fi una destul de aproape de realitate. Să
remarcăm că valoarea particulară p = 0.3 este una foarte convenabilă deoarece pentru a
percepe dublarea tăriei unui semnal sinusoidal cu frecvenţa de 1000Hz este necesar ca
nivelul intensităţii/presiunii sonore a acestuia să crească cu 10dB. Implicând şi definiţia
nivelului tăriei sonore (în foni) putem spune că pentru un stimul sinusoidal cu orice
frecvenţă, creşterea cu 10 foni implică dublarea tăriei sonore.

3.3.6 Măsurarea tăriei sonore pentru semnale sinusoidale. Sonul.


Conversia fon-son

Valoarea p = 0.3 a exponentului este baza pentru marcarea tăriei sonore în soni şi
este folosită curent în standarde internaţionale. Prin definiţie, 1 son este valoarea tăriei
sonore care corespunde unui semnal sinusoidal cu frecvenţă de 1000Hz şi cu nivelul
intensităţii/presiunii sonore de 40db SPL. Astfel, rescrierea ecuaţiei (5.3) pentru valoarea
aleasă a exponentului conduce la
0.3
1  I 
S[soni] =   pentru f = 1kHz , (5.6)
15.849  I ref 

ceea ce ne permite determinarea tăriei unui semnal sinusoidal, cu frecvenţa de 1000Hz şi cu


intensitatea sonoră I . Logaritmând (5.6) rezultă
lg S[soni] = − lg15.849 + 0.03L[dbSPL] pentru f = 1kHz , (5.7)

relaţie prin intermediul căreia putem evalua tăria aceluiaşi semnal sinusoidal cu frecvenţa de
1000Hz dar a cărui intensitate sonoră este exprimată acum în dB -SPL sau în foni. (să ne
Pag. 46 Capitolul 3. Noţiuni de psihoacustică

reamintim că, prin definiţie, pentru frecvenţe de 1kHz numărul de foni este egal cu numărul
de dB SPL).

Aceeaşi relaţie (5.7) ne permite să introducem un grad de generalitate şi să calcul ăm


tăria sonoră (în soni) pentru orice stimul sinusoidal . Pentru aceasta convertim
L[dB SPL] ⎯⎯
→ L [foni] cu ajutorul graficului Fig. 5.5. (nivelul intensităţii/presiunii
sonore exprimat în dB SPL este convertit în foni) astfel că (5.7) devine
lg S[soni] = − lg15.849 + 0.03L [foni] , pentru orice f . (5.8)

3.3.7 Determinarea tăriei stimulilor cu structură complexă

În multe din situaţiile întâlnite în practică se pune problema determin ării tăriei sonore
atunci când semnalul acustic are o structură spectrală mai complexă (componente sinusoidale
multiple sau chiar semnale de tip zgomot cu bandă dată). O primă situaţie, mai simplă şi mai
uşor de controlat constă în necesitatea determinării tăriei sonore pentru două componente
tonale pure, fiecare în parte cu aceeaşi tărie sonoră. Experimentele arată că dacă cele două
sinusoide au frecvenţele suficient de depărtate, atunci tăria ansamblului este egală cu suma
tăriei celor două componente ( S = S1 + S2 ). Dacă însă cele două componente au frecvenţe
apropiate (sunt în interiorul aceleiaşi benzi critice §3.4.3) atunci tăria sonoră se va calcula
aplicând sumei celor două intensităţi sonore, legea (5.6) de tip putere. Întrucât această lege
este de tip contractiv (exponentul este 0.3) tăria pentru suma a două sinusoide apropiate este
mai mică decât sumă tăriilor individuale.

Un exemplu mai detaliat de compunere a două sinusoide este prezentat în figura


Fig. 5.8. Să considerăm că avem două sinusoide, fiecare cu tăria sonoră S1 = S2 = 4 soni,
una cu frecvenţă f1 iar cealaltă cu frecvenţa f1 + f ( f este ecartul între cele două
componente pur tonale). În funcţie de valoarea f se disting trei zone diferite:
Tărie sonoră Presiune sonoră
[soni] [dB SPL]
8 70
7 68
Tăria/presiunea sonoră 6 66
pentru componentele
tonale 5 63
4 60
0 Hz 10 Hz CBw f
Fig. 5.8. Determinarea tăriei sonore pentru un stimul complex format din două tonuri pure de tărie
egală (4 soni)
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag.47

• Frecvenţe foarte apropiate ( f  8 − 10 Hz)

Dacă f este de doar câţiva Hz, atunci ascultătorul percepe fenomenul de bătăi şi va
evalua tăria ansamblului bazându-se pe amplitudinea presiunii rezultante. Deoarece
amplitudinea rezultantă se dublează, valoarea efectivă a presiunii se dubleaz ă ( pr = 2 p ),
= ( 2 p ) / Z c = 4 I ),
2
intensitatea sonoră creşte de 4 ori ( I r iar creşterea tăriei sonore

percepute (în soni) va fi de 40.3 = 1.5 ori (vezi şi graficul prezentat în Fig. 5.8.)
• Frecvenţe apropiate, în interiorul aceleiaşi benzi critice
(10 − 20Hz  f  CBw )

Dacă f depăşeşte circa 20Hz, fenomenul de bătăi nu se mai manifestă şi ascultătorul


percepe un sunet complex, cu două tonuri distincte. În plus dacă ecartul între cele două
frecvenţe pure nu depăşeşte lărgimea benzii critice („critical bandwidth”) atunci compunerea
se va face energetic, prin intensitatea sonoră. Altfel I r = 2I iar tăria rezultantă S r va fi de
aproximativ 5 soni (vezi Fig. 5.8.):

• Frecvenţe depărtate f  CBw

Când cele două tonuri pure sunt suficient de depărtate, f depăşind lărgimea benzii
critice (CBw), tăria sonoră (în soni) se sumează direct, rezultând Sr = 2S = 2  4 = 8[soni]
(vezi Fig. 5.8.).

Calculul tăriei pentru semnale de bandă largă este destul de dificil, datorită
intereacţiilor multiple. Dintre diversele metodele de calcul propuse trei au devenit standarde
internaţionale. Metoda propusă de Stevens în 1961 stă la baza standardelor ISO R532A şi
ANSI 3.4-1980, iar cea propuse de Zwicker (1990) devine standardul ISO R532B. În acest
context cel mai nou şi mai performant standard este Ansi S3.4 -2007. El se bazează pe un
model de percepţie tăriei propus de Moore, Glasberg şi Baer.

3.3.8 Tăriei semnalelor cu du rată finită

Să ne imaginăm un experiment simplu, în care un tren sinusoidal de o anumită


frecvenţă şi cu durată t0 finită este prezentat unui ascultător căruia i se cere să -i evalueze
tăria sonoră. Rezultatele unui astfel de test arată că pentru valori mici ale lui t0 , tăria creşte
monoton, odată cu creşterea duratei stimulului. Când însă t0 depăşeşte o anumită limită, tăria
sonoră percepută rămâne aceeaşi, indiferent cât de mult est e crescută durata stimulului.

Pentru a explica un astfel de comportament, încă din 1947 Munson sugerează că


sistemul auditiv uman are un comportament similar cu al integratorului cu scurgeri (pierderi).
Câţiva ani mai târziu Plomp şi Bouman (1959), folosind presupunerea că senzaţia de tărie
Pag. 48 Capitolul 3. Noţiuni de psihoacustică

sonoră se obţine prin acumularea unor pulsuri neuronale, statuează că rata acestora este
constantă4. În consecinţă tăria sonoră percepută la aplicarea unui stimul sonor de durată t ar
()
fi dată de cumularea unui număr h t de pulsuri neuronale, număr a cărui evoluţie în timp
respectă ecuaţia.

 −
t

h ( t ) = R    1 − e 
. (5.9)
 
Considerând R = 100 pulsuri/s şi diferite valori ale constantei de timp  se obţin
pentru h graficele din Fig. 5.9.

Remarcăm că dacă durata stimulului este mică ( t   ) atunci


h ( t ) R  t , pentru 0  t  t0 , (5.10)

ceea ce ar justifica observaţia experimentală. Dacă însă stimulul este suficient de lung
( t0   ), atunci

h ( t ) R  , pentru 3  t  t0 . (5.11)

ceea ce iarăşi coincide cu observaţia experimentală conform căreia tăria sonoră rămâne
constantă, indiferent cât de lung este stimulul.

h (t )
20
 =

 = 200
10
 = 100

0 100 200 300 400 t [ms]


Fig. 5.9. Determinarea numărului cumulat de pulsuri neuronale h ( t ) folosind
integratorului cu scurgeri

4
Mai exact R ar trebui să fie dependentă de puterea excitaţiei, dar în cazul de faţă, stimulul fiind de
nivel constant, R poate fi presupus şi el constant. În ceea ce priveşte  , diverse experimente sugerează
că ar trebui să depindă de frecvenţa stimulului, dar şi de această dată, în experimentul menţionat
frecvenţa nemodificându-se,  rămâne o constantă.
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag.49

3.4 FILTRE AUDITIVE. BENZILE CRITICE ŞI IMPLICAŢIILE


LOR

3.4.1 „Acordul” neuronilor. Caracteristici de selectivitate şi sincronizarea


temporală

Capacitatea de analiză frecvenţială a sistemului auditiv este una din caracteristicile


importante ale acestuia, deoarece înzestrează posesorul cu o anumită rezoluţie în perceperea
distinctă a diverselor componente spectrale care formează stimulul acustic audiat. Această
abilitate îşi are baza în conversia frecvenţial diferenţiată a presiunii acustice în impusuri
neuronale, conversie realizată la nivelul cochleei şi rafinată ulterior prin capacitatea de
interpretare la nivel cortical. Devine astfel de înţeles importanţa studiului răspunsului
frecvenţial al fiecărui neuron aferent celulelor ciliate Corti. Studiile arată că acest răspuns
frecvenţial este de tip trece bandă, [….] comportarea remarcată sugerând faptul că, dacă s-ar
respecta liniaritatea, pentru fiecare neuron, ar exista o „funcţie de transfer” de tip trece
bandă H( f ), a cărui caracteristică de amplitudine normată H ( f ) / H ( fc ) ar putea fi

destul de bine aproximată cu cea prezentată în Fig. 5.10.


H(f)
20lg
H ( fc )
0 Ph

Pl
-20

-40

-60

fc log ( f )
Fig. 5.10. Model pentru caracteristica de amplitudine a unui neuron

Relativ la curba de acord a neuronilor şi deci în mod corespondent la caracteristica de


amplitudine pentru filtrul normat, este important de precizat că deşi alura se păstrează, la
nivele mai mari ale stimulului sinusoidal pantele graficelor se modifică. Dacă panta
superioară îşi păstrează oarecum înclinarea, panta inferioară scade semnificati v pe măsură ce
nivelul stimulului creşte, neuronul devenind mai puţin selectiv pentru frecvenţe mai mici
decât f c .
Pag. 50 Capitolul 3. Noţiuni de psihoacustică

3.4.2 De fapt, cine realizează selectivitatea în frecvenţă?

Prima contribuţie relevantă în acest domeniu o aduce Helmholtz care, ignorând


efectele hidrodinamice ale fluidului din cochlee, reprezintă membrana bazilară ca o bandă
elastică tensionată progresiv radial [Hel]. Presupunând o tensiune neglijabilă după direcţia
longitudinală, membrana bazilară ar putea fi modelată printr-o mulţime de rezonatori
acordaţi pe diferite frecvenţe. Aşadar cochleea putea fi asimilată cu un analizor spectral,
realizând o corespondenţă frecvenţă – poziţie. Într-adevăr, membrana bazilară este formată
intern dintr-un număr de
Georg von BÉKÉSY fibre elastice tensionate.
Georg von Békésy s-a născut în Budapesta, la 3 Iunie 1899. Aceste fibre sunt mai
Având părinţii în serviciul diplomatic Békésy a călătorit mult şi şi-a scurte şi împachetate mai
desăvârşit educaţia în München, Istambul, Budapesta şi Zurrich A strâns în regiunea din
studiat chimia la universitatea din Berna terminându-şi doctoratul în apropierea ferestrei ovale
1923, la Universitatea din Budapesta. Din acelaşi an începe să (la intrarea în cochleee),
lucreze la Institutul Regal de Cercetări în Telegrafie din Ungaria. devenind progresiv mai
Între 1939 şi 1946 a lucrat şi la Universitatea din Budapesta, ca lungi şi mai depărtate, pe
profesor de fizică experimentală. Cercetările sale în domeniu măsură ce ne apropiem de
auzului încep cu lucrul la o cască telefonică îmbunătăţită, context în helicotremă.
care a studiat impedanţa mecanică a aerului pentru a putea realiza
Aflându-se sub
adaptări mai bune. Experimentele sale în mecanica cochleei pentru
tensiune fibrele pot vibra
care în 1961 primeşte premiul Nobel în Fiziologie şi Medicină sunt
„similar corzilor unor
descrise într-o lucrare publicată încă din 1928 iar în 1943, după 15
instrumente”, acordate pe
ani de studiu publică profilul clasic al undelor progresive. În 1947
frecvenţe diferite. Această
devine cercetător la Tehnical Institute of Stocholm, iar apoi la
laboratorul de Psihoacustică de la Harvard, condus de S.S. Stevens. concepţie a rămas practic
În 1960 o colecţie de lucrări de ale sale este publicată ca o carte, nemodificată până în 1927
intitulată „Experiments in Hearing”. Devenită celebră prin când Békésy (vezi caseta),
ingeniozitatea experimentelor şi prin observaţiile descrise, este realizează importanţa
retipărită în 1989 de Acoustical Society of America. După intereacţiilor hidro-
retragerea sa de la Harvard se mută la Universitatea din Hawaii. dinamice. Pe baza unui
Trece în nefiinţă la Honolulu în 13 Iunie 1972. Colecţia sa de artă,
model de laborator el
alcătuită cu deosebită grijă de-a lungul întregii sale cariere, sedescoperă undele
găseşte la Fundaţia Nobel din Stockolm. progresive care se
propagă de-a lungul
membranei bazilare (Fig. 5.11.a). Observaţiile sale sunt confirmate anatomic. În timpul
deplasării, aceste unde progresive au o amplitudine diferită, în funcţie de poziţia la care au
ajuns. Pentru un stimul de frecvenţă joasă vârfurile de oscilaţie sunt mai aproape de
helicotremă în timp ce pentru frecvenţe mai înalte localizarea lor se face mai aproape de
fereastra ovală. Localizarea acestor vârfuri de oscilaţie respectă o spaţiere aproximativ
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag.51

logaritmică (vezi Fig. 5.11.b), fiind dictată de rigiditatea membranei bazilare care creşte
exponenţial de la apex (helicotremă) către fereastra ovală (vezi Fig. 5.12.b [Ols]).
Rigiditatea progresivă a membranei bazilare se datorează parţial creşterii lăţimii
membranei (vezi Fig. 5.12.a [Ols]) şi parţial scăderii grosimii acesteia.

Fereastra ovală

Unda
progresivă
a) b)
Membrana
bazilară
Helicotrema

Fig. 5.11. Membrana bazilară – Reprezentare schematică


a) Unda progresivă „îngheţată” la un moment dat – Pentru o mai mare claritate membrana bazilară este
reprezentată „de-spiralat”
b) Spaţierea logaritmică a frecvenţelor caracteristice pe membrana bazilară

0.6 mm Kg
10 5 ms 2
0.5

0.4 10 4

0.3
10 3
a) 0.2 b)
10 2
0.1
l
0 101
0 5 10 15 20 25 30 mm 0 0.5 1 ltot

Fig. 5.12. Caracteristici ale membranei bazilare


a) Lăţimea membranei bazilare (mm) în funcţie de distanţa (mm) faţă de fereastra ovală
b) Rigiditatea membranei bazilare (scara logaritmică) în funcţie de distanţa relativă faţă de
fereastra ovală

Totuşi rezultate experimentale mai recente arată că selectivitatea în frecventă este


semnificativ mai pronunţată decât cea prezisă de teoria lui Helmholtz şi a lui Békésy Studii
realizate în perioada 1940-1987 permit astăzi explicarea în detaliu şi confirmarea prin
Pag. 52 Capitolul 3. Noţiuni de psihoacustică

experiment a modului în care se realizează selectivitatea în frecvenţă. Prezentarea acestora


depăşeşte contextul prezentării din acest material.

3.4.3 Profilul excitaţiei. Filtrul de band ă critică. Banda critică

Să considerăm răspunsul sistemului auditiv periferic la un stimul particular, alcătuit


din două componente sinusoidale (vezi Fig. 5.13.a). În conformitate cu gradul în care
„funcţia sa de transfer” se nimereşte să se potrivească cu una din cele două frecvenţe, fiecare
neuron al sistemului auditiv va fi mai mult sau mai puţin excitat de acest semnal particular.
Pentru a construi ceea ce poartă numele de profil al excitaţiei („excitation pattern”) se va
începe cu alinierea tuturor neuronilor într-un şir în care frecvenţa caracteristică f c a acestora
creşte de la stânga la dreapta. Axa generată în acest mod este o axă tonotopică şi o vom nota
cu z . Dacă această axă este astfel construită încât distanţele de -a lungul ei să fie
proporţionale cu logaritmul frecvenţei caracteristice, atunci neuronii vor fi plasaţi relativ
echidistant. În raport cu o astfel de axă urmează a fi reprezentată excitaţia cauzată de stimulii
sinusoidali externi. Excitaţia va fi măsurată în termeni ai numărului de pulsuri nervoase pe
unitatea de timp, luând în considerare numai pe acelea care sunt sincronizate cu semnalul.
Conform [Har] în figura Fig. 5.13.b se găseşte o astfel de reprezentare a excitaţiei.

Fig. 5.13. a) Componentele spectrale pentru un stimul acustic format din două sinusoide
b) Excitaţia provocată de semnalul de la punctul a) (conform [Har])

Excitaţia din Fig. 5.13. corespunde stimulului bitonal a cărei structură spectrală a fost
prezentată în Fig. 5.13.a. Fiecare linie verticală corespunde unui neuron. Neuronii care
corespund liniilor continue sunt sincronizaţi cu sinusoida de frecvenţă mai joasă, timp în care
cei care corespund liniilor punctate s-au sincronizat cu componenta de frecvenţă mai mare.
Se remarcă faptul că fiecărei componente spectrale din stimulul acustic îi corespunde la
nivelul excitaţiei un anumit profil, care este plasat nesimetric în jurul poziţiei caracterist ice
(locul unde excitaţia este maximă). [….] În exemplul prezentat în Fig. 5.13.a, componenta
acustică de frecvenţă mai mică este foarte puternică. Din acest motiv se remarcă în Fig. 5.13.
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag.53

un profil al excitaţiei cu vârf plat, caracteristic unui fenomen de saturaţie. Această situaţie nu
apare în profilul excitaţiei pentru cea de a doua componentă, a cărei intensitate sonoră a fos t
mai mică. O altă observaţie demnă de luat în seamă se referă la faptul că deşi diferenţa de
nivel între intensităţile sonore ale celor două componente tonale este mare, la nivelul
profilului excitaţiei, chiar dacă nu s-ar produce efectul de saturare, diferenţa este mult mai
mică. Acest fenomen se datorează faptului că sistemul auditiv este compresiv. Într -un fel sau
altul el accentuează componentele slabe şi le atenuează pe cele puternice.

Ascultătorul percepe două componente tonale pe frecvenţe diferite deoarece cele două
profile de excitaţie sunt localizate spaţial diferit şi, mai mult, sunt sincronizate diferit.
Totuşi, cele două componente tonale ale stimulului nu au frecvenţe suficient de depărtate,
observându-se o „coliziune” între cele două profile de excitaţie. Studiind pulsurile nervoase
emise de neuronii din zona comună s-a constatat că aceştia se pot sincroniza cu fie cu
componenta de frecvenţă mai mică, fie cu cea de frecvenţă mai mare, fie uneori chiar cu
amândouă componentele. Totuşi, de cele mai multe ori, componenta de frecvenţă mai joasă
învinge în acest „duel”, în special atunci când nivelul semnalului este suficient de mare.
Această ultimă constatare explică mascarea parţială (reducerea tăriei) pentru componenta de
frecvenţă mai înaltă (rămânând un număr mai mic de neuroni sincronizaţi cu componenta
spectrală de frecvenţă mai mare, tăria percepută pentru această componentă va fi mai mică).
Prelungind mental experimentul printr-o scădere progresivă a nivelului intensităţii sonore
pentru componenta tonală de frecvenţă mai mare, ne aşteptăm ca progresiv, din ce în ce mai
mulţi neuroni din zona de coliziune (zona comună) să se sincronizeze cu componenta de
frecvenţă mai mică […].

Ideea de filtru de bandă critică constă în aceea că analiza în c onformitate cu


coordonata tonotopică z , conduce la prelucrarea a două componente spectrale diferite prin
intermediul unor canale diferite. Această împărţire în canale stabilită la nivelul urechii
interne este menţinută în tot domeniul ascendent, până la cortex.

3.4.4 Filtre auditive. Caracteristici. Lărgimea benzii critice. Banda


echivalentă de zgomot. Numărul benzii critice

Privită în ansamblul ei această organizare specifică a organului auditiv uman


sugerează conceptul de filtru auditiv („auditory filter”), care în esenţă s-ar traduce într-un
banc de filtre de tip trece bandă, cu suprapunere semnificativă , fiecare din acestea acordate
pe câte o frecvenţă caracteristică.

Caracteristica de amplitudine pentru fiecare din aceste filtre este sensibil nesimetrică
şi neliniară (dependentă de nivelul semnalului ). Oricum ar fi ea definită , selectivitatea
acestor filtre trece bandă nu este aceeaşi, în general banda crescând odată cu frecvenţa
caracteristică. Ceea ce în literatură poartă numele de „banda caracteristică”, este de fapt o
Pag. 54 Capitolul 3. Noţiuni de psihoacustică

funcţie de frecvenţă care caracterizează comportamentul trece bandă al filtrelor care


modelează comportamentul frecvenţial selectiv al cochleei.
În mod real filtrul caracteristic nu este un filtru trece ba ndă ideal (funcţie de transfer
de modul constant în bandă şi nulă în exterior), dar conceptul unui filtru cu caracteristică de
amplitudine dreptunghiulară este foarte comod. Pentru unele calcule particulare este
preferată descrierea lărgimii benzii critice prin echivalarea filtrului real cu un FTB ideal, a
cărui bandă este BER şi a cărui funcţie de transfer este unitară în banda de trecere. Dacă la
intrare semnalul este tip zgomot alb, la ieşire cele două filtre (cel real şi cel echi valent) vor
furniza semnale cu aceeaşi putere, motiv pentru care BER mai poartă şi numele de bandă
echivalentă de zgomot. De aici şi comoditatea evidentă a conceptului de bandă echivalentă,
în special în rezolvare problemelor de calcul a rapoartelor semnal zgomot. Dacă funcţia de
( )
transfer frecvenţială a filtrului este H f atunci banda echivalentă de zgomot BER se
calculează cu ajutorul formulei

BER =  H ( f ) df .
2
(5.12)
0

Numărul benzii critice („critical-band number”) este o scală absolută pentru


frecvenţă, bazată pe caracteristicile de analiză frecvenţială a urechii. Pentru o frecvenţă dată
f (în Hz) se pune problema determinării numărului de benzi critice aşezate una după
cealaltă, care acoperă domeniul de frecvenţe cuprins între 0 şi f . Notând cu z numărul
benzii critice, el se poate calcula cu ajutorul relaţiei
1
z( f ) = 
f
df ' , (5.13)
0 B ( f ')

unde B ( f ) este expresia analitică a benzii critice.

3.4.5 Benzile critice München. Scala Bark

Una din cele mai importante informaţii despre filtrele de bandă critică se referă la
lărgimea de bandă, motiv pentru care un efort deosebit s -a depus de-a lungul anilor pentru
determinarea acesteia. În 1961 Zwicker publică rezultatele măsurătorilor efectuate asupra
lărgimii benzilor critice. Valorile lor sunt cunoscute sub numele de benzi critice München
(denumirea este dată de locul unde au fost efectuate măsurătorile) şi pentru câteva decenii ele
au fost acceptate pe scară largă. Pentru un ascultător „mediat statistic”, lărgimea de bandă
critică (în Hz), corespunzătoare unei frecvenţei centrale f c (exprimată tot în Hz), poate fi
obţinută convenabil, cu ajutorul relaţiei aproximative [Zw1], [Har]

BM  Hz  = 25 + 75 (1 + 1.4 10−6 f c2 )
0.69
. (5.14)
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag.55

Trebuie remarcat faptul că valorile BM ale benzilor München sunt de fapt benzi
echivalente de zgomot pentru filtrele de bandă critică. Din graficul prezentat în Fig. 5.14.
remarcăm că benzile München sunt relativ constante (cam 100Hz) în domeniul frecvenţelor
joase (până la 500Hz), după care, odată cu creşterea frecvenţei centrale devin din ce în ce
mai largi (reprezentând circa 20% din frecvenţa centrală).
6 Lărgimea benzii critice
4 [kHz]

0.4
BM
0.2

0.1

0.04

0.02
0.05 0.1 0.2 0.3 0.5 1 2 3 5 10 20 f c [kHz]

Fig. 5.14. Lărgimea benzilor München în funcţie de frecvenţa centrală fc

Scala Bark reprezintă o partiţionare a domeniului audibil în subdomenii disjuncte, în


conformitate cu lărgimile de bandă München. Totodată, scala Bark este şi o măsură pentru
numărul benzii critice. Unitatea de măsură pentru această scală a fost numită „Bark. Tabelul
3.2 prezintă scala Bark , în forma în care a fost stabilită de către Zwicker, în 1961, şi care
conform [Sch] sugerează un banc de filtre ideale, cu benzi egale cu lărgimile de bandă
critică, şi care acoperă întreg domeniul audio [Pai]
Tabelul 3.2 Scala Bark
Frecvenţă Frecvenţă Banda Frecvenţă. Largime bandă
Bark
inferioară [Hz] superioară. [Hz] critică nr. centrală [Hz] critică [Hz]
0-1 0 100 1 50 100
1-2 100 200 2 150 100
2-3 200 300 3 250 100
3-4 300 400 4 350 100
4-5 400 510 5 450 110
5-6 510 630 6 570 120
6-7 630 770 7 700 140
7-8 770 920 8 840 150
8-9 920 1080 9 1000 160
9-10 1080 1270 10 1175 190
10-11 1270 1480 11 1370 210
11-12 1480 1720 12 1600 240
12-13 1720 2000 13 1850 280
13-14 2000 2320 14 2150 320
14-15 2320 2700 15 2500 380
15-16 2700 3150 16 2900 450
16-17 3150 3700 17 3400 550
17-18 3700 4400 18 4000 700
18-19 4400 5300 19 4800 900
Pag. 56 Capitolul 3. Noţiuni de psihoacustică

19-20 5300 6400 20 5800 1100


20-21 6400 7700 21 7000 1300
21-22 7700 9500 22 8500 1800
22-23 9500 12000 23 10500 2500
23-24 12000 15500 24 13500 3500
24- 15500 - 25 19500

Valori întregi pe scala Bark corespund limitelor benzilor de zgomot echivalente pentru
filtrele de bandă critică. De exemplu 5Bark corespunde limitei superioare de frecvenţă
(510Hz) pentru cea de a 5-a bandă critică echivalentă. Valoarea 5.3Bark (plasată în intervalul
[5Bark, 6Bark] desemnează o frecvenţă reală, cuprinsă în interiorul celei de a şasea benzi
critice [510Hz, 630Hz].
Numărul benzii critice
25 z [Bark]
23 24 25
22
20
20
18

15 15

10

x – limitele benzilor critice Munchen


5

14 16 18
0
0 2 4 6 8 10 12 frecvenţa [kHz]
Fig. 5.15. Scala Bark ca măsură a numărului benzii critice (x frecvenţele limită pentru benzile critic)

3.4.6 Benzile critice Cambridge. Scala ERB

În anii 80, experimente îngrijite, construite în jurul tehnicilor de măsurare care


utilizează zgomot mascator cu rejecţie centrală (vezi [Ne1]), conduc la un set diferit de
valori ale benzilor echivalente de zgomot pentru filtrele de bandă critică. Deoarece
măsurătorile au fost realizate în Anglia, la Cambridge, aceste lărgimi de bandă poa rtă numele
„Cambridge”. Pornind de la o colecţie bogată de măsurători, a fost determinată empiric o
relaţie de calcul a lărgimii de bandă Cambridge (în Hz) în funcţie de frecvenţa centrală f c
exprimată tot în Hz [Har] [Pai]

BC  Hz = 24.7 (1 + 4.37 10−3 fc ) . (5.15)

Ca şi în cazul München, banda Cambridge Bc , calculabilă cu (5.15) este o bandă


echivalentă de zgomot. Din graficul prezentat în Fig. 5.16. remarcăm că în comparaţie cu
lărgimile de bandă München valorile Cambridge sunt mai mici.
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag.57

6 Lărgimea benzii critice


4 [kHz]

1
B1/ 3

0.4
BM
0.2

0.1

0.04 BC

0.02
0.05 0.1 0.2 0.3 0.5 1 2 3 5 10 20 f c [kHz]
Fig. 5.16. Lărgimea benzilor critice în funcţie de frecvenţa centrală fc
BM - lărgimea benzii critice München , BC - lărgimea benzii critice Cambridge
B1/ 3 - lărgimea benzii 1/3 de octavă

În mod similar, o altă partiţionare a domeniului audio şi respectiv o nouă măsură


pentru numărul benzii critice se poate construi pornind de la expresia benzilor Cambridge (şi
nu de la benzile München aşa cum s-a procedat anterior pentru scala Bark). Introducând în
ecuaţia (5.13) expresia benzii Cambridge din (5.15), se obţine relaţia de conversie între
frecvenţa reală f exprimată în Hz şi numărul benzii critice z marcat de data aceasta într-o
nouă unitate numită ERB.
z  ERB = 9.26ln ( 0.00437 f + 1) . (5.16)

Scala ERB (Equivalent Rectangular Bandwidth) este poate cel mai fidel corelată cu
mecanismul rezoluţiei frecvenţiale pentru auzul uman (vezi Fig. 5.17.) şi se consideră că
oferă o imagine consistentă cu reprezentarea frecvenţelor la nivelul cochleei.
Numărul benzii critice
z [ERB]
40

30

20

10

14 16 18
0
0 2 4 6 8 10 12 frecvenţa [kHz]
Fig. 5.17. Scala ERB ca măsură a numărului benzii critice
Pag. 58 Capitolul 3. Noţiuni de psihoacustică

3.4.7 Benzi la 1/3 de octavă

În Fig. 5.16., în afara curbelor corespunzătoare lărgimilor de bandă München sau


Cambridge, cititorul poate observa şi o dreaptă desenată punctat. Ea reprezintă o aproximare
a lărgimii de bandă folosind intervale de 1/3 de octavă. Calculul benzii la 1/3 de octavă se
face cu ajutorul relaţiei

B1/ 3  Hz = 21/ 6 fc − 2−1/ 6 fc = 0.232 fc , (5.17)

pentru care frecvenţa centrală fc este exprimată în Hz. Această abordare prezintă avantaje
evidente când se doreşte o aproximare simplă, reprezentând o idealizare convenabilă a
bancurilor de filtre care modelează auzul uman. Este întâlnită în multe aplicaţii (mai puţin
pretenţioase) din industria audio.

3.4.7 Benzile critice şi rolul lor central în teoria auzului

În conjuncţie cu filtrul auditiv, conceptul de bandă critică se dovedeşte a fi de


importanţă majoră pentru întreg domeniul audio. În esenţă, el este definit în urma efectuării
unor experimente de mascare, dar în literatură este des întâlnită formularea conform căreia
banda critică este un domeniu de frecvenţe „privilegiat”, la depăşirea căruia proprietăţile de
mascare se schimbă rapid [Sch]. Benzile critice reprezintă „canale de procesare”, iar
componentele spectrale suficient de depărtate frecvenţial (încât să aparţină unor astf el de
canale diferite) vor fi procesate separat. Această idee are un număr de consecinţe importante.
Benzile critice s-au dovedit a fi un liant istoric în unificarea diferitelor elemente care explică
multe din efectele psihoacustice.
BIBLIOGRAFIE
[Bek] Békésy G. von, “Experiments in Hearing”, New York, Mc Graw Hill, 1960
[Fle] Fletcher H., “Auditory patterns”, Rev. Mod. Phys., pp 47-65, Jan.,1940
[Fl1] Fletcher H., “Speech and Hearing in Communications”, Van Nostrabd, New York, retipărit (1995) de
Acoustical Society of America, New York, ed. J.B. Allen, 1953
[Fl2] Fletcher H., “Loudness, masking and their relation to the hearing process and the problem of noise
measurement”, J. Acoust. Soc Am., No 9, pp 275-293,1938
[Har] Hartman W.M., “Signals, Sound, and Sensations”, Springer–Verlag, New York 1998
[Ha1] Hartman W.M., “Auditory demonstration on compact disck for large N”, J. Acoust. Soc. Am. No 93, pp
1-16, 1996
[He1] Helmholtz H.W. von, “Théorie Physiologique de la Musique”, Ed. Masson G., Paris, 1874
[Ne1] Negrescu C., “Codecuri perceptuale audio multicanal”, Ed. Printech, Bucureşti, 2004
[Pai] Painter T., Spanias A., “Perceptual coding of digital audio”, Proc. of IEEE, Vol 8, No4, pp. 451-513,
2000
[Sch] Scharf B., “Critical bands”, in Foundations of Modern Auditory Theory, Ed. J. Tobias, Academic, New
York, 1970
[St2] Stanomir D., “Elemente de acustică fiziologică şi de statistică a semnalului audibil”, în Tehnici
moderne în sistemele de radiocomunicaţii digitale, note curs, 2000
[Ter] Terhardt E., “Calculating virtual pitch”, Hearing Res., vol1, pp 155-182, 1979
[Yos] Yost W. A., “Fundamentals of Hearing”, Academic, San Diego, 3-rd ed., 1994
[Zw1] Zwicker E, Fastl H., “Psychoacoustics – Facts and Models”, Springer–Verlag, Berlin, 1990
[Zw2] Zwicker E, Flottorp G., Stevens S.S., “Critical bandwidth in loudness summation”, J. Acoust. Soc.
Am., No. 28, pp548-557, 1957
CAPITOLUL 7

SISTEME DE SONORIZARE ŞI GESTIUNEA GAMEI DINAMICE


PUBLIC ADRESS, SOUND AND ACOUSTIC REINFORCEMENT SYSTEMS

7.1 Structura sistemelor de sonorizare

Sistemele de sonorizare reprezintă un ansamblu funcţional de echipamente şi


conexiuni construit pentru a permite redarea semnalelor/ programelor audio în condiţii
optime. Sistemele de sonorizare sunt de regulă utilizate la redarea în direct a semnalelor
audio (concerte, spectacole, manifestări sportive, mitinguri, anunţuri, conferinţe, etc).
Totodată găsim sistemele de sonorizare şi în situaţiile în care se doreşte redarea unor
programe deja înregistrate, cum ar fi sălile de audiţie şi vizionare, cinema, discoteci, sau în
cazul spaţii private, banalele camere de apartament. Funcţiile de bază ale sistemelor de
sonorizare reies printr-o trecere în revistă a principalelor motivaţii de utilizare a lor. În acest
context distingem următoarele situaţii:

• Dorim să auzim mai bine semnalul audio original. Exemple tipice pentru
această situaţie îl constituie sonorizarea producţiilor teatrale sau expu nerile de
tip discurs, în cadrul unei conferinţe sau a unei lecţii. În acest caz respectivul
actor/orator/prezentator/profesor vorbeşte de obicei în partea frontală a sălii şi
de regulă este bine auzit, în mod direct, în primele rânduri din sală . Situaţia
este diferită cu locurile plasate în rândurile din spate, unde în special sala este
mare şi nu a fost proiectată arhitectural pentru a avea o acustică deosebită
vorbitorul nu va mai fi auzit la fel de bine. Într-o astfel de aplicaţie rolul
instalaţiei de sonorizare este să extindă aria în care semnalul original este auzit
la fel de bine ca în primele rânduri. Trebuie subliniat faptul că se intenţionează
astfel ca în toate rândurile, inclusiv în cele din spate, vocea oratorului să fie
clar auzită dar nici mai tare, nici mai slab ci la fel de tare ca în apropierea
scenei.

• Dorim să îmbunătăţim estetic semnalul audio original prin accentuarea


acestuia. Exemple tipice pentru această situaţie îl constituie sonorizarea
producţiilor muzicale într-un club, într-o discotecă, într-o sală de concerte, sau
pe o arenă în aer liber. Muzica generată de o formaţie de instrumentişti ce
utilizează instrumente reci (fără amplificare) sau de multe ori chiar şi în cazul
vocii solistului, se produce un sunet prea slab pentru a se produce impresia
artistică dorită. În acest caz amplificarea semnalului original şi redarea sa la un
nivel sonor mai ridicat decât cel real îşi aduce esenţial contribuţia la oferirea
Pag. 90 Capitolul 7. Sisteme de sonorizare şi gestiunea gamei dinamice

unei ambianţe sonore mai dinamice, mai excitante şi ca urmare cu impact


artistic mai mare.

• Dorim să permitem persoanelor aflate la distantă să acceadă la mesajul


sonor original. De multe ori se intenţionează ca diverse prezentări, seminarii
sau dezbateri să poată fi urmărite de un număr mai mare de persoane decât cel
ce ar putea fi cuprins în sala în care evenimentul primar are loc. În acest caz se
intenţionează să se copie monologul /discuţiile din prima sală într -una
adiacentă sau la o oarecare distanţă, astfel încât mulţimi mai mari să poată
deveni „martore” la eveniment. De data aceasta, sistemul de sonorizare trebuie
să amplifice semnalul nu neapărat din motive artistice ci pentru a face faţă
zgomotului mai mare din aceste spaţii. Simpla amplificare a acestuia nu este
însă suficientă, deoarece păstrarea inteligibilităţii tot ale în condiţiile unui palier
de zgomot mai mare implică manipularea gamei dinamice a semnalului original

• Dorim să înregistrăm programul original pentru arhivare şi/sau


masterizare ulterioară. Aceasta este situaţia întâlnită într-un studio de
înregistrări. De data aceasta se intenţionează extragerea şi păstrarea maximului
de informaţie originală. Pentru a oferi o libertate artistică sporită viitoare , se
doreşte înregistrarea separată a fiecărei surse sonore. Remarcăm astfel cel puţin
existenta a două procese diferite: separarea surselor sonore şi respectiv
înregistrarea separată a semnalului sonor furnizat de fiecare din ele. Pentru a
realiza separarea surselor se utilizează un număr de tehnici: plasarea
instrumentiştilor într-un mediu controlat, relativ neutru din punct de vedere
acustic, alocarea unui canal primar de intrare/procesare/înregistrare pentru
fiecare sursă sonoră, utilizarea unor microfoane direcţionale, cu caracteristici
de frecvenţă, timp de răspuns şi dinamică adecvate fiecărui tip de sursă î n parte
plasate microfoanelor cât mai aproape posibil de fiecare din aceste surse
sonore. Separarea surselor sonore este completată şi prin tehnici specifice de
manipulare a gamei dinamice pe fiecare canal în parte şi mixare/procesare
audio multicanal. În plus canalele de monitorizare pentru instrumentişti sunt
prezentate acestora prin intermediul căştilor şi nu prin intermediul monitoarelor
de scenă (cum se întâmplă uzual în cadrul unui concert). Înregistrarea pentru
arhivare va fi una multicanal (ideal este să fie înregistrate toate canalele
individuale) şi se face la cea mai bună calitate posibilă, chiar dacă în viitorul
apropriat programul final masterizat este transmis/difuzat la o calitate ceva mai
scăzută. În felul acesta, pe de o parte se poate ţine pasul cu avansul tehnologic
al sistemelor audio pentru consumatorii finali (de exemplu se poate difuza un
album masterizat multicanal 5.1 în loc de unul stereo cu două canale) iar pe de
altă parte se poate aduce un plus artistic printr-o nouă remasterizare
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag. 91

(modificând ponderea şi/sau plasarea fiecărei surse sonore, prin procesarea de


efecte a unora din canale sau prin utilizarea în alt context a unor fragmente din
înregistrările individuale). O situaţie uşor diferită, dar aparţinând aceleiaşi
clase de aplicaţii o întâlnim atunci când dorim să înregistrăm pentru arhivare
sau masterizare un eveniment ce are loc într-o sală cu acustică specifică (de
exemplu o sală de concerte). În acest caz principal ele deosebiri derivă din
faptul că suportul oferit pentru separarea surselor sonore este mai redus,
separarea instrumentiştilor/soliştilor beneficiind de mai puţine grade de
libertate (există limitări în plasarea microfoanelor, nefiind de multe ori posibilă
realizarea apropierii dorite, sincronizarea instrumentiştilo r se face prin
intermediul semnalului redat prin monitoarele de scenă, poziţia
instrumentiştilor în raport cu microfoane poate varia) la care se adaugă, de
regulă, şi necesitatea de a capta programul cu tot cu amprenta acustică specifică
respectivei săli. Remarcăm că pentru această clasă de aplicaţii inginerul de
sunet controlează câştigul pe fiecare canal în parte, asigurând mai multe
deziderate simultan: maximizarea raportului semnal zgomot, controlul
dinamicii, obţinerea unor semnale de monitorizare core ct echilibrate care să
permită sincronizarea şi adaptarea nivelului instrumentiştilor.

• Dorim să difuzăm în direct şi eventual să înregistrăm


programul/evenimentul sonor original. Aceasta este o situaţie destul de
înrudită cu precedenta, de data aceasta însă scopul final fiind transmiterea unui
program sonor finit, complet masterizat. Faţă de cazul precedent apare drept
obligatorie masterizarea programului ceea ce din partea inginerului de sunet
implică alocarea unui efort suplimentar pentru atenta comutare şi/sau
echilibrare a canalelor audio în produsul final. Masterizarea este realizată atât
pentru spectatorii din sală cât şi pentru cei de la capătul reţelei de difuziune în
direct. Întrucât mediul de difuzare în direct (uzual radio sau TV) este mai
restrictiv decât cel de înregistrare, sau cel de redare din sala de concerte, este
obligatorie adaptarea finală a gamei dinamice a programului masterizat cu cea a
canalului de comunicaţie.

• Dorim să reproducem un program înregistrat. Dintr-un anumit punct de


vedere aceasta este situaţia cea mai simplă. Avem la dispoziţie un program
complet masterizat ce fie se găseşte stocat pe un mediu oarecare (CD, DVD,
HD, memorie flash, bandă magnetică), fie este recepţionat în direct printr-un
dispozitiv adecvat (receptor radio, TV, sau live media player). Dezideratul final
constă în reproducerea corectă a programului în sala disponibilă (alta decât cea
în care programul a fost înregistrat/realizat). De regulă, în această situaţie,
intervenţia inginerului audio este necesară numai în faza de proiectare,
configurare şi reglare iniţială a sistemului de sonorizare, sarcina sa reducându -
Pag. 92 Capitolul 7. Sisteme de sonorizare şi gestiunea gamei dinamice

se la implementarea unui sistem funcţional, capabil să corecteze într -o oarecare


măsură imperfecţiunile sălii de audiţie (de regulă neadecvată) şi s ă asigure
posibilitatea redării programului aşa cum a fost el imaginat de
producătorul/regizorul acestuia.

Trecând în revistă situaţiile prezentate anterior, remarcăm că f uncţia primordială a


unui sistem de sonorizare o reprezintă amplificarea semnalului. La aceasta se adaugă cele ce
vizează selecţia şi mixarea, controlul gamei dinamice, aplicarea de efecte sonore de
îmbunătăţire sau artistice, egalizarea, sincronizarea, uneori înregistrarea şi cu o singură
excepţie, controlul reacţiei pentru evitarea microfoniei.

Pentru orice sistem de sonorizare putem considera modelul generic din figura de mai
jos, capabil să ofere suport pentru implementarea tuturor funcţiilor descrise.
Câmp sonor Câmp sonor
(sursă) (destinaţie)

Transductor intrare Semnal audio Procesare de Semnal audio Transductor ieşire


(acustico-electric) semnal (electro-acustic)
Semnal audio Semnal audio

Receptor Înregistrare
şi/sau player şi/sau difuziune

Sistem sonorizare
Fig. 7.1 Modelul generic al unui sisteme de sonorizare

Transductoarele de intrare explorează câmpul produs de sursele sonore şi convertesc


energia acustică a acestuia într-un semnal electric, numit în continuare semnal audio. Blocul
de procesare semnal este unul generic. El va fi responsabil cu modificarea ca racteristicilor
semnalului audio. Această modificare se poate realiza fie prin manipulare electrică directă
(în cazul sistemelor analogice) fie prin prelucrare numerică (caz în care v or fi necesare şi
blocuri de conversie analog-numeric şi respectiv numeric-analog). În implementările practice
blocul procesare de semnal din figura de mai sus este format din mai multe
subsisteme/echipamente distincte (preamplificatoare, mixere, amplificatoare de putere,
egalizoare, procesoare de dinamică, procesoare de efecte sonore, convertoare numeric-analog
şi analog-numeric, reţele de separare, linii de întârziere, etc). Transductoarele de ieşire sunt
responsabile cu transformarea semnalului audio electric procesat în câmp sonor apt de a fi
prezentat ascultătorului.
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag. 93

Dintre transductoarele de intrare curent utilizate în sistemele de sonorizare enumerăm:

• Microfoane de presiune sau de viteză. (vezi capitolul 2)

Fig. 7.2 Microfoane

• Doze de contact – realizează conversia undelor sonore dintr-un mediu dens


(lemn, metal, piele) într-un semnal audio. De regulă aceste transductoare au la
bază efectul piezoelectric, dar există şi doze de contact similare microfoanelor
capacitive. Sunt uneori folosite pentru captarea semnalelor furnizate de
instrumente acustice cu coarde (chitară acustică, mandolină, vioară, etc)

Fig. 7.3 Doze de contact

• Doze magnetice – realizează conversia inductivă a unui câmp magnetic variabil


într-un semnal audio. Sunt des întâlnite în cazul instrumentelo r electrice cu
coarde metalice (de exemplu chitară electrică)

Fig. 7.4 Doze magnetică

La aceste transductoare de intrare native ce realizează directă a sunetului în semnal


audio, se adaugă şi cele pe care le găsim în echipamentele de redare a înregistrărilor audio.
Dintre aceste cele mai des întâlnite sunt

• Capetele magnetice – convertesc fluctuaţiile câmpului magnetic din mediul de


înregistrare (bandă, disc) în semnal audio
Pag. 94 Capitolul 7. Sisteme de sonorizare şi gestiunea gamei dinamice

Fig. 7.5 Capete magnetice

• Doze de pickup – convertesc mişcarea unui ac (stylus) în semnal audio. În


sistemele profesionale sau în cele de calitate ridicată destinate publicului larg
sunt utilizate dozele ce utilizează magnetice, în care mişcarea acului este
transmisă unui magnet În sistemele de amatori, de calitate medie, sunt utilizate
dozele de pickup bazate pe efect piezoelectric.

Fig. 7.6 Doze pickup

• Cititoare laser (laser pickups) convertesc o structură imprimată pe un CD


într-un flux digital ce este transmis direct blocului de procesare ca semnal
audio digital sau convertit în semnal audio analogic.

Fig. 7.7 Cititor laser pt CD/DVD

• Cititoare optice – convertesc variaţiile de densitate sau de transparentă (de


exemplu pe film fotografic) într-un semnal audio. Ca şi în cazul cititoarelor
laser sau magnetice în variantă digitală converti paternul înregistrat într -un flux
audio digital

Fig. 7.8 Cititor optic pentru film şi pentru vioară

În cadrul sistemelor de sonorizare transductoarele de ieşire sunt cele care vor produce
efectiv un semnal sonor prin conversia energiei electrice primită sub formă de semnal audio
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag. 95

într-una mecano-acustică. Într-un sistem de sonorizare cele mai utilizate tipuri de astfel de
traductoare sunt:

• Difuzoare de frecvente joase (woofer)– sunt proiectate în mod special pentru


a reproduce eficient domeniul frecventelor joase (sub 500Hz). Uneori aceste
tipuri de difuzoare sunt utilizate şi la reproducerea frecventelor medii (sub
1,5kHz). În mod tipic, aceste difuzoare sunt fac parte din categoria difuzoare cu
con, iar membrana lor are un diametru între 20 şi 45cm.

• Difuzoare de frecvente medii (squawkers)– sunt difuzoare proiectate să


reproducă eficient domeniul frecventelor medii, între 500Hz şi cel mult 6kHz.
În cazul în care difuzoarele de frecvente medii sunt din categoria difuzoarelor
cu con, membrana lor are un diametru tipic între 12cm şi 30cm. Dacă se
utilizează difuzoare din categoria celor cu compresie (suprafaţa mem branei este
semnificativ mai mare decât deschidere prin care difuzorul radiază) atunci
diametrul lor se plasează în intervalul 6 – 10cm, dar uneori pot ajunge şi la
aproape 23cm.

• Difuzoare de frecvenţe înalte (tweeter) – sunt difuzoare proiectate pentru a


eficientiza radiaţia sonoră începând cu frecvenţe peste 1,5 – 6kHz. Diametrele
uzuale pentru difuzoarele cu con din această categorie se plasează în domeniul
5 – 12,5cm iar în cazul utilizării celor cu compresie de la 3,5 la aproximativ
10cm.

• Difuzoare de bandă largă – sunt sisteme construcţii integrate ce încorporează


în mod uzual încorporează fie un difuzor de frecvenţe joase şi unul de frecvente
înalte fie trei difuzoare (unul pentru joase, unul pentru medii şi unul pentru
frecvenţe înalte). Trebuie precizat că un astfel de difuzor rareori redă frecvente
sub 60Hz şi nu trebuie confundat cu o incintă (boxă) ce conţine 3 sau mai mult
difuzoare dedicate.

• Difuzoare pentru frecvente foarte joase (subwoofer) – sunt utilizate în


sistemele de bandă foarte largă (întreaga bandă audio) şi sunt destinate
extinderii în jos a gamei de frecvenţe până la 20-30Hz. Utilizarea lor este
rareori eficientă pentru frecvente mai mari de 300Hz. În mod tipic sunt utilizate
difuzoare cu con, cu diametre între 38 şi 60cm.

• Difuzoare de frecvenţe foarte înalte (supertweeter) – sunt utilizate pentru în


sistemele performante de bandă foarte largă şi sunt optimizate pentru redarea
segmentului spectral superior din banda audio (peste 10kHz). În mod tipic fac
parte din categoria difuzoarelor cu compresie sau a celor piezoelectrice şi sunt
utilizate în sistemele profesionale de foarte mare calitate , utilizate ca incinte de
referinţă
Pag. 96 Capitolul 7. Sisteme de sonorizare şi gestiunea gamei dinamice

• Monitoare de scenă şi de studio – monitoarele de scenă sunt difuzoare de


bandă largă plasate pe scenă, orientate spre instrumentişti şi sunt utilizate
pentru a returna o parte din program înapoi la inst rumentist/solist. Aceste ajută
la menţinerea sincronismului în cadrul unei orchestre. Monitoarele de studio
sunt incinte sonore de bandă largă cu acurateţe ridicată în special în câmp
apropiat şi sunt destinate evaluării semnalului mixat, înreg istrat, produs,
masterizat şi sau distribuit.

• Căşti – sunt transductoare de bandă largă destinate a se aplica direct pe


urechile ascultătorului. Unele dintre acestea atenuează semnificativ semnalul
ambiental în timp ce altele nu o fac. Căştile sunt utilizate în operaţiile de
monitorizare, verificare, în înregistrări de studio precum şi în cazul sistemelor
de comunicaţii pe scenă (intercom).

Fiecare tip de transductor (de intrare sau de ieşire) are propriile caracteristici şi
particularităţi astfel că utilizarea optimă a lor poate fi făcută numai prin împerecherea lor cu
sursele de semnal sau după caz cu condiţiile de sonorizare.

Cu titlu informativ, în figurile de mai jos sunt prezentate câteva exemple de


organizare de sisteme de sonorizare

Fig. 7.9 Exemplu: Un sistem minimal pentru sonorizarea unei săli mici (meeting room)
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag. 97

Fig. 7.10 Exemplu: Sisteme pentru sonorizarea unei orchestre rock


Pag. 98 Capitolul 7. Sisteme de sonorizare şi gestiunea gamei dinamice

7.2 Dinamica semnalelor audio

Gama dinamică a unui program audio se exprimă în [dB] şi este mărimea numeric
egală cu diferenţa dintre nivelul maxim Lmax al respectivului program şi nivelul Ln
corespunzător palierului de zgomot.

DR dB = Lmax − Ln , (7.1)

Gama dinamică se exprimă întotdeauna în dB indiferent în ce este măsurat nivelul


semnalului (db SPL, dBu, dBm, etc).

În contextul sistemelor de sonorizare distingem diverse va riante ale gamei dinamice a


programului audio, în funcţie de locul în care această dinamică este determinată. Să
remarcăm că pe parcursul întregului lanţ de prelucrare audio distingem:

• Gama dinamică pentru semnale acustice

• Gama dinamică pentru semnale electrice

• Gama dinamică pentru semnale numerice

În cazul semnalelor acustice gama dinamică se referă la domeniul pe care îl ia nivelul


sonor, astfel că Lmax şi Ln se exprimă în dB SPL (vezi Capitolul 1).

În cazul semnalelor electrice, de obicei gama dinamică se referă la domeniul p e care îl


ia tensiunea electrică sau puterea. În situaţia în care mărimea considerată este puterea, Lmax şi
Ln se exprimă în dBm sau dBW. La exprimarea puterii în dBm , puterea de referinţă este
1mW în timp ce la dBW referinţa este 1W. În situaţia în care mărimea considerată este
tensiunea, Lmax şi Ln se exprimă în dBu, dBV, sau dBv. La exprimarea în dBV tensiunea de
referinţă este 1V rms în timp ce la exprimarea în dBv referinţa pentru tensiune este fixată la
0,775V rms. Iniţial, exprimarea în dBv a fost o reprezentare convenabilă deoarece, pentru
circuite terminate pe 600 , valoarea nivelului tensiunii exprimat în dBv este numeric egal
cu cel al puterii exprimat în dBm. La exprimarea nivelului tensiunii în dBu tensiunea de
referinţă este tot 0,775V, considerându-se însă că echipamentul se termină pe o rezistenţă de
sarcină infinită (u provine de la „unloaded”). Având în vedere că între echipamentele audio
moderne transferul de putere implicat este foarte mic (impedanţele de ieşire sunt mici iar cele
de intrare sunt mari), se preferă de cele mai multe ori ca specificaţiile să fie exprimate în
dBu. Excepţia o constituie microfoanele şi amplificatoarele de putere deoarece, la acestea, se
optimizează de regulă transferul în putere. În consecinţă se preferă în mod frecvent
exprimarea în dBm (la microfoane) şi respectiv în dBW (la amplificatoare de putere).

În cazul semnalelor numerice se utilizează exprimarea în dBov. În acest caz 0dBov


reprezintă nivelul semnalului dreptunghiular cu amplitudine maxim reprezentabilă în
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag. 99

respectivul sistem. De exemplu, pentru un sistem numeric în care reprezentarea se face PCM
liniar cu 16biţi/eşantion, 0dBov este nivelul unui semnal dreptunghiular cu valorile +/-32767.

••• Studiu de caz – un concert rock live

Gama dinamică acustică la nivelul microfonului (gama dinamică a concertului)

Întrucât la intrarea în microfon stimulul este unul acustic, ne interesează gama


dinamică pentru nivelul sonor. În consecinţă Lmax şi Ln se vor exprima în dB SPL.

Nivelul sonor la microfoanele de scenă (pentru solistul vocal sau pen tru instrument) în
timpul pasajelor cele mai liniştite (pauză de moment) poate avea valoarea

Ln = 40 dBSPL , (7.2)

şi se datorează în principal zgomotului ambiental produs de audienţă, vânt, trafic, diverse


alte instalaţii, etc. Pentru acelaşi concert, în timpul reprezentaţiei, nive lul sonor la microfon
poate ajunge destul de uşor la nivelul
Lmax = 130 dBSPL . (7.3)

Acesta valoare este aparent mare (depăşeşte pragul de durere) , dar să reamintim faptul că
respectivul solist cântă foarte aproape de microfon şi nu direct la urechea ascultătorului 1. În
această situaţie gama dinamică acustică la nivelul microfonului va fi

DR dB = Lmax − Ln = 130dBSPL − 40dBSPL=90dB , (7.4)

Gama dinamică a semnalului la microfon se mai num eşte şi gama dinamică a concertului

Nivelul sonor mediu la microfon (termenul de limbă engleză este „Average SPL”)
este valoarea medie (pe termen lung) a nivelului sonor la microfon. Pentru acest tip de
program în mod uzual el se situează în jurul a

Lav = 110 dBSPL . (7.5)

Gama dinamică necesară pentru semnalul electric

Să luăm în considerare două puncte ale lanţului de sonorizare: ieşirea consolei de


mixaj şi respectiv ieşirea amplificatoarelor de putere. Să presupunem că avem o consolă de
mixaj capabilă să producă la ieşire un semnal cu maxim +24dBu (ceea ce corespunde unei

1
De fapt, în practică, această valoare poate fi chiar mai mare. În cazul capturii semnalului acustic produs de unele
instrumente muzicale (ex. tobe acustice) se ajunge chiar la nivelul de 150 dB SPL !
Pag. 100 Capitolul 7. Sisteme de sonorizare şi gestiunea gamei dinamice

tensiuni de 12,3V) şi un amplificator de putere de 250W (+23,98dBW). Vom regla faderele


consolei de mixaj astfel încât pentru Lmax = 130 dBSPL la nivelul microfonului să corespundă
nivelul maxim al tensiunii la ieşirea consolei de mixaj (+24dBu) şi respectiv puterea maximă
a amplificatorului (+23,98dBW). Gama dinamică necesară pentru o rice verigă a lanţului
audio trebuie să fie cel puţin egală cu gama dinamică la nivelului microfonului (90dB) Ca
urmare, nivelului de zgomot minim la microfon ( Ln (mic) = 40 dBSPL ) îi va corespunde la
ieşirea consolei Ln (mixer ) = −66 dBu (0,388mV) iar la ieşirea amplificatorului de putere
Ln (ampl ) = −66, 02 dBW (0,25mW)

Gama dinamică pentru semnalul acustic la nivelul audienţei

Gama dinamică pentru semnalul acustic ce ajunge la urechile ascultătorului depinde de


mai mulţi factori, dintre care enumerăm:

• Eficienţa incintelor acustice

• Tipul de câmp sonor creat de instalaţia de sonorizare în spaţiul de audiţie

• Distanţa dintre incintele acustice şi ascultători

În principiu gama dinamică pentru semnalul acustic la nivelul audienţei ar trebui şi ea să fi e


egală cu gama dinamică la nivelul microfonului.

Este oare posibil acest lucru pentru exemplul considerat?

Să considerăm că avem la dispoziţie un sistem de boxe performant astfel că pentru nivelul


maxim la ieşirea amplificatorului ( Lmax (ampl ) = +23,98 dBW (250W) ) vom avea la 1m de
incinte acustice nivelul sonor Lmax (1m) = +135 dBSPL . În plus vom considera că pe distanţa de
la 1m faţă de incintă până la poziţia efectivă a ascultătorului, semnalul sonor este atenuat cu
15 dB. În această situaţie nivelul sonor maxim la ascultător va fi Lmax (asc) = 120 dBSPL
(maxim acceptabil pentru a nu afecta auzul), iar cel corespunzător nivelului de zgomot la
microfon Ln (asc) = 30 dBSPL .

Este situaţia acceptabilă?

Răspunsul este nu! Să ne reamintim că nivelul de zgomot acustic la nivelul microfonului (pe
scenă) este de 40dB SPL şi nu avem nici un motiv să credem că nivelul de zgomot la
audienţă este mai mic (în cazul fericit va fi tot 40dB SPL – dacă ascultătorii sunt „liniştiţi”)

Vedem astfel că deşi echipamentul sistemului de sonorizare este performant şi asigură


întreaga gamă dinamică necesară, pentru a nu pierde pasajele muzicale mai slabe o anumită
modificare („comprimare”) a gamei dinamice este necesară.

Un astfel de sistem capabil să modifice gama dinamică a semnalelor audio poartă numele de
procesor de dinamică •••
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag. 101

7.3 Procesoarele de dinamică - Generalităţi

Procesoarele de dinamică sunt o clasă de sisteme de procesare a semnalului audio şi


au drept scop modificarea gamei dinamice a semnalului ce se aplică la intrarea lor. Funcţia
lor de bază constă în adaptarea gamei dinamice a semnalului la un lanţ prestabilit de
echipamente, astfel încât să se realizeze operarea în condiţii optime din punct de vedere al
raportului semnal zgomot, distorsiunilor, nivelului global şi nu în ultim rând al evitării
distrugerii unor componente din lanţul audio.
În Figura 7.11, pentru diverse dispozitive, sunt prezentate capabilităţile tipice de a se
acomoda dinamicii nivelului sonor.

Preamplificator de microfon
Urechea umană

Amplificator de putere

.
Bandă magnetică
profesională

Radio

magnetică
Casetă

Fig. 7.11 Dinamica nivelului sonor (capabilităţi) pentru diferite dispozitive

Având în vedere structura materialului muzical precum şi caracteristicile semnalului


vocal putem pune în evidenţă situaţiile din Figura 7.12
P [ dB ]

Limitare absolută („clipping”)

Rezervă de dinamică („headroom”)

Nivel nominal

Raport semnal zgomot

Palier de zgomot
t
Fig. 7.12 Nivelul nominal. Rezerva de dinamică. Raportul semnal zgomot
Pag. 102 Capitolul 7. Sisteme de sonorizare şi gestiunea gamei dinamice

Este posibilă îmbunătăţirea calităţii transmisiei programului audio dacă nivelul


acestuia este monitorizat permanent iar cu ajutorului reglajului de nivel (faderul) consolei de
mixaj se „nivelezează dinamica acestuia”. În timpul pasajelor slabe nivelul acestora este
crescut prin utilizarea unei amplificări mai mari in timp ce pentru pasajele mai puternice
câştigul amplificatorului va fi redus. În mod evident o astf el de ajustare manuală a poziţiei
faderelor este destul de restrictivă, în special datorită dificultăţilor majore în identificarea şi
nivelarea rapidă a vârfurilor. În mod cert controlul manual nu este suficient de rapid pentru a
putea deveni eficient.
Pentru a rezolva aceste probleme şi după cum vom vedea ulterior pentru a obţine
soluţii şi pentru altele noi, se poate folosi un echipament dedicat - procesorul de dinamică

7.4 Arhitectura procesorului de dinamică.

Procesorul de dinamică este de fapt un amplificator pentru care câştigul este controlat
automat. Mai exact, el analizează şi transformă semnalul de la intrare astfel încât să producă
la ieşirea sa o copie a programului aplicat la intrare dar care, din punct de vedere al
dinamicii, să respecte un anumit set de specificaţii. Din această categorie fac parte
limitatoarele, compresoarele, expandoarele şi porţile de zgomot. Schema bloc de principiu a
unui procesor de dinamică este prezentată în Figura 7.13
Calea de semnal

x ( n) x (n − d ) y ( n)
Întârziere

Măsurare X V ( n )  dB S ( n )  dB Integrare g ( n)


Curba
nivel statică dinamică
X RMS ( n )  dB

Calea de control
Fig. 7.13. Schema bloc a procesorului de dinamică (variantă digitală)

Atât pentru varianta analogică cât şi pentru cea digitală, principiile care stau la baza
construcţiei şi operării unui procesor de dinamică sunt aceleaşi. Semnalul audio de la intrare
este analizat, măsurându-i acestuia nivelul X (în dB). Semnalul de la ieşire y ( n ) este
construit pe baza unei replici întârziate x ( n − d ) a semnalului de la intrare, prin multiplicarea
acesteia cu o funcţie dependentă de timp – câştigul curent g ( n )

y ( n) = x ( n − d ) g ( n) . (7.6)
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag. 101

7.3 Procesoarele de dinamică - Generalităţi

Procesoarele de dinamică sunt o clasă de sisteme de procesare a semnalului audio şi


au drept scop modificarea gamei dinamice a semnalului ce se aplică la intrarea lor. Funcţia
lor de bază constă în adaptarea gamei dinamice a semnalului la un lanţ prestabilit de
echipamente, astfel încât să se realizeze operarea în condiţii optime din punct de vedere al
raportului semnal zgomot, distorsiunilor, nivelului global şi nu în ultim rând al evitării
distrugerii unor componente din lanţul audio.
În Figura 7.11, pentru diverse dispozitive, sunt prezentate capabilităţile tipice de a se
acomoda dinamicii nivelului sonor.

Preamplificator de microfon
Urechea umană

Amplificator de putere

.
Bandă magnetică
profesională

Radio

magnetică
Casetă

Fig. 7.11 Dinamica nivelului sonor (capabilităţi) pentru diferite dispozitive

Având în vedere structura materialului muzical precum şi caracteristicile semnalului


vocal putem pune în evidenţă situaţiile din Figura 7.12
P [ dB ]

Limitare absolută („clipping”)

Rezervă de dinamică („headroom”)

Nivel nominal

Raport semnal zgomot

Palier de zgomot
t
Fig. 7.12 Nivelul nominal. Rezerva de dinamică. Raportul semnal zgomot
Pag. 102 Capitolul 7. Sisteme de sonorizare şi gestiunea gamei dinamice

Este posibilă îmbunătăţirea calităţii transmisiei programului audio dacă nivelul


acestuia este monitorizat permanent iar cu ajutorului reglajului de nivel (faderul) consolei de
mixaj se „nivelezează dinamica acestuia”. În timpul pasajelor slabe nivelul acestora este
crescut prin utilizarea unei amplificări mai mari in timp ce pentru pasajele mai puternice
câştigul amplificatorului va fi redus. În mod evident o astf el de ajustare manuală a poziţiei
faderelor este destul de restrictivă, în special datorită dificultăţilor majore în identificarea şi
nivelarea rapidă a vârfurilor. În mod cert controlul manual nu este suficient de rapid pentru a
putea deveni eficient.
Pentru a rezolva aceste probleme şi după cum vom vedea ulterior pentru a obţine
soluţii şi pentru altele noi, se poate folosi un echipament dedicat - procesorul de dinamică

7.4 Arhitectura procesorului de dinamică.

Procesorul de dinamică este de fapt un amplificator pentru care câştigul este controlat
automat. Mai exact, el analizează şi transformă semnalul de la intrare astfel încât să producă
la ieşirea sa o copie a programului aplicat la intrare dar care, din punct de vedere al
dinamicii, să respecte un anumit set de specificaţii. Din această categorie fac parte
limitatoarele, compresoarele, expandoarele şi porţile de zgomot. Schema bloc de principiu a
unui procesor de dinamică este prezentată în Figura 7.13
Calea de semnal

x ( n) x (n − d ) y ( n)
Întârziere

Măsurare X V ( n )  dB S ( n )  dB Integrare g ( n)


Curba
nivel statică dinamică
X RMS ( n )  dB

Calea de control
Fig. 7.13. Schema bloc a procesorului de dinamică (variantă digitală)

Atât pentru varianta analogică cât şi pentru cea digitală, principiile care stau la baza
construcţiei şi operării unui procesor de dinamică sunt aceleaşi. Semnalul audio de la intrare
este analizat, măsurându-i acestuia nivelul X (în dB). Semnalul de la ieşire y ( n ) este
construit pe baza unei replici întârziate x ( n − d ) a semnalului de la intrare, prin multiplicarea
acesteia cu o funcţie dependentă de timp – câştigul curent g ( n )

y ( n) = x ( n − d ) g ( n) . (7.6)
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag. 103

Referindu-ne la nivelele semnalelor implicate, relaţia multiplicativă anterioară devine (în dB)
una aditivă

Y = X + G [dB] . (7.7)

Întârzierea d este introdusă pentru a compensa timpul necesar prelucrărilor pe calea


care calculează câştigul, sincronizând astfel controlul amplificării cu semnalul de intrare . În
plus, dacă întârzierea este suficient de mare, se poate ajunge la un mecanism de control
predictiv (modificările nivelului semnalului efectuate asupra porţiuni din semnalul
semnalului de intrare depind şi de evoluţia ulterioară a caracteristicilor semnalului de
intrare).
Valoarea curentă g ( n ) a câştigului este determinată printr-un proces ce implică două
etape. În prima dintre acestea, imediat ce s-a realizat măsurarea nivelului de intrare X , se
aplică o curbă statică de corespondentă şi se determină un estimat s ( n ) al câştigului curent
final. Deşi la prima vedere s ( n ) ar putea fi folosit direct în controlul semnalului de la ieşire
într-o relaţie de tipul y ( n ) = x ( n − d ) s ( n ) (sau Y = X + S [dB] ) acest lucru nu este
recomandabil. Modificări bruşte şi semnificative în valorile succesive ale câştigului
generează variaţii temporale nenaturale ale nivelului programului audio. Aceste variaţii sunt
catalogate de către ascultător drept distorsiuni deranjante. Pentru a evita apariţia acestora în
programul audio final, câştigul curent g ( n ) se obţine printr-o „netezire” temporală a
evoluţiei temporale pentru estimatul s ( n ) . De acest ultim proces este responsabil blocul
„Integrare dinamică”. Să precizam în acest context că utilizarea adecvată a constantelor de
timp ce guvernează „netezirea temporală” permite inginerului de sunet extinderea
considerabilă a gamei de aplicaţii pentru procesorul de dinamică.

7.5 Măsurarea nivelului curent al semnalului de intrare

Pentru a aplica curba statică şi a obţine raportului de compresie dorit, este necesar să
se evalueze nivelul semnalului de intrare. În funcţie de modul în care procesorul de dinamică
este utilizat, se remarcă necesitatea de a măsura diferit nivelul semnalului: în valori de vârf
sau în valori efective (RMS). În ambele situaţii modulul de măsură al nivelului este compus
din două subsisteme: detectorul şi respectiv blocul de logaritmare. Detectorul este cel care
furnizează un estimat pentru valoarea de vârf sau după caz, pentru valoarea efectivă a
semnalului de la intrare. Blocul de logaritmare permite exprimarea nivelului în dB.
Pag. 104 Capitolul 7. Sisteme de sonorizare şi gestiunea gamei dinamice

x ( n) xV ( n ) X V ( n ) dB
20log10 ( • / xref )
Detector
xRMS ( n ) X RMS ( n )  dB
vârf/rms

Fig. 7.14. Componenţa blocului măsurare nivel

7.5.1 Măsurarea nivelului efectiv – Detectorul RMS

Conform schemei bloc din figura de mai jos, determinarea valorii efective (RMS) se
face prin ridicarea la pătrat a semnalului de intrare şi prin efectuarea unei medie ri cu ajutorul
unui filtru de tip trece jos. Proprietăţile de mediere sunt controlate prin intermediul unei
constante de timp, notată k av .

Ct. timp mediere k AV

x (n) Ridicare la u ( n) Filtru mediere xRMS ( n )


pătrat ()2 (FTJ)

Fig. 7.15. Detectorul RMS

Notăm cu u ( n ) semnalul furnizat de blocul de ridicare la pătrat

u ( n ) = x2 ( n ) . (7.8)

Pentru filtrul de mediere se poate folosi un filtru recursiv, de ordin 1 guvernat de


ecuaţia cu diferenţe finite

xRMS ( n ) = (1 − k AV ) xRMS ( n − 1) + k AV u ( n ) , (7.9)

căruia îi va corespunde funcţia de transfer

X RMS ( z ) k AV k AV z
H RMS ( z ) = = = . (7.10)
U ( z) 1 − (1 − k AV ) z −1
z − (1 − k AV )

În aceste condiţii, măsurarea nivelului valorii efective se poate face cu schema de procesare
sugerată de Figura 7.16
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag. 105

Ridicare la
pătrat
Filtru mediere H RMS ( z )

Ct. timp k AV
pt. mediere
x (n) x2 ( n ) xRMS ( n )

Z −1
xRMS ( n − 1)
Fig. 7.16. Măsurarea valorii efective (RMS)

7.5.2 Măsurarea nivelului de vârf

Există situaţii în care procesorul de dinamică trebuie să intervină „punctual”, în zonele


de vârf ale semnalului. În aceasta situaţie determinarea nivelului prin intermediul valorilor
efective (RMS) nu oferă o localizarea temporală suficient de precisă deoarece fil trul trece jos
recursiv de ordin 1 răspunde prea lent, mascând prin mediere vârfurile pronunţate dar scurte.
Din acest motiv procesorul de dinamică poate conţine un măsurător de nivel bazat pe valorile
de vârf, măsurător ce poate fi implementat pe baza urm ătoarelor considerente. Valoarea
absolută a eşantionului curent al semnalului de intrare x ( n ) este comparată cu ultima
valoare de vârf disponibilă xV ( n − 1) . Dacă x ( n )  xV ( n − 1) atunci este probabil ca vârful să
fi trecut, astfel că valoarea curentă de vârf este obţinută prin diminuarea valorii anterioare în
conformitate cu un coeficient  RT numit timp de stingere. Mai exact

xv ( n ) = (1 −  RT ) xV ( n − 1) , dacă x ( n )  xV ( n − 1) . (7.11)

Dacă însă x ( n )  xV ( n − 1) atunci este probabil să ne aflăm pe porţiunea crescătoare


din faţa unui vârf local. În acesta situaţie diferenţa dintre cele două valori este ponderată cu
un coeficient  AT numit timp de atac şi este adăugată la valoarea de vârf anterioară. Mai
exact, ecuaţia de evoluţie a valorii de vârf va fi scrisă sub forma

xv ( n ) = xV ( n − 1) +  AT  x ( n ) − xV ( n − 1)  , dacă x ( n )  xV ( n − 1) . (7.12)

Combinând relaţiile (7.11) şi (7.12) se obţine

(1 −  RT ) xV ( n − 1) ,
 dacă x ( n )  xV ( n − 1)
xv ( n ) =  (7.13)
(1 −  AT ) xV ( n − 1) +  AT x ( n ) ,
 dacă x ( n )  xV ( n − 1) .
Pag. 106 Capitolul 7. Sisteme de sonorizare şi gestiunea gamei dinamice

Pentru varianta discretă a procesorului de dinamică valorile  AT şi  RT sunt normate


prin împărţirea valorilor reale (exprimate în secunde) la perioada de eşantionare. Cele
menţionate anterior sugerează schema de prelucrare din Figura 7.7

Ct. timp atac  AT  RT Ct. timp stingere/eliberare

x (n) Detector de xV ( n )
vârf

Ct. timp atac  AT Ct. timp  RT pt. d ( n )  0


stingere/eliberare
0 pt. d ( n )  0
x ( n) x ( n) dx ( n) xV ( n )

Z −1
xV ( n − 1)
Fig. 7.17. Detectorul de vârf („peak level”)

7.6 Curba statică.

Nucleul căii de control îl reprezintă curba statică de modificare a nivelului. În general,


pentru un procesor de dinamică (limitator, compresor, expandor, poartă de zgomot) raportul
de compresie R se defineşte ca

X
R= , (7.14)
Y

în care Y reprezintă creşterea (în dB) a nivelului semnalului de l a ieşire, atunci când
nivelul semnalului de intrare creşte cu X dB. Curba statică defineşte corespondenta între
nivelul semnalului de intrare şi raportul de compresie aplicat. Tipul şi caracteristicile curbei
statice sunt definitorii pentru funcţia procesorului de dinamică
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag. 107

7.6.1 Limitatoare şi compresoare de dinamică

Compresoarele şi limitatoarele fac parte din categoria procesoarelor de dinamică şi


sunt concepute pentru a reduce gama dinamică a semnalelor audio.

Limitatoarele de dinamică sunt proiectate pentru a preveni ca semnalul să depăşească


un anumit nivel prestabilit (de obicei reglabil). Comportamentul acestora este uneori reglat
astfel încât atunci când nivelul X al semnalul de intrare depăşeşte pragul de limitare LT
prestabilit („Limiter Threshold”) semnalul de la ieşire nu depăşeşte sub nici o formă nivelul
corespunzător pragului de limitare. De cele mai multe ori însă, limitatorul este astfel reglat
încât atunci când nivelul semnalului de intrare creşte peste LT şi nivelul de ieşire Y creşte la
rândul său, dar într-o măsură mult mai mică. În afară de pragul de limitare (LT), funcţionarea
statică a limitatorului este caracterizată de valoarea raportului de compresie (notat LR).
Acesta este întotdeauna supraunitar, cele mai multe unităţi de limitare oferind rapoarte de
compresie cu valori între 8:1 şi 20:1. Există însă şi un număr mai redus de modele care
permit atingerea unei rate de compresie infinite.

Limitatoarele sunt utilizate pentru a procesa numai vârfurile semnalului de intrare


(zonele cu nivel mare), motiv pentru care mai sunt cunoscute şi sub denumirea de limitatoare
de vârf („peak limiters”). În aplicaţiile de difuziune ele previn supramodularea purtătoarei
armonice. În instalaţiile de sonorizare live ele sunt utilizate pentru protecţia mecanică a
incintelor acustice/difuzoarelor (de exemplu în cazul în care cade un microfon de scenă) prin
limitarea nivelului maxim al semnalului aplicat la intrarea amplificatoarelor de putere.
Istoric, în procesul de producţie al discurilor de vinil limitatoarele de dinamică preveneau
excursia mare a acului de gravare, împiedicând apropierea/atingerea spirelor succesive din
spirala de înregistrare şi diminuând astfel considerabil pericolul ca la redare acul dozei să
„sară”.

Dacă limitatoarele vizează numai vârfurile (de nivel) ale semnalului, compresoarele de
dinamică au drept scop modificarea unei plaje mult mai largi din semnalul de intrare (de
multe ori chiar întreg semnalul). În esenţă, atâta timp cât ne referim numai la caracteristica
statică, un compresor este un limitator în care pragul (numit acum de compresie în loc de
limitare) – CT („compression threshold”) – este coborât iar raportul de compresie (notat
acum CR) este ales în mod tipic între 1,5:1 şi 4:1. Totuşi este corect să precizăm că există
diferenţe importante între cele două categorii de procesoare de dinamică, dar acestea vizează
comportamentul dinamic. Pentru compresor curba statică este aplicată în conformitate cu
nivelul RMS în timp ce pentru limitator curba statică se aplică pe baza datelor furnizate de
detectorul de vârf (vezi paragraful §7.5).
Pag. 108 Capitolul 7. Sisteme de sonorizare şi gestiunea gamei dinamice

Y - Nivelul la ieşire [dBu] 30dB


+24
Comportamentul cu
+12 raportul de
compresie 1:1
S
0
3dB
-12 Zona de compresie
(peste pragul LT)
R = 10 :1 = LR
RT
-24

a) -36
Zona liniară
-48 (sub pragul LT)
R = 1:1
-60

-72

Pragul de limitare
-84 LT= -6dBu

-96
-96 -84 -72 -60 -48 -36 -24 -12 0 +12 +24
X - Nivelul la intrare [dBu]
Y - Nivelul la ieşire [dBu] 48dB
+24
Comportamentul cu
+12 raportul de
compresie 1:1

0 S
24dB
-12

-24

b) Compresie 2:1
-36
peste pragul CT
Zona liniară R = 2 :1 = CR
-48 (sub pragul CT)
R = 1:1
-60

-72

-84 Pragul de compresie


CT= -30dBu
-96
-96 -84 -72 -60 -48 -36 -24 -12 0 +12 +24
X - Nivelul la intrare [dBu]

Fig. 7.18 Caracteristici statice pentru limitatorul şi compresorul de dinamică


a) limitatorul,
b) compresorul,
c) echipament hibrid (compresor + limitator de dinamică) (vezi verso)
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag. 109

Y - Nivelul la ieşire [dBu]


+24
Comportamentul cu
+12 raportul de
compresie 1:1

0
S
-12

-24 Zona de compresie


(peste pragul LT)
Compresie R = 10 :1 = RT
-36
2:1 peste
Zona liniară pragul
-48 (sub pragul CT) CT
R = 1:1
CR = 2 :1
-60

-72

-84

-96
-96 -84 -72 -60 -48 -36 -24
CT -12 0 +12 +24
LT
X - Nivelul la intrare [dBu]
Fig. 7.18 Caracteristici statice pentru limitatorul şi compresorul de dinamică
a) limitatorul, (vezi verso)
b) compresorul, (vezi verso)
c) echipament hibrid (compresor + limitator de dinamică)

Compresoarele de dinamică au la rândul lor un număr de utilizări ce includ aplicaţii


cum ar fi difuziunea programelor (radio sau TV), sonorizarea pentru adresare publică sau
chiar înregistrarea semnalelor audio, unde este de multe ori necesar să se adapteze gama
dinamică a semnalului audio iniţial cu cea a sistemului respectiv. De exemplu, la
echipamentele de înregistrare magnetică, saturaţia benzii magnetice limitează gama dinamică
la 50dB astfel că pentru a înregistra un program „live” cu dinamică uzuală de circa 100dB, se
impune un raport de compresie de 2:1. Un alt exemplu îl constituie sonorizarea mediilor în
care nivelul de zgomot este mare (hale industriale, gări, metrou, arene sportive, etc .). Ca
exemplu relevant să luăm în discuţie sistemul de efectuare a anunţurilor pe un stadion. Într -
un astfel de mediu zgomotul de ambianţă ajunge la nivelul de 95dB SPL (aplauze, scandări ,
etc). Instalaţia audio este capabilă în mod uzual să producă nivele sonore de circa 110dB
SPL, ceea ce lasă la îndemâna inginerului de sunet numai 15dB în care să „înghesuie”
programul sonor. Semnalul vocal produs de un crainic antrenat are o gamă dinami că de 30dB
(la un vorbitor neantrenat această valoare este mai mare).
Pag. 110 Capitolul 7. Sisteme de sonorizare şi gestiunea gamei dinamice

Din nou, o compresie de 2:1 aplicată pe întreg semnalul rezolvă problema astfel încât
inteligibilitatea anunţului livrat spectatorilor rămâne neafectată.

7.6.2 Expandoare le de dinami că şi porţi de zgomot

Dacă limitarea superioară a nivelului apare datorită limitărilor privind capabilităţile


maxime pe care le au echipamentele (putere de vârf, tensiunea/curent maxim, nr de biţi pe
eşantion, etc.), limitările inferioare ţin de calitatea sursei de semnal. În acest sens de regulă
calitatea sursei de semnal este limitată de zgomotul perturbator. Microfoanele, dozele de
chitară, preamplificatoarele, generatoarele de efecte, amplificatoarele de putere produc un
anumit zgomot propriu sau îl preiau din mediul ambiental. Acest zgomot perturbator rămâne
inaudibil atâta timp cât semnalul util (semnalul muzical sau vocal) este suficient de mare în
raport cu acesta. Acest fenomen poartă numele de efect de mascare simultană şi se datorează
particularităţii auzului. În felul acesta odată ce semnalul util scade devine restrictiv palierul
de zgomot. Acesta este motivul pentru care preferăm să lucrăm în permanenţă cu nivele de
operare (nominale) cât mai mari. În acest sens ne poate ajuta compresorul de dina mică care
prin mecanismul de limitare sau compresie permite reducerea rezervei de dinamică şi astfel
oferă posibilitatea creşterii nivelului de operare

Tot legat de palierul de zgomot, cu cât nivelul semnalului devine mai mic cu atât
palierul de zgomot este mai deranjant. O soluţie la această problemă ne-o oferă tot procesorul
de dinamică ce acţionează ca un amplificator/atenuator cu câştig controlat. Dacă acestea ar
atenua semnalele atunci când nivelul lor scade puternic s-ar reduce în consecinţă şi nivelului
zgomotului în aceste porţiuni. În felul acesta aşa numitele expandoare de dinamică ar putea
mări gama dinamică a unui semnal (vezi Figura 7.19)

Practica arată că nu este necesar să se proceseze întreg domeniul de dinamică. Cu un


raport de compresie de 1:5 şi cu un domeniu de procesare de 30dB se poate obţine o
dinamică de 150dB ceea ce depăşeşte atât dinamica procesoarelor uzuale de semnal cât şi
chiar a auzului uman.
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag. 111

P  dB 
Intrare
max

Semnal util

min
Zgomot inaudibil Zgomot audibil
0
t
P  dB 
Ieşire
max

Semnal util
Prag
min
Zgomot inaudibil Zgomot inaudibil
0
t
Fig7.19. Extinderea gamei dinamice

De aceea controlul câştigului se aplică numai sub un anumit nivel numit pragul
expandorului de dinamică (ET)t obţine. Poarta de zgomot („noise gate”) este un caz
particular de expandor de dinamică, pentru care raportul de compresie se apropie de 1:  .
Y - Nivelul la ieşire [dBu]
+24

+12

-12 Zona liniară


(peste pragul ET)
-24 R = 1:1

-36 Comportamentul
cu raportul de
-48 compresie 1:1

-60

48dB -72 S
-84 Zona de Pragul de limitare al
expandare expandorului de
(sub ET) dinamică (ET)
-96 R = 1: 2 = ER
-96 -84 -72 -60 -48 -36 -24 -12 0 +12 +24
X - Nivelul la intrare [dBu]
24dB
Fig. 7.20. Caracteristici statice pentru poarta de zgomot şi expandorul de dinamică
a) expandorul de dinamică,
b) poarta de zgomot, (vezi pagina următoare)
c) echipament hibrid (expandor de dinamică + poartă de zgomot) (vezi pagina următoare)
Pag. 112 Capitolul 7. Sisteme de sonorizare şi gestiunea gamei dinamice

Y - Nivelul la ieşire [dBu]


+24

+12

-12
Zona liniară
-24 (peste pragul ET)
R = 1:1
-36

-48 Comportamentul
cu raportul de
compresie 1:1
-60

-72

36dB
-84 Pragul de
Zona de expandare limitare al porţii
(sub pragul GT) de zgomot(GT)
-96 R = 1:12 = ER
-96 -84 -72 -60 -48 -36 -24 -12 0 +12 +24
X - Nivelul la intrare [dBu]
3dB
Y - Nivelul la ieşire [dBu]
+24

+12

-12 Zona liniară


(peste pragul ET)
-24 R = 1:1

-36 Comportamentul
cu raportul de
-48 compresie 1:1

-60

-72 S
Zona de
expandare
-84 Zona de (sub ET)
expandare R = 1: 2 = ER
(sub GT)
-96 R = 1:12 = GR
-96 -84 -72 -60 -48 -36 -24 -12 0 +12 +24
X - Nivelul la intrare [dBu]
GT ET
Fig. 7.20. Caracteristici statice pentru poarta de zgomot şi expandorul de dinamică
a) expandorul de dinamică, (vezi pagina anterioară)
b) poarta de zgomot,
c) echipament hibrid (expandor de dinamică + poartă de zgomot)
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag. 113

Atât pentru expandoarele de dinamică cât şi pentru porţile de zgomot, curba statică se
aplică în conformitate cu nivelul semnalului de intrare măsurat pe baza unui detector RMS
(vezi paragraful §7.5)

Un efect al utilizării procesorului de dinamică în orice configuraţie îl constituie


reducerea nivelului mediu. Pentru a compensa această reducere de nivel, cele mai multe din
procesoarele de dinamică permit suplimentarea câştigului cu o constantă S0 (în dB). În
prezent există echipamente hibride care includ toate cele 4 funcţii ale procesorului de
dinamică, inclusiv câştigul adiţional (vezi Figura 7.21) .

Y - Nivelul la ieşire [dBu]


+24 Compresie
2:1 peste
+12 pragul
CT
CR = 2 :1
0
Zona liniară
R = 1:1
-12 Zona de compresie
(peste pragul LT)
R = 10 :1 = RT
-24
S0

-36 Comportament
raportul de
-48 compresie 1:1

-60
Zona de
expandare
-72 (sub ET)
R = 1:1.5 = ER
-84 Zona de
expandare
(sub GT)
-96 R = 1:12 = GR
-96 -84 -72 -60 -48 -36 -24 -12 0 +12 +24

GT ET CT LT
X - Nivelul la intrare [dBu]

Fig 7.21. Echipament hibrid (limitator compresor, expandor, poarta de zgomot


Pag. 114 Capitolul 7. Sisteme de sonorizare şi gestiunea gamei dinamice

7.7 Regimul dinamic. Constantele de timp pentru atac şi eliberare

În afara curbei statice de control al plajei dinamice, experienţa arată că în obţinerea


unui semnal de ieşire plăcut, cu calitate ridicată, un rol de impor tanţă majoră îl are regimul
dinamic exprimat prin modul în care este aplicat câştigul curent g ( n ) obţinut prin netezirea
temporală a câştigului estimat s ( n ) . Această integrare se face prin intermediul unui filtru
recursiv de ordin 1, caracterizat de ecuaţia cu diferenţe finite

g ( n ) = (1 − k ) g ( n − 1) + k  s ( n ) , k = k AT , kRT  (7.15)

în care k este o constantă de timp ( k AT pentru atac, k RT pentru eliberare), convenabil aleasă.
Funcţia de transfer corespunzătoare este

G (z) k kz
Hd ( z ) = = = , k = k AT , kRT  . (7.16)
S ( z ) 1 − (1 − k ) z −1
z − (1 − k )

Când nivelul semnalului de intrare ia valori în centrul gamei, procesorul de dinamică


este caracterizat de o rată de compresie unitară ( R = 1:1 ), adică nu intervine în modificarea
dinamicii semnalului. Când însă nivelul curent ajung în domeniul în care trebuie intervenit
( R  1:1 ) trebuie activată după caz rutina de limitare, compresie, expandare sau de aplicare a
porţii de zgomot. Aici intervine blocul de integrare dinamică care controlează prin
intermediul filtrului descris de (7.16) şi în consecinţă prin valoarea constantei de netezire
k = k AT , cât de rapid are loc această activare. Dacă k AT → 1 atunci g ( n ) s ( n ) ceea ce ne
arată că activarea procesorului de dinamică se face instantaneu. La extrema cealaltă avem
situaţia k AT → 0 , caz în care g ( n ) tinde să rămână nemodificat şi independent de s ( n ) ceea
ce înseamnă că activarea procesării de dinamică este înt ârziată indefinit. În felul acesta prin
intermediul constantei de netezire k AT , se pot controla întârzierea şi viteza cu care se face
activarea procesării de dinamică. Comportamentul este similar şi la ieşirea din funcţie a
procesorului de dinamică, valoarea constantei de timp k = k RT determinând şi în acest caz
întârzierea şi viteza cu care se trece de la regimul R  1:1 la cel în care R = 1:1 (dezactivarea
procesării de dinamică).

Procesoarele de dinamică performante permit inginerului de sunet utilizarea a două


valori diferite pentru constanta de timp k k AT , kRT  . În acest context k AT se va numi
constanta de timp pentru atac şi va caracteriza intrarea în funcţie a procesorului de dinamică
în timp ce k RT va purta numele de constantă de timp pentru eliberare şi va caracteriza
ieşirea din funcţie a procesorului de dinamică. Cele două constante k AT şi respectiv k RT pot fi
predefinite (prin construcţia echipamentului) sau ajustabile (de către utilizator, prin
intermediul panoului de control). În situaţia în care există constante de timp diferite pentru
atac şi pentru eliberare schema blocului de integrare dinamică trebuie completat ă cu un
INGINERIE AUDIO – Note curs - Prof. Cristian NEGRESCU Pag. 115

circuit de detecţie atac sau eliberare. Acesta poate fi implementat simplu prin compararea
valorii curente s ( n ) cu cea valoarea anterioară s ( n − 1) şi prin introducerea unui mic
histerezis (vezi Figura 7.22).

Detecţie atac / eliberare k AT k RT

Histerezis Selecţie

Z −1
k
s (n) g (n)

g ( n − 1)
Z −1
Integrator
Fig. 7.22. Blocul de integrare dinamică

7.8 Aplicaţii ale procesoarelor de dinamică

În sistemele de sonorizare de calitate procesorul de dinamică îşi găseşte un număr


respectabil de utilizări, Dintre acestea enumerăm

• Reducerea regimului tranzitoriu de stingere

• Reducerea reverberaţiei
• Sincronizarea semnalelor produse de instrumente de percuţie

• Adaptarea gamei dinamice a programului la condiţii diverse

• Reducerea sibilaţiei (de-esser)

• Reducerea dinamicii pentru difuziune - înregistrare

• Protecţia difuzoarelor/incintelor acustice

• Izolarea/accentuarea/dezaccentuarea semnalelor produse de instrumentele de


percuţie

• Creşterea nivelului sonor mediu

Pentru a putea fi realizate unele din aplicaţiile prezentate mai sus, procesoarele de
dinamică moderne permit atacarea lanţului de control cu un semnal extern (intrarea blocului
de măsurare a nivelului este decuplată de la intrarea de semnal)

S-ar putea să vă placă și