Sunteți pe pagina 1din 53

PRELUCRAREA AUDIO

DIGITALA

Cuprins
MIDI
Standardul MIDI
Crearea, editarea si interpretarea fisierelor MIDI
Acustica muzicala si notatii
Caracteristici ale secventiatoarelor si claviaturilor MIDI
Tipuri si formate de mesaje MIDI
Transmisia mesajelor MIDI
Sintetizarea sunetelor
PRELUCRAREA AUDIO DIGITALA
Medii de lucru audio digitale
Software pentru prelucrare audio
Tipuri de fisiere audio
Prelucrare dinamica
Restaurare audio

MIDI
Un fisier audio poate fi reprezentat:
-colectie de esantioane (cum s-a considerat pana in acest moment);
-MIDI (Musical Instrument Digital Interface): memoreaza evenimente de
sunet sau realizari umane de sunet. Se utilizeaza un limbaj scripting pentru
specificarea de mesaje prin care se indica note, instrumente si durate. Fiecare
mesaj descrie un eveniment (adica, schimbarea notei, a cheii, a tempo-ului,
etc) ~ interpretarea unei piese muzicale.
Mesajele MIDI genereaza sunetul corespunzator prin intermediul
unui sintetizator (cauta fiecare sunet intr-o memorie de sunete sau creaza
sunetul pe baza unui calcul matematic - in acest caz procesul se numeste
sinteza FM) => fisierele MIDI < fisiere de esantioane!
Dezavantaj: sunetul poate sa fie artificial, mecanic (in timp ce un fisier
de esantioane poate sa memoreze toate subtilitatile interpretului).
Avantaj: se poate utiliza un echipament cu clape MIDI conectat la
calculator pentru interpretarea si inregistrarea unei piese muzicale, iar ulterior
fisierul poate fi editat (modificarea instrumentului care interpreteaza, a notelor,
a cheii). De asemenea, deoarece MIDI este un standard se pot transfera
fisierele MIDI intre echipamente MIDI sau intre calculatoare.

Standardul MIDI
Primul protocol MIDI (1.0): stabilit in 1983 - colaborarea mai multor
firme (Roland Corporation, Sequential Circuits, Oberheim Electronics, Yamaha,
Korg, Kawai) => creata si o asociatie (MMA MIDI Manufacturers Association).
O componenta importanta = GM-1 (General MIDI) standardizeaza
asignarea instrumentelor muzicale la numerele de bucata (patch numbers) pe
masura ce sunt apelate.
1999: GM-2, revizuit in 2003 s-a marit numarul de sunete.
In tabelul urmator se prezinta maparea instrumentelor la numerele de
bucata (GM-2):

Crearea, editarea si interpretarea fisierelor MIDI


Dispozitivele hardware care genereaza mesaje MIDI se numesc
controllere MIDI (keyboard pian electronic, saxofon, guitara).
Dispozitivele care interpreteaza mesajele MIDI generand sunete se
numesc sintetizatoare MIDI. Unele dispozitive pot realiza ambele operatii
(exemplu anumite keyboard-uri). De asemenea unele placi audio din
calculatoare pot sintetiza fisiere MIDI.
Conectarea unui echipament MIDI la calculator:
-la calculatoarele mai vechi: conector special MIDI de 15 pini;
-actual prin USB => o conexiune MIDI standard = rata 31.25 kb/s.
Un secventiator MIDI = dispozitiv hardware (independent de calculator)
sau aplicatie software care permite receptia, memorarea si editarea datelor
MIDI. Exemple de secventiator MIDI software: Cakewalk Music Creator sau
Cubase. Secventiatorul permite vizualizarea unui fisier MIDI in diferite forme:
-staff view afisand notatiile muzicale;
-piano roll view indicand apasarile clapelor pianului;
-lista de evenimente.
In figurile urmatoare sunt prezentate aceste vizualizari din aplicatia Cakewalk
Music Creator:

Asemanatoare secvetiatoarelor, programele de notatie


muzicala pot fi utilizate pentru crearea de muzica prin:
-introducerea de note una cate una;
-click cu mouse-ul pe clapele unui pian;
-folosind un editor de evenimente.
Programele de prelucrare audio de esantioane pot citi si
fisiere MIDI si le pot converti intr-un format de esantioane (WAV sau
PCM) simplu !
Mult mai greu: transformarea unui fisier de esantioane in
fisier MIDI !

Acustica muzicala si notatii


In notatia muzicala vestica sunetele muzicale se numesc tonuri sau
tonalitati (tones), caracterizate prin inaltime (pitch), timbru si tarie
(loudness). Prin adaugarea atac (onset) si durata, un sunet muzical se
numeste nota.
Pentru doua note caracterizate de frecventele g si h, aflate la n octave
distanta exista relatia dintre frecventele corespunzatoare:
h = 2n g
Frecventa de 440 Hz este un punct de referinta si corespunde notei A.
Octava dintre A si A ul mai inalt este divizata in 12 note: A, A sharp, B, C, C
sharp, D, D sharp, E, F, F sharp, G, si G sharp. Termenul octava provine de la
faptul ca exista opt note intregi in acel domeniu. A sharp este echivalenta cu B
flat, etc... Aranjarea notelor pe clapele unui pian:

Pentru a calcula diferenta de frecventa pentru doua note succesive, se


considera f1 nota de baza si f2=2f1 nota aflata cu o octava mai sus, intre
acestea gasindu-se 12 note succesive, la distanta de un multiplicator x:
2f1 = ((((((((((((f1x) x) x) x) x) x) x) x) x) x) x) x)=f1x 12
2=x12
=> x = 1.05946309436
Astfel daca A are frecventa de 440 Hz, A# are frecventa de 440
1.05946309436 = 466.16 Hz, etc.
Notatia muzicala se scrie pe o partitura (musical staff), care are la
inceputul piesei o cheie (key signature), indicand care note se interpreteaza
sharp si care flat.
Timbrul unui sunet muzical desemneaza culoarea tonului, fiecare
instrument interpretand diferit o anumita nota muzicala. Un instrument pe langa
nota de baza (numita prima armonica) genereaza sunete cu frecventele
multiplii notei de baza, numite armonici (armonica intai, armonica a doua, etc),
care se combina cu nota de baza.
Perceptia sunetului este influentata de rezonanta, care amplifica
anumite armonici si diminueaza altele, avand un efect asupra timbrului
instrumentului.

La emiterea unei note muzicale se disting etapele formand anvelopa


de amplitudine:
-atac (attack) din momentul in care incepe emiterea sa pana cand
atinge amplitudinea maxima;
-decadere (decay) usoara scadere in amplitudine dupa atac;
-sustinere (sustain) cat continua vibratia sunetului la o amplitudine
mare;
-eliberare (release) oprirea sunetului inainte de stingerea sa naturala.

Caracteristici ale secventiatoarelor si claviaturilor MIDI


In functie de cat sunt de sofisticate, controloarele si secventiatoarele
MIDI dispun de o serie de caracteristici suplimentare:
-numarul de bucata (patch number) specifica instrumentul care
trebuie activat, in cadrul mesajelor MIDI fiind referit ca numar de program
(uneori la selectarea unui instrument pe o claviatura MIDI acesta este referit ca
voce);
-banca este o baza de date de numere de bucate;
-claviatura polifonica poate interpreta mai multe note simultan (maxim
32 de note);
-dispozitivul de iesire MIDI multitimbral poate interpreta simultan mai
multe instrumente;
-claviatura sensibila la atingere (touch sensitive) poate detecta viteza
cu care este apasata o tasta, codifica aceasta intr-un mesaj MIDI si controleaza
volumul sunetului;
-claviatura sensibila la forta cu care este tinuta apasata o tasta
(aftertouch), permitand efecte pentru trompeta si alamuri, cu variantele
monofonic (aceeasi valoare pentru toate notele) sau polifonic (efect numai
asupra unei note, celelalte ramanand neschimbate);
-pedala de sustinere poate intarzia eliberarea unei note;

-rotita de modificare a inaltimii notei (pitch bend wheel) modifica


inaltimea notei in timp ce este cantata, revenind la pozitia initiala dupa
eliberare;
-metronom dispozitiv audio pentru temporizare (ticaie in timpul redarii
piesei);
-software pentru transpozitie (schimbarea cheii), cuantizare temporala
(mutarea notelor la intervale mai regulate), schimbarea de tempo si efecte
DSP (flange, reverb, delay, echo).
De facut distinctie intre doi termeni MIDI:
-canal (channel) MIDI: o cale de comunicare de date intre doua
dispozitive MIDI;
-pista (track) MIDI: o zona de memorie in care se pastreaza datele
MIDI, corespunzand unui interval de timp al secventiatorului unde pot fi vazute
notele MIDI.

Tipuri si formate de mesaje MIDI


Un mesaj MIDI este un pachet de date care codifica un eveniment.
Evenimentele MIDI descriu modul cum se interpreteaza o melodie. Clasificarea
mesajelor:
1) Mesaje de canal: contin informatii relevante pentru canale, fiind de
doua tipuri:
-mesaje de voce canal : indica momentul cand o nota incepe si
cand se termina, cat de tare este apasata, cat de tare este tinuta apasata
(aftertouch), care instrument este activat, etc;
--mesaje de mod canal : indica dispozitivului MIDI care canal
trebuie activat pentru preluarea datelor si cum se interpreteaza acestea.
2) Mesaje de sistem: contin informatii care nu sunt specifice vreunui
canal particular (temporizare, sincronizare, setup).

Mesajele MIDI sunt transmise serial pe cuvinte de 10 biti,


incep cu un bit 0 de start si se incheie cu un bit 1 de stop, informatia
utila fiind pe 8 biti.
Fiecare mesaj contine un octet de stare si zero sau mai multi
octeti de date. Octetul de stare are bitul MSB 1 si indica tipul de mesaj,
octetul de date avand bitul MSB 0. Specificarile complete pentru
mesajele MIDI sunt date pe site-ul MMA. In tabela urmatoare cateva
exemple de mesaje:

Mesaj
Note On

Octet stare in
hexa (n este
canalul)
X9n

Octet stare in
binar

Informatia din octetii de date

1001...

Note Off

X8n

1000....

Aftertouch
pentru o clapa
Aftertouch
pentru intregul
canal
Program
change
Control
change
Pitch bend

xAn

1010....

Nota redata si viteza de lovire a clapei


(2 oct.)
Nota eliberata si viteza de eliberare a
clapei (2 oct.)
Nota, presiunea (2 oct.)

xDn

1101....

Presiunea (1 oct.)

xCn

1100....

Numar de bucata (1 oct.)

xBn

1011....

xEn

1110....

Tipul controlului (ex. modulatie, pan,


etc.) si modificarea controlului (2 oct.)
Scara de frecvente catre care
inaltimea tonului este ajustata (2 oct.)

Exemplu: mesaj pe 3 octeti: x91 x3C x64 semnifica activare nota pe canalul 1,
nota 60 (x3C) cu o viteza de apasare 100 (x64).

Transmisia mesajelor MIDI


Transmisia mesajelor MIDI se face pe cuvinte de 10 biti la rata de
31.25 kb/s, ordinea bitilor in cadrul unui cuvant fiind LSB primul.
Este posibil ca pentru note simultane si diferite efecte (rotita de
modificare a notei) sa fie generate multe mesaje, ceea ce conduce la intarzieri.
In acest caz se poate utiliza running status, o tehnica pentru reducerea
cantitatii de date MIDI, eliminand redundantele. O data ce s-a comunicat un
octet de stare, acesta nu mai trebuie repetat cat timp se aplica la octetii de
date. Exemplu: un acord de trei note pe un canal, se transmite mesajul Note
On o singura data, urmat de note si de viteza (de lovire a clapei). Comparatie
intre stream-urile in cele doua cazuri: fara running status si cu running
status:

Sintetizarea sunetelor
Un dispozitiv care reda fisiere MIDI (de exemplu o placa de sunet sau o
claviatura MIDI) poate sa utilizeze pentru sintetizarea sunetelor doua solutii:
-sintetizarea cu modulatie de frecventa (FM);
-sintetizarea cu tabela de unde (wavetable synthesis).
Sintetizarea FM este realizata prin operatii matematice pe sunete, ca
simple frecvente sinusoidale. Operatiile incep cu o frecventa purtatoare care
este apoi modificata cu o frecventa de modulare. Exemplu: se aplica unei
functii sinus o alta functie sinus. Ulterior se adauga alte functii pentru
modularea sunetului in timp. Tehnica FM poate capta foarte bine timbrul
instrumentelor reale si poate crea sunete noi care nu sunt proprii niciunui
instrument. Metoda este utilizata in special de placile de sunet.

Sintetizarea cu tabela de unde se bazeaza pe stocarea esantioanelor


de sunet ale instrumetelor reale, utilizand un dispozitiv de esantionare:
-tehnica mai costisitoare decat precedenta;
-poate stoca mult mai bine timbrul instrumentelor reale (mai buna
fidelitate).
Micsorarea numarului de esantioane pentru fiecare instrument: se
poate memora o nota produsa de un instrument, iar pentru obtinerea notelor
urmatoare, nota poate fi deplasata (shiftata), dar nu cu prea mult, caci fiecare
instrument pentru fiecare nota genereaza si o serie de tonuri suplimentare
(overtones) specifice, care nu se pot obtine prin calcule (se produce
aliasing) => gama de note este impartita in regiuni (key splits), fiind preluata
o singura nota pentru fiecare regiune, iar celelalte note din regiune se obtin prin
deplasare.
O alta solutie de reducere a cerintelor de memorie = reducerea
dimensiunii esantionului, prin stocarea unui interval foarte scurt de timp, iar la
redare esantionul este reluat in bucla pentru a obtine durata necesara. Se pot
aplica suplimentar filtrari, de asemenea esantioanele pot fi comprimate =>
sintetizarea cu tabela de unde este larg adoptata.

PRELUCRAREA AUDIO DIGITALA


Medii de lucru audio digitale
Exista doua medii importante de lucru cu datele audio digitale:
-interpretare in direct la teatru, concert (live);
-studio de inregistrari.

Echipamentul analogic utilizat anterior:

Elementul central: mixerul sau consola de mixare (primeste


semnale de la microfoane si instrumente, ajusteaza amplitudinle
acestora, egalizeaza componentele de frecventa si trimite iesirile la
difuzoare). Fiecare intrare la mixer este un canal, existand chiar si 24
de canale sau mai multe.
O alta solutie este utilizarea unui mixer digital. Acesta contine
convertor analog-digital (ADC), permitand ca prelucrarile ulterioare sa
fie facute digital.

In continuare se presupune ca elementul central de prelucrare


audio (DAW digital audio workstation) este calculatorul personal,
avand o placa de sunet cu urmatoarele functii:
-conectori de intrare pentru microfoane si surse audio externe;
-converteste sunetul din analogic in digital cu un ADC, in timp
ce este inregistrat;
-conectori de iesire pentru difuzoare si casti;
-converteste sunetul din digital in analogic cu DAC, in timp ce
este redat;
-sintetizeaza esantioane de sunet MIDI utilizand sinteza FM
sau cu tabela de unde.

Exista doua tipuri de microfoane:


-microfon dinamic: utilizeaza o bobina de inductie atasata la o
diafragma, plasata intr-un camp magnetic, astfel incat bobina se
deplaseaza la variatiile de presiune. Aceste microfoane sunt robuste,
ieftine, pentru inregistrari acasa. Nu necesita sursa externa de
alimentare. Frecventa limita este de 16 kHz.
-microfon capacitiv: are o diafragma si o placuta de baza, care
impreuna formeaza o capacitate. La schimbarea distantei dintre placile
condensatorului datorita vibratiilor, capacitatea se modifica, la fel si
tensiunea reprezentand sunetul. Microfonul este mult mai sensibil si
mai usor. Necesita sursa externa de alimentare. Frecventa limita este
de 20 kHz.

Calculatorul trebuie sa dispuna de o serie de conectori:

-conectori pentru comunicatii de date: Firewire (pentru conectarea


audio, video si discuri) cu viteza de 400 Mb/s, fara solicitarea procesorului, in
doua variante cu 4 pini si 6 pini si USB2 cu 480 Mb/s, dar cu solicitarea
procesorului;
-conector S/PDIF (Sony Phillips Digital Interface) pentru conectarea
unui recorder audio digital sau interfata externa de sunet, care transfera date
audio digitizate;
-conector (stereo 1/8) pentru microfon (analogic) la care pe placa de
sunet exista un ADC;
-conectori TRS sau TR de 1/4 pentru echipamente profesionale
(amplificatoare de microfon, casti, ghitara, difuzoare);
-conectori XLR pentru conectarea unui microfon de buna calitate la
interfete de sunet externe (prin cablu XLR), oferind un semnal de inalta calitate,
balansat si impedanta scazuta;
-conectori RCA pentru echipament audio si video, existand trei
conectori, galben pentru semnal video compus, alb pentru canal stanga sau
audio mono si rosu pentru canal audio dreapta.

Conectorii se caracterizeaza prin:


-impedanta (Z), masurata in Ohms ( ). De exemplu, microfoanele pot
fi de joasa impedanta (pana la 600 ), de medie impedanta (intre 600 si 10 k
) si de inalta impedanta (peste 10 k ). Un microfon de impedanta mare
poate furniza un semnal de amplitudine mai mare decat un microfon de
impedanta scazuta.
-lungimea cablului influenteaza semnalul, un cablu lung distorsioneaza
frecventele inalte (prin reactanta cablului).
-semnal balansat: semnalele balansate dispun de doi conductori de
semnal si un ecran. Semnalele sunt defazate cu 180 (adunand doua sinusoide
defazate cu 180 suma este zero). Zgomotul care se adauga liniei va fi
aproximativ uniform in cele doua canale, iar prin adunarea lor se obtine
zgomotul x2, ceea ce permite estimarea acestuia si eliminarea din semnal
=> canalele balansate sunt mai putin afectate de zgomot.
Semnalele nebalansate utilizeaza un conductor central invelit intr-un ecran.
Chiar si asa semnalul este afectat de zgomot.
Concluzie: cea mai buna solutie pentru inregistrare audio este oferita
de microfoanele cu impedanta scazuta (cele cu conexiune XLR).

Software pentru prelucrare audio


Printre cele mai utilizate programe de prelucrare audio sunt: Digidesign
Pro Tools (Mac sau Windows), Adobe Audition (Windows), Apple Logic (Mac),
Sony Sound Forge (Windows) si Nuendo (Mac sau Windows). Cakewalk Music
Creator si Cakewalk Sonar sunt pachete software combinate pentru prelucrare
audio / MIDI. Propellerhead Reason (Mac sau Windows) este un pachet
sofisticat audio / MIDI furnizand un secventiator, masina de tobe si o varietate
larga de sintetizatoare. Acid Pro este un instrument pentru creatia de muzica.
Max/MSP (Mac sau Windows) este un mediu de dezvoltare pentru muzica
interactiva si prelucrare audio.
Exista de asemenea o serie de freeware, shareware si instrumente
comerciale pentru Linux: DAP, MixViews, ReZound, Slab, JoKosher, KWave,
Brahms, Jazz++, TiMidity++, Playmidi, BladeEnc, si aRts.
Audacity este un program open source pentru Mac, Windows si Linux.

Caracteristicile principale ale unui software de prelucrare audio includ:


-import si salvare fisiere audio intr-o varietate de formate;
-interfata pentru inregistrarea si redarea de sunete;
-vizualizarea formei de unda, permitand editarea pana la nivelul de
esantion;
-editoare multitrack;
-instrumente de restaurare audio pentru inlaturarea suieraturilor,
clickurilor, pocniturilor si a zgomotului de fond;
-abilitatea de preluare de intrari sau furnizare de iesiri de la canale
multiple;
-efecte speciale reverb, panning, flange;
-controale pentru egalizarea si ajustarea volumului si intervalului
dinamic;
-filtre de frecventa;
-gestionarea formatului MIDI alaturi de date audio digitale si integrarea
intr-un singur fisier audio;
-inregistrarea de esantioane si adaugarea la banca de pachete MIDI;
-codecuri de compresie.

In Waveform view: reprezentare grafica a undelor sonore (se pot afisa


si edita la nivelul esantioanelor). Se mai numeste si editor de esantioane. Pe
orizontala se afiseaza timpul, iar pe verticala amplitudinea. Standardul pentru
timp este SMPTE (Society of Motion Picture and Television Engineers), divizat
in ore, minute, secunde si cadre (frames). De exemplu, un standard
(imprumutat din video) poate sa fie de 30 cadre / sec.
In Multitrack view se permite inregistrarea de diferite sunete,
instrumente si voce pe piste separate, care pot fi prelucrate independent. O
pista este o secventa de esantioane audio care poate fi redata si editata ca o
unitate separata. De obicei piste separate sunt asociate cu instrumente sau
voci separate.
Canalul difera de pista, canalul corespunzand unui stream de date
audio. Astfel inregistrare pe un canal inseamna mono, iar pe doua canale
inseamna stereo. Pe masura dezvoltarii industriei multimedia au aparut
inregistrari multicanal: multicanal 5.1 are 5 canale fata-centru, fata-dreapta,
fata-stanga, spate-dreapta si spate-stanga, plus un canal LFE (low frequency
extension channel), numit subwoofer cu frecvente intre 10-120 Hz, iar
multicanal 6.1 are un canal spate-centru suplimentar.

Tipuri de fisiere audio


Formatele de fisiere audio difera printr-o serie de caracteristici:
-codificarea esantioanelor:
-cuantizare liniara;
-cuantizare logaritmica;
-valori de esantioane cu semn sau fara semn;
-formatul datelor:
-existenta unui header;
-memorarea octetilor in ordinea litle-endian sau big-endian;
-intreteserea canalelor;
-tipul de informatii memorate in fisiere:
-constrangeri legate de rata de esantionare si/sau adancimea
de biti;
-constrangeri legate de numarul de canale;
-informatii suplimentare, ca timestamps, loop points;
-fisierul poate fi comprimat:
-utilizand o procedura cu pierderi;
-utilizand o procedura fara pierderi;
-format open sau proprietar.
Principalele formate audio sunt prezentate in tabelul urmator:

Extensia de Tip de fisier sau codec


Caracteristici
fisier
.aac
Advanced Audio Coding Compresie fara pierderi ca imbunatatire MP3,
utilizat pentru iPods, cell phones si
PlayStations portabile.
.aif
Audio Interchange File
Format PCM necomprimat, suporta mono/stereo,
Format, format wave
8/16 biti, varietate de rate de esantionare, ordine
standard Apple
big-endian.
.au
NeXT/Sun (Java)
Poate fi fara compresie sau cu compresie CCITT law, A-law, G721; suporta mono/stereo, 8/16 biti,
varietate de rate de esantionare (fara compresie);
utilizat pentru distributie pe Internet si includere in
appleturi si aplicatii Java.
.flac
.mp3
.ogg

Free Lossless Audio


Codec, Xiph.Org
Foundation
MPEG-1 Layer 3 audio

.raw

Ogg Vorbis, Xiph.Org


Foundation
Fisier Raw

.rm

Real Media

Codec gratuit fara pierderi, compresie 1.5:1 sau


2:1; pentru compresie fara pierderi pentru web.
Rata mare de compresie la o calitate buna, inclusiv
pentru web.
Codec gratuit, rata mare de compresie cu buna
fidelitate, concurenta cu .mp3.
Valori de esantion fara header, la deschiderea
fisierului se introduc rata de esantionare, rezolutia
si numar de canale.
Suporta stream audio (permite ascultare inainte de
descarcarea completa a fisierului).

.tta

True Audio

.wav A-law/- CCITT standard G.711


law

Codec gratuit fara pierderi, compresie 1.5:1 sau 2:1;


pentru compresie fara pierderi pentru web,
competitie cu .flac.
Fisiere cu esantioane pe 8 biti create din esantioane
pe 16 biti folosind codificarea A-law/-law,cu scara
dinamica de 13 biti (aprox. 78 dB).

.wav DVI/IMA International Multimedia


Association, versiune
ADPCM format
.wav cu compresie
ADPCM

Utilizeaza o metoda diferita (mai rapida) decat


Microsoft ADPCM, alternativa la MPEG cu
decodificare rapida si compresie audio de buna
calitate.

.wav Microsoft Microsoft


ADPCM

Utilizeaza ADPCM, furnizeaza 4 biti/canal date


comprimate cu rata 4:1.

.wav Windows Microsoft


PCM

Standardul Windows pentru audio PCM


necomprimat, suporta mono/stereo, varietate de
adancime de biti si rate de esantionare, conform
specificatiilor RIFF.

.wma/.asf

Codec Microsoft, permite alegerea calitatii, inclusiv


rata de biti constanta (CBR constant bit rate) sau
variabila (VBR variable bit rate), compresie
cu/fara pierderi, suporta streaming audio.

Microsoft Windows
Media (audio)

Prelucrare dinamica
Prelucrarea dinamica este procesul de ajustare a scarii dinamice
a unei selectiuni audio fie pentru a reduce, fie pentru a creste diferenta
dintre pasajele cele mai puternice (tari) si cele mai reduse (silentioase). In
productia de muzica, vocile si instrumentele sunt inregistrate separat,
fiecare pe pista sa, iar fiecare pista se poate ajusta dinamic in timp real
sau dupa inregistrare.

Modificarea scarii dinamice se poate realiza prin patru metode:


-compresie in jos (downward compression): micsoreaza amplitudinile
semnalului care sunt peste o anumita valoare de prag, fara sa schimbe
amplitudinile sub aceasta valoare, reducand astfel scara dinamica;
-compresie in sus (upward compression): ridica amplitudinile
semnalului care sunt sub o anumita valoare, fara modificarea amplitudinilor
peste aceasta valoare, reducand scara dinamica;
-expansiune in sus (upward expansion): ridica amplitudinile
semnalului care sunt peste o valoare de prag, fara sa schimbe amplitudinile
sub aceasta valoare, crescand scara dinamica;
-expansiunea in jos (downward expansion): micsoreaza amplitudinile
semnalului sub o valoare de prag, fara modificarea amplitudinilor peste aceasta
valoare, crescand scara dinamica.

Limitarea audio limiteaza amplitudinea unui semnal audio la un


nivel desemnat. Se poate realiza hardware, la inregistrare sau software,
executandu-se taierea amplitudinilor mari (clipping). Rezulta anumite
distorsiuni ale formei de unda.
Normalizarea este un proces care creste amplitudinea unui
semnal audio si deci si volumul perceput. Deoarece opereaza pe un
intreg semnal audio trebuie aplicat dupa inregistrare.

Algoritmul de normalizare:
1) gaseste amplitudinea cea mai mare din selectia audio;
2) gaseste amplificarea necesara pentru a creste amplitudinea cea mai
mare la valoarea maxima dorita (implicit 0 dBFS sau o anumita valoare setata
de utilizator);
3) mareste toate amplitudinile din selectie cu aceasta amplificare.
Varianta acestui algoritm normalizeaza amplitudinea RMS la o valoare de
decibel specificata de utilizator, caci RMS furnizeaza o masura mai buna pentru
volumul perceput al sunetului. In unele programe se furnizeaza o setare
predefinita impreuna cu o explicatie intuitiva (exemplu: Normalize RMS to
10dB (speech)).

Compresia si expansiunea se pot reprezenta matematic printr-o functie


de transfer sau grafic. O functie de transfer corespunzatoare primei bisectoare
(linie la 45) nu modifica semnalul audio, insa o functie liniara de transfer
deasupra primei bisectoare creste amplitdinea, iar sub prima bisectoare scade
amplitudinea.

Functii liniare de transfer pentru crestere cu 5 dB si micsorare cu 5 dB (fara


compresie sau expansiune).

Compresia in jos necesita un prag (amplitudinile peste aceasta valoare


sunt micsorate). Exemplu de functie de transfer:

Amplitudinile mai mari decat -40 dB sunt micsorate cu un raport 2:1.

Compresia in sus creste amplitudinea semnalului mai mic decat o


valoare de prag. Exemplu de functie de transfer:

Amplitudinile mai mici de -30 dB sunt amplificate cu un raport 2:1.

Unele programe permit combinarea celor doua operatii intr-una singura


In acest caz functia de transfer poate arata astfel:

Se executa compresie in jos pentru amplitudinile mai mari decat -20 dB, fara
compresie intre -20 si -60 dB si compresie in sus sub -60 dB. Scara dinamica a
fost redusa prin compresie in jos si compresie in sus.

Exemplu de semnal care a fost prelucrat dinamic prin compresie in jos


si compresie in sus, iar apoi normalizat:

Semnalul audio initial.

Dupa compresie

Dupa normalizare.

Restaurare audio
In timpul inregistrarilor audio apar zgomote de fond (aparatul de aer
conditionat, motorasul unui harddisk, vantul, etc). Pentru eliminarea acestor
zgomote se pot utiliza trei tipuri de restaurare audio: blocarea zgomotului
(noise gating), reducerea zgomotului (noise reduction) si inlaturarea click si
pop (click and pop removal).
Poarta de zgomot (noise gate) blocheaza semnalele cu amplitudine sub
un anumit prag. Cand esantioanele sunt sub valoarea de prag, poarta se
inchide si esantioanele nu sunt lasate sa treaca. Cand esantioanele cresc
deasupra valorii de prag poarta se deschide si lasa sa treaca aceste
esantioane. O poarta permite specificarea unor parametri:
-nivel de reducere (reduction level): amplitudinea sub care sunt reduse
esantioanele;
-timp de atac (attack time): timpul de deschidere a portii cand semnalul
depaseste valoarea de prag (timp scurt poate sa prinda de exemplu un sunet
de tobe);

-timpul de eliberare (release time): timpul de inchidere a portii din


momentul in care semnalul scade sub prag (o bucata muzicala care
scade incet in volum trebuie sa aibe un timp de eliberare mare pentru
a prinde efectul);
-control de detinere (hold control): timpul minim cat poarta trebuie sa
stea deschisa;
-control de histerezis (hysteresis control): este util in cazul cand
semnalul fluctueaza in jurul valorii de prag, ceea ce ar insemna
inchiderea si deschiderea continua a portii (fenomen numit chatter),
astfel se poate indica diferenta dintre valoarea care deschide poarta si
valoarea care o inchide.

Interfata pentru poarta de zgomot (Logic Pro).

Interfetele pentru reducerea zgomotului afiseaza de obicei graficul


analizei de frecventa: pe axa orizontala se reprezinta frecventele, iar pe axa
verticala amplitudinile. Utilizand culori diferite se reprezinta semnalul original,
cantitatea de reducere a zgomotului si zgomotul. Setarea principala se refera la
reducerea zgomotului.
Profilul zgomotului se obtine din analiza Fourier (se determina
frecventele la care apar zgomotele si amplitudinile corespunzatoare acestor
frecvente). Dupa determinarea profilului zgomotului se compara spectrul de
frecvente al intregului semnal cu profilul, iar sectiunile care coincid sunt
eliminate.
O astfel de interfata permite setarea unor parametrii de netezire:
-netezire de timp: timpii de atac si eliberare pentru reducerea
zgomotului;
-netezire de frecventa: gradul la care zgomotul identificat intr-o banda
de frecventa afecteaza schimbarile de amplitudine in benzile de frecvente
invecinate;
-netezire de tranzitie: seteaza o gama intre amplitudini care sunt
considerate zgomote si cele care nu sunt considerate zgomote.

Software-ul pentru reducerea zgomotului poate fi setat pentru a cauta


un anumit tip de zgomot:
-zgomot alb (white noise): apare la amplitudini egale (sau aproape
egale) pentru toate frecventele, echivalent cu energii egale in benzi de
frecventa de aceleasi dimensiuni (graficul frecventa-amplitudine aprox
orizontal, deci ariile de sub grafic sunt egale pentru benzi egale);
-zgomot roz (pink noise): energii egale in benzi de octave (pentru o
nota trecerea de la o octava la octava urmatoare inseamna dublarea
frecventei).
Eliminatorul de click si pop detecteaza intr-o portiune selectata a
fisierului audio o schimbare brusca de amplitudine si elimina aceasta
schimbare prin interpolarea undei de sunet intre punctele de start si sfarsit a
click-ului sau pop-ului