Documente Academic
Documente Profesional
Documente Cultură
http://liceu.uab.es/~joaquim/phonetics/fon_anal_acus/herram_anal_acus.html
1
ANALIZA SV
AMPLITUDINILE
BANC de FILTRE B.F. DERIVAT
din FFT
SEMNAL
VOCAL FFT COEFICIENTII
CEPSTRUM CEPSTRALI
DERIVATI din FFT
PREDICTIA LINIARA
(LP)
CEPSTRUM COEFICIENTII
CEPSTRALI
DERIVATI din LP
ANALIZA PERCEPTUALA PLP, MFCC
3
Algoritmi folosiţi în analiza spectrală [Picone]
1. SPECTROGRAMA
• Evolutia functiei spectrale a SV in timp – spectrograful
• Plotarea spectrogramei poate fi : de contur sau luminos/intunecat;
• Primul instrument folosit de foneticieni – Key Elemetrics;
• Compus din : modulator, filtru, tambur de plotare sonograma (f/t)
• Principiul este filtrajul superheterodina, daca SV este s(t) semnalul modulat este
ŝ(t) = s(t)*cos 2πft, iar spectrul este deplasat spre frecvente mai inalte si baleiaza
intrarea FTB;
5
Spectrograma (sonograma)
6
Spectrograma de banda larga si banda ingusta
9
10
11
- Spectrul de putere pe timp scurt este compus din anvelopa spectrala globala
(se modifica lent- tractul-rezonante/antirezonante, forma spectrului sursei si caract. de
12
radiatie la nivel buze-nasal) si structura fina (rapid- periodicitatea sursei glotale)
TFTS (STFT) – TF pe timp scurt
- unde w(n-m) este o fereastra care determina portiunea din x(n) care se
foloseste la calculul Xn(ejω)
13
• 500 de esantioane/ferestra (50 msec)
• periodicitatea se poate vedea în timp şi în frecvenţă
• se poate vedea primul formant (300-400 Hz), IIa rezonanţă la 2200 Hz, IIIa rezonanţă
la 3800 Hz 14
• caderea spectrului de frecvenţe, datorită formei impulsurilor glotale
• o claritate mai mare a armonicelor FF din cauza lobului principal mai îngust al
ferestrei rectangulare (RW)
• spectrul de frecvenţe mai zgomotos ( ptr. RW), datorită interferenţei interarmonice,
15
deoarece lobii laterali ai RW au doar -14 dB atenuare
16
17
18
19
Tema. Generati si analizati spectrogramele BL/BI pentru unul din fisierele de lucru (MATLAB).
F[Hz]
t[s]
20
3. Banc de filtre derivat din TFR
500 Hz
concentrare
Varfuri la
500,1000, 1500,...
imagini
Concentrare
DC
26
Banc de filtre Uniform
Banda Filtrului Numarul
(no overlapping) Frecventele f = Fs i, 1 i Q filtrelor
i N
Centrale
27
Q – numarul filtrelor uniform distribuite pe gama de frecvente a SV
BF Neuniform
• Scara de frecventa logaritmica
• Scara de banda critica
– Mel Scale
– Bark Scale
Scala Logaritmica de Frecventa
• Ptr. Q FTB, fecventa centrala, fi si banda bi:
Banda arbitrara ptr.
b1 = C primul filtru
bi = bi −1 , 2i Q
i −1
(bi − b1 )
Factor logaritmic f i = f1 + b j +
de crestere j =1 2
Uzual 2.
Frecventa centrala filtru i 28
Arbitrara la primul filtru
C = 200Hz; f 1 = 300Hz; = 2; Q = 4;
29
Scara de banda critica (perceptuala)
30
Si(n)
Exempu simplificat 31
33
Ex. Care este rata de compresie
la un vocoder de canal cu Q=16
FTB, la prelucrarea unui SV cu
B<8kHz fata de codarea PCM.
Presupunem fes=20kHz, si rez.
CAN 12 biti.
34
5. ANALIZA HOMOMORFICA
• Filtrarea/transformarea homomorfica este o transformare neliniară, x[n] = D(x[n]), aplicată
de obicei, la prelucrari de imagine și vorbire utilizată pentru a transforma un semnal obținut
din convoluția a două semnale în suma celor două semnale.
35
Sistemele homomorfice respecta principiul superpozitiei
generalizate (ptr. convolutie):
36
Filtru homomorfic => sistem homomorfic [H] care permite semnalului
dorit sa treaca nealterat, in timp ce opreste pe cel nedorit
; X1 - nedorit
; Opresc X1
37
Forma canonica pentru convolutia homomorfica
-relatia de convolutie
-Relatia aditiva
-Sistem liniar
38
- inversa rel. de conv.
Forma canonica pentru domeniul frecventa
- Trebuie gasit un sistem care transforma convolutia in adunare
39
Cepstrum
46