Sunteți pe pagina 1din 25

Codificao de udio II

MDCT e Transformadas
ESTI012 Comunicaes Multimdia
Profs: Celso Setsuo Kurashima e Mrio Minami
UFABC
Outubro 2016

Codificadores por Sub-Bandas x Transformada


Sub-bandas: codificadores com poucos canais de frequncia como
MPEG camadas I e II
Transformada: codificadores com muitos canais de frequncia como
DOLBY AC2 e AC3 e MPEG AAC
Matematicamente, apesar da nomenclatura diferente, eles so
equivalentes

A Transformada de FOURIER (TF) e a


Transformada DISCRETA DE FOURIE (DFT)
A TRANSFORMADA DE FOURIER:
Mapeia os Domnio do Tempo (DT) no Domnio da Frequncia (DF):

() ()
Se o sinal x(t) de banda mxima fmx for amostrado com frequncia
de amostragem
2
Teremos as amostras [] ( ) onde =

A Transformada DISCRETA DE FOURIER (DFT)


Um sinal limitado no tempo, num intervalo T, que possui um conjunto
finito de amostras no nulas pode ser completamente representado
por um conjunto de amostras na frequncia = (/)
Deseja-se ento trabalhar com um representaes limitadas no
tempo e na frequncia:
Deseja-se operar com blocos finitos do sinal amostrado no tempo (DT) e
convert-los em conjuntos finitos de amostras na frequncia (DF)
Uma soluo de compromisso pode ser encontrada, com quase nenhuma
perda de informao.

o que denominamos de Transformada Discreta de Fourier (DFT)

Janelas no Domnio do Tempo: Retangular e


Senoidal

Janela Retangular: = 2 = 0 2 =
sin()

Janela Senoidal:
= sin / , tempo contnuo
=

1
2

para n = 0,1,..., N-1 em tempo discreto

E,

= 2 =
2 = cos()

1 (2)2

Janela de Hanning
Hanning:
= 12 1

, para 0 e 0 c.c.

Ou:
= 12

1cos

2 +

1
2

, para n=0,1,...,N-1

Cujo espectro :
=

sin()
1/2
cos()

1 ()2

Aspecto (Shape)

Espectro

Janela de Kaiser-Bessel
0 1

=
onde 0 =
=0

( 2 )

/2 2
/2

0 []

a 0-sima funo modificada de Bessel.

E o espectro aproximado desta janela ser:


2 2 (2/22
=
0 ()
2 2 (2/22

Janela Kaiser-Bessel: Formato e Espectro

Procedimento de Sobreposio-e-Adio
(Overlap-And-Add)
A transformao para o DF permite a separao do sinal (seu
espectro) em blocos de bandas de frequncia com redundncia de
informao.
Utiliza-se o efeito de mascaramento em frequncia no Sistema
Auditivo Humano para remoo de componentes irrelevantes
Descarte de componentes de frequncia inaudveis
Alocao de bits varivel por banda, penalizando faixas espectrais encobertas
pelo rudo de quantizao

Overlap-And-Add

Overlap-And-Add

Overlap-And-Add: Normalizao das Janelas


Para Reconstruo perfeita, se usamos as mesmas janelas para a
Anlise e para a Sntese:
[]2 + 1 [ + ]2 = 1
para n = 0,1,...,N-M-1
[]2 = 1 para n = N-M, N-M+1,...,M-1
Para uma janela senoidal, fica:
1

+
2
2
para 0, , 1

para = , , 1
= 1
1

2
2
para = , , 1

Overlap-And-Add: Normalizao Genrica


=0 []
[]

=0

= 1

para = 0, , 1
para = , , 1

[]

=+1
[]

=0

para = , , 1

Janela normalizada derivada da Kaiser-Bessel


(KBD)
50% de
sobreposio
com os blocos
adjacentes
Dolby AC e
MPEG AAC,
usam = 4 KBD

Consideraes na utilizao das Janelas


Maximizao da separao das frequncias do Banco de Filtros e a
minimizao dos efeitos da segmentao em blocos.
Dois parmetros das janelas a serem considerados so o Tamanho e o
Formato da Janela.
Dado um certo tamanho de bloco para os dados de entrada do banco de
filtros, a seleo do formato da janela (tipo) determina o grau de separao
espectral do banco
P.ex. o lbulo principal da janela senoidal mais estreito que o da = 4 KBD;
entretanto, a rejeio nos lbulos laterais pior na senoidal que na = 4 KBD.

Utilizao de vrios tipos de Janelas: switch

Block Switching
Ajustar a seletividade do Banco
de Filtros:
Mudar o tamanho da janela
mantendo o critrio de
Reconstruo Perfeita
Para efeitos transitrios,
janelas estreitas
Para sinais mais estacionrios,
janelas mais largas
No necessrio manter
simetria nas janelas

FILTROS MDCT (usados no MP3 e no AAC)


So Filtros PQMF generalizados para bancos de filtros modulados
por cossenos com Reconstruo Perfeita, ou Modified Discrete
Cosine Transform (MDCT) filter (Princen e Bradley 1986).
Respostas impulsivas dos filtros de anlise:
=

2
cos

2 +

= (2 1 )
Condies PR:

com

2 + 1 1
=
2 2

2 + 1 ( + 1)
=
4

2 2 + = 1
= 2 1 para n = 0,...,M-1

Modulated Lapped Transform Filter Bank


(Malvar 1990), caso especial da MDCT
= +

1
2

Utilizados nas normas:


MPEG-1, camada 3 (MP3)
MPEG-2 AAC
MPEG4

, para n=0,...,2M-1

Codificador por Transformada M-Canais, N=M

Notao Matricial Filtros de Anlise e Sntese

TC, M Canais,
N=2M
viso da
segmentao
pelos blocos

TC M Canais, N>M

Referncias
DUTOIT, T. and MOREAU, N., How is sound processed in an MP3
player?, in: Applied Signal Processing, Ch.3, Springer, New York, 2009.
BOSI, M. and GOLDBERG, R. E., Introduction to Digital Audio Coding
and Standards, Kluwer Academic Publishers, Dordrecht, 2003.

S-ar putea să vă placă și