Documente Academic
Documente Profesional
Documente Cultură
Parte I – Sub-Bandas
ESTI019 – Codificação de Sinais Multimídia
Profs. Celso S. Kurashima, Kenji Nose e Mário Minami
Março 2018
Ilusões de Áudio
https://www.youtube.com/watch?v=kzo45hWXRWU
Ou seja,
• São famosas as “ilusões de ótica”, mas
devido ao funcionamento do nosso sistema auditivo, muitos “ilusões
de audição” podem ser criadas, que nos “enganem” (cfr.
KOHLRAUSCH2005).
• As tecnologias de Codificação de Áudio (p.ex. MPEG), ou
compensação de ruído (p.ex. Dolby) utilizam os limites e restrições do
nosso sistema sensorial-perceptivo auditivo, para obter os ganhos em
armazenamento e/ou processamento.
Algumas propriedades da Transformada Z (TZ)
Dadas as sequências x1[n], x2[n]
• Linearidade, sendo a e b quaisquer:
• Se y[n] = ax1[n] + bx2[n], então: Y(z) = aX1(z)+bX2(z)
• Convolução:
• Se 𝑦 𝑛 = 𝑥1 [𝑛] ∘ 𝑥2 [𝑛] ≜ σ∞
𝑚=−∞ 𝑥1 𝑛 − 𝑚 𝑥2 [𝑚], então Y(z) =X1(z)X2(z)
∞ 𝐾−1 𝐾−1 ∞
1/𝐾 −𝑚 1 1 −𝑚
= 𝑥𝑚 𝑧 𝑒 𝑗2𝜋𝑟𝑚/𝐾 = 𝑥 𝑚 𝑧1/𝐾 𝑒 −𝑗2𝜋𝑟/𝐾 =
𝐾 𝐾
𝑚=−∞ 𝑟=0 𝑟=0 𝑚=−∞
𝐾−1
1
= 𝑋 𝑧1/𝐾 𝑒 −2𝜋𝑟/𝐾
𝐾
𝑟=0
(2)
➢ Ou seja, a TZ do dado decimado é soma de K termos
Análise na frequência da decimação:
• Se o dado foi amostrado com frequência de fs, na decimação por K teremos
cada ponto decimado espaçado no tempo e a nova frequência de amostragem
será fs /K.
• O conteúdo espectral do sinal original fora de –fs /2K até fs /2K terá
sopreposição (aliasing).
• Os K-1 termos extra na TZ decimada são os termos sobrepostos
• Embora os dados decimados tenham frequência efetiva de fs /K o dado no DT
é uma nova sequência com taxa fs. Podemos associar a TZ com a TF:
1 𝐾−1 𝑓 𝑓𝑠
𝑌 𝑓 = σ 𝑋 −𝑟 (3)
𝐾 𝑟=0 𝐾 𝐾
• Assim: a) A largura de banda sofre um espalhamento por K (termo r=0) e
b) ocorre sobreposição para bandas fora de –fs /2K até fs /2K
Efeito de Aliasing e escalamento na Decimação
Up-Sampling K: aumento artificial de fs
• Colocação de K-1 zeros entre amostras:
𝑥[𝑚] se 𝑛 = 𝑚𝐾
𝑦 𝑛 =ቊ
0
𝑌 𝑧 = 𝑋(𝑧 𝐾 ) (4)
• No DF Y(f) = X(Kf), ou seja, o espectro é esprimido por um fator K.
• Se X(f) for periódica com período fs o espectro Y(f) terá réplicas de X(f)
Codificação por Sub-Bandas
Operação:
• O sinal de entrada x(n) é decomposto M faixas de frequêcias:
• banco de filtros de análise em sub-bandas
• Os sinais de cada sub-banda xi(n) são decimados (redução da taxa,
downsampling) para
yi (m) = xi (Mm) e depois quantizados.
• O decodificador combina os signais das sub-bandas 𝑦𝑖 (𝑚) em um
sinal de saída 𝑥(𝑚)
e
• depois interpola (upsampling) para 𝑥𝑖 (𝑚):
𝑥𝑖 𝑚𝑀 = 𝑦𝑖 (𝑚) e 𝑥𝑖 𝑚𝑀 + 𝑙 = 0 para l = 0, ... , M -1
• Por fim, sintetisa por um Banco (Crochiere and Rabiner 1983, Vaidyanathan 1993)
Quais os princípios que motivam?
➢Num Sistema PCM sem compressão a taxa de bits e a SNR são
constantes (p.ex. 16 bits/96 dB para o CD).
• Como a percepção humana varia em cada faixa de frequência (vide Modelo
Auditivo), porque não se pode variar a taxa de codificação em cada sub-
banda?