Sunteți pe pagina 1din 224

Alexandre Torres Porres

Modelos Psicoacsticos de Dissonncia


para Eletrnica ao Vivo

Universidade de So Paulo
Escola de Comunicaes e Artes

So Paulo 2012
Alexandre Torres Porres

Modelos Psicoacsticos de Dissonncia


para Eletrnica ao Vivo

Tese apresentada ao Programa de


Ps-Graduao em Msica, rea de
concentrao Musicologia. Linha de
Pesquisa Histria, Estilo e Recepo,
da Escola de Comunicaes e Artes da
Universidade de So Paulo, como
exigncia parcial para obteno do
Ttulo de Doutor em Artes, sob a
orientao do Prof. Dr. Marcelo
Queiroz e co-orientao do Prof. Dr.
Fernando Iazzetta.

So Paulo, 2012

I
Porres, Alexandre Torres
Modelos Psicoacsticos de Dissonncia para Eletrnica ao
Vivo.
Tese Doutorado Ps-Graduao em Msica.
Universidade de So Paulo.
Eletrnica ao vivo Pure Data - Modelos Psicoacsticos -
Curvas de Dissonncia.

II
ALEXANDRE TORRES PORRES

MODELOS PSICOACSTICOS DE DISSONNCIA PARA ELETRNICA AO VIVO

COMISSO JULGADORA

TESE PARA OBTENO DE GRAU DE DOUTOR

Presidente e orientador Porf. Dr. Marcelo Queiroz (USP)

2. Examinador Prof. Dr. Srgio Freire (UFMG)

3. Examinador Prof. Dr. Jnatas Manzolii (UNICAMP)

4. Examinador Prof. Dr. Rgis Faria (USP)

5. Examinador Prof. Dr. Fbio Kon (USP)

So Paulo, 14 de Fevereiro de 2012.

III
Aos meus avs.

Junilde Maron Torres 27.03.1928 / 07.08.2011


Hlcio de Andrade Torres 03.02.1928 / 25.12.2011

IV
Agradecimentos
No se faz um doutorado sozinho! A ss temos apenas uma idia, uma vontade, uma
busca, e somente com uma rede de amigos e profissionais que isso cresce e se concretiza.
Os apoios ocorrem de vrias maneiras e, em muitas vezes, em mais de uma nica forma. Mas
posso resumir em dois pilares: um de apoio e colaborao profissional, outro simplesmente
moral, de profunda amizade e companheirismo. Sem o primeiro pilar, nada seria possvel,
mas, sem o segundo, no seria um processo igualmente agradvel e, de alguma forma,
tambm impossibilitaria essa jornada maluca que escolhemos.
Sinto que este texto a Parte II do meu mestrado. E assim, fao um convite para
que busquem l um complemento e germe inicial desta pesquisa. Na dissertao de mestrado
fiz questo de agradecer e dar conta de todos que fizeram parte da minha vida musical e
acadmica at ento. Portanto, reforo o papel dessas pessoas, sem as quais tambm no
chegaria aqui.
Logo no incio dessa nova fase, Juliana Frana foi uma tima companheira em horas
conturbadas e decisivas de empreitadas malucas, saudades.
Foi um prazer ter a chance e privilgio de fazer parte do grupo de pesquisa MOBILE
na USP, a todos os membros, diretores e colaboradores, obrigado.
Velhos companheiros de outros carnavais continuam a, agora colegas da USP e do
grupo de pesquisa, como Henrique Iwao, Mrio Del Nunzio, Alexandre Fenerich, Giuliano
Obici, Llian Campesato. Em especial ao amigo Fenerich, que sempre me alertava de prazos e
outras informaes e toques imprescindveis at o momento do depsito deste texto, alm de
umas consideraes mais que bemvindas.
Novos amigos e colegas me ajudaram a viabilizar a idia de realizar uma conveno
de Pure Data no Brasil nesse perodo, que teve um impacto muito feliz e positivo na minha
carreira. Obrigado especial ao Ricardo Palmieri e Paloma Oliveira na formao da cpula.
Lina Lopes e Iwao pela fora na hora da verdade. E muito obrigado aos que apoiaram esse
projeto: Srgio Basbaum, Marcelo Bressanin e Cssio Quitrio.
Agradecimentos diversos para toda a comunidade mundial de Pd, amigos e
desconhecidos que sempre oferecem ajuda ou feedback para diversas questes via internet.
Conheci diversos artistas e pesquisadores de trabalhos inovadores e inspiradores nas
convenes de Pd e fiz diversos amigos, em especial: Nick Porcaro, Alexandre Castonguay,
Mathieu Bouchard, William Brent, Teresa Asceno, Hans Christoph-Steiner e Miller
Puckette.
Agradeo aos parceiros de empreitadas musicais que me ajudaram a botar idias da
pesquisa em prtica, como o velho grupo EntreCompositores, pela jornada de produzir a I
Bienal Msica Hoje em Curitiba com nosso concerto de encerramento nessa nova encarnao
(Mrcio, Orlando, Fernando, Vincius, Lucas e Franco in memoriam). Maurcio Dottori pela
tima vontade em me ajudar com a pea e as aulas de orquestrao que nunca tive. Marcel
Steuernagel pelo timo trabalho na regncia. O incrvel grupo Platypus pelo apoio alm do
necessrio, em especial as competentssimas solistas Sieglinde Gringer e Theresia

V
Schmidinger. E, por fim, um agradecimento especial para Rogrio Costa que esteve ali
quando possvel para testar meus prottipos em nosso duo.
Andr Salim Pires pela colaborao e primeira ajuda com implementao em objetos.
Mathieu Bouchard por verdadeiras aulas de programao no estgio na Canad. E ao colega
de USP Flavio Luiz Schiavoni por prometer no me deixar rfo nesse quesito daqui a pouco.
Um agradecimento mais do que especial a Sean Ferguson pela orientao no
CIRMMT/McGill e por fazer a inscrio no estgio acontecer indo atrs de mim para
perguntar se eu precisava de algo mesmo quando seu email deu pau e me filtrou no spam! A
Marcelo Wanderley por me acolher no Music Tech Building, mesmo quando eu quase botei
fogo no laboratrio. Novamente a Alexandre Castonguay pelo acolhimento em terras
estrangeiras montrealenses. Jlio Costa pela grande amizade e companheirismo que selamos
l.
Bruno Giordano pela ajuda no design do teste, Danilo Ramos pela ajuda na anlise
estatstica. Clarence Barlow, pelo apoio de sempre, pelo compartilhamento de seus cdigos e
prontido a atender diversas dvidas.
Ao sr. Guilherme Rebbechi, por sua excentricidade e amizade pra qualquer hora
mesmo distante, mas tambm por se oferecer a fazer uma reviso cuidadosa de uma parte
deste texto. Natacha Mauer e Missionrio Jos que ouviram gritos de socorro e ajudaram
em revises emergenciais do texto. Quel pela companhia no karaok e a zelosa e antroprtima
reviso profissional. Caio por me encher o saco que eu lanasse logo o [Brane~] (ou pra no
ficar de fora).
S que mais importante, este texto no existiria sem Marcelo Queiroz e Fernando
Iazzetta, pela orientao deles e por apostarem no meu trabalho, me dando essa chance de
desenvolver esta pesquisa!
No posso deixar de agradecer ao simples fato do Primus ter voltado ativa e do
Faith No More ter ressurgido do nada para dar uma alegria na minha vida chamando ainda
Trey Spruance para tocar o disco King For a Day Fool For a Lifetime na ntegra. E agradecer
o prprio Trey por apostar no meu trabalho de produo e vir para o Brasil com seus Chefes
Secretos (Timba, Ches, Toby e Matt).
Yoga Studio uma escola de Yoga que fica em Curitiba mas a melhor escola de
Yoga do mundo.
A meus queridos avs por terem ficado tanto tempo conosco, nesses mais de 60 anos
de vida feliz e amorosa que tiveram juntos. A meu av por ser um modelo de vida. minha
v por todo o apoio, orgulho e vnculo musical que tivemos. Hlcio de Andrade Torres e
Junilde Maron Torres, descansem em paz!

VI
RESUMO

O principal problema desta tese a aplicao da teoria psicoacstica sobre


percepo de dissonncia em novas ferramentas de computao musical em tempo
real. Os objetivos e contribuies incluem: Prover uma reviso critica do Estado da
Arte em teoria psicoacstica de modelos de dissonncia, projetar trabalhos futuros;
Explorar um potencial criativo negligenciado de modelos psicoacsticos de
dissonncia em Eletrnica ao Vivo; Desenvolver novas ferramentas computacionais
baseadas na teoria; Investigar o potencial e limitaes da teoria e tcnicas. Discutir
sua pertinncia e impacto; Tornar a teoria e tcnicas mais acessveis a msicos por
meio deste texto e as ferramentas desenvolvidas.
A percepo de Dissonncia um fenmeno complexo em que a abordagem
psicoacstica cobre apenas uma poro. Alm disso, ainda h muito debate na rea da
psicoacstica sobre o desenvolvimento de modelos de dissonncia. Portanto, a tese
apresenta uma reviso crtica do Estado da Arte da teoria psicoacstica, apontando
pontos fracos e fortes do atual conhecimento, e futuros desenvolvimentos no campo.
Um teste perceptivo tambm foi elaborado para gerar ponderaes relevantes.
Os modelos foram implementados em Pure Data, e uma srie de patches foi
desenvolvida para testar o potencial criativo em eletrnica ao vivo. Esse processo
culminou em um sistema desenvolvido em Pure Data que agrega diversas das tcnicas
baseadas nos modelos psicoacsticos. Suas possibilidades incluem, por exemplo,
encontrar intervalos consonantes de acordo com um espectro, ou alterar componentes
espectrais para que estejam de acordo com uma escala musical ou afinao particular.
Essas ferramentas foram empregadas em um duo de improvisao livre com o
autor e um saxofonista. O autor tambm comps uma pea orquestral que utilizou o
sistema desenvolvido na parte de eletrnica ao vivo.

VII
ABSTRACT

The problem of this research is to apply the state of the art in psychoacoustic
theories about dissonance perception in the development of novel creative computer
music tools for composition and live electronics. Goals and contributions include: To
provide a critical review of the State of the Art in Psychoacoustic theory regarding
dissonance modeling, project further work; To explore neglected creative potential of
psychoacoustic dissonance models in Live Electronics; To develop novel computer
music tools based on the theory; To investigate the potential and limitations of the
theory and techniques; To discuss its creative musical impact and pertinence; To
make the theory and techniques more accessible to musicians through the text and the
free developed tools.
The perception of Dissonance is a complex phenomenon in which the
psychoacoustical approach covers just a portion thereof. Not only that, but
psychoacoustic theory is still in debate about the development of dissonance models.
Therefore, the thesis provides a critical review of the state of the art in psychoacoustic
theory, pointing out weaknesses and strong points of the current knowledge, and
future developments in the field. A perceptual test was also designed to generate data
for relevant insights.
Apart from the theoretical review, the models were implemented in Pure Data,
and a series of patches was developed in order to test their creative potential in Live
Electronics. This culminated in a system developed as a Pure Data Patch that
aggregates several techniques based on the psychoacoustic models. Their possibilities
include, for example, finding consonant intervals according to a spectrum, or altering
spectral components so they are in accordance to musical intervals and particular
tunings. These tools were used in a Free Improvisation duo with the author and a sax
player, and the author also composed an orchestral piece that applied the developed
system in the Live Electronics section.

VIII
SUMRIO
Introduo: 1
Parte I Reviso Terica da Base Sensorial da Dissonncia Musical
Introduo: 3
1) A Psicoacstica como uma Base Sensorial da Percepo Musical 5
1.1 Psicoacstica 7
1.2 Diferentes Nveis de Percepo 8
1.3 Diferentes Nveis em Psicoacstica e Descritores de udio 10
2) Conceitos de Dissonncia e Relao com Atributos Perceptivos 12
3) Base Sensorial da Dissonncia Musical em Psicoacstica e Seus Atributos 15
3.1 Dissonncia Sensorial 16
3.1.1 Dissonncia Sensorial versus Dissonncia Musical 16
3.1.2 Dissonncia Sensorial versus Sensory Pleasantness 18
3.2 Quadro de Atributos de Ernst Terhardt 20
4) Descrio dos Atributos Psicoacsticos 22
4.1 Grupo de Dissonncia Sensorial 22
4.1.1 Brilho 22
4.1.2 Aspereza 23
4.1.3 Tonalness (Clareza de Percepo de Altura) 27
4.1.3.1 Altura Virtual (Virtual Pitch) 28
4.2 Grupo de Harmonia 33
4.2.1 Fundamental do Acorde 34
4.2.2 Afinidade de Tons: Comonalidade de Altura 36
4.3 Consideraes Finais e outros Atributos 37
4.3.1 Fuso Tonal 39
5) Modelos Psicoacsticos 42
5.1 Modelo de Brilho 43
5.2 Modelo de Aspereza 45
5.3 Modelo de Altura Virtual e Tonalness 51
5.3.1 Primeiro Estgio: Peso de Alturas Espectrais 52
5.3.2 Segundo Estgio: Modelo de Altura Virtual 53
5.3.3 Terceiro Estgio; Modelo de Tonalness 54
5.4 Modelo de Altura Virtual aplicado aos Atributos de Harmonia 55
5.4.1 Descrio Final do Modelo de Comonalidade de Altura 56
5.5 Outros Modelos Relacionados Harmonia 58
5.5.1 Harmonicidade 58
5.5.2 Entropia Harmnica 60
6) Consideraes Finais 62
Parte II Desenvolvimento de Ferramentas Criativas
Introduo: 67
7) Estado da Arte de Aplicaes Criativas 68
7.1 Aplicao em Afinao e Escalas Musicais 69
7.2 Exemplos de trabalhos em Composio Assistida por Computador 70
7.2.1 Sistema Apprentice, de Sean Ferguson 71
7.2.2 Sistema AUTOBUSK & Dissonometer, de Clarence Barlow 74
7.3 Aplicaes com Descritores de udio 77
7.3.1 Identificao de Alturas 79
7.3.1.1 Acompanhamento de Partitura (Score Following) 80
7.3.1.2 Antescofo~ (Expanso do Paradigma) 81
7.3.1.3 Outras Aplicaes com Deteco de Alturas 81
7.3.2 Identificao de Timbres e Reconstruo de Timbres 82
7.3.3 Expanso com Descritores de Dissonncia 84
8) Extrao de Componentes Espectrais 86
8.1 Anlise Espectral (Caractersticas e Implicaes) 86

IX
8.2 Extrao de Listas de Parciais com [sigmund~] 90
9) Objetos Desenvolvidos 92
9.1 Objeto [sharpness] 92
9.2 Biblioteca do Modelo de Aspereza 92
9.2.1 Conversor de dB para Phons e Sones 92
9.2.2 Converso de Hz para a Escala da Banda Crtica (Barks) 97
9.2.3 Objeto [roughness] 98
9.2.3.1 - Performance do Objeto [roughness] 100
9.3 Biblioteca de Pitch Commonality 102
9.3.1 Implementao do Cdigo de Parncutt em Patch de Pure Data 103
9.3.2 Objeto [tonalness] 106
9.3.3 Objeto [Pitch_Weigth] 107
9.3.4 Objeto [Pitch_Salience] 109
9.3.5 Objeto [Pitch-Commonality] 110
9.3.5.1 Comparao Avanada 112
9.4 Harmonicidade 115
10) Patches Desenvolvidos 118
10.1 Separao de Rudo de Fundo e Qualidade Tonal 118
10.2 Ressntese via Banco de Osciladores 120
10.3 Mudana de Altura (Pitch Shifting) 122
10.3.1 Picth Shiftting via Ressntese 123
10.3.2 Phase Vocoder 123
10.3.3 Harmonizador em Tempo Real 129
10.4 Manipulao Espectral 130
10.4.1 Sntese Cruzada (Vocoder) 130
10.4.2 Modulao de Amplitude 132
10.4.2.1 Modulao Complexa 134
10.4.3 Controle Arbitrrio de Parciais via Ressntese 136
10.4.3.1 Mapeamento Espectral 138
10.5 Curvas de Dissonncia e Gerao de Escalas a partir de Sonoridades 141
10.6 Autotuner e Gerador de Escalas 148
11) [Brane~]: Um Sistema para Interao em Tempo Real Desenvolvido em Pure Data 151
11.1 Resumo do Sistema 152
11.2 Base do Sistema 153
11.3 Capacidades Avanadas 156
11.4 Outras Consideraes 158
12) Consideraes Finais 160
12.1 Contribuies em Relao ao Trabalho de Sethares 160
12.2 Design e Acessibilidade 163
12.3 Outras Consideraes 165
Parte III Discusso Final
Introduo: 167
13) Discusso Terica Crtica 168
13.1 Recapitulao da Teoria Psicoacstica 168
13.2 Discusso Terica sobre a Modelagem de Dissonncia 170
13.2.1 Curvas de Dissonncia em Duas Dimenses Principais 172
13.2.2 Reviso dos Modelos de Aspereza 173
13.2.3 Aspereza versus Harmonicidade 178
13.3 Teste perceptivo de Dissonncia sob uma Perspectiva Sensorial 181
13.3.1 Estmulos 182
13.3.2 Teste e Resultados 184
13.4 Consideraes Finais 189
14) Discusso Final Sobre Aplicaes Criativas 192
14.1 Exemplos Criativos 192
14.1.1 Duo de improvisao Livre com Rogrio Costa 192

X
14.1.2 (i)Re(v||f)erncia, de Alexandre Torres Porres (2011) 193
14.2 Impacto de Modelos Psicoacsticos de Dissonncia em Criao Musical 195
14.2.1 Inato versus Adquirido 196
14.2.2 Teoria Psicoacstica e Teoria Musical, um Anacronismo 197
14.3 Por uma Abordagem Voltada ao Concreto 198
15) Concluso 205
15.1 Teoria Psicoacstica 205
15.2 Impacto e Contribuio Criativa 205
15.3 Projees Futuras 206
Referncias 207

Anexo I Partitura de (i)Re(v||f)erncia


Anexo II CD-ROM

XI
Introduo:
O ponto central e originrio dos problemas desta pesquisa est no processo de
percepo sonora e na investigao de como conseguimos identificar e perceber certos
atributos sonoros.

No... tambm no escutei isso.


(Frank & Ernest by Thaves)

O presente trabalho visou uma aplicao criativa do estado da arte em modelos


psicoacsticos de dissonncia em novas ferramentas de eletrnica ao vivo (Live
Electronics) para composio e improvisao. Apesar do fim criativo, os problemas
encontrados durante a pesquisa envolvem trs diferentes searas: Psicologia da Msica,
Computao Musical e Composio/Improvisao. Por esse perfil interdisciplinar, este
trabalho se caracteriza como um estudo na rea de Sonologia, como definida por
Iazzetta (2008).
A percepo de Dissonncia um fenmeno complexo, onde a abordagem
psicoacstica cobre apenas uma poro. Alm disso, o problema de quais seriam os
atributos psicoacsticos da dissonncia e como eles contribuiriam para uma percepo
geral de dissonncia ainda uma questo aberta e em pleno debate e investigao.
A referncia terica principal nesta pesquisa a de Ernst Terhardt (1984), que
expe dois grupos de atributos perceptivos relacionados percepo de dissonncia:
Dissonncia Sensorial e Harmonia. Os conceitos de todos os atributos de cada grupo,
sua histria, desenvolvimento e modelos existentes foram investigados para nos dar
uma base para sua implementao em ferramentas criativas. Alguns elementos
paralelos tambm foram investigados e colocados em perspectiva.
Uma reviso terica crtica levanta pontos fracos e fortes do atual
conhecimento, apontando para futuros desenvolvimentos nesse campo. Nela,
apresentamos algumas discrepncias encontradas entre diferentes modelos e
debatemos qual resultado seria o mais acurado e as implicaes dessas consideraes.

1
Tambm debatemos sobre como diferentes atributos contribuem para a percepo de
dissonncia e um teste psicoacstico foi desenvolvido para nos ajudar a levantar
pontos relevantes.
Como o principal objetivo est na aplicao criativa da teoria psicoacstica, a
reviso terica tange a questo do impacto e relevncia da adoo desses modelos
psicoacsticos no desenvolvimento de ferramentas criativas, que serviram de
laboratrio de testes para a elaborao de algumas das concluses apresentadas.
Os modelos estudados foram implementados em Pure Data1 em uma biblioteca
de objetos. Uma srie de patches2 foi desenvolvida para testar o potencial criativo
desses modelos em eletrnica ao vivo.
Os patches culminaram no desenvolvimento de [Brane~] um sistema que
agrega a maior parte das tcnicas apresentadas. Essas incluem, por exemplo, encontrar
intervalos musicais consonantes de acordo com um espectro sonoro, ou alterar
componentes espectrais para que fiquem de acordo com uma Escala/Sistema de
Afinao. Essas ferramentas foram adotadas pelo autor em um duo de improvisao
livre e na parte de eletrnica ao vivo em uma pea orquestral.
Seguindo com o objetivo principal de pesquisa, o desenvolvimento de patches
e objetos apresentam novas ferramentas criativas em tempo real. Com eles, um
potencial negligenciado foi explorado. Esses frutos da pesquisa esto acessveis e
disponveis por meio desta tese, e os prprios objetos e patches, que so distribudos
como cdigos livres.
A tese divide-se em trs partes. A primeira expe a teoria psicoacstica e uma
discusso inicial sobre a Base Sensorial da Dissonncia Musical com seus atributos e
modelos desenvolvidos. A segunda parte traz as ferramentas criadas durante a pesquisa
a partir da implementao dos modelos. A terceira e ltima parte traz uma reviso
terica crtica e uma discusso final sobre a aplicao criativa da teoria psicoacstica.

1
Pure Data, ou apenas Pd, um ambiente de programao grfica originalmente criado para desenvolver
aplicativos de computao musical em tempo real. Mais informaes em <http://puredata.info/>.
2
No mbito do Pd, o verbo em ingls to patch remete ao ato de programar, enquanto o substantivo patch
pode ser compreendido como um programa desenvolvido em Pure Data.

2
PARTE I Base Sensorial da
Dissonncia Musical

Introduo:
O conceito, a percepo e interpretao de dissonncia sempre foi importante e
elementar na teoria e prtica musical, igualmente para a musicologia. O mesmo vale
para o conceito complementar de consonncia. Afinal, ambos so essenciais na
linguagem harmnica e so princpios geradores de contrastes como tenso e
relaxamento. Qualquer msico iniciante possui uma noo intuitiva do que
consonncia e dissonncia e lida com esses conceitos de modo corriqueiro. No entanto,
a compreenso terica aprofundada de como funciona a percepo desses elementos,
ou do que realmente se constituem, so problemas mais complexos e prprios da
musicologia.
Por mais que seja possvel encontrar definies com certas distines entre
consonncia e dissonncia, faz parte do senso comum que os dois termos descrevam
um mesmo fenmeno. Algumas discrepncias surgem mesmo pelo fato de ser
necessrio aferir diferentes graus de consonncia e dissonncia para diferentes
intervalos musicais e assim distinguir entre dois grupos principais opostos. Sobre isso,
Schoenberg (citado em Tenney 1988 pg. 2) afirma que dissonncias, mesmo as mais
simples, so mais difceis de compreender que consonncias, e coloca esse fator como
justificativa pelo grau de aceitao de dissonncia ter mudado no decorrer da histria.
Esse exemplo j nos traz algumas complicaes envolvendo o conceito de
consonncia e dissonncia, que ser melhor definido adiante. Por enquanto,
necessrio afirmar que adotamos uma abordagem que no diferencia conceitualmente a
consonncia de dissonncia, tampouco pretende delinear uma fronteira entre esses dois
opostos. Logo, quando falamos de dissonncia, estamos igualmente falando de uma
mesma grandeza, por assim dizer, de consonncia, porm diretamente oposta.
Focaremo-nos na grandeza de dissonncia. De tal maneira, temos uma
consonncia mxima ou dissonncia mnima como ponto de partida, algo como o
intervalo de unssono, e medimos como a dissonncia aumenta em funo de outros
intervalos musicais (diferentemente de uma situao compreendida como mais
complicada, de partir de uma dissonncia mxima e, aos poucos, tentar dilu-la at

3
chegarmos a uma consonncia mxima). Esse foco na grandeza de dissonncia est em
linha com a afirmao de Schoenberg de que mais fcil entender o que uma
consonncia. Portanto, olhamos para o problema como um continuum que vai do
consonante ou menos dissonante ao dissonante.
Com essa perspectiva, a dissonncia pode ser relacionada com uma espcie de
entropia. Inclusive, esse um conceito por trs de uma das referncias desta
pesquisa, em que um modelo de Entropia Harmnica (Elrich 1997) visa contabilizar
a percepo de dissonncia.
Quanto ao problema de pesquisa, preciso olhar para a dissonncia como uma
qualidade de ordem perceptiva e sensorial. Nesse aspecto, a dissonncia um
fenmeno complexo, definido em termos objetivos e subjetivos, que depende de vrios
nveis, desde o fisiolgico at o cognitivo e interpretativo, alm de um contexto
esttico e cultural. Logo, sua abrangncia de natureza interdisciplinar e interessa no
somente teoria musical como tambm s cincias. Por essa caracterstica pluriforme,
esse conceito tem sido investigado sob diversos pontos de vista, por meio de uma
abordagem acstica, cultural, filosfica, cognitiva e assim por diante.
Tenney (1988) destaca cinco noes distintas de dissonncia: meldica,
polifnica, contrapontstica, funcional e psicoacstica. Dentre essas, devemos destacar
a abordagem psicoacstica, que relaciona atributos acsticos sensao de dissonncia
em um nvel ainda objetivo, fisiolgico. Essa noo est perfeitamente de acordo com
o que se define aqui como uma Base Sensorial da Dissonncia Musical. No obstante,
mesmo definindo esse recorte de pesquisa, entende-se que a Dissonncia Musical
como um todo ainda se mantm multidimensional e influenciada por diferentes fatores.
Nesta primeira parte, apresentamos um mapeamento da Dissonncia Musical
sob esse vis sensorial. A seguir, apresentaremos um panorama geral de atributos
perceptivos relacionados dissonncia. Aps essa etapa, cada atributo perceptivo ser
descrito e revisado em pormenores, finalizando com a apresentao de seus modelos
psicoacsticos.

4
Captulo 1) A Psicoacstica como uma Base Sensorial para a
Percepo Musical

Em musicologia, a grande rea da Psicologia da Msica estuda a percepo


musical e engloba diferentes subreas, dentre elas a Psicoacstica. Apresentamos
quadros gerais do processo de percepo musical e como a Psicoacstica se insere e se
compara com outras subreas. A partir dessa exposio, justificaremos o recorte
adotado em psicoacstica para os fins da pesquisa.
Terhardt investigou a percepo de altura e sua relao com a percepo da fala
(1974). Nesse estudo, ele adota o conceito de trs mundos relacionados aos trabalhos
de Popper (1972) e Eccles (1973) com a inteno de delinear trs instncias do
processo de comunicao sonora. A relao entre os mundos e estgios de
comunicao se d da seguinte maneira: 1) Mundo Fsico / O som como fenmeno
acstico; 2) Entidades subjetivas / A percepo sonora e 3) Informao /
Processamento e interpretao da informao sonora captada. Abaixo, uma figura do
livro de Parncutt que relaciona essa teoria com a percepo musical.

Figura 1 Interpretao dos 3 mundos na Percepo Musical (Parncutt 1989, p. 22).

Na figura 1 esquerda, temos a teoria dos trs mundos: 1) Mundo da


matria; 2) Mundo da experincia e 3) Mundo da informao. Do mundo da matria ao
da experincia temos um processo de Sensao, enquanto o caminho do mundo da
experincia ao da informao contempla um processo cognitivo. Tambm temos um
caminho direto do mundo da matria ao da informao, em que o processo todo tido
como de Percepo.
Adaptado ao contexto de percepo musical, direita da figura 1, temos um

5
ciclo, em que o mundo da matria o tom musical3 como uma vibrao acstica. O
processo de escuta (sensao) leva ao mundo da experincia dado como uma
Sensao Sonora. Essa sensao codificada em um processo de escrita em uma
Nota ou partitura, que leva ao mundo da informao. A partir dessa informao,
podemos executar e gerar um material sonoro.
Paralelamente, o semioticista e professor de musicologia Jean-Jacques Nattiez
(1990) define trs instncias, ou trs nveis, em um processo de criao e recepo
musical, o primeiro (poitico) diz respeito ao processo criativo; o segundo (neutro) o
dado sonoro bruto; j o terceiro (estsico) depende da interpretao pela escuta. O
caminho entre o nvel bruto at o estsico contempla o processo de percepo musical.
Simon Emmerson (1982) afirma que os estudos da Psicoacstica e da Cognio
Musical so reas compreendidas como importantes elos na comunicao entre o nvel
poitico e estsico. Emmerson (1982 p. 72) expande o modelo de Nattiez e o aplica,
em especial, anlise de msica eletroacstica. Seu trabalho amplia a relao entre o
nvel neutro e o estsico de Nattiez (1990), e trata a recepo do fenmeno sonoro
como uma cadeia de reas de pesquisa que unem esses polos pelo caminho dado na
tabela 1.

Tabela 1. Relao entre o Nvel Neutro e Estsico (Emmerson 1982)


Anlise do Anlise Psicologia da
Nvel Neutro Nvel Estsico
Sinal Fsico Psicoacstica/Cognitiva Msica

A distino feita por Emmerson entre Anlise Psicoacstica/Cognitiva e


Psicologia da Msica diz respeito a uma separao em que a Anlise
Psicoacstica/Cognitiva tange a um processo central de percepo musical, enquanto a
Psicologia da Msica trata de processos mentais de ordem superior. E assim podemos
relacionar esse caminho com as trs instncias tambm apontadas por Terhardt (fsico
sensaes auditivas informao).
Entretanto, a Psicoacstica e a Cognio so, de fato, subdivises da Psicologia
da Msica e possuem competncias distintas apesar de se encontrarem em um mesmo
estgio no quadro de Emmerson. A seguir, apresentamos melhor a rea da
Psicoacstica e a distinguimos da Cognio Musical ao expor diferentes nveis de

3
Neste texto, tom musical se refere ao material sonoro produzido por instrumentos musicais tradicionais
(tons complexos harmnicos).

6
percepo musical, que tambm dizem respeito ao quadro de Emmerson. No final,
retomaremos esse quadro frente a outros elementos apresentados no texto.

1.1 Psicoacstica
A psicoacstica uma rea cientfica que estuda a percepo sonora por meio
de testes empricos, aplicados a um grupo de indivduos modelo, com anlise
estatstica dos resultados. A Psicoacstica, ento, estuda a resposta subjetiva e
psicolgica de atributos fsicos, ou acsticos, do som. A base dessa relao o
mecanismo fisiolgico da escuta entende-se aqui, principalmente, o aparato
mecnico do ouvido (externo, mdio e interno).
Enquanto a acstica uma subrea da fsica que estuda o som enquanto
vibrao mecnica, a Psicoacstica considerada como um ramo da Psicofsica. Esta,
por sua vez, estuda todas as relaes entre estmulos fsicos e a nossa percepo
atravs dos sentidos. Entretanto, a Psicofsica tambm considerada uma ramificao
da Psicologia, que a grande rea que estuda percepo e cognio de um modo geral.
Ou seja, a Psicoacstica se configura como uma rea hbrida e agrega elementos da
Psicologia e da Fsica.
A formulao do campo da Psicofsica ocorreu no sculo XIX. Isso significa
que as tentativas de explicar fenmenos musicais (como a Consonncia e Dissonncia)
eram, at ento, altamente especulativas, muitas vezes com base apenas em alguns
preceitos matemticos, qualificados posteriormente como arbitrrios. O
desenvolvimento da Psicoacstica, ento, surge como uma possibilidade de fornecer
uma base cientfica para o estudo de percepo musical e at hoje est em ativo
desenvolvimento.
Em 1863, o mdico e fsico alemo Herman Helmholtz, conhecido por
contribuies diversas no campo da cincia, publica o original em alemo do livro
Sobre sensaes do tom (musical) como uma base psicolgica para a teoria da
msica (1877). Apesar de no estar explcita no ttulo do livro, a base psicolgica a
que Helmholtz se refere a Fisiologia Sensorial, rea em que ele tambm foi um
grande expoente.
A Fisiologia Sensorial justamente a rea do estudo de Helmholtz que implica
uma abordagem psicoacstica. At hoje, esse trabalho seminal uma referncia
importante na literatura psicoacstica, assim como nesta tese.
Na poca daquela publicao ainda no existia a atual diviso mais refinada

7
entre reas e subreas do conhecimento humano, como a musicologia e suas atuais
ramificaes. O ttulo do livro remete apenas a uma aplicao do conhecimento da
Psicologia em teoria musical, mas se trata de uma aplicao da Psicoacstica em
percepo musical e sua influncia em certos aspectos da teoria musical, como o
conceito de consonncia e dissonncia.
A rea da Psicoacstica est mais consolidada e bem definida atualmente. Um
livro atual na mesma linha de Helmholtz (1877) o de Parncutt Harmonia, Uma
Abordagem Psicoacstica (1989) j com uma definio mais clara no ttulo sobre o
campo de estudo no qual a obra se encontra. Porm, apesar de a Psicoacstica ser uma
rea hbrida entre Fsica e Psicologia, as publicaes de Helmholtz e Parncutt
exemplificam como possvel aplic-la como uma subrea da musicologia.
Em suma, a psicoacstica uma rea hbrida. Por um lado, ela diz respeito
acstica, que um ramo da fsica. Por outro, ela trata da recepo do estmulo fsico e
sua relao com um objeto sensorial. No que diz respeito sua aplicao em
musicologia, a psicoacstica se encontra na rea da Psicologia da Msica, que estuda
percepo e cognio musical de um modo geral. Como uma subrea delimitada, a
psicoacstica possui seus limites de abrangncia, que sero discutidos melhor a seguir,
onde apresentaremos diferentes nveis perceptivos e como a psicoacstica se aloca
nesse espao.

1.2 Diferentes Nveis de Percepo


Como exemplificado por meio do livro de Helmholtz, a Psicoacstica surgiu no
sculo XIX como uma nova forma de estudar percepo musical em um vis
cientfico. Todavia, seguidamente desse marco, outras abordagens paralelas surgiram
na rea da psicologia que tambm se voltaram a esse estudo, focando no mesmo
objeto, mas sem a preocupao de uma correlao direta entre um estmulo acstico e
uma resposta subjetiva.
Uma forma de classificar essas diferentes abordagens por nveis de
percepo. Um nvel de percepo que se explica por uma relao fisiolgica entre um
estmulo e uma resposta subjetiva dito mais baixo. Processos de ordem superior,
ou cognitivos, se do envolvendo a recepo e processamento da informao pelo
sistema sensorial em processos mentais diversos, assim como sua interpretao e
organizao de acordo com um fator de treinamento e aprendizado.
A percepo musical envolve tais processos mais complexos, pois depende de

8
uma experincia cultural. Logo, como um todo, pode-se dizer que a percepo musical
de uma ordem superior mera relao fisiolgica. Esse fato restringe a Psicoacstica
a apenas um estgio do processo de percepo musical.
A Psicoacstica explica, por exemplo, como somos capazes de distinguir certas
qualidades sonoras, tais como caractersticas espectrais, alturas e intensidade. Mas, j
comea a fugir de seu escopo quando se trata de investigar estruturas musicais mais
complexas, como a identificao de forma musical.
Seguindo ento para outro escopo de ordem superior, temos na Psicologia da
Msica, por exemplo, a cognio musical, que emprega disciplinas como a
Neurocincia, e investiga processos mentais no estudo da percepo musical. No
obstante, tanto a Psicoacstica como a cognio musical podem se voltar a um mesmo
objeto, como a percepo de timbre. Alis, alguns dos atributos perceptivos
apresentados nesta pesquisa sob a tica da Psicoacstica tambm esto sendo
investigados em nveis superiores de percepo.
Em relao Psicoacstica, os trabalhos na rea de cognio musical so bem
mais recentes e ainda incipientes, pois um campo que se instaura apenas na dcada
de 1980. Por isso, se encontram em um cenrio de rduo debate e reviso de
resultados. Inclusive, muitos desses resultados ainda no foram devidamente
sistematizados na forma de um modelo, impossibilitando sua incorporao na teoria e
prtica musical de um modo eficaz, do modo em que buscamos neste trabalho.
J a contribuio da Psicoacstica em percepo da Dissonncia presente
desde Helmholtz (1877) e tem fornecido estudos quantitativos extensos e objetivos em
dados generalizados que, por isso, tem sido aplicados em teoria musical h algumas
dcadas, inclusive de modo criativo como o foco desta pesquisa. Essa abordagem
mais objetiva e generalizada no , necessariamente, uma restrio, pois permite que
seus estudos sejam aplicados igualmente de modo genrico, independente de questes
culturais ou estticas.
Outro fator importante que a Psicoacstica nos fornece modelos
relativamente simples que podem ser implementados computacionalmente na criao
de ferramentas de Eletrnica ao Vivo. Logo, por mais que haja alguma restrio,
promove-se uma contrapartida providencial no desenvolvimento de ferramentas para
computao musical, com aplicaes prticas concretas. Por essas razes, nos
ateremos Psicoacstica como rea que nos fornece uma Base Sensorial para o estudo
da Dissonncia Musical, de modo que outras ramificaes e linhas da Psicologia da

9
Msica (como a cognio e neurocincia) no sero consideradas.

1.3 Diferentes Nveis em Psicoacstica e Descritores de udio


A Psicoacstica se volta para um estgio anterior de percepo, tido como de
nvel mais baixo. Porm, vimos que ela pode ter impacto em questes da teoria e
prtica musical e ainda estudar elementos que so igualmente pesquisados em
cognio musical e neurocincia. A percepo de dissonncia, que possui um carter
rico e multidimensional, inclui esses elementos situados em uma rea fronteiria.
Da mesma maneira que a Psicoacstica pode se voltar a estudos que possuem
interseo com nveis superiores, tambm h um desdobramento na direo oposta,
onde nos encontramos com os ditos Descritores de Sinais ou Descritores de
udio. A descrio de sinal sonoro faz parte da rea de pesquisa em msica e
tecnologia conhecida como Music Information Retrieval (Recuperao de Informao
Musical), ou apenas MIR, e se vale de anlise direta do sinal de udio para extrao
automtica de contedos sonoros/musicais. Apesar de envolver questes de ordem
perceptiva, o conceito implica que tais informaes se encontram no sinal sonoro sem
a necessidade de aplicao de modelos perceptivos mais complexos (como em
Psicoacstica, que seria de ordem superior em relao a esses).
Fato que quando pensamos nesse tipo de extrao automtica, dois nveis de
descritores (baixo e alto) se distinguem (Amatriain et. al, 2005). Os Descritores de
udio considerados de baixo nvel se relacionam diretamente com o sinal sonoro,
sendo definidos por modelos matemticos sem referncias a uma dimenso perceptiva.
Para evitar confuso, bom ressaltar que o alto nvel, nesse caso, est bem distante
de nveis de percepo superiores psicoacstica. De fato, eles podem se encontrar em
outra rea fronteiria oposta, em uma interseo com atributos psicoacsticos.
Os Descritores de udio ditos de Baixo Nvel so os principais e mais
numerosos, mesmo porque a caracterstica principal dos Descritores de udio se d em
uma relao extremamente direta e objetiva com o sinal sonoro. Muitas vezes, alis,
usa-se diretamente o termo Descritores de Baixo Nvel quando se pretende falar de
Descritores de udio, o que gera uma confuso terminolgica. Nesta pesquisa,
portanto, adotaremos o termo mais generalizado Descritores de udio, para evitar
confuso e no entrar no mrito de ser ou no um descritor de sinal de baixo ou alto
nvel. Em todo caso, e reforando a ressalva da caracterstica implcita de normalmente
no se configurarem como descritores perceptivos, estamos mais interessados nos

10
descritores de ordem superior, que se relacionam com a Psicoacstica.
H estudos detalhados e gerais sobre esses descritores na literatura (Grey 1975,
Iverson & Krumhansl 1993) e aplicaes tecnolgicas como classificao automtica
de gneros musicais (Tzanetakis, Cook 2002) e outras aplicaes criativas que
veremos no prximo captulo. A adoo de descritores de udio faz parte da nossa
realidade cotidiana, como no padro MPEG-7 (Linsday, Burnett, Quackenbush,
Jackson 2003) que define 17 descritores de baixo nvel. O Projeto CUIDADO (Peeters
2003) Content-based Unified Interfaces and Descriptors for Audio/Music Databases
Available Online contou com pesquisadores envolvidos no desenvolvimento do
padro MPEG-7 e estendeu o padro a 72 atributos.
Nesse permetro, ressaltamos casos em que os territrios dos descritores de
udio e atributos Psicoacsticos se sobrepem; Loudness um exemplo claro, pois
corresponde nossa percepo de intensidade sonora e tambm faz parte de um dos
objetos de Pd desenvolvidos nesta pesquisa. O conceito de brilho outro exemplo
similar e, como veremos, um atributo perceptivo da Dissonncia.
Podemos ento refinar e distinguir atributos Psicoacsticos em diferentes
nveis, sendo o mais baixo justamente compreendido pelos atributos que podem ser
considerados como Descritores de udio, ou os que tm sido adotados em MIR.
Acima disso, temos atributos Psicoacsticos por excelncia, como a sensao de
Aspereza (apresentada melhor nas prximas sees) e, acima destes ltimos, temos
atributos perceptivos mais complexos que j dialogam com outras reas da Psicologia
Musical, como notaremos ser o caso da Percepo de Altura Virtual. Retomamos,
ento, o quadro de Emmerson com um maior refinamento, em que separaremos a
Anlise Psicoacstica/Cognitiva em trs instncias, tendo a Psicoacstica uma posio
central.

Tabela 2. Reviso do quadro de Emmerson

Anlise do Outras instncias


Cognio e
Sinal Fsico Psicoacstica Psicologia da Msica
Neurocincia
Nvel Neutro (Descritor de (Psico- (Processamento e Nvel Estsico
(Processos
udio de Baixo fisiolgico) interpretao de
Cerebrais)
Nvel informao)

11
Captulo 2) Conceitos de Dissonncia e Relao com
Atributos Perceptivos.

A origem etimolgica do termo Consonncia do latim consonare (soar


junto), o que implica que h uma fuso, ou uma juno entre uma ou mais
sonoridades4 distintas (e, por outro lado, falta de fuso entre as sonoridades no caso de
Dissonncias). Esse conceito tambm se relaciona fortemente com o de Harmonia que,
por sua vez, descende do grego () e significa juno, unidade, acordo.
comum tambm a descrio desses fenmenos por meio de termos subjetivos como
eufonia, ou a qualidade de ser agradvel. Principalmente esses ltimos termos
carregam em si um alto grau de subjetividade, que contribui para uma definio vaga
dos conceitos.
Apesar de relativamente triviais na vida do msico, Consonncia e Dissonncia
no so fceis de definir em linhas gerais e seus conceitos tm evoludo em paralelo
com a histria da msica de acordo com cada perodo e estilo vigente ao passo que
intervalos e acordes, anteriormente definidos como dissonantes, passaram a ser
consonantes.
Tenney (1988) adota uma viso criteriosa e busca uma anlise distanciada de
juzos de valores, o que o ajuda a investigar diferentes conceitos de dissonncia e a
organiz-los com cuidado. Seu trabalho aponta diversas questes puramente
semnticas e encontra confuso e desacordo entre diferentes conceitos, em que o autor
clarifica, a partir de contextos histricos, sem apenas atribuir a uma questo cultural o
fator essencial da conceitualizao de dissonncia.
O trabalho de Tenney traz uma reviso crtica pormenorizada dos conceitos de
dissonncia, organizados em cinco noes distintas, ou categorias, que visam
enriquecer a linguagem sem gerar conflitos entre si. So elas: Dissonncia Meldica,
Polifnica, Contrapontstica, Funcional e Psicoacstica. A primeira corresponde
dissonncia em um contexto meldico, e o que est em jogo o grau de afinidade entre
alturas5 que soam sucessivamente. A segunda noo, polifnica, diz respeito ao carter
sonoro de dades simultneas (sua fuso, por exemplo) independente de contexto

4
O termo Sonoridade adotado nesta pesquisa se refere a um conceito mais amplo do que apenas tom
musical, o qual se restringe a tons complexos harmnicos, incluindo assim outras formas de configurao sonora.
5
O conceito de Afinidade de Tons o mesmo retratado posteriormente no modelo de Comonalidade de
Altura.

12
musical, diferentemente da terceira noo, contrapontstica, em que o contexto
importante e diz respeito s regras de conduo de vozes. A quarta noo, funcional,
surge com o trabalho terico de Rameau (1722), que d origem ao conceito de
harmonia funcional em msica tonal, em que notas de um acorde com forte relao
harmnica com um baixo fundamental so definidas como consonantes6.
A quinta e ltima noo de dissonncia a psicoacstica e traz implicaes
especiais. A primeira que uma sonoridade em si fora de um contexto meldico e
sem uma justaposio harmnica pode conter atributos perceptivos dissonantes de
acordo com seu contedo espectral7. Dessa surge outra implicao, em que se precisa
considerar o contedo espectral de cada sonoridade envolvida em um acorde ou dade,
alm das relaes intervalares em que se encontram.
Por fim, devido a essas nuances, a sensao de dissonncia se torna suscetvel a
pequenas mudanas de acordo com um nmero maior de variveis espectrais e, por
isso, se qualifica como uma grandeza contnua, enquanto nas noes anteriores a
qualidade de consonante/dissonante acaba sendo mais categrica e fixa.
A noo psicoacstica apresentada por Tenney somente como baseada na
sensao de Aspereza. Assim, teve como principal pilar a teoria de Helmholtz (1877),
que foi o primeiro autor a lidar com esse atributo. A concluso do trabalho de Tenney
ressalta a importncia de buscar correlatos acsticos para diferentes conceitos de
dissonncia, como os que ele conseguiu isolar e definir.
O trabalho de Tenney possui um esforo de reviso da linguagem e abre margem para
uma nova terminologia, busca novas relaes e conexes com termos mais detalhados
de certas qualidades sonoras, relacionadas com caractersticas objetivas fsicas e
estruturais. O autor conclui que, nesse caminho, h indcios de que sempre houve uma
forte relao entre o que os Iluministas chamaram de mundo natural e nossa
percepo, teoria e prtica musicais (Tenney, 1988 p. 103). Essa relao tambm
investigada pela Psicoacstica, que capaz de refinar essas relaes e conexes entre
qualidades sonoras e conceitos dimensionais de dissonncia. A respeito disso,
podemos destacar o trabalho de David Huron (2001), que investiga uma relao entre
as regras de conduo de vozes (a noo de consonncia contrapontstica) e princpios
perceptivos. Huron apresenta ento seis desses princpios e como eles se relacionam de
6
Um modelo de Baixo Fundamental, tambm apresentado e implementado nesta pesquisa, se relaciona
com essa noo de Dissonncia.
7
Como a relao entre os parciais, energia dos parciais e distribuio dos parciais no registro de
frequncias.

13
diferentes maneiras com a teoria e prtica musicais.
Os princpios levantados por Huron (1. Tonalness, 2. Continuidade Temporal,
3. Mnimo Mascaramento, 4. Fuso Tonal, 5. Proximidade de Altura e 6. Comodulao
de Altura) apontam para processos cognitivos, no apenas de ordem psicoacstica, ou
formalmente modelados para serem implementados em ferramentas computacionais.
Em todo caso, esses princpios tambm so exemplos do tipo de trabalho ao qual
Tenney remete como campo futuro de aprimoramento.
Neste texto, traamos um panorama atual de atributos psicoacsticos
relacionados percepo de Dissonncia. O objetivo no levantar diversos possveis
princpios perceptivos, como o trabalho de Huron, mas, sim, revisar o estado da arte e
buscar modelos j formalizados para serem implementados no computador e, assim,
gerar e testar ferramentas criativas.
Dentre os princpios apontados por Huron (2001), pudemos implementar em
nossa pesquisa apenas o modelo de Tonalness, j que este o nico atributo que possui
uma formalizao. No obstante, discutiremos elementos similares, como o de Fuso
Tonal, que um princpio semelhante e algo a ser levado em considerao em
pesquisas futuras. Outros elementos implementados e trazidos neste texto fazem parte
de um quadro de atributos formulado por Terhardt (1984).

14
Captulo 3) Base Sensorial da Dissonncia Musical em
Psicoacstica e Seus Atributos
Partimos da premissa de que a Dissonncia, sob um vis sensorial, no se ope
a uma noo mais geral de Dissonncia Musical. Essa viso est de acordo com a
teoria de Tenney (1988), que no descarta a relao com princpios fsicos e objetivos
de conceitos de dissonncia e conclui, em uma reviso terminolgica, que podemos
expandir essas relaes.
A respeito dos trs mundos de comunicao auditiva apresentados
anteriormente (vide figura 1), a base sensorial da dissonncia musical faz parte do
segundo mundo (das sensaes auditivas). O quadro da tabela 3 traz essa base
sensorial da dissonncia como uma instncia sensorial intermediria entre o mundo da
matria e da informao, que tambm diz respeito ao caminho percorrido entre os
nveis neutro e estsico (Nattiez 1990).

Tabela 3. Base Sensorial da Dissonncia como um mundo de comunicao auditiva

Matria/Tom: Experincia/Sensao de Tom: Informao/Nota: Processamento e


Sinal Fsico Base Sensorial da Dissonncia interpretao de informao

Em nosso trabalho, que revisa a exposio de Emmerson (1982) sobre o


caminho percorrido entre os nveis neutro e estsico, subdividimos essa instncia
sensorial em diferentes nveis (vide tabela 2). Porm, a Base Sensorial da Dissonncia
Musical que apresentamos se restringe ao escopo psicoacstico e seus atributos.
Tenney (1988) define um conceito mais recente de dissonncia, apenas
definida pela Aspereza, que um atributo psicoacstico e, por isso, d o nome de
Dissonncia Psicoacstica a esse conceito. Essa a nica noo trazida por Tenney
que foca em uma Base Sensorial da Dissonncia Musical e denota um enfoque em
psicoacstica. Esta noo est, portanto, perfeitamente alinhada com a Base Sensorial
da Dissonncia Musical que estamos definindo, mas no adotaremos o termo
Dissonncia Psicoacstica nesta tese e incluiremos outros atributos alm da
Aspereza.

15
3.1 Dissonncia Sensorial
Relacionado ao conceito de Dissonncia Psicoacstica apresentado por
Tenney, temos outro termo prprio da Psicoacstica introduzido por Greenwood
(1961), denominado Dissonncia Sensorial. Esse termo possui, igualmente, a
Aspereza como seu principal elemento (Terhardt 2000a) e forma um grupo de atributos
psicoacsticos (Terhardt 1984).
O interesse primrio de pesquisas sob a perspectiva de Dissonncia Sensorial
encontrar explicaes acsticas e fisiolgicas para a dissonncia, em uma abordagem
generalizada e de baixo nvel, passveis de serem aplicadas a qualquer tipo de
sonoridade. Tal nvel de generalidade dificulta sua utilizao em contextos musicais
especficos. Por isso, Terhardt (1984) nos traz um quadro que divide a Base Sensorial
da Dissonncia Musical em dois grupos de atributos psicoacsticos: Dissonncia
Sensorial e Harmonia, sendo que este segundo grupo se atm a um contexto e
princpios estritamente musicais.
Ambos os grupos e seus atributos sero expostos neste captulo aps
introduzirmos e definirmos melhor a Dissonncia Sensorial nas duas subsees a
seguir, que contrapem o conceito de Dissonncia Sensorial Dissonncia Musical e
Sensory Pleasantness.

3.1.1 Dissonncia Sensorial versus Dissonncia Musical


Muitas vezes, quando se fala de Dissonncia Sensorial, apenas a Aspereza est
em jogo, principalmente em textos mais antigos, em que a Aspereza era o nico
atributo psicoacstico considerado para explicar a Dissonncia sob um vis sensorial.
Isso gera alguma confuso, pois resulta em uma relao quase sinonmica entre
Dissonncia Sensorial e Aspereza que, em certa medida, ainda prevalece8. No
obstante, em trabalhos mais recentes, alguns autores incluem outros atributos
psicoacsticos Dissonncia Sensorial. Esse o caso do trabalho de Terhardt (1984),
que define a Dissonncia Sensorial pelos atributos de Brilho, Tonalness e Aspereza e
uma referncia principal desta tese.
O termo Dissonncia Sensorial surgiu na dcada de 1960 para se distinguir
da noo de Dissonncia Musical, claro que sem levar em conta o estudo posterior e
pormenorizado de diferentes conceitos de Dissonncia levantados por Tenney (1988).

8
Lembramos que o texto de Tenney relativamente atual, do final da dcada de 80. Nele, apenas a
Aspereza aparece como elemento da dissonncia dita psicoacstica.

16
Sendo assim, a noo de Dissonncia Musical, da qual a Dissonncia Sensorial se
distingue primeiramente, bem mais generalizada e simplificada.
O problema que sempre se entendeu que a dissonncia como um todo no
poderia ser apenas explicada pela sensao de Aspereza, ou por uma base sensorial.
Eis que surge uma necessidade explcita de distino categrica entre diferentes
conceitos de Dissonncia, at ento desnecessria. Por no dar conta de explicar a
Dissonncia Musical como um todo, a Dissonncia Sensorial cobre apenas uma poro
de sua multidimensionalidade, se reduz a um aspecto cientfico, psicofsico, alheio a
fatores de ordem cultural e esttica, por exemplo, que correspondem a dimenses
complementares
A noo de Dissonncia Sensorial permitiu uma srie de estudos perceptivos
sobre a dissonncia com um vis cientfico e objetivo, o que instaurou uma dicotomia
entre Dissonncia Sensorial e Dissonncia Musical (que inclui um aspecto cultural).
DeWitt e Crowder (1987) mencionam um debate que diz respeito a essa oposio,
definido como racionalistas vs. empiristas, e assim traam um paralelo que vai at a
teoria de nmeros inteiros de Pitgoras, como uma forma racional de teorizar sobre
leis de consonncia, enquanto uma oposio emprica, ainda na Grcia antiga, veio
de Aristxeno, que afirmava que o juiz final era o ouvido (a experincia perceptiva) e
no os nmeros (uma arbitrariedade terica).
Um dualismo dessa ordem acabou por colocar a Dissonncia Sensorial e a
Dissonncia Musical em lados opostos. Porm, a real dicotomia est entre o inato
versus adquirido, uma vez que a Dissonncia Sensorial apenas surge para dar conta de
uma dimenso sensorial da Dissonncia. Em ltima instncia, o objeto de estudo
continua sendo o mesmo: Consonncia/Dissonncia. Desse modo, plausvel
considerar que investigaes em reas diferentes no estejam completamente
desvinculadas, desconexas ou antagnicas. Tanto que Tenney foi capaz de reunir esses
elementos supostamente antagnicos em uma nica exposio.
Outros autores tambm encontram relaes mais estreitas entre Dissonncia
Musical e Dissonncia Sensorial, como (Terhardt 1984; Tramo et al. 2003). Terhardt
afirma que mesmo uma suposta dicotomia entre Dissonncia Sensorial (cientfica) e
Dissonncia Musical (cultural) no exclui o fato que a Dissonncia Sensorial cumpre
um papel importante na percepo de Dissonncia dita Musical (Terhardt 2000a).

17
3.1.2 Dissonncia Sensorial versus Sensory Pleasantness
Consonncia/Dissonncia so conceitos prprios da musica que costumam ser
definidos em Psicoacstica por termos como eufonia e pleasantness (agradabilidade).
Dessa forma, julga-se quo agradvel ou irritante um som qualquer pode ser,
relacionando essa resposta subjetiva a atributos fsicos do som. Nesse contexto,
diversos estudos foram desenvolvidos completamente desconectados de um contexto
musical.
Assim, encontramos pesquisas que avaliam a resposta subjetiva de sons de
mquinas, como aspirador de p, carros e afins. Esse tipo de pesquisa visa, inclusive,
permitir a construo e desenho de equipamentos que produzam barulhos menos
irritantes, o que, a respeito dos trs atributos aqui descritos, significa sons com menos
batimentos (Aspereza), maior harmonicidade (Tonalness) e menor energia no registro
agudo do espectro (Brilho).
No est claro ainda como cada atributo da Dissonncia Sensorial influencia
uma percepo geral de Dissonncia Musical. Terhardt (2000b) afirma que, em
msica, a Aspereza o elemento mais importante da Dissonncia Sensorial e que a
Dissonncia Sensorial cumpre, sem dvida, um papel no julgamento de Dissonncia
em msica, mas que apenas contabiliza uma dimenso de Sensory Pleasantness,
estando longe de determinar princpios de harmonia, por isso a necessidade de incluso
de um segundo grupo de atributos para dar conta desses princpios. Ao que concerne
os atributos da Dissonncia Sensorial, Parncutt (1989) afirma que os dois aspectos
mais importantes da teoria de Terhardt so a Aspereza e o Tonalness, e simplesmente
no menciona o brilho.
Terhardt no apresenta um modelo de Dissonncia Sensorial ou Sensory
Pleasantness bem definido. O autor tampouco afirma qual exato conceito e modelo
de cada atributo deve ser empregado para uma medida de Dissonncia Sensorial.
Zwicker e Fastl (1999), em contrapartida, definem um modelo de Sensory
Pleasantness, que relacionado com os atributos de Aspereza, Brilho e Tonality
(similar a Tonalness). Este modelo poderia ser uma definio completa de Dissonncia
Sensorial, mas o primeiro problema que o trabalho desses autores no define apesar
de incluir modelos prprios de Aspereza e Brilho um modelo claro de Tonality,
informando que a medida simplesmente subjetiva.
Outra questo que o modelo de Brilho, segundo os autores, o atributo que
mais tem destaque na medida final, o que gera uma controvrsia com a afirmao de

18
Terhardt (2000a), ou entende-se que o modelo no diz respeito a sons musicais fato
confirmado por detalhes a seguir.
No final do livro, os autores indicam uma aplicao de parte do contedo
apresentado em acstica musical. No caso, trata-se da percepo de dissonncia, mas o
termo adotado, em vez de Sensory Pleasantness, Consonncia Sensorial (conceito
complementar de Dissonncia Sensorial). Essa definio de Consonncia Sensorial
tambm baseada em Brilho, Aspereza e Tonalness.
Apesar da falta de uma referncia direta, h nessa seo do texto um quadro
anlogo teoria de Terhardt (1984) cujos textos se encontram na bibliografia
daquela publicao que une paralelamente o grupo de atributos psicoacsticos de
Harmonia ao de Consonncia Sensorial. O termo Consonncia Sensorial parece ento
estar levemente desconexo de Sensory Pleasantness.
Outro termo que ainda figura no texto dessa seo Tonal Consonance, sem,
igualmente, ser definido claramente ou comparado com os dois outros termos. No
obstante, levando em considerao o trabalho de Plomp & Levelt (1965), a
Consonncia Tonal pode indicar um sinnimo de Consonncia/Dissonncia Sensorial.
O livro de Zwicker e Fastl (1999) no possui um interesse inicial em aplicao
musical, tanto que a implicao em acstica musical aparece apenas no fim como um
possvel desdobramento. A exposio de um quadro com os mesmos atributos de
Terhardt no inclui um modelo contabilizando como cada fator contribui para a
percepo geral de Dissonncia em um contexto musical e no remete diretamente ao
modelo previamente apresentado de Sensory Pleasantness, confirmando que no se
trata de um sinnimo direto de Dissonncia Sensorial.
Encontramos tambm uma relao entre o modelo de Sensory Pleasantness
apresentado por Zwicker e Fastl (1999) e uma publicao de Aures (1985a), que
apresenta um modelo anlogo composto pelos atributos de Brilho, Tonalness e
Aspereza, mas o termo usado, em vez de Sensory Pleasantness, Eufonia Sensorial.
Como ambos termos subjetivos de Eufonia e Pleasantness (Agradabilidade) so
adotados para descrever a sensao de percepo de consonncia, fica claro que os
modelos de Sensory Pleasantness/Euphony so equivalentes, fora o fato de ambos
modelos serem muito similares.
Por fim, torna-se evidente que Sensory Pleasantness/Euphony no dizem
respeito a uma aplicao musical e por isso no se adota o termo
Consonncia/Dissonncia Sensorial. Esse, por sua vez, apesar de conter os mesmos

19
elementos, no possui um modelo bem definido j apresentado na literatura da rea, e
acaba pressupondo um contexto musical mesmo sendo passvel de ser medido em
qualquer tipo de som.

3.2 Quadro de Atributos de Ernst Terhardt


Como j exposto, a Dissonncia Sensorial surgiu tendo a Aspereza como
elemento principal. Terhardt (1984), entretanto, inclui outros atributos nesse grupo.
Mas, no sentido de expandir e incluir novos fatores, Terhardt expe tambm um
segundo grupo chamado Harmonia. O trabalho desse autor influenciou alguns outros
como Parncutt (1989) e uma importante referncia desta pesquisa pelo quadro amplo
de atributos psicoacsticos que expe.

Tabela 4. Atributos Perceptivos da Dissonncia Musical segundo Terhardt (1984).

Dissonncia Sensorial: Harmonia:


- Brilho (Sharpness) - Fundamental do Acorde
- Aspereza (Roughness) - Afinidade de Tons:
- Tonalness Comonalidade de Altura

Um ponto importante de distino entre a Dissonncia Sensorial e o grupo


Harmonia que a Dissonncia Sensorial pode ser avaliada e estudada em qualquer
sonoridade, sem a necessidade de um contexto dito musical. J os atributos do grupo
Harmonia acabam sendo os atributos sensoriais da Dissonncia Musical
propriamente dita isto , dependem de sons musicais, aplicados em um contexto
musical de Harmonia, como entendido pelo conceito tradicional.
O que o grupo de atributos da Harmonia representa, antes de mais nada, uma
abordagem sensorial para explicar conceitos musicais da prpria Harmonia tradicional,
ligados ao conceito de Consonncia e Dissonncia, como na relao com a
fundamental do acorde na teoria de Rameau (1722) e relaes de similaridade entre
notas e acordes.
No decorrer da pesquisa, nos deparamos com muitos trabalhos e modelos
dedicados a atributos especficos, como a Aspereza e Tonalness, em que possvel
encontrar algumas controvrsias entre diferentes modelos. Em contrapartida, no
temos uma completa implementao de um modelo de Dissonncia Musical com todos
os atributos baseados no trabalho de Terhardt (nem mesmo com outro conjunto de
atributos), j que Terhardt no deixa explcito como cada atributo contribui ou deve ser

20
contabilizado para a percepo ou medida final de Dissonncia. Terhardt apenas possui
trabalhos a respeito de alguns atributos, em especial do seu conceito de Virtual Pitch
(Altura Virtual). Assim, o quadro de Terhardt um bom ponto de partida, mas ainda
est relativamente em aberto.
Encontramos tambm alguns elementos que devem ser levados em
considerao e que no fazem parte do seu quadro, mas esto fortemente relacionados,
como o conceito de Fuso Tonal. Abrimos margem tambm para alguns elementos
fora da literatura clssica da Psicoacstica, mas que podem ser igualmente testados de
modo emprico em aplicaes criativas. Na prxima seo, esmiuaremos os atributos
aqui apresentados, e tambm apontaremos esses elementos paralelos.

Tabela 5. Subdiviso dos atributos Psicoacsticos em diferentes nveis de percepo.

Atributo: Nvel Sensorial:


Interseo entre Descritor de udio
Brilho (Sharpness)
de alto nvel e Psicoacstica
Aspereza (Roughness) Psicoacstico
Interseo de Psicoacstica com
Tonalness & Harmonia
elementos Psicolgicos (Gestalt)

Sobre a classificao do quadro de Terhardt em diferentes nveis perceptivos,


podemos comear pelo conjunto de Descritores de udio, que est em um nvel mais
baixo. Sharpness (Brilho) se encontra aqui, pois , inclusive, um dos atributos
classificados no projeto CUIDADO (Peeters 2004). J a Aspereza um atributo de
nvel mais alto, com uma dimenso de complexidade maior em sua modelagem, e
ainda controverso teoricamente. Os elementos seguintes dependem da teoria de Altura
Virtual de Terhardt, de uma ordem ainda superior, compreendida como parte de um
processo de aprendizado, produto de uma Gestalt auditiva (Terhardt 1974a), inerente a
um processo essencial para adquirir a habilidade de identificar sons da fala.

21
Captulo 4) Descrio dos Atributos Psicoacsticos

Vimos no captulo anterior a necessidade de uma reviso terminolgica para


evitar confuso entre termos como Sensory Pleasantness e Dissonncia Sensorial.
comum encontrarmos disparidades e incongruncias terminolgicas dessa ordem em
Psicoacstica. Um dos motivos que sempre estamos lidando, em parte, com alguma
definio de ordem subjetiva. Neste captulo, expomos em mais detalhes a origem e
desenvolvimento do conceito por trs de cada atributo no quadro de Terhardt (1984)
com o objetivo de evitar confuses conceituais, mas tambm para dar conta de uma
reviso terminolgica. Retratamos como os conceitos podem evoluir com o tempo e
serem adotados para fins ligeiramente distintos, ou ainda serem reelaborados. Dessa
forma, um cuidado especial foi dado a essas questes, antes de buscar modelos
psicoacsticos para uma implementao computacional.

4.1 Grupo de Dissonncia Sensorial


Esta subseo traz os atributos da Dissonncia Sensorial, conforme definida
por Terhardt (1984), dependente de trs atributos perceptivos: Brilho, Aspereza e
Tonalness. J apresentamos uma definio de Dissonncia Sensorial, mas veremos
ainda mais detalhes no desenvolvimento do conceito de Dissonncia Sensorial na
descrio do atributo de Aspereza.

4.1.1 Brilho
O Brilho um atributo perceptivo que se liga diretamente com a quantidade de
energia espectral no registro agudo. Em ingls, o termo Brilho pode aparecer como
Sharpness. Dentre as diversas inclinaes, um dos possveis significados de sharp
agudo. Por isso, em msica, o termo sharp corresponde a sustenido e indica uma
alterao do tom para o agudo.
Em compensao, em portugus, o termo brilho no remete diretamente a uma
traduo de sharpness. Fato que, alm de sharpness, esse conceito pode aparecer
como Brightness ou Density, fortemente relacionados com sharpness, ou at mesmo
equivalentes (Boring & Stevens 1936), sendo que Brightness est mais diretamente
ligado com a traduo para o portugus de Brilho. Na falta de outro termo em
portugus, adotamos o Brilho, mas estamos o definindo claramente em relao ao

22
conceito de Sharpness.
Mas Sharpness tambm remete ao conceito de agudo no sentido de afiado,
pontiagudo, do latim acum, que o nome da grandeza que mede o Brilho de um
som. Em ingls, usa-se o termo dull como antagnico de agudo para designar um som
sem Brilho. Portanto, assim como Consonncia e Dissonncia, temos o dull e sharp.
Terhardt (1984) adota o termo Sharpness, mas no deixa explcito um modelo
ou definio especfica desse atributo. Usando como referncia o trabalho de Zwicker
e Fastl (1999), adotamos o modelo e conceito desses autores.
Normalmente, os modelos de Brilho baseiam-se em dados como o centroide
espectral, que um ponto mdio de medidas de energia do espectro (no domnio das
frequncias). O Brilho chega a ser uma sensao diretamente correspondente medida
de centroide, da mesma maneira que uma relao direta possvel entre frequncia e
sensao de Altura (pelo menos para um tom puro). A relao similar de Brilho com a
percepo de grave e agudo de alturas o coloca como uma espcie de dimenso de
Altura para timbre (Cabrera 1999), onde uma nota musical de um timbre pode ser mais
aguda do que outra nota igual de outro timbre, por possuir mais brilho.
A relao direta de brilho com uma medida simples de energia espectral o torna
um modelo relativamente simples. Por isso, esse atributo comumente faz parte do
conjunto de Descritores de udio.

4.1.2 Aspereza
A Aspereza a principal explicao cientfica para a dissonncia. Antes de sua
formulao, prevaleceu por sculos a noo de Pitgoras, que relaciona consonncia
com intervalos formados por propores de nmeros inteiros pequenos. somente
com Helmholtz (1877) que temos uma reavaliao das observaes de Pitgoras junto
com um estudo aprofundado das propriedades fsicas do som e suas relaes com as
sensaes auditivas. O autor responsvel por uma teoria conhecida como Teoria de
Batimentos, que inclui a Aspereza.
Helmholtz (1877) explicou a sensao de Dissonncia pelo no alinhamento de
parciais, o que promove batimentos. Assim, dois tons simultneos so dissonantes caso
seus parciais no se alinhem. Parciais no alinhados e muito prximos geram a
sensao de Batimentos, em que percebemos claramente um tremolo (flutuao na
sensao de intensidade sonora). Essa flutuao ocorre em uma taxa que a mesma da
diferena em Hertz dos dois parciais promovendo os batimentos. Por exemplo, a taxa

23
de flutuao entre uma frequncia de 440 Hz e 442 Hz ser de 2 Hz, ou dois ciclos de
flutuao por segundo.
Helmholtz cunhou e inseriu na literatura psicoacstica o termo Roughness para a
sensao promovida por batimentos rpidos, que surgem aps uma taxa de 20 Hz. O
termo traduzido para o portugus como Aspereza (mas alguns autores tambm usam
Rugosidade, j que em francs o termo Rugosit). Em todo caso, sejam as
flutuaes em taxas lentas ou rpidas, o correlato acstico dos Batimentos ou Aspereza
o mesmo: a Flutuao de Amplitude (Vassilakis 2001), ou ainda a Modulao de
Amplitude.
A questo que, a partir de uma taxa de 20 Hz, o ouvido humano no percebe
mais os batimentos como uma variao na intensidade sonora, mas ainda clara a
sensao de interferncia causada pela Flutuaes rpidas, e inclusive percebemos
novas sensaes de Alturas, ditas virtuais na terminologia de Terhardt (2000b).
Os termos Aspereza e Rugosidade denotam essa percepo de irregularidades no
som, em uma analogia sensao ttil. Essa analogia chega a ser muito pertinente,
pois no ouvido interno (mais especificamente dentro da cclea) temos uma membrana
que recebe a presso mecnica (ou seja, de forma literalmente ttil) e a transfere para
clulas nervosas. O percepto contrrio da Aspereza (e, por extenso, dos batimentos)
foi designado por Smoothness, ou Suavidade em portugus e explica-se pelo
alinhamento de parciais, ou pelo espaamento de parciais acima de uma taxa que
promova a sensao de Batimentos ou Aspereza taxa esta que Helmholtz acreditava
ser fixa, mas cuja premissa foi revisada posteriormente por Plomp e Levelt (1965).
H uma relao possvel entre a teoria de Helmholtz e Pitgoras, uma vez que h
um grande alinhamento dos parciais de dois tons simultneos (complexos e
harmnicos) em relaes de nmeros inteiros pequenos e tambm porque o
espaamento dos parciais nesse caso no prximo o suficiente para gerar Aspereza.
Logo, intervalos como o da oitava (2:1) e quinta justa (3:2) so suaves, enquanto
intervalos como a segunda maior (9:8) e stima maior (15:8) so speros.
Porm, apesar de a teoria de nmeros inteiros pequenos encontrar uma
explicao na Aspereza ou Dissonncia Sensorial, o fato que vale somente para sons
complexos que possuem uma Srie Harmnica, o que o caso da maioria dos
instrumentos musicais. Portanto, essa relao falaciosa, j que trata-se apenas de uma
coincidncia aplicvel no caso de tons harmnicos. Alis, por causa da Aspereza,
possvel que uma relao de nmeros inteiros simples como a da oitava soe mais

24
dissonante, caso os tons sejam inarmnicos, como exemplifica Sethares (1999). De
fato, a teoria de nmeros inteiros simples est mais diretamente ligada a outros fatores
perceptivos, como o Tonalness, Afinidade de Tons e Fuso Tonal.
Apesar de contemplar uma objetividade na busca de correlatos fsicos, a
sensao de Suavidade e Aspereza ainda descrita em termos de quo agradvel ou
incmodo (pleasant, unpleasant) um som a um ouvinte (Terhardt 1984). Esses
termos so os mesmos usados para definir a Dissonncia Sensorial como um todo
aqui temos mais uma confuso, que liga diretamente o conceito de Aspereza com a
Dissonncia Sensorial.
bom reforar como os termos agradvel ou incmodo so empregados em
pesquisas da escuta humana completamente fora de um contexto musical, mas para
aferir uma resposta sensitiva de um atributo como a Aspereza. Inclusive, a Aspereza
considerada como um atributo auditivo fundamental, junto com a sensao de Altura e
Intensidade Sonora (Terhardt 2000b). Tambm se pode afirmar que, mesmo sendo
subjetiva, a ideia de agradvel, ou incmodo se refere diretamente relao
objetiva entre a Aspereza e sua sensao, tal como a frequncia o correlato da
sensao de Altura dada por termos de grave e agudo.
Mesmo na definio da Aspereza por Helmholtz (1877) e seu papel na percepo
de Dissonncia Sensorial h uma preocupao em evitar algum mal entendido,
separando o conceito objetivo da Dissonncia Sensorial de um conceito cultural de
Dissonncia. Segue uma traduo desta definio:
A combinao [de tons] percebida como mais spera ou suave que outra
depende apenas da estrutura anatmica do ouvido (...). Mas a que grau de
Aspereza um ouvinte est inclinado (...) como meio para expresso
musical depende do gosto e hbito; por isso a fronteira entre consonncia
e dissonncia tem mudado frequentemente (...) e ainda mudar adiante
(Helmholtz 1877: 234-235).9

Como Helmholtz apenas foca na sensao de Aspereza, ela se destaca e mantm-se


como o nico elemento da Dissonncia Sensorial. Aps Helmholtz, temos inmeros
trabalhos sobre Dissonncia Sensorial e Aspereza, mas apenas no trabalho seminal
de testes psicoacsticos de Plomp e Levelt (1965) e Kameoka e Kuriyagawa (1969a,
1969b) que temos no s uma reviso da teoria de Helmholtz, como tambm um
estudo sistemtico da percepo de ouvintes em laboratrio.

9
Todas as tradues desta tese so prprias do autor.

25
Plomp e Levelt (1965) adotaram o termo Consonncia Tonal para diferenci-la
da Dissonncia Musical. Assim, definiram um conceito de Dissonncia Psicoacstica
que sinnimo de Dissonncia Sensorial. Veja figura abaixo, com o resultado da
mdia de seus testes. Os dados desta pesquisa ainda so a base principal de toda uma
classe de modelos de Aspereza. Uma importante contribuio desses autores est em
relacionar as taxas da sensao de Aspereza com a Banda Crtica, contrariando as
afirmaes de Helmholtz, que definia a mxima sensao de Aspereza em uma taxa
fixa em torno de 35 Hz. Veja a figura 2.

Figura 2 - Dados de Plomp e Levelt (1965)

Plomp e Levelt verificaram que a sensao de Aspereza ocorre apenas em


parciais que estejam em uma mesma Banda Crtica. Logo, para parciais distribudos
em intervalos maiores que uma Banda Crtica, no h sensao de Aspereza. J a
sensao mxima de Aspereza se d em um intervalo que corresponde a um quarto da
Banda Crtica. Na figura 2, o eixo vertical a Consonncia (de baixo pra cima) ou
Dissonncia Sensorial (de cima para baixo), j o eixo horizontal representa uma escala
de Bandas Crticas. Uma tabela de valores das Bandas Crticas apresentada na
descrio do modelo de Brilho.
Alm do legado de Plomp e Levelt, estudos baseados em Modulao de
Amplitude confirmaram seus resultados e produziram detalhes adicionais (Leman
2000). No captulo 5, trataremos de mais detalhes sobre a modelagem de Aspereza e
retomaremos essa apresentao de diferentes fontes de dados e modelos.

26
4.1.3 Tonalness (Clareza de Percepo de Altura)
Tonalness uma medida da Clareza de Percepo de Altura. Quanto maior o
Tonalness de um som qualquer, mais clara se tem a sensao de uma altura. Tons ditos
musicais (ou seja, gerados por instrumentos musicais convencionais) possuem uma
clara percepo de Altura e so formados por tons complexos e harmnicos. A ideia de
evocar uma clara sensao de Altura significa que uma nica Altura percebida. Mais
detalhes sobre esse processo perceptivo dependem do conceito de Altura Virtual que
ser apresentado na prxima subseo.
Uma maior consonncia depende de um alto Tonalness e se relaciona, ento,
com uma facilidade do sistema auditivo em definir uma altura, enquanto mais de uma
altura gera uma complexidade que diminui essa dimenso de consonncia, ou a
incapacidade de encontrar uma sensao de altura diminui a sensao de Tonalness, e
isso promove uma dissonncia (Elrich 1997).
Huron (2001) afirma que sonoridades que possuem um alto Tonalness so tons
complexos harmnicos (ou seja, tons musicais). A relao entre Tonalness e tons
musicais grande. Inclusive, a etimologia da palavra Tonalness vem da acepo Tonal
em msica e indica justamente a percepo de um tom musical, uma nota musical, que
possui uma percepo de altura clara de acordo com uma frequncia de vibrao.
Nesta tese, portanto, definimos que um som complexo harmnico possui uma
qualidade tonal. H, assim, uma relao com o conceito de Tonalness quando nos
referimos a uma qualidade tonal de um som.
Quanto questo terminolgica, Huron (1999) prefere adotar o termo
Toneness, por achar tone (de tom) menos ambguo e para evitar a relao com a
implicao do termo Tonal em teoria musical (como Msica Tonal). Mas, ao se ater
ao termo tone, ele ainda remete diretamente a tons musicais.
Huron menciona como autores da Psicoacstica tambm adotaram o termo
Tonality para se referir Clareza de Percepo de Altura (ou seja, Tonalness). Um
exemplo da adoo de Tonality est no trabalho de Zwicker e Fastl (1999),
mencionado anteriormente no que diz respeito ao Modelo de Sensory Pleasantness.
Em compensao, a adoo de um novo termo por Huron apenas inclui mais uma
forma de se referir ao conceito, o que pode gerar ainda mais impreciso.
Fingerhuth (2009) nos traz uma boa reviso sobre a terminologia de Tonalness, e
sua pesquisa no diz respeito a sons musicais ou msica em geral. Este autor afirma
que Tonalness e Tonality podem se referir ao mesmo conceito de Clareza de Percepo

27
de Altura, porm tambm j foram definidos, modelados e adotados de modo distinto.
O autor explica como algumas dessas discrepncias surgem principalmente em
um processo de traduo de e para o alemo. Sobre as discrepncias de definio, uma
se volta mais para aplicaes no musicais, como o trabalho de Hugo e Fastl (1999) e
de Aures (1985a), adotado por Fingerhuth (2009). Uma conceitualizao e aplicao
em msica dada por Terhardt, baseada na sua teoria de Altura Virtual (1982).
Terhardt adota o termo ingls Tonalness, mas o original em alemo (seu idioma
materno) Klanghaftigkeit, um termo que direciona para o som (klang), ou sonoridade
em si, em vez de um tom. Parncutt adota o trabalho de Terhardt como base, mas
traduz em um de seus trabalhos o termo Klanghaftigkeit como Sonorousness, que est
etimologicamente mais ligado ao termo original em alemo, mas acaba, novamente,
incluindo mais uma informao e possvel incongruncia.
Como no h uma traduo para esse termo no portugus, preferimos no gerar
ainda mais rudo e confuso. Portanto, nos baseamos no conceito original de Terhardt
(Klanghaftigkeit), mas adotamos o termo Psicoacstico que mais comum na
literatura; o Tonalness. Talvez a melhor forma de se referir a esse atributo em
portugus seja pela sua prpria definio: Clareza de Percepo de Altura.
O conceito de Altura Virtual um elemento chave em Tonalness, mas tambm
um elemento principal na elaborao dos atributos do grupo de Harmonia. A seguir,
apresentamos uma melhor definio do conceito de Altura Virtual e expomos sua
relao com o conceito de Tonalness.

4.1.3.1 Altura Virtual (Virtual Pitch)


O conceito de Altura Virtual est intimamente ligado teoria de percepo de
altura por si mesma, mais especificamente ao fenmeno em que a percepo de tons
complexos pode evocar uma nica sensao de Altura, ou ainda mais de uma. A
clareza de Percepo de Altura (Tonalness) uma medida que indica a facilidade, ou
clareza, de percebermos nitidamente apenas uma Altura, quando se trata de um som
complexo.
Helmholtz (1863) tambm demonstrou como tons musicais podem evocar mais
do que uma nica percepo de Altura, ou seja, como possvel perceber no s a
frequncia fundamental de um tom complexo harmnico, mas tambm a salincia de
alguns dos prprios harmnicos. Helmholtz sugere que escalas musicais se
desenvolveram a partir da noo de alturas diferentes possurem percepes de Alturas

28
em comum conceito que Terhardt denomina de Afinidade de Tons e Comonalidade
de Altura.
Helmholtz enfatizou que sua teoria sobre a percepo de harmonia era
especulativa, diferentemente da Aspereza. Nessa afirmao, o autor implica que suas
hipteses poderiam no ser verificadas em observaes experimentais. Mas, no
decorrer do tempo, Terhardt desenvolve seus estudos que revisam a ideia de Helmholtz
e apresenta um complemento teoria se baseando nesse fato mais passvel de ser
observado e estudado: a Altura Virtual (Terhardt 1974).
Sobre a definio de Altura, a ANSI10 de terminologia psicoacstica estabelece
que a Altura o atributo auditivo do som, de acordo com o qual sons podem ser
ordenados em uma escala do grave ao agudo. Terhardt completa, afirmando que um
som pode evocar mais de uma nica altura, desde que no seja um tom senoidal.
Terhardt separa a percepo de altura de um tom senoidal da percepo de altura
de um tom complexo, denominados, respectivamente, Spectral Pitch (Altura Espectral)
e Virtual Pitch (Altura Virtual). Para tons complexos harmnicos, uma sensao de
Altura Virtual mais proeminente corresponde fundamental do tom e compreendida
como a Altura desse tom.
Segundo Terhardt (1974a), a percepo de Altura Virtual ocasionada pelo
sistema auditivo ser sensvel periodicidade. Tons puros com uma relao harmnica
entre si possuem uma periodicidade igual ao primeiro termo de sua srie harmnica, ou
fundamental. Na figura 3, temos uma srie com trs tons puros, que correspondem aos
trs primeiros termos da srie harmnica (f0, 2f0, 3f0). A soma desses trs tons puros
possui a mesma periodicidade que a do primeiro termo.
Todavia, em uma relao harmnica entre termos que no incluem a
fundamental (como 3, 5 e 8), a periodicidade tambm corresponde ao primeiro termo
da srie, pois ele o mximo divisor comum (MDC). Por exemplo, a soma de dois
tons senoidais com valores de 300 Hz e 500 Hz (ou seja, na relao harmnica entre 3
e 5) forma uma onda sonora resultante peridica em 100 Hz, seu MDC. Tambm
ilustramos uma relao dessa ordem na figura 4, que traz a soma de tons senoidais na
relao harmnica de [3:5:8].

10
Vide <http://pt.wikipedia.org/wiki/American_National_Standards_Institute>.

29
Figura 3 uma superposio de 3 tons puros em relao harmnica [1:2:3]
e a onda sonora resultante da interferncia entre eles.

Figura 4 uma superposio de 3 tons puros em relao harmnica [3:5:8]


e a onda sonora resultante da interferncia entre eles.

O MDC entre componentes espectrais harmnicos sempre corresponde a uma


fundamental, ou a um primeiro termo de uma Srie Harmnica, que comporta esses
componentes espectrais como seus harmnicos. Por exemplo, 1.200 Hz e 2.000 Hz tm
como Mximo Divisor Comum 400 Hz. A frequncia de 400 Hz representa o primeiro
termo dessa Srie Harmnica, enquanto 1.200 Hz e 2.000 Hz so, respectivamente, o

30
3 e 5 harmnicos (1.200 400 = 3 e 2.000 4 = 5).
Nesse caso, o MDC corresponde periodicidade da soma dos tons e pode ser
considerado uma espcie de subarmnico, ou seja um componente espectral mais
grave que faz parte da srie (sendo a fundamental, inclusive), que est ausente. Mesmo
no estando presente, esse subarmnico representa a percepo de Altura. Esse
fenmeno faz parte do conceito de Altura Virtual e conhecido como Fundamental
Ausente.
O conceito de Fundamental Ausente de Terhardt (1974) uma reviso do
conceito de Residue Pitch (Altura Residual) de Schouten (1940), que expe o
fenmeno de um tom complexo harmnico cuja fundamental est ausente, evocando
uma altura que corresponde, mesmo que precariamente, altura dessa fundamental. A
percepo de altura de um tom complexo, no conceito de Altura Virtual, no depende
apenas do contedo espectral, mas de mecanismos cognitivos de ordem superior e
sensveis periodicidade.
Em linhas gerais, o conceito de Altura Virtual estabelece que, quando o
componente espectral correspondente ao primeiro termo da Srie Harmnica no est
presente no tom complexo, o sistema auditivo, por ser sensvel periodicidade, ainda
tem como identific-lo como fundamental e gerar a percepo de altura que
corresponde a esse subarmnico. Quanto menores forem os termos, mais sensvel o
sistema auditivo para a periodicidade. Por exemplo, uma relao de [2:3:4] gera uma
percepo mais clara de altura que corresponde a uma Fundamental Ausente do que
uma relao de [3:5:8]
Terhardt afirma que esse mecanismo um fato cientfico que pode ser
comprovado em uma simples conversa de telefone, pois a transmisso deste aparelho
corta a fundamental da fala humana masculina11 e, mesmo assim, mantemos uma
mesma percepo de altura. Segundo o autor12:

Na vida real, a percepo de Altura Virtual est longe de ser um fenmeno


raro e extico, ou ainda um tipo de iluso. Pelo contrrio, a percepo de
Altura Virtual mais uma regra do que uma exceo (...) qualquer tipo de
som, no importa como foi criado, estimular o mecanismo auditivo de Altura
Virtual a procurar um Subarmnico que corresponda a uma possvel altura
fundamental (...) periodicidade uma forte pista para um objeto sonoro (...)
assim que a teoria de Altura Virtual d conta da determinao de altura e

11
Pelo menos assim o fazia em sistemas telefnicos mais antigos, da poca de publicao dos trabalhos de
Terhardt.
12
Texto original disponvel em <http://www.mmk.ei.tum.de/persons/ter/top/virtualp.hthml>.

31
segregao de objetos sonoros. (...) Altura Virtual um rtulo que caracteriza
um certo tipo de objeto sonoro, os chamados peridicos, incluindo supostos
peridicos (supostamente peridicos). Segregao e identificao de objetos
sonoros naturalmente uma das funes fundamentais de qualquer rgo da
escuta (Terhardt 2000e).

Esse trecho do texto informa que a periodicidade uma importante pista na segregao
e identificao de objetos sonoros, sendo esse um papel essencial e primrio do
sistema auditivo. Desse modo, tons complexos e harmnicos se fundem em uma nica
imagem, e tons inarmnicos geram uma percepo de mais de uma altura, ou uma
imagem difusa.
Terhardt (1974) conecta o conceito de Virtual Pitch ao da Totalidade da
Psicologia Gestaltiana, que depende de um processo de aprendizado prvio (Lei
Gestaltiana da Experincia Passada). O aprendizado prvio do modelo de componentes
espectrais harmnicos como um conjunto nico, segundo Terhardt, explica-se por ser
essencial na habilidade de identificar sons da fala, formada por relaes harmnicas.
Segundo Terhardt:

Por diversas dcadas, a altura tem sido subestimada; primeiramente no que tange sua
importncia em comunicao auditiva; e, (em segundo lugar), no que diz respeito s
dificuldades em compreender sua percepo. No que concerne comunicao
auditiva, foi claramente compreendido que, em msica, a altura a mais importante
portadora de informao. Entretanto, pouca ateno foi dada possibilidade de que
tambm na vida ordinria, ou seja, em comunicao pela fala, e em anlise auditiva
e reconhecimento de uma imensa variedade de sons impingindo sobre nossos ouvidos
na vida cotidiana, a altura pudesse ser um elemento chave (Terhardt 2000f).

Figura 5 - Princpio da Boa Continuidade. Percebemos um quadrado


e a palavra ALTURA mesmo com seus contornos incompletos.

Terhardt afirma que esse mecanismo cognitivo de integrar tons puros em uma
percepo de uma altura (mesmo quando a fundamental ausente) corresponde ao
modo em que contornos implcitos (lei Gestaltiana da Boa Continuidade) podem ser
constatados na viso. Dessa maneira, um conjunto de componentes espectrais

32
harmnicos evoca a percepo de uma altura fundamental que, mesmo ausente, pode
ser completada no processo de percepo.
A percepo de Altura Virtual, ligada ao conceito de periodicidade como
elemento chave na segregao e identificao de diferentes objetos musicais, implica
que podemos agreg-los tambm em relaes harmnicas, ou seja, relaes de
nmeros inteiros e consonantes. Desse modo, por exemplo, uma dade com intervalo
de oitava pode reforar uma mesma Altura Virtual. Por isso a Altura Virtual no
apenas um elemento chave para o atributo de Tonalness, mas tambm para os atributos
do grupo de Harmonia, dados a seguir.

4.2 Grupo de Harmonia

Enquanto a Dissonncia sensorial trata de atributos sonoros que se aplicam a


qualquer som, o estudo perceptivo da Dissonncia Musical inclui contextos mais
pertinentes e prprios da teoria musical. Em msica, a dissonncia trata,
principalmente, de relaes entre dois tons musicais. Tendo como base o estudo de
Tenney (1988), quatro conceitos de dissonncia levam em considerao esse tipo de
relao entre sonoridades (sendo implcita uma relao direta com tons musicais),
enquanto o quinto conceito justamente o da Dissonncia Sensorial, passvel de ser
aplicado a qualquer som de um modo generalizado (o que permite uma noo mais
ampla de sonoridade).
Entre os quatro conceitos anteriores de dissonncia, trs deles dizem respeito
superposio de sonoridades, o que, em msica, se refere ao estudo da Harmonia.
Logo, a prtica de Harmonia est intimamente ligada a conceitos de Consonncia e
Dissonncia. O estudo da harmonia sob um enfoque perceptivo tambm comea com
Helmholtz (1863), que a define como estudo das relaes entre tons. Parncutt (1989)
prefere adotar o conceito mais amplo de sonoridade, que bem mais pertinente em
uma abordagem psicoacstica.
Essa definio de Harmonia Sensorial mantm uma forte relao com a
teoria musical de harmonia. O conjunto de fenmenos que corresponde ao que
Helmholtz descreveu como relaes entre tons musicais pode ser explicado, segundo
Terhardt (2000c), por dois conceitos: Fundamental do Acorde e Afinidade de Tons:
Comonalidade de Altura, que veremos nesta seo.
Esses conceitos tambm se relacionam com os conceitos de dissonncia

33
apontados por Tenney (1988). Mesmo o primeiro conceito apontado por Tenney, de
dissonncia meldica, se baseia na questo de relao de semelhana entre tons
sucessivos. Apesar de ser um primeiro conceito de dissonncia que surge
anteriormente era polifnica, uma relao consonante se d por Afinidade de Tons
(conceito anlogo Comonalidade de Altura). Tenney tambm afirma que o conceito
de Dissonncia Meldica permaneceu e foi incorporado em outros princpios
harmnicos, como a progresso de acordes segundo uma relao dos baixos
fundamentais na teoria de Rameau (1722).
Com essa perspectiva, e deixando de lado o conceito de Dissonncia Sensorial,
demonstraremos no texto como possvel relacionar todos os outros conceitos
levantados por Tenney com os atributos do grupo de Harmonia de Terhardt, apesar de
serem apenas dois. Ambos esto tambm intimamente ligados percepo de Altura,
em especial ao conceito de Altura Virtual.
O modelo de Comonalidade de Altura de Parncutt tem um objetivo final de
medir a Comonalidade de Altura, mas como inclui um modelo de Altura Virtual como
dado essencial, gera subprodutos como um modelo de Tonalness e Fundamental do
Acorde. Apresentamos aqui o conceito desses dois atributos e, no prximo captulo,
uma descrio geral do modelo dado por Parncutt.

4.2.1 Fundamental do Acorde

A teoria de Fundamental do Acorde surge com o trabalho do compositor e


terico Jean-Philippe Rameau (1722). O autor foi o primeiro a explicitamente tratar a
fundamental de acordes (basse fondamentale) como um percepto auditivo. Um
desdobramento da teoria de Rameau o conceito de inverso de acordes, em que a
fundamental do acorde pode no corresponder nota mais grave. Por exemplo, Sol 4,
D 5 e Mi 5 uma primeira inverso da trade D Mi Sol.
Terhardt (1974) relaciona o conceito de Rameau sua teoria de Altura Virtual,
que pode ser usada como uma ferramenta para encontrar a fundamental de qualquer
tipo de som musical. Isso implica que Terhardt v em Rameau no apenas um modelo
terico, mas uma teoria com fundamento em uma sensao auditiva.
Vimos que a Altura Virtual est intimamente ligada com uma medida de
Tonalness, que, por sua vez, tambm diz respeito a uma fundamental. Porm, nesse
sentido, a fundamental diz respeito ao primeiro termo de uma Srie Harmnica. De

34
modo similar, a relao de dois ou mais tons pode ser encarada como uma relao
harmnica, em que um desses tons pode possuir a qualidade de ser a fundamental do
Acorde.
Por esse motivo, a medida de Tonalness e o modelo de Fundamental do Acorde
possuem uma relao muito forte. Enquanto o modelo de Tonalness nos d um valor
que contabiliza a Clareza de Percepo de Altura, o modelo da Fundamental do
Acorde nos aponta qual o tom fundamental. A relao de proeminncia, ou
prevalncia desse tom como fundamental depende da medida de Tonalness.
No caso de medidas de Dissonncia Sensorial, tanto um tom como uma dade.
ou acorde recebem um valor de estimativa de acordo com cada atributo (Brilho,
Aspereza e Tonalness). J para o atributo de Fundamental do Acorde, para fazer
sentido, preciso que o som analisado seja de uma dade, ou acorde.
No caso de um tom complexo, o modelo afere a fundamental do tom complexo.
Todavia, esse princpio pode ser bem interessante se analisarmos tons com
fundamental ausente, ou tambm sons inarmnicos. Mas esse tipo de explorao no
tem sido levada em considerao, mesmo porque essa teoria mal tem sido aplicada na
prtica musical. Nossa pesquisa busca esse desdobramento dos conceitos e modelos
psicoacsticos, de modo que apresentamos exemplos dessa ordem na prxima parte
desta tese.
Terhardt se fecha no conceito de Rameau, cujo ensejo foi mesmo: o de
encontrar supostas leis naturais para explicar princpios da prtica musical. Porm, da
mesma forma que Pitgoras, seu trabalho possui um grande teor especulativo, j que
faltaram ferramentas e conceitos cientficos para melhor examinar essas premissas.
Terhardt, ento, busca aplicar sua teoria para se relacionar com a noo tradicional de
Rameau sobre harmonia e consonncia/dissonncia.
Rameau parte de um conceito prximo ao de Altura Virtual, em que diferentes
tons musicais se relacionam uns com os outros por meio de uma fundamental. Na
teoria de Rameau, um acorde consonante se todos os tons possuem uma forte relao
com um baixo fundamental, enquanto notas que no se relacionam formam
dissonncias no acorde. Assim, a incluso de notas dissonantes abaixa a medida de
Tonalness e diminui a proeminncia de uma fundamental. Veremos isso em detalhes
no prximo captulo.

35
4.2.2 Afinidade de Tons: Comonalidade de Altura
O conceito de Afinidade de Tons foca no termo tom musical, pois esse tipo
de sonoridade que evoca mais Afinidade. O conceito de Afinidade pode ser definido
como uma propriedade de uma nota musical ser substituda por outra sem grande
diferena no resultado perceptivo. O intervalo musical de maior afinidade a oitava e,
em seguida, a quinta justa. Alis, Paul Hindemith (1940) afirma que nada novo
emerge com a relao entre tons na oitava ou quinta, a ponto de a teoria convencional
de harmonia no as considerar como dades com funo harmnica.
Terhardt (2000d) comenta um aspecto de afinidade auditiva um molde
perceptivo da nossa escuta que nos ajuda a relacionar tons sucessivos em termos de
afinidade como subproduto da exposio voz humana e sua caracterstica
harmnica, mesmo no caso de tons senoidais. Esse aspecto de afinidade auditiva o
mesmo princpio gestaltiano envolvido na percepo de Altura Virtual. Nesse aspecto,
parece haver uma pr-disposio perceptiva capaz de fazer correspondncias, com
facilidade, entre tons musicais que estejam na relao de oitava e quinta. Tons em
relao de oitava so, inclusive, compreendidos como equivalentes fenmeno
chamado de Equivalncia da Oitava (Terhardt 2000d).
Alm desta pr-disposio perceptiva para Afinidades de Tons, Terhardt aponta
um segundo aspecto de Afinidade Sensorial, que se vale do fato de um tom musical
poder evocar mais de uma Altura. Esse princpio, igualmente, diz respeito Teoria de
Altura Virtual e chamado de Multiplicidade de Altura.
Em particular, tons complexos harmnicos (tons musicais) evocam Alturas em
relaes de nmeros inteiros simples, que so as relaes entre os componentes
espectrais mais proeminentes. Como consequncia, uma Afinidade Sensorial entre
dois tons complexos e mltiplos emerge do fato de evocarem alturas em comum, fator
denominado de Comonalidade de Altura (Pitch Commonality). Para intervalos como a
oitava e a quinta, um modelo de Comonalidade de Altura capaz de encontrar valores
altos de afinidade, j que a relao intervalar a mesma de nmeros inteiros pequenos.
Entretanto, o modelo de Comonalidade de Altura pode ser aplicado a qualquer
sonoridade.
Esse conceito e modelo depende, ento, de uma estimativa de quais alturas uma
sonoridade evoca. Essa medida pode tambm ser gerada a partir de um modelo de
Altura Virtual, conforme ser apresentado no prximo capitulo. Por isso, o elemento
chave da Altura Virtual coloca ento esses trs aspectos (Tonalness, Fundamental do

36
Acorde e Comonalidade de Altura) muito prximos entre si.
A Comonalidade de Altura uma medida comparativa da afinidade entre duas
sonoridades. At agora, todos os atributos perceptivos que estudamos no partem de
um princpio de comparao e podem, portanto, ser analisados a partir de um nico
espectro. J a Comonalidade de Altura depende de uma comparao entre pelo menos
dois espectros sonoros, mas pode tambm ser avaliada em um conjunto bem maior de
sonoridades.

4.3 Consideraes Finais e Outros Atributos


Fizemos uma exposio de todos os elementos da teoria de Terhardt (1984). Na
reviso da literatura psicoacstica sobre atributos da dissonncia, vimos que a
Aspereza um elemento de destaque, alm de ser o primeiro a ser conceituado e
desenvolvido. Por essas caractersticas, ele acaba sendo o atributo que possui mais
detalhes a serem levados em considerao, uma vez que foi abordado em diversos
modelos e trabalhos.
Uma expanso de atributos que dizem respeito a uma contabilizao de
dissonncia alm da Aspereza recente e tem em Terhardt seu principal autor. Em
uma expanso da Dissonncia Sensorial, temos outros dois fatores j apresentados
(Brilho e Tonalness). O Brilho se destaca por possuir menos discrepncias em sua
definio terminolgica e modelagem, e tambm por tratar-se de um conceito de um
nvel mais baixo, mais simples e objetivo, pertencente literatura e pesquisa em
Descritores de udio.
No temos uma real formalizao de um modelo de Dissonncia Sensorial para
msica, tampouco um que englobe os parmetros de Dissonncia Sensorial e
Harmonia. Fora de um contexto musical, o Brilho assume um importante papel na
medida de Dissonncia Sensorial, como aponta o modelo de Zwicker e Fastl (1999). J
em um contexto musical, essa dimenso psicoacstica possui uma menor influncia, a
ponto de nem ter sido mencionada no trabalho de Parncutt (1989), que apenas aponta
Aspereza e Tonalness como os aspectos mais importantes da teoria de Terhardt.
Deixando de lado algumas incongruncias terminolgicas, o Tonalness um
conceito baseado na teoria de Altura Virtual de Terhardt. Logo, os dados de testes
psicoacsticos e a modelagem inicial desse atributo est nos trabalhos de Terhardt
(1977, 1979, 1982). Temos um segundo conceito de Tonalness (normalmente com
Tonality) baseado apenas na extrao de picos de componentes espectrais, que se volta

37
mais para estudos psicoacsticos em sons no musicais e faz parte do modelo de
Eufonia Sensorial (Aures 1985a), que difere do conceito de Dissonncia Sensorial
aqui apresentado.
O modelo de Tonalness baseado em Terhardt , portanto, nico, ou seja, sem
controvrsia em relao a uma outra possvel modelagem, ou mesmo sem outras bases
de comparao e verificao dos dados. Ele se vale da Altura Virtual, assim como os
atributos do grupo de Harmonia, os quais, por consequncia, tambm s possuem esse
exemplo de conceitualizao e modelagem. Todavia, justamente por isso, cabe-se
questionar se outros estudos, validaes e abordagens poderiam ser pertinentes.
Relacionado, porm distinto, ao modelo de Terhardt o conceito de Entropia
Harmnica, de Paul Elrich (1997). Futuramente, abordamos esse estudo a ttulo de
comparao. Comentamos, tambm, nesta subseo, outros conceitos de ordem
semelhante, que se relacionam com os atributos mencionados, com o intuito de
apresentar uma tentativa de expanso do quadro de atributos e a exposio de um
panorama mais abrangente.
O fato que Elrich um terico musical e compositor interessado em afinaes
alternativas, e seu conceito um modelo especulativo, em vez de um estudo clssico
da Psicoacstica. Mesmo assim, entendemos que uma abertura para outros elementos
fora do quadro tradicional da Psicoacstica pode servir como enriquecimento da
discusso. Outro exemplo de ordem especulativa e arbitrria que mereceu nossa
ateno o trabalho do compositor Clarence Barlow e seu princpio de
Harmonicidade. O modelo de Harmonicidade de Barlow foi tambm implementado
nesta pesquisa.
Terminaremos esta seo, entretanto, mencionando um conceito clssico em
psicoacstica, que o princpio da Fuso Tonal. O problema da Fuso Tonal que
ainda no temos uma relao com atributos fsicos nem, consequentemente, um
modelo, como Sethares aponta em seu trabalho (1999).
Sethares possui um trabalho de Dissonncia Psicoacstica baseado apenas em
um modelo de Aspereza. Porm, visando ampliar o panorama de abordagens , ele
tambm se refere Fuso Tonal, ao Tonalness, e a outros dois princpios (tons
diferenciais e deteco de pequenos perodos), que o autor acredita serem limitados e
fracos, e por isso foram desconsiderados nesta pesquisa. Seguimos ento com uma
explanao do importante conceito de Fuso Tonal.

38
4.3.1 Fuso Tonal
O conceito de Fuso tonal se baseia em uma tendncia de dois tons musicais se
fundirem em uma percepo nica, o que ocorre quando o sistema auditivo interpreta
certas combinaes de frequncias como um tom complexo nico (DeWitt e Crowder,
1987). Para que isso ocorra, o contedo espectral de cada tom e sua justaposio
devem formar uma srie harmnica, e isso possvel quando temos tons musicais
(complexos harmnicos) em relao de nmeros inteiros simples.
No Volume II de seu trabalho seminal Tonpsychologie (1890), Carl Stumpf v na
percepo de tons complexos a base para a consonncia musical. O psiclogo alemo
prope uma teoria de Fuso (Verschmelzung) Tonal, que relaciona a sensao de
consonncia sensao de percepo de dois tons como uma entidade nica.
H algumas similaridades e correlaes entre a teoria de Alturas de Terhardt e o
conceito de Fuso Tonal. Schneider e Frieler (2009) comparam, por exemplo, Fuso
Tonal, Harmonicidade e Percepo de Altura. Entretanto, isso no implica uma relao
direta. Mesmo Terhardt (1974a) menciona a Fuso Tonal sem buscar uma relao com
sua teoria de Altura Virtual, e Huron (2001) tambm traz o conceito de Fuso Tonal
separado de uma descrio de Tonalness.
A Fuso Tonal no trata propriamente de uma Altura Virtual que no est
presente no espectro, nem de um componente do espectro que se destaca como a altura
de um tom e, muito menos, da possibilidade de uma sonoridade evocar mltiplas
alturas, e sim justamente o contrrio, como duas sonoridades podem se fundir em uma
nica percepo.
O experimento clssico de Stumpf contou com indivduos sem treinamento
musical e tons puros. Os estmulos de dois tons senoidais, em intervalos musicais
diferentes, foram avaliados como um nico som, ou dois sons distintos. As respostas
dadas como um nico som apontam para o conceito de Fuso Tonal. Stumpf registra
a percepo de um nico som como uma resposta errada. A tabela 6 resultado de
seu teste.

Tabela 6. Resultados de Stumpf (1890).


Intervalo Oitava Quinta Quarta Tera Trtono Segunda
% de Erro 75% 50% 33% 25% 20% 10%

A partir desses resultados, Stumpf definiu graus de consonncia, baseado na

39
possibilidade da Fuso Tonal de um intervalo. O experimento de Stumpf sugeriu que a
possibilidade de Fuso Tonal corresponde s propores de nmeros inteiros pequenos
(Modelo Pitagrico), mesmo em tons senoidais.
Em seus trabalhos seguintes, especialmente em Die Sprachlaute (1926), Stumpf
demonstrou incerteza sobre o papel da Fuso Tonal na percepo de Consonncia
Musical. Todavia, seu legado foi explorado no sculo XX em estudos que
consideraram o conceito da Fuso Tonal como um fenmeno psicoacstico/cognitivo.
A figura a seguir nos mostra uma curva de resultados do trabalho de Stumpf para
intervalos musicais descritos em razes de frequncias.

Figura 6 Curva de Fuso Tonal (Stumpf 1890 II. p. 176)

O conceito de Fuso Tonal recebeu relativamente pouca ateno em


Psicoacstica, que teve na Aspereza seu foco principal. A proposta de algum modelo
para esse conceito rara, mas comea a surgir na rea de cognio, tal como o trabalho
de Ebeling (2009), baseado em periodicidade neural.
Apesar de Terhardt se concentrar na sua teoria de Altura Virtual para explicar a
harmonia e a Consonncia Musical sob um vis psicoacstico, entendemos que a
Fuso Tonal tambm um atributo que faz parte da Harmonia e um elemento
complementar Altura Virtual e suas implicaes (Tonalness, Fundamental do Acorde
e Comonalidade de Altura). Pelo menos em relao a Aspereza e Brilho, h um claro
entendimento da independncia destes em relao Fuso Tonal.
Huron (2001) usa os conceitos de Fuso Tonal e Aspereza como duas
dimenses independentes para classificar intervalos musicais. Na terminologia musical
tradicional, h trs classes de intervalos harmnicos: consonncias perfeitas (unssono,

40
oitava, quarta e quinta), imperfeitas (teras e sextas maiores ou menores) e
dissonncias (segundas e stimas maiores e menores e o trtono). Segundo Huron,
podemos classificar esses intervalos em critrios de Aspereza e Fuso Tonal, em que
consonncias perfeitas exibem pouca Aspereza e alta Fuso Tonal; consonncias
imperfeitas exibem pouca Aspereza e uma Fuso Tonal comparativamente mais baixa
e, por fim, dissonncias exibem bastante Aspereza e baixa Fuso Tonal.
Podemos ter dades com baixa Aspereza, mas com baixa Fuso Tonal, o que se
d no s em intervalos como a sexta maior, como Huron exps, mas tambm no caso
de tons inarmnicos em relaes intervalares que fogem do temperamento, como no
exemplo da oitava dissonante de Sethares (1999)13. Abaixo, temos diferentes
configuraes que levam em conta as combinaes de Fuso Tonal e Aspereza:
- Baixa Aspereza / baixa Fuso Tonal: Consonncias Imperfeitas, e oitava
dissonante;
- Alta Aspereza / baixa Fuso Tonal: Dissonncias;
- Baixa Aspereza / alta Fuso Tonal: Consonncias Perfeitas;
- Alta Aspereza / alta Fuso Tonal: Sethares e a oitava dissonante;

13
Esse o primeiro exemplo dado pelo autor em seu livro, que traz em um anexo digital diversos exemplos
de udio e vdeo. Nesse exemplo, um tom inarmnico tocado em um intervalo de oitava, primeiro melodicamente,
e depois harmonicamente. Pela inarmonicidade, os parciais no se alinham na oitava e geram Aspereza. Em
seguida, em vez da oitava, o exemplo de um intervalo um pouco maior, quase uma nona menor, mas em que os
parciais se alinham, gerando menos Aspereza.

41
Captulo 5) Modelos Psicoacsticos

A Psicoacstica no tem na teoria musical seu principal foco, e sim apenas uma
possvel aplicao que exploramos em nossa pesquisa. Um exemplo do foco real da
Psicoacstica sua contribuio em compresso de arquivos de udio, como no padro
MP3. Essa uma grande contribuio da rea que obteve um grande impacto em nosso
cotidiano, mas que nada diz respeito teoria ou prtica musical.
Esse exemplo interessante, porque ilustra bem a implicao de
conhecimentos da percepo auditiva nesta rea. Tendo em vista limitaes
perceptivas do ouvido humano, possvel eliminar uma grande quantidade de dados da
percepo sonora e atingir uma taxa de compresso de at 90% dos dados digitais de
um arquivo sonoro sem uma perda correspondente de qualidades perceptivas.
Essa compresso de dados depende da aplicao de um Modelo Psicoacstico.
A ideia de Modelo, na Fsica, a formalizao de uma teoria, usualmente expressa
matematicamente, que est de acordo com a observao em experimentos. Em
psicoacstica, h a mesma ideia de modelo, mas os experimentos se configuram como
testes psicoacsticos.
Nesta pesquisa de doutorado, implementamos computacionalmente Modelos
Psicoacsticos de atributos relacionados percepo de Dissonncia, conforme
exposto neste captulo. O fato que mesmo um modelo no campo da Fsica pode ser
revisado, assim como a gravidade teve que ser revista aps as teorias da relatividade de
Einstein. Em Psicofsica, em que lidamos com um maior ndice de subjetividade e
cognio, parece ainda mais plausvel que modelos possam ser revisados, ou ainda
serem adotados dependendo do caso, objetivo e convenincia.
No caso de nossa pesquisa, buscamos um objetivo principal de aplicao
criativa. Esse propsito claramente gera um contexto que influencia a pertinncia e
reviso dos modelos psicoacsticos. Essa questo tambm ser abordada nesta tese,
mas ainda no consideraremos esse fator neste captulo, pois ele apenas descreve a
formalizao dos modelos.
Por enquanto, temos trazido neste texto diversas questes conceituais e
terminolgicas. Este captulo ainda retrata questes de uma mesma ordem que surgem
na modelagem dos atributos discutidos.

42
5.1 Modelo de Brilho
J informamos anteriormente que os modelos de Brilho (Sharpness) se baseiam
em dados do centroide espectral. Em geometria, o centroide um ponto que define um
centro de gravidade, ou centro de massa. O centroide espectral busca um centro de
massa do espectro. Para isso, calcula-se, a partir dos valores de amplitude, uma mdia
ponderada dessa energia. Os pontos do espectro so dados por faixas de frequncia que
correspondem s bandas crticas. Vimos que a banda crtica tambm um dado
essencial no modelo de Aspereza, j que base da curva de Plomp e Levelt (vide
figura 2).
As medidas da banda crtica foram obtidas por Zwicker (1961), que adotou o
Bark como unidade de medida em homenagem a Barkhousen, o criador da unidade
de Phon para medir Loudness. Cada Bark corresponde a uma banda crtica. Ao todo, o
registro da escuta humana dividido em 24 Barks.

Tabela 7. Escala Bark em funo da frequncia (par esquerdo de colunas) e Banda Crtica
como funo da frequncia central (par direito das colunas).

Escala da
Escala fsica (em Faixa de frequncia da Frequncia central (em
banda crtica
Hz) banda crtica (em Hz) Hz) da banda crtica
(em Barks)
0 20 80 60
1 100 100 150
2 200 100 250
3 300 100 350
4 400 110 455
5 510 120 570
6 630 140 700
7 770 150 845
8 920 160 1000
9 1080 190 1175
10 1270 210 1375
11 1480 240 1600
12 1720 280 1860
13 2000 320 2160
14 2320 380 2510
15 2700 450 2925
16 3150 550 3425
17 3700 700 4050
18 4400 900 4850
19 5300 1100 5850
20 6400 1300 7050
21 7700 1800 8600
22 9500 2500 10750
23 12000 3500 13750
24 15500 4500 17750

43
Cada Bark corresponde a uma faixa de frequncia em Hertz, e esses valores
no so constantes. A variao da banda crtica gira em torno de uma segunda maior e
uma tera menor pela grande maioria do registro, sendo que a banda crtica bem mais
ampla no grave. A relao entre barks e frequncia apresentada na Tabela 7.

Figura 7 Equao da Medida de Brilho (S de Sharpness) em acum. Onde z o nmero da


banda crtica, N o loudness total espectro, N'(z) o loudness especfico da banda crtica, e
g(z) uma funo que igual a 1 se z < 15, e igual a 0.66 exp(0.171z) para z > 15.

Como informado na descrio do atributo, a unidade de medida de Brilho o


acum. O valor de 1 Acum atribudo a uma banda estreita de rudo em torno de 1 KHz
com energia de 60 dB. Essa banda estreita corresponde a uma banda crtica (em torno
de 160 Hz segundo a tabela 7). A 1 KHz, as medidas em dB equivalem a medidas em
Phons. Portanto, essa definio deixa implcito que 1 Acum um valor de Brilho que
corresponde a uma faixa estreita de rudo qualquer (correspondente s bandas criticas)
com intensidade de 60 Phons14. Na figura 7, temos a frmula de Brilho em funo da
intensidade ou loudness
Os estudos e modelo de Brilho, diferentemente de Aspereza e Tonalness, no
foram desenvolvidos para mensurar dissonncia em contextos musicais e se valem de
uma anlise espectral direta de qualquer tipo de fonte sonora. Os outros dois atributos
da Dissonncia Sensorial possuem uma certa ambivalncia e j foram considerados em
ambos os contextos, o que tambm gerou certas discrepncias em relao
modelagem dependendo de cada caso. Outra considerao importante que,
diferentemente de Aspereza e Tonalness, no relevante considerar intervalos
musicais para medir Brilho, pois pouco importa a relao harmnica, e sim a
distribuio de energia no domnio da frequncia.
O Brilho possui um especial destaque fora de um contexto musical no modelo de
Sensory Pleasantness de Zwicker e Fastl (1999), que um conceito anlogo
Dissonncia Sensorial, mas que no busca uma aplicao em um contexto musical. Em

14
Mais detalhes sobre Phons na prxima parte, quando apresentamos um objeto que converte medidas em
dB para escalas psicoacsticas de intensidade.

44
contrapartida, no clara nem bem definida a participao do Brilho na literatura
Psicoacstica em um contexto musical. Parncutt (1989), por exemplo, chega a
desconsider-lo. Traremos mais consideraes sobre sua falta de destaque e
importncia em um contexto musical ao longo do texto.

5.2 Modelo de Aspereza


A Aspereza e o Tonalness podem ser considerados em contextos musicais ou
no. No caso de ambos, h estudos que se voltam mais a uma ou outra aplicao. No
que diz respeito aos modelos de Aspereza, h basicamente dois tipos: os baseados na
curva psicoacstica de Plomp e Levelt (1965) e uma outra classe que se baseia em
modelos do processamento auditivo perifrico, que literalmente simulam a estrutura do
ouvido humano e se relacionam com estudos da rea de neurocincia, que adotam esse
tipo de estrutura para modelagem do sistema auditivo nervoso.
Terhardt (2000b) afirma que uma anlise da Flutuao de Amplitude no tempo
requer um modelo adequado da excitao da Membrana Basilar. comum o uso de
um banco de filtros (ou canais auditivos) para modelar as bandas crticas e o modo
como elas influenciam na anlise espectral e no padro de excitao na membrana
basilar. Uma anlise com banco de filtros tambm se aplica como base no modelo de
Brilho. O ponto em questo aqui que esse tipo de estrutura acaba embutindo um certo
paradigma de extrair informaes diretamente de uma anlise sonora sem considerar
que tipo de som est sendo analisado. Ou seja, no evidencia um contexto musical. Em
compensao, isso no incoerente, pois os atributos da Dissonncia Sensorial esto
sujeitos aplicao em qualquer tipo de entrada sonora, at mesmo rudo.
Como exemplos de uma abordagem desse tipo, temos o trabalho de Aures
(1985a), otimizado por Daniel e Weber (1997). Aures (1985a) calcula a Aspereza
como uma soma da energia das frequncias em batimentos dos canais auditivos (ou
banco de filtros). O Modelo de Pressnitzer (1999) outro exemplo similar, mas que
leva em conta os efeitos de comodulao (relaes entre os componentes espectrais
que possuam a mesma envoltria temporal) em diferentes canais.
Leman, em seu Modelo do ndice de sincronizao (2000), adota o modelo
auditivo de Immerseel e Martens (1992), e prope uma alternativa baseada na ideia de
que a Aspereza pode ser contabilizada em termos da energia provida pela
sincronizao neural das frequncias em batimento, em vez da estimativa direta da
energia das flutuaes.

45
Leman (2000) argumenta que essa abordagem possui algumas vantagens
porque no possui as limitaes de que os modelos baseados em Plomp e Levelt
sofrem, uma vez que permite a anlise de sons ruidosos e consideram efeitos de fase.
Todavia, pode tambm ser uma limitao o fato de este tipo de modelo apenas lidar
com uma anlise direta de sinais de udio no tempo.
Um dos motivos pelos quais os modelos baseados em Plomp e Levelt tm sido
usados em aplicaes musicais que podemos nos basear em modelos de espectros
(descritos por listas de parciais e amplitudes) e simular situaes sonoras e musicais
sem a necessidade de ter um sinal sonoro para isso. O prprio Leman refora esse fato
como influncia para uma tradio de uso desses modelos em aplicaes musicais.
O modelo adotado nesta tese segue uma reviso dos trabalhos baseados em
Plomp e Levelt (1965). Basicamente, com a diferena de frequncia de cada par de
parciais na escala da banda crtica, possvel buscar na curva psicoacstica de Plomp e
Levelt um valor de Aspereza para aquele par. Por fim, soma-se o valor de Aspereza de
todas as combinaes de pares de parciais do espectro. Veremos logo mais a estrutura
detalhada do modelo.
No que concerne fase, Pressnitzer e McAdamns (1999) afirmam que a
Aspereza depende deste elemento. Entretanto, Vassilakis15 depe que a ausncia da
fase no seu modelo (baseado em Plomp e Levelt) no distorce significativamente os
seus resultados.
Os modelos baseados em Plomp e Levelt (1965) levam em considerao a
extrao de picos do espectro, em vez de uma anlise do dado bruto. Os picos
representam um pequeno nmero de componentes espectrais16, em vez de toda a
informao de uma anlise espectral que pode chegar a milhares de dados. Este tipo de
perspectiva tambm difere de uma anlise por faixas de frequncia, que na prtica
representam apenas recortes dos dados brutos de FFT, e tampouco consideram
componentes espectrais.
Um modelo que aceita uma entrada de componentes espectrais (listas de
Frequncias e Amplitudes) acarreta o fato de lidarmos com um objeto sonoro
especfico, uma sonoridade. Neste caso, possvel uma abordagem de anlise sonora
em tempo real, mas tambm so possveis abordagens mais abstratas, que permitem

15
Vide <http://musicalgorithms.ewu.edu/learnmoresra/moremodel.html>.
16
Na segunda parte, apresentamos ferramentas criativas que no precisam de mais do que 50 componentes
espectrais para recriar uma sonoridade musical.

46
simular situaes sonoras como a justaposio de espectros, sem que primeiro
precisemos ger-los para ento submeter a uma anlise da mostra sonora.
Logo, possvel simular e calcular a Aspereza de diversas dades. Em especial,
esse tipo de procedimento permite gerar uma Curva de Aspereza, tornando-a uma
ferramenta til para aplicaes musicais relacionadas afinao e microtonalidade,
alm de outros processos criativos descritos na prxima parte (Barlow 2008, Ferguson
2000, Sethares 1999, Sethares et al. 2009).
Para proceder desta maneira com modelos temporais, seria necessrio sintetizar
e gerar arquivos sonoros para ento inserir no modelo, o que seria mais demorado e
complicado. Portanto, para aplicaes em tempo real, como na situao de uma
performance ao vivo, os modelos baseados em Plomp e Levelt so mais vantajosos.
Os modelos de Aspereza baseados nos dados de Plomp e Levelt (1965)
possuem uma mesma estrutura:
- Determinar a diferena de frequncia de cada par de parciais;
- Para cada par, buscar o valor de Aspereza na Curva de Plomp e Levelt;
- Aplicar um redimensionamento desse valor de acordo com as amplitudes;
- Somar os valores de cada par.

O modelo, claramente, gira em torno dos resultados da Curva de Plomp e


Levelt (1965), apresentada no captulo anterior (Figura 2). Destacamos duas frmulas
principais que aproximam essa curva, uma fornecida por Parncutt (1993) usada na
sua implementao do modelo de Hutchinson e Knoppoff (1978) e tambm adotada no
modelo de Clarence Barlow (2008) e outra por Sethares (1999), que foi adotada em
seu prprio modelo e tambm por Vassilakis (2001), que o revisou.
O parmetro mais controverso e que mais varia de um modelo para outro
como computar a Aspereza para um par de parciais com diferentes amplitudes. Esse
um passo necessrio, pois a Curva de Plomp e Levelt (1965) vale apenas para um par
de tons senoidais de mesma amplitude. O modelo de Clarence Barlow (2008) destaca-
se por incluir um redimensionamento de acordo com a percepo de intensidade
sonora (Loudness) e o efeito de Mascaramento. J o estudo mais consistente sobre
como computar a Aspereza para tons com intensidades sonoras diferentes o de
Vassilakis (2001), que afirma que estudos como o de Terhardt (1974) em modulao
de amplitude foram negligenciados na literatura sobre Aspereza e em suas
implementaes computacionais. A partir disso, Vassilakis desenvolve um modelo de
como contabilizar a Aspereza de Amplitudes diferentes por meio do Grau de

47
Flutuao de Amplitude.
Os estudos baseados em Modulao de Amplitude confirmaram os resultados
de Plomp e Levelt (1965) e tambm produziram detalhes adicionais (Leman 2000).
Zwicker e Fastl (1999, p.234) descrevem um modelo de Aspereza apenas por esse
enfoque e relacionam a Aspereza a trs atributos bsicos: (i) grau de modulao de
amplitude (outro termo para o grau de flutuao de amplitude de Vassilakis); (ii)
frequncia de modulao e (iii) frequncia central. Portanto, apesar de o estudo de
Modulao de Amplitude ser paralelo aos modelos baseados em Plomp e Levelt,
Vassilakis (2001) foi capaz de acoplar esses estudos nesse tipo de modelo.
Vassilakis insere sua reviso dos modelos baseados em Plomp e Levelt no de
Sethares (1999). O modelo de Sethares apresenta certa falta de acuidade na
implementao, como, por exemplo, a converso de frequncias em Hertz para Bark e
sua aproximao da curva de Plomp e Levelt questes j discutidas em meu
mestrado (Porres 2008). O modelo de Sethares tambm no possui a incluso de
modelo de mascaramento e loudness, como revisado por Barlow (2008), sendo
considerado, por isso, um modelo mais completo.

Figura 8 Diagrama do modelo de Aspereza

Portanto, preferimos tomar o trabalho de Barlow como base de reviso e inserir


nele o estudo de Vassilakis. O diagrama da figura 8 traz uma descrio bsica dessa

48
reviso do modelo de Aspereza, mas apenas diz respeito ao clculo de Aspereza para
um par de componentes espectrais, descritos por uma Frequncia e Amplitude (ou seja;
F1, A1 e F2, A2). Para contabilizar a Aspereza de um tom complexo ou de uma dade,
preciso levar em conta um passo final de somar os valores de Aspereza de cada par
de parciais encontrados no espectro.
O valor mximo de Aspereza , claramente, arbitrrio. A Curva de Plomp e
Levelt apenas diz que esse mximo ocorre em um quarto da Banda Critica.
Convencionamos que esse valor mximo igual a 1. Esse valor mximo ser
redimensionado de acordo com os valores de Amplitudes, sendo que no caso de duas
Amplitudes iguais e mximas, a Aspereza deve ser igual a 1.
O modelo de Clarence Barlow no adota a frmula de Vassilakis (2001), mas
um produto da mdia dos quadrados das Amplitudes em Sones. Excluindo este passo,
o modelo proposto continua fiel ao modelo de Barlow, exceto pelo estgio de
mascaramento, em que adotamos o modelo de mascaramento existente no modelo de
Comonalidade de Altura de Parncutt (1989), ao contrrio de Barlow, que implementou
um modelo baseado em Zwicker (1999). A converso de Hertz para a escala da Banda
Crtica a mesma sugerida por Barlow e descrita no captulo sobre a implementao
do objeto em Pd.
Grficos de Aspereza so comuns na forma de Curvas para intervalos musicais.
Pelo fato da importncia que esse atributo possui tradicionalmente na contabilizao
de Dissonncia Sensorial, as Curvas de Aspereza tambm figuram diretamente como
Curvas de Dissonncia. Porm, nesta pesquisa, definimos que uma Curva de
Aspereza no pode ser considerada uma Curva de Dissonncia, pois, para isso, seria
necessria a incluso de outros atributos aqui expostos (como Tonalness e
Comonalidade de Altura).
Deve ficar claro que esse tipo de grfico de uma mesma ordem que o grfico
elaborado por Stumpf (1890), apresentado no captulo anterior na Figura 6, uma Curva
de Fuso Tonal, por assim dizer, representando consonncia no eixo vertical. A prpria
curva de Plomp e Levelt (1965) trazida na figura 2 tambm apresentada pelos autores
como uma curva de Consonncia, em que os intervalos de frequncia so dados por
uma diferena na escala da banda crtica.
O grfico da figura 9 representa uma Curvas de Aspereza geradas por
Helmholtz, com Aspereza no eixo vertical e, no eixo horizontal, intervalos musicais
(dades) no espao de uma oitava, tal qual a Curva de Fuso Tonal de Stumpf (1890).

49
A diferena que os valores no eixo vertical esto invertidos: enquanto medidas de
Fuso Tonal correspondem Consonncia, os picos de Aspereza correspondem
Dissonncia. Como os tons analisados no grfico da figura 9 so harmnicos, os
parciais se alinham em relaes igualmente harmnicas, gerando pontos mnimos de
Aspereza. Estes se do nos mesmos intervalos que os pontos mximos de Fuso Tonal
da Figura 6.

Figura 9 Curvas de Aspereza de Helmholtz (1877).

Figura 10 Curvas de Aspereza de Plomp e Levelt (1965).

50
J a figura 10 apresenta um grfico similar produzido por Plomp e Levelt (1965).
Ao contrrio da Figura 9, a Aspereza dada no sentido contrrio, de cima para baixo, e
aqui est indicada como Dissonncia. Ou seja, os picos representam consonncia como
na Figura 6. Os intervalos so dados por propores, e o eixo horizontal representa
frequncias em Hertz no espao de uma oitava. O som analisado formado por 6
parciais harmnicos de igual intensidade. O valor mximo de Aspereza no grfico da
Figura 10 est em torno de 5.5, ao passo que Plomp e Levelt estabeleceram o valor
mximo de Aspereza entre dois tons puros igual a 1.

5.3 Modelo de Altura Virtual e Tonalness


Huron discorre sobre Toneness seu termo para Tonalness (Clareza de
Percepo de Altura) da seguinte maneira:

A clareza da percepo de alturas tem sido simulada, sistematicamente, em um modelo


de percepo de altura formulado por Terhardt, Stoll e Seewan (1982a, 1982b). Para
ambos os tons puros e complexos, o modelo calcula um peso de altura, que pode ser
entendido como um indcio da clareza de altura e, portanto, uma medida de toneness.
Para alturas evocadas por tons puros (ditas alturas espectrais), a sensibilidade mais
aguada na regio de dominncia espectral ampla regio prxima de 700 Hz. Alturas
evocadas por tons complexos (ditas alturas virtuais), tipicamente, denotam o maior peso
de altura quando a altura evocada, ou a fundamental verdadeira, encontra-se em uma
ampla regio, centrada prxima de 300 Hz mais ou menos R, logo acima do D
central (C4) (Terhardt, Stoll, Schermbach, & Parncutt, 1986) (...). Imagens auditivas
fortes so evocadas quando tons exibem um alto grau de toneness. Uma impresso clara
de um tom musical (como uma imagem ntida) possui um alto grau de toneness, e uma
impresso difusa possui um grau baixo de toneness. Uma medida til de toneness
provida pelo Peso de Altura. Tons possuindo os maiores Pesos de Altura so tons
complexos harmnicos centrados na regio entre F2 e G5. Tons que possuem parciais
inarmnicos produzem percepes de Alturas Virtuais que competem entre si, e ento
evocam imagens auditivas mais difusas (Huron 2001)..

Nessa passagem, o autor se refere ao trabalho de Terhardt para definir um modelo de


Tonalness baseado em Peso de Alturas (Pitch Weight). Baseamo-nos no Modelo de
Tonalness (ou Sonorousness) implementado por Parncutt em seu modelo de
Comonalidade de Altura (1989), que remete diretamente teoria e ao modelo inicial de
Terhardt baseados em Pesos de Alturas, e inclui o modelo de Tonalness como um
subproduto paralelo.
O modelo de Tonalness pode ser aferido aps extrarem-se os valores de Altura
Virtual, tambm necessrios para os modelos dos atributos de Harmonia. O modelo de
Comonalidade ser retomado depois. Todavia, como a dependncia a mesma, seu
estgio inicial ser descrito aqui j nesta subseo do modelo de Tonalness.
O modelo de Comonalidade de Altura pode ser conferido em detalhes

51
diretamente na fonte (Parncutt 1989). Apresentamos aqui apenas uma estrutura
generalizada e os passos conceituais essenciais. As implementaes dos objetos
tambm so uma fonte de referncia e sero dadas em cdigo aberto.
Como o modelo de Aspereza, a entrada de dados so listas de parciais descritas
por Frequncias e Amplitudes. Mas nesse caso os parciais so aproximados a pontos
de uma tabela que, quanto maior for, melhor resoluo de frequncias ter. O trabalho
original de Parncutt nos d tabelas com 120 pontos, que representam frequncias
distribudas em 10 oitavas, cada uma subdividida em 12 semitons do sistema
temperado.
O valor de um ponto da tabela a amplitude do componente espectral que
aquele ponto representa. O primeiro estgio do modelo redimensiona essas amplitudes
de acordo com a nossa percepo de intensidade e um modelo de mascaramento.
A partir dessa etapa, temos um estgio que corresponde ao modelo de Altura
Virtual, que pode aferir valores desta grandeza para vrios pontos da tabela, mesmo
alguns que no possuam valor nenhum de amplitude. Isso porque se trata justamente
de um modelo de Altura Virtual que consegue aferir percepo de alturas para
componentes espectrais inexistentes. Vejamos o modelo em maiores detalhes:

5.3.1 Primeiro Estgio: Espectro Audvel (Peso de Alturas Espectrais)


O primeiro passo do modelo converter as amplitudes em YL Nveis
Auditivos (Auditory Levels), que o valor em decibis da diferena entre a amplitude
de um parcial e o Patamar do Nvel de Audio LTh (Level Threshold), que, por sua
vez, o nvel de intensidade em que comeamos a perceber o som. Trata-se de um
procedimento que nivela as amplitudes de acordo com a nossa percepo de
intensidade.
O segundo passo filtrar o espectro em um modelo perceptivo de
Mascaramento. O fenmeno de Mascaramento ocorre para componentes espectrais
muito prximos, dentro de uma mesma banda crtica, em que um tom pode encobrir
outro e at mesmo fazer que a sensao de Altura Espectral promovida por ele no
ocorra. Aps isso, o que nos resta so as amplitudes descritas em Nvel Audvel
(Audible Level). Com esse dado, podemos calcular o Peso de Altura Espectral, ou
Audibilidade.

52
5.3.2 Segundo Estgio: Modelo de Altura Virtual (Pesos de Alturas)
Esse estgio extrai trs tipos de Pesos de Altura que esto diretamente
relacionados com a Teoria de Terhardt de Altura Virtual. Terhardt considera dois tipos
de Altura, a Espectral e a Virtual. Esta fase calcula o Peso de Altura Espectral (que
Parncutt define como Audibilidade de um Tom Puro), o Peso de Altura Virtual
(Audibilidade de um Tom Complexo, segundo Parncutt) e um terceiro tipo dado
apenas como Peso de Alturas (ou Perfil de Audibilidades, de acordo com o autor),
que uma combinao das duas medidas anteriores.
O Peso de Altura Espectral uma medida de quo audvel uma Altura
Espectral em uma sonoridade. A partir das amplitudes de um espectro em Nveis
Audveis, podemos calcular o Peso de Altura Espectral, que acaba sendo uma
grandeza de intensidade sonora subjetiva.
O Peso de Altura Virtual parte da medida de Peso de Altura Espectral, mas
depende de uma rotina de varredura do Espectro em busca de um padro harmnico.
No modelo original de Parncutt (1989), temos um molde da srie harmnica com 10
componentes. A fundamental do molde percorre o espectro do grave ao agudo. A cada
vez que um componente harmnico desse molde da Srie Harmnica corresponde a
um parcial de fato presente no Espectro, a Altura que corresponde fundamental
ganha um valor de Peso de Altura Virtual de acordo com a medida de Peso de Altura
Espectral.
Se h uma correspondncia de mais do que um componente espectral com
diferentes harmnicos do molde, o valor de Peso de Altura Virtual para essa
fundamental a somatria de todos os valores encontrados, mas cada harmnico
somado com um peso diferente (1/n, onde n o nmero do termo na srie harmnica).
Assim, se apenas o 8 e 9 harmnico de uma fundamental esto presentes, o Peso de
Altura Virtual ser menor do que caso estivessem presentes o 3 e 4 harmnicos.
A grande implicao que esse procedimento afere valores para fundamentais
ausentes a essncia da teoria de Altura Virtual de Terhardt (1974). No caso da
fundamental do molde estar presente, seu valor somado com os valores de outros
harmnicos, gerando um resultado maior do que se estivesse ausente. J quando h
apenas um componente como fundamental do molde, seu valor permanece o mesmo.
O Peso de Alturas incorpora todos os Pesos de Altura Virtual encontrados, mas
tambm o compara com os valores de Peso de Altura Espectral em que, no caso de um
Peso de Altura Espectral ser maior do que o Peso de Altura Virtual, sua medida

53
prevalece. Porm, na maioria dos casos, isso no acontece, donde se pode afirmar que
o resultado , basicamente, o Peso de Altura Virtual.

5.3.3 Terceiro Estgio: Modelo de Tonalness


Ambos Pesos de Altura Espectral e Virtual servem de base para calcularmos,
respectivamente, o Tonalness Puro e o Tonalness Complexo. Seguindo o modelo de
Tonalness de Aures (1985b), Parncutt define o Tonalness Puro de uma sonoridade
como uma soma quadrtica normalizada dos Pesos de Altura Espectral (para que seu
valor mximo seja igual a 1).
Dessa forma, a medida de Tonalness Puro cresce quanto maior for o nmero e
os valores de Peso de Altura Espectral e decresce na medida em que h mais
mascaramento entre os componentes. Se estamos comparando o Tonalness Puro de
diversas dades, o mascaramento ocorre mais em intervalos dissonantes, em que h um
desalinhamento de parciais e os componentes espectrais se encontram em uma mesma
Banda Crtica o que faz que este conceito esteja paralelamente ligado com o de
Aspereza.

Figura 11 Diagrama do modelo de Tonalness

J o Tonalness propriamente dito (Complex Sonorousness) dado pelo maior


Peso de Altura Virtual, tambm normalizado por uma constante. Como o peso de
Altura Virtual cresce de acordo com o reconhecimento de uma Srie Harmnica, essa
medida est relacionada com a harmonicidade da sonoridade. Dessa forma, o

54
Tonalness indica um grau em que uma sonoridade contm um tom complexo
harmnico e corresponde a uma medida da facilidade com que a Altura Virtual mais
saliente percebida (Parncutt 1989 p. 59). No caso de dades dissonantes, em relaes
harmnicas que no so de nmeros inteiros simples (como o velho postulado de
Pitgoras), essa medida diminui.
A Figura 11 seguir um diagrama que resume o modelo de Tonalness, onde
primeiro ajustamos a amplitude do espectro de acordo com a percepo de intensidade
e o fenmeno de mascaramento. Com o espectro audvel, calculamos os Pesos de
Altura Espectral e Virtual, que servem para calcular, respectivamente, o Tonalness de
Tom Puro e Complexo.

5.4 Modelo de Altura Virtual Aplicado aos Atributos de Harmonia


Parncutt (1989) apresenta um Modelo de Comonalidade de Altura baseado nos
estudos tericos de Altura e Consonncia de Ernst Terhardt. Esse modelo foi revisado
pelo autor para aplicao em composio musical e apresentado posteriormente com
alguns exemplos de anlise (Parncutt e Strasburger, 1994). Baseamo-nos nessa ltima
verso, que possui um cdigo original em C, usado tambm para a compilao de
objetos para Pure Data.
O modelo de Comonalidade de Altura consiste, primeiramente, numa
comparao entre duas sonoridades. Os dados de comparao so Perfis de Salincia
de Altura, que so calculados a partir dos Pesos de Alturas. Como j mencionado,
esses dados se baseiam na teoria de Altura Virtual e representam o espectro sonoro de
acordo com uma resoluo dada. Logo, o Perfil de Salincia ser dado em uma tabela
com a mesma resoluo.
Uma medida de Salincia de Altura significa que percebemos aquela Altura
com mais facilidade. O Perfil de Salincia de Alturas de um acorde pode no s conter
as prprias notas de um acorde, mas tambm outras Alturas que podem ser evocadas
pelos componentes espectrais do conjunto sonoro, j que parte do processo envolve o
modelo de Altura Virtual.
O modelo de Comonalidade de altura a relao entre o Perfil de Salincia de
Altura de dois Espectros Sonoros que podem ser, por exemplo, sucessivos em uma
composio. Por isso, esse modelo serve tanto para anlise harmnica de uma obra,
como tambm de ferramenta de assistncia composio, que permite ajudar na
escolha de uma progresso harmnica.

55
Em suma, se dois Espectros ou acordes possuem uma alta Comonalidade de
Altura, ento ambos evocam sensaes de alturas em comum. Logo, ambos produzem
Perfis de Salincia de Altura similares. A Comonalidade de Alturas pode explicar, por
exemplo, a relao entre os acordes de D Maior e R menor, visto que, mesmo no
contendo notas em comum, esses acordes podem evocar Salincias de Alturas em
comum. O modelo possui um subproduto, que calcula a distncia de Altura entre duas
sonoridades, tendo como base tambm uma comparao entre as diferentes alturas
evocadas pelo Perfil de Salincia de Alturas.
O modelo de Comonalidade de Altura nos d um tipo de medida harmnica
entre duas sonoridades, mas como baseado em princpios psicoacsticos, ele leva em
considerao o Espectro Sonoro e no uma abstrao como as notas escritas em uma
partitura. Uma segunda implicao importante que o difere de uma anlise harmnica
em geral que o modelo no generalizado em oitavas uma vez que a percepo
sonora varia de acordo com o registro da escuta.
Seguiremos para uma descrio mais detalhada do modelo original de Parncutt
e Strasburger (1994), que corresponde estrutura do programa original em C. Todavia,
tomamos aqui a liberdade de organizar a descrio do modelo de um modo diferente,
pois tambm segue nossa estrutura dos objetos de Pd implementados. Continuaremos
do ponto em que paramos no modelo de Tonalness e chegaremos at o clculo de
Comonalidade de Altura. Primeiro trataremos de como calcular o Perfil de Salincia de
Alturas. Com o Perfil de Salincia de Alturas, possvel tambm buscar a
Fundamental do Acorde, um dos descritores de Harmonia. Outro subproduto dessa
seo a medida de Multiplicidade.

5.4.1 Descrio Final do Modelo de Comonalidade de Altura


A Multiplicidade de Alturas o nmero de Alturas percebidas em um espectro.
Tendo como base o Peso de Alturas (ou Perfil de Audibilidade), uma primeira
estimativa dada por uma soma de todos os pontos da tabela dividida pelo seu maior
valor. Aps esse passo, o valor de Multiplicidade redimensionado ao ser elevado a
um expoente entre 0 e 1 de acordo com o tipo de escuta, sendo que o valor padro
0.5. J uma escuta mais analtica tenderia ao valor 1, enquanto uma escuta holstica
tenderia a 0.
Parncutt define a Salincia de uma Altura como a probabilidade de se
perceb-la conscientemente no Espectro Sonoro, em que o termo probabilidade

56
adotado em um sentido subjetivo. Seu clculo depende do Peso de Alturas e do valor
de Multiplicidade calculado. Conclui-se, pela interpretao das frmulas, que a soma
de todas as Salincias de Altura igual ao valor de Multiplicidade (nmero de tons
simultaneamente percebidos) daquela sonoridade. Em funo do Perfil de Salincia de
Alturas, o maior valor corresponde Fundamental do Acorde.
A comparao de dois Perfis de Salincia de Alturas nos d uma medida de
Comonalidade de Altura. Como no exemplo anterior, o Perfil de Salincia de Alturas
pode ser uma tabela com 120 valores de Salincia (10 oitavas do sistema temperado).
Parncutt adota a correlao de Pearson para contabilizar a Comonalidade, que fornece
valores que chegam em um mximo igual a 1 (no caso de espectros iguais) e -1 para
sonoridades teoricamente complementares. Veja o diagrama da figura 12 como resumo
do processo.

Figura 12 Diagrama do modelo de Comonalidade de Altura

Um subproduto final do modelo de Comonalidade de Altura de Parncutt


(1989) a distncia de altura entre duas sonoridades, dada como uma mdia das
distncias entre as Salincias de ambos. Essa medida complementar no faz parte dos
atributos de dissonncia, mas tambm foi implementada na pesquisa.

57
5.5 Outros Modelos Relacionados Harmonia
A ttulo de exemplo, apontamos dois elementos extras que se relacionam com
medidas harmnicas. Eles no podem ser devidamente includos no modelo de
dissonncia porque so, na verdade, modelos arbitrrios, e no trabalhos prprios da
literatura de Psicoacstica. De todo modo, eles servem como elementos de comparao
e de base para uma discusso final entre dados experimentais e uma abordagem
emprica.
Outra considerao que no temos outros modelos dos atributos de Harmonia,
a no ser o trabalho de Parncutt (1989) que, por sua vez, uma reviso da teoria de
Terhardt (1984). Portanto, na falta de algo prprio da Psicoacstica, adotamos esses
outros modelos como exemplo de contraste.
Nas consideraes finais desta primeira parte, tratamos com mais profundidade
essa questo de falta de outros trabalhos relacionados Altura Virtual e os Atributos
de Harmonia e trazemos tambm alguns exemplos da rea de Cognio e Descritores
de udio para a discusso.

5.5.1 Harmonicidade
O trabalho de Barlow em seu conceito de Harmonicidade um exemplo de
aplicao de um modelo arbitrrio baseado em princpios perceptivos. Veremos, nas
consideraes finais, que o termo Harmonicidade diz respeito a alguns Descritores de
udio, mas Barlow o adotou de um modo distinto e particular. O seu modelo de
Harmonicidade, baseado em sua teoria e conceito, extrai uma medida de acordo com
uma relao harmnica dada por nmeros inteiros (Barlow 1987).
A ideia se vale de princpios puramente matemticos, que visam medir a
complexidade de uma relao numrica. Nesse aspecto, podemos encontrar um ponto
em comum com a noo Pitagrica e pensar o conceito de Harmonicidade como sua
expanso, em um modelo que, a partir de nmeros, gera uma medida de consonncia e
harmonia. O modelo relativamente simples e pode ser consultado em seu artigo
(Barlow 1987). O objeto desenvolvido neste trabalho ser apresentado tambm na
segunda parte, onde o traremos com mais detalhes. Ele tambm faz parte do pacote de
ferramentas anexas pesquisa e ser distribudo como cdigo aberto.
A medida de Harmonicidade para o unssono possui um resultado igual a
infinito. Aps esse intervalo, o maior valor o da oitava (2:1) igual a 1. O modelo d
valores positivos quando o tom compreendido como fundamental o denominador.

58
Logo, se temos a inverso da oitava dada como (1:2), o valor de -1. A quinta (3:2) d
um valor de 0.272727, e a quarta (4:3) d um valor negativo, por ser considerada uma
inverso da quinta, com o resultado de -0.214286. O modelo pode ser expandido e dar
a relao harmnica de uma sonoridade, simplesmente ao somar o valor absoluto de
harmonicidade de todas as combinaes de parciais.

Figura 13 modelo de Aspereza na linha superior e Harmonicidade de Barlow (2008)


na linha inferior.

O grfico da figura 13 compara o resultado do modelo de Harmonicidade com


o modelo de Aspereza de Barlow (que equivale aos resultados originais de Plomp e
Levelt da figura 10). O som analisado o mesmo que Plomp e Levelt aplicaram para
obter a figura 10. O grfico tambm parte de 250 Hz, mas segue por duas oitavas
acima mais um semitom. Por fim, tambm como na figura 10, o eixo vertical
representa a consonncia de baixo para cima, e a dissonncia de cima para baixo em
uma mesma escala entre 0 e 6.
A linha superior da figura 13 a da Aspereza e podemos conferir como se
assemelha bastante ao desenho da Figura 10. A linha de baixo representa a medida de
Harmonicidade, de baixo para cima, em uma escala de 0 a 1.4. Vemos que esse
desenho de Harmonicidade pende mais para a Curva de Fuso Tonal de Stumpf
(1890), apresentada na Figura 6.

59
5.5.2 Entropia Harmnica
O conceito de Entropia Harmnica Relativa, de Paul Elrich (1997), possui
caractersticas similares com o modelo de Harmonicidade de Barlow (1987). Trata-se
de um conceito abstrato e matemtico para dar conta de uma dimenso perceptiva.
Neste caso, Elrich a relaciona explicitamente o conceito de Altura Virtual e Tonalness,
porm como uma grandeza oposta. A medida se baseia em teoria da informao, um
ramo da probabilidade e estatstica na matemtica, e dada por uma Sequncia de
Farey para n nmeros e seus mediantes.

Figura 14 Entropia Harmnica de Paul Elrich (1997)

Em termos prticos, a funo de Entropia Harmnica d valores mnimos para


razes de nmeros inteiros pequenos. Ou seja, tambm uma expanso do conceito
pitagrico, assim como a funo de Harmonicidade de Barlow (1987). No
implementamos esse conceito na pesquisa, mas achamos oportuno mencion-lo na
discusso.
A figura 14 nos d o resultado para uma sequncia de Farey com n = 81 e traz,
no eixo horizontal, os intervalos em cents e, no eixo vertical, a Entropia Harmnica

60
como uma medida contrria de Tonalness e a favor de uma percepo de Dissonncia.
O que interessante nesse trabalho que as Curvas geradas se assemelham com
Curvas de Aspereza dadas pelos modelos implementados.
Se, por um lado, os resultados do modelo de Elrich so diferentes do modelo de
Tonalness extrado de Parncutt (1989), h a semelhana entre os resultados da Entropia
Harmnica e os da Aspereza. Essa similaridade traz resultados anlogos Aspereza
que so desnecessrios, uma vez que j h discrepncias suficientes nos modelos de
Aspereza existentes a serem discutidas neste texto.

61
Captulo 6) Consideraes Finais

Apresentamos, no incio desta primeira parte, a Psicoacstica, dentre outras


reas do conhecimento, como uma rea de pesquisa voltada a uma base sensorial da
Msica. A Psicoacstica se restringe a um nvel mais baixo de percepo e tem
produzido muitos dados de pesquisa sobre a percepo de atributos perceptivos. Esse
tipo de abordagem nos interessa por nos dar a possibilidade de modelar e implementar
tais modelos em um computador, em que buscamos aplicaes criativas em tempo real
para composio e improvisao.
Justamente por se restringir a uma objetividade perceptiva, a Psicoacstica nos
d uma ferramenta concreta de manipulao sonora. Atualmente, uma prova eficaz do
impacto da pesquisa nessa rea faz parte do nosso cotidiano; a compresso de dados no
formato MP3 e afins. Algumas aplicaes criativas igualmente eficazes e objetivas j
existem nessa rea, como ser exposto no incio da prxima parte. Um dos objetivos
desta pesquisa buscar novos horizontes nesse sentido. Estamos interessados na
percepo de dissonncia, que um fenmeno multidimensional, complexo, cuja
abrangncia foge dos limites de competncia da Psicoacstica. Essa problemtica
tambm far parte de uma discusso final. A princpio, apresentamos aqui noes
distintas de Dissonncia baseadas no trabalho de Tenney (1988) e buscamos, na
literatura, os atributos psicoacsticos ligados percepo de dissonncia. Encontramos
no trabalho de Terhardt (1984) um quadro completo de atributos. Expomos o conceito
de cada atributo em detalhes e, no captulo anterior, os respectivos modelos
psicoacsticos.
O modelo de Brilho o mais simples e tem sido considerado e aplicado como
um Descritor de udio. Apontamos como o modelo de Brilho no gera resultados que
dizem respeito a relaes harmnicas e tem sido desconsiderado em um contexto
musical. O Brilho faz parte dos Descritores de udio, que tm sido aplicados em
pesquisa na rea de Music Information Retrieval e em aplicaes criativas
interessantes em tempo real, como demonstraremos na prxima parte.
Vimos aqui algumas diferentes possibilidades e parmetros na modelagem de
Aspereza. Continuaremos a tratar desta questo a seguir, aps apresentarmos o objeto
de Pd desenvolvido, com suas possibilidades de parametrizao. Usamos essa
ferramenta tambm para comparar resultados e extrair mais consideraes na parte

62
final.
A Aspereza possui um papel de destaque nesta pesquisa por ser o primeiro
elemento apresentado e investigado por Helmholtz (1877) e foi considerada por muito
tempo o nico atributo psicoacstico da Dissonncia Sensorial. Terhardt expande a
coleo de atributos psicoacsticos e cria um novo grupo alm da Dissonncia
Sensorial, o de Harmonia. Porm, alm do Brilho, Terhardt contribui de fato com a
incluso de atributos baseados em sua teoria de Altura Virtual, sendo este o elemento
chave que se desdobra no conceito de Tonalness, Fundamental do Acorde e
Comonalidade de Altura.
Em suma, podemos nos valer do conceito de Altura Virtual como um atributo
relacionado percepo de Dissonncia. Uma implicao clara da adoo de teoria de
Altura Virtual que a percepo de Altura em si um fator importante em jogo. Com
essa perspectiva, o Tonalness a Clareza de Percepo de Altura, e a relao com
percepo de Altura aqui trivial. A Fundamental do Acorde tambm se relaciona com
a percepo de Altura, pois implica relaes harmnicas entre alturas claras, que
remetem a um baixo fundamental em comum pelo fato de as relaes harmnicas
serem as mesmas de componentes espectrais de um tom com alto Tonalness. De fato,
quanto maior o Tonalness de uma sonoridade, maior a Salincia de Tom como a
Fundamental de um Acorde. Por fim, a Comonalidade de Altura nada menos que
uma medida de comparao que busca percepo de alturas em comum.
Ento, por um lado, temos a Aspereza, que uma dimenso que no lida
diretamente com a percepo de Altura e apenas diz respeito interferncia de parciais
de uma sonoridade em uma mesma banda crtica. Por outro lado, temos alguns
desdobramentos em relao Percepo de Altura. Temos aqui duas dimenses
principais que geram Curvas de Dissonncia, como veremos primeiramente na
prxima parte desta tese. As Curvas de Dissonncia so ferramentas de anlise
importantes e relevantes na pesquisa e remetem tambm a um teste perceptivo
desenvolvido e apresentado na parte final.
Se temos algumas problemticas e discrepncias na modelagem de Aspereza, o
mesmo no ocorre com o modelo de Altura Virtual e seus desdobramentos. Isso
porque temos principalmente o trabalho de Terhardt como a principal fonte, e poucas
revises foram feitas. Mas tambm, se comparada com a Aspereza, a teoria de Altura
Virtual de Terhardt relativamente recente.
No entanto, buscamos outros possveis elementos que pudessem aderir ao

63
quadro de atributos perceptivos de Dissonncia e, assim, abordamos tambm o
conceito de Fuso Tonal. Apesar de o encontrarmos na literatura como um conceito
distinto de percepo de Altura ou, mais especificamente, da teoria de Altura Virtual
entendemos que se trata de um conceito paralelo, pois est igualmente relacionado
com relaes harmnicas.
A Fuso Tonal depende de relaes harmnicas de tons musicais a coloca em
direta relao com a Harmonicidade ou periodicidade, como descrito no trabalho de
Schneider e Frieler (2009). Estes autores trazem uma interessante reviso de modelos
auditivos neurais e uma aplicao nos conceitos de consonncia por esse vis da
neurocincia, colocando a Fuso Tonal em uma relao com uma capacidade fisio-
neurolgica de percepo de periodicidade, assim como o fundamento da Altura
Virtual.
Tons complexos que evocam uma nica sensao de Altura possuem
componentes espectrais que se fundem. Um acorde que possui uma fundamental fcil
de identificar possui um alto Tonalness, contribuindo para a percepo de consonncia
e tambm se relaciona com uma maior Fuso Tonal. Por fim, da mesma maneira que a
quinta e a oitava possuem uma maior Afinidade e Comonalidade de Altura, estes so
intervalos que promovem mais Fuso Tonal.
Se o caso de no podermos inserir, pela falta de estudos, um modelo prprio
de Fuso Tonal no quadro, isso no nos impede de entendermos, pelas caractersticas
semelhantes levantadas, que o conceito de Fuso Tonal deve ser relacionado
percepo de Altura, em uma exposio sobre conceitos e modelos de atributos
perceptivos da Dissonncia.
Se, por um lado, foi possvel dar conta de uma reviso da literatura em
psicoacstica, nos deparamos com um cenrio mais turbulento e complicado ao
considerarmos pesquisas e modelos na rea de cognio e neurocincia. Seria
contraproducente revisar esse conhecimento, porque muito pouco ainda pode ser
extrado e implementado num sistema computacional em tempo real.
Como o objetivo final da pesquisa o desenvolvimento de aplicaes em
tempo real, nos atemos a esse recorte para dar sequncia ao plano de trabalho.
Entretanto, algumas consideraes a respeito de avanos nessa rea tm sido trazidas
para a discusso e tambm se encontram nas consideraes na parte final desta tese.
Uma relao com trabalhos em neurocincia encontrada em um modelo
anlogo ao de Altura Virtual, proposto no trabalho de Meddis e Hewitt (1991). Esse

64
estudo se baseia em um modelo auditivo perifrico nervoso e em uma abordagem de
anlise temporal, medindo a resposta do sistema nervoso auditivo em relao
periodicidade. Os autores comparam seu modelo com outras teorias de percepo de
Altura. Todavia, se temos aqui uma abordagem paralela percepo de Altura na rea
de cognio musical, no temos uma aplicao musical e a formalizao de um
modelo.
A reviso terica desta pesquisa nos evidencia que a maior questo no
encontrar teorias paralelas e modelos diversos, mas sim encontrar e comparar estudos
perceptivos de resposta para contextos explicitamente musicais. So novos testes com
essa abordagem que nos levaro a novos modelos mais aprimorados.
Como apontamos aqui, ainda no h resultados claros na rea de Psicoacstica
e Cognio a respeito de como essas duas dimenses mais importantes da Dissonncia
a Aspereza e a Percepo de Altura se relacionam em um contexto musical para
contabilizar uma medida de Dissonncia. Retomaremos essa questo na parte final
deste trabalho, onde tambm discorremos sobre um teste desenvolvido durante a
pesquisa.
No sentido contrrio de uma cognio musical, a Harmonicidade tambm
um termo e atributo comum em Descritores de udio. Nesse caso, o conceito mais
direto e objetivo, mais simplificado que o conceito de Tonalness ou Altura Virtual, que
possuem uma qualidade de natureza perceptiva.
Alis, h alguns conceitos diferentes que carregam o termo Harmonicidade. Por
exemplo, no padro MPEG-7, temos a harmonicidade do sinal de udio com um
descritor bsico do sinal, mas tambm descritores espectrais como o Centroide
Espectral Harmnico, dentre outros (Mitrovic et al 2010).
De um modo expandido, temos uma classe de descritores harmnicos que
incluem descritores diversos como tristimulus, razo entre harmnicos pares e mpares
e at mesmo inarmonicidade (desvio de um modelo harmnico) (Peeters, 2003).
Alguns desses descritores, assim como o modelo de Brilho, j foram implementados
em Pure Data em bibliotecas de Descritores de udio, referidas na prxima parte.
Mais ainda, fora do universo de pesquisas em Descritores de udio, modelos
psicoacsticos e cognio musical, podemos incluir na reviso terica conceitos e
parmetros arbitrrios, empricos, desenvolvidos por msicos em trabalhos prprios
para aplicaes musicais. Esse o caso do modelo de Entropia Harmnica de Elrich
(1997) e o de Harmonicidade de Barlow (1987).

65
Uma importante referncia em nossa pesquisa no modelo de Aspereza o
trabalho de Clarence Barlow, que considerou fatores que no encontramos em outros
modelos, como o efeito de mascaramento e a contabilizao de energia dos parciais em
escalas de intensidade psicoacstica.
Apesar de um bom rigor em incluir dados perceptivos cientficos na elaborao
do modelo, em um passo final, o modelo arbitrariamente extrai uma mdia quadrtica
das amplitudes como uma forma de redimensionar o valor de Aspereza de acordo com
as amplitudes.
Por isso, consideramos revisar esse modelo e incluir o mtodo de Vassilakis (2001).
Veremos, na parte final, uma discusso entre a adoo desses diferentes parmetros,
em que levantaremos a questo de um confronto entre uma certa arbitrariedade
emprica e dados experimentais.

66
PARTE II Desenvolvimento de Ferramentas
Criativas para Eletrnica ao Vivo

Introduo:
Grande parte do texto desta segunda parte discorre sobre as ferramentas
desenvolvidas durante a pesquisa (captulos 8 a 11) que serviram de laboratrio para a
aplicao criativa dos atributos psicoacsticos em tempo real. A maior contribuio e
resultado da pesquisa se encontram nesta segunda parte. Em especial, o captulo 10
traz mdulos desenvolvidos na pesquisa em forma de patches de Pure Data e o
captulo 11 traz um patch de Pd como um sistema que engloba elementos desses
mdulos.
No captulo 7, iniciaremos um apanhado geral sobre aplicaes criativas
relativas psicoacstica. O captulo 8 foca em anlise espectral e extrao de
componentes espectrais, um estgio necessrio, pois com esse tipo de anlise que
alimentamos os objetos implementados na pesquisa.
O captulo 9, por sua vez, informa os detalhes da implementao dos atributos
apresentados na primeira parte em forma de objetos de Pure Data. Mais informaes e
detalhes tericos complementares tambm se encontram presentes nessa exposio.
Claramente, esses elementos so os pilares principais das ferramentas criativas
desenvolvidas na pesquisa, em que sua aplicao criativa se torna a questo mais
importante, a ser concluda tambm na discusso final desta tese. J o captulo 12
encerra essa exposio com algumas consideraes finais.

67
Captulo 7) Estado da Arte de Aplicaes Criativas

No h muitos exemplos de aplicaes criativas baseadas nos modelos


psicoacsticos de Dissonncia, ou ainda de psicoacstica em geral. Isso se explica por
haver um distanciamento entre a rea de pesquisa psicoacstica e a criao musical,
tornando a aplicao desta teoria em msica ainda muito incipiente. O estudo
aprofundado de Psicoacstica, alis, no faz parte da grade de estudo comum de um
msico ou compositor.
Outra questo que a teoria psicoacstica tem muito a investigar ainda sobre o
estudo da percepo de dissonncia. Esse problema j foi evidenciado na reviso
terica da primeira parte, e retomaremos esta discusso em uma reviso crtica na parte
final desta tese.
O maior potencial de aplicao desses modelos est em medir a dissonncia de
intervalos musicais, analisar estruturas harmnicas de acordes e progresses de
acordes, algo que j tem sido tratado pela teoria musical tradicional sem a necessidade
de embasamento terico psicoacstico. Entretanto, este embasamento e a
implementao de modelos em tempo real abrem portas para explorarmos novas
tcnicas.
Destacam-se, nesse sentido, as tcnicas de manipulao de Sistemas de
Afinao como as de Sethares (1999), em que uma relao entre espectro sonoro e
afinao nos permite ajustar intervalos musicais ou mesmo espectros sonoros para que
promovam mais ou menos dissonncia. No geral, as ferramentas desenvolvidas durante
a pesquisa visam explorar esse terreno em tempo real, forma que ainda no foi
devidamente explorada. Na seo 7.1 introduzimos esse tipo de aplicao, que ser
retomada nos exemplos desenvolvidos durante a pesquisa.
Dos poucos compositores que buscaram nos modelos psicoacsticos uma nova
fonte de recursos, destacamos, na seo 7.2, o trabalho de Clarence Barlow e Sean
Ferguson. Ambos, porm, trabalharam com sistemas de Composio Assistida por
Computador, e no com ferramentas em tempo real para Eletrnica ao Vivo.
Por fim, faremos um paralelo com a pesquisa e aplicaes criativas em
Descritores de udio. Esses esforos tm produzido mais exemplos criativos em
eletrnica ao vivo e este trabalho pode se configurar como uma expanso dessas
tcnicas e recursos.

68
7.1 Aplicao em Afinao e Escalas Musicais
A grande aplicao e implicao de medidas de dissonncia a possibilidade
de analisar dades (intervalos musicais) e acordes. Uma variao desse processo
consiste em explorar afinaes alternativas, em que comparamos ento as medidas
para diferentes escalas e sistemas de afinao, tcnica que Barlow (1980) tambm
incorporou em seu processo.
Um mtodo possvel de analisar sistemas de afinao por meio de anlises de
Curvas de Dissonncia, onde conseguimos encontrar intervalos mais consonantes de
acordo com um espectro sonoro e, por conseguinte, definir um sistema de afinao
mais adequado. Pelo mesmo processo, tambm podemos encontrar os intervalos mais
dissonantes, e gerar uma escala com esses pontos mnimos e mximos de
consonncia/dissonncia (Porres 2007). A partir desses dados, podemos ter um
corretor de Alturas (Pitch Shifter) para mudar a afinao em tempo real de acordo com
a afinao desejada.
Essa relao entre escala e espectro sonoro nos leva a outra tcnica possvel,
que consiste em caminhar na direo oposta. Partimos assim de uma afinao qualquer
e manipulamos um espectro sonoro para que ele promova mais consonncia com essa
afinao de entrada. Essa tcnica se chama Mapeamento Espectral (Sethares 1999) e
tambm possvel realiz-la em tempo real.
Sethares o pioneiro a desenvolver ferramentas em tempo real, tanto na
gerao de Curvas de Dissonncia (1999), quanto na possibilidade de mapeamento
espectral sendo essa desenvolvida mais recentemente com a colaborao de outros
pesquisadores (Sethares et al 2009). Em nossa pesquisa, desenvolvemos ferramentas
similares, como as apresentadas nos captulos seguintes. Faremos uma comparao e
discusso com o trabalho de Sethares et al. (2009) nas consideraes finais desta
segunda parte.
Esses autores tambm criaram o conceito de sintetizadores capazes de
manipulaes tonais dinmicas, e alguns instrumentos virtuais foram elaborados nesse
sentido. Para isso, um controlador especial para afinaes alternativas permite que
diversas afinaes sejam acessadas por uma mesma interface, e a sntese acompanha a
mudana de afinao por meio de um mapeamento espectral17.

17
Os objetos e sintetizadores virtuais foram implementados em java e MAX/MSP e encontram-se
disponveis na internet em: <http://www.dynamictonality.com/>.

69
7.2 Exemplos de Trabalhos em Composio Assistida por Computador
O termo Composio Assistida por Computador (ou a abreviao CAC)
Computer Aided Composition, em ingls possui um paradigma de adoo do
computador para realizar clculos complexos como assistncia ao processo de
composio. O compositor, ento, usa essa ferramenta como forma de gerar e analisar
material que pode ser concreto ou abstrato (notas em uma partitura).
Esse paradigma no se aplica eletrnica ao vivo, que envolve um processo de
manipulao sonora em tempo real. Em outras palavras, o paradigma de eletrnica ao
vivo envolve processos de manipulao sonora e interao em tempo real, enquanto a
CAC pode ser empregada como forma de compor msica instrumental em tempo
diferido.
Programas de computador dedicados ao paradigma de CAC possuem uma
estrutura diferente de sistemas de eletrnica ao vivo, como MAX/MSP e Pure Data,
mas tambm se configuram como sistemas de programao. Das plataformas mais
importantes de CAC, destacamos os ambientes de programao visual Open Music18 e
PWGL19, ambos distribudos gratuitamente.
A diferena estrutural que esses programas no visam uma manipulao
sonora em tempo real. Em todo caso, nada impede que ambientes de programao
grfica como MAX/MSP e Pd tambm possam conter objetos com as mesmas
funcionalidades. A ideia , ento, que no h uma inevitvel oposio entre esses
sistemas sendo assim possvel uma relao entre esses paradigmas.
A CAC surge antes dos sistemas interativos em tempo real. O motivo trivial,
pois a capacidade computacional no permitia clculos rpidos o suficiente para
operaes em tempo real. Porm, com o avano de processamento computacional, os
sistemas de CAC atualmente gozam de CPUs de alta velocidade capazes de processar
operaes diversas em tempo real.
Por outro lado, em sistemas de eletrnica ao vivo, comum que alguns
processos no sejam rpidos o suficiente e gerem uma certa latncia, ou necessitem de
uma pequena janela de tempo a ser considerada em performance. No caso das
ferramentas desenvolvidas nesta pesquisa, alguns processos se enquadram nessa
forma, como a gerao de Curvas de Dissonncia. Ou seja, nada impede que possamos
implementar operaes que ainda no ocorrem em tempo real em sistemas de
18
Disponvel em <http://repmus.ircam.fr/openmusic/home>.
19
Disponvel em <http://www2.siba.fi/pwgl/>.

70
eletrnica ao vivo, e isso promove mais uma ponte entre esses paradigmas.
O fato que sistemas em tempo real s puderam se desenvolver h
relativamente pouco tempo, e h uma constante evoluo dessas ferramentas em
acompanhamento das novas capacidades de processamento. Assim, estamos sempre
explorando os recursos at o seu limite. Esse outro fator que torna o objeto desta
pesquisa incipiente, pois a possibilidade de implementao de tais recursos em
sistemas de tempo real recente. No obstante, temos exemplos de uso dessa teoria em
sistemas de CAC, em que destacamos aqui o trabalho de Ferguson (2000) e Barlow
(1980).

7.2.1 Sistema Apprentice, de Sean Ferguson


Sean Ferguson, em sua tese de doutoramento (2000), trabalhou na composio
de um concerto para piano em que adotou o modelo de Comonalidade de Altura e
Aspereza dentre outros conceitos que no fazem parte do nosso quadro de atributos,
como a teoria de contorno rtmico e meldico. O autor implementou os modelos
psicoacsticos em um sistema de CAC chamado Apprentice (Aprendiz), desenvolvido
em Open Music.
O modelo de Aspereza adotado foi o de Hutchinson e Knopoff (1978), levando
em conta a reviso e implementao de Parncutt em um cdigo em C (1993). O
modelo de Comonalidade adotado corresponde ao trabalho de Parncutt (1989), que
tambm adotamos como base para a implementao do objeto em Pure Data. Sean
Ferguson no se valeu do conceito de Tonalness nem da Fundamental do Acorde em
seu processo composicional, tampouco do Brilho.
Nenhuma alterao microtonal ou adoo de afinaes alternativas foi
considerada, portanto o modelo de Comonalidade de Altura foi adotado por Ferguson
em seu modo original, em uma resoluo de alturas que corresponde a 10 oitavas no
sistema temperado. Um banco de dados com anlises espectrais de instrumentos
musicais foi previamente armazenado para que a entrada do programa pudesse receber
e gerar dados apenas com uma entrada abstrata de informao (notas musicais em uma
partitura).
A teoria de contorno adotada por Ferguson possui um papel relevante como
elemento unificador em seu mtodo de composio, responsvel por determinar muitos
aspectos estruturais da pea. Portanto, os atributos da dissonncia no formam o nico
pilar da obra. Levantamos aqui uma considerao que permear discusses finais, que

71
a questo de quanto, ou como, apenas um modelo de dissonncia pode sustentar uma
potica composicional. Ferguson, sobre sua viso, afirma o seguinte:
Em anos recentes, um dos meus principais objetivos tem sido aumentar o
potencial expressivo de minha msica ao fortalecer a conexo entre minhas
intenes criativas, minhas tcnicas composicionais, e as reaes do ouvinte.
Eu quero estar mais confiante que as respostas musicais bsicas que eu quero
evocar ocorrero. Eu creio que melhorar essa conexo ajudar que minhas
ideias composicionais sejam comunicadas mais claramente e efetivamente. De
modo a realizar tal objetivo, preciso que se entenda de antemo os modos
fundamentais com que as pessoas percebem seus ambientes auditivos, e ento
encontrar formas de integrar esse entendimento em processos composicionais
(Ferguson, 2000 p. 1).

Neste trecho, Ferguson entende que h um grande desafio nesse tipo de abordagem, e
que ainda estamos dando os primeiros passos nessa jornada e pesquisa. Seu concerto
foi, de fato, a primeira pea que adotou esses modelos em particular. Logo, o autor
tambm reconhece que refinamentos desse tipo de tcnica devem ser desenvolvidos a
partir de mais experincia composicional e do avano das prprias teorias e modelos
psicoacsticos. Em suma, na viso desse autor, trata-se de uma abordagem e pesquisa
ainda em aberto, incipiente, e com espao para ser devidamente explorada, sendo a sua
contribuio modesta, porm pioneira.
Em uma segunda publicao (Ferguson e Parncutt 2004), Ferguson discorre
sobre as mesmas questes, nos dando como exemplo uma segunda pea orquestral
composta por ele. No obstante, nenhuma nova considerao surge a respeito das
tcnicas e poticas composicionais.
No que diz respeito aos atributos de Dissonncia, o processo de Ferguson
consistiu em medir a Aspereza de acordes e organiz-los em uma progresso
harmnica de acordo com uma relao crescente ou decrescente dessas medidas (ditas
medidas de Dissonncia, reforando a relao sinonmica apontada entre Aspereza e
Dissonncia). J o modelo de Comonalidade de Altura foi adotado para medir a
semelhana entre acordes sucessivos, mas tambm em relao a uma sonoridade de
referncia em um plano de fundo gerado pela orquestra. So esses elementos e o
controle desses parmetros que definem a linguagem e estrutura harmnica da pea.
As figuras a seguir trazem exemplos gerados pelo sistema Apprentice. Na Figura 15,
temos medidas de Aspereza de uma srie de tetracordes. J na Figura 16, temos a
medida de Comonalidade de Altura entre acordes sucessivos.

72
Figura 15 Medidas de Aspereza para diferentes tetracordes.

Figura 16 Comonalidade de Altura entre sonoridades sucessivas.

A figura 17 nos traz um exemplo de uma anlise do contorno de dissonncia


dos acordes de piano do incio da pea, nos quais vemos que o compositor teve a
inteno de escrever uma passagem que apresentasse essa curva de resposta para a
sensao de Dissonncia (dada somente pela Aspereza).

Figura 17 contorno de dissonncia (Aspereza) da seo de abertura do concerto

73
Neste concerto para piano, Ferguson tambm define regies harmnicas ao
escolher consistentemente acordes que possuem uma alta Comonalidade com uma
sonoridade de referncia. Essa sonoridade pode estar de fato presente na pea, ou ser
apenas sugerida, implcita. No caso da sonoridade estar ausente, ela, normalmente, fora
previamente enfatizada. Na figura a seguir, temos a sonoridade de referncia principal
adotada na obra.

Figura 18 Sonoridade Referencial primria do Concerto para Piano de Ferguson

O acorde da Figura 18 inversamente simtrico, mas no h simetria em sua


transposio (h 12 possveis transposies para ele). Ferguson tambm criou uma
progresso harmnica de fundo que varia entre a sonoridade de referncia primria
sua transposio que promova a menor comonalidade com a original.

7.2.2 Sistema AUTOBUSK & Dissonometer, de Clarence Barlow


Como no trabalho de Ferguson, Clarence Barlow adota um sistema
computacional para fins de composio instrumental. Seu primeiro programa de
composio algortmica foi criado no final da dcada de 1970 (em FORTRAN) para
ser aplicado na composio da pea para piano oluotobsiletmesi (197579), em
que sua teoria sobre tonalidade e mtrica (Barlow 1980) foi primeiramente explorada.
O sistema se desenvolveu e conhecido atualmente como AUTOBUSK. Uma
implementao para computador ATARI, da dcada de 1980, se encontra disponvel
na internet20 e pode ser compilada com emulador de sistema ATARI nos PCs atuais.
Essa verso mais recente funciona em tempo real, como um sistema interativo, mas
no manipula udio em tempo real, e sim apenas gera informao MIDI.
A potica de Barlow difere da de Sean Ferguson por causa das suas influncias
de msica estocstica, tcnica composicional na qual comeou a trabalhar em 1971

20
Vide; <http://www.musikwissenschaft.uni-mainz.de/Autobusk/>.

74
(Kaske 1985) e ainda mantm presente em sua esttica e potica. Barlow tem, desde
ento, empregado frequentemente o computador como meio de gerar as estruturas de
suas obras. Portanto, o sistema composicional possui essa diferena conceitual de ser
um ambiente generativo e estocstico, enquanto Ferguson buscava uma assistncia em
seu sistema para gerar material e compor sua obra, sem o mesmo paradigma
algortmico. Apontamos a complexidade do sistema AUTOBUSK e trazemos algumas
consideraes sobre a aplicao desse sistema e o mtodo composicional em
oluotobsiletmesi.

Figura 19 tela do sistema AUTOBUSK.

O AUTOBUSK recebe uma entrada que determina a gerao de msica (em


formato MIDI) de acordo com os parmetros dados. O resultado depende do conjunto
de vrios parmetros e no totalmente determinstico, estando sujeito a diversas
possibilidades coerentes com as especificaes dadas. Alm de conceitos
psicoacsticos como a Aspereza, o sistema de Barlow se baseia em conceitos prprios.
Logo, assim como Ferguson, o compositor no se vale apenas de atributos da
dissonncia como mtodo de desenvolvimento composicional.
O sistema de Barlow, para essa pea, traz oito parmetros texturais, que podem
ser definidos individualmente por mais de um conceito que, por sua vez, pode consistir

75
em um processo com mais de um passo. De modo geral, eles se relacionam com uma
teoria rtmica/mtrica e tonal/harmnica. Dos oito parmetros, quatro so ditos
principais, enquadrados em dois grupos: Coeso (mtrica e harmnica) e
Suavidade (rtmica e meldica). Dos parmetros secundrios, temos conceitos como
densidade do acorde (nmero de notas), densidade de pausa, dinmica e articulao.
Dado essa complexidade, ressaltamos apenas o papel dos atributos relacionados
nossa pesquisa (Aspereza e Harmonicidade). Ateremo-nos, ento, aos parmetros de
coeso harmnica e suavidade meldica. Sua teoria de Harmonicidade foi adotada para
analisar escalas e afinaes alternativas. Barlow calculou um valor geral de
Harmonicidade dentre os intervalos (razes) de vrias escalas/modos possveis,
considerando alteraes em quartos de tom. O parmetro de coeso harmnica controla
a tonalidade da pea, que varia de uma atonalidade ao surgimento de modos e escalas.
J a suavidade meldica diz respeito a saltos intervalares. Um salto mais suave para
tons adjacentes, enquanto uma menor suavidade gera saltos aleatrios e pontilhsticos.
Junto a isso, temos a medida de consonncia (Aspereza) e Harmonicidade em relao
fundamental do acorde.

Figura 20 Tela do programa Dissonometer, de Barlow.

76
Dissonometer outro programa desenvolvido por Barlow que se dedica apenas
medida de Dissonncia entre dois espectros sonoros (vide Figura 20). A medida de
Dissonncia, entretanto, dada apenas pelo modelo de Aspereza, que o modelo
adotado como base em nossa pesquisa. Com essa ferramenta, possvel fazer o mesmo
tipo de ordenao que Sean Ferguson empregou em seu trabalho.
Na Figura 20, o quadro maior representa o espectro sonoro, dado na escala da
banda crtica. As curvas no canto superior direito representam as funes
psicoacsticas, como a curva de Plomp e Levelt (1965) em roxo claro, as curvas de
loudness, em vermelho, a converso de Hz para a escala da banda crtica (bark), em
verde, e uma funo de mascaramento segundo Zwicker e Fastl (1999), em amarelo.

7.3 Aplicaes Criativas com Descritores de udio


Traamos aqui uma espcie de paralelo com Descritores de udio que se
mostrou necessria, pois colocaremos os atributos psicoacsticos de dissonncia
tambm em um paradigma de descritores. Relembrando que os Descritores de udio
esto em um nvel mais baixo de percepo, os modelos aqui descritos podem ser
encarados como Descritores Psicoacsticos, de um nvel mais alto, ou ainda
Descritores de Dissonncia. Portanto, mesmo que paralelo de certo modo, os
programas e aplicaes com descritores de udio so tambm referncias para esta
pesquisa.
J que a adoo de atributos psicoacsticos (ou de nveis mais altos) em
aplicaes musicais criativas ainda uma rea muito incipiente, os exemplos com
Descritores de udio se tornam relevantes e importantes. Os Descritores de udio
despontam de forma muito mais consolidada em aplicaes criativas em tempo real e
podem ser encarados como um primeiro passo nessa trilha que estamos traando.
Quanto s aplicaes criativas, em linhas gerais, as informaes extradas por
Descritores de udio podem ser usadas como dados de controle dos modos mais
diversos. Por exemplo, com a deteco de um dado qualquer, como a altura de um
som, podemos ento usar essa informao para controlar outro parmetro qualquer,
como a intensidade sonora. Esse tipo de procedimento , na verdade, um processo
muito elementar em eletrnica ao vivo, que um ambiente onde sempre exploramos
quaisquer possibilidades de interao. Em todo caso, o interessante encontrar
aplicaes mais pertinentes, com um potencial prprio e especial. Estamos lidando

77
com informaes sonoras bem especficas, que descrevem elementos musicais
distintos, em que o reconhecimento e identificao de certas qualidades sonoras pode
fornecer novas possibilidades criativas.
Os descritores de udio aplicados em MIR (Music Information Retrieval) visam
extrair informaes bsicas, a partir das quais podem ser derivados elementos
secundrios e mais complexos, como deteco de ritmos. Dos elementos fundamentais
de um som, entende-se que podem ser descritos por quatro elementos bsicos: altura,
intensidade, durao e timbre (Peeters 2004). De modo simplificado, uma nota em uma
partitura musical tambm codifica esses quatro elementos.
Dos quatro elementos citados, o timbre o mais difcil de definir e, por
conseguinte, descrever. A definio mais simples de timbre o caracteriza como uma
dimenso que permite distinguir sons com uma mesma durao, altura e intensidade.
Ou seja, trata-se, na verdade, de uma definio por excluso, sem uma definio
positiva clara, a ponto de um autor como Bregman (1990, p.93) afirmar que o timbre
a lata de lixo de todas as caractersticas que no podem ser rotuladas como altura ou
loudness.
Um paralelo entre timbre e Dissonncia foi apontado por Vassilakis (2001)
que, parodiando Bregman, afirmou que o Dissonncia de consonncia tem sido a lata
de lixo de julgamentos avaliativos estticos em msica. Esses exemplos denotam uma
pobreza da linguagem em definir e esmiuar esses conceitos. A pesquisa psicoacstica,
assim, contribui para um enriquecimento desses conceitos a partir do mapeamento de
parmetros fsicos/psicofsicos que podem ser relacionados percepo tanto de
timbre quanto de Dissonncia.
Enquanto a durao, altura e intensidade so qualidades perceptivas mais
simples e relacionadas com poucos fatores acsticos, o timbre se caracteriza como
dependente de um conjunto maior de fatores, levando em conta diferentes dimenses
perceptivas. Como a descrio e deteco de durao, altura e intensidade sonora so
processos mais simples e relativamente consolidados, os maiores esforos atuais de
pesquisa se concentram em aplicar descritores de udio na identificao e descrio de
timbre.
Quanto aos aplicativos especficos para eletrnica ao vivo, apontamos algumas
bibliotecas existentes em Pure Data (h j pelo menos trs conjuntos delas). A
biblioteca LibXtract, desenvolvida por Jamie Bullock (2007), contm alguns dos
atributos pertencentes ao padro MPEG-7 e ao projeto CUIDADO. Essa biblioteca foi

78
implementada em Pure Data e em Sonic Visualizer21 um programa de computador
especializado em gerar anlises de atributos sonoros. Logo, a caracterstica principal
dessa biblioteca de simples e pura descrio de atributos, e no tem funo criativa
prpria.
J a biblioteca de Monteiro e Manzolli (2010) traz uma boa coleo de
descritores de udio em abstraes de patches de Pd. Esse trabalho busca aplicaes
em tempo real a partir dos dados extrados em performance ao vivo, em que a pesquisa
analisou parmetros extrados do comportamento fsico do som para duas funes:
segmentao de eventos do sinal de udio (como notas), ou seja, deteco de incio e
fim de cada evento, e classificao de alturas de cada segmento. Tambm foram
desenvolvidos alguns experimentos com Mapas de Poincar para visualizao da
dinmica de alguma funo (no caso, o fluxo espectral, mas poderia ser outra
dependendo da necessidade).
William Brent (2009) desenvolveu uma biblioteca para Pure Data voltada para
classificao e anlise de timbres e avaliou a eficcia dessas medidas. Ele se vale de
alguns poucos descritores, que so na maioria os mesmos descritores de baixo nvel da
LibXtract. Porm, Brent busca maior objetividade e usabilidade em seus objetos, alm
de buscar fornecer aplicaes criativas baseadas nesses descritores j voltadas para um
usurio final, o que resultou em um objeto classificador, o [TimbreID]. Esse trabalho
o que mais se volta a aplicaes criativas avanadas, como a Sntese Concatenativa, e
ser retomado na subseo 7.3.2 deste captulo. Partimos agora para algumas
aplicaes especficas dos Descritores de udio.

7.3.1 Identificao de Alturas


A extrao de informao sobre a Altura (Pitch Tracking) um dos elementos
que obtemos com Descritores de udio e tambm uma referncia nesta pesquisa, pois,
como veremos adiante, trabalhamos com manipulao de intervalos musicais e
construo de harmonias, em que o processo de identificao de alturas nos ajuda
muito. De fato, um ponto levantado nesta tese como os modelos de Tonalness e
Fundamental do Acorde podem ser considerados descritores de altura mais refinados,
assim como os dados do Perfil de Peso de Alturas e Perfil de Salincia de Alturas.
Antes de mais nada, descreveremos a Identificao de Altura como um

21
Disponvel em <http://www.sonicvisualiser.org/>.

79
processo simples e direto de descrio de udio, em que modelos visam extrair a
fundamental de um tom complexo sem uma preocupao maior na resposta perceptiva.
A Identificao de Altura foi responsvel por uma das primeiras e mais importantes
tcnicas em eletrnica ao vivo, o Acompanhamento de Partitura, mencionado a seguir.
Na sequncia, traremos uma expanso desse paradigma com outras possibilidades
tcnicas.

7.3.1.1 Acompanhamento de Partitura (Score Following)


Na dcada de 1980 do sculo XX em uma primeira fase, antes ainda de uma
possvel anlise em tempo real da entrada de sinal sonoro o processo de
Acompanhamento de Partitura (do ingls Score Following) se desenvolveu com o
advento do protocolo MIDI. Esse processo bem trivial, em que um msico toca um
instrumento MIDI como um teclado sintetizador e o computador pode facilmente
acompanhar a entrada de notas.
Assim que a capacidade computacional permitiu anlises em tempo real, uma
nova gerao de Score Following comeou a se desenvolver apenas com a
identificao de alturas de uma entrada de udio. Essa uma das primeiras e mais
importantes tcnicas que surgem em Eletrnica ao Vivo e implica um paradigma
central, em que o computador pode entender e acompanhar um intrprete que est
tocando um instrumento acstico em tempo real.
Esse paradigma ainda o elemento chave que estamos explorando com a
possibilidade de identificao de novos parmetros alm da altura, como trazidos nesta
pesquisa. Entretanto, o Score Following manteve-se alheio e ainda se vale,
principalmente, de Deteco de Alturas, em que uma representao da partitura
previamente armazenada no computador e um detector de Alturas pode apontar em que
lugar na partitura o intrprete estaria tocando.
O paradigma de Score Following um timo exemplo de como podemos
identificar um descritor e programar uma reao a ele. Sua aplicao tem sido restrita e
limitada, mas possui atualmente um grande potencial de expanso que ainda comea a
ser explorado. Este processo pode ser expandido com a deteco de outros elementos,
sejam eles descritores de udio prprios da identificao de timbre, ou ainda atributos
psicoacsticos de ordem superior. Ao se abrir para diversos atributos, o Score
Following pode ser expandido para uma forma mais geral de Feature Following.

80
7.3.1.2 Antescofo~ (Expanso do Paradigma de Score Following)
Os avanos em Acompanhamento de Partitura tm envolvido sistemas de
reconhecimento de trilos, apogiaturas, nota, e tambm sistemas de antecipao e
deteco de tempo e andamento, como o antescofo~ desenvolvido no IRCAM22 por
Arshia Cont (2008a, 2008b). O trabalho de pesquisa de Cont em modelagem de
Antecipao Musical, implementada no seu software, cujo nome vem de Antecipatory
Score Following. O antescofo~ um mdulo de Score Following para MAX/MSP e
Pure Data. Alm de ser um mdulo com capacidades avanadas de deteco de tempo,
o sistema tambm se constitui como uma linguagem de programao sncrona
dedicada composio musical, que permite uma interao mais flexvel com o
computador.
Esse trabalho expande o paradigma de Acompanhamento de Partitura e se
apresenta como uma ferramenta de interao em computao musical para composio
e performance, que tende a evoluir continuamente. Sua estrutura modular permite uma
abertura para incluir dados de representao musical definidos pelo usurio. Aqui se
inclui perfeitamente a codificao de elementos no convencionais em Score
Following, que seriam baseados em deteco de Altura, por exemplo. Tal abertura
permite a adoo, para esse fim, de Descritores de udio e modelos Psicoacsticos.
Em suma, trata-se de um ambiente que se abre a esse conceito de Feature Following.

7.3.1.3 Outras Aplicaes com Deteco de Alturas


O Acompanhamento de Partitura tambm carrega outro paradigma, que o da
prpria partitura. Ou seja, da existncia de uma obra fechada e uma sequncia de
eventos pr-determinada. A identificao de alturas, ou outros parmetros podem ser
usados fora desse contexto, como em sistemas abertos de improvisao e performance.
Em paralelo a esses simples processos de identificao e interao, podemos
pensar em processos mais sofisticados de manipulao dos dados. No momento em
que identifico uma altura, posso buscar em um banco de dados sons com outros
timbres que possuam a mesma altura. possvel analisar um trecho gravado e orden-
lo em ordem ascendente ou descendente.
Veremos logo mais como esse tipo de processo pode ser interessante no que diz
respeito ao reconhecimento de timbre. Veremos tambm como o objeto [Pitch-

22
Vide <http://www.ircam.fr/>.

81
Commonality] desenvolvido nesta pesquisa capaz de comparar alturas de sons
distintos e buscar em um banco de dados sons que possuam uma alta afinidade (como
uma nota em relao de oitava ou quinta).
Outro exemplo criativo dessa ordem um patch de Pure Data desenvolvido por
Miller Puckette e apresentado em uma performance com ele (na guitarra) e Rogrio
Costa (no saxofone alto) na PdCon09 (Terceira Conveno Internacional de Pure
Data). Nesse caso, a entrada de udio de um instrumento foi armazenada em um banco
de sons e usada para imitar a linha meldica de outro instrumento em tempo real. Por
exemplo, enquanto o sax tocava uma linha meldica, o computador analisava o
material pr-gravado da guitarra e alterava a altura das notas para reconstruir a linha
meldica. Veremos no captulo 10 como o sistema desenvolvido nesta pesquisa
tambm capaz de imitar uma linha meldica de um modo similar. Isso depende,
claramente, de mdulos de mudana de altura, tambm apresentados na exposio dos
patches desenvolvidos durante esta pesquisa.

7.3.2 Identificao de Timbres e Reconstruo de Timbres


Dado a complexidade que envolve a compreenso de percepo de timbre, sua
identificao, descrio e modelagem ainda so problemas complicados e no
completamente resolvidos. No que diz respeito s aplicaes criativas, temos,
igualmente, a capacidade de deteco de certas caractersticas e a possibilidade de
programarmos diferentes formas de interao com essa informao, ou ainda imitar e
reconstruir sonoridades com qualidades similares. aqui onde encontramos o real
estado da arte em aplicaes de Descritores de udio em criao musical.
A biblioteca de William Brent em Pure Data foi testada e otimizada para
algumas aplicaes como a identificao de vogais e instrumentos de percusso.
Mencionamos que esta uma biblioteca com poucos descritores e isso um sinal que
com apenas alguns descritores j possvel obter bons resultados para certos
problemas. Um grande nmero de descritores no garante uma refinada extrao de
atributos particulares. A maioria dos descritores formalizada por anlises estatsticas
sob o espectro sonoro, e isso gera uma certa redundncia ou similaridade, sendo
possvel encontrar um subconjunto de descritores mais eficientes para certos fins.
Com a capacidade de reconhecer certas qualidades sonoras, podemos organizar
sons com caractersticas semelhantes, ou mesmo dissimilares. Nesse mbito, desponta
uma tcnica que consiste em reconstruir ou imitar um som a partir de outros com

82
caractersticas similares, conhecida como Sntese Concatenativa. Essa reconstruo se
d a partir de pequenos trechos sonoros, ou gros. Isso faz dessa tcnica uma
extenso de Sntese Granular. A Sntese Concatenativa tambm uma das
possibilidades fornecidas pela biblioteca de William Brent.
Em MAX/MSP, temos um mdulo de Sntese Concatenativa chamado
CATART (Diemo et al 2006). Destacamos um trabalho de composio baseado nesse
sistema por Bruno Ruviaro (2010). Como o nome do seu texto (no portugus:
Impropriedade intelectual: emprstimos musicais como manifesto em composies
acsticas e eletroacsticas) informa, trata-se de uma potica de gerar novos objetos
musicais a partir de material de outros compositores. Apesar de a tcnica de Sntese
Concatenativa possuir essa aplicao de reconstruo sonora, no exatamente isso
que Ruviaro explora. Esse exemplo ilustra como um trabalho criativo em composio
musical pode subverter os princpios e potencialidades de um sistema qualquer, em
que o compositor encontra inspirao na tcnica para uma potica criativa distinta.
Motivaes dessa ordem so mais que bem-vindas em composio musical.
Esse outro fator que, de certa forma, no contribui para a promoo de ferramentas
como as desenvolvidas em nossa pesquisa. Afinal, trata-se apenas de uma ferramenta,
de um instrumento, e essa questo ser retomada na discusso final deste trabalho,
frente a exemplos criativos desenvolvidos durante a pesquisa.
Outro exemplo interessante e relacionado tcnica de Sntese Concatenativa e
ao trabalho de Bruno Ruviaro a performance audiovisual sCrAmBlEd?HaCkZ!, de
Sven Knig23. Esse trabalho se vale de um processo de reconstruo de uma entrada de
som ao vivo, que a voz do performer. A sua reconstruo ocorre a partir de um banco
de sons de algum famoso clipe musical, cujo vdeo tocado junto com os respectivos
trechos de udio. Em todo caso, no se trata propriamente de reconstruir uma fala
reconhecvel, mas sim de um ambiente de controle onde, por meio da voz do
performer, possvel gerar loops a partir de ritmos e barulhos vocais como beatbox
ao mesmo tempo em que se edita o vdeo ao vivo.
Terminando a exposio de ferramentas relacionadas ao reconhecimento de
timbre, trazemos ainda mais um exemplo, para reforar como esse campo tem sido
explorado em diversos desdobramentos. Com o programa Orchide24 e SPORCH25, a

23
Vide <www.popmodernism.org/scrambledhackz/>.
24
Disponvel em <http://repmus.ircam.fr/orchidee>.
25
Disponvel em <http://sporch.sourceforge.net/>.

83
identificao e reconstruo de timbres permite que uma entrada sonora seja
reconstruda a partir da combinao de instrumentos orquestrais. Esse processo
expande, na realidade, a tcnica de reconstruo de timbre para que seja adotada na
msica instrumental.

7.3.3 Expanso com Descritores de Dissonncia


Enquanto processos de Sntese Concatenativa e similares so comuns e esto
em um estgio interessante de desenvolvimentos de pesquisa, processos da mesma
ordem com descritores de nvel mais alto, como os atributos da dissonncia aqui
expostos, ainda no foram devidamente explorados, salvo alguns exemplos como os
processos de composio assistida por computador de Ferguson (2000) e Barlow
(1980). Mas, levando em considerao novas possibilidades em tempo real, ou
ferramentas de eletrnica ao vivo como MAX/MSP e Pure Data, podemos somente
mencionar uma ferramenta recm-lanada por Sethares et al (2009), que ainda no tem
sido devidamente explorada por compositores.
O paralelo com Descritores de udio foi apresentado para indicar como as
novas ferramentas aqui pesquisadas dialogam com esses esforos. Para tal, encaramos
os atributos perceptivos estudados em nossa pesquisa tambm como Descritores. No
caso, para distingui-los, chamaremos de Descritores de Dissonncia. E, assim,
apontaremos algumas consideraes sobre como esses atributos psicoacsticos podem
se constituir como uma expanso dos processos apresentados.
Por exemplo, da mesma maneira que sons de uma performance ao vivo podem
ser armazenados e extrados de modo a imitar uma linha de entrada, podemos agora
fazer que um som com aspereza alta dispare um som igualmente spero. Ou ainda usar
esse dado de comparao para buscar um som com qualidades opostas.
Nesse paradigma de descritores de dissonncia/harmonia, comparar e combin-
los implica, em uma primeira instncia, gerar sonoridades consonantes ou dissonantes,
como na sobreposio simultnea de duas sonoridades (uma dade). Mas tambm
podemos pensar em gerar sequncias de sonoridades e acordes com caractersticas em
comum ou contrastantes, ou ainda em uma ordem crescente/decrescente de medidas
em uma progresso harmnica. Podemos apenas adotar um descritor, ou mais de um
para nos guiar em ambos processos: formar acordes, ou gerar progresses de acordes.
O paralelo se torna mais evidente quando se constata que tanto Ferguson (2000)
quanto Barlow (1980) exploraram esses processos, mas no em tempo real.

84
A expanso e real paralelo se d com a comparao de informaes adquiridas
em tempo real, como o sinal de dois instrumentos musicais sendo tocados ao vivo, ou
ainda na comparao com sons pr-analisados e armazenados, assim como na Sntese
Concatenativa. Tomemos como exemplo o descritor de Comonalidade de Altura, uma
vez que ele , por natureza, um descritor de comparao entre duas sonoridades.
possvel ento analisar uma nota musical ao vivo e comparar com dados armazenados
de anlises prvias, e assim buscar uma sonoridade que tenha alta ou baixa
Comonalidade com o sinal de entrada, que pode ser usada para formar uma dade, um
acorde. No caso, o mesmo processo pode ser aplicado para construir uma sucesso de
acordes.
Levando em conta a Aspereza, o modelo no necessita de duas sonoridades ou
acordes distintos para aferir uma medida, mas podemos igualmente pensar em
comparar a medida de dades ou acordes distintos. No caso de formar uma dade ou
acorde, podemos somar os espectros de entradas diferentes para ento extrair a medida.
Mais detalhes na apresentao dos objetos desenvolvidos durante a pesquisa.
Apesar de apontarmos para essa potencialidade, ela no foi devidamente
explorada criativamente. Trabalhamos mais com o paradigma de Curva de
Dissonncia, que, na prtica, tambm consiste em uma espcie de Descritor, mas para
intervalos musicais e no de objetos sonoros em si.

85
Captulo 8) Extrao de Componentes Espectrais

Neste captulo, discorreremos principalmente sobre Anlise Espectral, que


uma forma de extrair componentes espectrais de uma entrada sonora. Esses dados so
necessrios para alimentar os modelos psicoacsticos implementados em pesquisa,
visto que necessitam de uma descrio da sonoridade em listas de frequncias e
amplitudes. Alm disso, h outros desdobramentos em aplicaes criativas, como a
possibilidade de separar rudo de fundo e contedo tonal, exposta no captulo 10.
S o fato de que os modelos psicoacsticos aqui apresentados dependem de
uma representao do espectro j faz que praticamente todas as tcnicas e aplicaes
descritas necessitem de anlises espectrais, que apenas um ponto inicial, a partir de
onde ainda precisamos detectar e extrair os componentes espectrais para chegarmos em
listas de frequncias e amplitudes. Somente a partir da que esses dados so inseridos
nos modelos psicoacsticos. No caso de um descritor de nvel mais baixo como o
Brilho, o resultado de uma anlise espectral j cobre a maior parte do processo, pois
apenas o clculo do centroide espectral sobre os dados da Anlise Espectral j quase
corresponde ao produto final.
Uma Anlise Espectral , portanto, um requisito importante, em que apontamos
alguns fatores mais relevantes. Por fim, tratamos do objeto [sigmund~], que j vem na
distribuio oficial de Pure Data e possui capacidades diversas alm da deteco de
componentes espectrais. Com esse objeto, podemos tambm extrair dados para
ressntese via banco de osciladores e detectar Altura. Esses processos possuem,
igualmente, um grande impacto e pertinncia dentre nossas ferramentas desenvolvidas.

8.1 FFT (Caractersticas e Implicaes)


A Transformada Rpida de Fourier (Fast Fourier Transform, ou, simplesmente
FFT) um tipo de Anlise Espectral adotada para implementaes computacionais. O
termo rpido indica que o algoritmo otimizado para operaes mais geis, que
promovem um menor custo computacional. A anlise decompe um sinal digital em
seus componentes no domnio da Frequncia, e o termo transformada se refere
justamente ao processo de transformar do domnio do tempo para o da frequncia. A
Transformada Inversa faz a converso inversa, do domnio da frequncia para o
domnio do tempo.

86
As anlises so feitas em trechos do sinal digital, esses recortes so de um
mesmo tamanho, dado pelo nmero de amostras. No domnio do tempo, essas
amostras representam a variao de amplitude. O bloco de amostras tambm
chamado de janela transformado para o domnio da Frequncia, onde cada
amostra agora representa uma frequncia que vai de 0 Hz (primeira amostra) at a
frequncia de Taxa de Amostragem.
Essa sequncia de frequncias uma progresso linear, harmnica. Na FFT, h
um paradigma que o bloco analisado compreendido como um sinal peridico, tal
como uma forma de onda. Esse paradigma faz com que a anlise trate um som
complexo qualquer como um sinal harmnico, decomposto em uma srie harmnica.
Nesse aspecto, h uma grande semelhana com o conceito de Sntese Aditiva, em que
um tom complexo pode ser formado pela somatria de diversos tons puros. Inclusive,
entende-se que a transformada inversa um tipo de ressntese do sinal, como se fosse
feita por meio de um banco de osciladores.
Uma primeira caracterstica que, quanto maior o bloco de udio, maior ser a
resoluo em frequncia. Em contrapartida, uma janela grande de tempo significa uma
menor resoluo de tempo, o que implica uma maior latncia. Isso no gera dados bons
para sons que so muito dinmicos, com mudanas rpidas e abruptas, pois o bloco
todo ser compreendido como um objeto nico e peridico. Em outras palavras, h
sempre uma escolha entre uma boa resoluo de frequncias ou de tempo.
Mas, mesmo que estejamos analisando um sinal relativamente simples
(harmnico, esttico e com poucos componentes espectrais) h informao de rudo
gerada no processo de anlise. Veja por exemplo a figura 21, que uma anlise de um
sinal senoidal, consistindo apenas em um tom puro com frequncia de 6 KHz. O bloco
analisado relativamente pequeno, com 128 amostras. Dessas, 64 amostras dizem
respeito a um registro de frequncia desde 0 Hz at a frequncia de Nyquist (22.050
Hz em uma Taxa de Amostragem de 44.100). Cada ponto de amostra est ento a
344.5 Hz de diferena do seguinte, que a banda de frequncia, dada pela Taxa de
Amostragem divida pelo tamanho do bloco (44.100 / 128). Os grficos da figura 21
plotam o resultado da anlise no domnio da frequncia na forma Cartesiana
(coordenadas no plano complexo, formada pelas partes real e imaginaria, ou ainda
amplitudes de cosseno e seno) e na forma Polar, que d a Amplitude e Fase inicial de
cada componente. Estamos mais acostumados a ler a informao do grfico na forma
Polar, mais especificamente, o grfico de Amplitudes.

87
Figura 21 Anlise Espectral.

Notemos ento como um componente espectral no corresponde a apenas um


ponto de amplitude no grfico verde. possvel constar artefatos em um patamar,
mesmo que baixo, por boa parte do registro de frequncias, e mesmo o pico em si no
est em apenas um ponto de frequncia. Esses dados so um reflexo direto das
amplitudes das partes real e imaginria (grficos da forma cartesiana), que possuem
uma disposio similar. O grfico das fases o mais difcil de analisar visualmente e
gera padres grficos e valores mesmo na ausncia de valores relevantes de
amplitudes.
O que se deve ressaltar que os dados de anlise sempre se caracterizam como
uma aproximao. No caso acima, a banda de frequncia relativamente grande, de
344.5 Hz. O tom senoidal analisado, a 6 KHz, no se encaixa como um mltiplo da
frequncia de banda de anlise a 344.5 Hz. assim que se gera boa parte de artefatos e
rudos, pois muito raro termos componentes espectrais que sejam perfeitos
harmnicos da banda de anlise. E mesmo que a anlise seja feita em um bloco maior,
de maior resoluo, ainda se trata de uma aproximao.
O maior reflexo dessas aproximaes est no grfico das fases, que o menos
esttico de todos. Se os componentes espectrais correspondessem perfeitamente aos
pontos de frequncia, o grfico das fases seria mais uniforme, j que cada componente

88
teria a mesma fase inicial na prxima janela de anlise.
Inclusive, para uma Transformada devidamente acusar a frequncia com uma
melhor resoluo, usa-se uma tcnica baseada em computar a diferena de fase entre
uma anlise e outra. Veremos tambm uma implicao disso na implementao de
Phase Vocoder, pois foi a partir do desenvolvimento dessa tcnica que esse
procedimento ficou conhecido.

Figura 22 Diferena de Fase entre janelas sequenciais.

A figura 22 representa blocos de udio com 512 amostras, o que, em uma Taxa
de Amostragem de 44.100 Hz, nos d bandas de frequncia de 86.13 Hz. Temos ento
uma frequncia com esse exato valor na parte de cima da Figura, que cabe de modo
uniforme em cada bloco de anlise. J um valor prximo, de 90 Hz, tem um ciclo um
pouco menor e gera uma diferena de fase na medida em que se sucedem as janelas de
anlise. Ao computar essas diferenas de fase, possvel acusar com maior acuidade
qual a frequncia real analisada.
A seguir, uma implicao direta dessas consideraes em um primeiro patch
desenvolvido na pesquisa, baseado no objeto [sigmund~]. Esse objeto capaz de aferir
com grande preciso a frequncia de vrios componentes de uma anlise espectral a
partir desse tipo de procedimento.

89
8.2 Extrao de Listas de Parciais com [sigmund~]
O objeto [sigmund~] possui uma srie de capacidades, como a extrao de
parciais mais proeminentes em um espectro. Ele se encontra disponvel como objeto
nativo do Pure Data, e foi desenvolvido por Miller Puckette, sendo sugerido pelo autor
no lugar de um objeto desenvolvido anteriormente com as mesmas funes, chamado
[fiddle~] (Miller 2007). Uma verso desse objeto tambm est disponvel como objeto
externo de MAX/MSP.
O objeto recebe uma entrada direta de sinal de udio e computa uma
transformada de Fourier. A partir de operaes diretas nos dados de FFT, o [sigmund~]
nos entrega a Altura do som, seu envelope ou intensidade e tambm informao dos
parciais mais intensos encontrados.

________

Figura 23 funes bsicas do objeto [sigmund~] em seu arquivo de ajuda.

A figura 23, esquerda, nos mostra uma simples deteco da altura de um


oscilador e seu envelope de amplitude. O padro de inicializao do [sigmund~] uma
janela de 1024 pontos e um hop26 de 512. A altura dada em nmero MIDI, cujas
casas decimais equivalem a unidades em cents. A figura mostra como uma entrada de
frequncia em MIDI com at quatro casas decimais (duas casas decimais de um cent)
foi detectada com sucesso. Essa resoluo equivale a duas casas decimais de um cent.
direita da figura 23, temos o [sigmund~] fornecendo informaes de componentes
espectrais especficos em dois outlets, que correspondem aos argumentos tracks e
peaks. O padro que ele detecte at 20 parciais, mas isso pode ser facilmente
mudado. Os picos so dados em uma sequncia de listas e o objeto [route] permite

26
Hop (salto em ingls) a diferena entre duas janelas de anlise de uma FFT. Nesse exemplo, o hop de
512 a metade do tamanho da janela (1024). Outra maneira de dizer isso que o overlap (sobreposio) de 2.

90
selecionar apenas uma delas (a primeira, em ambos os casos). A sada tracks (sada
esquerda) detecta faixas contnuas de componentes espectrais e com essa informao
podemos reconstituir o som com um banco de osciladores. O [sigmund~] tambm foi
adotado em patches de ressntese e deteco de altura, como veremos mais adiante.
Aqui, portanto, apenas ressaltamos a extrao de listas. Em peaks (sada direita do
objeto), os componentes espectrais so ordenados do mais proeminente ao mais
nfimo, ou at inexistente. Por essa opo de elencar a quantidade de parciais mais
intensos, esse objeto tambm funciona como um filtro, que podemos usar para gerar
listas de at um nmero especfico de parciais considerados relevantes.

Figura 24 Listas de Amplitudes e Frequncias com o [sigmund~]

A Figura 24 um patch de Pd que exemplifica como adotamos o objeto


[sigmund~] para nos dar listas de frequncias e amplitudes a serem inseridas nos
modelos psicoacsticos. A anlise de uma forma de onda gerada pelo objeto
oscilador [triangle~], que capaz de fornecer formas de ondas triangulares e dente-de-
serra. Como a sada peaks nos d os valores do parcial mais forte ao mais fraco, nem
sempre teremos uma srie perfeitamente ordenada de parciais do mais grave ao mais
agudo. No caso acima, conseguimos uma srie ordenada devido s caractersticas da
forma de onda. Em todo caso, a ordenao das listas no faz diferena na entrada dos
modelos psicoacsticos implementados, apenas essencial que os termos na lista de
frequncia correspondam aos termos na lista de amplitudes.

91
Captulo 9) Objetos Desenvolvidos

Um cdigo em C pode ser compilado para gerar um objeto e ser facilmente


carregado no Pure Data como um objeto externo. Mas um cdigo em C pode conter
tambm um conjunto de funes e dar origem a diversos objetos como subprodutos.
Nesse caso, esse cdigo em C pode gerar mais de um objeto e compreendido como
uma biblioteca. Em nossa pesquisa, desenvolvemos principalmente dois cdigos em
C que so bibliotecas. Um diz respeito ao modelo de Aspereza, e outro ao modelo de
Comonalidade de Altura.
Alm desses, temos a implementao de Brilho que foi simplesmente adotada de
outra pesquisa (Bullock 2007), e a implementao do modelo de Harmonicidade de
Clarence Barlow (1987), que tambm uma biblioteca por resultar em mais de um
objeto.

9.1 Objeto [sharpness]


A implementao de Brilho (Sharpness) est de acordo com o modelo dado por
Zwicker & Fastl (1999). Um objeto de Pure Data com igual implementao j estava
disponvel na biblioteca de descritores de udio de Jamie Bullock (2007). Pela
simplicidade desse modelo em relao aos outros apresentados a seguir, tanto em
conceito quanto implementao, pouca margem nos restou para buscar e investigar
melhorias em termos de implementao e acuidade dos resultados. De tal maneira,
tambm diferentemente das outras implementaes, nada tivemos a acrescentar. Mais
consideraes sobre a questo do Brilho sero retomadas na discusso terica final.

9.2 Biblioteca do Modelo de Aspereza


Alm do objeto [roughness], que calcula a Aspereza de um espectro, geramos
dois objetos extras que so funes de converso adotadas no processo. Veremos esses
conversores primeiro, uma vez que cumprem etapas iniciais no modelo de Aspereza.

9.2.1 Conversor de dB para Phons e Sones


Esse objeto um subproduto contido no modelo de Aspereza de Clarence
Barlow (2008), que requer uma descrio das amplitudes na escala psicoacstica de
intensidade em Sones, computadas a partir de valores em Phons. A grandeza Phon

92
mede a percepo de intensidade sonora, uma vez que um som com uma mesma
amplitude em decibeis evoca diferentes sensaes de intensidade (loudness) de acordo
com o registro em frequncia.
As curvas de respostas, ou Curvas de Contorno de Loudness, foram
primeiramente medidas em testes por Fletcher e Munson (1933), sendo que uma
reviso dos dados foi elaborada por Robinson e Dadson (1956). Recentemente, temos a
ISO 226:2003 que uma reviso da Organizao Internacional para Padronizao
(ISO) feita no ano de 2003.
Por definio, em 1 KHz, um valor de intensidade em dB-SPL (presso sonora
em decibeis) equivale ao mesmo valor em Phons. Na medida em que mudamos a
frequncia, h uma variao de valores em Phons de acordo com a resposta perceptiva,
medida em testes psicoacsticos. Portanto, dizer que a intensidade sonora de 60
Phons significa afirmar que to intenso quanto um som de 60 dB-SPL a 1 KHz.

Figura 25 Distribuio das Curvas de Loudness sobre


frequncias no eixo horizontal e decibis no eixo vertical.

Por esse motivo, se temos um grfico em dB no eixo vertical e frequncias no


eixo horizontal, linhas que representam valores fixos de Phons possuem um formato de
curva. Esse tipo de grfico representa as ditas Curvas de Iso Loudness. Na figura 25,
temos um grfico com as curvas de acordo com dois dos resultados recm-
mencionados. Em azul, temos uma representao dos dados obtidos por Robson e
Dadson (1956). J a reviso feita pela ISO em 2003 dada em vermelho. De baixo
para cima, as seis linhas de cada cor representam as curvas de 0, 20, 40, 60, 80 e 100
Phons.

93
A partir de funes, podemos emular o contorno das curvas que valores fixos
de Phons representam em um grfico dado em dB. Desse modo, trivial encontrar o
valor em dB a partir de um valor de frequncia e outro de intensidade em Phons. Em
compensao, o que mais nos interessa justamente o contrrio, achar um valor em
Phons para uma frequncia e sua amplitude em dB. Infelizmente, essas funes no
so passveis de inverso, o que dificulta esse processo.
Clarence Barlow (2008) codificou em Pascal funes Phon-dB a partir dos
dados de Robson e Dadson (1956), que emulam as curvas de Phon como apresentadas
na figura 25 e possibilitam a converso de Hertz e Phon para um valor em dB. J para
fazer a converso contrria, uma funo dB-Phon, por meio de tentativas de busca com
a funo anterior, converte Hertz e dB para Phon. Dependendo da resoluo de
converso, esse processo de busca pode ser lento, o que traz uma complicao para
implementao em tempo real.

Figura 26 Dados de Robson e Dadson, fornecidos pelo objeto [Phon2dB]

A figura 26 mostra grficos gerados no Pure Data com um objeto compilado a


partir do cdigo original de Barlow. O objeto [Phon2dB] (Phons to ou para dB) d
uma sada de dB para entrada de um valor em Phons (inlet direito) e Hertz (inlet
esquerdo). Usamos esse objeto para emular e representar as curvas de resultados
originais da figura 25. Por meio de um subpatch, fazemos uma varredura de
frequncias e ndices da tabela para gerar as curvas.

94
A figura 27 foi gerada a partir de uma implementao em Pd de um cdigo em
Matlab27 dos dados fornecidos pela ISO226:2003. Este objeto capaz de plotar
grficos das curvas em Phons e assim tambm converte uma entrada em Hertz e Phons
para dB. Essa implementao tem como sada uma tabela de valores (29 apenas) para
uma entrada em Phons, ou seja, ela automaticamente gera as curvas com valores de dB
para pontos de frequncias. Precisamos, assim, armazenar esses valores para consult-
los. Com uma entrada em Hertz, necessrio converter esse valor para um ndice da
tabela, e acessar o valor via interpolao com o objeto [tabread4]. Tanto a resoluo de
pontos, como o registro de Phons desse objeto so menores do que o cdigo fornecido
por Clarence Barlow. Portanto, mesmo se tratando de uma reviso dos dados, o
trabalho de Clarence Barlow nos fornece uma converso bem aprimorada, alm da
possibilidade de converter dB para Phons.

Figura 27 Dados da ISO226:2003 fornecidos pelo objeto [iso226]

Apesar de ser redimensionada de acordo com nossa resposta de escuta, a


medida em Phon ainda remete escala logartmica de decibeis. Por isso, ela no uma
escala que dimensiona a percepo de variao da intensidade sonora, que dobra para
um acrscimo de 10 Phon. Para isso, convertemos Phons para Sones, em que o valor

27
Disponvel em: <http://www.mathworks.com/matlabcentral/fileexchange/7028-iso-226-equal-loudness-
level-contour-signal>.

95
em Sones dobra ou divide-se pela metade a cada variao em um fator de 10 Phons
acima ou abaixo. Assim, comparando diferentes medidas em Sones, fica evidente a
relao intervalar de intensidade sonora entre uma amplitude e outra.
A figura 28 mostra a converso de uma amplitude linear para Sones.
Primeiramente, usamos o objeto nativo de Pure Data que converte amplitudes lineares
para dB. Em um segundo passo, usamos outro objeto implementado em nossa
pesquisa, que corresponde tambm ao cdigo de Clarence Barlow e que converte uma
entrada em dB e Hertz para Phons. O objeto [phon] faz a converso por meio de uma
heurstica, ou seja, tentativas de busca e aproximaes sucessivas com a funo
existente no objeto [Phon2dB] e, por esse motivo, pode ser custoso
computacionalmente. Temos tambm na figura outros objetos nativos e uma
implementao por meio do objeto [expr] para converter Phons em Sones.

Figura 28 Converso de Amplitudes para Phons e Sones

comum que as amplitudes sejam dadas em valores lineares, como a sada


do objeto [sigmund~]. Esses valores variam entre 0 e 1 e podem ser convertidos para
decibeis com o objeto [rmstodb], nativo do Pd. Ao converter a amplitude linear para
dB, podemos convert-la para Phons, o que contabilizar uma mudana acima ou
abaixo de acordo com nossa curva de respostas. Esse redimensionamento das
amplitudes pode ser convertido de volta para valores lineares. A partir desse processo,

96
temos um redimensionamento das amplitudes de acordo com nossa percepo de
intensidade, o que pode ser muito til como entrada de dados em modelos
psicoacsticos. Essa converso de volta a valores lineares possvel com o objeto
inverso, tambm nativo do Pd, chamado [dbtorms]. Na figura 28, vemos como uma
entrada de amplitude linear variou de 0.5 para 0.550776.
Veremos adiante outro procedimento que Parncutt (1989) adota em seu modelo
de Comonalidade de altura para redimensionar os valores de intensidade de acordo
com nossa resposta perceptiva. Mas, trata-se de um modo muito mais simples, que
apenas contabiliza um nvel de dB acima do nvel de limiar da escuta.

9.2.2 Converso de Hz para a Escala da Banda Crtica (Barks)


Outro subproduto da implementao do modelo de Aspereza a converso de
Hertz para Barks a escala da banda crtica de acordo com os dados de Zwicker
(1961). A banda crtica um dado essencial no modelo de Aspereza, uma vez que o
resultado de Plomp e Levelt uma curva de resposta tendo como base a banda crtica.

Figura 29 Converso de Hertz para Barks

A converso de Hertz para a escala da Banda Crtica dada por funes que
aproximam os resultados dados pela tabela 7. Traunmller (1990) fornece uma
equao com um erro entre mais e menos 0.05 Bark para frequncias acima de 100 Hz.
J a converso pela frmula de Terhardt (1979) possui uma melhor preciso nas
frequncias do registro grave. Uma combinao sugerida por Clarence Barlow (2008)
dessas duas frmulas oferece o resultado de maior acuidade de converso e foi
implementada como um objeto conversor assim como parte do processo de clculo do
modelo de Aspereza no objeto [roughness], explicado a seguir. A Equao de Terhardt

97
(1979) usada, ento, para frequncias cujo valor em Hertz menor ou igual a 219.5
Hz, enquanto utilizamos a de Traunmller (1990) para os valores superiores vide
figura 29.

9.2.3 Objeto [roughness]


O modelo de Aspereza foi implementado primeiramente como um subpatch de
Pure Data e depois na forma de um objeto (com o termo em ingls: [roughness]). A
implementao em objeto foi necessria para interao em tempo real, pois essa verso
possui uma performance muito mais rpida, como demonstraremos aqui.
Alguns modelos de Aspereza baseados em Plomp e Levelt descritos no
captulo 5 foram contemplados no objeto. Foi possvel remeter a mais de apenas um
porque a estrutura geral a mesma, o que muda apenas alguns parmetros. Veja a
figura 30, que a estrutura geral interna do subpatch e que corresponde Figura 8 da
seo 5.2, do diagrama do modelo de Aspereza.

Figura 30 - Subpatch de Aspereza

O patch se alimenta de listas de amplitude a frequncias de um espectro,


fornecido pelo objeto [sigmund~]. Essas listas so alocadas em tabelas que so
varridas para enviar todas as combinaes de pares dos parciais. O par de frequncias
usado para encontrar a diferena na escala bark e buscar um valor de Aspereza
segundo o estudo de Plomp e Levelt. Esse valor ento redimensionado de acordo a
um Peso de Amplitude obtido a partir do valor do par de amplitudes. Um acumulador

98
soma o valor de Aspereza de todas as combinaes de parciais, que nos d a Aspereza
total para o espectro de entrada.
A diferena de parmetros est, primeiramente, em dois desses elementos
bsicos: a aproximao dos resultados de Plomp e Levelt e o tipo de Peso de
Amplitude. Foram adotadas duas funes distintas para aproximar a curva de Plomp e
Levelt, uma de Parncutt (1993) e outra de Sethares (1999). Antes de contabilizar as
diferentes opes de Peso de Amplitudes, podemos redimensionar os valores de
amplitude de acordo com um modelo de mascaramento em um passo inicial, seguido
de um redimensionamento em Phons (como exemplificado na Figura 28) e, por fim,
uma converso em Sones. A partir dessas opes e grandezas de intensidade (dB, Phon
e Sones), temos ento trs tipos de Pesos de Amplitudes, que correspondem a trs
modelos de base diferentes: Vassilakis (2001), Barlow (2008) e Sethares (1999), so
eles:
Vassilakis: Grau de Flutuao de Amplitude;
Barlow: Extrair a mdia quadrtica;
Sethares: Considerar o menor dos valores.

Com essas diferentes possibilidades de parametrizao, foi possvel pesquisar


as caractersticas e influncias de cada parmetro na medida final de Aspereza. Dentre
as possveis combinaes, podemos tomar o modelo de Barlow e inserir o de
Vassilakis, como proposto anteriormente na seo 5.2, mas tambm podemos ter os
modelos originais desses trs autores (Vassilakis, Barlow e Sethares).
Sobre as duas opes de aproximao da Curva de Plomp e Levelt (1965), a de
Sethares usada por ele mesmo (Sethares 1999) e tambm por Vassilakis (2001) que
o revisou e incluiu nele apenas seu mtodo de Peso de Amplitudes. Mas o modelo
original de Sethares no est completamente contemplado em nossa implementao,
tendo sido ligeiramente revisado, pois adotamos um mtodo mais acurado de
converso de frequncias para barks. Mesmo assim, consideramos que o resultado
ainda corresponde ao mesmo modelo, j que no promovem uma diferena to
significativa.
O modelo original de Sethares (1999) adota sua aproximao da curva de
Plomp e Levelt, amplitudes lineares sem mascaramento e o menor valor de um par de
amplitudes como peso de amplitude. Vassilakis revisa e apenas inclui sua frmula do
Grau de Flutuao de Amplitude, em vez da menor das amplitudes. J o modelo de
Barlow adota a aproximao da curva de Parncutt, um modelo de mascaramento e a

99
mdia quadrtica das amplitudes em Sones.
O objeto, ento, muda de parmetro de acordo com os seguintes comandos:
curve: Aproximao da Curva de Plomp e Levelt (0 = Parncutt, 1 =
Sethares);
masking: Mascaramento (0 = desligado, 1 = ligado);
loudness: Grandeza de Amplitude (0 = Amplitude linear, 1 = Phons, 2 =
Sones);
weight: Peso de Amplitude (0 = Vassilakis, 1 = Barlow, 2 = Sethares).

Figura 31 Parametrizao do objeto [roughness] por meio de comandos


enviados a ele. As quatro opes acima representam 4 tipos de modelo.

Note-se, na figura 31, como os trs modelos de base podem ser parametrizados
com esses comandos, alm da parametrizao proposta nesta pesquisa. Uma discusso
pormenorizada da diferena entre cada implementao ser dada na discusso terica
da parte final.

9.2.3.1 Performance do Objeto [roughness]


A figura 32 compara a performance da implementao em objeto e em um
subpatch de Pure Data. Os parmetros aqui usados foram curve 0 / masking 0 /
loudness 0 / weight 1, que correspondem ao modelo de Barlow com a entrada de
amplitude linear e sem mascaramento.
O sinal analisado provm de uma forma de onda que a mesma da Figura 24,
sendo que agora se trata de uma dade com as fundamentais de 400 e 430 hertz. A
anlise feita no subpatch [pd listas(sigmund~)] gera listas de Frequncias e
Amplitudes dos 32 parciais com mais energia no espectro e as aloca em tabelas.

100
Figura 32 Comparao de performance de processamento.

A pequena variao dos resultados entre a implementao em subpatch e a do


objeto compilado em C ocorre pelo fato de que o clculo dentro do objeto atende a
uma resoluo diferente em bits. Eis que, na soma de todas as combinaes dos 32
parciais (total de uma soma de 496 valores), essa discrepncia aparece, mas, no caso de
poucas combinaes, ela pode retornar o mesmo valor que a implementao em patch.
O teste de velocidade de processamento foi aplicado em um Macbook Pro Intel Core i7
2.66 GHz.
A figura acima nos mostra que a soma de Aspereza para todas as combinaes
de pares de parciais demorou 2.18 milissegundos na implementao em subpatch e
apenas 0.08 milissegundo na implementao em objeto, que uma diferena muito
grande. 2.18 milissegundos j uma latncia maior do que um bloco de udio de 64
amostras em uma Taxa de Amostragem de 44.1 KHz. Ou seja, no uma performance
boa para tempo real.
A seguir, um exemplo de como a converso para Phons pode ser
computacionalmente pesada. O teste feito no objeto [roughness], mas tambm diz
respeito ao objeto [phon] apresentado anteriormente, uma vez que se trata do mesmo
cdigo. Ao compararmos com o resultado acima, fica evidente como h uma diferena
realmente muito grande de performance, chegando a 2.44 milissegundos em vez de
0.08 milissegundo.

101
Figura 33 Testes de performance com a converso em Phons

Para otimizar esse clculo, inclumos um novo comando que diminui a


resoluo de converso para Phons, sendo que o objeto [phon] tambm obedece a esse
comando. Lembrando que h uma heurstica de programao, como descrita na seo
sobre o objeto [phon], podemos definir o nmero de passos, ou tentativas, em que o
algoritmo busca converter de dB para phons. O controle dado pelo envio de uma
mensagem phonsteps, que define o nmero de passos. Com apenas 4 passos (valor
mnimo) chegamos a um resultado de performance de 0.47 milissegundo. Mais
consideraes sobre os parmetros dos objetos sero trazidas na discusso final.

9.3 Biblioteca de Pitch Commonality


O clculo de Comonalidade de Altura em si simples e feito sobre o perfil de
Salincia de Alturas, ou melhor, atravs da comparao entre dois ou mais perfis de
Salincia de Altura. O maior trabalho est justamente em gerar o perfil de Salincia de
Altura, que um processo com vrios passos que dependem da estimativa de outros
elementos, como o Peso de Altura Virtual e a Multiplicidade. Em paralelo com esses
dados, podemos tambm gerar medidas de Tonalness.
Desse modo, com o mesmo cdigo, pudemos gerar diferentes objetos para
calcular Peso de Alturas, Tonalness, Perfil de Salincia, Multiplicidade e Baixo
Fundamental (ou Fundamental do Acorde), alm do clculo de Comonalidade de
Altura em si. Primeiramente, demonstraremos uma implementao em patch de Pure
Data, que serve de recurso didtico e tambm para testar ganhos de performance com a
verso em objeto.

102
De qualquer maneira, a motivao maior de construir objetos no foi
exatamente a performance, mas sim uma grande convenincia para chamar funes
diferentes e mudar a estrutura e comportamento dos objetos, principalmente o de
Comonalidade de Altura.

9.3.1 Implementao do Cdigo de Parncutt em Patch de Pure Data

Figura 34 Implementao do Perfil de Salincia, Tonalness e subprodutos.

103
A figura 34 uma Abstrao de Pure Data que calcula o Perfil de Salincia de
Altura (o dado essencial para calcular a Comonalidade de Altura), mas calcula tambm
Tonalness e outros subprodutos como a Multiplicidade e o Baixo Fundamental. O
fluxo de dados remete bastante aos diagramas apresentados anteriormente na seo
sobre a descrio dos modelos (ver figuras 5 e 6). Como os detalhes conceituais j
foram descritos, apenas apresentamos a organizao estrutural e os valores de sadas,
sem explicar novamente do que se trata cada elemento.
A entrada inicial, como no objeto [roughness], so listas de Amplitude e
Frequncias. Em um primeiro estgio, temos a anlise da entrada de Frequncias e
Amplitudes, onde geramos o que entendido como Espectro Audvel. Um grfico
dessa medida do espectro se encontra na primeira tabela, em amarelo, que representa
pontos de frequncias com amplitudes em valores de Audibilidade para Tons Puros (ou
Peso de Altura Espectral). Esse grfico da mesma ordem que os grficos de
amplitudes obtidos por anlises espectrais (da figura 21, por exemplo) e a sada do
outlet desse primeiro subpatch.
O segundo subpatch repassa essa entrada para o outlet direito e calcula a
Audibilidade de Tom Complexo (ou Peso Virtual de Altura), que repassada para o
outlet do meio. Com essas duas sadas, possvel calcular o Tonalness Puro e
Complexo do espectro, o que feito em no subpatch seguinte [Pd Tonalness]. Ainda
nesse segundo subpatch, temos a tabela que representa o Perfil de Audibilidade (ou
Peso de Altura), que uma combinao das duas medidas anteriores e a entrada para
calcular o perfil de Salincia de Alturas e os valores que aparecem visualmente na
tabela.
Na ltima seo, um dado essencial o clculo de Multiplicidade, que
enviado pelo outlet direito. A tabela representa o Perfil de Salincia de Altura, que a
sada do outlet esquerdo e a entrada de clculo de Comonalidade de Altura. Um
subproduto final o Baixo Fundamental ou Fundamental do Acorde, que dado pela
maior Salincia de Altura.
A figura 34 corresponde ao cdigo original de Richard Parncutt28. Isso significa
que os pontos de frequncia das tabelas representam 120 notas no sistema igualmente
temperado. Ou seja, 12 notas por oitava, sendo dez oitavas ao todo. Uma resoluo
maior de frequncias importante para sons inarmnicos e/ou Sistemas de Afinao

28
Disponvel em <http://www.uni-graz.at/~parncutt/parpitchcode.html>.

104
alternativos.
O dado de anlise que mais se beneficia com uma boa resoluo de frequncias
a Fundamental do Acorde. No exemplo dado acima, temos uma lista de frequncias
de um som inarmnico, que no corresponde exatamente a notas do sistema
temperado. Em compensao, o Baixo fundamental encontrado (174.6 Hz), parece
estar prximo do segundo parcial (170 Hz), mas a verdade que a diferena de 46
cents quase um quarto de tom, que a mxima diferena possvel com essa
resoluo. Logo, uma diviso da oitava em quartos de tom pode acusar com mais
preciso esse segundo parcial como a Altura mais Saliente do espectro. Outros
exemplos a respeito dessa questo viro a seguir.
Uma maior resoluo com mais notas por oitava possvel em abstrao, mas
sua praticidade maior em uma implementao em objeto. Sobre a questo de
resoluo, destacamos a convenincia de divises da oitava em 24, 36, 48 e 72 partes
iguais, que correspondem, respectivamente, a uma subdiviso microtonal em quartos,
sextos, oitavos e doze-avos de tom. O quanto isso reflete em nmero de pontos na
tabela estabelecido pela operao trivial de multiplicar pelo nmero de oitavas (10).
A diviso em 72 pontos um mltiplo que contm os mesmos intervalos de
quartos e sextos de tom e um sistema de afinao apontado por Navarro (1927) como
muito conveniente por conter boas aproximaes de intervalos dos harmnicos de uma
srie. Ou seja, podemos representar bem uma srie harmnica com esse sistema. O
terceiro harmnico (702 cents) j bem aproximado no sistema temperado. O dcimo
primeiro harmnico prximo de um quarto de tom (551 cents), o sexto de tom
aproxima bem o stimo harmnico (969 cents) e o quinto harmnico (386) prximo
de um sistema de doze-avos de tom.
Ainda outra possibilidade inserir afinaes alternativas e divises desiguais
quaisquer. Mas o que seria particularmente eficaz para qualquer caso seria adotar uma
espcie de contnuo de frequncias, que comportaria qualquer intervalo musical sem
restrio a escalas. O problema que nada no computador pode ser infinitamente
contnuo, ento precisamos definir uma resoluo, que pode ser de 1 cent, ou seja,
12.000 pontos. Uma maior resoluo traz o problema de que o gasto computacional
aumenta proporcionalmente. A verso em objeto, nesse caso, essencial para uma
melhor performance.
Vejamos agora uma implementao completa do modelo em um patch de Pure
Data, apresentada na figura 35. Analisamos dois sons em tempo real. Ambos esto em

105
unssono, o que deveria dar uma Comonalidade de Altura igual a 1. Entretanto, pela
pequena diferena no contedo espectral das formas de onda29, o resultado apenas
prximo a 1.

Figura 35 Comparao de duas sonoridades com o Modelo de


Comonalidade de Altura, implementado em um patch de Pure Data.

As duas abstraes [PSalience] correspondem figura 34. As listas de


amplitude e frequncia (com 50 parciais) so dadas do mesmo modo que apresentado
anteriormente, com o objeto [sigmund~]. O subpatch [pd Pitch-Commonality] recebe
os dois Perfis de Salincia e calcula a medida de comparao. Veremos a seguir a
implementao dessas diferentes etapas em uma organizao em objetos.

9.3.2 Objeto [tonalness]


Apesar de ser apresentado por Parncutt (1989) junto ao modelo de
Comonalidade de Altura (e tambm estar presente na implementao de seu cdigo
original em C), o modelo de Tonalness , na verdade, um elemento extra e
desnecessrio para o clculo de Comonalidade de Altura. Mais do que isso, como j
exposto pela classificao de Terhardt (1984), esse atributo faz parte de um grupo
distinto de elementos, os da classe de Dissonncia Sensorial.
O objeto [tonalness] corresponde aos primeiros passos expostos na descrio da
abstrao [PSalience], mostrada na figura 34, em que simplesmente se desconsidera o
clculo de Perfil de Audibilidade e, por consequncia, o de Multiplicidade e Perfil de

29
Uma onda dente-de-serra, dada pelo objeto [triangle~] com argumento 0, e outra forma de onda que est
entre uma onda dente-de-serra e uma onda triangular, como na figura 24 e outros exemplos anteriores, tambm dada
pelo objeto [triangle~] com argumento 0.25.

106
Salincia. O argumento corresponde resoluo da tabela, discutida anteriormente, ou
melhor, diviso da oitava, que, no exemplo da Figura 36, uma diviso da oitava em
12, padro no caso da falta de um argumento. possvel mudar essa resoluo e at
enviar escalas especficas, como exemplifica-se no arquivo ajuda do prprio objeto.

Figura 36 Medida do objeto [tonalness].

Diferentemente dos objetos [Pitch_Weight] e [Pitch_Salience], descritos a


seguir, o objeto [tonalness] d apenas um nico nmero de sada em seus outlets, que
so as medidas de Tonalness Puro (sada direita) e Complexo (sada esquerda). Mais
uma vez, usamos o [sigmund~] para gerar listas de amplitudes e frequncias.

9.3.3 Objeto [Pitch_Weigth]


As sadas desse objeto so as mesmas que se encontram no segundo subpatch
da Figura 34, que correspondem (da direita para a esquerda) ao Peso de Altura
Espectral, Peso de Altura Virtual e Peso de Altura. A resoluo de frequncias
referida da mesma maneira que o objeto [tonalness], onde o padro uma diviso da
oitava em 12 intervalos iguais.
Os dados de sada desse objeto dizem respeito ao modelo de Altura virtual, que
o elemento chave para o clculo de Tonalness e Perfil de Salincia. Por ter essa
importncia chave e representar um resultado de Altura Virtual, dedicamos um objeto
especialmente para esse estgio.
No exemplo da Figura 37, estamos analisando um som definitivamente

107
harmnico uma onda dentre-de-serra que possui bastante energia por todo o espectro.
Extramos listas de amplitudes e frequncias de 50 parciais, o que relativamente um
nmero grande. Por se tratar de um som harmnico, a frequncia que corresponde
fundamental ganha um peso de Altura Virtual evidentemente muito maior em relao
aos outros. Vejamos os resultados obtidos pela anlise.

Figura 37 Objeto [Pitch_Weight] e suas sadas.

A primeira tabela de Peso de Altura Espectral aponta os parciais mais


proeminentes, e as tabelas seguintes demonstram como Alturas Virtuais so
encontradas a partir de um reconhecimento de padro harmnico. Por isso, podemos
notar picos menores acusados em uma poro mais grave do registro que no esto
presentes na primeira tabela, e um maior valor ao parcial que a fundamental do
espectro harmnico.

108
9.3.4 Objeto [Pitch-Salience]
Seguindo o mesmo padro, o objeto [Pitch-Salience] corresponde ao ltimo
estgio da abstrao de Pure Data apresentada na Figura 34 e possui a mesma estrutura
dos objetos anteriores. A sada do Perfil de Salincia de Altura corresponde bastante ao
resultado de Peso de Altura. Podemos constat-lo ao compararmos o resultado da
figura 37 com a figura 38.

Figura 38 Objeto de Salincia de Altura.

O Baixo Fundamental acusado, como esperado, est prximo da fundamental.


Mas, devido resoluo de anlise estar de acordo com o sistema temperado, h uma
diferena de quase 8 Hertz, que resulta em uma diferena em torno de 35 cents. Caso a
resoluo da anlise estivesse em sextos de tom (36 intervalos por oitava, que
correspondem a passos de 33.333... cents), a diferena seria bem menor.

109
O Baixo Fundamental corresponde ao maior ponto da tabela e pode
corresponder fundamental, como neste exemplo, ou tambm indicar uma
fundamental ausente de um espectro sonoro como previsto pela teoria e modelo de
Altura virtual. No caso de um acorde ou combinao de sonoridades distintas, o
modelo pode indicar qual dos tons corresponde Fundamental do Acorde, mas
tambm pode indicar um tom ausente.
Outras aplicaes so interessantes com o perfil de salincia alm de apenas
acusarmos o tom mais saliente como Baixo Fundamental. Uma ideia explorada foi a de
extrair os picos mais proeminentes atravs de um processo como a mediana do
espectro. Assim, temos uma coleo de tons mais importantes em uma sonoridade
complexa. Maiores desdobramentos sero dados na sequncia.

9.3.5 Objeto [Pitch-Commonality]

Figura 39 Objeto de Comonalidade de Altura comparando duas sonoridades iguais.

Diferentemente dos objetos anteriores, no especificamos a resoluo de


frequncias, pois o objeto [Pitch-Commonality] apenas recebe as listas de valores. No
obstante, necessrio que as listas sejam de um mesmo tamanho. Por esse motivo, o
objeto faz uma checagem e acusa um erro quando recebe listas de tamanhos diferentes.
Vejamos a figura 39, que, diferentemente da figura 35, apresenta um resultado de
exatamente 1, pois tratam-se de duas sonoridades iguais.
Depois de receber pelo menos duas listas, o objeto pode calcular a

110
Comonalidade de Altura aps receber uma mensagem bang que tambm reseta (ou
limpa) o objeto para que comece a receber novas listas. Os vrios perfis so
recebidos por essa nica entrada. Aqui j temos uma diferena estrutural do primeiro
exemplo apresentado, na forma implementada em um patch de Pure Data, em que
havia duas entradas e a capacidade mxima era de comparar apenas duas sonoridades.
Outro detalhe diferente que a figura a seguir adota apenas um objeto [Pitch-
Salience].
Quando comparamos mais de duas sonoridades, o resultado no mais apenas
um nico valor, mas sim um valor para cada combinao entre os Perfis de Salincia.
De tal maneira, a comparao de quatro sonoridades (1, 2, 3, 4) nos retorna seis
valores diferentes: 1 & 2 (12), 1 & 3 (13), 1 & 4 (14), 2 & 3 (23), 2 & 4 (24), 3 & 4
(34), que so dados por uma matriz na seguinte forma:

11 12 13 14
21 22 23 24
31 32 33 34
41 42 43 44

No exemplo dado, os nmeros sublinhados correspondem aos seis valores


descritos. Os nmeros em negrito indicam comparaes de uma sonoridade com ela
mesma. Logo, os valores so sempre iguais a 1 e podem ser desconsiderados. Esses
nmeros tambm traam uma linha diagonal que divide a matriz em duas pores
iguais, sendo que os valores restantes tambm possuem o mesmo valor dependendo da
combinao de nmeros (32 = 23, 21 = 12, e assim por diante). Cada linha representa
ento todas as comparaes com uma sonoridade (a primeira linha contm as
comparaes com a primeira sonoridade, assim por diante at a quarta linha). Nesse
exemplo, cada linha deixa de fora dois valores que, obviamente, no contm a
sonoridade em questo.
Mas possvel tambm armazenar trs dessas quatro sonoridades, e comparar
uma quarta entrada de dados com esses dados armazenados, o que nos d apenas trs
valores e corresponde ultima linha da matriz, ignorando o ltimo valor igual a 1.
Essa estrutura em que o objeto [Pitch-Commonality] est completamente independente
do objeto que gera seus dados de entrada, [Pitch-Salience], traz esse tipo de vantagem.
Veremos mais dessas capacidades avanadas no prximo subitem.

111
9.3.5.1 Comparao Avanada com o Objeto [Pitch-Commonality]
A separao da gerao dos dados com o objeto [Pitch-Salience] e a
comparao deles com o objeto [Pitch-Commonality] permite, por exemplo, a
importao de um banco de dados com vrios Perfis de Salincia de Altura
previamente armazenados.

Figura 40 Gerar um banco de dados com o objeto [textfile].

Essas anlises prvias, certamente, necessitam do objeto [Pitch-Salience] para


serem geradas. Mas, uma vez que esses foram armazenados em um arquivo, podemos
nos poupar de seu processamento e usar o objeto [Pitch-Commonality] apenas como
um objeto comparador.

Figura 41 - Exemplo de arquivo de texto armazenando 3 Perfis de Salincia.

O armazenamento dos dados consiste em simplesmente guardar os valores da


tabela em um formato de lista, do mesmo modo que a sada do objeto [Pitch-
Salience]. Para separar uma lista de outra prxima, basta inserir ponto-e-vrgula e
colocar a outra lista abaixo. Essa a forma em que os objetos [textfile] e [msgfile]

112
geram e leem arquivos de texto no Pure Data, o que lhes permite serem usados para
gerar e ler os bancos de dados. Veja as figuras 40 a 42.

Figura 42 Exemplo de como importar e rodar, com o objeto [msgfile],


os dados no objeto [Pitch-Commonality].

O objeto [Pitch-Commonality] capaz de receber listas e armazenar uma srie


de Perfis de Salincia. Para que o objeto comece e pare de armazenar, preciso enviar
o comando store seguido de 1 (para iniciar a armazenar) ou 0 (para parar de
armazenar). O armazenamento pode ser reiniciado aps ser interrompido, o que faz
que novos dados sejam armazenados junto aos anteriores. A forma de apagar todos os
dados armazenados com o comando clear. Veja a figura 43.

Figura 43 Armazenamento de dados no objeto [Pitch-Commonality].

Com essa estrutura, mesmo com um nmero de sonoridades previamente


armazenadas, o objeto continua operando igualmente: novas entradas que no sero
armazenadas continuam sendo carregadas dentro do objeto e somadas s que estiverem
armazenadas. Aps um comando bang, o objeto faz o seu clculo com todos os

113
Perfis de Salincia de Altura carregados e elimina os que no foram marcados para
ficarem armazenados. Logo, ainda permanecem os que foram devidamente
armazenados, os quais s podem ser apagados de fato com o comando clear.
Por fim, como mencionado anteriormente, tambm podemos comparar um dado
de entrada diretamente com outros armazenados no objeto [Pitch-Commonality]. Para
tal, temos o comando compare, seguido do valor 1 para ligar e 0 para desligar esse
modo. A sada de resultados uma lista com o valor de comparao entre o dado de
entrada com cada Perfil de Salincia previamente salvos, respeitando a ordem em que
foram armazenados. Desse modo, a cada nova entrada de um Perfil de Salincia, um
resultado de sada calculado. Assim, no precisamos mais enviar uma mensagem
bang. Vide Figura 44.

Figura 44 Comparao da fundamental de uma escala


com todos os intervalos cromticos de uma oitava.

A figura 44 mostra a comparao de um dado de entrada com treze Perfis de


Salincia previamente armazenados no objeto [Pitch-Commonality]. As treze
sonoridades so, como j de praxe, ondas dente-de-serra. Elas representam uma escala
de alturas com esse mesmo formato de onda e foram armazenadas em uma ordem
ascendente. A escala o sistema igualmente temperado, que vai de 440 Hz (L central)
at uma oitava acima, ou seja, 880 Hz. O dado de entrada justamente o primeiro
Perfil de Salincia de Altura, de 440 Hz.

114
Os doze resultados nos do uma relao de Comonalidade de Altura entre essa
sonoridade e treze intervalos harmnicos (do unssono oitava). Usamos o objeto
[sort] para reordenar os resultados de forma descendente, e seu outlet direito nos d os
ndices ordenados do maior ao menor valor de Comonalidade de Altura. Os ndices
muito bem representam os intervalos harmnicos dados em semitons, de 0 (unssono) a
12 (oitava).

Tabela 8. Comonalidade de Altura em ordem decrescente dos intervalos


Intervalos Comonalidade
Musicais De Altura
__________ _____________

Unssono; 1
Oitava; 0.620257
Quinta; 0.197853
Quarta; 0.0736343
Tera Menor; 0.0184284
Tera Maior; 0.0174454
Sexta Maior; 0.0134486
Stima Menor; 0.00973713
Segunda Maior; -0.0176171
Sexta Menor; -0.0299934
Trtono; -0.0302042
Stima Maior; -0.0600014
Segunda Menor. -0.0608375

Na tabela 8, temos os intervalos, do mais comum ao menos comum, dados por


seu nome e o valor da medida comparativa dada pelo objeto. Veremos mais desse tipo
de anlise de intervalos musicais quando discutirmos Curvas de Dissonncia, onde
tambm figuram anlises dos objeto [tonalness] e [roughness].

9.4 Harmonicidade
Por fim, apresentamos uma implementao do modelo de Barlow para seu
conceito e mtodo de medir a Harmonicidade de um intervalo musical. Trata-se de
algo extra e anexo ao foco central da pesquisa, pois o mtodo em si arbitrrio e no
envolve nenhum estudo psicoacstico. Na ltima parte deste texto, entretanto,
trazemos algumas consideraes sobre a adoo de certas arbitrariedades, ou melhor,
de um empirismo em relao a esse tipo de pesquisa e objetivos composicionais.
O modelo de Harmonicidade se baseia em um clculo da indigeribilidade dos
nmeros inteiros que formam a frao de um intervalo musical. Portanto, se a entrada

115
de intervalos em cents ou uma razo, ela precisa ser convertida para uma frao. As
duas entradas do objeto [harmonicity] correspondem aos dois nmeros da frao.
Segundo Barlow (1987), a indigeribilidade de um nmero inteiro uma medida
de quo psicologicamente digervel um nmero de acordo com seus fatores primos.
Logo, outro passo necessrio consiste em fatorar os nmeros da frao. Barlow utiliza
um exemplo para nos dar a ideia de indigeribilidade: em quantos pedaos seria mais
fcil cortar um bolo? A sequncia em ordem crescente de dificuldade dos nmeros 1 a
16 seria: 1, 2, 4, 3, 8, 6, 16, 12, 9, 5, 10, 15, 7, 14, 11, 13. A tabela 9 nos d os nmeros
de 1 a 16 e seus respectivos valores de indigeribilidade que, na ordem crescente,
correspondem lista anterior. Antes, trazemos as frmulas da indigeribilidade de um
nmero N e a harmonicidade de uma frao (P,Q).

r=

(N)= 2{nr(pr-1)2/pr} Eq.1


r=1
nr
onde N = p r (fatores primos de um inteiro N)

H(P,Q) = sgn((Q)-(P) ) / ((P)+(Q)) Eq.2

onde sgn = -1 caso negativo, hcf o maior fator comum de a e b,


e (x) a indigeribilidade de um nmero x.

Tabela 9. Indigeribilidades dos nmeros 1 a 16.


_N (N)___
1 0,000000
2 1,000000
3 2,666667
4 2,000000
5 6,400000
6 3,666667
7 10,285714
8 3,000000
9 5,333333
10 7,400000
11 18,181818
12 4,666667
13 22,153846
14 11,285714
15 9,066667
16 4,000000

116
A harmonicidade tambm pode ser medida entre as relaes dos componentes
espectrais de uma sonoridade como o prprio autor j implementou. Barlow tambm
adotou esse modelo para medir a harmonicidade de diversas escalas e sistemas de
afinaes. Mais detalhes da teoria de Barlow encontram-se em seus textos (1980,
1987, 2008).
A figura 45 usa o objeto [harmonicity] para calcular a harmonicidade de
intervalos musicais entre as razes de 1.4 (um trtono dado pela frao [7:5], ou 582.5
cents) a 1.6 (uma Sexta Menor dada pela frao [8:5], ou 813.7 cents), sendo que o
ponto mdio uma quinta justa (1.5, ou [3:2], ou ainda 701.9 cents). Primeiramente,
convertemos os nmeros em fraes, para depois inseri-las no objeto. O grfico
anlogo ao da figura 13, porm est invertido. Assim, de baixo para cima, medimos a
Dissonncia e, de cima para baixo, a Consonncia ou Harmonicidade. Os picos de
harmonicidade correspondem , seguido da sexta menor [8:5] e trtono [7:5].

Figura 45 Curva de Harmonicidade.

117
Captulo 10) Patches Desenvolvidos

A partir dos modelos psicoacsticos implementados (que em si j podem ser


utilizados como descritores e ferramentas teis), desenvolvemos uma srie de patches
que visam melhor explorar uma potencialidade criativa em tempo real. A aplicao que
mais tem sido usada a partir desses princpios a tcnica de Sethares (1999), que
consiste em gerar escalas a partir de espectros e tambm manipular um espectro para
que fique de acordo com uma escala. Alm de ferramentas dessa ordem, temos
tambm outras ferramentas que se voltam, principalmente, a uma manipulao de
contedo espectral em geral e mudana de alturas.
A manipulao espectral um modo de interferir diretamente na percepo de
altura e qualidade tonal. Esse procedimento possui um impacto em praticamente todos
os atributos perceptivos estudados. J a mudana de altura (Pitch Shifting) um
princpio bsico para manipulao de intervalos musicais, escalas e relaes
harmnicas um processo essencial das possveis aplicaes criativas.
Deixamos de lado, entretanto, o desenvolvimento de ferramentas dedicadas a
princpios de descrio sonora, relacionados a exemplos dados no incio desta segunda
parte e nos concentramos apenas em Curvas de Dissonncia como descritores de
intervalos musicais e suas aplicaes. Um fator que contribuiu para no termos
explorado muito esse aspecto que o problema de descrio de dissonncia ainda no
est bem resolvido.

10.1 Separao de Rudo de Fundo e Qualidade Tonal


Como um nico oscilador gera dados de anlise distribudos por boa parte do
espectro (vide figura 21), um som complexo gera ainda mais. Entretanto, fcil
detectar os picos de parciais, os quais representam os componentes espectrais mais
proeminentes e a qualidade tonal de uma sonoridade. A necessidade de separar
qualidades tonais em uma anlise espectral permite, em especial, uma manipulao
direta nessa poro do espectro que diz respeito aos parciais mais proeminentes.
Outras informaes importantes para o timbre se encontram diludas em uma
distribuio menor de energia no espectro, de forma menos uniforme e mais catica.
Tal contedo espectral pode ser, por exemplo, a frico do arco em um instrumento de
corda, ou o som presente em deslocamentos de ar nos instrumentos de sopro.

118
Em alguns casos h at mesmo rudos indesejados que gostaramos de eliminar,
o que possvel com procedimentos do tipo noise gate, ou mesmo com reduo de
rudo. Porm, no estamos preocupados com esse tipo de procedimento de eliminao,
mas sim com a separao e conseguinte juno entre rudo de fundo e picos mais
proeminentes.
Em relao a isso, h um exemplo que se encontra presente nas distribuies de
Pure Data chamado Sheeps from Goats (patch n I09); trata-se de um dos exemplos
prticos do livro de Miller Puckette (2006), que figuram como exemplos de udio em
qualquer distribuio do Pd. Desse exemplo, foi elaborada uma adaptao para que
pudssemos dividir um fluxo de sinal em dois canais e balancear a sada para ambos,
em que um lado tende ao rudo, enquanto o outro tende qualidade tonal. O processo
se baseia em uma checagem de coerncia entre as fases de pontos de frequncia
vizinhos.
Visto que um pico de um componente espectral pode estar disposto em mais de
um ponto de frequncia da anlise, essa tcnica capaz de acusar um grau de
coerncia como patamar de diviso. Desse modo, se o grau de exigncia for grande,
apenas picos muito evidentes sero considerados, enquanto o resto seria rudo. A soma
de ambos canais, independentemente de qual patamar foi feita a diviso do sinal,
reconstri com tima fidelidade a entrada original.
Uma segunda tcnica adotada foi inspirada no trabalho de Sethares et. al
(2009), que apresenta algumas ferramentas com funcionalidades iguais s das
desenvolvidas nesta pesquisa. Esse processo consiste em definir, por meio de
medianas, valores de cho (ou um patamar) para vrios trechos do espectro e dividir o
que estaria abaixo (considerado como rudo de fundo) do que estaria acima
(considerado como os parciais mais proeminentes). Um segundo parmetro capaz de
elevar esse cho, ao multiplic-lo por um valor constante. Assim, conseguimos
interferir (aumentar ou diminuir este limiar) no processo de filtragem. Da mesma
maneira, somar as duas sadas divididas do sinal acaba reconstituindo com fidelidade a
entrada de sinal.
A figura 46 mostra uma implementao com essas duas tcnicas, ambas
filtrando a mesma entrada de sinal, que uma flauta tocando uma nota de modo
esttico. O patamar de corte, na segunda tcnica, foi calculado em trechos de 32
amostras esse nmero conveniente porque as janelas de FFT so sempre mltiplos
de 32, uma vez que os algoritmos de FFT necessitam que as janelas de anlise sejam

119
iguais a uma potncia de 2.

Figura 46 Patches de separao de rudo e contedo tonal.

A figura acima demonstra e compara as duas tcnicas, obtendo resultados


semelhantes auditivamente, tambm constatados nos grficos de anlise. Os grficos
so os valores de amplitude dos sinais divididos, sendo a anlise da esquerda a
extrao de rudo, e a da direita o isolamento de picos mais proeminentes.
A primeira tcnica descrita, baseada em coerncia de fases, corresponde parte
de cima da figura, e ao subpatch [unpitched/pitched]. O slider de balano indica que a
diviso pende mais para a sada do sinal unpitched, que corresponde sada
esquerda do subpatch. No processo de filtragem por meio de uma mediana no
espectro, o parmetro noise floor indica um fator relativamente alto de elevao do
patamar de filtragem, o que tambm eleva a quantidade de sinal que vem da sada
esquerda do subpatch.

10.2 Ressntese via Banco de Osciladores


Um patch de ressntese foi implementado com informaes extradas com o
objeto [sigmund~]. O processo em si no muito complicado, uma vez que o objeto j
foi estruturado para alimentar um banco de osciladores. Em compensao, nosso
interesse poder manipular esses dados em outras instncias, tendo a capacidade de
controles avanados e independentes de manipulao espectral. Por isso,
desenvolvemos outros exemplos baseados nesse patch.
Uma primeira utilidade da ressntese que, como usamos o objeto [sigmund~]

120
para gerar listas de frequncia e amplitude representando uma entrada sonora, nada
melhor do que uma reconstruo desse sinal via banco de osciladores, para que
possamos escutar o resultado sonoro gerado pela informao dessas listas e, assim,
julgar se a representao pelas listas fiel e correspondente ao sinal de entrada.

Figura 47 Implementao de um banco de 100 osciladores para ressntese.

A figura acima nos mostra os dados do [sigmund~] sendo roteados para vrias
instncias de uma abstrao que consiste em um oscilador. Os 10 primeiros osciladores
se encontram logo abaixo, e o roteamento para os restantes feito em subpatches,
totalizando um nmero de 100 osciladores. direita da figura, temos a implementao
de uma das instncias do oscilador, que recebe valores de frequncia, amplitude e uma
marca para informar se uma faixa contnua, vazia, ou nova.

121
10.3 Mudana de Altura (Pitch Shifting)
Tcnicas de mudana de altura so peas importantes nesta pesquisa, pois as
ferramentas desenvolvidas buscam aplicaes prticas em afinao, onde uma
reafinao automtica pode mudar e manipular escalas e sistemas de afinao. Outra
aplicao na gerao de harmonias, ou dades.
Um estudo detalhado ou um desenvolvimento aprimorado em tcnicas de
manipulao de altura um problema complicado e paralelo. Um procedimento de
mudana de altura altamente eficaz para diversos casos distintos ainda est para ser
desenvolvido (Parviainen 2006). O maior empecilho claramente no falta de
interesse, mas restries puramente matemticas de cada tcnica distinta, o que
significa que as possibilidades atuais j foram relativamente esgotadas. Logo, os
ltimos avanos tm sido em melhorias de mtodos j existentes, em que h um
aprimoramento da qualidade de anlise dos dados.
Um primeiro problema que encontramos que um simples deslocamento geral do
contedo espectral, para o grave ou agudo, exerce uma evidente influncia na mudana
de percepo de altura, porm distorce outros atributos perceptivos do som original. A
respeito disso, testamos as tcnicas de extrao de picos e separao de rudo de fundo,
para que o tratamento de mudana de altura ocorresse apenas na poro referente
qualidade tonal do som.
Foram testados vrios mtodos j implementados em Pure Data, como o prprio
pitch shifter desenvolvido por Miller Puckette (2006), que tambm faz parte dos
exemplos de udio que acompanham a distribuio do programa (exemplo G09). Um
trabalho interessante encontrado um objeto externo baseado em PSOLA,
implementado a partir de uma biblioteca desenvolvida por Olli Parviainen30. Seu nome
[soundtouch] e tambm permite compresso e expanso de tempo.
Em todo caso, preferimos nos basear em uma implementao em patch de Pure
Data da tcnica de Phase Vocoder desenvolvida por Miller Puckette (2006), que
permite tanto a mudana de altura quanto o controle independente de
compresso/expanso de tempo. Um critrio forte na deciso sobre qual ferramenta
optar foi que no deveramos buscar objetos externos ao Pure Data, a no ser que seu
resultado promovesse uma diferena concreta muito forte, de forma que, se abrssemos
mo dela, teramos uma perda lastimvel.

30
Disponvel em: <http://www.surina.net/soundtouch/>.

122
Nesse sentido, a qualidade do Phase Vocoder implementado no Pd no deixa
tanto a desejar. Alm disso, apesar de serem alheias, a compresso e expanso de
tempo tambm so de interesse nos mdulos de aplicao criativa desenvolvidos
durante a pesquisa. Assim, aplicamos e adaptamos sua estrutura em implementaes
prprias de mudana de Altura. Alm do Phase Vocoder, testamos tambm um patch
tendo como base a ressntese por meio de um banco de osciladores. Apresentamos a
seguir esses dois mtodos explorados para mudana de altura e, na sequncia, um
exemplo da aplicao delas como um harmonizador.

10.3.1 Pitch Shifting via Ressntese


No momento em que temos um banco de osciladores reconstruindo um sinal de
udio, simples e trivial operar uma mudana de altura. Basta apenas alterar a
frequncia do oscilador. Inserimos essa propriedade no patch de ressntese apresentado
anteriormente e acoplamos tambm um mdulo que separa o rudo de fundo para ser
acrescentado novamente aps o processamento. Dentre os testes com a separao de
rudo, a tcnica de separao com a mediana do espectro surtiu efeitos mais positivos,
em especial para transposies ao grave.
O aspecto mais relevante do uso dessa tcnica com ressntese que somos
capazes, tambm, de outras manipulaes desenvolvidas durante a pesquisa, em
especial o mapeamento espectral. A separao de rudo de fundo no s pode melhorar
a qualidade sonora, como tambm permite que o processamento de ressntese seja feito
com um nmero menor de osciladores, o que poupa em muito o processamento da
CPU.

10.3.2 Phase Vocoder


O Phase Vocoder foi originalmente concebido por Flanagan e Golden (1966).
Seu conceito, em parte, possui relao com o anteriormente conhecido Vocoder,
desenvolvido por Dudley (1939). O termo Vocoder vem de uma contrao de VOice
enCODER e nasce como fruto de pesquisas em anlise e sntese da fala para aplicaes
em telecomunicao, mas obteve uma aplicao em msica por sua estrutura de filtros.
Hoje em dia, podemos implementar o Vocoder com dados de uma FFT, que podem ter
milhares de bandas de frequncia usadas como filtros.
O Vocoder Clssico tambm pode ser chamado de Subband Vocoder, ou
Channel Vocoder. Channel e Subband referem-se a bandas de frequncia, como em

123
equalizadores e filtros. O nmero de bandas de um Vocoder Clssico variava de 8 a
30. Uma aplicao com o Vocoder em msica a Sntese Cruzada, que tambm ser
apresentada nesta pesquisa.
Enquanto o Vocoder lidava apenas com informao de amplitudes em dadas
faixas de frequncia, o Phase Vocoder apareceu como uma expanso que tambm
computava a fase inicial de cada faixa de frequncia. Comparado ao Vocoder, o Phase
Vocoder possua mais bandas, pois s assim fazia sentido computar as fases iniciais,
uma vez que a inteno era uma melhor resoluo de frequncias. Atualmente, o Phase
Vocoder tambm um software normalmente implementado sobre Anlises de FFT,
que podem ter uma resoluo de milhares de bandas em tempo real e retornam a
Amplitude e Fase Inicial de cada banda.
Na prtica, o Phase Vocoder pouco tem a ver com codificao de fala e at
mesmo com a tcnica de Sntese Cruzada. Seu uso era limitado a experts em DSP, mas
tem se tornado mais difundido com o atual avano da computao em geral e aplicado
amplamente em msica desde a dcada de 1990. Um exemplo clssico da aplicao de
Phase Vocoder em Msica Computacional a pea VOX 5 de Trevor Wishart, em
manipulaes de voz humana (1988).
Quanto s aplicaes, ainda na dcada de 1960, constatou-se que era possvel
reconstituir o som original da anlise de forma muito fiel aps alteraes de tempo, ou
frequncia. Por isso, quando falamos de Phase Vocoder, estamos falando,
normalmente, de uma tcnica de comprimir ou expandir o tempo de um som (Time
Stretch/Compress), alterar sua Altura (Pitch Shift), ou ainda ambos, de forma
independente.
O elemento-chave da tcnica se valer da informao de fase inicial para
manter uma coerncia na reconstruo de frequncia. Vimos que diferenas de fase
inicial entre duas janelas consecutivas de anlise aferem com maior preciso os valores
de frequncia de uma anlise de FFT, como o caso de rotinas internas do objeto
[sigmund~]. Da mesma maneira que usamos o objeto [sigmund~] para alimentar um
banco de osciladores, uma estrutura comum e original do Phase Vocoder tambm
consiste exatamente em uma anlise de dados, manipulao de frequncia e tempo
desses dados e uma ressntese por meio de um banco de osciladores. Dessa forma, o
Pitch Shifter desenvolvido com o [sigmund~] no est longe de ser uma espcie de
Phase Vocoder.
Alis, o trabalho de Sethares et al (2009) adota um banco de osciladores com

124
referencia direta tcnica de Phase Vocoder. Por isso, em um conceito mais amplo,
possvel relacionar o Phase Vocoder a tcnicas avanadas de manipulaes espectrais
quaisquer, para depois ressintetizar com um banco de osciladores.
Na implementao de Phase Vocoder, apenas com dados de uma FFT, a
transformada inversa substitui o que seria o estgio de ressntese por meio de
osciladores, uma vez que o sinal reconstrudo de um modo anlogo Sntese Aditiva.
Porm, lidar com dados brutos de FFT um processo mais limitado. Em relao a um
banco de osciladores, essa estrutura baseada em FFT restringe bastante as diversas
manipulaes possveis, j que com osciladores independentes podemos tambm
process-los de forma independente.
A implementao em FFT busca simplificar o processo, mas ainda permite,
com tima qualidade, a mudana de altura e tempo do sinal como um todo. O Phase
Vocoder implementado por Miller Puckette em um patch de Pd mais um exemplo de
seu livro (2006) uma implementao baseada somente em FFT e foi tomada como
base para adaptaes diversas durante o desenvolvimento desta pesquisa. Em um
momento temos, inclusive, a juno do Phase Vocoder para manipulao de altura com
um mdulo de ressntese para operar outras manipulaes espectrais.
A FFT possui a vantagem de ter uma implementao mais simples e com
menos gasto computacional. A anlise de FFT precisa ser feita em duas janelas
seguidas, justamente para computar a diferena de Fase inicial. Chamemos essas duas
janelas de traseira e dianteira (ou atual e ltima). A dianteira corresponde ao
ponto real de leitura de um sinal, e a traseira est ali s para computar a diferena de
fase com um momento anterior. O passo entre uma janela e outra (hop) depende do
tamanho da janela (ou bloco) e o nmero de overlaps.
A reconstruo da fase inicial se d em um processo que se chama Acmulo
de Fase. Na figura 48, o diagrama ilustra que, nesse processo, a diferena de fase
somada com um resultado de fase anterior, que no desenho est indicado como phase
accum (de acmulo de fase). Essa soma gera a informao de fase final a ser levada
para a FFT inversa e tambm inserida novamente para o acmulo de fase na prxima
rodada. Veremos com mais detalhes como esse processo capaz de manter uma
coerncia de fase, o que ajuda na reconstruo do sinal. Sem esse procedimento, ainda
possvel conseguir mudana de altura e tempo independentemente, mas com
pouqussima qualidade e algumas distores pela descontinuidade de fase.

125
Figura 48 Diagrama de Acmulo de Fase (Puckette, 2006 p. 282).

Figura 49 Diagrama do Acmulo de Fase em um Patch de Pd.

A figura 49 um subpatch de Pd que computa esse acmulo de fase. Da


esquerda para a direita, as entradas so: a anlise de FFT da janela traseira (dois
primeiros inlets), a FFT da janela dianteira (dois inlets seguintes) e o ltimo valor da
sada de fase no inlet direito. O sinal de FFT chega na forma cartesiana e precisa ser
convertido para a forma Polar, que d os valores de amplitude e fase. A converso
feita com objetos externos [cartopol~] (cartesiana para polar) e [poltocar~] (polar para

126
cartesiana).
O outlet direito do objeto [cartopol~] a fase. Dessa forma, podemos visualizar
que o patch recebe a fase da janela dianteira e subtrai o valor da fase da traseira. Essa
diferena ento somada com o ltimo resultado de fase. O valor atual de fase
enviado para o outlet direito, mas essa sada a mesma que retorna no inlet direito na
prxima rodada. Aps o clculo de fase, os valores so convertidos de novo para a
forma cartesiana e enviados para a FFT inversa.
Um mtodo um pouco mais complicado de computar isso pode ser feito
diretamente na forma cartesiana, envolvendo princpios de matemtica complexa. Essa
opo afere uma qualidade melhor de clculo e tambm mais rpida
computacionalmente (mas no to significativamente to mais rpido nos dias de
hoje). A implementao de Miller Puckette baseada na forma cartesiana e inclui um
elemento que gera mais coerncia na distribuio da fase (Miller 1995). A tcnica em
si um procedimento parecido com o exemplo Sheep From Goats, porque usa o
mesmo objeto [lrshift~].
Pela contrao e expanso de tempo, a implementao deste Phase Vocoder
depende de uma alocao de udio em um buffer (retentor em ingls). Esse termo,
em cincia da computao, diz respeito a um espao de memria utilizado para escrita
e leitura de dados. Um buffer de udio um espao alocado para gravao para
carregar sons pr-gravados. No Pure Data, um buffer consiste em apenas uma tabela,
ou array. O buffer facilita o processo de analisar duas janelas consecutivas, alm de
que, para podermos tocar um som mais rpido que o original, ele precisa ter sido
previamente gravado ou armazenado.
Uma mudana de tempo dada por um contador que controla uma mudana de
passos de leitura do buffer. Os passos podem ser mais rpidos ou lentos que o original.
Sem a tcnica de Phase Vocoder, isso implicaria em uma igual mudana de altura, da
mesma maneira que tocar um disco de vinil mais rpido ou mais devagar muda
igualmente a altura (metade da velocidade metade da frequncia, dobro da
velocidade o dobro da frequncia). Porm, o Phase Vocoder usado aqui justamente
para prevenir isso.
O fator de transposio dado por um novo tamanho de janela. Digamos que o
tamanho da janela seja de 2048 amostras, e que a anlise seja feita com 4 overlaps (um
hop de 512). Nesse exemplo, um novo tamanho de janela de 1024 a ser lida no
mesmo espao de tempo que a original (2048, seu dobro) faz com que sua frequncia

127
caia pela metade. Uma nova janela de 4096 seria o dobro, ou uma oitava acima. Um
novo tamanho de hop tambm dado por essa nova janela, que define a diferena de
leitura entre a janela dianteira e traseira.
Quando a velocidade de leitura est em um passo de acordo com novo tamanho
de hop, ocorre o mesmo que no exemplo mencionado com o disco de vinil e no
precisamos nos preocupar em aplicar um Phase Vocoder. Em termos prticos, a janela
atual (ou dianteira) ser exatamente a mesma janela lida como a ltima janela (ou
traseira) na prxima rodada de anlise. Portanto, as fases so as mesmas. A figura 50
ilustra esse processo com uma diferena de fase de 90 graus esquerda.

Figura 50 Passo de leitura e tamanho de janela em


concordncia esquerda e discordncia direita.

Na figura acima, direita, temos um novo tamanho de janela que o dobro e


resulta, como j informado, em um dobro da frequncia. Porm, o passo de leitura
continua o mesmo (a metade disso). A ideia que ele fosse o dobro (igual ao tamanho
do novo hop). Digamos que nossa janela atual a verde, na parte superior direita
superior da figura 50, a diferena de fase com a janela atual da rodada anterior (em
amarelo) de 90 graus, e queramos que fosse de 180 graus, para que a forma de onda
fosse uma funo seno (com incio em zero graus).
Para isso, fazemos o acmulo de fase. Pegamos a diferena de fase entre a
janela atual e a janela anterior (de 180 graus) e somamos com a diferena anterior
(tambm 180 graus). Isso nos d ento 360 graus (ou zero graus), o que equivale
mesma fase inicial da funo seno, como se buscava.

128
A figura 51 ilustra essa correo de fase inicial devido ao processo de
acumulao, deixando evidente que o resultado equivale, na prtica, a uma correo
que faz que a janela seguinte esteja em um passo equivalente ao tamanho do hop,
mesmo quando o passo de leitura a metade disso ou qualquer outro valor diferente.

Figura 51 Representao do resultado aps acmulo de fase.

10.3.3 Harmonizador em Tempo Real


Mais que apenas um Pitch Shifter, o patch harmonizador mantm o sinal
original, o que faz que ele produza harmonias, ou melhor, dades com a cpia do sinal
cuja altura foi alterada. Todavia, o patch permite que a capacidade de harmonizador
seja desconsiderada, funcionando ento apenas como um Pitch Shifter. A figura 52 traz
duas verses de Harmonizadores em tempo real, uma baseado em Phase Vocoder e a
outra em ressntese. Uma adaptao necessria na verso do Phase Vocoder a
implementao de um buffer em anel (ou loop), para que a manipulao no seja
interrompida ao chegar no final do buffer. Ambos os exemplos abaixo possuem um
mdulo que separa o rudo de fundo, que mixado de volta na sada.

Figura 52 Implementao de um harmonizer com Phase Vocoder (esquerda)


e Ressntese (direita), acoplados a um mdulo que separa o rudo de fundo.

129
10.4 Manipulao Espectral
Os patches que veremos aqui tm como intuito alterar o contedo espectral de um
sinal de udio. Nosso maior interesse alterar algumas qualidades sonoras pertinentes
nossa pesquisa. As aplicaes prticas ficaro mais claras no decorrer do texto e na
apresentao de outros patches que podem ser usados em conjunto.
O maior impacto nesta pesquisa alterar um espectro harmnico e torn-lo, por
exemplo, consideravelmente mais inarmnico. Esse processo influencia diretamente a
percepo de Tonalness, produz um perfil de salincia distinto e tambm gera
resultados diferentes em Curvas de Dissonncia.

10.4.1 Sntese Cruzada (Vocoder)


A Sntese Cruzada uma tcnica que combina a informao espectral de dois
sinais. Mais especificamente, gera um hbrido a partir de uma juno da informao de
amplitudes de uma fonte e a fase de outra. Uma ampliao desse processo pode
permitir que se multipliquem tambm as amplitudes de ambos os sinais, enquanto a
informao de fase permanece intacta.
H uma certa confuso terminolgica a respeito dessa tcnica. Ela se relaciona
com o Vocoder, mas o processo tambm se assemelha convoluo espectral, em que
multiplicamos dois sinais de FFT. Porm, a convoluo em si gera um produto
diferente, uma vez que tambm contabiliza uma soma das fases, enquanto o Vocoder
mantm uma informao de fase original. Mas h quem deixe de lado esse tipo de
cruzamento (ou soma) de fases na convoluo e se refira assim a uma convoluo
apenas das Amplitudes. Timbre Stamp (Estampa de Timbre) como Miller Puckette
chama essa tcnica em seu livro (Puckette 2006), pois a considera mais pertinente que
a relao com o Vocoder Clssico.
Por fim, h ainda um efeito de guitarra, chamado Talkbox, que, na prtica, um
Vocoder, em que, normalmente, o som da voz cruzado com o som processado de
uma guitarra. O mesmo processo comum em sintetizadores explicitamente
denominados Vocoders, onde um microfone capta o som da voz e o combina com um
programa de sntese. Tanto em um como em outro, a informao de fase que
permanece a dos timbres de instrumentos musicais. A informao de fase a que
carrega a informao precisa de resoluo de frequncia. Isso significa que a sua
qualidade tonal que prevalecer. A questo, ento, gira em torno do controle de
envelope de amplitudes, ou melhor, de uma filtragem dessa informao de amplitudes,

130
que nesses exemplos feito com o som da voz/fala.
H diversos plug-ins de Vocoder em softwares de edio e gravao musical.
Na cultura popular atual, temos outro exemplo do uso dessa tcnica que est sendo
conhecida pelo jargo de autotune por meio desses plug-ins. Mais por, digamos,
brincadeira, possvel combinar o udio de uma entrevista de destaque na mdia e
combinar com sons sintetizados. Desse modo, possvel forar essa entrada de udio a
ter uma qualidade tonal e meldica.
A maior potencialidade da Sntese Cruzada em msica justamente inserir a
qualidade tonal de uma entrada sonora em uma fonte sonora com pouca ou nenhuma
qualidade tonal, o que lhe permite possuir uma alta complexidade textural, ou de
transientes, como em sons ruidosos, de percusso e a voz. A motivao do uso dessa
tcnica em nossa pesquisa no foge a essa regra, em que buscamos forar um espectro
harmnico, ou mesmo inarmnico, em uma entrada sonora ruidosa, para depois
combinarmos com outros elementos.

Figura 53 Sntese Cruzada com a amplitude de ambas as fontes sendo multiplicadas.

Na figura 53, temos um patch simplificado que caracteriza o processo de


Vocoder. As fases da fonte A so mantidas, e a amplitude um produto das
amplitudes de ambas as fontes. O mtodo , ento, multiplicar a parte real e imaginria
do sinal que se deseja manter a fase pelos valores de amplitude de uma segunda fonte.
Para aniquilar as Amplitudes da fonte A, adotamos um processo de normalizao
das amplitudes, para que fiquem todas iguais a 1, mas ainda com a mesma informao
de fase. Para isso, basta dividir o resultado pelo valor de amplitudes de A.
A figura 54 do livro de Miller Puckette (2006) mostra o diagrama de um

131
Vocoder e inclui uma funo limitadora (limiting function) que gradativamente corta
(ou limita) uma diviso pelos valores de amplitude de A. Desse modo, na medida em
que os valores passam, as amplitudes so normalizadas ao valor de 1, o que faz que as
amplitudes de A sejam continuamente extradas do processo.

Figura 54 Diagrama de Vocoder de Miller Puckette.

10.4.2 Modulao de Amplitude


Esta tcnica consiste em controlar a amplitude de um sinal (agora estamos
falando de um sinal no tempo, e no das amplitudes de uma FFT no domnio da
frequncia) com um oscilador, chamado de modulador, enquanto o sinal modulado se
chama portador. A modulao de Amplitude Clssica implica que o oscilador gere
sinais Unipolares (positivos de 0 a 1). No caso de sinais Bipolares (entre -1 e 1), temos
um caso especial de Modulao de Amplitude, a Modulao em Anel (Roads 1996).
A Modulao de Amplitude cria dois componentes espectrais para cada
componente do som modulado. Esses novos componentes se dispem em uma banda
de frequncia, acima e abaixo, que igual frequncia do sinal modulador. No caso da
Modulao em Anel, os componentes do sinal modulado simplesmente desaparecem,
permanecendo apenas as bandas laterais. A frequncia moduladora pode variar entre
unipolar e bipolar, para controlar as amplitudes dos componentes originais.

132
Podemos criar relaes harmnicas e inarmnicas com tcnicas de Modulao de
Amplitude se soubermos a frequncia do sinal portador. Para tal, precisamos detectar a
frequncia fundamental do som modulado. A partir dessa ideia, buscamos
implementaes com o [sigmund~] e tambm com o Perfil de Salincia de Alturas,
para buscar frequncias pertinentes a esse processo. E, assim, encontramos alguns
exemplos interessantes, que consistem em modular um sinal harmnico por um
frequncia em que a fundamental do som modulado seja um mltiplo dela.
Por exemplo, no caso de uma modulao de Amplitude Clssica e de uma
frequncia moduladora igual metade da frequncia da Altura do som modulado, h
uma transposio uma oitava abaixo. Alm dessa transposio, criamos outros
componentes espectrais. O exemplo abaixo mostra o que acontece com uma srie
harmnica com apenas 4 componentes a partir de 800 Hz:

800 1600 2400 3200


400 800 1200 1600 2000 2400 2800 3200 3600

Agora, podemos ir alm e transpor de volta uma oitava acima. Desse modo, na
prtica, estendemos a srie harmnica e criamos novos componentes espectrais. H
tambm o caso de uma Modulao em Anel, em que perdemos os componentes
espectrais originais. Assim, em um primeiro passo, temos a sonoridade transposta uma
oitava abaixo, e a perda de harmnicos pares.

800 1600 2400 3200


400 ... 1200 ... 2000 ... 2800 ... 3600

tambm muito interessante apenas modular por frequncias quaisquer sem


preocupao de controle do resultado final, o que torna o sinal inarmnico de um
modo imprevisto. O interesse est em, por meio das ferramentas implementadas,
podermos analisar sons quaisquer e medir seu grau de harmonicidade, gerar escalas e
encontrar intervalos interessantes, mesmo quando sabemos pouco sobre sua origem ou
informao espectral.

133
10.4.2.1 Modulao Complexa (Spectral Shift e Compresso/Expanso Espectral)
Esta tcnica consiste em uma Modulao de Amplitude com sinais complexos.
Uma abstrao j presente nas distribuies de Pd nos fornece uma transformada de
Hilbert, que permite tornar um sinal real em sinal complexo. Modulamos esse sinal
ento com uma senoide complexa. O resultado parecido com a Modulao em Anel,
pois os componentes espectrais originais se perdem no processo. Em compensao,
temos apenas uma banda lateral de frequncia em vez de duas. Por isso, interpreta-se
que os componentes espectrais foram transpostos. Logo, uma modulao de 100 Hz
arrasta todos os componentes espectrais 100 Hz acima. Uma transposio para baixo
possvel se a frequncia do oscilador for dado por um nmero negativo, que na
verdade indica uma inverso de fase.
importante frisar que isso no implica uma real transposio de Altura, pois os
componentes espectrais precisariam ser deslocados de forma geomtrica, mantendo a
mesma relao proporcional entre os parciais, enquanto o deslocamento dos
componentes com essa tcnica linear. No caso em que uma lista de componentes de
400, 800 e 1200 Hertz deslocada uma oitava acima, todos os componentes dobram,
resultando em: 800, 1600 e 2400 Hertz. J um deslocamento por meio de Modulao
Complexa nos d: 800, 1200 e 1600 Hertz. Desse modo, como as relaes se perdem,
um som harmnico adquire qualidades inarmnicas.
Podemos tambm mudar a altura de um espectro que foi transposto linearmente
para que sua fundamental permanea a mesma. Entretanto, a qualidade espectral foi
manipulada gerando inarmonicidades. Uma compresso (ou aproximao) dos
componentes espectrais se d quando arrastamos o espectro acima e depois transpomos
novamente abaixo. A expanso (ou afastamento) dos componentes ocorre no processo
inverso. A quantidade de compresso dada pelo intervalo entre a Altura original da
fundamental e a nova fundamental arrastada pela frequncia de modulao.
No patch da figura 55, o parmetro de controle de expanso dado por um
intervalo em cents, que tambm o intervalo de mudana de altura. O som analisado
um L central tocado na flauta (que o [sigmund~] detectou como justamente em torno
de 440 Hz) com valor de 700 cents. Calculamos quanto temos que arrastar o espectro
ao grave para compensar a mudana de altura, e o resultado em torno de 146 Hz
abaixo. Fazemos, ento, a modulao complexa e inserimos o resultado em um Pitch
Shifter. Por fim, analisamos o Tonalness do som original e o que foi expandido. A
ideia que a manipulao tenha tornado o som bem mais inarmnico, diminuindo a

134
sensao e medida de Tonalness. O modelo implementado em pesquisa constatou essa
queda de Tonalness, em que o resultado baixou de 0.43 para 0.25.

Figura 55 Expanso espectral com modulao complexa e Pitch Shift.

No prximo exemplo da figura 56, analisaremos o efeito de uma manipulao


espectral e o modelo de Fundamental do Acorde / Altura Virtual. Temos uma onda
dente-de-serra com a fundamental em 240 Hz e sua srie harmnica em que os
componentes so mltiplos de 240 Hz. Ao deslocarmos essa sonoridade 240 Hz acima
por meio de uma modulao complexa, a fundamental muda para 480 Hz, s que os
componentes continuam espaados em 240 Hz. Diferentemente dos outros exemplos
em que analisamos a fundamental, agora temos uma resoluo em passos de 1 cent na
gerao do Perfil de Salincia. Podemos ver na figura 56 que a fundamental acusada
de 240.05 Hz, que corresponde aproximadamente fundamental ausente de 240 Hz.
Esse resultado aproximado uma diferena de apenas 0.36 cents, dada essa maior
resoluo do Perfil de Salincia. A lista de frequncias dada pelo [sigmund~] dada
em uma caixa de mensagem.

135
Figura 56 Fundamental (no caso ausente) de uma sonoridade inarmnica.

10.4.3 Controle Arbitrrio de Parciais via Ressntese


Com um banco de osciladores, podemos buscar aplicaes mais aprimoradas e
avanadas de controles arbitrrios dos parciais, como uma mudana de altura
independente para cada parcial, j que cada um corresponde a um oscilador. Para isso,
jogamos todas as frequncias dos parciais encontrados em uma tabela.
Como o [sigmund~] nos d os parciais na ordem do mais proeminente ao mais
fraco, a lista de frequncias precisa ser devidamente ordenada do mais grave ao agudo.
Os patches que separam rudo de fundo so particularmente teis aqui, pois nos
poupam processamento ao permitir que menos osciladores sejam empregados na
ressntese. Mas podemos ainda filtrar dentre os picos acusados e ficar s com os mais
presentes de acordo com um patamar, ou mesmo definindo um nmero mximo de
parciais.
Aps essa filtragem, podemos ordenar as frequncias em uma tabela. J com
uma outra tabela, podemos aplicar um valor de variao de altura para cada ponto, de

136
modo que cada ndice da tabela represente a ordem da srie de parciais. O que
precisamos agora conferir, em cada oscilador, se a frequncia que chega est na
tabela ordenada e filtrada. Se estiver, verificamos seu ndice para buscar o valor de
transposio na tabela de variao de altura.
Como se trata de uma tabela, podemos armazenar seus dados ou carregar
outros. Um controle de cada parcial dado tambm por sliders, o que uma interface
mais amigvel e fcil de operar do que inserir dados diretamente na tabela.
Controladores externos, tambm com sliders ou outros botes, podem ser usados para
facilitar essa interface de controle.
Algumas rotinas especiais podem ser desenvolvidas para gerar padres de
desafinao nessa tabela, como um fator de compresso e expanso do espectro,
anlogo ao que apresentamos anteriormente com modulao complexa. A figura
abaixo representa esse sistema, em que os parciais de uma onda dente-de-serra so
desafinados por uma tabela.

Figura 57 controle arbitrrio e independente de parciais.

137
10.4.3.1 Mapeamento Espectral
Uma aplicao especial da capacidade de controle dos parciais possvel
levando em considerao a relao entre escala e espectro sonoro. A partir desse
conceito, conseguimos gerar escalas a partir de espectros, mas podemos tambm fazer
o caminho inverso, que partir de uma escala e gerar um espectro que seja compatvel
com ela. Mais interessante, porm, partir de um espectro qualquer, analisado em
tempo real, e transform-lo para que se aproxime de um modelo baseado em uma
escala. Essa tcnica foi chamada de Mapeamento Espectral Baseado em Consonncia
por Sethares (1999), que foi o primeiro a explorar e desenvolver ferramentas para esse
fim.
Em nossa implementao, temos um patch de Pure Data que calcula uma nova
srie harmnica de acordo com uma escala qualquer dada em cents, inclusive as que
no so baseadas na oitava. Como um primeiro exemplo, vejamos o resultado de
gerao de uma nova srie a partir da escala do temperamento igual, que divide a
oitava em 12 intervalos iguais.
Em cents, a entrada de valores : 100 200 300 400 500 600 700 800 900 1000
1100 1200. A nova srie gerada ao encontrar qual intervalo desses est mais perto de
um termo da srie harmnica. O terceiro harmnico, por exemplo, est prximo de 700
cents, o quinto se aproxima de 400 cents e assim por diante. Eis que esses termos so
substitudos por nmeros que correspondem a esses intervalos. O tamanho da srie
um parmetro dado na gerao. No exemplo abaixo, temos 64 termos. A oitava o
nico intervalo que coincide com termos da srie harmnica e corresponde s
potncias de dois, marcadas abaixo em negrito:

Nova Srie: 1 2 2.99661 4 5.03968 5.99323 7.12719 8 8.9797 10.0794


11.3137 11.9865 12.6992 14.2544 15.102 16 16.9514 17.9594 19.0273 20.1587
21.3574 22.6274 23.9729 25.3984 26.9087 28.5088 30.204 32 33.9028 35.9188
38.0546 40.3175 42.7149 45.2548 47.9458 50.7968 53.8174 57.0175 60.408 64

O prximo passo agora analisar os dados obtidos na ressntese e, a partir da


srie de frequncias ordenadas, encontrar a srie harmnica real, que no
necessariamente ser uma srie harmnica perfeita, formada por uma sequncia de
nmeros inteiros. Dessa srie obtida, comparamos com a nova srie gerada a partir da
escala e encontramos os intervalos de diferena, que so inseridos na tabela usada para
reafinar os osciladores.

138
Agora um segundo exemplo de uma escala que divide uma dcima segunda em
13 intervalos iguais, tambm conhecida como a escala de Bohlen-Pierce (Pierce 2001
p. 183). Os nicos intervalos que correspondem srie harmnica so o nmero 3 e
seus mltiplos, marcados em negrito. A srie vai at o 64 harmnico, que no caso foi
substitudo por 62.9161, prximo da oitava.

Escala: 146.301 292.608 438.912 585.218 731.524 877.827 1024.13


1170.43 1316.74 1463.04 1609.34 1755.65 1901.95

Srie da Escala: 1 1.96613 3 3.93226 5.06695 6 7.22722 7.86452 9.3127


10.1339 11.0276 12 13.2831 14.4544 15.729 17.1161 18.6254 18.9462 20.2678
20.617 22.0551 22.435 24 24.4134 26.5662 28.9089 31.4581 34.2322 37.2508
37.8925 40.5356 41.2339 44.1102 44.8701 48 48.8269 53.1325 57.8178 62.9161

Um ltimo parmetro nos permite no forar todos os parciais a serem relocados


aos termos da nova srie. Podemos estipular uma diferena mxima em que o parcial
deve estar dentro para que ento seja reafinado. Esse procedimento foi implementado
porque s vezes vale a pena alterar apenas alguns parciais da srie, como quando temos
apenas poucos intervalos para gerar uma nova srie, que mal caracterizam um Sistema
de Afinao. Por exemplo, a entrada pode ser uma diviso da oitava em apenas 4
intervalos, que nos d um acorde diminuto e os intervalos de 300, 600, 900 e 1200
cents. Com isso geramos a seguinte srie:

1 2 2.82843 4 4.75683 5.65685 6.72717 8 9.51366 11.3137 13.4543 16 19.0273


22.6274 26.9087 32 38.0546 45.2548 53.8174 64

Essa lista contem apenas 20 itens e est bem incompleta em relao s listas
anteriores geradas por outras escalas. Apenas os parciais que estejam, digamos, numa
proximidade de 0.5 (acima ou abaixo) desta lista sero remapeados. Os outros parciais
que no esto nesse raio de proximidade permanecem intactos.
Outra forma de no reafinar todos os parciais encontrados na anlise a partir do
filtro mencionado anteriormente, em que podemos estipular um nmero mximo de
parciais a serem manipulados, o que nos d apenas os harmnicos com maior energia.
Todos esses controles permitem que a manipulao seja minuciosamente
controlada, de modo que o usurio pode experimentar at encontrar uma alterao
espectral que lhe satisfaa. Os parmetros podem ser processados em tempo real e isso
tambm abre uma margem para transformao contnua do som de uma forma muito

139
dinmica.
Tendo essa opo em mente, foi inserido ainda outro controle que permite fazer
uma metamorfose entre o som original e o destino do mapeamento espectral. O
controle morph um valor de 0 a 1, que multiplicado pelos valores da tabela de
reafinao. Logo, se igual a 0, nenhuma reafinao acontece e, se for igual a 1, a
transformao completa.
Por fim, um ltimo cuidado na transformao um detector de ataques (com o
objeto nativo [bonk~]), que corta, da mesma maneira que o controle de morph o
processamento no momento em que detecta um ataque. Isso faz que a qualidade sonora
de um ataque seja preservada, mantendo-se fiel, assim, percepo do timbre original,
visto que o momento de ataque um dos elementos fundamentais no reconhecimento
de timbre (Schaeffer 1966). Outro fator que, no momento do ataque, o resultado de
um processamento desse tipo gera resultados sonoros desastrosos, uma vez que a
informao espectral chega a ser catica, dificultando bastante a capacidade de apenas
operar sobre os parciais relevantes.

Figura 58 Mdulo de mapeamento espectral, de acordo com um


acorde diminuto (intervalos de 300 600 900 1200 cents).

140
10.5 Curvas de Dissonncia e Gerao de Escalas a partir de Sonoridades
As Curvas de Dissonncia so grficos que representam valores de dissonncia
para intervalos musicais, ou melhor, dades. Os atributos que descrevem a dissonncia
so o foco de discusso nesta tese, em que a Aspereza possui um forte destaque, uma
vez que, desde seu aparecimento na literatura, seu modelo j foi usado para gerar
grficos dessa ordem. A Figura 9, apresentada na seo 5.2 sobre Modelagem de
Aspereza, um exemplo do modelo de Helmholtz (1877). Nesse grfico, a Aspereza
est relacionada com a Dissonncia Sensorial. Na sequncia, a figura 10 outra Curva,
porm invertida (de consonncia em vez de dissonncia, com os valores de Aspereza
de cima para baixo).
Antes disso, porm, na subseo 4.3.1 (Fuso Tonal), a Figura 6 dos resultados
de Stumpf (1890) tambm pode ser encarada como uma Curva de Consonncia. Na
seo 5.5, a Figura 13 traz o modelo de Barlow recriando a Figura 10 e comparando
com os resultados da curva de Harmonicidade, que apontamos ter semelhana com a
figura 6. E na figura 14, temos mais uma Curva de Dissonncia dada pela medida de
Entropia Harmnica.
O ponto de discusso que no somente a Aspereza deveria ser adotada como
nica dimenso da Curva de Dissonncia. Essa discusso ser tratada na prxima
parte, onde retomaremos a discusso terica e apontaremos para as concluses finais.
Nesta seo apenas apresentamos a estrutura e funcionamento do patch que gera
curvas.
Nosso interesse , claramente, gerar curvas com os atributos estudados. Alm da
Aspereza, que mede o alinhamento dos parciais, podemos, como uma segunda
dimenso da Dissonncia Sensorial, gerar curvas com o modelo de Tonalness, que
contabiliza as relaes harmnicas de intervalos musicais. O Brilho, porm, no gera
resultados significativos ou teis em uma curva de intervalos musicais, pois no mede
o alinhamento de parciais, tampouco relaes harmnicas ou inarmnicas.
No tocante aos atributos da Harmonia, o descritor de Fundamental do Acorde
tambm no gera curvas, pois s indica o Baixo Fundamental da dade. Todavia,
podemos entend-lo como um desdobramento do modelo de Tonalness, j que a
Fundamental do Acorde depende diretamente da medida desse atributo, e ser mais
proeminente de acordo com a medida de um alto Tonalness. Por fim, temos a
Comonalidade de Altura, que pode ser usada como uma medida paralela. Em
compensao, no podemos usar o mesmo patch gerador de curvas com o objeto

141
[Pitch-Commonality], j que esse objeto possui uma estrutura diferente de comparao
e necessita de uma adaptao simples para esse objetivo.
No obstante, o objeto capaz de ser usado para gerar curvas, tanto que, no
exemplo da figura 44, usamos o objeto para comparar intervalos musicais e os
resultados podem ser utilizados para gerar um grfico em forma de curva. A figura 59
representa justamente isso: temos os mesmos dados obtidos anteriormente dispostos
em um grfico de curva, que poderiam ter vindo diretamente da sada do objeto.
Lembremos que o dado sonoro analisado so dades de ondas dente-de-serra, em uma
oitava de 440 Hz a 880 Hz.

Figura 59 Curva de Comonalidade de altura para 13 intervalos


musicais do sistema temperado (do unssono oitava).

Assim, para que o objeto funcione como um gerador de curva, precisamos


armazenar uma srie de Perfis de Salincia de Altura na ordem desejada. comum que
a estrutura das curvas seja de forma ascendente como esta, do unssono at a oitava,
medindo dades formadas por um mesmo espectro sonoro. No exemplo anterior, temos
passos de semitom, mas desejvel uma resoluo maior, que nos d uma curva
propriamente dita, em passos de 1 cent, por exemplo.
Sobre algumas primeiras concluses, podemos notar que no h muito
contraste entre os valores dados pela Comonalidade de Altura, que a maior variao se

142
d para os intervalos de oitava, quarta e quinta justa e como no h muita diferena
entre o trtono e a segunda menor. Note-se, na figura 60, como a Aspereza, por
exemplo, nos d um contraste maior. Na linha superior dessa figura, temos os mesmos
resultados da figura 44, dados pelo modelo de Comonalidade de Altura. J a linha de
baixo dada pelo modelo de Aspereza para o mesmo som analisado anteriormente e
no mesmo registro, sem redimensionamento das amplitudes ou mascaramento e com o
mtodo de extrair a mdia quadrtica de Barlow (2008) como Peso de Amplitude. O
modelo de Aspereza acusa uma maior dissonncia (ou desalinhamento de parciais em
torno de um quarto da Banda Crtica) para os intervalos de segunda menor e stima
maior, por exemplo.

Figura 60 Comparao entre Comonalidade de Altura e Aspereza.

Vejamos agora a estrutura bsica do patch gerador de Curvas na figura 61, que
consiste em receber uma lista de componentes espectrais (Frequncias e Amplitudes) e
duplicar essa lista para formar dades. Enquanto a lista original se mantm intacta, a
cpia transposta em passos dados at um intervalo mximo especificado. Esse
intervalo, o ponto inicial, o tamanho de passos e o intervalo mximo (ou registro) so
dados como argumentos em cents. Assim, para gerar um grfico como o da figura 60,
damos o argumento do registro (uma oitava: 1200 cents), o ponto inicial da curva
(unssono: 0 cents) e o tamanho do passo de transposio (um semitom: 100 cents).

143
Figura 61 Patch gerador de Curvas de Dissonncias, com a abstrao [Curve].

Figura 62 Comparao entre atributos (Tonalness Complexo e


Comonalidade de Altura Acima, e Tonalness Puro e Aspereza Abaixo).

144
Figura 63 Comparao dos quatro atributos.

Na figura 61, o patch analisa uma onda dente-de-serra a 440 Hz. Extramos listas
de 50 componentes espectrais com o subpatch [pd lists(sigmund)] e as enviamos para a
abstrao [Curve], com os argumentos previamente mencionados. As listas geradas
formam dades e so enviadas para um objeto de um dos atributos. No caso, a anlise
foi feita com o objeto [roughness], de Aspereza. O resultado para cada dade retorna
para o objeto de curva, que guarda os valores em uma tabela. Na figura 62, temos
tambm as medidas de Tonalness Puro e Complexo e, na figura 63, temos os quatro
atributos comparados entre si.
Lembrando o conceito de Tonalness Puro, sua medida decai junto com a queda de
energia dos parciais, dada pelo mascaramento. Como o mascaramento se d entre
parciais em uma mesma banda crtica, essa medida possui um contraste similar dado
pelo modelo de Aspereza. J o Tonalness Complexo depende diretamente do modelo
de Altura Virtual e indica uma maior ou menor relao harmnica. Ele est, portanto,
mais prximo da medida de Comonalidade de Altura. Outras anlises e discusses
tericas sobre as Curvas de Dissonncia sero desenvolvidas na parte final desta tese.
Vejamos agora a Curva de Aspereza da Figura 64, com passos de 1 cent, e como
podemos gerar escalas com pontos mximos e mnimos da Curva. A mesma entrada
sonora agora analisada com uma maior resoluo, e as Curvas se assemelham aos
desenhos das Figuras 9, 10 e 13. Podemos, assim, encontrar quais so os pontos

145
mximos e mnimos dessa curva, dados que so fornecidos pelo outlet esquerdo do
objeto [curve].

Figura 64 Curva de Aspereza com uma resoluo de passos de 1 cent.

Os pontos sempre se alternam entre um ponto mnimo (pares) e mximo


(mpares), ou seja, alternam entre consonncias e dissonncias. Esses pontos esto
marcados em linhas na figura 64, e podemos ver que em alguns casos h pouqussimo
contraste entre uma consonncia e dissonncia adjacente (mesmo assim, h mais do
que os resultados dados por uma Comonalidade de Altura).
A seguir, analisamos os pontos mnimos e mximos dados pela anlise de
Aspereza. Todos os pontos mnimos, nesse caso, correspondem bem a intervalos
justos. Como o som analisado uma onda dente-de-serra ou seja, um tom complexo
harmnico com energia em todos os parciais , era de se esperar que os resultados dos
pontos mnimos fossem prximos a intervalos justos. O interessante, todavia, partir
de sonoridades cujos resultados so difceis de prever e, assim, adotar a anlise como
uma forma de nos dar respostas. Veremos alguns exemplos como estes no prximo
captulo, no sistema que engloba todas as tcnicas aqui expostas. Segue abaixo a

146
Figura do Patch que nos d os pontos da escala, e, em seguida, esses pontos em uma
tabela de comparao com intervalos justos.

Figura 65 Escala com pontos mximos e mnimos da Curva.

Tabela 10. Escala do Espectro

Passo cents intervalo prximo


0 0 [1:1]
1 79
2 268 [7:6] 266.87 cents
3 288
4 314 [6:5] 315.64 cents
5 348
6 385 [5:4] 386.31 cents
7 438
8 498 [4:3] 498.04 cents
9 563
10 581 [7:5] 582.41 cents
11 634
12 702 [3:2] 701.95 cents
13 766
14 885 [5:3] 884.35 cents
15 934
16 970 [7:4] 968.82 cents
17 1131
18 1200 [2:1]

Por fim, apresentamos adaptaes do objeto gerador de Curvas, para que possa
gerar curvas a partir de duas sonoridades distintas. No caso, temos mais duas entradas

147
para as listas da segunda sonoridade. A sonoridade que se mantm fixa a B (inlets
do meio), enquanto a sonoridade A transposta da mesma maneira que antes. Um
ltimo objeto foi desenhado para que fosse usado com o objeto [Pitch-Commonality].
Como esse objeto possui uma estrutura de comparao, precisamos apenas enviar uma
sonoridade, e no dades. Veja as duas adaptaes na figura abaixo.

Figura 66 Adaptaes da abstrao [Curve].

No objeto [gliss], o tom fixo o que permanece armazenado, enquanto as


sonoridades de entrada so transpostas da mesma maneira. Outro modo de entender
esse processo que essa sonoridade faz um glissando. Para comparar sonoridades
diferentes, no necessitamos de uma adaptao, basta armazenar a sonoridade B, que
se mantm fixa no objeto [Pitch-Commonality], enquanto uma sonoridade A faz o
glissando.

10.6 Autotuner e Gerador de Escalas


Para finalizar a abordagem das ferramentas bsicas desenvolvidas na pesquisa,
temos duas abstraes: uma um gerador de escalas e outra, um corretor de afinao
chamado de Autotuner31 de acordo com uma escala dada. Estas so ferramentas teis
para algumas aplicaes que temos visto, como o Mapeamento Espectral, j que esse
mdulo responde entrada de uma escala, e tambm porque geramos escalas a partir
de espectros e implementamos patches de mudana de altura e harmonizadores.
A figura a seguir contempla algumas dessas capacidades. O gerador de escalas

31
Que no diz respeito ao autotuner previamente mencionado na seo de Vocoder.

148
cria uma diviso da oitava em 13 passos iguais. Inserimos essa escala no mdulo de
mapeamento espectral, que manipula os parciais de acordo com a escala. Aps esse
estgio, geramos uma curva de Aspereza. A expectativa que os pontos mnimos
encontrados estejam de acordo com uma diviso da oitava em 13 partes. Por fim,
inserimos no Autotuner o valor de 700 cents, que uma quinta justa no temperamento
igual. Pedimos ento que o corretor de afinao mude para o intervalo consonante mais
prximo, de acordo com a escala dada pela curva. Eis que o intervalo mais prximo
acusado de 738 cents, que corresponde exatamente quinta da escala da diviso igual
da oitava em 13 partes. Por fim, usamos a abstrao de [pitch-shift], baseada em Phase
Vocoder, como um harmonizador.

Figura 67 Integrao de Mapeamento Espectral, Gerar escala


de Espectro por meio de Curva de Aspereza, Autotuner e Pitch Shifter.

Essas duas abstraes possuem diversas funes avanadas, descritas com mais
detalhes no prprio arquivo de ajuda. As escalas geradas podem dividir qualquer

149
intervalo (no s a oitava) de diferentes formas e no apenas em passos iguais.
possvel tambm importar escalas no formato .scl, do software Scala32, que uma
plataforma especfica para construo de escalas e j vem com um banco de dados de
mais de quatro mil escalas. J a abstrao de reafinao automtica permite navegar
pela escala dada, reafinar para o mais perto acima ou abaixo e possibilita uma correo
em glissando/portamento, ou automtica, dentre outros.
Praticamente todas as ferramentas apresentadas aqui foram integradas em um
nico sistema, compacto e condensado, chamado [Brane~]. Este ser descrito no
captulo seguinte. Claramente, algumas possibilidades de combinao dos mdulos
desenvolvidos no foram consideradas, apenas as mais pertinentes. Essas duas
abstraes aqui apresentadas so exemplos de elementos que foram incorporados no
sistema com algumas funcionalidades a menos, com o intuito de simplificao, dado a
complexidade que o sistema adquiriu.
Em compensao, novos potenciais emergiram da combinao desses elementos
em um sistema nico. E, em todo caso, os mdulos desenvolvidos ainda permanecem
de modo independente com eventuais funcionalidades avanadas. De tal modo, uma
busca de novas estruturas e patches a partir desses elementos continua possvel, at
mesmo em combinao com o sistema desenvolvido apresentado a seguir.

32
Disponvel em: <http://www.huygens-fokker.org/scala/>.

150
Captulo 11) [Brane~] Um Sistema para Interao
em Tempo Real Desenvolvido em Pure Data

[Brane~] um sistema interativo em tempo real que comporta praticamente


todas as ferramentas desenvolvidas durante a pesquisa. O sistema foi desenvolvido e
implementado como uma abstrao de Pure Data na maior parte com objetos nativos, o
que o torna muito compatvel, aberto e acessvel.
A juno de todas essas ferramentas resulta em uma conveniente soma de
potencialidades disponveis em apenas um nico mdulo, que permite no somente o
uso de algumas capacidades em separado, mas tambm certas aplicaes especficas
que emergem do cruzamento de alguns de seus elementos.
A melhor forma de demonstrar suas potencialidades no atravs deste texto,
mas sim a partir de um manual detalhado que acompanha o lanamento deste
programa, assim como um tutorial demonstrativo em vdeo que exemplifica sua
utilizao em tempo real. Neste texto, apenas apontamos suas caractersticas
principais.

Figura 68 Tela interna da abstrao [Brane~].

O nome uma referncia a P-branas, conceitos da teoria M (substituta da


teoria das supercordas na fsica moderna) que dependem de um modelo do universo

151
com at 10 dimenses de espao e uma de tempo. O logotipo uma figura de Calabi-
Yau, que representa espaos curvados em dimenses extras. A inspirao potica para
a adoo dessa referncia uma aluso a uma ideia de o sistema operar em diversas
dimenses de espao e tempo em um sinal sonoro.

11.1 Resumo do Sistema


A Figura abaixo apresenta uma organizao geral do subpatch [Brane~]. A
estrutura bsica da abstrao inclui os seguintes elementos:
- Sampler com capacidades flexveis de gravao e leitura;
- Compresso e expanso de Tempo;
- Mudanas de Altura (Pitch Shiffting);
- Harmonizer;
- Pitch Tracking e imitao meldica;
- Autotuner;
- Modulaes de Amplitude;
- Ressntese com controle arbitrrio de parciais;
- Mapeamento Espectral;
- Descritores e Curvas de Dissonncia.

Figura 69 Estrutura do [Brane~].

A base inicial do sistema um sampler (primeira caixa de cima para baixo na


Figura 69). O sampler carrega arquivos mono ou estreo, e tambm grava uma entrada
de udio em um ou dois canais. Uma segunda base o Phase Vocoder, que permite a
leitura do udio em diferentes velocidades sem interferir na mudana de Altura. Alm
disso, h diversos outros controles de leitura.
O Phase Vocoder tambm permite alterar a Altura de modo independente (ou
seja, pitch shift, que a prxima caixa na figura acima). Veremos algumas outras

152
possibilidades com essa tcnica, como um harmonizer e reafinaes automticas
(Autotuner), pois o sistema pode carregar escalas, ou ainda ser alimentado com um
gerador de temperamentos iguais embutido.
[Brane~] possui dois mdulos de efeitos (prxima caixa FX na figura 69).
Um primeiro de modulao de Amplitude (Clssica, em Anel, e Complexa), e um
segundo que se trata de um mdulo de ressntese, que permite controle arbitrrio de
parciais, ou uma aplicao especfica de Mapeamento Espectral. Por fim, temos uma
mixagem final do sinal (caixa mix), e os dois canais de sada dessas manipulaes
so alimentados em descritores de dissonncia em tempo real (caixa Diss), que,
dentre outras coisas, tambm permitem gerar curvas para obter escalas.

11.2 Base do Sistema


Todos os controles do sistema podem ser armazenados em um preset, podendo
ser salvos, carregados e navegados na seo do canto superior esquerdo. Essa
possibilidade faz que diversas parametrizaes possam ser acessadas rapidamente, o
que potencializa a maleabilidade do sistema.

Figura 70 banco de presets.

Outra funcionalidade no presente nos patches dos captulos anteriores o


armazenamento de udio em um buffer. A adoo dessa base estrutural de um sampler
traz paradigmas centrais de performance, as quais descreveremos aqui, a comear
pelos seus controles principais.
Os botes centrais principais so: Rew (de rewind, rebobinar), para
apagar e resetar o buffer. Rec (de record) para gravar o udio de entrada no
buffer. E o ultimo boto direita pausa e reinicia a gravao. O toggle loop, quando
acionado, reinicia a gravao do incio do buffer quando ele for totalmente preenchido.
O tamanho do buffer dado em minutos na caixa de nmeros time. O buffer pode
tambm ser exportado como arquivo de udio com o boto save. O boto open
carrega arquivos de udio no buffer, que redimensionado para o tamanho dos

153
mesmos. A caixa de nmeros fade d o tamanho do fade in e fade out em
milissegundos, para prevenir clicks. Por fim, um controle de Bypass permite ouvir o
sinal de entrada sem que ele esteja sendo gravado.

Figura 71 Controles do buffer (esquerda) e de leitura (direita).

Quando comeamos a gravar no buffer, possvel que o player comece a tocar


automaticamente junto, ou ento aps ser acionado pelo toggle S (de start). O toggle
F (de freeze) congela o udio, o que significa que a leitura pausada, mas ainda
podemos escut-lo. Acima, esquerda, temos o boto | | de pause (ou stop), que,
quando acionado, muda de estado para go, que reinicia do ponto de parada. direita
deste, temos o boto > que reinicia do comeo do buffer. O boto B (de bounce)
rebate a direo de leitura, alterando entre o normal e ao contrrio. O horizontal
radio (caixa com trs botes no canto superior esquerdo da figura direita) permite
que seja possvel um loop automtico ao fim do buffer, ou um bounce automtico. No
canto superior direito, o location nos mostra em que ponto de leitura estamos no
buffer, dado em porcentagem, e o knob leva a qualquer ponto do buffer gravado. O
volume geral controlado pelo slider vertical, e o slicer controla parmetros de
edio que ficaro mais claros a seguir.

Figura 72 Sliders de visualizao do buffer.

Essa seo da interface representa o buffer de udio, em que ponto da gravao


estamos e a posio de leitura. As caixas de nmero direita representam o tempo em

154
minutos e segundos. Trs sliders abaixo podem restringir a leitura em apenas um
trecho recortado. Os botes do slicer apresentados na figura 71 marcam o ponto
esquerdo (L) e direito (R) quando acionados, e os toggles desativam o recorte.
possvel editar uma fatia do udio diretamente com os sliders, e a caixa de nmero
direita d um tamanho mnimo da fatia em segundos. O slider central o ponto mdio
e pode ser acionado para arrastar a fatia para direita ou esquerda.
A base elementar do sistema consiste nesse sampler, que depende de um Phase
Vocoder para controlar a velocidade de leitura. Apenas com esses elementos,
despontam algumas aplicaes criativas interessantes em tempo real, o que o torna um
ncleo principal, cuja potencialidade expandida e refinada com os frutos desta
pesquisa.
A figura 73 traz a primeira verso de um Sampler e Phase Vocoder ao vivo
desenvolvido durante a pesquisa, com menos capacidades de leitura e gravao.
Entretanto, esse mdulo relativamente simples tem sido adotado desde ento como
ambiente de improvisao pelo saxofonista Rogrio Costa, que tem desenvolvido boas
tcnicas de improvisao ao vivo com o sistema elementar. Rogrio Costa tambm
um parceiro nesta pesquisa e forma um duo de improvisao com o autor desta tese,
envolvendo outras capacidades desenvolvidas durante a pesquisa.

Figura 73 - Primeiro mdulo de Phase Vocoder, usado por Rogrio.

Ressaltamos aqui como mesmo esse mdulo bsico, sem as expanses com
elementos da pesquisa, j traz contribuies interessantes. O ambiente permite um
dilogo entre uma entrada de udio em tempo real e sua armazenagem no buffer. Com
uma velocidade de leitura apenas um pouco mais lenta, temos uma espcie de delay,

155
que entra em uma defasagem maior com o tempo. possvel, assim, gerar espcies de
cnones e contrapontos diversos.
O mecanismo de loop permite tambm manter ostinatos de base em uma
camada de fundo para improvisaes e contrapontos. Variaes diversas so possveis
com simples mudanas de leitura em tempo real, como variao de Tempo e Altura, e
tambm na capacidade de tocar os trechos gravados de trs pra frente. Sem contar que
diferentes parametrizaes esto facilmente disponveis pela navegao de bancos de
presets.
Essas caractersticas fundamentais so o cerne principal do sistema que, apesar
de agregar novas funes relacionadas pesquisa, ainda se vale desses mesmos
princpios de manipulao em tempo real do buffer.
Essa unificao de um Phase Vocoder com um Sampler, apesar de
relativamente trivial, no muito comum, se levarmos em conta as diversas
implementaes de Phase Vocoder que esto disponveis atualmente. A maioria opera
apenas em arquivos carregados no buffer. Quando permitem gravao no buffer, h
uma certa limitao de recursos em comparao implementao desenvolvida e aqui
apresentada.

11.3 Capacidades Avanadas

Figura 74 Controles avanados.

A figura acima exclui os controles de leitura do buffer, apresentado na figura


71. direita, temos controle do tamanho da janela de FFT wSize (window size). O
toggle L (de lock) parte de uma tcnica especial de trancamento de fases (phase
locking), desenvolvido por Miller Puckette (1995). As caixas de nmero indicam a

156
alterao de altura em cents, que podem atuar de modo independente, ou como um
harmonizer. O slider vertical ao lado das caixas funciona como um mixer, ou
balance entre as duas vozes na sada master.
O toggle H (de harmonizer), quando acionado, faz que a correo de altura
no ocorra independentemente entre as duas vozes. O primeiro conceito que a caixa
de baixo diz respeito a uma fundamental e a de cima, a um intervalo harmnico. No
sistema, independentemente desse paradigma e modo de operao, nos referimos
sempre s caixas, respectivamente, como root e harm.
O sistema muda bastante de propriedades quando lida com sinal mono ou
estreo. Quando operamos apenas em um canal, o sinal duplicado. A caixa de cima
representa o intervalo musical (em cents) em relao ao sinal original que, por sua vez,
pode ter sua altura alterada pela caixa de baixo. Mudanas na caixa inferior (root)
tambm promovem uma alterao de Altura no sinal duplicado (harm), que mantm a
mesma relao intervalar dada pela caixa de cima.
A mudana de altura de cada caixa de nmero feita por um Phase Vocoder
independente. Todos os mdulos de efeito tambm so duplicados e podem ser
independes para cada canal. O acesso se d nos controles do canto inferior esquerdo da
Figura 74. No caso de um sinal estreo, o canal esquerdo controlado pela caixa de
baixo e o direito, pela de cima, mas podem igualmente operar de modo independente
de acordo com o estado do toggle.
O mdulo de autotune opera sobre essas caixas de nmeros. Por meio de uma
identificao de Altura obtida pelo objeto [sigmund~], possvel que uma melodia seja
reafinada em tempo real de acordo com uma escala. Essa tambm uma especialidade
do sistema [Brane~], que no foi implementada nos mdulos independentes. Essa
mesma escala (ou outra) pode ser aplicada para uma afinao automtica das caixas de
nmero da Mudana de Altura.
Correes automticas de altura podem ocorrer tambm a partir de modulao
de amplitude, mantendo-se a mesma fundamental, como apresentado anteriormente na
figura 55. Essa integrao compacta conveniente, por deixar latente diversas opes
que podem ser facilmente combinadas de modo experimental.
Novamente pela identificao de Alturas, possvel uma outra particularidade
do sistema, em que h a possibilidade de fazer que a linha meldica de um canal imite
a melodia de outro, mesmo se esse modelo de imitao for distorcido. Porm, com a
possibilidade de mudana de Alturas, possvel formar harmonias diversas, ou

157
contrapontos.
Outro ponto central, como no poderia deixar de ser, o mdulo de ressntese e
Mapeamento Espectral. Uma capacidade avanada nesses sistemas permite que dois
canais independentes sofram um mapeamento distinto como, por exemplo, de uma
diviso igual da oitava em 7 partes em um e em 11 partes em outro.
Com a possibilidade de gerar curvas de Aspereza, possvel encontrar os
intervalos em que essas duas sonoridades alinham os parciais e inserir essa escala no
Autotuner, por exemplo. Essas ou quaisquer outras manipulaes possveis podem ser
analisadas em tempo real para gerar curvas, ou mesmo analisar em tempo real um
descritor, como o Tonalness.
A ordem dos efeitos (Ressntese e modulao de Amplitude) pode ser invertida.
Por exemplo, o Mapeamento Espectral pode ser realizado tambm aps alguma
distoro promovida pela Modulao de Amplitude, o que mantm uma mesma
qualidade ou padro espectral mesmo aps uma manipulao qualquer. Mas possvel
tambm que a fase de ressntese venha antes e uma modulao distora o resultado.

11.4 Outras Consideraes


Como previamente argumentado, entende-se que o texto de uma tese no a
melhor forma de explicar esses conceitos, que dependem de um tutorial mais detalhado
e exemplos prticos para firmar ideias e possibilidades. Mas espera-se que fique claro
como diversas interconexes complexas e interessantes emergem com a convergncia
de todas essas ferramentas em um sistema nico.
O ponto final desta subseo que h muitas potencialidades negligenciadas,
que comeam a surgir no desenvolvimento dessas ferramentas. O desenvolvimento
contou com diversas descobertas e relaes inesperadas ao longo do processo. O que
antes era apenas um sampler integrado com um Phase Vocoder acabou se tornando um
sistema bem mais complexo.
Novas potencialidades ainda esto para serem descobertas. E, como se trata de
apenas uma abstrao de Pd de um mdulo nico, ainda possvel integr-lo a uma
srie de outros projetos e potencialidades enormes desse ambiente de programao
para eletrnica ao vivo, alm da possibilidade de se carregarem mais de uma instncia
desse sistema para que processe independentemente diferentes entradas.
Uma limitao desse sistema que o seu processamento pode ser bem pesado,
em especial quando se faz mapeamento espectral em dois canais independentes, a

158
ponto de poder passar do limite da CPU em um macbook pro core i7 2.66 GHz. Para
carregar mais de um sistema [Brane~], pode ser necessrio adotar um recurso do Pure
Data para otimizar processamento em ncleos distintos, que o objeto [pd~].
J para gerar curvas de Dissonncia sem comprometer o fluxo de udio no Pd,
necessrio que o processamento seja feito em outro programa Pure Data, instalado e
rodando em paralelo. Para isso, um patch anexo ao [Brane~] de gerao de curvas
oferecido para ser aberto desse modo. O controle feito pelo [Brane~] normalmente, e
os patches se comunicam via rede.

159
Captulo 12) Consideraes Finais

Apresentamos nesta Parte II alguns exemplos da incipiente aplicao criativa


da teoria psicoacstica de dissonncia em composio musical. Seguimos a uma
exposio de objetos e ferramentas desenvolvidas. Neste ltimo captulo,
acrescentaremos algumas consideraes para fechar esta segunda parte.
Primeiro, analisaremos algumas contribuies no principal enfoque da
pesquisa, que foi o desenvolvimento de novas ferramentas para eletrnica ao vivo.
Compararemos algumas contribuies em relao a um trabalho nico e principal at
ento desenvolvido para eletrnica ao vivo, que um pacote de objetos para Max/MSP
desenvolvido por Sethares et al (2009). Em seguida, apresentaremos uma breve
considerao sobre o trabalho de design e acessibilidade e, por fim, ainda outras
consideraes sobre fatores de menor enfoque.

12.1 Contribuies em Relao ao Trabalho de Sethares


O trabalho de Sethares (1999) oferece uma profunda anlise entre Afinao e
Espectro Sonoro e nos oferece ferramentas e tcnicas para manipulao sonora
baseadas na fisiologia da escuta. Porm, o autor somente trabalha com a Aspereza e
no se volta a outros elementos pertinentes da Psicoacstica em relao percepo de
Dissonncia.
A maior contribuio de Sethares (1999) foi a gerao de escalas a partir de
espectros e o inverso (a tcnica de Mapeamento Espectral), que consiste em realizar
uma manipulao espectral para que uma sonoridade seja compatvel com uma escala
qualquer. Todavia, essa compatibilidade apenas em termos de alinhamento dos
parciais. Um Mapeamento Espectral feito a partir de uma escala ou Sistema de
Afinao com alto grau de inarmonicidade pode gerar sonoridades igualmente
inarmnicas. Consequentemente, o resultado promove um baixo Tonalness, uma
menor Salincia de um Baixo Fundamental e uma menor Comonalidade de Altura.
As ferramentas desenvolvidas em nossa pesquisa nos permitem analisar o
resultado por esses diferentes aspectos. Uma ferramenta de Anlise importante so as
Curvas de Dissonncia, que normalmente figuram apenas como curvas de Aspereza,
como no caso de Sethares (1999). Uma questo que a teoria Psicoacstica ainda no
nos informa, para uma medida de dissonncia geral, como se d a relao entre os
diferentes atributos apresentados nesta pesquisa. Retomaremos a discusso terica na

160
parte final, onde faremos uma reviso crtica a respeito desse problema, e levantaremos
algumas consideraes e propostas de trabalho.
Com o Mapeamento Espectral, somos capazes se explorar afinaes
alternativas com um novo material, de forma que os Batimentos e a Aspereza so
eliminados. A tcnica faz que afinaes com fortes relaes inarmnicas como uma
diviso da oitava em 11 ou 13 partes iguais possuam uma nova qualidade
meldica/harmnica, de forma que uma linguagem tonal diferente da tradicional pode
ser desenvolvida. Sethares (1999) explora algumas propriedades de um sistema com a
diviso da oitava em 10 partes iguais, por exemplo.
Alm do trabalho desse autor, pouco desenvolvimento tem ocorrido a partir
dessas novas tcnicas. um processo musical muito interessante, mas a teoria
envolvida no trivial. Outra questo que Sistemas de Afinao alternativos
requerem um novo paradigma de interface e novas tcnicas de execuo, alm de uma
ferramenta computacional amigvel e bem difundida.
Em seu livro, Sethares adotou processos de sntese como exemplo. Apenas em
um sistema de Eletrnica ao Vivo (Sethares et al. 2009) que podemos nos valer de
uma riqueza sonora maior, a partir de manipulao de uma execuo de instrumentos
musicais em tempo real.
Na mesma pgina da internet que oferece essas ferramentas33, tambm se
encontra uma srie de sintetizadores virtuais, capazes de modular o Sistema de
Afinao concomitantemente a uma respectiva modulao do espectro sonoro. Esse
conceito se baseia no Mapeamento Espectral, mas chamado de Tonalidade Dinmica.
A respeito da problemtica de interface, h um investimento na produo de
novos controladores em um sistema bidimensional de navegao das notas. Esse
sistema permite que vrios tipos de afinao sejam acessados pelo mesmo paradigma
de navegao/dedilhado, e as ferramentas computacionais tambm se baseiam nesse
paradigma, como um Sequenciador MIDI que adota esse padro34. De qualquer modo,
esses esforos ainda so incipientes e envolvem um investimento grande de
aprendizado, com um retorno ainda no muito claro do ponto de vista criativo. A
tcnica e a teoria precisam ser ainda mais difundidas, novas ferramentas devem ser
criadas, anlises crticas de um ponto de vista musical e composicional devem ser
feitas, relatadas e discutidas, para que ento possam ser criados mais frutos e

33
Vide <http://www.dynamictonality.com/>.
34
Disponvel em: <http://www.dynamictonality.com/hex.htm>.

161
desdobramentos desses primeiros esforos.
Esta tese colabora nesse sentido com a criao de novas ferramentas, e a
discusso de uma reorganizao e ampliao do quadro de modelos com a incluso de
outros atributos perceptivos, alm da relao com outras formas de aplicao criativa,
por meio do paralelo com os exemplos do trabalho de composio de Clarence Barlow
e Sean Ferguson e tambm com desenvolvimentos na rea de Descritores de udio. As
ferramentas desenvolvidas no se fecham apenas a essa questo especializada da
Afinao e buscam uma maleabilidade para que novos processos sejam desenvolvidos
a partir do estudo e experimento com esses elementos.
As ferramentas de Mapeamento Espectral de Sethares possuem essa limitao
de se configurarem como ferramentas relativamente fechadas, dedicadas a um nico
aspecto e especialidade: o de ajustar um espectro e sua melodia de acordo com um
novo sistema de afinao. Dessa maneira, sempre se busca um acordo e consonncia.
O mapeamento se d para um espectro harmnico, ou uma diviso igual da oitava. J
nosso trabalho traz algumas expanses e novas possibilidades com as ferramentas aqui
apresentadas.
Permitimos um maior controle de como o mapeamento pode ocorrer, se todos
os parciais devem ser relocados, ou apenas os que se encontram em um raio de
proximidade. As escalas nas quais podemos mapear os espectros podem ser das mais
distintas. No nos atemos apenas a divises da oitava, ou divises iguais da oitava,
mas a um gerador de escalas que permite diferentes tipos de diviso e de qualquer
intervalo musical. Alm da possibilidade de importar do software Scala. Por fim,
apenas alguns poucos intervalos podem ser inseridos, de modo que apenas alguns
parciais sejam relocados.
Os mdulos de reafinao automtica e harmonizador permitem tambm que
um dado mapeamento espectral seja tocado em uma outra escala qualquer, ou que uma
escala qualquer seja aplicada para uma entrada sonora que no obteve nenhum
mapeamento espectral. Diversas mudanas so possveis em tempo real, onde se
permite passear por essas distintas opes. Assim como um slider de morph permite
alternar continuamente entre o som original e o som manipulado.
Fora essas capacidades estendidas de modulao, as escalas geradas a partir de
espectros tambm possuem passos com pontos mximos de dissonncia, e no apenas
consonncia como o paradigma de Sethares. A adoo de outros atributos
perceptivos nos d a opo de tambm atentar para como as qualidades tonais esto

162
sendo manipuladas, atravs do descritor de Tonalness e de Comonalidade de Altura.
Por fim, o sistema [Brane~] traz ainda mais possibilidades na integrao de
diversas ferramentas apresentadas na pesquisa. Alm de todas as capacidades j
descritas, possvel tambm que uma sonoridade seja reafinada, harmonizada e, ainda,
transposta. Mais que isso, sua estrutura tambm permite a manipulao de duas
entradas sonoras distintas, que podem sofrer alteraes diferentes e mesmo assim
encontrar pontos mximos e mnimos de acordo. Isso sem contar o fato de sua base ser
um sampler com diversas formas de controle de gravao e leitura, que permitem
tambm mudanas de tempo, direo, loops, dentre outros.
Diversas manipulaes avanadas do [Brane~] que envolvem compresso e
expanso espectral, controle arbitrrio dos parciais na ressntese, modulao de
amplitude e convoluo podem ser controladas em tempo real e, posteriormente,
mapeadas para um dado modelo de espectro. Ou, invertendo o processo, um espectro
mapeado pode sofrer futuras manipulaes e, mesmo assim, ainda gerar uma escala a
partir do seu espectro. A gerao de escalas pode tambm ser feita de acordo com dois
espectros distintos.

12.2 Design e Acessibilidade


Um objetivo desta pesquisa produzir ferramentas e uma reviso crtica da
teoria e seu impacto, para que esse conhecimento e dispositivos estejam disponveis a
msicos e compositores em geral, em sistemas de fcil acesso e interao como o Pure
Data. Inclusive, muito da teoria e pesquisa psicoacstica implementada se encontra em
um formato de difcil acesso para msicos em geral, e muitas vezes at mesmo fora de
alguma aplicao de interesse musical.
Buscou-se uma ferramenta aberta e gratuita de eletrnica ao vivo: o Pure Data.
Esse ambiente nos permite gerar interfaces grficas amigveis, com sliders, caixas de
nmeros, botes e afins. Esse tipo de plataforma possui um apelo de maior
acessibilidade que um ambiente de programao em texto e, ainda, que uma
ferramenta como o MAX/MSP, a qual requer compra de uma licena de uso. Antes de
entrar no mrito de uma discusso sobre ferramentas livres, a inteno afirmar o
motivo de tal escolha, que visa uma maior disseminao.
O uso de objetos externos no Pd trivial, qualquer usurio iniciante consegue
carregar objetos j compilados em seu sistema. Mas, o desenvolvimentos de patches
torna a ferramenta mais malevel, editvel. Portanto, implementamos os modelos

163
psicoacsticos em verses de objetos externos e tambm abstraes (patches) como
forma de torn-los ainda mais acessveis. A adoo de objetos externos visada apenas
quando imprescindvel. No caso, algumas aplicaes e funes s foram possveis de
implementar na forma de objetos novos codificados. O processamento tambm mais
rpido na forma de objetos, o que tornou seu desenvolvimento essencial em alguns
casos.
A seguir, algumas consideraes em relao s outras ferramentas mencionadas
na pesquisa. Sobre as ferramentas de CAC, o AUTOBUSK (Barlow 1990), est
disponvel em um formato arcaico, que praticamente depende de uma emulao de
sistema ATARI. E seu sistema especializado para uma tcnica e sistema prprio de
composio musical. O Dissonometer tambm de difcil acesso, pois est
programado em Pascal. Nesta pesquisa, nem chegamos a rodar o programa no seu
original, apenas adaptamos o cdigo para ser implementado como objeto de Pd. O
sistema Apprentice (Ferguson 2000), em Open Music, mais acessvel nesse sentido.
Trata-se de um sistema interessante de composio, distribudo gratuitamente, que
pode ser um interesse futuro de implementao de nossa pesquisa.
A respeito das ferramentas de descritores de udio, o software SPORCH mais
aberto, porm menos amigvel que o Orchide, pois necessita de conhecimento de
programao e compilao de cdigos. O Catart roda em MAX/MSP, mas
distribudo livremente. Sua estrutura, porm, complexa e possui algumas
dependncias externas. O objeto [TimbreID] uma soluo mais simples e com menor
margem de problemas, com uma curva mais rpida de aprendizado.
Nosso processo de desenvolvimento culminou em um patch de Pd chamado
[Brane~], um sistema que incorpora os vrios patches desenvolvidos durante esta
pesquisa. Esse sistema est acessvel em uma interface amigvel. Porm, suas
funcionalidades so muitas, o que pode tornar seu uso nada trivial em um primeiro
momento de contato.
Por isso, importante tambm a exposio dos patches e mdulos
independentes, de modo que cada potencialidade criativa da teoria seja compreendida e
absorvida em paralelo, para que depois se encontrem novas potencialidades na juno
desses mesmos elementos. Claramente, este texto possui outro papel importante
complementar, na exposio da teoria e reviso crtica de vrios aspectos desses
sistemas.

164
12.3 Outras Consideraes
A aplicao dessa teoria tem tido destaque no desenvolvimento de aplicaes
em afinao e escalas. Nosso foco acabou tambm pendendo para uma experimentao
e desenvolvimento de ferramentas nesse sentido, que j nos d diversas possibilidades
de futuras pesquisas. Nesse nicho de maior enfoque, apontamos aqui algumas das
alternativas. Muitas delas emergiram inesperadamente no processo de experimentao
laboratorial, sendo constantemente implementadas. Novas ideias surgiam a partir de
uma perspiccia decorrente de uma melhor noo da potencialidade criativa, obtida por
um olhar compenetrado durante a pesquisa.
Apresentamos aqui o resultado atual de muitas ferramentas, mas entendemos
que elas devem se desenvolver ainda mais em trabalhos futuros. Logo, o resultado
atual apenas um primeiro estgio de evoluo. Primeiras verses e prottipos
puderam ser desenvolvidos nesse tempo em que tambm nos voltamos a uma pesquisa
terica e consideraes crticas sobre o papel e relevncia desse trabalho sob um ponto
de vista criativo.
As possibilidades aventadas no so poucas, nem simples. Mesmo no nicho de
maior enfoque, no pudemos explorar todas as capacidades das ferramentas
desenvolvidas de forma criativa. O sistema foi adotado em uma pea para orquestra e
em processos de eletrnica ao vivo, que sero discutidos na parte final, em uma ltima
exposio e reviso crtica do potencial criativo das teorias estudadas.
Tambm ressaltamos o papel de modelos de dissonncia em processos
composicionais assistidos por computador. As ferramentas desenvolvidas tambm
permitem processos similares, apesar de se encontrarem em um sistema dedicado para
eletrnica ao vivo, o Pure Data. Mas, esse mesmo sistema capaz de processos
similares, onde podemos medir e comparar qualidades sonoras. Um exemplo o objeto
[Pitch-Commonality], capaz de organizar e comparar diferentes sonoridades, sejam
acordes ou tons, harmnicos e inarmnicos.
O Pd pode no ser o melhor ambiente para um processo de composio
algortmica ou assistida por computador, mas ele pode servir, em parte, para isso e
ainda prover uma espcie de meio termo, que lhe permite, concomitantemente, ainda
usufruir de sua estrutura de Eletrnica ao Vivo.
As prprias Curvas de Dissonncia ainda no so capazes de serem
processadas em tempo real. Elas se configuram como uma espcie de descritores para
intervalos musicais, e foram exploradas e discutidas neste trabalho. Para dar conta

165
desse processo em performance, o [Brane~] conta com um mtodo de conexo via rede
entre duas instalaes diferentes de Pure Data, para que o udio no seja interrompido
pelo processo. Mesmo assim, ocorre uma certa latncia e espera de retorno dos dados.
Inclumos tambm no debate alguns avanos na rea de Descritores de udio.
Da mesma forma que em processos de CAC, encontramos uma relao que deve ser
melhor explorada entre os frutos de nossa pesquisa e os processos criativos em
Descrio de udio, como a Sntese Concatenativa.
H muita semelhana entre a estrutura de comparao do objeto [TimbreID], de
William Brent, e o objeto [Pitch-Commonality]. Ambos comparam similaridades entre
o espectro de duas sonoridades, sendo que o [TimbreID] foca em uma semelhana em
relao ao timbre, enquanto o [Pitch-Commonality] em uma semelhana de percepo
de Altura.
No sistema [Brane~] tambm possvel, por meio de identificao de Alturas
(um processo de descrio de udio), modular uma entrada meldica para que imite
outra, ou ainda uma sequncia dada. Entendemos que esse tipo de processo deve fazer
parte das ferramentas e processos aqui apresentados. H ainda muitos avanos que
podem ser feitos em relao aos Descritores de udio e mtodos comparativos de
CAC.
Tais desdobramentos devem emergir com um amadurecimento desse trabalho,
em que um olhar mais aprofundado ajudar a criar novas relaes em um processo
laboratorial de experimentao semelhante ao dos resultados j apresentados.
Retornaremos a essa discusso na prxima parte junto com um debate sobre o impacto
dessas ferramentas em eletrnica ao vivo e composio musical.

166
PARTE III) Discusso Final

Introduo:
Antes de apresentarmos a concluso, temos dois captulos finais que trazem
uma discusso sobre os problemas encontrados durante esta pesquisa. O captulo 13
retoma a discusso terica psicoacstica e tem como objetivo principal discutir as
Curvas de Dissonncia. J o captulo 14 discute o impacto da teoria psicoacstica em
composio musical.

167
Captulo 13) Discusso Terica Crtica

Retomaremos neste captulo a reviso terica na rea de Psicoacstica e


proporemos uma nova forma de organizao dos atributos perceptivos estudados,
assim como uma reviso do conceito de Curvas de Dissonncia, a partir de duas
dimenses perceptivas. Um teste psicoacstico tambm apresentado para ajudar na
investigao, antes de apontarmos consideraes finais e perspectivas futuras. A maior
dificuldade a unificao de diferentes atributos apresentados anteriormente em uma
percepo geral de Dissonncia.

Receio que colocar uma moldura em volta no a torna uma teoria unificada
Tira cmica de Sidney Harris35

13.1 Recapitulao da Teoria Psicoacstica


A Aspereza tem sido encarada como a mais importante dimenso da
dissonncia sob um enfoque psicoacstico, que surge sob a terminologia de
Dissonncia Sensorial e se aplica a qualquer sonoridade. Essa caracterstica da
Dissonncia Sensorial fez que ela se tornasse um grupo sujeito incluso de outros
dois atributos auditivos: Brilho e Tonalness.
Fora de um contexto musical, a relao entre esses trs componentes foi

35
Chalk Up Another One: The Best of Sidney Harris (1992).

168
estudada e medida em testes, e um modelo anlogo ao conceito de Dissonncia
Sensorial chamado de Sensory Pleasantness foi proposto por Zwicker e Fastl
(1999). Nesse modelo, o Brilho possui um papel importante.
No claro como esses trs itens se relacionam em uma medida de
Dissonncia Sensorial em um contexto musical. Em todo caso, em vez do Brilho, a
Aspereza possui um papel de destaque afirmado por Terhardt (2000b), e ferramentas
atuais como a de Sethares et. al (2009) apenas adotam e consideram a Aspereza.
Parncutt (1989) nem menciona o Brilho e apenas diz que a Aspereza e Tonalness so
os elementos mais importantes da Dissonncia Sensorial. Todavia, no encontramos
dados e testes que tivessem investigado esse problema a fundo.
Veremos nesse captulo incongruncias e problemas envolvendo diferentes
modelagens da Aspereza. A respeito de Tonalness, no temos os mesmos tipos de
divergncia, pois sua incluso na literatura mais recente, e as revises feitas por
Parncutt (1989) tm sido aceitas sem confronto com o trabalho original de Terhardt.
O conceito de Tonalness possui relao com outros elementos, como o
Descritor de udio Tonality, o conceito de Fuso Tonal, e ainda alguns modelos
arbitrrios como o de Harmonicidade de Barlow (1980) e Entropia Harmnica de
Elrich (1997). Mas, no contexto da Psicoacstica e Dissonncia Sensorial, temos
apenas o conceito de Tonalness (Complexo) como apresentado neste texto e seu
modelo depende do conceito de Altura Virtual.
Apresentamos duas medidas de Tonalness nesta tese: Puro e Complexo. O
Tonalness Puro uma medida relacionada com sons em um contexto no musical, que
um modelo que faz parte de Sensory Pleasantness, segundo Aures (1985a). A
medida de Tonalness Puro depende apenas dos componentes espectrais, ou melhor, do
Peso de Altura Espectral. J o Tonalness Complexo o conceito de Tonalness por
excelncia, prprio da Dissonncia Sensorial em um contexto musical e baseado nos
Pesos de Altura Virtual, uma medida que se vale de uma busca por um padro
harmnico em uma sonoridade. O Tonalness Complexo dado pelo maior peso de
Altura Virtual, normalizado para que seu valor mximo seja aproximadamente 1.
O Peso de Altura Virtual faz parte de uma medida geral de Peso de Altura, que
inclui tambm algum elemento do Peso de Altura Espectral, caso ele seja mais forte
que o Peso de Altura Virtual. Mas, no geral, o Peso de Altura Virtual a mesma base
do clculo de Tonalness Complexo um dado relevante e presente no Peso de
Altura. Por sua vez, o Peso de Altura uma base de medida para a Multiplicidade e

169
redimensionado para se qualificar como Perfil de Salincias de Altura.
Portanto, o mesmo dado essencial para a medida de Tonalness (Complexo) se
relaciona fortemente com o Perfil de Salincia de Altura, em que cada Salincia indica
a facilidade de se perceber aquela Altura, e a soma de todas as Salincias nos d o
Valor de Multiplicidade. Com esses dados, podemos encontrar os elementos do grupo
de Harmonia, que completa o quadro de atributos da Dissonncia Musical. A
Fundamental do Acorde, por exemplo, dada dentre as alturas mais Salientes. E o
Perfil de Salincia o dado para comparao em um modelo de Comonalidade de
Altura, que busca Salincias em comum.

13.2 Discusso Terica sobre a Modelagem de Dissonncia


Levantamos aqui a questo de quanto cada atributo contribui para uma
percepo de Dissonncia ou como e em que aspectos uns seriam mais relevantes
que outros. O papel de destaque da Aspereza tem sido afirmado constantemente neste
texto, mas questionamos at que ponto apenas esse atributo pode ser considerado.
Propomos tambm uma nova organizao em dois grupos diferentes dos da tabela 4
(que divide nos grupos de Dissonncia Sensorial e Harmonia). Vide tabela abaixo.

Tabela 11. Reorganizao dos Atributos Perceptivos da Dissonncia Musical.

Harmonicidade (Percepo de Altura): Banda Crtica:


- Tonalness
- Aspereza
- Fundamental do Acorde
- Brilho
- Comonalidade de Altura

A relao entre Tonalness (elemento da Dissonncia Sensorial) e os atributos


do grupo de Harmonia (Fundamental do Acorde e Comonalidade de Altura) se d pela
medida de Peso de Altura Virtual, que serve de base para todos e depende de um
padro harmnico do espectro. Logo, todos esses conceitos se agregam em uma
dimenso perceptiva geral de Harmonicidade, que se relaciona com a percepo de
Altura em si36.
A Aspereza no depende de Harmonicidade nem se relaciona com a percepo
de Altura, tampouco o Brilho. Todavia, ambos possuem um fator em comum, que

36
O conceito de Fuso Tonal tambm se encontra dentro desse mesmo escopo conceitual, porm ser
desconsiderada pela falta de um modelo estabelecido. A Entropia Harmnica e a Harmonicidade de Barlow (1987)
so outros conceitos relacionados, mas sero desconsiderados por no se tratarem de modelos psicoacsticos de
fato.

170
uma relao com a Banda Crtica. A Aspereza mede uma proximidade de parciais em
uma banda crtica, e o Brilho contabilizado a partir de energia existente em uma
Banda Crtica.
O conceito de Harmonicidade que estamos definindo aqui est tambm ligado
com a relao de nmeros inteiros pequenos, pois esses so encontrados no modelo de
uma Srie Harmnica que, alm de influencia na percepo de Altura, formam
intervalos musicais justos. Esses intervalos so importantes at mesmo em sistemas
temperados que, em sua maioria, so aproximaes de afinaes justas (Porres 2007).
Nosso sistema temperado, por exemplo, possui uma boa aproximao quinta justa
(3:2), em que a diferena de menos de 2 cents.
Sobre a relao entre os trs elementos da Harmonicidade, o Tonalness e a
Fundamental do Acorde so, na verdade, complementares. A medida de Tonalness o
valor do maior Peso de Altura virtual, enquanto a Fundamental do Acorde a
frequncia da altura mais saliente, que corresponde ao maior Peso de Altura Virtual, j
que h uma forte relao entre o Peso de Altura Virtual e o Perfil de Salincia. Temos
assim uma possvel simplificao que incorpora esses dois conceitos em um nico
elemento, que fornece um dado duplo, o valor de Tonalness e sua frequncia.
O Modelo de Comonalidade de Altura se destaca por nico com caracterstica
comparativa, que visa dar um valor de relao harmnica entre duas sonoridades. A
Fundamental do Acorde tambm se aplica como complemento desse tipo de medida,
ao nos informar qual a frequncia que emerge como Baixo Fundamental da
combinao de duas sonoridades. Ambas medidas, porm, se configuram como o
grupo de Harmonia segundo Terhardt (1974).
O modelo de Fundamental do Acorde pode ento ser acoplado aos outros dois
elementos como um dado complementar. A maior diferena entre os atributos do
grupo de Harmonicidade acaba se firmando entre o Tonalness e a Comonalidade de
Altura. A comparao de grficos de Tonalness e Comonalidade de Altura j foi dada
na figura 62 (pgina 144).
Como o problema da relao entre quaisquer atributos da tabela 1 ainda se
encontra em aberto, partimos de um passo inicial para adressar essa questo e
simplificamos esse quadro ao desconsiderarmos o Baixo Fundamental e o Brilho.
Desse modo, teremos duas dimenses principais: a Aspereza (que j possui seu
reconhecido destaque) e a Harmonicidade (como uma dimenso nica). Essas
dimenses sero levadas em considerao no contexto de Curvas de Dissonncia.

171
13.2.1 Curvas de Dissonncia em Duas Dimenses Principais
As Curvas de Dissonncia so interpretadas nesta tese como um Descritor de
Dissonncia para intervalos musicais. Esse um contexto especfico que trata da
sobreposio de sonoridades e pode incluir todos os atributos psicoacsticos da tabela
11, que correspondem aos atributos da Dissonncia Musical segundo Terhardt (1974).
Na figura 63 (pgina 145), vimos grficos de Curvas de Dissonncia com a
exposio e comparao de diferentes atributos: a Aspereza e outros descritores de
Altura (Tonalness Complexo e Comonalidade de Altura)37. A Fundamental do Acorde,
ao ser aplicada s dades usadas na construo das curvas, no produz um perfil
semelhante. Porm, pode ser considerada sua pertinncia ao constatar que h uma
maior consonncia no caso do tom de base da dade ser aferido como Baixo
Fundamental.
Ao analisarmos dados de medida de Brilho para Curvas de intervalos musicais,
no encontramos informaes significativas de mesma ordem, pois diferenas de
alinhamento de parciais ou a harmonicidade do som no influenciam no seu modelo.
Grosso modo, o Brilho apenas uma medida relacionada distribuio de energia no
espectro. Ou seja, est mais relacionado com a percepo de Loudness do que com as
interaes ou relaes entre parciais.
Dado o problema de relacionar diferentes atributos de nosso quadro, nos
ateremos a uma simplificao que, a princpio, exclui o Brilho e a Fundamental do
Acorde, nos deixando apenas com duas dimenses principais: Aspereza e
Harmonicidade. Desse modo, temos apenas os atributos que geram linhas
independentes em grficos como o da figura 63.
O grupo relacionado percepo de Altura/Harmonicidade mantm assim
apenas dois elementos: Tonalness e Comonalidade de Altura. A diferena entre esses
que Tonalness pode ser empregado em qualquer tipo de sonoridade (Dissonncia
Sensorial), enquanto a Comonalidade de Altura um descritor comparativo de
Harmonia, e depende de duas sonoridades distintas. Ambos, entretanto, podem ser
usados para gerar curvas com resultados similares, ou podem ainda se fundir em uma
nica curva de Harmonicidade. Vejamos agora uma reviso dos modelos de Aspereza
antes de contrapormos essas duas dimenses principais propostas.

37
O Tonalness Puro tambm apareceu no naquele exemplo, mas apenas por questes ilustrativas para que
seu conceito ficasse claro. Consideramos o Tonalness Puro como um conceito parte que no se aplica nesse
contexto de Curvas de Dissonncia.

172
13.2.2 Reviso dos Modelos de Aspereza
As curvas de Aspereza apresentadas na parte anterior (seo 10.5) foram
geradas a partir de um modelo baseado no estudo de Barlow (2008). Apontamos como
a maior controvrsia na implementao de diferentes estudos consiste em como
contabilizar a Aspereza levando em considerao a diferena das amplitudes dos
componentes espectrais.
O mtodo de Barlow calcula uma mdia desses valores. Sethares escolhe o
menor valor das duas amplitudes, procedimento igual ao modelo de Hutchinson e
Knopoff (1978). Enquanto no h grandes diferenas entre esses mtodos, o estudo de
Vassilakis (2001) gera resultados significativamente distintos.
Essa discrepncia , na realidade, a grande contribuio e problema de pesquisa
do trabalho de Vassilakis. Ele revisa e aponta inconsistncias nos mtodos de
contabilizar a diferena de amplitude e desenvolve uma equao baseada no Grau de
Flutuao de Amplitude. Sua reviso foi inserida e adaptada no modelo de Sethares
(1999).
Vassilakis (2001) desenvolveu alguns estudos para medir a sensao geral de
Dissonncia e a sensao de Aspereza de intervalos musicais. No est claro como o
autor define a Dissonncia de um modo geral. Ele parte da noo que ela pode se
relacionar com alguns atributos perceptivos, ou fatores acsticos, mas no discute
quais seriam eles alm da Aspereza. Vassilakis (2001) tambm no revisa, ou discute
diferentes conceitos de dissonncia no decorrer da Histria, como fez Tenney (1988);
consequentemente, sua definio de Dissonncia simplificada e apenas afirma que h
um aspecto sensorial e outro histrico/cultural.

Figura 75 Teste perceptivo de Vassilakis.

173
A figura 75 compara os resultados de dois testes perceptivos desenvolvidos por
Vassilakis. O grfico possui a mesma estrutura que as Figuras 60, 62 e 63, ou seja, so
curvas de Dissonncia para dades no espao de uma oitava no sistema temperado. Em
verde, temos a mdia do resultado da Dissonncia; em vermelho, a Aspereza e a linha
azul o grfico gerado pelo modelo de Vassilakis. O estmulo usado foi uma onda
dente-de-serra sintetizada, levemente inarmnica, com seis parciais. Os intervalos
foram apresentados aleatoriamente.
Vassilakis definiu e treinou os participantes de seu teste a compreenderem a
sensao de Aspereza como um atributo distinto, afirmando que todos foram capazes
de demonstrar que incorporaram o conceito, estando aptos a aferir os resultados nos
testes. Vemos uma diferena entre a Dissonncia e Aspereza estimadas, sendo mais
contrastante a diferena do desenho grfico nos trs pontos da quarta quinta (F4
F#4 e G4). Nas medidas de dissonncia, em verde, o trtono forma um pico bem mais
proeminente, no apenas por sua maior dissonncia, mas tambm pelo fato da quarta
ter sido considerada mais consonante. Os pontos de maior concordncia so o
unssono, oitava e quinta, como fortes consonncias, e o Semitom como maior
dissonncia.

Figura 76 Comparao de Modelos por Vassilakis (2001).

Vassilakis (2001) aponta que uma evidente presena ou falta de Aspereza


contribui no julgamento de dissonncia. Entretanto, em um caso contrrio, o autor
considera que a sensao de Aspereza no influencia mais da mesma maneira e d

174
margem para fatores de outra ordem. Porm, como o autor apenas expe uma
dicotomia entre Aspereza e critrios histricos/culturais, so esses outros fatores que
ele afirma como relevantes no julgamento de dissonncia. O autor valida, em sua
pesquisa, o seu modelo como forma acurada de medir a Aspereza, mas seu estudo traz
algumas implicaes e questes por gerar resultados distintos de modelos anteriores. A
figura 76 compara o resultado de seu modelo com o de Helmholtz (1877) e Hutchinson
e Knopoff (1978).

Figura 77 Curva fornecida pelo objeto [roughness].

Com complemento, fornecemos na figura 77 o resultado dado pelo objeto


[roughness] para uma sonoridade com as mesmas caractersticas no modelo de
Vassilakis. H dois grficos sobrepostos, um o mesmo dado na figura 76, enquanto o
outro a curva dada por uma resoluo de 1 cent. apenas com uma boa resoluo de
pelo menos 1 cent que somos capazes de gerar escalas a partir de espectros.
Vemos na figura 76 que a tendncia dos grficos gerados por Vassilakis
descendente, enquanto os outros modelos geram mais contrastes entre pontos mximos
e mnimos. Essa mesma tendncia de contrastes ocorre para os grficos apresentados
neste texto a partir a implementao do mtodo de Barlow. Desse modo, veremos
como a falta de contrastes nos resultados de Vassilakis no nos ajuda a encontrar,
dependendo da sonoridade analisada, pontos mximos e mnimos da mesma forma que
os outros modelos que possuem uma tendncia diferente.
A figura 78 nos traz curvas de Aspereza gerada pelo objeto [roughness] com
uma maior resoluo (de 1 cent) nos modelos de Barlow (2008) sem o modelo de
mascaramento e Vassiliakis (2001) para a mesma sonoridade das figuras anteriores.
A linha de cima a Curva dada pelo mtodo de Barlow, que, como j adiantamos,

175
possui mais contrastes que a Curva de Vassilakis, abaixo. Mas, no geral, o desenho de
ambas curvas seguem um padro similar.

Figura 78 Barlow (acima) versus Vassilakis (abaixo).

Figura 79 Barlow com e sem Loudness.

176
Comparamos agora os resultados dados pela contabilizao ou no de Loudness
e mascaramento. Vimos anteriormente que o passo relativo ao loudness gera bastante
custo computacional. Averiguamos, assim, at que ponto esse alto custo gera uma
diferena significativa. Veja na figura 79 como a diferena realmente pequena.
Portanto, descartar o de Loudness no distorce muito os dados, dependendo do
registro. Barlow o nico que se preocupou em contabilizar no s o loudness, como
tambm o mascaramento. Porm, o autor no o fez motivado por um melhor encaixe
dos resultados com dados de testes psicoacsticos. Esse tipo de preocupao deve
ainda ser levada em considerao em estudos perceptivos que se voltem para investigar
como o Loudness e o mascaramento de fato contribuem para a sensao de Aspereza.

Figura 80 Barlow com e sem mascaramento.

A respeito do mascaramento, tivemos dificuldade em incluir o processo


adotado por Barlow, que se baseia em um modelo de mascaramento de Zwicker e Fastl
(1999). O problema decorreu de o programa de Barlow adotar outros mtodos prprios
de anlises FFT. Em todo caso, fizemos testes com o modelo de mascaramento
existente no modelo de Comonalidade de Altura. Porm, como este altera bastante os
valores de amplitudes, a mudana dos resultados significativa. Compare na figura 80
o perfil de contorno do modelo de Barlow com e sem o mascaramento. O resultado do
mascaramento gera a linha de baixo, pela menor energia dos parciais.

177
Portanto, temos diferentes parmetros que geram resultados dspares, como o
mtodo de Barlow e Vassilakis para amplitudes diferentes. O modelo de mascaramento
tambm muda os resultados, e h diferentes modelos de mascaramento a serem
adotados, que podem gerar outros resultados. O loudness deve ser contabilizado no
processo, porm vimos que no promove muita diferena a troco de um alto custo
computacional.
Alm dessas questes, o detalhe mais importante diz respeito s discrepncias e
implicaes dos resultados de Vassilakis. O texto a seguir trar uma discusso mais
aprofundada sobre a relao entre as duas principais dimenses de dissonncia
propostas.

13.2.3 Aspereza versus Harmonicidade


Discutiremos aqui a relao da Aspereza com a Harmonicidade, uma segunda
dimenso principal relacionada percepo de Altura. As medidas de Aspereza nas
Curvas remetem ao alinhamento e desalinhamento de parciais que promovem,
respectivamente, consonncia e dissonncia. J os descritores relacionados com
percepo de Altura se baseiam na medida de Peso de Altura Virtual, ou seja, em uma
medida de harmonicidade e inarmonicidade do espectro, os quais tambm promovem,
respectivamente, consonncia e dissonncia.
A maioria dos sons adotados em msica so tons complexos harmnicos, com
alto Tonalness. Para tais sonoridades, o alinhamento de parciais se d nas mesmas
relaes de intervalos justos. Entretanto, quando temos uma variao da
Harmonicidade, os parciais no mais se alinham nas mesmas relaes de nmeros
inteiros pequenos, e o intervalo deixa de ser consonante apenas pelo fato de ser uma
relao harmnica forte, j que a Aspereza gerada pelos batimentos em uma banda
critica promove grande dissonncia.
A aspereza tida como o mais importante elemento psicoacstico da
Dissonncia, porque, no caso de espectros inarmnicos, um intervalo musical
inarmnico que promova alinhamento de parciais provoca menos sensao de
dissonncia que um intervalo harmnico com Aspereza. O fato que, no momento de
encontrar um intervalo musical consonante de acordo com um espectro inarmnico, h
uma espcie de dicotomia e uma falta de meio termo entre a Harmonicidade e a
Aspereza. Isso ocorre porque o intervalo eleito ou o que promove o alinhamento de
parciais, ou o que promove a relao harmnica.

178
baseado nessa prevalncia da Aspereza que conseguimos gerar escalas a
partir de espectros sonoros, ou o inverso por meio do Mapeamento Espectral, em que
conseguimos mudar as relaes de uma sonoridade para que fiquem de acordo com
uma escala. Se a Aspereza no tivesse esse papel de destaque, essa tcnica no poderia
ter se desenvolvido desta forma.
Porm, a curva de Aspereza em si pode mesmo ser considerada a nica
dimenso relevante de uma Curva de Dissonncia? Essa a pergunta mais importante
que levantamos durante a reviso terica desta pesquisa. Antes de tentar clarific-la,
vejamos primeiro algumas consideraes sobre a dimenso que aqui definimos por
Harmonicidade e problemas envolvendo diferentes modelos de Aspereza.
Segundo o trabalho de Vassilakis (2001), a tendncia semelhante dos modelos
de Aspereza (que no empregam sua reviso) imprpria. Todavia, as Curvas de
Aspereza de tais modelos possuem perfis de contorno que parecem representar nossa
sensao de Dissonncia. Considere-se o trtono como exemplo, que, no modelo de
Aspereza de Vassilakis, chega a ser mais consonante (ou menos rugosa) que a tera
maior.
Por mais que a reviso terica de Vassilakis esteja acurada (no que diz respeito
Aspereza), as Curvas de Aspereza de outros modelos tm gerado resultados
satisfatrios em uma prtica musical, na qual se pretende emular uma sensao de
Dissonncia. Uma contribuio importante do trabalho de Vassilakis separar melhor
o conceito de dissonncia e Aspereza por meio de testes. Com esse mtodo, o autor
investiga a relao de Aspereza com a Dissonncia.
Em compensao, seria pertinente uma investigao similar, que se voltasse a
outros atributos psicoacsticos, como o Brilho, Tonalness e Comonalidade de Altura.
A maior questo se encontra na relao entre Aspereza e a dimenso de
Harmonicidade, em que levantamos a questo de se a Harmonicidade no possui um
papel mais relevante do que o esperado, e que pode ser considerado na gerao de
Curvas de Dissonncia.
Como j mencionado, a rea de psicoacstica e cognio est em constante
debate e reviso. Uma vez que no temos um ponto final sobre a relao dessas duas
dimenses em Psicoacstica, novos estudos da rea de neurocincia tambm tm se
dedicado a este problema. Embora nenhum modelo tenha ainda sido proposto,
podemos ressaltar as consideraes trazidas pela pesquisa de Dermott et. al (2010), que
compara a Aspereza com um conceito de harmonicidade.

179
O termo harmonicidade ao qual o autor se refere no designa um atributo
perceptivo especfico, como os trazidos e debatidos aqui, apenas diz respeito a
estmulos formados por espectros harmnicos. Logo, trata-se de um conceito descritivo
acstico, como um conceito e modelo de harmonicidade existente em Descritores de
udio. Em todo caso, h uma relao com os atributos perceptivos que aqui colocamos
dentro de uma dimenso de Dissonncia tambm chamada Harmonicidade, e
entendemos que h uma relao entre nosso conceito de Dimenso de Harmonicidade
e a harmonicidade a que Dermott se refere.
Os resultados do seu experimento apontam para uma forte correlao entre
consonncia e harmonicidade para a maioria dos participantes, mais do que a falta de
batimentos ou Aspereza. A correlao foi ainda mais forte para os participantes com
treinamento musical, sugerindo que uma exposio maior msica amplifica a
sensibilidade a espectros harmnicos, dado sua importncia em msica.
O estudo recente, e o problema ainda precisa ser melhor investigado. Em uma
publicao anterior (2008), o autor tambm ressalta as dificuldades envolvidas numa
investigao dos atributos perceptivos da dissonncia. O fato que diferentes teorias
produzem resultados similares, o que um indcio reafirmado em nossa prpria
pesquisa, em que comparamos resultados de diferentes atributos com resultados
similares. Por exemplo, na Figura 63, comparamos Comonalidade de Altura, Aspereza,
Tonalness Puro e Complexo, e encontramos alguns padres em comum. At mesmo a
teoria de Entropia Harmnica de Elrich nos d um mesmo tipo de contorno grfico da
Aspereza. A dificuldade que surge a de isolar e verificar cada premissa. Por isso,
Dermott et. al (2010) adotou um mtodo de Psicologia das Diferenas Individuais.
Essa abordagem, como se trata de um estudo ainda recente, traz a necessidade
de mais desenvolvimentos e indica como a investigao do problema de percepo de
dissonncia est em pleno desenvolvimento, desde o surgimento da Psicoacstica. Em
nossa reviso terica, encontramos a necessidade de gerar novos testes e investigar
melhor a relao entre os atributos perceptivos da Dissonncia. Apesar das
dificuldades e desafios, com o olhar geral que obtivemos durante a pesquisa, pudemos
encontrar vrios trabalhos interessantes, mas com boa margem para melhorias, ou
adaptaes incluindo pontos positivos de outros trabalhos isolados. A seguir, como
exemplo, apresentamos um primeiro teste perceptivo, que nos ajudou em alguns
aspectos dessa problemtica.

180
13.3 Teste perceptivo de Dissonncia sob uma Perspectiva Sensorial
Este estudo foi inspirado pelo trabalho de Vassilakis (2001). Em parte,
adotamos algumas caractersticas semelhantes. Aps a exposio dos resultados,
trazemos algumas implicaes e apontamos futuras investigaes. Vassilakis (2001)
investiga a relao entre Aspereza e Dissonncia, mas seu experimento no define com
cautela o segundo conceito e como ele se distingue do primeiro (pensado como uma
dimenso sensorial da Dissonncia). Mesmo sem esses detalhes, o conceito de
Dissonncia, nesse caso, abre margem para uma interpretao cultural e individual.
Em nosso experimento, apresentamos um conceito de Dissonncia
Psicoacstica, formada pelos atributos perceptivos estudados e implementados em
pesquisa. Tambm investigamos uma distribuio diferente de intervalos musicais com
praticamente apenas intervalos justos, em um conjunto de 25 dades no espao de uma
oitava. Por serem intervalos justos, os passos no so regulares em cents, mas, grosso
modo, como se fossem passos de quartos de tom.

Figura 81 Interface do Teste Perceptivo.

A interface do teste (vide figura 81) foi implementada em um patch de Pure


Data. Os participantes pediam para tocar uma dade, marcavam o valor de dissonncia
em um slider contnuo e seguiam para a prxima estimativa. Caso quisessem,
poderiam voltar e refazer uma estimativa, ou tocar quantas vezes quisessem antes de
aferir um resultado.
As 25 dades foram dispostas em uma srie aleatria. Ao todo, foram dez
rodadas. Portanto, cada intervalo foi medido dez vezes, totalizando 250 medidas por

181
participante. O experimento contou com 20 participantes com formao musical
variada. E foi desenvolvido com a ajuda de Bruno Giordano, pesquisador colaborador
na rea de Psicologia da Msica, sob a superviso do Prof. Dr. Sean Ferguson, ento
diretor do centro de pesquisa CIRMMT38, em McGill, Montreal, Canad, onde o
experimento foi conduzido em agosto de 2010, durante um estgio de pesquisa.

13.3.1 Estmulos
Os intervalos Justos adotados so formados por fatores primos at o nmero
11. Tais intervalos se encontram no famoso sistema de afinao de Harry Partch
(1974). O critrio de escolha foi partir dos intervalos justos mais prximos ao sistema
temperado, formados pelos menores fatores primos. Temos, assim, as verses com
maior harmonicidade dos intervalos cromticos. Entre esses intervalos adjacentes,
adicionamos um intervalo mais prximo de um ponto mdio. Alm de terem uma
maior harmonicidade, esse conjunto de intervalos no culturalmente familiar. Isto foi
importante para que os participantes no focassem a ateno no intervalo, a fim de
evitar interpretaes decorrentes de um intervalo culturalmente familiar.
O nico intervalo irracional adotado foi um trs oitavos de tom acima do
unssono e abaixo da oitava (75 cents e 1125 cents). Este intervalo no possua uma
aproximao boa em intervalos justos e costuma ser o mais dissonante nos grficos de
Aspereza. Portanto ele foi escolhido entre um intervalo prximo ao quarto de tom e a
verso justa de semitom para ser comparado com eles. O mesmo vale para a inverso,
entre a stima maior e um quarto de tom abaixo da oitava. Para compensar, no h um
intervalo entre o semitom e o tom maior, ou entre a stima menor e a stima maior.
Isso explica-se por no haver interesse na comparao desse intervalo, como ficar
mais claro na descrio dos resultados.
Os 25 intervalos escolhidos se encontram na Tabela 12, em uma ordem
crescente do unssono oitava. Os intervalos so dados em cents, em fraes e seu
nome de acordo com o sistema de Partch (1974) salvo o caso dos intervalos baseados
em trs oitavos de tom, tido apenas como irracional. O registro foi o mesmo de
Vassilakis (de C4 261.6 Hz a C5, uma oitava acima). Os 13 intervalos cromticos
foram apresentados em verses de Afinao Justa, so eles: Unssono (1/1), semitom
(16/15), tom (9/8), tera menor (6/5), tera maior (5/4), quarta (4/3), trtono (7/5),

38
Stio da internet: <http://www.cirmmt.mcgill.ca/>.

182
quinta (3/2), sexta menor (8/5), sexta maior (5/4), stima menor (7/4), stima maior
(15/8) e oitava (2/1).

Tabela 12. Intervalos adotados no teste.


01) Unssono (1/1) 0 cents
02) + 1/4 de Tom (33/32) 53.2 cents
03) + 3/8 Tom irracional 75 cents
04) Semitom (16/15) 111.7 cents
05) Tom (9/8) 203.9 cents
06) 3 m Septimal (7/6) 266.9 cents
07) 3 m (6/5) 315.6 cents
08) 3 Neutra (11/9) 347.4 cents
09) 3 M (5/4) 386.3 cents
10) 3 M Septimal (9/7) 435.1 cents
11) Quarta (4/3) 498 cents
12) Quarta Aumentada (11/8) 551.3 cents
13) Trtono Septimal (7/5) 582.5 cents
14) Quinta Diminuta (16/11) 649 cents
15) Quinta (3/2) 702 cents
16) 6 m Septimal (14/9) 764.9 cents
17) 6 m (8/5) 813.7 cents
18) 6 Neutra (18/11) 852.6 cents
19) 6 M (5/3) 884.4 cents
20) 6 Septimal (12/7) 933.1 cents
21) 7 Harmnica (7/4) 968.8 cents
22) 7 Maior (15/8) 1088.3 cents
23) - 3/8 de Tom irracional 1125 cents
24) - 1/4 de Tom (54/33) 1146.8 cents
25) Oitava (2/1) 1200 cents

Dentre esses, o trtono (7/5) e a stima menor (7/4) foram os intervalos com o
maior fator primo (nmero 7). Dos demais, temos os usuais intervalos at o fator primo
5. Esses intervalos so bem prximos aos temperados e, portanto, so percebidos como
o mesmo intervalo, porm mais consonantes.
A maior percepo de consonncia se d no s pelo maior alinhamento dos
parciais (menor Aspereza), mas tambm pela Harmonicidade (j que esto no sistema
de Afinao Justa). Mas, para que esses intervalos despontassem como mais
consonantes em sua rea vizinha (uma hiptese previamente desenvolvida), os outros
intervalos foram inseridos entre esses intervalos cromticos, formados pelos fatores
primos 7 e 11.
As dades foram formadas por amostras reais de obo, extradas da biblioteca
Vienna Symphonic Library39. Com o programa Melodyne40, tratamos as gravaes

39
Disponvel em; <http://vsl.co.at/>.
40
Disponvel em; <http://www.celemony.com/cms/>.

183
para remover vibrato e aplicar uma pequena mudana de altura para que ficassem de
acordo com os passos dados pelos intervalos adotados. Escolhemos as amostras de
dinmica mdia, e as duraes de cada dade foram editadas em dois segundos.
O experimento foi calibrado para que o estmulo fosse tocado a um nvel de 60
dB-SPL. O equipamento adotado foi uma placa de som Apogee Duet, um fone de
ouvido Seinheiser HD-518 e um Macbook Pro com processador i7 rodando o patch de
Pure Data.
O som de obo foi escolhido por possuir uma boa riqueza espectral, com uma
relativamente grande energia e Brilho. Essa caracterstica sonora colabora para uma
dimenso de Aspereza. Mas, em todo caso, a inteno no era isolar ou fazer
prevalecer essa dimenso, mas, apesar dela, encontrar uma medida geral de
Dissonncia. Alguns participantes mencionaram que, em momentos, os estmulos
soavam como buzinas de carro, e outros disseram que no se deram conta que no
eram tons sintetizados.

13.3.2 Teste e Resultados


Antes do teste em si, uma fase de treinamento visava explicar o objetivo do
teste. Nessa conversa, os participantes expunham seus conceitos e ideias de
Dissonncia, quando se avaliava se possuam a noo de um enfoque sensorial desta
grandeza, na medida em que ela estaria relacionada a alguns atributos psicoacsticos.
Nenhum participante demonstrou estranheza ao conceito. Em diferentes graus, alguns
puderam expor uma noo relativamente clara de conceitos como a Aspereza e
Harmonicidade.
Aps essa primeira conversa, alguns exemplos foram dados para verificar o
entendimento dos participantes. Usamos o exemplo da oitava dissonante de Sethares
(1999). Todos os participantes no tiveram dificuldade em indicar que o som da oitava
mais dissonante, conforme a inteno didtica de Sethares. Em compensao, apesar
de mais consonante, os participantes eram capazes de relatar uma qualidade
inarmnica na sonoridade de Nona Maior. Em comparao a esses exemplos, tocamos
tambm o som de obo, harmnico em relao de oitava. No houve divergncia
tambm em constatar-se que esta seria a sonoridade mais consonante dentre as trs.
Assim, apresentamos estes conceitos mais importantes da Dissonncia sob um
enfoque Psicoacstico: a Aspereza e Harmonicidade (que entendemos se relacionar
com Tonalness e Comonalidade de Altura). Apontamos que no claro como esses

184
fatores se relacionam e que parte do estudo visava encontrar um maior entendimento
desse problema. Afirmamos tambm que havia mais detalhes e outros elementos
psicoacsticos em jogo.
Em todo caso, no adentramos em detalhes conceituais sobre conceito de
Brilho, Tonalness e Comonalidade de Altura. A inteno era apenas firmar uma ideia
de que existem atributos psicoacsticos relacionados percepo de dissonncia,
apresentar esses dois conceitos mais relevantes e depois pedir para que os participantes
tentassem buscar uma escuta mais concreta para propriedades sonoras do que
abstraes terico-musicais, sem focar a percepo em uma dimenso especfica, mas
em uma sensao geral do estmulo.
No comeo do teste, duas rodadas experimentais foram feitas para que o
participante se acostumasse com o processo e sistema. Aps mais uma breve conversa
sobre possveis dvidas, seguimos com o teste em si. Ao todo, desde a primeira
conversa at o fim do teste, uma mdia de 45 minutos bastou para finalizar o processo.
Os resultados foram guardados em arquivos de texto, junto com o tempo do teste,
quantas vezes e quando algum intervalo precisou ser repetido e todas as sries
aleatrias geradas.

Figura 82 Mdia dos nveis de dissonncia encontrados


por meio dos julgamentos dos participantes (n=20).

Os valores contnuos variavam entre 0 (extremo da consonncia) e 10 (extremo

185
da dissonncia). O valor do slider, para cada nova medida, retornava ao centro (valor
igual a 5). Assim, dividimos em pelo menos dois grupos categricos de percepo,
valores mais dissonantes (acima de 5) e mais consonantes (abaixo de 5). Vejamos a
mdia dos resultados na figura 82 e tabela 13 (dados completos em anexo).

Tabela 13. Mdias e desvios-padro

Intervalos Mdias de Desvio Mdias de Dissonncia


em cents Dissonncia Padro em ordem crescente

01) 0 0.14 0.22 0 cents (1) 0.14


02) 53 8.59 1.82 1200 cents (25) 0.31
03) 75 8.21 1.86 702 cents (15) 1.15
04) 112 7.93 1.64 498 cents (11) 2.32
05) 204 5.17 1.73 386 cents (9) 2.43
06) 267 6.17 1.64 884 cents (19) 3.47
07) 316 4.69 1.68 316 cents (7) 4.69
08) 347 6.21 1.34 814 cents (17) 5.07
09) 386 2.43 1.32 204 cents (5) 5.17
10) 435 6.00 1.37 435 cents (10) 6.00
11) 498 2.32 0.98 582 cents (13) 6.00
12) 551 6.49 1.15 969 cents (21) 6.09
13) 582 6.00 1.29 267 cents (6) 6.17
14) 649 7.17 1.08 347 cents (8) 6.21
15) 702 1.15 0.58 765 cents (16) 6.28
16) 765 6.28 1.27 853 cents (18) 6.43
17) 814 5.07 1.52 551 cents (12) 6.49
18) 853 6.43 1.07 933 cents (20) 6.66
19) 884 3.47 1.31 649 cents (14) 7.17
20) 933 6.66 1.29 1088 cents (22) 7.32
21) 967 6.09 1.29 112 cents (4) 7.93
22) 1088 7.32 1.91 1125 cents (23) 8.09
23) 1125 8.09 1.67 75 cents (3) 8.21
24) 1147 8.43 1.07 1147 cents (24) 8.43
25) 1200 0.31 0.38 53 cents (2) 8.59

O primeiro resultado esperado, por intuio e tambm influncia de modelos de


Aspereza, foi um padro de alternncia entre pontos mximos e mnimos por boa parte
do registro o que ocorre entre os intervalos 4 e 22. Desse modo, nessa poro, os
intervalos mpares se apresentam como os mais consonantes, e os pares, como pontos
mdios entre eles. Nos extremos (dades 1 a 4 e 22 a 25), esse perfil de alternncia no
era esperado, e sim esse contorno de um maior pico de dissonncia, por isso no nos
preocupamos em inserir um intervalo de quarto de tom entre o semitom e o tom, assim
como a stima menor e a stima maior.
Essa esperada tendncia de alternncia de pontos de maior dissonncia e maior
consonncia mais clara em alguns casos, como entre a tera maior (dade 09- 386

186
cents) e a quarta (dade 11- 498 cents). Porm, no foi apontada uma mesma tendncia
entre as inverses desses intervalos, a quinta (dade 15- 702 cents) e a sexta menor
(dade 17- 814 cents). O menor desvio padro para consonncias como o unssono,
oitava, quinta e quarta (em negrito na tabela 13) denota uma maior certeza das medidas
para esses casos.
Entre outros intervalos, no havia certeza antes do teste se, de fato, haveria a
acusao de uma alternncia. O ponto de maior dvida era em torno da regio do
trtono. Todavia, de fato, o intervalo de trtono formado pela frao [7/5] (dade 13-
582 cents) foi tido como mais consonante que suas verses vizinhas, a frao [11/8]
(dade 12- 551 cents) e [16/11] (dade 14- 649 cents).
Levantamos a hiptese que a existncia de mais batimentos e a proximidade
com uma forte consonncia (como a quarta e quinta) aumentam a percepo de
dissonncia. Alm de Batimentos em si, podemos considerar a dimenso de
Harmonicidade, ou melhor, de Inarmonicidade. Pois, no caso, percebe-se que h uma
proximidade com um padro harmnico, mas que se encontra de um modo
Inarmnico, ou difuso e incompleto.
Nos modelos de Aspereza, entretanto, o intervalo em torno de 3/8 de tom acima
(01- 75 cents) e abaixo (24- 1125 cents) costuma aparecer como mais dissonante em
relao a quartos de tom. Mas os resultados obtidos no teste sugerem o contrrio, que a
percepo de Batimentos dos quartos de tom percebido como mais dissonante que o
ponto de maior Aspereza. Talvez em parte pela escolha de outro tipo de estmulo, que
contm mais energia que o estudo de Vassilakis (vide Figura 75, em vermelho), a
tendncia do nosso grfico vai contra a ideia que o Pico de Dissonncia em torno da
oitava significativamente menor que o do em torno do unssono.
Outra tendncia dos modelos de Aspereza que o pico de dissonncia em torno
do unssono maior que o presente em torno da oitava. Os resultados do teste indicam
picos similares. Ressaltamos, porm, a grande discrepncia que h no modelo de
Vassilakis, que possui uma tendncia de decaimento e um pico bem menores em torno
da oitava.
Na figura 83, temos duas curvas que comparam os resultados do modelo de
Barlow (sem loudness e mascaramento) com o de Vassilakis. Pode ser argumentado
que o mtodo de Vassilakis mais acurado na medida de Aspereza, mas o mtodo de
Barlow capaz de gerar um perfil mais prximo ao que se espera de uma curva de
dissonncia, promovendo maiores contrastes.

187
Figura 83 Curvas de modelos de Aspereza para o estmulo e registro do teste.

Figura 84 Aspereza (vermelho), resultados do teste (azul) e Tonalness (preto).

Vejamos agora a figura 84 que traz os resultados de Aspereza do mtodo de


Barlow (apenas para as 25 dades adotadas no teste) mais o resultado do modelo de

188
Tonalness em comparao aos resultados do teste. H mais semelhanas entre os
resultados com as medidas de Aspereza do que com as de Tonalness, como em um
padro mais similar de alternncia e contrastes entre pontos mximos e mnimos. As
medidas de Tonalness ainda apontam um padro moderadamente similar aos
resultados, porm com menos alternncia e contrastes entre pontos mximos e
mnimos. O grfico de Tonalness representa a harmonicidade e seu resultado gerou
mais contrastes para comparao que a Comonalidade de Altura.
Um dos pontos de maior divergncia entre os resultados do teste e do modelo
Aspereza j foi apontado, que o fato de os intervalos de quarto de tom (dades 2 e 24)
terem sido aferidas com mais dissonncia que os de 3/8 de tom (dades 3 e 23). Esses
costumam ser os mais dissonantes, por estarem mais prximos ao intervalo mximo de
Aspereza (um quarto da Banda Crtica), como o contorno da Aspereza em vermelho na
figura 84 confirma.
Outra divergncia se encontra na dade 17, a sexta menor (8/5) ou ainda 814
cents. Diferente do resultado do teste, esse intervalo no foi acusado pelo modelo de
Aspereza como um ponto mnimo de consonncia. A hiptese que esse intervalo se
encontra na proximidade da quinta justa, um dos intervalos de maior alinhamento.
Logo, ainda ocorre um desalinhamento de parciais na sexta menor, que impede seu
aferimento como consonncia.
J o Tonalness, por ser um conceito distinto da Aspereza, no necessariamente
acusa picos ao lado de fortes consonncias, como a dade 14 logo abaixo da quinta
justa. Fato que uma maior resoluo de intervalos no Tonalness torna o seu grfico
mais parecido com uma medida de Harmonicidade como aferida pelo conceito de
Barlow (vide figura 45).
A Comonalidade de Altura possui uma caracterstica similar. De modo que no
nos ficou claro como esses diferentes fatores podem ser combinados em uma medida
conjunta de Curva de Dissonncia.

13.4 Consideraes Finais


Um dos maiores problemas apresentados est nas controvrsias dos possveis
modelos de Aspereza. O estudo de Plomp e Levelt (1965) antigo, e mesmo
Vassilakis aponta para possveis revises em que podemos medir, atualmente, esse
importante atributo auditivo com uma melhor definio de linguagem em um conceito
mais refinado. Ressaltamos como diversos outros testes tambm devem ser feitos

189
como refinamento.
Um dado interessante que encontramos foi o resultado de intervalos de quarto
de tom terem sido medidos como mais dissonantes do que os intervalos de maior
Aspereza dados por modelos. A concluso que, por mais que haja menos Aspereza,
uma maior sensao de Batimentos promove uma forte sensao de desafinao, que
percebida como mais Dissonante. Sugerimos uma reviso da Curva de Plomp e Levelt
(1965), onde um contnuo engloba a sensao de Batimentos e Aspereza em um
mesmo contorno e tendncia de curva, que aponta um quarto da banda crtica como a
sensao mxima dessa dimenso conjunta de Aspereza que engloba os batimentos.
Ainda em relao Aspereza, no est claro como ela deve ser contabilizada a
partir de amplitudes desiguais. Apenas o modelo de Barlow buscou adotar os
contornos de loudness e mascaramento, mas sem uma devida validao por meio de
testes psicoacsticos. Portanto no sabemos se, com isso, os dados realmente ganham
qualidade ou quanto.
A reviso e modelo de Vassilakis trazem implicaes srias sobre a relao
entre medidas de Aspereza e Dissonncia. Seus testes perceptivos so dos poucos que
focam somente em Aspereza e comparam essas medidas com as dissonncia. A
tendncia de seus grficos descendente, e h um menor contraste entre pontos
mximos e mnimos.
Em nosso teste perceptivo, constatamos como esses dados pouco nos ajudam
na relao com uma medida de Dissonncia. Nesse sentido, seria bom refazer um teste
com um mesmo estmulo do que o usado por Vassilakis, para compararmos com seus
resultados.
Em comparao ao teste de Vassilakis (2001), alm da Aspereza, consideramos
tambm a Harmonicidade, compreendida principalmente pelo Tonalness e
Comonalidade de Altura sem porm estar claro como unir esses dois conceitos em uma
medida nica. Em relao aos estmulos, adotamos uma fonte sonora de maior riqueza
e energia espectral e inclumos mais pontos (ou intervalos) como maneira de aumentar
a resoluo dos dados. Uma tendncia esperada de alternncia entre pontos mximos e
mnimos foi encontrada. Um passo seguinte pode incluir uma resoluo ainda maior,
com o dobro de intervalos, por exemplo, para compararmos os resultados e investigar
como se d uma maior nuance de alternncia entre esses intervalos.
Um objetivo ideal poderia ser uma diviso microtonal que possa gerar uma boa
continuidade, algo como uma diviso da oitava em 72 partes que, como apontado por

190
Navarro (1927), possui uma boa aproximao dos intervalos justos que adotam at o
fator primo 11 como o sistema de Partch e seus 43 intervalos por oitava. Seria
possvel, ento, incluir todos os intervalos de Partch (que tambm fazem parte de
nosso teste) e ainda outros. No final das contas, teramos uma curva de boa
continuidade tambm passvel de comparao com o One Footed Brigde de Partch
(1974), trazida na figura 87, no prximo captulo.
A adoo de diferentes estmulos deve contemplar tambm sonoridades
inarmnicas, para que possamos melhor investigar a dimenso de Harmonicidade em
comparao com os resultados de testes com estmulos harmnicos.
Testes de dissonncia que, na fase de treinamento no focam em uma
abordagem sensorial, podem tambm ser produzidos para verificar se h uma diferena
com os dados produzidos com esse tipo de enfoque. Tais resultados devem trazer mais
validao ao estudo.
So poucos os estudos que visam investigar melhor a relao entre as duas
dimenses principais de Dissonncia (Aspereza e Harmonicidade), j que se trata de
um processo problemtico. Dermott et. al (2010) geraram resultados novos importantes
que devem ser trazidos discusso, em que um papel relevante da harmonicidade foi
considerado. Porm, a relao entre essas duas dimenses de Dissonncia (anlogas
proposta nesta pesquisa) ainda no est clara, dependendo de mais estudos nessa
direo.
Encontramos uma boa relao entre os resultados do teste e um mtodo de
Barlow (2008), que contabiliza a Aspereza de modo arbitrrio. Na prtica, mede-se
apenas o alinhamento e desalinhamento de parciais e, nesse ponto, pouco importa uma
aproximao acurada dos dados de Plomp e Levelt, a maior diferena se d na incluso
do mtodo de Vassilakis (2001). Nesse ponto, abre-se margem para conceitos e
modelos mais arbitrrios, como o modelo de Aspereza de Barlow ou ainda seu
conceito de Harmonicidade (Barlow 1980) e a Entropia Harmnica de Elrich (1997)
que poderiam ajudar a emular os resultados de dissonncia.
Em suma, na verdade, sabemos ainda muito pouco sobre os modelos
psicoacsticos e sua contribuio para descritores de Dissonncia em intervalos
musicais. A reviso crtica pede diversos refinamentos e traz alguns problemas que
ainda sero discutidos no prximo captulo dentro do objetivo de pesquisa, que a
aplicao criativa em Eletrnica ao Vivo, para composio e improvisao.

191
Captulo 14) Discusso Final Sobre Aplicaes Criativas

Comeamos o captulo com a exposio de dois trabalhos criativos


desenvolvidos durante a pesquisa. Na sequncia, uma discusso geral sobre o impacto
da Psicoacstica em composio e teoria musical. Por fim, uma exposio de um tipo
de abordagem composicional que se beneficia da teoria exposta.

14.1 Exemplos Criativos


Trazemos dois exemplos bem distintos de aplicao do sistema [Brane~] e
algumas consideraes sobre seu uso e potencial. A primeira abordagem trata de um
duo de improvisao livre, em que todas as funcionalidades do sistema foram
colocadas prova. J a segunda abordagem uma pea orquestral para solistas e
eletrnica ao vivo, em que uma aplicao bem especfica do sistema foi adotada, como
um adendo parte orquestral, sendo um elemento textural a mais na pea.

14.1.1 Duo de Improvisao Livre com Rogrio Costa


O sistema [Brane~] foi testado em performance em vrios ensaios e algumas
apresentaes a partir de um duo formado pelo autor e pelo pesquisador em
improvisao e colaborador Rogrio Costa. Rogrio tem experimentado com uma
primeira verso do Phase Vocoder, apresentado na Figura 73, e no tem trabalhado
com os conceitos e ferramentas prprios desta pesquisa. No duo, ele toca Saxofone
Alto com esse seu sistema usual.
J este autor recebe o mesmo sinal acstico do Sax e controla diversas
manipulaes paralelas com o sistema [Brane~]. Concomitantemente, o autor tambm
controla uma instncia independente, com uma entrada de udio de sua execuo ao
violo.
Enquanto a abordagem a seguir busca um fim especfico e quase didtico, o uso
do sistema em um formato de improvisao foi adotado de uma forma contrastante, em
momentos, mais catica. No houve a preocupao de explorar recursos distintos de
modo claro, mas sim um jogo improvisativo em que diferentes elementos poderiam
convergir em um mesmo plano principal, com grandes influncias de ideias e a
experincia de Rogrio Costa (2009).
Porm, para algumas sesses de improvisao, algumas diretrizes foram

192
combinadas, como um trecho de notas mais longas e lentas, para que o sistema pudesse
aplicar o mapeamento espectral e uma harmonizao e reafinao em diferentes
escalas. Em trechos do gnero, ambos os instrumentos so manipulados em sistemas
inusitados e, ao mesmo tempo, como um mapeamento espectral em diviso igual da
oitava em 11 partes e 13 partes. Essa estrutura, por exemplo, pode ir se transformando
aos poucos para uma seo mais pontilhista, em que processos de manipulao de
distoro espectral ocorreriam de modo mais instvel, buscando uma imitao gestual
entre ambos os intrpretes.
Essa abordagem tem sido a forma principal de prova laboratorial do sistema
desenvolvido, em que foram exploradas todas as suas diversas funcionalidades. Essas
podem servir a um ambiente de eletrnica ao vivo para fins mais estveis e
particulares, menos caticos. O exemplo a seguir o de uma pea orquestral, em que o
sistema adotou um processo especfico para os solistas.

14.1.2 (i)re(v||f)erncia, de Alexandre Torres Porres (2011)


A pea foi composta em 2011, comissionada para o concerto de fechamento da
I Bienal Msica Hoje, em Curitiba, pelo grupo Ensemble EntreCompositores41
(formado por compositores curitibanos), com a execuo da orquestra da UFPR e
solistas do grupo austraco Platypus. As duas partes solistas da pea so para
flauta/piccolo e clarinete em Bb/clarone.
A pea possui um tema principal, que aparece em diversas variaes e arranjos
no decorrer da obra. A durao de cerca de 11 minutos e h vrios contrastes de
mudanas relativamente bruscas. Porm, o tema principal um elemento unificador,
que recorrente em diferentes variaes, nas quais o uso de eletrnica ao vivo serviu
para adicionar mais uma colorao e variao instrumental/timbrstica ao conjunto e
aparece apenas em trs trechos.
A funo da eletrnica ao vivo na pea de orquestrao e acompanhamento,
em um plano de fundo e seu processamento foi aplicado nas partes solistas, mais
especificamente na flauta e no clarinete. Duas instncias independentes do sistema
[Brane~] foram adotadas, uma para cada parte solista.

41
O concerto contou com seis peas compostas pelos compositores, em homenagem pstuma a um de seus
membros fundadores Franco Bueno.

193
Figura 85 Primeira exposio do Tema, Clarinete em Bb.

A funo da eletrnica ao vivo foi o de orquestrao e acompanhamento, em


um plano de fundo e seu processamento foi aplicado nas partes solistas, mais
especificamente na flauta e no clarinete. Duas instncias independentes do sistema
[Brane~] foram adotadas, uma para cada parte solista.
O intervalo de trtono possui um papel motvico que permeia toda a
composio musical. Seu emprego no visava uma resoluo tonal ou tenso. A
inteno foi de diluir essa tenso de dissonncia em motivos meldicos e constante
exposio do tema principal, que contm saltos meldicos de trtonos em uma relao
de meio tom (vide figura 85, na parte do clarinete, em uma primeira exposio desse
tema).

Figura 86 Primeiro trecho de eletrnica ao vivo.

A figura 86 traz a parte em que o sistema coleta o udio ao vivo e j inicia o


processamento de Mapeamento Espectral e sua execuo de fundo pela primeira vez.
Estamos ainda em um trecho inicial da pea. A entrada do mapeamento uma diviso
da oitava em quatro partes iguais, ou seja, um acorde diminuto, como um dos
exemplos dados na seo deste texto sobre Mapeamento Espectral.

194
Temos um contraponto entre dois motivos meldicos distintos, baseados em
saltos de trtonos nessa seo. Ambas instncias do [Brane~] tocam o buffer em uma
velocidade de um quarto da original. O mapeamento o mesmo para ambos, em que
uma mesma harmonizao se d em um intervalo de trtonos. Porm, a parte da flauta
transposta uma oitava abaixo, enquanto o clarinete transposto um trtono acima.
Nos trs compassos de pausa da figura 86, somente o processamento de
eletrnica ao vivo permanece de fundo. Os solistas ressurgem em seguida com motivos
pontilhistas e, alm do Mapeamento Espectral de fundo, um simples processamento
com o Phase Vocoder feito em tempo real de modo improvisativo, trazendo para a
performance alguns aspectos da experincia em improvisao.
Com a inteno de reforar a sonoridade de trtonos, o Mapeamento Espectral
ajudou na gerao de harmonias de trtonos em um plano de fundo com uma
minimizao da Aspereza e, portanto, uma eliminao dessa forte dimenso de
dissonncia sensorial.
A qualidade timbrstica dos instrumentos originais permanece presente. Porm,
clara tambm uma mudana de qualidade harmnica, ou melhor, de uma
inarmonicidade da sonoridade. Esse aspecto traz uma nova qualidade textural ao corpo
da orquestra. Esse trecho se repete ainda duas vezes no decorrer da composio, mais
ao meio e para o fim, com algumas variaes. A pea, na ntegra, se encontra em
anexo.

14.2 Impacto de Modelos Psicoacsticos de Dissonncia em Criao Musical


A pesquisa psicoacstica nos ajuda a buscar fundamentos cientficos para a
percepo de qualidades sonoras. Das muitas aplicaes da Psicoacstica, o seu
surgimento tambm permitiu uma nova forma de estudar a percepo musical e
princpios terico-musicais que se baseiam em percepo de certos objetos sonoros. A
Dissonncia, assim como a ideia de Harmonia e Consonncia, so fenmenos
perceptivos que podem ser estudados nesse vis.
Trazemos nessa subseo uma discusso final sobre o impacto e relevncia dos
modelos apresentados, assim como a velha discusso sobre o inato versus o adquirido
apresentada junto com algumas consideraes relacionadas ao foco de pesquisa.

195
14.2.1 Inato versus Adquirido
Antes da Psicoacstica, modelos tericos tambm buscavam uma relao entre
aspectos universais e a prtica musical. A teoria de Pitgoras se baseia em nmeros e
no tem embasamento perceptivo de fato. Apesar de coerente a princpio, a teoria
Pitagrica gerou um problema restritivo. Sua influncia deu origem a um sistema de
afinao (Afinao Pitagrica) formado apenas por fraes com os fatores primos 2 e
3, em que todos os passos da escala so obtidos por sucesso de quintas [3:2]. Estes
nmeros mais simples, porm, podem gerar intervalos menos consonantes, como a
tera maior ([81:64] em vez de [5:4]). Nosso experimento tambm foi capaz de
comprovar que mesmo em trs verses de trtono, a forma de razo mais simples foi
tida como harmnica.
Como o desenvolvimento da Msica Ocidental tambm foi muito influenciado
pela prtica musical em si, encontrou-se uma necessidade de incluir o intervalo de
[5:4]. Esse fato se deu por um princpio perceptivo de dissonncia. Entretanto, o
curioso que, com o desenvolvimento da msica tonal, diversos sistemas de afinao
temperados acabaram por excluir esse intervalo. No temperamento igual, as teras e
sextas possuem diferenas de at 16 cents em relao s verses de intervalos justos42.
Esses fatos trazem tona uma discusso e uma prova que a palavra final no
um modelo terico, como o de Pitgoras, nem mesmo um fato cientfico e perceptivo,
mas sim uma prtica e linguagem musical. O conceito de Dissonncia e Harmonia
evoluiu muito mais a partir de uma prtica musical artstica e esttica do que uma
teoria ou modelo cientfico, e essa concluso pode ser confirmada com a reviso
histrica de Tenney (1988). Por outro lado, difcil fugir de alguma relao com nosso
sistema perceptivo.
Alm de Pitgoras, podemos ressaltar o trabalho de Rameau (1722), cujo
tratado de Harmonia buscou clarear princpios tericos musicais baseados em leis
naturais. Suas premissas tericas possuem importncia at hoje, como na ideia de
inverso de acordes, e o Baixo Fundamental, que atualmente trazida por Terhardt
(1984) a partir de um embasamento psicoacstico.
Aps Rameau, Helmholtz (1877) traz um trabalho pioneiro em Psicoacstica
que explica princpios sensoriais da Dissonncia. E Parncutt (1989) nos traz uma boa
reviso do estado da arte no que diz respeito relao entre Psicoacstica e teoria

42
Uma reviso detalhada sobre Sistemas de Afinao e sua histria pode ser encontrada na dissertao de
mestrado do autor (Porres 2008).

196
musical. Alguns aspectos tm sido comprovados e identificados, como os atributos
aqui pesquisados.
De um modo ou de outro, o fenmeno musical depende em algum grau do que
se consegue ouvir e perceber. Por isso, tericos que buscam essa relao acabam
encontrando explicaes psicoacsticas. Mas ainda no resolvemos a questo do inato
versus adquirido, do sensorial versus cultural, ou dos racionalistas versus os
empiristas, como descrito no trabalho de DeWitt e Crowder (1987).
Porm, no h de fato uma ideia de que um fator deva prevalecer sobre outro e
que deva haver um vencedor nessa disputa. uma noo comum e atual que
ambos fatores tm relevncia, s no sabemos ainda exatamente quanto um depende
do outro.
O ponto em debate que no precisamos nos ater a uma validao de uma
prevalncia histrica de algum sistema ou teoria como a explicao psicoacstica da
msica tonal. Uma preocupao dessa ordem chega a ser anacrnica no panorama
composicional contemporneo. A cincia psicoacstica comea a trazer os primeiros
resultados mais relevantes na segunda metade do sculo XX, como o importante
estudo clssico de Plomp e Levelt (1965). Nessa altura, a pesquisa de linguagem
composicional do Sculo XX j tinha conhecido a msica concreta de Schaeffer, a
escola alem de msica eletrnica, o serialismo integral e at mesmo processos
estocsticos e sistemas de CAC (Griffiths 1995).

14.2.2 Teoria Psicoacstica e Teoria Musical, um Anacronismo


H aproximadamente 150 anos que o conhecimento cientfico abriu margem
para uma investigao de ordem Psicofsica. Desde ento, temos uma nova abordagem
que nos d ferramentas para explorar a relao entre conceitos terico-musicais (com
uma forte influncia de ordem abstrata, emprica, cultural, esttica e histrica) e
atributos acsticos. Isso tudo depende de um conhecimento do aparato fisiolgico e
cognitivo humano e de como ele responde a certos atributos fsicos mensurveis e
claramente distintos.
Apesar de constituir um perodo relativamente longo, os avanos em relao
percepo de Dissonncia tm sido modestos. A suposio de Helmholtz (1877) de
que a Aspereza um atributo perceptivo importante na sensao de Dissonncia ainda
prevalece. A relao sinonmica entre Aspereza e Dissonncia Sensorial ainda forte,
e a influncia de outros atributos tem sido, de certa forma, negligenciada.

197
Logo aps o trabalho de Helmholtz, j temos na pesquisa de Stumpf (1890)
outra premissa, que pressupe uma teoria baseada em relaes harmnicas e uma
Fuso Tonal, em que componentes espectrais harmnicos se fundem em um nico
objeto perceptvel. O autor inaugura experimentos nesse sentido. Mas, em todo caso,
no temos certeza ainda de como esse processo ocorre em nosso sistema auditivo e
cognitivo.
Este um cenrio diferente da Aspereza, em que h uma relao clara com
mecanismos fisiolgicos (encontrados na estrutura do ouvido interno, mais
especificamente na cclea) e como o ouvido interno se divide em bandas crticas.
Alm de a Aspereza possuir uma forte influncia na sensao de dissonncia, essa sua
correspondncia fisiolgica em um nvel mais baixo facilita sua modelagem e
contribui ainda mais para seu destaque na literatura.
Novos estudos na rea de neurocincia e cognio musical apontam para novas
relaes entre caractersticas acsticas sonoras e nosso sistema perceptivo. Essa rea
relativamente nova, tendo seu expoente apenas na dcada de 1980. Outro fator que
esse campo de pesquisa tem se valido de novos avanos cientficos na rea de estudo
do crebro, mas tambm de novas ferramentas tecnolgicas de anlise. Entretanto,
ltimos avanos cientficos (Dermott et. al 2010) ainda buscam compreender melhor a
relao entre Aspereza e Harmonicidade.
Um trabalho recente, como o de Parncutt (1989), ainda toca aspectos bsicos e
tradicionais de dissonncia e teoria musical, como o Baixo Fundamental de Rameau
(1722). H de se compreender o pequeno impacto de tais teorias na msica do sculo
XX, j que estudos psicoacsticos ainda engatinhavam na segunda metade do sculo
tratando de paradigmas musicais tradicionais e antigos. Por mais que se tenha uma boa
noo psicoacstica da Dissonncia, at que ponto podemos considerar seu impacto
em uma linguagem musical?

14.3 Por uma Abordagem Voltada ao Concreto


Levando em considerao o estado da arte em pesquisas psicoacsticas e as
questes envolvidas , sua adoo no deve ter o intuito de validar a teoria ou prtica
musical. As experincias psicoacsticas podem surtir efeito no desenvolvimento de
novas tcnicas composicionais, em uma abordagem voltada para o aspecto concreto do
material sonoro. Esse tipo de motivao tem atrado o interesse particular de alguns
compositores que se dedicam ao aspecto fsico do som e de sua percepo, e que

198
desenvolvem sistemas para controlar e manipular material sonoro de modo concreto.
Essa perspectiva no coloca a teoria psicoacstica como um pilar central e
imprescindvel para qualquer tipo de manifestao musical, no visa explicar a histria
e desenvolvimento da msica tonal, apenas procura uma nova ferramenta para o
desenvolvimento de novos mtodos e tcnicas de composio. E aqui podemos buscar
outros exemplos de compositores que desenvolveram sistemas prprios de um modo
similar.
Paul Hindemith (1895 1963), por exemplo, desenvolveu um sistema baseado
no conceito de Consonncia e Dissonncia (1945) e poderia ter se beneficiado de
alguns conceitos e teorias recentes da Psicoacstica. Um elemento central de seu
mtodo consistiu em ordenar todos os intervalos do Sistema Temperado em uma escala
do mais Consonante ao mais Dissonante. Hindemith tambm organizou seis diferentes
classes de dissonncia para acordes, levando em considerao, por exemplo, se contm
alguma relao de trtono, ou se h uma sugesto clara de um Baixo Fundamental.
Os modelos aqui apresentados visam justamente auxiliar nesse processo de
organizao material, como inclusive explorado por Barlow (1980) e Ferguson (2000).
A vantagem que os modelos psicoacsticos permitem medir essas caractersticas para
qualquer tipo de sonoridade e/ou sistema de afinao. Afinal, dependendo de
peculiaridades do contedo espectral (como loudness, brilho, aspereza, harmonicidade
e registro), o resultado aferido ser diferente. Por mais que ainda haja uma boa
margem para melhorias, evidente como uma abordagem com a de Hindemith poderia
se beneficiar dos resultados e informaes trazidas por esta pesquisa.
Apontamos como essa teoria possui um grande impacto em Sistemas de
Afinao. Em compensao, diversas pesquisas microtonais que exploraram novas
relaes auditivas no Sculo XX no se valeram dos avanos psicoacsticos de suas
pocas (Porres 2007), pois ainda no ofereciam uma ferramenta de pesquisa de
linguagem como agora possvel, principalmente aps o trabalho de Sethares (1999).
Podemos ressaltar, em especial, o trabalho de Partch (1974), que desenvolve
um Sistema de Afinao Justa com 43 intervalos por oitava. Esta diviso e o sistema
com 28 centros tonais no nada compatvel com o sistema temperado e a linguagem
tradicional de msica tonal. A perda de praticidade dessa pesquisa buscava um ganho
de ordem perceptiva de consonncia, como a principal motivao de uma afinao
justa frente ao sistema temperado, pois tal sistema, para tons musicais (complexos e
harmnicos), promove um maior alinhamento de parciais e maior harmonicidade.

199
Partch explorou esse aspecto em sua pesquisa e incluiu intervalos com fatores primos
at o nmero 11.
O trabalho de Partch data da dcada de 1970, porm o autor no incorporou
avanos da psicoacstica em seu trabalho. Partch discute sua teoria de consonncia no
captulo 9 (One Footed Bridge) e traz ao debate teorias antigas e modernas sobre
Consonncia e Dissonncia. Partch comenta o trabalho de Helmholtz, mas critica sua
abordagem cientificista e se ope ao destaque dado ao papel da Aspereza todavia,
sem refutar nem contestar o fato da existncia de Batimentos e Aspereza. O autor
prefere se basear no trabalho de Stumpf (1890), mesmo este tendo sido negligenciado
na literatura.
Mais do que um debate cientfico propriamente dito, Partch (1974) est mais
preocupado em discutir diversas teorias musicais de um modo geral. E, para todos os
efeitos, admite uma postura ou produz uma espcie de manifesto musical em que
prevalece o empirismo sobre uma filosofia racional e cientfica. No toa que
levantamos a questo do impasse de uma postura como essa versus uma abordagem
psicoacstica. Porm, conclui-se que, atualmente, essa guerra entrou em um acordo
de paz. Tanto que teorias psicoacsticas de Harmonicidade e Tonalness poderiam
embasar parte de suas premissas.
Infelizmente, esse contexto fez que Partch acabasse por no ter um devido
respaldo em modelos psicoacsticos. Porm, da mesma forma em que Hindemith
poderia usufruir de informaes e fatos pertinentes da Psicoacstica, uma abordagem
como a de Partch pode, igualmente, relevar os princpios tericos que despontam
atualmente.
A figura 87 um grfico emprico, desenvolvido por Partch, chamado One
Footed Bridge que, na prtica, uma Curva de Dissonncia que afere medidas para os
intervalos de seu sistema de afinao. O grfico divide a oitava no meio e coloca a
curva de modo espelhado, de forma que um mesmo perfil de contorno indica a ideia de
Partch sobre inverso de cada intervalo possuir uma mesma medida de consonncia.
Se compararmos os dados com modelos psicoacsticos, teremos um conflito,
certamente, como j apontado em pesquisa anterior (Porres 2007). No que um sistema
como o de Partch precise de uma validao cientfica para que seja aceito, o ponto
trazido discusso e concluso de nosso trabalho outro. Uma abordagem cientfica
pode ajudar no desenvolvimento de um sistema composicional de ordem concreta.
Mas, mesmo que um sistema composicional possua certas incongruncias tericas, isso

200
no necessariamente lhe extrai a potencialidade musical ou esttica. No obstante,
Barlow (1987) opina que Partch no foi capaz de adotar seu sistema de modo
convincente, ideia com que estamos de acordo.

Figura 87 Curva de Consonncia de Partch (One Footed Bridge).

Vem ao caso falar de outro exemplo paralelo. Como estamos tratando de


abordagens concretas, nada mais justo que comentar o trabalho de Pierre Schaeffer
(1966), o pai da msica concreta. Schaeffer um exemplo do anacronismo entre a
teoria psicoacstica e importantes aplicaes musicais. Se Partch no pde se valer de
grandes resultados e referncias, Schaeffer o fez muito menos, por ser anterior e ainda
visionrio no sentido de uma reviso da linguagem musical com uma organizao
sonora refinada.
A Psicoacstica ainda hoje possui dificuldades em dar conta da complexidade
de fatores de ordem musical tradicional. No consideramos, nesta tese, que uma
abordagem como a de Schaeffer deva ser contestada e validada cientificamente, mas

201
nos perguntamos se ela poderia ganhar corpo, ou se sofreria algum desdobramento.
A teoria e o mtodo de composio de Schaeffer se baseiam em um conceito de
tipos de escuta e uma forma de solfejo atento a aspectos chamados tipo-morfolgicos
do som. Com a absteno de um embasamento psicoacstico, sua teoria tampouco
preza por uma forma objetiva de medir diversos parmetros a partir de modelos
concretos. Todavia, atualmente, o cenrio permite algumas relaes como as feitas por
Ricard (2004).
Em parte apoiado pelo Projeto CUIDADO, esse autor relaciona Descritores de
udio tipo-morfologia de Schaeffer (1966) e busca essa relao entre os conceitos
schaefferianos e modelos psicoacsticos. Da mesma maneira que o projeto CUIDADO,
h um foco no trabalho de Ricard em Music Information Retrieval, em especial nos
sons cuja fonte no identificvel (efeitos sonoros), ou seja, no h uma preocupao
musical ou composicional de fato.
O trabalho estabelece um esquema descritivo que amplia a classificao de
Schaeffer (1966) para analisar, descrever e classificar automaticamente um corpo de
sons eletrnicos separados de contexto musical e parte de uma tipo-morfologia em
descritores como: durao subjetiva, loudness, altura, clareza de altura, aspereza, perfil
dinmico, ataque, brilho, flutuao espectral, metalidade, riqueza, dentre outros.
Esse trabalho no visa modelar computacionalmente a teoria de Schaeffer em
novas ferramentas para criao musical. Em compensao, trouxemos nossa
discusso exemplos interessante que se baseiam em Descritores de udio e so
capazes de comparar e medir atributos fsicos e atributos perceptivos de baixo nvel.
Tais iniciativas tm promovido tcnicas consistentes como reconhecimento e
comparao de timbres em processos como o de Sntese Concatenativa.
De um modo geral, os descritores so capazes de encontrar parmetros sonoros
diversos, relacionados a uma dimenso textural, ou de timbre. Enfim, a uma dimenso
mais esmiuada de descrio sonora que, at ento, se volta mais a um aspecto tonal,
como a identificao de Altura. O trabalho de Schaeffer amplia a linguagem musical
com outros objetos sonoros que no dependem apenas de um paradigma da linguagem
tonal (a qual se relaciona principalmente percepo de Altura), abrindo assim a
novos aspectos texturais dinmicos.
No precisamos tambm nos ater apenas a uma noo de Consonncia e
Dissonncia, ou percepo de altura. Uma abordagem voltada ao concreto abre portas
para uma parametrizao sonora mais detalhada. Tenney (1988) nos traz tambm uma

202
anlise pormenorizada de conceitos de Dissonncia, em que a relaciona a elementos
como a prtica e teoria de conduo de vozes. O autor comenta apenas da Aspereza
como elemento de uma Dissonncia Psicoacstica, mas reconhece a possibilidade de
incluso de outros parmetros de pesquisa psicoacstica e cognitiva para dar um
embasamento a diferentes conceitos e aspectos musicais. Um exemplo de uma
pesquisa nessa linha dado por Huron (2001), que faz um paralelo com alguns
conceitos psicoacsticos e conduo de vozes.
Fato que apenas uma modelagem de dissonncia psicoacstica como aqui
apresentada, tida como dependente de duas dimenses principais, no deve valer como
pilar estrutural nico de um sistema de composio. De modo similar, esse era apenas
um dos elementos e recursos do sistema e linguagem de Paul Hindemith (1945). Nos
exemplos trazidos aqui nesta pesquisa de Sean Ferguson (2000) e Clarence Barlow
(1980), ambos os sistemas incluram, igualmente, mais elementos que apenas os
descritores de dissonncia.
O trabalho de Barlow, apesar de incluir modelos psicoacsticos, acaba
envolvendo uma conduta empirista. Sua tcnica e esttica se voltam a um paradigma
de composio algortmica. Seu sistema e obras musicais carregam um alto grau de
complexidade. Esse sistema complexo envolve vrios conceitos desenvolvidos pelo
autor que no encontraram nem encontram ainda relao com a literatura de
Psicoacstica e cognio musical. Mesmo assim, o autor no descarta a utilidade de
uma pesquisa psicoacstica em sua linguagem e tcnica.
Em especial, Sean Ferguson (2000) busca uma abordagem mais concreta,
focada em princpios psicoacsticos como uma forma de conectar as intenes
criativas, tcnicas composicionais, e as reaes do ouvinte. Essa preocupao,
inclusive, se relaciona ao processo descrito por Nattiez (1990), pois envolve
exatamente o nvel poitico (intenes criativas), neutro (produto de tcnicas
composicionais) e estsico (reaes do ouvinte). Simon Emmerson (1982) tambm
destaca um possvel papel da Psicoacstica nesse processo.
Ferguson admite o grande desafio e incipincia desse tipo de abordagem. O
autor explora com grande nfase os modelos de Aspereza e Comonalidade de Altura
como base de uma estruturao harmnica e de Dissonncia. Ferguson tambm
explora e prope outros conceitos e ideias para harmonizao. Seu sistema lhe permite
harmonizar uma linha meldica a partir de critrios paralelos como cardinalidade e
varincia de intervalo adjacente (relacionada Distncia de Altura). A teoria de

203
contorno meldico e rtmico tambm o assiste na estruturao e unificao da pea.
O compositor tambm vislumbra novas possibilidades de adoo de outros
conceitos e ferramentas. A respeito de Comonalidade de Altura, alm de considerar
uma relao de Distncia de Altura, ele aponta para a possvel juno de uma terceira
dimenso, em um recente modelo de conduo de vozes (Bigand et al 1996), como
uma forma de contabilizar tambm a mudana da voz soprano de um acorde, que
possui um destaque maior.
Mas Ferguson poderia tambm ter explorado atributos aqui apresentados, como
o Tonalness e Fundamental de Acorde para medir a fora de um centro tonal, ou
analisado a Comonalidade de Altura entre as vozes de um acorde, apenas para citar
alguns elementos que estavam disponveis e ficaram de fora.
Com avanos atuais, possvel ainda abrir-se a novas perspectivas de
experimentaes e relaes. Aplicaes como a Sntese Concatenativa e as ferramentas
Orchide e SPORCH se baseiam em uma espcie de Comonalidade de Timbre, por
exemplo. Esse exemplo refora a concluso de Ferguson sobre o fato desse campo
estar emergindo com novas possibilidades de emprego em composio musical. Outro
fator de contribuio avano de processamento computacional, que permite a criao
de novas ferramentas e aplicaes em tempo real.

204
Captulo 15) Concluso
A principal e original contribuio desta tese se encontra na integrao de
modelos psicoacsticos de dissonncia em novas ferramentas criativas para eletrnica
ao vivo. Outras contribuies e objetivos foram tambm atingidos. Uma reviso crtica
da teoria psicoacstica fornecida e seu impacto em criao musical discutido frente
aos desenvolvimentos da pesquisa. O texto e ferramentas desenvolvidas tambm
contribuem na disseminao do potencial criativo da teoria.

15.1 Teoria Psicoacstica


A pesquisa contou com uma reviso crtica da teoria psicoacstica de percepo
de dissonncia. Foram apontados problemas em diferentes instncias, como na prpria
definio de dissonncia e inconsistncias e limitaes da pesquisa atual na rea, assim
como novos debates e avanos que tm surgido em neurocincia.
Tenney (1988) apresenta noes distintas de Dissonncia e uma necessidade de
enriquecimento da linguagem. A Dissonncia Psicoacstica, por ele apresentada, se
baseia apenas na Aspereza, mas aponta para novas relaes em um refinamento de
atributos perceptivos e conceitos de Dissonncia. As outras noes de dissonncia se
baseiam, fortemente, em relaes tonais (entre sonoridades harmnicas), que se
relacionam com atributos de Tonalness, Fundamental do Acorde e Comonalidade de
Altura.
Como os atributos perceptivos se relacionam em uma medida de Dissonncia
ainda incerto. Quanto ao problema, apontamos alguns estudos importantes e novos
caminhos para investigao. Inconsistncias e limitaes foram questionadas e futuras
projees foram feitas. Reorganizamos o quadro de Terhardt (1984) e focamos em
duas principais dimenses de dissonncia (Aspereza e Harmonicidade).
Curvas de Dissonncia foram apresentadas como uma forma de descrever a
dissonncia de intervalos musicais baseada no contedo espectral, que depende,
principalmente, das duas dimenses propostas. Um teste perceptivo baseado nessas
duas dimenses foi apresentado. Os resultados so comparados com modelos de
Aspereza e Tonalness, e concluses finais buscam formas de melhor considerar uma
reviso de modelagem de Aspereza, a sensao de Batimentos e a dimenso de
Harmonicidade, a serem validadas em trabalhos futuros.

205
15.2 Impacto e Contribuio Criativa
A teoria psicoacstica pode prover modos concretos de manipular atributos
sonoros, com impacto direto no resultado perceptivo. Novas tcnicas baseadas em uma
abordagem concreta podem se beneficiar com estudos nessa rea. Novos
desenvolvimentos relacionados a MIR e Descritores de udio tm emergido,
especialmente no que tange ao reconhecimento de Timbre. Um prximo estgio de
desenvolvimento deve considerar modelos de ordem superior, como os apresentados
nesta pesquisa, em que podemos, por exemplo, comparar a Comonalidade de Altura
entre diversas sonoridades em tempo real.
Esse conjunto de atributos nunca foram implementados anteriormente em
sistemas de Eletrnica ao Vivo. Algumas ferramentas desenvolvidas os medem em
tempo real e apresentam formas de alterar seu contedo espectral de modo pertinente.
Um potencial criativo que tem sido negligenciado foi explorado durante este trabalho
de pesquisa. O sistema de Eletrnica ao Vivo [Brane~] engloba as principais tcnicas
apresentadas em uma nica ferramenta acessvel e foi adotado pelo autor em
improvisao e composio mista.

15.3 Projees Futuras


O estado da arte foi implementado em objetos de Pd. Futuras atualizaes devem
ser feitas de acordo com novos resultados de pesquisa em psicoacstica, discutida na
reviso terica. No foi possvel explorar todas as capacidades criativas, mas
importantes primeiros desenvolvimentos foram feitos, enquanto outros foram
apontados. Muitas ideias surgiram e se desenvolveram casualmente por meio de
experimentaes, e novos desenvolvimentos devem ocorrer nesse sentido na evoluo
desses processos. Igualmente, enquanto essa teoria e ferramenta se tornam mais
acessvel, certo que outros frutos surgiro de uma forma igualmente casual.
O sistema [Brane~] , atualmente, um programa com uma base de apenas um
usurio: o autor. Porm, um esforo foi dedicado a uma boa usabilidade e
acessibilidade a outros. Apesar de ter sido adotado com sucesso em aplicaes
musicais, a ferramenta ainda um primeiro prottipo apresentado ao pblico em geral
e pode parecer complexa em um primeiro momento. Por isso, o texto e os mdulos
independentes desenvolvidos so importantes. Mas tambm projetamos que novas
atualizaes sejam feitas ao software, que podem se desdobrar em novos mdulos em
verses mais simples e especializadas a alguma funcionalidade.

206
Referncias

AMATRIAIN, X., Massaguer, J., Garcia, D., and Mosguera, I. (2005) Features for
Audio and Music Classification Proceedings of the 6th Interna- tional Conference
on Music Information Re- trieval London, UK, 2005
AURES, W. 1985a Ein Berechnungsverfahren der Rauhigkeit, Acustica, vol. 58, pp.
268281, 1985
AURES, W. 1985b Ein Berechnungsverfahren fr den sensorischen Wohlklang
beliebiger Schallsignale, Acustica 59:130-41
BARLOW, C. (1980) Bus journey to Parametron. Feedback Papers vol. 21-23,
Kln, 1980.
____________. (1987) "Two Essays on Theory", Computer Music Journal.
____________. (1990) Autobusk - An Algorithmic Real-Time Pitch & Rhythm
Improvisation Programme. In: ICMC Proceedings, Glasgow 1990, p. 166-168.
____________. (2008). Von der Musiquantenlehre (2 volumes, 130 pginas, em
alemo) Feedback Paper 34, 2008. Feedback Studio Verlag, Colnia, Alemanha
BIGAND, E., PARNCUTT, R. LERDAHL, F. (1996) Perception of Musical Tension
in Short Chord Sequences: The Influence of Harmonic Function, Sensory
Dissonance, Horizontal Motion, and Musical Training, Perception &
Psychophysics, Vol. 58, No. 1 (1996): 125-141.
BORING, E. & STEVENS, S. (1936) The nature of tonal brightness, Proceedings of
the National Academy of Science, 22, 1936, pp 514-521
BREGMAN, A. S. (1990). Auditory Scene Analysis. Cambridge, MA: MIT Press.
BRENT, W. (2009) A Timbre Analysis and Classification Toolkit for Pure Data: An
introduction to the timbreID collection of objects as of December 2009, including
descriptions of the example patches <
http://williambrent.conflations.com/papers/timbreID.pdf>.
BULLOCK, J. (2007) Libxtract: A lightweight library for audio feature extraction,
in Proceedings of the International Computer Music Conference.
CABRERA, D. (1999) PsySound: a Computer Program for the Psychoacoustical
Analysis. Anais da Australian Acoustical Society Conference, pp 47-54.
Melbourne, 24-26 Novembro.
CONT, A. (2008a) ANTESCOFO: Anticipatory Synchronization and Control of
Interactive Parameters in Computer Music. Arshia Cont. In Proceedings of
International Computer Music Conference (ICMC), August 2008.
____________. (2008b) Modeling Musical Anticipation: From the time of music to the
music of time. Arshia Cont. PhD thesis, University of Paris 6 and University of
California in San Diego, October 2008.
COSTA, R. L. M. (2009). A ideia de corpo e a configurao do ambiente da
improvisao musical Opus (Belo Horizonte. Online), v. 14.2, p. 87-99, 2009.
DANIEL, P. & WEBER, R. (1997) Psychoacoustical roughness: Implementation of
an optimized model, Acustica, vol. 83, pp. 113123

207
DeWITT, L. A., & CROWDER, R. G. (1987) "Tonal fusion of consonant musical
intervals: The oomph in Stumpf." Perception and Psychophysics, 41(1), 73-84,
1987.
McDermott, J.H., LEHR, A.J., Oxenham, A.J. (2010) Individual Differences reveal the
basis of consonance. Current Biology, 20, 1035-1041.
DIEMO S., BELLER G., VERBRUGGHE B., BRITTON S. (2006) Real-Time
Corpus-Based Concatenative Synthesis with CataRT. In Proceedings of the COST-
G6 Con- ference on Digital Audio Effects (DAFx), pages 279282, Montreal,
Canada, September 2006.
DUDLEY, H. W (1939) The Vocoder Bell Labs Rec., vol. 18, pp. 122-126, 1939,
Reprinted in [409, pp. 347-351]
EBELING, M (2009). Calculating Tonal Fusion by The Generalizes Coincidence
Function Mathematics and computation in music third international conference,:
proceedings. Berlin, Springer.
ECCLES, J.C. 1973. The Understanding of the Brain. McGraw-Hill, New York
ELRICH, P. (1997) On Harmonic Entropy; disponvel em <http://sonic-
arts.org/td/erlich/entropy-erlich.htm>.
EMMERSON, S. (1982) Analysis and the composition of electroacoustic music. Tese
de doutorado. The City University, 1982.
FERGUSON, S, Concerto for Piano and Orchestra, Ph.D. Thesis. 2000. McGill.
FERGUSON, S. & PARNCUTT, R. (2004). Composing 'In the Flesh': Perceptually-
informed har- monic syntax. Proceedings of Sound and Music Computing
(Paris/France, 20-22 Oktober '00).
FINGERHUTH, S. Tonalness and consonance of technical sounds, Logos Verlag
Berlin GmbH, 2009
FLANAGAN, J.L, GOLDEN R. M. (1966) "Phase Vocoder," Bell System Technical
Journal, November 1966, 1493-1509.
FLETCHER, H; Munson, W.A. (1933), Loudness, its definition, measurement and
calculation. Journal of the Acoustical Society of America N. 5, 82-108, 1933.
GREENWOOD, D. D. (1961) Critical bandwidth and the frequency coordinates of the
basilar membrane. Journal of the Acoustical Society of America, 33(4), 13441356.
1961.
GREY, J. (1975) An Exploration of Musical Timbre Using Computer-based
Techniques for Analysis, Synthesis and Perceptual Scaling. PhD thesis, Stanford
University.
GRIFFITHS, P. (1995) Enciclopdia da Msica do Sculo XX. Rio de Janeiro, Martins
Fontes, 1995.
HELMHOLTZ, H.L.F. (1877) On the Sensations of Tone as a Psychological basis for
the Theory of Music. New York, NY: Dover Publications. 2a edio (1954)
HINDEMITH, P. (1945) The Craft of Musical Composition, Book 1: Theoretical Part.
New York: Associated Music Publishers, Inc., 1945.
HUTCHINSON, W; KNOPOFF, L. (1978) The Acoustic Component of Western
Consonance, Inteface 7: 1-29, 1978.

208
HURON, D. (2001) Tone and Voice: A Derivation of the Rules of Voice-Leading
from Perceptual Principles. Music Perception Fall, Vol. 19, No. 1, 164, 2001.
IAZZETTA, F. (2008). Sonologia: uma tentativa de introduo. Anais do Seminrio
Msica Cincia e Tecnologia, v. 3, p. 3-6, 2008.
IVERSON, P. & KRUMHANSL, C. (1993) Isolating the dynamic attributes of
musical timbre. Journal of the Acoustical Society of America, 94(5):25952603.
KASKE, S (1985) A Conversation with Clarence Barlow Computer Music Journal
Vol. 9, No. 1 (Spring, 1985), pp. 19-28
KAMEKOA, A.; KURIYAGAWA, M. (1969a) Consonance theory. Part I:
Consonance of dyads. Journal of the Acoustical Society of America, 45, 14511459,
1969a.
____________. (1969b) Consonance theory. Part II: Consonance of complex tones and
its calculation method. Journal of the Acoustical Society of America,45, 14601469,
1969b.
LEMAN, M. (2000) Visualization and calculation of the roughness of acoustical
musical signals using the synchronization index model (SIM), Proceedings of the
COST G-6 Conference of Digital Audio Effects (DAFX-00), Verona.
LINDSAY, T., BURNETT, I., QUACKENBUSH, S., JACKSON, M. (2003)
Fundamentals of Audio Descriptors, Introduction to MPEG-7 Multimedia
Content Description Interface, West Sussex, England.
MEDDIS, R. HEWITT, M. (1991) Virtual Pitch and Phase Sensitivity of a Computer
Model of the Auditory Periphery. I: Pitch Identification Journal of Acoustical
Society of America, Vol. 89, No. 6. (June 1991), pp. 2866-2882.
MITROVIC, D. ZEPPELZAUR, M. BREITENDER, C. (2010) Features for Content-
Based Audio Retrieval Advances in Computers Volume 78 Improving the Web",
Elsevier, 2010, S. 71 - 150.
MONTEIRO, A. C., MANZOLLI, J. (2010) Aplicao de Descritores em Sistema
Interativo para Msica Mista. In: Encontro Internacional de Msica e Arte Sonora -
EIMAS, 2010, Juiz de Fora. Revista EIMAS 2010, 2010. v. 1.
NATTIEZ, J. (1990) Music and Discourse: Toward a Semiology of Music
(Musicologie gnrale et smiologue, 1987). Traduzido por ABBATE, C., 1990.
NOVARRO, A. (1927) Sistema Natural de la musica Sistema Natural base Del
natural-aproximado. Mxico D.F.
PARVIAINEN, O. (2006). Time and pitch scaling in audio processing Software
Developer's Journal 4/2006.
PARNCUTT, R. (1989) Harmony: a psychoacoustical approach, Berlin: Springer,
1989.
PARNCUTT, R. (1993) Parncutt's implementation of Hutchinson & Knopoff
roughness model. Disponvel em: <http://www-gewi.uni-
graz.at/staff/parncutt/rough1doc.html>.
PARNCUTT, R, & STRASBURGER, H. (1994). Applying psychoacoustics in
composition: "Harmonic" progressions of "non-harmonic" sonorities. Perspectives
of New Music, 32 (2), 1-42.

209
PARTCH, H. (1974) Genesis of a Music, Da Capo Press, New York, 1974.
PEETERS, G. (2003) A large set of audio features for sound description (similarity
and classification) in the CUIDADO project IRCAM, Paris.
____________. (2004) A large set of audio features for sound description (similarity
and classification) in the CUIDADO project CUIDADO I.S.T. Project Report
2004 <http://recherche.ircam.fr/equipes/analyse-synthese/peeters/ARTICLES/
Peeters_2003_cuidadoaudiofeatures.pdf>.
PIERCE, J. R. (2001). "Consonance and scales". In Perry R. Cook. Music, Cognition,
and Computerized Sound: An Introduction to Psychoacoustics. MIT Press. p. 183
PRESSNITZER, D. (1999) Perception de rugosite psychoacoustique: dun attribut
e le mentaire de laudition a le coute musicale Ph.D. thesis, Universite Paris 6.
PRESSNITZER, D & McADAMNS, S. (1999) Two phase effects in roughness
perception" J. Acoust. Soc. Am. 105(5): 2773-2782.
PLOMP, R.; LEVELT, W.J.M. (1965) Tonal Consonance and Critical Bandwidth.
Journal of the Acoustical Society of America N. 38, 548-568, 1965.
POPPER, K. 1972. Objective Knowledge, an Evolutionary Approach. Clarendon,
Oxford
PORRES, A. T. (2007) Processos de Composio por meio do Modelo de
Dissonncia Sensorial. Dissertao de Mestrado, UNICAMP, 2007.
PUCKETTE, M. (2007) Patch for Guitar, 2nd International Pd Convention, Montreal
PUCKETTE, M. (1995). "Phase-locked Vocoder." Proceedings, IEEE ASSP
Workshop on Applications of Signal Processing to Audio and Acoustics. 34
____________. (2006) The Theory and Technique of Electronic Music, World
Scientific Press.
RAMEAU, J.P. (1722) Trait de lharmonie rduite ses principes naturels
RICARD, J. (2004) Towards computational morphological description of sound, Tese
de Doutorado, Universitat Pompeu Fabra, Barcelona, 2004.
ROADS, Curtis (1996). The Computer Music Tutorial. MIT Press
ROBINSON, D. W & DADSON, R. S. (1956) A re-determination of the equal-
loudness relations for pure tones British Journal of Applied Physics, Volume 7,
Issue 5, pp. 166-181 (1956)
RUVIARO, B. (2010) "Intellectual Improperty: Musical Borrowing as Manifest in
Acoustic and Electroacoustic Compositions" tese de doutorado, Stanford.
SCHAEFFER, P. (1966) Trait des objets musicaux. Paris: Seuil, 1966.
SCHNEIDER, A. FRIELER, K. (2009) Perception of Harmonic and Inharmonic
Sounds: Results from Ear Models Computer Music Modeling and Retrieval Genesis
of Meaning in Sound and Music.
SCHOUTEN, J. F. (1940) The residue, a new component in subjective sound analysis.
Proceedings Koninklijke Nederlandse Akademie Wetenschappen, 43, 356365,
1940.
SETHARES, W.A. (1999) Tuning, Timbre, Spectrum, Scale. London: Springer-Verlag.

210
2a Ed. com CD-ROM, 2005.
SETHARES, W. A. J. Milne, S. Tiedje, (2009) Spectral Tools for Dynamic Tonality
and Audio Morphing Computer Music Journal, 2009, Volume 33, Number 2,
Summer 2009, pp. 71-84.
STUMPF, C. (1890) Tonpsychologie vol 2. Leipzig: Hirzel, 1890.
____________. (1926). Die sprachlaute experimentell-phonetische untersuchungen
nebst einem anhang ber instrumentalklnge. Berlin, DE: J. Springer.
TENNEY, J. (1988) A History of Consonance and Dissonance. White Plains, NY:
Excelsior, 1988.
TERHARDT, E. (1974a) Pitch, Consonance and Harmony Journal of the Acoustical
Society of America vol. 55 pp. 1061-1069
____________. (1974b) On the Perception of Periodic Sound Fluctuations
(Roughness): Acustica, 30, 201-213
____________. (1977). The two-component theory of musical consonance. In:
Psychophysics and Physiology of Hearing (Evans, E.F., Wilson, J.P., eds.),
Academic, London, 381-390
____________. (1979). Calculating virtual pitch. Hear. Res. 1, 155-182
____________. (1982). Die psychoakustischen Grundlagen der musikalischen
Akkordgrundtne und deren algorithmische Bestimmung. In: Tiefenstruktur der
Musik (Dahlhaus, C., Krause, M., eds.), Tech. Univ. Berlin, 23-50
____________. (1984). The concept of musical consonance: A link between music and
psychoacoustics. Music Percept. 1, 276-295
____________. (2000a, February 15). Sensory consonance. Acesso em 18 de Agosto
de 2011; http://www.mmk.ei.tum.de/persons/ter/top/senscons.html.
____________. (2000b, February 15). Auditory Roughness. Acesso em 18 de
Agosto de 2011; http://www.mmk.ei.tum.de/persons/ter/top/roughness.html
____________. (2000c, march 9). Harmony. Acesso em 18 de Agosto de 2011;
http://www.mmk.ei.tum.de/persons/ter/top/harmony.html
____________. (2000d, February 13). Afinitty of Tones. Acesso em 18 de Agosto
de 2010;
____________. (2000e, February 22). Virtual Pitch. Acesso em 18 de Agosto de
2010;
____________. (2000f, February 22). Pitch Perception. Acesso em 18 de Agosto de
2010;
http://www.mmk.ei.tum.de/persons/ter/top/pitch.html
TERHARDT, E., STOLL, G., SEEWAN, M. (1982). Algorithm for extraction of pitch
and pitch salience from complex tonal signals. J. Acoust. Soc. Am. 71, 679-688
TRAMO, M.J., CARIANI, P.A., DELGUTTE, B., & BRAIDA, L.D. (2003).
Neurobiology of harmony perception. In I. Peretz & R. Zatorre (Eds.), The
cognitive neuroscience of music, (127-151). New York: Oxford University Press.
TRAUNMLLER, H. (1990) Analytical expressions for the tonotopic sensory scale.
Journal of the Acoustical Society of America. N88: 97-100, 1990.

211
TZANETAKIS, G. & COOK, P. (2002) Musical genre classifica- tion of audio
signals, IEEE Transactions on Speech and Audio Processing, vol. 10, no. 5, pp.
293302.
VAN IMMERSEEL, L. & MARTENS, J. (1992) Pitch and voiced/unvoiced
determination with an auditory model, The Journal of the Acoustical Society of
America, vol. 91, pp. 35113526
VASSILAKIS, P. N. (2001) Perceptual and Physical Properties of Amplitude
Fluctuation and their Musical Significance. Tese de Doutorado. UCLA.
WISHART, T. (1988) The Composition of Vox 5. Computer Music Journal 12/4,
1988
ZWICKER, E. (1961) Subdivision of the audible frequency range into critical bands
(Frequenzgruppen), Journal of the Acoustical Society of America. 33: 248, 1961
ZWICKER, E. e FASTL H. (1999) Psychoacoustics: Facts and Models, Berlin:
Springer.

212

S-ar putea să vă placă și