Sunteți pe pagina 1din 147

Gustavo Basso

Percepci6n auditiva

UNIVERSIDAD NACIONAL DE QUILMES


Rector

Daniel Gomez

Vicerrector
Jorge Flores

(f)

Universidad
Nacional
de Quilmes
Editorial

Colecci6n MUsica y Ciencia


Dirigida por OscarPablo Di Liscia

Basso, Gustavo
Percepci6n audit iva - la cd. - Bernal: Universidad Nacional
de Quilmes, 2006.
288 p. : it. ; 15x21.5 cm
(Musica y ciencia dirigida por Pablo Di Liscia)
ISBN 987-558-082-1

1. Pcrccpcion Auditiva. 2. Sonido. 3. Tono. - 1. TItulo


CDD 152.\5

Gustavo Basso. 2006

Universidad Nacional de Quilmes. 2006

Roque Saenz Pefia 352

(BI876BXD) Bernal

Buenos Aires

http://www.unq.edu.ar

editorial@unq.ed.ar

ISBN: 987-558-082-1
ISBN-13: 978-987-558-082-4
Queda hecho el deposito que rnarca la ley 11.723

Esta edici6n de 1.000 ejemplares se termino de imprimir en agosto de 2006, en los talleres
graficos de Imprenta El Faro, Dorrego 1401, Mar del Plata, Provincia de Buenos Aires.

Iodice

Presentacion, por Oscar Pablo Di Liscia

15

Prologo

17

Capitulo I. Sistema auditivo periferico y fisiologia de la audici6n


1. Ofdo externo
Audici6n con auriculares
2. Oido medio
Tfrnpano
Cadena de huesecillos
Cavidad timpanica y trompa de Eustaquio
Funci6n aciistica del otdo medio
Alteraciones en el sistema de transmisi6n del ofdo medio
3. Oido interno
Fisiologta de la c6clea
Caracterfsticas del nervio auditivo
4. Teorta dellugar
Exdtaci6n de la membrana basilar con un impulso
5. Comportamiento activo de la membrana basilar y emisiones

otoacusticas
6. Funciones de transferencia del sistema auditivo periferico
7. Respuestas neurales a altos niveles en el sistema auditivo

19

20

22

24

24

26

26

26

28

30

32

40

42

44

Capitulo II. Sonoridad


1. Relaci6n entre arnplitud e intensidad
Decibeles
Potencia e intensidad acustica
2. Percepci6n de la sonoridad
Umbrales absolutos

53

54

54

55

57

58

46

47

48

Contomos de igual sonoridad


Escala absoluta de sonoridad
Sumario de unidades relacionadas con la sonoridad
3. Discrirninacion de la intensidad
Limen de intensidad
La Ley de Weber
Ley de Fechner para la sonoridad
4. Otros factores que intervienen en la percepcion de la sonoridad
Integracion temporal
Factores espectrales
Cambios en la sensibilidad auditiva pravocados por sobrestimulacion.
Deteccion de sefiales sinusoidales en presencia de ruido
Patologfas auditivas
5. Codificacion de la intensidad
El problema del rango dinamico
Limites a la discriminacion en intensidad
Codificacion de rasgos y codificacion contextual
6. Modelos de percepcion de la sonoridad

Capitulo III. EI ofdo como analizador espectral.


1. Diferencia apenas perceptible (OAP) en frecuencia
2. Bandas criticas
Experimento de Fletcher
Refinamiento del modelo de Fletcher
3. Sonoridad ante espectros complejos
Umbral para estfrnulos cornplejos
Sensibilidad a la fase
Discrirninacion de parciales en sonidos complejos
Selectividad en frecuencia en ofdos dafiados
4. Enmascaramiento
Relacion entre las bandas criticas y el mecanismo

de enmascaramiento
Modelos de cobertura y supresion
Modelos temporales de enmascaramiento
"
5. Analisis espectro-ternporal combinado
Reduccion del enmascaramiento por cornodulacion
Enmascaramiento no simultaneo
Enmascaramiento binaural
6. Distorsion alineal y sonidos de combinacion
Sonidos de cornbinacion de segundo orden

60

62

65

66

66

68

70

70

70

71

73

77

77

81

81

84

85

86

89

89

91

91

94

98

99

99

100

100

101

103

104

104

104

105

106

109

110

111

, ';!~:
~,.

Sonidos de combinacion de tercer orden


7. Algoritmos psicoaciisticos de compresi6n

113

113

Capitulo IV. Procesamiento temporal de sefiales


1. Resolucion e integraci6n temporal.
Efectos de la frecuencia central en la resolucion temporal
2. Resoluci6n temporal en sefiales de banda ancha
3. Resolucion temporal en seriales de banda angosta
Deteccion de discontinuidades en ruido de banda angosta
Detecci6n de discontinuidades en sinusoides
4. Modelos de resolucion temporal.
Hip6tesis del banco de filtros de modulacion
5. Otros pracesos temporales
Discriminacron en secuencias de Huffman
Deteccion de asincronfas en el ataque y la extincion

de sefiales complejas
Discriminacion de la duraci6n
6. ] uicios sobre el orden temporal.
Desplazamiento aciistico temporal.

117

118

121

121

122

123

124

124

126

127

127

127

127

128

128

Capitulo V. Percepci6n de la altura tonal


1. Percepcion de la altura tonal en sinusoides
Discriminacion en frecuencia
Variacion de la altura tonal con la sonoridad
2. Percepcion de la altura tonal en estfrnulos arrnonicos complejos
Modelos de reconocimiento de patrones
Modelos temporales
Evidencia experimental relevante a cada modelo
:
Modelo de Brian Moore del mecanismo para la percepcion

de la altura tonal en sonidos complejos


3. La altura tonal como un medio morfof6rico
4. Representacion grafica de la altura tonal
Sonidos de Sheppard
5. Altura tonal e intervalos musicales
Percepci6n de intervalos musicales
lntervalos sincronicos y diacronicos
Consonancia y disonancia

145

149

150

152

154

155

157

160

Capitulo VI. TImbre


1. Definiciones de timbre

163

164

133

135

136

137

139

140

142

143

2. Estudios y modelos explicativos sobre el timbre


El modelo clasico
Analisis multidimensional
Modelos verb ales
Modelos de analisis por sfntesis
Estudios sobre el timbre en la voz humana
Estudios sobre el "color" del sonido
Eventos acusticos diferentes a la voz y a los sonidos musicales
Resumen y conclusiones
3. Propiedades particulares del timbre
Constancia del timbre
[Timbres metamericos?
El timbre como medio morfof6rico
Timbre y atenci6n
4. Comentario final.

166

167

171

178

179

182

183

184

186

187

187

189

189

190

190

Capitulo VII. Percepcion auditiva del espacio


1. Localizaci6n de sinusoides
Diferencia interaural de intensidad
Diferencia interaural de tiempo
Batidos binaurales
2. Localizaci6n de sefiales no sinusoidales
Localizaci6n mono aural: el rol del pabellon auricular
Empleo de datos espectrales en la localizaci6n binaural
3. Modelos de procesamiento espacial
4. El efecto de precedencia
Refuerzo electroacustico en grandes espacios
5. Percepci6n de la distancia
Perspectiva auditiva
6. Percepci6n del movimiento
7. Campos aciisticos virtuales
8. Resumen

191

192

192

192

197

197

197

198

201

202

204

206

206

211

212

214

Capitulo VIII. Percepcion de objetos auditivos


1. Ecologta acustica y analisis auditivo del entomo
2. Informaci6n utilizada para separar los objetos auditivos
Armonicidad y frecuencia fundamental.
Disparidades en el ataque
Contraste con sonidos previos

215

215

216

217

219

219

Correlaci6n de los cambios en amplitud y frecuencia


220

Localizaci6n de la fuente
221

Periodicidad y fusi6n perceptual


223

Percepci6n de secuencias ritmicas


225

Percepci6n del orden temporal


226

Regularidad en los datos ffsicos


226

Redundancia de la informaci6n
227

3. Principios generales de organizaci6n perceptual y teorfa de la Gestalt .. 228

Leyes de la Gestalt
230

Isornorfismo
238

Capitulo IX. Percepci6n del habla


1. El aparato vocal y la fonaci6n
El aparato vocal
Producci6n del sonido
Formantes
Caracterfsticas generales de la emisi6n vocal
2. Representaci6n grafica de los sonidos del habla
3. Caracterfsticas particulares de la percepci6n del habla
4. Modelos de percepci6n del habla
Teorfa motora
Teorfa de los rasgos invariantes
Modelo de red neuronal
5. La busqueda de indicadores acusticos invariantes
Resistencia del habla frente al deterioro de la sefial
6. Inteligibllidad de la palabra
Ensayos de articulaci6n
Medici6n indirecta y predicci6n de la inteligibilidad
Ayuda visual

239

239

240

241

244

247

248

250

255

255

255

256

256

257

257

258

260

265

Apendices
I. Teorema de Fourier
II. Principio acustico de indeterminaci6n

267

271

Referencias bibliograficas

275

Indice ternatico

285

--~--

-----:;::--~--

- -

--- ----=-- - - - - - - - -

--

Presentaci6n

EI arte sonora, las modalidades y generos de comunicaci6n que involucran so


nido, las tecnicas y tecnologfas de praceso de sonido y rmisica y la investiga
ci6n sobre percepci6n auditiva, se vienen desarro\lando de manera
interdependiente y significativa desde el siglo pasado. Cada una de las areas
mencionadas ha impregnado de dud as y certezas a las otras, al participar de un
formidable praceso interactive que continua acelerandose en la actualidad.
Este libro presenta una exploraci6n de los avances en el campo de la per
cepci6n auditiva. Su titulo tiene el grado de determinaci6n y de generalidad que
requieren tanto el dinamismo como la variedad del campo de estudio involucra
do. Por otra parte, no puede negarse que su autor ha sido fiel a su triple condi
cion de rmisico, cientffico y docente, al generar un texto que expone de manera
muy didactica y eficaz los resultados mas significativos de la investigaci6n en su
area, en una constante realimentacion con la reflexi6n sobre el arte sonoro.
Una de las cuestiones medulares de la investigaci6n actual en esta area es
la determinaci6n del ambito (ffsico-fisiologico) en el que se \levan a cabo los
pracesos de decodificaci6n de la sefial aciistica. En otras palabras: ies el fabu
loso disefio de nuestro ofdo interno y externo, 0 son los procesos neurales de
alto nivel los responsables de que percibamos determinados eventos sonoros
de determinada manera? iY si son ambos, c6mo se reparte la tare a y como se
explica y modeliza su funcionamiento? ASI es que, par ejemplo, algunos auto
res (vease Bregman, 1994) hacen referencia a pracesos neurofisiol6gicos de
"alto nivel" 0 de "bajo nivel" como responsables de determinadas tareas de de
codificacion y otros (Malham, 2000), coincidentemente, denominan "comb i
nacion ofdo-cerebro" al sistema auditive en general. Y por citar un solo
ejemplo de este trabajo, Basso escribe en el capitulo VI: "[ ... ] la constancia del
timbre s610 puede ser explicada en funci6n de complicados procesos en las
etapas superiores del tratamiento neural".
Los avances en esta direccion han sido tens ados par la necesidad de invo
luerar dentro del estudio de la psicoacustica a secuencias sonaras complejas,

15

que van mas alla de los eventos individuales. Se involucran asf, procesos de
eventos sonaros de muy variada naturaleza y complejidad, como la percepcion
de secuencias de habla (capitulo IX), evaluacion de recintos y localizacion de
fuentes sonaras en movimiento (capitulo v), segregacion y fusion de estratos
sonoras simultaneos y sucesivos (capitulo VIII), 0, finalmente, los estudios sa
bre el desplazamiento entre el tiempo ffsico y el fenomenico (capitulo IV).
Una de las dificultades que hubo de enfrentar el autar de este libra es la
secuenciacion de los contenidos, dada su interdependencia. Es asi que, par
ejernplo, en el capitulo referido a la "sonoridad" (capitulo II) se pregunta: "Pe
ro, zes legitime considerar a la sonoridad como un rasgo autonorno, que se
puede estudiar de manera independiente, separada del resto de las caracteris
ticas que definen un sonido real?"
Y que decir del capitulo dedicado al "timbre" (capitulo VI), una de las no
ciones mas interdependientes y cambiantes en toda la historia del sonido y la
rmisica. En su tratamiento, el autor pone en evidencia, adernas, el rol de los
aportes de las tecnicas y tecnologias de sonido prapias de la electroacustica:
"Los modelos de analisis par sintesis han demostrado ser eficaces para generar
conocimiento cientffico y tecnico, reducir la cantidad de informacion necesa
ria para expresar una sefial aciistica, praducir variantes y modificaciones nun
ca experimentadas y contralar la prasodia musical en tiempo real. [...] Una
descripcion detallada de las tecnicas empleadas contendria la histaria de la
electroaciistica durante los iiltimos 60 afios."
Por todo 10 antedicho, este libra constituye un trabajo valioso para explo
rar antes que para simplemente "leer", para que ellectar realice multiples reco
rridos en los que puede y debe encontrar variados puntos de entrada-salida y de
relacion, a despecho de la necesaria secuencia que impone el texto escrito.

Oscar Pablo Di Liscia

16

Prologo

Este libra fue concebido inicialmente como una publicacion interna para un
seminario de posgrado que se dicto en el ana 2000 en la Universidad Nacional
de Quilmes. Ese arigen explica, en parte, el contenido y la secuencia de los ca
pitulos. Su objetivo principal es el de exponer los elementos, principios y pra
cesos que intervienen en la percepcion del sonido. Nuestra intencion no es
presentar los temas como si formasen parte de un conjunto de conocimientos
definitivos, sino integrar las dificultades prapias de una disciplina en la que los
mismos datos experimentales llevan muchas veces a la creacion de modelos ex
plicativos totalmente diferentes.
Quiza la confusion mas habitual en cualquier texto sabre acustica tiene
origen en la ambiguedad de la definicion de sonido. Segun el autor a el texto
que traternos, el termino son ida se puede referir a un fenomeno ffsico -como
una vibracion a una onda en el espacio- a a un [enomeno psicologico, Aquf
llamaremos son ida a la representacion mental asociada a la percepcion, y se
fial acustica al estfrnulo ffsico que 10 origina. La psicoaciistica tradicional es
tudia directamente la relacion entre las sefiales acusticas de entrada y los
sonidos, colocando los pracesos intermedios en una especie de caja negra cu
yo mecanismo no considera de su incumbencia. La fisiologfa de la percepcion
y la neurobiologia, par su parte, se interesan especialmente par los pracesos de
transduccion que operan entre la serial aciistica y la representacion mental
asociada. En nuestro caso predomina la primera aproxirnacion, pera no evita
remos mencionar los aspectos fisiologicos involucrados cuando 10 creamos ne
cesario. El primer capitulo, par ejemplo, esta dedicado par completo a la
fisiologfa de la audicion.
Este texto esta concebido como parte de un pragrama completo de acus
tica destinado a music as e investigadores en temas relacionados can el soni
do. Aunque los aportes de la psicologia y de las ciencias medicas resultan
esenciales, nuestra aproxirnacion al tema adopta decididamente la perspecti
va especffica de la ciencia aciistica. Si bien se supone que ellector esta farni

17

liarizado con los conceptos basicos de la acustica general, en la bibliografia al


final del libro se mencionan algunas referencias para quien necesite refrescar
alguno de ellos y en los apendices se describen brevemente dos temas que no
siempre aparecen en los textos de acustica habiruales: el teorema de Fourier y
el principio de indeterrninacion. Toda vez que fue posible se emplearon los
terminos tecnicos en espafiol y en algunos casos las expresiones se presentan
tambien en el idioma de origen para facilitar la consulta en la bibliogtafia es
pecializada.
Mi mas sincero agradecimiento al profesor Pablo Di Liscia -director de la
coleccion Musica y Ciencia- por el apoyo que le brindo al proyecto desde su
inicio, al profesor Juan Pampin y al profesor Emanuel Bonnier-responsable de
la realizacion de los graficos. Mi gratitud a los integrantes del equipo de inves
tigaci6n en acustica de la Facultad de Bellas Artes de la Universidad Nacional
de La Plata. Y a los colegas y alumnos que, directa 0 indirectamente, partici
paron en las charlas y en los innumerables intercambios de correo sobre per
cepcion auditiva de los ultirnos afios. Sin su estfmulo este libro no hubiera sido
posible.

Capitulo I
Sistema auditivo periferico y fisiologia de la audici6n

El ofdo -0 sistema auditivo periferico- comienza en el pabellon auricular y Ile


ga hasta la coclea. Su mision es convertir las vibraciones mecanicas en impul
sos nerviosos para que sean procesados en el cerebro. Es muy pequefio y
delicado y se halla protegido en el interior del hueso temporal. En la Figura 1
se 10 representa esquematicamente.
Canales semicirculares
Yunque

La Plata, mayo de 2006

Timpano
Ventana
redonda

~
~
Conducto auditivo

Dido externo

Dido medio

Dido interno

Figura 1. Sistema auditivo periferico

Para su estudio se 10 divide en tres partes: ofdo externo, ofdo medio y 01


do interno. Los canales semicirculares; que comparten algunas estructuras ana
tomicas con el oido interno, pertenecen en realidad al sentido del equilibrio.
En este capitulo nos detendremos extensamente en los procesos involu
crados en la fisiologfa de la audicion, cuyo objeto de estudio incluye la totali

18

19

dad de los eventos ffsicos y neurales involucrados en la percepci6n del sonido,


desde el sistema auditivo periferico hasta la carteza cerebral.'
En 10 que sigue analizaremos anat6mica y fisio16gicamente cada una de
las partes del sistema auditivo periferico.

Helix

--------"1~

Fosa del helix

Antihelix

-----t-t--.

Concha (plato)

----4-+---r:-+

Crus helias

1. Ofoo

EXTERNO

Concha (cavum) ------\----\,.----\""


Trago

El ofdo externo, junto a la cabeza y la parte superior del torso, forma parte del
sistema receptor de vibraciones que acopla el timpano con el campo aciistico
externo. Ademas de protegerlo ante posibles agresiones mecanicas, filtra y
modifies las sefiales que le llegan del exterior y contribuye decisivamente en
la tare a de localizacion espacial de las fuentes acusticas.
Una descripci6n anat6mica del ofdo externo, de adentro hacia afuera, in
cluye el canal auditivo externo, la concha y el pabellon auricular El canal au
ditivo extemo es una estructura tubular irregular de aproximadamente 26 mm
de largo par 7 mm de ancho y un volumen de 1 crn-, con un eje central sinuo
so, que conecta el pabellon con el tfrnpano. Su pared esta confonnada por una
parci6n cartilaginosa (rnovil) y una 6sea. La parte cartilaginosa, continuaci6n
de la estructura del pabellon auricular, es de mayor longitud que la 6sea y es
ta cubierta par piel con folfculos pilosos, glandulas ceruminosas y sebaceas. En
cambio, la piel que recubre la regi6n 6sea del canal auditivo externo, en la
parte mas profunda adherida al tfrnpano, es muy delgada.
La parte externa del canal auditivo externo se ensancha notablemente
farmando una cavidad en forma de taza llamada concha, con un volumen in
terno de aproximadamente 4 cm '. En la Figura 2 se pueden apreciar una vista
lateral y un carte del ofdo externo.
El pabell6n auricular (la oreja) es una estructura cartilaginosa que acnia
como un filtro direccional de las sefiales que llegan del exterior. Es muy dife
rente al de otros mamfferos, par ejemplo el de los felinos, que poseen pabello
nes conicos que pueden enfocar hacia un punto del espacio de manera
independiente por medio de musculos de control especfficos.
Los efectos del pabell6n auricular (6 em), de la cabeza (22 cm entre of
dos) y de los hombros (15 cm de ancho) se vuelven significativos cuando las
longitudes de onda son comparables con la dimensi6n de las estructuras. El sis
tema completo puede ser caracterizado comparando -0 midiendo- la presi6n
acustica en el campo libre, a la entrada del pabellon auricular, con la presi6n
acustica en la superficie del timpano. En la Figura 3 se aprecia la acci6n de fil
1

La parte de la acustica que estudia la fisiologfa de la audici6n se denomina fisioacUstica.

20

--------l.......,'r-~',,"\

Antilrago

------+-..>.,-~

Hendidura del trago ------\,.----'

L6bulo - - - - - - - - - T - - +

Figura 2. Vista lateral y corte esquerruitico superior del oido externo

20

iii'

~ 15
0

c:
tll

10

a;

c:
CD

SIII

CD

0III
CD

"

0::

-5
0.2

0,5

0.7

1012

Frecuencia (kHz)

Figura 3. Funci6n de transferencia del ofdo externo ante un estfmulo difuso de ruido blanco

21

~------------

tro espectral que produce el ofdo extemo. La transferencia maxima, a una fre
cuencia de aproximadamente 2.800 Hz, se debe a la resonancia del canal au
ditivo externo.
La compleja forma de la curva se debe ala concurrencia de los fenome
nos de reflex ion, difraccion y resonancia en diferentes partes del ofdo exter
no. Como curiosidad, en la figura 4 se reproduce el experimento de Goode, en
el que se compara la transferencia de un ofdo normal con un modelo en el que
el tfrnpano queda a ras de una esfera, como ocurre en el caso de algunos sau
rios (Goode, R. L. et al., 1994): es evidente la compleja accion espectral del
oido extemo sobre las sefiales que le llegan del exterior. En el capitulo sobre
percepcion auditiva del espacio nos detendremos a estudiar con detalle este
efecto y sus consecuencias.

te en calibrar los auriculares en su posicion de uso en un ofdo real. Primero se


mide, con un microfono muy pequefio colocado dentro del canal auditive, la
presion sonara provocada par una fuente acustica de espectro plano alejada de
la cabeza del ovente (campo libre). La sefial en el microfono corresponde
exactamente a la funci6n de transierencia -0 HRTF- de ese ofdo externo en par
ticular.i La curva de transferencia obtenida se reproduce en el ofdo ecualizan
do la salida del auricular en posicion de uso. De este modo se puede lograr la
misma respuesta espectral que en el campo libre para cada pareja auricular-of
do. Como el procedimiento es complicado, se ofrecen cientos de curvas HRTF
---que se pueden obtener, par ejemplo, en intemet- que cada usuario escoge de
acuerdo a su tipologfa particular.
Una de las caracterfsticas mas notables de la audicion a traves de auricu
lares es la excelente respuesta en bajas frecuencias, imposible de conseguir con
los mismos auriculares ubicados en el campo libre, lejos de la cabeza del oven
teo Este efecto se explica par la diferencia en el acople acustico entre ambas
situaciones. Con la fuente en el campo libre acnia el filtro del oido externo en
toda su capacidad: la energfa de baja frecuencia llega atenuada al tfrnpano
pues difracta alrededar de la cabeza. Cuando se coloca un auricular se cierra la
cornunicacion con el campo libre y se crea una cavidad estanca compuesta por
el volumen intemo del auricular mas el volumen intemo del ofdo externo. En
la figura 5 se puede ver este caso.
EI volumen es ahora constante y posee unicamente dos superficies mo
viles, el altavoz del auricular y el tfrnpano. Cualquier desplazamiento neto
del altavoz se va a transmitir Integramente al timpano amplificado por la re-

Audici6n con auriculares


Cuando los estfrnulos se presentan a traves de auriculares las caracterfsticas
del campo libre son reemplazadas por la interaccion entre el auricular y el of
do externo del oyente. Esta interaccion incluye efectos propios de la mecani
ca de ondas que son muy diffciles de controlar, especialmente a altas
frecuencias. Un metodo que permite acoplar con precision el sistema consis

""

10 ,...

Oldo completo

~
0

"'

""

Limite teorico

""

I..2I4rc

""

.2

'0
0
c.

E
ltl
o
c
Cll
c
0()
.~

"'

""

""

......

-l +10

"

-10

0,1

-E"'
Cll
Qi

.0

'0

TI mpano con esfera

Area del
altavoz

Cll

Cl

- ----........

...

-20

0,01

Area del
timpano

.0

0001

~
0,2

Volumen constante

130
I

0,5

10

20

Figura 5. Acople entre un auricular y el otdo extemo

Frecuencia (kHz)

Figura 4. Cornparacion entre las funciones de transferencia de un otdo completo y de un


timpano adosado a una esfera

2 Head

related transfer functions

22

(HRTF).

Este tema sera estudiado en detalle en el capitulo VII.

23

t'r

--laci 6 n entre sus a reas , 4: 1 a fa vo r de l a ltavoz en un caso pro rned io . Di ch a


t ra n smi sio n es indepen d ien te de la frec ue nc ia, pue s ac nia co mo una pre nsa
n e urna ti ca y ex p lica la no tabl e ef icienc ia en ba jas fre c uenci as de l siste ma.
Larnentablernenr e, el d isposit ivo de ajuste estanco qu e perm ite tan bu en
rendirnien ro e n gra ves es uno d e los factores q ue co nvie rte a los aur icula res
en ca usa potenci a l de hipoacu sia por rui do , so bre re do si se los usa in co rr ec

5,1

5,1 --

rarnent e.'

3,5
4 ,4

2. 0[00 MEOIO
El ofdo med io permi te aco plar las sefiales ac ustica s en tre el ca na l a udi tive y e l
ofdo interno. Ocupa un a cav ida d en el hueso te mporal denomi nada ca ja tim
panica y esra co ns t it uido pa r el t frnpano, la cad ena de hu esec illos -rnartil lo ,
yunqu e y estr ibo- co n sus ligamen to s y museulos de co ntrol, la tro mpa de Eus
taquio y las venta nas o va l y red onda, que 10 co m un ican co n e l a ida inter no ."
S u pr inc ipa l fun c i6 n es la de perm itir qu e las vibrac iones ac iist icas llegue n a
la c6 clea ca n sufic ien te energfa. S i las sefiales llegasen direct arnente al ofdo
inte rn o a traves de la ven ta na oval, cas i toda la ene rgla se reflejaria a ca usa de
la d iferen c ia entre las pro piedades mecanicas del rned io ae reo ex terior y de l
medi o ltquido de la coc lea . En los vert ebrados terrestr es el oido medi o ac t ua
co mo un siste ma de acople q ue adapra a mbos med ios, permiti en do una efec
tiva transferenc ia de ene rgla. T ecni carnente, es un ada pta do r de impe da nc ias
y co mo tal 10 ana lizaremos mas adela nte.

Figura 6 . Vibrac ion relat iva del rfrnpano ante una exc itacion de 52 5

Hz y 121 d B

Martillo Yunque

Timpano

Estribo

Figura 7. C aden a de h ueseci llos del old o med ia

T frnpan o
El tfrnpan o es un a membran a se m itranspa rente co n for ma de co no co n un a su
pe rfic ie prom ed io de 0, 6 c m/ . A causa de su geornetr fa irregu lar y al ancla je
so lida rio de l manubri o de l rnart illo, e l tim pano vibra co mo una co mpleja
membran a e las tica no horn oge nea. En la figur a 6 se aprec ia su respu est a an te
un esnruulo sin uso ida l de 525 H z. Se destaca ni ti damente la forma del area de
co n tacto co n e l manubri o de l rnarrillo.

3 A lgun os de los fac tores que aurnen tan el riesgo de hip oacusia son el usa de auric ulares en

arnbien tes can gran ni vel de ruido de fond a, par ejemp lo la vfa publica, y el emp leo de arn

plificadore s de audio de baja ca lidad, can der iva estatica y alt a porcenraje de "ru mb le" (rui

do de muy baja frecu enc ia) .

4 Esra estruc rura es sim ilar a la de casi rodos los verrebrados te rrest res. Las especie s que no

posee n memb rana rirnpanica, com o las salaman dras y las serpien tes , son la exce pcio n .

24

Figura 8 . Fotografla del estr ibo

25

Cadena de huesecillos

La impedancia es un a magnitud que permite evaluar la resisten cia al movi


miento de un siste ma . En nuestro caso se verifica que la impedanci a ac ustica
en el tim pano es mucho menor que en el oido interno .
Veam os el proceso en der alle. Con la excepci6n de las frec ue n cias m as al
tas, por en cima de 5 kHz, la dimension transversal del ca nal aud it ivo ex terno
es pequefia fren te a las longitudes de onda y, por 10 tanto, la presion sonora re
sulta aproximadarnente co ns ta n te sobre el are a del tim pano. En este caso la
interaccion ac ust ica puede desc ribirse en terrninos de dos va riables: la presion
sonora en el tfrnp ano Pr y su veloc ida d de volumen U T . EI mov irnien to del
rfrnpan o se transrnir e a crav es de la cade na de huesecill os a la ventana oval.
A quf tarnbien la interac cion ac ustica puede de scribirse a partir de la presion
sonora en la ven ta na ova l Pva y su veloc idad de volurnen U va . En la Figur a 9
se ve un esq ue ma m uy simplificado del sistema de transrnision .
En un a pr ime ra ap rox imacion , la cadena de hu esecillos ac t ua como un sis
tema de pa lancas. Para vibrac iones de amplitud moderad a, el estr ibo ejerce un a
fuerza 1,3 veces m ayor sobre la ventana oval que la qu e ejerce el timpan o sa bre
el martillo. C om o el area de la ventana oval-amos 4 mrrr-- es mucho rnenor que
la del tfrnpan o -de alrededor de 60 mrrr-- en ella puede aplicarse un a presi6n
hasta treinta veces mayo r que en el tirnpano, Y como la intensidad es funci on
del cuadrado de la presion, la diferencia de intensidad puede llegar a ser de mil

Las vibraciones del timpa no se tr ansmiten hacia el oido interno a tr av es de


tres pequefios hu esecill os: el rnartillo, el yunque y el estribo. EI martillo posee
una parte prominente, el manubrio, que se inserta entre las lami nas de la
membrana timpanic a, A su vez, el m artillo y el yun q ue estan co ne c tados e n
tre sf y a la pared 6sea por med io de ligamentos. EI yunq ue se vincula co n el
estribo a traves de otro ligam enro, y el pie del estribo se conecta po r me di o de
un ligarnento an ula r a la ve n ta na oval.
Dos miiscu los co n t ribuyen a soste n er los huesecillos y permiten co nt ro lar
la rigid ez de la cad ena osicular. EI tensor del tfmpano es ra ligad o al martillo y
el estapedial al estribo . Ta l co mo ve re mos , estos museu los funcionan co mo un
co n tro l de gana nc ia va riab le del o fdo medi o.
Cavidad tirnpanica y trompa de Eustaquio
La trompa de Eustaquio, que co n ec ra el otdo medio con la cavidad n asofarfn
gea, es un conducto de paredes blandas q ue esta cerrado la mayor parte del
tiempo y que se abre al tragar, masti car 0 bostezar. Su funci6n es la de perrni
tir la ecualizacion de la presion est atica a ambos lados del tirnpano . Gracias a
este mecanisme el ai re en el interio r eje rce la misma presion que la atmosfera
desde el exterior. Se resuelve asf la parad oj a que inquiere por que la presion
atmosterica, de un valor supe rior a los 100 kP a, n o se oye mientras q ue un a se
fial aciistica de s610 20 Pa nos resulta de una in te ns idad in to lerable . La res
pues ta es sen cilla: la presio n atrnosferica , prac ticamente estatica, no mueve al
tfmpano pue s se ej erc e Con igual valor en sus dos ca ras gracias a la ace ion de
la t rompa de Eust aquio. La presion dinami ca, qu e vibra a frecuenci as supe rio
res a 16 H z, se aplica con facilidad so bre la ca ra ex te rna del tfmpano pero lle
ga co n dificulrad a la ca ra interna, aun co n la trompa de Eustaquio a bierta. La
diferenci a de presiones d ina rnicas se trad uce en un mo vimiento efec tivo de l
tfmpano y de la cad ena de h ueseci llos .

Musculo
del estribo
(stapedius)
Estribo
.
Ventana oval

Pared del

canal(6 se~
Membrana
basilar

Membrana de la
ventana redonda

Canal
audi tivo

Funcion aciistica del aida media

.,.

Membran a
tirnpani ca

La funci6n principal del oido me di o es tr ansmitir Ia mayor cantidad de ener


gfa desde el canal auditivo ex ter no h ast a la coclea, Para lograr este fin la ca
dena de huesecillos debe ada ptar la imp ed anci a del sistema timpano-aire con
la del sistema ventana oval-perilinfa. C om o ya sefialamos, si las ondas acusticas
pasasen del tfmpano a la ventana ova l, casi toda la energfa se refle jar fa por la
gra n diferencia de impedancia ex iste n te e nt re los dos medios de propagacion.

.--' -::::as

Trompa de
Eustaquio

Pared del canal

(cartilagi nosa)

Figura 9. Esquema del sistema de transm isi6n del a Ida media

26

27

...............

-veces, equivalente a una ganancia de unos 30 dB. En realidad, el movimiento es


mas complicado que el de una simple rotacion y el manubrio del martillo no se
mueve como un cuerpo rigido a altas frecuencias. En la Figura 10 se puede apre
ciar la curva real de transferencia de presion entre el timpano y la ventana oval.
En la tuncion de transferencia se ve que se obtiene una ganancia de
20-30 dB en el rango medio. La variacion espectral de la curva demuestra que
la cadena de huesecillos no actua como una palanca lineal.
En cuanto a la transferencia nera de potencia, se considera que en el of
do medio se pierde alrededor del 50% de la energfa: al menos la mitad de la
potencia recibida por el timpano no llega al ofdo interno.

10

co

"0

'6

OJ

"0

'0

-10

CD

"0

<1l

>
~
~

-c- 500 Hz
-20

<1l

:<2
if)

Alteraciones en el sistema de transmision del aida media

40

30

iO
~

20

Q
~

a:

10

~
0,1

0,5

10

Freeueneia (kHz)

Figura 10. Funcion de transferencia de presion entre la venrana oval y el timpano

28

Hz
Hz

-30
-20

Una alteracion frecuente en la ganancia del sistema de transmision se da cuan


do la trompa de Eustaquio permanece cerrada y la presion atmosferica varfa
rapidarnente, por ejernplo en el interior de un avion mientras se presuriza la
cabina, 0 al sumergirse a varios metros de profundidad en el agua. La diferen
cia neta de presion estatica curva al tirnpano, aumenta la tension mecanica de
la membrana y modifica la capacidad de transferencia de energfa del ofdo me
dio. Por ejemplo, una diferencia de 1 kPa -que equivale a una columna de 10
ern de agua 0 a 0,01 atm- produce cambios detectables en la sensibilidad au
ditiva. Como se puede apreciar en la Figura 11, la profundidad del efecto de

1000 Hz

-A- 2000
-0- 3000

Cii

I
-10

I
0

10

20

Presion en el aida media (em H 20)

Figura 11. Variacion de la transferencia de energia del oido medio en funcion de la presion
estatica

pende de la frecuencia y genera la sensacion de sordina que experimentamos


al tener los oidos "tapados".
Otra Fuente de variacion en la ganancia del sistema la aporta la accion de
los musculos de ofdo medio. Estos musculos se contraen, en una accion deno
minada reflejo aciistico, ante estfrnulos acusticos de gran intensidad, antes y
durante la fonacion y, en general, durante los movimientos corporales de me
diana y gran amplitud. El estapedial es de accion rapida -el reflejo acustico
aparece entre 10 y 20 ms despues del estfmulo- mientras que el tensor del tim
pano responde mas lentarnente -rarda unos 100 ms en activarse. El retardo del
sistema de proteccion 10 vuelve ineficaz cuando el estirnulo es de tipo impul
sivo, por ejemplo el estallido de un petardo. Los dos musculos combinados 10
gran atenuar la sefial alrededor de 20 dB. Como se puede ver en la Figura 12,
el reflejo aciistico no posee respuesta plana y su efecto es mayor a bajas fre
cuencias.
La supresiori patologica del reflejo aciistico tiene, entre otras, las siguien
tes consecuencias: 1) disminuye la discriminacion del habla a altas intensida
des, 2) incrementa la perdida de audicion ante estimulos prolongados de alta
intensidad y 3) aumenta el enmascaramiento simultaneo. El dane audiologi
co provocado por el uso inadecuado de auriculares es similar al inducido por
la supresion patologica del reflejo acustico,
Es interesante marcar que la funcion de transferencia desde el pabellon
auricular hasta la ventaria oval define casi completamente la inversa de la cur

29

..

m~~

, "

:2- -2
c
'00

,),,,,, ,

~~:~ : 're, l

Superior

Posterior

Lateral

-0

'E

-4

(fJ

jg

-6

c
Q)

Ventana oval
-8

<3

_\~

Vestibula

:.0
E

Ventana redonda

-10
-12

~
40 0 500

800 1000

2000

Figura 13. Esquema dellaberinco oseo

Frecuencia (Hz)

Figur a 12. Reflejo actistico en funci6n de la int ensidad del estfmulo

va de sensibilidad audi ti va en el ser hu mane (en la figura 30 de este capitulo


se puede ver la curva de transferencia comp leta) . A partir de este pun to el pro
ceso completo parece cornpo rta rse de manera lin eal. Los est trnulos que llegan
por la ven tana oval produ cen los mismos patrones cocleares que los que lle
gan por via osea, aunque arnbas fun ciones de transferen cia difieran n otable
mente en tre sf.

3. Otto

lNT ERNO

El oido interne es parte de un a ca vidad irregular del hue so temporal que reci
be el n ombre de laberi n to oseo y comp rende el vest ibule , el caracol y los ca
nal es semicirculares. Sus paredes estan forrnadas por hue so recub ierto de
epi teli o y cont iene un lfquido acuoso parecido al liquido amn iot ico. G ran par
te del espac io in terior esta ocupado por un siste ma de finos cond ucto s y sacos
que const itu yen una segunda capa, de paredes tapizadas por tej ido conecti vo
blando, llarnado laberinto mernbranoso. La porc i6n del laberin to 6seo que si
gue a la ven ta n a oval se denom ina vestibule , que a su vez esta dividido en dos
partes, elutrfcu lo y el saculo. Mientras la base del est ribo cubr e casi comple
ta rnent e la ven tana oval, la venta na redonda se halla recubierta por una del
gada membr an a de te jido conectivo. Un estrecho can al cond uce del saculo al
conducto coc lear, situ ado en el interior del caraco l. El conducto coclear, tam
30

bien conocido como caraco l mernbran oso, forma un a espira l de dos vueltas y
media de tejid o conect ivo que sigue el desarrollo de la espi ral osea del caracol.
Ellaberinto esta inervado por el nervio audit ive -octavo par crane al- que
en su interior se divide en dos ramas: el ne rvio coclear, que es el nervio vinc u
lado a la audicion, y el nervio vestibular, que perte nece al sent ido del equilibrio.
En la porcion centra l del laberint o estan los canales semicirculares, q ue
poseen celulas recept oras y cr istales de calcic que responden a la gravedad y a
la aceleracion, informando al ce rebro sobre la posicion y el movirnien to de la
cabe za. Son tres conductos semicirculares orien tados en cuadratura segun las
tres dirnensiones espaciales. A l mover la cabeza se prod ucen mov imientos re
lativos ent re el lfqui do y los crista les de ca lcic en suspension que est imulan a
las ce lulas sen sibles q ue tapizan el tejido int erior de los cana les. As \, ade rnas
de las estru cturas pro pias del sentido de la aud icion , el labe rinto oseo con tie
ne tam bien los organos del sen tido del equ ilibr io.
El tarnafio de los elemen tos del ofdo int em o es ext raordinariamen te peque
no. La base de l caraco l mide men os de 9 mm y el diamet ro del cond ucto que for
ma la c6clea es de alrededor de 1 mm en su part e media, estrechand ose a medida
que se acerca al vert ice. En su interior, el con ducto coclear -t-O scala media- es
aun mas pequefio, ya que la coclea esta dividida en tres part es 0 scalas como se
puede ver en la figura 14. La membrana basilar (MB) sigue la forma en espiral de
la c6clea y forma el piso del conducto coclear, En su desarrollo describe dos vue 1
tas y media y, totalmen te extend ida, mide alrededor de 35 mm de largo.
En la mem bran a basilar se enc uen tra el organo de Cort i, qu e cont iene las
cel ulas ciliadas responsables de con vert ir las vibraciones mecani cas en impu l
sos ner viosos. Duran te much o tiempo se crey6 que la coclea era unicamen te

31

fl '"

Scala Vestibull
(perdinfa)

Hueso

'-t":
,I'

~S~~(~:~d O ~

:.

\'\1"
.'l '~\
,I r'""..: .

I ,.

I ' I . '

Capsula de una
celula ganglionar

. ... '," , I
,

r;r.n'
\ I \\.\'r,:
\ j)' - ,

~""

Figura 14. Cone transversal de la c6clea en su parte med ia

un 6rgano receptor que procesab a las sefiales acust icas pa ra tran sforrnarlas en
pot en ciales electricos e impulsos nerviosos. Hoy sabe mos, grac ias a numerosos
estu dios, como los de Kem p y Zwicker, que tarnbien posee prapiedades rnot o
ras que Ie ot organ la cap acid ad de act uar sobre las seriales que Ilegan desde el
ex te rio r.
Fisiologia de la coclea
El movimien to de la cadena de hu esecillos del o ldo me dio se ap lica a tra ves
del estribo a la ventana ov al. C omo el laberi nt o esta Ileno de llquido y sus
pared es son oseas, el conjunto resul ta pr act icarnente inc ompresible. El mo
vimi ento del estribo seria poc o menos que nulo de no existir la ventana re
don da, que permite que el volumen de llquid o en la coclea se mantenga
co ns ta n te y que, por 0 tanto, se compensen exacta me n te los movimientos
net os de la ventana oval y de la ventan a redonda. La energia acustica Ilega
en to nc es a la c6clea que, como se puede ver en el co rte de la Figura 15, esta
di vidida en tres compartimientos. La scala tympani co m ienza en la ventana
ova l y esta Ilena de perilinfa, un llquido rico en sod io. La scala vestibula na
ce en la ven ta na redonda y se comunica con scala tympani a trav es de una
ab ertura , el helic otrema, que permi te el paso de l liqu ido perilinfa t ico en el
extre me superior 0 apex del caracol. Entre ambos co nd uc tos se enc ue n tra la
scala media 0 co nd ucto coclear, qu e esta ais lado de los an te riores par la mem
bran a basilar y por la membran a de Reissner y qu e co n tiene endo linfa -un
llquido viscoso rico en potasio . Como la membran a de Reissner es mu y li
32

t .:" .

. . 1 ~ . .
~ ,rl,. I, . ~ ..
I

"'f
~

I'J "'

M b
to
:-";'
:::s-.;
Fibras nerviosas
em lana basilar
, - '~ " ."
" : ':
Ganglios
" , -, \
~' " ; .
espiralados
Tt' nel de Corti
lIgamento
: ' ,, '" .
Neuronas coclea res
esp iralado \ ';,
Sca la Tympanr
" ,:
(perilinfa)

~'"

v. : -.':

Figur a 15. Deta lle del co nducto coclea r

vian a y delga da n o acnia mecan icamente sobre el movi miento de los fluidos
cocleares. Su funci6n principal es la de sep arar la endo linfa de la perilinfa
para ma n ten er una diferencia de potencial e lectrico de un os 80 mV en tre
am bos medios.
La membrana basilar es un a membrana elastic a en la que se ubica el or
gano de Corti, Posee alrededor de 3.500 celulas ciliadas intemas dispuestas en
una fila y de tres a cinco filas con apro xim adamente 25 .000 celulas ciliadas ex
ternas en cada oido. Tal como ver em os, las celul as internas son aferentes -en
vlan informa ci6n al cerebra a trav es del nervio aud itivo- y las celulas externas
son efere n tes -reciben impulsos nerviosos desd e el ce rebra. La membrana tee
t6rea cubre las estereoc ilias de las ce lulas c iliadas ayudando a su excitacion
rnecanica. En la Figura 16 se puede ve r una image n del organo de C orti torna
da co n un microscopic elec tr6nico de barri do ,

6 rgano de Corti
El ogano de Cort i es una co mpleja estruc tura co rnpuesta, en tre o tros elem en
tos, por ce lulas nervi osas tran sductoras, ce lulas de sopo rte y fibras ner viosas.
33

pi

II

I~

Hendidura
de Hensen

Zo na limbica

Figu ra 16. Im agen del 6 rgan o de Co rti tornad a ca n un mi croscop ic elcc t ron ico de barrido.
I , Z y 3: ce lulas ciliadas exre rn as; eel: celulas c iliadas intern as; TC: run el de Cort i;
~ 1I1 : mem bran a basilar

Las celulas ciliadas son ne uro nas alta rnente especi a lizadas y se d isponen
en dos arcos separ ados po r el t un e] de C orti. En el arco exterio r se agrupa n
un as 25.000 ce lulas ci liadas externas , ca da un a con ce rca de 140 est ereocili as
in terconectad as En el otro arco h ay ce rca de 3.500 celulas c iliada s in te rrias,
cada un a con alrededo r de 40 estereo cilias in te rco nectadas. La membran a tee
tor ea c ubre las celulas de Cort i )' se sabe q ue en tra en co n rac to co n las este
reoc ilias de las ce lulas exte rn as, pero ac t ualmen te se d iscute si tambien lo
h ace co n las de las ce lulas in ter n as.
Las celulas de sopo rte proveen apo yo estructural y me tab oli co a las celu
las ciliadas, Se pueden d ividir en dos grupos : el de las ce lulas con filarne n tos
y rn icr o nibu los q ue co n t ro lan la rigide z de la me mbran a basilar y q ue son en
parte respon sables de la d istr ibuc ion espacial de la frecu enc ia de reson anc ia a
10 largo de la membrana; y el de las ce lu las q ue poseen o rgan ulos ca paces de
sin tetizar las prot ein as y de t rans po rtar los ion es n ecesa rios para el me tabolis
mo del organa de C o rt i.
El o rgan a de Cort i se vinc ula con el sist ema nervioso ce nt ral por med io
de dos t ipos de fibr as nerv iosas: las aferentes lle van informacion desde el o ldo
inte rn o h aci a el ce re bra y las eferentes 10 h acen en el sen t ido co n tra rio,
desd e el ce re bra h aci a el o ido inte rne. Exi st en dos tipos de fibr as afere n tes .
Las del t ipo I co ns t ituye n el 95% del to ta l y contac tan uni carnente a las ce lu
las ciliadas interri as, mientras qu e las del ti po II - el 5% rest ante- se co nec tan

34

Zona media

Zona marginal

Fi gur a 17 . Celulas senso riales y de sopo rte e n el 6 rgano de Cort i. A: pilares internes;
E: pil ares ext ern os

con las celulas ciliadas externa s. Cada celula intern a se co m unica co n alrede
dor de 20 n eu ronas afe ren tes de tip o I y cada ne urona aferen te de tip o II sc re
parte entre va rias ce lulas ciliadas cxte rnas, En ca rnb io, las fibras eferen tes qlll
par ten del ce reb ra se co ne ct an solo co n las celulas ci liadas ex ternas , aun qu e
algunos in vest igador es supo n en q ue plied en turnbien ac tua r, aunque inclirec
tarnen te, sobre las ce lulas internas.
El punto de co n tac to a tr aves del cual la informacio n pasa de un a n eur o
n a a o tra se denom in a sina psis, La sinapsis ent re un a ce lula ciliada y un a fibr a
afe ren te se ca rac te riza por un ade lgazarn ie n to de la mem brana celular Y la pre
sencia de pequefias vesicu las en la celula c iliada q ue co n tiene n las susta nc ias
q ufm icas ne cesari as para tran smitir la serial. Por el co n t ra rio , en la sinap sis en
tr e un a fib ra eferen te y un a ce lula ciliada las ves iculas se en cuen t ran en la fi
bra tr ansm isor a.

Celulas ciliadas
Existe n dos clases pri ncipales de ce lulas c iliadas , las in te mas y las externas,
q ue difieren notablernente e n tre sf. Las ce lulas c iliadas internas ticn en forma
globular ca n el nu cleo ubi cado en el centra y es tan sopo rt adas lateralmen te
por ce lulas de soste n , La parte in fe rio r de cada celula interna esta en co n tac
to directo ca n las fibras ne rv iosas q ue se proyect an hacia el sistema n er vioso

35

Endolin fa

Fibras eferentes

Perilinfa

Ficura J8 . C elulas ctliadas m ternas y externas

ce ntral. C o mo las fibras aferentes q ue parten de las celulas in tc rnus fo rman el


95 % de las fibras afere ntes del ne rvio a ud irivo , se supo ne que est as acui a n co
mo los recep tores pr imarios de la c6 clea al converti r los mo vim ien tos mcc ri
nicos e n impul sos n eurales. Las fibras eferen res, q ue llevan informacion desde
el ce reb ro hac ia el organo de C o rt i, esta n en co n ta c to con las fibras nfere n rcs
pe ro n o co n las ce lulas ciliadas int ern as.
Las ce lulas c iliada s ex te rn as son largas V de fo rma cilfndrica, con el rni
cl eo situ ad o en su parte infer ior. Mas de cu at ro veces mas n urner osa s 4 11 C las
celu las in ternas, fo rman de tres a c inc o filas a 10 largo de la mem bra na basilar.
Se hallan en con tac ro d irecto tan to co n fibras aferen res como eferen tcs. Du
rante la esti mu lac ion co n tension elec trica , las ce lulas ex te rn as se ac o rtan y
alargan a un a frec uencia esrable. A ra iz de esta capac ida d motora sc h a sugc
rido qu e so n las responsab les de los procesos co clea res ac t ive s, qu e inc luycn la
ca pacidad de sint onia de ban da angos ra V la generac i6n de cmis iones otoac iis
t icas. C omo exis te n ce rca de 1.800 fibras n erviosas eferente s qu e lle vun in for
mac i6 n hacia la coc lea desde el co mp lejo o livar superior, se suponc q ue e n las
primeras e tapas del ana lisis audit ivo perifer ico ac t uan centros elevad os de pro
cesam ien ro V cont ro l.

Proceso de transducci6n en las celulas ciliadas intemas

Figura 19 . Trcs mas de ce lulas c iliadas ex ternas tornadas con un microscopio clectron ico

d<: barrido

36

La peri linfa, rica e n sod io, es similar a los fluid os q ue oc upan c l espac io exte
rior a las cel ulas del orga n isrno , rnientras q ue la endolinfa, con un a gra n co n
centrac i6n de potasio, se ase meja al medio llquido interior de las celulas, Dada
su ubicaci6 n en la membra na basila r, las ce lulas del 6 rgano de C urt i esnin ex
pues tas a la en dolin fa en su parte supe rior V a la peril infa e n la in fe rio r, co n
un a difer enc ia de po ten cial de alred edo r de 80 mVe nt re a mb os ext re mos. Du
rante la esrim ulac ion ac ust ica el mov irniento de la membrana basila r se t ran s
m ite a traves de diferente s clases de ce lulas de sopo rte, en uni o n solida ria co n
las celulas sen soriales. Las este reoc ilias de estas ultim as se mueve n cn t re la
membran a bas ilar V la masa gelat inosa de la membrana tec tore a, cxc itando
mecanicarnente las ce lulas ci liadas e inic ian do el proceso de rran sd ucc io n en
tre vibrac i6 n e impu lso nervioso.
Todas las este reoc ilias d e un a ce lula estrin uni das e n tre sf. Se supon c q ue .
co mo est as son n gid as V pivo ta n sobre SLl base, el rno vim ien to ell una d irec
ci6n abr e canales se lec tivos de ion es a traves de los qu e fluyen iones de pour
sio hacia el in teri or V la celula se despolariza. La corr iente ioni ca, qu e fluve
de sde la escoui media hacia e l in te rior de las cel ulas ciliadas in rernas, esr;i 111 0
du lad a por la deflexi6n de l haz de este reoc ilias en rel ac i6 n co n un cje de ma
xi ma sensib ilid ad.

37

Excitacion

lnhibicion

Figur a 20. Deflexion de la estc rcocilias en una ccl ula ciliada int ern a

Los rnov imie nt os en d irecci6n de la fila mas alta pro vocan un aume n to
en la conductancia del sistema y los qu e van en sen t ido co ntrario la dismi n u
yen, mientras q ue los movi mient os or togo na les al eje no la alte ran . La eo
rricnte ionica esta constituida pr inc ipa lmente por iones positiv os de pot asio
(K +) pues su concentracion en la endo linfa de la scala media es mu y alta. La
transd ucci on en las ce lulas c iliadas es no lineal. Los desp lazarnien tos sirnetri
cos del h az de este reocilias desde la posicion de rep oso , de la misma rnagn itud
pcro en sentidos opuestos , gen eran cambios de oonduc ta nc ia asirnetricos .
Inrned iat aruente despues de un disparo la celula c iliada inte rna en tra en
un estado refractario, en el eua l se rea justa quimicamente, de una durac ion
apr ox irnada de 1 rns. N o podra disparar nuevamente h asra h aberlo supera do .
En la figur a 21 se pued e ap reciar el co rnpo rtamiento temporal de un a celula
de Cort i durante un disp aro .

El pe rfodo refracrario de una celula es muy grande en relaci on co n los pe


riodos caractertst icos de las seria les ac usticas: un a sola ce lula es incapaz de
eap turar la variacion temporal, pu es no puede seguir con suficiente velo cid ad
sus ascensos y caldas, S in embargo, las celulas c iliadas in ternas pu eden respon
der ante ciertos va lores de la forma de ond a de l est frnulo. S i varias ce lulas d is
paran ante la misrna sefial a d iferen tes niveles 0 fases, el con jun to de la
infor macion pe rrni te reconstruir la for ma de onda origina l aunque esta posea
un a frec uencia mu y elevad a.
La infor macion de fase del estimulo rarnbi en es codificada en el pa tron
te mpor al de di sparo de las ce lulas c iliadas in tern as, Los in tervalos entre dispa
ros son, apr oxirnadamente, mu ltip los enrerosdel periodo del estimulo. U na
celula aislada no d ispara ne cesar iarnen re en cada ciel o del estf mulo pero,
cu an do oc urre, 10 h ace siemp re a la misma fase de la forma de onda. El patron
temporal de d ispa ro de un grupo de ne uronas con tie ne in for maci on cla ra so
bre el perfodo de l esti mu lo porque ex iste siempre algun d isparo en cada cic lo
del mismo. En la figura 22 se ve que el interva lo entre disparos es siempre un
multiple entero de l perf od o de la serial de en trada .
La sen sib ilidad a la fase desapare ce por enci ma de 5 kHz. El lfrnite supe
rior no est a de te rm inado por la rasa maxim a de d isparo de las neuronas, sino
po r la prec ision co n que el imp ulso ne rv ioso "enga nc h a" una fase part icul ar
del esnrn ulo . A 5 kH z la vari abilidad estocas tica de eng anche es comparable
co n el perfodo de la onda.

120

50

.z

--,----

-----,

120

B
850 Hz
178/5

f 20

60

60

60

C
1.000 Hz
182/5

11

.----- . . -. -- - Nivel del pica

. . .

</)

oI

II

iii
~

ro

c:

10

15

20

0
0

Q)

10

15

20

10

15

20

-~
Q)

ro

'13 -50
cQ)

e 120

Potencial postsin apfic o


excitatorio

Q)

120

'J

o
a.

1.500 Hz
234/5

-40 -30

E K+

-20

-10

Tlernpo (ms)

Figu ra 2 1. Diferenc ia relati va de pot en cial entre el int erior y el exterior de una neuron a
especializada ante un pot en cia l de accion variable

10

60 ~

60

100

38

40 6 Hz
72/5

E NA++
. ... .

>
-S

r'- --

15

20

120

2 .000 Hz
178 /5

F
2 .300 Hz
83 /5

60

o~
0

10

01. ...
0

I t . . . . . . ,,Ia

.
10

Duracion del interva le (ms)

Figura 22. Int ervalos int erdisparo para una neurona aud itiva ant e estfrnulos de diferent es
frecuen cias

39

Mu chos in vest igador es ace p ta n q ue n uest ra habilidad par a localizar sorii


d os dep ende en pa rte de la co m pa rac ion d e la info rm aci on te mpo ra l de lo s dos
oidos: pero la rel evanci a de la informaci on tempor al en e l enrn ascaramien to y
e n la pe rcepci o n de la a lt ura to n a l es tod avia de batida aca lo rada mente , tal co
mo verernos mas adelanto.

Sinapsis
dendrita-dend rita

Proceso de transducci6n en ws celuws ciuoaos extemas


En L98 3 Bro wn e ll d escubrio q ue las ce lulas c ilia das exte rn as a islad as p ued en
ca rnb iar de lon gi tud ante un ca m bia en el potencial e lec trico d e po la rizac ion
(Brow ne ll, W . E., L985 ). A pes ar de que e l mecan isme n o se con oce en de ta
lle , se supone qu e e l est imulo efectivo 10 provee una va riaci on en e l po tenc ia l
en la mem brana ce lular y no , co mo en el caso de las ce lu las c iliadas in ternas,
un a corriente io riica. El ca rnb io de longitud to ta l se logra sumando los ca m
bios geomet ric os d e gran cantidad de estructuras senso rno ro ras ind epend ien
tes a lojada s e n e l p lasma de la membrana celu lar. La mem brana de las celulas
c iliada s ext ern as posee gra n cant ida d de mitocondrias adyace n tes q ue le per
m iten transfor ma r las mo lec ules orga n icas par a o btener la en e rgfa necesa ria de
acuc rdo a l c iclo de Krebs.
Las ce lulas ciliadas externa s ac tuan como pequefios mu scul os q ue agrega n
e ne rg fa rnecani ca a la o nda progresiva en la membrana basila r. S e cree q ue la
(race ion de ene rg fa agrega da p uede ser controlada por los ce ntros elevados de
procesam ienro a t roves de la informaci on qu e v iaja por las fibras efe re n tes de l
n er vio auditive . Acnian co mo un a "resistenc ia negati va" qu e co rnpensa la
ene rz fa pcrdida e n e l proceso de vib rac io n , Este co ntro l de gan an cia tam bien
pu cd e redu cir la respu cst a ante est irnu los muy interisos, y ac tua co n mu cha
ma yor velocidad qu e e l reflej o del mus cu lo estap edia l. La reali mc n tac ion po
sit iva q ue tiene lugar per m ite so rrea r las limirac iones prop ias de un siste ma pa
sivo irnpuestas pa r e l principio de ind et er rninacion acustico?
Las ce lulas c iliadas ex ternas afectan la t ransdu cc i6n de las celulas c iliadas in
tern as prin cip a lrnente a traves de la vibracion inducida de la membrana basilar.

C aracteristicus del nervi o audit ivo


El ner vio a ud it ive se d ivid e en dos rarnas ana to rn ica y fisiol ogicamen te di fer en
res, la rarn a ve st ib ular -0 ner vio de l eq uili brio- y la rarna coc lear. Esta forma
do principa lrnente por los axo n es de las neu ronas conectada s co n las ce lulas del
6rga no de Cort i. C omo la resistencia e lec tri ca a 10 la rgo de l eje es m uv grande
; !\ Igo similar oc urre cuando un percusion isra "apaua" e l son ido de un rimbal.

40

... ... ...

Sodio (Na++L.......... .

.~
.'

+++ +"+"+ + + + - - - - + + + + + +
- - - - - - - - - + ++++ -- - -_ "':
~~l~~~~~

I I

Direcci6n del impulsa

r--- Interior de l ax6n

_-_-+-+_-_-_..L- _ -+++T :!:.f+ + - ':t--:--=-L-- Me mbrana celular


+++++++++ - - - - - ++++++

Media externa

Pasajes de iones par co ncentracion y par gradiente etectrico

Fi gur a 23 . Neurona tfpica y rran smision de un poten cial de accion en e l axon de una
neu rona

y la resistenci a elec trica de la membrana ce lula r muy peque fia, resu lt a un co n


du ctor electrico ineficiente. En consec uenc ia, la ca rga positiva in yectada en el
ax on se d isipa tras un o 0 dos m ilfrnetros de reco rr ido . Par a qu e la sefial recorra
distan cias rnayores es necesario rege ner ar frecue n rerne n te el pot encial de ac
cio n a 10 largo de l ca m ino a pa rt i. r del int ercambio ionico. Asi, la inform acion
via ja a 10 largo de los axo nes en forma de breves irn p ulsos elect ricos q ue son el
resu ltado del desplazarnien to a t ra ves de la membrana cel ular de iones de sod io
dotad os de carga positiva. En la figura 23 se puede observa r un esquema del pro
ces o de transmision .
Un pulso nervioso qu e v iaja por un axon es po te nciado cada tanto a traves
de d iscontin uidades en las vaina s mie lin icas llarnados nodules de Ranv ier. La ne
cesidad de reforzar repetidam ente la corrien te elec tr ica lirnita la velocida d max i
ma de v iaje de los impu lses. Pa ra ax ones de 2 rnrn de d iarnetro la veloe idad de
co nducc ion es de 10 mis, mientras qu e pa ra ax ones de 20 m m llega a los 120 m/s.6

Le to rna ce rca de un qui nt o de segund o a un men saje llegar desde La cabeza de un orga
nism hasta sus pies -en un pasaje rapido este debe corn pensar este retardo md icandole a sus
pies que ha cer ant es qu e suen e la nota .

41

4. TEORfA DEL LUGAR

cia mecanica de 10. membrana basilar. Recordemos que, para un sistema discre
to, 10. frecuencia de resonancia fR depende directamente de dichos parametres a
partir de 10. relacion i =1/jJr;;, en 10. que k representa 10. rigidez y m 10. mas a del
sistema. La variacion de 10. elasticidad en funcion de 10. posicion, en una razon
de 1: 100 entre ambos extremos, es 10. principal caracterfstica ffsica que expli
co. el mapeo frecuencia-espacio que tiene lugar en 10. coclea. La estructura del
organa de Corti, a su vez, cambia continuarnente a 10 largo de su desarrollo.
Cerca del apex, en 10. zona sensible a las bajas frecuencias, las celulas son mas
grandes y las estereocilias mas largas que en 10. region cercana a 10. base, sensi
ble a las altas frecuencias.
Si el estribo empuja muy lentarnente a 10. ventana oval, to. perilinfa paso.
a traves del helicotrema y el volumen total de lfquido permanece constante 0.1
desplazarse hacia fuera 10. ventana redonda. Pero si empuja rapidamente a 10.
ventana oval, la deflexion en 10. membrana basilar compensa el cambio de vo
lumen y no existe flujo a traves del helicotrema. En esencia, una onda de una
frecuencia definida no puede viajar mas alia de un determinado "punto de cor
te" en 10. coclea. A medida que se aproxima a ese punto, 10. onda progresi va se
hace mas lenta, 10. amplitud aumenta y su energfa es absorb ida por el movi
miento de 10. membrana basilar. En 10. Figura 24 se aprecia una onda progresi
va en 10. membrana basilar generada por un estfmulo sinusoidal de 200 Hz.
EI gradiente espacial que define el comportamiento tonotopico de 10. mem
brana basilar se manifiesta tarnbien en 10. pendiente de 10. onda progresiva.
Se puede pensar en 10. membrana basilar como un filtro en el cual la res
puesta maxima ante una serial sinusoidal se mu cve hacia el extrema apical a

Como los pulsos nerviosos que nacen en las celulas ciliadas internas no son 10
suficientemente rapidos como para seguir 10. forma de onda exacta de una se
fial acustica (las ventanas que definen poseen anchos de banda limitados), de
ben existir necesariamente otros mecanismos que permitan codificar dichas
sefiales. De todos los propuestos se destacan 10. teorfa del lugar y las teorfas
temporales. Desarrollaremos aquf la primera de elias y estudiaremos las teorias
temporales en el capftulo dedicado a la altura tonal.
El descubrimiento de la mecanica de la membrana basilar, fundamento de
10. teorfa dellugar -0 teorfa tonotopica-, se debe a Georg Von Bekesy (Bekesy,
G. Von, 1960). Su magntfico trabajo, que le valio el Premio Nobel de Fisiolo
gfa y Medicina en el afio 1961, es el fundamento de casi todas las investiga
ciones posteriores sobre la fisiologfa de la audicion. La teorfa dellugar postula
que cada punto de la membrana basilar vibra a una frecuencia particular, las
mas agudas en la zona cercana a 10. base de la coclea y las mas graves en 10. re
gion proxima al apex, en una especie de mapeo frecuencia-espacio."
Cuando vibra el estribo, la onda generada en 10. ventana oval se propago.
rapidamente por el fluido coclear y liego. al apex en apenas unos microsegun
dos, Pero tarnbien se propaga transversalmente a 10 largo de la membrana ba
silar con una velocidad mucho menor, recorriendo su extension en algunos
milisegundos. La velocidad de propagacion en 10. membrana basilar no es uni
forme y varfa en funcion de la distancia a la base de la coclea. Cerca de 10. ven
tana oval la velocidad es rapida y la longitud de onda comparativarnente
grande. En el apex, por el contrario, la velocidad y 10. longitud de onda son
mucho menores. La velocidad finita de la onda progresiva implica un retardo
acumulado en funcion de la distancia desde el estribo que produce un corri
miento de fase, tambien acumulativo, de gran importancia en algunos proce
sos de transduccion coclear.
Esta caracterfstica mecanica de la membrana basilar se debe a que funcio
no. como una estructura de soporte con parametres que se modifican gradual
mente a lo largo de su extension. Es mas angosta, gruesa y rfgida en su base y
deviene progresivamente mas ancha, delgada y elastica a medida que se acer
co. a su extrema apical. La rigidez aumenta progresivamente hacia la base de
10. coclea, mientras que su masa decrece en 10. misma direccion. Este gradien
te de rigidez y masa permite la variacion gradual de la frecuencia de resonan

....

................

LJ

:::J

~
Q.

"

'"

'

I
,
I"

/
20

22

24

26

28

.....

....

30

32

Distancia desde el estribo (mm)

En el teclado de un piano se realiza un mapeo espacio-frecuencia. cada punto del espacio


-eada tecla- corresponde a una frecuencia diferente. En esta analogfa la membrana basilar
vendna a ser una especie de anti-piano.
7

Figura 24. Dos instantes diferentes de una onda progresiva generada por una excitacion
sinusoidal de 200 Hz

42

43
liiio......

11 kHz

medida que la frecuencia disminuye. En otras palabras, existe una conversion


frecuencia-espacio, tal como se aprecia en la figura 25.
Al margen de la frecuencia del estimulo, la forma de la envoivente tem
poral de la vibracion en cada punto de la membrana basilar sigue isomorfica
mente la de la vibracion en la ventana oval. Ante estimulos sinusoidales toda
la membrana basilar vibra de manera aproximadarnente sinusoidal, a la fre
cuencia de la serial de entrada. Por ejernplo, si se aplica una sinusoide de 1.000
Hz, cada punta de la membrana que se mueve 10 hace a esa frecuencia, con un
desplazamiento maximo en el punto de resonancia correspondiente a 1.000 Hz.
EI patron de vibracion de la membrana basilar no depende del punto so
bre el cual se localiza la excitacion: vibraciones que llegan a la coclea desde
los huesos de la cabeza gene ran respuestas similares a las que provienen de la
ventana oval.

2 kHz

Base

200 Hz

500 Hz

10

20

30

Apex

Distancia a la base (mm)

Figura 25. Resonancia de la membrana basilar en funci6n de la frecuencia


y de la distancia a la base de la c6dea

Retardo
acustico

Excitaci6n de la membrana basilar can un impulso

Cuando se aplica un impulso al estribo aparece una perturbacion cerca de la


ventana oval que se propaga la 10 largo de toda la membrana basilar. Cada
punto de la membrana se cornporta como un filtro de banda pasante cuya tre
cuencia central corresponde a la frecuencia de resonancia caracteristica en ese
punta. La forma de onda y el espectro varian continuamente con la posici6n,
hecho que afecta nuestra habilidad para discrirninar sonidos de caracter tran
sitorio.f En la figura 26 se puede ver la respuesta al impulso en un punto par
ticular de la membrana basilar.
A su vez, la respuesta ante un clic de las celulas internas en un punto de
terminado de la membrana basilar se puede ver en la figura 27.
Los picos multiples aparecen debido a las oscilaciones atenuadas del filtro
basilar correspondiente: el intervale temporal entre picos es el inverso de la
frecuencia caracteristica de la zona de la membrana basilar. Si la polaridad del
clic se invierte, el patron se desplaza en el tiempo de modo que los picos apa
recen donde antes se localizaban los valles, efecto muy importante a la hora
de localizar espacialmente una fuente acustica.
Estos hechos tarnbien se relacionan con la percepci6n de seriales periodi
cas. Javel mostr6 que una porci6n de la actividad de las celulas ciliadas inter
nas que responde a los arrnonicos de una sefial periodica es sensible a la fase
de repeticion de la onda cornpleta, que coincide con la fundamental de Fou
rier de la serial (Javel, E., 1980).

OJ

E
~

C1l

IS.
<f)

OJ

1\

A"
VVVV

0,1 0,2 0,3

0,4 0,5

0,6 0,7 0,8 0,9 1,0

Tiempo (ms)

Figura 26. Respuesta mecanica ante un impulse del punto de ta membrana basilar
correspondiente a una frecuencia de resonancia de lO.OCO Hz
256

C1l

>

192

Q)

~ 128
C1l

u
"OJ

2
c

64

Tiernpo de respuesta (ms)

8 El cornportarnienro de la membrana basilar en este caso es similar al definido por la tram


fomw.da wavelet (Basso, G., 2001a).

Figura 27. Histograma posesnrnulo en un punta de la MB ante un clic

44

45
.........

5. COMPORTAMIENTO A CTIVO DE LA

alinea lidad co clear se ve rifica al excitar un otdo co n dos sin uso ides de frecuen
c ias fl y fz. El eco coclear qu e apa rece co inc ide en frecuencia co n e l soni do de
combinac i6n princ ipal 2fl - fz. Este resultado pru eba la d istorsi6n arm6 n ica 0
alineal q ue ac nia durante e l proc eso de tran sducci6n (Basso, G., 2001 a) .
La alinealidad oc urre princ ipa lmente en los lugar es de la membrana basi
lar pr 6x imos a la frecu enci a de resonanc ia co rrespo nd iente. En un cadaver la
respuest a es siempre lin eal, ta l co mo consrato Von Bekesv en sus experirne n
tos, ya que desapa recen los proce sos ce lula res ac t ivos apo rtados fun dame ntal
me nte par la motricid ad de las ce lulas c iliadas ex rern as. La a lin eal ida d se
pierde co n el dana fisiologico y co n la rnuerte: los ecos cocleares solo se o b
ser van en suje tos en bue na co n dicio n fisiologica, Estan relac ionad os con pro
ce sos vu lnerab les y las h ipoacu sias te rnporarias 0 perrnan en tes, c iertas d rogas
y otros tr astornos fisio logicos los in hibe n .
En aprox imad am ente e130 0/0 de las personas apa rece n em isione s otoac us
ti cas espo n taneas , que suce den en ause nc ia de est irnulos ac ust icos ex te m os.
Los tinnitus 0 acasieros so n, e n ese nc ia, em isio nes o to ac iist icas espontaneas.

MEMBRANA BASILAR

Y EMISIONES OTOACUSTICAS

D e ac ue rdo co n la teor ia dellugar clasica, tal como la enunc i6 Von Bek esy, la
membra na bas ilar ac nia co mo un an a lizado r lineal de Fourier co n un poder de
resoluci6n in sufic ien te par a exp licar la reso luci6 n en frecu en cia del o ido hu
rnano. En o tras palab ras, e l anc ho de banda de la resonanc ia de la membrana
es muc ho mayor q ue el que se rnide en los expe rime ntos psicoacu st icos. Pa r
ejemplo, de ac ue rdo can la teorf a delluga r clasica , a l exci tar la mem brana ba
sila r a un a frecu enci a ce ntra l de 1.000 H z ap arece una banda de 100 H z de ex
ten sion, cie n veces mas gra nde q ue la reso luc ion re al, q ue es del o rden de 1
H z pa ra d icha frecuencia centra l. La causa de es ta enorme discrep anci a es, 10
sa be mos aha ra, la existenc ia de un me canismo ac tivo e n e l o rgana de Co rt i
q ue Von Bekesy, a l tr ab aja r exc lusivam en te can ca daveres , no pudo descubr ir,
En 197 8 Kemp enconrro que al estimular el timpano de un ind ivid uo vi
vo can un impul so de baja intensidad se dete ct a un eco ge ne rado en e l inte
rior del ofdo (Kemp, D . T., 197 8 ). C omo esras se riales poseen un re rardo
comprend ido entre 5 y 60 ms se sugiri6 que tenian un o rigen co clea r. Ac tual
me nte se las co noce co mo ecos co cl eares, ecos de Kem p a em isio nes oroaciis
t icas evocada s. El nivel re la tive de la reflex ion es mayor a menores n ivel es de
excitaci6n, 10 q ue revela una o peraci6n n o lineal. En ocas iones, la energia re
flejada supe ra a la en ergfa in c idente eviden ciando un proceso activo de am
plificac ion biologica. Las e m isio nes otoacu sti cas provienen de la ac t iv ida d
morora de las ce lulas c iliadas ex te m as.
El descu brimi ento de Ke mp mo d ifico profundarnente el co noc imie nto
qu e ten em os sobre la fisio logfa del o fdo. Los proce sos cocl eares ac tivos posibi
lit an la sin to n ia de banda angos ta que se ob ser van en las ex pe rienc ias psicoa
custicas y q ue las teorias an terio res basa das en el ofdo como un receptor pas ivo
-corno la teo ria c lasica de l lugar-, no pod ian explicar. El co mpo rta m ien to ac
tiv o de l oido interno permite su aso mbrosa resolu c ion e n frecu enci a, su gran
se nsibilida d ante es timulos debiles y explica el efec to de supres i6n de un to no
po r otro, temas que desa rro llaremos ma s ade la nte.
La ac rividad co clear pued e e n te nderse tarnbien co mo un a relacion alineal
entre las sefia les mccan icas de en tr ada y salid a. Numerosos trabajos en indi vi
du os vivos han demostrado que la resp uesta de la membrana basi lar es a lin ea l,
es decir que la salida no responde proparc ionalmente a la entrad a. A ni vc lcs
de serial de e n trada po r debajo de 60 dB, un mecanismo bio logico ac t ivo a m
plifica la respuesta coclea r. A med ida q ue el n ivel crece la arnplificacion d ismi
nuy e y, para altos n ive les en la sefial de ent rada, ce rca nos a 90 dB, e l
mecanismo ac tivo deja de o pe rar y e l sistema deviene linea l. U na pru eb a de la

6. FUN CIONES DE T RANSFERENCI A

DEL SISTEMA AUD lTlVO PERIFERICO

Es posible re un ir to da la informaci6n descripta has ta ahora para ana lizar co


mo el siste ma aud itive periferico rnodifica las sefiales ac usticas que llegan a ca
da o ido . El resultad o fin al es la funci6n de transieiencia del sistema auditioo
periferico, q ue rela c iona la pr esi6 n ac ust ica de la fuente ex terio r p(t) con la vi
br acion que llega h asra la membran a basilar S(t) .
S i hd Y ~ son las se fialcs ac usticas a la en trada de los pa be llo nes aud itivos
derecho e izq uierdo y &1(t) y gj( t) las respu estas a l impulse del espac io ac usti
co entre la fuente y las dos entradas aud it ivas, hd y hi se pue den ob tener de las
expresiones que siguen (el sfrnbolo * de nota co nvo luc ion ):

hd(t ) = p(t) * gd( t)


p(t) * g;(t)

~ (t) =

U na parte de las respu est as gd (t) Ygi ( r) esta dad a por las ca racterist icas del am
biente ac ust ico ext er ior y o t ra part e po r las fun ciones de transfere n c ia defini
das por los hombros, la forma y tam an o de la ca beza y e l pabellon auric ular.
Los efectos de esras piezas ana rornicas se v ue lve n sign ifica rivos c ua ndo las lon
gitudes de on da so n co mpa rab les con sus di mensiones a causa del fenomen o
de difraccio n , tal co mo ve remos e n c l ca p itulo VII. Pa ra sirnplificar la ex pos i
c ion, obv iare mos d esde aq ui las diferenc ias en tre los o fdos derecho e izquier - .

47

46

........

20

do y uti lizare rnos la tra nsfo rmada de Fourier H (w) para sirnbo lizar la respues
ta espec tra l de la entrada aud itiva h(t) .
En el trayecto del estimu lo interv ierie a con tinuacion la funci 6n de trans
ferencia de l canal audi tivo extemo E(w ), que al cornbin arse co n H(w) modi
fica la serial de entrada de la manera que se ve en la Figura 28 .
En seguid a aparece la acci6n del sistema de pal an cas y filtros del o fdo me
d io, cuya funci6n de tran sferen cia promedio, C(w ), se aprecia en la Figura 29.
Si se co rnbin an las tres funciones de transferen cia an teriores se obtien e la
func i6n de transferenc ia total entre la Fuente ac ust ica y la entrad a de la coclea
S(W) :9
S(w) = H(w ) (W ) C( W)

til

:s.

'S'

I A mplitud

10

O r.

W
"3
~ -10

-20
0,2

0,5

10

15

Frecuencia (kHz)

Figura 28. Fun cion de tran sferen c ia co mbinada H (c.o ) E(c.o )

En la Figura 30 se co m para a S(w) con la sensib il idad pro me di o d el ofdo

30

humane .
EI notable ajuste entre la func i6n S( w) co n la curva de sensibilidad de l
o fdo permite afirma r que el proceso q ue sigue luego de la llegada de la sefia l a
la membran a basilar es, al men os para in ten sidad es med ias, esencialment e li
neal. Risset afirma: "En un articulo te6ri co , Yang, Wa n g y S hamma ( 1992 ) de
mostr aron q ue un modelo fisiologico pla usible de la periferia a ud itiva pu ede
ser in vertido y usado para regener ar I.a entrada or igin al cornpl et amente . Este
resultado sugiere que el siste ma aud itivo n o pierde informacion acu st ica en las
eta pas ternpra n as de l proceso" (en Deutsch, D., 1999) .

20 f.._...._ ..j

'S'

g:
~ _ _ _j ..

10

__j- - - -

f--.. .. ..1 ..1

o
0,2

0.5

10

2
Frecuencia (kHz)

Figura 29. Fun cion de tran sferen c ia del oido medic C(c.o)

7. R ESPLJ ESTAS NEURALES A ALTOS NIVELES EN ELSiSTEMA AUDlTIVO


Existe eviden ci a de que co nc urre n grupos de detectores neurales alta rnen te es
pe ci.alizados en los niveles supe riores del sistema aud itivo. Aparentem ente , en
la corteza cere bra l se an aliza algo mas que la frecuen cia 0 la intensidad de las
sefial es que le llegan . A lgun as ne uro nas corti cales parecen responder d irec ta
mente a los tr an sitori os de la seria l de entrada; ot ras reaccion an ante cambio s
uni d irecc ionales de frecuenc ia (se las denornina "freque nc y sweep detectors"
en la literat ura especializada): ot ras son sensi bles a la tasa de mod ulaci 6n (irn
portan te qu iza para la in teli gib ilidad del h abl a ): ot ras a los da tos necesarios
para la localizacion espac ial, et ce te ra. La mayor fa de los invest igadores op ina
que la tonotopia de la mem brana basilar llega hasta el cerebro , pero no cree
qu e la relaci 6n isornorfi ca se co nserve plena rnente y prop one un mapeo rnul

'0

'0

(jj
'0

is
<I>
E

o-..
;=::3 I~I
"' -'"

1[

I:..~:.:.:~ . .__.. . . . ._

Q.

...

,.10 dB

L'0,2

_.--/

.-

'0

ro
~
:0

'in

..

<I>

0,5

en
I

10

Frecuencia (kHz)

Figura 30. Fun ci6n de tran sferencia ent re el campo externo y la coclea S(c.o) (puntas)
co mparada con la sens ib ilida d prornedi o de l oido h urnano ([(nea)

9 La relacion expuesta es val ida solo para Fuentes acusticas loca lizadas frent e al oyen re. En
el ca pitulo VII sc analizara el caso general.

48

49

..........

Hemisferio
izquierdo

dB
o

0....

21

-40

<:

'.

'~.?

...~.....
'.,

,
-60

'0
"

-80

6
6

9
9

<1..

4......

'Q,

'q
. ~.\'

6
6

?
9

.dJ

~
,

'\

r-,

"'f

Hemisferio
derecho

I:,

-100
0,1

0,2

0,5

10

20

50

Frecuencia (kHz)

... :

. . ( .0
..
. . . : 0
0..-....
::

Figura 31. Umbrales de respuesta de diferentes fibras simples ante diferentes esttrnulos
sinusoidales. La segunda pendiente es del orden de 1.000 dB/oceava

-,

tiple entre ambos sistemas. En todos los casos, el mapeo ocurre entre un siste
ma unidimensional, la coclea, y otro bidimensional, la corteza cerebral. Aun
que nos representamos al cerebro como una estructura tridimensional, quiza
sea mas cercano a la realidad pens arlo como una estructura bidimensional -la
materia gris- plegada en numerosas convoluciones.
Lo que sf se puede afirrnar es que la informacion acustica llega al sistema
auditivo central con un grado de detalle extremadamente fino. Por ejemplo, dis
tinguimos diferencias de apenas 10 IlS entre las sefiales que nos llegan a los dos
oidos; tornando en cuenta que la duracion de los pulsos mismos es de 100 us,
diez veces mas largos, la precision del sistema resulta poco menos que increible.
Las propiedades de respuesta en frecuencia de las celulas ciliadas internas,
asistidas por la realimentacion positiva provista por las celulas ciliadas exter
nas, se muestran en la Figura 31 para cuatro frecuencias centrales distintas. La
segunda pendiente es del orden de 1.000 dB/octava, valor consistente con
nuestra capacidad de discriminacion diferencial de aproximadamente el 0,3%
de la frecuencia central correspondiente.
Se define asi el maximo nivel de detalle espectral posible a la entrada del
sistema de transduccion, De acuerdo con las experiencias psicoacusticas en la
boratorio, este nivel de detalle se conserva intacto a 10 largo de toda la cade
na sensoneural.
El recorrido esquematizado de la informacion auditiva, desde que abando
na el ofdo hasta que llega a la corteza cerebral, se puede ver en la Figura 32.
Aunque el recorrido y la naturaleza de la informacion acustica distan de ser

Oido izquierdo

Nucleos
cocleares
venlrales

Nucleos
cocleares
dorsales

Oido derecho

Figura 32. Recorrido esquernatico del flujo de informacion entre el oido extemo
y la corteza cerebral

comprendidos en profundidad, algunos autores han aplicado esquemas similares


al anterior para crear modelos completos de percepcion auditiva. Por ejemplo,
Yoichi Ando postula un modelo en el que aparece un mecanismo precortical de
extraccion de la autocorrelacion de las sefiales, una posterior correlacion cruza
da interaural entre las vias derecha e izquierda y la especializacion de los hem is
ferios cerebrales para el proceso de factores espaciales 0 temporales. En la Figura
33 se puede ver un grafico del modelo de Yoichi Ando (Ando, Y, 1985, 1998).
Para ciertas tareas complejas, como las involucradas en el "efecto de ca
feterfa",l0 es necesaria la interaccion de ambos hemisferios: el izquierdo -rern
poral- tiene a su cargo el procesamiento de la palabra, mientras que el derecho
-espacial- procesa la localizacion de las Fuentes. El modelo de Ando se ha em
pleado con exito en el disefio de salas para musica no amplificada.!'
10 Efecto que describe la capacidad de cornprender el habla en ambientes de gran contarni

nacion por ruido. Donald Hall 10 denornino "~ocktail party effect".

11 Por ejemplo, en el Auditorio de Kirishirna, en [apon, disenado par Yoichi Ando.

50

51

-~ ro
VI

Q)

>

:;:;

5.. .~

Capitulo II

Sonorida

~ -

a:

VI

I
~ ~

>

W :.;::;

:5~

~I

o ~

oro

'C

OJ

U '"

:~
~

'u

';:: 0
OJ C.

ro
Q..

'C E

VI

U2

OJ

c
c '"

:g
~ro ~
~

'0 ~
OJ ~

c. OJ

VI U
w
Qj

"0

(;

't:

0"0

~
~
~

~-5 ~
<3 '~~ ~

<ll

'

ro

Co
>

VI

o 0

VIC

oQ

=,-~

.~ '~.~

ro

::

~ - E ~

.J

EfJ)~

b'
~

2~
<ll '"
u~
.:J U
Z
0
U

co
C

::J

EU
VI ro

.~ ~
U

OJ
"0

OJ U

'"
:J

<{

co ro

- _.

-"0

~ co
,w
:.=

~B
co . ~

U '(3

15~

"OC

C ' ro
0;=

<ll.o

g 'O"J

"i:i

f- U

-0

OJ
'"
c. C '"

r:!

.S: ~.~
_

.0

"'C
C
'" OJ
UX
OJ
~

-0

c:

r5

;::;
00

'tJ~

ro 0

VI

...c
u

-;::;

. ",

"'

"0

-0

-9

._0

c.~

.~

.c-

ro
ro
c

;2
v
v

-0

c ~
OJ '"

OJ

VI

:J .:J

U- U

'"

52

'"
'"ro

i.I:

Es razonab le relac ionar la sono ridad - un a mag nitud perceptu al- co n la inten
sida d de la serial ffsica que la origin a. El me cani smo parece claro: un a on da
acu stica produce cierta presion d ina rnica en el aire a la entrad a del ofdo ex
terno y gene ra mov im ientos de amplit ud proporcional en el timpan o, en los
huesos del ofdo rnedi o , en la ven ta na ova l y en la membrana basilar. El movi
miento de la membran a basilar, a su vez, implica la est imulac i6n de las ce lu
las cili adas y la apa rici6n de un a cant idad de impu lsos nerviosos v iaja ndo por
el n er vio auditivo . La relaci6n ca usal intensidad [fsica ~ sonoridad se insiruia
co n apa ren te clarid ad. Pero , ies legfti mo considerar a la sonoridad com o un
rasgo autonorno, que se puede estud iar de maner a indepe n diente, sepa rada del
resto de las ca racterfsticas que definen un son ido real? Es pract icarnen te un a
pe rogrullada dec ir que todos los sonidos q ue n os resultan relevan tes esta n ca
racterizados par diferencias en la int en sidad del espec tro a 10 largo del tiern
po, pues la percepc i6n de la intensidad del est fmulo ac iistico esta presente en
todos los aspectos de la func i6n audit iva. Pero la in te nsi dad en sf misma , aun
que resulte vita l pa ra la funci6 n supe rior de extraer informac i6n de los son i
dos de l amb iente, n o es un rasgo de in ter es primar io para la aud icion.
A clarado 10 anterio r, debema s recon ocer que el est udio auto n orno de la
pe rcep ci6n de la intensidad es uno de los ternas tradi cion ales de la inv est iga
ci6n acustica y h a ge nerado gran ca n t idad de informaci6n relevante . Durante
los ultimos di ez afios se h a increme n tado notabl ernenre nuestro co noc im ien
to sobre un a de sus princ ipales carac te rfsticas, q ue es la forma en q ue el siste
ma auditivo repr esenta a cod ifica la in tensidad de las seftales ac usti cas ,
En 10 qu e sigue describ iremos el esta do actua l de los est ud ios sa bre el te
ma, tr at ando de n o perder de vista nu estro objet ivo ce ntra l - a curnplirse un os
capftulos mas ade lan te : int egrar cada un o de los rasgos en un a imagen globa l
y cornpleta del so n ido tal como efectivame n telo perci bimos.
Par el memento, podem os adopt ar la siguien te defini cion de sono rida d ,
que nos va a serv ir para co menzar su estudio . "La so no rida d es el rasgo de la

53

sensac ion aud itiva e n terrninos del c ual los soni dos puede n se r o rde na dos en
un a escala q ue se ex tiende de l silenc io a 10 muy sonoro".'
En esta defi n ic io n , la sono rida d apa rec e como un a tributo gen era l del so
n ido y se refiere , a nte tod o , a la sonoridad global de un o bje to acustico. Mas
ade lan te la arn pliaremos pa ra an alizar la sono ridad de los difer entes eleme n
tos que co mpo ne n dich os obje tos,

rftrni ca, el decibel, mucho mas adec uada para descr ib ir la relac i6n entre la
energfa de l est imulo ffsico y la sono rida d resulta nte." De aq uf se obt iene un a
de las magni tudes mas usadas en ac ust ica , el nivel de presion sonora (N PS),5 cu
ya un idad es el decibel (d ls) :

N PS = 20 loglO _P- [dB]; can Pre! = 20 J-lPa


Pre!

1. R ELACION ENTRE AM PLITUD E INTENSIDA D


En e l caso de un a onda sin uso idal, la a rnplitud no es mas q ue un a manifesta
cion de la ca n tidad de ene rgfa presente en el sistema. Como esta e ne rgfa no se
pued e med ir dir ec tarne n te y es mu y d iftcil deterrninar la a rnplitud del mov i
rniento de las molecul as, se acos tu mbra medir algun par arnetro mas acces ible.
De todos los parame tres relaciona do s con la energfa de la o nda, el mas senc i
110 de evalua r es la presion diruimica (p), que puede ser medid a e mp leando di
rect amente los m ic rofonos de presi6n clasicos, La presi6 n es un a magn itu d q ue
vincula un a fuerza con la superficie sobr e la qu e se aplica , y la un idad q ue le co
rresponde es el pascal-que eq uivale a un a fuer za de un newton aplicada sobre
un a supe rfic ie de un metro cuad rado. U n a onda acust ica q ue se propaga en el
air e esta for mada por una suces i6 n de zo nas de presion por enc ima (p posit iva)
y por debajo (p negat iva) de la presi6n atmosfe rica med ia. La presion atmos fe
rica normal, a n ivel de l mar, es de aprox imadamente 101. 300 Pa y se man t le
ne relar ivarnen te co nstan te durante intervalos de t iempo breve s. 2
D ecib eles
Se sabe q ue par a obte ne r incre mentos de sono rida d en pasos per ceptu alme n
te iguales los increme n tos en la presi6n del est imulo deben ser cad a vez rna
yores. 0, co n mayor preci si6n , para pe rcibi r un aume n to de so nor idad
co ns ta n te h ay q ue aurnen ta r el esti m ulo un po rce n ta je tam bien co nstante. A
mediad os del siglo XIX W eb er y Fec hner' condensaron marernaticam ente este
compor tam iento en dos leyes q ue pe rmi t iero n la c reac ion de un a unidad loga
) A lgunos aurores Haman "in rensidad subje tiva" a la sono ridad. Por ejernplo, vease el arti

culo de Plack y Ca rlyon en el que emplean los termi nos loudness y subjecriveintensity ( Moo

re, B., 1995).

2 Son los l.0 l3 h Pa (hecro pasca les) que informa el servicio meteorologico como presion

arrnosferica normal.

3 Ernst Heinr ich Weber (1795 -1878) y G ustav Theodor Fechner (180 1-1887), fisiologos

alemanes pioneros de la psicologia ex perime nt al y creado res de la psicofisica.

54

En esta relaci6n P es la presi6 n ac ustica en un pun to del espacio y Pre[ es una re


ferencia co n ven ciona l estandar izad a, Ha y va ries eleme ntos a destacar en esta
ec uac ion: en prime r terrn ino , el niv el compa ra dos presio nes d inarnicas entre sf,
ind icando cual de ellas es mayor y en que prop orci on . En segundo lugar, para po
der compa rar dos n iveles de presi6n en dB estes deben h aber sido to mados se
gun un a m isma presi6n de referencia (Pre!)' El estan dar in temacional estip ula
qu e la referen cia debe co inc id ir co n el umbral de aud ibilidad a 1.000 Hz, q ue
corresponde a un a presion de 20 )..l.Pa. A sf se consigue v inc ular de manera d irec
ta un a un idad ffsica, el decib el, co n un a de las principales carac ter fst icas de la
audici 6n h umana, Por ultimo, el eno rrne rango ffsico presen te en los esn mu los
aciisticos, en el que la mayor presion aud ible supera un m ille n de vece s a la me
nor, se redu ce considerablemente al ser ex presado en de cibeles. En la figura 1 se
aprec ia la relac i6n ent re la presion dinamica de la serial, expresada en pascales,
y el ni ve l de presio n so no ra en decib eles. Para q ue el lecto r pueda vincular es
tos valor es con los son idos co tid ianos, e n la c uarta co lumna se h ace referen cia
a los co n textos ac iist icos co n los q ue h ab itu alm enre se asoci an . Se o bserva qu e
el valor de 0 dB correspo nde a una presion de 20 IlPa, el umbral de aud ibilidad ,
y no a presi6n cero. Por su part e el umbral de dolor ro nda los 120 dB, aunq ue
este limit e var ia aprec iablemente segiin la sens ibilidad de cada individuo.
Potencia e intensidad aciistica
Tod a onda ac ustica nace en una fuente cuya funci6n es t ransferir ene rgfa al me
dio. La cantidad de ene rgfa (E) que en trega por unid ad de tiempo se denornina
poteneia (P) y constituye una de sus ca rac terfst icas mas importantes. La pot encia
se mide en watts (W) y se v incula co n la ene rgla a traves de la siguiente relacion:

P = !:iE /!:it
4

[W] = [loulej/[s]

U n poco mas ade lan re vamos a volver sobre este pun ro.
Ing les se 10 denomina sound pressure level (SPL).

S En

55

Presi6n dinarnica

lntensldad

20 Pa

1wlm '

-I-

120 dB

-----7 Umbral de dolor

2 Pa

lO-'wl m'

-I-

100 dB

-----7 Martillo neurnatico

200 mPa

10'" wl m'

.L

80 dB

-----7 Calle muy transitada

20 mPa

1 0~ wlm'

-I-

60 dB

-----7 Conversaci6n normal

2 mF:a

1 0~ wlm'

40 dB

-----7 Ruido de fonda

200 ~Pa

1O- 1ow !m'

20 uPa

1O-1'w!m'

-I-

[W/m 2]

1 = P I A

Situaciones tlpicas

Nivei de presi6n sonora

Es posible de most rar qu e la in ten sidad ac ust ica de una onda progresiva pla na
es propo rcional al cuad rado de su presion d inarnica:

p2
I = - [W/m 2J
p~.c

en una sala de eslar


20dB

-----7 Dormilo rio lranquil o

0 dB

-----7 Umbral de audibilidad

Figura 1. Relaci6n ent re presion d inarnica y ni vel de presi6n sonora en decibeles

Es dec ir que la po tenc ia de scribe la variac ic n de ene rgfa .'lE que ocurre en e l
tiemp o .'It.6 En ot ros te rrninos, es e l traba jo Fis ico ejercido por la Fue n te duran
te e l t iempo .'lL La po te nc ia aciist ica max ima qu e en trega n algunos instru
mentos musicales se puede aprec iar en la siguien te tab la (los va lores son un
prom edi o ent re varias mediciones):

en la qu e Po es la densidad medi a del aire y c es la veloc idad de propagaci6n


del sonido en ese rned io. En la Figura 1 se pueden obscrvar los valores que to
rna la intens idad ac ust ica anre algunas Fuentes acu sticas co t id ianas .
A partir de la inten sidad I es posible defin ir el nivel de intensiMd aCUs tica
(Nl) . 7

N l = 10 loglO _I- [dB]; con Ilel = 10 - 12 WI m2


Irel
Para el caso de ondas plan as 0 esfericas progresivas el va lor del nivel de in ten
sidad N I coincide apr oximadarnen te co n el de l n ivel de presion sono ra N PS.
Cualq uiera de las magnit udes an te riores (ampli tud , presi6n, NPS, in te n
sidad y N I) puede ded ucirse de las dernas: todas se refieren, en ultima instan
c ia , a la cantidad de energta asociada a un a onda acust ica.

Z. PERCEPCION
Fuente acll.snCa
C an tan ie (teno r)

Flaura
Trornpera
Tromb 6n
O rquesra sinfo n ica (fff)

Potencia aCll.s nCa maxima


0,04
0,05
0,2
6
60

W
W
W
W
W

La ene rgia tot al que rad ia la fuente se pro paga en mu chas d ireccio nes. En par
ticu lar, a nosot ros nos va a in teresar la que atrav iesa determinada area (por
ejernplo, el tfrnpano de un a per son a) . O tra magn itu d , la intensidad acustica (I),
da cuen ta de la po te ncia que atrav iesa un area A:
La pot en cia insranta ne a se calcula a partir de la derivada de la ene rgia co n respecto a l
tiernpo: Pi = JE/Jt.

DE LA SONO RIDA D

La sonoridad es una magnitud percep tual y como tal no pued e medi rse d irec
ram en te a partir de sensores fisicos. Pu C ~LO que todas las te cni cas indi rect as de
rned ic ion apor ta n sus propi os presupue stos y lirnitac iones, nu estra discusi6n
in clui ra necesariamen te un a descrincion de la metod ologla aplicada en cada
uno de los casos ex puestos . Quiza la me nos cont roverrida de las tecni cas de
medici6n sea la de comparaci6n de sonoridades, en la que un oyen te debe variar
la intensidad de un estimu lo hasra con segu ir igua larlo en sonoridad can ot ro
esta ndar de intensidad fija. En este rnetod o el oldo se usa como un detector de
cero y es capaz de revelar como otros parametre s de la serial, tales como la fre
cuencia 0 el anc ho de banda , afec ta n la sonorida d. Tarnb ien sirve para detec
tar la manera en que alguna carac terfst ica parti cul ar del oye nte , como un a
perdida de sens ibilidad aud it iva , influye sobre su per cepcio n de la sonorid ad .

56

7 Sound intensity level (IL) en ingles.

57

1IM~

1'

- - - - - - - - - - - - - - -.........._

90

Umbrales absolutos

80

EI umbral abso lute de in ten sidad -Ia in tensid ad a part ir de la cua l cornenz a
mos a perc ibir so n ido- fue de te rm in ad o por pr imera vez en la segunda mitad
del siglo XIX. S e 10 m idi6 a una fre cuencia centr al de 1.000 H z y se supuso que
e l o ido hu m ane manten ia un comport amiento parejo a 10 lar go de todo el ran
go audibl e. H oy sabemos q ue, para un a sefia l sin uso idal de 1.000 Hz , la mayo
ria de las personas con o ido sano co m ienza a o fr c ua ndo la intensidad alcanza
unos 10- 12 W/ m 2 . Est a in rensida d eq uiva le a un a presion so nora de 20 millo
nesirnas de pasca l (20 flPa ), 0 a una arnplit ud de mov im iento de 10-11 m ( 0
0 ,1 A iun dec imo del d iarnetro del ato rno de hidr6gen o!). EI o ido humano es
in crefble rnente sensible a la intensid ad ac iistica, pues si pud iese rnos perci bi r
in te nsidades aiin menores o irlarnos e l rui do provocado par la agitac io n terrni
ca de las mo lecu las del a ire . C uan do comparamo s n ues tros old os co n los de al
gun os animales nocturnes, co mo los ga to s 0 las lechuzas, no de be mos buscar
en una m ayo r se nsib ilida d abso luta la razon de sus exc elentes ca pac idades au
di tivas (n o a l me nos a 1.000 H z).
La vari aci 6n del umbral de aud ici6n en fun ci6n de la frecue ncia del est i
m ulo se obtien e habitual mente a pa rt ir de dos met odos: el de la presion mfni
ma audible (MAP), q ue se e valua con auriculares, y el de l mtrurno campo audible
(MAF), q ue se mid e con a lta voc es y q ue incluye los efec tos de filtro del ca n a l
aud itivo extern o y del pab e llon a uricu lar (de gran importancia para defin ir los
filtros HRTF). 8 La Figura 2 perrn ite apreciar, junto a est os umbrales, el corres
pond ien te al minima campo audible binaural (MAF bin aural), q ue es a lrededor
de 2 d B me n o r q ue el monoaur al.
Se co nsideran sujetos co n aud ic io n nor ma l aq uellos q ue presentan urn
brales de h asta 20 dB por enc ima de la curva anterio r. Pa ra frec uenc ias sup e
rior es a los 1.000 Hz las d ifere n c ias interindividuales so n apreciabl es.
Es n otabl e la sernejanz a de for ma que existe entre la sens ibili dad del ofdo
de riv ada de los filtros del siste ma aud itive pe rife rico (figura 30 del ca pitulo I) y
la in versa de la c urva umb ral que acabarnos de presentar. Ademas de proporcio
n ar la identificac ion puntu al de la causa de cada resonancia y de cada factor de
ponderac ion espectral, la sernejanza alud ida permi te supo n er un a cod ificac ion
espectral "pl an a" en los ni veles superiores de procesamiento neur al, a part ir del
flujo de informacion q ue asc iende por el ne rvio a ud it ive . A si, pode mos inferir
q ue tan to la sens ibilidad max ima del o ido alrededor de los 3.000 Hz, como la
ca rac teristica de Fittro pasa altos que pre sen ta h asta los 5.000 H z, se originan
prin c ipalmen te en la resonanc ia ac ustica del co nd uc to aud itivo exte rno .
8

Fun cion es de trans feren cia relativas a la cabeza (Head Related Transfer FLmcrions) .

58

70

ill

60

50

40

"5
U)

..0

co

30

\\
\'

- - - MAF (monoaural)
- - MAF (binaural)

\
\

1
..0

20

::J

10

. MAP (monoau ral)

~
-c

~ ..

. ....
" < , ; ~ .... . . .., ....
..

10 [ . , ", "I
" , , " "I
0.02 0 .05 0.1 0.2 0.5 1

,~~ II

' '-' " ,,1I


5 10

I
20

Frecuencia (kHz)

F igura 2. Mfnimas inr ens idades ac usticas audi bles (umbrales MA P y MAF)

En cuan to a los lim ites de audi bilidad pa ra bajas frecuenc ias, pode mos
apuntar que W h it tle m idio en 1972 los umbrales entre 3 ,5 y 50 H z y conclu
y6 que forman un continuum co n las curvas a frecuenci as medias (a 3 ,5 Hz se
n ecesitan 120 dB pa ra lle gar al umbral) (W hi t tle , L. S. et at., 1972 ). En 1974
Jo nson sugiri6, n o ob sta nte , qu e pa ra so n idos de men os de 16 H z 10 que se oye
es el prod uc to de la d istorsion arm6 n ica de l o ido (Johnson y Gierke, 19 74) . EI
lim ite para siru acio n es norm ales parece ser de alrededor de 16 H z, frec uen c ia
cercana a la m as baja que prod uce una sens ac i6n clara de alt ura ton al.
En la practica c hn ica los urnb ra les se to rnan co n rel ac i6n a los co ns idera
dos "estad fs t icamente norrnales" y se mid en e n niveles de umbral (HL) : un urn
br al de 40 dB HL a 100 H z sign ifies q ue es ta 40 dB por enc irna del um bral
normal a dicha frecuen c ia. En el aud iograrn a de la Figur a 3 se pu eden ver los
ni veles de um br al HL para ambos o tdos.
La sensib ilida d del o ido humano a la intensidad es desraca ble ta nto en ter
minos absolutos como en term ln os del ran go de valor es al que responde (del
orden del billon de veces entre la maxima y la minima in ten sidad perceptible,
o del rnillon si 10 medimos en pres iones ac usticas)." EI mo tivo de se mejan te
range hay que buscarl o en el con jun to de son idos h abit uales en los ti empos en
los q ue estas ca pac idades se fijaron biologicamente La gran sensibilidad ante
esti mu los minuscul es, del orden del decibel , n os permitia o ir por ejernplo el an
dar d istan te de un de predador 0 de una peq uefia presa. En aquellos tiernpos
tarn bien existian est imulos de gran ene rgia, co mo el so n ido de un t rueno 0 de
9

En n ume ros, un a relaci6n de 10 11/1 en inten sidad, 0 de 10 6/1 en pr esi6n acu stica.

59

120

110

100

90

80

:s. 70
e0 60

c
0
50

en
40
Qj
>
Z 30
20
10
0

-10
0

CO

.s.
~
E

10

rJ
:J
OJ
0

Qj

>

30

co

. .....r -' - " ~ ':' r: \

20

a ido derecho

Oido izquierdo

.......

. . \;
\

Oido normal

..

1\

40
50

Deterioro causado
por exposici6n al ruido

~"'\4 ";"
\, \

",: ....

... ..

60
0.02
70
125

250

500

1000

2000

4000

8000

Frecuencia (Hz)

Figura 3. Audiogram a de un sujeto con o fdo sano y de otro can h ipoacusia


pro vocada por ruid o

un grito a co rta distancia. La est rategia q ue nos perrnitio co nse rvar una sensibi
lidad auditiva ex tre ma sin qu e po r e llo aurnen te exce siva rne n te la fragilidad de l
siste ma es co mp \eja y au n no se co no ce corn plet arnente. Ent re los facto res de
impo rtancia qu e int ervienen esta, sin du da, el efec to de lupa pro pio de la co m
presion logarftmica q ue opera entre el est fmu lo y la respuesta: n uest ra sensib ili
dad es maxim a a pequefias int en sidades y se va red ucie nd o a rnedida q ue la
in tensid ad aumenta. As!, para estimulos ce rcanos al um bral de do lor, e l co njun
to de mecan isrnos perifericos y cen t rales qu e se descr ibieron en el cap itulo I at e
mi an co ns ide rableme n te la serial que nos llega de l exteri or.

Co nrornos de igual sonoridad


Ex ist en dos tecnicas q ue pe rm ite n me d ir la so noridad: un a es la estimaci6n de
magninui, qu e inr enta dete rmi na r valo res ab solutes d e so no rida d: la o tra co n
siste en medir el nivel de 50noridad en relac ion co n un a sin usoi d e de 1.00 0 H z.
Las c urvas de contorno.s de igual sonoridad de la Figu ra 4 se obt ienen a partir de
es te ultimo rnet odo y resultan a lgo d iferentes segiin e l la boratorio en el cu al
fueron determ inadas (la forma ex ac ta n o deb e tomarse liter al rne n te ). Puede n
se r reprodu cid as co n senci llez a l ped irle a uri ove nte q ue igua le la so no rida d
de una serial s in uso ida l, de frecuenc ia e intensidad variable, co n la de un to
no esta nda r de 1.000 H z a N decib e les. Obvia decir q ue so n un p ro med io ela
bo rad o so bre la base de las respu est as de c ien tos 0 mil es de sujetos.

60

0.05 0.01 0.2

0.5

10

Frecuencia (Hz)

Figu ra 4 . Curvas is6fonas (Fletch er-Muns on)

Las Clavas de igual sonoridad -0 is6fonas- so n una descri pc ion de la va ria


c ion de la sonoridad en fun ci on de la frec uencia del estfrnulo (Fletc her y
M unso n , 1933 ). EI nivel de sonoridad (rn edido en fones) d el so n ido de p rueba
es n umericarn en te igua l a la intensid ad N I (rnedida en dB ) del tone de refe
renci a de 1.000 H z. A si , por ej e mp lo, to do so n ido q ue po sea la mis ma sono ri
dad q ue un a sin uso ide de 40 dB a 1.000 H z, rendra un ni vel de sonoridad de
40 fones. U n co n to rn o de igu al so noridad es una linea q ue un e los ni veles de
los esnrn ulos - de diferent es frecuen cias- qu e presentan el m ism o nivel de so
nori dad en Iones.
La ca ntid ad de in formaci on util q ue apo rta n est as c urv as es mu y gra nde .
Men c ionernos algunos ejernpl os:
La forma de las c urvas es, par a bajos ni veles de sonoridad, parec ida a la
del umbra I de la Figura 2: la sensibilida d decrece a med ida q ue nos alejarn os de
la zona ce nt ra l de l espec t ro haci a las a lta s y bajas frec ue nc ias. Es necesar io
aplicar mas ener gfa en la region grave q ue en la med i~ pa ra o btene r el m ism o
resultado auditi vo .
Para sonorid ad es intermed ias, en tre 60 y 70 fon es, es rnenor la difere n
cia d e sens ib ilid ad aud it iva en fun ci on de la frecu encia.
Las curvas d e n ivel, par a altas sonorida des, son pr ac ricarnen te planas:
nuestro o ido resp o nde d e mane ra sim ila r en todo e l rango a ud ible a co nse
c ue ncia de la atenuac ion pro vist a por los mecanismos de pror eccio n auditiva.
Exist e un a zona de maxima sensibil idad entre los 2.500 y los 3.500 H z.
T iene una gran irnpo rta ncia p ues el esrfrnulo qu e oc up e esa banda va a ser pe r
ci bido con mayo r fac ilida d q ue los que oc upen o t ras regiones de l espe ctro. Co

61

11:111 :

mo ya sabe rnos, este maximo de scns ib ilidad se o rigin a e n la resonan cia del
co nd uc to aud itivo ex te rno .
S i se gene ra un a serial sinuso idal qu e recorra co mpleta me n te una de las
curvas de igual son oridad se a ye un glissand o perfecto , de sono ridad co ns ta n te.
Una co nsec ue nc ia de las curvas isofonas, muy cornun en el ca mpo de la
mu sica, es el co n tro l de sono rida d --0 loudness- qu e posee n algunos prearn pli
flcad or es de aud io. Las grabac iones de piezas de rruisica se realizan por 10 ge
nera l a ni veles altos , do nd e la sensibilidad del otdo es plana . S i se re produ cen
a ni vel es meno res ca mb ia el balance espe c tral al ca mb iar nu estra sensiblltdad
a ud itiva: ol mos debil itadas las regio nes mas grave s y agudas de l espectro . Para
corregir este efeeto algunos eq uipos de aud io v iene n eq uipados co n un co nt rol
de sono ridad q ue refuerza los ex tre mos del espec tro a bajos n ivcles de arnp li
ficacion. La salida del prea rnplifica do r can el control de sono rida d ac tiva do si
gue de modo mas a rne nos feli z la c urva um bral de aud ibilida d .

Escala absol u ta de so nori dad


EI ni vel de sono ridad en tones tod avia se refiere, sin e mba rgo, a la serial fisi
ca . So lo propo rc io na un a esca la co mpa ra t iva y no perm ite desc rib ir la sono ri
dad prop iame nte dicha. iCua nto mas sonoro es un so n ido de 70 fo nes que uno
de 50 fones? Con los ele me ntos hasta aqu i ev aluad os no se puede dar resp ues
ta a esta pregu n ta. H ace falta defin ir una un idad a ute ntica rnen te pe rce pt ual ,
qu e per rnit a rned ir la mag n itud de las pe rcepciones en si m ismas y no co n re
lac ion a referen cias ex te rnas .

La ley psicoflsica
Este problema se encaro in icialmente en la segu nda mitad del siglo XIX. Los fi
siologos aleman es Weber y Fech n er propusieron un a ley psicoftsica q ue pre
tendla vinc ular los est imulos can las per cepciones a cra ves de una rela c i6 n
co rmi n a todos los sen tidos . Esta ley fue co ns iderada adec uada y se la reprodu
jo e n la mayorf a de los te xtos espec ializados h asta no hace muc ho t iern po .
Au nque dio lugar a un a variedad de tecn icas y unidad es de medici6n en tre las
qu e se enc ue n tra el decibel , en la mayoria de los ca sas no es n i aprox irnada
mente co rrec ta . La definicion mas d ifundida de la ley psicofisica estab lece q ue
la magn it ud psicol6gica pe rcibida es proporc io nal al logaritmo del estimu lo fi
sica . Es dec ir, qu e mul tiplicaciones sim ilares en la magnirud del estfrn ulo ge
neran adiciones prop orcion ales en la respuesta pe rceptual, t ransforrnan do un a
esca la geornetrica en un a esca la aritrnet ica. En el caso del sonido , 10 anterior
sign ifica simplemente que n uest ros ju icios sob re la sono ridad deben seguir

62

exactame n te un a escala logan trnica sim ilar a la pa urada en la esca la de decib e


les: un esrfrnulo de 80 dB deberta ten er un a sono ridad dob le qu e un o de 40 dB.
q ue a ca da ad icion de 10 dB le deb erfa co rresponde r un paso siemp re igual
en son orida d. Como verernos a co n tin uac ion , nu ev as med iciones psicoac usti
cas refutaron estas afirrnaciones.

La sonoridad
A pesar de qu e las recn icas q ue e mplea n al aida co mo un det ec to r de ce ro -eo
mo la de co rnpa racion de sonorida dcs- ha n probado ser utiles en la de te rmi
nacion de los fac to res q ue afec tan la sono ridad , no proveen un a medid a
direct a de la sensac ion percib ida. U no de los proced im ien tos emplead os pa ra
resolver el pro ble ma fue aplica r la tecni ca de es timaci6n de magnitudes, en la
qu e el oyente debe simplernen te as igna rle un ruim e ro a cada sonido de d ife
ren te in te nsidad . Una a lterna tiva co ns iste en emp lea r la tecn ica de producci6n
de magnitudes e n la qu e, a la in versa, el oyen te deb e ajusta r la intensidad de un
estfrnulo de ac ue rdo a un num ero dado de an te rnano. Duran te la decada de
195 0 S te ve ns e rnpleo a mbos rnet od os para desa rro llar sus esca las de sonoridad,
qu e descri ben la relaci6 n e nt re sonoridad -percep tual- e intens idad -ffsica
(Stev ens, S . S ., 1959 ). Los pro blemas me tod o l6gicos q ue enco n tro fueron
mu y grandes pues resu lta d iffcil cuantificar la sono ridad q ue es, como ya sabe
mos, una mag n it ud enterarnente pe rceptual. S tevens tuvo q ue defini r un a
n uev a un idad, el son, para c uan t ifica r d irecta rnen te la so no ridad . EI son es, fi
na lmen te , un a un idad lin eal: un son ido de 2 sones posee el dobl e de sono ri
dad qu e un o de 1 son, y un o de 3 sones el tr iple. A l igual que la altura, la
sonoridad es un a magn itu d perceptual y deberta definirse a part ir de un a un i
dad de referen d a estable. Pero co mo la estabilidad en el ca mpo de las sens a
ciones es mu y poco confia ble, se to ma un a refe rencia ffsica ex terria: un a serial
1.000 H z y 40 dB (40 fones) pro duce par defin icion un son ida que posee un a
sono rida d de 1 son (pa ra la altura ra rnbien se to ma un a refe rencia ffsica ex ter
na: 440 H z definen e l La en mu sica j.l?
A pa rtir de los trabajos de S teve ns se enco n t r6 qu e la relaci6n esn rnulo
respu esta sigue aproximadamente una ley de potenc ia, diferen te a la ley loga
rltrn ica de los psicoffsicos. Prop uso la siguien te relacion en t re la sonori dad (S )
y la intensidad ( I):

S = k [ 0,3 [son es]


10 El contex ro es aquf de gran imp orta ncia. 40 fones or igin an un son ido de 1 son s610 si en
los ins tan tes prev ios el oyente se encuentra e n un ambie n te ex tre mada me nte silenc ioso_

63

EI valor de la co nsta n te I< depend e de las co nd iciones experimen rales y de las


un idades empleadas. EI grafico de la figura 5 muestra la relaci6 n de Stev ens (no
hay que olvidar qu e es consecuencia de exp erirnen tos realizados co n ondas si
nusoidales y no co n estfmulos co rnplejos). Se puede obse rva r que a un aurnen
to de 10 d B en el est fmulo Ie correspo nde un a dupl icacion de la sono ridad.
A unque la relacion an terior ha sido rat ificada para sefiales mayores a 40 dB,
se Ie hacen varias criticas: existen diferencias individuales rnuy grandes, y el re
sultado se obtuvo a par tir de medias de pob lac iones muy grandes y d ispersas.
Wa n'en enco ntro que la duplicac ion de la sonoridad correspo nde a un aumen to
de la in ten sidad de 6 dB, en vez de los 10 d B de Steven s (Warren, R. M., 1970).
Ad emas, aunque las tecnicas de estimaci6n y de producci6n de magnitudes tie
nen la ven taja de permitir la obtenc ion de una relacion di recta ent re un pararne
tro ffsico y un rasgo perceptual, a diferencia de la tecnica de comparaci6n de
magn itud es, am bas asumen que los oyentes pueden usar los mimeros para califi
car sus percepciones de un modo consisten te. Existen varias razones que perm i
ten supo ne r que esto ultimo no siempre es asi, que los oyentes polarizan y sesgan
sus ju icios de estimac ion acerca de la sono ridad que perciben . Sin embargo, asu
miend o que el riesgo ex iste y extrernan do los cuidados metodol6gicos, la tecnica
de estimacion de magn itudes es usada ampliamen te para medir la son oridad.
Existe una objeci6n aun mas irnportan te: algunos autores desaprueban el
heche de pregun tar por la sono ridad en sf misma. De ordina rio, eva luarnos
ciertas caracte rfsticas de las fue n tes acust icas co mo un todo qu e in volucr a al
con texte, a la perspect iva y a muchos otros factores circunstanc iales. La esti
maci6n aislada de la sono ridad pa rece un a abs tracci6n muy diffcil de realizar.
Helm holtz esc ribi6: "[...] estarnos mu y bien en trena dos pa ra evaluar los obje
tos que nos rod ean , pero fallamos cornplet ame nte cu and o inten tarnos obser
var las sensacion es per se [.'OJ" (H el mholtz , H. von, 1885).1l

Medidores de nivel sonora


Los instrumentos de medi cion mas tradicionales en acustica son los medic10res
de nivel sonora ,12 que perrniten determina r el ni vel de pres ion son ora. Por 10 ge
n eral, tien en un banco de filtros en la eta pa de ent rada que per mit e medi r la
sefial ac ustica tal como !lega al micr6fono -respuesta plana 0 lineal- 0 com
pensada segun cie rto pat ron espectral. A s!, un med idor de n ivel sonoro en

Traducci6n de GB. Hermann Ludwig Ferdinand von Helmholtz (1821 -1894 ) fue un cien

nfico aleman de destaca da actuacion en el campo de la fisiologta, la opti ca, la acustica y la

electr odinamica.

12 C onoc idos popu larmente como "dec ibelimeuos".

II

64

20
10

5
2

Ul
~

0.5
02

'0

'

0,1

g
o

(f)

0,05
0.02
0,01

0,005
0,0 02
0001 11...L._
I

'

~_~_~_-:,..
20
40
60
80

Intensidad (dB)

Figur a 5. Relaci6n de Stevens entre in tensidad y sono ridad

com pen saci6n "A" sigue de rnanera aprox imada la curva de respuesta del ofdo
para un nivcl de sonoridad de 30 fones, en co rnpensacion "B" la de 70 fones, y
en cornp ensacion "C" es practi carnente lineal. Cas i toda la norrnativa relacio
nada co n acustica ambien ta l esta espec ificada en decibeles A. Por ejernplo, el
n ivel equivalente de ruido acep table en zonas residen c iales no deberfa superar
los 65 dBA en horarios de aetiv idad diu rn a ni los 50 d BA duran te la noche.
S i se tornan dos lec turas de un a misma serial, una en dB lineales y o tra en
d BA , por 10 gene ral la ultima dara un valor in ferior pues se filtran las band as
graves del espectro de ruido.
Los medidores de niv el sonoro, sin embargo, s610 son confiables cuando
se los emplea para med ir sefiales continu as de larga duraci6n. Las respuestas
percep tuales an te seriales imp ulsivas 0 muy co rtas no co rrespo nde n a la mag
n itud que indi can . Los med idores ta mp oco proveen lecturas satisfactorias de
la sono ridad de estfmulos compuestos muy separados en frecuencia. Y, por su
puesto, no estan ca librados en sones, la un idad que debe ernplearse para eva
luar la sonoridad prop iamente d icha.
Sumario de unidades relacionadas con la sonor idad
EI camino que nos !lev6 de la arnplitud de las ondas en el aire a los sones es co m
plejo y se podrta supo ner de una dificu ltad innecesaria. Sin embargo, la auten
tica co mplejidad esta dad a por la multiplicidad de mecan ismos que actuan en la
cod ificaci6n aud itiva de la in tensidad. Para ilustrar esta situaci6n volvamos a las

65

I,

curvas isofonas de la figura 4: se las esquematiz6 en dos di mensiones - riotese qu e


n o apa rece la dimension so no rida d-, pew en rea lidad deberfan haber sido repr e
sentadas en tres d imensiones. En la figura 7 se puede ver un a porci6n de la re
presenracion trid ime ns iona l, mas adec uada pew mucho mas d iflcil de leer.
Para sin te t izar eI ca mino qu e llevamos reco rrido , la siguien te tabl a enu
mera las difer entes unidad es relac ionadas con la sono rida d , co n sus un idade s
y ca racte risticas par ticu lates.

Tab la 1. Magn itud es relacion ad as ca n la sono ridad (pa ra ondas ac ust icas plan as)

Magnitud

Naturaleza

Unidad

Rango audible

Amplitud
Presion
Nivel de presion sonora (NPS )
Inte nsidad
N ivel de in tensidad (N I)
N ive l de sono ridad
So noridad

Fisica
Fisica
Fisica
Fisica
Fisica

Metro
Pascal
dB
W/m 2
dB
Fan
Son

10 - II m - 10 5 m
20 ~ P a - 20 Pa
Od B - 120d B
10- 12 W/ m2 -I W/ m2
Od B - 12Od B
fa n - 120 fanes
so n - 250 so nes

Hjbrida
Psicol6gica

o
o

3. D ISCRIMINACI6 N DE LA INT ENSIDAD


La discrimin aci6n en intensid ad se refiere a la h abilidad de l sistema aud itivo
par a detect ar di fere nc ias en t re la inten sidad de dos 0 mas est lmulos. Du rante
eI siglo xx se rea lizaron numero sos ex pe rimen tos co n el fin de med ir los lfrni
tes de este signi fica tive aspecto de la aud ic ion , qu e adquiri6 especia l impor
tanc ia can la lIegada del aud io d igital.

Figura 6 . Medidor de nive l sonora

Sonon dad
(sones)

Limen de in tens idad


Va rias definici ones de la diferencia abenas perceptible (D AP 0 ]ND13 ) en in ten
sida d , tambien lIam ada limen de intensidad (t.L), fueron e mplea das en eI pasa
do. En el prese nte las mas usuales so n :

an

1) L1L =
2) L1L = 10 log (& /1)
3) L1L = 10 log {(l +

an / l}

conocida com o fracc ion de We ber

NI

(dB)

la fracci6n de Weber definida en d B


en dB.
70

I3

JND, de l Ingles just noticeable difference.

66

Figu ra 7 . Rep resentacion trid imensional de las curvas isofon as

67

-En todas ellas I es la intensidad de la seria l de base (el pedest al) y 61 la inten
sidad del menor incremento de tectabl e par el ovente.
Para medir ellimen de in ten sidad se emplea co n frecuencia el metodo de
elecci6n for zada entre dos ouemaiioas (2 A FC ), en la que cada suje to de be op
tar obligatariamen te po r alguno de los son idos qu e oye, aiin cuando le parez
ca n ind istinguibles. El umbr al de discrirninacion se o bt iene cuando la
d iferenc ia 6 1 e n el est fmul o prod uce el 75% de respu estas co rrectas. Esta tee
n ica se ap lica a part ir de tre s rnetodos pr in cipales: m etod o de det eccio n de
rnodulacion, de deteccion de increm en tos y de discriminacion de estimulos
pul santes. En la detecci6n de modulaci6n los oyentes deben n ota r la presencia
de un a pequefia rnodulacion en a mp litud en una sefial dada. En ladetecci6n de
incrementos y en la oiscrunuiacion de estimuios pulsaiues deb en perc ib ir un cam
bio en la inte ns idad de un est fmu lo esta nda r (el pedestal ).

8 kHz
<,

1.5 t- .......

iii"
"0
;;:- 1.G1-c

200 Hz

1 kHz

40

60

80

Nivel de intensidad sonora

Figura 8. DAP en inr ensidad


a)

b)

100 r

La L ey de W eb er

68

<,

0.5

, . - - - - - --

Para ruido de banda an cha se co rnprobo que el min imo ca m bio de in tensidad
de tect able es una fraccion co nsta n te de la inte nsidad del est frnu lo . En otras pa
lab ras, la razon 6 1/1 se rnan tien e co nsta n te. Este es un buen ejemp lo parti c ular
de la conoc ida Ley de Weber, que estab lece que nuestro sistem a perceptiv o dis
crimina carnbios porcentuales constan tes. La relacion 61/1 se llam a fracci6n de
Weber y es h abitualmente expresada en dB co mo & = 10 log (61/0 . En el ran
go de 20 a 100 d B el valor de & permanece entre 0,5 y 1 d B. C erca de l urn
bra1de aud ibilidad la fraccio n de Weber au men ta dr asti cam en te, en parti cular
a frecu enc ias par debajo de los 200 H z.
En co n traste con los resultados an teriores pa ra ruid o de banda ancha, la
fraccion de Webe r sufre un desvfo cuan do el esti mulo se constru ye co n sinusoi
des: la discriminac ion mejora al aume nta r el nivel del estimulo. A 80 dB 6 L
llega a ser de 0,3 dB, par deb ajo de la Ley de Weber. En la figura 9a se puede
ver qu e el grafico de la relacion 10 log (6 0 en funcion de 10 log (I ) presen ta
un a pe ndiente de 0,9 en vez de 1, tal co mo co rresponderia a la fraccion de W e
ber exac ta, De ac uerdo con McGill y G oldbe rg, la diferencia q uiza se deba al
ensanch arniento de la zona afect ad a de la membran a basilar a ca usa del in cre
men to en la intensida d del estfmu lo sin usoidal ( McG ill y G oldb erg, 1968 ).
El des vlo - aume n to en la di scriminacion- q ue sufre la Ley de Webe r pa
ra estimulos si nusoida les pur os parece relacionarse co n el patro n de e n rnasca
rarni ento: al aumen tar e l ni vel sono ro se act iva n otros ca na les espe c tral es que
con tribuyen a la sonoridad genera l. Este ensan ch arn ien to de la zon a de in
fluencia en la mem brana basilar se p uede aprec iar en la figur a 10.

<,

----,

- Ley de Weber
.... Desvio

'"

-4

.'

.'

~ 60

-6

0:::

~- 8

.' .'

OJ

.Q
040
20 f- /

OJ

0. 10

"

12

14
20

40

60

60

100

20

40

60

10 Iog(l)

80

100

10Iog(l)

Figura 9 , Ley de We ber y desvfo de la Ley de Webe r para esn mulos sin usoida les
100
90

iii" ao

:2 70
c

-0

u
.cg

'u
x

60

50

Q)
Q)

40

"0

a;

30

20

>

10
1000

2000

5000

Frec uenci a central (Hz )

Figura 10. Ensancharnien ro de la zona de la membrana basilar q ue explicaria el desvlo de


la Ley de Weber para esrlrnulos sin usoidales

69

([- [J

Ley de Fech ne r para la sonoridad


Co mo ya sabernos, la sonoridad es el correlato perceptual de la in tensidad ffs i
ca, al men os en una primera aprox irnacion . Podemos supo ner, por 10 tanto, la
ex istencia de alguna relacion ent re la d iscrim inacion de la sono ridad y la habi
lidad de los oyentes para detectar diferencias de intensidad. La Ley de Fechner
va un paso mas alia proponi endo que la fracci on de Weber, i'll/I, esta asociada
a un incremen to constan re de la sono ridad i'lS (Fechne r, G., 1860):

LlS = k LlI/I
en la que k es una consta nte . A unque esta relaci6n fue defendida durante mas
de un siglo, se ha co rnprobado que es in correct a, tal como adve rti rnos antes ,
en este mismo capitulo (Zwislocki y Jorda n, 1986) .

4. OTROS FA CT ORES QUE INTERVIENEN

EN LA PERCEPCI 6 N DE LA SONORIDAD

In tegraci6n tempo ra l
Ga rner y Miller enc ontraron que el umbral de aud ici6n de la sono ridad co rres
ponde mas a una can tidad co nsran re de energ fa que a un a canridad co ns ta n
te de pot enci a -0 de in tensidad-, al rneno s sobre cierto tan go de duraciones
(Ga rne r y Miller, 1947). Tiernpo despues, Hen n ing descubrio que para estirnu
los de corta duraci6n la ene rgfa de l menor increment o detec table (i'lE) se
mantiene co ns tan te , contra la creencia generalizada de la co nsta nc ia de la in
rensidad.!"
En 1995 Moore comprobo que para d uracion es menor es a 200 ms la in
tensidad necesaria para la dereccion del esrirnulo se incrementa a medid a que
la duraci6n disminu ye (Moore, B., 1995). Pareci era que el ofdo integrar a la
energia de la serial:
[ X

= ete.

En la que [ es el umbral de inrensidad para un pulso de duraci6n t. En la prac


tic a la siguien te exp resion da mejores resultados :
14 G . B. Henning (1970) . Esre hech o ya h abra sido norado par Exner en 1876: "Tanto los
umbr a les abso luros en sono ridad como la sono ridad en sf misma de pend en de la duraci6n
del esrfrn ulo."

70

X t

=It x '! = ere.

donde IL es el umbr al para un pulso de larga duracion y 1: es una con stante


que represen ra el "t iernpo de in tegraci on" del sistema aud it ive . La relac ion
anterior es valida solo para intensidades ce rcanas al umbral. Lejos de l mismo
no se puede asegurar la forma que ado pra la inr egracion de la ene rgia . Sola
ment e se puede decir que, para un a in tensidad dada, la sono ridad crece h as
ta los 200 ms de dur acion. Para men os de 80 ms de dur acion se pue de afirma r
que , aprox imada mente, energ(a constance = sonoridad constante. Aquf la frac
cion de Webe r disminuye 3 d B cada vez que se du plica la du raci6n del estf
mulo. Mas alia de una c ierta durac i6n cr ftica i'lt la fracc i6n de Weber devi en e
constante. Para dur acion es mayo res a 500 rns los umbrales son in de pend ien
tes de la d urac ion ,
EI valor crftico i'lt es func i6n de la frecue nc ia: decrece al aumen tar esta
ulti ma y to rna valores que van desde 100 ms a 250 Hz hasra 10 ms a 4 kHz . Al
parecer, integramas mejor los impulsos de alta frecuencia.
En el organa de tubos no se puede mod ificar la int ensidad de cada soni
do porqu e las teclas s610 abren 0 cie rran las va lvulas que distribuyen el flujo
de aire. Sin embargo, la integrac i6n temporal a energia co nsta n te le pe rrnite
al organ ista modu lar agogicarnen te la sono ridad, act uan do un icarnent e sobre
la durac ion -a l menos en los pasajes veloces.
Fac tor es espectrales
En un experime n to desarro llado en la decada de 1950, Zwicker, Flottorp y
Steven s le pidieron a un grupo de oyentes que igualasen la sono ridad de una
banda de ruido con la de un tone sin usoida l estandar (Zwicker, Flot torp y St e
vens, 1957). Los autores co nc luye ron que si la so no ridad en cada banda crlti
ca sigue la ley de la po te nc ia S = k [0.3, al distribuir la misma intensidad de la
sefia] en n ban das crfticas se debe obte ne r un incremento en la sonor idad to
tal sirnplernen te porque:
k [ 0,3 < nk (Ifn )o.3 , para n > 1
En la actualidad se realiza el siguien te ana lisis para calcular la sono ridad total
de un conjunto de esrfrnulos sin usoidales cornbinados.
1. Nunca se suman los niveles de presion sonora 0 los niveles de int ensi
dad di rec tarnente: dos esn rnulos de 80 dB jarnas gene ran juntos 160 dB.
2. Si se desea n sumar seriales de frecuenc ias cercanas - ambas den tro de la
misma band a crftica- se deben sumar en pr imer termino las in rensidades efi

71

~---~p

:I

cace s, pues la in formacion de fase n o es rele vanre.J ? C an este resultado se pue


de obtener el n ivel de in tensidad en dB . A co n t in uac ion se ext rae de las cur
vas isofonas (figura 4) e l n ive l de son o ridad en fone s y, par fin, de la relacion
de Stevens (Figura 5) se obtiene la sono ridad total. Par ejemp lo, si se su man
dos sefiales de 100 y 120 Hz co n el m ismo niv el de in tensidad de 80 dB, el re
sulta do da un Nl de 83 dB , equivalentes a 77 fones qu e co rresponden ap rox i
madam ente a un a sonoridad de 12 sones.
3. S i se de sea sumar sefiales de la m isma frecuen cia el pro cedimiento es
similar, pero en primer lugar de be n sumarse las a mplitudes porqu e aq ui la in
fo rma cion de fase resulta dec isiva al aparecer el fenorn eno de interferencia de
ondas: dos seriales de 80 dB de la misma frecuen cia pued en dar lugar a un a
cornbin ac ion cuy o n ivel te n ga entre 0 y 86 dB (Basso, G., 200 1a).
4. S i la diferencia de frec uen cia entre los estimulos supera un a banda Crt
t ica, e n la pr actica es usual surnar d irect ame n te las sono rida des en sones. Sin
emb argo, el escena rio es a lgo mas complicado, y sigue la curva de la figura 11.
5. Si los esti m ulos esta n mu y sepa rad os en frec uencia, en mas de tre s oc
tavas, se compo rtan in dependienternente uno del o tro y no puede h ablar se
con prop iedad de un a ve rdadera sum a de son oridades,
U n ejemplo n os perrniti ra comprender co mo se estructura la so nor idad total
e n un son ida peri od ico co mp lejo . C on side re mos una o nda d ien te de sierra
con un n ivel de intensidad de 100 d B y un a pe riodic idad de 200 Hz. Las fre
cucn cias, niv eles de intens idad y son oridad es de los primeros oc h o arrn onicos
seran ento n ces:

it = 200 Hz
fz = 400 Hz
h=600 Hz
f4 = 80 0 Hz
fs = 1.000 Hz
f6 = 1.200 H z
h = 1400 Hz
fs = 1 600 Hz

NI

98 dB
92 dB
:)1 = 88,5 dB
NI = 86 dB
NI = 84 dB
NI = 82,5 dB
NI = 81 dB
NI = 80 dB
=

:~I =

Sonaridad = 70 sones
Sonaridad = 45 sones
Sonaridad = 40 sones
Sonoridad = 35 sones
Sonaridad = 30 sones
Sonoridad = 20 sones
Sonoridad = 18 sones
Sonoridad = 15 sones

La son oridad total se obt ien e al sum ar las sono ridades de los primero s cinco ar
m6n icos de acuerdo co n la figura 11 -la d istanc ia entre ellos supe ra el ancho de
ban da crftico-, agregan do luego la ocasionada por los de mayor orden q ue cae n
15 Las bandas criticas se van a analizar en deralle en el capitulo Ill. Por aho ra, nos alcanza
can saber que cor responden aproximadamente al 15% de la frec uencia central cons iderada.

30

25

20

<Jl

:;;

15

ro

:g
a

10

(fJ

- - _ . Sonoridad de eada seria l (13 sones)

oI
o

- - - Sonoridad eombina da

10 12 14

16 18 20

22 24 26

Sepa raei6n de alturas en 1/12 de oetava

Figura 11 . Son oridad cornbi nada de dos sinusoid es de 13 sones cada una. La freeuencia de
la serial base es de 300 Hz

de ntro de bandas crft icas solapadas. En el eje mp lo se suma n las int ensidades de
los arm6nicos 6, 7 y 8 que con tribuyen can 21 so nes al co nj unt o. La suma co m
ple ta alc anza unos 200 son es. En comparacion , una sin usoide de 200 Hz ca n un
nivel de in ten sidad de 100 dB determ in a un a sonoridad de apenas 80 son es. Se
entiende clarame n te aq ui la causa del mayor ren dim iento sonoro asociado a un a
serial pe riod ica cornp leja. Este es un o de los mot ives que exp lica el escaso em
ple a de sefiales sin uso ida les en c ualq uier siste ma de co mun icac ion acustica,

Cambios en la sensibilidad au dit iva provocados po r so brcstim u lac i6n

Adaptaci6n auditiva
U na propiedad co rruin a tod os los sen tidos co nsiste en q ue la respuesta neural
ante estfmulos estab les de larga d uraci6n decae rapi da rnen te , luego de su apa
ricion, h asta alca n zar un cierto "estado de equilibria" . Esta adaptaci6n awiitiva
resulta de la in te raccion entre la en ergia de respues ta del oyente frente a un
estimulo estac ion ario y la en ergia necesaria para mantenerlo en act iv idad . La
co n trapar te psico logica es un a declinaci6n en la son o ridad aparente has ta q ue
esta alcanz a un valor co nsta n te ,
So rp rende, sin e mba rgo , q ue la so norida d an te estirnulos de med ia a alta
intens idad n o parezc a decrecer en el tiempo, Solo los esti m ulos de nrro de los

73

primeros 40 dB por encirn a del um bral presentan un a apreciable adaptacion


auditiva. En la Figura 12 se rnuestra de manera esq ue rnat ica esta propiedad de
la pe rce pcion auditiva.
Las seriales de alta frecuencia se adap ta n mas profundamente que las de
baja frecuencia, y los sonidos est ables en el tiem po 10 hacen mejor que los so
nidos modulados, Si cumplen arnb as condicion es, es decir, estimulos agud os y
esta bles, los sonidos pueden llegar a desaparecer cornple ta men te luego de un a
expos icion prol ongada. Este efec to n o ocurre co n estfrnulos de baja frec uen cia .
Las medi ciones tipicas de carnbio de urnbral po r adaptacion se re ali zan
co mpa ran do las son orida des en el a taq ue y tres minu tos mas ta rde . En co n di
cio nes favora bles, la ada ptac ion puede alca nza r un a d ism inucion de sono rida d
correspo n d ien te a un cambio de -20 dB en el esnm ulo.
En la adLzpt.aei6n pawl6gica la sens ac ion a ud itiva desapa rece co mp leta me n
te an te un estirnulo co n tin uo a l cabo de un os segundos.

I[
I)~

II

I , ,

I ,

b: ~

Tiempo (s)

, I,

Tiempo (s)

, ~

Figura 12. Ad aptac ion auditiva (graficos esquernaricos)

74

.1

Tiempo (s)

i[ t:= ,
c7l

.1

Tiempo (s)

Fatiga awlitiva
La fatiga auditiva es la perdid a tem po ra l de sensibilidad que aparece cuando
nos exponemos a un son ido mu y intenso y se la mide luego de remover el es
tfmul o q ue la ca usa. Ge ne ralme nte es ra ca rac terizada por el desplazamienw

temporario del umbral (TIS) 16.


La fatiga aud it iva es mas ac usada a altas frec ue nci as. El maximo TIS ocu
rre ent re 4 y 6 kH z y esta rel acionado co n el n ivel de pres io n aciist ica del rui
do - a mayor ni vel en dB ma yor incr em ento del um bra l-, co n la frec ue nc ia y
el espec tro del m ismo - cu anto mayo r sea la frecuenc ia, has ta llega r a 6.00 0
H z, mayor sera el in crem en to de l um bral- y co n el patro n tempor al del ru i
do -los ru idos intermitentes producen men os pe rdidas ternpor ar ias que los
conti n uos.
C om o ejemplo, podemos o bserv ar en las figuras 13 y 14 el deterioro y la
posteri or recuperacion de la sensibilidad audi tiva ca usada por un ruido de un
ancho de banda de una octava, centrad o en 4.000 Hz y co n nivel de presion
sono ra de 85 dB.
Observa mos que la sensibilidad aud it iva se recu per a totalmente solo 48
hor as despues de la supresion de la Fuente de ruido . S i un a persona, por ejern
plo, reacti va la Fuente a las ocho h or as de h aberl a supr imido , su umbral desde
el reinicio sera 10 dB mayor que el n ormal a ca usa de la fat iga aud itiva, obli
gan do la a aumen tar 10 dB la pot en cia de la Fuente ac ustica pa ra alcanzar el
ni vel deseado : su otdo vera m ult iplicada por d iez Ia ene rgfa recibida . Este pro
ceso pued e real ime n ta rse va rias v eces h asta alcan zar ni veles ca paces de provo
car dart os no re versibl es, Algunos de los mecanismos fisiologicos in volu crados
en la perd ida te rnporari a de la audi ci on son los m ismos q ue produ cen la per
dida perrn anente de la ca pac idad aud itiva . La diferenc ia es solo un a cuestion
de grade .
En la ac tualidad (no rmas ISO ) se co ns ide ran seguros n iveles de hasta 85
dBA, oc ho horas por di a. A partir de este va lor a ca da inc remen to de +3 d B
en la inten sida d del estimulo le co rrespo nde una d isrnin uc ion a la mitad del
tie mp o de expo sicion perrnitido.l? Por ejemplo, si se ap lica esta regia una per
sona podr a exp one rse sin riesgo au di t ive h asta dos h or as por dia a un nivel
co ntin uo de 91 dB. En algunas norrnas se est ipula un ni vel maximo, por ejern
plo 115 dBA, q ue no debe superarse en ningun a circ uns ta nc ia.

.1
16 Del

ingles Temporary Threshold Shift.

17 Ya no se e rnplea la "regia de

los 5 dB" propiciada par cierras in du strias.

75

20

CD
~

ro

aume n tar el intervalo temporal en tre ambas sena les y desaparece luego de unos
pocos cientos de milisegund os. El efecto es mayor si los dos estfrnulos tienen la
misma frecuen cia y si son expuestos al mismo ofdo (0 a los mismos ofdos).

15

.0

Detecci6n de sefiales sin usoi dales en presen cia de ruido

E
::l

Q;

10

C
~
E
::l

o I
1

I
2

12

16

20

24

Tiempo de exposici6n (horas)

Figura 13. Desarro llo de las perdidas t ran sit o rias de aud icion

20

CD 15
~

.D
E
.:: 10
~

.8
c;
~

E
::l

0 \
2

12

24

Para anali zar sefiales sin usoidales a las que se le agrega una banda de ruido se
emplea una metodologfa simi lar a la que se usa para est udiar la discriminaci6n
en intens idad entre sinusoides.
Un efecto temporal relacion ado es el de des borde (overs hoot).18 El umbral
necesario para deteetar un a serial breve es mayor si se la presenta cerc a del ata
que 0 la extinci6n del ruido en rnascaran re. EI efecto aurnen ta entre 10 a 15
dB cuando el ruido en masca ran te cubre un gran anc ho de band a y la serial es
de alta frecuencia. Las compone ntes en frecuencia del ruido por encima de la
serial son importantes para producir el efecro.
El efecto de overshoot muestra que el umbr al para un breve estfmulo sinu
soidal iniciado luego de l ataque de un ruido puede ser 10 dB mayor que si se
10 coloca , par ejemplo, 200 ms despues del inicio del ruido enmascarante
(Zwicke r, E., 1965) . A lgunos expe rimentos poster iores sefialaron que , para
que ocurra un gran efecto de overshoot, el ruido enmasca rante debe contener
ene rgfa a frecuen cias alejadas de la frecuencia de la serial, y q ue esta energfa
debe aparecer un breve instan te antes del ataque de la serial (McFadden, D.,
1989). La figura 15 sintetiza los trabajos de McFadd en .
Los mecanismos que da n lugar a estos result ados no se cornpren den toda
via ca n clarid ad , aunque sin dud a esta n vincu lados con el principio de inde
terminaci6n acustico (vease el A pendice n) .

48

Patologias auditivas

Tiernpo de posexposici6n (horas)

Figura 14 . Rec upe rac i6n de l um bral una vez in terrumpid a la fue n te acustica

Incremento de Ia sonoridad
En contraste con la reducci6n de la sono ridad producid a por son idos presentes
sirnultanea rnente con el son ido de prueba (enrnascaramien ro), los son idos que
aparecen antes del de prueba pueden a veces producir un incremen to en su so
noridad. Si el primer est frnulo es, por ejemplo, 20 dB mas in tense que el segun
do , los expe rirnentos muestran que este ultim o puede incrementar su sonor idad
hasra la equiva lente a un aumento en intensidad de IS dB. El efecto decrece al

76

Los efect os del ruido sobre el siste ma aud itive human o se pueden dividir en
desplazamientos temp orarios del umbr al de aud ibilidad (pe rdidas te mporarias
o rever sibles, TIS) ye n desplazami entos perm an entes de dicho umbral (pe rdi
das perrnanentes 0 irreversibles, PTS) .19 Estos ultim os pued en ser causados por
la destrucci6n inm ediat a de las estruct uras ffsicas del ofdo, en cuyo caso esta
mos en presen cia de un trauma acustico, 0 por el efecto ac umulativo de suce
sivas exposicion es d urante un perfodo relativamen te pro longado .
18 La pa lab ra "desborde" no es un a rrad ucci6n lireral d e "overshoo t" (exceder, rebasa r, so

bre pasar ), pero c reemos que describe mejor el fen ornen o alud ido .

19 De l ingles Pennanent Threshold Shift.

77

Candici6n

a)

L'
-

co

co

Alto

---'

_ 40

:s.
20
E
co
:2
"0
.Qj 10

Baja

o,

-- - --

e) _

durante 10 arias

Baja

b) l-

d)

40 haras semanales

c)!-

Umbral

Baja

- I

80

90

10 0

Nivel sonora en dBA

Alto

Fi gura 16. Perdi da perman ence de aud ici6n para f = 4.000 Hz


Fi gura 15 . So nog rarnas esque rnat icos del efecco de overshoot. a ) y b): situac ion basica; c)
a e) : efeccos del anch o de banda del ruido y del retardo en el a raq ue

oI
co 10

Perdida permanence de sensibilidad


Las perd idas aud itivas perrnanentes pueden di vidirse en d os gra ndes gru pos:
las co nd uc t ivas y las sensoneurales (0 pe rcept ua les) . Las conductivas lIevan a
un aume n to e n el umbral mas 0 menos pa rejo e n funci6n de la frecu enci a,
mi entras qu e las se nso ne ura les son mas co mp lejas .
El co noc im iento q ue poseemos del de splazam iento perrnan ente de l urn
br al de aud ibilida d 0 PTS se basa en estu d ios realizados en industrias y en ex
per imentos co n ani ma les. De e llos se desprende q ue existe un a rel ac i6n
aprox ima da men te lin eal en t re las pe rd idas de sens ibi lid ad y e l n ive l son ora de
la expos ici6n por encima de los 85 d BA, ta l como se observa en la figur a 16.
Se co ns ide ra q ue los ni vele s inferiares a 80 dBA n o producen efec tos n oci vos.
La rel ac ion entre el tiempo de exposici6n y la variacio n espectral de las
perdidas es mas co mpleja. Es co rruin q ue apa re zca d urante los primeros afios
un a d isminuc i6n de la se ns ib ilidad a lrededo r de los 4.000 H z, a rnpliandose
co n e l co rre r del tiempo h ast a oc upa r la banda comprendida entre los 3.000 y
los 6.000 Hz. Este praceso se muestra en la figura 17 .
Vemos q ue las frecuencias mas altas (entre 3.000 y 4.000 H z) son afec ra
das en los pr imeros afios de exposic i6n , mientras que las men ores (entre 1.000
y 2.000 H z) son alca nzadas con perd ida s significati vas al cabo de 20 afios 0 mas.
En los grafico s de las figuras 16 y 17 se ve con cl aridad qu e e l o fdo es m as
sens ible , y par 10 tan to mas fragil , en la regi6n de alta s frecu enc ias que en la
de bajas. Este hecho es e l ca usan te de la detecci6n ta rd la de la h ipoacu sia pro
vocada por ru ido, dado que la inteligibilidad de la palabra h ab lad a depende de

78

-- -

:s.co

20

~
"0

40

__ 5 arios

U
.Qj

50

- - - 35 aiia s

n,

60

~ 30

70

,~..

125

250

500

1000

2000

.. --
I

....

,," '"
I

3000 4000

6000

8000

Frecuencia (HZ)

Figura 17. Perdida perrn an ente de aud icion en funci 6n de l perfodo de exposi cion

la energfa en frecuencias rel ati vam ente bajas: las personas ac uden al medico
s610 cuando tienen d ificu ltades en la co mun ica c i6n oral, etapa en la que el
praceso ya manifiesta un gran ava nce.
En las figuras 18 y 19 se pued en ver microfotograffas de la membrana basilar
en las que se aprecia el deterioro que sufren las ce lulas de Corti a causa del ru ido.

Recluwmiento auditivo
El veciutamieiao auditivo oc urre c uan do el umbraI de aud ibilidad de un a perso
na est a par enc im a de l n ormal, pero su audic i6n es normal a altos ni vel es de
sonor idad . En e l suje to co n reclutamiento , la sonoridad aum en ta mas rapida
mente con la intensid ad de 10 q ue oc urre en un oven te con o fdo pro med io -al
me n os en las frecu enci as afecta das. Se podrfa asim ilar a un a suerte de cornpre
si6 n del rango de sonoridad .

79

Moore re lac iona e l recl utam ie n to aud it ive co n un dafio en las celulas c i
liadas exte rnas de la membran a basilar, que imp ide la co rrec ta cod ificacion del
ran ge d in arn ico del es tirnulo ac ust ico (M oor e, B., 199 7).

5. C ODIF1CACI6 N

DE LA INTENSIDA D

EI estud io de la codifica c ion d e la in tensid ad t ien e po r ob jet ivo exp licar la


for ma que tiene el ofdo de info rrnarle a l ce reb ro sobre c ua n in ten se es un es
timulo . 0, mas es pecfficarnen te , po r la man e ra en q ue se configura la re pre
sentac ion me n tal de la intensidad fisica de una seria l a pa rt ir de la ac tividad
de las ce lulas ne rviosas de l siste ma a ud itive. Se h a ve rifica do q ue la cod ifica
c ion de la in tensidad esta vinc ulada d irectarnente co n n uestr a habil idad pa
ra d iscrim ina r en tr e estfrnulos de d iferente in tensidad . S i pode mos di stingui r
en t re dos son idos, la d ife renc ia d eb e estar represe n ta da en todos los n iveles
de la ca dena a ud it iva, desde la coc lea h ast a los ce n tros super ior es de de c ision .
Los expe rime n tos de d iscrim in aci o n de la in te nsidad so n , por 10 tan to , la he
rram ienta base pa ra c rear mcd elos de codi fica cio n de la inten sidad ,
Un primer mo de lo, mu y si mplificado , estab lec e q ue la intensidad de un
estfrn ulo sin usoida l es cod ificada sirnple me n te po r la tasa de d ispa ro de las fi
bras de Cort i sin to n izada s a la frecu en c ia del est frnulo : a mayo r in te nsidad ,
mayo r ca n t idad de d isparos por un idad de t iem po. Est e modelo , sin embargo,
presenta varios in con ve n ient es.
El pr obl ema del rango dinamico

Figura 18. Celulu de Cort i en un aida sana

Figura 19. Ce lulas de Cort i en lin otdo dan ado par ruido

80

C omo hemos vista, e l sistema aud itiv e human e es capaz de de tectar d iferen
cia s en la in te nsidad de los est frnulos so bre un gran ran ge d in arni co, tan gra n
de co mo 120 dB en o yen tes co n o ido sano . La mayo ria de las ce lulas ne rviosas
aud itivas, aque llas q ue presen tan un a rasa de d isparo re lati varnente alta, tie
n en bajos umbrales de exc itac io n y rangos di n am icos co mparat ivarnen te pe
quefios. C asi todas se sa turan a l llega r a un a inte nsidad de ap ro xima darnen te
60 d B cuan do son es ti muladas a sus frec ue n ci as carac terist icas. La pro po rc io n
de fibr as en el ner vio aud itive q ue prese n ta n un arnplio rang o dinarn ico (60
dB 0 mas) es muy baja, de a lrededo r de l 10% de l tota l. Por 10 ta nto , se supo
ne qu e inte rviene mas de un mecanism o dife rente e n la d iscrirninaci on de la
intensidad. Los ca mbios en int ensidad pod rian se r cod ifica dos po r cambios de
la tasa de de scarga de las n euronas q ue ocupa n el ce ntro del pa tron de exc ira
c io n , po r un a exten sio n de l patro n de exc itac i6n (mas ne uro n as en t ran en
operac ion), 0 por una corn bin acio n ent re ambos mecan ismos. La sensibi lid ad
a la fase tarnbien parece in terve n ir en e l proceso.
La impo rtan te Ley de Weber para ruido de band a a ncha, qu e co n tin ua ac
tu ando para a ltas intensidad es, deb e prov en ir de la ope rac i6n del siste ma a udi
t ivo, no de prop ied ades estadisticas de l esn mulo. Pero no se puede ex plicar a
pa rt ir de la in formacio n cod ificada por un a sola n eu rona por los motives antes

81

apuntados. Es necesario encontrar un modelo que combine la tasa de disp aro


de un n iimer o pequefio de neuronas, cuyos umbrales y cambios dinamicos es
ten escalon ados de manera tal que permitan cubrir el rango dinarnico total del
sistema aud it ive . La informacion de las neu ron as que responden a frecuencias
caracter fsticas similares podria combinarse y op e rar en un "canal" indepen
d iente . La ley de Weber parece responder a cada un o de estos canales, sin to n i
zado a un ran go de frecuen cias dado y en paralel o con los demas.
Buscando un a respue sta a este pro b lem a, C arlyo n y M oore sugirieron qu e
e n la co d ificac ion periferica intervienen neuronas de d iferente umbral de d is
paro : a inte ns ida des moderadas inter vienen las n eu ron as de bajo umbral, lue
go esras se sa tura n y son reemplazad as paul atinam ente por las de alto umb ral
de di sparo (Carlyo n y Moore, 198 4). En la misma direccion, Delgute indica
que son poc as las neuronas necesari as para dar cuenta de la discriminacion en
inten sidad (D elgute, B., 1987). Segun este auto r, el numero requerido es de
aprox irnada rnen te 100 neuronas. Si se ex tien de esta con cl usion a la totalidad
de las celulas que ocupan la coclea, la dis criminacion deberfa ser mucho ma
yor que la q ue tenemos (podrla ser de menos de 0,1 dB a 1.000 Hz). De ser
cierta esta h ipot esis, la lirnitacion no depe nder fa de la infor m ac ion que trans
porta el n er vio aud itivo sino de los n iveles centrales de procesa m ien to.

Codificaci6n por extensi6n del patr6n de excitaci6n


Una ex plicac ion posible para la apa ren te paradoj a es qu e, al men os para esti
mul os de banda a ngosta, la informaci on sobre la intensidad se obtiene tarnbien
de las celulas a udi t ivas sin to n izadas a frecu en cias por en cima y por debajo de
la frecu encia del estim ulo. A pesar de q ue las ce lu las correspondientes a la fre
cuencia del esnrnulo se saturen, las que tienen frecuencias centrales diferentes
reciben men os ex cit acion y contimian dentro del rang o de funcionamiento. Se
ha sugerido que esta s celulas "fuera de frecuencia" son las responsables de la co
dificacion a altas intensidades (Zwicker y Fastl , 1990). Sin embargo, los resul
tad os de los experimentos sobre enmascaram iento demos traron que, a pesar de
que la ex tens ion lat eral de la zona de excitaci on puede ayuda r a discriminar a
altas in tensidad es, el sistema auditive puede cod ifica r la in tens idad sobre un
gran ran go dinami co empleando s610 la infor macion prove n ien te de un a pe
qu efia banda de frecuencias centrales en la membran a basilar.

las siempre en la zona de ac tiv idad , lejos de la saturacion, Est am os familiari


zados con algo similar, el control autornatico de gan ancia en la vista , que nos
permite ver bien tanto a plen e sol como en la rel ati va oscuridad de un cine.
En el ca so de la vista la rec uperac i6n es bastante lenta y ne ce sit amos un buen
tiempo para adap tar nu estr a sensi b ilidad al pas ar de un a sit uaci6n lum lnica a
o tra diferente. En el caso de la aud icion , sin embargo, te nernos q ue ser capa
ces de procesar son idos q ue va ria n dr am aticamente en in rensi dad sobre un in
tervalo de tiempo mu y breve: n ecesitamos disponer de l rango d ina mico
completo "al instante't"
La supresi6n es un proceso no line al en el cu al un a in tensa excitaci on en
una region de la membrana basilar reduce la excitacion en las reg iones veci
nas. Al tener un a co ns ta n te de tie mpo muy pequefia oc urre solarnente cuan
do se presentan sim ulta n earn en te el estfmulo supr esor y el sup rim ido. Es
posible que el mecanismo q ue produce la supresion ac tue tarnbien co mo un
control automatico de ganancia para estimulos de banda anc ha, y ayude a dar
cuenta del gran rango d in arnico del sistema auditivo.

Codificaci6n por sincronizaci6n neural


C arl yon y M oore sugirieron qu e, en ciertas circunstanci as, la in te ns idad pue
de ser codificad a por la estruc tura de segu im ien to de fase en las celulas audi
tivas: un incremento en la int ensidad de un est imul o sin uso ida l en presen cia
de ruid o puede ge ne rar un a ume n to de la can tida d de ce lulas sincron izadas
con la estructura fin a del estfrnulo, diferente de la del ruid o (Carlyo n y M oo
re, 1984). Los exper imentos rnostraro n, sin embargo , qu e este meca ni smo por
sf solo no puede ser responsable del gran rango dinamico presen te en el siste
ma auditivo.

Modelos basados en funciones intensidad-tasa de disparo


Una hipotesis diferente establ ec e q ue las celulas de Corti co n altas tasas de
d isparo son responsabl es de la cod ificac ion a bajas intensidad es, mie n t ras q ue
las celulas de Cort i co n bajas tasas de disparo se destinan a co d ifica r los est i
mul os a altas intensidade s, po r enc ima de la saturacion de las ante riores. Los
modelos basad os e n esta hi p6tesis se denominan modelos de doble poblaci6n. La
principal dificulrad q ue encuentran es la de explicar la co ns ta nc ia de la frac-

El papel de lasupresi6n y de laadaptaei6n


Plac k y C arl yo n dan un muy buen ejernp lo.ipodemos orr el gri to : "[El psi copa ta em!
bajando al corredor!", y a cori rin uacion los debiles sonidos de sus pasos en la esca lera
(Moore, B., 1995) .

ZO

Una posible soluc i6n serfa que el sistema aud itivo pudiera ajustar el rango de
ope racion de las celulas de acuerdo al ni vel de entrad a, de mo do de mantener

82

83

_J
ci6n de W e ber a 10 largo de cas i todo el rango dinarnico . Esta dificu ltad se in
cre me nta al constatarse q ue h ay much as mas celulas co n altas q ue co n bajas
tasas de disparo .
En uno de estos modelos de doble poblaci6n se sirnularo n las codifi cacio
n es basandose en el nu mero de celul as necesa rias para c ubrir el rango din am i
co comp lete a un a frecu encia dada: con s610 die z celulas comb in ad as es
posib le irnitar al sistema aud it ive (Vie rneist er, N. E , 1988). S in em ba rgo, po
see rnos mas de 50 para la m isrna funci6n. Es deci r, ten emos a la salida del n er
via aud itive infor mac ion mas que suficie n te pa ra codi ficar los estimu los sobre
un gra n rango de inte nsida des . Q uiza la pregunta no deba ser, en to nces , por
q ue es tan buena la cod ificac ion a altas in te ns idades, sino po r qu e no es me
jor de 10 q ue es a bajas in ten sidades.

Limites a la discri min aci6n en intensidad


H ernos tr azado los ca rninos q ue pueden servi r pa ra represen tar la intensidad
en el sistema a udi t ive pe riferico , A h or a co n side raremos el caso de los lImites
impuestos por las tra nsforrnac iones q ue oc urre n en los ce n tros de proc esa
m iento neural. En esta e rapa debe in co rpor arse un a de scripcion del rnec anis
rno q ue perrnire q ue las in tensidade s pued en ser a lmacena das en la me mori a y
de co mo las limitaciones de la mem oria afecran los resul tad os en las tareas de
discriminacion.

Limitaciones perifericas )' centrales


Los ex pe rirne n tos rea lizados par a determina r las ca rac te rfst icas de la di s
c rim inac i6 n de la inrensid ad, par a ex c itac io n es qu e aba rca n un a so la fre
c ue nci a ce nt ra l e n la mem bra na basi lar, a rrojan resultados co n t radic to ries .
Mi entras los mod e los de doble poblaci 6n sugie re n q ue la d iscri m in ac i6 n
esta ca rac te rizada por la frac ci6n d e W eber, los mo delos fisio logicos pre di
cen mej o r di scr imi n ac i6n a baj as y m edias intens ida des q ue a gra n des in
tens idades .
La riqu eza de la in forma c ion presence en el n ervio audi tiv o y la falla de
los mod elos de cod ificacio n basad os en las propied ad es de las fibras a uditivas,
en su in ten to por ex plica r el ex ito de la Ley de W eber, imp lican qu e en a lgun
pun to del pro ceso neural ce n tral no se h ace un uso co mple to de la informa
c ion q ue c ircula a ni veles per iferi cos (Carlyo n y Moore, 1984). Presurnible
mente, esta lirnitacion ce ntra l de term ina el de sernperio de los oyen tes en las
tar eas de discrim in ac ion de la in tens idad, y ev ita q ue el sistem a auditivo ten
ga un ren di rnien to supe rior a bajas in ten sidades.

84

Memoria de la intensidad
Muchos exp erimentos de d iscrim ina c ion de la intensidad emplean secu enc ias
en las q ue dos intervalos de observac io n estan sepa rado s por un intervalo inter
estfmulo (nt) . La a usenc ia de un efec to susta nc ial de este intervalo en las ta
reas de di scr iminacion cita das suste n ta la h ipotesis de que los oyen tes emplean
la memor ia de largo te rrn in o par a hacer las co mpa rac io n es entre el pri mero y
el segundo de los esn rnulos. U n a lmacena m iento en la memo ria de co rto te r
m in o deber la decaer en el t iernpo, ge ne rando una gran dependencia con la d u
raci6n del inter vale inter estfrnulo. Como un ejernplo ex trerno, Poll ack
ernpleo un llE de 24 h o ras y prac tic arnente no encontro de te rioro en la tarea
de discriminaci 6n de la inten sidad (Po llack , 1.,1953).
La memori a de la rgo ter rnino pu ede ser an ulada va rian do al azar, entre
pruebas, la intensidad de los estimulos en los intervalos de obs ervaci6n. Cuan
do est o ocurre , el ex ito en las tareas de d iscriminaci on de la intensidad baja
notab lernente al a ume ntar el us. Por ejemplo , la fracci6n de W eber aumenta
de 2 a 5 dB w ando el UE crece de 250 ms a 8 s. Esre ca rnbio se debe, presurni
blernente, al det eri or o del a lmace na rn ien to e n la memori a de co rto ter m in o.

Codif icacion de rasgos y codificac ion contextual


Durlac h y Braid a di stin guieron dos modos d ifer en tes de operaci6n de la me
mor ia relac ionad a con la d iscri rninacion de la inrensidad : la codificaci6n de re s
gos y la codificaci6n contextual (D urlach y Braid a, 1969). En la primera so n
alm acenad as las sensac iones dircctas - in med iatas- producidas par el estimu
10 , que ti end en a dccaer en cl tiernp o (son afec radas por la d uraci6n del ut) .
En el modo de cod ificacion co ntext ua l, por o rra pa rte , la in tensidad es cod i
ficad a en relac io n co n un a in tensidad de refe re ncia externa 0 con relaci6 n a
un a referenc ia interna "fuerte", como el umbral de aud ibi lida d 0 el umbral de
molest ia,
En circu n stan cias no rrna les la memoria de rasgos es suficien ternen te rica
como para ser relati varnente in mune a la degrad ac ion con el tiempo . Pero si
la informacion en la me moria de rasgos es redu cida grad ua lmen te, el sistema
se ap oya cad a vez mas e n la cod ificacion contextu al - aunque esta no es efec
tiva a intensidad es medi as debido a la di stancia qu e sepa ra a l est irnulo de los
limites pe rceptuales de refe renc ia,
Es ev iden te q ue el sistema aud it ivo necesita cod ifica r la in tensidad de
mod o rela tive en muc has oc asione s, simple rnente po rq ue los objeto s aud itivos
(como los fon emas en el h abla) se definen po r su in tensidad rela tiva, ya sea
entre co mpo ne n tes espectrales 0 ent re eventos sucesivos, La intens ida d abso

85

lura n o afec ra la identidad de los objetos a ud itivos en la ma yo rfa de los casos


- juzgam os que es eI mismo per ro el que lad ra a 2 0 a 50 m de dist an cia. Es 10
gico pensar, por 10 ta n to , que eI siste ma aud itivo deb a ex trema r su eficie nc ia
para las co mparac iones en t re estfrnulos cercanos en el tiempo an tes q ue pa ra
los separados po r mas de un os c ien tos de mili segundos.

)~~

Estimul o

FiurO
fiiadodea
la funci6n
transferencia
del oido
externo/medio

Calcular el
area bajo
el patron
especifico
de sonoridad

Transformar
la excitaci6n
en sonoridad
especifica

Transformer
el espectro
en patrones
de excitaci6n

Figu ra 20 . Modele de Moore en bloques para calcular la sono ridad

6. M ODELOS DE PERCEPC16 N DE LA SONORIDAD


Se h an elabo rado varios mode los fo rm ales qu e inten ta n descr ib ir cuan tirati
vamen te la percepci6 n de la so no ridad . Zwicker desar ro llo un model o de so
n or ida d basa do en la distribuci6n del patr on de exc itac ion en la me mbrana
basilar (Zwicke r y Fastl, 1999 ). En su mo delo el estimulo es conve rt ido en una
sonoridad espedfica POT banda ctitica (N -) a t raves de un a ley de potenc ia:

N - = C Ea
En la qu e N - es la sono rida d po r banda c rltica , E es la in tensidad de la e xci
tacion, y C y ex so n co ns ta n te s co n ex < 1.
Este mod e lo fue modi ficado por Moor e y Glasbe rg, qu ienes asume n qu e,
por deb ajo de 1 kH z, la fo rma del filtro aud it ive es igual al co nto rno isofo ni
co co rrespo nd ien te a 100 ton es, y qu e por encima de 1 kH z la fo rma del filt ro
esta de ter m in ad a por la inversion de la c urva um bral de audib ilida d (M oore y
G lasberg, 1986 ).21 La exc itac i6n es co n vert ida en son oridad espec ifica por
ba n da c rft ica a pa rt ir de la siguien te expres ion :

En la figu ra 20 se puede ve r el model o en bloqu es de Brian M oo re en su


version de 1997 (M oo re, B., 1997). La sono ridad to ta l es pr op or cio nal al area
baio un pa tron de sono ridad espe cifico . Este esque ma se ha incorpor ado a cie r
tos medidor es de so no rida d - no de in tensidad 0 presion ac ustica-, y de ac ue r
do con los info rm es parece q ue funciona razo nablem ente bien .
A lgunos paqu e tes de softwa re para ac ust ica de sa las e mplean mod elos si
milar es para brindar info rmac i6 n so bre pred icc io n de so no rida d y co n ellos es
posible caleular los ecogramas e n un a escala de sones. En la figura 2 1 se apr e
cia un ejemplo de esos ec ogra mas.

San a

I AO 0 1 lK

1~~-

---. --1 ----

-1i-.-.---.-.LI .-

I
-

- _ -

00

N - = C [(I senal)CL - (I umbral)CL ]


Aquf I senal e I umbral son las inten sidades co rrespond ien tes a la excitaci6n y al
umbral defin ido en el pa rrafo an te rior. N ot ese q ue si I senal = I umbrall a sono ri
dad especffica es nul a, y qu e ce rca del umbral un peq uefio ca mbio e n la exci
tacion provoca un ca mbio proporcion alrnente grande e n la so norida d. La
sono rida d globa l se caleula in tegrando las so nor idade s espec fficas posit ivas a
10 largo del patron to tal de exc itacion . EI ex ito de este modelo al predecir la
variacion de la sono rida d e n fun cio n de ca mbios en frecuenci a, in tensidad y
anc ho de band a apoya la hipot esis q ue establec e q ue la sono rida d esta relac io
n ad a co n la se lec t ivida d en frec uenc ia del sistem a aud itive periferi co, y n o d i
rec tarne n te co n la in te ns ida d ffsica del estf rnulo aciist ico .
11 En

86

Figura 2 1. Ecograma e n so nes simulado para una butaca en la platea del Teatro Argentino
de La Plata. La Fuente acustica ernitio un impulse de Dirac v irtual"
" En este caso se utilizo el paq uet e C ATT- Acoust ic v7.Z.

Moore, B. (1995).

87

Capitulo III
El oido como analizador espectral

En los capitulos precedentes mencionamos muchas veces las nociones de ban


da crfrica, ana lisis en frecuencia, discriminaci6n espectral V enrna scaramien
to. Ha llegado el memento de an alizar estos conceptos con det alle.
La habilid ad para separar 0 resolver los cornponentes espectrales de un a
serial compleja es consec uencia de la capacidad de analisis en frecuencia del
sistema auditive . Por ejemplo, si dos flaut as afin adas a diferentes frec uenc ias
se sopIan sirnultanea rnen te, es posible o fr al mismo t iempo dos sonidos dife
rentes, Se sabe q ue el ana lisis en frec uencia dep ende en gran medid a de la ex
ploraci6n espectr al q ue oc urre direc tam en te en la cocl ea. Toda sefia]
cornpleja, como la que genera la voz hu mana 0 un instrumento de musica, es
procesada en esta tempran a e tapa de la cadena auditiva. Los compone n tes si
nusoidales 0 de banda angosta son separados, codificados V transmitidos de
modo indep endiente por el nervio auditivo. Mas aiin , esta etapa temprana del
ana lisis no puede obviarse: todas las sen ales sufren necesariamente dich o pro
ceso. Por esto, la percepci6n de un son ido como un todo cohe ren te depend e
del rearrnado que tiene lugar en algiin punto superior del sistema nervioso.

1. DI FERENCIA APENAS PERCEPTIBLE ( OAP) EN FRECUENCIA

Una de las pregun tas elernen tales relacionada con el terna es la que inqui ere
sobre nue stra habilidad para discrimin ar ent re dos sefiales cuyas frecuencias son
ligerame n te diferent es. La respuesta, obten ida a parti r de un procedimi en to psi
coffsico clasico, int roduce el conc epto de diferencia apenas perceptible (OAP 0
JNO) t en frec uenci a, 0 limen de frec uenc ia. Para medirla se realiza un experi
men to en el cua l los sujetos oven alte rnativam ente dos sinusoides de igual so
n orid ad : rnienr ras un a de ellas mantiene con stante su frecuenci a la otra la
1

En mgles, just noticeable difference.

89

Detectable

modi fica leve rnente. El o bje to es de te rmi nar la m in irna dife renci a en frec ue n
cia necesaria para d isr ingui r e ntre a mbas seria les. En las figur as 1 y 2 se pue
den ve r los va lores de la DAP en frecuencia en fun ci6n de la frccu enc ia de base.
El resultado pued e sin tet izarse di c iendo que la DAP en frecuencia se man
tiene ce rcan a a 1 H z par a frecuencias por debajo de 1 kHz y que crec e paula

I
18
16

Sin cambio

~lL
I' j ~LL ~ lli
I - :
~

Frecuen cia

14

Mas dificil de detectar

Frecuencia

Ruid o enm ascaranle de ancho de banda variable

Frecuencia

Sena l sinusoidal de prueba

Figura 3. Esquema del expe riment o de Fletch er

12

N 10
;S

tin arnente a parti r de esta Irecuencia. Por encima de 5 kH z la DAP aurnenta


mas rapidarnen te , y mas alla de los 10kHz, nuestr a h abi lidad pa ra disc rim ina r
en tre d iferentes frec ue nc ias practicamente de sap arece .
La cuestion camb ia si e n lugar de sinuso ides empleamos seriales per iodi
cas comp lejas. Tal como ve rernos en e l ca p frulo v, e n est os ca sos la DAP pu e
de llegar a se r tan pequefia como 0 ,1 H z.

'<j

64

125

250

500

1000

2000

4000

8000

Frecuencia (Hz)

2.

Figura 1. DAP absoluta en frecuen cia; a ) obten ida a partir de sefiales sin usoidales de int en
sidades medias, ent re 60 y 80 dB, b) ob renida a partir de sena tes sin usoida les de inrensida
des ce rcanas al umbral de audibilidad (Wi er, [esteadr y Gr een, 1977 a)

0,9

0,8

0,7

0,6

-~~

Ya a med iados del siglo XIX alguno s in vestiga do res supo ni a n q ue el sistema
aud it ive no funcio n a en bloque y q ue di v ide las sefiales para su tratam iento
d et allad o. Una h ipot esis ternpran a planteab a la pre sencia de alguna cl ase de
ana lisis de frecuencia a ni vel de l sistema audi t ivo periferlc o. Este pro ceso de
anal isis en frec ue nc ia se h a estudiad o ind irectarnente a pa rti r del fen 6 men o
de enmascaramien to , que ocurre cuan do un son ido enmascara 0 "tapa" a otro de
di feren te frecuenc ia. El fen 6meno de en mas ca rarnien to se ana lizara con dew
lle en el pu nto 4 de este capf rulo .

0.5

Experimento de Fletc her

0,4

0,3

El experirnento fund aciona l en este camp o 10 real iz6 H arvey Flet cher en
1940 .2 Fletcher midio el aumen to del umbral de deteccion pa ra una sefial si
nu soid al en func i6n de un ruido enrnascar ante con de n sid ad de po te ncia cons
tan te y banda pasante va riable. El ruido esraba centrad o a la frecue nc ia de la

0,2

0,1

64

125

250

500

1000

Frecuencia (Hz)

Figura 2. DAP relariva en frecuencia

90

B AN DAS C RiT lCAS

2000

4000

8000

Harve y Fletch er (1884-1981), ftslco e inge niero estadoun idense. Fue uno de los mas des
tacados invest igadores en psicoac ustica durant e la primera rnitad del siglo xx.

91

sinusoide y su potencia acustica se incrernentaba a medida que crecia el an


cho de banda.
El experimento de Fletcher, que fue repetido gran cantidad de veces des
de entonces, revelo aspectos desconocidos de nuestro sistema auditive. En la
Figura 4 se aprecia un resumen de dicho experimento, realizado por Moore y
su equipo en 1993 (Moore, B., 1997). En el grafico se observa que el umbra 1
de deteccion para una serial sinusoidal de 2.000 Hz aumenta al principio a me
dida que crece el ancho de banda del ruido, pero a partir de un valor deterrni
nado -400 Hz en la figura- se produce un quiebre marcado de la curva de
umbral, que deviene practicarnente constanre.
Para dar cuenta de esta singular caracteristica, Fletcher sugirio, si
guiendo a Helmholtz, que el sistema auditive periferico se comporta como
si estuviera compuesto por un banco de filtros pasabanda en paralelo (Ila
mados fatros auditivos), cuyas bandas se traslapan. Cuando tr a tarnos de de
tectar una serial en un ambiente ruidoso, usamos el filtro cuya frecuencia
central (FC) se acerca mas a la frecuencia del estfmulo: la serial pasa pero
atenuarnos gran parte del ruido de fondo, correspondiente a los otros filtros,
Solo la porcion de ruido que atraviesa el filtro centrado en la serial la afec
ta significativamente. Como es de esperar, si se incrementa el ancho de
banda del ruido aumenta la porencia de ruido que pasa por ese Fittro en par
ticular. Pero una vez que el ancho de banda del ruido supera al del Fittro au
ditivo su capacidad enrnascarante deja de crecer. La parte del ruido que cae
fuera del Fittro sintonizado con la serial no afecta nuestra habilidad para de
tectarla.
Se asume que el umbral de deteccion para una serial sinusoidal esta deter
minado por la cantidad de ruido que atraviesa el correspondiente Fittro audi
tivo. Mas especificamente, el urnbral estaria vinculado a una cierta relacion
serial/ruido a la salida del Fittro. Este modelo es conocido como el mode1o del
espectro de potencia, en el cuallos estirnulos estan reprcscntados por su espec
tro de largo tiernpo, sin fluctuaciones transitorias que involucren cambios en
las fases relativas.
El terrnino banda cntica (Be), acufiado por Fletcher, gen cralmente se re
fiere a un hipotetico filtro rec tangular que simula el cornportamiento de los
filtros auditivos reales. El ancho de bandarectangular equivalente (ERB) es el an
cho de banda de un filtro rectangular ideal que posee igual maximo de trans
mision que el Fittro real y por el que pasa la misma potencia total ante una
entrada de ruido blanco. Fletcher establecio las siguientes hipotesis, que defi
nen su modelo del espectro de potencia:
El sistema auditive periferico contiene un banco de filtros pasabanda
lineales.

92

76
75

ill
"0

74

C1l

>c

Q)

if)

73

~
.0
E 72

::J

71
70
50

100

200

400

800

1600

3200

Ancho de banda del ruido enmascarante (Hz)

Figura 4. Umbral para una sinusoide de 2.000 Hz en funcion del ancho de banda del ruido
enrnascaranre

Cuando un oyente intenta detectar una sefial en un entorno de ruido


emplea un filtro auditive centrado a la frecuencia de la serial. En general es el
Fittro que entrega una mayor relacion sefial/ruido de salida.
Solamente una banda angosta de frecuencias que rode a al estfmulo,
aquellas que caen dentro de la BC, contribuye a enmascararlo.
El umbral de deteccion de la sefial esta deterrninado por la cantidad de
ruido que pasa por el filtro auditivo correspondiente. La potencia del esnmu
10 P dividida por la potencia del ruido dentro de la banda crftica es constante
(k).
k = P / (W

X Nt' )
W=P / (b N o )

ancho de la banda critica, en Hz.

N[. = densidad de potencia del ruido, en watts/Hz


(la potencia en una banda de 1 Hz de ancho).

Midiendo P y No es posible estimar W. Segun Fletcher, la constante k vale


aproximadamente 1, aunque mediciones recientes la sinian en 0,4. La diferen
cia tiene que ver con el contorno espectral del ERB equivalente, que no fue to
mado en cuenta por Fletch er,
Sabemos que ninguna de las hipotesis anteriores es estrictamente co
rrecta: los filtros no son lineales, los oyentes cornbinan la informacion de
varies filtros para aumentar la capacidad de deteccion y el ruido que cae fue
ra de la banda pasante del filtro auditive atecta al umbra] de deteccion, Pe

93

5000

ro estas imperfecciones no imp lican que la hip6t esis central del mode lo es
te eq uivoca da . De hecho , gran parte de los avances en el ca mpo se han ba
sado en ell a.
La forma rect an gular de l filtro auditivo propu esta por Fletcher merece un
cornenta rio aparte . Si el filtro fuese perfectarnente rect an gular el umbr al de
det ecci6n deber fa crecer a una rasa de 3 dB por cad a duplicacion de la banda
de ruido , En la figura 4 se puede ver que !a curv a de crecimiento tiene una
pendiente much o menor. Este desvfo del valor reorico se debe probable men
te a dos fact ores: el filtro no es rectangular, y las pequefias flucruacion es del
ruido afecran la detecci6n de una manera aprec iable.

~
U
'"c:
'"

2000
1000

"0
D

500

Q)

s:
o
c:

,,

200
100

R efin amien to del modelo de Fletc her

P = k fo~ W (f) N(f) df


Midiendo los ca mbios en el umb ral de detecci6n de P en func i6n de l ancho
de band a del ruido, es posible evaluar la forma de l filtr o aud itive W(f) .
En gene ral se eligen ruidos de band a ang osta en vez de sinusoides co mo
enrnascarantes a fin de evitar los batidos que se gene rarfan con la seria l en
rnascarada. Para ruidos de banda muy angosta, sin emb argo, aparece n fluctu a
ciones que pueden ser oidas. Otro mot ivo por el cua l se eligen ruidos de
ban da co mo en masca rantes es que mucha s veces el filrro aud it ive que gene
ra la mayo r respuesta es uno ce ntrado a una frecuencia diferente de la fre
cuenc ia de la sefial a derectar, Esra impo rtan te ca rac te rfst ica, en la que e l
ofdo explora el ca mpo audible "moviendo" su ventan a espec tral para buscar
la mejor respuesta, se den omin a audici6n [uei a de frecuencia.3 Para desact ivar
este efecto se co loca ruido a ambos lados de la zona de ex plorac ion con el me
rodo de supresi6n de bandas por cooet tuta de Patterson , que se describe en el
apa rrado siguiente.
Otro rnetodo muy ern pleado para esrudiar la selectiv idad en frecuen cia
del ofdo co nsiste en medir las curvas de afina ci6n psicoaciistica, en las que se
emplea ruido de band a an gosta para evitar la interferen cia de los batid os.
3

Off-frequency listening en ingles,

94

,,

c).

~. - - - - - - 1 0 0 Hz

0,05

EI modelo de l espectro de pote ncia se emplea com o punta de partida para el


desarroll o de modelos mas precisos. Si el ruido enrn ascarante se representa por
su espec tro de pot encia estac io nario N(f) y la forma espec tral de l filtro aud i
tivo por W(f) , la potencia de la serial en su umbr aI P se puede calcular con la
siguien te ex presi6n:

, ". "

'l-\

"0

,
,,

0,1

0,2

0,5

10

20

Frecuencia (kHz)

Figura 5. An cho.de banda crft ico en funci6n de la frec uenc ia cent ral. Las Iineas de pun tos
indic an aprox imac iones lineales para baja yalta frecuenc ia (Zwicke r, Flottorp y Steve ns,

1957)

En la figura 5 podernos apreciar el ancho de band a crftica en funci6n de


la frecuencia central de ban da. Para frecuencias medias , la banda crit ica tiene
una extension de a lrededo r del 15% de la frecuencia cent ral (corre spon de a
un intervalo musical a media ca mino en tre un ron o -segund a mayor- y un to
no y med io -tercera menor) .

MetoOO de supresi6n de bandas por cobertura


Para satisfacer las condiciones impuestas por el modelo de Fletcher es necesa
rio, entonces, usar un ruido enrn ascarante q ue ev ite la aud ici6n fuera de fre
cuencia, y que ade rnas limite el rango a lrededo r de l cual la relaci6n
sefial/ruido man tiene valores sign ificativa rnen te a ltos. EI ruido enmascarante
disefiado por Patterson , cuyo espec tro se puede apreciar en la figura 6, cumple
can ambos requi sitos (Patterson , R. D., 1976 ). La forma del filt ro audit ivo
puede estudiarse midien do el urnbral de pot encia P para la serial en funci 6n
del ancho de la muesca en el espectro del ruido.
El ernpleo de ruidos enrn ascarantes de esta clase es muy cormin en el es
tudio de sefiales tran sitori as, pues las band as lat erales "cubren" los puentes es
pectra les provocados por las tran sicion es rapidas de la sefial, que aparecen
com o consecuencia del prin cipio de ind et erminaci6n acustico (Basso, G.,
1999, 2001a).

95

. . ....

. ... . . . ....

"r-- - - - -- - - - - - - - -- - - - - - - - --"

~ l
-;;;
~

Banda de ruido
enmascarante

Banda de ruido
enmasca rante

.~
J!!

VI

~
ro

Filtro auditivo

31mm 28

24

20 17

13 mm

Distancia
al eslribo

1,0

!'!

'u
e

'0

a0. 0,5

a.

Frecuencia (escala lineal)

2000

Q)

I I I I'

I I I I i I

'

200

Q):;

Q)

o e

,
lk

,! ,

2k

...

51<

Frecuencia (Hz)

f es la frecuencia central de la band a en Hz. Cada ERB corresponde a una distan

500

co 'S

'0

""

200 300 500

1000

'0 0

elli

100

I I I I II

'0>

ro ~
.oro

' ,],-,

20 30 50

. Figura 8 . Posic ion del maximo de resonanc ia en la membrana basilar al ser estirn ulada
por una serial sinus oidal de frecuenci a variable (Bekesy, G . Von , 1960 )

Q)

Q3ro

<l:

0,0 I

Figur a 6. Esq uema del ruido en rnasca ran re usado por Patterson pa ra estima r la forma
del filrro aud irivo

100

.r: J)l

u u
e Q)

<l: a:

50

i.L
20 I f il l

0,05 0,1

0,2

I I I 11' 1

0,5

I I I I III

10

Frecuencia central (kHz)

Figu ra 7. Esrirnacion de l ancho de band a de l filuo rectan gular eq uivalen ce en funci on


de la frecuencia cent ral

Forma del filtTO auditivo

cia de alrededor de 0,89 mm en la membran a basilar. La con jetura de Greenwood


se basa en las mediciones realizadas algunos afios an tes por Von Bekesy.
Si el filtro aud it ivo fuese lineal su forma no carnbiarfa con la intensidad
de l estlmulo. Pero no es asi: a bajos ni veles de excitacion es aprox imadarnen
te sirne trico, pero deja de serlo a medida que aumerita la po tencia de la serial,
En el grafico de la figura 9 se puede ver la forma del filtro auditive en fun ci6n
de la intensidad. En particular, la ex tens i6n de baja frecuencia posee un an
ch o de banda mayor que la de alta frecuencia.
Esta acep tado que las bandas criticas son con tin uas pues no ha y ev iden
c ia experimen tal de d iscontin uidad en tre ellas. Podemos hablar de la existen
cia de un a band a crlt ica alrededor de cualquier frec uencia audible.
A veces, es util especificar la esca la de frecuen cias de un experimento to
man do el anc ho del filtro rect an gular eq uivalen te como unidad:
Niimero de ERB = 2 1,4 10g lO (4,37

Experimen tos co mo los anteriores, y otros sim ilares, han llevado a los inves ti
gado res a form ular qu e el filtro rectan gular equiva lente sigue aprox imada me n
te los valores de la figura 7.
G reen wood prop uso en 1961 qu e el an cho del filtro rectan gular equivalcn
te represen ta un a distan cia cons tante a 10 largo de la mem bran a basilar. La re
laci6n de G ree nwood, corregida por G lasberg y Moore (1990 ), es la siguien te:
ERB

96

Extremo basal
Extremo apical

24 ,7 (4,37

f+

1)

+ 1)

En la actua lidad se puede predecir a parti r de q ue n ivel una serial compleja


puede ser detec tada en un arnbiente de ru ido calc ulando los umbrales de sus
parciales mas prominentes. Para frec uencias medias el criterio di ce que con
un a relaci6n sefial/ru ido de -4 dB la sefial com ienza a ofrse. Es decir, que el es
tfrnu lo deb e superar el ni vel a -4 dB del ruido de salida del filtro audi t ivo que
le corresponde. Un modelo que ap lica cons ideraciones similares fue usado co n
exi to en el disefio de sistemas de co mun icac i6n en aeropuertos, a mediados de
la decada de 1990.
97

90
Sumatoria de sonoridad

90

80

80

70
(il
OJ

m 60

:s
ro

:9

co

-0

60

--0g
c

40

50

<Il

Qj

.2:

70

ro

50

<Il

OJ

-0

,g

OJ
-0

30

40

Q;

>

20

30
20

10

20 dB

10
50
0,6

0,8

1,0

1,2

1,4

100

200

500

1000

2000

Ancho de banda (HZ)

1,6

Frecuencia (Hz)

F igura 9 . Form a del filrro aud it ive cen trado a 1.000 Hz en func i6n de la in rensidad
del esruu ulo, de 20 a 90 dB en pasos de 10 dB

Figura 10 . N ivel de so nor idad para un ruido de ban da ce n trado en 1.0001-t en funci6n
del an ch o de band a

3. SONORIOA D A NT E ESPECTROS COM PLEJOS

U mbral para estimulos complcjos

En cl aparrad o 4 de l capitulo J] an alizamos la infl uen cia de los fact ores espec
qu e in te rvi en en en la percep cion de la son oridad. Pcdernos aha ra exa
m in ar el tem a dcsde otra perspectiva.
Cons ideremos un a sefial aciistica de intensidad fija y an cho de ban da va
riable W. Mi entras W se manten ga menor que la banda crftica BC la sonori
dad sera mas 0 men os indepe nd ien te d e W, e igua l a la de un tono puro de
igual intensidad situado en la frecuen cia cent ral de la banda. C uando W su
pcra la BC , la sonoridad comienza a incr ementarse. Por 10 tanto , para una
dcu .nn inada can tidad de ene rgfa la sonoridad es mayor si la enc rgfa se repar
l ~_ sobre un ruim er o de bandas crfticas, en vez de estar co n ten ida en un a so la
de ellas. En la figura l O se aprec ia el aurnento de sonoridad alud ido. 4
Esre efec to es mu y importante en musica ya q ue el a ument o de sonoridad
dcpcnde de la suma de las sonoridades especi ficas en las d ifercn rcs band as. Por
cjemplo , doblar un bajo a la octava es mu ch o mas efectivo, desde el pun to de
vista de la sonoridad , que dob larlo al unfsono a unq ue la energfa ffsica puesta
en juego sea la misma.

Cuando dos est irnulos sin usoidales poco separados en frecu encia se prcscn tan
juntos, puede olrse sonido aun cuan do cada esnrnu lo por sf mismo esre ubica
do por deb ajo del umbra]. G assler propus o que, dcntro de un a banda cr ft ica,
las energias de los co mpone n res de un est fmul o complejo se surnan algebra i
ca men te.? Spi egel , por el con trario, sugiere qu e el ofdo es capaz de in tcgrar la
en ergia sob re anc h os de ban da mayores que un a BC (S piegel, M . E, 1981).
Al gunos ex pe rimentos real izados co n sin uso ides mu y sep aradas confirman es
to ultimo.

I rules

4 A lgunos autores 10 denorninan "surna de sonoridad"

98

(loudness summation).

Sensibilidad a la fase
En un ce lebre exp erirnento rcali zad o por Zwicker y rep et ido casi iuc dio si...lo
mas tarde por Sek se ern plearon dos sefia les csrac ionarias , una modulada en
amplitud can un Indice de modulaci6n m y o tra modu lada en frecuenc ia ca n
un fndi ce de modulaci6n b (Sek, A. , 1994) . S i se igualan los Indices de mo
du lacion (m = b) y b es pequefio , el espec tro de potenci a de las scn a les es
; G assier (1954 ), en Moore, B. (1995).

99

identico. Las co mponentes de las sefia les s610 d ifieren en sus fases relativas.
EI resultado de este experi mento muestra q ue somos sensibles a las fases rel a
t ivas de una sefial esta cionari a cuando las componentes caen dentro de una
misma banda crftica. Por el cont rario, cuando las co mpo nen tes se encuen
tran separadas en frecuencia por una dista ncia que supe re el valor de un a
banda crit ica, las fases relativas dejan de percibirse. So lo en este caso parece
va lida la ley acustica de Ohm, q ue pos tu la la insensibilidad a la fase del siste
ma aud itivo.?
Di scriminacion de parciales en sonidos co mplejos
La ley acust ica de O hm tambien estab lece que el ofdo es capaz de percibir los
componentes sin usoida les en un son ido complejo . Plornp enco n tro que esta
hab ilidad llega, segun la frecuen cia de la fundame ntal, has ta el q uin to u octa
vo parc ial (P lomp, R., 1976). Co n su rnetodo -diferen te al de Fle tche r- est i
mo un valor para la banda critica algo menor a la medida por el metodo de
enmascaram ien to . Plom p introdu jo la h ipotes is adicional de que un parcial
puede ser ofdo en el entomo de otros parc iales si se encuentra separado de es
tos ultimos por 10 menos en 1,25 veces el valor del ERB de l filtro aud itivo que
le corresponde.
Los experimentos de Soderquist parecen probar que los musicos poseen
bandas crft icas menores a las de los no rmisicos (Soderquis t, D. R., 1970). Sin
embargo, Fine y Moore mostraron que no hay tal diferenc ia (Fine y Moore,
1993). La interpretacion mas aceptada es la que presume la exis tenc ia de al
gun meca nismo, mas entrenado en los musicos, que actua a n iveles no perife
ricos en la de tecc ion de parci ales.
Selecti vidad en fr ecuencia en ofdos dafiados
Hay considerable evide ncia de que la select ividad en frecue nc ia d ismin uye
por dafio en la coc lea. Una co nsec uencia es la gran sens ibilidad al en rnasca
ram ien to q ue posee n las person as con lesiones coc leares, con la consiguie nte
dificu ltad para ofr en am bien tes ruidosos. Un impedimento ad icional apa rece
ante el analisis percep tual de son idos complejos como la palabra y la rmisica ,
por ejernp lo en la disrninucion de la habilidad para distinguir entre diferentes
t imbres. Co n los audffonos conven cion ales no mejor an estas dificu ltades pues,
aunque conv ierta n en audibles las seriales, no se recupera la selec t ividad en
frecue nc ia perd ida.
6

Ohm (1843), en Moore, B. (1995).

100

4.

ENMASCARAMIENTO

EI enmascaramiento acustico es un fenorne no habitual en nuestra vida cot idia


na. Cuando elevamos la voz para ser oidos en una reunion, cuando perdemos
parte de un a conversacion que es "tapada" po r el paso de una motocicleta con
el escape libre, 0 cuando el ruido de una aspiradora nos imp ide seguir un dia
logo en el televisor, 10 estamos experimentando. La cuestion puede plantea r
se de la siguiente man era: si alguie n esta oyendo un son ido inten so a un a
cie rta frecuencia, lqu e in tensidad debera tener ot ro sonido, a un a frecuen cia
difere nte, para que 10 poda mos percibi r? EI enmascaramiento se defin e como
1) el proceso que provoca un aume nto de l umbral de audibi lidad para la serial
enmascarada 0 2) la cant idad de aumento de l umb ral expresada en dB.
Wege l y Lane publicaron el pr ime r trabajo sistematico de investi gacion
sob re el enmascaramien to de un to no po r otro, pero sus resultados se cornpli
caron por la apa ricion de batidos entre las sefiales (Wegel y Lane, 1924). Pa
ra supera r el problema en los exp erimen tos recien tes se emp lea ruido de banda
angosta tanto para las seriales en mascarante co mo enm ascarada.
Los patrones de enmascaramiento obtenidos experimen ta lmen te mues
tran una pendiente mas abrupta en la zona de baja frecuenc ia que en la de al
ta frecuencia, tal como se aprecia en la figura 11.
Los graficos anteriores ponen en ev idencia el uso simul taneo de mas de
un filtro aud it ivo. Una explicacion posible es interp reta r esta forma como un
ind icador del mod elo de excitacion del ruido enmascarante : el patron de en
mascaramiento seria pa ralelo al patr on de la excitacion, pero desplazado ver
t icalmen te una pequefia cant idad de dB. En la practica la cuestion no es tan
senci lla, pues tambien in tervien en los facta res propios del mecanismo de "oi r
una frec uencia diferen re" y la de teccion de los productos de cornb inac ion en
tre la seria l y el ruido enmasca ran te.
Moore y G lasberg descri bieron una forma de derivar las curvas de enrnas
ca rarniento usando el co ncepto de filtro aud itivo (figura 12) , en la q ue supo
nen que el ancho de banda de los filt ros aumenta al aumentar la frecuen cia
ce ntral FC (Moore y G lasberg, 1983).
A la descripcion anterior se le debe agregar la acc i6n de las ondas progre
sivas en la mem brana basilar segun el esquema de Von Bekesv. Una frecu en
cia elevada pro duce un maximo de vibracion en la membrana basilar cerc a de
la ve n tana oval, mien tras que una de baja frecue ncia se esparce practicamen
te por toda la membran a. Esta caracterfst ica de "enrnascarar hacia las frecuen
cias agudas" se puede ver en el grafico de la figura 13.
Como se observa en la figura 13, la segun da sefial se pe rcibe con facilidad
si su frecuencia esta alejada de la frecu encia de la serial enmascarante, pero la

101

100

100

a ........ Umbral de audib ilidad

80

Intensidad del ruido


do banda angosta

80

.,."

CD

:2

Aumento del umbral causado


par una banda de ruido
Aumento del umbral causado
par una sinusoide

c:

<ll

CD 60

:2- 60

c;

40

so

'"o

40

Qj

~ 20

.2:
Z

E
c:

20

ill

-<..:::r /

oI
100

250

J '"

-"""'T=-

1000

2000

4000

'--

500

J,..

'-i

8000

Frecuencia (Hz)

""W
u
c:
'0
13

400

800

1600

3200

Figura 13. C urvas de enrnascaramie ruo : a ) umbr a ] de audibilidad, b) aumento del umbral
causado par una banda de ruido y c) aurnenro delumbral causado por una sinusoide

200

Frecuencia (Hz)

Figurn 11. Parrone s de enrnascararnienro para ru ido de band a angosta centrado en 500 Hz

CD

dificultad crece apreciablemen te a medid a que ambas sefiales se acercan. Esro


no deberfa sorp rend ern os pues sabemos que, si comparten un a rnisma banda
crit ica, dos seriales se perturban mut uamen te y la mas debil no se percib e a
menos que posea un porcent aje apreciable de la ene rgta de la mas in tensa, al
ga asi como 6 u 8 dB por debajo de la enrnasca rante . C uando la segunda serial
est imula una banda crit ica diferente, sin embargo, el estim ulo llega al cerebra
por un canal separado y todavia no ocupado: la serial enmasca rada puedc per
cibirse estan do aun 30 0 40 dB por deb ajo del ruido.

-10
-20
-30

OJ

u 40
c:
0

D.

-50
0,5

1,0

1,5

2,0

R elaci6n en tre las bandas cr iticas y el mecanismo de en mascaramicnto

Frecuencia (kHz)

0
-10

CD

:2-

-20

c:

'u -30
.8
u
x

ill

-40
50
0 ,5

1,0

1,5

2,0

Frecuencia (kHz)

Figu rd 12. Der ivaci6n del patron de enmascaramiento segun Moore y G lasberg

102

H ay mu ch as semeja nzas entre las select ividades en frecuen cia med idas tan
to en la mem brana basil ar co mo a partir de expe rimen tos psicofisiolcgicos
(Moore, B., 1995 ): cada a ncho de ba nda rectan gular equ ivalente ( ER B) co
rrespon de a alrededo r de 0 ,9 mm en la membrana basilar, sin qu e irnpor te
el centro de frecuencia co ns iderado . S in embargo, a pesar de la buena co
rrespon dencia entre e l co mpo rtarnien to de la co clea y la medida de los
ERB, es posible qu e ex ista un mecani sme de "afinac ion " del anch o de banda
en etap as supe ri ores de procesamiento. Esto podrfa lograrse a traves de me
can ismos de supresi on 0 inhib icion la teral. Si la ba nda cr it ica de pe nde de
un proceso n eu ral inhib itori o, se pued e esperar q ue el mismo demore algu
nos mi lisegun dos en ac t uar: la band a c rft ica para sefiales co rtas deb e rfa ser
mayor qu e para sefiales largas. Los datos ex perimen ta les en este pu nta se
con trad icen .

103

ZIIIIIlUb-------------------
I

M odel a s de cobertu ra y su pres ion


H ay dos modelos q ue explican el proceso de en mascararn ienr o. EI mod e lo de

coben usa in vol ucra la sa turac ion de la ac tiv idad n eural ev ocada por la sefial.
S i el ruido en mascaran te prod uce una can tidad significa tiv a de ac t ividad en
la banda crit ica que norma lme nte responde a la seria l, en tonces la act iv ida d
agregada por la seria l resul tara cubiert a y no se la pod ra detectar, Consi dere
se, po r ejemp lo, el caso de un tono jun to a un ruido de ba nda ancha . EI urn
bral del tono esra a -4 dB por deb ajo del ni vel del ruido en su banda crft ica.
La exc itac ion co mbina da de l to ne y el ruid o es 1,5 d B mayor que el ruido so
lo: 1,5 dB represen ta el increm en to m inirn o necesario para la deteccio n del
to ne (por eje mplo, si el tono estuviera a -20 dB , el n ive l to ta l h abn a aume n
tado 0 ,05 d B y no serta aud ible).
EI segundo mecan ismo posib le, desarr oll ad o por el mod elo de supresi6n,
se basa en la hi p6tesis de que el ruid o enmascaran te suprime la acti vida d neu
ral que la serial producirfa de est ar sola.
Po r el moment o no hay ev ide nc ia fuerte qu e perrnita descartar alguno de
los dos mecan ismos, aunq ue q uiza se co mbine n ambos. S in embargo, el ex i
to de los mod elos lineales de co mbinac i6n de filt ros aud itivos en la ex plica
ci6n del patron de en masca ra miento inclina la balanza hacia los mecan ismos
d e cobert ura, pues la supresio n es un proceso alrarnen re alineal.
Modelos temporal es de en mascaramien ta
Existen dat os q ue apoya n la hi pot esis del uso de los patrones temporales de dis
paro ne uron al en el ana lisis de est irnulos complejos (una sin uso ide produce
d isparo s neur ales cuyo int er vale temporal es un multiple en tero de su perfo
do ). Si la regular idad temp oral es menor que ciert o valor - com o oc urre co n el
ruid o alea to ric- la sin uso ide sera en mascarada. El mecanisme te mporal pare
ce efectivo iin ica men te pa ra frecuenc ias por debajo de los 4 0 5 kH z y cabe su
poner la acc ion de un disposit ivo sensible a la fase.
O tro elemen to q ue posibleme n te se empl ee en la det ecc i6n de un a serial
sin usoida l en un fond o de ruido es el cambio en la en vo ivent e de la onda co m
bina da, que flucni a menos en presenc ia de la sefial sin usoida l.

5. ANA uSIS ESPECfRO-TEMPORAL COMBINA DO


EI mod elo del espect ro de pot en cia asume q ue, cuan do tratarnos de detect ar
una sena l sinuso ida l en presencia de un ruid o en rnascaran te, hacernos uso de

104

la salida de un filt ro aud itive ce n trado a la frecuen cia de la sefial. En general,


se supo ne que la prestaci6n se basa en la salida del filtro que provee la mayor
relacion sefial/ru ido y que los um bra les corresponden a un a relac ion serial/rut
do consta n te. Las fases rela tiv as de las co mpo nen tes y las fluctuaciones de Cor
to tiemp o del ruido en rnasca ran te son igno rada s. Este mod elo funcion a bien
en muchas situac iones , pero no en todas, En parti cular, hay evidencia de que
los oyen tes a vece s realizan co mparaciones entre diferentes filtro s aud iti vos,
Mas aun , ciertas fluctuaciones temp orales de l ruido en mascarante pueden te
ner efectos impor tan tes.
Reduccion del en rnascararnien to par co rnodulacion
H all demostr o qu e las co rnpa rac iones en tre filtros aud it ivos pueden aumen rar
la detecci6n de seriales sin uso ida les en presen c ia de ruido (Ha ll, D. et ol.,
1984). Para que oc urra este efec to debe ex ist ir una fluctuacion co he ren te 0
correlacionada entre diferen tes bandas del ruid o en mascaran te , fen ornen o al
que Hallllam 6 comodulaci6n.7 En la Figura 14 se aprecia el resulr ado de su ex
perirnento.
Hall uso ruido de un a banda de anc ho variab le. Tarnb ien se puede n em
plear dos 0 mas bandas de ruido, incl uso una en cada ofdo , sin qu e vade el re
sultado .
Se asume usual mente que la redu cci6n del en ma scararn ien to por como
dulacion depende de la co rnparac ion en tre las salidas de d iferen tes filrros au
diti vos. S in emb argo , tarnb ien se produce un efec to similar cuando la
fluctuaci6n cae den tro de una sola band a crit ica, aunque en ese caso la dismi
nu cion del umbraI resulte men or. La redu ccion del en mascaram ien to por co
modulaci6n es mayor cuando la variac ion del ruido en masca rant e es lenta y
cua ndo este cubre un gran anc ho de banda. Para sefiales de hasta lOO ms de
duraci6n la redu ccion de l en masca ramiento por co modulaci6n puede lIegar a
11 dB. Esta d ismin uci6n alcanza los 14 dB en el caso de ruido en rnascarante
de dos ban das cuando la band a agregada se ubica cerca de la frecuen cia de la
primera ban da. Tarnbien aurnen ra hasta lIegar a un max imo de 16 dB cuan do
hay mas de dos band as en juego. La magnirud de la redu ccion del enm ascar a
mien to po r cornodu lacion no camb ia co n la frecuencia central del estfrnulo.
La compa racion entre las diferentes env olventes temporales de los filtros
aud it ivos parece ser un hecho co rmin en el ana lisis de los pa t rones aud it ivos.
A pare n temente juega un pap el mu y irnportant e en la ex tracc i6 n de seria les
7 H oy se 10 den orn ina reducc ion de l enrnasca ram ient o po r comod ulac i6n 0 CMR

(conmodu

/arion maskingrelease).

105

til 60

FI

:2.

I
R

R
I

~ ~Vt--.~
I
K'
~
'"

55

,t."

.!!1

E
~
::J

W
"0

45 1

M
I

50

/I
))

Ancho de la banda enmascarante (kHz)

Figura 14 . Resultado del experimen to de H all. Los puntos marcados "M" corresponden a
los umbrales obte nidos con ruido enrnascarante modulado en arnplit ud ca n una serial irre
gular que varia lentarnenre

de ambientes ruidosos y en la d iscriminaci6n en tre va rias fuentes acust icas,


Tarn bien da c uen ta , al menos en parte , del "efec to de ca fe teria" ("cocktail
party effect" ) .
Hay dos clases de modelos que in te ntan ex plica r la redu cci6n del en mas
ca ramien to por co modulaci6n. Los qu e in tegran el primer grupo asumen qu e
el siste ma aud it ivo co mpa ra los patrones de modul aci6n de las envolve n tes de
las salidas de los d iferentes filtros audit ivos: la presencia de una serial es reve
lad a por la disparid ad en la modulaci6n en tre los filt ros.
Un segundo grupo de modelos sugiere qu e la fluctuaci6n de las en volven
tes a la salida de los filtros audi t ivos indican los mom entos 6ptimos en los que
se debe escucha r la sefial. Es decir, du rante los mfnimos de la en vo lvente del
en masca ran te.
Estos modelos no son mutuarnente excl uyentes y no parece que la redu c
ci6n del en mascaram ien to por comodulac i6n depend a de un uni co mecanis
mo simp le.
Enmascaramiento no sirnultaneo
Los efecto s del tiempo sobre el enmasca ramiento han sido estu diados en deta
lle par nume rosos in vest igadores. El en masca ram ien to "hacia arras", co n la se
rial precediendo al ruid o enrnascaran te, parece pro ven ir de un a co nfusion
106

en tre las seriales que afecta a los sujetos con poca practica. De heche , oyen tes
entren ados - rnusicos y tecn icos de audio ent re otros- obt iene n mejores por
cen tajes de deteccion que los sujeto s prorned io. Por otro lado, el en rnascara
miento "hac ia de lan te", con el ru ido en mascarante p reced iendo a la serial, es
un o de los tres proc esos que alteran el umbral de un a serial que tien e lugar des
pues de otro soni do . Los otros dos son la fat iga y la adap tacion. Se disti ngue
de ellos por estar limi tado a sen ales que apa recen dentro de los 200 ms des
pues del mom en ta en que cesa el ru ido en masca rante .
El en masca ramien to hac ia delan te t ien e las siguientes part icul ar idades:
1) es mayor cuan to mas ce rca en el t iemp o se suceden ambas sefiales: 2 ) los
incrernen tos en el n ivel del ruido en rnasca ran te no co rrespo nden a incrernen
tos iguales en el um braI de la serial (a d iferencia del en masc aram iento sirnul
taneo , que responde a una relaci6n serial/ruido co nsta n te), y 3) depende de la
relacion.de frecuen cias entre ambas seriales (igual q ue en el en rnascararnien
to simult aneo), Los pro cesos que dan cue nta del en masca ram iento no sirnul
tan eo no se co no cen co n exactitud , aunque pro bab lemente sea n co nsec uenc ia
de la co mbinaci6n de varios a la vez. La superposici6n temporal de patrones
de vibrac ion en la mem brana basilar - una suerte de co la de resonan cia 0 "rin
ging"- parece ser imp ortant e , asf co mo la adaptac ion de corto term ino tant o
en el ner vio aud itivo co mo en los ce n tros ne urales superiores.

Supresi6n lateral en el enmascaramiento no simultaneo


Los experimentos sobr e en mascaramie nto sirnulta neo pueden ser exp licados a
partir de la superposici6n de filtro s audit ivos aprox imadame nt e line ales. S in
embargo, las respue stas neur ales son marcada men te alineales. En part icu lar, es
impor tan te destacar el hech e de q ue la respuesta a un a serial puede ser supri
mid a por otra de diferente frecuencia en el fen6me no de supresi6n entre dos to
nos, que describe el hech e de que la respuesta an te un estimulo sin usoida l
puede an ularse par la presenc ia de un segundo estfrnulo. En la figura 15 se
aprec ia este importante efecro.
Los efectos de la supresion com ienzan y cesan mu y rapidarnen te, den tro
de unos pocos milisegundos luego del co mienzo 0 fin del segundo estfmulo.
Para seriales mas co mplejas, el fen 6m en o tom a el nombre de supresi6n la
teral, en la que un a fuerte activida d a una frecuenc ia ce ntral puede suprimir
un a act ividad meno r a un a frecuen cia adyacente. Las cres tas del pat r6n de ex
c itac i6n son resaltadas por los va lles que las rode an .
La pregun ta es w o r qu e la supr esi6n later al no se revela en el en rnasca
rarniento no simultaneo ? Houtgast estud io exte nsa mente el caso a parti r del
umbral de pulsaci6n (Houtgast , T., 1972) . En el enma scaramiento simulta neo
107

Enmascaramiento binaural
80

CD

50

~
Q;

>

Z 40

20
2000

5000

10k

15k

Frecuencia de los eslimulos (HZ)

Figura 15. A reas de supresion de un estirnulo por otro

la supresi6n se manifiesta porque cua lquier reduccion en la ac tiv idad del rui
do en rnasca ran te en la regi6n de frecu encias de la sefial se acompa fia co n un a
redu ccion sim ilar en la ae tiv idad de la seria l enmascarad a. En otras pa labras,
la razon "sena l en mascarada /ru ido enmascarante" no es afectada por la supre
si6n. En el en mascaram ien to no sim ultan eo la supresi6n afec ta al ruid o en
mascarante perc n o a la sefial.
O tra diferencia importante es que la seleet ividad en frecuenci a del en
mascarami ento n o sim ultaneo es mayo r qu e en el simultan eo (rnedido por
ejem p lo a partir de la curva de afin ac ion psieofisiea 0 PTS) .

Examen del perfil espectral


Green y sus co legas dernostraron en 1988 que los oye ntes co mpa ra n la sa lida
de diferentes filtros aud itivos para mej ora r la detecci 6n de un a sefial especffi
ca, aun en los casos en los que el ruido y la sefial flucui an sincronicarnen te.
Sugiri eron que se perc ibe un ca mb io entre el perfi l espectral del ruido en pre
sencia de la seria l y el perfil en ausencia de la misma. El ana lisis es mas efec
tiv o cuan do : 1) el ruid o de fondo posee u ri gran aneho de banda; 2) h ay varias
co mpo ne n tes de la serial dentro de l rang o espeetral del ruid o y 3 ) el ruido de
fondo se co mpo ne de bandas de sim ilar intensi dad.
En un sen t ido el exa me n del perfi l espeetral no sorpr ende: la form a de l es
pectro es un o de los facto res relevantes a la hora de identificar una vocal 0 un
timbre musical.

108

El umbraI de en mascara miento pu ede ser marc adam ente menor cuando la se
fia l se oye co n am bos of dos. La difer encia de ni vel entre la audici6n binaur al
y la monoaur al se co noce co mo nivel de enmascaramiento diferencial (MLD). El
MLD llega a ser de 15 dB para baj as frecuencias y se reduce a s610 2-3 dB para
sefiale s de 1.500 H z. N o es cas ua l qu e el lirnite de 1.50 0 H z sea el mismo que
el de nu estr a ca pac ida d para co mpa ra r las fases de las seriales entre los dos o f
dos dur ante la localizaci6n espac ial. En la figur a 16 se aprecia cu alitativarnen
te un expe rime n to clas ico en este ca mpo .
Para qu e el efecto ten ga lugar se debe agrega r el mismo ruido a los dos oi
dos (0 al menos deben estar co rrelac iona dos 0 provenir de la misma fuente).
Se ha obser vad o en masca rarnien to binaural en sefiales sin uso idales, en cli cs y
en el habl a. En situac iones reales apa rece cu ando la serial y el ruido provi enen
de diferentes posieiones en el espac io y se relaciona fuertemente con el efec
to "cocktail party". La banda del ruid o en rnasca ran te q ue ac tua en las condi
ciones de en masca ra miento d iferencial es la que co rresponde a la frecuencia
de la serial. H all sugiri6 qu e los filt ros aud itivos qu e intervienen en la detec
cion monoaural y binaural son los mismos, pero que la det eeei6n binaur al de
pende de la sal ida de mas de uno de ellos en paralel o,
La inteligibilidad del h abl a en co nd iciones de ruid o arnbiental mejora
con sefiales an t ifasicas, en espec ial a niveies ce rca nos al umbral. Las co ndi cio
nes antifasicas n o s610 mej oran la capacidad de det ecci6n de sefiales, sino qu e
tambien incrementan la h abilidad para discriminar sefiales.f Los pro cesos de
enmascaramiento y de localizacion espac ial, sin embargo , par ecen procesarse
de manera separada .
Los mode los mas recient es, co mo los de Colburn, S tem y Trahiotis, asu
men que las tasas de disparo de los difer entes filt ros audit ivos pro venientes de
los dos ofdos son co mpa radas por det ect ores de coi n cide n cia que proveen un a
especie de sal ida bid imen sional , co n un a d imen sion ca rac te rizada por las fre
cuencias centrales de los filtros aud it ivos y la otra por el ret ardo interau ral
(Colburn, H . S., 1995) . U n co mp lejo modelo, el de Yoich i Ando , da cue nta
con bastante detall e del proceso de eval uac i6n inter aur al y fue util izado en el
disefi o de salas para mu sica n o arnp lificada (Ando, Ye t al., 1997 a) .

BU n pararnetro uti lizado en el estud io de salas para rruisica y palabra, el coeficiente de C01Te
lacion CTUZada interaural (ixcc ), cuan tifica la co rrelac i6n existen re en tra las seriales que lle
gan a los dos o tdos.

109

"'Cb----------------a)~

b)~ .~

C)~
V\f\N\v

d)~

Sonidos de combinaci6n de segundo orden

W~

Figura 16. Enmascaram ien to bina ural

6. DISTORSl6 N AUN EAL Y SONlDOS DE COMBINAC l6N


El vio lin ista ital ian o G iuseppe Tartini obs erve en 1714 qu e al ejec uta r dos
son idos mu y intensos se generaba un tercer sonido, mas grave, c uya frecu cn
cia co rresp ond fa a la diferenci a en tre las frecu encias de los dos son idos origi
nales, La apa rici 6n de d icho sonido difer encial no deberta sorprcndernos ya
que sabemos que el ofdo presenta cornportarnientos alineal es en practica
mente to das las etapas de transm isi6n y procesamiento de sena l.? El tfrnpa
no, la cadena de hu esecill os y el ofdo inte rn o co nt ribuyen de manera va riab le
a la alincalidad to ta l, a un que es mu y d iffcil hallar el orig en exacto de la dis
torsion en cada caso.
Un sistema de tr an sm isi6n alin ea l produce arm6 n icos cuando se 10 cxc i
ta co n un a sin usoide pur a (Basso, G., 200 1a). Los productos de est a distorsion
arm6 n ica son di ffcil es de ofr pues se co nfun de n con los arm6 n icos propios del
esrirnulo ffsico y se integran a la peri odi cid ad definida por la fund am ental de
Fourier de la seria l. Pero si el ofdo es excitado con dos senales sin uso ida les, la
distorsi6n alinea l produce un a gran ca ntidad de artefactos que se percib en co
mo sonidos resulcantes 0 de combinaci6n. En teorfa, ex isten infinidad de sonidos
9 A unqu e aqui adopcamos la deno minacion tradicion al de sonidos diferenciales y de sonidos
de combinaci6n, no los de bemos confundir con las sena tes ffsicas qu e los causan ni con las
frecuenci as de dic has sefiales ftstcas.

110

resultantes, pero en la pra ctica son aud ib les solam ente los de menor frecuen
cia. Se los pu ede cla sificar de acuerdo co n la can tidad de vec es que aparece n
las frecu encias de los estirnulos i, y fz en la formula correspondiente. En la ta
bla de la figura 17 se ind ican los soni dos de co mbin ac i6n de menor orde n .
En la tercera columna estan los arm6ni cos de cada un o de los cornp onen
res primarios. Por 10 gene ral, los son idos de co mbin ac i6n de las dos prime ras
columnas no sigue n un a estructura arrnonica. '?

El espectro d e los son idos de co mbi nac i6n de segundo orde n 0 cuadrciticos se
puede apreciar en la figura 18.
Ademas d e los arm6 nic os de los co mpo ne ntes primarios (2fl Y 2fz), se ge
nera un sonido diferencial (fz - !l) y un o adicional (fl + fz) de gran amp litud . El
sonido adi cional es d ificil de ofr po rq ue cae en una regi6n esp ectral en la que
existen arrnonicos, si las sefiaies primari as son co mp lejas. Tarnbien es en rnas
carado con facilidad por los co mpo ne n tes primari os ft Yh
En carnbio, el sonido diferencial se perci be co n facilidad, sobre rodo
cuando su frecu encia es mucho menor qu e fl' Aunque la frecu encia resultan
te (h - f\) es la misma , no h ay que co nfund ir el son ido diferencial - producto
de la distorsion alineal del ofdo- co n el batido ffsico , qu e se origina en la in
terferencia entre sefiales sin usoidales -un proceso lineal.
Para un siste ma regul ar con d istorsion cuadrat ica , el nivel del son ido d i
ferenci al sigue la siguien te ec uac i6n :
NI (fz - it)

Nl (ft) + NI (fz) - C z

C z es un a constan te que depende de la profundidad de la distorsion cuadrati


ca . Los exp erimentos psicoacusticos sobre e l tema la ubican en un valor apro
ximado de 130 dB . Es decir, co n NI (ft) = NI (fz) = 70 dB, el niv el de
intensidad del diferencial alcanza 10 dB y no se 10 percibc en todas las ocasio
n as. Pero con Nl (ft) = NI (fz) = 90 dB e l ni vel de intensidad del diferencial
llega a 50 dB y se 10 pe rcibe co n relati va fac ilidad .
Se asume que la alinealidad ca usan te de los son idos de combinaci6n de
segundo orden se origina en su mayor parte en el ofdo mcdio, con un a parti
c ipac i6n menor del tfrnpano y del o fdo int erno.

10 Una excepcion se da cuando una frecuen cia primaria es igual


ejempl o, i: = Nfl (Basso, G., 200 1a).

multiple de la otra, Por

111

r,

Primarias

f, -

Secundarias
Tercer orden

r,

f, + f,

2f , - f,

.zr,

3f, -f,

.sr, .r, ,

Cuarto orden

Sonidos de combinac ion de ter cer orden

f,

- f,

2f, + f,

.zr,

+ f,

3f, + f ,

. sr,

+ f, ,

2f, - 2f,

2f, + 2f,

...

...

2f,

.zr,

3f,

. sr,

4f, , 4f,

...

Figura 17. Frecuencias correspondient es a los sonid os de co mbinaci6 n de menor orden . Se


presupon e f2 > f j

a.
E

<l:

III
I, - 1,

I,

21, I, + I, 21,

I,
Frecuenc ia

Figu ra 18. Distorsi6n cuadrat ica pura a partir de dos cornponentes primarios de frecuenc ia

f1 \' f2

El espect ro de los son idos de com bin aci 6n de tercer o rden 0 cubic os, gene
rados por un siste ma regular con distorsion cubica, se puede apreciar en la
Figura 19.
Los soni dos adicionales cubicos de alta frecuencia (2fl + iz) y (2iz + fJ)
son extremadament e diftciles de oir. Los sonidos diferenciales cubicos (2fl - fz)
y (2.fz f l) poseen el triple de amplit ud que los terceros arm6n icos (3fl) y (3fz)
de los co mpon entes primarios. En c iertas circunsta nc ias el mas bajo de ellos,
(2fJ - fz) , es tan audible co mo el d iferencial cuadrat ico (f2 - fl )'
Sin emb argo, en este caso la relaci6n entre ni veles de en trada y sonori
dad percibida no sigue un a ley tan simp le co mo en el caso de los son idos de
combinaci6n de segundo orden , El d iferencial cubico (2fl - iz) persiste a n ive
les de estfmu lo muy bajos y su audibilidad dcpe nde en gran medida de la fre
cuencia de los comp onen tes primarios. Po r ejemplo, dec rece rapidamente en
sonoridad cuand o la diferen cia en tre iz y i, supera un valor cercano al 30%.
Estos hechos revelan la existe nc ia de un a alinealidad esencial, en la que el sis
tema no se puede aproxi mar a un siste ma lineal para pequefias amp litudes de
sefial. Se sabe que el origen de esta alinealtdad esencial aparece mas alia del
ofdo medic . Se supone q ue surge de la actividad de las celulas mot oras en la
c6clea 0 en algun ce ntro de procesa miento ne ural superior.
En la figura 20 se aprec ia el co rnpor tamie n to de los sonidos diferen ciales
mas audi bles en fun ci6n de la diferen cia de frecuencia en tre los comp on entes
primarios y en la Figura 2 1 se grafican en not aci6n musical aproximada los di
ferenciales cuadratic os y cubicos presen tes en alguno s intervalos sencillos.

7. ALGORITMOS PSICOACUSTICOS DE COMPRESION

a.
E

<l:

I,

21,-1,

21,+1 , 1,+21,

I,

21,-1,

31,

sr,

Frecuencia

Figur a 19. Distorsion cubica pura a part ir de dos co mponentes primario s de frecuencia f[
\' f2

112

El fen orneno de enmascaramiento se emplea desde la decada de 1980 en el di


sefio de siste mas para co rnpresion de arch ivos de audio de gran eficacia. Se los
denom ina gene rica rnen te algoritmos psicoacusticos de compresi6n y, de todos
ellos, en la actualidad el mas difundid o es el MP3. El objetivo primario de es
tos sistem as es el de redu cir el tamafio de los arch ives digita les de aud io que
-en codificacion PCM estand ar- ocupan alrededor de 10Mb por minuto de re
gistro y tienen una rasa de transmision de 1,4 Mbps. La cornpresion permite
un ahorro de espacio de almacen amien to y una mayor velocidad de tr an srni
sion a traves de sistemas de red. A con t inuacion describiremos brevemente las
ca racte rfsticas principales del codigo MP3 , que en prin cipio no difiere sustan
cialmente de otros forrnatos de co rnpresion de aud io menos difund idos.
113

Frecuencia
21, ~ - - - - - - - - - - - - - - - - - - - _. - -
Estimulo I,
(Frecuencia variable)
3/2 I,
Eslimulo I,
(Frecuencia fija)

I,

IC1 = 12 - I ,

Ic3 = 31, - 21,

: Sonidos dilerenciales

y- I
,

'I

I,
Unisono

c2

3/2 I ,
Quinta

21,
Octava

=21, - I,

Frecuencia
del estimulo
variable

Figura 20. Diferen ciales cuadra ricos y cubicos en funci6n de la diferenc ia de frecuen cia
entre los compone nres primaries (tornado de Roederer, 1997)

1 ::
-0-

()

.Q.

-0

()

~?
( )

En primer lugar, los archivos de audio, generalmen te en dos canale s PCM de


44,1 kH z de muestre o y 16 bits de resolucion , son transform ados en frecuencia
y separados en 18 sub-bandas por canal. Cada sub-banda reproduce aprox ima
dameme el tamafio de un an cho de banda crft ico, La tasa de tran srnision se fi
ja a un valor meno r al de un CD de audio para limitar int en cionalm en te la
can tidad de bits disponibles y forzar la cornpresion . A partir de un modelo psi
coac ustico se exa mina cada sub-band a y se decid e a cuales se destin a la mayor
cant idad de bits. Par ejemplo, las band as qu e son enmascaradas por otras mas
potentes reciben menos bits parque en ellas no se va a percibir el ruid o de cuan
nzacion, product o inevitable de la menor resolucion. En otros terminos, se re
mueve la parte de la sefial que no vamos a poder ofr al quedar enmascarada.
A la salida del cod ificador psicoacusti co se agrega un codificador por re
dundancia, po r eje mplo uno de H uffman , q ue pe rmi te llevar la tasa de co m
presion a un valor fin al de h asta 12:1 sin que se degrade signi fica tivamen te la
ca lidad de aud io. En la figura 22 se puede aprecia r un di agrama en bloqu es del
proc eso completo .
La profund idad de co mpresion depend e de la calidad de aud io requer ida
y del tipo d e serial que se va a codifica r. Por 10 general, una rasa de tra nsrni
sian de 128 kbps se considera suficiente para alcanzar la calidad de aud io de
un CD, al meno s si se emplea un sistem a de monitoreo de calidad med ia y la
rruisica no posee gran ran go dinamico,
Es muy imp ortante tamar en cu enta que la co dificacion MP3 y todas las
que ernplean esta clase de procesarniento psicoacustico son tecnicas a pe rdida
de inform acion. La serial cod ificada no puede vo lver a su est ado original un a
vez fina lizado el proce so.

Figura 21. Nor acion musical aproximada de los sonido s diferen ciales mas destacados

La sigla M P3 es un a abrev iatura de MPEG - l Layer 3, un formato defini do


par el Mot ion Picture Expe rts Group (MPEG). Es part e de un extenso pro gra
rna destinad o a estab lece r estandares pa ra la indu stri a del c in e, la tele vision ,
la musica y de siste mas multimedia.'! El algoritmo de compresion/descompre
sian (Codec) del forrnat o MP3 comprende dos etapas principales. En la prime
ra etapa se remueve la parte inaudible de la serial y en la segunda se eliminan
las redundancias del material remanente.

11 La parte de audio de MPEG- l (no rma ISO/IEC IS 11172-3 ) fue esrablecida en 1991 y con
siste en tres modos de operaci6n de complejidad crecien te: Laver-I , Layer-Z y Layer-3. En
el estanda r MPEG-Z, sucesor del MPEG -l , se define el Adva nced A udio Co d ing (AAC) que es
ta reernplazando al MP3 en muchas ap licac iones.

114

Seiial de
audio digital
(peM)

Seiialdeaudio
codificada
~' 92 kll i ls/ s
.!!J

t'""""1

:i5 u

~5
.~~

32kbils/s

==
~:g

u
g

Figura 22 . Diagrama en bloques de un cod ificador MP3

115

Capitulo IV
Procesamiento temporal de sefiales

Decir que los sonidos del ambiente, de la musica y del habla dependen, nece
sitan y, en ultima instancia, estan hechos de tiempo, es enunciar una verdad
de Perogrullo. La naturaleza del sonido es el devenir y el estudio de sus rasgos
esenciales ha planteado, y plantea, arduos problemas filosoficos. De las mu
chas experiencias que nombramos con el terrnino "tiernpo", algunas involu
cran nociones relacionadas con la sucesi6n, el presente, el pasado y el futuro.
Otras con las ideas de instantaneidad, simultaneidad y duracion, Tambien es
tan las que tienen que ver con la flecha temporal y la irreversibilidad del tran
sito del pasado al futuro. De la nocion de tiempo se derivan de forma mas 0
rnenos directa otras como movimiento, velocidad, pulso 0 ritmo. La dificultad
del llamado problema del tiempo radica en articular semejante variedad de fe
nornenos y conceptos dentro un sistema coherente.
Son abundantes y variadas las soluciones propuestas hasta ahora para re
solverlo. Pero es posible reconocer en la historia del pensamiento dos grandes
tendencias, La primera -que cuenta en sus filas a Arist6teles, Newton y Eins
tein- considera al tiempo como un hecho Fisico al que se adapta la mente hu
mana. La segunda supone que el tiempo es un fen6meno que pertenece a la
mente humana y que el de los ffsicos es un constructo proveniente de la idea
lizaci6n de los contenidos mentales. Se pueden situar en esta ultima linea a
pensadores como San Agustin, Brentano 0 Husser!. Para Paul Ricceur estas
opciones no se solapan por entero: a la perspectiva ftsica le falta la capacidad
de concebir un presente a partir del instante, y a la perspectiva psicol6gica le
falta sustento a la hora de explicar de forma satisfactoria el durar.
En la actualidad, la mayorfa de los investigadores conjeturan que el tiempo
no responde a un modelo de tipo univoco, sino que constituye una entidad que
se debe pensar desde varias perspectivas diferentes. Segim Fraser (1992), existen
al menos seis categorfas temporales: 1. Atemporalidad: en un universo en el que
solamente hay radiacion electromagnetica el tiempo no existe. La emisi6n y la
absorcion de un fot6n ocurren, en 10 que se refiere al fot6n, simultaneamente.

117

2. Prototemporalid ad : en un uni verso de parnculas elementales el tiempo


es fragmentario. No fluye y ca rece de direccion, Los sucesos se pueden situar
de forma esta d ist ica porque la sing ularizac ion de un instan te concret o ca rece
de significado.
3. Eotemporalidad: en el uni verso rnacroscopico de la materia dotada de
masa el tiempo es con tin uo, pero inmovil y sin direccion, No se le apl ican los
co nc eptos irreversible s de pasado , presen te y futuro . Es el t iempo de las leyes
de la rnecanica clasica.
4. Biotemporal idad : es el tiempo de los anirnales. Tiene d ireccion y ex iste
un pasado, un presente y un futuro , pero sus horizontes son lirnitados. Los bor
des del presente son estables y probabl emente caracterfsticos de cad a especi e.
5. Nootemporalidad: es el tiempo de la mente humana. Existe un a cl ara
n ocion de pasado , presente y futuro y sus horizontes son ilirnitados. El pre sen
te tiene bordes difusos, que varian segun la atencion.
6. So ci ot ernporalidad : es el tiempo co lectivo que regula el ritmo soc ial.
Lo organ izan los relojes y los calendar ios.
El esquema de Fraser, aunque simple y parcial, sirve para entender qu e
e l problema del ti empo no puede abarcarse por co mple te desde un a sol a
perspectiva.
Al margen de las especulac ione s conc eptuales, el tiempo es un pararnetro
ac ustico importante pues casi tod os los son idos fluctuan durante su desarr ollo.
Mas aun , para son idos que contien en informacion, como la palabra y la m usi
ca , esta aparece en los camb ios antes que en las partes est ables. En esto s casos
es conveniente distinguir algunas escalas temporales diferentes: 1) la micr oes
ca la, que va desde algun os milisegundos a varios cientos de milisegundos y qu e
porta la estructura fin a del sonido; 2) un a escal a qu e co n te rnpla los ca mbios
mas lentos, carac te rizados por las env olven tes temporales de los parametros
ac ust icos, que va desde un as decimas de segun do h asta algun os segundos; 3)
otra que contenga las estructuras co mpuestas que toman varios segundos en
des arrollarse, como palabras y motivos musicales, y 4) la rnacroescala tempo
ral, que puede abarcar minutos enteros y en la que se despliegan oraciones y
frases musicales. Esta ultima escala depende direc tarn ente de la memori a de
co rto terrnino. En los grandes desarrollos musicales, co mo el de la forma sona
ta, tarnbien juega un rol decisivo la memori a de largo terrn in o.

1. RESOLucrON

curre el tiempo y permite aurnen ta r la capacid ad de discrirninacion ante un


estfmulo de larga duracion. La mayorfa de los estudios psicoacust icos se orien
ta hacia ternaticas relacionadas con la resolu ci6n temporal. Sin embargo, la in
tegraci6n temporal juega un rol destacado en cier tos gen eros y est ilos musicales
que ernple an la aliteracion de sonidos en los que algiin par am etr o deri va len
tamente.! La ma yoria de los autores concuerdan en que la resolucion temporal
depende principalmente de dos procesos afines. Por un lado se realiza un ana
lisis del patron temporal dentro de cada canal del filtro auditivo y, por el otro,
se comparan los patrones temporales correspondientes a canales diferentes.
La mayor dificultad al intentar medir la resolu cion temporal es consecuen
cia de la in ev ita ble relacion ent re tiempo y frecuencia propia de tod o fenorne
no ondulat ori o, que depende dir ectarnente del principio de ind eterrninacion
acustico . Los ca mb ios en el patron temporal de un a serial estan aco rnpan ados
generalmente de una modi ficacion en su espectro . Por ejernplo , al interrum
pir bre vernente una sinusoide aparece un espe ctro de banda ancha qu e se oye
como un clic muy sonoro. En la Figura 1 se apre cian los graficos temporales y
sonogramas co rrespond ientes.
Puede oc urrir que un a aparente deteccion temporal sea en realid ad una
deteccion espectral -por eje rnplo, e l espe ctro de potencia de un par de clics
mu y cercanos en el tiempo es d iferente del espect ro de potencia de uno so lo
de ellos. Para ev itar esta cl ase de confusion es, en las pruebas experimentales
se adoptan dos estrategias diferentes, La primera co nsiste en ernplear sefiales
de espectro in variante ante cam bios en su pa tr on temporal. El ruid o blanco,
por ejemplo , co nserva el espectro p lan o aunque se 10 secc ion e repentinarnen
te , tal como se aprecia en la figur a 2.
La segunda est rategia emplea est imulos cuyos espectros se rnodi fican al al
terarse los patrones temporale s - como ocurre con las seriales sinusoidales. Pa
ra evitar la co n fusion entre dete ccion temporal y espectral, a la sefial de base
se le agrega ru ido de fondo a fin de en rnascarar las bandas de frec uencia que
surgen en cada trans icion, El ruid o de Patterson, ya visro en el punto 2 del ca
pitulo 1II , es uno de los mas eficaces ya que no alte ra a la senal en su banda
central (Patterson , R . D., 1976 ). En la Figura 3 se puede apreciar la tecn ica de
Patterson para en rnascarar las bandas laterales que apa recen en las transicio
nes en una serial sinusoidal.

E INTEGRACION TEMPORAL

Much as veces se confunden dos nociones relacionadas con el procesamiento


temporal de seriales, Una de elias, la resoluci6n temporal, es la habilidad para de

118

tecrar ca mbios en el estfmul o a medida que trans curre el tiempo . La otra, la in


tegraci6n temporal, es la ca pac idad de agregar informacion a medida que trans

I Hay numerosos ejemplos en la rmisica del sudeste asiatico . En occ idente, la integracion
temporal const ituye UD proceso central en el minimalismo.

119

+rl- - - -

--------,

iii
Q)
~

Banda de ruido
enmascarante

co

co

'u

'"

cQ)

13

'u
c

co

Banda de ruido
enmascarante

Sefial

u,

0..

Frecuencia (escala lineal)

Figur a 3. Te cni ca de Patt erson aplicada a una sinusoide

Ef ect os de la fr ecu en cia central en la resolucion temporal

Tlernpo (ms)

Figura 1. Grafico temporal y espectral de una discontinuidad en una sinuso ide

r::;

Eo

co

'u
c:
Q)

:0

<.:!

~
u,

1i empo (ms)

ro
:s.
"0

:~

a.
E

<l:

1i empo (ms)

Figura 2. G rafico temporal y especrral de una dtsconrinuidad en una serial de ruido blanco

120

Se ha sugerido que la reso lucion te mpor al deberfa ser mejor a alta que a baja
frecue ncia. Una discontinuidad en un a sinus oide causa un a cola de resonan
cia ("ringing" en ingles) en cad a filtro aud itivo, que se rnant iene durante mas
t iempo a medid a que decrece el ancho de banda del filtro aud itivo correspon
dien te -por aplicacio n de l principio de indeterminaci6n aciist ico. En la figu
ra 4 se puede observar la rnodificacion temporal ejer cida por el filtro aud itiv o
centrado en 1.000 Hz sobre un a serial de entrada de 1.000 H z.
Como las band as mas angostas se en cuentran a baja frecuencia, es logico
suponer que en dicha region del espectro la resolucion temporal resulte infe
rior que en la zona de alta frecuencia, Datos experimentales sugieren que , por
encima de los 2.000 Hz, el tiempo de respue sta de los filtros auditivos es muy
pequefio y no afecta sign ificarivarnen te la resoluci6n temporal. Por debajo de
esa frecuencia la resoluci6n disminuye aprec iablemen te.

2. RESOLUCI6N TEMPORAL

EN SENA LES DE BAN DA ANC HA

En gene ral, los experime ntos en los que se intenta dete rrnina r el umbral de de
tecci 6n de disconti nu idades (gaps) se basan en sefiales de ruido de banda an
cha o El metodo mas uti lizado es el de elecci6n forzada entre dos altemat ivas
( 2 AFC), en el que el sujeto debe decidir cual de los dos pu lsos sucesivos de rui
do contiene el gap. El umbra l de discontinuidad medido en esta clase de expe
rime ntos, por ejemplo el realizado por Plomp, es de 2 a 3 ms (Plomp, R., 1976).
Otro grupo de experimentos ernplea seriales de banda ancha invertidas en
el tiempo . Sab emos que el espectro de potencia de largo tiempo de una serial
121

I'"

a)

.. ~~ ~ ~ ~~.~

-0

ro

-0

'iii

Q)

-0

ro

"0

'iii

Q)

10

15

20

25

30

~ i~W~i~1

iII

:s

~~ !~~~~ !I

1 1~ 1 1 \1 1~l l l li

~ ~~mi~

Ii

liempo (ms)

Figura 4, Respuesra sirnulada de un filrro auditive de Fe


seccionada de 1.000 Hz

1.000 Hz ante una sinusoide

de corta dur acion no cambia si esta es invert ida temporalmente, Por 10 tan to,
si la segunda serial es muy breve y se la dist ingue aud itivame n te de la original
debe ser por la diferen cia en su patron temporal. EI umb ral de det eccion entre
dos senales de banda anc ha que cambian de arnplitud a la mitad de su desa rro
llo (de A a 2A) , pasadas al "de recho " e invertidas, es de 2 a 3 ms, valor qu e
co inc ide con el hallado por Plomp. Los sujetos no se dan cue n ta de l ca mb io de
arnplitud, pero perciben un cambio tfmbrico (oven "t ick " y "tock" ), En el gra
fico de la figura 5 se pueden ver las seriales ut ilizadas en el experime n to cit ado ,
A lgunos autores hall aron valores sign ifica tivarnente menores para el urn
bral de detecc ion, ent re 0 ,25 y 1,8 ms, pero no se conoce la causa de la d iscre
panda ent re ambos grupos de med iciones.

3. R ESOLUCION TEMPORAL EN SEN A LES DE BAN DA

AN GOSTA

Para sefiales de banda angosta , la in troducci6n de una disc ontinu idad impli ca
"desparr amar" el espectro por efecto del principio de indeterminaci6n aciisti
co. De todos modos, la sit uacion es d iferente si se trat a de sefiales de ban da
angosta moderada 0 co n espectro de linea, como es el caso de las sin uso ides.
A contin uac i6n se an alizan ambas posibilidad es.

122

l 'IT" I '1

liempo (ms)
b)

iII

:s
-0

ro

-0

'iii

ill

EO

'II'" I rr r." r

: , .

[1 1' 1" ' " .

liempo (ms)

Figura 5. Sena tes de banda ancha ernpleadas para deterrninar el urnbral de detecci6n de
disconrinuidades

De tecci6n de discontin uidades en ru ido de banda an gosta


Par a seriale s de banda an gosta moder ad a el paramet ro de comparaci6n es el
anch o de ban da del filt ro aud it ive qu e Ie co rrespo nde . Tal como hemos vis
to, la detecci6n de discontinu idad es deb erla ser peo r a baja frecu encia por
que en esa region espec tra l e l anc h o de ba nda de los filtros aud it ivo s es
menor. Los um brales de det ecc ion de be rfan d ism inu ir a med ida que aumen
t a la frecuenci a y por 10 tan to el anch o de banda de l ru ido , h asta llegar al
va lor de la banda crfti ca cor respond iente . A partir de est e pun to, un au
men te en el anch o de band a no deb er fa rnejorar la detecc ion de la d iscon
ti n ui da d . S in embar go , los datos ex per irne n t a les co n t radic en est a
afirrnac ion: cu ando se introd uce un a disco n t in uidad su gran desarro llo es
pectral afecta sincro ni ca me n te a un a can t idad de filtros aud it ivos -cosa qu e
no ocurre con las va ria cio nes de arnplitud produ cto de la aleatoriedad p ro
pi a del ru ido. La ex c it aci6 n en para lelo de varios filtros aud it ivos perrn ite
que e l umbra I de det ecci6n resulte men or que el que se obtendrfa si s610 un
filtro fuese pu est o en ju ego. Las medi c ion es experirnentales confirrnan esta
hipotesis, pues par a ruido de ba nda angosta, cuya frecuenc ia central va ria
entre 30 y 1.000 H z, los um br ales de detecc i6n de d iscontinuidade s di smi
nuyen desd e un valor de 40 ms h ast a caer po r deba jo de 10 rns. Este efecto

123

11[:

I~

es de gran importan cia para explicar la parwioja acustica temporal que ana
lizarem os mas ad elante.
D eteccion de discontinuidades en sinusoides
Para evitar la confusion entre detecci6n temporal y espectral, las sinusoides se
presentan junt o a un ruido continuo con una muesca espectral sintonizada a
la frec uenc ia de la sinusoide (figura 3). De este modo se consigue enmascarar
la dispersi6n de l espectro ocasionada en la discontinuidad.
En lin celeb re expe rimento , Sha iler y Moore estudiaron la detecci6n de
discontinu idades en sin usoides en foca ndo la atenci6n en la fase de reinicio
de la serial (Shailer y Moore, 1987). Explicaron sus resultados, que contradecfan
a la literatura sobre el terna, sobre la base de la cola de resonancia ("ringing")
del filtro auditivo: cuando la sinusoide cesa, el filtro auditivo sintonizado a su
frecuencia cont inua respond iendo por un tiempo . Si el reinicio de la serial
coinc ide en fase con esta respuesta del filtro, la det ecci6n de la discontinui
dad es mas dificil. En las figuras 6 y 7 se muestran las seriales empleadas y las
respuestas del mode lo ante discontinuidades de diferente duraci6n.
En los casos en los que la serial "engancha" en fase con la respuesta del
filt ro aud itivo , Sha iler y Moo re midieron umbrales de 4,5 ms, consider able
mente mayores a los 2 0 3 ms esperados.

4. M ODELOS DE RESOLUCr6N TEM PORAL


La respuesta de l filtro auditi vo a nive l coclear es muy rapida para altas fre
cuenc ias y, por 10 tanto , se supone que debe existi r un limitador a otro ni vel
de procesa rnien to neural. En genera l, se asume que los cambios rapidos son
suavizados en alguna de las eta pas supe riores del proceso. Cas i todos los mo
delos elabo rados para dar cue n ta de la resoluci6n temporal co nstan de cuatro
erapas, similares a las que se aprecia n en la figura 8.
En prime r lugar aparece un filtro pasaba nda que co rresponde a cada uno
de los filtros aud itivos conec tados en para lelo.
A co nt in uac i6n, la serial es procesada por algun d isposit ive no lineal.
Luego pasa por un integrador tempora l, que puede caracte rizarse como
un filtro pasabajos.
Por ult imo, el producto de los primeros tres bloques en tra a un modulo
de dec ision que determina que es 10 que se va a percibir ante la discontinuidad.
Estos bloques co rresponden a diferentes procesos que transforman la
seria l de l estimulo. De todos ellos, el modu lo de decisi6n es qui za el mas
124

W-1f\v

VW\fv

rvv-M

10 rns

Figura 6. Tres condiciones de fase diferenres usadas en el experimento de Shader y Moore

Selial con discontinuidad

Salida del filtro auditive

~~

WvvwvVV'v

~-

V\JVVvWVVV
~ - V\JVVvWVVV

~ -V\JVVvWVVV

~ - fIJVvvvvvVVV

~-~

Figura 7. Salida de un filrro auditivo simulado con Fe = 400 Hz en respuesta a una sinu
soide, con disconrinui dades de 1,2 a 3,7 ms en la cond ici6n de fase esran dar (exper imento
de Sh ailer y Moore)

125

<iiIiJjP

5. OTROS PROCESOS TEl\IPORALES


Esti mulo

Discriminaci6n en sec u encias de H uffman


Figura 8. Diagrama en bloques de un modelo de resolucion tem poral

-o
.~

:;

Ci

:g ~

<t

Q;

-c

'"

:2

ro

(f)~

10

15

20

Tiempa (ms)

Estim ulo

25

30

10

15

20

25

Tiempa (ms)

Filtro auditiv o

30

10

15

20

25

30

Tiempa (ms)

Modul o integrador

Figur a 9. Op eraci6n del mod ulo de decision en el modelo de Shailer y Moore para estimu
los de diferente frecuenc ia

comp lejo y su co nfig uracio n varia segun la tarea que se le asigne. En un o de


los modelos mas desa rrollados, e l de Shailer y Moore, la sefial es procesada
po r un modulo de decis ion con las ca racteris ticas que se aprec ian en la fi
gum 9 . En este model o el in reg rador tem por al es una ve ntana te mpora l n o
rec tangular.
Se observa claramen te qu e la deteccion de la discon t in uidad resulta in de
pend ien te de la frec uen cia central del filtro audi tive involucr ado .
Hip6tesis del banco de fil tros de modulaci6n
A lgunos in vestigadores han sugerido que el ana lisis de los son idos que son mo
du lado s en am pl itud depende de una parte especializada del cerebro que con
tienc grupos de neuronas afinadas cada un a a una tasa de rnodulacion dada.
Cada neur ona puede ser co ns iderada co mo un filtro en el domin io de la mo
du lac ion y el conjunto de neuronas se conoce como banco de filtros de modula
ci6n. Este modelo es to davia co ntrove rsial, pero pod ria explicar la eficacia de
ciertos parametr e s de prediccion de Ia inteligibilidad tales como el STI 0 el
RASTI, que tratarernos en el capitulo IX.

126

G reen estudio la d iscriminacion temporal en sefiales que tienen el mismo es


pect ro de largo tiempo - a gran esca la-, pero d istin ros espectros de co rto t iern
po - a pequefi a esca la- (Green, D. M ., 1973) . Son sonidos breves de banda
anch a - parecidos a clics- excepto qu e la energfa de ciert as regione s es retra
sada con relacion a la de otr as regiones. La frecu en cia ce n tr al, la cant idad del
ret ardo y el ancho de banda de la region co n retardo pueden va riarse inde pen
di en tem enre. Est as seriales se de no rnina n sonidos de Huffman. El experime n to
de G reen postul aba que si los sujetos notaban deferen cia entre dos son idos de
Huffman d iferen tes, quedaba dern ostrada su sensibilidad al pa tr on te mporal.
El resultado confirrno la hi potesis: el um bra1de det eccion del ret ardo de la re
gion bajo est udio fue de 2 ms, resul tad o ind ependiente de la frecuencia cen
tr al de las seriales util izadas. Los suje tos percib ieron las d iferencias en el
patron temp oral como carnb ios en la ca lidad del sonido .
Detecci6n de asincronias en el ataque y la extinci6n de sefiales complejas
La asinc rorua de co mpo ne ntes de una serial compleja es de tec tada con ma
yor fac ilidad en el ataque que en la ex t inc ion de la serial. Pa ra seriale s armo
nicas se perciben d iferencias en el ataque de los arrnonicos de men os de 1 ms
(con umb rales algo may ore spara componen tes de alta frecuenc ia), m ien tras
que el um bral en la ex tincion va dcsde valores comprendidos entre 3 y 10 ms
- cuan do el co mpo nente asinc ron ico ce sa des pues qu e el resto de la serial
compleja- has ta va lores en tre lOy 30 ms cuando esre cesa antes que la seria l
de base. El resu ltado de estos experimen tos es consisten te con la irnportancia
per ceptual del ataque de un sonido . Tamb ien esta estrech arnente rel aciona
do con la adapracion audit iva y con la percepcion del timb re ins tru men tal.
Los umb rales de deteccion de asincron ias para seriales no arrnonicas so n
de 2 a 50 veces mayores que para senales arrnonicas . Este hecho es explicable
en te rrnin os de agru parnient o perceptual: es mas diftcil esta blecer la sincro n ia
de ataques de sen ales que parecen provenir de fuentes dife ren res.
Discri minaci6n de la d uracion
Vari es estud ios revelan que , para va lores de duracion del est fm ulo T supe rio
res a los 10 ms, el um bral diferencial de duracion AT se incrementa con T y
es ap roxirnadarnente independien te de las caracte risticas espec trales de la se

127

rial. Esta regia se c umple tanto para la discriminaci 6n de la duraci 6n en soni


dos como en sile ncios entre sonidos. Valores tfpicos de boT son de 1,7 ms pa
ra T = 25 ms y de 15 ms para T = 320 ms (Di ven yi y Danner, 1977). La
fracci6n de Weber, boT/T, decrece levernente al aurnentar T. Como co n cas i
todos los pa ra me tres que cuan tifican la d iscriminac i6n audit iva, se enc on tro
q ue boT aumenta a intensidades pr6ximas al umbral de audibilida d.
Estos va lores se co rre lacionan con los de integrac ion tempo ral de la sono
rid ad, en part icu lar co n el posculado de H enning qu e esta blece q ue, al eva lua r
la sono rida d en estfmulos de co rta d uraci 6n , prevalece la cantidad tot a l de
ene rgfa en lugar de la intensidad de la sefia l, tema q ue tratam os en el cap itu
10 u, punto 4 (Henning, G . B., 1970).

6. ] U ICIOS SOBRE EL ORDEN

T EMPORAL

La habilidad para juzgar el o rden te mp oral en un a secue nc ia de son idos depcn


de en gran medida de la tarea asignada al suje to : una cosa es la identificaci6n
de l orde n q ue oc upa ca da son ido dentro de la sec uenc ia y otra la discrimina
cion en tre sec ue nc ias co n distinto orden , sin q ue se pu ed a precisar la ubi ca
ci6n de ca da son ido en el conjunto.
En el caso de la identificacion de l o rden tempo ral, Hirsch encon t r6 q ue
sujetos en tre nados necesitaban al menos 20 ms por son ido para det erminar el
orden en un a sec uenc ia (H irsch , I. ] ., 1959). En el ca so de la di scriminaci6n
entre sec ue ncias la resoluci 6n es mas fina, y se necesit an ent re 2 y 7 ms po r
son ido . Estos va lores son de gran importancia para comprender el desplaza
rniento ac ust ico temporal, q ue pre sentamos a co nt in uaci6n .

EI desplazamien to acustico temporal

que esgrirne pa ra defender d icha hip6tesis es la del desp lazam iento te mpora l
de estfmu los acust icos ex trernos: to ma ndo la sec uencia [a] - b - azl en el riem
po fisico t, si el estfrnulo ce n tral b tiene un a frecu encia qu e difiere de forma no
tab le -por ejemplo cu at ro oc tavas- de los est frnulos later ales y escogemos
esti m ulos muy breves -del orde n de los 80 mi lisegun cios-, 10 qu e se oye en el
tiempo fenomenico T es un a suces i6 n distinta [A I - A z - B]. Los sonido s mas agu
dos se oye n seguidos y cl son ido intermedi o, mas grave, se ve re legad o al fin a l
de la suce si6n (Vicari o , G . B., 1997). En la Figura 10 se puede ver un esquema
del experirnento. La diferen cia entre las frecu encias de aj y az corre sponde a
un intervalo de seg un da mayor desce nde n te .
Vicar io comprob 6 q ue e n e l caso de q ue los es t trnu los al Y az sea n no ta
blernente mas exte nsos q ue b el fen6 meno se hac e mas ev ide n te , in clu so de
sap arece la noci on de "localizaci on temporal" de b, q ue parece flota r sobre los
dos son idos agud os. Llega a la co n clus i6n de qu e las secuen cias de estirnul os
no h o mogen eos son m as propi cias pa ra la producci 6n de de splaza m ien tos
temp or ales.
EI desp lazamiento temp oral no se pued e a tribuir a n ingun proceso fisiolo
gico y no parece senc illo ex pl icar de q ue modo re laciones especfficas no tern
por ales -como semejanza 0 d isimilaridad- pueda n in teraccion ar con relaciones
temporales tales como anres/des pues. La ex plicaci6n mas difundida supo ne q ue
la posici6n de los so n idos e n el t iempo feno rnenico se decidirfa luego de h a
ber ofdo todos los estfrnulos, La o pe rac i6n , prec onsciente, te ndrfa lugar en el
lapso de aprox ima da me n te 200 ms q ue va de sde la lIegada de las sena tes at
tfrnpano y la pe rcepci6n consciente de las m ismas (Fraisse, P. , 1967).

a, = 1.800 Hz

I
b

Las prueb as ex pe rime n ta les refe rida s a l de sp lazam iento entre el tiempo ffsico
y el fenomcnico fueron ini ci ad as por W h ilhem W undt y continuad as luego
por Edgard Rubien , q uien es lograro n tr ansforma r un fen 6men o de si multa nc i
dad fisica en un a suces i6n psicologica, Varias h ip6t esis fueron pro puestas po r
entonces pa ra dar cu en ta de l fen 6meno, y en tre elias pre valeci6 la qu e supo
nfa qu e la h et erogen eid ad de los estfmu los consti tu ye el factor responsab le de
los desp lazami entos ternporales.
En la dccada de 1970 el psicologo italiano Gio vanni Bruno Vicari o desa
rrollo un a serie de tr ab ajos sobre el fen ornen o de l de splazamiento tempor al en
la aud ici6 n , en los q ue plantea la imposibili dad de est ab lecer un a co rresp on
dencia biunfvoca en tre el tiempo ffsico y el psico logico . Una de las ev ide nc ias

128

a, = 1.600 Hz

=66 Hz

80

160

240

Tiempo (ms)

I
I

A,

A,

B
I

I
Tiempo

I.
I.
I

Figura 10. Esquema del expe rimento de Vicario

129

..,....-

Umites de validez del fen6meno

a)

Una cond icio n necesaria para la oc urrencia del desp lazam iento tempor al es
qu e las di stintas sefial es no deben co nec ta rse esp ectr alme n te en las t ran sic io
ne s. De h eche, la rep roducc ion literal del experim en to de Vicario no da el re
sultado esperado. El motivo hay que buscarlo en el pe rfil di n arni co de las
sefia les: si las tr an siciones son bruscas (figura l l a ) apa rece un gran anc ho de
banda que destruy e la separacion espectral estipulad a en la h ipotesis o rigina l.
La apa ren te ano rna lia se debe simplemente a que n o puede ser qu eb rantado e l
lfrnite impu esto por el principio de inde terrninacion ac ust ico . El efecto se
aprec ia clara men te en el diagrama tridimensional de la figura 11b.
S i se suav izan las transiciones entre las sefiale s, po r eje rnp lo co n ven tarias
te rnporales gaussian as, se eliminan los puentes espectr ales q ue co n ec ta n Ia re
gion aguda co n la grave y el fenorneno de de splazam ien to tempor al se perc ibe
co n claridad, En la figura 12 se observa la sefial de prueba mod ificada y el efec
to espectral de rivad o. Se ve cla rarnente la ma yo r independen c ia (sepa rac ion
espe ct ral) ent re las seriale s aj y az con respecto a la seria l b, q ue correspo nde
a la co nd icion de n o h omogene idad de los est imu los post ulad a en los t rabajos
in ic iales (Basso, Gu illen y Liut, 2000).

u
ro
u

Tiempo

ol rJ.2J ms
".

544.54 ms

Frecu encia (Hz)

Figura 12 . a) Deralle de la sec uenc ia temp oral co n transi c io nes gaussian as largas. b) Ora
TEFd e la misma sec ue nc ia

f ICO

a)

Aplicaci6n musical
u
m

:g

c: 0
'"

t:

b)

iIi"

Tiempo

:so

_ O,Oms

.~

~ JJ-+'tJ2i!
-
344

689

1033

1378

~ ipEM ~!pe=-; :~ ::~ :

'!J

1
1722

2067

2411

2756

Frecuencia (Hz)

Figura 11. Gr afico te mporal y t iempo-energta-frecuen c ia (TEF) de la sena les de la secuen


c ia origin al

130

Estas ex pe rie nc ias controlada s - co mo reco nocen casi tod os los inves t igadores
qu e par tic ipan de ell as-, por su simpl ic idad d istan bas ta n te de 10 qu e sucede
en la vida cotidiana, Es posible, sin embargo , encontr ar en rnuc has obras de
rruisica el uso -intencional 0 no - de algun a de estas pec uliaridad es de la pe r
cep c ion a udi t iva. Por tratarse de situaciones m usicales reales (es to es, dentro
del contexto de una "puesta en ob ra") n o ti en en la intensi.dad y la clari dad
que se puede lograr en el marco ascetico de un laboratorio.
De acuerdo con sus objetivos y co n los pre supu esto s esti lfsticos in vo lucra
dos, un co mpositor puede decidir el mod o de aplicac ion del desplazam ien to
aciistico temporal. Si su intencion es in depe nd izar y desvincu lar d iferentes ele
mentos de un conjunto, la estrategia pl an te ada permite de sdoblar la estru ctura
en dos tr aru as temporales separadas y autonorn as. U n ejemplo q ue ilustra esta
tecnica se encuentra en la pieza para orquesta red ucid a Homenaje a Garda Lor
ca (1936) de Silvestre Revueltas, en la qu e la m isma melcdfa se in te rp reta en
para lelo con una tuba y una flauta piccolo a d istan cias de cuatro y c inco oc ta
vas. Aunque el paralelismo absolute de alturas y dur acion es deber ia ayuda r a
fund ir perceptualmente los instrumentos, la en orme separacion de los regist ros

131

Tiempo

Capitulo V
Percepci6n de la altura tonal

iD
~

"D

'"

"D

"Vi

932 .97 ms

C
QJ

tIT"

516

1033

1550

206 7

258 3

3 100

1,391 S

36 17

Frecuencia (Hz)

Figura 13. Grafi co T EF del fragment o cita do de H omenaje a Garcia Lorca de Silvestre
Re vueltas

y la ausenc ia de puentes espec trales rompen la relacion temp oral ent re cllos. A l

ofr el pasaje se percibe un a ambigua sensaci6n de "desajuste", provocado por el


desfasaje en tre tiempo ffsico y psicol6gico propio del fen 6m eno bajo ana lisis.
En la Figura 13 se puede ver un grafico TEF de dicho fragmento.
Por el con trario, si el prop6sito del autor se dirige a la fusi6n de estruc tu
ras, el fen6meno de desplazam iento temporal debe ser evitado . Adernas de re
ducir la d istanc ia espec tral que separa a los estim ulos, es necesar io agregar da tos
espectrales que sincro n icen las secuenc ias en las zonas de transicion . Cie rtas ar
ticulaciones y ata ques des truyen la paradoja temp oral, sinc ron izand o el tiempo
ffsico con el psicol6gico . A q uf una cuidadosa elecc i6n de los medios instru
mentales, que inclu ye tanto los instrumentos mismos co mo las dernas va riables
involucradas -registro, rnatiz, articulacion, etc.- result a decisiva.

La altura tonal se define tecn icam ente co mo "aq uel atri buto de la sensac i6n
audit iva en terminos de l cual los son idos pueden ser orde nad os en una esca la
musical" (American Sta ndards A ssociation, 1960) .1 En otras palabras, un a se
cue ncia de son idos que varfan de altura ton al tien e el car acter de una melo
dia, Un ejernp lo qui za ayude a delimitar este concepto.
Si se alte ra la ec ualizaci6n en un sistema de audi o ca mbia el brillo del so
nid o y, en cierto sen tido , algun aspecto relacionado con su altu ra. Pero h ay
otros elementos que no se rnodifican, pues el cambio en la ecualizaci6n no ha
ce que el Do de un a flaut a sesustituya por un Re, ni que el fragmento modul e
a ot ra ton alidad. Estas caracte risticas -que perrn an ecen in variantes frente a los
cam bios en la d istr ibuc i6n de energfa del espectro- definen la altu ra ton al pre
sen te en los son idos llamados t6nicos (Sc haeffer, P , 1966) . La ton icidad de un
son ido es el rasgo percep tual q ue permite que se 10 identifique con uno de los
grados de la escala musical. Lo q ue cam bia al modificarse la posici6n de los cur
sores de un ecualizador es la distribuci6n de ene rgia en el espectro de la sefia l.
Esta dist ribuc ion de ene rgia se asocia co n la percepci6n de la altura espectial del
son ido: dos guita rras que emite n la misma not a, una de soni do rnet alico y la
otra de sono ridad oscura, produ cen la misma altura tona l pero distintas alturas
espec tra les (es ha bitua l decir que la primera es "mas aguda" que la segunda) .
El grado de tonicidad varia de un son ido a ot ro: una flau ta genera sonidos
muy t6nicos, una ma rimba sonidos de tonicid ad interrnedia y un ta rnbor ge
ne ra sefiales de ton icid ad nula. En una primera aproximaci6n podemos esta
blecer que el grado de tonicidad guarda relaci 6n con el ancho de band a de la
serial ffsica: a mayor ancho de banda menor tonicidad, y viceve rsa. El princi
pio de inde te rrninacion aciistico gobierna la rela ci6n frec uencia/duraci6n en
los casos anteriores. La altura tonal se considera comp leta 0 "fuerte" cuando
permite la for maci6 n de aco rdes y funciones tonales, e incompleta 0 "debil"
1

132

Err la literat ura err ingles se la den omina pitch chroma"

133

cuando no 10 hace. Po r ejernplo , con tres to m- to ms de banda angos ta se pue


de gene rar un a sec ue nc ia melodica Do-Mi -Sol, pero si se los ejec uta simulta
neam ente no se forma e l aco rde de do mayor: los to m-to ms posee n altura
to nal incom plet a (Basso , G., 200 1a ).
En general, las sefiales periodicas son percibidas co mo son idos toni cos, a
los q ue se pued e asigna r un valor de altura tonal defi nid o q ue se corre lacio na
direct arnen te con la funda mental de Fourier de la sefial. Se presenta aquf un a
de las propiedades mas notables del sen tido de aud icion : perci birnos con un a
altura to na l (mica los son idos causados por est imu los peri odi cos, al margen de
la co mp lejidad arrno n ica qu e posean. En la figura 1 se puede ve r el espec tro de
un son ido de v ioloncello.
La can tidad de arrnon icos es aqui mu y gran de. S in em bargo, se oye cla ra
ment e un a sola altu ra tonal. En estos casos el sistem a audi tiv e presra mas ate n
cion a la salida de un hi po te tico centro de pro cesamiento de la altura (q ue
sefiala un a iinica sensac ion de altura tonal) que a las caract erfsticas de la altu
ra espec tral 0 pr imaria de l son ido , Si se desea air en detalle cada com pone n te
aislado es necesar io inhi bit el mecanismo anterior, operacion que demanda un
tiemp o co nsiderable y que explica la dificultad de perci bir por separado los 8.[
rnonicos superio res en los son idos de corta dura cion . Se den omina audici6n
analftica a esta ulti ma forma de ai r y audici6n sintetica a la prim era.?
Al gunos a utores , entre elias Terhardt, sugieren que la capac idad para sin
te tizar gran cant idad de arrn on icos en una un ica altura tonal se aprende du
rante la pr imera infancia a parti r de la reiterada exposic ion a son idos
periodicos, en espec ial la voz huma na (Terhardt, E. et aI. , 1982).
A 10 largo de esre capitulo nos encontraremos constanternente co n dos
teorfas que trat an de explicar la percepc ion de la altura to na l. Una de elias es
la teorfa dellugar (vease cap. I, aparrado 4), que parte de dos postu lados d istin
tos. EI primero establece que el aida efectua un an alisis espectral en el int erior
de la coc lea: d iferen tes frecuencias exc itan d iferentes lugares de la membrana
basilar, en una especie de organizac ion tonotopica. EI segundo postu lado afir
rna que la altura tonal se relac ion a con el patron espaci al de exc itac ion produ
cido por el estfmulo. La prime ra h ipot esis es aceptada por la casi tota lidad de
los investigadores, mien tras que la segunda toda via es materia de discusion .
Una teorta alterna tiva a la teo ria dellugar es la teona temporal, q ue sugiere que
la alt ura se relaciona con el pa tron temporal de los impulsos neurales origina
dos en el csn rnulo. Co mo los d isparo s de las ce lulas nerviosas t iend en a ocurrir
en una pa rt icula r fase de la forma de onda, interviene necesariarnen te la sens i
Por ejernp lo, Ge rard G risey tuvo que ralen rar las masas sonora s en Partiels, co rnpuesra en
1975, para que se pudiera o fr la evoluci6n de cada componente (parcial) aislado ,

134

0
-6

-12

-18

-24

-30

m -36
:s-
-0

:::J

~
E

-42
-48

-54

60

-64

-72

-78

-84

-90

-96

100

200

500 1k

2k

5k

10k

20k

Frecuencia (Hz)
Figura 1. Espectr o de un son ido de violonce llo

bilidad a la fase de l sistema aud it ive . Como esta sens ibilidad desaparece para
frecuencias por en c ima de los 5 kHz, la teorfa tem pora l no expli ca la percep
c ion de la altura to na l a alras frec uenc ias.

1. P ERCEPCION DE LA ALT URA T ON A L EN SINUSOIDES

A comienzos de l siglo XX el psicologo Herm ann Ebbin gh aus postul o qu e se de


be remover tod a la informacion supe rflua en el estud io de los esti mulos y sus
respue sta s psfquicas. A par t ir de esta regia, q ue mezcla pr inc ipios torna dos de
las ciencias ffsicas y una mala lectu ra de l teorerna de Fourier, se impuso una
trad icion en la que se ern plea n casi exclu sivament e seria les sin usoida les para
los experimentos de psicoacustica. En co nsec uenc ia, tambien se ut ilizaron es
tirn ulos sin uso idales para est ud iar la percepcion de la altura tonal. Sabe mos,
sin em bargo, que las sin usoides son sefiales de prueba inade cu adas po rque la
altura tona l se asoc ia en gran medida a la peri odi cidad de los estfrnu los arrno
nicos co rnplejos , qui za par nu estr a ca pac idad para agrupar los diferentes co rn
pon entes espectrales pre sentes en la voz h urnana . La altura tonal originada en
una sinuso ide result a impr ecisa e inestable, co mo puede co mpro bar cua lquier
oyente ante un a mel odia realizada can ton os pur os - h abituales en las sefiales
de espera de los co ntestado res te lefonicos,
Adernas, cu ando los est frnulos son simp les y posee n solarnente un a sola
frecuencia dest acada, la altura to na l se con funde en parte co n la altura espec
tr al. En c ierto sentido , un a sin usoide co ntiene su propi o timbre , ya que al rea

135

lizar un barrid o ascende nre en frec uenc ia del uni co armo n ico presenre (la si
nuso ide misma) se exc itan sucesivamen te zonas advacentes en la mem bran a
basilar. El resultado perceptu al es un glissando acornp afiado de un cambi a
continu o del co lor to na l. U n ejemp lo trad icional de esta confusion entre al
tura tona l y espectral 10 brinda la esca la de altura, expresada en me ls, que se
muestr a en la figura 2.
Los valores de altura en mels, elabora dos a part ir de estimu los sinusoidales,
d ifieren no tablemente de los obtenidos a partir de sefiales arrnon icas complejas.
Para alguno s auto res, la escala en mels describe simplemenre el brillo tfmbrico
de los sonidos simples y no es aplicable a la altura to na l ta l com o se la en tie n
de en la pract ica musical. A prin c ipios de la decada de 1970, Fred Attneave y
Richa rd O lson postu laron que para est udiar las escalas musicales se deben
ernp lear las seria les co mplejas que se usan en la practi ca musical concreta
(Attneave y O lson, 197 1). Los experimen tos que realizaron a part ir de este
postu lado diero n resultados mejor correlacionados con un vfnc ulo logarftmi co
en tre la frecuencia de l estfrnulo y altura tonal que la escala de me ls, al men os
dentro del rango de las frecuencias fun damentales que se emp lean en musica.

10 largo de l tiempo. Para la teoria del lugar ambas habil idades esran relac iona
das , pues depende n de l filrrado en frecuencia de la coclea . Para las te orfas
temporales la re lac ion no es tan marcada.
El limen - rnfnima variacion det ect able en frecuencia- permite evaluar la
discriminacion en frecuencia y crece mon otonarnente con el valor de la fre
cuencia del estfmu lo sinusoidal.' En las figuras 3 y 4 se pueden observar sus va
lores absoluto s y relatives, El valor relati vo de l limen, expresado en relacion con
frecuenci a central Fe, tiende a ser menor a frecuencias centrales y aume nta a
med ida que el estfmulo se desplaza hacia los ex tremos del espectro audible. Por
ejemplo, el limen absoluto es aprox imada ment e ~f = 2 Hz para una frecuen cia
ce nt ra l de 1.000 Hz y corre sponde a un limen relative de 0,2%.
Es habitua l rea lizar las experienc ias de medi cion del limen a partir de dos
metodos: la var iacion en frec uenc ia de sinusoides aisladas y la variacion en
frecuencia de la sefial moduladora en un dispositivo de frec uencia modulada
(FMDL).4 Los resu ltados de las experiencias de FMDL se utili zan, por ejernplo, en
el calculo de los Ind ices de inteligibilidad de la palab ra en sistemas de cornu
nicacion. En el capitulo IX desarrollarem os este top ico ,
C ontrariamente a 10 pred icho por la teorfa del lugar, el DLF no varta con
D iscriminacion en frecu en cia
la frecuencia de l mismo modo que la band a cr ft ica y disminuye al aumentar la
sono ridad de l estfrnu lo. A part ir de estos datos la mayorfa de los invest igado
Como ya serialamos, es necesario d isti nguir en tre selectividad en frecuencia,
res se inclinan por las teorlas tempo rales al proponer sus mod elos, aunq ue los
que es la habi lidad para distingu ir cornpo nentes en un son ido co mplejo , y dis resultados experimenta les sugieren q ue ex iste un mecanis mo temporal para las
criminaci6n en frec uencia, la capacidad para de teetar cambios de frecu en cia a
bajas frecuen cias y un mec anismo tonotopico para altas frecuencias.
Zwicker y Henning crearon un modelo mixto que produjo resultados con
sistentes
con los valores medidos de DLF y de FMDL (Zwicker y Fastl, 1999 ). Es
3000 I
I
t
I
j
I
I
t
I
JII
te modelo establece que el limen esta det erminado por la informacion tem poral
(sensibilidad a la fase) para frecuen cias de h asta 5.000 H z - la sensibilidad a la
2500 ~ . .f_f L.
L.
+ .. 1 1
fase dec rece ai llega r a 2 kH z y desa parece a 5 kH z. Por enc ima de 5.000 Hz
tanto el DLF y como el FMDL parece n responder a un a suerte de teo rfa del lugar.
2000 -I i-- i+- -: ;; + 1 ..~ . j
'

T'

..

Q;

- ; l S00

-I . _~ ......

Variaci6n de la altu ra ton al co n la sonoridad

.3

Stevens constat o en 1935 , a part ir de esti mulos sin usoidales, que la alt ura to
nal varfa con la sono ridad del esn mulo (Stevens, S. S., 1935). En la figura 5
se muestran los resultados del ex perime nto origina l.

1000

500

10

20

50

100

200

SOO

1000 2000

5000 10000

Frecuen cia (Hz)

Figu ra 2. Relacion en tre altura (rnedida en mels) y frecuencia

136

(difference limen in frequency) y, como

tal, pertenece al conjunto de parametres de d iscriminaci6n agrupados como "rnin imas di

ferencias perceptibles" (JND, de just noticeable difference).

4 FMDL (difference limen in modulation frequency ).

3 Se la con oce como DLF pa r sus inic iales en Ingles

13 7

100,0
50,0

15

,_+.J -L- ---~-._---_+---~-.-- !..-.L-~--,

-I-:

+--Ti-~r-- -r -----r----- --'-_

-t .

~ ': : f-~tf~ ;t -" _ L

8000 ~ Hz

10-1

--+

5J OO Hz

- +1

;;g

+"

C1l

>

~ o l~
C1l

::: I~ ~Z[] - ..J+_. +

5 -l

-'-_ _...._

.i. _1()OO.H" ...

- + ' . . ; ..

~ _. ~- ;: " .' 1

Shower y Biddulph (193 1)


-10 -/-

- - - - Promedio de varias mediciones

. --.+-

.;.-. , - i X ' 1

!
125 250 500 1000

2000

4000

6000

-15

0,02

&
co

-;
c
-o

80

90

100

LRF FM 10 Hz(FMDLF)
0,01

-.

0Q

2. PERCEPCION

'.

K
0,005
c

'"

o
>
.~

~
c

'"

E 0,002

:::;

250

500

1000

2000

II"

4000

8000
\

Frecuencia central (Hz)

Figura 4. Limen relat ivo en frecuencia para esnrn ulos sinusoid ales. El FMDL se obtiene ca n
un a modulaci6n en frecuencia

138

ii
70

Aunque los dat os actuales son men os profundos que los medidos por Ste
vens, el fenorneno ocurre y, para senales alejadas del centro del espectro audi
ble , la variacion en altura ton al puede superar el 5%. Este fenorneno no tien e
aun explicacion teorica.
La variac ion de la altura ton al con la son orid ad desaparece cuand o el es
timulo est a cons titu ido par sefiales arrno n icas com plejas y no es, por 10 tanto,
apreciable en la mayorfa de los son idos que se usan en musica.

LRF (DLF)

:::>

60

Figura 5, Variaci6n de la altura can el nivel sonora

Figura 3. Limen absol uro en frecuencia para esnrnu los sinuso idales. En la medici 6n de
Shower y Biddulph se ernplearon FMDL

'"

50

Nivel sonora (fanes)

Frecuen cia (Hz)

ec:
c'"
.~

Iii
40

12000

8000

-,

"

DE LA A LT URA TON A L EN ESTfMULOS A RMO N ICOS COMPLEJOS

A pesar de la gran ca nt idad de estudios realizados a parti r de estfrnulos sinu


soidales, la altura to na l es un rasgo propio de los son idos t6 n icos deri vados de
sefiales periodicas cornplejas, cuyo espectro es aproximadamente arrnon ico.
El nacim ien to del concepto de altura tonal esta asoc iado al desarrollo h is
ronco de los modelos explicativos de la relacion (recuencia-a ltura y del per
feccionamie nto de los met odos de rned icion en psicoacust ica . En el siglo XIX,
Fechner llego a la idea de que existe una transform acion logarftmi ca del esn
mulo ffsico a partir del uso de metodos diferenciales para sus experirnentos. A
mediados del siglo xx , Stevens com pare las alturas tonales provenientes de es
timulos sinusoid ales y propuso la escala de mels. Sus result ados difieren de los
de Fechner, en part icular en los extre mos del registro. Mas tarde , Sheppa rd

139

sost uvo que ambos merodos resultan incorr ecros a la hora de eva luar y dar res
puesta a la cuest i6n de la alt ura to na l, y que se debe ce ntrar el estud io en la
rasa de repetic ion de Four ier de la serial acustica.
Sin dud a, hay al menos dos d iferen tes clases de altura to na l: la que deri
va de estfrnulos d iacron icos 0 suces ivos y la que provien e de est frnulos sinc ro
nicos 0 simultaneos, Aunque la escala de mel s no es un a esca la aprop iada para
usos musicales, ca ptura sin embargo algun aspec to irnportan te relacion ado
co n la alt ura tonal de los son idos d iacron icos, Al gun os dat os estad fs ticos, co
mo la mayor can t ida d de inter valos cerrados en el ran go central de frecuen
cias , esta n relac ionados co n la esca la de mels. Tamb ien tien e algo que ve r co n
el brillo de los son idos, tal como co rne n ta ramos antes.
La teo rfa del lugar clasica tien e d ificultad es a la hor a de descr ibir la pe r
cepc ion de sefiales comp lejas ya q ue, por 10 gene ra l, la alt ura to na l no co
rrespo nde a la posic ion del max imo de exc itac ion en la membrana basilar.
U na dernostr ac ion co n cluyen te la provee el fenorneno de la fundamental re
co nst ruida 0 fantasma, descr ito por Schouten en 1940 co mo el "residue " de
bat ido de un grupo de arrnonicos co nsecut ivos.' La percepcion de este resi
duo n o requi ere ac t ividad en el punto de la MB que responde a un a sin uso i
de de alt ura sim ilar. Tiem po despues, Licklider ( 956) dernost ro que la
al tura del resid uo pe rsiste aiin cuan do los ca n ales en la MB co rrespo nd ientes
a la fundamental de la serie arrnon ica se enmascaran co n ruido de baja fre
cuenc ia: los soni dos de baja frecuen cia qu e se perc iben, asoc iados al residuo
de batido, apa rece n a part ir de los canales exc ita dos por los comp onentes de
me dia y alta frecuen c ia de la serial.
Varios mod e los fue ron prop uestos para exp licar la incid en ci a de la fun
dam enta l reconstruida en la percepcion de la a ltu ra ton al. U na primer a c la
se de modelos, los llamados modelos de reconocimiento de purrcnes, asume qu e
la a ltu ra de un soni do co mp lejo se de riva de las sefiales neura les co rrespo n
dientes a los estfmulos prima rios en la membrana basilar, por eje mplo las fre
cuenc ias de los pa rc iales indi vidu a les. La segund a clase de mod elos sost iene
q ue la percep c i6n de la a ltura to na l se as ienra en la eva luac ion de inter va
los te rnpora les. Veam os cada una con det all e.
Modelos de recon ocimi ento de patrones
Los modelos de reconocimienro de pa trones di viden el proce so de percepc ion
de la altu ra tonal en dos e tapas, La primera consra de un ana lisis en frecuen cia,
5 La funda menta l reconstruida cor responde al primer arrnon ico en el desarro llo de Fourier
de una serial per iodica. Vease el Apendic e l.

140

sim ilar al analisis clasico de Fourier, para det ermin ar las co mponen tes sinusoi
dales de la senal co mpleja. La segunda e tapa co nsiste en el recon ocimiento de
los esquem as 0 patron es que det erm inan la altura ton al co nforme a la salida
de la pr imera et apa.
En el afio 1962 Sc ho ute n realize un a expe rienc ia que provoco la apari
cion de gran cantidad de modelos teoricos que intentaron dar cuenta de los
result ados (Sch ouren , }. F. et aL, 1962). A part ir de sin usoides modul adas en
amp litud genera , en primer terrnino, sefiales co n tres co mponent es de 1.800,
2.000 y 2.200 H z. La altura to na l percibida cor respo ndfa, com o era de esperar,
a la de un a sin uso ide de 200 Hz, fundame nta l de Four ier del tr fo de arrnoni
cos an te riores. Luego gene ra otra sefial co n co mpo ne ntes de 1.840, 2.040 y
2.240 Hz (que son los arrnonicos 46, 51 y 56 de una funda men tal de 40 H z).
Los oyentes, sin embargo, percibfan un son ido compuesto cuya altura to na l
predom ina n te era similar a la de una sinusoide de 204 H z, jun to a dos alturas
secundarias que se pod fan asoc iar co n sin usoides de 185 y 227 H z. Ninguno
de los sujetos que part iciparon de la experienc ia perc ibio la altura correspon
dien te a la fund amen tal de Fourier de 40 Hz.
El modelo propuesto po r Wa lliser, en 1969, para ex pl icar estos resultados
con sta de dos pasos: 1) se calcula la altura de te rm ina da por la diferen cia de
frecuencia entre pa rc iales vec inos (la tasa de repetic ion de la en voIven te) y
2) se busca el subarrno n ico del co mpo ne n te de meno r frecuenc ia que mejor se
ajuste a la frecuen cia enc ontrada en el paso pr imero ," Este modelo aplicado al
experimento de Scho ute n da 200 H z en la pr imera operac ion 0 ) y 204, 4 H z
0 .840 H z / 9) en la segunda operac ion (2). Esra ulti ma es la frecuencia que
de te rm ina la altura tona l.
En 1972 Terdh ardt sugirio , inspirado en el modelo de Walliser, que la al
tura residual es un subarrnon ico de un compo ne nte dom ina n te y discrimina
ble, sea 0 no el de meno r frec uenc ia. C uando los parc iales estan muy proxim os
en frecue ncia no puede n d iscrim inarse y resulta imposible o fr la altura resi
dual. Estimo q ue los parcia les dom inantes cae n en la region espectral com
prend ida entre 500 y 1.500 Hz."
U nos afios despues, Terdh ard t sugirio qu e la capac idad necesaria para ha
cer uso del mecanisme prop uesto en su modelo apa rece en un a fase ternpran a
del ap rendi zaje, en la que estarnos expuestos sobre todo a los son idos del ha

Walliser (1969), en Moore (1995).

7 Terhardt llama 5ubaml6nico5 al conjunto de las funda menta les de Fou rier cuyas series ar

m6ni cas inclu yen el co mpone nte del est fmulo en cuesrion. Sus frecuencias coincide n co n

los subm ultiples de la frecuencia de l compone n te. No se los debe confund ir con el produc

to de un a h ipotet ica resona ncia inferior.

141

bla (Terdhardt, E., 1974) . Afirrn o que aprendemos a asociar la frecuen cia de
un corn pone n te del estim ulo co n los suba rrnoni cos del m ismo: la estirnulac ion
de un solo arrnon ico produce alturas prob ab les a las frecuenc ias de los subar
mon icos. C uando un co mplejo arm6 n ico se pres enta, la mayor cantidad de
co inc idencias a la frecu encia de la fundamenta l determina la altura to na l del
son ido, Para son idos no armo n icos (como el de la experiencia de Sc ho uten )
no hay co inc ide ncias exa ctas y la sensac ion de altu ra no resulta tan precisa.
Queda claro que este modele requ iere de l ana lisis de mas de un parc ial de la
serial de entrada .

a)

b)

Mas 0 men os en la misma epoca, G o ldstein propuso un modelo en eI q ue


la alt ura tonal de un son ido complejo es der ivad a por un procesador ce nt ral
que recibe informacion solo de la frecu en cia de cada cornp on ente, soslayando
la informacion apo rrada por la arnpl itud y la fase (Goldstei n , ]. L., 1973 ). EI
procesador presum e que todos los estirnulos son peri od icos y que rodos sus es
pectros comprenden arrnon icos sucesivos. Los errore s de estirn acion de la fun
dam en tal oc urren al estima r eI ruimer o de ar rnonico apropiado. A plicado al
experirnento de Scho uten , los arrnon icos de 204 H z ex plican razon ab lernenre
bien los co mpone n tes de 1.836, 2.040 y 2.244 , pe ro no dan cuen ra con igual
exactirud las frecu en cias de 185,5 H z y de 226,7 H z - cercanas a las de 185 y
227 Hz percibidas en e l expe rime nto ori ginal.
Los mod elos de reconoci mien to de patrones dependen de la resolu cion
espectral de la mem brana basilar, pero no irnpli can necesari arnente el uso de
informac ion to notopica perse como un a medida de la frecu en cia.

La altura residu al se determina por el in ter va lo temporal ent re rnaxim os


142

l ' 2 ' 3:

l' 2' 3'

Figura 6. Form as de onda de dos sefiales modu ladas en arnplitud. En el pr imer caso, la
portadora (2.000 H z) es un multi ple exac to de la moduladora (200 Hz) y el pertodo ent re
picos correspondienres (1-1 ' , 2-2' ) es de 5 ms, En el segundo la frecuen cia de la portadora
aumenra a 2.040 Hz y el in tervale en tre picos es algo menor a 5 ms

en la esrructura fin a de la onda en la membran a basilar (Scho uten regisrro la


sefia l en el punto de maxima osci lacion en la MB). S i hay mas de un interva
10 tempo ral posible, la altu ra to na l co rrespo nde a la cre st a mas prominente. Si
se considera la repr esen racion de la serial a n ivel neur al adq uiere significac ion
el intervalo temporal ent re los disparos nervi osos sim ilares. Si el sistema "con
tase" simplernen te la ca n tidad de d isparos por segundo, el modelo de Sc hou
ten no podrfa fun c ionar.

Mo de los temporales
Para da r cuen ta de su celebre ex perirnen to , Sc hou ten propuso un mod elo
basad o en el patron temp or al q ue desarr olla la onda del estimu lo en la mem
bran a basilar. Seg un su mod elo, la a ltura tonal es determinad a po r la pe rio
dicidad de los parciales in vo lucrados en la dete rminacion de l residu o. EI peso
relati ve de cada parcial depende de su capacidad para atraer la ate nc ion del
oye nte , ya sea po r sono ridad 0 po r co n traste con esn rnulos prev ios.
La gran diferen cia ent re los modelos temporales y los mod elos de recon o
cim iento de patron es es que este s ulr imos requ ieren que mas de un parcial sea
discriminabl e del co mplejo para q ue se perciba la altura de l residuo , mientras
que los primeros solo pid en que los parciales interactuen , no que sea n discri
minab les (n o es n ecesario que sean perc ibidos separados) ,
En la figura 6 se mu estran los resultados temporales del exper ime n to de
Sc ho uten .

1 2 3

Evidencia experime ntal relevan te a cada mod elo

LA regiOn de existencia de la altura residual

"

-,

De acuerdo con la teori a de reconocirni ento de pat rones, la altura residual so


lo se puede perc ibir cuan do al men os un o de los co mponen tes sin usoida les del
estirnu lo puede ser o fdo en form a separad a. Es decir, qu e ne cesita ser discrimi
nable. S i el esrfrnu lo posee uni carnen te arrnon icos muy altos no resolub les la
altura residu al no deberfa perc ibirse.
R itsma encontro que el caracter to na l de la altura residual existe iin ica
mente dentro de una regi6n de frecuencias lim itada, que llarno la regi6n de
existencia (Ritsma, R., 1962) . C uando el mim ero del armo n ico es muy grande
(po r encima de 20 0 mas) se oye un zumbido de altu ra ind efinible. Tiempo
143

~
despues, Plomp hallo qu e la altur a residual puede percibirse para tasas de re
peti ci6n de hasta 1.400 Hz, dat o compatible - aun que no identico- con la pro
puesra de Rit sma (P lo mp, R., 1967).
A con trapelo de las h ip6tesis an teriores, Moore estableci6 q ue para an no
n icos de orde n elevado hay un rango determinad o en el cual se puede o ir una
altura residual aun cuand o ningun o de los arm6n icos pueda o frse por separa
do (Moore, B., 1995 ). Los modelos de reconocimien to de pat rones no pueden
dar cuenca de este heche . De tod os modos hay que apuntar q ue los son idos ge
ne rados un icarnen re a parti r de arm6ni cos elevad os no definen tan clara rnen
te la altura residual como aquellos que con tiene n arm 6nicos mas bajos.
A unq ue la altura residual se percibe rnejor en presencia de gran can tidad
de comp on entes arm6n icos, Houtgast reporto que si el con tex to lleva al suje
to a centra r la atenc ion sobre alturas de un rango particular, aun un solo arrno
n ico es capaz de evoca r la percepcion de una altura residual grave (Ho utgast,
T., 1976). C uando la infonnaci6n sensorial se vuelve ambigua, como ocurre en
presencia de ruido, esas alturas potencia les se perciben con mas facilid ad.
En un expe rimen to sec uencial de Hall y Peter s, en el que tres arm6nicos
sucesivos de 40 IDS de dur aci6n se presen taban separados por 10 ms de silencio,
los son idos se ofan d isociados en condiciones de laborarorio (H all y Pet ers,
198 1). Pero en presenc ia de ruido la altura residual asociada, correspond iente
a los arrnon icos en presen tac i6n sincron ica, se volvla perceptible. Parece ser
q ue el ruido habilita la aparicion de un mecan ismo sin tetico de percepc ion de
la altura.

El principia de dominaci6n
De acuerdo con la teo rfa de reconocimie n to de patron es, los arrnon icos dis
cr imin ab les de rnenor frec uenc ia son los mas import an tes para det erminar la
altura tonal. En ca rnbio, para las teorlas tem porales los mas impor tantes son
los de mayor frec ue nc ia. La altura residu a l se h a observado uni camente
cuando los arrnon icos esta n presen tes a frecue nci as por deb ajo de 5.000 H z,
region q ue coi nc ide co n la efec tividad del proce samienro de la inform acion
temporal.
Rit sma sugirio qu e los arrnon icos 3, 4 y 5 domi nan la sensac ion de altura
tonal en la region de 100 a 400 Hz (R irsrna, R., 1967). Plom p co incid io en
parte con este postulado, pero considero q ue la region no se define en cuan ro
al nurn ero de armo n ico, sino qu e es funcion de la frecuencia absoluta (Plomp,
R., 1967). Para alturas to na les agudas son imporran tes los prim eros arrnon i
cos, mientras que para alturas ton ales graves cobra n import an cia los arrnon i
cos por enc ima del quinto.
144

Evidenciadel rol de mecanismas centrales de pracesamiento


Houtsma y Go ldst ein en contraron que es posible percibir alturas residuales
cuando los armonicos sucesivos se presentan alternados entre los dos oidos,
por ejemplo los arrnon icos pares al oido derech o y los impares al izquierdo (es
timulos dicoti cos): este hec ho no puede explicarse confonne a los modelos
que requi eren la in teracc i6n de los co mponen tes en la membran a basilar co
mo el de Sc houten (Ho utsma y Go ldstei n, 1972) . lrnplican necesar iamen te la
exis tencia de un proceso neural central. Los model os temp orales pueden , sin
embargo, expl ica r el recon ocimi ento de la altura residual a partir de secuen
cias de disparos neuron ales en lugares de procesa mien to superiores, mas alla de
la membran a basilar, en los que se enc uenr ra la informac i6n pro venie nte de los
dos oidos.

A lturas tanales basodos unicamente en informaci6n temparal


M iller y Taylor invest igaron la sensac i6n de altura ton al provocada por seria
les de ruido blanco que se co nec ta n y desco nec ta n periodica men te, cuyo es
pectro asociado no posee maxirnos ni mfnim os destacados (Mi ller y Taylor,
1948 ). Encontraron que para una frecuenc ia de conmutac ion co mprendida
entre 100 y 2.000 Hz la mayorfa de los sujetos pe rcibieron una cierta altura to
nal. Llegaron incluso a const ruir melodtas recon ocibles.
Estas expe rien cias demu estran la exis te nc ia de mecan ismos te mporales en
la percepcion de la altura to na l, pues los rnodelos de reconocimiento de pa
crones no pueden dar cuenta de sus resultados.
Modelo de Brian Moor e del mecan ismo par a la perce pc ion
de la altura tonal en son idos complejo s
La evidenci a expe rimental revela que la percepc ion de una altura tonal parti
cular no depende de la ac tividad local izada en un lugar especifico de la mem
brana basilar, 0 de la ac t ividad de un unico grupo de neuronas perifericas. Se
sabe que la altura ton al indu cida po r estlmulos complejos arm6n icos es obte
nida, en gene ral, a part ir de la int eracci6n de los arrnon icos mas alla de la fun
damental de la serie. Por 10 tanto, es posible percibi r altu ras tonales similares
proven ientes de pat ron es espec trales diferent es, que comprometen dist int os
esque mas en la ac tiv idad basilar 0 neural. Para estfrnulos period icos que con
tienen un gran rango espec trallos primeros arrnonicos, bas ta el quinto, tie n
den a dominar el percepto auditive . Dichos arm6n icos caen en un a zona en la
que es posible discrimin arlos - resolverlos- po r separado y el proceso puede ex
145

plicarse sobre la base de los modelos de reco nocimien to de pa trones . S in em


bargo , se puede pe rc ibir una altura residual aun cuando los co mpo nen tes son
dem asiado altos co mo para ser discriminados por sepa rado , Este hecho no pue
de ser explicado por los modelos de reco nocimien to de pa trones, pe ro sf po r
los mod elos tempo rales.
Parece q ue ningun a de las teorfas expuesta s hasta aquf puede dar cuen ta
po r sf sola de l con jun to de dato s expe rirnen ta les. Brian Moore propuso un mo
delo cualita tivo que co rnbina elemen tos tanto de la teor fa de reconoc irnien to
de patro nes co mo de las teorias tem porales (Moore, B., 1997). O tros modelos,
co mo los de Van N oordern (19 82), Patt erson (19 87) y Meddi s y H ewitt (199 1)
tarnb ien com bin an aspec tos de las dos teorfas, aunque los algoritrnos materna
ticos difieran sign ifica tiva rnen te en cada caso . EI mode lo de Moore (esquema
tizado en la figura 7) co nsta de cinco etapas.
La primera etapa esta definid a pa r los filtros audi tivos en la membran a ba
silar. Respo nde n a los arrnon icos que son aprox imada men te sin usoidales en su
forma y qu e pueden resolverse. La resp uesta de los filtros a los arrnon icos mas
a ltos co mbina va rios de ellos po r banda critica , y no puede n discriminarse.
A unque la forma de onda de salida de la etapa es co rnple ja, la rasa de repeti -

c ion corresponde a la que se enc uen tra en la en trada. A modo de eje rnplo, en
la figura 8 se aprec ia la salida de diferentes filtros audit ivos an te un tren de irn
pu lsos de 200 pulsos po r segundo.
La segu nda eta pa consis te en Ia transducc ion de la salida de los filt ros an
ter iores en impulsos nervi osos.
La tercera etapa defin e un dispositi ve capaz de analizar los in tervalos en
tre rnaximos a cada frec uenc ia central Fe (vease la figura 8).
En la cuar ta etapa se comparan los in tervalos rernporales presen tes en los
diferen tes cana les y se buscan los pa tron es com unes a varios de ellos, Esre cir
cuito tam bien deb e in tegrar Ia informac i6n a traves del t iernpo. En general, el
interva le temporal mas frec uen te corr espond e a la co mpo ne n te fund amental.
En la quinta etap a los valo res de los in te rva los ternporales mas prcrn ine n
tes llegan a un mecan ismo de decision qu e selecciona un o de ellos. Este cir-

Hz

6400 -ItI...- - ----t_ --

5080 -141_~--~_.--

-----'l/j,..-

4032 -HIH
Entrada

acustica

banco de
filtros
pasabanda

3200 1-"W\J1i1ftArv----.AAflJJ.A/'tN'J""-~
2540 -J---.AAAAiW

-.AJW't:Prf\!'<P-

20 16 +--.A;f'rAJ_

1270
Transducci6n
nerviosa

'<Af'rAJ_

1600 +-"""p.,<""'-

""'-__

f. .-- -=--.=.,-.",- _

1008 +=,=..,_~~"""""'""".,,=....=......=....
800 +="=="""'==--"=="""'==--"==

Analisis de los
intervalos
entre picos

635 = = = =~ ~=====
504 4 - --

- - --

400
Combinaci6n de
mtervalos con
frecuenclas centrales

Selecci6n de los
intervalos mas
promlnentes

: : j-~-~----~-~

159 .

Tiernpo
A ltu ra
ton a l

Figu ra 7. Modelo esquematico para la percepci6n de la altura tona l de Brian Moore

146

Figura 8. Sim ulacion de las respuest as de la MB ante un tre n de impulses de 200 pps.
Los mim eros de la izquierd a ind ican cada un a de las frecucncia s cenr rales Fe,
que co rresponden a las formas de onda de salida de cada ftltro

147

cuito incorpora la memoria y la atencion, y puede ser influido tanto por los es
tfmulos in med iata rnen te precedentes como por el co n tex te y las co nd ic ion es
generales de pres entacion. La altura tonal final (sefial de sa lida del modelo)
corresponde al intervale seleccionado.
El modelo de Moore explica satisfactoriamente gran ca n t idad de ev iden
cia experimental. A co n t inuac ion mencionaremos algu na de las situac iones
que logr a resol ver.
C uan do la altura residu al se obtiene a partir de un os pocas armoni cos ele
vados (por ejemplo, el 12, 13 y 14) que no pueden resolverse por separado, resul
ta debil y am bigua. Este hecho ex plica por que los primeros arrnon icos tienden a
dominar en la percepcion de la altu ra. La altura asoc iada a los armo n icos supe
riores se hace mas clara si aurnen ta el mim ero de armonicos presen tes.
Un pequefio grupo de armo n icos mu y altos no gen era la sensacion de al
tur a tonal, h ech o que se puede explicar en terrninos dellimitado ran go de in
tervalos tempor ales que pueden ser analizados por el grupo de neuron as de cada
frecuencia ce n tral. Para arrnon icos por encima dellS, el intervalo temporal co
rrespondiente a la fund am ental cae fuera del rango que puede ana lizar el can al
que responde a esos armonicos (este dato es muy import ante en el modelo de
Moore).
Cuando los arrnon icos superan los S kHz la estructura fin a de la forma
de onda a la salida del filtr o de la primera et apa no se prese rva en el patron
tem pora l de los imp ulsos ner viosos.
La altura de estfmulos qu e no presentan picas espectrales, com o el rui
do blan co interrumpido periodicarnente, se percibe en el mod elo a traves de
los interv alos tempor ales presentes en los cana les de altas frecuen cias ce n tra
les FC, que poseen mayores anc ho s de banda y por 10 tanto mayor defini cion
tempor al (preservan la estructura temporal fina de la forma de onda) . La altu
ra tonal de esto s est irnulos es debil.
Si se incorpo ra un mec anismo comparador central de la informacion
proveniente de ambos o idos lue go de la tercera etapa, se pueden in te rpretar
los fenornenos dicoticos.
El modelo se parece al de Terhardt en el tratamiento de los primeros arm o
nicos, pero este ulti mo no puede explicar la altura producida por los arrnon icos
superiores no discriminables . En el modelo de Moore los sonidos de co mb ina
cion juegan un rol en la dete rminac ion de la altura. El mas impo rtante (2ft - f2)
se percibe aun a bajas sonoridades y puede actuar com o un arrno nico infe rior
mas facil de d iscrimina r que algunos co mponentes del espec tro de en trada .
El modelo de Moore se utiliza ac tua lrnen te en el disefio de tradu ctores de
altura tonal para sistem as cod ificado s a ruimero uni co , por ejernplo para dise
fiar conve rsores de altura tonal desde un a guitarr a al siste ma MIDI.

148

3. LA ALTURA

TONAL COMO UN MEDIO MORFOFORICO

A principios de la decad a de 1970 A ttneave y O lson esta blec iero n un nu evo


crite rio qu e permite c lasificar de manera diferente los par ametres del sonido.
Aunque ex isten o tros atributos par a la organ izaci6 n de los sonidos - com o el
timbre, la sonoridad y la locali zaci on espacia l- s610 la altura tonal y el tiern
po co ns tituyen medi os ca paces de portar formas, 0 medias morfaf6ricos8 (A u
neave y Olson, 1971) . De ac ue rdo co n los au to res, el espacio visual es un
medio morfoforico: un triangulo se puede tras lada r -0 rotar- y sigue siendo el
mismo tr ian gulo, su identidad se rnantiene bajo cie rtas operaciones de trans
formaci 6n. De manera similar las estructuras ge ne radas a partir de la al tur a
ton al, tales como melodias 0 funciones arm6 ni cas, pueden ser transportadas
h aci a arriba 0 hacia abajo y aun ser rec on oc idas como las mismas: la infer
mac i6n estructural que pose en resul ta in vari ante frente a los transportes en
altura tonal." El tiempo tambien es un medi o morfoforico poderoso. Pero
o tras dim ensiones utilizadas en rruisica (c om o la son or idad , el timbre y la 10
calizaci6n espacial) no 10 son . Por ejernpl o , n o se logra el mismo grado de
prese rvacion de la informacion est ruct ural actuan do so bre la son oridad. En el
siglo xx va rias co rr ien tes musicales in te n ta ron co mpo ner pie zas a partir de
esca las de sono rida d, de at aques 0 de otros param etres so no ros, pero fracasa
ron en el in ten to de equiparar Sll ca pacida d estructural a la de la altura tonal
o e l tiernpo.'?
En la mism a linea, el psicol ogo cog n itiv ista Mi chael Kub ovy distingui 6
en tre atributos dispensabl.es e iruiispensabl.es (Kubovy , M ., 1981). En vision la
posici on espacial es un atributo in d ispe nsa ble, mientras que el color es disp en
sable, hecho rel acionado con su in cap acidad ana litica trente a los colores: al
me zclar azul y amarillo vemos un nu evo co lor, el verde, pero no sus compo
n entes ini ciales. En audicion la altura tonal es un atributo indispensable,
m ien tras que la localizacion espacial no 10 es. La "ind ispensab ilidad" del espa
cio en vision y de la altura tonal en aud ici6n es paralel a al hecho que ambos
son atributos co rrespon d ien tes a medios morfof6ri cos. Emonces el pararnetro
ana logo del espacio v isual no es el espacio aud itive, sino la altura tonal. En la
figura 9 se grafican las diferencias entre atributos dispens abies e indispensables
en visi6 n y en la figura 10 en aud ic ion .
8

Morphophoric medium en Ingles.

El ejemplo clasico consiste en tran sport ar un fragmento musical un cierto inrervalo, par
ejemplo una quinta justa ascende nte.
10 Podemos citar aquf la pieza para piano Modes de valeurs er d'intensitis, co rnpuesta en 1949
por O livier Messiaen (1908-1992), que emplea por primera vez la recni ca serial no sola
mente para las alturas sino tarnbien para las durac iones, los araques y las intensidades.

149

------------------------.....------------------ - - -
La 1

La 2

La 3

La 4

La 5

La 6

55
11
11

110

220

440

880

1.760

12

13

14

15

16

11x 2

12 x 2

13 x 2

14 x2

15 x 2

En la percepcic n visual el colo r es dispensable, la posicion no

Figura 9. A tri butos dispe nsables e ind ispensab les en vision

Mi l l

Escucha dos
nolas: Do y Mi

Do+Mi

Re

Escucha dos

notas: Do y Mi

II

Figura 11. Represent aci6n logartrmica unidimensional de la altura ton al

Escucha una
nota: Re

En la percepci6n auditiva la altura es indispensable,


la posicion es dispens able

Figu ra 10. At riburos d ispensables e ind ispensables en audicion

4. R EPRESENTAc rON GMFICA DE LA ALTURA TONAL


La representacion grafica trad icion al de la altura tonal emp lea una escala 10
garftrnica unid imen sion al de frecuenc ias que preserva los in tervalos musicales
bajo diferen tes tran sformacion es, pero no alcanza a describir las complejas re
laciones que operan en tre los int erva los musicales. En la Figura 11 se puede ve
rificar que las ocravas ocupan segmentos de la misma longitu d a 10 largo de l
espectro audible. Lo mismo oc urre con el resto de los in tervalos.' !
Esrricrarnenre , la represent acion tradic ion al no describe alturas tonales sino las frecuen
cias de los estlrnu los asociados.
11

150

Frecuencia (Hz)

Sin embargo, un a esca la logarit mica unid imension al no refleja el hecho


de que ciertos int ervalos, como las oc tavas y las qu int as justas, poseen carac
terfst icas especial es. C iertos estudios etnomusicologicos h asta prerenden de
mostrar que dichos intervalos son culturalmente un iversales, pero el debate
sobre el punto sigue lejos de alcanzar una con clusion defin itiva.lA mediados de l siglo XIX Drob isch con cibio un a rep resen tacion tridi
mension al en for ma de he lice que dis tingue en tre la altura un idimension al
(a la que llama pitch height) y la altura tona l (pitch crama segun Drobisch l.P
En la figura 12 se puede apreciar la version de Shepard de la helice de alturas
ton ales.
En el esquema los son idos de cada familia tona l (po r eje mplo todos los la
a distan cia de oc tava ent re sf) se hallan encolumnados: eI La5 queda mas cer
ca de l La4 que del Mi5, d isposicion que corresponde a la proximidad segun la
consonancia musical, al men os en la rruisica tonal tradicion al.
Si se desea suprimir la altura tonal (croma) sin eliminar la altura unidi
mension al (height ) 10 mas senc illo es reemplazar las sefiales arrnon lcas origina
les por ruido de band a angosta. En otras palabras, se remueven los elemen tos
que aport an ton icidad y se dejan solarnen te los que corresponden a la altura
espectral del son ido. En ese caso la helice se reduce a un solo eje vert ical, el
que define la altura un idim ens ional.
11 Co mo contraeje rnplo, Un ernoto cornent a que no existe una palabra en el idio ma japo

nes para designar el inte rvale de octav a (Une rnoto , T., 1989 ).

13 Drobisch (1855), en Cook, P. (1999).

151

La5

La4

--<;>-Mi5
Parcial

Do

00#

Re

Oesplazamiento

La
Ancho de banda
Sol#

Sol

Fa#

Fa

Figura 12. Helice de alturas tonales

Frecuencia (escala logaritmica)

Figura 13. Serial de Sheppard

En cambio, si se quiere suprimir la altura unidimensional (height) y dejar


s610 la altura tonal (cmma) , es necesario generar una serial que obligue a la he
lice a colapsar en un cfrculo como el dibujado en la base de la figura 12. Ro
ger Sheppard public6 en 1964 un trabajo en el que describe la construcci6n
de seriales capaces de suspender la percepci6n de la altura unidimensional, en
las que la altura tonal parece ir hacia el agudo (0 el grave) indefinidarnente
(Sheppard, R. 1964).14
Sonidos de Sheppard
Los sonidos de Sheppard consisten en una gran cantidad de componentes si
nusoidales a distancia de octava que abarcan por completo el rango de fre
cuencias audibles, modulados en amplitud por una envoivente espectral en
forma de campana que tiende a cero para altas y bajas frecuencias (Risset, J.
c., 1978b). La figura 13 muestra el espectro de una serial de Sheppard.
A medida que transcurre el tiempo, la frecuencia de cada parcial se va co
rriendo hacia arriba, en una suerte de glissando en octavas paralelas, mientras
que la amplitud es controlada por la envoivente en forma de campana. Nue
vos parciales ingresan en la parte grave del espectro a medida que superan la
barrera del umbral de audibilidad, a la vez que los mas agudos se reducen has
ta desaparecer. La cantidad de parciales y la energfa de la serial son constan
14 Se puede hallar un paralelo visual en el grabado "Ascendiendo y descendiendo" de M.
C. Escher.

152

~ Croma ~
Figura 14. Toroide que permire representar las relaciones de octava y de quinta

tes, pero se percibe un incremento continuo de la altura tonal. Los sonidos


que descienden indefinidamente se obtienen de man era similar, desplazan do
hacia abajo la frecuencia de los componentes.
Una ilusion equivalente a la de los sonidos de Sheppard se puede obtener
con el otro medio morfof6rico conocido, el tiempo. Ligeti y Risser ernp learon
procesos de este tipo en varias de sus composiciones.

IS3

P er cepcion de in ter valos mu sicales

Figura 15. Helice toroida l q ue permue represen tar la altur a tonal, la a ltura (height)
y las relaciones de oc tava y de quinta

Aunqu e la h elice de Sheppard de la Figura 12 pre serv a la relacion de oc


ta va , n o registra la irnportancia que poseen los in tervalos de quinta en la rnu
sica to nal tradi cional, El to ro ide de la figura 14 sf 10 h ace, pero p ierde la
ca pac idad de grafica r la a ltura un id imensional (height).
Para representar al mismo t iempo la altu ra un idimension al (height), la al
tura to nal (cromzr) y las relaciones especiales de octava y quin ta es necesario
un espacio de c inc o d imensiones. La h elice toro idal result an te serla similar a
la representada en la Figu ra 15.
Si ade rnas deseamos representar los in tervalos de tercer a mayor y tercer a
rnenor, imprescindi bles a la hom de definir la rnod alid ad de un aco rde, la fi
gura se complica h asta e l pun to de resu ltar imposible de d ibuja t So lamen te se
pued enplantear las ec uac ione s alge bralcas que co rrespondan a cada modele .

5. A LT URA TONAL E INT ERVALQS MUSICALES


Un desarrollo que in te n te exponer la co mplejidad de la percepcion de los in
ter valos y de la gen erac ion de escalas musica les requ iere por 10 menos un li
bro comp leto. P A qu f in tentarernos pre sentar los top icos mas re lev an tes sin
aden tram os en el estud io co mp let o de los po rmeno res prop ios de la prac tica
mu sical.
15 Esre libro, en este mom en ta simpl e exp resi6n de deseo, ten dr fa natu ralrnente un lugar en
la co lecci6n Mus ica y Ci en c ia.

154

N oam C ho msky d istingui6 entre competence (h ab ilidad para reconocer las re


glas que gobieman la lengua) y perfonnance (h abilidad para real izar un acto de
h abla) en su teorfa de la gra rna tica y la sin taxis. Aunque tengam os alrnace n a
das inte rn arnente las reglas de la lengua, debido a nu est ras lirnitaciones par a
proce sar y emitir sent enc ias comp lejas, muchas veces no las ap licamos correc
tamente al ofr 0 praduc ir frases cornpletas. Del mismo mod o, las reglas que go
b iernan las re lac iones inte rvalicas en mu sics de ben se r con oc idas e
in temal izadas (es dec ir, "n atur alizadas") por los oye ntes. Veamos algunos ca
sos prapios de la rnusica occide ntal tradi c iona l, en la que d ichas relacion es ya
han sido largarnen te n atu ralizadas.
Dos son idos cuyos estimul os estan sepa rados po r un in te rva le de oc ta va
suen an , en algun sen t ido , de rnanera similar. En muchas culturas se les dena
m in a con el m ismo nornb re dentro de la esca la musical (son, por ejemplo, los
son idos de la familia del Do) . Desde el pun to de vista del est irnulo , la frecuen
cia de la segund a sefial se ajusta a un valor ce rcano al doble de la frecue ncia
de la frecuen cia de la p rimer a sefial. En otros ter rn inos , si la relac ion de fre
cuenc ias fund arnen tales es a prox imadarnen re fz "'" 2 fl se percibe un in te rvale
de ocrava, O tros in te rva los pue de n d efin irse tamb ien a pa rt ir de relac iones si
milares. Asf, un a q uinta justa correspo nde a la relaci6n fz "'" 0 /2) f t y un a cuar
ta justa a fz "" (4/3) fl' Las rel aciones son so lamen te ap rox irnadas pues la
definicion de los intervalos depende de gran can t idad de fact or es, [a mayorfa
cultura les, algun o de los cuales vere mos mas adelan te .
Las relac iones an teriores, sin emba rgo , s610 se pe rc ibe n c lararnen te
cuando las dos frec uenc ias se ubican por de bajo de 5 .000 H z. Exi ste gra n
ca n t ida d de ev id enci a expe rimenta l q ue indica qu e los est fmulos cuyas fre
cue nc ias fund arnenta les (l as q ue dec ide n la periodi c idad de la serial comple
ja ) supe ran el valo r de 5.000 H z n o definen la a ltura tonal. Po r eje rnplo, una
sec uen cia de so n ido s no prod uce la sensac i6n de rnelodta po r enc ima de los
5 kH z. Y los sujetos con ofdo absoluto fracasan repetid arnenre a altas frecuen
ci as. Estos dat os son consiste n tes con el heche ya v isto de que a alrededo r de
los 5 kH z carnbian los mecani smos de perc epci6n de la altura: un mecanisme
temporal ac tua a baj as frec uen ci as y un mecan ismo tonot6p ico 10 h ace a altas
frecuenc ias. Tan to el sentido de la altura to n al com o la sens ibilidad a la fase
se pierden mas alia de los 5.000 H z.
Puede ser in teresan te repasar el rango de frec uenc ias fun dame n ta les que
aba rca el teclado de un pian o moderno: la frec uenc ia mas alta n o lIega a
4.200 H z (vease la Figur a 16 ).

155

Frecuencia (Hz)
I

3729
3322
296 0
2489
22 18
1865
1661
1480

~ )86
-

1244 ,5
1108 ,7
932,3
830,6
740
622 ,3
554 ,4
466 ,2
415 ,3
370

~
~
~

3 11,1
277 ,2

233 ,1
207 ,7
185

155,6
138 ,6

116,5
103,8
92 ,5
77,8
69,3
58,3
5 1,9
46 ,3
38,9
34,7
29 ,1

lntervalos sinc r6nicos y diacr6nicos

~
~

3951
3530
3 136
2794
2637
2349
2039
1976
1760
1568
1397
1318 ,5
1174,7
1046 ,5
937,8
88 0
784
698,5
659 ,3
587 ,3
523,3
493,9
44 0
392
349,2
329,6
293,7
26 1,6
246,9
220
196
174 ,6
164 ,8
146 ,8
130,8
123 ,5
110
98
87,5
82,4
73,4
65,4
61,7

Do 8
Si 7
La 7
Sol 7
Fa 7
Mi 7
Re7
Do 7
Si 6
La 6
Sol6
Fa 6
Mi 6
Re 6

Do 6
Si 5
La 5
Sol 5
Fa 5
Mi5
Re 5
Do 5
Si 4
La 4
Sol 4
Fa 4
Mi4
Re4

D0 4
Si 3
La 3
Sol 3
Fa 3
Mi 3
Re 3
Do 3
Si2
La 2
Sol2
Fa 2
Mi 2
Re2

55

D02

Si 1

La 1

49
43 ,7
41 ,2
36,7
32,7
30,9
27 ,5

Sol 1

Fa 1

Mi 1

Re 1

Do 1

Si 0

La 0

Figu ra 16. Ran go de freeuenei as fund amentales de un piano moderno

156

Los dos mecan ismos que acnia n en la percep ci6n primaria de la altura, el ton o
rop ico y el temp oral, se man ifiestan de mane ra d iferen re si se presen tan int er
valos sucesivos 0 diacronicos 0 int erv alos simultaneos 0 smcrorucos. C uando los
estfmulos son diacr6n icos, la sucesi6n de intervalos posee ca racter melod ico.
La eva luaci6n de la diferen cia de altura ent re esn mulos -el intervale diacroni
co- puede derivar uni carnente de la evaluac ion de la distancia que existe ent re
puntos de vib raci6n en la membran a basilar. S i los est frnulos son periodicos,
con espectro arrnon ico, se eva lua la d istan cia ent re los dos patrones de excit a
cion. En esros casas el mecan ismo tonotopico es el unico que pued e act ivarse
porq ue, al no actuar los dos esn rnulos al mismo tiempo, no es posible el anali
sis tem poral sirnulran eo ent re ambos. En la figura 17 se ap rec ia un grafico tem

pora l de las sefiales que indu cen un interv alo diacroni co de qu inta justa.
] uzgamos los interva los sucesivos casi de rna nera tactil, cornparando el
pun to de maxima excitac ion del segundo esrfrnulo co n el recuerdo de l punto
de ma xim a excitacion de prim ero . En este caso , el rol de la me moria de co rto
terrni no resulta dererrninanre. S i ade rnas actua la mem oria de largo terrnino,
hech o que oc urre en alrededor del 1% de la poblaci6n , se dice que el oyen te
posee ofdo abso luro. El oldo absolwo es la habilidad de recon ocer la altu ra ro
na l de un son ido sin co mpararla con una referencia cercana en el tiernpo,
En camb io, cuando los esn rnulos se presen ran de manera sincronica , la
man ifestacion simulta ne a de dos 0 mas son idos posee carac ter arm6nico. 16 La
eva lua ci6n de la d iferencia de altura entre estfrnulos - el in tervale sincronico

Mi

La

ill

:s
"0

I1l

"0

'iii

CD

E
Tiempo (ms)

Figur a 17. Se na les asocia das a un in tervale diaer6ni eo de quint a justa

16 El termino "armon ico" se emplea aquf en un sent ido arnp lio y sign ifica ocurreneia sirnul
tanea . De rnan era similar, en el parrafo ante rior se habla de caracter melodico para descri

bir la ocurrenc ia sucesiva. Se podrfa trazar un correlate eon las estruc turas ver tic ales y
ho rizon tales en una partitura 0 en un sonogra ma.

157

CD

:s
"0
C1l
"0

"Vi
c

2c;

V\fL"

Ii

~"

-j---j -

. -

T-I

I.-

i_J

"0
C1l
"0

"Vi
c

_.

CD

~-"-I

I.

i - -;

~---" -~:

:s
Q)

-~

_."- - -

I
l"'

Figur a 19. Espectro de Fou rier asociado a un intervalo sinc r6n ico de quinta justa

ro
:s

"0
C1l
"0

"Vi
C
Q)

Tiempo (ms)

Figu ra 18. Seriales asociadas a un int ervale sinc ron ico de quin ta justa

+----!~"

-'-

1S8

--'

--+-----+ ~ - - 1 -1

-~; ~--~ -; :r;- ~-:IJ"~ ~l"_

I -

1I

'-

-1.-.1 - - -

puede deri var en este caso tanto del mecan ismo tonot o pico a n te rio r co mo del
analisis temp ora l sirnultaneo de las dos sefiales. En este ultimo caso la apari
ci on de batidos y so n idos di ferenciales pre va lece como cr ite rio de co nso na n
c ia y co rrec ta afinac io n , al menos en la mu sica tonal occ idental.
Tomem os como ejemplo un intervale sincron ico de qui nta jus t a , C a
da vez qu e la seri al m as gra ve, un La4 d e [ = 440 H z cornplet a dos ciclos la
m as aguda, un M iS d e i': 660 Hz cornpleta 3 , tal como se apr eci a e n la fi
gur a 18.
La ex ac ta coinciden cia de fase cada dos ciclos del La4 -0 tres del MiS
imp ide la aparic ion de batidos y d iferenc iales . EI grafico espec tral del interva
10 an terior es el qu e se mu estr a en la Figura 19.
iQ ue oc urre si desafina mos un poco esta q uinta justa , po r eje rnplo, au
mentando la frec uencia del M iS ap e nas 2 H z pa ra llevarl o a 66 2 H z? A pare
cen n ece sari amente ba tid os de primer o rden que crece n en frecuencia a
med ida qu e aumenta el orden de los arrnon icos involucrados.
EI batido mas grav e se da entre el tercer armo n ico de La4 (un M i6 de [ J =

r
I--t-a

.I"

1j -

t i - .
"

-- .J- . .
j:
~ : f/ j

-1I '-1-- !-

--

"

Figu ra 20 . Espect ro de Fourier asociado a un Intervale sincr6n ico de quinta justa desafinado

1.320 Hz) y el segundo arrnoni co de Mi S (otro Mi , pero es ta vez de f z = 2 x


662 Hz = 1.324 Hz) con un per fod o de batido de hi = 4 Hz. EI siguien te ocu
rre en t re el sexto arrn onico de La4 ([6 = 2.640 H z) y el cuarto arrnon ico de
M i5 (f 4 = 2.648 H z). A h o ra el perfo do de batido es hz = 8 H z. La secuen cia
continu a h asta, te oricarnen te, alca nzar el lImite del rango a ud ible.
En la m usica occidental trad icion al, consonancia arrnon ica y co rrecta afi
n aci on de acordes sign ifican m fnirno ba tido. Po r este motivo, para eva lua r los
intervalos sincro n icos prev alece n los c rite rios tempor ales -que aseguran el
-control de los posib les batidos- sobre los c rite rios to n oto p icos. H ay que acla
rar q ue en la miisica de much as cu lturas el ba tido entre sonidos no es co ns i
der ado un elemento ne gat ive 0 disonante , sino q ue se 10 integra com o part e
de la text ura del sonido.

159

~
r-.
--

r-.
':'
e-------=--o

Figura 2 1. O ctav a d iacr6n ica ejecutada con un vio lin

I'7't

I'7't
o
e

del marco cultural de referencia. Dich os int entos de un iversalizar el concepto


de consona nc ia son rebat idos al confr omarlos con la gran ca nt idad de len gua
jes musicales no occ identa les en los cuales no se cump len . Incluso dentro del
area de la rnusica occ iden tal misma se crearo n, a part ir de fines del siglo XIX y
principios del XX, sistemas que redefinen cornpletarnen te la noc i6n tradicional
de consona ncia.!" U n estudio exha ustivo del tema necesar iarnente deberfa
contemp lar el desarrollo con tex tual e historico de cada len guaje musical part i
cular. Dich o estud io no podra soslayar el ana lisis de las cornbinac iones de altu
ras ton ales, de sus ca mpos de acc i6n y de las jerarqufas relativas que ocupan en
los diferent es sistemas musicales. En o tras palabras, el estudio q ue imaginamos
rendrfa que enca rar ampliamente un ana lisis escalfst ico completo de cada sis
tema musical.

Figura 22. Oc tava sincr6ni ca ejecurada con un vio lin

U n ejernplo pract ice para dernostrar la diferen cia entre un a octava dia
cronica y o tra sinc ronica se puede realizar con un instrurnen to de arco, por
eje mplo un vio lin . Primero se toea la tercera cue rda al aire (Re4), se hace un
pequefio silencio y se toea en segunda cuerda la oc tava (Re5) del son ido an
terior, buscando la mejo r afinac ion posible. A cont inuacion se compara esta
ultima no ta con el segundo arm6n ico de la tercera cuerda (Re5 ): el Re5 en se
gunda cuerda es casi siempre mas agudo q ue el arm6n ico.
lQue ocurre? La octava diacr6nica fue afinada de acuerdo con la memo
ria audit iva y no pud o controlarse por baudo. Par 10 gene ral se la afina un po
co mas grande que la que corresponde a la relacion Z: 1. A su vez, la frecuencia
del segundo arrnon ico, si la cuerda es de buen a calidad, es casi exac ta rnen te el
doble de la frecuenc ia de la cuerda a aire.
En ca mbio, si la octava an terior se interpreta sincroni camen te (un bicorde)
es posible llevar el batido en tre ambos son idos a cera. En este caso la altura del
Re5 en segund a cuerda y el ann6 n ico en te rcera son de la rnisma altura to nal.
Co ns onancia y disonancia
Los conc eptos de conso na ncia y disonanc ia son, obviarnente, cultu rales y de
pend en del contexte h istorico, del gen ero, del estilo y hasta de las caracterfst i
cas part iculares del compositor de cada pieza de rnusica. En muchos textos se
leen frases del tip o: "cuando los son idos musicales relacionados por un a razon
simple suena n sirnultanearnente el son ido es agradab le" 0 "la d isonancia puede
ser explicada en parte por el bat ido entre cornpon en tes en la membrana basi
lar", que pret end en establecer causas perceptu ales primar ias e independ ientes

160

<.;
17 Q ue alguno de los siste mas experirnen rales que apa reciero n en el siglo xx ha ya n sido ac u
sados de "ax iom at icos", y hasta de "recnocra ricos" , no invalida la aftrmac ion ante rior.

161

Capitulo VI

TImbre

Aprendimos en nuestra etapa escolar que el sonido tiene por atributos la altu
ra, la intensidad, la duraci6n y el timbre. El timbre se referia a cierta cualidad
del sonido que nos permite reconocer los instrumentos de una orquesta 0 dis
tinguir entre sonidos diferentes. Pero, a diferencia de la altura, de la intensi
dad y de la duracion, el timbre no es un atriburo perceptual de descripci6n
sencilla.
Entendernos la percepci6n como un proceso en el que usamos la inforrna
ci6n provista por nuestros sentidos para armar representaciones mentales del
mundo que nos .rodea, Una parte irnportante en esta tarea es decidir que par
tes de la estimulaci6n sensorial corresponden al mismo objeto 0 evento ffsico,
y cuales no. La necesidad biologica del timbre tarnbien puede ser comprendi
da desde una perspectiva evolutiva, a partir de la adapracion del sentido del
oido para proporcionar informacion sobre la base de las vibraciones mecani
cas del aire.
Bregman opina que el timbre surgi6 de la necesidad de distinguir entre dos
objetos auditivos cuando estes no pueden identificarse a partir de parametres
simples (Bregman, A., 1994). Si un rasgo auditive se mantiene dentro de limi
tes unidimensionales, como ocurre con la altura tonal, podemos operar hasta
una cantidad maxima de cinco 0 seis elementos individuales a la vez. Para ma
nejar simultaneamente una mayor cantidad de unidades de informacion se re
quieren mas dimensiones y el timbre aportarfa esas dimensiones adicionales.
Segun Shepard, el sistema perceptual de los animales nace con la incor
poracion sensorial de las regularidades propias del arnbiente en el cual han
evolucionado.' Por ejemplo, somos muy sensibles a ciertos aspectos del soni
do que no se modifican durante el recorrido entre la Fuente y el oyente, como
-",,-,J a altura tonal. Por el contrario, somos practicamente insensibles a las carac
t~risticas que varian de manera aleatoria con el contexto, como la fase y la in
1

Shepard (1981), citado en McAdams y Bigand (1994).

163

tensidad relativa de los co mpo ne ntes en un a serial co rnpleja. De ac uerdo con


esta co nce pc i6n, soste n ida por gran cantida d de in vesti gadores, los parametros
"fuertes" que determin an el timbre de los son idos esta rfan rel acionados co n las
ca rac te rfsticas de la serial ac ust ica qu e resisten la distorsion propi a del medi o
qu e n os rodea,

1. DEFINICION ES DE T IMBRE
EI primer problema qu e aparece al estud iar el concepto de timbre es la vague
dad y arnb iguedad del terrnino. Rep asem os las dos defini ciones mas utilizadas .
1. Una maner a clasica de definir timbre es asociando lo a las fuentes acus
ticas de origen. En musica , los nombres de los instrurnentos se usan co mo eti
qu et as para deno tar los t imb res, por eje rnplo "timbre de flau ta" 0 "timbre de
violin". S i uno de sea comunicar la impresi6n gene ral dada por un son ido , est e
met odo de nombrarlo puede ser adec uado. Las etiquetas norninales ac nia n de
modo ana logo a los n om bres de los co lores: el termino "rojo" es suficien te pa
ra ped ir un torn ate maduro en un a verdulerfa, pero result a dem asiado arnplio y
vago para describir los miles de "rojos" que se usan en la indu stri a grafica. Del
rnisrno modo, h abl ar d e "so n ido de flaut a" n o n os sirve para diferenciar en tr e
los son idos de dos flaut as d iferentes, ni para distinguir los son idos que obt ien en
dos flau tisras del mismo instrurnento . C om o eje rnplo, podem os men cionar la
mut aci6n que ocurri6 co n el co nce pto de ruido blanco: en princ ip io describe
un a ca racte rist ica ffsico-mat em arica de un a sefial ac ust ica de espec tro plano,
pero se co nv irt io en tre los rruisicos electroac usticos en un a nu eva unidad c ul
tura l, el "ruido blanco" co mo un timbre mas de su repertori o.
Como vere mos mas ade lante, el uso del timbre a man er a de et iq ueta irn
plic a el reconocimienro del son ido sobre la base de un esq ue ma previo en el
qu e la mem oria auditiva juega un papel cent ra l.
2. La defin icion acade mica de timbre se puede encon trar, por eje rnplo, en
el apartado sobre terminologta ac ustica del ASA . Es repetida hasra el ca nsanc io
en rnultitud de norrn as y tex tos, y dice menos de 10 que no d ice: "ti mbre es el
at ributo de la sensaci6 n auditiva en term inos del c ual un oye nte puede juzgar
qu e dos son idos simil ares, co n igua l sono ridad y altura tonal, son diferenr esv.s
Esta es, qui za, la defini cion menos co mpro me tida de tod a la historia de la

2 American Sta nda rds Associati on (1960) , trad ucci6 n de GB. Esta definicion es de fendida,
entre otros, por Crow der, aunq ue impone una restriccion remporal que sc suma a las con
d iciones originales (Crowder, R. G., 1989). O tros autores (Plomp, R., 1976) restringen la
definic i6n a la clase de los sonidos co mplejos estaciona rios en el tie mpo.

164

acust ica. H ast a se podria dud ar de su co m petencia en ta nto definicion . Impl i


ca, por eje rnplo, qu e los son idos a los que se le puede asigna r tim bre poseen al
tura tonal; luego, los soni dos no t6nicos -corno los de un plat illo 0 de un
tambor- , [no poseen timbre ! S6 10 nos queda n dos posib ilidades: desistimos de
estudiar mas de la mitad de los sonidos que nos interesan, 0 buscam os otra de
finicion. Como ve re mos mas adelan te , este en unc iado esta profundamente in
fluid o por el modelo ac ustico clasico de tim bre.
A de rnas, iq ue sign ifica "dos son idos sirnilares''? iAlcanza esta seme janza a
la ubi caci6n espac ial, 0 a la tasa de repeticion si ex istie ra? iD ifiere el timbre
de un registr o este reofon ico de una tr ornp et a si un o int ercam bia los ca na les
derecho e izquierd o ? iEs d istinto el timbre de dos not as de un a flauta del t im
bre de tr es not as del mismo instrumento ? Son dem asiadas preguntas sin res
pue sta, y qu iza co nvenga aq uf repetir la op in ion de Bregm an sobre el punta :
"Creo qu e la defin icion de timbre de la ASA deberfa ser la siguie n te: 'N o sabe
mos c6 mo definir el ti mbre, pero no es n i la sonorida d ni la al tu ra tonal "
(Bregman, A., 1994).3
Una pos ible ex p licac ion del lugar espec ial qu e oc upa n la son oridad y la
alt ura tonal en la defini ci on aca dernica es q ue ambos param etres son uni di
mensionales y de fac tl co n tro l en los experimen tos de ac ustica y psicoacust i
ca. Otro moti vo es sin du da ellugar preponder an te que oc up6 la alt ura tonal
en las investi gaciones ac usticas a plicadas tan to a la rmisica occ iden ta l co mo a
la no occ ide n ta l, al men os hasta la de cad a de 1980.
Sin dud a, e l timbre es mas que un simple cata logo d e son idos 0 qu e 10 que
queda de un so n ido al quitarle la sono rida d y la a ltu ra tonal. N ecesitam os, por
10 visto, un a nu eva definici6n. Se rfa co nvenien te q ue esta nue va d efini ci6n
co n ternple un a descripci 6n senc illa de los eleme n tos qu e usamo s para percibir
el timbre y qu e, en 10 posibl e, se rel aci one clarame nte co n las seriales ac ust i
cas qu e 10 ca usan. H ace afios que los in vesti gadores en ac ust ica y los rruisicos
electroac ust icos tr abajan para desarrollar un a co lecc ion orde na da de terrninos
t fmbr icos desc ript ivos , aunq ue co n resultados in ciertos.
Las definiciones tr adi cionales de timbre prcsentan o tra difl cultad . Un
evento ffsico puede co m prende r mas de un a oc urrenc ia: los pasos de un a per
son a, la llu via sob re un a cha pa, los soni dos gran ulados qu e se usan en electroa
custica , varios instrumentos de rnusica tocando una sec uenc ia isorritm ica, etc .
Todos estos eje m plos se oye n co mo unidades acabadas pues forman part e de
una representaci6n pe rcept ual co h eren te, pero no se ada pta n con faci lidad a
,~oc i6n lim it ada de sonido qu e aparece en las definic iones de t imbre. EI co n
3 Mich el Chion es mas sarca.stico: "[ ] 'altura, int cnsidad , duracion, timbre' equivale a 'al
tura, peso, edad , fisonom fa genera l' [ ]" (Chion , M., 1998).

165

cep to de objew auditive , q ue ana lizaremos en detalle en el ca pitul o V[lI y qu e


co mp rende la fusi6n de las diferentes ca rac te risticas de la serial de en t rada en
un a (mica imagen cohe ren te, resulta mucho mas adec uado en estos casas.

recen provenir) de la misma fuen te ac ust ica y descubrir las propiedades qu e fa


cultan la ca tego rizacion tfmbrica de los o bje tos auditivos.
.
En 10 qu e sigue pre sentar em os algunos de los modelos explicativos mas
destacad os sabre el timbre . Al fina l de esta parte resumiremos las caracteristi
cas que, a nuestro jui cio, sinteti zan e l est ad o ac tual de la cuest ion.

2. EsTUDIOS Y MODELOS EXPLICATIVOS SOBRE EL TIMBRE


EI mode1o clasico
El timbre de un son ida es un rasgo perceptual de n aturale za diferente a la de
los otras rasgos ya ana lizado s, co mo la alt ura tonal a la sono ridad. Par eje rn
pi a , no es posib le or de na r los soni dos de menor a mayor e n un a sola di men
si6n tfrn br ica: el timbre es, en consecuen cia, un rasgo multidimensional.
Durante los iilt imos doscientos afios se estudio ca n cie rto det all e el tim
bre de los son idos, Se reali zaron gran cantidad de est udios ex pe rime n ta les y se
pr opu sie ran un a plural idad de mod elos explicati vos, tanto desde el punta de
vista de la serial ac iistica co mo del de las representaciones psiqui cas de los so
nid os. Cas i tod as las ex pe rienc ias se dedicaron al estudio del timbre en los in s
trum entos de mu sica. En la mayor fa de los estudios el tim bre n o es
co nsiderado co mo un ob je to de estud io en sf mismo, sino co mo un a ca rac te
n sti ca perceptiva q ue perrnite ide n t ifica r un a ca tego rfa particul ar de fuen tes
sono ras.
Las sefiales prefer idas en los est ud ios de laborat ori o son mayoritariamen
te estac io na rias en el tiempo - sinusoides a combinaci ones de sinuso ides-,
pues son fac iles de produc ir, de co n t ro lar y de medir. Aunque las seriales esra
ciona rias son mu y raras e n la natu raleza, los cantos y gritos de mu ch os an ima
les se les pued en aprox irnar por tram os. Los son idos gene rados por algunos
instrumentos de mu sica tarnb ien poseen segmentos que se pueden eq uipa ra r a
o ndas estac iona rias. O tros grupos de estudio ernplean puls os de ruid o, blanco
a rosa, en vez de sefia les esta cio na rias deterministas. De nuevo la elecc i6n re
cae sab re un artefa c to tecnicarnenre simple. Aunque los pulsos de ruid o son
mas h abituales en la naturale za q ue las seriales esta c iona rias, oc urren muy ra
rarnente en esrado puro. Como sab emos, el universo ac ust ico q ue nos rod ea es
mu y co mplejo y tod o intento de sirnplificac io n implica riesgos reconocid os,
Mu chos de los desvtos y desaju stes qu e aparecen ent re los mod elos acus t icos
sobre el timbre y la real idad arnbie n ta l - 0 mu sical- tienen su o rigen en un a
ex trapo lac i6n incorrecta de los resultad os de los expe rimentos de lab ora torio
a sit uac ione s ac usticas rea les.
Al margen de las h err arn ientas rnetodologicas ado pradas, la mayorfa de los
mod elos y teorias sabre el timbre intentan vincular ciertos param etres de la se
n al ac ustica ca n las co nsecuencias perceptuales asoc iadas, co mpren de r nu est ra
capacidad para asigna rle un ida d a los diferentes soni dos q ue provien en (0 pa

166

El mod elo clasico empleado pa ra exp licar el timbre -al menos en los instru
mentos de rnusica- establecia q ue, asf co mo la frec uencia funda men tal deter
mina la altura percibid a y la intensid ad ffsica la sono ridad, el timbre tiene
origen en la a mplitud y distribuci6n del espec tro promed io de la sefial acu sti
ca . El modelo est ab a basa da e n la ley ac ustica de O h m, enunc iada en 184 3 ,
segun la c ual el o fdo es ca paz de disc riminar los arm6 n icos que co mpo n en un a
sefial peri odica, pero n o pu ed e pe rc ibir las diferencias de fase entre los co m
ponentes, En la figura 1 se pueden ver los osc ilogra mas de cu atro seriales pe
ri6dicas can igual espec tro de potenci as y diferentes fases relativas en tre
arrnonicos. S i pudierarnos ofrlas n o e nco n trarfarnos diferenci as aprec iables.
De mod o mas pre ci so, la ley ac ustica de O hm esta blece qu e un oye nte
no puede d isti ng ui r en t re dos sefia les can la m isma distribucion de frec ue n
cias y a mplit udes en los a rmo n icos, pero can un a di stribuci6n de fases di fe
rente . En est e modelo el timbre depende unicarnente del espec tro de
potencias de la o n da , q ue es s610 un a parte del ana lisis co mp lete de Fourier
(Ba sso , G., 200 1a) .
Segun la tradi cion, el defensor mas dest acad o del modelo clasico fue H er
man von Helmholtz. S in emba rgo, H elmholtz tuvo la precauci6n de limitar su
alcance a las sefia les est acion ari as: "Ciertas ca rac te rfsticas particulares de los
sonidos de va rios instrumentos dep enden del mod o que co m ienzan y cesa n
[Oo .J", de man era q ue estudi6 sola mente "[...] las pec uliarida des de los son ido s
mus icale s que co n tiruia n un iforrn ernente"." Los seguido res del model a -easi
todos los ffsicos, ac usticos y rmisicos hasta bien e n trada la dec ad a de 1960-,
n o tuvieron la prud encia de Helmholtz y procl am aron resuelto el asun to.l A
10 sum o , reconoclan qu e la teorf a es ta ba limitad a a las ondas estacionarias pe
riodicas qu e, seg iin ellos, co mpo n fan la mayor parte de las sefiales de los in s
trumentos de mu sica.
" <, .............~

4 Helmholtz, H. von (1885-1954). Trad. de GB.


s S in int enci on de agota r la lisra, esra posicion se puede ver reflejada en los trabajos de Ray
leigh (1945), C ulve r (1947), Olson (1952) , Benade (1960) , Berane k (1962), Backus
(1969), Feyman (197 1) y Sundbe rg (199 1).

167

'}I)~ AJL'~,Y\r.

Tiern po

b)

ILL

OT' --,.-~---,--,

Flauta

UillJ

-20

co

~ -20
"0

.-E

-40

0.

<{

Frecuencia

Figura 1. a) Oscilogramas de cuatro sena tes periodicas con igual espectro de potencias y
d iferentes fases relat ivas: b) espect ro de potencias de las senal es anteriores

Frecuencia (kHZ)

Llevar esta teorfa a la realidad no fue tarea simple. Se sabla desde princi
pios del siglo XX que los espectros de los son idos varian en el tiernpo, asf que
la pregunta central fue: lc ual de tod os los espec tros sucesivos de bia to rnarse
para determinar el tim bre del son ido? La respuesta la dio H all en 1937 al es
tablecer que se deb fan pro med iar temporalm ente los espec tros, y que el resul
tad o de este promedi o era e l responsable del tirnbre .? Un eje rnplo
repr esentative de estud io experime n ta l basado en el modelo clasico se puede
aprec iar en la Figura 2.
Si el timbre es co nsec uenc ia de la distr ibuci6n de los armonicos 0, ex
puesto de otra manera, de la forma de onda estac ionaria, una serial cuya for
ma se mantiene no deber fa sufrir modifi caciones t fmbricas. Pero un o de los
experimen tos acusricos mas simples contradi ce esta afirrnac ion .? La fo rma de
onda de un a sin usoide no ca mbia a l cambia r su frecuenc ia, pero si se genera
un glissando que recorra buena parte del tan go audi ble poc as personas d iran
q ue el timbre perrnan ece inmutabl e. En realid ad, a bajas frecuen cias la sin u
soide suena bland a y oscura, mientras q ue a altas frec uencias parece dur a y br i
llante." [La sin usoide, el "ladrillo" con el que se pret end fa construir el edificio
del timbre poseia, a su vez, un timbre particul ar! 0 peor aun, mutaba de t im

Hall (1937) , en Cook, P. (1999).


El experimento fue realizado por primera vez por Kohl er en 1915 (Risser y Wessel, 1999).
8 Q ue en un texto sobre el timbre esternos usand o palabras como "duro", "oscuro" 0 "bri
llant e", romadas en presramo de otros sent idos, demuesrra 10 lejos que esta rnos de rener re
suelro el asunto .
6
7

168

Figura 2. Espect ros de son idos de diferentes instrurnen tos segun Wedln y Goude (Hande l,
S, 1995)

bre a medid a que ca mbiaba de frecue ncia. La conclusion del expe rimento es
ca teg6 rica: no ex iste una relaci6n uno a uno entre forma de o nda y timbre.
U no de los pilares del modelo clasico se desrnoro naba.
Otra cuest i6n que gener6 un intenso de bate fue la de la invariancia del
timbre ante un cambio de frecuencia. Para que el timb re no varie, ldeb en con
servarse las relacione s de amplitud entre arm6n icos para preservar la forma de
onda escalada, 0 de ben conservarse las posicion es absolutas de la envoi vente
temporal? El modelo clasico sosten ia clararnen te la prime ra opcion. En un ce
lebre trabajo, S lawson demostr6 que el model o tarnbi en fracasaba en ese pun
to (S lawson, W., 1968 ). En la Figura 3 se pueden ver las dos opciones. Los
oyen tes juzgaron que la alte rna t iva 1 co nserv a mejor el ti mbre que la alter na
tiva 2 -defend ida por el modelo clasico,
Durante el ana 1926, en plena auge de la teorla clasica, Me tfessel public6
un artlculo en el que ponia en duda la simplista propos ici6n "forma de on da es
tacionaria igual timbre" (Butler, D., 1992). La inve rsi6n temporal de una serial
de aud io -posible desde la aparicion del registro magne tico durante la segun da
.~rra mundial- , en la que se mantiene sin carnbi os el espectro de potenc ias
pro medio pero se alteran las fases relativas, de mostr6 que hab ra alga mas que
distribuci6n espec tral en el te rna del t imbre (cualquie ra puede co mproba r el
cam bio d rarnat ico que se oye al invertir temporalmente un registro de pian o,
por ejemplo mediante el uso de software de aud io en una corn putado ra) .
169

a)

.....1
I..,I.

-0

eo

-0

'iii

Espectro original

r-- ..'l

OJ

dos y para prede cir 0 crear otros n un ca experimentados. Dur ante el siglo pa
sado se pot encio la necesi dad de aplicar las nuevas recnologias a la construe
cion y a la sirnulacion de instrumentos m usicales. La llegada de la energia
electric a prime ro, del control electr6nico desp ues y, por ulti mo, de la sintesis
digital, perm iti6 gradualmen te la construcci6n de sonidos a partir de la des
crip c ion ffsica de las sefiales asoc iadas a tales sonidos. El mayor esfuerzo tee
no logico se apoy6 en los tratados de acust ica qu e repetlan, obv iamen te, el
modelo clasico . En la mayo rla de los casos el producto de la sin tesis instru
mental se parecfa muy poco al instru men to origina l. Los son idos resulraban
apagad os, carentes de identidad y de interes.? La conclusion fue entonces evi
dente : la descri pci 6n ffsica de la cau sa del t imbre era in adecuada, pues fallaba
en el dec isivo test de la sintes is aciistica. Este fracaso pued e describirse como
un a auten t ica "catastrofe del t imbre" de la ac ust ica del siglo xx. El modelo cla
sica debta ser reemplazado par otro.

10 Numero de arm6ni co

"' j . . .

Frecuencia (Hz)
b)

co

-0

'iii

I .

-0

Nurnero de arm6nico

I
Alterna tiva 1

OJ

Conservaci6n de las
tor-nantes espe ctrates

.'. I

.' 1...
Frecuencia (Hz)
c)

234567

I .... ~ ... '1

1
. . . . ' .

*.~:..r.' r,'. _. 1'. '.


~

~ ~

"

-. '

'\ '

~ ..

Altirnativa

Anal isis multidimensional

d~."""?"

Conservac ion de la

.I-. --.1.... r
estructura

Frecuencia (Hz)

Figura 3. Experimento de Slawson sobre la invar ianc ia del t imbre ante un ca mbio de
frecuencia, a) espectro or iginal, b) alterna t iva 1: frecu encias fijas 0 conservaci6n de las
formames espectrales: c ) alt ern ativ a 2: frecuencias relativas 0 conservaci6n de la
estruct ura de arm6n icos

lPor q ue contin uam os reconoc iendo la fuente acustica al o ir musica en


una pequefia rad io , 0 cua ndo o frnos un instrumen to en una sala con una res
puesta en frec uencia irregu lar ? En ambos casos el espectro de potencias origi
na l se alte ra profunda mente y tarnbien deberta a lterarse, de acuerdo co n el
modelo clasico, el timbre que per cibim os.
H emos exa minado va rias de las dificultades que encontro la reorl a clasi
ca del timbre desde su en unc iac ion a med iados del siglo XIX . Aunque no daba
cue n ta de nume rosos he ch os, segula siendo considerada correcta por la mayo
ria de los especialist as, qu ien es supo n ian que solamente restaba realizar algu
nos ajustes. Esta sit uaci on se mantuvo ha sta la decada de 1960, cuand o la
aparicion de la sintesis acust ica por cornp uta do ra ter rninarfa definitivarnente
con el modele . Como sabernos, un modelo sirve para explicar hechos cono ci
170

--

La falla principal del mod elo clasico fue, sin dud a, que en su form ulaci6n sos
layaba compl etamente la importancia d e los fac tores temporales. Hel mho ltz
ya habta sospecha do que el ataque y la extincion de c ierto s son idos co n renia n
informacion relevante para la det erm inacion de l t imbre. Y resultaba eviden re
que la co rrespondenc ia en tre los datos ffsicos y los rasgos pe rcibidos no era
simple y line al co mo, por ejernp lo, en la relac i6n frecu enc ia-altura.
Para no repetir el erro r comet ida dur an te el apogeo de la teo ria clasica,
en el q ue se inten to imponer un concepto ffsico para explicar la perc epci6n ,
dur ante la dec ada de 1960 se idearon y realizaro n gran can t idad de expe rien
cias psicoaciisticas. Las motivaban la necesid ad de encontrar los datos fisicos
empleados efectivamen te en la percepci6n del timbre, comprender la estruc
tur a de las rep rescntaciones pslquicas de l t imbr e de un son ida y hallar un a co
rr espondencia en tre datos fisicos y representaci one s mentales .
Aunq ue par ece habe r un a gran ca ntidad de maneras de describir la form a
en qu e un son ido se dis ting ue de otro , la psicoacust ica necesita encon trar las
mas sencillas para simplificar el problema . Es in teresan te aqui comparar el es
tudio de l t imbr e can el del co lor. Un co lor esta determinado ffsicamente par
un espectro de luz carac reristic o. Exisren infinid ad de espectros posibles y po
dem os percibir miles de co lores, Sin embargo, tod os los colores pueden desert
birse can s610 tres dimensiones: dos de ellas define n la cro ma t icidad y la otr a
Algunos de estos instrumen tos, sin embargo, lograron irnponerse como generadores de
timbr es a rigina les y novedosos. Tal es el caso del organa Hammond.

171

\'

c l brillo . iEs pos ible desc rib ir las difer enc ias de t im bre en tr e los son idos a par
tir de un ruirn e ro peque fio de dimensiones, c om o oc urre co n e l color? Para
responder a esta preg un ta se emplea el metoda del analisis multidim ensional, me
di ante el cu al se procesan esta d fst ica rnen te los .I uicios de los o yen tes sobre e l
grado de sim ilit ud entre dos sonidos elegidos de un conjunto restringid o . La
hipot esis de trab ajo del metodo afirrna q ue ex iste un numero lirnitado de di
mension es ca paces de desc ribir la total idad de los timbres pos ibles. S i dos so
n idos tiene n un va lor ce rca no en una d imens ion , so n sim ila res e n esa
dimens ion aunq ue no 10 sea n en las o t ras. Bregman 10 ex p lica de la siguien te
rnan era: "C uan do co menza mos a pensar en las similitudes en t re cosas, inrn e
dia ta rnen te nos dam os c uen ta que un a cos a puede parece rse a o tra de man e
ras di feren tes , Una pe lo ta se parece a algun os jugue tes e n su redondez, a o tros
e n su co lo r roj o, a o tros en su ta rnafio , [...] el hecho de q ue a lgo pued a pa re
ce rse a o tras cosas de diferen te s maner as lle va n at ura lmente a la idea de la
ex iste nc ia de dimensiones de sirnilit ud'U ''
A co n t in uac io n describiremos tre s destacados estud ios de ana lisis mu lti
dimen siona l sobre el timbre.

ESttldios de Plomp. En 1967 Re ini er Plomp descubrio q ue las d iferenc ias t im


br icas se corre lacionaban bien co n dife renc ias en el espectro cua ndo se cons i
deraba n los ni veles de 18 ban das de te rc io de oc tava, ape nas mayo res que las
bandas cr iticas. Dicho de otra forma, el ti mb re se re lac ionaria con e l pat ron
espectral de excitacion de l son ido . Como h ay 37 bandas c rfticas cub riendo to
do el rango aud ible habrta qu e co n side ra r o tras tantas dimensiones. Para co
rrobora r estas co nje turas decidi6 realiza r un est ud io sistem at ico. Los primeros
tr ab ajos de evaluacion mult idimensional fueron realizados ent re 1960 y 1976
(Plo rnp, R. , 1967, 1976). Ernpleo co mo datos de partida so n idos de violin,
viola, vio lo ncello , oboe, c la rine te, fago t, trornpe ta, co mo frances y trombon,
De term ino qu e los ju ic ios so bre di ferencias entre los so n idos podfan reso lver
se co n solo tres dimensiones perceptua les.
En un a segunda e ta pa in rento det ecr ar la clase de in for macio n acu stica
usad a para det errninar el timbre. Analizo ffsicamenre las sefia les de los instru
rnentos filt rando las e n 15 bandas de terc io de oc rava, siguiendo a prox irnada
mente la distribucion de las bandas c riticas e n el oldo . A partir de la co nje tura
de q ue las 15 bandas no e ran totalmenre independ ientes un as de otras , redu
.1 0 tod a la in formacion espec t ra l a cua tro dirnensiones basicas, La int enci6 n de
Plomp era rot ar y aco mo da r estas c ua tro dimens iones fisicas para ajusta rlas a
las tres dimen sion es percep t ua les derivad as del analisis de di fer en cias en tim
10 Bregman, A. (1994) . Trad . de OB.

172

bre. La h ipotesis principal esta blecia q ue los oye ntes ernplean la corr elacion
entre diferenc ias espect rales para per ci bir el timbre de los so n idos . Aunque
Plornp permite la apa rici6 n de nu evas dirnensiones perceptuales en cases par
ticulares (po r eje rnplo, la "tasa de rui do" es dec isiva para evaluar e l so n ido de
un cascabel) , sugiere qu e siernpre se reducen en ultima ins ta nc ia a no mas de
tres. Simplern ente, cada son ido pol ari za e l ca mpo perceptua l de ac ue rdo a sus
carac teri sti cas particulares.
Aunque e l mod e le de Plornp introduce e l a na lisis mul tidimensional en el
esrudio de la percep c ion del timbre, sigue fie l a l mod elo espectra l cs rarico de
la reo ria c lasica . Quiza por eso su rnejor resulrad o se h a ob ren ido con so n idos
cuyo c ue rpo es mu y es ta ble e n e l tiernpo , co mo 10 so n los qu e ge ne ran los tu
bos de o rgano. En la Figura 4 se aprecia un d iagrama bid ime nsio na l e n el que
se comparan los jui cios so bre los so n idos de los t ubos reales co n sus sirnulac io
nes esp ectrales. La d im en sion vert ica l desc ribe la ca nt ida d de arrn on icos supe
riore s (d e men or a ma yo r ca n tida d), rnie n t ras qu e la horizon tal es produ ct o de
una com binacion co rnpleja de pr opi ed ad es espec t ra les .
Una de las criticas mas irnport antcs que se le h an h echo a este tip o de ana
lisis es q ue de pende fue rte me nte de l co nj unto de sonidos eleg idos. En cie rta me
d ida , para cada co nj unto de datos se obt ienen resultados d iferentes, A dern as, las

o
o---b.
Trompela

L;,

Organa
Sintetizadar

Regal

~ F" "

'
Diapas6n 4'

LengOe1as

J?

f:/alJla s

Q~JD iapaS6 n

8' .

Diapason ~

G ed aC~

Octava 2'

Waldftule

------

Rohrtlute

Figura 4. Repr esen tacion bidimen siona l de l timbre de sonidos de organa (cfrculos) versus
son idos de orga na sin retizados (triangu los) (R asch y Plomp, 1999 )

173

diteren cias en el timbre "esta tico" de Plomp no son sufic ien tes para definir un
objeto audi tivo, en part e porque la serial acust ica puede ser alterada espect ral
mente par las reflexiones en una sala. En la epoca de los trabajos citados se sa
bia que el reconocimien to de los instr umentos musicales, pa r ejernplo, depende
ca n fuerza del at aque y de la estructura temporal de la en voiven te d inarnica del
son ido.!' S in embargo, Plomp no incorp or6 factores ternporales en su modelo.

Especlro

angoslo

1
~

u
Q)

0.

if)

Q)

-0

'(3

Modelo de GTe )!_ Entre 197 5 y 1979 John Grey realiz6 una serie de experien
cias tendientes a construir un espacio ti mb rico vecto rial , sim ilar al que se em
plea para describir los co lo res. En la primera de elias ernpleo di ec iseis son idos
de la misma altura, intensidad y duraci6n , pro ven ientes de 12 instr umentos
t6nicos (es decir, de al tu ra to nal defini da ). Digitalize las seriales, las simplifi
c6 reempl azando las m icrovariaciones temporales pa r secciones rectilineas, y
se las presen t6 de a pares a ve in te oyen tes. Los suj etos deb ian cuantificar la si
militud en tre los son idos de cada pa r medi ante el usa de un a esca la grad uada
de uno a trein ta. Grey interpret o qu e las dista ncias psicol6gicas se pod ian co
rrelacionar negativamente ca n las sim ilitudes per ci bidas. En otras palabras, a
menor similitud, mayor dista nc ia timbr ica. Los result ados de est a experienc ia
fueron graficados en el espacio vec torial tridimension al de la figura 5. Cada
dimen sion , aunque obten ida par ana lisis multidimen sional , representa los
atribu tos ffsicos que Grey consider6 mejor apa reados con las respuest as per
ceptuales obten idas (Grey, J., 1975) .
La d imensi6n vertica l (Y) repr esen ta la distribuci6n de la en ergia en los
parciales arm6 n icos de la serial. Se trata princ ipalmente de una dimensi6n es
pectral. Se puede pensar en ella co mo repr esentando el grado de "brillo" del so
nid o, y en los analisis trad icio nales queda defin ida par la envolvente espectra l.
La dim ensi 6n horizontal (X) repres enta en parte el grado de fluctuacion de la
env olvent e espectral dur ante el desarrollo del son ida y en parte el grado de sin
cron ismo en el ataq ue de los diferentes arrnon icos, Es una dimensi6n espectro
temporal, den ominada "flujo espectral" por Krumhan sl (McAda ms y Bigand ,
1994 ). Permite distinguir entre sonidos de evolu ci6n esta t ica y sonidos de ev a
luci6n dina rnica. La tercera dimensi6n (Z) repres enta la presencia de vibracio
nes inarm 6nicas prev ias a la parte arm6n ica pr incipal del son ido. Se pued e
hablar de una "calidad de ataque" y es esenc ialmen te una dimensi6n temporal.
En una pub licaci6n de 1977 , Grey ilustr6 dos de las proyecc iones bidi
mensionales de su espac io tridimens ional con los d iagramas tiemp o-energia
frecu en cia (TEF) de las sefiales de los instrumen tos (figura 6).
clasico en esa epoca consistfa en invert ir cernporalmerue un regisrro de audio:
la en volvente espectr al promedio no cam bia, pero el tim bre sf 10 hace.
11 EI ejemplo

174

:J

'C

.~

Especlro
ancho

_ .

( -(

/ u 7L

fr.7/

~
Jncrcnlco

'. ~'
:z:tt

1r. ?1-

I.:::=J L:..':l

'-=-'

<l'.

\\

Desplazami ento del ataqu e

Q)

&

r>:
----X

Tran sitorios
de alta Irecuencia

.c

Asincr6nico

Sin transttorio s
de alta frecuencia

Figura 5. Representacion tridimension al de similitudes rfmbricas. O boes (01 , 02 ); como


Ingles (EH) ; fagot (BN) ; clarinete alto en Mib (C l ): clari net e bajo en Sib (C 2); saxof6n
alto mf (Xl ), saxof6n alto p (X2) ; saxof6n soprano en Sib (X3); flaura (FL); trompe ta
(T P); co mo frances (FH) ; trombon con sordina (T M), violoncello sui ponticello (51),
normal (5 2) y sui wsw (5 3) (Gr ey, ).,1 975 )

~ ~Q" ~

'"
0

0 '

\ '\

Q.l

~,~ tt l L
@

~@
t" '@~ ~,, ' ~.c~~
.
~
~

~~

"

-.

' 0
01

Sincro nicos

Parciales
Dimension 2 Asincroni ccs

~1
~

iii
~:J

'~

Figura 6. Ejempl o de una pro yeccion bidime nsion al del espacio de tim bres
(los instrurnenr os son los rnisrnos de la figura 5) (Gre y,[ ., 1977)

175

"\

Las conclusiones que el autor extrajo de este estudio, y de otros similares,


fueron muy valiosas. En primer lugar, constato que la representacion mental
del conjunto de timbres es relativamente estable y mas 0 menos identica en
tre un sujeto y otro. Se comprob6 que un cambio en una dimensi6n ffsica par
ticular (por ejernplo en la envolvente espectral) provocaba un desplazamiento
en la dimension perceptiva correspondiente ("brillo" en este caso ). En ciertas
ocasiones se producian tambien desplazamientos en otras dimensiones. Quiza
la conclusion mas controvert ida este relacionada con la continuidad de las
transiciones timbricas: "No hay fronteras perceptuales marcadas en la identi
ficaci6n entre dos sonidos interpolados [...] la ausencia de llmites abruptos y
la sensibilidad al contexte sugiere que, definidas estrictamente, las transicio
nes no se perciben categorialmente'l.U
De acuerdo con las experiencias de Grey, es probable que existan distin
tas estrategias perceptuales asociadas a la discriminaci6n tirnbrica, que se ac
tivan en funcion de la caracteristica particular mas pronunciada -temporal 0
espectral- del sonido en cuestion. Quiza estas diferencias en las respuestas es
ten fundamentadas en la polarizaci6n de la atencion hacia 10 que los oyentes
seleccionan, en un proceso preconsciente, como la caracteristica tlmbrica dis
tintiva en cada caso.
Se puede poner en duda la hip6tesis de Grey segiin la cual sonidos extre
madamente complejos no difieren entre sf mas que en ciertas dimensiones
subyacentes comunes. Es posible que algunos timbres pose an caracterfsticas
unicas no codificables en dimensiones continuas. Un buen ejernplo se en
cuentra en la preeminencia de arrnonicos impares en el clarinete, que contri
buye a su identificacion mas que otros datos aciisticos espedficos como la
envolvente de arnplitud. En cambio, en los sonidos en los que la envoivente
de arnplitud posee caracteristicas destacadas, como en el tromb6n 0 la flauta,
esta prima en la identificacion por sobre la estructura arrnonica.
Con todo, la mas profunda de las objeciones a los modelos basados en es
pacios vectoriales ataca directamente su naturaleza: un espacio vectorial es
esencialmente lineal. Sabemos, sin embargo, que en la percepci6n del timbre
ocurren grandes saltos y bifurcaciones marcadamente alineales. Un modelo
como el de Grey quiza sirva solarnente para describir regiones timbricas aco
tadas, con comportamientos lineales locales, ocupadas por sonidos de caracte
rtsticas afines.
Estudios de Iverson)' Krumhansl. Iverson y Krumhansl analizaron la percepcion
del timbre empleando sonidos de instrumentos musicales tonicos en tres con
t1

Grey,

176

(1977). Trad. de

GG.

diciones diferentes: senales cornpletas, solo los primeros milisegundos de las


sen81es (ataques) y sefiales cornpletas menos los ataques (es decir, el cuerpo y
la extincion) (Iverson y Krumhansl, 1993). Como en el estudio de Grey, los
sujetos juzgaron la similitud de cada par de instrumentos tomados de un total
de 16. Los juicios de similitud fueron notablernente consistentes en las tres
condiciones impuestas. Los autores graficaron parte de los resultados en el es
pacio bidimensional de la figura 7.
La dimension perceptual horizontal esta relacionada con las diferentes
envolventes de amplitud. Los instrurnentos de ataque rapido, como los de per
cusion, se encuentran a la izquierda, mientras que los de ataque gradual, como
los de viento, a la derecha. La dimension vertical esta asociada con la envol
vente espectral (el brillo aumenta hacia arriba). Iverson y Krumhansl sostie
nen que los oyentes basan sus juicios en las propiedades acusticas que se
encuentran en la totalidad del desarrollo del sonido. El proceso fisico de ge
neracion vincula fuertemente las diferentes partes entre sf. El ataque, el cuer-

i~

O ,~taqu es

'D TonGssin att:i ques

Frecuencia

Perfil espect ral


mas ancho

~o

JIM '0' o
't:

rf

&
~
~

Perfil espectral

mas angosto

r:

L21

Frecuencia

Envolvente de amplitud

to]
Tiempo

+ Subito

~'E E:]
1'1
2

4:

.,

Tiempo

Tiempo de ataque

I~
Tiernpo

+ Lento

Figura 7. Representaci6n bidimensional de similitudes tfmbricas. Comparaci6n entre


ataques aislados (cfrculos) y sonido sin los ataques (triangulos): fagot (1); violoncello (2);
clarinere (3); como ingle, (4); flauta (5); como frances (6); oboe (7); piano (8); saxof6n
(9); tromb6n (10); trornpcta (11); trompeta con sordina (12); tuba (13); carnpana tubular
(14); vibrafono (15) y violfn (16)

177

po y la ex t incion son inte rdependientes y n o se co ntrad icen . Este argumento


explicarfa la causa por la cual co n solo un a part e del son ido - el ataque 0 el
cuerpo , segun el caso- pode mos iden tifica r su tim bre. O tra conclusion der iva
da de este estudio estab lece que los datos que usam os para percib ir el timb re
depe nd en del context e . La repre sentacion psfquica resultante es func ion tan
to de la durac ion, in tens idad y envolve nte espectral de la sefia l acust ica, co
mo de l ban co de son idos almace na dos en la memori a del sujeto , su estado de
atencion y su experien cia previa. En este punto, los auto res declaran la proba
ble inexistencia de invariantes aciisticas subyac en tes en la percepcion del tim
bre de los son idos,

Conclusiones sol:rre los modelos multidimensionales. A pesar de la gran ca ntidad


de inform acion que aportaro n hasta la fecha, los inrent os tendient es a encon
trar un mimero redu cido de dimension es no han llegado a result ados conclu
yentes. N inguno de ellos dern ostro que las d imen sion es sugeridas son
co rnple ta mente adec uadas, aun de n tro de un un iverso restringido de estimu
los. Nu estr a objec ion al modelo de G rey puede ex tenderse, en menor 0 mayor
medid a, al resto de los estudios sobre el timbre basados en el analisis multid i
mension al.

ta y baja frecuenc ia, y se parece al "bri llo" presente en casi todos los estudios
sobre t imbre. La segunda di mension en import anci a -"compacto- d isperso"
perrnire separar los son idos to nicos del ruid o. En esta experie ncia , como en to
das las de su clase, el resultado es muy sensibl e a la selecci on inicial de son idos.
Pa r ejemplo, la dimension "cornpacto-disperso" no hubiera apa recido si no se
inclu ian pulsos de ruido entre los esti mulos de partida.
O rra posibilidad de ace rca miento verba l al timbre la dan las "ex perie nc ias
de campo", en las que simplerne n te se recopil an y clasifican los terrninos que
las perso nas -rnusicos 0 no musicos, segun el caso-, usan para describir los so
nidos. Aquf la dificult ad est a dada por la mu lti plicidad de un iverses lin guist i
cos exis te ntes, aun de ntro de un a misma comun idad. Los mejores trabajos son
los que restringe n las muestras a un uni verso mu y aco tado . Dos buen os ejern
plos son los tra bajos de Kend all y Ca rtarette , en los que analizan los terrninos
que apa recen en el tra bajo de Von Bismark citado y en el trat ado de orqu es
tacion de Wal ter Piston (Kenda ll y Cartarette, 1993). EI fin prac tice mas sig
nificari vo de esra clase de estudios es obtene r un diccionario de terrninos que,
al alimentar uri siste ma basado en una red ne ural, perrn ita que los rru i sicos
controlen de man era verbal ciert os programas de sinresis pa r co rnputado ra.
Mod elos de analisis por sfntesis

Modelos verbales
Desde un a perspect iva d istinta, Von Bismark int ent o reducir el mime ro de va
riables necesarias para de term inar el timbre a parti r de la verb alizacion de las
percepciones (Bisma rk, G., 1974 ). Q ue es, de heche, 10 que hacemos habitu al
mente cuando tratamos de descri bir un son ido en un a co nve rsaci6 n. Se lecc io
no 35 son idos diferentes y le pidio a los oventes que los califiqu en, con un valor
de 1 a 7, con relaci on a 30 cualidades 0 dimensione s d iferentes, Cada dimen
sion se defin io a partir de una parej a de adjet ivos contrarios com o "duro-blan
do", "seco-vivo", "opaco-brillante" y asf hasta llegar a las 30 inclu idas en el
estud io. Los son idos prove n lan de genera do res de sefiales periodicas co mplejas,
co n un ruirnero variable de armo n icos, y de pulsos de ruid o rosa. Se hac ian pa
sar a traves de filtros que los modifi caban de acuerdo co n determinadas envoi
ventes espec trales, entre las que figuraban las correspondientes a las voca les en
idiom a aleman. Aplicando el met odo de selecc i6n de co mpone ntes princ ipa
les, el auto r reduj o las 30 dime nsiones verba les origina les a cuat ro d imensiones
perceptuales. Las dos d imensiones mas destacadas represen taban los pares
"punzante-apagado" y "compacto-disperso". La d imension mas importante
-definida por el par "punzante-apagado"- se relacion o co n el ce ntro de grave
dad del espectro de la sefial, que depen de de la relacion ent re la ene rgfa de ai

178

EI ti mbre de los sonidos tarnbien se puede estudiar des de un a perspectiva to


talrn en te diferenre, que parte de la produccion antes que del analisis. La idea
cen tr al co nsiste en el desarrollo de modelos de sin te sis qu e perrn itan gen erar
son idos sinte t icos indi stinguibles de los soni dos "na turales" que se desea n
irnitar. S i ambos so n idos, el sinte tico y el or igina l, se ove n exactame nte igua
les, en ron ces la descripc ion acus tica del son ido - adoptada para elaborar el
mod elo- es acertada. EI metodo se denomina ancilisis POl' sfnresis . Jean C lau
de Risse r ilust ra el proce so en un diag rams sim ilar al de la Figura 8 (Ri sset y
Wessel, 1999).
Quiza un ejernplo ce lebre sirva para aclarar el procedimiento usual en es
ta clase de inve st igaciones. En la decada de 1960 R isser y Max Mathews in
te ntaron, sin exi to , imitar los soni dos de los instru mentos de bro nce. La teorfa
\ clasica - con sus espectros estati cos- fallaba comp leta men te, y el intento p'or
\ dot ar a las sefiales de un co mporta mle nto tem poral senClllo - compuesto por
un ataq ue , un cuerpo y un a ex tinc i6n- tamp oco mejoraba mucho los resulta
dos (R isset y Math ews, 1969). Para destrabar la cuest ion , registraron magne
ticamente el sonido de una trompet a real ejec utada por un profesional. La
grabac ion fue realizada mediante el metodo de anal isis sincronico de alt ura en
un a camara anecoica -con un tiempo de reverberaci6n muy bajo- para elimi

179

0'"

~t"

~:'I>

60

C0Q.

' 'o~

,/>",

~~

<V'"

CD

U
t1l

;Q

~ 30

100

50

150

Tiernpo (ms )

Figura 9. Resulrado del ana lisis sinc ron ico de altu ra del son ido de un a tro rnpera (Basso,
G .,200 1a)

Figura 8. Diagrama conceprual del proceso de aua lisis par sfnresis


60

iii'
~

na r los efectos aciist icos propi os de un a sala normal. El ana lisis sincron ico pre
supon e qu e la serial es cuasi-pe riodica y de scribe el desa rro llo de cada arrno n i
co individual en el t iernp o. El resultad o de un ana lisis de esta cl ase se mue st ra
en la figura 9.
A partir de este an alisis del sonido or igina l, los autores sirnularo n la serial
simplifica n dola de dos rnane ras: elirnina ron las fluctuacion es de alta frecuen
c ia y aprox imaro n las curvas po r trarnos lin eales. La sena l sin tet izada que do
co mo la que se ve en la Figura 10.
Las dos sefiales resu ltaron ind ist ingu ibles cu ando se las co rnparo a ud it iva
mente. Las simplificacion cs, por 10 ta nto , n o afect aron los datos relevan tes
presentes en el sonido origina l.
Au nq ue el mode lo er a simp le, para la epoca resul taba m uy costoso a n i
vel co mputaciona l (e n el estud io or igina l se simu laron las evo luc ion es tern
por a les de los primeros 13 arrnorucos) . A partir de suce sivas simplificac iones,
Risset y Mathews encon tra ron que: 1) la variac ion tem poral del esp ectro es
crft ica pa ra deterrnin ar el timb re; 2) las variacio nes de alta frec uencia y pe
q uefia arnpli tud n o se perciben; 3 ) la dinarnica del crec im ient o de cad a ar
mo n ico defin e gra n pa rte del tim bre de los bronces; 4 ) existe un a forrn ante
ubicada entre 1.000 y 1.500 H z de gra n imp ortan ci a pa ra la d iscrirninacion
180

U
t1l
U

.~ 30
Q)

.~

.... .

.3.. .

100

50

150

Tiemp o (ms)

Figura 10 . Slntesis de la serial anre rior simplificada

tfmbr ica; 5) la prop orcion de ar rnonicos supe riores aumen ta signi ficat iva
mente con la inte nsi dad . Empleando estos nu evos co noc im ien tos lograron
cre~un model e co mp utac ion alrnen re mas econo rnico que supero ex itosa
men e la prueb a de discr irninacion aud itiv a
. l.ejernplo ante rio r, aunque limitad o a un os pocos sonidos de rrornp eta,
ilustra las caracte rist icas y ve ntajas de l an alisis por sin tesis. Par a em pezar, per
mi te eva luar cada pararnetr o del so nido de ma ne ra ind ividua l, uno por vez,
evitando la co mp lejfsima tarea de lid iar co n espaci os multidimensionales en
los que no se sabe bien qu e cosa produ ce cada efecro per ceptual. N o menos

181

irnportante, saca prov echo inmedi ato del avance tecnol ogico en los ca mpos
de la aciistica y de la informati ca, a la ve z q ue im pul sa nu evas in vestigacio
nes y desarro llos . Los mod elos de ana lisis po r sin tesis h an demost rado ser efi
caces para gene ra r co noc irnien ro cient ffico y te cnico , reducir la can tida d de
in formacion necesar ia para exp resa r una serial acu stica, pro du cir varian tes y
modi ficaci ones nunca ex pe rirnen tadas y co ntro lar la pro sodi a m usical en
tiempo real.
U na descr ipc ion deta llada de las tecnicas empleadas conr en dria la h isto
ria de la elec troac ust ica duran te los ult irnos 60 afios. S610 para enu rnerarlas,
podem os c ita r la sin tesis aditiva, la sln tesis sustrac t iva, la sin tesis alinea l 0 glo
ba l -a este grupo per tenece la sin tes is por FM de Chowni ng- , el mo de lado ff
sico y, ac tua lme n te en desar rollo , la sfn tes is basada en prin cipios percep tu ales.
Estudios sob re el timbre en la VOz h urna na
Parece que poseem os cap acidades audi t ivas especiales para co mp re nde r la voz
h urnan a, q ue no empleam os para oir el resto de los sonidos, Es algo similar a
10 q ue oc urre en la decodi ficacio n visual de los rostros. Se sabe que pa ra el re
conoc imien to del rostro de un a persona se usan rec ursos diferentes de los q ue
se usan para percibir el resto del camp o visual (ex isten personas que n o pue
den distinguir los objetos, pero que leen perfec tarnen te los rostros, y viceve r
sa ). Q uiza esta s capac idades tengan que ver con la irnpor tan cia socia l de la
in formacion y co n 10 parecidos que son los rostros - y las vo ces- entre sf; es
prob ab le que se n ecesite cierta ca pac idad pot enciada y espe cifica para distin
guir en tre un a voz y otra. Por otra parte, existe fuerte evide n cia de que la pa
labr a y la musica se procesan en lugares d iferentes de la corteza cerebral.
Anteriorme nt e se crefa que cada un o de los h emisferios cerebr ales estaba es
pec ializado en un o de estos do rnin ios, pero en la actualidad se sabe que tanto
la producc i6n como la perce pci on de miisica y pa labra involucran varios sub
procesos , cada un o de ellos lat era lizado de mod o diferen te. Por eje rnplo , se
descubri6 que las ta reas de discr imin aci6n y de identificacion (q ue implican
un acceso al lexico verbal ) son independ ientes y estan loc alizadas en dife ren
res lugares de la co rteza .
El pro blema de la iden t ificac ion t fmb rica de las voces es mucho mas di
freil que en el caso de los dernas son idos, N o s610 porqu e pode mos ident ificar
m iles de voces di fer entes (contra un gru po reducido de et iquet as ti rnbri cas
gene rales ), sino por el peq uefio ran go de variaci6n de los rasgos n o t lmbr icos
en la voz. Sa bemos que las frec uenc ias fundamenta les t fpicas en h ombres,
mujeres y ni fios estan comprend ida s en tre 80-240, 140-450 y 170-600 H z,
respectivam ente. Y que el ran go de variac ion en frecuencia para un habl ante

182

prom edio alcanza una relaci6n de 2 a 1 (en el can to no profesional es de 3 a 1) .


Pese a est a amplitud de val.ores espec trales, se co mpro b6 que un carnbio de ape
na s 5% en la frec uen cia de alguna de las tr es primeras forma n tes puede redu cir
drasticam ente la capa cid ad de identificacion de un a voz con ocida.
Aunque apa re nte rnente la frec uencia fund amen ta l, la frec uencia de las
forman te s - especialmen te entre 1.000 y 2.500 H z- y el anc h o de banda de
las forrna ntes participan en la ide n t ificac ion de la voz human a, se pre sume que
la infor mac ion aciistica relevante depe nde de las ca rac terist icas part iculares
de cada locutor (Van Dornm elen , W., 1990) . En otros ter rnin os, no ex iste un
conjunto fijo d e datos in variantes que se ap liquen a todas las situaciones . Por
ejemp lo, pued e oc urrir q ue la seria l ac usti ca de la voz del h ablante A posea
cierta can tidad de informac ion especffica , de la c ual el oven te extr ae un sub
co njunt o de datos adec uado para su idenrificacion. Pero en el caso del h ablan
te B el subcon junto ant erior pod ria resu lt ar in aprop iado , y el oyente deb e
elegir otro diferente .
Estudios sobre el "color" del sonido
Un grupo part icu lar de est ud ios fue orientado sobre 10 q ue se llam6 el "co
lor " del son ido , El co lor del sonido no t iene , segun sus defe nsores, prop ieda
des tem por ales y se ap lica a los atr iburos estacionar ios de l soni do , n o a los
tra ns itori os. De ac uerdo con Wayn e S lawson, "un son ido pued e camb iar de
co lor a 10 largo del tiernp o, pero el camb io en sf m ismo no es un color in de
pendi ente. N o mas q ue un cambio en un co lor v isual puede ser un col or in
dependiente 't.P S lawson intent o descu brir el modo de co nt rolar el co lor del
soni do mientras ca mbia la altura tonal, la sono ridad 0 algun otro rasgo del so
n ido , Propuso un sistema de contro l basad o en el modelo fisico de fuente y
filtro, Por eje rnplo , en un a guita rra la cuerda es la fue n te de oscilaci6n y la
ca ja de resonan cia el filtro. A parti r del modelo prop uso un a ser ie de reglas
de co nt ro l y tran sforrnac ion .
1. El co lor del son ido esta asociado con el filtro, no co n la fuente . Para
man tener el color constante se de ben rnan ten er co ns ta n tes las ca racterisricas
del filrro,
2. Para man ren er el color del soni do co ns tan te se debe mantene r la en
-olven
te espectra l co ns ran te .!"
\
\
\ 3 . El color de l son ido posee cua tro dim ensi on es ind epend ientes: apertu
ra, agudeza, lasitud y pequefiez,
13 Slawson (1985) , en Butle r, D. (1992). Trad, de GB.

14 Esta

regla no es mas que una variaci6n de la ant erior.

183

4. Para tra nsporter un co lor respecto a una dime nsion, se debe agregar un
va lor constante en esa dimension.
5. Para invertir un color respecto a una d imen sion, se debe inverti r el sig
no del valor en esa dime nsion. IS
Estas reglas definen claramente un espac io vec torial, simil ar al espac io
de los colores visuales propu esto por Schrodinger. A 10 controversial de la
con jetura, Sla wson le sumo ciertas afirrna ciones que se pueden calific ar, por
10 menos, de arriesgadas: "el color del soni do aparece com o un elemento mu
sical viable que puede ser sometido a un control estructu ral precise , en todo
an alogo al que se le aplica a la altura tonal". Aquf aparece por primera vez el
debate sobre la capacidad del timbre para sustentar tr ansform aci ones estruc
t urales 0 , dicho de otro modo, sobr e la capac idad morfof6rica del timbre (m as
adelante desarrollarernos este pun to) . A l margen de la audacia de las afirrna
ciones de Sla wson, en sus conjeturas se perciben claros resabi os de l modelo
clasico del timbre .
En sinton fa con Slawson, Yee On Lo acepta que la envo lvente especrra l
dete rmina en gran medida el timbre de los sonidos, pero se diferencia al asig
narle tam bien gran irnportancia a la evo lucion temporal del espectro. A firma
que percibimos los cambios espectrales a traves de "cuadros" defin idos com o
la minima porc ion repet itiva de la onda. Estos cuadros acnia n como las tr an
siciones entre fonemas en la voz hablada . Asf como los cuadros proporcionan
la microes tru ct ura temporal -del orde n de los milisegundos- , la rnacroe struc
rura -del orden de los segundos- esta tarnbien const ruida a partir de la co nca
tenacion de cuadros, Como ap unta Lo: "El tim bre es la evo lucion de los
cuadros"." Existe n c iertos cuadros crft icos q ue define n los cambi os importan
tes a 10 largo del tiempo. En el modelo de Lo, la percepc ion de l t imbre se fun
da en tres parametres: la d isposicion de los cuadros crit icos, la envolvente de
arnplit ud y la trayectoria de la altu ra tonal. En la Figura 11 se aprecian los dia
gramas de Lo para dos sonidos diferenres.
El model o de Yee On Lo se puede ver com o una version cuan rificada a d i
ferentes niveles de la concepcion que asoc ia el timbre con la evoluc ion tem
poral del espectro de la serial.
Even tos acus ticos dif erentes a la voz y a los son idos mu sicales
Aunque la mayo rfa de los estudios sobre el timbr e tratan sob re los son idos de
la voz hab lada 0 de la rnusica, algunos investigadores centraron su ate ncion
15 Slawson
16

(1985), en Butler, D. (1992). Trad. de GB.


Lo, y. O. (1987)]. Trad . de GB.

184

~d

~c

c
b

Tiempo

Figura 11. Diagramas de Lo de dos son idos diferenr es (Lo, Y. 0. , 1987)

sobre sonidos complejos prop ios de la vida cot idian a. Co me n taremos breve
mente cuatro de ellos.
1. D. ]. Freed estud io los soni dos producidos po r diferentes baquetas al
golpear cuatr o cacerolas de distinto tama fio (Freed, D. ] ., 1990) . A islo cuatro
para metros de "prevision de timbre": la energia global, la distribuci6n espectral,
la velocidad de evoluci6nespectral y la rapidez de alteraci6n del evento. Las eva lua
ciones de los sujetos sobre el tipo (dureza) de la baquera emp leada se mantu
viero n to ta lmente independ ient es del tip o de cacero la golpeada, a pesa r de
que los estfmulos contenian informacion tanto sobre el excitador como sobre
el resonador. Los pa rametres de pre vision de timbre de Freed se corre laciona
ron bien con las eva luacio nes de la du reza de la baqueta. Actualmente se co n
tinua investigando co n el fin de individualizar los Indice s invariantes que
pe rmiten a los oyentes ca racte rizar y reconocer a l excitador y al reson ador de
forma sepa rada .
2. B. H. Repp estudio los son idos que producen las mane s al aplaud ir, En
ce ntro que los oye n tes co inc idfan al juzgar el sexo de l "ap laudidor", aunq ue
los juicios no siemp re co rrespo nd fan al sexo rea l de la Fuente (Repp, B. H.,
1987). Seg un el a uto r este estud io refleja la influencia de los estereot ipos cul
tu rales auditivos.
3. Wa rren y Verbrugge ana lizaron las respuestas aud it ivas frente a ob jetos
de vidrio que rebotaban 0 se rornpia n (Wa rren y Verbru gge, 1984). A na lizo la
correspondencia entre patrones ritrnicos, la intensidad y las envolventes es
pectrales y los juicios aud it ivos asociad os.
4. N. ]. Vanderveer estudio la identificac ion libre y la clasificacion de
\ eventos acusticos complejos como el tintine o de llaves, el crep ita r del papel ,
~c . (Vanderveer, N . ]., 1979). Segu n S. Handel , serfa natural indicar los so
nidos a partir del evento mecan ico que los engendra, sin duda a partir de in
variantes transformacionales (Han del , S., 1989 ). Los grupos esta rian
parcialmente determinados a partir de las pro piedades acusticas de los mate
riales utilizados (es decir, las invariantes estr ucturales) .
185

A los estudios an te rio res les cabe, poten ciada, la crit ica que se le h ace a
casi todos los estudios sobre el timbre: dependen fuertemente del conjunto de
son idos escogidos.
Resumen y conclusiones
Los resultados de los estudios mencionados, y de otros similares, son muchas ve
ces contrad ict or ies. En general, todos acepta n que la percepci6n del timbr e de
pende de la forma de onda en su conjunto, pe ra discrepan sobre cual es de sus
caracteristicas debe n considerarse relev antes. A modo de resumen, podemos es
tablecer una serie de elementos, aceptados por la rnavorfa de los investigadore s,
que intervienen en la discriminaci6n de los timbres instrumen tales aislad os.
La informaci6n pre sente en el ataque de la sefial.
La informaci6n rel ati va a la evoluci6n de la envoivente espectral, pri n
c ipalme n te en el cuerpo d e la serial.
La presenci a de pequerias variac ione s alea to rias de frecuencia en los
componentes discret os de la serial.
Otras ca rac terfsticas se discriminan co n mayor d ificultad:
El grado de coherencia de la variaci6n en frec uen cia de los co mpo n en
tes discretos.
El grado de simplificacion en las variaci on es de amplitud y frecuencia
(valido sobr e tod o para los modelos de analisis po r sin tesis).
Esta en ume rac i6n es valid a sola mente co mo refer en cia ya que deben agregar
se numerosas sing ularidades y excepciones. En la lista qu e sigue men cionam os
algunas de ellas.
Las var iables sign ifica tivas par a la percepci6n del timbre musical exis
ten en, al menos, dos ni veles tempor ales d iferen tes: un nivel se asien ta en los
cambios que oc urren en algunos milis egundos y el otro registra las variaciones
mas lentas, del orde n del segundo.
C uando el estud io permite que part ic ipen las caracterfsticas de ataque
de los sonidos, estas dominan por sobre los otros factores presentes en la sefial
acu stica. So larnen te el bril lo, determinado por la distribucion espectral, pe r
manece presente co mo un factor tirnbrico de importan cia . Un erro r sist em a
tico co me t ido por mu chos in vesti gad ores qu e pretenden eliminar el ataq ue de
la serial aparece al seccionarlo abruptam ente : lejos de eliminar el ataque, se 10
reemplaza por otro de banda ancha.!? Algo similar ocurre en los experimen
tos de resta urac ion fon ernica, en los q ue ciertas silabas de una Frase son sup ri
17 Este

186

efecro es consecuencia del principi o de indeterm inacion aciistico (Basso, G., 2001a).

mid as. El reconocimiento es mayor cuando se reemplazan las stlabas ausent es


por silencios que cuando se enmascara n las mismas silab as por un ruido . En el
segundo caso se reemplaza un a silaba por otra cosa, en el primera no.
El brillo del sonido Figura com o un parametro significative en todos los
estud ios mencionados. La gran discusi6n gira en torno a la n atu ral eza de la en
vol vente espectral. Algunos auto res co nsi deran que su imp ort an cia guarda es
tr echa relac i6n co n la frecu en cia fun damental de la seria l, rnientras que otros
sost ien en qu e las band as de frecu encia (e n algunos casos las forrnantes) deben
ocu pa r regiones espectrale s absoluras. La ma yor parte de la evi dencia ex pe ri
mental co nfirma la segun da h ipote sis.
C uan do sonidos de un mismo genera se hallan situados en co n tex tos mu
sicales de cierta complejidad, en particular en texturas isorrftmicas, los indices
de n aturaleza temporal pare cen perde r irnportancia desde el punto de vista de la
discrim in aci6n, en beneficio de los indice s ligados a la envolv ente espectral. Pa
rece ser que, cuando la complejidad aume n ta (complejidad arm6 n ica 0 cantidad
de voces) las d iferencias temporales finas n o son tan bien preservadas como las
diferen cias espectrales. Un buen ejemplo se puede encontrar en los co rales pa
ra maderas en algunas sinfon fas rornanticas. En esos fragmentos, los transitorios
de las not as aisladas son men os impo rtantes que la informaci6n presente en la
parte del cuerpo de la serial, ligada a la en voivente espectral.
C iertos sonidos par ecen poseer caracteristicas 0 dimensiones timbricas
exclusivas, no comparables co n las usuales en la mavorfa de los instrumen tos.
La pree m in en c ia de arm6nicos impares en el clarinete -cuya sola apa rici6n so
brepasa en importancia a las dern as ca rac terlst icas de la sefial-, el particular
tra nsito rio de ataq ue de la trornpeta, la presencia de ruid o rosa en el son ido de
un plat illo , la envoi vente de amp litud en el tromb6n y en la flau ta, son bue
nos eje mplos de dimensiones tfmbricas particulares no ex trapo lables a la tora
lidad de los instrurnentos de musica,

3. PROPIEDADES PARTlCULARES DEL TIMBRE


A co n t in uac ion describir em os algunas de las prapiedade s pa rtic ulates de la
percepcion auditiva que fu era n analizadas, y en algunos casos descubiertas, a
p'artir de las investi gaciones sobre el timbre de los sonidos.

Constancia del timbre


Es evidente que existe alguna form a de invariancia 0 de co nsta nc ia tfrnbrica,
que se comprueba en el h echo de que una Fuente acustica puede reconocerse

187

en un a gran varieda d de circunstancias. Por ejern plo , un saxo se identifica co


mo tal al margen de la altura tonal 0 de la d inarnic a que este gene rando . Se 10
reconoce sin di ficuirad aun si 10 ofmos a craves de un medi o tan distorsivo co
mo un a pequefia rad io po rtatil 0 a tr aves de un a puerta de madera. La voz de
una perso na co nocida se identifica en una hab itacion silenc iosa 0 en un a reu
n ion mu y con curr ida , en la que se mezcla con otras voces, co n la musica y co n
los ruid os de propios de la fiesta . Los espectros que nos llegan son mu y dife
rentes en todos estos casos . S in embargo , la no cion de constan c ia tfmbrica n o
se co mp ren de bien a part ir de los estud ios clasicos de d iscriminacion.
lEx iste n co rrela tos ffsicos que den cuen ta de esta co ns tan cia tfmbrica en
di fere n tes co n tex tos? Para reconocer e l timbre uni co de un a voz se deben ele
gir, aislar y ana lizar las partes de la sefial qu e aporta n la informaci6 n adec ua
da . Una mala eleccion imp lica ta un ca mb io en el ti mb re pe rcibido y una
ide n tificac ion equivocada. En este punto resul ta in te resa n te destacar que la
envoivente espectral de una seria l acustica sufre, inev ita blemente, modifica
ciones importantes entre la ernision y la rec ep cion. Ya sea par la accion de fil
tr ado en el medi o de propagacion , 0 por d istors ion en las refle xiones y
refracciones qu e pu edan oc urrir, el espec tro qu e le llega al oye nte depend e de
la geo metrfa lImite del espac io ac ust ico y de la ubicac ion de la fuente y el re
ce ptor en d icho espacio (expresado co n mayor prec ision, la alterac ion del es
pectro depende de la impe da ncia co mp leja que encue nt ra la seria l en el
tr ayecto emisor-receptor l.l f Las variaciones tempora les, en espec ial las de pe
quefia escala pres entes en el ataque, preservan mucho mejor el patron est ruc
tur al origin al luego de transformaciones como las an te riores. Se sup one que
estos parrones tem porales invariantes cumplen un a func ion destacada en la
pe rcepc ion de la co nstancia t fmbri ca.
H abitualmente reconocem os sin erro r el timbre de los son idos, 10 que sig
ni fica que elegimos los e lemen tos d e informacion adecuados en contextos en
ter am ente d ifer en tes. Como en el caso de las constancias visua les, la
co ns ta nc ia del t im bre so lo puede ser exp licada en func ion de co mp licados
procesos en las etapas superiores del tratami en to n eural. El tratamiento de las
sefiales de entrada al siste ma aud it ive , 0 de las repr esentaciones auditivas pr i
rnarias, no alcanza pa ra dar cuenta del fenomeno,
Como ocurre en el recon ocimiento v isua l de los rostros , se supon e que la
apa ricio n de cie rtos rasgos especificos a lcanza para situar un son ido en un a ca
tegor fa tfmbri ca particul ar - por ejernp lo, para reconocerl o co mo sonido de sa
De aquf surge la fragilidad de la altura espectral an re la meno r mod ificac i6n de la seii.al
aciisrica. Esra propiedad , opuesra a la solidez que presenta la altura conaL fren re a modiftca
ciones sirnilares 0 super iores, se desa rrolla en Basso, G. (200 1a) .
L8

188

xo fon-, al margen de la exis te nc ia 0 no de otras ca racterfsticas menos signi fi


cativas. Lo interesante en el caso de l timbre es que el conj un to de rasgos im
prescind ibles n o es el m ismo para tod os los sonidos, co mo ya v imos en el
apa rta do an te rior.

lTimb~es metarnericos?
El sen tido de la audicion es clar amente analitico con rel acion a las alturas to
n ales, relacion ad as co n la frecuenc ia fundamental de la serial acustica, Es de
cir, en prese n cia de un a mezc!a espectral distin guimos ca da un o de los
co mp one ntes de la mezcla. Por eje mp lo, cuando co mbi na mos un Do y un M i
ofmos tanto la ter cer a mayor (la co rnbinacion) co mo cada un a de las notas in
d iv idu ales. En co nt ras te, el sentido de la vista no es analftico co n relaci6n a
los co lores, rela cionados co n la longitud de las on das lumfnicas: al mezc lar
azu l y ama rillo vemos el co lor ver de (Ia cornbin ac ion), pero ya no percibimos
e l azul y el amarillo que 10 forman . Esta caracterfstica de la vision perm ite
crea r co lares metarnericos, causado s por espectr os diferentes pero indistingui
b les a la v ista. lEx isten los timbres metarnericos 0, 10 que es equivalente, dos
sefia les ffsicas difer en tes que se o igan exacta rnen te igual? De ac uerdo con los
estud ios realizados h asta aho ra, la respuest a es no (a l menos en un sen tido es
tr ict o, pues se pued en h allar dos seriales d iferen tes que curnp lan un a misma
func ion t fmbri ca -par eje mp lo en un a fusio n de objetos aud itiv os- aunq ue se
los pu ed a discriminar).
Por otro lado lex iste un "unisono tfmbrico", mas alla del caso tri vial de
dos son idos de igual in ten sidad y altura tonal? Es decir, dos sonidos de diferen
re alt ura tonal e identi co timbre (l n o serfa este el ideal de un constru cto r de
pianos?) . A lgunos auto res cree n qu e sf, a unq ue sus argume ntos n o son plena
mente co nv incentes (Va n N oord en, L., 197 5; Erickson, R., 197 5). O tra ca rac
te rfst ica de la audicion, rel acion ada co n 10 ante rio r, es la inexistencia de
algun a cosa parecida a una "octava t fmbrica": no es posi ble obte ne r un cic lo
de t imb res a partir de l cual co nst ruir una "esca la timbr ica", a semej anza de la
esca la de alturas tonales. Por supuesto , 10 anteri or n o es mas que otra form a de
dec ir que el timbre es un rasgo multidimensional.
\

. El timbre eomo un medi o morfoforico


En el ca pitulo V mencionamos la posib ilid ad de clasifica r los rasgos aciisticos
en morfofori cos, cap aces de po rtar formas invariantes, y no rnorfofor icos. Co
me n ta mos que la alt ura to nal y el tiempo constituyen rnedi os rnorfoforicos po
derosos. Sin embargo, tanto A ttn eave y Olson, como mas adelante M ichael

189

Kubovy y Roger She pa rd, cons ideraron el t imb re como un medio no rnorfo
forico. Es eviden te que a partir del timbre no se pued e codificar la misma cla
se de inform acion est ructural q ue se obt iene operando con la altura tona l.
Sin embargo, descar tar tod a ca pacidad de o rgan izacion est ruc tural cimenta
da en la modul acion tfmbrica no parece razon able. La codificac ion fon et ica
de l habla se asien ta prin cipalmente en las va riac iones del ti mbre en func ion
del ticmp o, y la arrnonia musical puede ser cons iderada como un a pa rticular
cod ificac ion de l timbre de los son idos {cada funci on tonal posee un ','co lor"
particu lar ).'?

Capitulo VII

Percepci6n auditiva del espacio

Timbre y at enc i6n


Para ana lizar la percepcion auditiva del espacio es usual distinguir en tre loca
lizacio n y lareral izacion. El terrnino Ioca lizaci6n se refiere a los juicios vert idos
sobre la d ireccion y disran cia a la que se enc uen tra una fuente ac ustica, que
puede n 0 no co inc idir co n su ubicacion ffsica. El terrnino laceralizaci6n se usa
para descri bir la localizacion apa ren te de un sonido "en la cabeza" del oyen te.
La lat eralizacion puede verse como una version de laborat orio de la localiza
cion y es un co rnpo ne n te ce nt ral en e1 disefio de campos ac ust icos virtuales.
Para caracte rizar al espacio acustico vamos a emplear coo rden adas esferi
cas cuyos param etr es son cl angulo de azirnut e, el angulo de elevacion 8 y la
distan cia r a la fuente, tal como se ve en la figura 1.
Co menzaremos nuestro estud io de la percepcion espaci al con el caso par
ticu lar de los estfmu los sinusoida les estac iona rios. Mas adelan re veremo s 10
que ocurre con las sefiales genc rallzadas,'variables en el tiemp o y de espec tro
comp uesto.

Una carac rerist ica destacada de la percepcion auditi va se relacion a con la


atenc ion. Si co mparamos las propiedade s de los event os y rasgos acusticos que
nos permiten rnantcne r la atencion select iva, veremo s que son (casi) las rnis
mas que se ernplcan para discrimin ar y preservar el timb re de un son ido ante
ca mbios de con tex te . En ambos casos el acenro esta puesto sobre el esfuerzo
para identificar y seguir auditivamen te un obje to acustico part icular.

4. COMENTARIO FINAL
Lo visto en este capftulo vale solamente para ca racter izar el t imbre de un iin i
co objeto audit ive . Tod avfa no con side ramos las caract er fsticas que de be po
seer un a serial acust ica para que percibamo s un o 0 un a mult iplicidad de
obje tos ac ust icos, terna que sera desarro llado en el cap itul o VIII.
La conclusion logica de este capftu lo esta ria dada por el ana lisis de los
usos musicales de l timbre, quiza o rdenados de acuerdo con su progresion h is
torica. Pero tal empresa ocupa ria, por 10 men os, un libro similar a este. As f que
10 dejamos para mas adelan te.

Plano

frontal

-,
Plano

horizontal

19 En la rmisica conre rnporan ea la d istinci6n entre armon ia y tim bre resulta muchas veces
desd ibuiada, co mo puede co mprobarse en piezas co mo Avenrures de Ligeti l' Modulations de
G risey,

190

Figu ra 1. S istema de coordena das esfericas: e, azirnu t; 0, elevaci6n; r, dista nc ia

191

30 ,-,.......,---,.---.,..--,---,-...,-.,.-.,-,.......,---,.---.,..--,---,---,----,---,

1. LOCALIZACI6 N DE SINUSO IDES


6000

En la localizacion de sefiales que poseen una sola linea en su espectro -corno


ocurre con una sinusoide- los factores espectr ales no aportan informacion es
pacial relevante. Per este mot ivo los datos empleados en la localizacion de si
nusoides son prin eipalmen te bina urales. De todos ellos se destacan claramente
la diferencia interaural de inrensidad (110) y la diferenciainteraural de tiempo (lTD).

5000

'"

'(;
c

3000

:J

2500

(1)

1800

Diferencia interaural de tiempo


Para fuent es acusti cas ubicadas fuera del plano medio del oyen te, la diferen
cia int eraural de tiempo ( ITO) aparece com o cons ecuenc ia de la diferen cia en

192

ai

co
~
Qj

<:

LL

1000

C uando la fuent e aciistica se ubica fuera del plan o medio del oyente, la in ten
sidad de las seriales que llegan a cada uno de sus oidos es ligerarnente diferen
teoEn la mayorfa de los casos, esta diferen cia de int ensidad no es provoeada por
la desigualdad de reeorr ido entre la fuent e y cada ofdo, sino por la sombra acus
tica que causa la cabeza al interpon erse en tre la fuent e y el oido mas alejado.
En la figura 2 se puede ver la difere ncia interaural de intensidad (110) en
funcion del azimut 8. La frecuencia de la sefial sin usoidal generada por la
fuen te se ernplea com o pararnetro de la familia de curvas.
Una cabeza hu man a promedio se pued e aproximar a una esfera de alrede
dor de 20 ern de diarnetro, A causa del fen6me no de difraccion la cabeza no
va a provoca r una sombra aciistica n ftida por debajo de 1.700 Hz, y va a resul
tar acusticamente transparente por debajo de 500 Hz. Co mo pued e verse con
clar idad en la figura 2, la 110 es Infima a frecuencias por debajo de los 500 Hz,
pero puede llegar h asta 20 dB a frecuen cias elevadas, En otros terrni nos, la di
fracc ion de las ond as en la cabeza lirnita la eficacia del mecanismo de detec
cion de diferencias int eraur ales de intensidad a la parte superior del espectro
audible.
En cuanto al min imo camb io detectab le en la lID, se h a compro bado que
llega a 1 dB para seriales frontales siempre que la frecueneia de la serial supe
re los 1.000 Hz.
U n buen ejernplo relacion ado con la 110 10 provee la reproduccion este
reofon ica bicanal, en la que casi toda la informaci6n espac ial esta codificada
unica mente en terrninos de diferencias de int ensidad (esto no es asi, debemos
aclarar, en los registros de audio bien cuid ados en los que se conternpla tam
bien la informacion de fase) .

500
200

c c ;

" C"

o ~---+----;-____==::;::=;.....;~,..;.....;.;;;-.;-;...-..;---+----;-----,-----"

10

"0

'"

4000

(1)

Diferencia interaural de intensidad

~
-

i..
c;;.;'-'-"-.i.:.;.;.....;-~.;.....;~ c

"C"

20
10

0
10

.. - .. _

0
10 c c 0

10

..
"C"

C " ~"

._... .
~

~.

,:

~ ~-

..

0 ~c:::.._;___+___;__----:----___;____;_-:-_:___;----;____;____;__----:----___;_---:----::'!'_1

....

10 -- .;. - .:. -- --7

::
~
0 1""': -;--;----;-----;----;----;----;--+- -+- ---;----;----;----;-- ;--,---"'" 1

10 --';-" ';- " ';' -.;._ . .:.

- ~ . -~ . . ~ .. ~ . . ~ .. ~ . ~. .;. -.;---.;.. .
: ;-,.....;
~ ,

11 ~ ,'c" c" c .~ ..: .c..i ..;..~ ..;..~ ..c..: .. ~ .~


c ..

'C

..

10 " ~" c c , , c ~ ~ ~ : ~ ~ - c ~ ~ c-c ' C"

0"

30"

60'

90"

120"

150'

180'

Angulo horizontal desde el frente (azimut)

Figura 2. Diferencia interaural de imensidad (tro) en funci6n del azimut 8 y de la frecuenc ia

el tiempo que le lleva a la onda alcanz ar cada uno de los otdos. La ITO varfa
entre a y 690 ms para sefiales euyos angulos de azimut eo rrespo nden a 0 0 y
90, respect ivament e. Como una onda ac ustica que se propaga en el aire tar
da 30 us en recorrer 1 em , para ir de un ofdo al otro necesita aproximada
mente 700 us.
Si las sefiales son estr ictamen te sinu soidales, una diferencia de tiempo
equiva le a una diferencia de fase. A bajas frecuenc ias la infor macion co nte
n ida en la diferencia de fase es sign ificativa, pero a altas frecuencias la longi
tud de onda es men or que la dista ncia entre otdos y la diferen cia de fase
provee datos ambiguos. A una longitud de onda de Z3 em, similar a la distan
c ia pro medio en tre ofdos, le corresponde una frecue ncia de 1.500 Hz. Si la
serial posee 10 kH z en tr an varios ciclos completos en esa distan cia y la fase
deja de aportar inform acion espacial un ivoca. En la figura 3 se puede n apre
ciar estas dos situ acion es.
\ Los movimientos de la cabeza reducen en parte la arnbiguedad de fase, pe
ro\esta resulta muy grande para frecuencias por enc ima de los 1.500 Hz y el
rnecanis
mo de ITO pierde toda efectividad.
-,
En la figura 4 se ap recia la diferen cia de recorr ido en funei6n de l angulo
de ent rada de las seriales que llegan a los oidos ,
Si denominamos r al radio de la cabe za, la diferenc ia de recorr ido des :

d = r e + r sen e

193

En la Figura 5 se puede ver el grafico de his diferencias temporales de lle


gada en funci6n del angulo 8. La curva se quiebra a 90 por simetria bilateral.
Tan importante como la ITO es el mfnimo cambia de cingula perceptible
(MAA). Cuando el azimut 8 es cera los umbrales de detecci6n para cambios en
el angulo de llegada son muy pequefios, del orden de lOa 2 -que correspon
den a una diferencia temporal de 10 us. Para otras angulos horizontales de lle
gada el MAA varia sensiblemente con la frecuencia (figura 6). A 1.800 Hz y un
azimut de 60 el MAA no puede discemirse.

u;

.s

/".,

0,6

/V

E
0,5
<D

""~

0,4

(5

0,0

1/

'u

~ 0,1

/
~

a)

1\
1\
~

~1W1~1~1~1~

Angulo horizontal desde el frente (azimut)

~<p=2100

Baja frecuencia

~ 0,3

Qj

02
'

:sro

"'\

Figura 5. Dtferencia interaural de tiempo lTD en funcion del azirnut

14

rt

, i

u;
b)

~<p = 180

2?

10

'6

OJ

ro
.2

OJ

~<p

.\>'

OJ
c;

= 180 0

ro
<D

u
.9

Alta frecuencia

.n

E
o
E

Figura 3. Perdida de efectividad de la lTD a alta frecuencia par confusion de fase.


El mecanismo no puede distinguir entre la locacion de las fuentes Fl y FZ si erniten a alta
frecuencia

'c
~

75'

_1:<"

f>

6
4

rl

0
60'
4

n
"
,,, ,,,
,,, ,,,
,, ,,
,,, ,,,
,, ,,
,, ,,
0" ,

...

~ 12

30'

//
...

0------0---0--0

....

0'

500

,
,0

...'

--- -----
1000

2000

5000

10000

Frecuencia (Hz)

Figura 6. Minima cambia de angulo perceptible (MAA) en funci6n de la frecuencia.


El parametro variable es el azirnut El

"~ .....'

rse~"

Figura 4. Calculo de la diferencia de recorrido entre las sefiales que llegan a ambos oidos

194

El cono,de confusion y los movimientos de la cabeza

\
Como la d iferencia interaural de tiempo depende de la diferencia de recorri
do de las ondas entre ambos oidos, la linea que va de un tfrnpano al otro de
fine un eje de simetria axial alrededor del cual se encuentran lugares

195

Batidos binaurales
Arriba

Figura 7. Cono de confusion lateral

geo rnetricos co n el m ismo ITO. Ap arecen asf los de norninados cones de confu
sion a cada lado de la cabeza tal como se aprec ia en la figura 7.
Las arnbiguedades relacionadas con este co no de confusion, al igual q ue las
vinc uladas co n el plano med io, puede n ser resueltas moviendo la cabeza. S i la ro
tarnos 20 a la izquierda y la imagen aud itiva se desplaza 20 en su posicion late
ral aparen te, en tonc es uno tiende a supo ne r que la fue n te se sinia en el plan o
horizont al. S i, en carnbio, el movimi en to de la cabeza no es aco rnpariado por un
cambio en la imagen percept ual, la fuen te de son ido se localiza directamente arr i
ba 0 abajo del oyente . La vision y el sentido del equilibrio juegan un pape l im
port ante en este proceso, pues ayudan a definir la posicion de la cabeza en el
espacio. A n iveles elevados de procesa rnien to neural la represen tacion espac ial
involucra la integracion de la inform acion proveni ente de d iferent es sent idos,
Co mo resumen - y solarnen te pa ra sefiales sin uso idales-, es posible soste
ner que los dato s ffsicos apo rt ados po r la !DO son uti les a alms frecuencias,
mien tras que los proveni en tes de la ITO 10 son para bajas frecu encias. Este re
leva en los mecan ismos de pe rcepc ion espacia l rue denominado en 1907 teo
na doble por Lord Rayleigh , pero no se verifica de rnan era aca bada para sefiales
de espectro co mp lejo .
Los umbr ales de ca mbio en la percep cio n de las d iferenc ias de t iempo son
rnen ores cuand o la ITO es ce ra , co n la fuen te ubicad a en el plan o med ic . El
umbral de variacio n para la [DO ta mbien es menor cuando la !DO es cera . En
defin it iva, la resolucion espacial es mejor para sonidos qu e llegan de [rente 0
de sde algun lugar en el plano medi o, con 0 de azimu t.
En algunos casos la loca lizacio n rnono aural es tan buen a co mo la binau
ral, heche qu e sugiere el uso de algun mecanismo ad iciona l no co n te mplado
en la [DO n i en la [TO, ta l co mo ve remos mas ade lan te .

196

Una notab le caracterfst ica de nu estra aud icion, en la q ue se com prue ba la sub
sistencia de la informaci6n de fase mas alla de l sistema aud it ivo per iferico, se
revela con la aparicion de batid os binaura les. Estos se manifiestan al presen
tar dos sefiales sin usoidales de frecuencias apenas difere n tes (M < 20 Hz), un a
en cada ofdo , La ex istenc ia de los batidos binaurales dep ende de la in terac
cion de la informac ion de las sefiales qu e part en de ambos o fdos a n iveles su
peri ores de procesarni ento neu ral. Pro veen una dernostracion irrefutable de
que la descarga de las neuronas preserva la informac ion de fase del estirn ulo.
Los batidos binaurales son menos ni t idos que los bat idos monoa urales,
con las dos sin uso ides de l estirnulo presen tes en un solo ofdo. Se los per cibe
solo por deb ajo de los 1,000 Hz, a diferen cia de los mon oaurales que se oven
en tod o el rango de frec uenc ias audibles. Adernas, estos iilt imos se perciben
mej or cuando las in tensidades de las dos sin usoides son sim ilares. Los bar idos
binaurales, por el co n trario, se oyen aun co n grandes d iferenc ias de inten sidad
entre los estimulos (Ia sensi bilidad a la fase ex iste den tro de un gran ran go de
inten sidades), y un auto r bas ta sostuvo qu e un a de las sefiales puede qu edar
par d ebajo del umbral de audibi lida d. Estudi os recien tes no han corroborado
esra afirrnacio n .

2. LOCAUZACION DE SEN ALES NO SINUSO!DALES


Los son idos reales, a d iferencia de las sin uso ides teori cas, tiene n co mienzo y
fin. C omo sabe mos, tod o ca mbio te mpo ral en un a sefial ac iist ica va asociado
a cambios en su espec tro , tan to mas profund os cuan to mas rapido ocurre la
transicion temp oral. Precisarnente, estas irregularidad es espectrales apo rta n
n ueva informac i6n ut il para localizar fuen res acusricas. EI sistem a aud itivo las
aprovecha de dos mane ras diferentes: un primer mecanismo cornpara el espec
tro presente a la en trada del siste ma aud it ive con espectros pre vios 0 con es
pectros almacenados en la memoria de largo te rrnino . Co mo esta operac ion
puede real izarse con un solo ofdo inv olucr a un proceso monoaural, EI segun
do mecan ismo compara las ca racte rfsticas espec trales de las seriales qu e llegan
a ambos o fdos y es, obvia rnen te , binaural.

Localizacion monoaural: el rol del pab ell6n au ricular


En 1969 Butle r sugiri6 qu e el pabellon auricular provee informacion sobre la
localizacion vert ica l y sobre la d iscrirninacion entre los ca mpos acust icos an

197

teri or y posterior. Es decir, permite loc alizar Fuentes ubicadas en el plan o me


dio , impos ibles de resol ver co n la 110 y la ITO (Butl er, D., 1969) .
Hoy est a aceptado que el pabellon auricular rnod ifica el espectro de l esti
mulo en funci6n del ang ulo de incidencia de la onda en relaci6n con el eje
medio de la cab eza. La acc i6n del filtro se mide co mpa ran do el espectro del
estfrnulo exterior co n el espe ctro de la serial en la entrada del canal auditive
ex tern o. La razon , exp resada en dB, se conoce com o la funci6n de transferen
cia de la cabe za (HRTF)l y se puede apreciar en la figura 8.
La informacion provista por el pabe llon au ricular, da do su tam afio - un os
Z7 cm z- , es efec t iva a frecu en ci as por e nc ima de los 6 kH z. Entre 500 H z y
6 kHz la ca beza, ac t uan do co mo pantall a, fun ci ona de rnanera simila r.
En experirnentos con ruido de ban da angosta, la ele vacion apa rente deri
va de la coinciden cia entre los picos de la HRTF y la frec uen cia central del rui
do. Por ejernplo , un ruid o di6tico centrado en 8 kHz se oye "arriba" al ma rgen
de su ubicacion real, pues en esa posicion la func ion de transferencia posee un
pico de am plitud .?
Si el oyente desea hacer un uso efici ente de los dat os espectrales asoc ia
dos co n la dir ecci6n de la Fuente ac ust ica, es n ecesario qu e distinga en tre los
picos y valles rel acionados co n la direcci6n (fil tro s HRTF) y los propi os de la
Fuente y de las reflexiones gen eradas en las superficies ce rca n as, Esto sign ifica
que el conocim iento previo de la fuen te y de las condiciones acu sticas del am
biente es rel evante. S in embargo , como cada pabe llon aur icular pro vee filtros
diferentes y conocidos , se los puede separ ar de los datos espectrales ext ernos.I
G. Plenge presento evid encia de que cu an do un sujeto no esta famili arizado
con las car acterfst icas de la fuente y del am bien te acust ico la localiz aci6n rna
noaural se deg rada (P lenge, G., 1974) . Pero en compensaci6n se req uieren
mu y pocos segu ndos para en trar en la nu eva situa ci6n . Est a acomodm:i6n espa
cial es de gran irnportan cia en la aud ic i6n y ejecuc i6n de rnusica en v ivo.
Empleo de datos espectrales en la localizaci6n binaural
En seriales de espectros de banda las di fer encias interaurales de ti empo pro
veen informaci on pa ra localizar la fuente que no esta sujeta a las arnb igue -

Del Ingles Head related transfer functions.


2 C uando las sefia les q ue Ilegan a los dos o fdos son ide n ticas se dice q ue el esnrnulo es di6
tico y cuando son d iferenr es se 10 llam a dic6rico.
3 Un ejercicio inr eresan te con sisre en "apl ast ar" los pabellones co n tra la cab eza y salir a dar
una cam inata. Es no table co mo se altera nue srra perc epc i6n ac usrica del espaci o al rnodifi
car levemenr e los filrros HRTF.
I

198

Amplitud 10dB

0
1----.

18

36

72

126
144
162

l/\\

/!

/ V\\ 1/\\1/

I---- ..----'
f--..- ~

/\"--- VA

h\ 1
/

--------- --- 1/'\\~\\ /f\


V
\\
-------

---

180

0.2

0.5

0
18
36

>

90

:r: 106

.:~\
j ~'\

r------ V V\\ V" Vr


lr----/ V\'\ VI'
J..----.
./
~

00'
<D

./'

./

54

'8

>

\\ j

54
72

r: 90

'I' 106
r-; 126

144

1/

\l/

10 15

162
180

Frecuencia (kHz)
Figura 8. Funciones de tran sferen ci a desde el campo extemo h ast a la entrada del canal
aud itivo ex tem o (HRTF) con el angulo h orizontal e como paramerro

dad es de fase ti pic as de las sinu so ides. S i el espectro cu bre un gran range de
frecuencias, las arnb iguedades de fase pu eden ser superadas a traves de cornp a
raciones ent re los ca na les del filtro aud itivo involu cr ados. D. W. Grantham
consider6 que la diferencia in teraural de tiempo debe definirse a partir de se
fiales de espectro de banda y pro puso llamarla verdadera ITO (G ran th am, G.,
1995 ).
A continuaci6n men cion arnos algunos experimentos en los que se desta
ca la aplicacion de datos espe ctrales en la localizaci6n bin aural.

LocaliZCKi~ seiioies transitorias


<.

Klump y Ead y rnidi eron los um brales para la discriminaci6n de la ITO para tres
t ipos de estfrnulos co rtos. Fueron ne cesarios 9 us para detec ta r lin ca mb io en
el ITO an te un estfrnul o de ruido de banda an gosta de 1,4 s de duraci6n; 11 us
199

para sinusoides de 1.000 Hz recortadas por una ventana rectangular de 1,4 s;


y 28 !-1s para dics de 1 ms de duraci6n (tengase en cuenta que 10 us corres
ponden a un desplazamiento lateral de 1). Los umbrales de ITO para trenes de
impulsos repetidos fueron del orden de los 10 us (Klumpp y Eady, 1956).

Localizaci6n en funci6n de la frecuencia


La discriminaci6n de la posici6n lateral sobre la base de los retardos tempera
les entre los dos oidos depende principalmente del contenido de baja frecuen
cia de sefiales de banda ancha, por ejernplo clics, Por debajo de 1.500 Hz las
fases de las oscilaciones de decaimiento en la onda de los dos oidos pueden
compararse, proveyendo informaci6n sobre los tiempos de llegada relativos de
los clics. Para frecuencias por encima de 1.500 Hz la informaci6n de la estruc
tura fina del decaimiento se pierde. S610 queda la referida a la envoivente de
decaimiento.

Importancia de las disparidades en el cuerpo de la serial


Las disparidades en el cuerpo de una serial compleja (que implican la percep
ci6n de la diferencia entre fases) son mas importantes que las del ataque, aun
para puis os de 10 us de duracion, S610 para impulsos muy cortos prevalece la
disparidad del ataque (que en este caso es la unica disponible, pues el cuerpo
queda enmascarado bajo el ruido de banda ancha provocado por la interven
ci6n del principio de indeterminaci6n acustico).

Correspondencia tiempo-intensidad
Si se presentan dics identicos por medio de auriculares, la imagen se percibe
"en el centro" de la cabeza, Si a continuaci6n se retarda el clic del ofdo dere
cho, por ejemplo 100 1-lS, la imagen se desplaza hacia la izquierda. Pero si la in
tensidad de la serial en el ofdo derecho aumenta, es posible colocar la imagen
nuevamente en el centro de la cabeza. La cantidad de tiempo necesario para
compensar 1 dB de diferencia interaural se denomina razOO de correspondencia.
Este fen6meno apoya la teorfa que establece que las diferencias en tiempo y en
intensidad son codificadas en el sistema nervioso de manera similar, y es de gran
importancia para la implementaci6n de sistemas virtuales de espacializaci6n.

Adaptaci6nbinaural

tren de pulsos. Los dics luego del primero aportan poca informaci6n para la
localizaci6n. E. R. Hatter present6 evidencia de que un disparo adecuado -un
pulso de ruido de baja intensidad 0 un hueco (gap) en el tren de clics- puede
desactivar la adaptacion binaural. En su experimento los clics que aparecen
luego de la perturbaci6n son mas efectivos que los anteriores -adaptados- pa
ra localizar espacialmente la fuente. Hafter y Buell dicen: "[...] El sistema au
ditivo se vuelve insensible a los datos interaurales luego del ataque, a la vez
que monitorea el entomo a la espera de nuevas condiciones. Cuando algo
inesperado ocurre, el entomo espacial es nuevamente examinado" (Hafter y
Buell, 1990).

Interferencia binaural
Los ruidos de baja frecuencia degradan fuertemente la lateralizaci6n de las se
fiales de alta frecuencia, mientras que la recfproca no es cierta. Una interpre
tacion de la interferencia binaural establece que esta resulta de la fusi6n de la
serial y del ruido en una imagen auditiva unica, no jerarquizada.

3. MODELOS DE PROCESAMIENTO ESPACIAL


Se han propuesto gran cantidad de modelos que intentan dar cuenta de la
multiplicidad de mecanismos presentes en la percepci6n espacial. En la Figura
9 se puede apreciar el esquema de Blauert, que incluye todos los bloques que
aparecen en los modelos mas detallados (Blauert, J., 1997).
En cuanto a los modelos de aplicacion, uno de los mas interesantes es el
propuesto por Yoichi Ando a fines de la decada de 1980. Su esquema se pue
de ver en la Figura 33 del capitulo l.
El modelo de Ando postula la existencia de un mecanismo precortical de
extracci6n de la autocorrelaci6n de las sefiales que provienen de ambos of
dos, la posterior correlaci6n cruzada interaural entre las vias derecha e iz
quierda, y la especializaci6n de los hemisferios cerebrales para el proceso de
factores espaciales 0 temporales. Para ciertas tareas complejas (como la pro
pia del efecto "cocktail party") es necesaria la interacci6n de ambos hernisfe
rios: el izq~~do -temporal- tiene a su cargo el procesamiento de la palabra,
mientras que elderecho -espacial- procesa la localizaci6n de las fuentes. Es
te modelo fue utilizado con exito en el disefio de salas para musica no arnpli
ficada, entre elias el celebre auditorio de Kirishima, en Jap6n.

El sistema auditivo binaural parece procesar s610 el ataque del conjunto en un

200

201

'"

'iii

'0
0.

II

:c

a
~o.

'

I ln fu r~a~i6~ s-;;n~oria l- I
no auditiva

Cognici6n

eJecta f1ass .

.Q.

eo

ro"O

ro 2

.D C
"C

Q)

~ .~

II

t--- ,

li
olio

ReaHmonlaci6n

roPI~
E Q)
ro'"
6 ro
0.

"0

,.

--

L--

",""

--I

--"- -

Procesador
monoaural

,~

Patr6n de actividad binaural

ro ~

.D O

Procesador
binaural

r I

-" - ' - -

Filtro del

"_

-,

l __ .
_

.,:lo.

Procesador
monoaural

..

~.
Figura 9. Modelo esquerna tico de Blauert para la audicion espacial

4. EL EFECTO DE PRECEDENCIA
Sa bemos que el sent ido de la aud icion, a diferenc ia de la vista, se co nce ntra
en las fuentes ac ust icas antes que en las reflexiones provocadas por los obje
tos de l entorno. U n ejemplo cotidian o ocu rre al localizar la ub icacion de una
fu ente ac ust ica en un a sala reverberan te donde la mayor part e de la ene rgia
proviene de reflexi on es. Wallach (1949) y Ha s.') (1951) in vesti garon este fe
nom en o co n dos sefiales asincron icas y los result ados pueden sinteti zarse en
las siguientes reglas.
Dos son idos sucesivos se perciben como uno solo si el in tervalo te mpo
ral entre ellos es 10 suficienternen re corto. EI limite superior es de 5 ms para
clics y de 40 ms para sonid os de carac ter co mplejo, como palabr a y musica.

202

C uando ocur re 10 ante rior, la locac ion de la fuente esta det erm inada
por la de l primer soni do. Este fen ornen o se den om ina eiecto de precedencia, 0

EI efecto de preced encia aparece solo para sonidos de caracter d iscon


tinuo 0 transito rio.
EI segundo estfrnulo puede te ne r alguna influencia en la localizacion de
la fuente (su maxim o aporte es un ca rnbio de 7 en la loca lizaci6n aparen te).
S i el interv ale entre est imulos es de 1 ms 0 menor, el efecto de pre
cedencia no actiia : se obt iene a lgun tip o de co mpro m iso entre las ubicac io
nes espacia les de las dos fuentes, Este hecho se denom ina suma de lacaciones
(Blauert,]., 1997 ).
Si el estfrnu lo retr asado es 10 suficiente intense, entre 10 y 15 dB po r
encima de l prime ro, el efecto no oc urre.
Se asume co rriente rnen te qu e el efecto trabaja mas efectivamente cuan
do ambo s estirnulos se pare cen . P. Divenyi dern ostro, sin embargo, que las di
ferencias espectrales no cuen ta n si se man t iene la envo Ivente temporal
(Di venyi, P., 1992 ). Esta co ncl usi6n es razona ble, pue s las reflex iones pueden
mod ificar el espectro de la sefial por disto rsion arm6 n ica.
EI efecto es mas not orio en el plan o horizontal , aunq ue tarnbien apar e
ce en el plan o medi o.
EI efecto de preceden cia puede tornar algun tiempo en aparecer (muy
, importante en grandes salas e iglesias) .
C iert as modific acion es en las co ndiciones aciist icas de l arnbiente pue
den destruir temp orariamente el efecto de precedencia.
La h abilidad para detectar carnbi os en e l intervale te mporal del estfrnu
10 retras ado puede mej orar no tableme n te con la practica.
EI efecto de prec edencia no involuc ra un a cornplet a supresi6n de la infer
ma ci6n de los "ecos". EI oyente puede distin guir cualita t ivamente cua lquier
cambio en el patron temporal de los esn rnulos. Es mas, este pa tr6 n aporta in
formaci on sobre la sala y la posicion de los objetos y paredes en ella. EI efec
to de precedencia segur arnente aparece en un nivel relati varnen te alto del
proceso cogn it ivo. Parece que los posib le "ecos" son suprim idos despues de h a
ber sido evaluados co mo con sisten tes COil las exp ectati vas del oyen te en rela
ci6\ con la fuente aciistica y al arnbien te. Cu ando oc urre un carnb io
inesperado la mascara del efecto de precedencia puede ret irarse momentanea
mente . En el grafico de la figura 10 se puede ver con claridad la regi6n de va
lidez del efect o de preced encia.
En la region super ior las reflexion es super an los lim ites del efecto de pre
cedencia y se las percibe co mo ecos aislados, en la parte intermedia las refle
xiones aportan informa ci6n espac ial del ento rno aciist ico, y en la region

203

20

10

Altavoz 2

Eco

rn

//1\"'

.
'x
Ol

0
E:r}Sqr}Ch

0=

q0ier}1.

~ -10

a
E:s qCiq,
".
P

'I(jq(j

-'"

Ol
U

(je

I.

q i0

qPer)

~ -20

Posici6n
deloyente

Altavoz 1

'/

Figura 11. Sistema de refuerzo electroacustico con dos altavoces distantes entre sf

Reflexi6n
inaudible

-30

A
-40 0

rn
10

20

30

40

50

60

70

80

Retardo de la reflexi6n (ms)

Figura 10. Region de validez del efecto de precedencia

'0

'u
o,

Altavoz 2

Ol

u
~

Altavoz 1

-'"

Ol

inferior las reflexiones se vuelven inaudibles, Cuando las reflexiones poseen


retardos iguales 0 menores a Lrns aparece el fen6meno de fi/era en peine, que
se oye como una especie de coloraci6n espectral."

u
cc
u
'iii
c

Tiempo de recepci6n (ms)

Refuerzo electroacustico en grandes espacios


El. efecto de precedencia se emplea para preservar la localizaci6n espacial de
la fuente fisica cuando se emplean varios altavoces separados por distancias
significativas, Por ejemplo, en el sistema de dos fuentes electroacusticas de la
figura 11, el oyente percibiria antes y con mayor intensidad al altavoz 2. El al
tavoz 1, cercano a la fuente fisica, se manifestarta como un eco.
La secuencia temporal que le llega al oyente se aprecia e la figura 12. Es
evidente que percibira como fuente acustica primaria al altavoz 2.
La soluci6n a este problema consiste en retardar la serial del segundo al
tavoz hasta ubicarla dentro del limite de Hass. El esquema del dispositivo se
muestra en la figura 13.
El resultado final se puede evaluar en el grafico temporal de la figura 14.
Ahora se recibe primero la sefial del altavoz 1. La serial del altavoz 2 ocu
pa una posici6n que cae dentro de los lfrnites establecidos por el efecto de pre
cedencia. Para el oyente la locaci6n de la fuente queda establecida por el
primer sonido que le llega, que es el que emite el altavoz 1.
4 Comb filter

204

en ingles (Basso, 200Ia).

Figura 12. Diagrama temporal en el punto de recepcion a partir del sistema de refuerzo
electroacustico con dos fuenres

_._ ..... _---


Micr6fo no

-.

// I\""-

Altavoz 2
retrasado
0, + 20 ms

Altavoz 1
sin retardo

-0

deloyente

Figura 13. Aplicacion del efecto de precedencia a un sistema de refuerzo electroacusrico

205

Rango del etecto


Hass 0 de preeedeneia

I ~ Allavoz 2

lD

:s
-0
-0
'"
.u;

Altavoz 1

con retardo
de senal

.i->:

oS

Tiem po (ms)

Figura 14. Diagrama tem po ral en el punro de recepc ion luego de insralar el d isposi rivo de
rerardo

5. PERCEPCION

DE LA DISTANC IA

Figura 15 . Co nsta nc ia visual de tarnafio. La ca beza mas cerca na al observador tien e el


m ismo tam afio que la "gran cabeza" alejada

H asta ahora ana lizamos los rneca nis mos empleados para de term in ar la d irec

cion de llegada de las ondas ac ust icas desde una fuente externa. N os qu ed a po r
ver de q ue rnane ra eva lua mos la distanc ia a la q ue se encuen tra d icha fue nte .
En e l sis te ma de coordenadas esfericas de la figura 1, al comienzo de este ca
pi t ulo, nos fa ltar ia deterrninar la di st anci a r a la que se encuen tr a la fuen te.

Pe rspectiva auditiva
La perspec ti va ac ust ica , al igual q ue su co n traparte visual, es un a imp or tan te
fue n te de in for m ac ion ambien ta l. Las imageries acu sticas de gran desarroll o en
azim ut se red ucen a un pun to a gra n des d istanc ias, Por ejemp lo , e l an cho actis
tico aparente de un a o rques ta sin fon ica , m uy gran de en las prim eras butacas de
la platea, d ism in uye a unos poco s grado s al o frla en un parq ue a 300 m de d is
ta nc ia.! El efec to es eq uivalen te al de las lin eas paralel as q ue co nvergen en e l
in fini te. S i contin uarn os d esarr o llando la an alogia con el sent ido de la vista,
se pod rfa dec ir q ue la son o ridad d ism in uye co n la d istanc ia ta l como oc urre
co n e l ta rnafio apa rente de los ob jeto s y que la defin ic ion t fmbrica se ateruia
de modo sim ila r al grad ien te de co lor en la v ision. 6 Aunqu e no siem pre estu

5 El pararn etro subjer ivo emp lead o en acust ica de salas se den om in a "anch o apar enre de la
fuente" (AWS), bien co rrelac ion ado con el fact or objetivo de espacialidad (I -IACC).
6 La ana logfa co n el sentido de la vista , aunque inexact a, resulra ut il pa ra eje mp lificar los
diferentes aspecro s irnp licados en la percepc i6n de la pe rspecti va auditiv e.

206

d iad a en de talle, la d istancia apa rente de la fuente ac ustica que defin e la pers
pectiva auditiva cornp one una impo rtante d ime nsion psicoac ustica . Los in ves
t igad ores que desarroll an d isposit ivos acust icos para el ci n e y siste m as
multimed ia ha n conc cntrado gra n pa rte de su in teres en el perfecc ion amien
to de mod elos vi rt ua les de perspectiva auditiva.
La sonor id ad, cuan do inte rv ien e co mo un pa rarnetro de en trada pa ra ev a
luar la d istanc ia de las fuen tes ac iist icas , deja de ser un correlato un idi mens io
n al de la in tensid ad fisica pa ra co n vc rtirse en un rasgo co mplejo que in vo lucra
m as de un a di mension. Los objetos en e l mundo son, en gen eral, de tarnafio
constance, pe ro la im agen de un o bje to en la retin a c rec e y decrece cu ando es
te se acerca 0 se aleja de n oso tros. Este heche es co nocido co mo constancia de
tamano. En la figura 15 se puede aprec iar un a ilust rac ion c lasica de la constan
c ia visua l de tarnafio.
En e l dorn in io de la audicion la constancia de fa sonoridad funciona de mo
do ana logo a la co ns ta ncia de tarnafio pa ra e l sen t ido de la vista . S i un a fuen
te acu stic a de in te n sidad cons ta n te se aleja de n oso t ros a campo libre, la
inten sidad ffsica que nos llega d ism inuye prop orc ion a lmen te con el cu adrado
de la d istanc ia. N o de be sorprendernos en to nces q ue un a fuente cuya intensi
dad decrece parezca aleja rse. Es dec ir, tarnbien podemos exp erimen tar la sen
sac ion de ofr una fue n te aciistica que d ismi nuy e de in tens idad sin alejarse - un
in str urnen to m usical en decrescendo-, cuyo eq uiva len te en el ca mpo v isua l po
d rfa ser un globo que se de sinfl a.
207

............

'I

Imaginemos un experimento: un oyente observa a dos cantantes, una cerca


na y la otra alejada. La cantante "cercana produce un son ido pp, mientras que la
otra ernite el mismo son ido pero en ff. Los sonidos poseen la misma altura ton al
y dur acion. Si al oyente se le pide que evalue la son oridad de amb as cantan tes,
dira que la mas alejada supera a la cercana. Supon iendo que la intensidad del pp
sea 1/128 de la intensidad del ff, y que por estar a 50 m la intensidad de la can
tante alejada llega con 1/2.500 (l/d 2 = 1/50 2) de la emit ida, la onda cercana po
see alrededor de 20 veces mas energia que la alejada. Sin embargo, el oyente
insistira con su afirmacion. En la figura 16 se puede ver este experirn ento.
El experimento anterior muestra que ex isten otros datos no to mados en
cuenta, diferentes de la son or idad , que nos aportan informacion sobre la in
ten sidad fisica y la distan cia de las fuentes acust icas. H asta aquf no to mamos
en cuen ta el ca mbio espe ctral operado en las sefiales de las cantan tes en fun
cion del esfuerzo vocal. En gene ral, la en volvente espect ral cambia de forma
-para favorecer a los armonicos mas agudos- a medida que la inten sidad y el
esfuerzo vocal aume nta n,
La figura 17 sinte t iza los trabajos de John Chowning en una can tidad de
experimentos sim ilares al expu esto (Chowning, J., 1999). Represents una ge
neralizacion del cambio de la cornposicion espectral en funcion de la altura
tonal, la dinarnica y la distan cia, A cau sa de la gran ca ntidad de dimensiones
necesarias para describir los datos ffsicos se han incluido espacios bidimensio
nales (espectros de potencia) de n tro de un espacio tridimensional cerrado .
Es posible ahora comprender al oyente del experimento: no juzgaba la dis
tancia y la sonorid ad de la fuente unicamente a partir de la int ensidad que per
cibia. En la figura 18 se esquematiza una situac ion simetri ca a la de la figura 16.
Una fuente de inform acion ad iciona l la proporciona la reverberad6n del
recinto. La relacion entre la in tensidad de la reverberacion y la onda directa
es interpretada por el oyente como un indice de distancia, En un espacio ce
rrad o tlpi co la in tensidad del ca mpo reverberante no varia co n la distan cia a
la fuente, mientras que el son ido directo sf 10 hace . Sabemos, por experiencias
previas, que el n ivel del cam po reverberan te depende de la intensidad de la
fuente que 10 excita y usamos este conocimiento para evalu ar la intensidad y
distan cia de las fuen tes acust icas en recintos cerrados.
En la figura 19 se comparan dos sena les inrner sas en el mismo ca mpo re
verb erante. La serial A se ubica a cinco unidades de distancia del oyente y po
see un a intensidad relativa seis veces menor que la serial B, a una distancia de
dos un idades. Ambas llegan al pun to de recepcion con la misma intensidad di
rect a. S in emb argo, la relaci on co n el cam po reverberante aporta la inform a
cion necesaria para ev irar la confusion de distanc ias sin ne cesidad de apelar a
diferencias espectrales.
208

i-Cual de ellos se percibe


con mayor intensidad ?

Figura 16. Co nstancia de sonoridad

I.Ja intensid ad decrece cuand o la distancia aument aO


IJI cambia de la envalvente espectral es minim a

if
"' 0

">! t::!

E '"

"'"
CUi::>

o ~

pp

Oltura

Menos parciales y cambios en la envolvente


espectral debidos al cambro de altura

Figura 17. Espacio disranc ia-inrensidad-frecuencia segun Chowning

209

Debe cantar muy fuerte


para producir
la misma intensida~

Canta

Figura 18. Pcrccpci6n de la d istancia: los son idos de ambas can tan tes poseen para el
oyen re la rn isma in tens idad, pero la composici6n especrralle perm ite al oyen re saber que
la mas alejada canta en ff

Si amplifica mos seis vec es

la serial a 5 m, obtene mos

el mism o nivel qu e a 2 m

ro

'0

'iii

Selia !
directa

t:

<l>

,'(' J ] )
1

,:

,,,

,/
"

/ ......'

ZOOM /
6X

6. PERCEPCl6 N DEL MOVIMIENTO


.

/ ,"

B
'0

,/
,,

Pero la reverb eraci6n


ha aum ent ado su nivel
seis vece s, indicando
que si la se iia l es mas
intensa , no por eso la
fuente es mas ce rcana

...
5

Reverb eraci6n ....

~
6

Oistancia de la fuente

Figura 19. Raz6n serial direcra/carnpo reverberante en funci6n de la distancia

2 10

A unque la analogfa co n el sent ido de la vista nos ha resultad o ut il hasta


ahora, deb e serialarse qu e la co ns ta nc ia de sono ridad es mas compleja qu e la
co nstanc ia de caman o: pocos obje tos visuales varian de ta rnafio ante nuestros
ojos (com o en el ejemplo de un globe qu e se desinfla), pero las fuentes acus
ticas varian norrn almenr e de int ensidad en lapsos muy bre ves, espec ialmente
en miisica. Por eso quiza el mecan ismo de percepcion asociado a la constan
cia de son orid ad necesite informacion relacion ada co n indices espectrales y
con la interpret acion de la relacion sefial direct a/senal reverberant e, La eva
luacion aislada de la inten sidad parece no alcanzar.
En gen eral, los juicios audit ivos sob re la distancia a la que se encuen tra
una fuente aciistica son relati varnen te imp recisos, y los erro res con relac ion a
la d istancia ffsica son del orden del 20 % en situaciones normales .
Es in teresan te descri bir 10 que ocurre cuando los oyentes son pri vados de
alguno s de los dat os men cionados. Por ejernplo , en el campo libre no acnia el
sistema de eva luacion de la pe rspec tiva relacionado co n la reverbe raci on y la
precision de los juicios con relacion a la d istan cia se reduce sign ifica tiva men
te o Estas sit uac iones se han estud iado en exp erienc ias de laborarorio , co n
fuentes sin usoidales ubicadas en ca rnaras ane coicas, en las se preserva sola
men te la informacion relacion ada co n la in ten sidad ffsica.

La habilidad para percibi r e l mov imiento lateral de una fuente aciistica se mi


de em pleando el mfnima cingula de mavimienta audible (MAMA). Los experimen
tos han mostr ado que el sistema audit ivo es poco sensi ble al rnovirniento de
las fuentes aciis t icas, aunq ue se co rnporta mejor ante movimientos len ros. Pa
ra desp lazami en tos angulares del orden de los 15/s, el MAMA es de 5. Pero pa
ra movimi entos angulares veloces, del orde n de los 900/s, el MAMA crece hast a
llegar a 21 0.
El eJecta Doppler, responsabl e del cambio de altura en las siren as de las
ambulancias cuando pasan a nu estr o lado, es una importante fuente de infor
maci on sobre el carnbio en el sen tido del movimien to relati ve entre el emi sor
acustico y el oyen te. Es un fen orneno ffsico que hace qu e la frecuen cia aparen
te en el punto de recep cion aurnen te si este se acerca a la fuente y que dismi
nuya si se aleja de ella. En la figura 20 se ilustra el caso con una fuen te aciistica
en movimiento hacia un receptor en reposo.
S i la fuente se encuen tra qu ieta la onda acustica llen ara la distan c ia FR
que la sepa ra de l receptor en un tiempo ~t == FRIc. con c com o la veloci dad
del sonido en el aire. La longitud de onda en este caso es A = FR / J~t. Pero
21 1

.......

Espac io acustico virtual

si la Fuente se desplaza hacia el receptor a velocidad VF la onda aciis tica reco


rrera en el mismo tiemp o un a disran c ia menor F'R. La Fuente se h abra movi
do en ese lapso un a d istancia F'R - FR = VF 6.t y la nueva longitud de onda sera
'A ' = F'R / I 6.t. Tom ando en cuen ta la relaci6n general v = 'AI y luego de algu
nas operac iones algebra icas senc illas se tiene que :

f'=

c - VF

c-

Fuentes acusticas
\\

~"~~"

En la ecuac i6n anterior I es la frecuencia de la seria l emitida por la Fuente y i'


es la frecuen cia aparen te en el punto de recepc ion . S i se cons idera tam bien la
posibilid ad de movimi ent o de l receptor a veloc idad VR la ecu aci6n se modifi
ca levernente:

f' = ~
1
c - VR
EI efect o Dopp ler se emplea desde h ace tiempo en rnusic a elec troac ust ica a
part ir de modu le s espec fficos de proce sarnie nto. Casi no es necesario co rnen
tar la impor tan c ia que tiene un a buen a simulaci6n Doppler en el caso de los
efec ros espec iales para c ine y multimedia.
En cuan to a la percepcion del efecro, se reduce a la percep cion de una va
riaci6 n co n ti n ua de frecue nc ia, qu e ya examinamos en el capitulo Il l.

7. CAMPOS A CUST ICOS VIRTU A LES


En un ca mpo ac iistico habitual, con el oye n te inmerso en su interi or, la in
formacion espacial depende de los con ocidos datos espec t rales, tem por ales

D
\/\/\ R
V C~V
I
I

~f\

v,
F'

f\

f\

V\J\J\J R

reales

Espacio acustico real

F igur a 2 1. Camp os acusticos definidos por un sistema estereofo nico bicanal

(ITO) Y de inten sidad (lID) que apo rt an las seriales qu e Ie llegan a ambos of
dos . En un sistem a elec troac iist ico de reproducci6n, sin embargo, a la infor
mac ion anterior se suman las referencias espac iales cod ificadas en la serial
grabada.
Por ejemp lo, el registr o de un co nc ierto en un gran audito rio contiene in
formaci6n sobre la reverb eraci6n y las ca rac terfst icas espectro-ternporales de
la sala. A simismo , es funcion de los vfnc ulos espac iales entre cada insrrumen
to y cad a uno de los microfon os ut ilizados. C uando esta grabac ion se reprodu
ce en otro recin to a traves de un sistema estereofon ico bican al, el campo
acustico qu e pe rcibe el oye n te se desdob la en tre: a) un campo acUstico real, que
es en el que esta inmerso y qu e detect a a partir de los son idos que el mismo
pro duce -com o voz hab lada, ruidos de pisadas, etc .- y b) un campo (U;ustico vir
tual generado por la Fue nt e elec troac ust ica a part ir de las referencias cod ifica
das en el registro origina l. En la Figura 21 se puede ver un esquema que ilustr a
d icha situ acion.?
Por supuesto qu e el ter rnino "real" esta cmpleado aqu f co mo una euqueta pracuca, sin
connotaciones episte rnologicas. En cierto scnt ido, por supuesto, ambos campos aciisticos
son "reales" a su rnane ra.
7

Figura 20. Efecto Doppl er con una fuente Fen rnovimien to a velocid ad
ceptor R en reposo

212

VF

hacia un re

213

La situac ion ideal serta q ue el ca mpo acu st ico real no in te rfiriese negat i
varnen te co n el espac io ac ustico vi rt ual q ue defin e la grabacion . Pero esto
ocurre po r 10 gene ra l en salas de aud ic ion cuidad osam ente diseriadas, por
eje mp lo un a sala de co ntrol de un estu d io de grabaci6n . Lo h ab itu al es que el
camp o acust ico de la sala real degrad e la informacion espaci al que con t ienen
las senales elec t roaciisticas . Aunque en el ejemplo n os referimos a un siste ma
este reofon ico bicanal, 10 m ismo oc urre ca n los de mas sistemas de espacializa
ci6 n elect roacust icos que ex iste n en el mercado, tales com o las diferentes ve r
sione s co nocidas co mo surround 0 las que se derivan de la codifi cacion Blumlei n

Capitulo VI n
Percepci6n de objetos auditivos

original.'

8. RESUMEN
N uest ra habilidad pa ra local izar sonidos es muy buena en el plano hori zontal ,
algo men or en el p lano vert ica l (elevacion ) y regul ar para la d istan cia,
La locali zacion espacial es el res ultado del procesam iento comb ina do de
da to s. Para Fuentes acus t icas co rrien tes los dat os descrip tos en este capitulo
son accesibles simul ta nea rnente, al menos en circun stan cias no rrn ales. Es esta
riq ueza de informacion, muchas veces redu nd ant e y refo rzada par da tos visua
les, 10 q ue hace la local izacion mas prec isa y co nfi ab le.
Un capitulo apa rte po d na dedica rse al disefio de ca mpos ac iist icos vi rtua
les. Todos los irnplernenrados h asta ah ora , de sde los disposit ivos rnonofon icos
h ast a los ac tua les algoritmos de espa cializacion para cine y mu lti med ia, pasan
do pa r la estereofonla bica na l, h acen usa de las citadas capac idades aud itivas .
En algunos casas , la contrad icc ion entre datos de entrada (p ar eje rnp lo, un a
[[ 0 q ue corresponde a una Fue n te a la izquierda del oyen te con un a de ITO re
lacion ada can la rnisrna Fuen te ubicada a la izquie rda) puede degrad ar e inclu
so destruir la loca lizacion audi t iva .

Desde A rist6t eles, la pe rcepci6n se ent iende co mo el proceso a traves del cual
util izamos la informacion provista par nu estros sentidos para ar mar represen ta
ciones me ntales del mundo q ue nos rodea. En gen era l, desde una per spec tiva
realista (la de Aristoteles 10 era ) la tarea de la percepc i6n es tamar los da tos de
los sentidos y ded ucir de ellos un a representacion util del arnbien te exteri or. En
la vida di aria n o percib imos los rasgos del son ido - alt ura, sonorida d, ti mbre,
dura cion- de modo aislado , sin o q ue los in tegra mos en la representaci on de
Fuentes acu sticas u obje tos audi tivos . U na pa rte importante en el proceso es
decid ir q ue partes de la est irnulac ion sensorial co rrespo nden al mismo objeto
a even to ambien ta l. La for ma final de ca da represen taci on mental de un ob
jew - visual 0 aud it ivo- for mado a part ir de un cie rto agrupa m ien to de da tos
senso riales, es un a propieda d eme rgen te . Esta pro p iedad n o corresp onde a n in
guno de los dato s to rnados de manera individu al y surg e a partir de nu estr a
capacidad de organ izaci6n psiquica de los datos. La c ita de Helmholtz repro
ducida en el capitu lo [[ ("[...] esta mos muy bien entrena dos para evaluar los
objetos q ue n os ro dea n , pero fallamos com p let arnente cuan do interitarnos ob
servar las sensaciones per se [...]") alcanza aquf p lena signi ficacion .

1. ECOLOGiA ACUST ICA Y ANA uSIS AUDlTIVO DEL ENTORNO

Pa r eje mplo, Do lby-Surround, Dolbv-Digira l, T HX, Ambisoni cs y muchos orros.

A lbert Bregman llama aruilisis awlitivo de escenas al proceso q ue pe rm ite reu


n ir en una un idad perceptiva el co n jun to de datos provenientes de un a fuen
te aciistica ex tern a (Bregman, A. , 1994 ). Estric tarnen te , ca da oido no recoge
mas que los camb ios temporales de la pres ion ac ustica en el timpano que le
corresponde. U n agregado awlitivo es, segiin Bregman, la asoc iacion de las par
tes del espectr ograma ne uronal (conjunto de dat os senso riales) que parecen
pertenec er a un mismo evento pe rceptual. U na Fuen te ac iistica es una entid ad
ffsica que gene ra o nda s en el aire. Un agrega do auditivo es un percepto ca u
215

214

->:

--sado por un grupo de elemen tos sonoros que se exp erimenta como un to do y
que parece em an ar de una unica Fuente ac ust ica ext erna.! Normalmente, las
propiedade s em ergentes que definen cada agregado estan co rrelac ion adas con
las propiedade s de los obje tos fisicos asoc iados.
En vision se pued e describir el probl em a del analisis opti co del am biente
en terrninos del co rrec to agrupa mien to de las regiones estimuladas en la ima
gen retinian a. En nu est ro caso [que elem entos se deben agrupa r para ensa m
blar un son ido 0 , me jor aun , un obje to ac ust ico? N o es pos ible co mpa rar las
estrategias de agrupam iento de ambos sen tidos pu es existe un a diferencia cru
cial en el modo en que usam os la energia ac ustica y la lumfn ica para obten er
informacion del mundo ex terior. En audicion, h acemos uso de la energfa erni
tida por los objetos (las Fuentes acusticas) y cas i n o to rnamos en cuenta la
energfa reflej ada en otros objetos fisicos. Se podrla afirma r que existen al me
nos tantas Fuentes ac ust icas co mo objetos sonoros en una situacion normal.
Las reflexiones - qu e carnbian en funcion del contexto espac ial- degradan la
informacion que n os llega de cada una de las Fuentes. En co nsec uenc ia, ne ce
sita rnos aten uar la informacion que llega por reflexi6n y co locar en primer pla
no la qu e nos llega dir ectamente (en una sala de co nc ierros situ arnos
a ud it ivame nte el piano en el escenario , aun cuan do gran parte de su energfa
n os llega por reflex ion desde las paredes y el c ielo rraso de la sala ). Por el con
trario, la informaci6n visu al esta causada princip almente por la reflexi6n de la
luz en los objetos de in teres. Encendemos un a larnpara n o porque nos intere
se mirada, sin o para ver por reflex ion los objetos de la sala. A diferencia de la
gran cantidad de Fuentes ac iist icas que nos aco rnpafian desde siempre, hubo
una sola Fuente de luz a la vez a 10 largo de gran par te de nues tro recorrido evo
lutivo, En resum en, los dat os auditivos y visuales son dife re n tes y se comple
mentan para brindarnos un pan or ama ve ros irnil del mundo ex terior.

z. lNFORMACl6 N UTILlZA DA PARA SEPARAR LOS OBJETOS AUDlTlVOS


La fusion 0 fision simu ltanea de la informaci6n aud it iva y la co nstrucc i6n de
agregados son ejemplos de organ izacion perceptual. A partir de ellos analiza
mos el entomo ac ust ico al distribuir los datos sensoriales entre los diferentes
objetos auditivos po ten ciales. Podemos ilustrar la distinci6n en tre los concep
tos de Fuente ac ustica y de agregado acustico a part ir de las sefiales de la Figura
1. En ella se yen varias on das aciisticas aisladas que se h an reunido en el ulti Es una rraducci6n (q uiza no muy feliz) de auditory stream ("corrien te", "flujo ''} , C reernos,
sin embargo, que el terrnino "agregado" describe acepra blernenre la idea de Bregman .
I

mo grafico. Es mu y diftcil distinguir cada compone nte en la mezcla fina l, pero


realizam os esta operaci6n inmediatamente con el ofdo (si pud ierarnos rep rodu
cir las sefiales en un equipo de audio) grac ias al proceso de agrupamiento per
cept ual. Cada un a de las Fuentes co rresponde a un solo agregado ac iist ico.
Pare ce hab er di ferentes mecanismos de segregac i6n audit iva qu e respon
den en func i6n de la tarea a realizar. C uan do los oyentes intentan mantener
int egrada en un solo agregado una secuenc ia de sonidos, la segre gaci6n es in
voluntaria y opuest a a sus intenciones. Pero cu ando los sujetos se esfuerzan en
separar los sonidos la segregaci6n apare ce co mo un proceso de sele cci 6n pr o
vocado po r la ate n cion . La existencia de estos dos mecanismos explica los di
ferentes resultados que se obtienen en las pru ebas experimentales cuand o se
vari a alguna ca rac te rfstica aciistica en la sefia l de entrada. Las diferenc ias ti m
bric as entre son idos musicales, por ejernplo, faci liran mucho la segregac i6n .
Pero si la sec uenc ia se basa en otro facto r de agru pam ien to d ifere n te, co mo
puede ser la vari aci 6n de la altura to na l, las diferencias tirnbricas no provocan
necesari am ente la segregac i6n.
El sistema aud itivo emplea diferentes datos para separar los obje tos aud iti
vos. En 10 que sigue describiremos los masdestacados. Debe tenerse en cuenta
que n o siemp re se util izan todos los datos en todos los casos: el agrup amien to
per cep tu al n o es un proceso a "todo 0 n ada". En un a situacion complej a se ob
serva con frecuencia que el dato saliente en masca ra y oscurece a los menos
acentuados, mecanismo que nos permite man tener la eficiencia perceptual aiin
cuando no este presente toda la informacion esperada . En el caso del t imbre,
que depende de un a gran cantidad de entr adas audit ivas co n currentes, el con
texto juega un papel determin ante a la h ora de dec idir cual dat o es sign ificat i
vo , y cual no 10 es.
El "efecto de cafete ria" (0 "cockta il part y") pon e de rnanifiesto la eficac ia
de nu estra capac ida d para separa r los di ferentes obje tos aud it ivos , Podemos
manten er una co nve rsacion sin in convenientes en un arnb ienre co n gran con
tarninacion por ruido . Si n embargo, si registrarnos con un microfono di ch a
conversaci6n y la reproducimos mas tard e h ab rem os perdido algunos dato s
esenciales para sep arar la Figura acustica del fondo de ruido y el discurso se
vuelve ininteligibl e.
A conti n uaci6n describiremos los rasgos de la in for mac i6n acustica q ue
permiten agrupa r 0 separar los diferentes objetos ac iisticos entre sf.

Armonicidad y fr ecuencia fundamental


Un co njun to de parc iales perfectamente arm6n icos t ienden a fusionarse en un
so lo artefac to perceptu al, pues com part en la misma altura tonal , defini da por

Z17

216

->

~2

Voz humana

1
-6
~

III

~9

-12

~ ~n

-g

::=

-0,

Q.

-21
15

<l:

-12
~9

MMMvWNMAMMAM

~6

4
~3

~2

",

I
0,005 0001 0 0,015 0,020 0.025

co

0.Q:l5 O,CMO 0.00 Qt.6:] 0,lY.:6 O.ettl 0,((6 O.G1O

o.o ~

O,CfI)

coes

O,COO 0.(9$ 0.,

Tiempo (segu ndos)

la componente fund am ental de la ser ie. De acuerdo con este criterio, si dos es
tfmul os sirnultaneos de espectros perfe ctarnente arrnonicos tien en diferentes
frecuencias fund amenrales, se ove n separa dos.! U na desafin acion del 3% es
suficiente para que un arrnonico se perc iba segregado del co mplejo (siernpre
que su dur acion exce da los 400 ms), Para el sonido co mplejo restante, el efec
to de la desafin ac ion del arrnon ico es sim ilar al que oc urre cuando se reduce
el ni vel del arrnon ico en cuestion hasta vo lverlo ina ud ible. La fusion par ar
monicidad fue uti lizada desde el med ioevo para combinar los registros de or
gano y constituye un recurso clasico en orquestacion .

~2

Disparidades en el ataque

Impresora

1
-6

iD
E

<l:

~~i~ I'V~~,'V\~"14r/1'~V~

WW'\;l_l" \i\f/\t.h~ft"W/VWV

-12
~9

-6

-4

-a
~2
~

1
0.005 0.010 0,015 0,020 0 .025 0030

cess ooeo

0.045 0.050 o.CC6 0.000 O.o:l> 0,011,)

O,07~

0,00(1 0,065

oosc

0.095

0.1

Tiemp o (seg undos)


~

~2

Alarma

1
-6

~I~~I

It"
<l:

~9

-6
4

~3

~2

-1,

I
0,005 0,010 0,015 0,020 0.0250,0300,035 O.Gl

O .~5

0,1%'0 0,0500,00J 0,1:65 0,070 0,075

o .~

0,085

o,COJ

0005

0,1

Tiernpo (seg undos)


~

~2

Rasch investigo la h abilidad para ofr un sonido complejo en presencia de otro


semejante (Rasch, R . A., 1978). Cu and o la unic a diferencia entre ambos es la
frecuencia fund amental, la serial debe estar por enc ima de los -20 dB respec
to del sonido enmascarante . Pero si la sefial com ienza 30 ms antes del enrnas
ca rante, se la percibe aun cuand o su n iveillega a apenas -60 dB (figura 2). La
serial puede seguir percibiendose aunque cese de inmed iato despues del ataque
del son ido enmasca ran te (este efecto se relacion a con el fen orne no de conti
nuidad que veremos mas adelan te).' El valor de 30 ms corresponde aprox ima
damente a las imprecisiones de ataque que se enc uen tran co n frecuencia en la
musica instrumental. Esta capac idad de agrupamiento par disparidad en el
ataque refuerza la idea trad icional de que las asinc ron fas son un factor irnpor
tante en la percepcion separada de las voces en la musica polifonica.
En un expe rimento relacionado co n las dispar idades temporales en el ata
que , Robert s y Moore dernostraron que sin usoides ex trafias agregadas a un a
vocal puede n influir en su calidad t frnbrica, pero que esta influencia se redu
ce not ab lemen te si el elemen to extrafio apa rece ant es 0 despues del inicio de
la vocal - se segrega de ella (Moore, B., 1997).

Mezcla

i~ ~~NW~N~~','~~"

Contraste con sonidos prcvios


La percepcion de un est fmul o es afectada por los estirnulos inmediatamente
precedentes. En gene ra l, al nue vo est fmulo se le resta algo asf como el "nega
tivo espectral" de los an teriores.

-4

~ 3

~2

~1~~~.
0.005 O()1()

O.O1 ~

c.~

O,uz. O.DX

1:~

QOW O,().l5 O.D50 0.056 a,ClEO OJ1i5 0,010 o,OTS O.OOCI o.e:a-- O]:J JJ 0);1..e

Tiernpo (segundos)

Figura 1. C uatro sefiales separadas reun idas en eI ultimo grafico

218

(),1

Las relaciones entre espectro arrnon ico , period icid ad y ton icid ad se exponen en el
Apendi ce 1.

J Alg unos cantantes 10 util izan para co nseguir pianissimos sorprende nres (y, estrictarnen te

hablando, inaudibles a no ser por el mecan isme cirado).

219

Enmascarante
"0

:ec.

III \ I \

<{

Enmascaranle
"0

.~
C.

IlL

<{

"

III ~ ~

Enmascarante

"0

,?

c.
~

Frecuencia

: Senal
Tiempo

Figura 3 . Espectro de poren c ia de dos sen a tes sucesivas. EI tercer grafico representa

Fi gura 2. Expe rirnen ro de Rasch

especrro percibid o por el oyen re

Tarnbi en se verifica un efect o sim ilar cuando ocurre un ca mb io en el est i


mu lo, que puede ser interpret ado com o que el esrfrnulo de part ida se sustra e del
estfrnulo fin al. El rasgo modificado se separa percep tualmente del resto y la par
te del est fmulo q ue perrn anece estab le se reduc e h asta su niv el de adap tac ion ,
U n ejemp lo n ot ab le de 10 an terior se da al ofr un est irnulo co n un a estruc
tu ra espec tra l part icular, segu ido inmed iatarnente por ruid o b lanco (espectro
p lan o) . El ruido blanco aislado puede ser descrito com o "n o co loreado ", Sin
embargo , en la secuen cia comp leta se oye un a estructura espectral "co lore a
da", que corresponde al espectro de la primera serial invertido (figur a 3 ).

Localizaci on de la fu ente

Correlac ion de los ca mbios en amplitud y fr ecu en cia


Ra sch tarnbi en noto qu e , aun cuando do s sin usoides com iencen en sinc ron ia,
es posible ac recen ta r la sepa racion perc ep tu al modu lando en frecuen cia la mas
aguda (Rasch, R. A., 1978) . Este proced irniento permite reduc ir el umbral de
pe rcepcion de 1a serial de mayor frecuenc ia en 17 dB . En real idad , el expe ri
menta de Rasch no es mas q ue un caso particular de un a caract erfst ica gen e
ral de la percepc i6n a udi tiva: los son idos que presentan camb ios "co here n tes"
tienden a fusionarse per ceptualmen te , mientras los que presentan variac ion es
in coh eren tes ent re sf t iend en a segregarse.

220

el

M uchas veces las diferen cias espac iales jue gan un papel importante en el an a
lisis auditivo de l entomo al fac ilitar 0 dificu ltar la segregac ion basada en otros
factores." Sabem os, por ejemp lo, que un a serial se detecta co n mayor fac ilidad
cua ndo su ubic aci 6n espaci al difiere de la de l ruido enrnascarante.
Shackleton y sus co legas in vesti garon la h abi lidad para identificar cada
vocal en un conjunto de dos voca les concurrentes. Encontraron que una dife
rencia de frec uen c ia fund am ental entre las dos mejora la identificacion en un
22% , mientras que un retard o de 400 us-correspond ienees a un a d iferencia en
azim ut de 45-la mejo ra s610 7% (Shack leton, T. M. et al., 1992). En resum en,
el mecani smo de segregac i6n espectral parece scr mas poderoso que el espaci al.
La preg unea es, en to nc es, !po r que los humanos no le dan pr ioridad absoluta al
ind ice espac ial? Y la respuesta se enc uentra en la base de n uestra estr at egia au
d it iva , centrada en la percepci6n de fuentes y no de reflex ion es acu sticas. Las
sen ales provenientes de la fuente pueden h aber sido reflejados muchas veces en
Recordemos que la localizacion de la fuente se refiere al rnundo fisico mientras que la la
ter alizacion de l son ido pertenece at un iverse de las represenracion es men tales (ve ase el ca
pftulo vu).

221

fari zar parte de la in formaci on c uando e l co n texto - 0 la tare a impuest a- se 10


demanda. En a lguna s ocas iones la local izac ion (0 la lar eral izacion) del so n ido
ocupa un lugar fund am enta l en la seg regacion de los o bjeto s audi ti vos. U n
buen ejernplo 10 brinda n uestra ca pacida d pa ra rnan te n er una conve rsacion en
amb ien tes mu y ruid osos.?

Periodicidad y fusion perc eptual

Directo
Prim eras
reflexiones

CD
~

"0

co

"0

'in

Reverberaci6n

c
w

Tiempo (ms)

Figura 4. Patron de ref1e xiones en una sala median a y grafico te mporal de la ener gfa que

llega a un secto r de la platea

e l amb ien te , 0 pu eden haber sido at enuados por la presencia de un o bje to ce r


cano, hechos que deforman la informacion relativa a su posic io n . En la Figura
4 se ilust ra esta a paren te co n fusion de Fuen tes rea les y v irtua les.
El eiecio de precedencia (0 efec to H ass) nace de la n ecesidad de locali zar
un fvocam ente cad a Fuente ac ustica a un en pre senc ia de un gran mirn e ro de re
flex ion es ternpran as.l En e l experimen ro de S h ackle ton y M ed d is las refle
x ion es n o mo d ific an la frecu encia fund amenta l n i las relaci ones arrno n icas
de cada voca l. De heche , en un con tex te normal las sefiales no arm on icas y de
banda anc ha son las q ue ap ort an la ma yor parte de la in formaci on espa c ia l.
A unq ue la n ecesidad de a te n uar e l efec to de las reflexiones ex pliq ue la menor
importan cia relat iva de los dat os espaci ales frente a o tros mas es tables, es n e
ces ario recor dar la ca pa c ida d q ue pose e el sistem a audi tivo pa ra aren ua r 0 en

Un pa tron tem por a l perfec tamente regular, qu e repite ex ac tarne n te igual en


tiempos iguales, es peri6dica, mi entras qu e uno que pr esen ta pequefi as va ria
c iones en su perfod o 0 arnplitud se defin e co mo cuasi peviodico. En la Figur a 5
se apreci an las d ifer enc ias en sus co rrespond ien res graficos temporales.
Las sefiales q ue se ernplean en los ex peri men tos psicoac iisticos rradicio
n ale s son, a los efec tos practicos, razonablernente period icas. Est an gene radas
por medios elec tr on icos y es practicam en te im posible h all arl as en la n aturale
za 0 en las o ndas de los ins trurne n to s de rnusica no elec tron icos, Las se riales
cu asi pe riodi ca s, por o tra par te, so n tfpi cas en estos ultirn os casos.? El sistema
aud it ivo es muy sens ible a las sefia les cuasi pe riodi cas a l se r ca paz de de tect ar
pequefi as varia c iones de l o rden de un a fraccion de periodo . Est as va riac ione s
so n impuest as po r las a lin ea lida des de las Fuen tes acustic as. En el caso de la
rmisica, apa rec en ta nto en el inst rum ento co mo e n su ejecuc ion y a veces se
las ag rega intenc ionalmen te en la for ma de vibra to 0 tr em olo . El sistema au
ditivo ernplea de mane ra pro vechosa las pequ efias aperiodic idades menc ion a
das par a fun d ir pe rceptual mente los es tirnulos q ue le llegan . C uando recib e
pequefias variac io n es sin cro n izadas en para lelo tien de a o irlas co mo si estuv ie
ran ori ginad as en la mi sma fuenre, feno me no rel acionad o co n la ley de destina
comun de la te o rfa de la Ges ta lt.
Tomemos por eje mplo la ernisio n vocal en un can tante . Si empre existen
peq uefias irregu laridade s en e l flujo de a ire q ue llega desde los pul mones; hay
vibraciones no co n rro ladas en los mu scul os de las cue rdas vocales; aparec en
turbule ncias no lin eales en el tract o voca l y co nc urren desaju stes en la ada pra
cion de imped an c ias en tre el co mplejo buc on asal y el ex te rio r. C omo con se
cu en c ia de este s facto res e l con jun to de a rrnon icos es modulado irregularm en te
en frecue nc ia ("jitter") ye n arnp lirud ("sh immer"). A l aplicarse ambas mod u
laciones al total de la serial, el efec ro fin al es la pe rcepc ion de un solo objeto
aud itive , la voz de tal 0 cu al ca n ran te en part icula r,
Tal es el caso del "efecro de cafeter fa" C'cockratl party") .

En la ac rualidad se sabe q ue poseen un co rnportamien to caotico y no esrocastico, como

se erda hace un riernpo.

Tema desarro llado en el capitu lo

VII.

222

223

-.

-~

+
c
"Vi

'0

n,

:2~ r
rl:

"

I!

"
!,

rfl,

Ii

I'(l

.;

II

Figura 5. Comparaci6n ent re una serial periodica y una serial cuasi periodica

+
c

Es muy sencillo realizar el siguiente experimento: se gen eran digitalmen


te tres series arm 6n icas con la misma fundamental, qu e se funden perceptual
mente en un solo objeto ac ustico -se oven como si est uvieran origina das en la
misma fuente. Si a cada serie arm6 n ica se le agregan peq uefias fluctuaciones
no co rrelac iona das (que pueden ser tres v ibratos diferentes), cada serie se se
par a de las restantes y se las oye co mo si provinieran de tres fuentes distintas
em it iendo en unisono.
Los sistemas aud itivo y visua l parecen trat ar la period icidad y la sime trfa
de una manera simi lar, pero con diferente grado de resoluc i6n . Por ejemplo,
la vista no det ect a co n faci lidad la aperiod ic idad de la segunda serial de la fi
gura 6, al no contar con la ayuda de las lIneas que ind ican los perfodos que
aparecfan en la figur a 5. Tampoco nos percatamos inmedi at amen te de que tres
de los edificios son rnen os simetricos respecto del eje cen tral q ue los otros dos.
El sistema auditivo, en co n trapa rt ida , detecta inmediat amente un grado simi
lar de disparidad,
Tanto el sistema visua l co mo el audit ivo pierden parte de su capac idad de
ate nc i6n - se podrfa decir que se "desco nectan"- cuando apa rece n simetrfas 0
periodicidades perfect as, aun duran te un tiempo breve, y fallan al intentar ex
traerl es informaci6n relevanre.

0()

"w

n,

+
c

'0

"Vi

n,

Figura 6. Percepcion visual de la periodicidad y de la simetria . Las ondas son las mismas
que en 1afigura 5, pew sin llneas de referend a

224

P ercepci6n de secuencias ritmicas


N umerosas experiencias co mprobaron que la fusion y fision perc eptual de
eve ntos repetitivos dep enden del intervalo de tiempo qu e media en tre cada
oc urrencia. En una escala temp oral media, del orden de las decimas de segun
do, se habla de secuencias n tmicas. En un contexte aciist ico cotidiano much as
sec uenc ias de sonidos son rftmicas, y es de esper ar que exis tan mecan ismos
pe rce ptua les espectficos que las conternplen. Par ejemplo, si un patron auditi
vo es rftmico, entonces ciertos aspectos del mismo resultan temporalm en te re
dundantes. Una vez qu e los eleme n tos tempran os que defin en el patron so n
adve rt idos, los subsiguien tes pueden ser an t icipados . Handel dernostro , en se
cuenc ias repetit ivas segmentadas po r pausas, que el principio de agr upa rnien
to perc eptual predominante se basa en la estru ctura temporal ; otros
parametres, como la altu ra to na l, pasan a segundo plano (H andel , S ., 1989).
En otras palabras, la est ructura temporal -Handel la llam6 timing- de los ele
mentos es mas importante para det erminar el ritmo subj etivo qu e la estruct u
ra interna de cada grup o.
Por el contrario, cuando ofmos sec uencias rapidas (m as de 10 eve n tos par
segundo) los son idos no se agrupan de acuerdo con su ar den tem poral ffsico,
sino de ac uerdo con c iertas carac te risticas co munes co mo la altura tona l 0 el

225

'I

1,111
1

timbre. S, I, secuenc ia se percibe como un todo se produ ce [",iOn ,ilm'ca, y


c uando aparec e dividida en vario s patrones dife rentes se produce fisi6n rftmi
ca. Bregman sugi ri6 que ca da agruparnien to produc ido por la fision rit rnica co
rre sp ond e a un ob je to a ud it ive d iferenre. Dow ling de m ostr6 qu e la
segregaci6n oc urre ta mbi en cuando las sefiales sucesivas difieren en intensi
dad 0 en ubicac i6n espac ial.f
A lgun os co mposito res - no tablemente Bach- han apr ovech ad o la segre
gaci6n pro d uc ida en sonidos muy sep ar ad os en frecuenc ia - po r ejemplo en las
partitas para v iolin so lo- , 0 la fusi6n de los so n idos de dos inst rumentos en un a
so la me lodia (p ara qu e e l efecto tenga luga r los instrumentos deb en ten er ti m
bres y locac ion es simi lares) .
P e rcepci6 n del orden temporal
Pue de ser dift cil est abl ecer e l o rden tempora l de son ido s q ue parecen provenir
de diferentes fuent es aciist icas. Las person as no entrenad as necesit an du raci o
ne s de 200 ms par a esta blec er e l orden de cua t ro eventos no rel acionad os y
mu y d iferentes, Este resul tad o qu iza pr o venga de la segregaci6n en diferen tes
corrientes aud it ivas, do nde los so nidos pare cen flo ta r un os co n respec to a
o tros en el tiemp o subjetivo .
Giovann i Vica rio demost ro q ue no es pos ible orderiar ternpora lrnen te d os
co rrientes de so n idos de a lta y baja frecuencia cu ando la sepa rac ion excede las
tre s oc tavas.? En su ex per irnento, c uan do los sonidos suces ivo s se unieron co n
glisados en frecu en c ia la tendencia a sep ar arse en d iferentes co rrientes se re
du jo, a un c ua ndo los glisados no fuer an co rnp letos. La co n tin uidad perfecta
ent re tonos no es ne ce sar ia pa ra reduc ir la fision entre las dos sec ue nc ias: si un
ca mbio en frecuenc ia "apunta" hacia e l proximo sonido, e l oye n te pu ed e se
guir el pat ro n de co nt in uidad mas facilmente. Las transiciones bruscas ta m
bien ayuda n a ev ita r la segregac io n en difere n tes co rr ientes a ud itivas e
intervienen co ns ide rab lerne n te en la percepcion de la palabr a,

Regularidad en los datos fisicos


Los te 6ri cos qu e proponen el modelo frsi co para describir la representacion
mental de un objeto aud itivo , co mo C laude Cadoz, sost ierien qu e aprovecha
mos c iertas ca rac terf sticas de las fuentes ffsicas pa ra co mpo n er e l ana lisis au
ditivo de esc enas (C ad oz, C. et al., 1993). Este mec anismo serla luego
8
9

Dowling (I 968), en Moore, B. (I 997) .

Vease este terna en el punt a 4 del capitulo

226

IV.

intern ali zado y ope rarfa aun si el a ud ito r no esta familiari zado con la seria l fi
sica en un caso par ticul ar. Q ue e l siste ma aud it ive interpreta una transforrn a
c i6n subita de las pro p iedad es ac ust icas co mo e l ini c io de una nu eva seria l, 0
que haber o ido previa me nte un sc ni do potencia la pe rce pc i6n de su OCU1Ten
c ia fu tura, son h echos qu e n adie c uest iona, Aunque n oso tro s nos in cl in am os
po r el modelo acustico, la pr opu est a de Cadoz n o dej a de tene r c ierto atrac tiv o.
Las regularidades ffsicas h an sido corrobo radas experirne n ta lmen te y son una
buena gu fa pra ctica , a unq ue q uizas no de riven de una corn pren sion perceptu al
profunda de la n atura leza de los procesos ftsicos inv o luc rados.
De ac ue rdo co n el modelo ffsico , las regu larid ade s qu e pueden emplearse
pa ra agrupar e leme ntos en un unico o bje to a ud itivo so n :
Regula ridad 1: es ext rernada rne n te raro que dos so n idos, que co rnien
cen y rer rnine n e xac ta rne n te a l mism o tie mp o , no posean a lguna relacion en
tre sf.
Regularidad 2: progresion de un a tr an sforrn acion: a ) las pr opiedades de
un sonido a islado ti enden a rnodificarse de rnanera co n t in ua y lenta: b) las
prop iedades de un a sec uencia de sonidos to rnados de la m isma fuente tienden
a m od ificarse lentamen re .
Re gul aridad 3 : cuan do un c uerpo vibra pe riod ica men te, sus vibrac ion es
dan nac imi ento a un patron ac ust ico donde las frecu en cias de las co rnponen
tes son mu ltip les de un a misma frecu enc ia fund amen tal.
R egul aridad 4: la rnayor ia de las mod ific ac ion es qu e afec tan a un a fuen
te ac ust ica afec ta a todos los cornpone ntes del so n ido resultante, de rnane ra
ide ntica y sirnultanea.
El fen 6rn en o de red ucc ion de l e n rnasca rarnien to po r co mo d ula c ion co ns
tit uye un bu en eje rnplo de regu laridad del tip o 4 . 10 En e l experirnento c lasico
de Donald H all se emite una seria l sin uso ida l supe rp uesta a un ruid o de ban
das mu ltiples. S i e l ruido se manriene esta t ico el son ido de prueba es en rnas
carado, pe ro si e l ruido e nrnasc aran te flucni a sin cron ica rnen te en arnplit ud, la
percepcion de la seria l se rest abl ece. El oyente agrupa a las d iferentes bandas
de ru ido en un so lo obje to aud it ivo a part ir de su mo vim ien to co rmin . El so
n ido de prueba , estatic o , se segrega de l resro.
Redundancia de la in fo r macio n
C omo hemos v ista , exi st en rnuch as est ra teg ias de agrupa rnien to e interpreta
c ion de los da tos se nso riales. Est a mu lt ipli cid ad es necesaria porque cada un a
10 Vease

este terna en el punt a 5 del capitulo 111.

227

.......

de elias, par sepa rado, esta sujeta al erro r. Por ejemp]o, la estra teg ia que agru
pa los soni dos por su o rigen espacia l puede ser ineficaz en arnbien tes muy re
verb erantes. La q ue se basa en re lacion es arrnonicas puede fallar si se
enc uen tra co n son idos inarrnonicos 0 ruidos de banda. Las qu e buscan sim ili
tud es sec uenc iales pueden ser burl adas an te sonidos d iscontinuos 0 ca rnbian
res. La utilizac ion en para lelo de varias relaciones de agruparniento co nst ituye
habitualmente un a prot eccion co n tra e l fallo de una de e lias. C uando la in
form aci6n que rec ibe es co n trad icto ria, e l audit or sirnplernen te se puede de
c larar incapaz de penetra r los co mplejos sono ros. La extrema rareza de tales
casos testim onia la pot en cia de ana lisis de l sistema aud it ivo humano.

3. PRl NCIPIOS GENERALF.5 DE ORGAN IZA CI6 N

PERCEPTU A L

Y T EORfA DE LA GESTALT

Junto a sus descubrim ien tos fund acionales en ffsica y fisio logfa de la pe rcep
c ion , H elmh o ltz es co nocido tam bien co mo un precursor de la psicologfa cog
ni ti va. Forrnu lo el princ ipio de la inferencia inconsciente, que esta blece que
nu est ro siste ma visual "construye" obje tos trid imension ales a partir de los da
tos presen tes en el espac io bid imens iona l de la reti na. A part ir del principio
de H elmho ltz se desa rro llo la teorfa de la Gestalt. Esta se in icia en 1912 con un
artic ulo de Max W ertheim er sob re el rnovim iento aparen te , que exp lica la ilu
sion que posibil ita la ex istenc ia del cine. El auto r deduj o que la percepci6n de
un todo (el mov irnien ro) era radicalmenre difererite de la percepci6n de sus
co mpo ne ntes (las imageries esta t icas), La teoria tu vo un gran desarro llo du
ran te los siguien tes 50 afios. Sin embargo , aunque la descripci6n de los fen o
men os per ceptu ales pos tulada por los gestaltist as no ofrecfa rep ar os
importan tes, la argumen tacion te6ri ca se mos tr6 insufi cienre para funda rnen
tar sus leyes y la esc uela cay6 en c ierto de scredito en la decada de 1970. En la
ac tua lidad, se han ret ornado sus princ ipios generales de organ izac ion percep
tu al, que descr iben a grandes rasgos las caracterist icas de la percepcion, pero
se han dejado de lado los modelos exp lica tivos originales. Cas i todos los psi
co logos especializados en la percepci6n aceptan hoy la ope rativi dad de las le
yes de la Ges ta lt, aunque las justifican a part ir de procesos y mecan ismos
diferentes,
Los gesta ltistas, a d iferenc ia de los estructuralisras, entendfan q ue la per
ce pc ion no pod fa redu cirse a un a mer a suma 0 serie de sensaciones, sino que
respond fa a la configurac ion tot al de la que aq uellas form an part e. "El to do es
distinto que la suma de sus part es" sin tet iza uno de sus axio mas basicos, en el
qu e las pro pieda des ernergen tes ilustr an el concepto gesta lt ico de organ izacion

228

ne cesario para ex plica r por q ue los se res human os ve mos el mundo co rnpues
to de obje tos d isrinros, La ca pacidad de pe rcibi r obje tos - piedras, arboles, la
dr idos 0 vien rc-- deb la esta r o rigina da en o perac iones efectuadas po r el siste ma
ne rvioso centra l. A dve rt ir qu e la percepcion de objetos se parados no es s610
prod ucro de las sensa c iones periferi cas fue una de las mas importantes con tri
buciones d e la esc uela de la Ges ta lt.
Segun la teori a de la Ges ta lt los hechos psfquicos son forrn as, un idades or
gan icas q ue se indi vidu alizan en e l ca mpo espac ial y te mpo ral de pe rcepc i6n
o de represenracion. Las form as dependen , en e l caso de la percep c i6n, de un
conj unt o de fac tor es senso riales obje tivos. La pe rcepci6n de las dife rent es c la
ses de elem entos y de las d iferenres clases de relaciones co rresponde a dete r
minados modos de organizaci6 n de un to do , qu e depende a la vez de
condicion es objerivas y subje rivas. La co rresponde ncia qu e se puede estab le
cer entre las part es de un red o artic ulado y ciertos eleme n tos objetivos no se
mantiene, en gene ra l, cu and o esos mismos elementos perten ecen a otro con
junto obje tivo. En ot ras palabras, un a part e en un todo es algo d ist into a esa
part e a islada 0 en o tro to do, a causa de las propiedades q ue debe a su lugar y
funci on en cada uno de ellos. El ca mbio de una cond icion objet iva puede pro
duc ir un ca mbio local en la for ma perc ibida, 0 traduci rse en un cambio rad i
cal de la form a eme rgen ce.
El objet ivo in ic ial de la teorfa de la Ges ta lt cons iste en esta blecer, por
med io de la expe rienc ia, un conj un ro de cond iciones de ex istenc ia de las for
mas perceptuales y de leyes de tran sforrn acion de dich as formas. Para que es
tas se mue str en eficaces no es necesar io q ue exis ta una correspondencia
rigurosa entre los elemen tos del estfrnulo objet ivo y los eleme ntos de la forma
- de heche, la co rrespo nde nc ia direct a gene ralmen te n o existe y, en tod os los
casos, no se man t iene co nsta n te.
Los te6ricos de la escue la afirma ron que el proceso fisio logico que resulra
de un co n jun to de exci tac ione s tien de a organ izarse espo n ta neamen te si
guiendo cie rtas leyes de estructura, independ ien tes en prin cipio de las sign ifi
cac iones agregadas por la educaci6n. En la act ualidad ex isten teorias sobre la
percepc ion que co n tradice n tal afirrnac ion . Se ran comentadas mas adela n te .
Los tr ab ajos de los psicologos gesta ltis tas lIevaron a en un c iar ci nco le
yes y dos princi pios gene ra les q ue pe rrnite n agrupar los estfmu los que pro
v ienen de un a mi sm a fuen te , y seg rega r los q ue no 10 h ace n , En gene ral,
un a regia a islada no sie mpre perm ite la fusi6n 0 fision perceptua l y varias
de eli as d eb en act ua r juntas pa ra que e me rja la forma final (Kohle r, Koffk a
y S ander, 1962).
En 10 que sigue describirernos brevernente las leyes y los princ ipios gene
rales de organ izacio n q ue propon e la teo rfa de la Ges ta lt.

229

~-

III
Leyes de la Gestalt
1111

'c"

'(3

Los psicologos de la Ge stalt centraron sus estudios en el sen tido de la vista .


Co n algun as ada pta cion es, sus cinco leyes y dos principios de organizac i6n sc
aplican tarnbien a la audicion.!'

OJ

::J

OJ

u:


Tiempo

Ley de proximidad
La ley de proximidad expresa que los elemen tos ce rca nos tienden a percibirse
como un a unid ad . En la Figura 7 se aprec ian pares de c irculos agrupados por
proximidad cspac ial.
En audici6n la proximidad pued e darse en diferentes di mensiones . Los so
n idos se agrupan po r pro ximidad de altu ra, de tiem po, de timbre a de espacio.

Circulos no ag rupados

Clrculos agrupados por proximidad

F igura 9. Agrupa mienr o de son idos par pro xim idad temp oral

Ley de semejanza
La ley de semejanza esta blece que elem entos iden ticos a semeja ntes (en color,
tarnafio 0 forma para el sentido de la vista) t ienden a percibirse agrupad os. En
aud ic i6n , la semej anza implica sim ilitud de timbre, altu ra, sono ridad 0 locali
zaci6n espac ial. EI rasgo que determina la agrupacion percep tual por semejan
za depende de l co ntex te 0 de la rarea impuesta al oyen te. Van No orden
demostr6 que la sirnilitud de timbre puede impone rse a la similitud de alt ura
tonal, al men os bajo ciertas circunstancias (Van N oorden, L., 1975) .
En la Figura 10 se observa la ley de semeja nza aplicada a la vista y en la fi
gura 11 se puede ver el espectrogram a de dos corrientes perc eptuales agrupa
das par semejanza tfmbrica.

Figura 7. Ley de prox imidad


Agrupa miento por seme janza

'c"

'(3

OJ

Fig ura 10. Ley de se me janza

OJ

::J

lL

'"

' (3

eeD DeeD D

::J



~
u,

Tiempo

Tiempo

Figura 8. A grupamienro de son idos po r proxi rnidad de alt ura

'c"

'(3
OJ
::J

~
lL

..

_-=LJ ..
~

Ll
. Ll

Ll

Tlernpo

El o rde n y aun el ruirnero de leyes varfa segun el aura r q ue se consulre. El que ex pon e
mos aq ul es el mas frecuenre en la lit eratura so bre el terna.
II

230

F igura 11. A grupam ienro de sonidos par se rnejanza de tim bre

231

1,;[

Ley de cierre
La ley de cierre esta blece que las figur as incornpletas tienden a cornpletarse y
a ser percibidas como una unidad cerra da. En la Figura 12 se ve un a serie de
rect angulos.
Bajo ciertas condiciones un son ido enmascarado puede oirse como si fue
ra continuo aun sin serl o (en to do caso, no existe evidenci a senso rial de su
co ntin uidad), Se 10 sigue "oyen do" aiin cuando ha cesado. En la Figura 13a
per cibim os que la serial de banda an gosta no pr esenta ninguna solucion de
continuidad . Puede ocurr ir, sin embargo, que result e disc ontinua en los tr am os
en mascarados (figur a 13b) .

Ley de continuidnd 0 de buena [onna


La ley de co n tin uida d esta blece que los elementos que forman parte de un pa
tr on co ntin uo tienden a percib irse co mo una unidad . En la Figura 14 ve mos
dos line as qu e se cru zan , aunque son posibl es ot ras con figurac iones.
Esta ley, aplicada a la audici on, h ace uso de nuestro co noc imien to de las pro
piedades fisicas de las Fuentes aciisticas que modifican sus parametres de manera

suave y continua. Los cambios bruscos indican que una nueva Fuente se ha acti
vade . Par ejemplo, si la alternancia entre son idos agudos y graves se intercala con
los glisados en la dire ccion adecu ada , se redu ce la segregacion en dos corrien tes
perceptuales. En la Figura 15 se puede apreciar el correlato auditivo de esta ley.
En la voz hablada, gran des cam bios ine sperados en la frecuencia funda
mental dan la impresion de que un nuevo hab lante se ha incorp orad o. Este
efecto requiere un "conocimiento" de las reglas normales de en to n ac ion . La
segregac ion aud itiva produce silencios ilusori os en cad a corriente durante la
parte de la serial atribuida a la otra co rrierite.

Ley de destino cormzn


Por la ley de de stino corruin los objeto s que presentan un patron de movi
miento co rmin ti enden a percibirse como una unidad. Ejemplos clasicos son
las bandadas de pajaros 0 los grupos de mar atonistas.
Esta ley es de enorme impartan cia en audicion. Los diferentes co rnpon en
res en frecuencia provenientes de la misrna Fuente aciistica varian usualm ente
de un a rnanera coherenre. Tienden a co rnenzar y terminar juntos, ca rnbian de
intensidad a la par y alteran sus frecu encias de manera asocia da. Por eso si dos

Agrupamiento por cierre

Continuidad AD Y CoB

:><

[ ] [ ] [ ] [ ] [ ]

Figura 12 . Ley de cierre

Figura 14. Ley de continu idad

'"

"0

I'"

"

1/\

c;

<l)

::>

2'

LL

rv

"

)i

fo\

I~

-~

1\

'"

Tiempo
b) Sin enma scaramiento

Figura 13. Ley de cierre para una secuencia de son idos

Z3Z

@
eL

Tiempo
a) Con enmascaramiento

"g .

Tiempo

Figura 15. Ley de contin uidad en dos secuenc ias de soni dos

233

Cl rculos agrupados por movimiento cornun

--------

-8 -8

-8-8

~~

'-.:::::/ '-.:::::/

'-.:::::/ '-.:::::/

Figur a 16. Ley de destine co rrni n (las ondas dobles representan rnovirnient os en paralelo)

C1l

'0

OJ

OJ

LL

...

. ...
..: ".

".
..
0.. .... . ....: .....

. ..

Tiernpo

Figur a 17. Agrupam iemo de sonidos por movimien to co rrui n

o mas co rnpone ntes de un son ido complejo experimen tan el mismo tipo de
carnb ios al mismo tiempo, son agrupados y percibidos como proveni entes de la
misma Fuent e. En la Figura 17 las dos lineas melodicas que se rnueven en para
lelo tiende n a agrupa rse entre sf.
Con relaci6n a la ley de destin o co miin, hay dos fact ores q ue se destacan
a la hora de sin tet izar sonidos para crear nue vos obje tos audit ivos. El primero
t ien e que ver co n la forma y sinc ron ismo del ataq ue, y el segundo co n la sin
cro nfa de las mod ulaeiones (de amplitud 0 frecuencia) en el desarrollo tem
poral de los cornpon en tes que se preten den agrupa r.

Principia de figura yIundo


Ten emos la capaeidad visual de distinguir una Figura del fond o contra el cual
aparece. Tambien somos capaees de distinguir la melod ia que ejecuta un solista
destacada por sobre la masa orquestal y de comprender el discurso de locutor de
radio a pesar del ruido de fond o. Sin embargo, todos estos estfmulos nos llegan
desde el cam po pereept ivo periferico sin jerarquizaci6n alguna. En la conoe ida
imagen de la Figura 18 se pueden ver alterna tivarnen te dos rostros 0 una copa,
segun cual de los campos visuales cons ideremos como Figura y cual como fond o.

234

Figura 18. Figura y fondo

G rac ias al pr incipio de Figura y fon do se esta blece una jera rqufa ent re los
obietos de interes y el medio neutro que, aunque pueda estar constituido por
exc itac iones co mplejas y heterogeneas, es desplazado a un grado infer ior de di
feren ciaci6n. La segregac i6n perceptu al entre Figura y fondo no ocurre de rna
nera rnecan ica. A l ofr una conversacion 0 una melod ia en un arnbiente co n
un gran ruido de fondo , seguimos al objeto aud itivo q ue co nte nga mayor sen
tido en funci6n del co ntex te 0 de nu estro interes parti cular. Cuando los Indi
ces de diferenciacion no son ev identes se producen figuras amb iguas 0
ilusion es figura-fondo, situac iones q ue se aprovechan en el mimet ismo y en el
camuflaje.
El principia de pertenencia (t arnbien conoc ido co mo principio de cortes
ponden cia ) expresa que si un compo ne n te simple es usado para la form aci6n
de una corrien te perceptual, no puede emplearse en la formaci6 n de una se
gunda co rrien te . En la Figura 18 no pueden verse a la vez la copa y los rostros.
Parece que ate ndernos a una corrien te perceptual a un tiernpo, y el resto for
ma part e del fondo. A lgunos autores han ace prado, no obs tan te, que el prin
cipio de per te nenc ia auditive puede debilitarse en ciertas ocas iones: un
elemento sono ro puede oirse co mo part e de mas de una corrien te perceptiva.
En el caso de las texturas polifon icas se ha propuesto la posibilidad de perc i
bir mas de una Figura a la vez.
El pape l de la atencion cs determ inant e en la selecc i6n de los elemen tos
que van a form ar parte del objeto ac ustico que ocupara la funci6n de Figura.
La atenc i6n ac nia sobre la en trada auditiva para seleccionar ciertos rasgos del
son ido para su ana lisis conscie nce. Emp leamos nu estra sensibilidad a los ca m
bios en la sefial aciistica para dirigir la at encion hacia n uevo s y pot encialmen
te import ant es eventos del entorno . C uan do un aspec to del sonido ca mbia,

235

rnientras el resto se manti en e constante, llama la atenc ion de l oyent e: se con


vierte en Figura. El efecto "cocktail part y" 0 la audicion de un a voz que se des
raca del resto en una pieza polifonica son buen os ejernplos de eleccio nes
atenc ionales. Neisser sugirio que la atencion aparece un a vez realizado un ami
lisis preatentivo de las diferentes cor rientes percept ivas (Neisse r, U ., 1967).
Sin embargo, este proceso no es de un solo sen tido: se sabe que la atencion
puede influi r en la forrnacion de co rrientes perceptivas .

L~

Principia de pregnancia
El princip io de pregnancia fue formulado por Koffka del siguien te modo: "la or
ganizacion psicologica sera siempre tan excelente como las condiciones domi
nant es 10 permitan" (G uillaume, P , 1975). Se entiende aquf por "excelencia" a
la interveneion de propiedades como regularidad, simetrfa, armon ia de conjun
to, homogeneidad, equilibrio, maxima senc illez,etc. En otras palabras, para agru
par el campo perceptu al recurrimos a la menor cantid ad posible de informacion.
Este principio opera empleando simultanea men te varias leyes de la Gestalt.
En la Figura 19 se ha dibujado el triangulo de Kani zsa. La interpretacion
mas eco nomica en terrninos de inform acion es supone r que ex iste un triangu
10 blanco que se superpone a tres circulos y al triangulo delinea do, y no la rnu
cho mas compleja e improba ble alineacion de tres angu los y tres pacman .
En el en mascaramiento por ruido ocurre algo similar. Es mas eco norni co
en terrn inos de informacio n supone r que el son ido en mascarado con tin ua en
presen cia de l ruido , que in terpretar una compleja operacion sincr6n ica de ac
t ivacion -desact ivac ion .
Se puede aprecia r un ejemp lo notable de agrupamien to , en el que int er
viene n varios princ ipios gesta lticos a la vez, al comienzo del movimie n to fin al
de la sexta sinfonfa de Tchaikovsky. En el sistema superior de la Figura 20 se
yen las partes de los violines I y II tal como figuran en la parti tura, mientras
que en el segundo sistema esta escrito 10 que casi todos los oyentes percibe n ,
cn-esre caso se oponen ent re sf algunas de las leyes de agrupa miento exa m i
nadas. Por semejanza tim brica y de alturas se fusion an los son idos provenie n
tes de ambos grupos instrumentales y luego se reagrupan de acuerdo con el
prin cipio de pregnanc ia. En esta segunda fase inte rviene n las leyes de con ti
nuidad y cierre junt o a un principio de cohes ion estructural llarnado ilusi6n de
escala por Dian a Deutsch (1975).
Es posible ace n tuar la arnbigueda d perceptua l del pasaje agregand o un
compone nte espacial si se dispone la orquesta en el escena rio de ta l modo que
los primeros y los segundos violines queden alejados entre sf, a ambos lados del
director, como ocurre en la forrnacion orques ta l "a la alernana" .

236

e /\
Figura 19. Triang ulo de Kanizsa

"

Como se escribio;

-. -Violin I

-----

Violin II

Como se percibe:

Violin I

Violin II

-----

~--

Figura 20. Reagrupam ienr o melod ico en el cuarto mo vimien to de la sexta sinfonfa ("Pa
te tica") de Tcha ikovskv

237

Isomorf ismo
Los creadores de la escuela de la Ges talt trataron de fundam entar su teona en
term inos fisioiogicos. Postularon una conexi6n muy directa entre la expe rienc ia
percep tiva, la fisiologfa y el mundo ffsico a traves del principio de isomorfismo,
que afirma que una experie ncia subje tiv a y el dispositivo neura l asociado tie
n en estruct uras formales similares.
Se trat a clarame nte de una postur a monista en la que los procesos fisicos,
fisio16gicos, psico logicos y culturales t ienen la misma base rea l: la forma ftsi
ca. La ffsica se convierte aqu f en la ciencia fun da mental a tamar como refe
renci a explicat iva ultima. Esta con cep ci6n se man ifiesta, por ejernplo, en las
numerosas comparacio nes ent re el mundo ftsico y el psicologico a las que re
curre Kohl er: "[...] del mismo modo que en el camp o ffsico (pe r ejernplo el
campo elect rico) , en el campo psico16gico hay tambien una estructuracion es
pont anea que obedece a principios dinarnicos" (Kohler, W., 1972).12
Para estos investigado res la teoria de las formas ffsicas y el isomorfismo
psicoffsico constituyero n el asien to te6rico de la doc trina . A l afirrnar que en
la natural eza inorgan ica se en cuentran mod os de ser del tip o "formal", libera
ron la barrera que separa los procesos no organi cos de los procesos fisiologicos
en el sistema n ervioso central. El marco te6rico fue to rnado de la teor fa del
campo electrornagnetic o vigente a principi os del siglo xx . Citernos n ueva
mente a Koh ler: "[...] los proc esos fisiologicos neu rales con que se asoc ian los
he chos percep tuales esta n en cada caso localizados en un medio cont inuo , y
los hechos que ocurren en una parte de ese rned io influyen sobre los que tie
nen lugar en otras region es, en la med ida direcra en que las prop iedades de
ambos se ha llan relacion adas mutuamente [...] a un percept o aislado en medio
de un arnbie n te ho rnogeneo, le atribuimos su campo". Introduce entonces el
princip io de isomo rfisrno: "las propi edade s estructurales de las exper ienc ias
--'-sen al mismo tiempo las pro piedades estruct urales de sus correla tos biologicos
y, en ult ima instan cia, del mund o ffsico" (Koh ler, w., 1972).13
En la actualidad ya no se cree en el princip io de isornorfismo , y hace tiern
po que han sido dejados de lado los fund amentos teo ricos originales de la psi
cologfa de la G esta lt. Sin embargo, las leyes de agrupamiento todavfa son
empleadas para describir el modo en que percib imos el mun do exterio r. De to
dos los in tentos realizados para int egrar estas leyes a un modelo reorico gene
ral, qu iza el mas interesante sea el que pro ponen los creadores de la teona de
la percepci6 n caotica.
12 Trad.
IJ

de Julio Gu illen .

Trad. de Julio G uillen .

238

Capitulo IX
Percepc i6n del habla

Resulta evidente que la percepci6n del habla no depen de simplemente de ele


mentos invariantes accesibles directa rnente en la ond a aciistica. Por ejernplo,
los patrones de la sefial acustica que corresponden a una palabra se rnod ifican
de man era compleja en funcio n de los son idos que la preceden y que la suceden ,
y un fone ma que resulta alta rnente probable en determinado contexte lingufst i
co va a ser "ofdo", aun en ausencia de los dat os acusticos correspon dient es. EI
recono cimiento de la palabra depend e tambien de indicadores sernanticos, sin
tacti cos y circunstanciales, La import anci a de estos indicado res se potenc ia a
medida que aumen ta el ruido presente en el cana l de comun icac i6n.
Au nq ue este capitu lo trata sobre la percepcion de l hab la, conviene repa
sar primero brevemente el mecanismo de fonac i6n hu mano.

1. EL

APARATO VOCAL Y LA FONA CrON

Las menores unid ades del ha bla son los fonemas. EI idioma espanol posee a l
rededor de 24 fon emas diferentes que se definen a partir de los sonidos que es
capaz de producir el aparato vocal.' En esencia, proclucimos tres clases basicas
de son idos diferentes: las consonantes plosivas , que son sefiales tra nsitorias que
se produc en al bloque ar y luego abrir repentinarnente el tracto vocal; las con
sonantes fricativas, que depen den de la tur bulencia en el aire cuand o pasa a tra
ves de una pequefia abe rtur a, y las vow les, cuyas ondas son periodicas y que
poseen altura tonal definida.
Veamos primero, de manera muy sint et ica, como y con que produc imos
esta gran cantid ad de son idos diferentes.
I La can ridad de fonemas del espariol depende de cada region IingL
ifsrica y varia levernen
te, por ejemplo, en tre Madrid, Buenos Ai res y La Ha bana. Co mo referencia cornparat iva,
el Ingles posee alrededor de 40 fone mas.

239

---El aparato vocal

II

a)

E[ apa rato vocal hu man o se puede di vidir en tres partes principa les que son:
un a reserva de a ire a mayor presi6n que [a atmosferica, un cana l de salida do n
de el a ire puede ser interrumpido 0 modulado, y una cav ida d reson ante q ue
filtra las sefia les que se erniten al exterior.
La rese rva de aire a presion, llamada presi6n subglot ica, se local iza en los
pulmones. Su capac idad prom ed io es de tres a cuatro litros y puede llegar has
ta seis durante una inspirac i6n profunda . Mov emos alrededo r de med io litr o
durante la respiraci6n pausada , pero un cantante entrena do es capaz de ut ili
zar hasta c inco lit ros en una sola exha laci6n.
En el borde supe rior de la traqu ea se ubica una espec ie de cav idad ca rt i
laginosa llamada lar inge, que la co mu nica co n el tracto voca l, terrn ino que in
c luye la gargan ta y la cav idad naso bucal. Dentro de la lar inge se hallan las
cuerdas (0 mem bran as) voca les, encargadas de estrech ar u ocl uir el paso de ai
re a pa rti r de la acci6n de va rios peq uefios rruisculos. La ape rtura co n form a de
V entre las cuerdas voca les se denomina glotis. La gloris mide aproximada
mente 2 cm de largo y 1 c m de anc ho cu ando esta tot alm ente ab ierta, En la
figura 1 se puede ve r e l co rte lat eral de la pa rte superior del apa rato voca l, y
en la figura 2 se yen dos co rtes esque rnat icos de la laringe.

Paladar
blando

I '~
'."

Cuerda s
vocales
falsas

Carti lago
1iroides

Carti lago

Cuerdas
vocales
verdaderas

Tlroldes
Cuerdas
voca les
verdaderas

b)

Cartilago
Aritenoides

Figura 2. Vista front al y superior de una laringe hurnana

En fonac i6n, la caja toraxica ap lica una presi6n subg lot ica un poco ma
yor que la presi6n armosfe rica - entre 1,005 y 1,04 atm6sferas- qu e fuer za al
a ire a pasar por la glotis y que hace vibrar las cuerdas voca les, cu ya apert ura
estatica es regulada por el ca rti lage arite no ides. Las cue rda s vocales, a su vez,
vibran a un a frecu en cia co n tro lada por la presi6n subglotica y por la ten si6n
aplicada a sus pequefios rmisculos. Para el habla norm al, las frecuencias se ex
tienden en un ran go que va de 140 a 400 Hz en las muj eres y de 70 a 200 Hz
en los hom bres. Estos ran gos puede n extende rse una oc tava 0 mas en el can to.

'II

Faringe

Epiglolis

Producei6n del sonido


Cuerdas
vocales

Figura 1. C ort e lat eral de la parte superior del aparato voca l hurnano

240

Cuerdas
vocales
falsas

En la fona ci6 n par tic ipan varios mecani smos diferentes dura n te la producc i6n
de ondas. Las consonantes plosivas, que son seriales trans itor ias que se produ cen
al bloquear y luego abrir repenti nam ente el tracto voca l, tienen un desarrollo
temporal en el que pr imero aparece un ataque similar a un impulso de gran pre
sion, seguido por un breve int ervalo en el que la vibraci6 n se aten ua rapida
mente. En la figura 3 se ve el grafico tem poral de la co nso na n te plosiva /k/
Esta serial , transitori a y no pe riodica, pose e un espec tro de banda anc ha
y, por supuesto, carece de altura to nal. Las plosivas se div iden en sordas ({pi ,
241

---+
+

"0

.-e
a.

"0

.a.e

<l:

<l:

Tlernpo
Tiempo

Figura 3. G rafico temp oral de la conson ante Ikl

/t/ y /k/) y sonoras (lb/, /d/ y /g/). En estas ultimas, las cuerd as vocales se po
nen en vibraci6n y una vocal suena inmed iatamente despues - unos 30 ms- de
la conson ante, Como el ca rac ter transitor io de las plosivas hace q ue co n ten
gan poca energfa, los can tan tes generalmente las exageran para equilibrarlas
en sonor idad con respect o a las vocales.
Las consonantes fricativas (ls/, [z], /sh/, /j/, /f/, /v/, etc.) producen un a tur
bulencia en el aire que fluye a traves de una pequena abertu ra a mayor velo
cidad que la veloc idad crftica. Aunque se pued e sostener est a clase de seriales
en el tiemp o, son estaciona rias solarnente en el sen t ido que 10 es el ruido blan
co. S us ondas son no peri 6dic as y el espect ro es de band a anc ha . En la figura
4 se aprec ia el grafico tem por al aislado de la consonante fricativ a /sh/.
Aunque el tract o voca l pueda enfat izar alguna s frecuencias de la banda
total gene rada por una con son ante fricati va (por ejernplo, 6 kH z para la /s/ 0
3 kH z para la /sh/ ) no se destaca ninguna frecu encia en part icular y el sonido
resultan te es no t6ni co. Existen otros son idos como las consonantes tiasoles
(lm/, /n/, /n!), las vibratues (lr/ , /rr/ ), erc., pero los modos de producci6 n no di
fieren en esen cia de los ya vistos.?
A diferencia de las conso nantes, las vocales se manrienen estables en el
tiemp o, sus formas de onda son practi carnenre peri6dicas y sus espec tros son
1 N o prerende rnos cub rir aquf el pan orama cornplero de los fonemas del espanol. Tampoco
ernpleamos los sfmbo los recornendados por la Inr ernatlonal Phonetic Associati on (IPA),
q ue exig irfan una desc ripci6n de rallada. Q uien desee ampliar en el tema debera recurrir a
text os especfficos de fon erica y fono logfa.

242

Figura 4. G rafico te mporal de la conson ance Ishl

aproximadamente arm6ni cos. En otras palabras, las voca les sf poseen altura
tonal definid a. Se producen por la modulaci6n peri6dica de la apertura glot i
ca. Tanto la frecuencia de vibrac i6n de las cuerdas voca les co mo la forma de
onda resultante estan determina das casi co rnpleta rnen te por la laringe. La fre
cuencia fund amental, que define la per iodicidad y la altura tonal, dep end e de
la presi6n subgl6tica y de la ten si6n y apertura de las cuerdas voca les. El trac
to voca l, tapizado de tejido blando, casi no devuelve energ fa hacia la laring e.'
Las diferentes posiciones de la lengu a, por ejem plo, modifican la acci6n de fil
trado y determ inan cual vocal se va a emitir, pero no alt eran la periodicidad
base de la serial que emiten las cuerdas vocales.
En la figura 5 se pueden observar las formas de onda que parten de la la
ring e para tres ni veles de intensidad diferentes. A mayor intens idad aumen ta
sign ifica tivamen te la cantidad de arm6nicos en el espectro.
De la laringe surgen ondas aproxirnada rnen te periodicas que se parecen,
segiin el caso, a una onda trian gular 0 una onda dienre de sierra con gran can
t idad de arrnon icos. El sonid o que se registra en la laringe se sien te como un
zumbido con altura tona l defin ida, no como los son idos mucho mas agradables
que ofmos cuand o el locutor emite por la boca . Esta gran diferencia acustica
se debe a la acci6n de los filtros de resonancia de l tracto voca l.
Aquf Fa lla la difundi da ana logfa en tre el apa rato vocal humano y los insrrumenr os de
viento del grupo de los bronc es: la carn pana de estos ultirnos de vuelve hacia la boquill a un
gran po rcen taje de energfa en cada ciclo. Asf se esrablecen las ondas estacionarias necesa
rias para su funcion arnienr o.
3

243

........

a)

:t~ it.
---- - -

-..

<{U

Tiempo

lib '"t1 " ~ "b

..

Frecuencia

200 AA~~

"0

a.
<{

Ii!

Tiempo

c)

Figura 6. Con figuraciones del rracto vocal para las vocales Iii, l ui, /e/ y /a/

Qt

b)

(f)

Frecuen cia

Frecu en cia (kHz )

"0

a.
<{
E

Tiempo

I.
Frecue ncia

o~

' 0

: ;~

III I I1 I! !11 I I!1 I! !1 !11!!!!1 ' , ~

o
1
2
3
Frecu en cia (kHz)

lal

~ ~~ ' ~ ~
>

D !:J
.~

Figura 5. Formas de onda y espectr os tornados en la laringe. a) serial debil, b) serial de me


diana inrensidad y c) serial muy intensa

IIII
0

Frecuen cia (kHz )

luI
Fo rma ntes
El traeto voca l se puede aproximar a un tuba de 17 ern de largo, cerrado en un ex
tremo por las cuerdas voca les y abierto en el otro a craves de la cavidad naso bucal.
C ada voca l d efine una geom et rfa particu lar de l trac to voc al , como se pue
de ver en la figura 6.
Cada co nfigurac ion particu lar de l tracro voca l, a su vez, modifica las ca
racterfst icas espectra les del filrro ac ust ico co rrespond ien te. Lo que ofmos es,
en definitiva, un a serial peri odi ca gene rada en la laringe y filtrada par e l tr ac
to voca l. En la figura 7 se pu ede ver co mo la misma onda, ernitida por la fa
rin ge, ado pta envo lven tes espec trales d iferentes para cada voca l. En este
ejernplo se oye siempre la misma alt ura tonal, pero co n tre s alturas espectrales
d iferentes (las voc ales /ii, /a/ y /u/).
La cav ida d n aso bucal posee resona n c ia de banda medi a porque el tej ido
blando qu e la tap iza absorbe gra n cantidad de energfa ac ust ica , Cada un a de
estas zonas de resonanc ia, en las que se refuerza la arnplit ud de los cornponen
tes espectrales, se denomina [omviiue. Cada vocal co rrespo nde a un a corn bi

244

~
Frecue ncia (kHz )

Figu ra 7. Efecto de filtro del tracto vocal sobre una serial periodica proven ience de las
cuerdas vocales

na cion parti cu lar de forrnantes, tres 0 cuatro segiin el caso . S in embargo, es


posib le distingui rlas con cl aridad a part ir un icam ente de las do s primeras. Si
se cons truye un grafico cartesiano qu e posea la frec uenc ia de la prime ra for
rnante en abscisas y la de la segunda forrn ante en orden adas, se obt iene un es
paci o bidimensional en el que cada punta co rrespo nde - idealmente- a un a
vocal. En la vida rea l, por supu est o, ex iste gran variabilidad no solo entre un
hablante y otro, sin o hasta en la misma per sona en diferentes mornentos del

245

a)

3000
2500 .
2000

----r----~----;' -'
'

: E

~- --~

~ -- -! _
I

E.

:e
L
_ I

1500

1000

",

U .

,,

-----,----

- -T-----'
,
' - --

--~,

:--

500

Caracterfst icas gen era les de la ernision voca l

~: - ---

-----iG}D---, ., __ ~0:

LL

,-'' - - --

:__

''

0
0

200

400

600
800
Fl (Hz)

1000

1200

1400

b)
3000

, "-.-~E - J----+ , . -,----


.~ ~ : ' . - ..;

250 0

~ j-_.- ~-- ---i-(


----; 9. ---
---~--~--'
; ----:;:

2000

<,

E.
N

'

1500

LL

1000

--':

500

- - - "l " -

"

~-~ -- - - ,;-

-,

ejemplo, en la figura 8 se co mpara n las regiones de reconoc imiento voca l pa


ra voces mascu linas yfeme n inas.

" A--

La voz hum an a genera un espectro de pot en cia que alcanza un maxim o de


energfa alrededo r de los 500 Hz en los hombres y de los 1.000 Hz en las mu
jere s, para luego decaer a razon de -8 d B por oc tava hasta un a frecuencia co m
pren did a entre 4.000 y 5.000 Hz. En la figura 9 se puede vel' el n ivel med io de
ernision de un a voz mascul ina tomado a im del locutor. El ran ge dina rnico
uti ] para la palabra es del orden de los 30 dB. Las crestas mas potentes se en
cuen tran a alreded or de + 12 dB por enc irna y las mas debiles a -18 dB por de
bajo de l n ivel medi o.
En la region de sobreca rga el oido no puede discr irninar entre d iferentes
fonemas y la int el igibilidad cae bruscarnente.
POl' supuesto, la voz hurn an a no emite de rnanera ornn idirecciona l a to
das las frecue nci as. Es marcadarnente d ireccional por enci ma de los 1.000 Hz.
En la figura 10 se muestr an los d iagramas de d irectividad en el plan o ve rtical
correspond ientes a cinco frecuencias diferen tes.

:- - -- T- ----,

~'

110

0
0

200

400

600
800
Fl (Hz)

100
1000

1200

1400

90

CD

80

70

Figura 8. Regiones de reconoc imiento vocal para las dos prirneras forrnan tes de l espafiol
riop larense, a ) voces masculinas, b) voces femen inas

c:
0

60

-0

50

a.

40

'"
c:

'in
~

dia. POl' 10 tanto hay un ran go de valores para cada par de form antes (una re
gion en el grafico de la figura 8) que co n tie ne informacion sobre la misma vo
cal (Aronso n , L. et aI., 2005).
Los ran gos se superponen en algunos casos y los mismos son idos puede n
percibirse en dos fonn as diferenres. POl' 10 general, solo una de las interpr et a
ciones tien e sentido en su co ntexto y la ado ptamos auto ma tica rnente de rna
nera preconsciente. Una de las razones de la gran ext en sion de las areas para
cada voca l es que las mujeres, los hombres y los nifios no poseen el mismo ta
rnafio de tracto vocal y no pueden producir exactarnente las mismas forma n
tes. Los oye ntes eval uan las ca racte rfs t icas acusticas gene rales del locutor
antes de decidir las forrnantes que le va n a corre sponder a ca da voca l. Co mo
246

Region de sa brecarga

<])

'0

30

20

(J

M vel de cres la de la P11abra


M vel media de la

pa lab r~

Nivel minima de la pa/abra

<])

a.

'"

10

<])

Qi

10

>

-20
30

Nivel efi ca z total de la


palabra: 69 dB a 1 metro
Umbra l de audibilidad para

so nidos de espectro co ntinuo

270380 490 630 770 9201070 1230 1400 1570 1740 1920 2 ' 30 2370 2660 3000 3400 39504650 5600

Frecuencias ce ntrales de las bandas ~e igua l cantribuci 6n


allndice de articulacio n

Figur a 9. Ni veles espectrales de em isi6n para una voz masculina

247

270'

a)

270'

5.000

180'

1 II

(?K 1 \ a O'

' 1\1

(*\

1' 0'

;s
co

'(3

c:

2.500

<1l
:J

90'
100 Hz

90'

~
u,

400 Hz

1.000
270'

0
180'

I l

I a O'

(')+()

I 1 'Ii

2
Tiempo (5)

2
Tiempo (5)

I 1 0'
b)

5,000
90'

90'

1.000 Hz

4.000 Hz

;s

270'

180'

I I

f\?K

j,

I /I

O'

~~

'~ 2.500
c:

<1l
:J
U

u,

1.000

90'
10.000 Hz

Figura 10. Direcrividad de voz hurnan a en el plano vertica l

Figura 11. Sonogramas de band a anc ha y de banda angosta

2. REPRESENTACI 6N GRAFICA IDE LOS SONlDOS DEL HABLA

lor que proporciona una buena resoluci6n tem poral 0/300 s) , pero que no
permite observa r los arm6nicos individuales de una serial periodica. Los sono
gramas de ban da angosta poseen no rrnalmente bandas de 45 Hz, suficiente pa
ra dist inguir los armo nicos , pero no para diferencia r ind ividualrnente los
rapidos impulsos gl6ticos. En la figura l 1 se pueden ver dos sonogramas de di
ferente ancho de banda.
N uestro ofdo puede resolver con gran deta lle y (casi) simulta nearnente los
aspectos te mporales y espectrales de un a serial acustica, como ocurre cua ndo
ofmos una sucesi6n rapida de acordes . Sin emba rgo, no viola el principio acus
tico de indete rminacion porque posee la capaci dad de activar y desactivar ra

Como los espect ros de los sonidos del habla varfan en eI tiempo -no son estati _
cos-, para estudiarlos se usan tradiciona lmente graficos cartesianos tiemp o/fre
cuencia que se denorninan sonogramas. EI problema con estas formas de
represen tacion es que, como todo sistema pasivo de analisis de ondas, depe n
den del lfrnite impuesto por el principio acustico de indete rminaci6 n. Resulta
imposible obrener sirnulta nea mente gran resoluci6n en el tiempo y la frecuen
cia . Una soluci6n de comp'romiso consiste en alte rnar son ogramas de banda
anc ha y de banda angosta . En los primeros la band a tipica abarca 300 Hz, va

248

249

E-

m
2.500
'u
c:
OJ
::J
U

i':'

LL

1000

Tiernpo (s)

Figura 12. Espectrogr ama auditivo

pida men te los. sens or es de la membran a basilar, corr igiendo asf eI an cho de
ban da efec t ivo de acuerdo a la tarea impuesta ."
Co mo ninguno de los sonog ram as tradicionales representa 10 que eI ofdo
detecta realmente, algunos autores crearon los espectrogm mas awlitivos, en los
que eI anc ho de banda de cada frecuencia de ana lisis iguala a la banda cri tica
que correspon de a su frecuen cia ce ntral (C arlson, Granstrom y Hunnicutt ,
1982) . En la figura 12 se muestra el espect rogram a aud it ivo del registro de V Ol
habl ada de la figura 11. En este caso se pu eden observa r a la vez los arrnon i
cos en baja s frecue nc ias y las transi ciones rapid as a altas frecue nc ias.
C uando se compara un registr o aciistico de voz hablada con su represen
tac ion grafica 10 primero que llama la ate nc ion es que los silencios gene ral
mente no co rresponden a los espac ios entre palab ras. Una de las mayores
dificu ltades a la hor a de ana lizar graficarnente esta c lase de sefia les es determi
nar el modo en q ue la secuencia de son idos se segme n ts en sflabas y pa labras .

Existe evidencia de espe cializaci on cerebral rel ac iona da con la per cep ciori
del hab la. Por ejernplo, se ha pro bado q ue intervienen diferen tes re giones
del cerebro en la percepcion de los son ido s del habla y en la de los son idos
ambientales en general. Si se apl ican sim ultan eamen te a los dos ofd os esti
mulos diferentes -por eje mp lo dos frases distintas- eI esurnulo h ablado pre
sente en eI ofdo derecho - que se procesa en eI h emisferio cer ebr al izquier do
es comprend ido con ma yor facilidad . Lo co ntrario ocurre en el caso de la
rnusica.
Experiencias con tom ografia cornputada y resona nc ia magnetica dem os
traron que, mientras que los sonid os ambientales y musicales son procesados
en am bos hemisferios cerebr ales, los sonid os del hab la est imulan casi exclusi
vamente el he misferio izqu ierdo. Esta caracterfstica esta na basada en la nece
sidad de rnan tener ce rcanos todos los centros involu crados en eI trat arniento
de las sefiales del habla, a fin de per mitir la detecc ion de sus pequefias transi
ciones -del orden del rnilisegundo. De otro modo, si la informacion tu viera
que viajar entre hemisferios, estas transi cione s se perde rian debido al excesi
vo t iempo invo lucrado en la cornun icacion.
A continuacion nos referimos a algunas de las caracteristicas particulares
de la percepcion del habla, que nos perrniten decodificar con eficacia los fo
nemas en una amplia variedad de situ ac iones y contextos.

Tasa de ocunencia de [os sonidos del habla


En eI ha blar rap ido pueden oc urrir 30 fonemas por segundo. Liberman espe
culo que esta rasa supera la resolu c ion temporal del siste ma aud it ivo (Liber
man, A. et aL, 1967). Sin embargo, la ev idencia recien te ind ica que es
posib le ide ntifica r secuencias donde cada fon ema dura apena s 10 ms, a una
rasa de oc urrencia de 100 fone mas por segu ndo . A esa ve loc idad no se perc j,
be cada eve n to por separado , pero se pue de seguir aud it iva me n te eI patro n
sonoro globa l.

Variaci6n de [os datos acttsticos

3. C A RACTERISTICAS PARTICULARE S DE LA

PERCEPCrON DEL HABLA

A un que eI tema sigue siendo mo ti vo de co nt roversia en tr e neurologos y


lin guist as, es probable que en eI ser hu mano h ayan evoluc ion ado mecanis
mos espec iales dedicados a la percepci6n de los sonidos propios del habla.

La percepcion del mismo fonema puede estar de ter mi na da por d iferen tes da
ros acust icos. Por ejernplo, un a consorian te fricat iva "acomoda" sus bandas
de ruido de acuerdo con la voca l que la sucede: vocales diferentes dan lugar,
inevitablemente, a difer en tes tr an sicion es en tre formantes. Una sola tran si
c ion de la serial acu st ica puede con tener informac ion sobre varios fon emas
vec inos.

4 EI control activo de la membrana basilar se via en el capitulo I, puma 4.

250

251

Modo lingiiJstico
N o h ay un continuum en la percep ci6n de los son idos del h abla , la percep
cio n es dic ot6m ica. En gene ral, los son idos son pe rc ibidos co mo lingu isti
cos 0 como no lin gufsticos, Se pu ed e activar el mod o lingu fsrico dandole
cie rtas instru cciones a l oyen te, pero un a vez ac t ivado es mu y d iffcil rever
t ir el pr oceso.
Una de las co ns ecue ncias de esta caract eristica de la percepci6n del
h abla es nu estra incapac idad par a oir los sonidos propios de l lenguaje en
terrninos de sus parametres acust icos . Los perc ibimos co mo un a corriente
unica d e pa la bras y las de scr ipciones "a ciist icas" son , cas i siempr e, confusas.
Pa ra lograr un a audic i6n limpia de los dato s ac ust icos es ne cesar io a islar ca
d a fonema y sacarl o de co ntex te . S6 10 a partir de ese momen to se desacti
va el mod o lingufsti co.
Results cas i in necesa rio menc ionar la impo rta ncia qu e tie ne esta ca
racteristi ca en la percepc i6n de canc iones y piezas lfricas, en las que coex is
ten elementos pr opios del mo do linguistico (e l te xt o ) y no linguistico (la
rnusica ). ___

Tran siciones

de las forrnante s

.~

"u
u:

Una
de
estas

Q)

: Regimen estacio nario :

de la voca l
:
:........,, '
,
~ :
: Form ante 3
{
,,
''
.

. Forrnante 2

, Formante

T1empo
Presentaci6n normal (di6tica)

"'--:
:~

{~

''

Percepci6n dual
En la decada de 1970 Rand realiz6 por primera vez un experimen to qu e de
mos tr6 la existencia de 10 qu e se con oce co mo percepci6n dual (Ra nd , T. c.,
1974). Mas adelante, Liberm an perfeccion 6 la ex per ienc ia de Rand de la si
guiente man era: se presenta a un o fdo la parte de la sefial prop ia de una sfla
ba a la cual se Ie ha q uitado la transicion del tercer forrnante, y al ot ro la parte
esta t ica del tercer forma n te mas los dos prim eros forman res co mpletos (Libe r
ma n , A. , 1995). Los oyentes dicen percibir la silaba co mp leta en el primer 01
do y s610 un corto zumbido en el otro, En la figura 13 se ap rec ia la de scripcion
esq uernat ica de d ich o ex perirne n to .
Segun Liberman , los resultados ob ten idos indican qu e existen m6dulos
separados qu e pro cesan , por un lado, los sonidos del habl a y, par otro, los de
mas sonido s. Est a co ncl usion co ncuerda co n los dat os ob te n idos a partir de la
obse rvac i6n directa de la actividad co rtical dur ante la aud icion.
Una de las con secuencias in teresa n tes asociadas a este fen 6m eno es qu e
se viola el principi o de separaci6n espaciol que sostiene qu e un elemento ac us
t ico dad o no pued e ser asign ado a mas de un a fuente a la vez. Pare ce que el
meca n ismo de per cepci6n lin guistico es tan poderoso que, bajo ciertas cir
cunsta ncias, permite agrupar ele me ntos ac iisticos aun cuando estos pro ven
gan , 0 aparenten pro ven ir, de fuentes diferen tes .

252

Base
(a un oido)

Transicion es aisladas
(al otro oldo)

Presentaci6n dic6tica

Figura 13. Esquema del experirnento de Liberman sobre la percepcion dual

Integraci6n audiovisual
A l decod ificar un mensaje habl ado Ie presta rnos ate nci6 n a un a gra n ca n t i
dad de d ato s no aciis t icos . Los mov imientos de la cabeza, de las manos y, en
particular, de los labios del hablante puede n influir sign ifica tiva men te en la
percep ci6n del habla .
Es in te resan te mencionar aqu f un experi rnen to en el que se presen ta
un vid eo co n el a ud io modificado a un gru po de espec tadores (M cGurk y
MacD o nald, 1976 ). En la image n apa rece un locu tor di c ien do "t a ta" jun
to al audio del mismo locu tor pronunciando la pa labra " ma ma". Los ove n
res di cen ofr "n ana", sin expresar riin guna d ud a -oyen "nana" con
cla ridad-, y se so rpr e nde n a l o ir el aud io aislado, libr e de toda in formaci6n
visual.

253

Percepci6n cQteg6ricQ
U n a consecuencia de la percepc ion en mod o linguisti co es nu estr a capacidad
par a ubicar cada fonema en un a dererrnin ada cat egorfa ind ividu al. C ua ndo
varia de man era cont in ua algun par ametro acust ico de la sefial, por ejernp lo la
frecuenc ia de una formante, n o oimos un a serie de pequefios cambios grad ua
les, sino que pe rci bimos saltos "cuan t icos" en tre un fonem a y otro. Este fen o
meno se denom in a percepci6n cQteg6ricQ y no oc urre usualm en te con los
son idos arnbienta les. No se d ist in guen los ca mb ios aciisticos de la sefia l cuan
do estes caen en la misrna categorfa, pero se percib en com o mu y grandes si
provocan un salto de ca tegorfa. La percepc ion categ6rica se nos present a co
mo evide n te c uando trat arnos de co mprender un discur so en un a lengua qu e
no dorninarnos co mpleta rnen te: las con fusion es frec uentes se deben a un a in
suficien te co rnpete nc ia respecto de las ca teg orfas fon ernicas de esa lengua,
La percep c ion de vocales est aci onarias es m uy d iferente pues los peq ue
fios ca rnb ios ffsicos son perc ibidos con faci lida d . Segun Liber man, est o oc urre
porq ue las vocales ais ladas estan mu cho menos cod ificadas y se las oye co mo
son idos co rr ien tes, no ca tego rizados lingufsticam en te. N o obsta nte, las voca
les de n tro de un a sec uenc ia del ha bla se comportan de mane ra sim ilar a las
co nso na n tes, es decir , de rnan er a a ltarnen te cod ificad a.
U n ejern plo de percepci6n codificada y categorizada de son idos n o pe rt e
nec ien tes al h abla es la percepci on de las alt uras musicales en un siste ma es
ca list ico dete rrninado . En rnusica to nal, las funciones arrnon icas tarn bien
esta n a lta rnen te ca tegorizadas .
Ex isten tr es hi potesis principales elaboradas para ex plica r la percepci6n
ca teg6 rica . En la prirn era, P isoni co ns idera que la me moria aud itiva para los
patrones acust icos de las co nsona ntes decae rap idam ente y que cuando debe
rian ser p rocesados en la iden t ificac ion acust ica del fon ema ya se h an per d i
do : la discr iminacion fina de l est frnulo dentro de est a categorfa de fon em as es
imp osib le (Pison i, D. B., 1973). Par a fonemas mas largos e in tensos, como los
de las voca les prolong adas, los pa trones ac ust icos pueden ret enerse en la me
mor ia aud it iva por perfodos mayores, pud ien do reali zarse sobre ellos operac io
n es de discrim in acion similares a las ope radas en los son idos en gene ral.
En la segunda h ipot esis K. S te vens sugiere que las ca tego rfas y los lim ites
en el h abla han evo luc ionado co n el fin de ex plota r la sens ibilidad natural del
sistem a aud itivo (Steven s y Blumste in , 1981) . Esta hipotesis n o da cuen ta de
mu chas de las operac ion es carac terist icas necesarias para la apa rici6n de la
percepcion categ 6rica.
U na tercer a h ip6tesis, formulada por Kuhl, conside ra que la percep c i6n
ca teg6rica surge de la expe rienc ia co n el prop io len guaje (Kuh l, P. K., 1993 ).

254

C uand o aprendemos a en tende r las palab ras de un lenguaje part icular, presta
mos atencion a las diferencias ac usticas que afecta n su sign ificado e ign oramos
las que no 10 afecta n . U na vez que ap rendernos a distinguir en tre ambos gm
pos, n os c uesta o fr las diferen cias ac usticas que no atafien al sign ificado . Esta
explicacion da cuenta de la dificu ltad para ofr diferencias en tre fon emas en un
len guaje no fam iliar. Kuh l enco n tro que los n ifios n acen con h abi lidades rele
van tes respect o dellenguaje que parecen depender de me cani smos gen erales de
la percepcion aud it iva: no responden de man era espec ffica a una lengua en par
ticular. Pero a los seis meses la percepci6n de los bebes ya esta polar izada por la
exposicion a un a lengua espec ffica. Kuh l propu so la teorfa del magne tismo del
l.enguaje nativo, en la que la ex pos ic ion a un a lengua en particular resulta en la
form acion de representaciones almace na das de catego rias foneticas, que gene
ran "prototipos" de cada ca tego rfa. Los prot otipos acni an com o ima ne s percep
tua les: la percepc ion cat egorizada es un a co nsec uen cia n atural. La teorfa de
Kuhl es co mpa tible con la hi pot esis de que el cerebro funciona co mo un siste
ma qu e opera en la Frontera del caos .

4. M ODELOS DE PERCEPCI6N

DEL H A BLA

Teorfa mot ora


Esta teorla estab lece que los obje tos de la percepc ion de la palabra son trata
dos com o gesto s fon eti cos del h ablante, repr esentados en el cerebro como co
mandos de movi miento in variantes relacionados con ciertas configurac ione s
ling uisticas sign ificativas (Liberman y Matti ngly, 1985) . Este s gestos no se
rnanifiestan d irect arnente en la serial aciistica.
El modelo es in completo pues no especifica co mo se logra la tr ansforrna
cion ent re la serial ac ust ica y los gestos percibidos. Seg un Klatt, "es mas un a
filosofla que un a teori a de la percepc ion del h ab la" (Klatt, D. H ., 1989) .
Teorfa de los ra sgos in variantes
A su vez, Stevens y Klatt defienden un a teoria en la que la percepci on se da en
un a serie de etapas que incluyen un conjun to de det ectores fon et icos (Klatt, D.
H., 1989). La primera eta pa oc urre en el sistema audit ive perifer ico (filtrado, su
presion lat eral, adaptacion y sens ibilidad a la fase) . La segunda con sta de un a ba
teria de detect ores aciisticos (det ec tores de ataque, de cambio espectral, de
formantes y de period icidad) . La tercera etapa la for man un a serie de det ect ores
de rasgos foneticos y sus decision es son especfficas de un a len gua deterrninada.
255

Finalrnente, aparece n eta pas de ana lisis de segmen tos y busqueda de lexico .
Este mod elo esta basa do en la suposicio n de que es posibl e encon trar un
mapeo relati vam ente in vari ante en tre los patrones ac usticos y los soni dos de l
h abl a. S us det ract ores sefialan el caracter in evitabl emente sec uenc ial de las
operac iones inv olu cradas.
Modelo de red n euronal
EI mod elo de McClell and y Elma n es co nexionis ta y esta basado en las teor fas
de las redes ne uro na les (McClella nd y Elman, 1986) . Asum e q ue existen tres
n iveles de represen tacion , cada un o de los cuale s co ntiene unidades de proce
samiento alta rnente interco nectadas llamadas nod os. En el nivel mas bajo, los
nodos represen tan rasgos foneticos, en el siguiente representan segmentos fo
n et icos, yen el ultimo nivel representan palabr as. Por eje rnplo, el nodo corres
pondiente a un fonem a especffico puede d isparar h acia dos 0 tres nodos
correspon dientes al nivel de los rasgos asocia do s normalrnente co n di chos
fone mas. La ac tivaci6n excitato ria 0 inhibitor ia puede f1uir en ambas direccio
nes, desde niveles mas bajos h ac ia otros mas elevado s, 0 viceversa.
Este modelo perrnite ex plica r varios aspectos de la percepc i6n de l h abla,
tales co mo la resta uraci6n percep tiva de fonemas "perd idos", la percepci6n ca
tegor izada y la armon izacion de dat os. Es un o de los mod elos compatibles co n
la teor ia de la percepcion caot ica ,

5. LA BUSQUEDA DE

INDICADORES ACUSTICOS INYARIANTES

Cole y Sco tt nota ron que la percepcion del habl a in volucra la identificaci6n
sim ultanea de , al menos, tres tip os de datos cua lita tiva rnen te diferen tes: indi
cadores aciisticos invarian tes, indicad ores de pendientes del contexte e indica
do res asentados en la envolve n re dinamica de la onda (Cole y SCOtt, 1974).
En o tras palabras, cada sflaba contiene da tos in variantes y datos depe nd ientes
del co n texte. Ex iste ev ide ncia de qu e la envoiven te dinarni ca de la on da pro
vee in formacion sob re la co rnposicion fonernica de la serial y de que, en cier
to grado, el siste ma auditive esta capaci tado para decodifi car los estirn ulos de l
h abl a basa ndose un icam ente en las varia cio nes de la amplitud en el tiernpo.
La naturaleza mul tidimensional de la informacion aciistica permi te un alto ni
vel de redundan cia en la seria l del habl a. C oex iste n diferentes datos q ue per
m iten la iden tificac ion de un fonem a determinado , aunque co n uno so lo de
ellos se 10 pueda reco noce r. La redundancia sirve para supera r las arnbigueda
des inherentes a l disc urso hablad o, para minimizar la inf1uenci a del ruid o y de
256

las interferencias, para compensa r las d isto rsiones de la sena l (por ejernplo en
un a linea tel efonica) y par a supera r la ma la articulaci6 n de un locu tor.
R esistencia del habla fr cnte al deterioro de la serial
Es remarcabl e la resistencia del habla fre nte a varias forrn as de distorsion se
vera. Los met odos de testeo de artic ulac ion las h an ca raloga do en : cantidad de
ruid o de fondo , ca mb ios en el espectro d e frec uencia y recorte de picos.
Cantidad de ruuio de fonda. La inteligibilidad de sflabas aisladas resulta sa
tisfactoria co n un a relac ion sena l/ruido (SiR) de +6 dB. Sin emba rgo, las pala
bras resultan inteli gibles aun para rel aciones SiR negativas si integran
sente nc ias bien fonnadas, en particul a r si el oye n te esta farniliarizado co n el
tem a, 0 si el h abl a y el ruido prov iene n de lugares diferentes.
Cambios en el espectro de frecUencia. Se ha dem ostrado qu e, co n tra la afir
maci6n tradi cion al, no h ay co m pone n tes en frec uencia esen ciale s para la co
municaci6n. Se puede cortar un a serial de habla co n un filtr o de banda
pasante de a 1.800 H z, de 1.800 a 20 .000 H z 0 de 1.000 :J. 2.000 Hz, y no per
der mucho en intel igibilidad .
Recotte de picos. S i se coloca un ci rcuito que reco rte la sefial de entrada al
2% de su arnp litud pro med io queda un a onda casi rect an gular de per iodo varia
be y se pierd e la infonnaci6n aportada por la forma de on da origina l. Sin em
bargo, se ob tiene n tasas de articu lacio n ent re el80 y el 90%: son necesar ios solo
dos bits para cod ificar la amplitud sin perde r casi nada de inteligibilidad, Por su
puesto que el son ido no result a "na tu ral" y es imposible reconocer al locuto r.
En resum en, el siste ma de co municaci6n human o ha evo lucio nado de tal
forma que pued e operar bajo un a gran variedad de con diciones adversas. Sin es
tas capacidades el telefon o n o ex istiria, 0 serla ext rao rdina riame n te complejo.

6. INTELIGIBILIDAD DE LA PALABRA
La inteligibilid ad del disc urso se refiere a la exactitud con que un oyen te pro
medio puede entende r un a palabra 0 un a frase h abl ada. En un a situac ion n or
mal parte de la informacion se ex trae de l co ntexto y de las sefiales visua les que
acompafian a la fon aci6n y, po r 10 tan to, es posible entender el sign ificado in
clus o si solamente un a fracci6n de las un idades ac usticas d iscretas se oye co
rrectamen te. En otros casos el oye nte queda limitado a valerse unicamente de
la informaci 6n ac ust ica, co mo oc urre en los siste mas de co rnunicacio n no pre
senc iales, por eje mp lo el telefono 0 las gra ndes salas en las que se emplea re
fuer zo electroacustico.
257

Un fonema es inteligible cuando se 10 oye de forma clar a y puede ser di


feren ciado de l resto de los fonemas de la misma lengu a. La misma definicion
puede aplicarse a un discur so art iculad o, aunque aqui acnian factores contex
tuale s de irnportancia.
Veamos prim ero que ocurre con los fon emas a islados. En este caso el pun
to crftico en cuanto a la inteligibilidad son las consona n tes, pues al ser mas
debil es que las voca les se pueden enmascarar con mayor facilid ad.

100
Silencioso

90
<f)

l"

.0

'"
'"

80

-o

70

'iii

Ruidoso .

..

-0

'(3

'"

:;
o
t

Ensayos de articulaci6n

''""
'"
~
'"

60

-0

La in vestigaci 6n en esta area com enzo con el desarroll o de los sistemas telefo
nicos a fines del siglo XIX y de la radiofon ia a princip ios del xx. Los primero s
intentos para definir numericarnente la inteligibilidad fueron los ensayosdear
ticuiacum, que cons isten en pruebas de ca mpo en las que un locutor lee un
conjunto de fonemas 0 palabras de una lista confeccionada al azar. Para evitar
la influencia de elem entos no fone ticos, las secuencias ca rece n de sentido lin
gufst ico y las sflabas estan ordenadas de manera estocastica. Es habitual el uso
de listas estandarizadas para permitir la comparaci6n entre en savos.t Los oven
res, distribuidos en la sala de una manera prede terminada, an otan los fonemas
o pal abras que creen ofr, El result ado del test es el porcentaje de pal abras co
rrect as -que coinciden con la lista original- para cada oyente. Ademas de los
factores acust icos especific os que analiz aremos mas adelante, los en sayos de
articulaci6n son muy sensibles a las caracteristicas par ticulares de cada locu
tor y de cad a oyen te. En las figuras 14 y 15 se pueden ver los resultados obte
nidos a partir de dos grupos de locutores y oyen tes (Beranek, L., 1954).
Una caractenstica a destacar de los ejemplos an teriores es la not able dis
paridad en la resistencia al ruido que presentan las voces de los diferentes 10
cutores. En las mismas condiciones de ruido intense, el prim er locutor de la
figura 14 se comprende correctamente, mientras que el ultimo de la lista re
sulta absoluta mente ininteligible.
La rasa de art iculaci6n se puede con siderar una med ida valida de la inte
ligibilid ad , que es aplicable iinicarnente a cada caso parti cular. El valor es re
presentative de la sala en la que se reali z6 el en sayo y de las caracteristicas del
locutor y de los oyentes que participaron en el,
En condicio nes acusticas 6ptimas la art iculac i6n cas i nunca supera el
95% de respue stas correctas. Afortunadamente, un discurso art iculad o puede
comprenderse aunque algunas silabas resulren ininteligibles porque el oyen te
extrae el sent ido del contexte. Por esta razon, una rasa de articulaci6n del
5 En idioma ingles se util iza la lisra de fin ida en

258

el "H arvard P.B.50 word score".

50

~
0

40
[
i

,
3

Lcicutores

Figura 14. Resulrado de un ensayo de articu lacio n de palabra a partir de cuatro locutores
diferentes

Figura 15. Resulr ado de un ensayo de art iculac i6n de palabr a obten ido co n siete oyenres
ubicados en la misma pos icion. El locutor fue siempre el mismo

259

80% permite co mprende r el discurso sin esfue rzo. C ua n do baja al 70 % los


oyen tes deben co nce ntrarse co n esmero pa ra entender las sen ten cias y, por de
bajo de l 60 %, en la m ayor fa de los casos la in teli gibilidad resulta ins ufic ien te.
Los ensayos de articulacio n , a un q ue brindan va liosa in formaci on sobre la
in te ligibilidad , so n mu y cosrosos en ti em po y recursos, y en algunos casos pue
de n resultar imposibl es de reali zar. En la ac t ualidad se usan principalm ente pa
ra ve rifica r los modelos d ura nte el de sarro llo d e metod os ob je tiv os de
med ici6n y predicc i6 n de la inteli gibilidad .

Medi cion indirecta y predic cion de la inteligibilidad


Ex isten varios metodos d ispon ibles pa ra predec ir la in tel igibi lid ad de h ab la en
un sistema de co mun icaci6 n 0 en el in te rior de un a sala. C ada un o de esros
met od os se basa en el m ismo pr incipio fund am ental , qu e co nsi ste en h all ar al
gun a relacion entre la serial del h ab la y el ni vel del ruid o que la in terfiere en
el can al de co mu n ica cion , En esta relacion intervi enen los sigu ientes factores
me nsurab les: el ni vel y o tras carac terfstica s aciisticas de la sefial em itid a, e l
n ivel y co mp osici6n esp ec tra l del ruido de fon do, y la naturaleza del can al de
com un icac i6 n 0 de la sala .
En un en torno tranquilo, un a conversac ion produce un n ivel de presion
son o ra entre 55 y 65 dBA medidos a I m de l locutor, aunque en situac ion es es
peci ales el ni vel p ued e alcanza r 96 dBA. Como los ni veles varian sign ificativa
mente en tre individu os, pa ra el d isefio de siste mas de co mun icac ion se ut ilizan
los casos mas desfavo rables en lugar de los ni veles promed io. La tabla 1 presen
ta los valo res estandart izados para el disefio de sistemas electroacu st icos en
grandes salas pa ra pro sa. Cad a va lor se obtiene restando un desvfo est and ar al

prornedio.
Tabl a 1

Esfuerzo vocal

Se enco ntro q ue un d iscurso gritado es mas d iflci l de en tende r que uno a n i


veles medios, al margen del n ivel ac iistico fin al en el o fdo de los oye n tes . Es
te efec to de sobrecarga, q ue ya ana lizamos en este cap ftu lo , se debe a los
cambios en los t ransito rios del ataq ue y en la ento na cion de las forrnantes de
la serial. Para sirnp lificar los ca lculos la sob reca rga se suele tr atar de la siguien
te man era: en pr imer lugar, para altos n iveles de ernision se reduce la razon se
fial-ruido permitida en el canal un valo r de -4dB cada vez q ue la serial supera
en 10 dB el valo r base de 75 dBA (rnedi dos a I m del ernisor) . En segundo lu
gar, se asume qu e los ni veles de ernision co mprendidos entre 45 y 75 dBA que
no llegan a los oyentes con valo res super io res a 80 dBA no requieren correc
cion po r sobreca rga .
En to do cana l aciistico h ay siemp re cierto nivel de ruido de fondo. EI
efec to mas o bv io de l ruido de fond o es en masca rar la serial del habla, C uanti
ficar este efec to es diftcil dadas las d iferen tes situac ion es posibles, pero co mo
esta nda r de d isefio se co ns idera q ue ca da deci bel de ruido que se agrega por
en cima de un ni vel base de 45 d BA debe co mpensarse co n un aumento de 0,6
dB en la sefial h ablad a.
La n at ura leza del canal de cornun icacion tarnbien pue de afecta r de cisi
va rnente la in teligibil idad del d iscurso h ab lad o . S u in fl ue ncia, be ne ficiosa 0
pe rjud ic ial, se p uede e val uar a pa rt ir de la respuesta al impulso del canal. Si
se t rata de un a sala exis ten dos fact o res q ue se ana lizan por separado : el pa
tr on de refle xiones y la reverberacion . En ge neral, el recin to re alzar a la in
teligibilida d cu ando proyec te cie rta ca n t ida d de ene rgfa de ntro del per fodo
de integraci 6n del di sc urso (de 35 a 50 rns). Dado q ue el ru ido de fondo se
distribu ye de mane ra un ifor me e n el tiernpo, toda reflex i6n temprana mejo
rara la rel ac ion seria l-ru ido del sistema . S in emba rgo , las reflexiones tard ias,
los ecos y un a re ver ber ac io n e xce siva inte rfie ren con la serial y tienden a re
duc ir la relac i6n sefial-ruido del ca na l, det erio rando la inteligibilidad d el
d isc urso .

dBA

Re!aci6n seiial-ruido
S usurro
S uave
Relajado
Norm al (p rivadc )
Normal (p ublico)
Voz levan rada
Int cnso
Muy int ense
G rito
Max imo

260

32
37
42
47
52
57
62
67
7Z
77

Prob ablemente sea la mas simp le y senc illa de las relac iones que se usan para
med ir la inteligibilidad. Se la define co mo la resta entre el pro med io de largo
tie rnpo, 0 ni vel sonoro continuo equ iva lente , de la serial del h abla en el pun
to de recepc ion (LA eq. " iiul) Y el n ive l promedi o de largo tie mpo del ruid o de
fondo (LA eq. ruido)' Ambos n iveles se miden en dBA:

Relaci6n seiiai-ruuu: (SR) = LA eq. seiial - LAeq

n,ido (dBA)

26 1

Las med ic iones de in teligibi lid ad del discu rso conforme a la re laci 6n sefia l-rui
do reali zadas po r Brad ley sugiere n un a meseta de ni velaci6n po r en cima del
va lor S R = + 15 dBA. En o rras palab ras, me jo rar el sistema m as alla de este va
lor n o aurne n ra la in teli gibil idad del sistema. El defe ct o de este fndice es q ue
n o contemp la la na tur aleza ac ustica de l canal de comun icaci6 n: relaciones de
S R 6pt imas pueden co rrespo nde r a un a in te ligibilidad deficienre si, po r eje rn
plo , la sala prese n ta un ec o desrac ad o.

[ndice de articulaci6n (Ai)


EI prime r estudio siste ma t ico y profund o sobre la inteligibil idad de l h abla fue
realizado po r H arvey Fletch er d urante la de cada de 1940 en los Laboratori os
Bell. Flet ch er y su eq uipo , a pa rt ir del estudio de la relac i6n sefial/ruido de ca
da banda de un terc io de oc tava , cre a ron el iiuuce de articulaci6n (AI) , un ex
ce le n te rne todo pa ra eva lua r los efec ros de l ruid o en la inte ligibili dad .
EI AI es basicame nr e una med ida de la in te ligibilidad basad a en e l coc ien
te serial/ruido en c inco bandas de oc tava. EI calculo del A l co ns iste en tres pa
sos basicos: medi ci6n del cocien te sena l/ruido eficaz pa ra cad a band a de
oc tava, ap licaci6n de un facto r de co mpensaci6n tabulado para cada banda y
ca lculo del valor med io . La siguien te ecu ac i6n sintet iza el procedim iento:

Al

G(i}

30dB

.=1

=- - L

(LA eq . seiial - LA eq

ruido +

12) dB

e n la q ue el fact o r de co mpe nsa ci6n G r,] va le:


Frecuencia(Hz)

G r,}

250

0.072

500

0.144

1000

0.222

2000

0.327

4000

0.234

EI Indice de art iculac i6n no es sensible a los cambios en la reverberaci6n y a la


presenc ia de distorsion tem poral en el camp o aciistico, factores q ue sf co ntern
plan los ensayos de art iculacion. Por ella se lim ita su aplicac i6n a ca mpos aciisti
cos sin defec tos ostens ib les y con un tiempo de reverb eraci6n maximo de 0,5 s.
262

Dur ante varias decad as, el AI y los e nsayos de articulac io n fueron los uni
co s met odos cap ace s de evalua r la inteligibil idad del ha bla. Se sabla q ue el ri
po y la complej ida d de la serial de pru eb a (pa labras art iculadas sin se n tido
contra palabras cone ct adas en un a sen te nc ia signi fica tiva ) tien en un irnpact o
importante en los result ad os. S in e mba rgo, la ac ust ica de esos ti empos n o po
dfa diferenciar c uan ritat ivarnenre ent re las dos secuencias. Tampoco inclu ia
elemen tos prop ios del canal de co mun icac i6n, co mo el patron de reflexion es
o la re verbe rac io n , ni co n te mplaba algunos efec tos psicoac iisticos rele vantes
co mo el en rnascararn iento . Era necesario h all a r o tro merod o de evalu ac i6n
q ue superase estas lirnitaciones.
[ndice de transmisi6n de la palabra
Introduc ido por Steen ek en y H ou tgast , e l fndice de transmisi6n de fa polabta
(STI )6 es basicarnenre un a ve rsi6 n mej o rada del In di ce de la art iculac i6n
que in cluye las d isto rs iones te mp o ra les e n el ca na l d e co m un ica ci6n (S tee
neken y H ourgast , 198 0 ). El STI se basa e n las ex pe rienc ias de det ecci 6n de
modulac i6 n desc rip tas e n e l pun to 3 del ca pit ulo II. Las seria les del h abla se
co ns ide ran como un flu jo de ene rgia co n va riac io nes espec tro-te rnpo rales y
el grad o de prese rvaci6n de estas va riac ion es a t raves del ca na l de co rnun i
ca c i6n se to rna co mo un a med ida de su fid elida d . Los autores argumen taro n
q ue la conse rvaci 6 n de la envo lve n te d in arn ica impl ica la prese rvaci on d e
sus compo n en tes de Fo ur ie r en el p unto de recepc i6 n. EI n ive l co n ti nu o
eq uiva len te de la sefia l del hab la es sust it uido po r un a seria l teo rica de prue
ba, c uya intens idad es modulada por un a func i6 n s in uso id al co n un Indice
de la modul ac i6n m = 1. C ua lq u ier degr adaci 6 n de la se ria l e n e l ca na l de
comuni caci 6n apa rece ra co mo un a red ucci 6 n en e l fn d ice de la mod u la
c i6n e n el p unta de recepci on . Steene ke n y H ou tgast aco ns eja n el e rnp leo
de seria les mo d uladoras de frec ue n c ias co mp rendi das en tre de 0 ,4 y 20 H z
pa ra repres e n ta r el grade de in tel igibi lid ad a tod as las tasas de oc urrenc ia
del h ab la .
S i f rep resenta la frecuenc ia de la serial modul adora y t es el tiem po en se
gundos, en tonces la inte nsidad de la sefial de pru eb a es modul ada por la fun
ci6n 1 +cos(2n ft ). El fnd ice de mod ulac i6 n en el pun to de recepci6n es
fun ci6n de la frec uenc ia y se ca lcula co n la siguien te ex presion , q ue se dedu
ce de la repuesta di screta al imp ulso entre los ex tre mos de l ca na l:

Del Ingles Speech Transmission Index.

263

L.J

a ( -j nf ~)
n

rn2

m( f ) = - - -
an

L
n

r;

Usando mediciones empfricas de las sefia les reale s de prueba, es posible medir
el STI de cualquier sala 0 siste ma de co mun icac i6n. Si se reduce el numero de
bandas de octav a se pu ede construir un sistema mu cho mas sencillo y rapid o
denominado RASTI,7 qu e permite determinar la inteligibilidad del habla en
tiempo real.

Perdida de articulaci6n en consonantes


en la qu e c es la ve loc idad del son ido y rn la trayectoria entre el em isor y el re
ce pto r. S i se desea incl uir el efec to del ruido de fondo se la deb e rnod ificar de
la siguien te man era:

L
n

Is an

r;

m'(f)=m(j) - - - -

IsL~+ l R
n

r,;

aquf Is es la inte ns idad promedio de la serial del habla en el punta de recep


c ion e l R la intensida d del ruido de fondo.
En esta fun ci6n se manifiest an los efectos del patron de reflexiones y de
la reverb er aci6n. Ta mb ien es posibl e deducir de manera senci lla un coc ien te
sefial/ruido aparen te:

(S/R)ap = 10 log ( m (f) )


,
I-m(f)
Si se recorta cada coc iente individu al a un valor limitado entre + 15 y -15 dB,
se ca lculan las relaciones SIR apare n tes por bandas de octav a y se prom edi an
los va lores de las 14 band as in volu crad as, queda:
14
--

(S/R )ap

ocr. I

(S/R)ap = --14.

El Ind ice de tran srnision de la palabr a (STI) representa un a razon lin ealizada
de la forma:

ST1= (S/R)ap + 15

30

264

Como la inteligibilidad de la pal abra depende en gran medida de la audi ci on


correcta de las co nso na n tes, a veces se emplea un Indice denominado per-dida
de articulaci6n en consonantes (% A lco ns ) qu e se ca lcula unicamente en la ban
da de 2.000 H z. Es un Ind ice apro p iado para pred ec ir la inteligibilidad por
software durante la eta pa de disefio de un a sala. Por eje mplo, a distancias rna
yores que el radi o de reverb er aci on, la pe rd ida de articulac ion en consonantes
se calcula de la sigu ien te ex presi6n:

%A lcons = 9 TR ~
i -a
en la qu e TR es el ti empo de rev er ber aci on globa l en segundos, S es la su
perficie interi or total de la sa la y a es el coe fic ien te de absorcion medio d e
la sala.

Ayuda visual
Se sabe que la lectura de los labi os perm ite que las personas hipoacusicas par
ticipen en un a conversacion. Las personas con ofdo n ormal tambien se bene
fician con la info rmac i6n v isual y, si b ien no les perrn ite la comprensi6n
completa del discurso h ablado , la reconstruccion fonetica en presencia de rui
do se facilita al obs erva r el rost ro del locutor.
Se h a co mpro ba do qu e la informaci6n lin gufstic a se comprende mejor
cuando se la tr an sm ite por television qu e por radi o (Reisberg y McL ean ,
1987). Macleod y Sum me rfield encontraro n que el "beneficio de la lectura de
labios" corresponde a un aume nto promedi o de 11 dB en la relaci6n sefial-rui
do del sistema y O stberg probe qu e el tarnafio del monitor de video tambien
contribuye en el m ismo sen tido (M cLeod y S umme rfield, 1987). Estas ob ser
vacion es confirman la idea intuitiva de que la informacion visual contribuve
7

Del ingles Rapid Speech Transmission Index.

265

100
so

ro

Apendice I
Teorema de Fourier

80

<:;

i!'

"
0

"'
ro

60

(iJ
<J)

:J
o,

co

40

<J)

-0
<J)

'ro

20

C
<J)
~

0..

-l
-30

-20

-10

Relaci6n Senal! Ruido (dB)

Figu ra 16. A umento de la inteligibilidad en condiciones de ruido al agregar infor macion

visual

a rnejorar la in telig ibilidad, sobre todo en condicio nes adversas provocadas


por la existe ncia de ruido en el cana l de comun icacion .
En la Figura 16 se observa el result ado del expe rirnen ro de Ben oit , en el
q ue se midi6 la inteligibilidad en funcion de la razon sena l/ruido en dos sit ua
cio nes diferentes: s610audicion y audic ion mas vision (Benoit , C. et al., 1994).
La vision es innecesaria en condiciones acusti cas optirnas (SIR > 0 dB),
pero resulta decisiva en condicione s aciist icas alta mente degradadas (SIR = -24
dB) en las que la informacion auditiva no alcanza para entend er el discurso lin
gufstico.

El teorema de Fourier se puede en unciar de la siguien te rnanera: "Toda funcion


period ica de perfodo P puede descomponerse en una suma de sinusoides arrno
nicas, de amplitudes y fases adec uadas, cuyo primer arrnon ico 0 fundamental
posea perfodo P".1 En otros terminos, un a suma de sin usoides armonicas gene
ra una onda periodica cuyo perfodo co inc ide con el perfodo de la sinusoide de
menor frecuen cia, llamado primer arm6nico 0 fundamental de la serie. El teore
rna permite descomponer y analizar cualquier funcion periodica y habilita la
posibilidad de cons truir sefiales periodicas complejas a partir de un a suma de
sinusoides puras.
Record emos que un a sucesio n es armonica cuando presenta una base y to
dos sus mult iples. Es un caso particular de sucesion arit rnetica en la q ue la ba
se ao coinc ide con la razon k (an = aa + n k con k = ao) Por ejernp lo, un a
sucesion arrnonica de base 5 es: 5, 10, 15, 20, 25, ... , n x 5; y una de base 300 :
300, 600, 900, 1200 , ... , n x 300. La diferen cia entre dos valores sucesiv os, 0
raz6n de la sucesion arrnon ica, es igual al valor de la base. Asf en el ultimo de
los ejemplos 1.200 - 900 = 300; 900 - 600 = 300, etce te ra.
La disposicion de las amplitudes y frecue ncias de las sin usoides involu cra
das en la suma se denom ina espectro de Fourier, y cada una de ellas toma el
nombre de componente de Fourier.
Aunque la co mplejidad de las operac iones mat ernat icas involucradas en
el calculo de los arrnon icos es grande, en la ac tualidad ex isten num erosos pro
gramas de cornputacion que los realizan con gran eficie ncia. Aun sin realizar
grandes esfuerzos mat ernati cos podemos extraer num erosas conclusione s cua
litativas que son de ut ilidad. Por ejernp lo, el teorema dice que una funcion pe
riodica posee un espec tro arrnon ico. Si te ne mos un a serial periodica y
1 En realidad exisren cierras restriccion es matematicas: las funciones deben ser secc ional
mem e co nt inuas adernas de period icas. Afortunadamenre, las que interv ienen en acustica
musical cumplen con estos requisitos.

266

267

los rnotivos de su emp leo en gra n ca n tidad de ap licaciones prac t icas. La voz
humana y algun os instrumen tos, como el v iolin 0 el oboe, generan sefia les q ue
se le aproxim an .

h = 2 mm

-l. . . .. . .

Tiempo (ms)

.s

Reconstruccion de parcia les por batid o

ro
a.
<fJ

-1

-2

'

i:

Periodo
P= 10 ms

0,64

=0,64 mm

.su

f,

'6. 0,32

f, = n f ,

.3

<l:

0,213

=1/

= 100 Hz

+-"m.u
r,
r,

f2

f3

= 100 Hz

r.

f5

Frecuencia (Hz)

f6

f7

f.

f5 = 500 Hz

f9

f,o

f,o = 1000 Hz

Figura 1. G rafico temp oral y espec rral de un a onda dien re de sierr a

conocemos su per todo , sabemos inmediatamen te : 1) que el espectro co rres


pondiente sera arrno n ico, y 2) cu ales seran las frec uencias de cada un o de los
arrnon icos (la co rres po nd ien te al pert odo de la seria l original y sus mu lt iples) .
Desconocerernos, h ast a qu e se ap lique completo el teorema de Fourier, las am
plitudes de cada un o de esos arrnon icos.
C om o ejemplo aplicaremos el an alisis de Fouri er a la fun ci6n diente de sie
rra dibuj ada en la Figura 1. El espectro resultante nos muestra que posee todos
los armo n icos posibles desde la fundamenta l ha sta el infinite . La amplitud de
cada un o de ellos va decreciendo a med ida que aum enta la frec uen cia segun la
ley A n = Ai / n, siendo n el ruimero del arm on ico, Ai la amp litud de la fund a
mental y A n la arnplitud del armo n ico numero n. Por ejernplo, el quinto arrno
ni co tendra un a am plitud A 5 = Ai / 5 , cinco veces menor que la fund am ental.
En teo ria, se deb en suma r todos los infi ni tos arm6nicos para sin te t izar
ex act arnente un a onda diente de sierra. Es esta gran riqueza armonica un o de

268

Dos sinusoides de distin ta frecuenci a baten a un a rasa igual a la difer en cia de


frecuencias entre arnbas, C omo las co rnpone n tes de Fourier son sinusoides, es
de espe rar que est e fenorneno tenga lugar para todo par de co mpo nentes ar
monicos que se consideren . S i fny i; son las frecuencias de dos armonicos
cualquiera, la frecuenci a de baudo sera fb= fro La frec uencia de batido en
tr e arrnonicos siempre va a co inc id ir co n la frecuencia de algun ar rnonico de
la serie . En particu lar, dos componentes co nsecut ivas baten a la frec uencia de
la fun damen tal. Por ejemplo fz - fl =fl; h - fz =fl; ... .i; - fn-l =fl '
La armonicid ad de un espectro refuer za la periodicidad dada por su fun
damental. lnclu so , aun que falte la fund amental, la frec uen cia que le cortes
ponde se reconstruye a partir del baudo de sus arm onicos. Este fen orneno , de
gran irnportancia musical, se co noce como fundamenral perdida 0 [axvasma de
la onda ,
Un ejemplo de reconstrucc io n de la fund amenta l se da cua ndo se repro
d uce rruisica a craves de un altavoz pequefio, incap az de rad iar ondas de baja
frec uenc ia. Como la mayor fa de los instrurnentos graves -contrabajos, fagotes
o bajos elect ricos- producen seria les espectralmen te ric as en arrnonicos, se
puede n oir los bajos de la musica porque los primeros armon icos se recon stru
yen por batido a pesar de n o esta r presentes a la salida de l altavoz. El fenorne
no de fund amental reconstruida tambien puede originarse durante el proceso
de percepci6n . Ocurre , por ejemplo , cu ando do s sefiales acce den , a tr aves de
auriculares, de manera ind ependiente a ca da un o de los otdos: en ese caso n o
exis te baudo ftsico , de rnan era que la fund amental se reconstruye en algun lu
gar de la cad ena neural de procesam iento superior.

269

Apendice II
Principia acustico de indeterminaci6n

La serie de Fourier se pued e aplicar uni camenr e a seriales perrnanentes perio


dicas cuyos espectros son siempre arm6nicos y de lfneas, N o es posible ana li
zar con ella el estado transitorio de un a serial, que se puede definir com o el
intervale temporal en el que una onda evoluciona de un estado perrnanente,
o est acionario, a otro. Asf como h ay sefiales to talmen te tr ans itori as -Ia gene
rada por el golpe sobre un a mesa es un buen ejernplo-, existen otras que pre
sen tan caract eri st icas tr an sit ori as en el co m ienzo y en la extincion ,
permaneciendo relativarnente esta bles dentro de esos lfmite s.
Por oposicion al estado perrnane n te, en el que roda oscilaci6n es una
combinac i6n de sin usoides de du raci6n in fin ita, el estad o transitorio posee
una duraci 6n finit a y necesariarnente ocurre por 10 menos al comenzar y fina
lizar una sefia]. C ualquier rnodificacion de las condiciones de oscilacion en
medi o del desarrollo de una onda , como el carnbio en la amplitud 0 la frecu en
cia de alguna cornpon ente, form a part e del estado tran sitorio. EI efecto de vi
brato, que co nsiste en una variaci6n periodica de la frecuencia y/o de la
arnplitud de aproximadamen te 7 H z, origins en much os casos la supres ion del
estad o perrnanenre en la porcio n de serial a la que se aplica. En sefiales sin es
tado perrnan ente el estado transitori o co inc ide con su dur aci6n.
J. B. Fourie r desarrollo la tranfo't1nada 0 integralde Fourier para extender el
alcanc e de sus series a todo tipo de sefiales, sean perrnane ntes 0 transitori as.
Una de las derivacion es mas import antes de la transforrnada de Fourier esta
blece q ue las sefiales limit adas en el tiem po poseen espectr os de band a. Se
puede concluir, por sirnetrfa, que los espec tros de lin eas, arrnonicos 0 no, co
rresponden a sefiales no limit adas en el tiempo.
Todas las sefiales reales, o bviarnen te limit adas en el tiempo, poseen anchos
de banda no nul os. La onda que gene ra un diapason posee una gran duraci6n
y un pequerio anc ho de band a, mien tras que la que produce un tamb or se ex
tingue rapidarnente y ocupa un anc ho de band a co nsiderable. Podemos pregun
tar por la existencia de alguna relaci6n general entre duracion y an cho de

271

iD

iD

!'!
o

!'!

o
c

51

51

,0

c
'in

-0

i"

i"

"in

0.

0.

QJ

QJ

-0

-0

~
Z

Freeuencia (Hz)

>

ti/ = oo

M= 0

ro~

iD
~

[1'

[1'

51

51

-0

-0

"in

"in

i"

i"

0.

0.

QJ

Tiempo (ms )

-0

W
>

QJ

-0

W
>

6 1= 0

iD

iD

[1'

!'!

51

51

-0

c;

-0

"in

"in

i"

i"

0.

0.

QJ

QJ

-0

-0

"z

M= oo

Freeuencia (Hz)

espec tro contendra un a sola lin ea (com o era de espe rar) . Si se anal iza un im
pu lso de duraci6n tl c -7 0, el ancho de banda tl f sera 1 divid ido (cas i) cero que
equ ivale a infiniro , Este result ado co nfi rrna qu e el espectro de un impulso es un
ruid o blanco can un anc ho de banda infinito. En el caso intermedio de un a se
fial limitad a en el t iempo -<Ie duracion fin ita- el pr inc ip ia se aplica sin incon
ven ientes. En la figura 1 se ilustr a 10 an te rior co n los di agramas temporales y
espectrales de un a sefia] sin uso ida l, de un impulso y de una serial de duraci6n
in tennedia.
El pr inc ipio ac ust ico de ind et erminaci6n irnpone un limite inferior, pe w
n o un o superi or : el produ ct o d e la duraci6n par el a nc ho de banda puede al
canzar va lores co nside rables. Par ejernplo , el ruid o en un a av eni da mu y tran
sita da posee a la vez un a d uraci6 n (tl c) y un anc ho de banda (tl j) muy gra ndes
y no vio la po r ella la relaci6n tl f X tlt ~ 1.
Es imp ortance dest acar qu e el princ ipia de ind et erminaci6n no se refier e
a un a limitaci6n en la tec no logfa de gene rac i6n de o n das 0 en el mec an ismo
de percepc i6n human e , sino qu e descri be el comportam iento fisico propio de
los fen6menos o nd ulato rios. N o ex isre la posibilidad de construir un a sefial
que a la vez este bien det erm inad a en la frec ue nc ia (pe quefio tlj) y en el ti ern
po (pequefio tlt) , cualquiera sea la tecn ologia utilizad a. En otras palabras, no
se puede co n struir un son ida tan co rto co mo el de un tambor y a la vez ta n to
ni co co mo el de un a flauta ,

61

Figura 1. Ap licac i6n del principia de indeterrninacion a diferenres senates

ba nda. De ac uerdo co n el desarro llo de Fourier las representaci on es te mpo ra


les y espec trales son dos formas de int erpretar el mism o fen 6m eno. El vin cul o
qu e las relacion a se dedu ce sin dificul tad a partir de la tranformad a de Fouri er
y se den omina principia acUstica de indeteTminaci6n. Se 10 puede en unc iar de la
siguien te rnan era: "el pro ducto entre la duraci 6n de l esta do transitori o de un a
serial y el anc ho de banda que le co rrespo n de n o puede ser inferi or a un cie rto
va lor mfnimo". S i tlf es el ancho de banday tlt la dur aci6n del estado transi
tor io, el princ ip io ac iistico de ind eterrninacion est able ce, para el caso gene ra l:
tlf x tlt ~ 1

S i se aplica la relaci6n anterio r a un a s in uso ide, co mo en ella la duraci6n tlt


tiende a infinite el anc ho de banda co rrespondiente (tl f ~ l /tlt ) sera nulo y el

272

273

Referencias bibllograficas

Ando, Yoichi (1998 ), Architectural A coustics. Blending Sound Sources, Sound Fields , and
-

Listeners, Nueva York , Spr inge r-Verlag.


et al. (199 7a), "Acoust ic Design of a Conce rt

Hall A pplying the Theor y of

Su bject ive Preference, and th e A coust ic Measurement aft er C on strucct ion",


-

Acustica & Acta Acusncc , 83 .


y Dennis N oson (199 7b ), Music and Concert Hall Acoustics, Londres, Academ ic

Press Limi ted.


- (19 85 ) , Concert Hal! Acoustics, Berl in, Sp ringer-Verlag.
Aronson, L. et al. (200 S) , "Carac te rfst icas ac usti cas de la voc ales del es pafiol rio

platense", pub licad o en in ternet po r la Fundacion A rauz.


Attneave, F. y R. O lson (197 1), "P itch as a Med ium : A New A pproach to
Psychoph ysical Scaling", AmericanJournal of Psychology, vo l. 84.
Backus, J. (1969 ), The Acoustical Foundations of Music, Nu e va York, W.W. N orto n &
C ompany Inc.
Barton S . (1994 ), "C hao s, Self-O rgan izat ion and Psychol ogy", American Psychologist,
vol. 49.
Basso , G . (200S) , "Orde n gene rat ive , Irac tales y miisica'', en Revisw. del Ins titu to

Superior de MUsica UNL, N Q 10, Sa nta Fe.


-

(2004 ), "Varia bles de d isefio e n ca mp os ac ust icos no expon enciales", en A et as de


las Terceras [o rn adas de Acust ica Elec troacus t ica y A reas Vin culadas (CADAE) ,
Buenos Aires.
(200 2), "Frac tales y es truc turas musicales aurosernejan tes", en Aetas de XV

C onferen c ia An ua l de la A sociaci6n A rgentina de M usico logia, Buen os Ai res.


(2001 a ), Andlisis espectral. La transformada de Fourier en ml/.Sica, La Plat a, Ed. Al

Margen - UNL P.
(2001 b ), "Fracrales, ruid o l /f y rruisica", en Acw.s del Encuenrro Nacional 2001 de

Investigaci6n en Artes y Diseiio (EN IAD 2001) , La Plata.


(2000 ), "Pe rce pc ion auditi va. Nuevos en foq ues", Bem al , UNQ, mim eo .

(1999 ), "E l princi pio de inde term in aci6n en ac ust ica m usica l", en AcUlS de la XIII

w.

275

III!\"

Conferencia Anual de la Asociaci6n Argenrina de Musicologia , Bue nos A ires .


_ (1998a), "M odelos cs ta t icos I' d inarn icos e n ac ust ica mu sical ", en Acres de la 2 ~
Conferencia Iberoanericana de Invesrigaci6n Musical, Lan ds.
- ,J . Guillen I' M . Liut (2000) , "Cond icion es necesarias par a el uso mu sical eficaz de l
desplazarnien to ac ust ico temporal", Actas del II Congreso Iberoamericano de
Acusnc, Mad rid.
- et al. (1 998a) , "Limitcs de a plica c i6n del desplazamiento aciistico te mpora l", en
Actas de la XII Jorruulas Ar'genrinas de MU5ico logia, Buenos A ires.
- et al. ( 1998 b) , "El de splaza rnicn to ac ust ico rempo ral. A juste de la ex pe rie nc ia I' uso
mu sical" , en Actas de las 11I JOT7UU1as del insntu to Julio E. Payr6, Buenos A ires.
Bekesy, G . Von (1 960) , Experiments in Hearing, N ue va York, W iley.
Be na de, A. H . (19 76) , Fundamentals of MU5ical Acousncs, Nueva York , Oxford

C halmers, D. (1996 ), "EI prob lema de la co nc icnc ia", Inuesrigaci6n y Ciencia, N 233 .
C hion , M . (1998) , "Du son a la cho se: h ypo th eses sur l'objet sono re", L'analyse musi

Un iversit y Press
- (1960), H ams, Strings and HamlOny, N ue va York, Anchor Books.
Benoit , c., T. Mohamadi I' S . Kandel (1994 ) , "Effec ts of ph onetic contex t on a ud io

C ulve r, C. A. (194 7) , MusicalAcoustics, Filadelfia , Blac kiston .


Delgute , B. (1 987 ), "Peripheral aud itory processing of speech information", en The

visual intelligibility of French spe ec h in noise", Journal of Speech & Hearing

Research.
Beranek , L. ( 1996), Concert and Opera Halls: How they Sound, N uev a York, A cou st ical
-

Society of A me rica .
(1988 ), Acousrical Measurements, Wood bury, A co ust ical Society of A merica.

(196 2), Music, Acoustics. and Architecture, N ue va York, Wile y.


(1954 ), Acoustics, McG raw H ill [trad., (196 1) , A cusncc , Buenos A ires, Edi to rial

H ispan o A mer ican a].


Bism ark , G . von (1 9 74 ), "Sharpness as an att ribute of th e t imbre of stea dy sounds",

Acustica, vo l. 30 .
Blaue rt, J. (199 7 ), Sparial Hearing. T he psychoph)'sics of human sound localization,
Ca mbridge, MIT Press.
Bregman , A. (1 994), Auditory Scene Analysis, Ca mb ridge, MIT Press.
Brown ell, W. E. er al. (1985 ), "Evok ed Mechan ical Re spon se of lso lat ed C oc h lear
O ute r H air Ce lls", Science, vo l. 22 7.
Butler, R. A. ( 1969) , "Mo naura l a nd bin aur al local izati on of no ise bursts ve rt ically in
th e med ian saggital plane", Journalof Auditory Research, vo l. 3.
Butler, D . (1992 ), The Musician's Guide to Perceprion and Cognition , N ueva Yor k,
Sc h irme r Books.
C adoz, C. et al. (1993) , "C ORDIS-ANIMA: a Mod eling and S imu lat ion Syste m for So und
and Image Sy nthes is-T he Gen era l For mali sm", Computer' MU5ic] oumal, vo l. 17.
Ca rlson , R., B. G ra ns tro m I' S . Hu nnicutt ( 198 2) , "A multi -lan gu age tex t-to -speech
module", Proceedings of ICASSP, vo l. 82 .
Ca rlyo n, R. I' B. Mo ore (1984 ), " In te nsity d iscrim ination: a sev ere depar tu re fro m
We ber 's Law", Journal of the A cousnccl Society of America, vo l. 76.

276

cale , vol. 11.


C o lbu rn , H . S . (1995 ), "Computati onal models of binaural processing" , Auditory
Computarion, Nueva York, S pringe r-Verlag.
Cook, P. (1999 ), Music , Cognition, and Computarized Sound, Ca mbridge, MIT Press.
C how ning, J. (1999 ), " Perceptua l Fusion a nd A ud itory Persp ec tiv e", Music, Co gnirion ,
and Computarized Sound, C ook (ed. ) , C a mbridge, MIT Pre ss.
C o le, R. I' B. Sc o tt (1 974 ), "Towa rd a the ory of speec h pe rcep t ion ", Psychological
Review, vo l. 8 1.
Crowder, R. G . (1 989 ) , "Image ry for musica l t imb re", Joumal of Experimental
Psychology: Human Perception and Perfonnance, vo l. 15.

Psychophysics of Speech Perception, Parses Bajos, Nijhoff.


Den nett, D. C. (1 993 ), Coscie nza, Mil an , R izzoli.
Deutsc h , D. (1999) , T he Psychology of Music, Nue va York, A cade m ic Press.
_ (1995), MU5ical lllusions and Par'adaxes, La Jo lla, Phi lornel R. In c.
Q
_ (1 99 2) , " Parado jas de la ro na lidad mus ica l", Invesrigaci6n y C iencia, N 193 .
_ (1975), "Two-ch annel listening to musical sca les", Joumal of the Acousrical Socie ty

of America, vo l. 57.
Di Liscia, O . P. (2000 ), "Spa t ial listening and its computer simulat ion in electron ic music",
en <htt p://depts.wash ington.e du/smcc web/courses/40 1-3/402examps/spat ial.htm l>.
Divenvi, P. (1 992 ), "Binau ral suppressio n of no nechoes" , Journal of Experimental

Psychology: Human Perceprion and Performance, vo l. 9 1.


P. (1 992) , "T he effec t of ba nd wid th on aud ito ry localizati on: An
estimation the or y mode l", Proceedings of the 12th Internarional Symposium on
Hearing, Lon dres, Pergamon Press.
_ I' Danner, W. (1977) , "Discrim inat ion of time inter vals mar ked by brief aco ust ic
pulses of var io us intensit ies and spec tra", Percept . Psychophys., vo l. 2 1.
Durlach, N . I. I' L. D. Bra ida (1969) , " Inte nsity pe rce pt io n . I. Preliminar y theory of
in tens ity resol ut ion ", J.Acoust. Soc. Amer., vo l. 46, pp. 3 72-383 .

I' Zakarau skas,

Eh resman, D. (1 978 ), "Percept ion of t imb ral an alog ies", Rapports IRCAM N 13/78.
Erick son , R. (19 75 ) , Sound Structure in Music, Berkeley, Uni versity of California Press.
Fec hner, G . (1 860 ) , "E lem e nt os de psicofisica", pub licado en int e rn et.

Fevrnan , R. (1971 ), f(sica, Panama, Fo nd o Ed ucat ive Lati n oa rner ica no .

Fin e, P. A. I' B. Moor e (1993 ), "Freq ue nc y ana lysis a nd musical a bility", Music

Perceprion, vo l. 11.
Flet cher, H. , W. A. Munson (1933 ), "Lo ud ne ss, its de fin it ion, mea surement and cal
culati on", Journal of the Acousrical Society of America, vo l. 5.

277

Fletch er, H . (1995), "Speech and Hearing in Communi cation - A SA Edit ion ", reirn
preso, Woodbury, A me rican Ins ti tut e of Ph ysics.
Fraisse P. (1967), Psychologie du temps, Paris , PUF.

Fraser, J. T. (1992), II Tempo, una Presenza Sconosciuca, M ilan, Felt rin elli,

Freed, D. J. (1990) , "Audi tor y co rre la tes of pe rceived ma llet h ardness for a set of

record ed per cussive sound events", Journal of the Acoustical Society of America,
vo l. 87.
Freeman, W. (1991), "Fisiolc gfa de la percepc ion", Investigaci6n y Ciencia , NQ 175.
Gardne r, M. (1968), "His to rica l Background of the Hass and/or Preced en ce Effect ",
Journal of the Acoustical Societ)' of America, vol. 43.
Ga rne r, W. R. y G . A. Mi ller (1947), "T he masking th reshold of pure ton es as a func
tion of du ration ", J. Exp. Psycho/., vol. 37.
G lasberg, B. y B. Moore (1990), " Deriva tion of aud itory filter sha pes fro m not ch ed
n oise dat a", Hearing Research, vol. 47.
Goertzel, B. (1993) , The evolving mind, Nueva York, Gord on and Breach Sc i. Pub .
Go ldste in , J. L. (1973), "A n op tim um processor th eor y for the central form at ion of th e
pitch of co mp lex to nes ", Journal of the Acoustical Society of America, vo l. 54.
G oode, R. L. et al. (1994) , "N ew know ledge abo ut th e fun cti on of th e human ear :
deve lopmen t of an improved model", Am . J. Otol., vo l. IS .
G rant ham, D. (1995), "Spat ial hear ing and related ph en omen a", en Hearing, ed. B.
Moo re, Nu eva York, Acade mic.
G reen, D. M. (1973), "Temporal acuity as a func t ion of frequ en cy", Journal of the
Acoustical Society of America, vo l. 54.
G rey, J. (1975), An Exploration of MusicalTimbre , CCRMA , S tan ford Un iversity.
Guillaum e, P. (1975), Pisicologfa de la forma , Buen os A ires, Psiq ue.
H aas, H . (1951) , "Uber den e ing luss e in es einfach echos auf die h orsamk ei t von
sprache", Acustica, vo l. I [trad . a l Ingles, (1972), 'T he in fluen ce of a sing le echo
on the audi bility of spee ch" , Journal of the Audio Engineering Societ)', vol. 20].
Hafter, E. y" T. Bue ll (1990), "Resta rting th e adapted bin aura l system ", Journal of the
AcousticalSociety of America, vo l. 88.
Hall, J. W. y R. W. Pet ers (198 1), " Pitch fro m no nsirnultaneous successive harmoni cs
in quiet and noise", Journal of the Acoustical Society of America, vel . 69.
Ha ll, J. W. et al. (1984) , " Detection in noise by spec rro- rernporal pa tte rn ana lysis",
Journal of the Acoustical Society of America, vol. 76.
-

y M. Fern and ez (1984), "T he role of rnon oaural frequency se lectivity in bina ural
ana lysis", Journal of the Acoustical Society of Amencs, ve l. 76.

H all , D. (1991) , Musical Acoustics, Ca liforn ia, Brooks/Cole Publi shing Company.
Han del, S. (1995), "Timbre percep tion and audito ry object ide ntificat ion", Hearing,
ed. B. Moo re, Nu eva York, Acade mic Press.
- (1989) , Listening, Cambridge, MIT Press.

278

H elmho ltz, H . von (1885) , Die Lehre von den Tonempfidungen [trad. en ingles, (1954),

On the Sensation of Tone, trad . A. J. Ellis, Nu eva York, Dover Publicat ions].
Henning, G . B. (1970), "Compar ison of th e effects of sign al dur ation on frequency an d
amplitude discr imin at ion", en Frequency analysis and periodicity detection in hear
ing, ed . Plornp, Leiden , Sijthoff
H irsch , 1. J. ( 1959), "Aud itory percept ion of temporal order", Journal of the Acoustical
Society of America, vol. 3l.
Hourga sr, T. (1976) , "S ubharrnon ic pitc hes of a pure to ne a t a low SIN ra tio", Journal
of the Acoustical Societ)' of America, vol . 60.
- (1972), "Psych oph ysical evide nce for lateral inhibit ion in he aring", Journal of the
AcousticalSociet)' of America , vol. 51.
- Y Sreen eken , H .. (1984), "A mult i-language eva lua tion of th e RASTI-Me tho d for
estim ating speech inte lligib ility in aud ito ria", Acustica, vol. 54.
H~tsma , A. y J. Go ldste in (1972), "The central origin of the pitch of pure to nes : evi
\\ence fro m musical int erval recogn ition ", Journal of the Acoustical Society of
America, vol. 51.
- , T. Rossin g y W. Wage naa rs (1987), Auditory Demostraiions, ASA (cd y libro).
Iverson, P. y C. L. Kru mh an sl (1989), "P itch and t imbre interac t ion in isola ted ton es
and in sequences", Journal of the Acoustical Society of America , vol. 86.
Ive rson , P. y C. L. Krumhan sl (1993) , " Iso lat ing th e dynami c at tribures of musical tim
bre", Journalof the Acoustical Society of America, vol, 94.
Javel , E. (1980) , "C od ing of AM tones in the ch inc hi lla aud ito ry nerve: implication s for
th e p itch of complex to nes ", Journal of the Acoustical Society of America, vol. 68.
Joh nson , D. L. y H . Gierke ( 1974), "A ud ibility of infrasound" , Journal of the Acoustical
Society of Amelica, vo l. 56.
Kat z, D. (1967) , Pisicolog(a de laforma, Madrid , Espasa-C alpe.
Kemp , D. T. (1978), "S timulated Aco ustic Emissions from with in th e A ud ito ry
S ystem" , Journal of the Acoustical Society of America , vo l. 64.
Kendall R. A. y E. C. Cartere rre (1993), "Verbal att ribu tes of simul tan eou s wind
ins trum ent timbres: II. Adjec tives induced from Pisto n 's Orch estration ", Music
Perception, vol. 10.
Kendall , R. A. , E. C. Cartere tt e y J. M. Hajd a (1999), "Natura l vs. synt he tic instru
ment ton es", Music Perception, vo l. 16.
Klatt, D. H . (1989 ), "Review of selected mod els of speech pe rcep tio n", en Lexical
Representation and Process, Ca mb ridge, MIT Press.
Klumpp, R. y H . Eady (1956), "So me measurements of interaural time difference
th resho lds", Journal of the Acoustical Society of America , vo l. 28.
Koh ler, W. (1972), Psicologia de la forma . Su tarea y ultimas experiencias , Madr id,
Biblioteca Nu eva .
- , K. Koffka y F. San der (1962), Pisicologia de la forma , Buenos A ires, Paidos.

279

Konishi, Masak azu (1993), "Audici6n bin aura l", Investigad 6n y Ciencia, N Q 20I.

M iller, G . y W. Taylo r (1948), "The perception of rep eated bur st of noise ", Journal of

Krumhansl, C. (1990), Cognitive Foundations of Musical Pitch, Nueva Yo rk, O xford


University Press.

the Acoustical Socie ty of America, vo l. 20, pp . 171-182.


M iyara, F. (s/f) , "Introduccion ala psicoacust ica", mimeo.

y R. Shepard (1979), "Quant ification of the Hi e rarch y of To nal Fun ct ions With in
a D iatonic Contex t" , Journal of Experimental Psychology : Human Perception and
Performance, vo l. 5.

Kubo vy, M . (1981), " Integral an d sepa rable d imensions and the theo ry of in d is
pensable att ributes", en Perceptual Organization, Erlbaurn, H illsd al e.

Kuhl, P. K. (1993), "In na te predi sposit ions and the effects of exp er ience in speech per .
ce pt io n: The na ti ve langu age magnet theory", en Developmental neurocognition:

Speech and face processing in the first year of life, Pafses Bajos, Kluwer'A<zdemi c
-Publishers.
-,
Liberman, A. er al. (1967), "Perception of th e speec h code", Psychological Review, vo l. 74.
Liberman , A. y Mattingly, I. (1985), "The motor theory of speech perception revisited",
Cognition, vol. 2I.
Liber man , A. M . (1995), Speech perception , Cambridge, MIT Press.
Lo , Y. O . (1987), "Tow a rd a T he ory of Ti mbre", Stanford, CCRMA , St anford Un ive rsit y.
McAdam s, S . y E. Bigand (1994), Penser les sons. Psychologie cognitive de l'audition,

Parts , PUF.
McAdams, S tephen (1995), Localisation Auditive, Parfs, IRCAM .
Mc Clell and , J. L. y

J. L. Elman (1986), "Th e -mACE Mod el of Speec h Perception",


Cognitive Psychology, vo l. 18.
Mcfadden , D. (1989), "Sp ec tra l d iffere nces in the ability of te mp oral gaps to reset the
mechan isms underly ing ov ersh oot", Journal of the Acoustical Socie ty of America,
vo l. 85.
McGill, W.

J. y J. P.

G o ldb erg (1968), "A St udy of the near-mi ss inv o lving Weber's

Law and pure-tone in tensity d iscri m inati on", Perception and Psychophysics, vo l. 4.
McG urk, H . y J. Mac Donald (1976), "Hearing lips and see ing voices: A new illusio n ",

Nature, vol. 264.


Mc Leod A. y Q . S ummerfield (1987), "Quantifyi ng the contribution o f vision to
spe ec h per cep t ion in noise", British Journal of Audiology, vol. 2I.
Majernfk, V. y J. Kaluzn (1979), "On the auditory uncert ain ly re lations" , Acustica, vol.

43.
Malham D. G . (1998), "S patial he aring mechan isms and sound rep roduction", trad . al
espa fiol O . P. Di Liscia, aur o rizad a por el auto r, en < h ttp://www.unq .ed u.ar/cme/
personales/od iliscia>.
Matthew, Robert (1975), "A co ust ics in per spective", en Auditorium Acoustics, Londres,
A pplied Sc ience Pu blishers.
Mathews, M . y J. Pie rce (1980), "H armon y and no nharmon ic part ials", Journal of the
Acoustical Society of America, vo l. 68.

280

Moor e, B. (1997), An introduction to the Ps)'chology of H earing, Londres, Academ ic


-

Press.
(ed .) (1995), Haruibook of Perception arui Cogn ition : Hearing, Londres, Academic
Pre ss.

- et al. (1993), "Cornodulation masking release in subj ects with unilateral an d bilat
eral cochlear hearing impa irme nt", Journal of the Acoustical Society of America,
vo l. 93.
- y B. Glasberg (1983), "S uggested formu lae for ca lculat ing aud ito ry-filter bandwidths
and excitati on pa tterns", Journal of the Acoustical Society of America, vo l. 74.
N e isser, U . (1967), Cognitive psychology, N ue va Yo rk, App let on-C enrury-Crofts.
O lson, H . (1952), Music, Physics and Engineer ing, Nu ev a Yo rk , Dov er Publications.
O stberg 0 ., B. Lindst ro m y P. O . Renhall (1988), "Contribution to speech int elligi
bility by different sizes of vide ophone displays", Proc. of the Workshop on
Vide ophone Terminal Design, Turfn .
Patterson, J. y D. Green (1970), "D isc riminati on of Transient Si gn als H aving Ident ical
Energy Spectra" , Journal of the AcousticalSocie ty of Am erica, vol. 48.
Patterson, R. D. (1976), "A ud ito ry filte r shapes der ived with noise stimuli", Journal of
the Acoustical Socie ty of America, vo l. 59.
P ick les, J. (1988), An Introduction to the Physiology of Hearing, S an D iego, Acad em ic
Press.
Pierce, ] . R. (1991), "Periodic ity a nd Pit ch Perception", Journal of the AcousticalSociety

of America, vo l. 90.
(1 985), Los sonidos de !a mUsica, Barce lona, Ed . Labo r.
Pisoni, D. B. (1973), "Auditory and ph onet ic memory co des in th e d iscrimination of
consonants and vowe ls", Percept. Psychophys., vo l. 13.
Plenge, G . (1974), "On the d iffe rence between locali za t io n and latera liza tio n", T he
Journal of the Acoustical Society of America, vo l. 56.
Plomp, R. (1976), Aspects of Tone Sensation, Londres, A cadem ic Press.
- (1967), "Pitch of complex tones ",journal of the Acoustical Society of America, vol. 4I.
- y Levelt,] . M . (1965), "Tona l Conso nance and Critical Bandwith", Journal of the
Acoustical Society of America, 38.
Po llack , I. (1968), "Auditor y pul sed Dopp ler d iscriminat ion", Journal of the Acoustical
Socie ty of America, 44, pp . 592-598
- (1953), "The Inform ati on of Elem entar y A ud itory D isplays", Journal of the
Acoustical Socie ty of America, 25, pp . 765-769.
Ran d, T. C. (1974), "D icho tic rel ease from masking for spe ec h ", Journal of the
AcousticalSocie ty of America , vo l. 55.

281

-Randell, M. (1993), "M ental mode ls and co mp lex syste ms: the ada ptive dynamics of
cog n itio n" , en internet .
Rasch, R. A . (1978), "The perception of sim ultane ous notes such as in polyphon ic
music" , Acustica, vo l. 40.
Rasch , R. y R. Plornp, (1999), "The percept ion of musical tones", en The psychology of
music, ed. D. Deutsch, San Diego , Acade m ic Press.
Rayleigh, L. (19 45) , The Theory of Sound, Lond res, Do ver.
Repp, B. H. (19 87), "The sound of two hands clappi ng", Journal of the Acoustical
Society of Am erica, vo l. 8l.
Rei sberg D . y J. McLean (1987) , "Easy to hea r but

hardt~nderstand :

Risser, J. e. (1 986) , "Pitch and Rhy thm Pa radoxes: C o mment on A uditory Par ad ox es
Based on Fract a l Wavefo rm" , Journal of the Acoustical Society of America, vo l. 80 .
-

(1 97 8a) , "M usical A cou stics ", Parts, Ra pports IRCAM N 8.

(1978 b) , "Parad oxes de H aut eur" , Pa rts, Rapports [RCAM N 10.

(1978c) , "Ha uteur e t TImbre de s Sons", Paris, Rapports IRCAM N 11.

y M . V. Mathews (19 69), "Analysis of M usica l Instrument Tones", Ph)'sics Toda)',


vo l. 22.

Risser, J.e. , y D. L. We ssel (1999), "Exp loration of timbre by ana lysis and syn thesis",
en The Psychology of Music, ed . D. De utsch, San Diego, A cad emic Press.
Ritsrna, R. ( 1967), "Freq uencies do minan t in the percep tion of th e pi tch of co mplex
so und", Journal of the AcousticalSociety of America, vo l. 42.
- ( 1962), "Existen ce region of the tona l residu e", Journal of the Acoustical Society of
America, vo l. 34.
Rock, I. y S. Palmer (1991), "EI legado de la psico logia de la forma", Investigaci6n y
C iencia, N Q173 .
Roede rer, Juan (1997), FCsica y psico[fsica de Ia miisica, Buenos Ai res, Ric ord i.

Ru iz, R icard o (1995), Ideas para el estudio de la organizaci6n pSlquica, La Plata, UNLP.

Schaeffer, p. (1966) , Traue des Objets Musicaux, Paris, Edition du Seui l.

(1 95 2) , A la Recherche d'une Musique C oncrete, Pa ris, Edi tion d u Seuil [t rad. en


caste llan o, (1 959 ), iQue es la mt1.sica concreta?, Nue va Vision].

Scho ut en, J. F. et al. (19 62), "P itch of the resid ue", Journal of the Acoustical Society of
Am erica, vo l. 34.
Sek, A. (1 994), "M od ulati on de tec tion th resho lds and crit ical modu lati on frequen cy
based in random amp litude and freq ue nc y chan ges" , Journal of the Acoustical

Society ofJ apan, vo l. 15.


Se thares, W. A. (19 93), "Local C ons onance an d the Rel at ionsh ip be twe en TImbre
and Scale", Journal of the Acoustical Society of America, vol. 94.
Sethares, W. A. (1998) , Tuning, Timbre , Spectnl m, Scale, Lo nd res, Springer -Verlag.

282

t ion", Journal of the Acoustical Society of America, vo l. 9 1.


Shailer, M . y B. Mo ore (1 98 7), "Gap detection an d th e aud ito ry filt er: ph ase effects
usin g sinus oida l st imuli", Journal of the Acoustical Society of A merica , vo l. 8l.
Sheppard, R. N. (1964), "Circul arity in Ju dgmen ts of Relat ive Pit ch ", Journal of the
Acoustical Society of Am erica, vol. 35.
S lawson, W. (1968) , "Vowel q uality and music al timb re as functi ons of spectrum enve
lope and fundament al frequency".Journal of AcousticalSociety of Amence, vol. 43 .
Soderq uist, D. R. (1970) , "Freq ue nc y a na lysis and the cr it ica l band", Psychonomic

A lip-reading

adv antage with intact a ud ito ry st imuli", en Hearing by ey~ : The psychology of lip
reading, New Je rsey, Lawrence Erlbaum Associates.

S hac kleton, T. M ., et al. (199 2), "Across freq ue ncy integration in a mod el of lat era liza

Science, vol, 21.


Spiegel, M. F. (198 1) , "T h resho lds for ton es in maskers of vari o us bandw idths and fo r
signa ls of vari o us bandw idths as a func tion of signal freq uency", Journal of the

Acoustical Societ)' of Am erica, vol. 69 .


S teeneken , H . y T. Ho utga sr (1980) , "A ph ysical me thod for meas ur ing speech -tran s
m ission quali ty", Journal of the Acoustical Societ)' of Americ, vol. 67.
S tem, R. y C. Trahiotis (19 95), "M odels of binaural interac tio n", en Hearing, ed . B.
Moore, Nueva York, A cad emic Press.
S tevens, K. y Blum stein, S. (19 81), "The sea rch for in variant ac o ustic cor relates of
ph oneti c fea tures", Perspectives on the stwiy of speech, eds. P. Eimas y J . Mill e r,
Hillsdale, Lawre nce Erlebaum Associates.
S te vens, S . S . (1975), Psychoph)'sics: Introduction to its Perceptual, Neural and Social
-

Prospects , Nueva Yo rk, Wil ey & Sons.


(195 9 ), "On the validity of loudness scale", Journal of the Acoustical Society of

America , vol. 31 .
(1935 ) , "The relati on of pit ch to in te nsity," Journal of the Acoustical Society of

Amencc , vo l. 6.
al. (1937), "A sc ale for th e mea sure ment of the psychologic al magni tude of
pi tch", Journal of the Acoustical Societ)' of Am erica, vo l. 8.
S undberg, J . ( 1991), The Science of MusicalSound, San Dieg o, Academ ic Press.
- (1 98 7), The Science of the Singing Voice, DeKalb, N orthern Illinois Un iver sity Press.
- y Lindqvisr, J . (1 973 ), "Musica l oc ta ves and p itch," Journal of the AcousticalSociety
of A merica , vo l. 54 .
- y Verr illo , V. (19 80) , "On the anato my of the retard : A St ud y of tim ing in music,"
Journal of the Acoustical Society of America , vol. 68 .
Terhardt, E. ( 1974), " Pitch , consonan ce and harmony," Journal of the Acoustical Society
of Amencc, vol. 55.
- er al. (1982a) , "P itch of co mplex signa ls accord ing to vi rt ua l-p itc h theory: Tes ts,
ex amples, and predic t ions ", J. Acousr. Soc. Am ., 7l.
- y W. Dixon Ward (1982b), "R ecognition of musica l key: Exploratory stud y", J.
Acousr. Soc. Am. , 72 .
-

er

283

----------------------zp-----------

Unernoto, T. (1989), "T h e psycho log ica l structure of m usic", Proccedings of the Firs t

International Conference on Music Perception and Cognition, Kioto.


Vanderveer, N. J . (1979), "Eco logi cal Aco ustics. Human perceptio n of environm ental
so unds", Doc toral Thesis, U n ivers ity M icrofil ms No. 8004002.
Van Dommelen W. (1990), " A coust ic para mete rs in h uman spea ker reco gnitio n ",
LangSpeech, vo l. 33.
Van Noorden, L. (1975) , "Tempor a l Co heren ce in th e Per ception of Tone Seq uences ",
Im tituut voor Perceptie Onderzoek, Ein dhoven.
V icario , G. B. (1997), "Ti me in Psych ol ogy", Sci. Am .
- (1967), Tempo Psicologico ed Eventi, Florenci a,..G~ti- Bar bera .
V ieme ister, N . F. (1988), "Ps yc hophysical aspec ts of au d itory intensity co d ing" , en
Auditory Functions, ed . Ede lma n , Nueva Yor k, Wiley.
Walla ch , H . et al. (1949), "T h e Preced ence Effect in Soun d Local izati on", American
JOUl/Ul1 of Psychology, vo l. 57.
Warre n, R. M . (1970), "Elimin ation o f b iases in lou dness judge me nts for to n es",
Journal of the Acoustical Society of America, vo l. 48.
Warren, W. H . y R. R. Ve rbrugge (1984) , " A ud itory Pe rcep t io n of Brea king a nd
Bouncin g Events: A Case S t udy in Ecologic al A cou stics", Journal of Experimental
Psychology: Human Perception and Performance, vo l. 10.
Wegel , R. y C Lane (1924), "The auditory ma sking of one so und by an other sound an d
its pro babl e re lat ion to the dy n am ics of th e inner em ", Physical Review, vo l. 23.
Wier, G . C , W. [esteadt y D. M . Green (1977), "Intensit y d iscriminat ion as a fun ction

of freq uency an d sen sa t ion level", Journal of the Acoustical Society of America, 61,

pp. 169-177.

W essel, D. (1978) , "Low Di m ension al C o ntrol of Musical Ti m bre" , Paris, Rapports


lReAM

N 12.

Whittle, L. S . et al. (1972), "T h e aud ibility of low frequency so un ds ", J. Sound Vib.,
vo l. 2 1.
Zwi cker, E. (1965) , "Tempora l effects in simultaneous masking by wh ite -n o ise burst",

Journalof the Acoustical Society of America, vo l. 37.


- , G . Flottorp y S . S. S te ven s (1957), "C ritical Bandwidth in loudness sum m at ion ",

Journalof the Acoustical Society of America, vo l. 29.


- y H . Fastl (1999), Psychoac1lStics . Facts and Models, Berh n, S prin ger-Verlag.
- y H . Fastl (1990) , Ps)'choacustics, Berl in , S pringe r-Ve rlag.
Zwislocki, J. J. y H . N. Jordan (1986), "On the rel at ion of intensity jn ds to lou dness
a nd neural n oi se, Journal of the Acoustical Society of Americu, vo l. 79.

Indice ternatico

A daptaci on aud itiva , 73 , 82

Ad aptacion binaural, 200

A daptacion pat ologica, 74

A gregado aud it ive , 215

A lgorinnos psicoac usticos

de co mpresi6n , 113

A ltura espect ral , 133

Al tura residual, 140, 143

A lt ura ton al, 133

Al tur a to n al en estfmulos diacronico s, 140

A ltura ton al en estimulos sinc r6n icos, 140

Al tura ron al, repr esemaci6n grafica, 150

A n alisis audi tive del en torno , 215

Anal isis especuo-temp oral , 104

A nalisis multid imens ion al , 171

Ancho de banda, 272

Ancho de band a rectangu lar equivalem e, 92

Ando, modelo de, 51, 109, 201

A parato vocal, 240

Arrn onicos, 267

Atenci6 n y t imbre, 190

At riburos dispensables e ind ispensables, 149

Aud ici6n an alit ica, 134

Aud ici6n fuera de frecu encia, 94

Aud ici6n sln tet ica, 134

Auriculares, 22

Ayuda visual par a la inr el igibilidad , 265

B
Ban das cnticas, 91, 103

Batidos binaur ales, 197

Blauert , model o de , 201

Brillo del son ido, 187

C ampos acust icos virtuales, 212

C ategorfas temporales, 117

Celulas ci liadas, 34

C oclea (ca racol) , 32

C olor del son ido, 183

C o loraci6n espec t ral, 204


C ornodulacion, reducci 6n del
en masca ram ient o par, 105, 227
C onducro coclea r, 31

Co no de co nfusion espacia l, 195

C onsonan cia y dison an cia, 160

Co nsonan ces [ricat ivas, 242

C on son antes nasales, 242

Conson an tes plosivas, 241

C onstancia de la sonoridad , 207

Co nsta nc ia del t imbre, 187

C on tornos de igual son oridad , 61

C orrespondencia t iemp o-intensidad, 200

C ort i, 6rgan o de, 31, 33

Dato s especrrales, 198

Decibel (un idad) , 54

Desborde acustico ("overshoot") , 77

Desplazam ien ro acustico temporal, 128

Desplazamiemo per man en te del umbra!

(PTS), 77

Desplazami em o temp orario del umbral

285
284

---------------~----------------_.

(TIS) ,75

Derec cion de asin cron fas, 127

Detecci6n de disconri nuidades, 124

Detecci6n de sefiales en presencia

de ruido, 77

Difere nc ia intera ural de inte nsid ad (110 ),

190

Diferencia interaural de tiempo (ITO), 192

Dimensiones timbricas exclusivas, 187

Discriminaci6n de parciales, 100

Disparidades en el cuerpo de la senal, 200

Distors ion alinea l, 110

Distors ion arm6n ica, 47

Distribuc lon de ann6nicos, 168

Doppler, efecro, 211

Ecos, 203

Ecos cocleares, 47

Efecro de cafeteria, 217, 223

Efecro de precedencia, 202, 222

Emisi6n vocal, 247

Emisiones o toa ciisticas, 37, 46

En masca rarnienro, 101

En rnascararnienro binaural, 109

Enmascaramiento no sim ulta neo , 106

Ensayos de arti cu lacion , 258

Escala de alturas, 136

Espec ializacion cerebral para el habla, 248

Espec tro de pote nc ia, modelo del , 92

Espec rrogramas auditivos, 249

Estado t ransitor io, 271

Esnrnulos sinusoidales, suma de, 71

Eustaqu io, rro mpa de, 26

Exciraci6n irnpulsiva, 44

Fac to res espec rrales, 98

Fase, informaci6n de, 39

Fatiga aud iriva, 75

Fechner , ley de , 70

Filrros de modulaci6n , 126

Fletcher, expe rirne nto de, 91

Fen (unidad), 61

286

Fonaci6n, 241

Fonemas, 239

Formanres, 244

Fourier, teorema de, 267

Fourier, transformada de, 271

Frecuencia, d iferen c ia apenas perceptible

(DAP),89

Fuente aciistica , 216

Funci6n de rransferen c ia de la cabeza

(HRTF),198

Funci6n de transferencia del o fdo, 47

Fundamental de Fourier, 134, 140, 267

Fundamental reconstruida, 140, 269

Fusion por arrnonicidad, 217

Fusi6n por cambios de arnplirud y

frecuencia, 220
.

Fusi6n por conrraste con sonidos previos, 219

Fusion por disparidades en el a raq ue , 219

Fusi6n por localizaci6n de la fuenre, 221

Fusion por periodicidad, 223

Fusion y fisi6n ritrnica, 226

Gestalt, teoria de la, 228

Goldstein, modelo de, 142

Grey, rnodelo de, 174

H
H ass, efecro, 202

Hueseciltos de! ofdo medio, 26

Indicadores ac ustic os invar iantes en el

habla, 256

fndice de arriculaci6n , 262

ind ice de transmisi6n de la palabra, 263

Integraci6n audiovisual, 253

lnregraci6n temporal, 70, 119

ln teliglbilidad de la palabra, 257

lnteligibilidad, predicci6n de la , 260

In tens idad ac ustica , 56

Intensidad, codificaci6n contextu al, 85

lnrensidad, codificacion de la , 8 1

Inrensidad, codificaci6n de rasgos, 85

ln te nsidad , cod ificacion peri ferica , 82


In rensidad , di fer enc ia apenas perceptible

(DAP),66
Inrensidad, discriminaci6n de la, 66
In re nsidad , facto res espec tra les, 71

In re rfe rencia binaural, 201

In rervalos d iacronicos, 156

lntervalos musicales, 154

ln tervalos sincronicos, 157

l nvariancia del timbre, 169

ln var iantes acusticas, 178

Inversion temporal, 169

Isofonas, curvas, 61

Isornorfismo, 238

Iverson y Krumhans l, estudios de, 174

Modelo de supresion, 104

Modelos de doble poblaci6n, 83

Modelos rernp o rales, 142

Modo lingufsrico, 252

Moore, modelo de, 145

Morfof6rico, med ic , 149, 189

MP3, cod lficac ion, 114

N
Nervio aud it ive , 40

Neural, respuesras de alto nivel , 48

Nivel de inrensidad (N O, 57, 6 1

Nivel de presi6n sonora (NPS) , 55

Nive les de urnbral, 59

o
L
Ley de c ie rre , 23 1

Ley de continuidad, 233

Ley de desrino corn un, 234

Ley de proxi rnida d , 230

Ley de sernejanza , 231

Limen en frecu enc ia, 89, 137

Limen en in ten sidad, 66

Lo, modelo de, 184

Localizaci6n audiriva, 19 1

Localizac ion de sefiales cornplejas, 197

Localizaci6n de senales transirorias, 199

Localizaci6n monoaural, 197

Localizaci6n temporal, 129

Loudness, contro l de, 62

M
Medidor de n ivel sonoro, 64

Med idores de sono ridad , 87

Mel (unidad), 136

Membrana basilar, 3 1, 43, 46

Memoria de la int en sidad, 85

Met arne ricos, ti mbr es, 189

Minimo angulo de rnovim ient o

perceptible (MAMA), 211

Mode!o de cobert ura, 104

Mode!o de reco nocim iento de patr ones,

141

O bje tos audi u vos , 166, 215

O hm, ley ac ust ica de, 100, 167

O ido absolute , 157

Otdo ex terno, 20

Otdo in tern e , 30

Oldo medio, 24

O rden temporal, 128, 226

Pabellon auricular, 20

Pascal (unidad}, 54

Pa tol ogias a uditivas, 77

Percepci6n ca regorica, 253

Percepci6n del habla, 239

Percepci6n del movimiento, 211

Percepci6n dual, 253

Perdida de articulaci6n en consonanres, 265

Perfil espec tra l, exarnen del, 108

Perspecriva audit iva, 206

Plomp, estud ios de ,I n

Potenc ia ac iistic a, 56

Presi6n dinarnica, 54

Principio ac ustico de indeterminaci6n, 95,

119,130, 186, 200, 248, 271

Principio de figura y fondo, 235

Principio de inferencia incc nsciente. 228

Princip io de pe rrenencia, 235

Prin ci pio de pregnancia, 236

287

Propiedades emergen res, 228

Psicoffsica, ley, 62

rnetodo de, 95

Supresi6n lateral, 107

Rango dinamico, problema del, 81

Reclu rarni enr o a ud itive , 79

Red neuronal, modelo de, 256

Reflejo ac iistico (en el oido rned io ), 29

Refractario, esrado, 38

Refuerzo elect roacust ico , 204

Regularidad de datos fisicos, 226

Reissner, membran a de, 32

Relaci6n senal/ruido, 93, 261

Resistencia del habla, 257

Resoluci6n temporal, 118

Resonancia del filtro a ud it ive, 121

Resonancia del tract o vocal, 244

Resonancia me cani ca

(membrana basilar), 43

Reverberaci6n , 208

Risser y Mathews, rnctodo de, 180

Ruido cn masc aran te de Patt erson , 95, 119

Tasa de ocurrencia en el habla, 251

Tensor del tirnp an o, 29

Teorfa de los rasgos in varian tes, 255

Teoria del lugar, 42, 134

Teoria del magn eti srno del lenguaje

nati ve , 255

Teoria doble, 196

Teoria rnorora, 255

Teena temporal, 134

Terdhardt, modelo de, 142

Tiernpo, problema del , 117

Timbre, 163

TImbre en la voz h urnana, esrudios sobre

el, 182

TImbre, defin iciones, 164

TImbre, modelo clasico, 167

TImbre, rnod el os de analisis por sfn tes is,

S
Schouten, expe rirncnto de, 142

Secuencias rftmicas, 225

Segregaci6n aud it iva, 217

Sensibilidad a la fase, 98

Senates c uasi-period icas, 223

Shepard, helice de alturas tonales, 151

Shepard, sonidos de, 152

S ln tesis ac iistica, 170

Slawson , esrud ios de, 183

Son (un idad) , 63

Sonidos de cornbinacion, l l O, 112

Sonidos diferenciales, l lO
So nogra rnas, 248

Sonoridad, 53

Sonoridad, cont rol de, 62

S ta pedi ano, 29

Stevens, relaci6n de, 64

Suma de locaciones, 203

Supresi6n, 82

Supresi6n de bandas por cobertura,

288

177

TImbre, rnodel os verbales, 178

Tfmpano, 24

Ton icidad, 134

Tonoropta.T Z

Transducci6n en el ofdo medi c, 27 , 37

U
Umbral de audiblidad, 58

Umbral para esti mulos co rnplejos, 98

Unisono rfrnbrico, 189

Variaci6n de datos acusticos en el habla,

251

Vocales, 243

Von Bekesy, esquema de, lOl

Voz h umana, frecuencias fundarnentales,

182

Weber, fraccion de, 68, 71, 84

Weber, ley de, 68, 8 1

S-ar putea să vă placă și