Documente Academic
Documente Profesional
Documente Cultură
ca
• Anatomia del oido humano
• Percepción de la altura
• Percepción de la sonoridad
• Enmascaramiento
• Direccionalidad
• Espacialidad
• Inteligibilidad de la palabra (*)
1. Breve anatomía
del oído
El oído es un detector biológico
del sonido. Es una de las
estructuras mecánicas mas
intrincadas y delicadas del cuerpo
humano. Se especializa en
responder a una particular forma
de energía, la energía acústica, en
un intervalo de 20 a 20 Khz y un
rango dinámico de 120 dB.
El aparato auditivo está
formado por tres secciones:
El oído externo
El oído medio
El oído interno
Yunque
Martillo Caja
Pabellón timpánica
de la oreja Canales
semicirculares
Cóclea
Canal Ventana
auditivo oval
Ventana
redonda
Estribo Trompa de
Tímpano Eustaquio
Pabellon de la oreja
o auricula
Canal Auditivo
El cerumen
arrastra las
partículas hacia
afuera
ii. El oído medio
Yunque
Martillo Caja
timpánica
Membrana
del Tímpano
Estribo Trompa de
Eustaquio
Oído
medio
El oído medio conduce el
sonido desde el tímpano al
oído interno.
Convierte la energía
acústica en movimientos
mecánicos.
Oído medio: mecánica de los huesecillos
Martillo Yunque
Ventana
oval
Tímpano
Oído medio: mecánica de los huesecillos
Ventana
oval
Tímpano
Oído medio: mecánica de los huesecillos
Ventana
oval
Tímpano
Oído medio: mecánica de los huesecillos
Ventana
oval
Tímpano
Oído medio: mecánica de los huesecillos
Ventana
oval
Tímpano
Dos pequeños músculos, el tensor
del tímpano (unido al martillo) y
el estapedio (unido al cuello del
estribo), limitan un poco los
movimientos de los huesecillos.
Para altas intensidades estos
pequeños músculos cambian su
extensión para reducir la
amplitud del movimiento. Este
proceso se conoce como Reflejo
Acústico y requiere de cerca de
0,5 ms para hacerse efectivo. Por
tanto no ofrece protección para
sonidos súbitos impulsivos (ej.
disparos de armas de fuego)
iii. El oído interno
El oído interno transforma
el sonido en impulsos
eléctricos y los envía al
cerebro a través del nervio
auditivo.
Oído interno: la cóclea
Canales
semicirculares
Cóclea
Estribo
Ventana Ventana
oval redonda
Oído interno: la cóclea
Oído interno: la cóclea
Oído interno: la cóclea
Membrana
Células ciliadas de Reissner Rampa
internas
coclear
Rampa
vestibular Na+ Membrana
tectoria
K+
Células ciliadas
Nervio externas
auditivo
Membrana
Na+ basilar
Lámina
espiral
Rampa
timpánica
Oído interno: la cóclea
Nervio auditivo
Células ciliadas
El tubo de la cóclea está dividido en:
vestíbulo superior y vestíbulo inferior.
La división se completa por una
membrana fibrosa flexible (membrana
basilar). La unica comunicación entre
los vestíbulos es de una pequeña
abertura en el véctice de la cóclea
(helicotrema).
Oído interno: la cóclea
Oído interno: la cóclea
Oído interno: la cóclea
Oído interno: la cóclea
Oído interno: la cóclea
Oído interno: la cóclea
Oído interno: la cóclea
Oído interno: la cóclea
Oído interno: la cóclea
Oído interno: la cóclea
Oído interno: la cóclea
Oído interno: la cóclea
Oído interno: la cóclea
Oído interno: la cóclea
Membrana
tectoria Rampa
coclear
Órgano
de Corti
Membrana
tectoria Rampa
coclear
Órgano
de Corti
Membrana
tectoria Rampa
coclear
Órgano
de Corti
Membrana
Pandeo
tectoria Rampa
coclear
Órgano
de Corti
Ápex
Base
Helicotrema
Ondas “viajeras” en la membrana basilar
Membrana
Estribo basilar
f Ápex
Base
Helicotrema
Ondas “viajeras” en la membrana basilar
Membrana
Estribo basilar
f Ápex
Base
Helicotrema
Ondas “viajeras” en la membrana basilar
Ondas “viajeras” en la membrana basilar
Ondas “viajeras” en la membrana basilar
Ondas “viajeras” en la membrana basilar
0,05 mm 0,5 mm
Longitud 32 mm
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Ondas “viajeras” en la membrana basilar
Base Ápex
Zona de máxima
oscilación
La zona de máxima
oscilación depende de la
frecuencia del sonido
Zonas de máxima oscilación
Base Ápex
Este comportamiento se
debe a las propiedades
elásticas de la membrana
basilar.
La membrana basilar es
más pequeña y rígida en
la base, por eso en dicha
zona la frecuencia de
resonancia es alta.
En cambio, es más ancha
y flexible en el ápex, por
lo cual allí la frecuencia
de resonancia es baja.
En la zona de máxima
oscilación las células ciliadas
experimentan deformaciones
más intensas, enviando más
impulsos nerviosos al cerebro
Zona de máxima oscilación
Base Ápex
x
x = 61 – 14 log f
La membrana basilar
constituye, así, un analizador
de espectro que envía al
cerebro la señal sonora
descompuesta en sus
frecuencias constitutivas.
2. Percepción
de la altura
La relación entre la frecuencia
y la altura percibida es simple,
al menos para la cultura
basada en la música
occidental.
La frecuencia patrón de 440 Hz
corresponde a la altura del la de
la octava central del piano.
La 440
La
440 Hz
Cada vez que la altura aumenta
un semitono la frecuencia se
multiplica por:
12
2 = 1,05946
Por ejemplo, para obtener la
frecuencia del si bemol hacemos:
fSi bemol = 1,05946 × fLa
fSi bemol = 1,05946 × 440 Hz
fSi bemol = 466,16 Hz
fLa = 440 Hz
fSi bemol = 466,16 Hz
La 440 Si b 466,16
Análogamente, cada vez que la
altura baja un semitono la
frecuencia se divide por:
12
2 = 1,05946
Por ejemplo, para calcular la
frecuencia del sol sostenido:
fSol sostenido = fLa / 1,05946
fsol sostenido = 440 Hz / 1,05946
fsol sostenido = 415,30 Hz
fLa = 440 Hz
fSol sostenido = 415,30 Hz
La 440 Si 493,88
Un tercera mayor equivale a
cuatro semitonos, por lo tanto se
multiplica por:
12 12
2 × ... × 2 = 1,25992
4 veces
fLa = 440 Hz
fDo sostenido = 554,37 Hz
La 440 Do # 554,37
Un quinta equivale a siete
semitonos, por lo tanto se
multiplica por:
12 12
2 × ... × 2 = 1,49831
7 veces
fLa = 440 Hz
fMi = 659,26 Hz
La 440 Mi 659,26
Finalmente, una octava equivale
a doce semitonos, por lo tanto se
multiplica por:
12 12
2 × ... × 2 = 2
12 veces
fLa = 440 Hz
fLa’ = 880 Hz
3000
2500
Altura [mel]
2000
1500
1000
500
0
20 50 100 200 500 1000 2000 5000 10000 20000
f [Hz]
EJEMPLO
Averiguar a cuántos mel
corresponde un LA de 1760 Hz.
3500
3000
2500
Altura [mel]
2000
1400 mel
1500
1000
500
0
20 50 100 200 500 1000 2000 5000 10000 20000
f [Hz]
Es interesante comparar la
escala de semitonos con la
escala mel.
3500
3000 120
110
2500 100
90
Semitonos
Altura [mel]
2000 80
70
1500 60
50
1000 40
30
500 20
10
0
20 50 100 200 500 1000 2000 5000 10000 20000
f [Hz]
3. Percepción
de la sonoridad
La presión sonora audible
abarca un rango muy amplio:
0,00002 Pa a 20 Pa
Conviene expresarla como
nivel de presión sonora, Lp,
decibeles.
P
Lp = 20 log ——
Pref
10
1
S [son]
0,1
0,01
0,001
0 10 20 30 40 50 60 70 80 90 100 110 120
NS [fon]
Un sonido de 2 son es
doblemente sonoro que
uno de 1 son.
Por encima de 40 fon la
curva anterior es lineal.
Esto permite obtener:
NS – 40
———
30
S = 10
EJEMPLO
Determinar la sonoridad de
un tono de 3 kHz y 80 dB
NS – 40
———
30
S = 10
Este tono de 3 kHz y 80 dB
tiene un nivel de sonoridad
de 90 fon.
dB
120 fon
120
110
110
100
100
90
90
90
80
80
70
70
Lp 60
60
50
50
40
40
30
30
20
20
10
10
0
90 – 40
———
30
S = 10 = 46,4 son
Hasta ahora hemos
analizado la sonoridad de
los tonos puros.
Para sonidos espectralmente
complejos debe introducirse
un procedimiento que
permita combinar
sonoridades.
Para ello tengamos en cuenta
las siguientes propiedades:
1. Para sonidos de frecuencias
distantes se suman las
sonoridades (S).
2. Para sonidos de frecuencias
próximas se suman las
intensidades (Pef2)
El criterio para decidir si los
tonos están próximos o no
es si están en una misma
banda crítica.
Curva de
S1 S2 S3 S4 S5 S6 S7
transferencia
S = Σ Si
Se han propuesto métodos
simplificados para llevar a cabo
esta idea. El más simple es el
de Stevens, llamado Mark VI.
El método Mark VI requiere
disponer del espectro de
bandas de octava del sonido a
analizar. Utiliza las bandas
centradas en 31,5 Hz hasta
8000 Hz.
Por medio de los contornos de
Robinson-Dadson se determina,
para cada banda, el nivel de
sonoridad y luego la sonoridad.
Finalmente, se aplica la siguiente
fórmula:
En condiciones de silencio un
determinado tono se percibirá
hasta un nivel de presión sonora
bastante bajo, llamado umbral
de audición.
dB
120
110
100
90
80
70
Lp
60
50
Umbral de
40
audición
30
20
10
0
El siguiente ejemplo
corresponde a un tono máscara
de 400 Hz a tres diferentes
niveles: 40 dB, 60 dB y 80 dB
Enmascaramiento
Actualmente, la tecnología de
audio digital aprovecha el
enmascaramiento para reducir
la cantidad de información a
almacenar o transmitir.
Enmascaramiento
Ello se consigue evitando
aquellos sonidos que, por quedar
enmascarados por otros sonidos,
no se escucharán.
Un ejemplo es el formato MP3,
hoy muy utilizado en Internet.
5. Direccionalidad
La audición permite no
sólo permite obtener
información semántica,
sino además espacial. La
direccionalidad del
sonido es una de las
características espaciales
básicas.
La direccionalidad del
sonido, o ángulo de
procedencia, es percibida
fundamentalmente
gracias a la audición
biaural (dos oídos).
∆x = c ∆t
Los caminos entre la
fuente y los oídos son de
diferente longitud, por lo
que se produce una
diferencia de tiempo
interaural, ∆t , abreviada
ITD
También hay una
diferencia de intensidad
interaural, IID, que
obedece a dos factores:
la diferencia de distancia
y la atenuación de la
propia cabeza.
La diferencia de distancia
influye debido a la
divergencia geométrica
(atenuación por distancia)
del campo sonoro.
La divergencia geométrica
es importante cuando la
fuente se encuentra muy
cerca. Así, una diferencia de
10 cm en una distancia de
1 m implica una diferencia
de apenas 1 dB.
Para distancias mayores
este factor pierde
importancia frente a la
atenuación de la propia
cabeza.
La atenuación de la cabeza
se debe al efecto pantalla
que la misma causa en el
oído menos expuesto.
Pero a causa de la
difracción se producen
variaciones del sonido
percibido en un mismo
oído.
Esto se evalúa mediante la
función de transferencia
de la cabeza, HRTF (Head
Related Transfer Function).
La HRTF expresa la
atenuación para diferentes
ángulos y frecuencias.
Eje
interaural
Azimut
Plano medial
20
15
f
10
[kHz]
0
0 45 90 135 180
Azimut [º]
La HRTF se puede medir
mediante la construcción de
maniquís que representen una
persona promedio.
Fuente
El camino más corto es siempre
el directo. Esto da origen al
Efecto de Precedencia o Hass,
por el cual la dirección
percibida corresponde a la del
primer frente de onda recibido.
El Efecto de Precedencia,
tambíen llamado Efecto Hass,
explica por qué en un
ambiente reverberante la
ubicación de la fuente en
general se percibe
correctamente, pese a las
múltiples reflexiones.
Veamos algunos parámetros
acústicos de las salas que
tienen importancia en la
calidad de la percepción.
Tiempo de reverberación (T o T60)
Lp 0 - 35 dB
t
T/2
En los albores de la acústica
arquitectónica moderna (fines
del siglo XIX) se pensaba que el
tiempo de reverberación era el
único parámetro importante.
Más adelante se comprobó que
también eran muy importante
las primeras reflexiones,
denominadas reflexiones
tempranas. Se introdujeron
varios parámetros relacionados
con ellas.
Retardo inicial (ITD)
Es el tiempo entre la
llegada del sonido directo y
el de la primera reflexión.
En los mejores auditorios
está comprendido entre
10 ms y 25 ms.
Retardo inicial (ITD)
Lp
t
ITD
Tiempo de caída inicial (EDT)
Es el tiempo de reverberación
que se obtiene extrapolando la
caída de 0 dB a -10 dB con
respecto al nivel alcanzado en
régimen permanente una vez
interrumpida la fuente.
Tiempo de caída inicial (EDT)
Lp
Lp 0
Lp 0 - 10 dB
t
EDT/6
Índice de claridad (C80)
C80
∫ p
= 10 log —————
0
2
(t) dt
∞
∫ (t) dt
p 2
0,08
Índice de claridad (C80)
p2(t)
0,08
po2
∫ 0
p2(t) dt
∞
∫
0,08
p2(t) dt
to to + 0,08 s
t
Índice de claridad (C80)
0,05
∫
D = —————
0
p 2
(t) dt
∞
∫ (t) dt
0
p 2
Definición (D50)
Se utiliza en la evaluación de
salas para la palabra hablada.
Valores entre 40% y 80%
permiten una buena
inteligibilidad de la palabra.
Fracción de energía lateral (LF)
Es el cociente entre la
energía correspondiente a
las reflexiones laterales y
la energía total en los
primeros 80 ms.
Fracción de energía lateral (LF)
0,08
∫0,005
LF = ——————
p g
2
(t) dt
0,08
∫ (t) dt
p
0
2
300º 60º
90º
Sensibilidad
270º
nula
240º 120º
210º 150º
180º
Correlación interaural (IACC)
Es una medida de la
diferencia entre los sonidos
que llegan a ambos oídos.
Correlación interaural (IACC)
t2
IACC(τ) =
∫ p (t) p (t + τ) dt
t1
——————————
I D
t2 t2
∫t1
pI2(t) dt ∫
t1
pD2(t) dt
Correlación interaural (IACC)
t2
IACC(τ) =
∫ p (t) p (t + τ) dt
t1
——————————
I D
t2 t2
∫t1
pI2(t) dt ∫
t1
pD2(t) dt
IACC(τ) =
∫ p (t) p (t + τ) dt
t1
——————————
I D
t2 t2
∫t1
pI2(t) dt ∫
t1
pD2(t) dt
IACC(τ) =
∫ p (t) p (t + τ) dt
t1
——————————
I D
t2 t2
∫t1
pI2(t) dt ∫
t1
pD2(t) dt
IACC(τ) =
∫ p (t) p (t + τ) dt
t1
——————————
I D
t2 t2
∫t1
pI2(t) dt ∫
t1
pD2(t) dt
IACC(τ) =
∫ p (t) p (t + τ) dt
t1
——————————
I D
t2 t2
∫t1
pI2(t) dt ∫
t1
pD2(t) dt
Se define el coeficiente de
correlación interaural, IACC, como
el máximo valor de |IACC(τ)|.
Correlación interaural (IACC)
pD(t+τ )
t
pI(t)
IACC < 1
t
pD(t+τ )
t
Correlación interaural (IACC)
AI = ΣAI
i=1
i
AIi es la inteligibilidad de la banda i,
obtenida de
(S/R)i + k
0,05 ———— si (S/R)i + k ≤ 30
30
AIi =
0,05 si (S/R)i + k > 30
AI = Σq ∆L
i=1
i i
t
La señal recibida tendrá una
menor amplitud de
modulación a causa del ruido
y de la reverberación.
La señal recibida será:
Po
Po
p(t)
Po Po m(F)
t
Se define la función de
transferencia de modulación
como:
f
80 Hz