Sunteți pe pagina 1din 31

¿Qué es Ambiophonics?

Tal cual se recoge en la página web del Ambiophonics Institute, esta es una pregunta de respuesta inquietante:

The Ambiophonics method combines an exploitation of seldom applied, but well documented, psychoacoustic principles with
the basic rules of good musical performance space design to create believable concert-hall sound fields in dedicated home
listening rooms.

http://www.ambiophonics.org/#WhatIs

De acuerdo, muy bien, deme una docena porque justamente esto es lo que quiero.

¿Y quién no? ¿Qué audiófilo no busca precisamente este objetivo a la hora de conformar su sistema estéreo, o de home-cinema? La
definición que se nos presenta es más una ambiciosa declaración de intenciones que la descripción de un método. Y es que, luego lo
veremos, Ambiophonics es, más que un método definido, una colección de recetas técnicas, combinables de modo abierto por el
aficionado, organizadas en torno a un "gadget" denominado dipolo estéreo o ambiopolo (o incluso ambiodipolo), con un objetivo
simple: el de la definición anterior.

Un punto a favor de Ambiophonics y claramente ventajoso para el aficionado a la hifi es que no parte de un enfoque rupturista. No
se necesita redefinir completamente todo: grabación, formatos, altavoces, etc. Aunque tiene recetas para muchos de los aspectos
de la hifi, permite una aplicación gradual. Su configuración más simple, el ambiopolo, únicamente le exige a la grabación estéreo
que incluya una localización de escena musical realista. En este sentido es perfectamente compatible con nuestras grabaciones
favoritas.

El propósito final de Ambiophonics es erigirse en sustituto del estéreo en el ámbito de la reproducción, aportando soluciones a los
problemas inherentes de este último a la hora de ofrecer una presentación realista de la escena sonora recogida en las grabaciones.
1.- El ambiopolo.
Como ya hemos comentado, el ambiopolo es el elemento central, y el mínimo, que conforma un sistema Ambiophonics. Otra forma
de verlo sería a partir de la analogía: un ambiopolo es a Ambiophonics lo que un par de altavoces es para un sistema estéreo. Más
aún, un ambiopolo es un par de altavoces configurado de modo que permita superar algunas de las limitaciones del estéreo siendo
compatible con sus modos de grabación. Por lo tanto, de la comprensión de las limitaciones del estéreo es de donde parte esta
explicación de qué es un ambiopolo.

1.1. - El triángulo estéreo.

Comencemos viendo en un esquema en qué consiste un sistema estéreo.

Para cualquier aficionado al sonido, este esquema es una trivialidad, no obstante conviene repasar algunas de sus características:

Un sistema estéreo emite dos señales distintas desde dos altavoces situados uno a cada lado del oyente. Esta diferencia entre
señales es lo que da lugar al fenómeno sicoacústico de la localización virtual.

El oyente se encuentra equidistante de ambos altavoces. En dicho eje se da el óptimo del fenómeno de la localización virtual.
Es decir, que cajas y oyente están en los vértices de un triángulo al menos isósceles.

El estéreo óptimo se dispone ubicando las cajas a la misma distancia entre ellas que la que les aleja del oyente. Es decir,
formando altavoces y oyente un triángulo equilátero ( Dco=Dcc ).

Un parámetro de uso habitual en estéreo es el ángulo entre cajas: se define como el ángulo que, en la posición del oyente, se abre
entre una caja y otra. Siguiendo el esquema, esté ángulo sería 2*alpha. El triángulo equilátero de la disposición nominal en estéreo
proporciona un ángulo entre cajas de 60°.

Para aquellos que quieran conocer cúal es el ángulo entre cajas de su sistema, la relación trigonométrica es simple:
Siendo H la distancia del oyente al eje que une los frontales de ambas cajas. Hay que recordar que todas estas medidas se efectúan
tomando como referencia el eje central frontal de cada caja y que, habitualmente, las calculadoras proporcionan el ángulo en
radianes.

1.2. Localización real y virtual.

Aunque los detalles del proceso auditivo de localización de fuentes sonoras se escapan al alcance de este artículo, es necesario
hacer un breve repaso a tres importantes mecanismos binaurales que empleamos para conocer de dónde nos llega un sonido.

Interaural Level Diference (ILD). Su explicación es muy simple, el sonido que nos llega se percibe con más intensidad en el
oído situado más cerca de la fuente. Esta diferencia se debe principalmente a que la propia cabeza produce un "efecto sombra"
que disminuye la presión sonora que llega al oído opuesto al origen de dicho sonido.

Interaural Time Diference (ITD). Aunque sea muy pequeña la diferencia, el sonido llega antes al oído más próximo a su
origen. Esta diferencia también se emplea como señal de localización azimutal.

Head Related Transfer Function (HRTF): Un par de ILD e ITD determinados no definen completamente una dirección de
llegada de un sonido, sino que dan lugar a lo que se conoce como "cono de confusión" o "confusión frente-detrás". Lo que nos
permite distinguir el correcto punto de llegada del sonido en estos casos son las diferencias tonales inducidas por las asimetrías
de la cabeza y orejas principalmente. Una misma fuente de sonido se percibe con distinto timbre según la tengamos al frente, a
los lados o detrás. O bien se encuentre a cierta altura por encima o por debajo del plano de horizonte.
En el caso de reproducción de escenas musicales, son más importantes las ILD e ITD que la HRTF, puesto que el sonido suele venir
del frente sin necesidad de discriminación tanto de arriba-abajo como de delante-detrás. El siguiente esquema nos permite entender
como varían tanto ILD e ITD con el ángulo horizontal de llegada del sonido.
Como podemos ver, en el caso de una fuente centrada, como por ejemplo la guitarra del esquema superior, tanto la ILD como la
ITD son cero. El efecto sombra de la cabeza es idéntico para ambos oídos y la distancia que recorre el sonido es la misma. En el
caso de la trompeta o el piano, el oído situado en el lado opuesto detectará que el sonido le llega algo más tarde (no hay más que
comparar las longitudes de las líneas punteadas) y con menor intensidad (por efecto del sombreado inducido por la cabeza).

Dado que de esta forma somos capaces de localizar azimutalmente un sonido, el objetivo del estéreo es tratar de simular este tipo
de sonidos, de forma que la grabación de un instrumento musical sonará por ambos canales/altavoces, aunque en uno de ellos lo
hará con un pequeño retardo y, especialmente, con menor intensidad. El oyente, al percibir esta señal con diferentes intensidades
en cada oído, tenderá a localizar (virtualmente) el instrumento hacia el lado donde más suene y tanto más desplazado lateralmente
como mayor sea la diferencia de niveles detectados.

En grabación, la técnica principal de generación de localizaciones virtuales es el "panning". Mediante esta técnica, cada pista
grabada es ubicada en el espacio por reparto de niveles relativos entre canales. Si en ambos canales el nivel es igual, estará en el
centro, si sólo se presenta en un canal estará en un límite lateral del sistema estéreo.

http://en.wikipedia.org/wiki/Panning_(audio)
Una ley habitual en "panning" es la de la tangente:

La posición aparente de una fuente de sonido (un instrumento musical) es función del reparto de nivel entre el canal izquierdo (L) y
el canal derecho (R). En esta ecuación 2*alpha es el ángulo entre cajas.

http://www.davidgriesinger.com/pan_laws.pdf

Este tipo de técnicas de localización virtual funciona gracias al mecanismo de identificación binaural basado en la ILD.

Para que esta virtualización espacial funcione, el sistema estéreo debe estar dispuesto en forma de triángulo al menos isósceles, o
mejor aún, en triángulo equilátero, tal cual se ha comentado en el apartado 1.1. Si no hay simetría, a igualdad de niveles entre
canales, el punto central estéreo, virtual, podría desplazarse de su correcta ubicación a un lado u otro.

1.3. El problema de la diafonía acústica.

El fundamento del "panning", o de la virtualización de ubicación de fuentes en estéreo, es sencillo y, como todos hemos podido
comprobar alguna vez, de modo básico funciona. No obstante, el estéreo presenta una importante distorsión conocida desde sus
primeros tiempos: la diafonía acústica.

La diafonía acústica es este fenómeno tan obvio en la escucha de un sistema estéreo que generalmente es ignorado. Un oyente no
escucha un solo altavoz por cada oído, sino ambos por ambos oídos. En cada oído se escuchará, además del correspondiente a su
lado, el altavoz cruzado, con valores de ILD e ITD dados por su ubicación física. El siguiente esquema, tomado de la página web del
Ambiophonics Institute, nos introduce de lleno en la diafonía acústica (crosstalk en inglés):
Como podemos apreciar, realmente en estéreo no escuchamos una trompeta en el centro, si no dos trompetas simultáneas a +30°
y -30°. Por igualdad de la señales principales (caja derecha a oído derecho, caja izquierda a oído izquierdo), tenderemos a
localizarla en el centro, es decir, habrá unas pseudo-ILD y pseudo-ITD nulas. Pero habrá también una distorsión causada por dos
cruces de señal, el propio sonido de trompeta, con un "sombreado" superpuesto a la señal principal, la cual se ubicará con unas ILD
e ITD extrañas. Es lo que se conoce como "filtro comb" y afecta tanto al timbre como a la precisión de la ubicación de nuestra
trompeta.

Ahí no queda todo, esta distorsión va más allá: supongamos que nuestra trompeta está a 45° a la derecha, ¿de dónde saldrán esos
15° más allá de la ubicación del altavoz derecho? aunque la ley panning de la tangente pasa a ser inaplicable, sabemos que existe
"una ILD y una ITD para 45°" y seguro que se puede diseñar una señal estéreo a base de retardos y contrafases que pueda generar
un sonido que se perciba más allá de los altavoces. Pero, aunque sea factible hacerlo, en esta situación la diafonía acústica va a
jugar a la contra y nos va a impedir, por mucho, alcanzar esos 45°. Porque la distorsión por diafonía va a estar solapándose, en
niveles y retardos, con la señal diseñada para alcanzar a simular esa posición virtual requerida. Si en circunstancias reales, un
sonido que nos llega desde un lado (±90º) se percibe con una ITD de 0.7 ms, en un sistema estéreo es difícil, por no decir
imposible, superar una ITD de 0.25 ms. En una configuración LCR de un 5.1 la ITD máxima posible será incluso menor.

Alguien dirá: no importa, colocamos las cajas a 45° y ya tenemos nuestra trompeta a 45°. Pues sí, pero la diafonía acústica va a
insistir en cobrarse su precio: en cuanto la trompeta se mueva al centro, la ubicación virtual de la trompeta tenderá a difuminarse
ensanchándose hacia los lados. Este caso se comprueba de modo simple poniendo los altavoces a 180° y escuchando una
grabación mono: tendremos una bonita demostración del efecto "agujero-en-medio". La causa de este efecto es que aunque ITD e
ILD sean nulas, la percepción tonal que nos proporciona la HRTF no nos engaña: suena mucho más parecido a dos sonidos laterales
que a uno centrado. Y es que, gracias a las HRTF, nuestras orejas actúan también como discriminadores de dirección de llegada del
sonido en función de la distinta percepción tonal.

En resumen, la diafonía acústica es responsable de la imprecisión con la que se percibe en estéreo el canal central virtual y
responsable de que no se pueda hacer que una escena sonora virtual sobrepase de modo claro los límites del ángulo entre cajas de
altavoces.

El filtro comb producido por la diafonía acústica es además responsable de otra distorsión sonora del estéreo: "apaga" la ambiencia
(reverberación) disponible en la grabación, dado que dicha ambiencia es, de modo básico, una serie de ecos retardados del sonido
principal, y la diafonía se tiende a percibir de la misma forma pero a un nivel comparativamente muy alto. Esto a su vez afecta a la
sensación de profundidad, que está relacionada con lo anterior, dado que en dicha sensación influye mucho el peso del sonido
principal frente a la reverberación que generó en el momento en que fue grabado.

Asimismo, nuestro diablillo cruza-canales es el causante de la deslocalización de la citada ambiencia, especialmente la "muy lateral"
( decorrelada entre canales). Esta última distorsión es la que ha dado lugar, en parte, a la necesidad de evolución a sistemas
"surround" donde se intenta generar/grabar señales de ambiencia lateral con fuerte decorrelación (bajo Interaural Cross Correlation
- IACC).

http://www.davidgriesinger.com/physics3_ton02.pdf

1.4. Canceladores de diafonía.

Como ya se ha citado, la diafonía en sistemas estéreo es una distorsión conocida desde sus inicios. Dado que es, a todas luces, un
efecto indeseable, se han diseñado diferentes experimentos llevados a cabo para eliminarla. El más simple es el de la barrera física
entre altavoces. Un par de imágenes son la mejor descripción:
Extraídas del trabajo de D. B. Keele Jr.:

http://www.xlrtechs.com/dbkeele.com/papers.htm

Part 1: Preprint No. 2420-A (B-10)


Part 2: Preprint No. 2420-B (B-10)

A la vista de las imágenes se puede apreciar que, aunque el método de la barrera física sea muy efectivo, no resulta especialmente
cómodo como para hacerlo útil en el ámbito doméstico.

No obstante, nos permite mostrar una característica importante de los sistemas con cancelador de diafonía acústica: las cajas de
altavoces están llamativamente próximas entre sí. Esto se hace por un motivo: al acercarlas, el filtro comb se produce a frecuencias
cada vez mayores, con lo cual la percepción de enfoque de la imagen central virtual mejora. Recordemos lo que ya hemos
comentado: cuanto más abramos el ángulo entre cajas, peor se percibirá la localización central.
Esta proximidad entre cajas no supone merma de la amplitud de escena; al contrario, la propia barrera física hace que, a efectos
prácticos, los altavoces sean sonoramente ilocalizables, con lo cual toda la localización es virtual y está construida a partir de las
señales binaurales (ITD, ILD, panning...) contenidas en la grabación. Únicamente hay una cierta distorsión en los extremos finales
de la escena debida a la diferencia entre el HRTF muy lateral, que es el que sería deseable conseguir en este caso, y el HRTF real,
producido por la escucha con los altavoces muy cercanos uno del otro.

A la vista de la incomodidad de uso, ¿no se podría construir una barrera de este estilo, pero basándonos en principios acústicos, de
forma que se pueda convertir en algo invisible? Sí, se puede.

Realmente no es hacer una barrera, sino conseguir que un canal emita una señal que sea capaz de anular en cada oído,
parcialmente al menos, aquella señal que es el cruce que llega desde el altavoz opuesto. Algo como esta propuesta de Polk Audio:
Este esquema podemos encontrarlo aquí:

http://www.polkaudio.com/downloads/whitepapers/SDA_WhitePaper.pdf

Aquí lo que vemos es que cada caja lleva dos altavoces, uno para la señal principal y otro encargado de cancelar la diafonía
provocada por el canal opuesto. En principio, el funcionamiento de este sistema es a modo fijo, sin posibilidad de configuración
alguna y a buen seguro obliga a un cuidadoso estudio de ubicación del triángulo estéreo de manera que realmente los altavoces
dedicados a la cancelación sean efectivos.
En esta página web:

http://pagesperso-orange.fr/pol.bct/exemples/Ambio.htm

podemos ver una foto de una instalación de este tipo.

Las columnas laterales son las responsables de la cancelación de diafonía provocada por la emisión principal desde las cajas de
suelo situadas en el centro. Quizás la banqueta pudiera ser sustituida por algo más cómodo.

Otro modo de verlo: los altavoces laterales emiten, uno en contrafase del otro, lo que se conoce como señal "Side" de la
descomposición del estéreo en "Mid/Side":

http://www.wikirecording.org/Mid-Side_Microphone_Technique

La componente "Side" es la portadora de la localización lateral de una grabación estéreo. Es decir, que lo que esta técnica hace es
potenciar la componente lateral por emisión combinada entre dos pares de cajas. Es la sincronización espacio-temporal de cada par
lo que hará que la cancelación de diafonía sea más o menos eficaz.

1.5. El ambiopolo.

Ahora por fin estamos en condiciones de presentar al elemento principal de Ambiophonics: el ambiopolo.

Un ambiopolo está formado por un par de altavoces, situados en un ángulo entre ellos de unos 20° a 30°, a los cuales se les
incorpora cancelación de diafonía (Crosstalk Canceller en inglés - XTC), generalmente mediante tratamiento DSP.

Como se muestra en el esquema de un ambiopolo, la barrera física puede sustituirse por procesamiento digital (software).
Ambiophonics propone, como algoritmo XTC, lo que denominan Recursive Ambiophonics Crosstalk Eliminator (RACE). Un desarrollo
propio, del cual el Ambiophonics Institute proporciona acceso libre desde su página web, y cuyo diagrama operativo es como sigue:
La idea subyacente a este algoritmo es que el sonido que llega a cada oído desde su altavoz cruzado (caja derecha a oído izquierdo
y caja izquierda a oído derecho) se puede cancelar (al menos parcialmente) mediante una réplica emitida desde el altavoz directo
(caja derecha a oído derecho y caja izquierda a oído izquierdo). Para que está réplica cumpla su función, debe ser de polaridad
invertida (para poderse cancelar al combinarse con la señal original), adecuadamente retrasada temporalmente (de modo que
coincidan ambas señales, original y réplica, en el oído en el instante correcto) y adecuadamente atenuada (para tener en cuenta el
"efecto sombra" que la cabeza produce sobre el sonido que se cruza). Además, debido a que el "efecto sombra" de la cabeza es
función de la frecuencia de la señal (recordemos los HRTF), el algoritmo RACE solo se aplica a una banda de frecuencias concreta,
en torno a 250 Hz - 5 kHz, donde su efectividad es buena.

Este algoritmo además tiene en cuenta que la señal canceladora a su vez debe ser cancelada desde el canal opuesto, idea que
llevada al infinito (o a efectos prácticos hasta niveles inaudibles) da lugar a la necesidad de recursividad.
Como ya se ha citado, RACE requiere ser implementada por DSP, pudiéndose emplear de modo directo o mediante la generación de
filtros FIR (dos por cada canal, directo y cruzado) y su aplicación por convolución.

Según muestra el esquema de su algoritmo, RACE dispone de varios parámetros configurables:

1. Atenuación. La atenuación a aplicar en cada paso de RACE puede variar entre -2 dB y -8 dB. Como regla general, a menor
ángulo entre cajas (10º a 20º) menor debe ser la atenuación a aplicar (2 a 3 dB) y conforme aumente este ángulo mayor
debería ser la atenuación elegida. Esto es así porque a mayores ángulos mayor es el "efecto sombra" entre lados cruzados
debido a la influencia de la cabeza (Interaural Level Difference - ILD).

2. Retardo. El retardo a aplicar en cada paso de RACE puede definirse sobre un margen de entre 50 a 120 microsegundos. Como
regla general, a mayor ángulo entre cajas, mayor será el retardo a configurar, puesto que aumenta la diferencia de tiempo
entre el sonido que llega al oído directo y al cruzado (Interaural Time Difference - ITD).

3. Frecuencias de corte de la aplicación del efecto RACE. Cómo ya se ha citado, el algoritmo RACE ha de tener en cuenta
que el "efecto sombra" es función de la frecuencia, siendo mínimo a frecuencias bajas (la diafonía en graves es total puesto
que la cabeza no le hace apenas sombra a sonidos de longitud de onda mayor a su tamaño) y completo a frecuencias muy
altas (la diafonía en agudos superiores es prácticamente nula, siendo más influyentes en localización a estas frecuencias los
cambios tonales debidos al ángulo de incidencia del sonido en las orejas - HRTF).

Es decir, RACE incorpora en su algoritmo la posibilidad de ajustarse a los ILD e ITD de nuestro sistema concreto, de tal forma que
podamos alcanzar el óptimo de XTC sea cual sea nuestro caso, aunque independientemente de que este óptimo sea satisfactorio.

Una buena configuración de RACE proporciona, si la grabación así lo dispone, una gran amplitud de escena sonora y una mejora en
las sensaciones de profundidad y de ambiencia, aspectos estos últimos en los que supera a cualquier otro tipo de diseño de sonido
envolvente. Las anomalías comienzan a aparecer en cuanto se desajusta este efecto: si hay un exceso de retardo, el sonido tenderá
a abrir mucho la escena musical pero con muy mala precisión en la localización individual de fuentes; el ambiopolo pasa a
comportarse de modo parecido a lo que ocurre con sistemas estéreo con un canal fuera de fase. Por otro lado, si hay un defecto de
atenuación, la escena sonora en vez de abrir se cierra aún más que en estéreo.

2. Ambiophonics básico: un ambiopolo.


El sistema Ambiophonics más simple está formado por un solo ambiopolo, siendo la presencia de XTC (aportada por el algoritmo
RACE) su característica principal. En la siguiente fotografía se muestra un ambiopolo presente en el Ambiophonics Institute, formado
por un par de altavoces electrostáticos de SoundLab:
Otra propuesta más pequeña, empleando dos satélites Bose, combinados con un subwoofer:

Mediante la aplicación de RACE, se consiguen varias ventajas sobre el estéreo convencional:

Atenuamos la mayor reflexión "dura" que presenta un sistema estéreo: la diafonía acústica. Si existen numerosos estudios
publicados acerca de los perniciosos efectos que las reflexiones cercanas de alto nivel tienen en la sensación de enfoque de
localización virtual, todos los argumentos presentados a favor de un tratamiento amortiguador de este sonido rebotado son de
aplicación al caso de la diafonía.

Con un conveniente acercamiento entre cajas (de 20° a 30°) se mejora la distorsión de filtro comb, subiendo la frecuencia a la
que aparece. Esto permite mejorar en focalización central, algo fácilmente comprobable si escuchamos música monofónica en
un ambiopolo.

Al atenuar los cruces acústicos, se impide la formación de señales ILD e ITD relacionadas con la posición de las fuentes
sonoras reales: las cajas de altavoces tienden a hacerse menos "localizables". En un XTC ideal las cajas "desaparecerían" de la
escena y dicha escena se presentaría con los ILD e ITD propios de la grabación, sean coherentes o absurdos. Esto da lugar a
escenas sonoras de amplitudes que pueden doblar al estéreo convencional, yendo a 120° o incluso más allá. Es importante,
llegados a este punto, aclarar que RACE no es un efecto cuyo impacto sea ajustable: o disponemos de XTC o no disponemos
de ella. Al no ser ajustable su efecto, RACE no modifica por igual la escena musical, independientemente de la grabación. Habrá
grabaciones que abran 120º y habrá otras que no pasen de 60º. No es decisión del ajuste del XTC ni nuestra: es
exclusivamente el "panning" incorporado a la grabación tal cual se presente.

La localización espacial de la ambiencia y profundidad, tal cual esté recogida en la grabación, pasa a ser más perceptible. Esto
da lugar a que en algunas grabaciones los instrumentos se escuchen envueltos en un halo de reverberación que se desarrolla
en los límites laterales (alrededor de 120° o incluso más allá), y en otras dicha reverberación se haga muy presente y/o muy
centrada (reverb artificial de voces solistas, por ejemplo).

El resultado para el aficionado es que pasar de estéreo a Ambiophonics es pasar a escuchar como nuevas nuestras archiconocidas
grabaciones favoritas. Resulta sorprendente, por ejemplo, el nivel de sonido surround que Ambiophonics puede extraer de
grabaciones que pertenecen a los inicios del estéreo comercial, comienzos de los años 50.

El uso de Ambiophonics demuestra que los diseños multicanal, conforme van incluyendo más canales, van incluyendo más
distorsión por diafonía acústica, lo cual va en contra de algunos de los objetivos del sonido envolvente. Del uso de Ambiophonics se
puede concluir que el canal/altavoz central, aunque mejora la precisión de la localización central, es una solución lejos del óptimo
para un problema que realmente es causado por la diafonía, puesto que en realidad disminuye la ITD virtual disponible en dicho
sistema.

3. PanAmbio: el envolvente total con dos ambiopolos.


Para grabaciones multicanal (típicamente 5.1 canales), Ambiophonics presenta una solución basada en dos ambiopolos, uno
delantero y otro trasero, de forma que se pueden cubrir cerca de los 360° máximos disponibles con buena precisión de foco en
localización virtual. Este sistema recibe el nombre de PanAmbio (PanAmbio 4.x).
Dicha solución no impide la incorporación de subwoofers al sistema, en las mismas condiciones que en el caso de sistemas 5.1.
Ambiophonics recomienda que el ambiopolo trasero esté ligeramente elevado, unos 15º, para facilitar su escucha como emisor de
ambiente. Solución que también se suele adoptar en sistemas 5.1 para las cajas surround.

El enrutamiento de canales es como sigue:

Canales frontales derecho e izquierdo se dirigirán a los altavoces RF y LF respectivamente.

El canal central se dividirá entre 2 (-6 dB de atenuación de nivel) dirigido hacía los altavoces RF y LF, puesto que ambiophonics
no emplea altavoz central.
Los canales surround derecho e izquierdo irán al ambiopolo trasero, altavoces RB y LB respectivamente.

Según señala Robin Miller, del Ambiophonics Institute, la localización virtual se desarrollaría de la siguiente forma según cada
sistema empleado:

Localización en un sistema 5.1 convencional. La localización frontal está atrapada entre las cajas frontales. La localización surround
se desarrolla muy cerca de las cajas surround, a unos 120°.

Localización en un sistema PanAmbio, con todas las ventajas que supone emplear dos ambiopolos. Amplitud máxima de escena,
correcta presentación de instrumentos conforme a los ILD e ITD de la grabación.
Localización tras un downmix a estéreo. Toda la escena colapsa a 60° de amplitud, especialmente concentrada en los extremos del
sistema, a ±30º.

4. Ambiovolver. Generación de ambientes envolventes.


Como hemos mostrado a lo largo de esta explicación, Ambiophonics trata de conseguir un tipo de realismo en la presentación de
una escena musical diferente del ofrecido por el estéreo. Frente al "ellos están aquí" del estéreo, Ambiophonics persigue el "tú estás
allí", algo que en estéreo sabemos que es imposible.

Gracias al ambiopolo, Ambiophonics puede convertir una grabación estéreo en una experiencia próxima al realismo del sonido
envolvente. No obstante, faltarían algunas prestaciones importantes para alcanzar el máximo realismo como son:

Ser capaces de suplantar ambiencias y superponer a la acústica de una sala doméstica la ambiencia (binaural) de una sala de
conciertos o escenario musical. Para el caso de grabaciones multicanal, el PanAmbio sería la solución directa que Ambiophonics
ofrece. Pero, ¿se puede plantear alguna receta que ofrezca ambiente lateral y trasero a partir de una grabación estéreo?

Poder ofrecer, además de las ILD's e ITD's tal cual están en la grabación, los cambios tonales inducidos por la HRTF al menos
en los casos de ubicación virtual más extrema. Si los altavoces están muy cerca uno del otro (20º entre ellos) la percepción
tonal siempre será la de esta dirección, algo que afectará al realismo en la percepción de los sonidos más desplazados a los
lados.

Realmente aquí entramos en terrenos poco definidos por Ambiophonics; propuestas a la vez ambiciosas y faltas de un desarrollo
detallado, las cuales además en muchos casos se solapan con las tradicionales codificaciones surround (del tipo Dolby Pro Logic).
Veamos un esquema de una propuesta tomada de la propia página web de Ambiophonics:
El sistema estaría formado por un ambiopolo frontal y numerosos altavoces de ambiente+surround. Para los altavoces de ambiente
la señal emitida se genera por convolución de la principal con impulsivas preparadas a tal efecto ambiental. Este sistema anexo al
ambipolo es lo que en Ambiophonics se conoce como Ambiovolver.

El Ambiovolver requiere de filtros de convolución muy particulares, puesto que, además de ser impulsivas de reverberación
(naturales o artificiales), tienen que estar registradas o generadas teniendo en cuenta la localización desde la que llegaría el sonido
rebotado/reverberante y su naturaleza binaural. Todo ello teniendo en cuenta que las citadas impulsivas correspondan a un tipo de
escenario o ambiente compatible con lo que se ha incluido en la grabación estéreo original. En definitiva, algo que no es
precisamente sencillo de conseguir:
http://pcfarina.eng.unipr.it/Public/Presentations/Ambiophonics.pdf

En este caso Ambiophonics se apoya en los trabajos de Michael A. Gerzon, creador de Ambisonics:

http://www.acoustics.net/objects/pdf/review_aes_gerzon01.pdf
Otra propuesta adicional que se hace desde el Ambiophonics Institute es utilizar dos altavoces laterales para emitir la señal surround
tomada de un decodificador Dolby Pro Logic, planteamiento que parece ser que ayuda al ambiopolo frontal a ofrecer con mayor
claridad y definición aquellos sonidos procedentes de los extremos del campo sonoro virtual. Esto se debería a que la incorporación
de altavoces surround favorecería la correcta presentación tonal (HRTF) de los sonidos de ángulos más abiertos, por combinación
entre el sonido llegado desde el ambiopolo y el recibido desde estos altavoces laterales a 180º de ángulo entre ellos. Para que esto
ocurra, estos altavoces han de emitir solamente aquellas señales más laterales, sin afectar a la escena central. De ahí el uso de
métodos Dolby Surround en la generación de la señal a hacer sonar desde estas cajas.

En cualquier caso, tanto los altavoces de ambiente como de surround no precisan ser full-range ni llevar instalado ningún sistema
XTC.

La última propuesta, en lo que parece una sesión de brainstorming por parte del Ambiophonics Institute, es montar un PanAmbio
(dos ambiopolos, frontal y trasero) y emitir por el dipolo estéreo trasero una "señal semejante" a la que emite el ambiopolo frontal
(ver http://www.ambiophonics.org/papers/LLRG-TactManual.pdf ). Parece evidente que esta propuesta necesita de mayor
definición antes de poder ser analizado su interés o conveniencia de llevarla a cabo.

Por no extendernos en la descripción de tantas alternativas, no probadas personalmente por Matrix Hi-Fi, toda esta variedad de
propuestas las tiene explicadas Ralph Glascal, creador de Ambiophonics, en este artículo: http://www.ambiophonics.org/files
/AES24Banff.pdf

5. Ambiophonics y DRC.
¿Hay algún requisito que tengan que cumplir los altavoces y la sala en la que se encuentren para que Ambiophonics funcione de
modo óptimo? Por supuesto. Primero están los habituales: equipo lineal en todo su margen de potencia habitual (baja distorsión,
bajo ruido de fondo); y cajas correctamente diseñadas y construidas: respuesta en frecuencia bien acotada en el rango audio (20
Hz - 20 kHz), sin estridencias, baja distorsión en su margen dinámico de uso, sin problemas de desajuste entre vías ni en amplitud
ni en fase.

Desde el punto de vista acústico, es muy importante que la disposición de los altavoces forme un triángulo isósceles con el oyente,
con un ángulo entre cajas que para el XTC óptimo estaría entre los 20º y 30º, así como que ambas cajas tengan una respuesta en
frecuencia similar, medida desde el punto de escucha. Este último requisito puede parecer obvio, pero obliga a que el entorno
acústico de cada caja no sea muy distinto al de su pareja (evidentemente acercarlas entre sí ayuda a que esto se cumpla). Es decir,
las asimetrías sonoras inducidas por el entorno acústico impactan negativamente en el correcto funcionamiento de RACE.

Desde el punto de vista específico de la sala, el mayor competidor acústico de la aplicación de XTC son las reflexiones laterales
duras, las cuales deben retrasarse y aminorarse con respecto al sonido directo lo suficiente para que no desenfoquen la apertura de
escena sonora. Por suficiente podemos entender que la distancia de cada caja a su pared lateral más próxima sea igual o mayor que
la distancia entre cajas. Esta es otra necesidad a la que el acercamiento de las cajas entre sí ayuda a que se cumpla. Por supuesto,
la aplicación de elementos absorbentes/difusores que ayuden a disminuir la dureza de las citadas reflexiones es siempre bienvenida.

El resto de necesidades es el mismo que el de un sistema estéreo normal: linealidad en la respuesta en frecuencia de cada altavoz
en el punto de escucha y reducción del impacto de bolas de graves producidas por el comportamiento modal de la sala. Para estas
últimas necesidades, la ecualización acústica (aplicando algoritmos DSP del tipo Digital Room Correction) es la solución más
práctica. Como bien señala Ralph Glascal desde ese pragmatismo que impregna todo Ambiophonics:

The Ambiophonics Institute also strongly recommends room treatment and room/speaker correction. DSP
based room correctors are now widely available and can correct most speaker responses and eliminate the
worst of the bass room modes. At the high frequencies, absorbent room treatment is useful to avoid
erroneous early reflections of direct sound.

http://www.ambiophonics.org/files/aes111a.pdf

Nada más que añadir que sumarnos a la recomendación. En el caso de DRCoP, la solución para la aplicación de ecualización acústica
a sistemas hifi diseñada por Matrix Hi-Fi y disponible para uso libre, la adaptación de RACE a su operativa, centrada en el uso del
convolver GNU/Linux brutefir, ha sido relativamente sencilla. De ahí que a partir de la versión 0.7 se haya incorporado
Ambiophonics a DRCoP (DRCoP Ambiophonics Edition) como un elemento más, utilizable a conveniencia del usuario. A diferencia de
lo que Glascal indica en alguno de sus documentos, en DRCoP el primer paso en la secuencia de tratamientos DSP lo es a través de
RACE y posteriormente se aplican los filtros DRC a cada canal, donde ya están incluidos la señal directa y los ecos de cancelación de
diafonía.

Es importante señalar que, aunque el impacto sea pequeño, la incorporación de RACE a un sistema tiende a cambiar el timbre del
sonido percibido. Esto es debido a dos causantes: la atenuación de la distorsión de filtro comb estéreo, lo cual podemos calificar
como efecto positivo, y la desviación de RACE de lo que sería la correcta cancelación de diafonía, pudiendo introducir pequeños
efectos tonales no deseados. Es imposible saber a priori cúal es cúal en aquellos cambios tímbricos que se produzcan. La
minimización de dicho impacto tímbrico es uno de los pasos inevitables del correcto ajuste del algoritmo RACE en la instalación de
DRCoP en un sistema hifi.

Además, hay que tener en cuenta que, en el caso de RACE, el efecto XTC es inmedible empleando únicamente un micrófono
omnidireccional en el punto de escucha. Con lo cual las medidas de este estilo, habituales en DRC, no van a permitirnos conocer si
estamos o no en un buen punto de minimización de diafonía. Para esta medida haría falta un KEMAR, algo que está lejos del alcance
del aficionado común. Dicho aficionado dependerá, inevitablemente, de sus propios oídos para valorar si RACE está funcionando
correctamente o no. A su favor juega que hay bastantes grabaciones donde el impacto audible de la correcta instalación de un
Ambiophonics básico es bastante más que un "cambio sutil", resultando perfectamente distinguible en prueba ciega.

6. Los filtros RACE en DRCoP.


DRCoP ofrece una implementación propia, configurable a medida de cada instalación, del algoritmo RACE. Dicha implementación
parte de generar unos filtros FIR que se aplican en tiempo real por convolución, empleando para ello el programa Brutefir.

La siguiente captura de pantalla de Audacity muestra las impulsivas de la parte recursiva (sin filtrar en banda) del algoritmo RACE.
La gráfica superior es la parte recursiva del canal directo y la gráfica inferior la parte recursiva del canal cruzado.

Como vemos, el cancelador en el canal cruzado va en contrafase del canal directo. La aplicación de la recursividad es la que da lugar
a esta serie de picos decrecientes progresivamente, según indique la atenuación configurable, y separados entre si por un retardo
también configurable: al sonido directo en el instante cero le sigue un impulso en contrafase en el canal cruzado, convenientemente
atenuado y retrasado. Al que le sigue otro impulso, en el canal directo, igualmente atenuado y retrasado. Así hasta bajar de -100
dB-FS, lo que ocurre en menos de 1.5 ms.

Una vez filtrados ambos canceladores para que se apliquen en la banda de frecuencia deseada, sus respuestas impulsivas quedan
de este modo:
Se puede observar que DRCoP aplica el filtrado indicado en el algoritmo RACE empleando filtros de fase lineal (retardo de grupo
constante). La respuesta en frecuencia del impulso directo:
Hay un impacto en la respuesta en frecuencia acotado, en el caso del ejemplo, en un margen de menos de 4 dB. Este rizado será
función de los parámetros RACE configurados en cada caso. A menor atenuación aplicada, más rizado. En cuanto a la respuesta en
frecuencia del impulso cruzado:
Donde se observa la banda de frecuencia sobre la que se aplica XTC, en el caso del ejemplo entre los 400 Hz y los 2000 Hz. Como
ya hemos comentado, y estas respuestas en frecuencia confirman, los impulsos RACE, al aplicarse por convolución, pueden dar
lugar a pequeños cambios en la tonalidad presentada en el caso de que el efecto RACE no se ajuste con precisión a la diafonía
existente. De ahí que sea importante la correcta configuración de los parámetros que DRCoP ofrece en su aplicación
Ambiophonics-RACE, de forma que se tenga en cuenta las particularidades del sistema donde se está aplicando.

En pruebas realizadas con DRCoP empleando solo RACE y en un equipo tan simple como altavoces típicos de ordenador portátil, el
efecto es audible configurado con 2 muestras de retardo y 2.5 dB de atenuación, lo cual facilita montar una demo muy básica como
toma de contacto con DRCoP Ambiophonics Edition.

7. Conclusión.
Ambiophonics es un paso adelante en la superación de los problemas inherentes a un sistema estéreo. Está basado en una serie de
técnicas bien conocidas, aunque no desarrolladas hasta el momento en sistemas hifi domésticos. Su fundamento teórico lo hemos
tratado de explicar en este artículo. Para facilitar el paso a Ambiophonics, lo cual requiere aplicar complejos tratamientos DSP,
DRCoP incorpora la implementación práctica de un ambiopolo básico de modo flexible sin por ello resultar excesivamente complejo,
o tarea de especialista. Muchas de las grabaciones estéreo existentes guardan en su interior señales binaurales no perceptibles en
todo su potencial sin la incorporación del cancelador de diafonía acústica, la primera distorsión por orden de importancia en un
equipo hifi. Todo esto ¿Funciona o no funciona? ¿Merecerá la pena? No esperes a que te lo cuenten.

S-ar putea să vă placă și