Sunteți pe pagina 1din 79

TRABAJO DE GRADO

COMPARACIÓN DE MEZCLAS DE AUDIO DE


ESCENAS DE UN DOCUMENTAL PARA AUDIO
BINAURAL Y 5.1, REPRODUCIDOS POR EL
SISTEMA OPSODIS MARANTZ RC002ES, POR
MEDIO DE PRUEBAS SUBJETIVAS

ALEJANDRA GUTIÉRREZ MESA

ASESOR

Héctor García Mayén

UNIVERSIDAD DE SAN BUENAVENTURA SECCIONAL MEDELLÍN


FACULTAD DE INGENIERÍAS
INGENIERÍA DE SONIDO
MEDELLÍN
2015
AGRADECIMIENTOS
Daniel Marín – Asesor
Héctor García Mayén – Asesor
Luis Alberto Tafur – Asesor
Manuela Henao – Directora documental y cámara
José Julián González León – Sonido directo documental
Danny Rubio – Música documental
Alejandro Molina Jaramillo – Artista Foley
Compañeros Ingeniería de sonido – Préstamo de espacios y ejecución de la
prueba

2
TABLA DE CONTENIDO

Contenido

1. INTRODUCCIÓN .................................................................................................. 6
2. OBJETIVOS ......................................................................................................... 8
1.1. 2.1 Objetivo general ........................................................................................... 8
1.2. 2.2 Objetivos específicos: ................................................................................. 8
2. MARCO TEÓRICO............................................................................................... 9
1.3. 2.1 Producción audio binaural .......................................................................... 9
2.1.1 Grabación audio binaural ................................................................................... 9
2.1.2 Mezcla audio binaural........................................................................................ 10
1.4. 2.2 Producción audio surround ...................................................................... 13
2.2.1 Grabación audio surround................................................................................ 13
2.2.2 Mezcla 5.1............................................................................................................ 16
1.5. 2.3 Planos sonoros en postproducción audiovisual ................................... 20
2.3.1 Ambientes ........................................................................................................... 21
2.3.2 Diálogos .............................................................................................................. 21
2.3.3 Música ................................................................................................................. 21
2.3.4 Efectos ................................................................................................................ 21
1.6. 2.4 ............................................................. Sistema de reproducción OPSODIS
22
1.7. 2.5 Percepción la calidad del audio ............................................................... 25
1.8. 2.5 ............................................Análisis estadístico con pruebas de hipótesis
27
3. ESTADO DEL ARTE.......................................................................................... 30
1.9. 3.1 Antecedentes Históricos ........................................................................... 30
1.10. ......................................................................................................................... 3
.2 Referencias ................................................................................................... 31
4. DISEÑO METODOLÓGICO PRELIMINAR ....................................................... 33
1.11. ......................................................................................................................... 4
.1 Prueba de preferencia pareada .................................................................. 33

3
1.12. 4.2 ............................................................................ Método del simple ciego
34
5. DESARROLLO .................................................................................................. 35
1.13. ......................................................................................................................... 5
.1 Selección de las escenas del documental a trabajar de acuerdo con la
importancia que cobra el sonido en las mismas .......................................... 35
1.14. ......................................................................................................................... 5
.2 Postproducción y mezcla de las escenas seleccionadas utilizando
herramientas para audio binaural y 5.1 ......................................................... 37
9.2.1 Mezcla 5.1............................................................................................................ 43
9.2.2 Mezcla binaural .................................................................................................. 46
1.15. ......................................................................................................................... 5
.3 Diseño del formato de consulta para evaluar los principales parámetros
sonoros de las mezclas binaural y 5.1: epacialidad, definición y
envolvimiento. .................................................................................................. 49
1.16. ......................................................................................................................... 5
.4 Ejecución de la prueba ................................................................................ 50
5.4.1 Respecto a los oyentes ..................................................................................... 51
5.4.2 Respecto al estímulo ......................................................................................... 51
5.4.3 Respecto al método ........................................................................................... 51
6. RESULTADOS ................................................................................................................. 55
6.1 Espacialidad .......................................................................................................... 55
6.2 Definición ............................................................................................................... 56
6.3 Envolvimiento ........................................................................................................ 57
6.4 Resultados generales ........................................................................................... 58
7. CONCLUSIONES............................................................................................................. 61
8. BIBLIOGRAFÍA .................................................................................................. 63
9. ANEXOS ............................................................................................................. 67
1.17. ......................................................................................................................... 9
.1 Anexo 1 .......................................................................................................... 67
1.18. ......................................................................................................................... 9
.2 Anexo 2 .......................................................................................................... 69
1.19. ......................................................................................................................... 9
.3 Anexo 3 .......................................................................................................... 70
Espacialidad ................................................................................................................ 70

4
Definición ..................................................................................................................... 71
Envolvimiento .............................................................................................................. 72
1.20. ......................................................................................................................... 9
.4 Anexo 4 .......................................................................................................... 73
1.21. 9.5 ......................................................................................................... Anexo 5
76

5
1. INTRODUCCIÓN

A lo largo del desarrollo y la evolución del audio se ha buscado su


perfeccionamiento tratando siempre de conservar la naturalidad, tanto en
características sonoras como el timbre, como en los atributos que presenta al
momento de su reproducción [1]. Con dicho fin se exploran diferentes técnicas
tanto en grabación, como en reproducción que permitan al espectador una
experiencia de inmersión en la imagen sonora que se desea proyectar, y brinden
fidelidad al momento de la escucha. Inicialmente el paso de reproducción
monofónica a estereofónica y la aplicación de procesos tiempo y frecuencia como
reverberaciones, delays, flangers, entre otros, marcaron los límites de la
espacialización auditiva circunscribiéndose a la distribución en el plano horizontal
(Acimut) [1]. Es esta, entonces, la razón por la cual se experimentan e ingenian
cada vez con mayor fuerza e interés técnicas que brinden un mayor acercamiento
al audio 3D [2].
Concretamente en Colombia, la alternativa mayormente aceptada, en cuanto a
audio para productos audiovisuales, es la resultante de un proceso de constante
actualización por parte de la empresa Dolby. Dedicada a la innovación y
mejoramiento en cuanto a almacenamiento y reproducción de audio se refiere,
Dolby procura proporcionar al espectador una experiencia rica en características
sonoras, fieles a las creadas en los procesos de producción [3]. Actualmente dicha
empresa presenta como producto más reciente Dolby Atmos, luego de una
evolución que aumenta cada vez más el número de parlantes necesarios para una
correcta reproducción [4], lo que dificulta el acceso del público a salas
actualizadas, y particularmente en Colombia, llegando a su punto máximo en
configuraciones para reproducción de audio con Dolby 5.1 [6]. Conocido
técnicamente como Dolby Digital AC-3 pretende generar una atmósfera sonora
completa en torno al espectador por medio de la ubicación espacial de 6 parlantes
y la distribución discriminada de sonidos en los mismos [3]. Éste protocolo se ha
consolidado como el de mayor uso, prolongándose en el tiempo por medio de
amalgamas hechas con editores de audio, los cuales se han actualizado y
acomodado al mismo, y con exhibidores, quienes lo han acogido de forma
profesional por medio de la certificación en su uso. Dolby 5.1 se presenta
entonces como la opción más utilizada profesionalmente en Colombia para la
producción y, por ende, reproducción de proyectos audiovisuales, y mientras no se
presente una real evolución hacia el audio 3D como protocolo de trabajo
mejorando la experiencia del oyente, esta técnica no se hará obsoleta [7].
Sin embargo es evidente que esta configuración de trabajo no logra un
acercamiento total al audio 3D por su limitación a la espacialización horizontal y en
distancia y por la limitante que genera el número de parlantes, haciendo discreta la
distribución de sonidos; lo anterior hace necesario explorar otras técnicas al
alcance de productoras y exhibidoras nacionales, evidenciando las fortalezas y
debilidades que presenten sus resultados finales, en comparación con la ya
instaurada como estándar.

6
La grabación y reproducción de audio obtenido por medio de cabezas binaurales
ha sido ya previamente explorada mostrando las ventajas del mismo en
cuestiones de espacialización y envolvimiento, y su alto grado de acercamiento al
audio 3D [8]. Sin embargo la postproducción y el tratamiento de este tipo de audio,
e incluso el manejo de audio monofónico y estereofónico procesado para simular
audio binaural, no ha sido estudiado por un amplio grupo de profesionales en
producción sonora y visual, desconociendo los alcances del producto auditivo, una
vez terminado, en la producción para medios audiovisuales [9].
Teniendo en cuenta las dificultades de configuración que presentan ambos
sistemas para su reproducción (La cantidad de parlantes para audio surround, y la
necesidad de audífonos para audio binaural o filtros para su reproducción en
altavoces), El Instituto de investigación en sonido y vibraciones (The Institute Of
Sound And Vibration Research) ha desarrollado un sistema de teatro en casa
compuesto por un parlante de varias unidades internas que permite reproducción
de audio binaural y surround creando un ambiente envolvente. Dicha tecnología
conocida como Opsodis (Optimal Source Distribution) busca consolidarse en el
mercado de la reproducción sonora con la ventaja de ser una sola unidad que no
requiere de complejas instalaciones y a su vez permite la reproducción de varios
formatos de audio y configuraciones envolventes.
Es así como, finalmente, en la producción audiovisual se podrá disponer de un
amplio conocimiento y de herramientas que permitan con mayor precisión obtener
el producto deseado implementando técnicas mixtas y desarrollando a profundidad
las ya utilizadas, acercándose cada vez más al audio 3D.

7
2. OBJETIVOS

2.1 Objetivo general

Comparar las diferencias entre las mezclas de audio de escenas de un


documental, seleccionadas de acuerdo con la importancia que cobre el
sonido en las mismas, para audio 5.1 y binaural, reproducidos por el
sistema Opsodis Marantz RC002ES, por medio de pruebas subjetivas
diseñadas para tal fin.
2.2 Objetivos específicos:

 Seleccionar las escenas del documental a trabajar de acuerdo con la


importancia que cobre el sonido en las mismas.
 Postproducir y mezclar las escenas seleccionadas utilizando herramientas
para audio binaural y 5.1.
 Diseñar un formato de consulta para los espectadores donde se evalúen los
principales parámetros sonoros de la mezcla binaural en contraste con la
mezcla 5.1: Espacialidad, definición y envolvimiento.

8
2. MARCO TEÓRICO

2.1 Producción audio binaural

La producción de audio binaural es un proceso que integra desde la grabación


hasta la reproducción del audio, pues el tratamiento del mismo difiere del realizado
al audio monofónico y estereofónico. Esto debido a que su desarrollo se basa en
el concepto de audio binaural. Este se fundamenta en una de las funciones del
oído humano: la localización de fuentes sonoras, para lo cual se vale de las
diferencias interaurales de tiempo y de intensidad, las cuales hacen referencia,
respectivamente, a la diferencia de tiempo e intensidad con que el sonido arriba a
cada oído; todo esto debido a la morfología de la cabeza humana que actúa como
obstáculo entre ambos oídos, creando una sombra acústica para las frecuencias
con una longitud de onda igual o menor al tamaño de la cabeza [10].
Con base en estas características psicoacústicas el sistema de reproducción
binaural permite una experiencia acústica objetiva por medio de sensaciones
auditivas concretas, basadas en características sonoras como sonoridad, nitidez,
inteligibilidad, entre otras [11]. Esto se ha hecho evidente en el tratamiento musical
principalmente, donde la calidad obtenida impulsó la grabación con métodos
binaurales hasta el punto donde se pensó que haría obsoletas las demás técnicas
[11]. Sin embargo esta técnica no se popularizó lo suficiente debido a su máxima
falla en el momento de su aparición: La necesidad del uso de audífonos para una
correcta reproducción o de filtros especializados que eliminen el efecto crosstalk,
es decir, que eviten que las señales se filtren de un punto de radiación al otro, y
entre puntos de recepción de forma indeseada.
Pero el panorama se torna diferente al hablar de medios audiovisuales, tal como lo
expresa José Liaño en su artículo “Grabación Binaural. Introducción y
aplicaciones” para el sitio web Acusticayvibraciones.com
Sin embargo, la aparición del cine y la televisión en 3D hace muy interesante la
grabación biaural para obtener un sonido en 3D real, especialmente en aquellas
situaciones en las que se pretende situar al oyente dentro de un campo sonoro
con diferentes fuentes localizadas espacialmente [11].

2.1.1 Grabación audio binaural

La técnica de producción de audio basada en el concepto de sonido binaural


busca mediante la grabación, por medio de una cabeza humana artificial con
micrófonos en sus orejas o micrófonos en los oídos de seres humanos inmersos
en una escena, captar el sonido lo más fiel posible a como el ser humano lo
percibe, razón para el uso de una cabeza modelada con base en las medidas
promedio de la cabeza humana; así, en el momento de la reproducción, la
sensación del oyente es de inmersión en la escena auditiva [8].

9
2.1.2 Mezcla audio binaural

Debido a lo poco explorada que ha sido la postproducción de audio binaural, no


existe una estandarización para la mezcla binaural; sin embargo puede decirse
que direccionar diferentes audios binaurales aumenta en complejidad a mayor
elementos sonoros, al igual que los recursos de software necesario. Aún así, es
necesario garantizar que la mezcla brinde la información necesaria, en cuanto a
presión sonora, para caracterizar el campo sonoro y la posición en que se
encuentra el oyente en el mismo, teniendo especial cuidado en las bajas
frecuencias, donde la longitud de onda es sustancialmente mayor que el tamaño
de la cabeza con que fue grabado dicho audio; a medida que la frecuencia
incrementa, la localización se hace más sencilla pues se hace más fácil la
reconstrucción de las diferencias interaurales de tiempo e intensidad [12].
La mezcla de audio binaural es más sencilla cuando se hace entre audios
provenientes de una misma grabación, hecha en un ambiente acústico controlado;
sin embargo cuando los audios a mezclar tiene su origen en diferentes
grabaciones, diferentes ambientes o son de carácter estéreo o monofónico, la
mezcla exige mayores recursos tantos de hardware, como de software y estéticos.
En el caso de los software, por medio de algunos especializados es posible
sintetizar audios monofónicos y estereofónicos grabados con técnicas
convencionales, en señales relativas a HRTF’s que contengan información
adicional acerca de la dirección de incidencia del sonido, la cual puede ser
modificada junto a otros parámetros como reverberación y eco, lo que ayuda a
construir además el espacio acústico deseado. Esta posibilidad añade más
claridad a la mezcla final que la lograda con una mezcla esterofónica, aunque la
espacialización del audio binaural se haga únicamente en el plano horizontal.
Respecto a la aplicación de efectos sonoros como flangers y chorus, y filtros, se
deben tener en cuenta algunas recomendaciones: Al usar ecualizadores
paramétricos lo apropiado es elegir un factor Q pequeño para un rango de
frecuencias no muy amplio, esto porque al alterar el nivel de las frecuencias se
puede modificar la dirección de incidencia del sonido; a razón de que la detección
de la dirección de proveniencia de un sonido, por parte del oyente, se basa en un
análisis interaural no sólo de tiempo si no también de intensidad, lo que es
altamente dependiente del contenido frecuencial de dicho sonido.
De esta manera es posible lograr una escucha espacializada bastante natural
donde todas las fuentes sonoras pueden ser localizadas en la dirección que se
quiera durante el proceso de mezcla. Al momento de la escucha, los audios se
perciben fieles a la mezcla cuando esta se hace en audífonos, y cuando la
escucha es por medio de altavoces en un cuarto acústicamente tratado, no se
percibe pérdida de calidad alguna respecto a la grabación estereofónica original
[13].
Algunos de los software de edición de audio que se han elaborado con el fin de
permitir la creación de mezclas binaurales partiendo de audios monofónicos y
estereofónicos son [14]:

10
Panorama 3D-Wave Arts (Figura 1)

Panorama es una herramienta o plug-in desarrollado por la empresa Wave Arts,


que permite la creación de escenas auditivas en 3 dimensiones por medio de la
espacialización de sonidos con base en las características psicoacústicas de
escucha, principio básico del audio binaural [15]. La tecnología DSP que utiliza,
combina una función de transferencia promedio de la escucha en el ser humano,
con la característica del medio ambiente, las cuales pueden ser variadas por
medio de los parámetros ajustables sonido directo, reflexión y reverberación [16].
Permite el movimiento de un sonido particular en 3 dimensiones o entre
configuraciones surround, dándole una ubicación exacta en el espacio, lo cual
puede ser automatizado en caso de que se requiera la traslación del mismo.
Panorama incluye algoritmos que cancelan el efecto crosstalk cuando se
reproduce el audio en parlantes en configuración estéreo común, generando una
señal en 2D que simula el resultado de la producción con técnicas de grabación y
edición estéreo [16].

Figura 1.Plug in Panorama 5 – Wave Arts, tomado de [17]

Longcat H3D (Figura 2 y Figura 3)

Es un plug in de edición de audio diseñado para permitir la creación de mezclas


3D para ser escuchadas por audífonos, esto por medio de una interface de
visualización que consiente en dar posicionamiento y animación en movimiento de
objetos representados en canales de audio tanto de forma estática como
automatizada. Utiliza filtros basados en funciones HRTF para crear los efectos de
espacialización apoyados en reverberaciones captadas con una cabeza binaural
[18].

11
Figura 2. Ejemplo Pantalla de visualización Plug in Longcat H3D, tomado de [18]

Figura 3. Plug in Longcat H3D, tomado de [18]

Vibestudio designer (Figura 4)

Es una suite para tratamiento de audio 3D que tiene la capacidad de crear


escenas auditivas con amplios parámetros de espacialidad por medio del uso de
audio binaural, permitiendo la conversión de dicha escena a formatos 2.1, 4.1, 5.1,
7.1, 8.1 ó 10.2.
Se basa en la tecnología SoundScape3D y requiere de uso de audífonos para su
reproducción y correcta escucha de audio binaural, o sistemas surround.

12
Su interfaz consiste en una pantalla en que se visualiza en un plano 3D la
ubicación de los elementos o canales de audio y desde la cual se puede controlar
su movimiento y tamaño. Por medio de diferentes expansiones permite controlar
los parámetros del recinto virtual en que se desean ubicar los elementos, por
medio de datos como la distancia, la absorción, los materiales de construcción, la
reverberación, y demás [19].

Figura 4. Plug in Vibestudio designer, tomado de [18]

2.2 Producción audio surround

2.2.1 Grabación audio surround

En la grabación de audio utilizado para postproducción audiovisual se recurre a


técnicas estéreo y surround que involucran mínimo 2 micrófonos, pues la mezcla
de las señales captadas permite dar espacialidad a la señal y repartirla en el plano
horizontal [20]. Con base en estas técnicas se configuran otras más avanzadas
que involucran mayor cantidad de micrófonos y dan como resultado superior
cuantía de pistas de audio [21]:

13
Tabla 1. Técnicas de grabación estéreo y surround

Técnica Configuración Características


Par espaciado Dos micrófonos cardioides u Espacialidad en
omnidireccionales separados el plano
de 0,5 a 3 metros horizontal

XY Dos micrófonos cardioides de Compatibildad


igual referencia con sus monofónica
cápsulas coincidentes,
angulados entre sí en un
rango de 90º a 135º

Mid side Un micrófono cardioide y otro Control de la


bidireccional. El micrófono apertura de la
cardioide se dispone con la imagen estéreo
cápsula frente a la fuente,
mientras que el bidireccional
se configura con su cápsula
hacia los lados, de forma tal
que su eje quede
perpendicularmente al eje del
micrófono cardioide
ORTF Un par de micrófonos Sensación de
cardioides separados 17cm y profundidad y
angulados 110º entre sus cobertura ancha
cápsulas. Una mayor del estéreo
distancia de separación
angulación genera audios no
coincidentes
Blumlein Dos micrófonos Compatibilidad
bidireccionales en un ángulo monofónica
de 90º

Decca tree Tres micrófonos Espacialidad y


omnidireccionales formando profundidad
un triángulo equilátero que
apunte a la fuente de sonido

14
Hamasaki Cuatro micrófonos Óptima captura
square bidireccionales con los del ambiente y la
lóbulos apuntando hacia el difusión del
centro sonido en el
recinto de
grabación

MS Doble Dos arreglos de micrófonos Sonido


bidireccionales y un envolvente con
micrófono cardioide en el realismo. Permite
centro; o cuatro cardioides realizar una fácil
dispuestos a 90º entre sí localización y
espacialización

OCT Dos micrófonos direccionales Técnica efectiva


en los extremos y un para grabar los
micrófono cardioide usonidos de los
omnidireccional en el centro tres parlantes
frontales de un
sistema 5.1.
Ofrece
espacialidad y
distinción entre
los sonidos
WCSA Cinco micrófonos Se adapta muy
omnidireccionales o bien a grandes
cardioides direccionados espacios. Genera
hacia afuera del arreglo una grabación
intensa,
envolvente y con
captura de
dinámica

15
Grabación con micrófono Soundfield (Figura 5)

Adicional a estas técnicas existe un micrófono que es utilizado en la grabación


estéreo: El micrófono soundfield, el cual consiste en un transductor acústico
eléctrico de varias cápsulas que se vale de las diferencias de intensidad para crear
la escena con sonido envolvente.

Figura 5. Grabación con micrófono Soundfield, tomado de [22]

2.2.2 Mezcla 5.1

2.2.2.1 Dolby Digital 5.1

Técnicamente conocido como Dolby Digital AC-3, debido al formato en el que


genera el full mix, o mix down (Archivo de sonido con la mezcla final de máximo 6
canales), Dolby 5.1 se ha constituido en un formato de mezcla y reproducción
ampliamente trabajado y utilizado, que pretende acercase a un audio 3D por
medio del posicionamiento de altavoces en la sala de reproducción y la
espacialización de los objetos a mezclar reproducidos por medio de una
configuración de 6 altavoces distribuidos así (Figura 6):

16
Figura 6. Distribución de parlantes en arreglo 5.1. El círculo representa el receptor.

Los altavoces frontales, central y traseros reproducen un rango de frecuencias de


entre 20 Hz y 20kHz; mientras el sub woofer debe ser especializado para
reproducir bajas frecuencias, hasta 120Hz (También es conocido como Low
Frecuency Effects-LFE-).
El formato AC3 es un sistema de codificación-decodificación que permite una
compresión eliminando los sonidos no audibles por el oído humano, es decir,
frecuencias por debajo de los 20Hz y por encima de los 20KHz y permitiendo así
espacio para más información y filtrando el canal LFE para reproducir un máximo
de 120Hz [6].

La idea principal del formato 5.1para audiovisuales es envolver al oyente en una


imagen auditiva virtual que recree la imagen visual presentada en la pantalla,
poniendo al oyente en el centro de la misma. Para lograrlo se conserva la
siguiente distribución de planos sonoros: En el parlante central con pequeña
divergencia a los laterales se presentan los diálogos [22]; en los parlantes laterales
frontales los sonidos de los objetos discretos que aparecen en pantalla; en los
parlantes laterales traseros se presentan efectos de sonido y ambientes que
pueden también ser reproducidos en una configuración 4.0 con los parlantes
laterales delanteros [23]; finalmente los efectos de sonido específicos de baja
frecuencia se guían al parlante LFE [24] proporcionando una sensación de
inmersión en la situación [3].

Sin embargo en ocasiones la recreación del ambiente sonoro puede ser una tarea
complicada, cuando se recurre a la grabación con técnicas que involucren más de
2 micrófonos, dedido a que el posicionamiento de los micrófonos no coincide

17
totalmente con la ubicación de los parlantes de reproducción. Para los audios que
serán reproducidos en los parlantes traseros suele procesarse una disminución de
nivel para las altas frecuencias con el fin de simular la escucha humana, e incluso,
en ocasiones se realiza un retrado de entre 10 y 15 milisegundos con el fin de
lograr mayor espacialidad y profundidad. Estas modificaciones deben realizarse de
forma cuidadosa para no generar un desequilibrio psicoacústico indeseado [25].
Estas recomendaciones de mezcla pueden ser variadas dependiendo de la
imagen presentada en la pantalla o de la intensión que quiera dársele a la mezcla;
sin embargo es necesario tener en cuenta que el subwoofer se encuentra limitado
por el rango de frecuencias que puede reproducir [24].
A pesar de que el proceso de mezcla es mayormente artístico, se debe tomar en
cuenta que al realizarse el downmixing, proceso por el cual una mezcla surround
se configura para ser reproducida en un sistema mono/stereo, el nivel de los
altavoces al ser sumados puede superar los 0dBFs por lo que es importante tomar
en cuenta una serie de recomendaciones, las cuales indican mantener el nivel del
parlante central y los 4 surround a máximo -3dBFs, y el nivel del subwoofer -
12dBFs menos que los demás altavoces. De esta manera se garantiza tener una
versión mono/stereo dentro de los rangos de reproducción, y además, permite
mantener un headroom en el que se podrán ubicar elementos más fuertes [23].
Igualmente la empresa Dolby ha determinado unas curvas (Figura 7 y Figura 8)
donde, dependiendo del formato, se presentan unos niveles máximos por
frecuencias; igualmente es necesario tomar en cuenta el formato en que fue
grabado y será reproducido el material audiovisual, pues las curvas varían para
formato digital y análogo (Cinta magnética) [26]:

Figura 7. Niveles pico para bandas sonoras en cinta magnética, tomado de [24]

18
Figura 8. Rango dinámico para bandas sonoras en formato óptico, tomado de [24]

Paneo 5.1 Avid Pro Tools 10 (Figura 9)

Como herramienta de mezcla de audio 5.1 el programa Pro tolos, como plataforma
de edición de audio versus video, en su décima versión, ofrece en su suite
Complete Production Kit, una pantalla de paneo para canales que serán
reproducidos en una configuración 5.1, -Entre otras- amplias opciones para la
ubicación espacial de un canal de audio tanto en desplazamiento horizontal como
en profundidad.

19
Figura 9. Plug-in de Pro tools 10 suite Complete Production Kit para paneo 5.1, tomado de [27]

El plug-in muestra en una pantalla interactiva el posicionamiento en un espacio 3D


simulado, delimitado por la posición de los parlantes en la configuración tradicional
anteriormente explicada, del objeto. En la parte superior se encuentran los
controles de posición, que dirigen la energía concentrada del canal, representada
con un punto verde, hacia el frente, hacia atrás o hacia los lados, permitiendo un
movimiento por todo el espacio horizontal, además de indicar la concentración de
energía en el parlante frontal. En la parte inferior se encuentran los controles de
divergencia que permiten controlar la cantidad de energía que se reparte hacia el
espacio virtual fuera de la figura geométrica formada, es decir, que dependiendo
de la divergencia, la energía concentrada en el lugar donde se ubica el punto
representativo va a repartirse hacia los demás parlantes, de forma tal que se
escuchará por fuera de la figura. El fader inferior representa el nivel del canal,
mientras el superior permite enviar un porcentaje de la señal hacia el LFE,
representado en nivel al subwoofer. El plug-in permite a un canal polifónico dirigir
cada una de sus señales de manera diferente si se desea [27].

2.3 Planos sonoros en postproducción audiovisual

Los planos sonoros son los diferentes grupos de sonidos en un proyecto


audiovisual, agrupados de acuerdo con sus características de proveniencia y
función narrativa [28]:

20
2.3.1 Ambientes

Es el elemento sonoro derivado del espacio físico. Se obtiene por medio de su


grabación directamente en el lugar específico durante el rodaje de la escena o
posteriormente por medio de wildtracks (Archivos de sonido que captan
únicamente los ambientes) [29], o a través de procesos de edición basados en
archivos de librerías y demás técnicas de síntesis de sonido. Se divide de acuerdo
con su naturaleza en Tone-room (Ambientes de espacios cerrados) y Paisaje
sonoro (Ambientes de exteriores) [30].

2.3.2 Diálogos

Es el elemento sonoro derivado del habla de los personajes e inflexiones


provenientes del sistema respiratorio y el aparato fonador. Puede obtenerse por
medio de la grabación del sonido directo durante el rodaje de la escena, por medio
de wildlines (Archivos de sonido que captan un diálogo específico únicamente) o
por medio del doblaje, una técnica utilizada en el proceso de postproducción,
donde en contraste con la imagen, el actor graba el texto conservando el lipsync.
El doblaje puede realizarse por tres motivos: cambio de idioma, creación de
personaje para productos animados, o doblaje por problemas técnicos [28].

2.3.3 Música

La música es el elemento narrativo que se utiliza para indicar cierta emoción


(Música incidental) o constituye parte del ambiente (Música Diegética). Se obtiene
por medio de la grabación directa en estudio, o su inclusión en el proceso de
montaje en la postproducción [28].

2.3.4 Efectos

Los efectos son los sonidos específicos de una escena, que pueden ser derivados
de alguna acción física, o de una intensión narrativa. Pueden conseguirse por
medio de librerías de sonidos, su grabación en campo, síntesis de sonido o por
medio de Foley, una técnica de grabación de efectos sonoros en un espacio
controlado (Figura 10¡Error! No se encuentra el origen de la referencia.) [31].

21
Figura 10. Estudio Foley, tomado de [31]

2.4 Sistema de reproducción OPSODIS

El sistema de reproducción OPSODIS (Optimal Source Distribution) es una


tecnología de reproducción de audio que por medio de una barra compuesta por
seis altavoces permite la difusión de una imagen sonora en 3 dimensiones,
adaptándose a diferentes formatos, como el audio binaural, surround y
mono/stereo [32]. Para la reproducción de audio binaural el sistema OPSODIS se
basa en los principios físicos y psicoacústicos de la escucha humana:

 Físicas: El sonido es producido por una fuente cualquiera a través de una


perturbación de presión en el medio que genera un desplazamiento; este se
propaga a través del espacio con la velocidad característica del medio de
difusión, de acuerdo con su arquitectura y acabados, produciendo
fenómenos como la reflexión, absorción y difracción. Finalmente llega a los
oídos de un receptor situado en dicho espacio con unas diferencias de
tiempo de arribo y de nivel a cada oído.

 Psicoacústicas: El sistema auditivo humano se basa en la información


acústica del recinto que él mismo puede captar, como la difusión del sonido,
y en las diferencias interaurales de tiempo e intensidad para identificar el
posicionamiento de la fuente sonora. Esta última es producida por la
sombra acústica que genera la cabeza, haciendo más bajo el nivel sonoro
que llega al oído situado más lejos de la fuente; esto teniendo en cuenta
que dicho fenómeno reduce su intensidad a medida que disminuye la
frecuencia. Así mismo, para la diferencia de tiempo de arribo existe una
ambigüedad de dirección cuando la longitud de onda es semejante a la
distancia entre ambos oídos [33].

22
Para lograr una correcta reproducción y superando el inconveniente de la
necesidad de usar de audífonos, el sistema OPSODIS incluye filtros especiales de
cancelación del efecto crosstalk, lo que evita que las señales se filtren desde los
puntos de radiación y lleguen al receptor de forma indeseada, esto causando
interferencias en frecuencias altas mayormente y creando distorsión.
Concretamente en el caso de la reproducción de audio binaural evita que las
señales derecha e izquierda se mezclen, llegando a ambos oídos en cantidades
indeseadas, entorpeciendo así el proceso de diferenciación y ubicación realizado
por el cerebro con base en la información entregada al canal auditivo, más
concretamente, por medio de las diferencias interaurales de tiempo e intensidad.
Esto impide que se dificulte el posicionamiento de fuentes y se vuelva difusa la
imagen sonora [34].
Los filtros usados para dicha cancelación se basan en la teoría de posicionamiento
de los parlantes, en la cual se explica que la creación y direccionalidad de la
imagen sonora está íntimamente relacionada con la ubicación física de la fuente, y
se evidencia que para reproducir y manipular dicha imagen de forma arbitraria, se
hace necesario tener mínimo dos señales provenientes de fuentes reales
totalmente independientes, con el fin de direccionarlas a cada oído en la forma
deseada sin que se solapen o se interfieran de manera incontrolable [32]. Con la
anterior condición cumplida se explica el funcionamiento de un filtro de
cancelación de crosstalk de la siguiente manera:
Supóngase una fuente de audio binaural con dos señales D, las cuales ingresan a
un filtro inverso H y a partir de ahí se reproduce por dos altavoces generando dos
señales S que llegan a los oídos de un oyente quien capta una sola señal W.
Tomando en cuenta el efecto crosstalk las señales S1 (Izquierda) y S2 (Derecha) se
descompondrían en S11 arribando al oído izquierdo y S12 arribando al oído
derecho, y S21 arribando al oído izquierdo y S22 arribando al oído derecho.
De esta manera las señales de interferencia son S12 y S21.
El resultado final, es decir la señal W captada por el oyente es la señal original D
normalmente descompuesta en sus respectivas señales S, procesadas por el filtro
inverso H (Ecuación 1):

W=DHS, → W ≈D

Ecuación 1. Modelo matemático cross talk cancellation, sistema OPSODIS

23
El resultado de este filtro convencional genera unas pérdidas de nivel en ciertas
frecuencias, por lo que el resultado se asemejaría a un filtro peine, donde se haría
necesario incrementar el nivel de la señal para compensarlo, con el resultado de
baja definición y degradación de la señal a causa de la pérdida de rango dinámico
y distorsión agregada [32]. Éste tipo de filtros se entienden como el resultado del
posicionamiento de parlantes a una angulación entre ellos, tomando como punto
central el espectador (Entre 180º y 0º): Entre mayor sea el ángulo de apertura
entre los parlantes se generará una menor pérdida en ganancia, pero habrá una
gran variación de la misma en función de la frecuencia, creando una respuesta
inestable en el dominio de la frecuencia; a menor ángulo (comportamiento de
dipolo estéreo) el comportamiento en frecuencia será más uniforme pero la
pérdida de nivel se aumentará proporcionalmente con la frecuencia [32].
Combinando estos conceptos, el sistema Opsodis RC002ES se genera por medio
de un arreglo de 3 pares de parlantes con diferente angulación entre ellos: los
parlantes encargados de reproducir altas frecuencias se ubican en el centro con
poca angulación, de modo que brinden una respuesta estable; los parlantes para
bajas frecuencias se encuentran en los extremos con mayor angulación
presentando poca pérdida a dichas frecuencias, y los parlantes encargados de
reproducir un rango medio se encuentran en el centro de cada arreglo dando una
respuesta estable en ganancia a lo largo del rango de frecuencias
correspondiente; es por esto que en caso de necesitar el uso de subwoofers se
deben utilizar dos parlantes ubicados a los extremos del arreglo. Para evitar los
problemas de fase, las señales son enviadas con una diferencia de 90º, lo que
generará interferencias destructivas para la componente de la señal generada por
el efecto crosstalk, y constructivas para la componente original de la señal [32].
De esta manera, el sistema Opsodis no es dependiente de la frecuencia en su
respuesta en fase y amplitud evitando pérdida en la calidad de la señal y en el
rango dinámico, lo cual permite su reproducción en cualquier sala, a diferencia de
un sistema convencional con cancelación del efecto crosstalk que requiere de una
cámara anecóica o semianecóica para su correcta reproducción [32].
En conclusión, las características de mayor importancia del sistema Opsodis son:

 Patrón de radiación independiente de la frecuencia.


 Amplio sweet spot.
 Reproducción uniforme para varios oyentes (Máximo 3 ubicados de frente
al OPSODIS).
 Reproducción de variaciones en la altura.
 No se produce pérdida en el rango dinámico, evitando degradación en la
señal (Distorsión, aumento relación señal/ruido) y reduciendo el trabajo del
transductor.
 Respuesta plana en frecuencia independiente del posicionamiento dentro
del sweet spot.
 Óptima reproducción en cualquier ambiente.
 Compatibilidad para reproducción surround y mono/estéreo.

24
2.5 Percepción la calidad del audio

La calidad del sonido es la evaluación de la imagen auditiva en términos de lo que


el oyente puede expresar como satisfactorio o insatisfactorio en la misma. Puede
ser juzgada por la comparación entre varias imágenes producidas por varios
estímulos externos o con base en una imagen referenciada que ha sido percibida
por el oyente y reside en su memoria [35]. Siendo una valoración subjetiva se
vuelve de mayor fiabilidad cuando es realizada a atributos definidos, lo cual va
directamente relacionado con el entrenamiento y la sensibilidad del oyente [36]. La
calidad sonora es típicamente tratada como una entidad compositiva cuando se
evalúa por medio de pruebas de escucha y se califica en términos de un puntaje
de opinión medio, que fusiona todos los aspectos que definen la calidad del
sonido, incluyendo preferencias de los oyentes y características descriptivas [36].
Las características de espacialidad entre diferentes escenas sonoras son
típicamente descritas por los oyentes en términos de altos o bajos niveles de
ancho, profundidad y envolvimiento; en vez del uso de términos analíticos que
describan el sonido directo y las reflexiones asociadas con la reproducción de
cada fuente.
Es necesario tener en cuenta que los atributos de juicio y las preferencias son
diferentes de los conceptos; por ejemplo, se reconoce que la fidelidad de la fuente
en un atributo comparativo que relaciona un estímulo sonoro con otro,
posiblemente tomado como referencia. Por otro lado, la naturalidad puede ser
tomada como una comparación entre el estímulo a evaluar y la referencia interna
relacionada a la memoria del sujeto y su relación con el entorno [36].
Letowski propone la calidad sonora como una relación entre dos categorías:
Calidad tímbrica y calidad espacial. Toole, por otra parte escoge los parámetros
globales de fidelidad, simpatía y calidad espacial. Todas estas características
evaluativas pueden ser clasificadas en dos grupos: Atributos preferenciales
(Valoraciones subjetivas) y atributos descriptivos (Valoraciones objetivas) [35].
Para una correcta realización de pruebas subjetivas evaluativas es necesario
discutir y aclarar el significado de los términos a utilizar, pues pueden ser obvios
para unos pero susceptibles a interpretación para la generalidad. Los términos
relativos a la espacialidad más útiles y de mayor uso en numerosos estudios
pueden ser resumidos en ancho de la fuente y envolvimiento espacial [36].
El envolvimiento espacial puede definirse como la percepción auditiva de
localización, dimensiones y demás parámetros físicos de la fuente sonora y el
espacio acústico donde se ubica la misma. Esto implica que la preocupación se da
por la construcción sonora en relación a la direccionalidad, tamaño, altura y ancho
de la imagen a proyectar, tanto para las fuentes individuales como el conjunto

25
total, siempre en relación con el ambiente de emisión. En otras palabras, el
enfoque se centra en describir y evaluar las características espaciales
tridimensionales en una escena auditiva reproducida en altavoces o en audífonos
[36].
Se presentan entonces, derivados de estas definiciones, una serie de atributos
con valoraciones objetivas, distribuidos de acuerdo con su naturaleza, bien sea en
relación con la fuente o en relación con el entorno de reproducción:
Atributos relativos a la fuente:

 Presencia de la fuente: Sonido directo y reflexiones tempranas.


 Distribución energética de la fuente por frecuencias.
 Reverberación natural del espacio de emisión.
 Envolvimiento de la fuente: Energía temprana relativa al sonido directo.

Atributos relativos al entorno de reproducción:

 Tiempo de reverberación.
 Variación del tiempo de reverberación en función de la frecuencia.

Por otro lado se realiza una división más acorde a la evaluación subjetiva, que al
modelamiento de fuentes y espacios:

 Calidad de la imagen estereofónica (Para sistemas de dos canales):


Diferencia entre la referencia y el objeto sonoro en términos de localización
de imagen sonora y sensación de profundidad y realidad del evento
auditivo.
 Calidad de la imagen frontal (Sistemas multicanal de más de dos canales):
Localización de la fuente sonora al frente. Esto incluye la calidad de
imágenes estereofónicas y la definición.
 Impresión de la calidad surround: Impresión espacial, ambiental y
direccional de los efectos surround.

Para pruebas subjetivas relativas a la calidad de sistemas de reproducción, en


1980 Toole definió algunos términos relativos a la calidad sonora y la
espacialización:

 Definición de la imagen sonora: Estabilidad, foco, separación entre fuentes.


 Continuidad en el escenario sonoro: Ancho homogéneo relativo a la
distribución de las fuentes en el espacio sonoro.
 Ancho del escenario sonoro: Relativo al ancho entre fuentes opuestas en el
límite del espacio sonoro.
 Impresión de distancia y profundidad.
 Efectos anormales: Sensación de espacialidad no natural.

26
 Reproducción del ambiente, la espacialidad y la reverberación.
 Perspectiva: Sensación propia de inmersión en relación con el entorno
sonoro.

Sin embargo, de forma más técnica, la norma IEC 60268 para la evaluación de
sistemas sonoros de amplificación define tres factores bajo el título calidad
espacial global:

 Localización de la imagen: Localización espacial percibida de una fuente


sonora reproducida. Puede ser de buena definición o borrosa.
 Estabilidad de la imagen: Localización percibida de una fuente sonora
reproducida; puede variar en función del pitch, loudness o el timbre y en
función de la posición del oyente, la rotación de su cabeza y demás
movimientos. Con dichos efectos controlados la imagen será estable.
 Homogeneidad en el ancho: La imagen estereofónica debe estar distribuida
uniformemente entre monitores de audio.

Adicionalmente en la norma IEC 268-13 (Versión anterior de la IEC 60258) se


proponen escalas de valoración para los atributos espaciales:

 Espacialidad: Cerrado-Amplio.
 Distancia: Lejos-Cerca.
 Ubicación de las fuentes: Inestable-Estable.

Finalmente entonces pueden definirse los parámetros a evaluar con base en las
características descritas por cada autor [36]:

 Espacialidad: Es la distribución de las fuentes sonoras en el espacio


acústico de tamaño determinado. Permite al oyente establecer la dirección
de proveniencia de la fuente.
 Distancia: Es el rango espacial percibido entre el oyente y la fuente
reproducida.
 Definición: Es la estabilidad de la imagen sonora brindada por la distinción
entre cada una de las fuentes.
 Envolvimiento: Es la impresión subjetiva de inmersión en el sonido,
producida por el grado de llenado de la imagen sonora alrededor del
oyente.

2.5 Análisis estadístico con pruebas de hipótesis

Mendenhall define el estadístico de prueba como un procedimiento que se aplica


para los resultados de una medición estadística de una población con n

27
resultados, probabilidad p y desviación estándar σ, en la que se desea probar una
hipótesis de la forma (Ecuación 2)

Ecuación 2. Hipótesis nula, prueba de hipótesis

Donde p0 es un valor hipotético para p, contra una hipótesis alternativa (Ecuación 3)

Ecuación 3. Hipótesis alternativa, prueba de hipótesis

H0 es un valor exacto para el parámetro a probar; mientras que Ha es un rango de


valores posibles para p.

La prueba de hipótesis está formada por:

 H0, Hipótesis nula: Contradicción de la hipótesis alternativa.


 Ha, Hipótesis alternativa: Hipótesis que se desea apoyar.
 p: Estadístico de prueba y su valor.
 Región de rechazo.
 Conclusiones.

Estos cinco elementos forman una prueba particular y la variación de una o más
de estas partes crea una prueba diferente.

Una vez se definen las suposiciones iniciales se buscan todas las pruebas
posibles para contradecir dicha suposición; bien sea que las pruebas sean
suficientes o no, se obtiene un resultado que rechace la hipótesis alternativa o que
no la rechace (Lo que no significa que demuestre su aprobación, simplemente no
la rechaza). El estadístico de prueba (Ecuación 4) actúa como apoyo para tomar
decisiones acerca de si se acepta o rechaza H0:

28
Ecuación 4. Estadístico de prueba, prueba de hipótesis

Para decidir aceptar o rechazar H0, el conjunto de valores que puede tomar el
estadístico de prueba se divide en (Figura 11):

 Región de rechazo α: Rechaza H0 y apoya Ha


 Región de aceptación: Apoya H0 y rechaza Ha

Figura 11. Región de aceptación y rechazo, prueba de hipótesis, tomado de [36]

Si el estadístico de prueba cae en la región de rechazo, se rechaza la hipótesis


nula, si cae fuera de la región de rechazo se acepta la hipótesis nula o la prueba
se juzga no concluyente [36].

29
3. ESTADO DEL ARTE

3.1 Antecedentes Históricos

La dirección de imagen en un arreglo de 6 canales en configuración 5.1 para una


reproducción surround es analizada por medio de ecuaciones de localización del
sonido. Está comprobado que con el uso de señales mezcladas por parejas un
sistema 5.1 puede crear una imagen definida en el frente y atrás, dependiendo la
dirección de la combinación de frecuencias de la imagen. Sin embargo, la imagen
lateral en profundidad no es lo suficientemente definida; para lo cual se deben
inspeccionar métodos que soporten la mezcla 5.1 y permitan una imagen a 360º
totalmente definida [38].
Se han hecho amplios estudios acerca de la simulación acústica y arreglo de
altavoces para audio 3D. Algunas técnicas empleadas pueden ser adaptadas a un
formato 5.1 para generar un sonido aún más envolvente; para esto el proceso de
mezcla debe ser fusionado con técnicas de simulación acústica virtual siempre con
el objetivo de reproducirse en en un arreglo 5.1 [39].
NHK es un sistema de audio de 22.2 canales que se ha propuesto como
alternativa para el futuro de la televisión. Consiste en un conjunto de 22 parlantes
full rango y 2 para efectos de baja frecuencia, que juntos producen un espacio
sonoro tridimensional. Para validar el procedimiento se han estudiado métodos de
reproducción que involucran menos parlantes, llegando a una posterior fusión
entre la grabación binaural y la reproducción surround, para lo que fue necesario
hacer una adaptación del audio binaural en el dominio de la frecuencia, con el fin
de evitar problemas como el crosstalk. Al elegirse este sistema de reproducción se
propusieron entonces, nuevos filtros que permitirían expandir el sweet spot de la
reproducción al mismo tiempo que garantizarían una correcta reproducción del
audio binaural en un sistema surround 22.2 [40].
En la universidad de Southampton se ha desarrollado un proyeto llamado
Development of 3-channel OPSODIS 3D sound reproduction system para crear
algoritmos avanzados de simulación de audio 3D basados en el funcionamiento
del sistema Opsodis. Se tenía como objetivo adaptar la tecnología anteriormente
mencionada a productos de consumo doméstico como home theatre, que permitan

30
su funcionamieto con trasmisiones de televisión pensadas para tal fin y pueda ser
adaptado a juegos de video. Se pensó además en adaptar dicha tecnología a
automóviles; y completando la cadena desarrollar facilidades para los creadores
de contenido de audio 3D [41].

3.2 Referencias

En 2010 Hwan Shim ha realizado un estudio para evaluar la calidad del audio en
términos de espacialidad. El resultado muestra cuáles atributos de espacialización
influencian el sentido de realidad en la reproducción de audio y cuáles son difíciles
de reproducir en sistemas surround 10.2, 22.2 y 5.1. Se proponen 8 atributos en 3
categorías: Timbre (Naturalidad, distinción), localización (Dirección, movimiento,
distancia, volumen) y espacialidad (Ancho aparente de la fuente, envolvimiento al
oyente). Los estímulos fueron elegidos de contenidos audiovisuales producidos
para cada formato de reproducción. Para la evaluación subjetiva se utilizó el
método de diferencial semántico: Los sujetos fueron entrevistados para reportar lo
que sentían en base a los atributos seleccionados evaluándolos en una escala de
1 (Pobre calidad) a 7 (Calidad ideal). Se evaluaron 7 sujetos con conocimiento en
audio quienes hacían la prueba en un cuarto para escucha equipado con un
sistema 22.2 capacitado para reproducir los otros dos y una pantalla transparente
para video. Referente al estímulo se utilizaron 12 tracks audiovisuales de duración
entre 15 y 30 segundos para la reproducción en cada sistema, los cuales fueron
aleatorizados. Los resultados mostraron que el sistema 22.2 es significativamente
mejor que el 5.1 para todos los atributos, excepto para movimiento y volumen; al
igual que el sistema 10.2 para naturalidad y envolvimiento. Se encontró que los
atributos distancia y naturalidad afectan ampliamente la calidad en general,
además que todos los atributos están estrechamente relacionados entre sí,
especialmente envolvimiento y ancho aparente mostrándose como los de mejor
calificación. En conclusión las pruebas subjetivas mostraron que a mayor número
de altavoces los atributos se reproducen mejor; sin embargo algunos atributos
como el volumen son difíciles de reproducir incluso con amplio número de
parlantes; además se concluyó que los atributos perceptuales más influyentes en
la calidad son, para fuentes en movimiento distancia y naturalidad y para fuentes
estáticas envolvimiento y ancho aparente [42].

Para una correcta reproducción de un proyecto audiovisual en formato 5,1 es


fundamental establecer un arreglo adecuado de 6 altavoces dependiente del
recinto y su acústica; una mala configuración puede producir cambios drásticos en
la escucha y la espacialidad. Para evitar estos inconvenientes los televisores
modernos cuentan con un sistema de dipolo acústico en el estéreo para crear una
imagen llamada “virtual surround”, lo que funciona muy bien recreando la imagen
frontal, mas no genera una envolvente real. Se investigan entonces nuevas
alternativas para crear imágenes auditivas virtuales lo más reales posible,
validándolas por medio de pruebas subjetivas en ambientes adecuados [43].

31
Con el objetivo de explorar técnicas diferentes a las estéreo que brinden realismo
al audio usado en el ámbito comercial y/o publicitario, se realizó en la Pontificia
Universidad Javeriana de Bogotá en el año 2009 un estudio acerca de la
aplicación del audio binaural en publicidad auditiva. Se crearon diferentes tipos de
comerciales, de acuerdo con la división dada por la publicidad, y fueron grabados
y editados tanto con técnicas binaurales como estereofónicas. Se encontró como
aspecto positivo a resaltar el impacto que generaba el audio publicitario en el
oyente cuando se utilizaba la técnica de audio binaural, pues le creaba una
sensación de realismo y captaba su atención en un alto grado, factor fundamental
en la publicidad; además se rescata la combinación entre sonido binaural y
estereofónico para una misma pieza auditiva, situándolos en diferentes tiempos
con el fin evitar la cancelación del efecto binaural por parte de los audios
trabajados de forma estereofónica [14].
Para evaluar la técnica PCMA (Perspective Control Microphone Array) para
controlar la espacialidad brindada por ciertos arreglos de micrófonos se
desarrollaron dos pruebas de escucha subjetiva, las cuales fueron diseñadas con
el fin de dar un valor cualitativo al resultado del audio obtenido con el uso de esta
técnica en cuanto a distancia y profundidad. Una primer prueba fue hecha para
examinar la relación existente entre los atributos señalados y la longitud a la
fuente, utilizando instrumentos grabados en una cámara anecóica a diferentes
distancias posteriormente convolucionados con la respuesta al impulso obtenida
con técnicas binaurales de la sala donde se realizó la prueba; se llegó a la
conclusión de que la percepción de profundidad disminuye cuando incrementa la
distancia a la fuente. La segunda prueba evaluó tres arreglos de micrófonos a los
cuales se les aplicó la técnica PCMA en una grabación orquestal, encontrando que
las variaciones en el códec brindan cambios en el resultado similares a los
notados en la prueba anterior. Con esto se logra demostrar la validez y efectividad
del uso de PCMA en la postproducción gracias a las posibilidades de
espacialización que brinda [44].

32
4. DISEÑO METODOLÓGICO PRELIMINAR

La investigación se valió de la postproducción de escenas de un documental, para


realizar comparaciones entre las mezclas de audio binaural y surround, para lo
cual se emplearon técnicas de edición relativas a cada método y se realizó la
reproducción por medio del sistema Opsodis Marantz RC002ES. Se ejecutaron
pruebas de escucha subjetiva, diseñadas con el método de Preferencia Pareada
para evaluar la percepción de los espectadores en parámetros relativos a la
calidad del sonido y su espacialización, con los cuales se valoró cada mezcla
encontrando así los mejores atributos sonoros de cada una. Así mismo se hizo
uso del método del simple ciego para evitar que los participantes emitieran juicios
de valor con base en el conocimiento del tipo de mezcla escuchada. Con base en
el resultado se observó el comportamiento de cada mezcla, y la eficacia de los
métodos al ser reproducidos por el sistema Opsodis.
Es así como en la producción audiovisual se podrán disponer con amplio
conocimiento de herramientas que permitan obtener el producto deseado
implementando técnicas mixtas acercándose cada vez más al audio 3D.

4.1 Prueba de preferencia pareada

Se presentan al individuo dos muestras nombradas de forma codificada para


comparación, de forma tal que no sepa qué muestra presenta unas u otras
cualidades de las que se desea evaluar. Se le pide elegir una con la opción de que
justifique su elección. Se obtiene así la detección de diferencias sobre la base de
criterios definidos previamente a la ejecución de la prueba y aclarados a los
individuos que habrán de ejecutarla.

Campo de aplicación:
Se aplica en situaciones en las que se requiere determinar una diferencia
perceptible de un atributo particular; seleccionar, entrenar o hacer seguimiento al
desempeño a los individuos entrevistados; y comparar dos atributos en términos
de preferencia. El método es aplicable si existe disimilitud en un solo atributo
sensorial o en varios, lo que permite determinar si hay una diferencia significativa
respecto a una propiedad determinada.

33
Respecto a otras pruebas de discriminación presenta ventajas en cuando a la
sencillez en su aplicación y la menor fatiga sensorial en los participantes

Respecto al estímulo:
No es necesario que la diferencia de nivel de estímulo entre las muestras de un
par sea igual en todos los pares; sin embargo se debe garantizar la diferencia
entre los mismos [45].

Ejecución de la prueba:
Los individuos participantes reciben un grupo de dos muestras, inmediatamente
indican la muestra que consideran más intensa en el atributo a evaluar, incluso si
su elección se trata sólo de una conjetura. Finalmente se hace un conteo de las
veces que una u otra muestra fue seleccionada [46].

4.2 Método del simple ciego

Es un método utilizado en experimentos donde los individuos participantes


desconocen las características de los objetos a evaluar, reduciendo de esta
manera el sesgo de la información obtenida [47].

34
5. DESARROLLO

La forma de abordar la ejecución del proyecto fue por medio de los objetivos
específicos, en el orden en que fueron planteados, de los cuales se desprendieron
las actividades, como puede ser observado en el cronograma:

5.1 Selección de las escenas del documental a trabajar de acuerdo con la


importancia que cobra el sonido en las mismas

Se observó en conjunto con la directora del documental el corte final de video y


este fue analizado junto al plan de rodaje, script y escaleta (Figura 12), proceso
por el cual se pudieron señalar las escenas y los planos en que el sonido tenía un
papel de gran importancia, pues complementaba la imagen visual y funcionaba
como elemento narrativo comprendido por los diálogos, los ambientes, los efectos
y/o la música, como cada escena lo requiriera; sin el cual la escena se mostraría
incompleta y hasta, en el caso de las escenas con diálogo por ejemplo,
inentendible.

35
Figura 12. Scouting Sierra Viva

Luego de este proceso se seleccionaron las escenas en que el sonido permitía ser
mezclado de manera envolvente (Figura 13), y se eligió un conjunto que mostrara
las diferentes situaciones que podían presentarse en la mezcla de sonido de un
proyecto audiovisual: tanto la fusión de todos los planos sonoros como el
protagonismo de alguno específico. De esta manera en algunas escenas puede
observarse cómo interactúan la música, los diálogos, los efectos y los ambientes
entre sí, y en otras cómo un solo plano sonoro se distribuye a lo largo del eje
horizontal y crea la sensación de envolvimiento por sí mismo, sin la necesidad de
otros elementos auditivos.

36
Figura 13. Revisión corte final documental

Para dar cumplimiento al segundo objetivo en el que se realizó la postproducción


incluyendo grabación de Foley, se dio gran importancia a los efectos consecuencia
de acciones. Los diálogos, en ocasiones presentes, fueron un factor importante
para la delimitación de las escenas pues se buscó siempre respetar el inicio y final
de los mismos y guardar coherencia en el video mostrado para no generar
confusión en los individuos ejecutores de la prueba. Los ambientes se presentaron
como elemento esencial en la mayoría de las escenas, cuidando de no interferir en
especial con la música, y se tomaron como elemento de ubicación de las
acciones, así el diálogo presentado no fuera narrado desde el mismo lugar
mostrado en la imagen visual. Finalmente la música se tomó como elemento
adicional que podía ser adaptado a cada escena, sin necesidad de estar sujeto a
los límites de las mismas ni a su participación en el documental como pieza
completa, valiéndose de la misma como un recurso acompañante de las imágenes
y de contextualización en el espacio físico que no necesariamente tenía un orden
cronológico.

Se seleccionaron 10 escenas con una duración de entre 10 y 35 segundos


aproximadamente, lo cual permitía no fijar al individuo en una situación de
evolución lógica durante la reproducción dándole individualidad a cada una,
evitando sujeción de una frente a la otra y permitiendo a las respuestas tener un
carácter personal e independiente. Las escenas seleccionadas se nombraron de
acuerdo con su orden de aparición en el corte final de video y el lugar de captura
de las mismas.

5.2 Postproducción y mezcla de las escenas seleccionadas utilizando


herramientas para audio binaural y 5.1

37
Teniendo las escenas seleccionadas se procedió al montaje del sonido directo y la
edición del mismo, de forma tal que se hicieron evidentes los momentos en que
era necesaria la grabación de Foley y doblaje. Respecto a los diálogos de este
trabajo, se tuvo especial cuidado con el lipsync y los tiempos de inicio y
terminación, para ser consecuente con la elección de las escenas que buscaba
dejar frases completas. La música fue adaptada conforme fuera necesario a la
duración de la escena; y finalmente los ambientes fueron cuidadosamente
ubicados de acuerdo al lugar de la imagen proyectada y la hora de captura, para
mantener siempre la coherencia entre audio y video.

Tabla 2. Desglose Foley y doblaje

ESCENA FOLEY DOBLAJE


Corte final 1 Voz en off saludo
Corte final 2 Cadena motosierra
Limpieza motosierra
Cierre bolso
Pasos
Corte final 3 Pasos
Corte final 4 Pasos
Corte final 5
Corte final 6 Bolsas al viento
Tijeras cortando bolsa
Corte final 7 Pasos niños
Límites Pasos
Palomino 1 Cigarrillo
Palomino 2 Pasos
Fruta al caer
Fruta sobre caneca

38
Figura 14. Grabación Foley

Se realizó la captura del doblaje (monofónico) con un micrófono AKG 414 y una
pantalla anti viento, y el Foley (Figura 14) por medio de la técnica de grabación
estéreo ORTF con dos micrófonos de referencia Shure SM58 y un micrófono
shotgun Rode NTG adicional que captara los sonidos de manera más direccional,
pero más alejado, con el fin de mezclar las señales y darle profundidad a las
tomas.

Posterior a esto, el doblaje y el Foley fueron montados y editados de forma


sincrónica con la imagen (Figura 15) y adaptados de acuerdo al ambiente en que
transcurrían, para lo cual se hizo uso de elementos como reverberaciones y
ecualizadores que dieran al sonido una ubicación dentro del espacio físico donde
se producía, además de cuidar conservar el ruido de fondo característico del
sonido directo, con ayuda de tomas de room tone y wild tracks. Esto se logró
analizando la locación donde transcurría la escena y el encuadre de la misma, el
cuál daba la información necesaria para conocer la naturaleza del lugar.

Tabla 3. Edición Foley y doblaje de acuerdo a locación

ESCENA CARACTERÍSTICAS LOCACIÓN CARACTERIZACIÓN SONIDO


Espacio abierto con algunos árboles Espacio sin reverberación, sonido
Corte final 1 al rededor natural con contenido similar en
todas las frecuencias
Espacio abierto cubierto con un Espacio con muy poca
Corte final 2 techo, objetos y árboles al rededor reverberación, sonido natural con
Corte final 3 predominio de bajas frecuencias
Corte final 4

Espacio natural, sin objetos ni Espacio sin reverberación, sonido


Corte final 5 construcciones cerca, habitado por natural con predominio de altas
Palomino 1 gran cantidad de árboles frecuencias por los elementos
propios del lugar como flora y
fauna

39
Ambiente: Espacio abierto Espacio sin reverberación, sonido
natural con contenido similar en
todas las frecuencias
Corte final 6 Voz: Construcción cerrada Espacio con tiempo medio de
reverberación de 2 segundos
aproximadamente, predominio de
frecuencias bajas
Espacios abiertos con Espacio sin reverberación con
Corte final 7 construcciones al rededor contenido similar en todas las
frecuencias
Ambiente: Espacio abierto con Espacio sin reverberación, sonido
árboles alrededor, cercado por natural con contenido similar en
objetos y construcciones todas las frecuencias
Límites Voz: Construcción cerrada Espacio con tiempo medio de
reverberación de 3 segundos
aproximadamente, predominio de
frecuencias bajas
Espacio sin techo con árboles y Espacio sin reverberación, sonido
Palomino 2 algunos objetos alrededor, natural con contenido similar en
delimitado por una cerca de madera todas las frecuencias

Figura 15. Edición sonido directo y Foley

Una vez montado el audio y sincronizado con el video en formato estéreo,


se procedió a realizar unos procesos previos de edición que serían
generales a ambas mezclas:

40
Corte final 1
 Ambientes: Los ambientes acompañan toda la escena y se les dio gran
importancia debido a que la escena transcurre al aire libre, lo que significa
que los ambientes brindan toda la información de ubicación y dan la
sensación de inmersión en la escena.
 Diálogos: El último saludo fue doblado por problemas técnicos con el sonido
directo y ecualizado para adaptarlo al ambiente, disminuyendo el contenido
en bajas frecuencias asemejándolo al sonido directo.
 Efectos: En esta escena todos los efectos fueron extraídos del sonido
directo, excepto los pasos de uno de los personajes que fueron grabados
en estudio.

Corte final 2
 Ambientes: Los ambientes acompañan toda la escena, brindan toda la
información de ubicación y dan la sensación de inmersión en la escena.
 Efectos: Para esta escena los pasos, la cadena y el cierre del maletín
fueron grabados en estudio y editados para adaptarlos al ambiente y
asemejarlos al sonido directo. El audio de la cadena fue comprimido para
reducir las diferencias de intensidad y acentuar el ataque.

Corte final 3
 Ambientes: Los ambientes acompañan toda la escena, brindan toda la
información de ubicación y dan la sensación de inmersión en la escena.
 Efectos: En esta escena todos los efectos fueron extraídos del sonido
directo.

Corte final 4
 Ambientes: Los ambientes acompañan toda la escena, brindan toda la
información de ubicación y dan la sensación de inmersión en la escena.
 Efectos: En esta escena el sonido de la motosierra y del perro fueron
extraídos del sonido directo y los pasos fueron grabados en estudio.

Corte final 5
 Ambientes: Los ambientes acompañan toda la escena y se les dio gran
importancia debido a que la escena transcurre al aire libre en un
ecosistema rico en fauna con gran componente frecuencial, brindando toda
la información de ubicación y dando la sensación de inmersión en la escena
 Diálogo: Fue ecualizado para hacerlo más inteligible y se le aplicó un filtro
pasa bajos para eliminar frecuencias molestas captadas en la grabación del
sonido directo.
 Efectos: En esta escena los únicos efectos presentes son los pasos, los
cuales fueron tomados del sonido directo y ecualizados.

41
Corte final 6
 Ambientes: Los ambientes acompañan toda la escena y se les dio gran
importancia debido a que la escena transcurre al aire libre y consiste en la
muestra de unas acciones ocurridas en los espacios que contextualizan el
lugar en que el documental fue grabado. Brindan toda la información de
ubicación y dan la sensación de inmersión en la escena.
 Diálogo: En esta escena el diálogo fue tomado del sonido directo.
 Efectos: Para esta escena todos los efectos fueron recreados en el estudio
y ecualizados para simular su grabación en escena.

Corte final 7
 Ambientes: Los ambientes acompañan toda la escena y se les dio gran
importancia debido a que la escena transcurre al aire libre y brindan toda la
información de ubicación dando la sensación de inmersión en la escena.
 Música: La música fue grabada previamente en estudio por un músico
quien la compuso especialmente para el documental con la intensión de
mostrar los elementos sonoros propios de la región.
 Efectos: En esta escena únicamente los pasos fueron grabados en estudio
y ecualizados para darles el color característico de la escena, los demás
efectos fueron tomados del sonido directo.

Límites
 Ambientes: Los ambientes acompañan toda la escena y se les dio gran
importancia debido a que en la escena se habla del lugar mostrado.
 Diálogo: En esta escena el diálogo fue ecualizado debido a que el espacio
donde se grabó tiene un alto tiempo de reverberación y componentes en
frecuencias medias especialmente.
 Efectos: Los pasos de esta escena fueron grabados en estudio y
ecualizados para dar el color del sonido directo. La bicicleta fue tomada del
sonido directo.

Palomino 1
 Ambientes: Los ambientes acompañan toda la escena y se les dio gran
importancia debido a que la escena transcurre al aire libre y brindan toda la
información de ubicación dando la sensación de inmersión en la escena.
 Música: La música grabada previamente en estudio.
 Efectos: En esta escena los pasos fueron tomados del sonido directo. El
cigarrillo fue recreado en estudio con la grabación de elementos con un
sonido similar, los cuales fueron mezclados y posteriormente ecualizados
para asemejarse lo más posible al sonido original.

Palomino 2
 Ambientes: Los ambientes acompañan toda la escena y brindan toda la

42
información de ubicación del espacio donde transcurre la acción dando la
sensación de inmersión.
 Efectos: En esta escena todos los efectos fueron recreados en el estudio y
ecualizados para darles el color característico del sonido.

9.2.1 Mezcla 5.1

La mezcla 5.1 se compuso principalmente de la nivelación, el paneo o distribución


espacial y la automatización de la dirección y nivel de los sonidos en concordancia
con la imagen visual.
Para dicho fin y de forma coherente con la definición de envolvimiento utilizada
como directriz, se tomó como punto central o de referencia la cámara de video,
pues es el encuadre el que ubica al espectador en la escena y decide qué parte de
la realidad será transmitida. De esta forma el sonido escuchado coincide con la
imagen en pantalla, así como la posición de los objetos, tamaño y desplazamiento.
En ese sentido los ambientes se distribuyeron en configuración 4.0 en los
parlantes surround, para dar sensación de envolvimiento y de ser necesario, fue
enviado un porcentaje al parlante central, esto, por ejemplo, en las escenas en
que predominaba el ambiente y no habían diálogos.
Los efectos producto de acciones se distribuyeron de acuerdo con el lugar donde
sucedía la misma, tanto en pantalla como fuera de ella; es decir, para las acciones
visibles y para las ocurridas fuera de encuadre, que se hacían evidentes por medio
del sonido directo y la narrativa de la escena, al sonido le fue dada la dirección
que se hacía evidente en la escena.
Los diálogos principalmente se ubicaron en el parlante central de acuerdo con las
recomendaciones encontradas a través de la elaboración del marco teórico
(numeral 7), sin embargo, se tuvo en cuenta su dirección de proveniencia y el
valor de plano en el conjunto sonoro; lo que significa que en ocasiones se dieron
variaciones del posicionamiento con base en la dirección de la fuente y su
importancia en la creación de la imagen sonora como plano.
Finalmente la música incidental se mezcló con los demás elementos sonoros
dando preponderancia a la misma en caso de ser necesaria y narrar más que los
mismos efectos o el ambiente, o solamente acompañar la escena y
complementarla, teniendo en cuenta que no interfiriera con los diálogos.
Es importante resaltar que debido al rango de frecuencias reproducido por el
sistema OPSODIS (Sin adaptación de subwoofers), de 80Hz a 20kHz, los efectos
de bajas frecuencias y los componentes graves no se enviaron en alto porcentaje
al canal adicional debido a que el sistema no los reproduciría en su totalidad.

43
Corte final 1
 Ambientes: Mezclados en 4.0.
 Diálogos: En esta escena los diálogos se ubicaron según su dirección de
proveniencia, uno en el parlante trasero izquierdo y otro en el trasero
derecho.
 Efectos: El sonido del gallo al principio fue ubicado en la parte frontal pues
abarcaba toda la pantalla en su aparición. La puerta de la siguiente escena
también fue ubicada en el parlante central y automatizada hacia el parlante
derecho según el movimiento percibido. Los pasos por su parte fueron
automatizados desde el parlante trasero derecho al frontal derecho con un
porcentaje al central, pues los personajes se movían de esta manera en
escena.

Corte final 2
 Ambientes: Mezclados en 4.0.
 Diálogo: El diálogo se situó mayormente en el centro y se varió el
porcentaje enviado a los parlantes laterales delanteros según la dirección
en que se ubicaba el personaje en la pantalla.
 Efectos: Los pasos, la cadena y el contacto con la motosierra se
automatizaron en paneo entre los tres parlantes frontales según el
movimiento percibido.

Corte final 3
 Ambientes: Mezclados en 4.0
 Diálogos: El diálogo se ubicó en el centro con un pequeño porcentaje a los
parlantes laterales en la parte inicial de la escena y se movió gradualmente
hacia el parlante derecho debido al movimiento del personaje.
 Efectos: En esta escena todos los efectos fueron ubicados en el parlante
central; igualmente se les dio importancia con el nivel por su protagonismo.

Corte final 4
 Ambientes: Mezclados en 5.0. Se decidió enviar al parlante central un
porcentaje del ambiente debido a la ausencia de diálogo en la escena.
 Efectos: El sonido del perro y los pasos fueron direccionados al parlante
delantero izquierdo según su ubicación en la pantalla, mientras que el
sonido de la motosierra fue enviado al parlante derecho y al centro por su
protagonismo en la escena.

Corte final 5
 Ambientes: Mezclados en 4.0.
 Diálogo: En esta escena el diálogo se ubicó según su dirección de
proveniencia, entre el parlante delantero izquierdo y el parlante central,
estando en constante movimiento.

44
 Efectos: En esta escena los únicos efectos presentes son los pasos, los
cuales fueron paneados igual que los diálogos.

Corte final 6
 Ambientes: Mezclados en 5.0.
 Diálogo: En esta escena el diálogo se ubicó en los 4 parlantes laterales
pues el orador no aparece en escena.
 Efectos: Para esta escena todos los efectos fueron direccionados según su
aparición en escena.

Corte final 7
 Ambientes: Mezclados en 4.0.
 Música: Se decidió asignarle un nivel sonoro predominante en esta escena
y mezclarla en 5.0 aprovechando la ausencia de diálogo.
 Efectos: Todos los efectos fueron direccionados y automatizados en paneo
según su movimiento en escena.

Límites
 Ambientes: Fueron mezclados en 4.0 con el fin de brindar la sensación de
inmersión en la escena.
 Diálogo: En esta escena el diálogo se ubicó en el parlante central.
 Efectos: Los pasos de esta escena fueron automatizados en paneo al igual
que la bicicleta, que según el movimiento que hace se le dio direccionalidad
desde el parlante izquierdo al central y un poco al derecho.

Palomino 1
 Ambientes: Mezclados en 4.0.
 Diálogo: En esta escena el diálogo se ubicó en el parlante central pues es
allí donde se muestra el personaje.
 Música: La música fue mezclada en 4.0 cuidando de no interferir con el
ambiente pero dándole preponderancia.
 Efectos: En esta escena los pasos fueron direccionados según su aparición
en el encuadre. El cigarrillo fue enviado al centro.

Palomino 2
 Ambientes: Mezclados en 4.0.
 Diálogo: En esta escena el diálogo se ubicó en 4.0 pues el sonido directo
no permitió la separación de este del ambiente y debido a que la escena no
se centra en el diálogo se prefirió darle importancia al ambiente.
 Efectos: En esta escena todos los efectos fueron direccionados según su
aparición y los pasos automatizados según el movimiento.

45
9.2.2 Mezcla binaural

La mezcla binaural tuvo en cuenta la nivelación de amplitudes siguiendo el mismo


lineamiento que la mezcla 5.1: la concordancia con la imagen. Sin embargo se
centró en la distribución de los sonidos en el plano horizontal únicamente, debido
a que la idea del proyecto es la comparación de 3 aspectos con la mezcla 5.1
(Espacialidad, definición y envolvimiento), y esta no última permite colocar sonidos
en el eje vertical; por lo tanto se decidió hacer las mezclas lo más similares posible
para que la comparación fuese equitativa y no hubiese una ventaja a priori de un
tipo de mezcla sobre la otra, pues esto generaría resultados incomparables.
En ese sentido se procuró mantener la misma distribución que en la mezcla
surround, para hacerlas lo más parecidas posible y así el oyente pudiera evaluar
los parámetros pedidos de forma homogénea en ambas configuraciones sonoras.
Para realizar la mezcla binaural se hizo uso del plug in Panorama 5 de Wave Arts,
el cual añadía de forma automática reverberación y delay según el lugar donde la
fuente fuese ubicada, con el fin de situar el sonido en un espacio definido; sin
embargo como la mayoría de las escenas se daban al aire libre se cuidó de que
dichas opciones no se utilizaran en alto grado. La mezcla en 2D por medio de este
plug in se hace ubicando las dos fuentes reproductoras en una de las 4
configuraciones predeterminadas que posicionan los parlantes al frente del oyente
en 3 distancias y angulaciones diferentes, o bien, realizan una simulación de
escucha por audífonos. Para esta mezcla se tomó la ubicación de parlantes a ±40º
respecto al eje proyectado por la vista hacia el frente del oyente. La fuente
emisora virtual es un punto que puede ser ubicado a gusto de quien realice la
mezcla en los 360º del plano horizontal; esto tomando en cuenta que el oyente se
encuentra en el centro de la circunferencia (Figura 16).

Figura 16. Ubicación de fuente en el plug in Panorama 5.

Corte final 1
 Ambientes: La fuente se ubicó en el lugar del oyente para tener difusión por
todo el espacio horizontal.

46
 Diálogos: El diálogo proveniente de la parte trasera derecha se ubicó a 135º
y el proveniente de la parte trasera izquierda a -120º. En cuanto a difusión
se cuidó de dar todo el protagonismo al sonido directo y no tener
reflexiones debido a que la escena transcurre en un espacio abierto.
 Efectos: A los pasos se les dio la misma dirección de proveniencia de la voz
y se automatizaron para que se acercaran hacia el centro y frente del
oyente, según la escena muestra. La puerta se ubicó al centro y al frente y
se automatizó 20º a la derecha a medida que transcurría el movimiento. El
gallo se ubicó al centro y al frente. Todos los efectos fueron mezclados con
la mínima reverberación para conservar la concordancia con el espacio
físico.

Corte final 2
 Ambientes: La fuente se ubicó en el lugar del oyente para tener difusión por
todo el espacio horizontal.
 Diálogo: El diálogo se ubicó en el centro a una distancia media del oyente y
se movió hacia los lados según la dirección en que se ubicaba el personaje
en la pantalla.
 Efectos: Para esta escena los pasos fueron enviados al frente y
automatizados según el movimiento presentado, al igual que los demás
efectos, en especial el contacto con la motosierra al que se le dio mayor
importancia permitiendo su paneo a lo largo de todo el eje horizontal, pues
ocupa una parte importante de la pantalla.
Corte final 3
 Ambientes: La fuente se ubicó en el lugar del oyente para tener difusión por
todo el espacio horizontal.
 Diálogos: El diálogo se ubicó en el centro alejado del oyente en la primer
parte de la escena. En la segunda parte se acercó al oyente y se movió
gradualmente hacia la derecha debido al movimiento del personaje.
 Efectos: Los efectos fueron enviados al centro y muy cerca al oyente según
ña imagen; igualmente se les dio importancia con el nivel por su
protagonismo.

Corte final 4
 Ambientes: La fuente se ubicó en el lugar del oyente para tener difusión por
todo el espacio horizontal y se le dio gran nivel debido a la ausencia de
diálogo.
 Efectos: El sonido del perro fue enviado a la parte izquierda a -65º, lejos del
oyente. Los pasos a -90º alejados al máximo del oyente, y la motosierra
muy cerca del oyente a 70º.

Corte final 5
 Ambientes: La fuente se ubicó en el lugar del oyente para tener difusión por
todo el espacio horizontal y se le dio gran nivel debido a que la brindaban

47
toda la información de ubicación de la escena, cuidando de no interferir con
el diálogo.
 Diálogo: El diálogo fue puesto a -90º y totalmente automatizado entre la
parte izquierda y central acercándolo y alejándolo del oyente según se
presentara en la imagen.
 Efectos: En esta escena los únicos efectos presentes son los pasos los
cuales fueron automatizados de igual forma que el diálogo según fueran
más cercanos o lejanos en la imagen.

Corte final 6
 Ambientes: La fuente se ubicó en el lugar del oyente para tener difusión por
todo el espacio horizontal y se le dio gran nivel debido a que brindaban toda
la información de ubicación de la escena, cuidando de no interferir con el
diálogo.
 Diálogo: El diálogo se ubicó a 0º cercano al oyente, y con amplia difusión
para tenerlo en todo el espacio, aprovechando que el orador no hacía
aparición en escena, pero cuidando de mantenerlo legible.
 Efectos: Los efectos se direccionaron según su aparición en la escena, sin
reverberación adicional y alejados del oyente para darle mayor importancia
al diálogo.

Corte final 7
 Ambientes: La fuente se ubicó en el lugar del oyente para tener difusión por
todo el espacio horizontal y se le dio nivel medio debido a que brindaban
toda la información de ubicación de la escena; sin embargo se tomó en
cuenta que no eran el elemento principal.
 Música: La música se ubicó en el lugar del oyente para tener difusión por
todo el espacio y se le dio alto nivel, tomándola como elemento principal
narrativo de la escena.
 Efectos: Todos los efectos fueron direccionados según su aparición en
escena y puestos alejados del oyente con la intensión de no hacerlos
inteligibles separados del ambiente y la música.

Límites
 Ambientes: Se ubicó la fuente en el lugar del oyente y difusión en todo el
espacio, dándoles gran importancia debido a que en la escena se habla del
lugar mostrado.
 Diálogo: El diálogo se ubicó a 0º cerca al oyente como aparece en escena.
 Efectos: Tanto los pasos como la bicicleta fueron automatizados; los pasos
de la derecha hacia el centro alejándose, y la bicicleta acercándose de
izquierda a derecha. Al igual el volumen se automatizó en los pasos
disminuyendo y en la bicicleta aumentando.

48
Palomino 1
 Ambientes: La fuente fue ubicada en el lugar del oyente para obtener
difusión en todo el plano horizontal y dar sensación de inmersión.
 Diálogo: En esta escena el diálogo se ubicó a 0º pues es allí donde se
muestra el personaje y lejos al oyente para no afectar su inteligibilidad con
la música y el ambiente.
 Música: La música fue ubicada en el lugar del oyente con nivel alto para
darle preponderancia sobre el ambiente ubicado en el mismo punto.
 Efectos: Los pasos fueron automatizados entre ±30º y el punto más lejano y
un punto cercano al oyente según se diera en la imagen; sin embargo no se
llevaron hasta el oyente para mantener la diferenciación con los demás
elementos que ya estaban ubicados allí.

Palomino 2
 Ambientes: La fuente fue ubicada a 0º cerca al oyente, más no en el centro,
para conseguir la mejor difusión a lo largo del plano horizontal pero
cuidando la ubicación del diálogo que no fue posible separar del ambiente.
 Diálogo: En esta escena el diálogo fue tomado del sonido directo, por lo que
se debió editar junto al ambiente a 0º cerca al oyente, obteniendo difusión
en el plano horizontal pero dirección al frente.
 Efectos: En esta escena los efectos fueron ubicados cerca al oyente lejos
de los 0º y los pasos automatizados según su movimiento en el eje
horizontal un poco más lejos que las frutas.

5.3 Diseño del formato de consulta para evaluar los principales parámetros
sonoros de las mezclas binaural y 5.1: espacialidad, definición y
envolvimiento.

Para llevar a cabo éste objetivo lo primero a realizarse fue un estudio acerca de
los parámetros a evaluar con el fin de encontrar una definición clara, sencilla y
concisa de cada uno; esto con miras a evitar vacilación en la ejecución de la
prueba por parte de los individuos, tal como se indica en el diseño metodológico.
Para esto se tomaron como base algunas pruebas similares ya realizadas en las
que se usaron parámetros afines, y demás estudios semánticos relativos a las
características sonoras a evaluar (Remítase al Estado del Arte – 3.2 Referencias)

Se propusieron entonces 3 atributos referentes al concepto de distribución del


sonido en el espacio y recreación de la imagen sonora en un plano horizontal de 2
dimensiones que pudiera ser reproducido por ambas configuraciones a evaluar:
Espacialidad, definición y envolvimiento.

 Espacialidad: Es la distribución de las fuentes sonoras en el espacio


acústico de tamaño determinado. Permite al oyente establecer la dirección
de proveniencia de la fuente.
 Definición: Es la estabilidad de la imagen sonora brindada por la distinción

49
entre cada una de las fuentes.
 Envolvimiento: Es la impresión subjetiva de inmersión en el sonido,
producida por el grado de llenado de la imagen sonora alrededor del
oyente.

Adicionalmente se tomó como referencia el concepto de distancia pues se mostró


inherente a las características a evaluar debido a que le da más claridad a las
mismas.

 Distancia: Es el rango espacial percibido entre el oyente y la fuente


reproducida.

Estos atributos se tomaron como relativos a la calidad de reproducción,


independiente de la fuente y del espacio acústico, cuidando de ser éste el más
apropiado para el sistema OPSODIS, y dependientes únicamente del mismo. Se
pretende que el resultado muestre cuáles atributos son mejor reproducidos por
una u otra configuración, y cuáles son comunes en calidad a ambas.

Para el diseño de la prueba se hizo uso del método diferencial semántico por
degradación, pues permite realizar una calificación tanto cuantitativa como
cualitativa, debido a que los números extremos son indicados con adjetivos
bipolares. El mínimo número a registrar es el 1, representando la peor calidad del
atributo a evaluar, mientras que el máximo número, el 5, representa la mejor
calidad posible; es decir, el mejor o peor desempeño de la mezcla relativo a dicha
característica. Para tales efectos el mejor desempeño es entendido como la mayor
fidelidad en la reproducción respecto a la escena real y el peor desempeño como
una imagen sonora irreal en contraste con la imagen visual proyectada. Debido a
que los resultados de la prueba piloto no fueron concluyentes se decidió hacer uso
del método de preferencia pareada junto con el método del simple ciego, pues
permite realizar una elección cualitativa, debido a que consiste en la elección de
uno de dos estímulos, el que presentara el mejor desempeño.

Para tales efectos el mejor desempeño es entendido como la mayor fidelidad en la


reproducción respecto a la escena real y el peor desempeño como una imagen
sonora irreal en contraste con la imagen visual proyectada.

Ver Anexo 2 – Prueba subjetiva.

5.4 Ejecución de la prueba

Los individuos fueron entrevistados para reportar sus percepciones respecto a los
atributos seleccionados en la tabla de respuestas. Los estímulos fueron
reproducidos de forma aleatoria en términos de configuración de audio para evitar
juicios basados en las diferentes porciones audiovisuales. Así mismo, los oyentes

50
podían reproducir el estímulo cuantas veces consideraran necesario y de esta
forma realizar una calificación no apresurada.

5.4.1 Respecto a la población encuestada

Se evaluaron individualmente 25 estudiantes de ingeniería de sonido entre los 20


y 30 años de edad, de la muestra de 30 estudiantes que estaban cursando alguna
de las materias relacionadas con audiovisuales (Foley y doblaje, montaje y
edición, banda sonora), lo que garantizaba su conocimiento en el ámbito
audiovisual y un entrenamiento previo respecto a la mezcla de audio.

5.4.2 Respecto al estímulo

Se presentaron 10 tracks audiovisuales en las dos configuraciones auditivas a


evaluar de forma aleatoria, así el oyente no podía saber cuál reproducción es
binaural y cuál 5.1. La descripción de los estímulos se hace a continuación:

1
Tabla 4. Escenas a presentar

Escena Descripción Duración


(min:sec)
1 Animales, acciones específicas y diálogo fuera de plano 00:16
2 Acciones específicas y diálogo dentro y fuera de plano 00:32
3 Acciones específicas y diálogo fuera de plano 00:29
4 Acciones específicas 00:30
5 Diálogo fuera de plano 00:13
6 Acciones específicas y dialogo fuera de plano 00:25
7 Efectos y música 00:11
8 Efectos y diálogo fuera de plano 00:12
9 Efectos, diálogo fuera de plano y música 00:22
10 Acciones específicas y diálogo dentro y fuera de plano 00:09

5.4.3 Respecto al método

La prueba se realizó en un cuarto absorbente (Figura 18) adaptado con tapetes en


el suelo entre el sistema de reproducción y el oyente para disminuir reflexiones. El
sistema OPSODIS se ubicó a una altura de 0.8 metros y una distancia de 2 metros

1
Todas las escenas incluyen ambiente y pasos a excepción de la escena número 6 que no incluye pasos.

51
del oyente tal como lo indica el manual para usuarios. Para hacer más absorbente
el recinto y disminuir las reflexiones se utilizaron 3 biombos absorbentes (Figura
17¡Error! No se encuentra el origen de la referencia.) que delimitaron el espacio
de escucha a un cuadro de 3m2. En la Figura 19¡Error! No se encuentra el origen
de la referencia. puede observarse la distribución del espacio de la prueba y la
ubicación del oyente representada por un punto rojo; mientras que los biombos se
representan con rectángulos naranja y el sistema OPSODIS con un rectángulo
negro. El televisor fue ubicado detrás del sistema OPSODIS durante la ejecución
de las pruebas piloto.

Figura 17. Biombos absorbentes

52
Figura 18. Dimensiones en metros cuarto de ejecución de la prueba

3
3

Figura 19. Adecuación y ubicación punto de escucha prueba subjetiva; medidas en metros

Al iniciar la prueba a los participantes se les hizo entrega del consentimiento


informado (9.1 Anexo 1) avalado por el comité de Bioética de la Universidad San
Buenaventura, seccional Medellín, y de la hoja de respuestas (9.2 Anexo 2) donde
se hacía la explicación de la prueba y además se incluían las definiciones de los
parámetros a evaluar y una definición complementaria: distancia, que fue añadida
con el fin de dar apoyo al entendimiento de las anteriores.
Así mismo se les explicó el procedimiento a seguir y se resolvieron dudas,
haciendo hincapié en que, para minimizar las variables de influencia la mezcla
binaural sólo se realizó en el plano horizontal, debido a que la configuración 5.1 no
permite distribución vertical, y el no hacerlo de esta manera daría una ventaja a
priori por la característica agregada del sistema binaural sobre el 5.1 y los
resultados no podrían ser comparados al no encontrarse en iguales condiciones.
Además se aclaró que la mezcla puede ser en varios aspectos más técnica que
artística, con el ánimo de dar la mayor dinamización posible del sonido.
Se hizo uso de los métodos de preferencia pareada y simple ciego para la
evaluación. En las pruebas piloto se hizo uso del método diferencial semántico de
Osgood, pidiéndole a los participantes que calificaran de 1 a 5 cada parámetro
para cada reproducción; sin embargo los resultados arrojados demostraron no dar
la suficiente información respecto a qué configuración auditiva era mejor para uno
u otro parámetro pues los oyentes calificaron de forma muy pareja ambas
reproducciones (Ver Anexo 3).

53
El método de preferencia pareada se eligió debido a que permitía evidenciar qué
mezcla es elegida como la mejor en cada parámetro, pues el individuo sólo puede
elegir una u otra opción, codificada para él gracias al uso del método ciego en
reproducción A y reproducción B. Las escenas se reprodujeron en orden
numérico, primero A y luego B, e inmediatamente se terminaban ambas
reproducciones por escena el sujeto realizaba la calificación, o se repetían las
reproducciones tal como lo pidiera previo a la calificación. El orden de
reproducción de las mezclas para cada escena (Tabla 5) fue elegido
aleatoriamente sin criterio alguno. De esta manera cuando ambas mezclas (A y B)
de una escena se reproducían el sujeto elegía una mezcla para cada parámetro
desconociendo si se trataba de la mezcla binaural o 5.1.

Tabla 5. Codificación escenas presentadas, método simple ciego

Escena 1 2 3 4 5 6 7 8 9 10
A 5.1 Binaural 5.1 Binaural Binaural Binaural 5.1 5.1 5.1 Binaural
B Binaural 5.1 Binaural 5.1 5.1 5.1 Binaural Binaural Binaural 5.1

54
6. RESULTADOS

Los resultados obtenidos arrojan en algunos casos diferencias muy estrechas


respecto al tamaño de la población, en la elección entre una mezcla y otra, por eso
se realizó una prueba de hipótesis para proporciones binomiales, con el fin de
encontrar si los porcentajes tienen realmente significancia estadística e
importancia práctica. A continuación se presenta el análisis estadístico en
frecuencia de los resultados encontrados para cada uno de los parámetros
evaluados y así mismo se aclara si los mismos son o no significativos (Tabla 6,
Tabla 7 y Tabla 8).

6.1 Espacialidad

Tabla 6. Resultados en frecuencia relativa y porcentaje, Espacialidad

Frecuencia absoluta Frecuencia relativa Porcentaje Significativo (S) /


No significativo (NS)
Escena Binaural 5.1 Binaural 5.1 Binaural 5.1
1 16 9 0,64 0,36 64% 36% S
2 11 14 0,44 0,56 44% 56% NS
3 12 13 0,48 0,52 48% 52% NS
4 8 17 0,32 0,68 32% 68% S
5 13 12 0,52 0,48 52% 48% NS
6 10 15 0,4 0,6 40% 60% NS
7 18 7 0,72 0,28 72% 28% S
8 14 11 0,56 0,44 56% 44% NS
9 17 8 0,68 0,32 68% 32% S
10 19 6 0,76 0,24 76% 24% S

55
Espacialidad
Binaural Vs. 5.1
80

Porcentaje de elección (%)


70
60
50
40
30
20
10
0
1 2 3 4 5 6 7 8 9 10
Número de escena

Binaural 5.1

Figura 20. Gráfica Espacialidad, binaural vs. 5.1

Puede apreciarse en los resultados que la mezcla binaural fue elegida por, entre el
52% y el 76%, de los participantes como la que mejor espacialidad presentaba
para 6 de las 10 escenas reproducidas; conforme con la prueba de hipótesis se
puede observar que sólo la mitad de las diferencias son significativas, de las
cuales 4 (entre el 64% y el 76% de los participantes) arrojan a la mezcla binaural
como la que mejor espacialidad presenta; mientras que las escenas 2, 3, 4 y 6
obtuvieron mayor elección de la mezcla 5.1, siendo la escena 4 la única que
obtuvo diferencias significativas.

6.2 Definición

Tabla 7. Resultados en frecuencia relativa y porcentaje, Definición

Frecuencia absoluta Frecuencia relativa Porcentaje Significativo (S) /


No significativo (NS)
Escena Binaural 5.1 Binaural 5.1 Binaural 5.1
1 8 17 0,32 0,68 32% 68% S
2 10 15 0,4 0,6 40% 60% NS
3 12 13 0,48 0,52 48% 52% NS
4 5 20 0,2 0,8 20% 80% S
5 1 24 0,04 0,96 4% 96% S
6 10 15 0,4 0,6 40% 60% NS
7 8 17 0,32 0,68 32% 68% S
8 21 4 0,84 0,16 84% 16% S
9 10 15 0,4 0,6 40% 60% NS
10 5 20 0,2 0,8 20% 80% S

56
Definición
Binaural Vs. 5.1
Porcentaje de elección (%) 120
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10
Número de escena

Binaural 5.1

Figura 21. Gráfica Definición, binaural vs. 5.1

Puede apreciarse en los resultados que la mezcla 5.1 fue elegida por, entre el
52% y el 96%, de los participantes como la que mejor definición presentaba para 9
de las 10 escenas reproducidas, siendo que conforme con la prueba de hipótesis
sólo 6 de las 10 calificaciones son de diferencias significativas, de las cuales 5
(entre el 68% y el 96% de los participantes) arrojan a la mezcla 5.1 como la que
mejor definición presenta. La escena 8 obtuvo mayor elección de la mezcla
binaural con una diferencia significativa.

6.3 Envolvimiento

Tabla 8. Resultados en frecuencia relativa y porcentaje, Envolvimiento

Frecuencia absoluta Frecuencia relativa Porcentaje Significativo (S) /


No significativo (NS)
Escena Binaural 5.1 Binaural 5.1 Binaural 5.1
1 19 6 0,76 0,24 76% 24% S
2 14 11 0,56 0,44 56% 44% NS
3 6 19 0,24 0,76 24% 76% S
4 8 17 0,32 0,68 32% 68% S
5 15 10 0,6 0,4 60% 40% NS
6 4 21 0,16 0,84 16% 84% S
7 14 11 0,56 0,44 56% 44% NS
8 13 12 0,52 0,48 52% 48% NS
9 17 8 0,68 0,32 68% 32% S

57
10 16 9 0,64 0,36 64% 36% S

Envolvimiento
Binaural Vs. 5.1
100
Porcentaje de elección (%)
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10
Número de escena

Binaural 5.1

Figura 22. Gráfica envolvimiento, binaural vs. 5.1

Puede apreciarse en los resultados que la mezcla binaural fue elegida por, entre el
52% y el 76%, de los participantes como la que mejor envolvimiento presentaba
para 7 de las 10 escenas reproducidas, siendo que conforme con la prueba de
hipótesis sólo 6 de las 10 calificaciones tienen diferencias significativas, de las
cuales tan solo 3 (entre el 64% y el 76% de los participantes) arrojan a la mezcla
binaural como la que mejor envolvimiento presenta. Mientras que las escenas 3, 4
y 6 obtuvieron mayor elección de la mezcla 5.1, todas con diferencias
significativas.

6.4 Resultados generales

Los resultados de las pruebas realizadas muestran que existe una asociación
entre los parámetros espacialidad y envolvimiento, al ser percibidos como los
mejor reproducidos por la mezcla binaural; mientras que definición es evaluado
como mejor reproducido por la mezcla 5.1. Esto se debe, posiblemente, a que
para trasladar un objeto de forma artificial y modificar su difusión natural, el plug in
se vale de algoritmos que disminuyen la intensidad, pues hace uso de retardos y
reverberación, lo que genera una imagen difusa, es decir, con baja definición por
la combinación de los sonidos que han sido tratados; lo que se agrava si los
mismos se encuentran separados del punto central del plano, es decir, donde se
ubica el oyente, pues a mayor distancia se le asigne menor intensidad tendrá y
será menos definida su representación. En ese sentido se puede deducir que la
calidad de un sonido, representada en este caso por los parámetros espacialidad,

58
definición y envolvimiento, puede disminuir cuando de forma artificial se recrea un
espacio 3D a partir de pistas grabadas con técnicas monofónicas y estereofónicas.
Tomando en cuenta los resultados estadísticamente significativos únicamente, a
pesar de que fueron tan sólo la mitad mas uno como máximo para cada factor a
evaluar, de estos se obtiene que para el parámetro espacialidad en 4 de 5
escenas fue elegido el sistema binaural y para definición en 5 de 6 escenas los
oyentes eligieron el sistema 5.1; lo que muestra que la elección fue realmente
mayoritaria. Mientras que a la hora de evaluar el envolvimiento según los
resultados representativos, sólo en 3 de 6 escenas se eligió el sistema binaural; lo
cual puede significar que realmente los oyentes no percibieron una diferencia
importante entre la reproducción 5.1 y la binaural para el parámetro envolvimiento.
Los resultados que no fueron significativos de acuerdo con la prueba de hipótesis
apoyan la elección mayoritaria, en el sentido de que afianzan la preferencia de los
oyentes por la mezcla binaural para espacialidad y envolvimiento y la mezcla 5.1
para definición.
Otro factor que puede influir en las elecciones de los individuos participantes de la
prueba son los diferentes modelos de HRTF disponibles en el plug in, que varían
en cierto grado la localización de los sonidos. Para este caso se eligió el modelo
“Human” que fue el que mejor resultado presentó a juicio de quien realizó la
mezcla; sin embargo es imposible garantizar igual percepción en todos los oyentes
por las diferentes morfologías de la cabeza, entre otras cosas.
Se puede observar que fue en las escenas 3, 4 y 6 que los oyentes realizaron
elecciones contrarias a las demás escenas para los parámetros espacialidad y
envolvimiento, lo cual lleva a pensar que se trata de una discontinuidad producto
de la naturaleza de las escenas (composición de planos sonoros) y la mezcla de
las mismas. Por su contenido visual fue necesario centrar la mezcla de dichas
escenas en los efectos, pocos pero acentuados, a los que por ser protagonistas en
pantalla se les puso en medio, al frente y con nivel sonoro predominante, haciendo
menos importantes los elementos paneados a los lados o circundantes. Es
necesario razonar en este caso cómo la mezcla binaural puede mostrarse menos
impactante, a pesar de las posibilidades que ofrece, respecto a la mezcla 5.1
cuando no se hace uso de elementos que las aprovechen todas, es decir, que a la
hora de comparar piezas sonoras que se encuentren mezcladas de forma habitual,
únicamente en la parte frontal del plano horizontal, se obtiene mejor definición y
claridad en los sonidos en la mezcla 5.1, así sea sacrificando la espacialidad y el
envolvimiento no tan importantes en dicho caso. Es importante además, tener en
cuenta que a pesar de que en la mezcla se procuró no ubicar estos sonidos
específicos en el mismo punto que los ambientes (escenas 3, 4 y 6) y/o el diálogo
(escenas 3 y 6), mezclar grabaciones hechas en espacios con características
acústicas diferentes, como lo es el sonido directo grabado en campo versus el
Foley grabado en estudio, a pesar del proceso de edición en que se procuró darle
la coloración característica del sonido directo, en ocasiones puede producir
resultados turbios y confusos en una mezcla binaural debido a que para realizar la
espacialización y distribución de los sonidos se aplican diferentes procesos que al

59
ser utilizados en audios de diversa naturaleza y características les añade
propiedades particulares y modifica las ya existentes, lo que genera que en vez de
volverlos similares o mantener el color que se les imprimió, al mezclarlos se tornen
difusos, en especial cuando se solapan en un punto específico del plano unos y
otros; mientras que en una mezcla 5.1 aunque muchos sonidos de naturaleza
diferente sean mezclados, estos aún pueden percibirse separados y diferenciarse
claramente. Este tipo de situaciones pueden analizarse gracias a la variedad de
las escenas en cuanto a elementos sonoros que las conforman, así se pudieron
evaluar los parámetros para diferentes escenarios sonoros tales como los
conformados únicamente por efectos, música o diálogos, o combinaciones entre
estos.

En cuanto a la prueba piloto, a pesar de que se ejecutó con una muestra de la


población bastante pequeña (8 individuos), puede decirse que los resultados
hacen evidente cómo el sistema OPSODIS Marantz RC002ES reproduce de
manera óptima mezclas en formato 5.1 y binaural, según lo evaluado en esta
prueba, pues los oyentes dieron calificaciones altas a los tres aspectos a valorar
para ambos tipos de reproducción; lo que además ratifica que las mezclas fueron
hechas de forma semejante, resultado deseado en el proceso de postproducción,
que fortalecería el hecho de que las diferencias encontradas y la superioridad de
una mezcla sobre la otra en uno u otro aspecto se debe a la configuración en que
fue realizada (Binaural o 5.1) y no a la mezcla en sí.

Es importante anotar que algunos de los individuos que realizaron la prueba


manifestaron su dificultad al elegir una u otra mezcla mientras veían las imágenes
y pidieron se les repitieran ambas reproducciones de las escenas para únicamente
escucharlas y así tener más claridad en la elección. Este factor fue solamente
anotado y no se tomó medida alguna respecto a estos comentarios, más allá de
tenerlos en cuenta y exponerlos, para sugerir como alcance un estudio en que se
revele con cifras si las imágenes en contraste con el sonido realmente ayudan al
espectador a definir, limitar y clarificar la imagen sonora o por el contrario pueden
causarle confusión; o incluso si esto varía de una configuración de mezcla a otra,
lo que sería realmente comprensible en el caso de la mezcla binaural, pues el
oyente promedio de la población que participó en este estudio no está
acostumbrado a contrastar dicho sonido con la imagen, mientras que le es común
en una mezcla 5.1 por ser esta la configuración más utilizada en mezcla para
audiovisuales.

60
7. CONCLUSIONES

En general se comprueba que un sistema binaural se acerca de mejor forma al


audio 3D que un sistema 5.1, pues brinda mayor espacialidad y envolvimiento,
parámetros que se buscan con la adición de más parlantes. Sin embargo en
cuanto a definición del sonido, la puntualidad en ubicación del sistema 5.1 permite
dar al objeto sonoro separación, claridad y distinción de los demás objetos.

Al momento de llevar a cabo el proceso de mezcla binaural a partir de pistas de


audio monofónicas y estereofónicas, y por medio del plug in Panorama 5 de Wave
Arts, se pudo ratificar la importancia de la reverberación y el delay en la mezcla
audiovisual por encima de cualquier otro proceso de edición; y a pesar de que
otros elementos como la ecualización, dan información respecto al espacio
acústico donde se sitúa el sonido y respecto a la fuente que lo produce, la
reverberación da la idea final de la cercanía o lejanía de los objetos a través de los
parámetros de decaimiento y reflexiones tempranas. Una evidencia de la
importancia que tiene la reverberación es que el plug in se vale de este elemento
para realizar el posicionamiento de los objetos, y aunque permite ajustar a gusto
parámetros de reverberación añadida, cuando esta no es utilizada puede notarse
que el movimiento de un objeto modifica al mismo con retrasos y reflexiones, lo
que permite concluir adicionalmente la importancia del cuidado al alterar estas
características, pues realizan un cambio en la ubicación y definición espacial del
elemento sonoro más allá de la que ya se estableció en el plano de ubicación
virtual.
En cuanto a la postproducción puede concluirse que independientemente del tipo
de mezcla es importante previo a este proceso realizar un control de frecuencias,
en especial cuando se trata de sonido directo grabado en campo abierto, pues
este puede captar una serie de sonidos más allá de los deseados que ensucien la
grabación, y aunque esto haga parte del ambiente y la coloración, frecuencias muy
bajas o muy altas (Bajo 100 Hz y por encima de 15kHz) pueden ser molestas a la
hora de combinar los sonidos y contaminar el resultado general, lo que generará
únicamente confusión en el oyente, en especial si se aplican procesos que puedan
hacer difuso el sonido, como es el caso de la mezcla binaural a partir de audios
monofónico y estereofónicos.
Del proceso de trabajar con sonido directo puede concluirse que, a la hora de
realizar Foley o un doblaje, siempre es importante realizar ecualización y dar al
sonido la coloración característica del espacio donde la acción o el diálogo se
presentan, además de mantener el ruido de fondo característico de la grabación,
pues esto ayuda a conservar el realismo y la inmersión del oyente dentro de la
escena; en especial si se desea dar a lo grabado una ubicación específica en el
plano, pues debe ser congruente con los elementos que lo circundan y no resaltar
como si estuviese fuera del mismo. Y de nuevo se hace necesario resaltar el uso

61
prudente de la reverberación en la edición previo a la mezcla, pues en el proceso
de mezcla el plug in se encarga de añadir otro tanto.
Como conclusión respecto a la imagen visual puede decirse que es posible que
esta se presente como una limitante a la hora de realizar la mezcla, en especial en
el formato binaural, debido a que el posicionamiento de los objetos y el tamaño de
los espacios presentados en pantalla requieren correlación con lo escuchado para
dar realismo a la imagen sonora; esto no permite el manejo libre de parámetros
como espacialidad y envolvimiento y confina la distribución de sonidos; lo que para
casos de lugares cerrados u objetos pequeños y muy puntuales al frente del
espectador, limita la mezcla a una simple variación de una mezcla estereofónica,
lo cual se agrava si a esto se le suma el desuso de la ubicación de elementos en
el eje vertical. Sin embargo no puede desconocerse que la imagen visual no deja
de ser una guía para la ubicación de sonidos en cuanto a direccionalidad se refiere
y para la caracterización del espacio respecto a los elementos y fuentes sonoras
que lo conforman. Además a la hora de la reproducción, en especial de una
mezcla binaural donde se ha trabajado ampliamente el espacio 3D con la
ubicación de sonidos por todo el plano horizontal y vertical, la imagen visual puede
ayudar a suplir esas falencias que mostró dicha mezcla en cuanto a definición,
pues concreta visualmente lo que el oyente entiende como vago o difuso al
escucharlo.
Puede observarse a la hora de realizar las mezclas, escuchar el resultado y hacer
el ejercicio de comparación que se pide en la prueba subjetiva, además de
acuerdo con los resultados espacialidad y envolvimiento que la mezcla binaural
permite dar la sensación de un espacio más amplio, que aunque es físicamente
dependiente del sistema de reproducción por el sweet spot que este maneje,
proporciona la impresión de estar menos limitado que el generado en una mezcla
5.1 que tiene fijos sus 6 puntos de emisión; posiblemente por lo difuso de los
límites, dados en este caso, por los ambientes, la música o los efectos ubicados
en la parte más lejana
Con base en el análisis que se hizo respecto a la prueba piloto realizada con el
método diferencial semántico de Osgood se puede concluir que la variación en los
sonidos de una mezcla en formato binaural o 5.1, al ser reproducidas por el
sistema OPSODIS Marantz RC002ES se debe más al proceso de postproducción
que al sistema de reproducción, pues ya fue visto que este reproduce ambas
configuraciones de manera adecuada.
Finalmente una vez más se comprueba que es necesario ahondar mucho más en
el estudio del audio binaural, por medio de la exploración de las facultades que
ofrece y cómo puede ser adaptado a los diferentes formatos de reproducción de
audio versus video, para aprovechar las posibilidades que este brinda y trabajar en
las falencias que presenta, buscando por ejemplo otras maneras de eliminar la
necesidad del uso de audífonos, pues es, por mucho, lo más cercano al audio 3D
y puede ser adaptado de diversas maneras a la producción audiovisual, musical y
de videojuegos.

62
8. BIBLIOGRAFÍA

[1] M. Chion, Audio-vision, New York: Editions Nathan, 1994.

[2] J. Buxó, De la investigación audiovisual, Barcelona: Proyecto a, 1999.

[3] Dolby, «Dolby,» 2014. [En línea]. Available:


http://www.dolby.com/us/en/professional/technology/cinema/dolby-digital.html.

[4] G. DellaSala, «The Dolby Atmos Experience,» Audioholics, 2013.

[5] Semana, «Hitos del cine colombiano,» 2015. [En línea]. Available:
http://www.semana.com/cultura/multimedia/cine-colombiano-los-mejores-
momentos/420030-3. [Último acceso: Abril 2015].

[6] Dolby, «Dolby,» 2014. [En línea]. Available:


http://www.dolby.com/us/en/consumer/content/movie/theater/find-a-cinema.html.

[7] F. J. Mojica, «Estudio prospectivo de la formación audiovisual en Colombia al año 2019».

[8] L. J., Métodos avanzados de Evaluación y Análisis en Ingeniería Acústica, 2001.

[9] R. R. Mariño, «Técnicas de sonido binaural en la postproducción audiovisual,» Gandia, 2011.

[10] F. H. Zwicker E., Psychoacoustics. Facts and Models, 1999.

[11] J. Liaño, «Acústica y vibraciones,» 2013. [En línea]. Available:


http://www.acusticayvibraciones.com/articulos/grabacion-biaural.html.

[12] S. W. Jean-Marc Jot, «Approaches to binaural synthesis,» AES, 1998.

[13] H. W. G. a. K. Genuit, «ProcessingArtificial-Head Recordings,» AES, 1989.

63
[14] J. A. T. Viveros, «Pontificia Universidad Javeriana,» 2009. [En línea]. Available:
http://www.javeriana.edu.co/biblos/tesis/artes/tesis69.pdf. [Último acceso: 2014].

[15] H. Moller, «Fundamentals of Binaural Technology,» Dinamarca, 1992.

[16] Wave arts, Inc., «Wave Arts,» 2014. [En línea]. Available:
http://wavearts.com/products/plugins/panorama/. [Último acceso: 2014].

[17] Wave Arts Audio, Wave Arts Panorama demo,


http://www.youtube.com/watch?v=bK59QO1oY7k, 2008.

[18] Audiofanzine, «Audiofanzine,» Abril 2011. [En línea]. Available:


http://en.audiofanzine.com/surround-sound-spacialization-software/longcat-
audio/h3d/news/a.play,n.10311.html. [Último acceso: 2014].

[19] VRSonic, «KVRAudio,» Noviembre 2011. [En línea]. Available:


http://www.kvraudio.com/product/vibestudio-designer-by-vrsonic#. [Último acceso: 2014].

[20] Shure Europe GmbH, «Shure,» 2014. [En línea]. Available:


http://www.shure.es/asistencia_descargas/contenido-
educativo/microfonos/stereo_microphone_techniques. [Último acceso: 2014].

[21] Facultad de Bellas Artes UNLP, «Astormastering,» UNLP, [En línea]. Available:
http://www.astormastering.com.ar/Clase_12_Tecnicas_de_Microfoneo_de_sala.pdf.
[Último acceso: Marzo 2015].

[22] Sound on sound, «Surround Sound Mixing,» Sound on sound, 2001.

[23] Videomaker magazine, «Videomaker,» 19 Julio 2013. [En línea]. Available:


http://www.videomaker.com/article/15800-surround-sound-part-2-getting-the-mix. [Último
acceso: 2014].

[24] Producers & Engineers Wing Surround Sound Recommendations Committee,


«Recommendations For Surround Soun Production,» The Recording Academy's Producers &
Engineers Wing, 2004.

[25] Facultad de Bellas Artes UNLP, «Astormastering,» [En línea]. Available:


http://www.astormastering.com.ar/Clase_12_Tecnicas_de_Microfoneo_de_sala.pdf.
[Último acceso: 2014].

[26] I. Allen, «Are movies too loud?,» 1997.

[27] Avid Technology, Inc., «Avid,» 2011. [En línea]. Available:

64
http://avid.force.com/pkb/articles/en_US/user_guide/en419211?popup=true&NewLang=en
&DocType=1082&q=All%20Pro%20Tools%20Documents&site=kbase&filter=0&subfilters=us
erguides;&ProductCategory=Audio;. [Último acceso: 2014].

[28] D. G. Najar, Interviewee, Postproducción de audio para audiovisuales. [Entrevista]. Enero


2014.

[29] Archivo sonoro, «Archivo sonoro,» [En línea]. Available:


http://www.archivosonoro.org/documentos/?Documentos:Definiciones. [Último acceso:
2014].

[30] Universidad nacional abierta y a distancia, «Universidad nacional aberta y a distancia,» [En
línea]. Available:
http://datateca.unad.edu.co/contenidos/208030/Material_Didactico/post_produccin_de_a
udio_para_medios_audiovisuales.html. [Último acceso: 2014].

[31] V. T. Ament, The Foley Grail, Focal press, 2009.

[32] T. Takeuchi, «3D sound reproduction with "OPSODIS" ans its commercial applications,»
2011.

[33] J. A. R. Rábago, «Generación de fuentes virtuales de sonido en audífonos,» Universidad de


las américas, Puebla, 2005.

[34] P. U. Edgar Y. Choueiri, «Optimal Crosstalk Cancellation for Binaural Audio with Two
Loudspeakers,» 2013. [En línea]. Available:
http://www.princeton.edu/3D3A/Publications/BACCHPaperV4d.pdf. [Último acceso: 2014].

[35] T. Letowski, «Sound Quality Assessment: Cardinal,» 87th Convention of the Audio, 1989.

[36] F. Rumsey, «Spatial Quality Evaluation for Reproduced Sound:,» Institute of Sound
Recording, University of Surrey, UK, and School of Music in Piteå,, 2001.

[37] Mendenhall, Introducción a la probabilidad y estadística, México D.F.: Cengage Learning


Editores, S.A., 2010.

[38] X. Bosun, «Signal Mixing for a 5.1-Channel Surround Sound System'Analysis and
Experiment,» Audio Engineering Society, 2001.

[39] P. Flanagan, G. Dickins y L. Layton, «Real-Time Virtual Acoustics for 5.1,» Audio Engineering
Society, 1999.

[40] K. Matsui y A. Ando, «Binaural Reproduction of 22.2 Multichannel Sound with Loudspeaker

65
Array Frame,» Audio Engineering Society, 2013.

[41] University of Southampton, «University of Southampton,» 18 Septiembre 2013. [En línea].


Available:
https://www.southampton.ac.uk/engineering/research/projects/development_of_3channel
_opsodis_3d_soun.page. [Último acceso: 2014].

[42] E. O. S. K. a. S. H. P. Hwan Shim, «Perceptual Evaluation of Spatial Audio,» Audio Engineering


Society, 2010.

[43] E. Armelloni, A. Farina y p. martignon, «Comparison between Different Surround


Reproduction Systems: ITU 5.1 vs PanAmbio 4.1,» Audio Engineering Society, 2005.

[44] H. Lee, «Subjective Evaluations of Perspective Control Microphone Array (PCMA),» AES E-
Library, 2012.

[45] Universidad Nacional abierta y a distancia, «Universidad Nacional abierta y a distancia,»


Universidad Nacional abierta y a distancia, 1999. [En línea]. Available:
http://datateca.unad.edu.co/contenidos/401552/Capitulo_8/814prueba_pares_diferencia_
o_prueba_pareada.html. [Último acceso: Abril 1025].

[46] Instituto Colombiano de Normas Técnicas y Certificación (ICONTEC), «www.icontec.org,» 19


06 2013. [En línea]. Available: http://tienda.icontec.org/brief/NTC2680.pdf. [Último acceso:
31 10 2014].

[47] M. T. A. A. J. G. B. Jaime Arnau Gras, Metodología de la investigación en ciencias del


comportamiento, Murcia: Universidad de Murcia, 1990.

[48] G. K., Artificial Head with Simplified Mathematical Describable Geometry, 2002.

[49] «Norma ISO 9614 Referencia».

[50] Cine Digital, «cinedigital.tv,» 2014. [En línea]. Available: http://www.cinedigital.tv/que-es-


un-dcp-digital-cinema-package/. [Último acceso: 2014].

66
9. ANEXOS

9.1 Anexo 1

Consentimiento Informado Participantes de Investigación: Comparación de


mezclas de audio de escenas de un cortometraje para audio binaural y 5.1,
reproducidos por el sistema Opsodis Marantz RC002ES, por medio de
pruebas subjetivas
El propósito de esta ficha de consentimiento es proveer a los participantes en esta
investigación una clara explicación de la naturaleza de la misma, así como de su
rol en ella como participantes.
La presente investigación es conducida por Alejandra Gutiérrez Mesa, de la
Universidad San Buenaventura Medellín. La meta de este estudio es Comparar las
mezclas de audio de escenas de un cortometraje, seleccionadas según la
importancia que cobre el sonido en las mismas, para audio 5.1 y binaural,
reproducidos por el sistema Opsodis Marantz RC002ES, por medio de pruebas
subjetivas diseñadas para tal fin.
Si usted accede a participar en este estudio, se le pedirá calificar unos atributos
sonoros.
La participación es este estudio es estrictamente voluntaria y no remunerada. La
información que se recoja será confidencial y no se usará para ningún otro
propósito fuera de los de esta investigación. Sus respuestas serán anónimas.
Si tiene alguna duda sobre este proyecto, puede hacer preguntas en cualquier
momento durante su participación en él. Igualmente, puede retirarse del proyecto
en cualquier momento sin que eso lo perjudique en ninguna forma. Si alguna de

67
las preguntas le parecen incómodas, tiene usted el derecho de hacérselo saber al
investigador o de no responderlas.
De antemano se le agradece su participación.

Acepto participar voluntariamente en esta investigación, conducida por Alejandra


Gutiérrez Mesa. He sido informado (a) de que la meta de este estudio es
Comparar las mezclas de audio de escenas de un cortometraje, seleccionadas
según la importancia que cobre el sonido en las mismas, para audio 5.1 y binaural,
reproducidos por el sistema Opsodis Marantz RC002ES, por medio de pruebas
subjetivas diseñadas para tal fin.
Me han indicado también que tendré que calificar atributos sonoros.
Reconozco que la información que yo provea en el curso de esta investigación es
estrictamente confidencial y no será usada para ningún otro propósito fuera de los
de este estudio sin mi consentimiento. He sido informado de que puedo hacer
preguntas sobre el proyecto en cualquier momento y que puedo retirarme del
mismo cuando así lo decida, sin que esto acarree perjuicio alguno para mi
persona. De tener preguntas sobre mi participación en este estudio, puedo
contactar a Alejandra Gutiérrez Mesa al teléfono 3166964943.
Entiendo que una copia de esta ficha de consentimiento me será entregada, y que
puedo pedir información sobre los resultados de este estudio cuando éste haya
concluido. Para esto, puedo contactar a Alejandra Gutiérrez Mesa al teléfono
anteriormente mencionado.

--------------------------------------------------------------------------------------------------------------
Nombre del Participante Firma del Participante
Fecha

--------------------------------------------------------------------------------------------------------------

68
Nombre del Investigador Firma del Investigador
Fecha

9.2 Anexo 2

Prueba subjetiva de escucha - Comparación de mezclas de audio de escenas


de un documental para audio binaural y 5.1, reproducidos por el sistema
Opsodis Marantz RC002ES, por medio de pruebas subjetivas.

Introducción
A continuación se le presentarán 10 escenas de un documental postproducido con
técnicas para audio binaural y surround. Cada una será reproducida dos veces,
una con el audio binaural y la otra con el audio surround (A y B en orden
aleatorio). Usted podrá escuchar las escenas en sus configuraciones auditivas
cuantas veces considere necesario.
Se le pedirá que inmediatamente presencie ambas reproducciones de cada
escena elija la mejor para cada parámetro a evaluar: espacialidad, definición y
envolvimiento. Para esto por favor tenga en cuenta las siguientes definiciones:

 Espacialidad: Es la distribución de las fuentes sonoras en el espacio acústico de


tamaño determinado. Permite al oyente establecer la dirección de proveniencia
de la fuente
 Definición: Es la estabilidad de la imagen sonora brindada por la distinción entre
cada una de las fuentes
 Envolvimiento: Es la impresión subjetiva de inmersión en el sonido, producida
por el grado de llenado de la imagen sonora alrededor del oyente

69
 Distancia: Es el rango espacial percibido entre el oyente y la fuente reproducida

Escena 1 2 3 4 5 6 7 8 9 10
Espacialidad
Definición
Envolvimiento

9.3 Anexo 3

Resultados prueba subjetiva

Espacialidad

Tabla 9. Resultados Espacialidad

Escena 1 2 3 4 5 6 7 8 9 10
B A B A A A B B B A
B B A B B B B B B B
A B A A A B B A A A
A A A B B A B A B B
B B A A A A A B A A
B A A B A B B B B A
B A A B A B A A B B
B A B A B A B B A A
B B A B B B A A B A
B B A A B B B B B A
A B B B B B B A B A
A A B B B B B B B A
B B B B B A A B B B
A B B A B B B B A B
B B B B A B A A A A
B B A A A B A A B A
A A A B A A A B B A
A A B B B A B B A B

70
A B A A A B B A A A
B A B B A B B B B A
B A B B B A B A B A
B B A B B A B B B A
B A A B A B B A A A
A B B B A B B B B A
B B B B A A B A B A
Frecuencia A 9 11 13 8 13 10 7 11 8 19
Frecuencia B 16 14 12 17 12 15 18 14 17 6
Resultado Binaural 5.1 5.1 5.1 Binaural 5.1 Binaural Binaural Binaural Binaural

Definición

Tabla 10. Resultados Definición

Escena 1 2 3 4 5 6 7 8 9 10
A B A B B B B B A A
A A A B B B A B A B
B A A B B A A B A B
B B A A B B B B A A
A B B B B A A B B B
B B B B B A A A A A
A B B B B A A B A B
A A A B B B A B A B
B A B A B A A B B B
B B B B B B A B B A
B A A B A B B B A B
A B B B B B A B B A
A B B B B B A B A B
A B A A B B A B B B
A B A B B B B A B B
B B A B B A A A A B
B A A B B B A B A B
A A A B B A B B A B
A B A A B A B A A B
A A B B B B A B A B
A A B A B A B B B B

71
A B B B B B B B B B
A B B B B B A B B B
A B B B B A A B B B
A A A B B B A B A B
Frecuencia A 17 10 13 5 1 10 17 4 15 5
Frecuencia B 8 15 12 20 24 15 8 21 10 20
Resultado 5.1 5.1 5.1 5.1 5.1 5.1 5.1 Binaural 5.1 5.1

Envolvimiento

Tabla 11. Resultados Envolvimiento

Escena 1 2 3 4 5 6 7 8 9 10
B A A B A B B A B A
B A A A A B A B A B
B B A B A B B A B A
A A B A A B B A B A
B B A B A B B B B A
A A A A A A B B B A
B A B A B B A B B B
A A A B A B A B B B
B B A B B B A A A A
B B A A A B A B B A
B A A B A B B B A B
B A A B A B B A B A
A A A B A B A A B A
A B A A B B A B B B
B B A B B B B B B A
B B A A B B A A A B
B B A A A B B A B B
B A B B B A B B A B
B A B B B B B A B A
B A B B A B A B B A
B B A B B B A A A A

72
B B A B A B B A A A
B A A B A B B A A A
A B B B B A B B B B
B A A B B A A B B A
Frecuencia A 6 14 19 8 15 4 11 12 8 16
Frecuencia B 19 11 6 17 10 21 14 13 17 9
Resultado Binaural Binaural 5.1 5.1 Binaural 5.1 Binaural Binaural Binaural Binaural

9.4 Anexo 4

Resultados prueba piloto con el método de Osgood

Espacialidad

Tabla 12. Resultados Espacialidad mezcla 5.1

Escenas
5.1 1 2 3 4 5 6 7 8 9 10
3 3 4 4 3 4 3 4 4 3
4 3 5 4 3 2 3 3 2 3
4 3 2 3 3 3 3 1 4 3
3 3 3 3 3 3 4 4 4 2
3 3 3 4 3 4 4 3 4 4
4 3 2 5 5 5 5 5 5 5
4 4 5 3 4 3 2 4 3 3
3 4 2 5 4 5 3 3 4 5
3,5 3,25 3,25 3,87 3,5 3,62 3,37 3,37 3,75 3,5
Promedio 3,56 3,28 3,15 3,85 3,56 3,57 3,42 3,29 3,71 3,56
Moda 4 3 2 3 3 3 3 3 4 3
Mediana 3,75 3 3 3,93 3,25 3,31 3,18 3,18 4 3,25

73
Tabla 13. Resultados Espacialidad mezcla Binaural

Binaural Escenas
1 2 3 4 5 6 7 8 9 10
3 3 5 4 3 4 3 4 5 4
4 5 4 3 5 4 4 3 2 5
4 2 3 3 3 2 3 3 3 3
4 4 3 3 4 3 4 3 4 3
3 4 3 4 4 4 4 3 4 3
5 3 5 5 5 3 5 3 5 5
2 4 4 5 3 3 2 3 5 3
4 2 4 3 3 4 5 4 4 3
3,63 3,38 3,88 3,75 3,75 3,38 3,75 3,25 4,00 3,63
Promedio 3,70 3,42 3,73 3,72 3,84 3,30 3,84 3,16 3,88 3,58
Moda 4 4 4 3 3 4 4 3 4 3
Mediana 4 3,69 3,94 3,38 3,88 3,19 4 3 4 3

Definición
Tabla 14. Resultados Definición mezcla 5.1

Escenas
5.1 1 2 3 4 5 6 7 8 9 10
4 5 5 5 3 5 3 3 3 4
4 4 5 3 2 3 3 3 3 3
3 3 3 4 2 4 4 3 4 4
3 4 4 4 4 2 3 3 3 3
4 3 4 4 4 4 4 4 4 4
3 3 3 5 5 5 5 5 2 5
4 3 4 4 5 3 2 4 3 4
4 4 4 4 5 4 3 4 4 4
3,63 3,63 4,00 4,13 3,75 3,75 3,38 3,63 3,25 3,88
Promedio 3,58 3,45 3,88 4,02 3,84 3,59 3,42 3,70 3,28 3,86
Moda 4 3 4 4 5 4 3 3 3 4
Mediana 3,81 3,31 4,00 4,00 4,00 3,88 3,19 3,81 3,13 4,00

Tabla 15. Resultados Definición mezcla Binaural

Escenas
Biunaural 1 2 3 4 5 6 7 8 9 10
4 4 4 5 3 5 4 5 3 4
3 5 3 4 4 2 4 3 3 5
3 3 4 4 2 4 3 3 3 4

74
3 4 4 4 5 3 3 2 3 3
3 4 4 4 4 4 4 4 3 4
5 4 4 5 5 5 5 5 5 5
3 3 4 5 4 3 2 3 4 3
4 4 4 5 4 4 4 4 5 4
3,5 3,88 3,88 4,5 3,88 3,75 3,63 3,63 3,63 4
Promedio 3,44 3,86 3,86 4,44 3,98 3,59 3,58 3,45 3,70 4
Moda 3 4 4 4 4 4 4 3 3 4
Mediana 3 4 4 4,25 4 3,88 3,81 3,31 3,31 4

Envolvimiento
Tabla 16. Resultados Envolvimiento mezcla 5.1

Escenas
5.1 1 2 3 4 5 6 7 8 9 10
3 4 3 4 5 5 4 4 3 4
5 3 4 2 2 3 4 4 3 2
5 1 5 2 4 2 1 1 1 3
4 3 3 3 3 3 4 3 5 2
4 3 4 4 3 3 4 3 4 3
5 3 5 5 4 3 5 5 4 5
5 3 5 3 4 3 3 4 3 3
4 4 4 3 4 4 4 4 4 4
Promedio 4,37 3 4,12 3,25 3,62 3,25 3,62 3,5 3,37 3,25
Moda 5 3 4 3 4 3 4 4 3 3
Mediana 4,5 3 4 3 4 3 4 4 3,5 3

Tabla 17. Resultados Envolvimiento mezcla Binaural

Escenas
Binaural 1 2 3 4 5 6 7 8 9 10
3 4 3 4 3 4 4 3 4 4
3 4 3 3 5 3 4 4 4 5
4 2 5 2 5 2 4 3 4 1
4 3 4 3 4 3 4 3 4 3

75
4 4 3 4 3 3 3 3 4 3
5 5 4 5 5 2 5 3 5 3
3 4 3 5 4 3 3 3 5 3
5 4 4 4 5 4 4 3 4 4
Promedio 3,87 3,75 3,62 3,75 4,25 3 3,87 3,12 4,25 3,25
Moda 3 4 3 4 5 3 4 3 4 3
Mediana 4 4 3,5 4 4,5 3 4 3 4 3

9.5 Anexo 5

Prueba de hipótesis

Prueba de hipótesis para experimentos binomiales


̂
̂

Un resultado mayor o igual al 50% no es representativo

Con n=25, p0=0,5 y α=10%

Espacialidad
Tabla 18. Prueba de hipótesis Espacialidad

FRECUENCIA ABSOLUTA COEFICIENTE DE REPRESENTATIVO (R) /


BINAURAL 5.1 ̂ z ASIMETRÍA NO REPRESENTATIVO (NR)
16 9 0,64 1,4 -0,11666667 R
11 14 0,56 0,6 -0,04834938 NR

76
12 13 0,52 0,2 -0,01601282 NR
8 17 0,68 1,8 -0,15434873 R
13 12 0,52 0,2 -0,01601282 NR
10 15 0,6 1 -0,08164966 NR
18 7 0,72 2,2 -0,19599158 R
14 11 0,56 0,6 -0,04834938 NR
17 8 0,68 1,8 -0,15434873 R
19 6 0,76 2,6 -0,24351231 R

Definición
Tabla 19. Prueba de hipótesis Definición

FRECUENCIA ABSOLUTA REPRESENTATIVO (R) /


COEFICIENTE DE
̂ NO REPRESENTATIVO (NR)
BINAURAL 5.1 z ASIMETRÍA
8 17 0,68 1,8 -0,15434873 R
10 15 0,60 1 -0,08164966 NR
12 13 0,52 0,2 -0,01601282 NR
5 20 0,80 3 -0,3 R
1 24 0,96 4,6 -0,93897107 R
10 15 0,60 1 -0,08164966 NR
8 17 0,68 1,8 -0,15434873 R
21 4 0,84 3,4 -0,37097041 R
10 15 0,60 1 -0,08164966 NR
5 20 0,80 3 -0,3 R

Envolvimiento
Tabla 20. Prueba de hipótesis Envolvimiento

FRECUENCIA ABSOLUTA COEFICIENTE REPRESENTATIVO (R) /


BINAURAL 5.1 ̂ z DE ASIMETRÍA NO REPRESENTATIVO (NR)
19 6 0,76 2,6 -0,24351231 R
14 11 0,56 0,6 -0,04834938 NR

77
6 19 0,76 2,6 -0,24351231 R
8 17 0,68 1,8 -0,15434873 R
15 10 0,6 1 -0,08164966 NR
4 21 0,84 3,4 -0,37097041 R
14 11 0,56 0,6 -0,04834938 NR
13 12 0,52 0,2 -0,01601282 NR
17 8 0,68 1,8 -0,15434873 R
16 9 0,64 1,4 -0,11666667 R

Lista de tablas
Tabla 2. Técnicas de grabación estéreo y surround ................................................................. 14
Tabla 3. Desglose Foley y doblaje ............................................................................................... 38
Tabla 4. Edición Foley y doblaje de acuerdo a locación .......................................................... 39
Tabla 5. Escenas a presentar....................................................................................................... 51
Tabla 6. Codificación escenas presentadas, método simple ciego ........................................ 54
Tabla 7. Resultados en frecuencia relativa y porcentaje, Espacialidad................................. 55
Tabla 8. Resultados en frecuencia relativa y porcentaje, Definición ...................................... 56
Tabla 9. Resultados en frecuencia relativa y porcentaje, Envolvimiento .............................. 57
Tabla 10. Resultados Espacialidad ............................................................................................. 70
Tabla 11. Resultados Definición .................................................................................................. 71
Tabla 12. Resultados Envolvimiento ........................................................................................... 72
Tabla 13. Resultados Espacialidad mezcla 5.1 ......................................................................... 73
Tabla 14. Resultados Espacialidad mezcla Binaural ................................................................ 74
Tabla 15. Resultados Definición mezcla 5.1 .............................................................................. 74
Tabla 16. Resultados Definición mezcla Binaural ..................................................................... 74
Tabla 17. Resultados Envolvimiento mezcla 5.1 ....................................................................... 75
Tabla 18. Resultados Envolvimiento mezcla Binaural .............................................................. 75
Tabla 19. Prueba de hipótesis Espacialidad .............................................................................. 76
Tabla 20. Prueba de hipótesis Definición ................................................................................... 77
Tabla 21. Prueba de hipótesis Envolvimiento ............................................................................ 77

Lista de Figuras

78
Figura 1.Plug in Panorama 5 – Wave Arts, tomado de [17] .................................................... 11
Figura 2. Ejemplo Pantalla de visualización Plug in Longcat H3D, tomado de [18] ............ 12
Figura 3. Plug in Longcat H3D, tomado de [18]......................................................................... 12
Figura 4. Plug in Vibestudio designer, tomado de [18] ............................................................. 13
Figura 5. Grabación con micrófono Soundfield, tomado de [22]............................................. 16
Figura 6. Distribución de parlantes en arreglo 5.1. El círculo representa el receptor. ........ 17
Figura 7. Niveles pico para bandas sonoras en cinta magnética, tomado de [24] .............. 18
Figura 8. Rango dinámico para bandas sonoras en formato óptico, tomado de [24] .......... 19
Figura 9. Plug-in de Pro tools 10 suite Complete Production Kit para paneo 5.1, tomado de
[27] .................................................................................................................................................... 20
Figura 10. Estudio Foley, tomado de [31] ................................................................................... 22
Figura 11. Modelo matemático cross talk cancellation, sistema OPSODIS.. ¡Error! Marcador
no definido.
Figura 12. Scouting Sierra Viva.................................................................................................... 36
Figura 13. Revisión corte final documental ................................................................................ 37
Figura 14. Grabación Foley .......................................................................................................... 39
Figura 15. Edición sonido directo y Foley ................................................................................... 40
Figura 16. Ubicación de fuente en el plug in Panorama 5. ...................................................... 46
Figura 17. Biombos absorbentes ................................................................................................. 52
Figura 18. Dimensiones en metros cuarto de ejecución de la prueba ................................... 52
Figura 19. Adecuación y ubicación punto de escucha prueba subjetiva; medidas en metros
........................................................................................................................................................... 53
Figura 20. Gráfica Espacialidad, binaural vs. 5.1 ...................................................................... 56
Figura 21. Gráfica Definición, binaural vs. 5.1 ........................................................................... 57
Figura 22. Gráfica envolvimiento, binaural vs. 5.1 .................................................................... 58

79

S-ar putea să vă placă și