Documente Academic
Documente Profesional
Documente Cultură
ASESOR
2
TABLA DE CONTENIDO
Contenido
1. INTRODUCCIÓN .................................................................................................. 6
2. OBJETIVOS ......................................................................................................... 8
1.1. 2.1 Objetivo general ........................................................................................... 8
1.2. 2.2 Objetivos específicos: ................................................................................. 8
2. MARCO TEÓRICO............................................................................................... 9
1.3. 2.1 Producción audio binaural .......................................................................... 9
2.1.1 Grabación audio binaural ................................................................................... 9
2.1.2 Mezcla audio binaural........................................................................................ 10
1.4. 2.2 Producción audio surround ...................................................................... 13
2.2.1 Grabación audio surround................................................................................ 13
2.2.2 Mezcla 5.1............................................................................................................ 16
1.5. 2.3 Planos sonoros en postproducción audiovisual ................................... 20
2.3.1 Ambientes ........................................................................................................... 21
2.3.2 Diálogos .............................................................................................................. 21
2.3.3 Música ................................................................................................................. 21
2.3.4 Efectos ................................................................................................................ 21
1.6. 2.4 ............................................................. Sistema de reproducción OPSODIS
22
1.7. 2.5 Percepción la calidad del audio ............................................................... 25
1.8. 2.5 ............................................Análisis estadístico con pruebas de hipótesis
27
3. ESTADO DEL ARTE.......................................................................................... 30
1.9. 3.1 Antecedentes Históricos ........................................................................... 30
1.10. ......................................................................................................................... 3
.2 Referencias ................................................................................................... 31
4. DISEÑO METODOLÓGICO PRELIMINAR ....................................................... 33
1.11. ......................................................................................................................... 4
.1 Prueba de preferencia pareada .................................................................. 33
3
1.12. 4.2 ............................................................................ Método del simple ciego
34
5. DESARROLLO .................................................................................................. 35
1.13. ......................................................................................................................... 5
.1 Selección de las escenas del documental a trabajar de acuerdo con la
importancia que cobra el sonido en las mismas .......................................... 35
1.14. ......................................................................................................................... 5
.2 Postproducción y mezcla de las escenas seleccionadas utilizando
herramientas para audio binaural y 5.1 ......................................................... 37
9.2.1 Mezcla 5.1............................................................................................................ 43
9.2.2 Mezcla binaural .................................................................................................. 46
1.15. ......................................................................................................................... 5
.3 Diseño del formato de consulta para evaluar los principales parámetros
sonoros de las mezclas binaural y 5.1: epacialidad, definición y
envolvimiento. .................................................................................................. 49
1.16. ......................................................................................................................... 5
.4 Ejecución de la prueba ................................................................................ 50
5.4.1 Respecto a los oyentes ..................................................................................... 51
5.4.2 Respecto al estímulo ......................................................................................... 51
5.4.3 Respecto al método ........................................................................................... 51
6. RESULTADOS ................................................................................................................. 55
6.1 Espacialidad .......................................................................................................... 55
6.2 Definición ............................................................................................................... 56
6.3 Envolvimiento ........................................................................................................ 57
6.4 Resultados generales ........................................................................................... 58
7. CONCLUSIONES............................................................................................................. 61
8. BIBLIOGRAFÍA .................................................................................................. 63
9. ANEXOS ............................................................................................................. 67
1.17. ......................................................................................................................... 9
.1 Anexo 1 .......................................................................................................... 67
1.18. ......................................................................................................................... 9
.2 Anexo 2 .......................................................................................................... 69
1.19. ......................................................................................................................... 9
.3 Anexo 3 .......................................................................................................... 70
Espacialidad ................................................................................................................ 70
4
Definición ..................................................................................................................... 71
Envolvimiento .............................................................................................................. 72
1.20. ......................................................................................................................... 9
.4 Anexo 4 .......................................................................................................... 73
1.21. 9.5 ......................................................................................................... Anexo 5
76
5
1. INTRODUCCIÓN
6
La grabación y reproducción de audio obtenido por medio de cabezas binaurales
ha sido ya previamente explorada mostrando las ventajas del mismo en
cuestiones de espacialización y envolvimiento, y su alto grado de acercamiento al
audio 3D [8]. Sin embargo la postproducción y el tratamiento de este tipo de audio,
e incluso el manejo de audio monofónico y estereofónico procesado para simular
audio binaural, no ha sido estudiado por un amplio grupo de profesionales en
producción sonora y visual, desconociendo los alcances del producto auditivo, una
vez terminado, en la producción para medios audiovisuales [9].
Teniendo en cuenta las dificultades de configuración que presentan ambos
sistemas para su reproducción (La cantidad de parlantes para audio surround, y la
necesidad de audífonos para audio binaural o filtros para su reproducción en
altavoces), El Instituto de investigación en sonido y vibraciones (The Institute Of
Sound And Vibration Research) ha desarrollado un sistema de teatro en casa
compuesto por un parlante de varias unidades internas que permite reproducción
de audio binaural y surround creando un ambiente envolvente. Dicha tecnología
conocida como Opsodis (Optimal Source Distribution) busca consolidarse en el
mercado de la reproducción sonora con la ventaja de ser una sola unidad que no
requiere de complejas instalaciones y a su vez permite la reproducción de varios
formatos de audio y configuraciones envolventes.
Es así como, finalmente, en la producción audiovisual se podrá disponer de un
amplio conocimiento y de herramientas que permitan con mayor precisión obtener
el producto deseado implementando técnicas mixtas y desarrollando a profundidad
las ya utilizadas, acercándose cada vez más al audio 3D.
7
2. OBJETIVOS
8
2. MARCO TEÓRICO
9
2.1.2 Mezcla audio binaural
10
Panorama 3D-Wave Arts (Figura 1)
11
Figura 2. Ejemplo Pantalla de visualización Plug in Longcat H3D, tomado de [18]
12
Su interfaz consiste en una pantalla en que se visualiza en un plano 3D la
ubicación de los elementos o canales de audio y desde la cual se puede controlar
su movimiento y tamaño. Por medio de diferentes expansiones permite controlar
los parámetros del recinto virtual en que se desean ubicar los elementos, por
medio de datos como la distancia, la absorción, los materiales de construcción, la
reverberación, y demás [19].
13
Tabla 1. Técnicas de grabación estéreo y surround
14
Hamasaki Cuatro micrófonos Óptima captura
square bidireccionales con los del ambiente y la
lóbulos apuntando hacia el difusión del
centro sonido en el
recinto de
grabación
15
Grabación con micrófono Soundfield (Figura 5)
16
Figura 6. Distribución de parlantes en arreglo 5.1. El círculo representa el receptor.
Sin embargo en ocasiones la recreación del ambiente sonoro puede ser una tarea
complicada, cuando se recurre a la grabación con técnicas que involucren más de
2 micrófonos, dedido a que el posicionamiento de los micrófonos no coincide
17
totalmente con la ubicación de los parlantes de reproducción. Para los audios que
serán reproducidos en los parlantes traseros suele procesarse una disminución de
nivel para las altas frecuencias con el fin de simular la escucha humana, e incluso,
en ocasiones se realiza un retrado de entre 10 y 15 milisegundos con el fin de
lograr mayor espacialidad y profundidad. Estas modificaciones deben realizarse de
forma cuidadosa para no generar un desequilibrio psicoacústico indeseado [25].
Estas recomendaciones de mezcla pueden ser variadas dependiendo de la
imagen presentada en la pantalla o de la intensión que quiera dársele a la mezcla;
sin embargo es necesario tener en cuenta que el subwoofer se encuentra limitado
por el rango de frecuencias que puede reproducir [24].
A pesar de que el proceso de mezcla es mayormente artístico, se debe tomar en
cuenta que al realizarse el downmixing, proceso por el cual una mezcla surround
se configura para ser reproducida en un sistema mono/stereo, el nivel de los
altavoces al ser sumados puede superar los 0dBFs por lo que es importante tomar
en cuenta una serie de recomendaciones, las cuales indican mantener el nivel del
parlante central y los 4 surround a máximo -3dBFs, y el nivel del subwoofer -
12dBFs menos que los demás altavoces. De esta manera se garantiza tener una
versión mono/stereo dentro de los rangos de reproducción, y además, permite
mantener un headroom en el que se podrán ubicar elementos más fuertes [23].
Igualmente la empresa Dolby ha determinado unas curvas (Figura 7 y Figura 8)
donde, dependiendo del formato, se presentan unos niveles máximos por
frecuencias; igualmente es necesario tomar en cuenta el formato en que fue
grabado y será reproducido el material audiovisual, pues las curvas varían para
formato digital y análogo (Cinta magnética) [26]:
Figura 7. Niveles pico para bandas sonoras en cinta magnética, tomado de [24]
18
Figura 8. Rango dinámico para bandas sonoras en formato óptico, tomado de [24]
Como herramienta de mezcla de audio 5.1 el programa Pro tolos, como plataforma
de edición de audio versus video, en su décima versión, ofrece en su suite
Complete Production Kit, una pantalla de paneo para canales que serán
reproducidos en una configuración 5.1, -Entre otras- amplias opciones para la
ubicación espacial de un canal de audio tanto en desplazamiento horizontal como
en profundidad.
19
Figura 9. Plug-in de Pro tools 10 suite Complete Production Kit para paneo 5.1, tomado de [27]
20
2.3.1 Ambientes
2.3.2 Diálogos
2.3.3 Música
2.3.4 Efectos
Los efectos son los sonidos específicos de una escena, que pueden ser derivados
de alguna acción física, o de una intensión narrativa. Pueden conseguirse por
medio de librerías de sonidos, su grabación en campo, síntesis de sonido o por
medio de Foley, una técnica de grabación de efectos sonoros en un espacio
controlado (Figura 10¡Error! No se encuentra el origen de la referencia.) [31].
21
Figura 10. Estudio Foley, tomado de [31]
22
Para lograr una correcta reproducción y superando el inconveniente de la
necesidad de usar de audífonos, el sistema OPSODIS incluye filtros especiales de
cancelación del efecto crosstalk, lo que evita que las señales se filtren desde los
puntos de radiación y lleguen al receptor de forma indeseada, esto causando
interferencias en frecuencias altas mayormente y creando distorsión.
Concretamente en el caso de la reproducción de audio binaural evita que las
señales derecha e izquierda se mezclen, llegando a ambos oídos en cantidades
indeseadas, entorpeciendo así el proceso de diferenciación y ubicación realizado
por el cerebro con base en la información entregada al canal auditivo, más
concretamente, por medio de las diferencias interaurales de tiempo e intensidad.
Esto impide que se dificulte el posicionamiento de fuentes y se vuelva difusa la
imagen sonora [34].
Los filtros usados para dicha cancelación se basan en la teoría de posicionamiento
de los parlantes, en la cual se explica que la creación y direccionalidad de la
imagen sonora está íntimamente relacionada con la ubicación física de la fuente, y
se evidencia que para reproducir y manipular dicha imagen de forma arbitraria, se
hace necesario tener mínimo dos señales provenientes de fuentes reales
totalmente independientes, con el fin de direccionarlas a cada oído en la forma
deseada sin que se solapen o se interfieran de manera incontrolable [32]. Con la
anterior condición cumplida se explica el funcionamiento de un filtro de
cancelación de crosstalk de la siguiente manera:
Supóngase una fuente de audio binaural con dos señales D, las cuales ingresan a
un filtro inverso H y a partir de ahí se reproduce por dos altavoces generando dos
señales S que llegan a los oídos de un oyente quien capta una sola señal W.
Tomando en cuenta el efecto crosstalk las señales S1 (Izquierda) y S2 (Derecha) se
descompondrían en S11 arribando al oído izquierdo y S12 arribando al oído
derecho, y S21 arribando al oído izquierdo y S22 arribando al oído derecho.
De esta manera las señales de interferencia son S12 y S21.
El resultado final, es decir la señal W captada por el oyente es la señal original D
normalmente descompuesta en sus respectivas señales S, procesadas por el filtro
inverso H (Ecuación 1):
W=DHS, → W ≈D
23
El resultado de este filtro convencional genera unas pérdidas de nivel en ciertas
frecuencias, por lo que el resultado se asemejaría a un filtro peine, donde se haría
necesario incrementar el nivel de la señal para compensarlo, con el resultado de
baja definición y degradación de la señal a causa de la pérdida de rango dinámico
y distorsión agregada [32]. Éste tipo de filtros se entienden como el resultado del
posicionamiento de parlantes a una angulación entre ellos, tomando como punto
central el espectador (Entre 180º y 0º): Entre mayor sea el ángulo de apertura
entre los parlantes se generará una menor pérdida en ganancia, pero habrá una
gran variación de la misma en función de la frecuencia, creando una respuesta
inestable en el dominio de la frecuencia; a menor ángulo (comportamiento de
dipolo estéreo) el comportamiento en frecuencia será más uniforme pero la
pérdida de nivel se aumentará proporcionalmente con la frecuencia [32].
Combinando estos conceptos, el sistema Opsodis RC002ES se genera por medio
de un arreglo de 3 pares de parlantes con diferente angulación entre ellos: los
parlantes encargados de reproducir altas frecuencias se ubican en el centro con
poca angulación, de modo que brinden una respuesta estable; los parlantes para
bajas frecuencias se encuentran en los extremos con mayor angulación
presentando poca pérdida a dichas frecuencias, y los parlantes encargados de
reproducir un rango medio se encuentran en el centro de cada arreglo dando una
respuesta estable en ganancia a lo largo del rango de frecuencias
correspondiente; es por esto que en caso de necesitar el uso de subwoofers se
deben utilizar dos parlantes ubicados a los extremos del arreglo. Para evitar los
problemas de fase, las señales son enviadas con una diferencia de 90º, lo que
generará interferencias destructivas para la componente de la señal generada por
el efecto crosstalk, y constructivas para la componente original de la señal [32].
De esta manera, el sistema Opsodis no es dependiente de la frecuencia en su
respuesta en fase y amplitud evitando pérdida en la calidad de la señal y en el
rango dinámico, lo cual permite su reproducción en cualquier sala, a diferencia de
un sistema convencional con cancelación del efecto crosstalk que requiere de una
cámara anecóica o semianecóica para su correcta reproducción [32].
En conclusión, las características de mayor importancia del sistema Opsodis son:
24
2.5 Percepción la calidad del audio
25
total, siempre en relación con el ambiente de emisión. En otras palabras, el
enfoque se centra en describir y evaluar las características espaciales
tridimensionales en una escena auditiva reproducida en altavoces o en audífonos
[36].
Se presentan entonces, derivados de estas definiciones, una serie de atributos
con valoraciones objetivas, distribuidos de acuerdo con su naturaleza, bien sea en
relación con la fuente o en relación con el entorno de reproducción:
Atributos relativos a la fuente:
Tiempo de reverberación.
Variación del tiempo de reverberación en función de la frecuencia.
Por otro lado se realiza una división más acorde a la evaluación subjetiva, que al
modelamiento de fuentes y espacios:
26
Reproducción del ambiente, la espacialidad y la reverberación.
Perspectiva: Sensación propia de inmersión en relación con el entorno
sonoro.
Sin embargo, de forma más técnica, la norma IEC 60268 para la evaluación de
sistemas sonoros de amplificación define tres factores bajo el título calidad
espacial global:
Espacialidad: Cerrado-Amplio.
Distancia: Lejos-Cerca.
Ubicación de las fuentes: Inestable-Estable.
Finalmente entonces pueden definirse los parámetros a evaluar con base en las
características descritas por cada autor [36]:
27
resultados, probabilidad p y desviación estándar σ, en la que se desea probar una
hipótesis de la forma (Ecuación 2)
Estos cinco elementos forman una prueba particular y la variación de una o más
de estas partes crea una prueba diferente.
Una vez se definen las suposiciones iniciales se buscan todas las pruebas
posibles para contradecir dicha suposición; bien sea que las pruebas sean
suficientes o no, se obtiene un resultado que rechace la hipótesis alternativa o que
no la rechace (Lo que no significa que demuestre su aprobación, simplemente no
la rechaza). El estadístico de prueba (Ecuación 4) actúa como apoyo para tomar
decisiones acerca de si se acepta o rechaza H0:
28
Ecuación 4. Estadístico de prueba, prueba de hipótesis
Para decidir aceptar o rechazar H0, el conjunto de valores que puede tomar el
estadístico de prueba se divide en (Figura 11):
29
3. ESTADO DEL ARTE
30
su funcionamieto con trasmisiones de televisión pensadas para tal fin y pueda ser
adaptado a juegos de video. Se pensó además en adaptar dicha tecnología a
automóviles; y completando la cadena desarrollar facilidades para los creadores
de contenido de audio 3D [41].
3.2 Referencias
En 2010 Hwan Shim ha realizado un estudio para evaluar la calidad del audio en
términos de espacialidad. El resultado muestra cuáles atributos de espacialización
influencian el sentido de realidad en la reproducción de audio y cuáles son difíciles
de reproducir en sistemas surround 10.2, 22.2 y 5.1. Se proponen 8 atributos en 3
categorías: Timbre (Naturalidad, distinción), localización (Dirección, movimiento,
distancia, volumen) y espacialidad (Ancho aparente de la fuente, envolvimiento al
oyente). Los estímulos fueron elegidos de contenidos audiovisuales producidos
para cada formato de reproducción. Para la evaluación subjetiva se utilizó el
método de diferencial semántico: Los sujetos fueron entrevistados para reportar lo
que sentían en base a los atributos seleccionados evaluándolos en una escala de
1 (Pobre calidad) a 7 (Calidad ideal). Se evaluaron 7 sujetos con conocimiento en
audio quienes hacían la prueba en un cuarto para escucha equipado con un
sistema 22.2 capacitado para reproducir los otros dos y una pantalla transparente
para video. Referente al estímulo se utilizaron 12 tracks audiovisuales de duración
entre 15 y 30 segundos para la reproducción en cada sistema, los cuales fueron
aleatorizados. Los resultados mostraron que el sistema 22.2 es significativamente
mejor que el 5.1 para todos los atributos, excepto para movimiento y volumen; al
igual que el sistema 10.2 para naturalidad y envolvimiento. Se encontró que los
atributos distancia y naturalidad afectan ampliamente la calidad en general,
además que todos los atributos están estrechamente relacionados entre sí,
especialmente envolvimiento y ancho aparente mostrándose como los de mejor
calificación. En conclusión las pruebas subjetivas mostraron que a mayor número
de altavoces los atributos se reproducen mejor; sin embargo algunos atributos
como el volumen son difíciles de reproducir incluso con amplio número de
parlantes; además se concluyó que los atributos perceptuales más influyentes en
la calidad son, para fuentes en movimiento distancia y naturalidad y para fuentes
estáticas envolvimiento y ancho aparente [42].
31
Con el objetivo de explorar técnicas diferentes a las estéreo que brinden realismo
al audio usado en el ámbito comercial y/o publicitario, se realizó en la Pontificia
Universidad Javeriana de Bogotá en el año 2009 un estudio acerca de la
aplicación del audio binaural en publicidad auditiva. Se crearon diferentes tipos de
comerciales, de acuerdo con la división dada por la publicidad, y fueron grabados
y editados tanto con técnicas binaurales como estereofónicas. Se encontró como
aspecto positivo a resaltar el impacto que generaba el audio publicitario en el
oyente cuando se utilizaba la técnica de audio binaural, pues le creaba una
sensación de realismo y captaba su atención en un alto grado, factor fundamental
en la publicidad; además se rescata la combinación entre sonido binaural y
estereofónico para una misma pieza auditiva, situándolos en diferentes tiempos
con el fin evitar la cancelación del efecto binaural por parte de los audios
trabajados de forma estereofónica [14].
Para evaluar la técnica PCMA (Perspective Control Microphone Array) para
controlar la espacialidad brindada por ciertos arreglos de micrófonos se
desarrollaron dos pruebas de escucha subjetiva, las cuales fueron diseñadas con
el fin de dar un valor cualitativo al resultado del audio obtenido con el uso de esta
técnica en cuanto a distancia y profundidad. Una primer prueba fue hecha para
examinar la relación existente entre los atributos señalados y la longitud a la
fuente, utilizando instrumentos grabados en una cámara anecóica a diferentes
distancias posteriormente convolucionados con la respuesta al impulso obtenida
con técnicas binaurales de la sala donde se realizó la prueba; se llegó a la
conclusión de que la percepción de profundidad disminuye cuando incrementa la
distancia a la fuente. La segunda prueba evaluó tres arreglos de micrófonos a los
cuales se les aplicó la técnica PCMA en una grabación orquestal, encontrando que
las variaciones en el códec brindan cambios en el resultado similares a los
notados en la prueba anterior. Con esto se logra demostrar la validez y efectividad
del uso de PCMA en la postproducción gracias a las posibilidades de
espacialización que brinda [44].
32
4. DISEÑO METODOLÓGICO PRELIMINAR
Campo de aplicación:
Se aplica en situaciones en las que se requiere determinar una diferencia
perceptible de un atributo particular; seleccionar, entrenar o hacer seguimiento al
desempeño a los individuos entrevistados; y comparar dos atributos en términos
de preferencia. El método es aplicable si existe disimilitud en un solo atributo
sensorial o en varios, lo que permite determinar si hay una diferencia significativa
respecto a una propiedad determinada.
33
Respecto a otras pruebas de discriminación presenta ventajas en cuando a la
sencillez en su aplicación y la menor fatiga sensorial en los participantes
Respecto al estímulo:
No es necesario que la diferencia de nivel de estímulo entre las muestras de un
par sea igual en todos los pares; sin embargo se debe garantizar la diferencia
entre los mismos [45].
Ejecución de la prueba:
Los individuos participantes reciben un grupo de dos muestras, inmediatamente
indican la muestra que consideran más intensa en el atributo a evaluar, incluso si
su elección se trata sólo de una conjetura. Finalmente se hace un conteo de las
veces que una u otra muestra fue seleccionada [46].
34
5. DESARROLLO
La forma de abordar la ejecución del proyecto fue por medio de los objetivos
específicos, en el orden en que fueron planteados, de los cuales se desprendieron
las actividades, como puede ser observado en el cronograma:
35
Figura 12. Scouting Sierra Viva
Luego de este proceso se seleccionaron las escenas en que el sonido permitía ser
mezclado de manera envolvente (Figura 13), y se eligió un conjunto que mostrara
las diferentes situaciones que podían presentarse en la mezcla de sonido de un
proyecto audiovisual: tanto la fusión de todos los planos sonoros como el
protagonismo de alguno específico. De esta manera en algunas escenas puede
observarse cómo interactúan la música, los diálogos, los efectos y los ambientes
entre sí, y en otras cómo un solo plano sonoro se distribuye a lo largo del eje
horizontal y crea la sensación de envolvimiento por sí mismo, sin la necesidad de
otros elementos auditivos.
36
Figura 13. Revisión corte final documental
37
Teniendo las escenas seleccionadas se procedió al montaje del sonido directo y la
edición del mismo, de forma tal que se hicieron evidentes los momentos en que
era necesaria la grabación de Foley y doblaje. Respecto a los diálogos de este
trabajo, se tuvo especial cuidado con el lipsync y los tiempos de inicio y
terminación, para ser consecuente con la elección de las escenas que buscaba
dejar frases completas. La música fue adaptada conforme fuera necesario a la
duración de la escena; y finalmente los ambientes fueron cuidadosamente
ubicados de acuerdo al lugar de la imagen proyectada y la hora de captura, para
mantener siempre la coherencia entre audio y video.
38
Figura 14. Grabación Foley
Se realizó la captura del doblaje (monofónico) con un micrófono AKG 414 y una
pantalla anti viento, y el Foley (Figura 14) por medio de la técnica de grabación
estéreo ORTF con dos micrófonos de referencia Shure SM58 y un micrófono
shotgun Rode NTG adicional que captara los sonidos de manera más direccional,
pero más alejado, con el fin de mezclar las señales y darle profundidad a las
tomas.
39
Ambiente: Espacio abierto Espacio sin reverberación, sonido
natural con contenido similar en
todas las frecuencias
Corte final 6 Voz: Construcción cerrada Espacio con tiempo medio de
reverberación de 2 segundos
aproximadamente, predominio de
frecuencias bajas
Espacios abiertos con Espacio sin reverberación con
Corte final 7 construcciones al rededor contenido similar en todas las
frecuencias
Ambiente: Espacio abierto con Espacio sin reverberación, sonido
árboles alrededor, cercado por natural con contenido similar en
objetos y construcciones todas las frecuencias
Límites Voz: Construcción cerrada Espacio con tiempo medio de
reverberación de 3 segundos
aproximadamente, predominio de
frecuencias bajas
Espacio sin techo con árboles y Espacio sin reverberación, sonido
Palomino 2 algunos objetos alrededor, natural con contenido similar en
delimitado por una cerca de madera todas las frecuencias
40
Corte final 1
Ambientes: Los ambientes acompañan toda la escena y se les dio gran
importancia debido a que la escena transcurre al aire libre, lo que significa
que los ambientes brindan toda la información de ubicación y dan la
sensación de inmersión en la escena.
Diálogos: El último saludo fue doblado por problemas técnicos con el sonido
directo y ecualizado para adaptarlo al ambiente, disminuyendo el contenido
en bajas frecuencias asemejándolo al sonido directo.
Efectos: En esta escena todos los efectos fueron extraídos del sonido
directo, excepto los pasos de uno de los personajes que fueron grabados
en estudio.
Corte final 2
Ambientes: Los ambientes acompañan toda la escena, brindan toda la
información de ubicación y dan la sensación de inmersión en la escena.
Efectos: Para esta escena los pasos, la cadena y el cierre del maletín
fueron grabados en estudio y editados para adaptarlos al ambiente y
asemejarlos al sonido directo. El audio de la cadena fue comprimido para
reducir las diferencias de intensidad y acentuar el ataque.
Corte final 3
Ambientes: Los ambientes acompañan toda la escena, brindan toda la
información de ubicación y dan la sensación de inmersión en la escena.
Efectos: En esta escena todos los efectos fueron extraídos del sonido
directo.
Corte final 4
Ambientes: Los ambientes acompañan toda la escena, brindan toda la
información de ubicación y dan la sensación de inmersión en la escena.
Efectos: En esta escena el sonido de la motosierra y del perro fueron
extraídos del sonido directo y los pasos fueron grabados en estudio.
Corte final 5
Ambientes: Los ambientes acompañan toda la escena y se les dio gran
importancia debido a que la escena transcurre al aire libre en un
ecosistema rico en fauna con gran componente frecuencial, brindando toda
la información de ubicación y dando la sensación de inmersión en la escena
Diálogo: Fue ecualizado para hacerlo más inteligible y se le aplicó un filtro
pasa bajos para eliminar frecuencias molestas captadas en la grabación del
sonido directo.
Efectos: En esta escena los únicos efectos presentes son los pasos, los
cuales fueron tomados del sonido directo y ecualizados.
41
Corte final 6
Ambientes: Los ambientes acompañan toda la escena y se les dio gran
importancia debido a que la escena transcurre al aire libre y consiste en la
muestra de unas acciones ocurridas en los espacios que contextualizan el
lugar en que el documental fue grabado. Brindan toda la información de
ubicación y dan la sensación de inmersión en la escena.
Diálogo: En esta escena el diálogo fue tomado del sonido directo.
Efectos: Para esta escena todos los efectos fueron recreados en el estudio
y ecualizados para simular su grabación en escena.
Corte final 7
Ambientes: Los ambientes acompañan toda la escena y se les dio gran
importancia debido a que la escena transcurre al aire libre y brindan toda la
información de ubicación dando la sensación de inmersión en la escena.
Música: La música fue grabada previamente en estudio por un músico
quien la compuso especialmente para el documental con la intensión de
mostrar los elementos sonoros propios de la región.
Efectos: En esta escena únicamente los pasos fueron grabados en estudio
y ecualizados para darles el color característico de la escena, los demás
efectos fueron tomados del sonido directo.
Límites
Ambientes: Los ambientes acompañan toda la escena y se les dio gran
importancia debido a que en la escena se habla del lugar mostrado.
Diálogo: En esta escena el diálogo fue ecualizado debido a que el espacio
donde se grabó tiene un alto tiempo de reverberación y componentes en
frecuencias medias especialmente.
Efectos: Los pasos de esta escena fueron grabados en estudio y
ecualizados para dar el color del sonido directo. La bicicleta fue tomada del
sonido directo.
Palomino 1
Ambientes: Los ambientes acompañan toda la escena y se les dio gran
importancia debido a que la escena transcurre al aire libre y brindan toda la
información de ubicación dando la sensación de inmersión en la escena.
Música: La música grabada previamente en estudio.
Efectos: En esta escena los pasos fueron tomados del sonido directo. El
cigarrillo fue recreado en estudio con la grabación de elementos con un
sonido similar, los cuales fueron mezclados y posteriormente ecualizados
para asemejarse lo más posible al sonido original.
Palomino 2
Ambientes: Los ambientes acompañan toda la escena y brindan toda la
42
información de ubicación del espacio donde transcurre la acción dando la
sensación de inmersión.
Efectos: En esta escena todos los efectos fueron recreados en el estudio y
ecualizados para darles el color característico del sonido.
43
Corte final 1
Ambientes: Mezclados en 4.0.
Diálogos: En esta escena los diálogos se ubicaron según su dirección de
proveniencia, uno en el parlante trasero izquierdo y otro en el trasero
derecho.
Efectos: El sonido del gallo al principio fue ubicado en la parte frontal pues
abarcaba toda la pantalla en su aparición. La puerta de la siguiente escena
también fue ubicada en el parlante central y automatizada hacia el parlante
derecho según el movimiento percibido. Los pasos por su parte fueron
automatizados desde el parlante trasero derecho al frontal derecho con un
porcentaje al central, pues los personajes se movían de esta manera en
escena.
Corte final 2
Ambientes: Mezclados en 4.0.
Diálogo: El diálogo se situó mayormente en el centro y se varió el
porcentaje enviado a los parlantes laterales delanteros según la dirección
en que se ubicaba el personaje en la pantalla.
Efectos: Los pasos, la cadena y el contacto con la motosierra se
automatizaron en paneo entre los tres parlantes frontales según el
movimiento percibido.
Corte final 3
Ambientes: Mezclados en 4.0
Diálogos: El diálogo se ubicó en el centro con un pequeño porcentaje a los
parlantes laterales en la parte inicial de la escena y se movió gradualmente
hacia el parlante derecho debido al movimiento del personaje.
Efectos: En esta escena todos los efectos fueron ubicados en el parlante
central; igualmente se les dio importancia con el nivel por su protagonismo.
Corte final 4
Ambientes: Mezclados en 5.0. Se decidió enviar al parlante central un
porcentaje del ambiente debido a la ausencia de diálogo en la escena.
Efectos: El sonido del perro y los pasos fueron direccionados al parlante
delantero izquierdo según su ubicación en la pantalla, mientras que el
sonido de la motosierra fue enviado al parlante derecho y al centro por su
protagonismo en la escena.
Corte final 5
Ambientes: Mezclados en 4.0.
Diálogo: En esta escena el diálogo se ubicó según su dirección de
proveniencia, entre el parlante delantero izquierdo y el parlante central,
estando en constante movimiento.
44
Efectos: En esta escena los únicos efectos presentes son los pasos, los
cuales fueron paneados igual que los diálogos.
Corte final 6
Ambientes: Mezclados en 5.0.
Diálogo: En esta escena el diálogo se ubicó en los 4 parlantes laterales
pues el orador no aparece en escena.
Efectos: Para esta escena todos los efectos fueron direccionados según su
aparición en escena.
Corte final 7
Ambientes: Mezclados en 4.0.
Música: Se decidió asignarle un nivel sonoro predominante en esta escena
y mezclarla en 5.0 aprovechando la ausencia de diálogo.
Efectos: Todos los efectos fueron direccionados y automatizados en paneo
según su movimiento en escena.
Límites
Ambientes: Fueron mezclados en 4.0 con el fin de brindar la sensación de
inmersión en la escena.
Diálogo: En esta escena el diálogo se ubicó en el parlante central.
Efectos: Los pasos de esta escena fueron automatizados en paneo al igual
que la bicicleta, que según el movimiento que hace se le dio direccionalidad
desde el parlante izquierdo al central y un poco al derecho.
Palomino 1
Ambientes: Mezclados en 4.0.
Diálogo: En esta escena el diálogo se ubicó en el parlante central pues es
allí donde se muestra el personaje.
Música: La música fue mezclada en 4.0 cuidando de no interferir con el
ambiente pero dándole preponderancia.
Efectos: En esta escena los pasos fueron direccionados según su aparición
en el encuadre. El cigarrillo fue enviado al centro.
Palomino 2
Ambientes: Mezclados en 4.0.
Diálogo: En esta escena el diálogo se ubicó en 4.0 pues el sonido directo
no permitió la separación de este del ambiente y debido a que la escena no
se centra en el diálogo se prefirió darle importancia al ambiente.
Efectos: En esta escena todos los efectos fueron direccionados según su
aparición y los pasos automatizados según el movimiento.
45
9.2.2 Mezcla binaural
Corte final 1
Ambientes: La fuente se ubicó en el lugar del oyente para tener difusión por
todo el espacio horizontal.
46
Diálogos: El diálogo proveniente de la parte trasera derecha se ubicó a 135º
y el proveniente de la parte trasera izquierda a -120º. En cuanto a difusión
se cuidó de dar todo el protagonismo al sonido directo y no tener
reflexiones debido a que la escena transcurre en un espacio abierto.
Efectos: A los pasos se les dio la misma dirección de proveniencia de la voz
y se automatizaron para que se acercaran hacia el centro y frente del
oyente, según la escena muestra. La puerta se ubicó al centro y al frente y
se automatizó 20º a la derecha a medida que transcurría el movimiento. El
gallo se ubicó al centro y al frente. Todos los efectos fueron mezclados con
la mínima reverberación para conservar la concordancia con el espacio
físico.
Corte final 2
Ambientes: La fuente se ubicó en el lugar del oyente para tener difusión por
todo el espacio horizontal.
Diálogo: El diálogo se ubicó en el centro a una distancia media del oyente y
se movió hacia los lados según la dirección en que se ubicaba el personaje
en la pantalla.
Efectos: Para esta escena los pasos fueron enviados al frente y
automatizados según el movimiento presentado, al igual que los demás
efectos, en especial el contacto con la motosierra al que se le dio mayor
importancia permitiendo su paneo a lo largo de todo el eje horizontal, pues
ocupa una parte importante de la pantalla.
Corte final 3
Ambientes: La fuente se ubicó en el lugar del oyente para tener difusión por
todo el espacio horizontal.
Diálogos: El diálogo se ubicó en el centro alejado del oyente en la primer
parte de la escena. En la segunda parte se acercó al oyente y se movió
gradualmente hacia la derecha debido al movimiento del personaje.
Efectos: Los efectos fueron enviados al centro y muy cerca al oyente según
ña imagen; igualmente se les dio importancia con el nivel por su
protagonismo.
Corte final 4
Ambientes: La fuente se ubicó en el lugar del oyente para tener difusión por
todo el espacio horizontal y se le dio gran nivel debido a la ausencia de
diálogo.
Efectos: El sonido del perro fue enviado a la parte izquierda a -65º, lejos del
oyente. Los pasos a -90º alejados al máximo del oyente, y la motosierra
muy cerca del oyente a 70º.
Corte final 5
Ambientes: La fuente se ubicó en el lugar del oyente para tener difusión por
todo el espacio horizontal y se le dio gran nivel debido a que la brindaban
47
toda la información de ubicación de la escena, cuidando de no interferir con
el diálogo.
Diálogo: El diálogo fue puesto a -90º y totalmente automatizado entre la
parte izquierda y central acercándolo y alejándolo del oyente según se
presentara en la imagen.
Efectos: En esta escena los únicos efectos presentes son los pasos los
cuales fueron automatizados de igual forma que el diálogo según fueran
más cercanos o lejanos en la imagen.
Corte final 6
Ambientes: La fuente se ubicó en el lugar del oyente para tener difusión por
todo el espacio horizontal y se le dio gran nivel debido a que brindaban toda
la información de ubicación de la escena, cuidando de no interferir con el
diálogo.
Diálogo: El diálogo se ubicó a 0º cercano al oyente, y con amplia difusión
para tenerlo en todo el espacio, aprovechando que el orador no hacía
aparición en escena, pero cuidando de mantenerlo legible.
Efectos: Los efectos se direccionaron según su aparición en la escena, sin
reverberación adicional y alejados del oyente para darle mayor importancia
al diálogo.
Corte final 7
Ambientes: La fuente se ubicó en el lugar del oyente para tener difusión por
todo el espacio horizontal y se le dio nivel medio debido a que brindaban
toda la información de ubicación de la escena; sin embargo se tomó en
cuenta que no eran el elemento principal.
Música: La música se ubicó en el lugar del oyente para tener difusión por
todo el espacio y se le dio alto nivel, tomándola como elemento principal
narrativo de la escena.
Efectos: Todos los efectos fueron direccionados según su aparición en
escena y puestos alejados del oyente con la intensión de no hacerlos
inteligibles separados del ambiente y la música.
Límites
Ambientes: Se ubicó la fuente en el lugar del oyente y difusión en todo el
espacio, dándoles gran importancia debido a que en la escena se habla del
lugar mostrado.
Diálogo: El diálogo se ubicó a 0º cerca al oyente como aparece en escena.
Efectos: Tanto los pasos como la bicicleta fueron automatizados; los pasos
de la derecha hacia el centro alejándose, y la bicicleta acercándose de
izquierda a derecha. Al igual el volumen se automatizó en los pasos
disminuyendo y en la bicicleta aumentando.
48
Palomino 1
Ambientes: La fuente fue ubicada en el lugar del oyente para obtener
difusión en todo el plano horizontal y dar sensación de inmersión.
Diálogo: En esta escena el diálogo se ubicó a 0º pues es allí donde se
muestra el personaje y lejos al oyente para no afectar su inteligibilidad con
la música y el ambiente.
Música: La música fue ubicada en el lugar del oyente con nivel alto para
darle preponderancia sobre el ambiente ubicado en el mismo punto.
Efectos: Los pasos fueron automatizados entre ±30º y el punto más lejano y
un punto cercano al oyente según se diera en la imagen; sin embargo no se
llevaron hasta el oyente para mantener la diferenciación con los demás
elementos que ya estaban ubicados allí.
Palomino 2
Ambientes: La fuente fue ubicada a 0º cerca al oyente, más no en el centro,
para conseguir la mejor difusión a lo largo del plano horizontal pero
cuidando la ubicación del diálogo que no fue posible separar del ambiente.
Diálogo: En esta escena el diálogo fue tomado del sonido directo, por lo que
se debió editar junto al ambiente a 0º cerca al oyente, obteniendo difusión
en el plano horizontal pero dirección al frente.
Efectos: En esta escena los efectos fueron ubicados cerca al oyente lejos
de los 0º y los pasos automatizados según su movimiento en el eje
horizontal un poco más lejos que las frutas.
5.3 Diseño del formato de consulta para evaluar los principales parámetros
sonoros de las mezclas binaural y 5.1: espacialidad, definición y
envolvimiento.
Para llevar a cabo éste objetivo lo primero a realizarse fue un estudio acerca de
los parámetros a evaluar con el fin de encontrar una definición clara, sencilla y
concisa de cada uno; esto con miras a evitar vacilación en la ejecución de la
prueba por parte de los individuos, tal como se indica en el diseño metodológico.
Para esto se tomaron como base algunas pruebas similares ya realizadas en las
que se usaron parámetros afines, y demás estudios semánticos relativos a las
características sonoras a evaluar (Remítase al Estado del Arte – 3.2 Referencias)
49
entre cada una de las fuentes.
Envolvimiento: Es la impresión subjetiva de inmersión en el sonido,
producida por el grado de llenado de la imagen sonora alrededor del
oyente.
Para el diseño de la prueba se hizo uso del método diferencial semántico por
degradación, pues permite realizar una calificación tanto cuantitativa como
cualitativa, debido a que los números extremos son indicados con adjetivos
bipolares. El mínimo número a registrar es el 1, representando la peor calidad del
atributo a evaluar, mientras que el máximo número, el 5, representa la mejor
calidad posible; es decir, el mejor o peor desempeño de la mezcla relativo a dicha
característica. Para tales efectos el mejor desempeño es entendido como la mayor
fidelidad en la reproducción respecto a la escena real y el peor desempeño como
una imagen sonora irreal en contraste con la imagen visual proyectada. Debido a
que los resultados de la prueba piloto no fueron concluyentes se decidió hacer uso
del método de preferencia pareada junto con el método del simple ciego, pues
permite realizar una elección cualitativa, debido a que consiste en la elección de
uno de dos estímulos, el que presentara el mejor desempeño.
Los individuos fueron entrevistados para reportar sus percepciones respecto a los
atributos seleccionados en la tabla de respuestas. Los estímulos fueron
reproducidos de forma aleatoria en términos de configuración de audio para evitar
juicios basados en las diferentes porciones audiovisuales. Así mismo, los oyentes
50
podían reproducir el estímulo cuantas veces consideraran necesario y de esta
forma realizar una calificación no apresurada.
1
Tabla 4. Escenas a presentar
1
Todas las escenas incluyen ambiente y pasos a excepción de la escena número 6 que no incluye pasos.
51
del oyente tal como lo indica el manual para usuarios. Para hacer más absorbente
el recinto y disminuir las reflexiones se utilizaron 3 biombos absorbentes (Figura
17¡Error! No se encuentra el origen de la referencia.) que delimitaron el espacio
de escucha a un cuadro de 3m2. En la Figura 19¡Error! No se encuentra el origen
de la referencia. puede observarse la distribución del espacio de la prueba y la
ubicación del oyente representada por un punto rojo; mientras que los biombos se
representan con rectángulos naranja y el sistema OPSODIS con un rectángulo
negro. El televisor fue ubicado detrás del sistema OPSODIS durante la ejecución
de las pruebas piloto.
52
Figura 18. Dimensiones en metros cuarto de ejecución de la prueba
3
3
Figura 19. Adecuación y ubicación punto de escucha prueba subjetiva; medidas en metros
53
El método de preferencia pareada se eligió debido a que permitía evidenciar qué
mezcla es elegida como la mejor en cada parámetro, pues el individuo sólo puede
elegir una u otra opción, codificada para él gracias al uso del método ciego en
reproducción A y reproducción B. Las escenas se reprodujeron en orden
numérico, primero A y luego B, e inmediatamente se terminaban ambas
reproducciones por escena el sujeto realizaba la calificación, o se repetían las
reproducciones tal como lo pidiera previo a la calificación. El orden de
reproducción de las mezclas para cada escena (Tabla 5) fue elegido
aleatoriamente sin criterio alguno. De esta manera cuando ambas mezclas (A y B)
de una escena se reproducían el sujeto elegía una mezcla para cada parámetro
desconociendo si se trataba de la mezcla binaural o 5.1.
Escena 1 2 3 4 5 6 7 8 9 10
A 5.1 Binaural 5.1 Binaural Binaural Binaural 5.1 5.1 5.1 Binaural
B Binaural 5.1 Binaural 5.1 5.1 5.1 Binaural Binaural Binaural 5.1
54
6. RESULTADOS
6.1 Espacialidad
55
Espacialidad
Binaural Vs. 5.1
80
Binaural 5.1
Puede apreciarse en los resultados que la mezcla binaural fue elegida por, entre el
52% y el 76%, de los participantes como la que mejor espacialidad presentaba
para 6 de las 10 escenas reproducidas; conforme con la prueba de hipótesis se
puede observar que sólo la mitad de las diferencias son significativas, de las
cuales 4 (entre el 64% y el 76% de los participantes) arrojan a la mezcla binaural
como la que mejor espacialidad presenta; mientras que las escenas 2, 3, 4 y 6
obtuvieron mayor elección de la mezcla 5.1, siendo la escena 4 la única que
obtuvo diferencias significativas.
6.2 Definición
56
Definición
Binaural Vs. 5.1
Porcentaje de elección (%) 120
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10
Número de escena
Binaural 5.1
Puede apreciarse en los resultados que la mezcla 5.1 fue elegida por, entre el
52% y el 96%, de los participantes como la que mejor definición presentaba para 9
de las 10 escenas reproducidas, siendo que conforme con la prueba de hipótesis
sólo 6 de las 10 calificaciones son de diferencias significativas, de las cuales 5
(entre el 68% y el 96% de los participantes) arrojan a la mezcla 5.1 como la que
mejor definición presenta. La escena 8 obtuvo mayor elección de la mezcla
binaural con una diferencia significativa.
6.3 Envolvimiento
57
10 16 9 0,64 0,36 64% 36% S
Envolvimiento
Binaural Vs. 5.1
100
Porcentaje de elección (%)
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10
Número de escena
Binaural 5.1
Puede apreciarse en los resultados que la mezcla binaural fue elegida por, entre el
52% y el 76%, de los participantes como la que mejor envolvimiento presentaba
para 7 de las 10 escenas reproducidas, siendo que conforme con la prueba de
hipótesis sólo 6 de las 10 calificaciones tienen diferencias significativas, de las
cuales tan solo 3 (entre el 64% y el 76% de los participantes) arrojan a la mezcla
binaural como la que mejor envolvimiento presenta. Mientras que las escenas 3, 4
y 6 obtuvieron mayor elección de la mezcla 5.1, todas con diferencias
significativas.
Los resultados de las pruebas realizadas muestran que existe una asociación
entre los parámetros espacialidad y envolvimiento, al ser percibidos como los
mejor reproducidos por la mezcla binaural; mientras que definición es evaluado
como mejor reproducido por la mezcla 5.1. Esto se debe, posiblemente, a que
para trasladar un objeto de forma artificial y modificar su difusión natural, el plug in
se vale de algoritmos que disminuyen la intensidad, pues hace uso de retardos y
reverberación, lo que genera una imagen difusa, es decir, con baja definición por
la combinación de los sonidos que han sido tratados; lo que se agrava si los
mismos se encuentran separados del punto central del plano, es decir, donde se
ubica el oyente, pues a mayor distancia se le asigne menor intensidad tendrá y
será menos definida su representación. En ese sentido se puede deducir que la
calidad de un sonido, representada en este caso por los parámetros espacialidad,
58
definición y envolvimiento, puede disminuir cuando de forma artificial se recrea un
espacio 3D a partir de pistas grabadas con técnicas monofónicas y estereofónicas.
Tomando en cuenta los resultados estadísticamente significativos únicamente, a
pesar de que fueron tan sólo la mitad mas uno como máximo para cada factor a
evaluar, de estos se obtiene que para el parámetro espacialidad en 4 de 5
escenas fue elegido el sistema binaural y para definición en 5 de 6 escenas los
oyentes eligieron el sistema 5.1; lo que muestra que la elección fue realmente
mayoritaria. Mientras que a la hora de evaluar el envolvimiento según los
resultados representativos, sólo en 3 de 6 escenas se eligió el sistema binaural; lo
cual puede significar que realmente los oyentes no percibieron una diferencia
importante entre la reproducción 5.1 y la binaural para el parámetro envolvimiento.
Los resultados que no fueron significativos de acuerdo con la prueba de hipótesis
apoyan la elección mayoritaria, en el sentido de que afianzan la preferencia de los
oyentes por la mezcla binaural para espacialidad y envolvimiento y la mezcla 5.1
para definición.
Otro factor que puede influir en las elecciones de los individuos participantes de la
prueba son los diferentes modelos de HRTF disponibles en el plug in, que varían
en cierto grado la localización de los sonidos. Para este caso se eligió el modelo
“Human” que fue el que mejor resultado presentó a juicio de quien realizó la
mezcla; sin embargo es imposible garantizar igual percepción en todos los oyentes
por las diferentes morfologías de la cabeza, entre otras cosas.
Se puede observar que fue en las escenas 3, 4 y 6 que los oyentes realizaron
elecciones contrarias a las demás escenas para los parámetros espacialidad y
envolvimiento, lo cual lleva a pensar que se trata de una discontinuidad producto
de la naturaleza de las escenas (composición de planos sonoros) y la mezcla de
las mismas. Por su contenido visual fue necesario centrar la mezcla de dichas
escenas en los efectos, pocos pero acentuados, a los que por ser protagonistas en
pantalla se les puso en medio, al frente y con nivel sonoro predominante, haciendo
menos importantes los elementos paneados a los lados o circundantes. Es
necesario razonar en este caso cómo la mezcla binaural puede mostrarse menos
impactante, a pesar de las posibilidades que ofrece, respecto a la mezcla 5.1
cuando no se hace uso de elementos que las aprovechen todas, es decir, que a la
hora de comparar piezas sonoras que se encuentren mezcladas de forma habitual,
únicamente en la parte frontal del plano horizontal, se obtiene mejor definición y
claridad en los sonidos en la mezcla 5.1, así sea sacrificando la espacialidad y el
envolvimiento no tan importantes en dicho caso. Es importante además, tener en
cuenta que a pesar de que en la mezcla se procuró no ubicar estos sonidos
específicos en el mismo punto que los ambientes (escenas 3, 4 y 6) y/o el diálogo
(escenas 3 y 6), mezclar grabaciones hechas en espacios con características
acústicas diferentes, como lo es el sonido directo grabado en campo versus el
Foley grabado en estudio, a pesar del proceso de edición en que se procuró darle
la coloración característica del sonido directo, en ocasiones puede producir
resultados turbios y confusos en una mezcla binaural debido a que para realizar la
espacialización y distribución de los sonidos se aplican diferentes procesos que al
59
ser utilizados en audios de diversa naturaleza y características les añade
propiedades particulares y modifica las ya existentes, lo que genera que en vez de
volverlos similares o mantener el color que se les imprimió, al mezclarlos se tornen
difusos, en especial cuando se solapan en un punto específico del plano unos y
otros; mientras que en una mezcla 5.1 aunque muchos sonidos de naturaleza
diferente sean mezclados, estos aún pueden percibirse separados y diferenciarse
claramente. Este tipo de situaciones pueden analizarse gracias a la variedad de
las escenas en cuanto a elementos sonoros que las conforman, así se pudieron
evaluar los parámetros para diferentes escenarios sonoros tales como los
conformados únicamente por efectos, música o diálogos, o combinaciones entre
estos.
60
7. CONCLUSIONES
61
prudente de la reverberación en la edición previo a la mezcla, pues en el proceso
de mezcla el plug in se encarga de añadir otro tanto.
Como conclusión respecto a la imagen visual puede decirse que es posible que
esta se presente como una limitante a la hora de realizar la mezcla, en especial en
el formato binaural, debido a que el posicionamiento de los objetos y el tamaño de
los espacios presentados en pantalla requieren correlación con lo escuchado para
dar realismo a la imagen sonora; esto no permite el manejo libre de parámetros
como espacialidad y envolvimiento y confina la distribución de sonidos; lo que para
casos de lugares cerrados u objetos pequeños y muy puntuales al frente del
espectador, limita la mezcla a una simple variación de una mezcla estereofónica,
lo cual se agrava si a esto se le suma el desuso de la ubicación de elementos en
el eje vertical. Sin embargo no puede desconocerse que la imagen visual no deja
de ser una guía para la ubicación de sonidos en cuanto a direccionalidad se refiere
y para la caracterización del espacio respecto a los elementos y fuentes sonoras
que lo conforman. Además a la hora de la reproducción, en especial de una
mezcla binaural donde se ha trabajado ampliamente el espacio 3D con la
ubicación de sonidos por todo el plano horizontal y vertical, la imagen visual puede
ayudar a suplir esas falencias que mostró dicha mezcla en cuanto a definición,
pues concreta visualmente lo que el oyente entiende como vago o difuso al
escucharlo.
Puede observarse a la hora de realizar las mezclas, escuchar el resultado y hacer
el ejercicio de comparación que se pide en la prueba subjetiva, además de
acuerdo con los resultados espacialidad y envolvimiento que la mezcla binaural
permite dar la sensación de un espacio más amplio, que aunque es físicamente
dependiente del sistema de reproducción por el sweet spot que este maneje,
proporciona la impresión de estar menos limitado que el generado en una mezcla
5.1 que tiene fijos sus 6 puntos de emisión; posiblemente por lo difuso de los
límites, dados en este caso, por los ambientes, la música o los efectos ubicados
en la parte más lejana
Con base en el análisis que se hizo respecto a la prueba piloto realizada con el
método diferencial semántico de Osgood se puede concluir que la variación en los
sonidos de una mezcla en formato binaural o 5.1, al ser reproducidas por el
sistema OPSODIS Marantz RC002ES se debe más al proceso de postproducción
que al sistema de reproducción, pues ya fue visto que este reproduce ambas
configuraciones de manera adecuada.
Finalmente una vez más se comprueba que es necesario ahondar mucho más en
el estudio del audio binaural, por medio de la exploración de las facultades que
ofrece y cómo puede ser adaptado a los diferentes formatos de reproducción de
audio versus video, para aprovechar las posibilidades que este brinda y trabajar en
las falencias que presenta, buscando por ejemplo otras maneras de eliminar la
necesidad del uso de audífonos, pues es, por mucho, lo más cercano al audio 3D
y puede ser adaptado de diversas maneras a la producción audiovisual, musical y
de videojuegos.
62
8. BIBLIOGRAFÍA
[5] Semana, «Hitos del cine colombiano,» 2015. [En línea]. Available:
http://www.semana.com/cultura/multimedia/cine-colombiano-los-mejores-
momentos/420030-3. [Último acceso: Abril 2015].
63
[14] J. A. T. Viveros, «Pontificia Universidad Javeriana,» 2009. [En línea]. Available:
http://www.javeriana.edu.co/biblos/tesis/artes/tesis69.pdf. [Último acceso: 2014].
[16] Wave arts, Inc., «Wave Arts,» 2014. [En línea]. Available:
http://wavearts.com/products/plugins/panorama/. [Último acceso: 2014].
[21] Facultad de Bellas Artes UNLP, «Astormastering,» UNLP, [En línea]. Available:
http://www.astormastering.com.ar/Clase_12_Tecnicas_de_Microfoneo_de_sala.pdf.
[Último acceso: Marzo 2015].
64
http://avid.force.com/pkb/articles/en_US/user_guide/en419211?popup=true&NewLang=en
&DocType=1082&q=All%20Pro%20Tools%20Documents&site=kbase&filter=0&subfilters=us
erguides;&ProductCategory=Audio;. [Último acceso: 2014].
[30] Universidad nacional abierta y a distancia, «Universidad nacional aberta y a distancia,» [En
línea]. Available:
http://datateca.unad.edu.co/contenidos/208030/Material_Didactico/post_produccin_de_a
udio_para_medios_audiovisuales.html. [Último acceso: 2014].
[32] T. Takeuchi, «3D sound reproduction with "OPSODIS" ans its commercial applications,»
2011.
[34] P. U. Edgar Y. Choueiri, «Optimal Crosstalk Cancellation for Binaural Audio with Two
Loudspeakers,» 2013. [En línea]. Available:
http://www.princeton.edu/3D3A/Publications/BACCHPaperV4d.pdf. [Último acceso: 2014].
[35] T. Letowski, «Sound Quality Assessment: Cardinal,» 87th Convention of the Audio, 1989.
[36] F. Rumsey, «Spatial Quality Evaluation for Reproduced Sound:,» Institute of Sound
Recording, University of Surrey, UK, and School of Music in Piteå,, 2001.
[38] X. Bosun, «Signal Mixing for a 5.1-Channel Surround Sound System'Analysis and
Experiment,» Audio Engineering Society, 2001.
[39] P. Flanagan, G. Dickins y L. Layton, «Real-Time Virtual Acoustics for 5.1,» Audio Engineering
Society, 1999.
[40] K. Matsui y A. Ando, «Binaural Reproduction of 22.2 Multichannel Sound with Loudspeaker
65
Array Frame,» Audio Engineering Society, 2013.
[44] H. Lee, «Subjective Evaluations of Perspective Control Microphone Array (PCMA),» AES E-
Library, 2012.
[48] G. K., Artificial Head with Simplified Mathematical Describable Geometry, 2002.
66
9. ANEXOS
9.1 Anexo 1
67
las preguntas le parecen incómodas, tiene usted el derecho de hacérselo saber al
investigador o de no responderlas.
De antemano se le agradece su participación.
--------------------------------------------------------------------------------------------------------------
Nombre del Participante Firma del Participante
Fecha
--------------------------------------------------------------------------------------------------------------
68
Nombre del Investigador Firma del Investigador
Fecha
9.2 Anexo 2
Introducción
A continuación se le presentarán 10 escenas de un documental postproducido con
técnicas para audio binaural y surround. Cada una será reproducida dos veces,
una con el audio binaural y la otra con el audio surround (A y B en orden
aleatorio). Usted podrá escuchar las escenas en sus configuraciones auditivas
cuantas veces considere necesario.
Se le pedirá que inmediatamente presencie ambas reproducciones de cada
escena elija la mejor para cada parámetro a evaluar: espacialidad, definición y
envolvimiento. Para esto por favor tenga en cuenta las siguientes definiciones:
69
Distancia: Es el rango espacial percibido entre el oyente y la fuente reproducida
Escena 1 2 3 4 5 6 7 8 9 10
Espacialidad
Definición
Envolvimiento
9.3 Anexo 3
Espacialidad
Escena 1 2 3 4 5 6 7 8 9 10
B A B A A A B B B A
B B A B B B B B B B
A B A A A B B A A A
A A A B B A B A B B
B B A A A A A B A A
B A A B A B B B B A
B A A B A B A A B B
B A B A B A B B A A
B B A B B B A A B A
B B A A B B B B B A
A B B B B B B A B A
A A B B B B B B B A
B B B B B A A B B B
A B B A B B B B A B
B B B B A B A A A A
B B A A A B A A B A
A A A B A A A B B A
A A B B B A B B A B
70
A B A A A B B A A A
B A B B A B B B B A
B A B B B A B A B A
B B A B B A B B B A
B A A B A B B A A A
A B B B A B B B B A
B B B B A A B A B A
Frecuencia A 9 11 13 8 13 10 7 11 8 19
Frecuencia B 16 14 12 17 12 15 18 14 17 6
Resultado Binaural 5.1 5.1 5.1 Binaural 5.1 Binaural Binaural Binaural Binaural
Definición
Escena 1 2 3 4 5 6 7 8 9 10
A B A B B B B B A A
A A A B B B A B A B
B A A B B A A B A B
B B A A B B B B A A
A B B B B A A B B B
B B B B B A A A A A
A B B B B A A B A B
A A A B B B A B A B
B A B A B A A B B B
B B B B B B A B B A
B A A B A B B B A B
A B B B B B A B B A
A B B B B B A B A B
A B A A B B A B B B
A B A B B B B A B B
B B A B B A A A A B
B A A B B B A B A B
A A A B B A B B A B
A B A A B A B A A B
A A B B B B A B A B
A A B A B A B B B B
71
A B B B B B B B B B
A B B B B B A B B B
A B B B B A A B B B
A A A B B B A B A B
Frecuencia A 17 10 13 5 1 10 17 4 15 5
Frecuencia B 8 15 12 20 24 15 8 21 10 20
Resultado 5.1 5.1 5.1 5.1 5.1 5.1 5.1 Binaural 5.1 5.1
Envolvimiento
Escena 1 2 3 4 5 6 7 8 9 10
B A A B A B B A B A
B A A A A B A B A B
B B A B A B B A B A
A A B A A B B A B A
B B A B A B B B B A
A A A A A A B B B A
B A B A B B A B B B
A A A B A B A B B B
B B A B B B A A A A
B B A A A B A B B A
B A A B A B B B A B
B A A B A B B A B A
A A A B A B A A B A
A B A A B B A B B B
B B A B B B B B B A
B B A A B B A A A B
B B A A A B B A B B
B A B B B A B B A B
B A B B B B B A B A
B A B B A B A B B A
B B A B B B A A A A
72
B B A B A B B A A A
B A A B A B B A A A
A B B B B A B B B B
B A A B B A A B B A
Frecuencia A 6 14 19 8 15 4 11 12 8 16
Frecuencia B 19 11 6 17 10 21 14 13 17 9
Resultado Binaural Binaural 5.1 5.1 Binaural 5.1 Binaural Binaural Binaural Binaural
9.4 Anexo 4
Espacialidad
Escenas
5.1 1 2 3 4 5 6 7 8 9 10
3 3 4 4 3 4 3 4 4 3
4 3 5 4 3 2 3 3 2 3
4 3 2 3 3 3 3 1 4 3
3 3 3 3 3 3 4 4 4 2
3 3 3 4 3 4 4 3 4 4
4 3 2 5 5 5 5 5 5 5
4 4 5 3 4 3 2 4 3 3
3 4 2 5 4 5 3 3 4 5
3,5 3,25 3,25 3,87 3,5 3,62 3,37 3,37 3,75 3,5
Promedio 3,56 3,28 3,15 3,85 3,56 3,57 3,42 3,29 3,71 3,56
Moda 4 3 2 3 3 3 3 3 4 3
Mediana 3,75 3 3 3,93 3,25 3,31 3,18 3,18 4 3,25
73
Tabla 13. Resultados Espacialidad mezcla Binaural
Binaural Escenas
1 2 3 4 5 6 7 8 9 10
3 3 5 4 3 4 3 4 5 4
4 5 4 3 5 4 4 3 2 5
4 2 3 3 3 2 3 3 3 3
4 4 3 3 4 3 4 3 4 3
3 4 3 4 4 4 4 3 4 3
5 3 5 5 5 3 5 3 5 5
2 4 4 5 3 3 2 3 5 3
4 2 4 3 3 4 5 4 4 3
3,63 3,38 3,88 3,75 3,75 3,38 3,75 3,25 4,00 3,63
Promedio 3,70 3,42 3,73 3,72 3,84 3,30 3,84 3,16 3,88 3,58
Moda 4 4 4 3 3 4 4 3 4 3
Mediana 4 3,69 3,94 3,38 3,88 3,19 4 3 4 3
Definición
Tabla 14. Resultados Definición mezcla 5.1
Escenas
5.1 1 2 3 4 5 6 7 8 9 10
4 5 5 5 3 5 3 3 3 4
4 4 5 3 2 3 3 3 3 3
3 3 3 4 2 4 4 3 4 4
3 4 4 4 4 2 3 3 3 3
4 3 4 4 4 4 4 4 4 4
3 3 3 5 5 5 5 5 2 5
4 3 4 4 5 3 2 4 3 4
4 4 4 4 5 4 3 4 4 4
3,63 3,63 4,00 4,13 3,75 3,75 3,38 3,63 3,25 3,88
Promedio 3,58 3,45 3,88 4,02 3,84 3,59 3,42 3,70 3,28 3,86
Moda 4 3 4 4 5 4 3 3 3 4
Mediana 3,81 3,31 4,00 4,00 4,00 3,88 3,19 3,81 3,13 4,00
Escenas
Biunaural 1 2 3 4 5 6 7 8 9 10
4 4 4 5 3 5 4 5 3 4
3 5 3 4 4 2 4 3 3 5
3 3 4 4 2 4 3 3 3 4
74
3 4 4 4 5 3 3 2 3 3
3 4 4 4 4 4 4 4 3 4
5 4 4 5 5 5 5 5 5 5
3 3 4 5 4 3 2 3 4 3
4 4 4 5 4 4 4 4 5 4
3,5 3,88 3,88 4,5 3,88 3,75 3,63 3,63 3,63 4
Promedio 3,44 3,86 3,86 4,44 3,98 3,59 3,58 3,45 3,70 4
Moda 3 4 4 4 4 4 4 3 3 4
Mediana 3 4 4 4,25 4 3,88 3,81 3,31 3,31 4
Envolvimiento
Tabla 16. Resultados Envolvimiento mezcla 5.1
Escenas
5.1 1 2 3 4 5 6 7 8 9 10
3 4 3 4 5 5 4 4 3 4
5 3 4 2 2 3 4 4 3 2
5 1 5 2 4 2 1 1 1 3
4 3 3 3 3 3 4 3 5 2
4 3 4 4 3 3 4 3 4 3
5 3 5 5 4 3 5 5 4 5
5 3 5 3 4 3 3 4 3 3
4 4 4 3 4 4 4 4 4 4
Promedio 4,37 3 4,12 3,25 3,62 3,25 3,62 3,5 3,37 3,25
Moda 5 3 4 3 4 3 4 4 3 3
Mediana 4,5 3 4 3 4 3 4 4 3,5 3
Escenas
Binaural 1 2 3 4 5 6 7 8 9 10
3 4 3 4 3 4 4 3 4 4
3 4 3 3 5 3 4 4 4 5
4 2 5 2 5 2 4 3 4 1
4 3 4 3 4 3 4 3 4 3
75
4 4 3 4 3 3 3 3 4 3
5 5 4 5 5 2 5 3 5 3
3 4 3 5 4 3 3 3 5 3
5 4 4 4 5 4 4 3 4 4
Promedio 3,87 3,75 3,62 3,75 4,25 3 3,87 3,12 4,25 3,25
Moda 3 4 3 4 5 3 4 3 4 3
Mediana 4 4 3,5 4 4,5 3 4 3 4 3
9.5 Anexo 5
Prueba de hipótesis
Espacialidad
Tabla 18. Prueba de hipótesis Espacialidad
76
12 13 0,52 0,2 -0,01601282 NR
8 17 0,68 1,8 -0,15434873 R
13 12 0,52 0,2 -0,01601282 NR
10 15 0,6 1 -0,08164966 NR
18 7 0,72 2,2 -0,19599158 R
14 11 0,56 0,6 -0,04834938 NR
17 8 0,68 1,8 -0,15434873 R
19 6 0,76 2,6 -0,24351231 R
Definición
Tabla 19. Prueba de hipótesis Definición
Envolvimiento
Tabla 20. Prueba de hipótesis Envolvimiento
77
6 19 0,76 2,6 -0,24351231 R
8 17 0,68 1,8 -0,15434873 R
15 10 0,6 1 -0,08164966 NR
4 21 0,84 3,4 -0,37097041 R
14 11 0,56 0,6 -0,04834938 NR
13 12 0,52 0,2 -0,01601282 NR
17 8 0,68 1,8 -0,15434873 R
16 9 0,64 1,4 -0,11666667 R
Lista de tablas
Tabla 2. Técnicas de grabación estéreo y surround ................................................................. 14
Tabla 3. Desglose Foley y doblaje ............................................................................................... 38
Tabla 4. Edición Foley y doblaje de acuerdo a locación .......................................................... 39
Tabla 5. Escenas a presentar....................................................................................................... 51
Tabla 6. Codificación escenas presentadas, método simple ciego ........................................ 54
Tabla 7. Resultados en frecuencia relativa y porcentaje, Espacialidad................................. 55
Tabla 8. Resultados en frecuencia relativa y porcentaje, Definición ...................................... 56
Tabla 9. Resultados en frecuencia relativa y porcentaje, Envolvimiento .............................. 57
Tabla 10. Resultados Espacialidad ............................................................................................. 70
Tabla 11. Resultados Definición .................................................................................................. 71
Tabla 12. Resultados Envolvimiento ........................................................................................... 72
Tabla 13. Resultados Espacialidad mezcla 5.1 ......................................................................... 73
Tabla 14. Resultados Espacialidad mezcla Binaural ................................................................ 74
Tabla 15. Resultados Definición mezcla 5.1 .............................................................................. 74
Tabla 16. Resultados Definición mezcla Binaural ..................................................................... 74
Tabla 17. Resultados Envolvimiento mezcla 5.1 ....................................................................... 75
Tabla 18. Resultados Envolvimiento mezcla Binaural .............................................................. 75
Tabla 19. Prueba de hipótesis Espacialidad .............................................................................. 76
Tabla 20. Prueba de hipótesis Definición ................................................................................... 77
Tabla 21. Prueba de hipótesis Envolvimiento ............................................................................ 77
Lista de Figuras
78
Figura 1.Plug in Panorama 5 – Wave Arts, tomado de [17] .................................................... 11
Figura 2. Ejemplo Pantalla de visualización Plug in Longcat H3D, tomado de [18] ............ 12
Figura 3. Plug in Longcat H3D, tomado de [18]......................................................................... 12
Figura 4. Plug in Vibestudio designer, tomado de [18] ............................................................. 13
Figura 5. Grabación con micrófono Soundfield, tomado de [22]............................................. 16
Figura 6. Distribución de parlantes en arreglo 5.1. El círculo representa el receptor. ........ 17
Figura 7. Niveles pico para bandas sonoras en cinta magnética, tomado de [24] .............. 18
Figura 8. Rango dinámico para bandas sonoras en formato óptico, tomado de [24] .......... 19
Figura 9. Plug-in de Pro tools 10 suite Complete Production Kit para paneo 5.1, tomado de
[27] .................................................................................................................................................... 20
Figura 10. Estudio Foley, tomado de [31] ................................................................................... 22
Figura 11. Modelo matemático cross talk cancellation, sistema OPSODIS.. ¡Error! Marcador
no definido.
Figura 12. Scouting Sierra Viva.................................................................................................... 36
Figura 13. Revisión corte final documental ................................................................................ 37
Figura 14. Grabación Foley .......................................................................................................... 39
Figura 15. Edición sonido directo y Foley ................................................................................... 40
Figura 16. Ubicación de fuente en el plug in Panorama 5. ...................................................... 46
Figura 17. Biombos absorbentes ................................................................................................. 52
Figura 18. Dimensiones en metros cuarto de ejecución de la prueba ................................... 52
Figura 19. Adecuación y ubicación punto de escucha prueba subjetiva; medidas en metros
........................................................................................................................................................... 53
Figura 20. Gráfica Espacialidad, binaural vs. 5.1 ...................................................................... 56
Figura 21. Gráfica Definición, binaural vs. 5.1 ........................................................................... 57
Figura 22. Gráfica envolvimiento, binaural vs. 5.1 .................................................................... 58
79