Sunteți pe pagina 1din 10

TD1004.1.

15-10
Documento Tcnico AES

Recomendacin para la sonoridad de streaming de


audio y reproduccin de archivos de red

Sociedad de Ingeniera de Audio, Inc. 551


Fifth Avenue, Suite 1225
Nueva York
NY 10179
Estados Unidos

Tel: +1 212 661 8528. E-mail: hq@aes.org . Internet: http://www.aes.org


El Consejo Tcnico de la Sociedad de Ingeniera de Audio y sus comits tcnicos responden a los intereses de los
miembros proporcionando informacin tcnica a un nivel adecuado a travs de conferencias, convenciones, talleres y
publicaciones. Trabajan en el desarrollo de una gua informativa de uso prctico para los miembros y se concentran
en el seguimiento y volver a portar los ltimos avances en la tecnologa y las aplicaciones. Esta actividad est bajo la

direccin del Consejo Tcnico de AES y sus Comisiones.

El Consejo Tcnico y sus primeros comits tcnicos fueron fundadas por la Sociedad Audio Engin- eering en 1979,
y se establecieron reglas permanentes que cubren sus actividades en 1986, con la intencin de definir y consolidar
el liderazgo tcnico de la Sociedad para el beneficio de los miembros . El Consejo Tcnico est formado por los
funcionarios del Consejo Tcnico, los presidentes de los comits tcnicos, el editor de la revista, y como ex-de-

ficio miembros sin voto, los dems miembros de la sociedad.

CONSEJO TCNICO Francis


Rumsey - Presidente Juergen Herre -
Vicepresidente Robert Schulein -
Vicepresidente Michael Kelly -
Vicepresidente

Los comits tcnicos Acstica y sonido


Refuerzo de archivado, restauracin y
bibliotecas digitales
Audio para juegos de audio
forense de audio de
Telecomunicaciones
Codificacin de audio del automvil
de seales de audio Compatibilidad
Electromagntica
Fibra ptica para la audicin de audio y

Prevencin de la prdida de audicin


-Audio de alta resolucin Factores
Humanos en Sistemas de Audio
Altavoces y Auriculares Micrfonos y sus
Aplicaciones
Sistemas de Audio Network
La percepcin y la evaluacin subjetiva de seales de audio
Grabacin Tecnologa y Prcticas
Anlisis semntico de audio
Procesamiento de seales de sonido
para cine digital y Televisin
Audio espacial
Transmisin y Difusin

www.aes.org/technical

El objetivo de AES Documentos Tcnicos no es para indicar una poltica o el apoyo a un mtodo, dispositivo tcnico o
principio, pero para proporcionar informacin que representa el colectivo
conocimiento de un grupo de expertos.
Ni AES ni ninguna de sus comits o miembros sern responsables de las consecuencias
derivadas del uso de la informacin contenida en esta publicacin.
Comit Tcnico de AES en
Transmisin y Difusin
Grupo de Estudio sobre Transmisin de sonoridad

Recomendacin para la sonoridad de streaming de audio


y reproduccin de archivos de red

Version 1.0: 9 Octubre 2,015 mil

grupo de la escritura

Editor: Bob Katz

escritores

Rob Byers James


Johnston
John Kean
Thomas Lund
Robert Orban
Adrian Wisbey

Los miembros adicionales del grupo de estudio

David Bialik
Frank Foti Alex
Fabian Kosiorek
Kuech Saltar Pizzi
Ian Shepherd Jim
Starzynski

Con contribuciones adicionales de

Ron Ajemian Florian


Camerer Eelco Grimm
Andrs Mayo Matthieu
Parmentier
1. Introduccin

Streaming est convirtiendo rpidamente en un importante vehculo para la entrega de medios. Como resultado, las formas en que se graba audio, mezclado, post-producidos y entregados han sido afectadas
radicalmente. La calidad del sonido ha comenzado a sufrir como consecuencia de las diferencias de sonoridad entre y dentro de las corrientes, as como algunos objetivos muy altos de sonoridad, que produce
una distorsin. Por lo tanto, la transmisin requiere una solucin de nivelacin basado en volumen, con un objetivo de volumen apropiado.

Volumen es la percepcin del oyente de volumen de audio. Un flujo de audio es una transmisin continua a los oyentes a travs de una red (normalmente Internet) que consiste en uno o
ms programas presentados secuencialmente. Es anlogo a una estacin de radio en over-the-air radiodifusin. UN serpentina es un proveedor de contenidos que ofrece un servicio de
streaming a los clientes. Normalizacin es un mtodo de regulacin de la intensidad a ser ms consistente para el oyente. la reproduccin de archivos de red es descarga bajo demanda
de programas completos de la red, tales como podcasts. En este documento, los trminos corriente y transmisin tener en cuenta la reproduccin de archivos de red. Estas
recomendaciones estn destinadas principalmente a Radio-como mono y estreo corrientes en oposicin a estreo muy dinmico y secuencias de sonido surround con contenidos como
pelculas o especiales de vdeo. Vase el Apndice para notas en tales corrientes altamente dinmicos.

2. Objetivos primarios

La intencin de este documento es proporcionar recomendaciones para la normalizacin de sonoridad de streaming y archivo de red de contenido de reproduccin. Hay muchas buenas razones para
establecer algunos requisitos bsicos de sonoridad:

Mejorar la experiencia de la audiencia.


Proveer consistencia razonable a travs de diferentes secuencias en lnea de diferentes fuentes.
Proveer consistencia razonable dentro de una corriente en lnea especfico para sus diferentes programas.
Proporcionar un objetivo de produccin en tiempo real consistente para la sonoridad corriente.

Obtener una sonoridad que se adapta bien para la escucha mvil.


Evitar sonoridad salta cuando se inserta el material externo (como los anuncios) en el contenido de corriente.
Prevenir pico de la limitacin excesiva u otros procesos de degradacin de la calidad de audio percibida.
Evitar una guerra del volumen entre las serpentinas.

3. Recomendaciones

Se recomienda que la sonoridad de destino de la corriente no supera -16 LUFS: para evitar de pico excesiva limitante, y permitir un mayor rango dinmico en un flujo
de programa. 1

Se recomienda que el volumen de destino de un flujo no sea inferior a -20 LUFS: mejorar la audibilidad de las corrientes en los dispositivos mviles.

Se recomienda que la programacin en formato corto (60 segundos o menos) ser ajustado al restringir el mximo a corto plazo Loudness que sea no ms de 5 LU
ms alta que la sonoridad de destino: Esto asegura que los anuncios y contenido de formato corto similares son consistentes con el volumen corriente.

Se recomienda que el nivel pico mximo no exceda -1.0 dB TP: para evitar el recorte cuando se utilizan sistemas de prdidas.

1 objetivo de sonoridad es la intencin o la sonoridad de una corriente deseada, en LUFS, Unidades de volumen relativo a gran escala. Vase la Seccin 4 a continuacin. En ATSC A / 85, la
unidad de medida LKFS se utiliza en lugar de LUFS de sonoridad absoluta. LKFS y LUFS son idnticos. Ver definiciones en el Apndice.

1
4. La eleccin y la medicin de sonoridad

A. Definiciones Tcnicas

El volumen se mide en relacin con la escala digital completa, no SPL. sonoridad absoluta se mide en LUFS, Unidades de intensidad relativa a la escala completa. Volumen
relativo se mide en LU, unidades de sonoridad. define BS.1770-3 ITU-R Integrado de sonoridad, una medicin de la cantidad total de energa de audio entre dos puntos en el
tiempo dividido por la duracin de la medicin. La medicin se pondera en frecuencia para aproximar la sensibilidad del odo a frecuencias diferentes, y es de nivel ponderado para
enfatizar las partes del programa que ms contribuye a la sensacin de volumen. programa de sonoridad es una medida de un programa desde la parte superior hasta la cola.
EBU - TECH 3341 y UIT-R BS.1771 distinguen las ventanas de medida de La sonoridad integrada y La sonoridad a corto plazo. EBU R 128 define Mximo a corto plazo de
sonoridad. Ver enlaces y definiciones en el Apndice.

B. Objetivo de sonoridad

objetivo de sonoridad es la intencin de sonoridad integrada por una corriente. Es imposible para medir y verificar la real Loudness integrada de una corriente de longitud infinita, por lo que la
sonoridad se debe verificar mediante el uso de un tiempo de integracin suficientemente largo (tpicamente 24 horas) para caracterizar la corriente como un todo.

Cada corriente tiene un nico volumen de destino, con la posible excepcin de los flujos multi-formato, por ejemplo, programas de entrevistas en los programas de la maana y de la msica en la noche.
En tales casos, se recomienda que la diferencia mxima entre cualquier blanco sea tan pequeo como sea posible, y no menos de -20 ni mayor de -16 LUFS. Se recomienda que la sonoridad de cada
programa integrado coincide con su objetivo tan de cerca como sea prctico. Para secuencias en vivo, una tolerancia ms amplia posible que sea necesario, mientras que los archivos pregrabados
pueden ser emparejados dentro de 0.5 LU, por ejemplo.

Los usuarios pueden elegir una sonoridad objetivo que es lo wer que el mximo -16 LUFS, por ejemplo, - 18 LUFS, para adaptarse mejor a las caractersticas dinmicas del programa. Un menor de
destino de sonoridad permite mejorar la calidad de sonido al permitir que los programas para tener una mayor relacin Peak- a la intensidad de pico excesiva y sin limitar.

El lmite inferior de -20 LUFS ha sido elegido como el valor prctico corriente ms baja para la transmisin, ya que algunos dispositivos mviles actuales tienen una ganancia insuficiente para permitir que los
objetivos de produccin comunes de -23 o -24 LUFS a ser escuchados en un volumen satisfactorio incluso si el volumen control se gira todo el camino hacia arriba.

C. contenido de formato corto (por ejemplo anuncios publicitarios)

Se recomienda que la sonoridad de los programas (PL) de roturas de programas que duran 60 segundos o menos no exceda el volumen de destino de la corriente. Adems, se recomienda
que la mxima sonoridad a corto plazo de estas programa corto no rompe supera el 5 LU por encima de la sonoridad de destino de la corriente.

Por ejemplo, si una corriente est dirigido a -20 LUFS Integrated Loudness, el mximo de sonoridad a corto plazo de un comercial (u otra longitud corta) segmento seran no
exceda -15 LUFS. Por otra parte, el PL de la comercial no excedera -20 LUFS. Si el PL de la comercial es de -20 LUFS pero su mximo a corto plazo Loudness est, por
ejemplo, -13 LUFS, el comercial tendra que ser atenuada por 2 LU, lo que reducira su PL a -22 LUFS. En este caso, el proveedor comercial tal vez desee volver a mezclar
el comercial para reducir la diferencia entre su valor mximo a corto plazo y su sonoridad PL a 5 LU o menos por lo que no se requiere esta atenuacin.

D. Eleccin de la ptima Target

Cada serpentina tiene que elegir un objetivo. Al elegir un volumen de destino, serpentinas deben tomar varias caractersticas de audio en cuenta, tales como proporcionar una salida acstica
adecuada de los auriculares jugador. valores objetivo ms altas (se acerca a -16 LUFS) requieren un mayor control dinmico, que puede reducir la calidad del sonido. El mnimo de sonoridad
objetivo de -20 LUFS se cree que el apoyo suficiente de salida acstica con la mayora de los equipos de reproduccin de los consumidores, aunque no siempre con reproductores multimedia
porttiles obedeciendo norma europea EN 50332 (vase el apndice). Otro factor es la variabilidad de la gestin integrada de sonoridad con el tiempo en una transmisin en vivo, lo que puede
requerir la reduccin de la sonoridad de destino para evitar inadvertidamente superior a -16 LUFS.

Algunos transmitir dicho material de palabra que suena ms natural con un rango dinmico menos procesada. Otros lo corriente bellas artes material que suena ms natural cuando se transmiten
a una meta ms baja con su rango dinmico original. Otros pueden dirigirse a dispositivos mviles o sistemas de reproduccin de alta fidelidad. En cualquier caso, si todas las serpentinas siguen las
recomendaciones de este documento, no habr ms que una extensin de 4 LU entre todos los participantes.

5. Control de pico

Picos generalmente no afectan a una medida de la sonoridad, a pesar de que s afectan a la calidad de la seal percibida. Una grabacin con alto pico de relacin sonoridad (PLR) a menudo se
percibe como ms clara y menos fatigoso que las que han sido excesivamente pico limitado. En esta discusin, dB TP se refiere a los niveles mximos medidos usando un medidor de verdadero
pico de acuerdo con la ITU-R BS.1770-3, Anexo 2. Si el streamer elige un volumen objetivo ms baja que la recomendada -16 LUFS (por ejemplo, -18 LUFS), sobrecargas mximas rara vez son un
problema. limitacin de pico no se requiere normalmente menos que el nivel de audio entrante debe incrementarse para cumplir el objetivo de sonoridad. Audio que se han atenuado para conseguir el
volumen de destino habr disminuido su nivel mximo en la misma cantidad. Altamente procesados audio donde los niveles de pico originales superar 0 dB TP normalmente no se sobrecargar como
la sonoridad tendra que ser reducido en gran medida para cumplir con el volumen objetivo. El material entrante que ha sido procesado suavemente o est sin procesar rara vez exceder 0 dB TP.

2
Sin embargo, el nivel de pico se puede aumentar despus de la codificacin con prdidas, por lo que se recomienda utilizar un limitador de seguridad con un umbral de -1,0 dB TP antes de la codificacin. Vase el

Apndice para obtener sugerencias tcnicas sobre el control de limitacin de picos y cdecs.

6. Los programas continuos se presentan en segmentos

Algunos serpentinas jugarn los programas de varias partes, por ejemplo, sinfonas, que se presentan en los movimientos. Es deseable normalizar toda la sinfona a la meta, no los
movimientos individuales, o los movimientos tranquilos se reproducirn en voz demasiado alta. El mejor algoritmo es encontrar el movimiento ms fuerte, determinar su normalizacin, y
aplicar esa ganancia a cada uno de los otros movimientos de la sinfona. Si un solo programa pre-grabado se presenta como un todo con la sinfona integrada en el programa, normalizando el
programa es fcil de lograr, pero si la sinfona se presenta como una lista de reproduccin en los segmentos de un normalizador automtica puede anular por error la necesidad de programa
entero normalizacin. Tenga precaucin: Normalizar los programas antes de tiempo de mantenimiento de estas cuestiones en mente.

7. cuestiones gnero y formato

Numerosas pruebas independientes del algoritmo BS.1770 UIT-R contra oyentes humanos muestran que es uno de los mejores indicadores para la normalizacin de una amplia variedad de programas de
difusin y pistas de msica. Sin embargo, es posible encontrar ejemplos en los que los oyentes promedio prefieren normalizacin por un ingeniero con experiencia con los odos frescos. Adems, la
normalizacin de cada elemento genrico (como el habla y la msica) en un programa dado para el mismo volumen puede producir saldos inartistic que son incompatibles con los saldos realizadas por
operadores humanos experimentados. Por lo tanto, los equilibrios entre los elementos de un programa deben ser elegidos por los creadores del programa en funcin de sus objetivos artsticos. 2

Dentro de un programa dado, la mayor diferencia se percibe que sealar es el discurso frente a la msica. Discurso normaliz a la misma sonoridad integrada como una corriente de msica
inevitablemente suena demasiado fuerte. Se recomienda para normalizar discurso (dilogo) segmentos dentro de otros segmentos 2 a 4 LU (o ms) por debajo de la sonoridad de los otros
segmentos.

Idealmente, los oyentes no deberan tener que ajustar sus controles de volumen cuando se cambia entre los arroyos con formatos similares. A pesar de que dos corrientes de diferentes
formatos que tienen idntica miden Integrado de sonoridad no puede sonar igual de alto, la diferencia no es sacudida al oyente, por lo tanto, es generalmente tolerada y aceptada.

flujos multi-formato: Este es un caso especial en el que una serpentina puede producir contenido de bellas artes con una alta PLR a un objetivo de, por ejemplo, -20 LUFS por la noche y
por la maana, programas de entrevistas con un objetivo de -16 LUFS . Esto no es un problema porque los oyentes slo tendrn que ajustar sus controles de volumen una vez cuando se
produce el cambio de formato. La sonoridad integrada de todo el flujo todava caer dentro de la ventana aceptada de -16 -20 LUFS travs LUFS.

8. Live Streams

corrientes viven obviamente no pueden normalizarse con antelacin. La forma ms transparente para hacer frente a corrientes viven es fijar las ganancias de antelacin en un segmento moderadamente
fuerte para que la sonoridad a corto plazo es de aproximadamente -20 LUFS y ajustar segn sea la corriente que avanza. Incluir un limitador de proteccin en el -1 dB TP antes del codificador para evitar
sobrecargas accidentales.

9. Apndice

A. Notas Tcnicas

1. reproductores multimedia porttiles (PMP) y prdida de la audicin


Si reproductores porttiles de msica se reproducen demasiado alto durante demasiado tiempo, causarn la prdida de audicin. El Comit Cientfico de los Riesgos Sanitarios Emergentes y Recientemente Identificados

estima que entre 2,5 y 10 millones de personas en la UE estn en riesgo de desarrollar prdida auditiva temprana como resultado de escuchar a los reproductores porttiles de msica (vase la Bibliografa: Prevencin de

la prdida de audicin ...). Europa es la primera regin en implementar regulaciones para proteger la vista de los usuarios PMP. Esto ha llevado con xito por el SPL mximo de reproductores porttiles de msica vendidos

en toda Europa, pero con el efecto adverso que la msica y los programas que no se producen como pop moderna no se pueden reproducir en voz alta lo suficiente como para ser escuchado bajo las ms exigentes

condiciones de escucha.

La regulacin actual especifica una seal de prueba en lugar de un mtodo para determinar el alcance y la duracin de la sonoridad de material real del programa. En trminos de su capacidad para
predecir la prdida de audicin, esta seal de prueba es inaplicable a un material que tiene un carcter diferente, intensidad y duracin del programa. El reglamento tambin no refleja el volumen real y la
dosis odo por el oyente. Por otra parte, la regulacin especifica un SPL de la seal de prueba, lo que resulta en un lmite de ganancia para los jugadores que lleva a los productores a ms de comprimir el
material del mundo real con el fin de ser escuchado. Sin darse cuenta, los mismos reglamentos destinados a prevenir la prdida de audicin han desatado una carrera de sonoridad para producir msica
excesivamente comprimido y con un sonido fatigante. Este desarrollo no puede ser bueno para nuestra audiencia o nuestro patrimonio musical.

CENELEC TC108X / GT3 est trabajando para mejorar el estndar, EN 50332, mediante la adicin de las estimaciones de dosis slidas que tengan en cuenta audio real. Sin embargo, hasta la regulacin
revisada entra en vigor, reproductores porttiles de msica europea puede tener una ganancia insuficiente para permitir la reproduccin satisfactoria de material con alta PLR y el LRA (Rango de Sonoridad).
Adems, hasta que se revise la regulacin, el volumen objetivos por debajo de -20 LUFS y posiblemente incluso por debajo de -16 LUFS pueden no ser compatibles con PMPs europeos de la generacin
actual.

2. Rendimiento de DVD porttil


Animamos a los proveedores de dispositivos de reproduccin para eliminar el volumen, la ganancia y limitaciones del espacio libre en futuras versiones de software y hardware. Esto a la larga
permite que el nivel de -23 LUFS EBU R 128 para que sea adecuado para la transmisin, incluso en entornos ruidosos moderadamente. Esto sera una gran ventaja debido a que prcticamente
todo el contenido del programa puede ejecutarse sin alteracin sonora, sin

2 Para ms informacin, ver BS.1770-3 referencias estndar y otros citados en el apndice.

3
cualquier tratamiento que no sea la normalizacin de sonoridad. La reduccin de todos los objetivos de la norma de difusin de -23 LUFS tambin proporcionara la coherencia entre el material de
transmisiones de televisin en streaming sin necesidad de traduccin de nivel, y causara menos dolores de cabeza para las emisoras que tambin proporcionan flujos de Internet.

Como los reproductores porttiles de deshacerse de la ganancia y la altura libre actuales limitaciones, todos los objetivos podran bajar juntos para que la diferencia entre las corrientes
ms bajas y ms fuertes seguira siendo no ms de 4 LU.

3. Los jugadores con limitadores


Muchos dispositivos mviles han incorporado en los limitadores de pico de la calidad subjetiva incierto, y stos actuar para proteger los amplificadores de potencia en batera- operaban los dispositivos mviles de
recorte. Por lo tanto, una corriente con una alta relacin de pico a promedio (tal como una corriente de msica clsica -23 LUFS) puede activar los limitadores de pico en los dispositivos de jugador, con resultados
subjetivos impredecibles.

Del mismo modo, algunos sistemas operativos comunes (como Microsoft Windows, Vista o superior) han incorporado en los limitadores de pico que producen una reduccin de ganancia de rebasamiento de
cdec que de lo contrario se producir un corte en una conversin flotante a punto fijo siguiendo el decodificador. En consecuencia, el no proporcionar suficiente espacio libre para codec sobrepasa en el
lado de transmisin puede producir tanto como 3 dB de ganancia de reduccin en el limitador de pico del lado de descodificacin.

4. Control del nivel de pico y con prdida Codecs


Seguridad limitante debera tener en cuenta el nivel de seal pico que aparece en la salida del decodificador, que puede ser mayor que el nivel pico en la entrada del codificador. Alta tasa (por ejemplo,
256 kbps) codificadores puede funcionar satisfactoriamente con tan poco como -0,5 dB TP para el umbral de limitacin. Sin embargo, los codificadores de tasa de bits ms bajas tienden a sobrepasar
picos an ms, por lo que pueden necesitar ser reducida por debajo de -1,0 dB TP el umbral de limitacin. Un mximo de 1 dB de limitar antes de la codificacin final se recomienda como un punto de
partida. Haga esto slo si se producen picos frecuentemente- causan distorsin audible o artefactos en el decodificador. Usar el odo como el juez final, ya que la limitacin ms de aproximadamente 1
dB puede producir artefactos audibles ms que simplemente dejar que el clip de programa sobre los transitorios ocasionales. An mejor, no aumente la ganancia suficiente para causar el potencial de
recorte. Dada rango permisible recomendada de este documento de la sonoridad (-20 a -16 LUFS), la mayora de tipos de contenido pueden ser acomodados por el simple uso de un nivel objetivo
inferior en lugar de aplicar pico atroz limitante. Esto fcilmente podra producir un sonido ms limpio estacin y ser muy deseable. En otras palabras, en lugar de decidir sobre 2 dB de limitacin de
picos, una combinacin de -1 dB TP umbral limitador de pico con una atenuacin global de 1 dB desde el objetivo elegido previamente puede producir un resultado ms deseable.

llamadas de medicin de pico verdadero de la seal de audio a ser sobremuestreados por lo menos 4 veces para que se aproxima al verdadero nivel mximo despus de la conversin D / tasa de conversin o de
la muestra. medidores de pico verdaderos tienen tpicamente un error de menos de 0,6 dB, suponiendo un D ideales / A convertidor con un filtro de reconstruccin de fase lineal.

filtrado de paso bajo puede aadir rebasamiento, filtrado de paso bajo de modo (si se utiliza) debe ocurrir antes de que el limitador de picos. Si el camino de la seal despus de que el limitador de picos tiene una alta

caracterstica de paso (como lo hacen los caminos ms analgicas), el -3 dB de frecuencia debe estar por debajo de 0,15 Hz para evitar que la trayectoria desde la introduccin de ms de 0,1 dB de rebasamiento.

5. Metadatos, Interoperabilidad con R contenido 128


Hasta que un esquema de metadatos de sonoridad acordado est firmemente establecida y extendida, es difcil suponer que el receptor del oyente llevar a cabo los cambios de ganancia necesarios para
los diferentes programas y diferentes corrientes. Para ayudar a acelerar la transicin a un sistema basado Metadatos de, se recomienda insertar metadatos de sonoridad en el codificador flujo que indica el
volumen del contenido para control de sonoridad lado player-. Sin el uso de metadatos, archivos necesitan ser almacenados previamente normalizado, o un esquema de normalizacin en tiempo real en el
lado del proveedor de contenidos se pueden establecer utilizando un mtodo de lista de reproduccin que lee los metadatos de cada archivo para ser escuchados. Sin embargo, tales listas de
reproduccin pueden no respetar la integridad de los movimientos de una sinfona, o los niveles relativos de las canciones de un lbum, por lo que proceder con cautela.

Flujos de tener una sonoridad integrada de acuerdo a las recomendaciones de este documento estar disponible en los dispositivos jugador que tambin puede jugar el material de programa que tiene
el R-128 recomendado Integrado de sonoridad de -23 LUFS. Esto puede hacer que la sonoridad saltos de hasta 7 LU, que se encuentra fuera de la zona de confort de la mayora de los oyentes. La
mejor solucin para esta situacin es incluir metadatos de sonoridad destino en el flujo de programa. Esto permite que un jugador con reconocimiento de metadatos para ajustar su ganancia
automticamente para evitar cambios de volumen entre -16 y -23 LUFS LUFS corrientes. Tales dispositivos tpicamente se normalizan todo el material de programa a una referencia interna por debajo
de -23 LUFS.

Con metadatos cada vez ms generalizada, se hace viable no utilizar un volumen de destino fijado en absoluto! En su lugar, el control de ganancia ( control de volumen) puede ajustar el volumen de
destino ( blanco mvil). Cuanto ms bajo el control deslizante, menor es el volumen de destino y el ms alto el nmero de los programas que pueden ser sonoridad normalizada sin ninguna
limitacin. Se debe tener cuidado de que la posicin mxima del control de ganancia est en o cerca del lmite superior de la meta de -16 LUFS.

6. Prctica de Normalizacin
Normalizacin es el proceso de ajustar la sonoridad de un programa para ajustarse a la diana a travs de un algoritmo. Tres algoritmos posibles son:

a. Medir la sonoridad y el verdadero nivel de pico integrado del programa. Determinar la diferencia entre el volumen de destino y la sonoridad de los programas. No hay ningn problema si
su nivel tiene que ser bajado para que coincida con el objetivo. Si su nivel tiene que ser levantado, elevarlo hasta que alcanza el nivel de destino o hasta que el pico verdadero llega a
0 dB TP, lo que ocurra primero. Por lo tanto, la calidad del sonido de

4
todo el material se mantendr, sin introducir pico excesiva limitante. Sin embargo, algo de material con una alta PLR ser transmitido menor que el volumen
de destino.
segundo. Realizar un prrafo, pero seguir subiendo el nivel hasta el nivel de programa llega a destino, y aplique la limitacin de picos o permitir que algunos de recorte para manejar los
picos excesivos. La ventaja es la sonoridad ms consistente en la corriente, pero esto es un compromiso potencial sonoro en comparacin con el prrafo a. La mejor manera de
conservar la calidad del sonido y tienen sonoridad ms consistente es un algoritmo. con un objetivo inferior.

do. microprogramas que se destacan por su propia cuenta (60 segundos o menos, por lo general las pausas comerciales): Medir el Programa de sonoridad BS.1770-3 (PL) y el corto
plazo de sonoridad (que utiliza una segunda ventana de medicin 3 - ver UER - Tech 3341 y ITU-R BS.1771-1). Subir o bajar el nivel hasta el PL coincide con el objetivo
excepto si el mximo a corto plazo Loudness excede 5 LU por encima del objetivo; en ese caso disminuir el nivel hasta el mximo a corto plazo Loudness no es mayor que 5
dB por encima del objetivo. Alternativamente, una remezcla del programa puede ser entregado por el proveedor de contenido.

7. corrientes altamente dinmicos (por ejemplo, pelculas)

Algunos serpentinas, por lo general serpentinas de vdeo, desean transmitir contenido altamente dinmico con una muy alta PLR, por ejemplo, pelculas, especiales musicales, teatro, deportes, etc.
menudo con sonido envolvente 5.1. Se reconoce que este tipo de contenido requiere mucho ms espacio para la cabeza y una sonoridad objetivo de -23 LUFS o inferiores. Sera intil para transmitir
estos programas con su rango dinmico completo de los reproductores de medios personales o pequeos equipos de sonido. Sin embargo, podra ser adecuado para transmitir algn contenido de
radio-como en el alto flujo de PLR. En ese caso se recomienda para normalizar el contenido de radio similar a la baja a la -23 LUFS objetivo de esta corriente. Tener metadatos de sonoridad en cada
archivo ayudara a resolver las complejidades.

En el momento de escribir estas lneas, no existe una solucin fcil aparte de metadatos para la coexistencia de contenido altamente dinmico y flujos de estilo radio- en la misma corriente. Sin embargo, puesto
que el contenido altamente dinmico est diseado para ser reproducidas en una habitacin tranquila en un buen sistema de reproduccin de sonido envolvente con capacidad, a continuacin, a la inversa, que
normalmente no se hizo una prueba en un reproductor multimedia personal en una habitacin ruidosa. As que hay poco conflicto o superposicin entre estos dos tipos de corrientes, por ahora. En el futuro, los
metadatos ayudar a conciliar cualquier conflicto.

B. Enlaces a las normas de sonoridad tiles

CENELEC EN 50332-2: 2013 , El equipo del sistema de sonido: Auriculares asociados con los reproductores de msica personales.

ITU-R BS.1770-3 , Https://www.itu.int/dms_pubrec/itu-r/rec/bs/R-REC-BS.1770-3-201208-I!!PDF-E.pdf: Algoritmos para medir la sonoridad de los programas de audio y verdadero
-peak nivel de audio. ITU-R BS.1770-3 define un mtodo de medicin de la sonoridad integrada sobre segmentos enteros de programas, utilizando gating para enfatizar las partes del
programa que contribuyen percepcin ms sonoridad.

EBU R 128 , Https://tech.ebu.ch/docs/r/r128-2014.pdf: Sonoridad Normalizacin y nivel mximo permitido de seales de audio.

ATSC A / 85 , Http://atsc.org/wp-content/uploads/2015/03/Techniques-for-establishing-and-maintaining-audio-loudness.pdf: ATSC Prctica Recomendada:


Tcnicas de establecer y mantener Audio Volumen para la Televisin Digital ( A / 85: 2013).

EBU R 128 s1 , Https://tech.ebu.ch/docs/r/r128s1.pdf: Los parmetros de sonoridad para Short Form contenido (Los anuncios, promociones, etc.).

EBU - Tech 3341 , Https://tech.ebu.ch/docs/tech/tech3341.pdf: Loudness de medicin. Medicin 'Modo EBU' para complementar la normalizacin de sonoridad de acuerdo con EBU R 128. EBU
- TECH 3341 define tres constantes de tiempo de integracin derivados del algoritmo BS.1770-3.

EBU - Tech 3342 , Https://tech.ebu.ch/docs/tech/tech3342.pdf: Rango de Sonoridad: Una medida para complementar la normalizacin de sonoridad de acuerdo con la EBU R 128.

EBU - Tech 3343 , Https://tech.ebu.ch/docs/tech/tech3343.pdf: Manual prctico para la produccin e implementacin de acuerdo con la EBU R 128.

EBU - Tech 3344 , Https://tech.ebu.ch/docs/tech/tech3344.pdf: Directrices prcticas para sistemas de distribucin de acuerdo con EBU R 128.

ITU-R BS.1771-1 , Https://www.itu.int/dms_pubrec/itu-r/rec/bs/R-REC-BS.1771-1-201201-I!!PDF-E.pdf: Requisitos para la sonoridad y verdadero pico que indica metros.

C. Bibliografa

Diferencia entre la Recomendacin EBU R-128 Medidor y la percepcin humana Subjetiva Loudness , Http://www.aes.org/e-lib/ browse.cfm? Elib = 16015. AES
Papel Convencin de 8489, Convencin AES 131, (octubre de 2011) por Begnert, Ekman, y Berg.

Sonoridad descriptores para caracterizar los programas y las pistas de msica , Http://www.aes.org/e-lib/browse.cfm?elib=14666. Lund y Skovenborg discutir la tolerancia rango de sonoridad de
los sujetos. Resumen: 50% de los sujetos reaccionan a + 4 cambios sistemticos / -6 Lu y 95% de los sujetos que hacer as que para + 6 / -8 LU.

Prevencin de la prdida de audicin por el uso de reproductores de msica personales , Http://www.aes.org/e-lib/browse.cfm?elib=17796. Lund demuestra que los reglamentos europeos han
establecido PMP sin darse cuenta de una guerra del volumen y sugiere cambios en las regulaciones que pueden proteger nuestro patrimonio musical, as como nuestra audiencia.

Normalizado de audio y 0 dBFS + Exposicin , Http://www.indexcom.com/tech/0dBFS+/, por Greg Ogonowski. Por qu los niveles de pico verdadero exceden 0 dBFS.

Transmisin Informe del Estudio Codec , Http://nprlabs.org/sites/nprlabs/files/documents/codec/20130920%20Streaming%20Codec%20 Estudiar% 20report.pdf. Kean y Sheffield
discutir la calidad de los cdecs utilizados para la transmisin.

Estudio del rango de sonoridad de audio para los consumidores en varios modos de escucha y niveles de ruido ambiental , Https://drive.google.com/file/ d /
0B6yqUryPr1iaRFhiSDZzbk5IMGM / vista. Kean, Johnson y Sheffield, presentado en NAB 2015.

5
D. Definiciones

dB FS: decibelios con relacin a la escala completa medido con un medidor de pico digital estndar. Abreviado a veces sin el espacio: dBFS dB TP: decibelios con relacin a la escala completa medido

con un medidor de pico. A menudo abreviado sin el espacio: dBTP Formato: Un nombre, como la radio contempornea xito o noticias, que describe el tipo o estilo de un programa de larga duracin

determinada. Una corriente que a menudo tiene un solo formato, pero algunos netcasters transmitir diferentes formatos en diferentes momentos (corrientes formato mixto). Formatos a menudo se

construyen a partir de elementos que se relacionan entre s y se presentan de forma secuencial, pero que tienen diferentes gneros, como la msica, anuncios DJ con calidad de estudio, y ruidoso, el

habla limitada de ancho de banda de un reportero de trfico basado en helicptero. Este documento trata inserciones comerciales como las pausas del programa de formato corto separadas que tienen

limitaciones de sonoridad diferentes de las del programa principal.

Gnero: Un nombre, como discurso de ancho de banda completo, El discurso de telfono de grado, msica popular, msica clsica, etc., que caracterizan un elemento de programa que tiene
una textura homognea y estilo.

Espacio libre: La proporcin de 0 dBFS al nivel programa integrado de un segmento.

Integrado de sonoridad: El volumen promedio medido elctricamente entre dos puntos en el tiempo. Integrado de sonoridad de acuerdo con el estndar internacional ITU-R BS.1770-3 utiliza
un algoritmo cerrada. Si integrado intensidad del sonido se mide a lo largo de toda la longitud de un programa el resultado se llama Programa de sonoridad (PL). Para determinar la sonoridad
integrada de una corriente continua es necesario elegir una ventana de tiempo de integracin que es suficientemente larga (tpicamente 24 horas).

LKFS: Sonoridad, K-ponderada, con referencia a la escala digital completa. ATSC prefiere plazo para el valor de sonoridad absoluta. K-ponderacin se explica en ITU-R BS.1770-3.
(Ver LUFS).

Sonoridad Normalizacin: Una prctica de trabajo en el que un nivel de sonoridad especfica define el punto de referencia (tambin conocido como el objetivo), y la sonoridad de las seales
individuales se evala de manera que entonces se pueden ajustar para que coincida con el volumen objetivo en la repeticin. Este enfoque permite un margen para los picos y por lo tanto fomenta
variaciones dinmicas si se elige un objetivo razonablemente bajo. (Vase tambin la normalizacin de prctica, Pico de Normalizacin).

LRA: rango de sonoridad. Describe la variacin de niveles de volumen dentro de un programa en una escala macroscpica. No debe confundirse con rango dinmico, que es la
distancia entre el suelo de ruido y el pico ms alto posible de una ruta de seal. Se basa en estadsticas y utiliza los niveles de sonoridad 3-segundo-a corto plazo. Ver UER - Tech
3342, vinculado en la bibliografa.

LU : Unidades de volumen. Un paso de 1 LU es la misma que la etapa de 1 dB. Si la intensidad de una corriente objetivo es -16 LUFS y otra corriente se establece en -18 LUFS, entonces son 2
UGM aparte. Tambin un valor volumen relativo en el que el nivel objetivo es 0 LU. Si el nivel objetivo es, por ejemplo, -23 LUFS = 0 LU, a continuacin, una seal de audio con un programa de
sonoridad de -19 LUFS podran escribirse como PL siendo 4 LU. Ver EBU Tech 3341 y UIT-R BS.1771-1.

LUFS: Unidades de sonoridad con referencia a la escala digital completa. El trmino preferido EBU para el valor de sonoridad absoluta, que incluye una forma de filtro psicoacstico
conocido como K-ponderacin, explicado en ITU-R BS.1770-3. (Ver LKFS).

Normalizacin: El proceso de ajustar la sonoridad de material de entrada para ajustarse a un volumen de destino. Vase el Apndice para una descripcin de algunos algoritmos.

La normalizacin de pico: La prctica de ajustar el nivel de pico de cada programa para (normalmente) la escala completa o 0 dBFS. Esto se traduce en niveles de volumen que varan widely-.
Esta prctica ha sido citada como la causa original de la guerra del volumen de emisin y produccin musical.

PLR: Pico de relacin de sonoridad. La relacin de mximo nivel de pico verdadero de un segmento de programa a su integrado sonoridad ITU-R BS.1770-3.

Programa: Una seccin de una corriente que tiene un formato nico, como noticias / charla, o la msica popular con las presentaciones de DJ y comentarios. En este documento, tratamos material de
sntesis, insertada como los comerciales como las pausas del programa separadas que tienen limitaciones especiales de sonoridad porque los diferentes equipos de produccin se caracterizan por
producir el comercial y el programa en el que se inserta, ya que el contenido del comercial es a menudo relacionado con el contenido de las el programa circundante, y debido a obtrusively comerciales
fuertes molestar a los oyentes.

Programa de sonoridad: Una medicin de Integrated Loudness sobre toda la longitud de un programa. Abreviado PL. Corto Plazo de sonoridad: Como se define en EBU Tech 3341, la

sonoridad a corto plazo utiliza ITU-R BS.1770-3 algoritmo, pero sin gating y una ventana de tiempo deslizante rectangular de longitud 3 s. La tasa de actualizacin para metros en vivo debe

ser de al menos 10 Hz.

Corriente: Una transmisin continua a travs de una red (normalmente Internet) que consiste en uno o ms programas presentados secuencialmente. Anlogo a una estacin de radio en
over-the-air radiodifusin.

Serpentina: Un proveedor de contenidos que ofrece un servicio de streaming a los clientes.

Objetivo: La intencin de sonoridad integrada de toda la secuencia. En formato mixto arroyos tambin puede referirse a la intencin de sonoridad integrada de los programas que tienen un
formato determinado dentro de la corriente.

transcodificar: Para convertir material de una representacin codificada a otra. En el peor de los casos esto es decodificacin completa del material, y re-codificacin. Por ejemplo, para
convertir de una tasa de bits a otro, o para insertar procesadores en el camino de la seal. La transcodificacin es mal vista, ya que puede multiplicar los artefactos de codecs.

Es cierto nivel de pico: Ver UIT-R BS.1770-3, anexo 2.

6
Para ponerse en contacto con este comit con preguntas o
sugerencias, enve un correo electrnico

mailto: streamloudness@aes.org

S-ar putea să vă placă și