Sunteți pe pagina 1din 11

21/9/2014

Transmision de la Voz - Caracteristicas fisicas de la voz humana | ElastixTech - Aprende Telefonia IP Asterisk - Elastix
Traducir

Volver a Fundamentos de Telefonia

Transmision de la Voz

El sonido humanamente audible consiste en ondas sonoras que producen oscilaciones


de la presin del aire, que son convertidas en ondas mecnicas en el odo humano y
percibidas por el cerebro. La propagacin del sonido es similar en los fluidos, donde el
sonido toma la forma de fluctuaciones de presin. En los cuerpos slidos la
propagacin del sonido involucra variaciones del estado tensional del medio.
La propagacin del sonido involucra transporte de energa sin transporte de materia,
en forma de ondas mecnicas que se propagan a travs de la materia slida, lquida o
gaseosa. Como las vibraciones se producen en la misma direccin en la que se
propaga el sonido, se trata de una onda longitudinal.
Si la temperatura ambiente es de 15 C, la velocidad de propagacin del sonido es 340 m/s (1224 km/h ). Este valor
corresponde a 1 MACH.
Las cualidades o parmetros que permiten diferenciar un sonido de otro son intensidad, timbre, duracin y tono.
Intensidad: La intensidad del estmulo auditivo se mide en decibelios (dB o dbs). Si tenemos en cuenta que el umbral es
el punto a partir del cual una persona empieza a ser consciente de una sensacin, podemos definir el umbral auditivo
como la intensidad mnima que necesita una persona para empezar a or, y el umbral de dolor como la intensidad mxima
que es capaz de soportar su odo. Entre estas dos intensidades se encuentra el umbral de confort, desde donde tendremos
la sensacin ms cmoda y agradable de estimulacin sonora.
Timbre: Esta cualidad nos va a permitir identificar dos fuentes sonoras diferentes.
Duracin: Permite diferenciar entre un sonido corto y un sonido largo cuando el resto de sus cualidades o parmetros son
idnticos.
Tono: Permite la distincin entre un sonido grave y otro agudo. Las frecuencias agudas nos permiten mejorar la
discriminacin de los fonemas del habla, y las frecuencias graves permiten captar los parmetros esenciales del habla como
ritmo y entonacin.
El odo humano percibe aquellos sonidos cuyas frecuencias se encuentran entre 20 y 20.000 vibraciones por segundo
(frecuencias audibles). La frecuencia se mide en ciclos por segundo y se expresa en hercios (Hz). El rango de frecuencias
conversacionales de la voz humana est entre 250 y 3.000 Hz, si bien algunos fonemas se encuentran situados entre los
4.000 y los 8.000 Hz.

http://elastixtech.com/fundamentos-de-telefonia/transmision-de-la-voz/

1/11

21/9/2014

Transmision de la Voz - Caracteristicas fisicas de la voz humana | ElastixTech - Aprende Telefonia IP Asterisk - Elastix

La Voz Humana
La voz masculina tiene un tono fundamental de entre 100 y 200 Hz, mientras que la voz femenina es ms aguda,
tpicamente est entre 150 y 300 Hz. Las voces infantiles son an ms agudas. Sin el filtrado por resonancia que produce la
cavidad buco nasal nuestras emisiones sonoras no tendran la claridad necesaria para ser audibles. Ese proceso de filtrado
es precisamente lo que permite generar los diversos formantes de cada unidad segmental del habla.
La voz humana est compuesta por ondas acsticas que viajan a travs del aire a la velocidad del sonido, esto es a 1,244
Km/h (o 340 m/s). Pero esta rapidez no significa que me pueda comunicar fcilmente con puntos distantes pues la voz
humana se atena rpidamente, perdiendo energa a medida que viaja. Luego de unos pocos metros ya no podemos
escuchar una conversacin.
La voz humana por tanto es de la misma naturaleza que el resto de ondas acsticas y esto ya se conoca desde antes de la
invencin del telfono.
Antes de la invencin del telfono tambin se conoca que existan otros tipos de ondas llamadas ondas elctricas que
podan ser transmitidas a travs de un conductor metlico como un cable de cobre. Este segundo tipo de ondas es de una
naturaleza diferente a las ondas acsticas y viaja a la velocidad de la luz, es decir aproximadamente 300,000 km/s. Es decir,
ms de lo que podamos imaginar; casi instantneamente desde un punto de vista terrenal. Adicionalmente podemos
controlar la atenuacin de estas ondas y hacerlas viajar por grandes distancias.
Con estos hechos conocidos ya a mediados del siglo 19 es ms fcil comprender que muchos persiguieran la idea de
transformar las ondas acsticas en ondas elctricas para as poder transmitirlas luego a grandes distancias a travs de
conductores metlicos. La cuestin es que haba que inventar un dispositivo para hacer dicha transformacin y all estaba la
clave del asunto. Este dispositivo, conocido como micrfono en nuestros das es una parte importante de cualquier aparato
telefnico.

Rango de frecuencias de la voz humana


Otra caracterstica importante de la voz humana es que las cuerdas vocales modulan la voz en un amplio espectro de
frecuencias que van de graves a agudos en un rango aproximado de 20Hz a 20kHz. Todo un abanico de sonidos!
http://elastixtech.com/fundamentos-de-telefonia/transmision-de-la-voz/

2/11

21/9/2014

Transmision de la Voz - Caracteristicas fisicas de la voz humana | ElastixTech - Aprende Telefonia IP Asterisk - Elastix

Esto nos hace suponer que un micrfono debe ser capaz de capturar y transmitir todo este rango de frecuencias. Sin
embargo, en la actualidad sabemos que para transmitir voz entendible no es necesario transmitir todas las frecuencias sino
un rango mucho menor y transmitir un rango menor de frecuencias tiene sus ventajas pues facilita la transmisin como
veremos ms adelante. Por lo tanto los telfonos comerciales solo transmiten un rango aproximado de 400Hz a 4kHz. Esto
distorsiona un poquito la voz pero de todas maneras se puede entender. Es por eso que cuando omos a alguien por
telfono su voz suena ligeramente diferente que en la vida real pero aun as podemos entender la conversacin.

Digitalizacion de la voz
Digitalizacion es: Accin de convertir en digital informacin analgica. En otras palabras, es convertir cualquier seal de
entrada continua (analgica) en una serie de valores numricos.
La informacin digital es la nica informacin que puede procesar una computadora, generalmente en el sistema binario, es
decir unos (1) y ceros (0).
Mientras que la telefona tradicional utiliza la voz mediante seales analgicas, la telefona IP requiere tenerla codificada en
formato digital, es decir en 0s y 1s, puesto que es el nico lenguaje interpretado por el computador. A este proceso de
conversin se le denomina digitalizacin de voz.
La seal digital, es la codificacin de la seal sonora en trminos discretos (por lo general en dos estados 1, y 0). El principal
problema de la seal digital, es que nuestro odo es analgico con lo que por un lado necesitamos una conversin analgica
digital y posteriormente una conversin digital analgica (para que nuestro odo sea capaz de percibirla). A este conjunto de
procesos se le suele llamar DSP (Digital Signal Procesing).
En el paso del analgico al digital (ADC) existen dos procesos el muestreo (nmero de muestras que cogemos de la seal
analgica, a mas muestras, mejor representacin de la seal) y la codificacin (el valor que le vamos a dar a todas esas
muestras, a mayor nmero de bits mayor parecido con la seal analgica. Posteriormente aparece el DAC (paso de la seal
digital a la analgica), para que nuestro odo sea capaz de escucharlo.

La tasa o frecuencia de muestreo es el nmero de muestras por unidad de tiempo que se toman de una seal continua
para producir una seal discreta, durante el proceso necesario para convertirla de analgica en digital. Como todas las
frecuencias, generalmente se expresa en hercios (Hz, ciclos por segundo) o mltiplos suyos, como el kilohercio (kHz),
aunque pueden utilizarse otras magnitudes.
En audio, la mxima audiofrecuencia perceptible para el odo humano est en torno a los 20 kHz, por lo que tericamente
una frecuencia de muestreo de 40 kHz sera adecuada para digitalizarla; no obstante, el estndar introducido por el CDAudio (Disco Compacto), se estableci en 44,1 kHz. La frecuencia de muestreo ligeramente superior permite compensar los
http://elastixtech.com/fundamentos-de-telefonia/transmision-de-la-voz/

3/11

21/9/2014

Transmision de la Voz - Caracteristicas fisicas de la voz humana | ElastixTech - Aprende Telefonia IP Asterisk - Elastix

filtros utilizados durante la conversin analgica-digital.


Hay que tener en cuenta que no todas las fuentes sonoras se aproximan a los 20 kHz que corresponden a esta frecuencia
mxima; la mayora de los sonidos est muy por debajo de sta. Por ejemplo, si se va a grabar la voz de una soprano, la
mxima frecuencia que la cantante ser capaz de producir estar en torno a los 1046 Hz, con lo que utilizar una frecuencia
de muestreo de 44,1 kHz sera innecesario (se estara empleando una capacidad de almacenamiento extra que se podra
economizar).

En este caso, siguiendo el Teorema de Nyquist, sera adecuada una frecuencia de muestreo en torno a los 2100 Hz. En este
sentido, la mayora de software/hardware estn preparados para que el usuario pueda seleccionar la frecuencia de
muestreo a utilizar. El estndar del CD-Audio est fijado en 44,1 kHz, pero esto no significa que esa sea la frecuencia que
utilizan todos los equipos. Los sistemas domsticos de baja calidad pueden utilizar frecuencias de 22,05 kHz o de 11,025
kHz (produciendo as una seal analgica de inferior calidad a la que podra generarse con la informacin contenida en el
disco). Adems, las tarjetas de sonido de los equipos informticos utilizan frecuencias por encima o por debajo de este
estndar, muchas veces seleccionndolas en funcin de las necesidades concretas (sobre todo, en aplicaciones de audio
profesional).
En audio profesional, se utilizan frecuencias de muestreo de 48 kHz o superiores. La razn es que cuando se graban altas
frecuencias, cercanas a los 20 kHz, usando los 44,1 kHz, slo se recogen dos muestras por ciclo, con lo que la seal
resultante queda muy limitada. Ante esto, es evidente que las altas frecuencias se muestrean peor que las bajas; una tasa
de muestreo superior al estndar permite corregir esta disparidad.

Teorema de Nyquist
Segn el teorema de muestreo de Nyquist-Shannon, para poder replicar con exactitud (es decir, siendo matemticamente
reversible en su totalidad) la forma de una onda es necesario que la frecuencia de muestreo sea superior al doble de la
mxima frecuencia a muestrear.
Es un error frecuente y extendido creer que una misma seal muestreada con una tasa elevada se reconstruye mejor que
una muestreada con una tasa inferior. Esto es falso (siempre que la tasas empleadas cumplan el criterio de Nyquist,
naturalmente). El proceso de muestreo (que no debe ser confundido con el de cuantificacin) es, desde el punto de vista
matemtico perfectamente reversible, esto es, su reconstruccin es exacta, no aproximada. Dicho de otro modo, desde el
punto de vista matemtico al que se refiere el teorema de muestreo de Nyquist-Shannon, la reconstruccin de una seal de
10 kHz es idntica tanto si se obtiene de una tasa de muestreo de 25000 muestras por segundo como de una de 50000
muestras por segundo. No aporta nada incrementar la tasa de muestreo una vez que sta cumple el criterio de Nyquist.
Tambin son errores frecuentes y extendidos, relacionados con lo expuesto en este prrafo, creer que los puntos que
resultan del proceso de muestreo se unen en la reconstruccin mediante rectas formando dientes de sierra o que existe un
proceso de clculo que realiza la interpolacin de manera simulada. En resumen, el teorema de muestreo demuestra que
toda la informacin de una seal contenida en el intervalo temporal entre dos muestras cualesquiera est descrita por la
serie total de muestras siempre que la seal registrada sea de naturaleza peridica (como lo es el sonido) y no tenga
componentes de frecuencia igual o superior a la mitad de la tasa de muestreo; no es necesario inventar la evolucin de la
seal entre muestras.

http://elastixtech.com/fundamentos-de-telefonia/transmision-de-la-voz/

4/11

21/9/2014

Transmision de la Voz - Caracteristicas fisicas de la voz humana | ElastixTech - Aprende Telefonia IP Asterisk - Elastix

En la prctica y dado que no existen los filtros analgicos pasa-bajo ideales, se debe dejar un margen entre la frecuencia
mxima que se desea registrar y la frecuencia de Nyquist (frecuencia crtica) que resulta de la tasa de muestreo elegida (por
ejemplo, para CD-Audio la frecuencia mxima de los componentes a registrar y reproducir es de 20 kHz y la frecuencia
crtica de la tasa de 44100 muestras por segundo empleada es de 22,05 kHz; un margen del 10% aproximadamente para
esta aplicacin). Pero este margen es una necesidad que resulta de las limitaciones fsicas de un filtro de reconstruccin (o
filtro antialiasing) real, y no una consideracin que contemple (o deba contemplar) el teorema. Con frecuencia en los
conversores modernos de CD-Audio, para la reconstruccin de una seal se emplean tcnicas de sobremuestreo con objeto
de aumentar este margen y permitir el uso de filtros de fase lineal (retardo de grupo nulo) en la banda pasante y, en general,
ms sencillos y econmicos con pendientes de atenuacin ms suaves.
Los nuevos formatos de audio que recientemente han aparecido (aunque con escaso xito comercial) que emplean PCM sin
prdida por compresin con tasas de muestreo ms altas a las empleadas en el CD-Audio, (DVD-Audio, por ejemplo) para
registrar y reproducir seales de idntico ancho de banda se justifican porque permiten el empleo de filtros de
reconstruccin ms benignos, sencillos y econmicos sacrificando un recurso cada vez ms econmico y de menor
trascendencia (la capacidad de almacenamiento, un recurso crtico en el pasado) y porque, adems, satisfacen
simultneamente las expectativas de un mercado como el audifilo, caracterizado por dogmas entre los que se encuentra
muy extendida la falsa creencia de que esto representa una mejora en la calidad de la seal reconstruida (en particular, de
sus componentes de alta frecuencia). Este error es slo una consecuencia de una clara incomprensin de las
consecuencias del teorema de muestreo y de establecer comparaciones falaces como, por ejemplo, con la digitalizacin de
imgenes (donde no se realiza una reconstruccin de una seal peridica), etc.
La alta tasa de muestreo de otro formato de audio de reciente aparicin, el SACD o Super Audio CD, es una consecuencia
del uso de una tecnologa denominada modulacin Sigma-Delta (Direct Stream Digital). Si bien la tasa de muestreo es 64
veces la del CD-Audio, es necesario tener presente que se trata de una cuantificacin de 1 bit (en lugar de los 16 empleados
en el CD-Audio) y basado en tcnicas de Noise Shaping (modelado de ruido). No es posible, por tanto, establecer
comparaciones superficiales con el PCM de CD-Audio, ya que en este caso la relacin seal-ruido no es constante respecto
de la frecuencia (en CD-Audio el ruido de cuantificacin es independiente de la frecuencia y slo depende de los intervalos
de amplitud empleados en el proceso de cuantificacin, es decir, de unos 98,09 dB constantes para los 16 bits de este
estndar CD-Audio en todo el espectro til). Un SACD puede registrar y reproducir seales con componentes de hasta 33
kHz con una relacin seal-ruido equivalente al de un CD-Audio (aunque 33 kHz est casi una octava por encima del
mximo audible y, por tanto, una ventaja sobre el CD-Audio de dudosa utilidad) y mantener una relacin seal-ruido de
aproximadamente 122 dB para el espectro audible (un potencial, el equivalente aproximado a 20 bits, tambin de dudosa
utilidad prctica como formato final de usuario). Entre las ventajas objetivas de estos formatos recientes (DVD-Audio y
SACD) se encuentra el potencial multicanal (registro de ms de dos canales) y la capacidad para el empleo de tcnicas de
proteccin de copia (algo de extraordinario inters para las compaas discogrficas). Ninguna prueba doble-ciego realizada
en condiciones controladas ha probado que existan diferencias audibles entre estos formatos denominados de alta
resolucin.

Conversin analgica-digital
La conversin analgica-digital (CAD) consiste en la transcripcin de seales analgicas en seales digitales, con el
propsito de facilitar su procesamiento (codificacin, compresin, etc.) y hacer la seal resultante (la digital) ms inmune al
ruido y otras interferencias a las que son ms sensibles las seales analgicas.

La digitalizacin o conversin analgica-digital (conversin A/D) consiste bsicamente en realizar de forma peridica
http://elastixtech.com/fundamentos-de-telefonia/transmision-de-la-voz/

5/11

21/9/2014

Transmision de la Voz - Caracteristicas fisicas de la voz humana | ElastixTech - Aprende Telefonia IP Asterisk - Elastix

medidas de la amplitud (tensin) de una seal, redondear sus valores a un conjunto finito de niveles preestablecidos de
tensin (conocidos como niveles de cuantificacin) y registrarlos como nmeros enteros en cualquier tipo de memoria o
soporte. La conversin A/D tambin es conocida por el acrnimo ingls ADC (analogue to digital converter).
En esta definicin estn patentes los cuatro procesos que intervienen en la conversin analgica-digital:
1. Muestreo: el muestreo (en ingls, sampling) consiste en tomar muestras peridicas de la amplitud de onda. La
velocidad con que se toma esta muestra, es decir, el nmero de muestras por segundo, es lo que se conoce como
frecuencia de muestreo.
2. Retencin (en ingls, hold): las muestras tomadas han de ser retenidas (retencin) por un circuito de retencin (hold),
el tiempo suficiente para permitir evaluar su nivel (cuantificacin). Desde el punto de vista matemtico este proceso no
se contempla, ya que se trata de un recurso tcnico debido a limitaciones prcticas, y carece, por tanto, de modelo
matemtico.
3. Cuantificacin: en el proceso de cuantificacin se mide el nivel de voltaje de cada una de las muestras. Consiste en
asignar un margen de valor de una seal analizada a un nico nivel de salida. Incluso en su versin ideal, aade, como
resultado, una seal indeseada a la seal de entrada: el ruido de cuantificacin.
4. Codificacin: la codificacin consiste en traducir los valores obtenidos durante la cuantificacin al cdigo binario. Hay
que tener presente que el cdigo binario es el ms utilizado, pero tambin existen otros tipos de cdigos que tambin
son utilizados.
Durante el muestreo y la retencin, la seal an es analgica, puesto que an puede tomar cualquier valor. No obstante, a
partir de la cuantificacin, cuando la seal ya toma valores finitos, la seal ya es digital.
Los cuatro procesos tienen lugar en un conversor analgico-digital.
Un computador o cualquier sistema de control basado en un microprocesador no puede interpretar seales analgicas, ya
que slo utiliza seales digitales. Es necesario traducir, o transformar en seales binarias, lo que se denomina proceso de
digitalizacin o conversin de seales analgicas a digitales.
El proceso de digitalizacin utiliza el muestreado o sampleado, cada cierto tiempo se lee el valor de la seal analgica y
toma una muestra:

1. Si el valor de la seal en ese instante est por debajo de un determinado umbral, la seal digital toma un valor mnimo
(0).
2. Cuando la seal analgica se encuentra por encima del valor umbral, la seal digital toma un valor mximo (1).

http://elastixtech.com/fundamentos-de-telefonia/transmision-de-la-voz/

6/11

21/9/2014

Transmision de la Voz - Caracteristicas fisicas de la voz humana | ElastixTech - Aprende Telefonia IP Asterisk - Elastix

El momento en que se realiza cada lectura es


ordenado por un sistema de sincronizacin que emite una seal de reloj con un perodo constante.
La modulacin por impulsos codificados (MIC o PCM por sus siglas inglesas de Pulse Code Modulation) es un
procedimiento de modulacin utilizado para transformar una seal analgica en una secuencia de bits (seal digital), este
mtodo fue inventado por Alec Reeves en 1937. Una trama o stream PCM es una representacin digital de una seal
analgica en donde la magnitud de la onda analgica es tomada en intervalos uniformes (muestras), cada muestra puede
tomar un conjunto finito de valores, los cuales se encuentran codificados.
En la figura observamos que una onda senoidal est siendo muestreada y cuantificada en PCM. Se toman las muestras a
intervalos de tiempo regulares. De cada muestra existen una serie de posibles valores. A travs del proceso de muestreo la
onda se transforma en cdigo binario, el cual puede ser fcilmente manipulado y almacenado.

Recuperacin de la seal analgica


En la recuperacin se realiza un proceso inverso, con lo que la seal que se recompone se parecer mucho a las originales
(a), (b) y (c), si bien durante el proceso de cuantificacin, debido al redondeo de las muestras a los valores cunticos, se
produce una distorsin conocida como ruido de cuantificacin. En los sistemas normalizados, los intervalos de cuantificacin
han sido elegidos de tal forma que se minimiza al mximo esta distorsin, con lo que las seales recuperadas son una
imagen casi exacta de las originales. Dentro de la recuperacin de la seal, ya no se asignan intervalos de cuantificacin en
lugar de ello son niveles, equivalentes al punto medio del intervalo IC en el que se encuentra la muestra normalizada.

Ventajas de la seal digital


1. Cuando una seal digital es atenuada o experimenta perturbaciones leves, puede ser reconstruida y amplificada
mediante sistemas de regeneracin de seales.
2. Cuenta con sistemas de deteccin y correccin de errores, que se utilizan cuando la seal llega al receptor; entonces
http://elastixtech.com/fundamentos-de-telefonia/transmision-de-la-voz/

7/11

21/9/2014

Transmision de la Voz - Caracteristicas fisicas de la voz humana | ElastixTech - Aprende Telefonia IP Asterisk - Elastix

comprueban (uso de redundancia) la seal, primero para detectar algn error, y, algunos sistemas, pueden luego
corregir alguno o todos los errores detectados previamente.
3. Facilidad para el procesamiento de la seal. Cualquier operacin es fcilmente realizable a travs de cualquier
software de edicin o procesamiento de seal.
4. La seal digital permite la multigeneracin infinita sin prdidas de calidad.
5. Es posible aplicar tcnicas de compresin de datos sin prdidas o tcnicas de compresin con prdidas basados en la
codificacin perceptual mucho ms eficientes que con seales analgicas.

Desventajas de la seal digital


1. Se necesita una conversin analgica-digital previa y una decodificacin posterior, en el momento de la recepcin.
2. Si no se emplean un nmero suficientes de niveles de cuantificacin en el proceso de digitalizacin, la relacin seal a
ruido resultante se reducir con relacin a la de la seal analgica original que se cuantific. Esto es una consecuencia
de que la seal conocida como error de cuantificacin que introduce siempre el proceso de cuantificacin sea ms
potente que la del ruido de la seal analgica original, en cuyo caso, adems, se requiere la adicin de un ruido
conocido como dither ms potente an con objeto de asegurar que dicho error sea siempre un ruido blanco y no una
distorsin. En los casos donde se emplean suficientes niveles de cuantificacin, la relacin seal a ruido de la seal
original se conservar esencialmente porque el error de cuantificacin quedar por debajo del nivel del ruido de la
seal que se cuantific. Esto, naturalmente, es lo normal.
3. Se hace necesario emplear siempre un filtro activo analgico pasa bajo sobre la seal a muestrear con objeto de evitar
el fenmeno conocido como aliasing, que podra hacer que componentes de frecuencia fuera de la banda de inters
quedaran registrados como componentes falsos de frecuencia dentro de la banda de inters. Asimismo, durante la
reconstruccin de la seal en la posterior conversin D/A, se hace tambin necesario aplicar un filtro activo analgico
del mismo tipo (pasa bajo) conocido como filtro de reconstruccin. Para que dicho filtro sea de fase lineal en la banda
de inters, siempre se debe dejar un margen prctico desde la frecuencia de Nyquist (la mitad de la tasa de muestreo)
y el lmite de la banda de inters (por ejemplo, este margen en los CD es del 10%, ya que el lmite de Nyquist es en
este caso 44,1 kHz / 2 = 22,05 kHz y su banda de inters se limita a los 20 kHz).

Procesamiento digital de seales


Un procesador digital de seales o DSP (sigla en ingls de digital signal processor) es un sistema basado en un
procesador o microprocesador que posee un juego de instrucciones, un hardware y un software optimizados para
aplicaciones que requieran operaciones numricas a muy alta velocidad. Debido a esto es especialmente til para el
procesado y representacin de seales analgicas en tiempo real: en un sistema que trabaje de esta forma (tiempo real) se
reciben muestras (samples en ingls), normalmente provenientes de un conversor analgico/digital (ADC).

Se ha dicho que puede trabajar con seales analgicas, pero es un sistema digital, por lo tanto necesitar un conversor
analgico/digital a su entrada y digital/analgico en la salida. Como todo sistema basado en procesador programable
necesita una memoria donde almacenar los datos con los que trabajar y el programa que ejecuta.
Se puede procesar una seal para obtener una disminucin del nivel de ruido, para mejorar la presencia de determinados
matices, como los graves o los agudos y se realiza combinando los valores de la seal para generar otros nuevos.
Eventualmente cundo el DSP ha terminado su trabajo, los datos digitales pueden volverse atrs como seales analgicas,
con calidad mejorada. Por ejemplo: un DSP puede filtrar ruido de una seal, remover interferencias, amplificar y/o suprimir
http://elastixtech.com/fundamentos-de-telefonia/transmision-de-la-voz/

8/11

21/9/2014

Transmision de la Voz - Caracteristicas fisicas de la voz humana | ElastixTech - Aprende Telefonia IP Asterisk - Elastix

frecuencias, encriptar informacin, analizar una corriente compleja en sus componentes esenciales.
Este proceso deber ser realizado en TIEMPO REAL, lo cul es muy rpido, necesitando as que el DSP realice miles de
millones de operaciones por segundo.
En su ncleo, un DSP es altamente numrico y repetitivo. A la vez que cada dato llega, ste debe ser multiplicado, sumado
y adems de eso transformado de acuerdo a frmulas complejas. Lo que permite realizar todo ello es la velocidad del
dispositivo. Los sistemas basados en DSPs deben trabajar en tiempo real, capturando y procesando informacin a la vez
que ocurre. Los conversores anlogo digital deben adquirir la informacin lo suficientemente seguido como para captar
todas las fluctuaciones relevantes de las seales. Si el ADC es muy lento se perder informacin. El DSP tambin debe
trabajar rpido para no perder informacin que le llega desde el ADC y adems cumplir con el adecuado procesamiento de
las seales.

Digitalizacin y Compresin
La digitalizacin es una tecnologa que se ha desarrollado con xito para la
transmisin de voz y video. La telefona fija y la celular manejan esta tecnologa pero
cada uno tiene sus propios codificadores. Como sabemos la mejor calidad de audio la
tiene todava la comunicacin telefnica, la celular es buena pero como todos hemos
notado nuestro cerebro necesita hacer un mayor esfuerzo para entender una
conversacin por un telfono celular, de ah que no se debe conducir y hablar por el
celular a la vez. Las centrales IP utilizan codificadores diferentes para poder transmitir
por la web, ya que estos deben de utilizar el menor ancho de banda posible. Como
sabemos el primer paso para cada conexin de VoIP es la digitalizacin, convirtiendo las seales analgicas en paquetes
digitales. Esto se puede hacer en varias maneras; La forma ms fcil es tomar un muestreo de frecuencias con una
proporcin fija que sea lo suficientemente alta para captar todas las frecuencias necesarias, luego dividimos la fuerza de la
seal en varios niveles. Por ejemplo, 8000 Hz y 256 niveles de muestreo es una configuracin fija muy comn. De esta
manera, la seal se escaneada y digitaliza por medio de un convertidor de analgico a digital o ADC la cual muestrea la data
en la frecuencia fija con una profundidad de 8 bits. Los datos son enviados sin comprimir, la otra parte los decodifica con un
convertidor de digital a analgico o DAC. La combinacin de 8 kilohercios y la profundidad de muestreo de 8 bits es buena
para sustituir a las conversaciones normales de telefona. Las comunicaciones en telefona se llevan a cabo en frecuencias
entre aprox. 500 Hz y 3.500 Hz a 256 niveles diferentes por lo cual es suficiente para proporcionar una buena calidad. Pero,
la calidad tiene un precio en VoIP. El muestreo de datos sin comprimir a esta proporcin genera un flujo continuo de datos
de 8 kbytes/seg. Esto no es gran cosa para los anchos de banda de pases desarrollados, pero puede ser demasiado para
conexiones de Internet ms lentas, o peor an a travs de una conexin de internet mvil. Por lo tanto se han hecho varios
intentos de reducir el nmero de kilobytes por segundo necesarios para lograr una calidad de voz aceptable. Esto puede en
principio, lograrse de varias maneras. Usted puede reducir la frecuencia de muestreo un poco, pero esto tiene un efecto
negativo debido a que las frecuencias ms altas se filtran. De acuerdo con el Teorema de muestreo de Nyquist-Shannon,
que se remonta a 1928, mucho antes de que hubiera VoIP o incluso en Internet, no es posible digitalizar las seales en una
frecuencia de muestreo inferior a 2 veces la frecuencia ms alta en el espectro. La reduccin de la tasa de muestreo de
4000 Hz, por ejemplo, reducira el mximo permitido de frecuencia en la seal analgica a 2000 Hz, que es muy por debajo
de las frecuencias que son comunes en el habla, de mujeres y nios. Por lo tanto la reduccin de la frecuencia de muestreo
puede ayudar un poco en la reduccin de la asignacin de ancho de banda de la aplicacin de VoIP, pero en una pequea
proporcin. Otro enfoque es, por tanto, reducir el nmero de bits necesarios para almacenar una muestra de datos. Como se
mencion anteriormente, 8 bits de codificacin dar una calidad razonablemente alta para una seal en una conversacin.
La reduccin del nmero a 4 reducira el ancho de banda utilizado en un 50%. Lamentablemente, esta reduccin tambin
tiene un precio. Con 8 bits, hay 256 niveles de seal posible. La decodificacin de la seal nuevamente a analgica origina
una leve seal donde el paso de un nivel a otro es menor del 0,5% del valor de la seal de pico a pico. A pesar de ser una
distorsin del 0,5% puede ser audible, el discurso seguir siendo comprensible y la mayora de las personas que no son
meticulosas no lo detectaran.
Con una profundidad de 4 bits, la codificacin de la seal slo tendr 16 niveles diferentes disponibles. Esto no es mucho.
Cada paso en la conversin de digital a analgica ser de un 7%, que es linealmente dividido entre el mximo pico de
http://elastixtech.com/fundamentos-de-telefonia/transmision-de-la-voz/

9/11

21/9/2014

Transmision de la Voz - Caracteristicas fisicas de la voz humana | ElastixTech - Aprende Telefonia IP Asterisk - Elastix

intensidad de seal posible. Imaginen que alguien est hablando en voz baja en su telfono donde su fuerza de seal no
ser ms del 25% del pico, en este caso la codificacin digital es casi binaria, generando un sonido enlatado del lado para el
receptor. La reduccin de la profundidad de muestreo con un 50%, de 8-4 bits da una degradacin de la calidad de un factor
de 16. Esto tampoco es lo que queremos.
Una solucin para combatir el problema de la mala calidad de voz con un volumen bajo de seal es no dividir el grfico de
intensidad de la seal en 16 niveles de igualdad, sino tener ms niveles en torno a la lnea cero y menos cerca de los
niveles de volumen mximo. Un enfoque comn consiste en utilizar una escala logartmica en lugar de una escala lineal. Las
escalas logartmicas no son extraas en esta aplicacin, ya que nuestros odos raramente escuchan diferencias de volumen
en una escala logartmica. Diez veces ms volumen en trminos de energa se escuchan como cerca de dos veces ms alto
para el odo humano. Otra solucin es usar algoritmos de adaptacin que dividen la seal linealmente, pero no entre los
valores mximos posibles de la seal de pico a pico, sino entre los valores reales de la seal. Si alguien est hablando a un
volumen bajo, estos algoritmos de forma automtica aumentar la seal y el error de cuantificacin de la seal nunca es
mucho ms de 7% a 4 bits de profundidad de muestreo. A veces se puede escuchar este tipo de acondicionamiento de
seales en las lneas con ruido, donde los niveles de ruido aumenta en medio de palabras o frases. Esto es porque el
algoritmo de muestreo amplificar las seales de bajo volumen, incluso si no hay presencia de seal real. La amplificacin del
ruido en la lnea se escuchara en el extremo del receptor.
Ahora la mejor manera de reducir las necesidades de ancho de banda para una aplicacin de VoIP esta en el uso de un
protocolo propietario de baja prdida de compresin (low-loss). Todos sabemos que es una compresin ya que lo vemos en
nuestros PCs. Las aplicaciones como ZIP reducen el tamao de los archivos mediante el anlisis de patrones de bits y el
clculo de patrones de bits alternativos y tablas de conversin que ocupan menos espacio que el archivo original, estas
tcnicas de compresin que se utiliza en la compresin ZIP se llaman (no-loss) no-prdida, ya que es posible extraer los
archivos originales de la versin comprimida sin prdida de informacin. Otras tcnicas son de baja prdida y aceptan
algunas prdidas de informacin en el aumento de la compresin. La compresion low-loss de baja prdida se utiliza a
menudo en la compresin de imgenes como la del formato JPG. La versin sin comprimir se parece a la original, pero en
estrecha observacin pueden ver los artefactos causados por el algoritmo de compresin. Este tipo de algoritmo funciona
mejor si se desarrolla con conocimiento de los datos a comprimir. Han desarrollado algoritmos de compresin especficos
para la compresin de voz que cuentan con baja prdida combinada con una asignacin de ancho de banda muy reducido.
La compresin en los telfonos mviles es un ejemplo de ello.

!!! AYUDANOS A MANTENER ESTE SITIO ACTIVO!!!


Si piensas que te hemos ayudado y merecemos tu apoyo. !!! GRACIAS !!!
Cuando lo hagas tendras acceso inmediato a la documentacion en formato PDF para que la descargues. Encontraras
tambien otros tutoriales mas avanzados no publicados en el sitio. Si no puedes o no quieres, no hay problema igual tendras
acceso a toda la informacion publicada en este sitio.
!!CLICK AQUI.!! para ver Tutoriales a descargar
!!! GRACIAS POR TU DONACION !!!
http://elastixtech.com/fundamentos-de-telefonia/transmision-de-la-voz/

10/11

21/9/2014

Transmision de la Voz - Caracteristicas fisicas de la voz humana | ElastixTech - Aprende Telefonia IP Asterisk - Elastix

37246 total views, 9 views today

Follow

Share

Twittear

Enlace permanente a este artculo: http://elastixtech.com/fundamentos-de-telefonia/transmision-de-la-voz/

http://elastixtech.com/fundamentos-de-telefonia/transmision-de-la-voz/

11/11

S-ar putea să vă placă și