Documente Academic
Documente Profesional
Documente Cultură
FIE
DESARROLLO
Los archivos de audio y video son muy largos para ser transmitidos digitalmente. Normalmente estn
comprimidos en una seal digital y luego transmitidos. Los cdecs son programas capaces de
comprimir y descomprimir una seal digital. La codificacin y decodificacin de los codecs es para la
transmisin, almacenamiento o cifrado. Los cdecs son usados en videos y videoconferencias, entre
otras aplicaciones.
La comunicacin de voz es analgica, mientras que la red de datos es digital. El proceso de convertir
ondas analgicas a informacin digital se hace con un codificador-decodificador (el CODEC). Hay
muchas maneras de transformar una seal de voz analgica, todas ellas gobernadas por varios
estndares. El proceso de la conversin es complejo. Es suficiente decir que la mayora de las
conversiones se basan en la modulacin codificada mediante pulsos (PCM) o variaciones.
Adems de la ejecucin de la conversin de analgico a digital, el CODEC comprime la secuencia de
datos, y proporciona la cancelacin del eco. La compresin de la forma de onda representada puede
permitir el ahorro del ancho de banda. Esto es especialmente interesante en los enlaces de poca
capacidad y permite tener un mayor nmero de conexiones de VoIP simultneamente. Otra manera de
ahorrar ancho de banda es el uso de la supresin del silencio, que es el proceso de no enviar los
paquetes
de
la
voz
entre
silencios
en
conversaciones
humanas.
A continuacin se muestra una tabla resumen con los cdecs ms utilizados actualmente:
1/6
Estandariza
do
Descripcin
G.711
ITU-T
Pulse code
modulation
(PCM)
64
G.711.1
ITU-T
Pulse code
modulation
(PCM)
G.721
ITU-T
G.722
ITU-T
G.722.1
ITU-T
G.722.2
AMR-WB
ITU-T
G.723
ITU-T
G.723.1
ITU-T
Frame
size
(ms)
Observaciones
Muestrea
da
80-96Kbps
Muestrea
da
Adaptive
differential
pulse
code
modulation
(ADPCM)
7 kHz audiocoding within
64 kbit/s
32
Muestrea
da
Tiene dos
versiones u-law
(US, Japan) y alaw (Europa)
para muestrear
la seal
Mejora del
codec G.711
para abarcar la
banda de 50 Hz
a 7 Khz.
Obsoleta. S e ha
transformado en
la G.726.
64
16
Muestrea
da
Codificacin
a 24 y 32
kbit/s
para
sistemas sin
manos con
baja perdida
de paquetes
Adaptive
Multi-Rate
Wideband
Codec (AMRWB)
24/32
16
20
23.85/
23.05/
19.85/
18.25/
15.85/
14.25/
12.65/
8.85/ 6.6
24/40
16
20
Muestrea
da
5.6/6.3
30
Extensin de
la
norma
G.721 a 24 y
40 kbit/s para
aplicaciones
en circuitos
digitales.
Dual
rate
speech coder
for
multimedia
communicati
ons
transmitting
at 5.3 and 6.3
kbit/s
Bit rate
(kb/s)
Sampling
rate (kHz)
MOS
(Mean
Opinion
Score)
4.1
Divide los 16
Khz en dos
bandas cada
una usando
ADPCM
Se usa
principalmente
para compreson
de voz en
tecnologa movil
de tercera
generacin.
Obsoleta por
G.726. Es
totalmente
diferente de
G.723.1.
Parte de H.324
video
conferencing.
Codifica la seal
usando linear
predictive
analysis-bysynthesis
coding. Para el
codificador de
high rate utiliza
Multipulse
Maximum
Likelihood
Quantization
3.8-3.9
2/6
G.726
ITU-T
G.727
ITU-T
G.728
ITU-T
G.729
ITU-T
G.729.1
ITU-T
GSM
06.10
ETSI
LPC10
Gobierno de
USA
Speex
16/24/32/4
0
var.
Muestrea
da
Muestrea
da
(MP-MLQ) y
para el de lowrate usa
Algebraic-CodeExcited LinearPrediction
(ACELP).
ADPCM;
reemplaza a
G.721 y G.723.
3.85
ADPCM.
Relacionada con
G.726.
16
2.5
CELP.
3.61
10
3.92
8/12/14/16/
18/20/22/2
4/
26/28/30/3
2
10
Ancho de banda
desde 50Hz a 7
Khz.
13
22.5
Usado por la
tecnologa
celular GSM
2.4
22.5
10 coeficientes.
La voz suena un
poco "robtica"
8, 16, 32
2.15-24.6
(NB)
4-44.2
(WB)
30 ( NB )
34 ( WB )
3/6
EVRC
DVI
American
Department
of Defense
(DoD)
Gobierno de
USA
3GPP2
Interactive
Multimedia
Association
(IMA)
L16
SILK
Skype
Enhanced
Variable Rate
CODEC
DVI4 uses an
adaptive
delta
pulse
code
modulation
(ADPCM)
Uncompress
ed audio data
samples
Uncompress
ed audio data
samples
8
4.8
13.3
30
30
9.6/4.8/1.2
20
32
Variable
Muestrea
da
128
Variable
Muestrea
da
De 6 a 40
kbit/s
Variable
20
Se usa en redes
CDMA
El codec
Harmony est
basado en SILK
En los ltimos aos estn apareciendo nuevas versiones de los codecs clsicos G711, G722 y G729
conocidos como versiones 1 o versiones 2.
G 711.1
El nuevo codec G.711.1 ha sido aprobado por la ITU-T en marzo de 2008. El objetivo es que permita
interoperar con la infraestructura G.711 existente mejorando la calidad de la seal.
4/6
G.729.1
Al igual que G.711.1 el codec G.729.1 es tambin un codec G.729 al que se le aaden capas para
mejorar la calidad del sonido a bajas y altas frecuencias para abarcar la banda desde 50Hz a 7 Khz. a
costa de incrementar el bitrate (cantidad de informacin que se manda por segundo). Tiene hasta 12
capas.
La capa principal es compatible con G729 y tiene un bitrate de 8 Kbps. La segunda llega hasta los 12
Kbps (incremento de 4kbps). Por cada nueva capa se aaden 2 Kbps hasta llegar a los 32 Kbps. A
estas velocidades mximas se podra transmitir musica con calidad (aunque inferior al codec G.722.2
al mismo bitrate)
Esta norma est pensada para telfonos IP, softphones, centralitas, gateways, centros de llamadas
(call centers), equipos de grabacin de voz o servidores de contestadores automticos.
Tambin se conoce como G729J o G729EV.
G.722.1 o SIREN 7
G722.1 o SIREN 7 provee un ancho de banda entre 50 HZ y 7Khz y opera con un bit rate de
24 kbps o 32 Kbps.
Se usa habitualmente para operaciones de manos libres en sistemas voip HD con baja
perdida de paquetes.
Existe un anexo llamado G.722.1 C o SIREN 14 que permite un ancho de banda de hasta 14
Khz y opera con un bitrate de 24, 32, y 48 kbit/s.
El codec tiene 9 bitrates diferentes (23.85, 23.05, 19.85, 18.25, 15.85, 14.25, 12.65, 8.85 y
6.6 kbit/s).
El codec se basa en el principio ACELP (Algebraic Code Excited Linear Prediction),
prediccin adaptativa soportando transmisin discontinua DTX, usando algoritmos de
deteccin de voz VAD ( Voice Activity Detection) y conformt de ruido CNG (Comfort Noise
Generation )
El codec trabaja con un framesize de 20 ms e introduce un retardo de 25 ms.
GSM
En cuanto a la voz, el cdec GSM es una gran opcin para comprimir la informacin, ya que no existe
una gran diferencia, como en el caso descrito anteriormente de una tasa de bits de 64 kbps a una de
13 kbps.
El codificador procesa la seal de voz que est dividida en bloques de 20 ms. Cada bloque contiene
260 bits como se muestra en figura (188 +36 +36 = 260). Esto es razonable, ya que 260 bits / 20 ms =
13 000 bits/s =13kbits / s.
En la figura tambin se pueden ver las tres partes principales del codificador:
Anlisis de prediccin lineal (prediccin a corto plazo).
Prediccin a largo plazo
Anlisis de excitacin
5/6
Half-rate Cdec:
Tambin existe una versin de cdec GSM de tasa media, es el VSELP (Vector Self-Excited Linear
Predictor cdec), tiene una tasa de bit de 5.6 kbps. El codificador/decodificador VSELP utiliza hasta
un total de tres fuentes de excitacin.
La primera es el diccionario adaptativo (igual que en CELP). Las dos restantes son los dos (o uno)
diccionarios VSELP. En las implementaciones de 8 Kbps se usan dos diccionarios VSELP, cada uno
de los cuales contiene 128 vectores. A 4.8 Kbps se usa un solo diccionario que contiene 2048
vectores. Los diccionarios VSELP, debidos a su estructura, son muy robustos frente a posibles
errores. Estos diccionarios VSELP contienen vectores que se calculan como combinacin lineal de
unos vectores bsicos.
Requisitos para la codificacin de la voz en GSM
La forma ms sencilla para pasar una seal analgica a digital se implementa mediante convertidores
analgicos digitales, y viceversa. Pero estas tcnicas de digitalizacin no son las nicas empleadas
en transformar las seales en banda base analgica, en digitales y viceversa. La codificacin de la
voz en GSM debe tener los siguientes requisitos:
Los codecs GSM, proporcionan una codificacin con muy buenos y aceptables resultados en
cuanto a la calidad de la seal de la voz, su uso no es complejo, ya que como vimos no utiliza
algoritmos difciles de realizar para un computador sin muchas caractersticas, su principal
ventaja es la sencillez en sus operaciones.
6/6