Documente Academic
Documente Profesional
Documente Cultură
El protocolo de Voz sobre IP es un estndar desarrollado para poder realizar comunicaciones de voz en tiempo real a travs de redes IP, inicialmente desarrolladas para el
transporte de datos. Las redes IP han evolucionado desde la transmisin de datos nicamente, hasta realizar las funciones de una red tradicional de conmutacin de circuitos.
La mayor parte de las redes de conmutacin que existen en la actualidad sern remplazadas por redes de conmutacin de paquetes en un futuro. Esta transicin supone no
slo una reduccin de los costes, sino que proporcionar tambin el desarrollo de una
serie de nuevos servicios para voz y datos que no hubiesen sido posible con las redes de
conmutacin de circuitos tradicionales.
En este apartado se describirn los elementos del estndar de VoIP, as como una descricpin de la arquitectura y funcionamiento del software, de carcter libre, utilizado
para implementar la central de conmutacin.
Las enormes posibilidades que tiene la VoIP de convertirse en la opcin de telefona
dominante del futuro, debido tanto a su reducido coste como a su exibilidad, ser otro
tema tratado en este apartado.
3.1.
INTRODUCCIN.
La convergencia de las redes de telecomunicaciones actuales supone encontrar la tecnologa que permita hacer convivir en la misma red voz y datos. Esto obliga a establecer
un modelo o sistema que permita encapsular la voz para ser transmitida junto con los
datos sobre la misma red. Teniendo en cuenta la importancia y desarrollo de Internet,
el desarrollo de una tecnologa universal nos lleva a pensar en el protocolo IP (Internet
Protocol) y a encontrar un mtodo que nos permita la transmisin de voz sobre dicho
protocolo. Esto se consigue con el estndar VoIP (Voice Over Internet Protocol).
14
3 LA VoIP.
Dicho estndar, regula el transporte de los datos de voz a travs de redes IP en forma
de paquetes de datos. El inters de transportar la voz por este tipo de redes, en lugar
de por las redes de conmutacin de paquetes tradicionales, se debe a ciertas limitaciones
de stas ltimas y a las ventajas aportadas por las redes de conmutacin de paquetes:
3. Mantenimiento caro.
3. Al no tener que reservar canales exclusivos para cada llamada, permite la reduccin
drsticas de costes de taricacin de llamadas.
15
3 LA VoIP.
una aplicacin especca: la telefona, y construy una red adaptada a sus necesidades.
Internet, por otro lado, comenz exactamente en el extremo opuesto: cre una nueva
tecnologa de red y busc, con xito, aplicaciones que pudieran hacer uso del servicio
ofrecido.
IP cuenta con varias limitaciones, que se han hecho ms evidente conforme la red aumenta de tamao. El aumento del trco tradicional, se ha venido solventando mediante
la solucin obvia de incrementar la capacidad de los medios de transmisin. Sin embargo, el trco por la red no slo ha cambiado en volumen, sino tambin ha cambiado en
naturaleza. Existen muchos nuevos tipos de trcos, de mltiples aplicaciones nuevas,
cuyos requirimientos operacionales varan enormemente.
Entre estas nuevas aplicaciones, la telefona se destapa como una de las ms exigentes.
El mantenimiento de una conversacin bidireccional en tiempo real es posiblemente una
de las aplicaciones ms difciles de satisfacer. A pesar de ser una aplicacin multimedia,
sus requisitos de ancho de banda son muy escasos, apenas 8 Kbytes por segundo en cada
sentido. De modo que la capacidad no es problema, el problemas ms bien es la latencia
durante la comunicacin.
Para la telefona IP, y en general para muchas otras aplicaciones bidireccionales y en
tiempo real, los requisitos de temporizacin son mucho ms restrictivos que los de capacidad. El retardo de trnsito, y las prdidas de paquetes debido a congestiones momentneas de la red, resultn en una prdida apreciable de la calidad de la comunicacin. Un
incremento del ancho de banda es una primera solucin para los problemas de latencia,
sin embargo, el trco en Internet aumenta en la misma proporcin que el incremento de
ancho de banda una vez que ste es aadido, de manera que esto no supone una salida.
Son imprescindibles nuevas medidas que aseguren cierta calidad del servicio prestado.
En los siguientes apartados se irn viendo los elementos necesarios utilizados por la
tecnologa VoIP para transportar la voz sobre redes IP.
3.2.
Este captulo describe los pasos necesarios llevados a cabo para transmitir la voz a travs
de redes IP, desde que sta es capturada en el origen de la comunicacin hasta que es
reproducida en el otro extremo.
16
3 LA VoIP.
3.2.1.
MUESTREO Y DIGITALIZACION
Sin embargo, estos procesos de digitalizacin en la tecnologa VoIP no estn exclusivamente ligados al tipo de enlace de dato. Diferentes tcnicas de digitalizacin y compresin son usadas en circunstancias diferentes. No siempre las propiedades de los enlaces
de datos, tales como capacidad o latencia, son factores decisivos en la eleccin de estas
tcnicas. Esta conversin de la seal a formato digital es llevada a cabo tanto en el mundo IP como en la telefona tradicional, donde los sistemas de comunicacin transportan
los datos mediante multiplexacin de ujos de voz digitalizados.
DAC incluye digitalizacin de la voz, cuantizacin de la seal digital, ltrado para preservar el ancho de banda y compresin de la seal para una mejor eciencia del ancho
de banda. La tcnica de muestreo ms comn para convertir seales audibles a seales
digitales es la Modulacin por Implusos Codicados (MIC), donde la seal analgica ser
muestreada a la vez que su amplitud ser discretizada y codicada en formato binario.
Para establecer una llamada telefnica, un telfono tradicional, sea analgico o digital,
requirir un enlace con suciente capacidad como para transportar un ujo de datos de
64 Kbps. sta es la velocidad jada para cualquier lnea de telfono tradicional. Tanto
sistemas de telefona analgica como digital ofrecen una claridad del sonido similar, ya
que operan en el mismo rango de muestreo de la seal de voz: 8000 Hz. Esta frecuencia
combinada con una resolucin de muestreo de 8 bits, da lugar a un rgimen binario de
64kbps.
17
3 LA VoIP.
3.3.
EL PROCESO DE CODIFICACIN DE LA
VOZ.
3.3.1.
EMPAQUETADO
El empaquetado de la voz es el proceso, en tiempo real, por el cual un ujo de voz digitalizada es dividida en trozos manejables y de igual tamao para su adecuado trasnporte
sobre la red.
18
3 LA VoIP.
3.3.2.
MULTIPLEXACIN.
La red de telefona tradicional (RTC) ofrece una forma de proveer una mayor capacidad de llamadas que la que provee la linea telefnica tradicional. A travs de una lnea
compuesta por dos pares de hilos conductores, a diferencia de la lnea tradicional, compuesta por un slo par de hilos, puede transmitirse hasta 24 llamadas simultneas. Esta
tecnologa de alta densidad es llamada E1 y es a menudo usada a modo de enlace para
unir centrales telfnicas (PBX). La tcnica usada para aprovechar mejor los recursos
de la red se llama multiplexacin. Diversos niveles de multiplexacin de canales de voz,
proveen una mayor densidad de llamadas a travs de un mismo medio. Por contra, la
adquisicin de estos cirtcuitos tiende a ser bastante cara y es por ello que suelen emplearse exclusivamente como enlaces entre centrales telefnicas, o bien, en aplicaciones
de datos, suelen ser usados por los proveedores de servicio a Internet (ISP) que necesitan
ofrecer una alta capacida de conexin a Internet.
3.3.3.
COMPRESIN.
VoIP provee una forma ms econmica de compartir el medio de transmisin. Para ello
emplea tcnicas de compresin sobre las muestras de sonido usadas para representar la
voz en la red, de tal forma que una menor cantidad de enlaces fsicos son requeridos
para transmitir la misma informacin. Es posible reducir el rgimen binario de 64 kbps,
usados en una conversacin telefnica tradicional, por debajo de los 44 kbps, sin llegar
a notar prdida de calidad en la seal de voz reconstruida en el extremo receptor. Los
algoritmos usados por VoIP para codicar los datos de sonido o para decrementar los
requerimientos de ancho de banda son conocidos como codec.
19
3 LA VoIP.
3.3.4.
CODECS.
Los codecs, llamados as por la funcin que desempean tanto en el transmisor, como
codicadores de la seal, como en el receptor, como decodicares de la misma, son
algoritmos usados para empaquetar ujos de datos multimedia (voz y/o audio), que
posteriormente sern retransmitidos por la red en forma de streaming o bien sern
transportados en tiempo real sobre la misma. Existen docenas de codecs para audio
y video, pero aqui slo describiremos los que son ms comunes en las redes VoIP.
La mayora de estos codecs usados en redes VoIP son denidos por recomendaciones
de la ITU-T, quellas pertenecientes a la variedad G ( Trasmision system and media).
Dentro del grupo de codec denidos por la ITU-T, pueden distinguirse dos tipos: los que
van destinados a aplicaciones que requieren una alta delidad como puede ser la difusin
de msica a travs de la red, y aquellos que van destinados a la codicacin de seales
de voz que sern transmitidas en tiempo real. Ser sobre estos ltimos sobre los que nos
centraremos posteriormente.
Los codecs de audio para aplicaciones de telefona, as mismo, se dividen en dos grupos:
aquellos que se basan en la modulacin por impulsos codicados para transmitir la seal
de audio, y aquellos que restructuran la representacin digital de la seal PCM en un
formato ms adecuado. As estos dos grupos de codecs de telefona son los codec PCM,
que son los codecs bsicos de 64 kbps, y los vocoders, los cuales van un paso ms alla del
algoritmo PCM. Por ltimo, puede considerarse un tercer grupo de codecs, los codecs
hbridos, que reunen las ventajas de los anteriores.
20
3 LA VoIP.
estos codecs se puede reducir la tasa de error hasta los 18 kbps, a cambio de perder
un poco de calidad.
Vocoders:
Codecs hbridos:
Estos codecs tienen las ventajas de los vocoders, en cuanto a que se basan en
el modelo de excitacin, ms un ltro vocal para conseguir bajas tasas de bit
a transmitir, y adems poseen las ventajas de los predictivos, en cuanto a que
comparan la muestra generada mediante la seal de excitacin y ltro calculados,
con la original, para as transmitir tambin el error cometido con muy pocos bits y
conseguir ms naturalidad en la voz reproducida en el destino. Dicho error puede
ser codicado bien mediante ndices o por forma de onda, segn el codec, y se
transmite junto con los coecientes del ltro vocal y la seal de excitacin. Con
esto se consiguen tasas de transmisin tambin muy bajas y adems una calidad
de escucha bastante buena.
Dentro de este grupo, podemos encontrar a los codecs: G.729 y G.723.1, estandarizados por la ITU-T, y a GSM y sus variantes, estandarizados por el ETSI.
21
3 LA VoIP.
G.711.
Este codec es un algoritmo de codicacin/decodicacin de 64 kbps que usa
8 bits para codicar las muestras de seales de audio muestreadas a 8 khz.
Se trata de una seal de audio de buena calidad. Este codec presenta un
bajo procesamiento para ser implementado y es el esquema de codicacin
usado por los circuitos de telefona digital tradicional, como E1. Este codec
no provee ninguna compresin.
Existen dos variantes de las tcnicas de digitalizacin PCM usadas en el
codec G.711: uLaw y ALaw. La primera utiliza una escala de digitalizacin
logartmica para discretizar los niveles de amplitud, mientras la otra usa una
escala lineal. Entre ellos no son compatibles y deben ser transcodicados si
cada uno de los extremos de la conversacin estn utilizando uno de ellos.
uLaw suele ser usado en Norte America y parte Asia, mientras que ALaw
prevalece en el resto del mundo.
G.722.
Este codec tiene ocupa un gran ancho de banda, ya que hace un muestreo de
la seal de audio al doble de valor normal: 16 Khz. El efecto es que el sonido
tiene mucha mayor calidad que el resto de los codecs usados para VoIP. Por
lo dems, es idntico al codec G.711.
GSM.
Este codec, usado en el sistema de telefona movil global, ofrece una tasa de
13 Kbps. Como muchos otros codec salido de las recomendaciones de la ITUT, hace uso del algoritmo CELP para lograr una alta escala de compresin y
,a su vez, presenta un procesamiento mucho menor.
22
3 LA VoIP.
ILBC.
El Internet Low Bitrate Code, es un codec de audio que puede adquirirse
gratuitamente. Presenta caractersticas similares, en cuanto a consumo de
ancho de banda e intesidad de procesamiento, a las del codec G.729A, pero
con un mejor comportamiento ante la prdida de paquetes.
Speex.
Este codec presenta una tasa de muestreo comprendida entre 8 y 32 kHz,
adems de una tasa binaria variable. Speex permite cambiar la tasa binaria
en medio de la transmisin, sin tener que establecer una nueva llamada, lo
que puede ser til en situaciones de congestin de la red. Se trata de un codec
disponible gratuitamente y con implemenataciones bajo cdigo abierto.
Cada uno de estos codecs tiene sus ventajas e inconvenientes. G.711 es adecuado en
enlaces donde hay suciente capacidad y presentan poca latencia, como es el caso de
Ethernet. ste presenta un buen comportamiento ante los errores, pero, por ejemplo, no
sera adecuado su uso en un enlace Frame Relay de 56 kbps, ya que no se dispondra del
suciente ancho de banda. Recprocamente, los codecs que proveen una algn tipo de
compresin, lo hacen a costa de degradar la calidad de la seal
3.3.5.
Adems de los bits que representan los datos de audio, todos los paquetes transportan
otros bits usados para funciones de rutaje, correccin de errores, etc. Esta sobre carga de
bits no representa ningn benecio para la aplicacin de VoIP, ms que permirtir a los
niveles inferiores transmitir cabeceras ethernet, cabeceras IP o cualquier otra informacin
necesaria para el transporte del paquete a travs de la red. Cuanto mayor sea la cantidad
de datos de audio transmitidos por paquete, menos sobrecarga de cabeceras se transmite
por la red, ya que hacen falta menos paquetes para transportar el mismo sonido, y por
tanto mejor se aprovecha la capacidad del canal.
23
3 LA VoIP.
Los diferentes tipos de codecs usan diferentes tasas de paquetes. Al espacio entre los
paquetes transmitidos se le conoce como intervalo entre paquetes, y es expresado en
relacin a la tasa de paquetes. Algunos codecs, especialmente aquellos que usan algoritmos CELP avanzados, requieren una mayor cantidad de audio ( 20 ms, 30 ms) en un
mismo tiempo, para poder realiazar la codicacin y decodicacin. El intervalo entre
paquetes tiene un efecto directo sobre la sobrecarga. Cuanto mayor es ste, menor ser
la sobrecarga requerida para transmitir los datos de audio, y viceversa. Pero por contra,
el aumento del mismo provoca un aumento directo de la latencia o retraso de los datos,
es decir, la diferencia de tiempo entre el momento en el que el sonido fue originado hasta
que ste fue codicado, transportado, decodicado y reproducido en el extremo receptor,
ser mayor. Ya que un paquete IP no ser transmitido hasta que ste sea totalmente
construido, una trama de audio no podr viajar a travs de la red hasta que ste est
totalmente codicado. Esta latencia afecta negativamente a la calidad de la llamada,
percibida en el receptor.
Si se considera un muestreo de 8khz para una seal de audio bsica con 8 bits por muestra, y se asume un intervalo entre paquetes de 20ms, puede verse que la cantidad de datos
de audio, utilizando el codec G.711, transportada es de 1.280 bits. Si a estos se le aade
24
3 LA VoIP.
los bit de cabecera introducidos por cada protocolo que encapsula el mensaje, resulta
1.904 por trama, suponiendo que se utiliza ethernet como tecnologa de transimisin.
3.3.6.
Una forma importante de reducir ancho banda, adems del que se consigue al comprimir
la seal, es el uso del sistema DTX / VAD / CNG. Se trata de un sisitema de transmisin
discuntnua ( Discontinous Transmision, DTX), que se emplea conjuntamente con un
detector vocal ( Vocal Activity Detector, VAD) y un generador de ruido de fondo (
Confort Noise Generator, CNG). Dicho sistema consiste en no enviar paquetes de datos
durante los silencios de las conversaciones. En estos silencios, aunque no se hable, seguir
habiendo ruido de fondo, por lo que ser necesario transmitir algn tipo de informacin
que sirva para reproducir el ruido de fondo en el receptor y no perder as la naturaleza
25
3 LA VoIP.
de la conversacin. Este tipo de tramas con informacin para el ruido se conocen como
tramas SID ( Silence Insertion Descriptor) y son de poco tamao comparadas con las
tramas de datos. El elemento del codec encargado de generar el ruido de fondo a partir
de la informacin de las tramas SID, es el generador de ruido de fondo ( CNG).
Utilizando el sistema de transmisin discontnua se ahorra mucho ancho de banda. Este
algoritmo DTX, tambin es menos sensible a los errores de transmisin que en un sistema
en el que se enviaran las tramas activas de datos constntemente, ya que si se pierden
tramas tramas SID, se cogen los parmetros de las anteriores para generar el ruido
actual, de manera que afecte poco esa prdida. En el caso en que se pierda la primera
trama SID de un tramo de silencio, durante la fases de habla se van estimando tambin
dichos parmetros para su posterior reproducin.
Para que este sistema funcione es fundamental el buen funcionamiento de los detectores
de actividad vocal. Estos analizan intervalos de conversacin de una determinada duracin y concluyen si en este fragmento analizado ha habido voz ( tramo de "active voice"),
o no ( tramo de "inactive voice"). En los tramos de voz activa se envia informacin til,
y en los tramos de voz inactiva, se mandan tramas SID, para que el decodicador pueda
generar un ruido de fondo adecuado, o , incluso, no se enva nada. Las tramas SID slo
se envian si el ruido ha cambiado desde la ltima trama transmitida.
Para determinar si estamos ante un tramo de voz inactica o activa, los VAD's se basan
en diferentes medidas, tales como:
3.4.
EL ESTANDAR VoIP.
Este apartado describe los estndares de sealizacin de llamadas en una red de VoIP.
Tambin se describe la forma en la que estos estndares compiten y se complementan.
26
3 LA VoIP.
3.4.1.
Sus propsitos son sealizar, registrar y facilitar los eventos claves de una llamada:
el comienzo, el nal de llamada y cundo los usuarios estn intentando usar una
serie de servicios de telefona como transferencia de llamada o conferencia.
Aunque las llamadas de sealizacin suelen establecerse usando UDP como protocolo de transporte, no son vistas como trco en tiempo real, como ocurre con la
transmisin de los datos de voz.
El patrn de trco que sigue la sealizacin cuando sta es transmitida por la red,
suele ser de poca duracin y a rfagas, en oposicin al trco de voz que tiende a
ser consistente y de larga duracin.
Actualmente, existen dos importantes protocolos de sealizacin en el mundo de la telefona IP: el Protocolo de Inicio de Sesin (SIP), desarrollado por el IETF ( Internet
Engeneering Task Force); y H.323, desarrollado por la ITU-T. Existen otra serie de protocolos de sealizacin, desarrollado por compaias privadas, como pueden ser: SCCP,
desarrollado por Cisco Company, o IAX, propiedad de la empresa Digium.
Entre todos los estndar de sealizacin que existen, aquellos que han sido elaborados
por organismos pblicos, como son SIP y H.323, nos aportarn una mayor exibilidad
y extensibilidad, ya que se encuentran bajo libre disposicin, distribucin y modicacin para toda la comunidad de Internet. Entre estos dos principales standares existen
27
3 LA VoIP.
sustanciales diferencias, en cuanto a los distintos tipos de caminos por donde pueden
establecer las llamadas telefnicas. H.323, hace posible establecer una comunicacin entre central de conmutacin y central de conmutacin, entre la RTC y una central de
conmutacin, y entre terminales y centrales de conmutacin. Esto signica que H.323
posee una interfaz que le permite establecer una llamada con los sistemas de telefona
tradicionales, especialmente con la RTC. Comparativamente, SIP es mucho ms limitado
en cuanto a su alcance dentro de la red. ste no soporta la comunicacin con ningn
terminal tradicional, sea analgico o digital. Fue diseado para permitir una comunicacin entre terminales IP. Sin embargo, una gran ventaja de SIP es su exibilidad para
soportar aplicaciones de caracter no telefnico, tales como mensajera instantnea, video conferencias, etc. Dicha propiedad es la principal caracterstica de SIP y la mayor
carencia de H.323.
Familia de protocolos
Escenarios de sealizacion
Mantenedor
H.323
Telefona y video.
ITU-T
SIP
IETF
IAX
Telefona.
Digium Inc.
SCCP
Telefona( conmutadores<>terminales)
Cisco System
MEGACO/H.248
Telefona(control de gateway's)
ITU-T
MGCP
Telefona(control de gateway's)
IETF
3.4.2.
EL PROTOCOLO H.323.
Mientras que el estndar H.323 se encuentra en un estado bastante maduro y bien documentado por la ITU-T, ste ha sido implementado en partes especcas por cada
fabricante que no son, desafortunadamente, totalmente interoperables. Esta incompatibilidad de las implementaciones de H.323 es un problema cuando se pretende enlazar
28
3 LA VoIP.
sistemas de distintos fabricantes. Para conseguir este objetivo, se hace uso de dispositivos trandicionales, tales como E1, como elemento intermediador, ya que la mayora de
las implementaciones de los protocolos de telefona tradicional de cada fabricante son,
casi siempre, compatibles entre s.
Los paquetes de mensajes H.323 son compactos, y la sealizacin H.323 es muy rpida,
especialmente comparada con SIP, el cual usa mensajes ms largos y basados en texto
plano. El diseo de H.323 est basado en los fundamentos del diseo de la Red Telefnica
Conmutada: brevedad y disponibilidad. La red es usada tan poco como sea posible para
transportar la sealizacin de la llamada, y tanto como sea posible para transporta el
sonido.
3.4.2.1.
3.4.2.1.1.
ARQUITECTURA .
GATEKEEPER H.323.
El gatekeeper es un equipo de la red que provee monitorizacin, centralizada de llamadas y capacidades de sealizacn hacia terminales H.323. El alcance de un gatekeeper
puede ser un segmento particular de una LAN o , incluso, todo un continente.
Al alcance de red dentro del cual un gatekeeper opera se le denomina "zona". Puede
haber slo un gatekeeper por zona y una zona por gatekeeper. Es normal referirse a un
gatekeeper H.323 como una central software de conmutacin, una softPBX.
Tanto los terminales H.323 como los gateways, para que puedan ser accesibles a las
aplicaciones de telefona, deben llevar a cabo un proceso de registro ante el gatekeeper.
Esto quiere decir que cada terminal H.323 debe informar al gatekeeper de cules son
sus caractersticas nicas que lo identican: nmero de telefno, direccin IP, etc. Este
proceso puede ser autenticado si se desea.
El proceso de registro es llevado a cabo mediante el protocolo RAS: Resgistration, Admission y Status. Este protocolo slo govierna el proceso de registro y no el establecimiento
29
3 LA VoIP.
de llamadas. Sin la presencia de un gatekeeper en una red H.323 no se podra establecer mucho ms que canales dedicados con otro terminal, se perderan, entre otras, las
funciones de rutaje de mensajes.
Registro y autenticacin.
30
3 LA VoIP.
3.4.2.1.2.
TERMINALES H.323.
Cada terminal H.323, ya ste implementado en software o hardware, contiene una pila
de elementos software que le permiten cubrir diferentes aspectos del proceso de llamada:
3.4.2.1.3.
GATEWAY H.323.
Los gateways tambin deben registrarse con el gatekeeper para la zona en la que ellos
sirven, si las llamadas van a ser rutadas a travs de sus interfaces.
31
3 LA VoIP.
3.4.2.1.4.
Una MCU, es un dispositivo H.323 que tiene un nico propsito: poder establecer una
multiconferencia entre tres o ms canales de voz. sta puede ser implementada en un
servidor dedicado, o bien, ser integrada como parte de un terminal H.323.
Una MCU est formada por dos componentes fundamentales: MP (mulipoint processing)
y MC (multipoint controller). La primera de ellas, es el elemento software dentro de
la MCU encargado de llevar a cabo las accciones de un DSP, para agregar canales
multimedia a una multiconferencia. El controlador multipunto o MC, es el encargado
de gestionar las negociaciones H.245 entre todos los terminales para determinar las
capacidades comunes para el procesado de audio y datos. Tambin controla los recursos
de la conferencia para determinar cules de los ujos, si hay alguno, sern multipunto
(multicast). Las capacidades son enviadas por el MC hacia todos los extremos de la
conferencia, indicando los modos en los que pueden transmitir.
3.4.2.2.
TORRE DE PROTOCOLOS .
32
3 LA VoIP.
Algunos protocolos, como RTP ( Real Time Protocolo) y RTCP (Real Time Control
Protocol), ya existan cuando se deni la recomendacin y fueron reutilizados directamente. Otros, como H.225.0 y H.245, derivarn del ITU-T H.320, H.221 y H.242, y
algunos otros, como el protocolo RAS, fue diseado especcamente para H.323.
Como se describe ms adelante, cada protocolo o conjunto de ellos en H.323 tiene como
objetivo ofrecer un servicio a las capas superiores:
Direccionamiento.
RAS: protocolo utilizado para la bsqueda de un gatekeeper por parte de un terminal, para establecer un registro en la zona que ste controla.
Sealizacin:
H.225.0: protocolo que describe cmo el audio, los datos y la informacin de control, en una red de conmutacin de paquetes, pueden ser usados para proporcionar
servicios telefnicos. Se encarga de la sealizacin de las llamadas. Los mensajes
H.225.0 siguen el estndar Q.931 y son del tipo: mensaje de establecimiento de llamadas, mensajes de informacin de la fase de la llamada, mensajes de terminacin
de la llamada y otros.
H.245: protocolo de control para especicar mensajes de apertura y cierre de cnales lgicos para comunicaciones de voz, para realizar las negociaciones de los
parmetros y establecer conexiones UDP.
Los mensajes siguen la sintaxis ASN.1. Consisten en un intercambio de mensajes
que pueden ser del tipo: peticiones, respuestas, comandos y mensajes de indicacin.
Informacin de audio:
Todos los terminales deben soportar el codec G.711. Tambin pueden utilizarse
cualquiera de los codecs G.7xx estandarizados por la ITU-T.
Informacin de vdeo:
En el caso que los terminales H.323 soporten vdeo llamada o vdeo conferencia,
sern utilizados los protocolos H.261 y H.263, que dene la manera de transportar
ujos de videos utilizando RTP.
33
3 LA VoIP.
Control de la transmisin:
RTCP: protocolo de control de RTP. Se utiliza principalmente para detectar situaciones de congestin en la red y tomar acciones correctoras. Se basa en la
transmisin peridica de paquetes de control a todos los participantes en la sesin,
usando el mismo mecanismo de distribucin que los paquetes de datos.
Servicios suplementarios.
A travs de los protocolos de la familia H.450.x se ofrence servicios tales como:
llamada en espera, intrusin de la llamada, etc.
3.4.2.2.1.
SEALIZACIN.
Hay cinco pasos generales, a seguir por cada extremo de la llamada, para llevar a
cabo el proceso de sealizacin de la misma: establecimiento/nalizacin, negociacin de
capacidades, establecer canales de audio y/o video, llevar a cabo la llamada y liberacin
de la llamada.
1. Establecimiento/nalizacin:
34
3 LA VoIP.
Para iniciar una llamada se hace uso del protocolo H.225. Durante este paso, cada
terminal involucrado en la llamada es puesto al da del estado en que se encuentra
la llamada, a travs de uno de los posibles estados que dene H.225:
Alerta: esto signica que el extremo receptor est siendo noticado de que
alguin est intentando alcanzarle. En otras palabras, que el extremo receptor
est sonando, y que el terminal que origin la llamada est recibiendo una
indicacin de ello.
2. Negociacin de capacidades
Despus de establecer la llamada, se hace uso del protocolo H.245 para negociar
los requerimientos de aplicacin de la llamada y seleccionar el codec apropiado.
H.245 determina:
Cules son los codecs disponibles para cada terminal y cules son sus preferencias.
35
3 LA VoIP.
5. Liberacin
Al nalizar la llamada, H.225 entra en su estado de liberacin, sealizando el
nal a los canales multimedia, a la sesin H.245 de negociacin de capacidades
y al proceso de taricacin llevado a cabo por el gatekeeper. Dependiendo de los
terminales, ambos podrn oir un tono o una seal de ocupado.
36
3 LA VoIP.
En la anterior gura puede verse el proceso de sealizacin que tiene lugar cuando un
terminal H.323 intenta establecer una llamada con otro terminal via un gatekeeper:
2. El gatekeeper contesta con una conrmacin ARQ (ACF). Esto conrma al llamante que la peticin de sesin ha sido recibida por el gatekeeper.
5. El receptor enva un mensaje "Called Party ARQ Adminsion Request" al gatekeeper, preguntndole si la llamada es legtima. En este punto, el gatekeeper debera
tener una copia de la peticin de registro del llamante para validar la llamada.
6. Si el gatekeeper tiene una copia de este registro, devuelve el mensaje "Called Party
ACF" al receptor, dando paso a que el receptor comienze a sonar.
7. El receptor, una vez que comienza a sonar, enva en mensaje H.225 "Alerting",
indicando al extremo que origin la llamada que el receptor est sonando.
8. Una vez que el receptor conteste a la llamada, ste enva un mensaje H.225 "Connect" al otro extremo de la comunicacin. Esto deja paso a que el proceso H.245,
de negociacin de capacidades, comienze.
La diferencia entre sealizacin basada en gatekeeper y sealizacin directa entre terminales, es el papel que juega ste en las sesiones H.225, sin inuir en el camino que
seguirn los datos multimedia a travs de la red.
37
3 LA VoIP.
3.4.2.3.
E.164 es una convencin para asignar nmeros de telfonos a terminales en una red de
VoIP. E.164, permite a los terminales de una red de VoIP registrar dinmicamente sus
nmeros de direcciones E.164 desde una lista de nmeros almacenados en una base de
datos en el gatekeeper.
Esta base de datos es una lista de direcciones MAC Ethernet, cada una de las cuales
corresponden a una o ms direcciones E.164. De esta forma se controla que terminal va
a usar un determinado nmero, permitindo as una fcil movilidad de los terminales en
la red: no importar a qu lugar vaya el terminal H.323, su direccin E.164 siempre ser
la misma.
Pero exiten una serie de incovenientes usando direcciones MAC como enlaces hacia una
direccin E.164: dicultad a la hora de memorizarlas e imposibilidad de cambiar su valor.
Existen mejores formas de manejar la asignacin de alias a los terminales H.323, ya que
basarse en este mtodo, es intrnsicamente basarse en la tecnologa Ethernet. Esto es
unos de los grandes inconvenientes de H.323 en comparacin a SIP.
38
3 LA VoIP.
3.4.3.
EL PROTOCOLO SIP.
El Protocolo de Inicio de Sesin, fue desarrollado por el IETF, como una forma de
sealizacin multiusuario de telefona distribuida y de aplicaciones de mensajerias en
una red IP.
Los deberes y escenarios de SIP son los mismos que los de H.323. Es decir, hay terminales
de VoIP de distintas capacidades y servidores que participan en el proceso de sealizacin
y establecen polticas para la red de VoIP. Sin embargo, SIP es ms exible que H.323,
puede considerarse ms que un conjunto de protocolos de telefona para audio y video. Se
trata entorno de trabajo para todos los tipos de aplicaciones basadas en el intercambio de
mensajes, desde aplicaciones de telefona hasta mensajera instantnea u otros servicios.
39
3 LA VoIP.
3.4.3.1.
ARQUITECTURA.
SIP sigue el modelo cliente/servidor. En el entorno SIP, tanto servidores como los puntos
nales de una comunicacin, son llamados "nodos". Un telefno SIP, es un nodo, y como
cada nodo, puede comunicarse directamente con cualquier otro para, de esta forma,
poder establecer sesiones multimedias, tal y como los terminales H.323 pueden establecer
canales directos entre ellos. Pero la conguracin ms usual es usar servidores SIP, a los
cuales el resto de los telfonos SIP debern noticar su presencian, es decir, debern
registrarse, una vez que empiecen a funcionar.
Los elementos funcionales en la arquitectura SIP son:
2. Servidores de red.
Los agentes de usuario son aplicaciones que residen en los nodos terminales SIP, y contienen dos componentes: Agentes de Usuario Clientes ( User Agent Client, UAC) y Agentes
40
3 LA VoIP.
de Usuario Servidores ( User Agent Server, UAS). Los UAC originan las peticiones SIP
, y los UAS responden a estas peticiones, es decir, originan respuestas SIP asociadas al
extremo que recibe la llamada. Los UA's deben implementar el transporte tanto sobre
TCP como UDP.
Los UA's y UAS's pueden establecer, por s solos, una comunicacin. No obstante, la
potencialidad de SIP se aprovecha con el empleo de los servidores de red. Los servidores
de red, se clasican desde el punto de vista logico, de la siguiente manera:
Servidores de redireccin.
Servidores Proxy.
Servidores de Registro.
3.4.3.1.1.
SERVIDORES DE REDIRECCIN.
Se encargan de procesar mensajes INVITE, que son solicitudes SIP emitidas por la
parte que origina la llamada, y retornan la direccin , o direcciones, de la parte llamada,
es decir la URL de la parte llamada, o cmo contactar con ella. En caso contrario,
rechazan la llamada enviando una respuesta de error. Anlogamente a H.323, juegan el
papel de gatekeeper.
Cuando un servidor SIP responde a la solicitud INVITE, enviada por la parte que origina
la llamada, con una respuesta 3xx, el servidor SIP est redireccionando a dicha parte
hacia otro servidor SIP. Posteriormente, el nodo SIP debe contactar con el nuevo servidor
SIP a travs de otra solicitud SIP. Esta caracterstica no est implementada en todos
los sistemas que soportan SIP, y suele ser propia de entornos extensos que operan bajo
redes exclusivamente SIP.
3.4.3.1.2.
SERVIDORES PROXY.
Ejecutan un programa intermediario que acta como servidor y cliente: desde al punto
de vista del llamante se comporta como un servidor y desde el punto de vista del receptor
como un cliente. Un servidor proxy puede reenviar solicitudes hasta el destino nal sin
efectuar cambio alguno en ellas, o cambiar alguna parmetro si se requiere.
41
3 LA VoIP.
Los servidores proxy statefull retienen informacin dela llamada durante el proceso que
dure el establecimiento de sta, no as los servidores stateless, que procesan un mensaje
SIP y entonces olvidan todo lo referente a la llamada hasta que vuelvan a recibir otro
mensaje asociado a la misma. Las implementaciones stateless proveen buena escalabilidad, pues los servidores no requieren mantener informacin referente al estado de la
llamada una vez que la transaccin ha sido procesada. Adems, esta relacin es muy
rubusta, dado que el servicio no necesita recordar nada en relacin a la llamada. Sin
embargo, no todas las funcionalidades pueden ser implementadas por un servidor stateless, algunas como: contabilizacin, taricacin de llamadas,etc, pueden requerir que se
le sigua el rastro a todos los mensajes y estado de una comunicacin.
3.4.3.1.3.
SERVIDORES DE REGISTRO.
Se encargan de registrar las direcciones SIP, formato URL, y sus direcciones IP asociadas. Es decir, se encargan de mappear direcciones SIP en direcciones IP, y tpicamente
se encuentran implementados junto con los servidores proxy o servidores de redireccin.
Tambin se les denominan servidores de localizacin ( Location Server), pues son utilizados por los servidores proxy y de redireccin para obtener informacin de la localizacin
de la parte llamada. Realmente los servidores de localizacin, no son entidades propias
del sistema SIP, sino ms bien, base de datos que pueden formar parte de arquitecturas
que utilicen SIP. Entre stos y cualquier servidor SIP, sea proxy o de redireccin, no se
utiliza el protocolo SIP, sino protolos tpicos de bases de datos o servicios de directorio,
como por ejemplo LDAP.
42
3 LA VoIP.
3.4.3.2.
Los nodos SIP son referenciado usando URI ( Uniform Resources Indicator), con la
siguiente estructura
sip:usuario@servidor_sip
Esta convencin indica tanto el usuario al que quiere alcanzarse como el servidor SIP ,
que se espera que conozca la direccin SIP del usuario nal. Aquellas coneccines que
requieren una encriptacin para la sealizacin usaran el prejo "sips", en lugar de "sip"
en la descripcin de sus URI's. La encriptacin de dichas seales har uso de la capa de
transporte seguro (SSL).
3.4.3.3.
43
3 LA VoIP.
Mientras que H.323 usa la sintaxis ASN.1 para la descripcin del formato de los mensajes,
SIP se basa en texto plano.
Las solicitudes SIP se clasican dentro de diez categoras, llamadas mtodos. Cada mtodo lleva a cabo una funcin diferente dentro de la arquitectura SIP:
1. INVITE: este mtodo es usado para establecer sesiones y anunciar las capacidades
de los nodos SIP.
2. ACK: es usado para conrmar que el cliente solicitante ha recibido una respuesta
nal desde un servidor a una solicitud INVITE, reconociendo la respuesta como
armativa.
3. OPTIONS: es usado para preguntar a un nodo SIP por sus capacidades, sin que
ningn canal multimedia haya sido establecido an.
4. BYE: este mtodo ocurre cuando la llamada es completada, es decir, cuando alguna
de los extremos involucrados en la comuniacacin desea nalizar la llamada.
5. CANCEL: cancela una solicitud pendiente, pero no afecta a una solicitud ya completada. Este mtodo naliza una solicitud de llamada incompleta.
44
3 LA VoIP.
Cuando una llamada debe ser establecida, nalizada o alterada, un evento SIP es empleado. Los eventos precedentes son similares en concepto a los mtodos de HTTP:
GET y POST; y como en HTTP, SIP espera cdigos de respuestas cuando un mtodo
es enviado. Los cdigos de respuestas SIP son clasicados en seis categorias:
45
3 LA VoIP.
3.4.4.
EL PROTOCOLO IAX.
IAX, Inter-Asterisk Exchange Protocol, actualmente en su segunda versin, es un protocolo de sealizacin para redes VoIP, tal y como ocurre con H.323 y SIP. La principal
diferencia con estos ltimos es que IAX no implementa RTP como mecanismo de paquetezacin, sino que ste tiene su propia forma de empaquetar los datos de voz codicada.
IAX es un protocolo a prueba de NAT, donde cientos de llamadas simultneas origindas desde detrs de un rewall con enmascaramiento funcionarn correctamente, como
ocurre con HTTP.
IAX es implementado de forma ms simple y menos exhaustiva que SIP o H.323. A
diferencia de estos ltimos, que son ms extensibles, IAX va dirigido exclusivamente a
aplicaciones de telefona.
Mientras que un ciclo completo de registro, sealizacin de llamada, transmisin de
voz y nalizacin, puede usar varios puertos TCP y UDP, en el caso de SIP o H.323, el
protocolo IAX maneja todas estas funciones usando un nico puerto UDP. Tanto cuando
el cliente IAX, terminal, se registra con el servidor o proxy IAX, as como cuando una
llamada es establecida o se trasnmite tramas de voz, se utiliza el mismo puerto UDP.
La forma que IAX utiliza para distinguir las distintas funcionalidades llevadas a cabo
46
3 LA VoIP.
Funciones/Caractersticas
SIP
47
H.323
IAX
3 LA VoIP.
Localizacin de terminales
Mtodo SIP
y admisin
REGISTER
Establecimiento y
Protocolo RAS
Tramas de control
IAX REG
Protocolo H.225
liberacin de llamada
Tramas de control
IAX NEW y
HANGUP
Negociacin de capacidades,
Protocolo de
Denicin de Sesin
Protocolo H.245
Informacin de
multimedias
Paquetizacin y transmisin
Meta-trama de
Capacidades IAX
Protocolos
de muestras de sonido
RTP/RTCP
Streaming de video y
Protocolo RTSP
audio grabado
Protocolos
Tramas IAX
RTP/RTCP
VOICE/DATA
Ninguno
Ninguno
recomendado
recomendado
Codicacin de trama
ASCII
ASN.1
Binario
Simulitud de mensajes
HTTP
RDSI/Q.931
Propietario
Proxy
Gatekeeper-
Software PBX
como
Dipositivo de referencia
rutado
Registrar
Gatekeeper
Servidor
Redirect
Sealizacin
Sealizacin
directa
directa
Gateway H.323
Ninguna
Ninguna
recomendada
Identicacin de terminales
SIP-URI, direccin
recomendada
Direccin E.164
de email, direccin
SIP-URI,
direccin de
E.164 o alias
email, direccin
E.164 o alias
Conexin a traves de
cortafuegos
Redireccin a travs
de Proxy/softPBX
Redireccin a
No se necesita
traves de Gate-
Proxy
keeper/SoftPBX
Puertos UDP
5060/5061
48
1503,1720,1731
5036
3 LA VoIP.
3.4.5.
Estos dos protocolos surgieron con la aparicin, como consecuencia de la liberacin del
servicio telefnico, de escenarios que permiten el trnsito de llamadas entre terminales
telefnicos de la RTC, a travs de una red IP. En estos escenarios no exiten terminales
VoIP nativos conectados directamente a la red IP. La solucin se basa en el empleo de
pasarelas VoIP conectadas entre s a travs de una red dorsal IP, y localmente, a una o
ms centrales telefnicas.
Con objeto de que las pasarelas que proporcionan el inter-funcionamiento entre la red la
red telefnica y la red IP sean lo ms sencillas posibles, el proceso de llamada y el manejo
de la sealizacin se realizan en un servidor de llamadas (controlador de pasarelas). De
esta forma, las pasarelas slo tienen que encargarse del manipulado fsico de los ujos
de voz: codecs, empaquetado, control de jitter, cancelacin de ecos, etc.
49
3 LA VoIP.
2. SIGTRAN: familia de protocolos del IETF que permite el transporte de la sealizacin telefnica sobre la red IP hasta el servidor de llamadas, MGC
50