Sunteți pe pagina 1din 37

3 LA VoIP.

El protocolo de Voz sobre IP es un estndar desarrollado para poder realizar comunicaciones de voz en tiempo real a travs de redes IP, inicialmente desarrolladas para el
transporte de datos. Las redes IP han evolucionado desde la transmisin de datos nicamente, hasta realizar las funciones de una red tradicional de conmutacin de circuitos.
La mayor parte de las redes de conmutacin que existen en la actualidad sern remplazadas por redes de conmutacin de paquetes en un futuro. Esta transicin supone no
slo una reduccin de los costes, sino que proporcionar tambin el desarrollo de una
serie de nuevos servicios para voz y datos que no hubiesen sido posible con las redes de
conmutacin de circuitos tradicionales.
En este apartado se describirn los elementos del estndar de VoIP, as como una descricpin de la arquitectura y funcionamiento del software, de carcter libre, utilizado
para implementar la central de conmutacin.
Las enormes posibilidades que tiene la VoIP de convertirse en la opcin de telefona
dominante del futuro, debido tanto a su reducido coste como a su exibilidad, ser otro
tema tratado en este apartado.

3.1.

INTRODUCCIN.

La convergencia de las redes de telecomunicaciones actuales supone encontrar la tecnologa que permita hacer convivir en la misma red voz y datos. Esto obliga a establecer
un modelo o sistema que permita encapsular la voz para ser transmitida junto con los
datos sobre la misma red. Teniendo en cuenta la importancia y desarrollo de Internet,
el desarrollo de una tecnologa universal nos lleva a pensar en el protocolo IP (Internet
Protocol) y a encontrar un mtodo que nos permita la transmisin de voz sobre dicho
protocolo. Esto se consigue con el estndar VoIP (Voice Over Internet Protocol).

14

3 LA VoIP.

Dicho estndar, regula el transporte de los datos de voz a travs de redes IP en forma
de paquetes de datos. El inters de transportar la voz por este tipo de redes, en lugar
de por las redes de conmutacin de paquetes tradicionales, se debe a ciertas limitaciones
de stas ltimas y a las ventajas aportadas por las redes de conmutacin de paquetes:

Limitaciones de las redes de conmutacin de circuitos:

1. Uso ineciente de los recursos. Cada llamada telefnica utiliza un canal de 64


kbps, independientemente de trco que haya en cada momento. Adems todos
los elementos de conmutacin se designan para conmutar canales de 64 kbps independiente de la cantidad de trco que llegue al conmutador en cada instante.

2. Son cerradas e poco exibles.

3. Mantenimiento caro.

Ventajas de las redes de conmutacin de paquetes:

1. Soportan un mayor volumen de trco gracias a que aprovechan mejor el ancho de


banda disponible.

2. Son redes abiertas.

3. Al no tener que reservar canales exclusivos para cada llamada, permite la reduccin
drsticas de costes de taricacin de llamadas.

4. Integracin de nuevos servicios y unicacin de la estructura de red.

Aunque las redes IP parece aportar excepcionales ventajes al mundo de la telefona, la


integracin de stas con las redes de telefona tradicional es un reto difcil y ,actualmente,
presentan ciertas limitaciones. Hay que tener en cuenta que los principios de diseo que
dieron lugar a la red de telefona que actualmente conocemos, son casi los opuestos a los
que originaron la red IP. Mientras que IP proporciona un servicio de tipo "Best-Eort"
mediante ancho de banda compartido, la red telefnica proporciona un servicio garantizado mediante reserva de capacidad. La industria de las telecomunicaciones empez con

15

3 LA VoIP.

una aplicacin especca: la telefona, y construy una red adaptada a sus necesidades.
Internet, por otro lado, comenz exactamente en el extremo opuesto: cre una nueva
tecnologa de red y busc, con xito, aplicaciones que pudieran hacer uso del servicio
ofrecido.
IP cuenta con varias limitaciones, que se han hecho ms evidente conforme la red aumenta de tamao. El aumento del trco tradicional, se ha venido solventando mediante
la solucin obvia de incrementar la capacidad de los medios de transmisin. Sin embargo, el trco por la red no slo ha cambiado en volumen, sino tambin ha cambiado en
naturaleza. Existen muchos nuevos tipos de trcos, de mltiples aplicaciones nuevas,
cuyos requirimientos operacionales varan enormemente.
Entre estas nuevas aplicaciones, la telefona se destapa como una de las ms exigentes.
El mantenimiento de una conversacin bidireccional en tiempo real es posiblemente una
de las aplicaciones ms difciles de satisfacer. A pesar de ser una aplicacin multimedia,
sus requisitos de ancho de banda son muy escasos, apenas 8 Kbytes por segundo en cada
sentido. De modo que la capacidad no es problema, el problemas ms bien es la latencia
durante la comunicacin.
Para la telefona IP, y en general para muchas otras aplicaciones bidireccionales y en
tiempo real, los requisitos de temporizacin son mucho ms restrictivos que los de capacidad. El retardo de trnsito, y las prdidas de paquetes debido a congestiones momentneas de la red, resultn en una prdida apreciable de la calidad de la comunicacin. Un
incremento del ancho de banda es una primera solucin para los problemas de latencia,
sin embargo, el trco en Internet aumenta en la misma proporcin que el incremento de
ancho de banda una vez que ste es aadido, de manera que esto no supone una salida.
Son imprescindibles nuevas medidas que aseguren cierta calidad del servicio prestado.
En los siguientes apartados se irn viendo los elementos necesarios utilizados por la
tecnologa VoIP para transportar la voz sobre redes IP.

3.2.

TRANSMICIN DE VOZ SOBRE REDES IP.

Este captulo describe los pasos necesarios llevados a cabo para transmitir la voz a travs
de redes IP, desde que sta es capturada en el origen de la comunicacin hasta que es
reproducida en el otro extremo.

16

3 LA VoIP.

El empaquetamiento de la voz dentro de datagramas IP, la transmisin de la misma a


traves de la red, la recepcin y la reconstruccin digitalizada de la voz es llevado a cabo
dentro de caminos virtuales establecidos entre el origen y el destino a travs de la red
IP, comunmente conocidos como canales.

3.2.1.

MUESTREO Y DIGITALIZACION

La tcnica por la cual la voz humana es convertida de su forma de onda natural al


formato digital nal empleado por la tecnologa de VoIP para su transmisin a traves
de red, se le conoce como DAC (Digital-to-Analog Conversation). En el mundo de la
telefona tradicional, el proceso es bastante simple, ya que las variaciones de dichas
tcnicas vienen impuestas segn los diferentes tipos de enlaces de datos y dispositivos,
y segn los estndares regionales empleados.

Sin embargo, estos procesos de digitalizacin en la tecnologa VoIP no estn exclusivamente ligados al tipo de enlace de dato. Diferentes tcnicas de digitalizacin y compresin son usadas en circunstancias diferentes. No siempre las propiedades de los enlaces
de datos, tales como capacidad o latencia, son factores decisivos en la eleccin de estas
tcnicas. Esta conversin de la seal a formato digital es llevada a cabo tanto en el mundo IP como en la telefona tradicional, donde los sistemas de comunicacin transportan
los datos mediante multiplexacin de ujos de voz digitalizados.

DAC incluye digitalizacin de la voz, cuantizacin de la seal digital, ltrado para preservar el ancho de banda y compresin de la seal para una mejor eciencia del ancho
de banda. La tcnica de muestreo ms comn para convertir seales audibles a seales
digitales es la Modulacin por Implusos Codicados (MIC), donde la seal analgica ser
muestreada a la vez que su amplitud ser discretizada y codicada en formato binario.

Para establecer una llamada telefnica, un telfono tradicional, sea analgico o digital,
requirir un enlace con suciente capacidad como para transportar un ujo de datos de
64 Kbps. sta es la velocidad jada para cualquier lnea de telfono tradicional. Tanto
sistemas de telefona analgica como digital ofrecen una claridad del sonido similar, ya
que operan en el mismo rango de muestreo de la seal de voz: 8000 Hz. Esta frecuencia
combinada con una resolucin de muestreo de 8 bits, da lugar a un rgimen binario de
64kbps.

17

3 LA VoIP.

En el mundo de la telefona tradicional cada conversacin de voz concurrente, tanto


digital como analgica, requirir un ancho de banda de 64kps, es por ello que este valor
representa un dato til a tener en cuenta en el dimensionamiento de una red VoIP.

3.3.

EL PROCESO DE CODIFICACIN DE LA
VOZ.

3.3.1.

EMPAQUETADO

El empaquetado de la voz es el proceso, en tiempo real, por el cual un ujo de voz digitalizada es dividida en trozos manejables y de igual tamao para su adecuado trasnporte
sobre la red.

Figure 3.1: Seal discretizda.

18

3 LA VoIP.

No como ocurre en una lnea analgica, en VoIP la seal de sonido es transmitida y


recibida mediante terminales IP. Esto hace que la seal sea ms manejable para ser
transportadas a traves de circuitos tradicionales de voz, tales como E1 o RDSI. Pero a
diferencia del sistema de telefona digital RDSI, la seal de voz en una llamada a travs
de una red IP es empaquetada, esto signica que dicha informacin es transportada a
travs de la red en unidades que tambin son usadas para transportar otros tipos de
datos. En el caso de VoIP, dichas seales se encapsulan en datagramas UDP.

3.3.2.

MULTIPLEXACIN.

La red de telefona tradicional (RTC) ofrece una forma de proveer una mayor capacidad de llamadas que la que provee la linea telefnica tradicional. A travs de una lnea
compuesta por dos pares de hilos conductores, a diferencia de la lnea tradicional, compuesta por un slo par de hilos, puede transmitirse hasta 24 llamadas simultneas. Esta
tecnologa de alta densidad es llamada E1 y es a menudo usada a modo de enlace para
unir centrales telfnicas (PBX). La tcnica usada para aprovechar mejor los recursos
de la red se llama multiplexacin. Diversos niveles de multiplexacin de canales de voz,
proveen una mayor densidad de llamadas a travs de un mismo medio. Por contra, la
adquisicin de estos cirtcuitos tiende a ser bastante cara y es por ello que suelen emplearse exclusivamente como enlaces entre centrales telefnicas, o bien, en aplicaciones
de datos, suelen ser usados por los proveedores de servicio a Internet (ISP) que necesitan
ofrecer una alta capacida de conexin a Internet.

3.3.3.

COMPRESIN.

VoIP provee una forma ms econmica de compartir el medio de transmisin. Para ello
emplea tcnicas de compresin sobre las muestras de sonido usadas para representar la
voz en la red, de tal forma que una menor cantidad de enlaces fsicos son requeridos
para transmitir la misma informacin. Es posible reducir el rgimen binario de 64 kbps,
usados en una conversacin telefnica tradicional, por debajo de los 44 kbps, sin llegar
a notar prdida de calidad en la seal de voz reconstruida en el extremo receptor. Los
algoritmos usados por VoIP para codicar los datos de sonido o para decrementar los
requerimientos de ancho de banda son conocidos como codec.

19

3 LA VoIP.

3.3.4.

CODECS.

Los codecs, llamados as por la funcin que desempean tanto en el transmisor, como
codicadores de la seal, como en el receptor, como decodicares de la misma, son
algoritmos usados para empaquetar ujos de datos multimedia (voz y/o audio), que
posteriormente sern retransmitidos por la red en forma de streaming o bien sern
transportados en tiempo real sobre la misma. Existen docenas de codecs para audio
y video, pero aqui slo describiremos los que son ms comunes en las redes VoIP.
La mayora de estos codecs usados en redes VoIP son denidos por recomendaciones
de la ITU-T, quellas pertenecientes a la variedad G ( Trasmision system and media).
Dentro del grupo de codec denidos por la ITU-T, pueden distinguirse dos tipos: los que
van destinados a aplicaciones que requieren una alta delidad como puede ser la difusin
de msica a travs de la red, y aquellos que van destinados a la codicacin de seales
de voz que sern transmitidas en tiempo real. Ser sobre estos ltimos sobre los que nos
centraremos posteriormente.
Los codecs de audio para aplicaciones de telefona, as mismo, se dividen en dos grupos:
aquellos que se basan en la modulacin por impulsos codicados para transmitir la seal
de audio, y aquellos que restructuran la representacin digital de la seal PCM en un
formato ms adecuado. As estos dos grupos de codecs de telefona son los codec PCM,
que son los codecs bsicos de 64 kbps, y los vocoders, los cuales van un paso ms alla del
algoritmo PCM. Por ltimo, puede considerarse un tercer grupo de codecs, los codecs
hbridos, que reunen las ventajas de los anteriores.

Codecs PCM o basados en forma de onda:


Transmiten informacin sobre la forma de onda de la seal de voz. Este grupo
de codecs se caracterizan por tener una tasa de bit de 64 kbps, siendo el ms
representativos de todos ellos el codec G.711. Esta tasa es muy elevada para las
posibilidades de algunas partes de la red, por lo que cada vez se utilizan menos
este tipo de codecs.
En este grupo tambin se encuentran los codecs predictivos, que comparan a codicar con las anteriores y codican slo la seal de error, con una menor cantidad
de bits y tambin mediante forma de onda. Se usan menos bits ya que la seal de
error es ms pequea que la muestra en s, tiene un menor rango dinmico. Con

20

3 LA VoIP.

estos codecs se puede reducir la tasa de error hasta los 18 kbps, a cambio de perder
un poco de calidad.

Vocoders:

Estos codecs aprovechan las caractersticas de la seal de voz humana. Toman


muestras de intervalos de la seal de voz de diferente duracin (10ms , 20ms o
30ms), segn el tipo de codec. Una vez con estas muestras, la analizan mediante
determinados algoritmos para sacar los coecientes del ltro vocal ( que har el
papel del tracto vocal de la persona que habla) y para crear la seal de excitacin
( que simula el impulso del aire que pasa por las cuerdas vocales al hablar). Con
estos datos de excitacin y ltro se puede reconstruir posteriormente la voz en el
receptor.

Estos codecs comprimen bastante la informacin a transmitir y alcazan tasas de


transmisin muy bajas, por contra la voz reproducida suena muy sintetizada, poco
natural y la calidad es bastante a inferirio a la de PCM.

Codecs hbridos:

Estos codecs tienen las ventajas de los vocoders, en cuanto a que se basan en
el modelo de excitacin, ms un ltro vocal para conseguir bajas tasas de bit
a transmitir, y adems poseen las ventajas de los predictivos, en cuanto a que
comparan la muestra generada mediante la seal de excitacin y ltro calculados,
con la original, para as transmitir tambin el error cometido con muy pocos bits y
conseguir ms naturalidad en la voz reproducida en el destino. Dicho error puede
ser codicado bien mediante ndices o por forma de onda, segn el codec, y se
transmite junto con los coecientes del ltro vocal y la seal de excitacin. Con
esto se consiguen tasas de transmisin tambin muy bajas y adems una calidad
de escucha bastante buena.

Dentro de este grupo, podemos encontrar a los codecs: G.729 y G.723.1, estandarizados por la ITU-T, y a GSM y sus variantes, estandarizados por el ETSI.

A continuacin se describen brevemente los codecs ms comunes usados en la


telefona IP:

21

3 LA VoIP.

G.711.
Este codec es un algoritmo de codicacin/decodicacin de 64 kbps que usa
8 bits para codicar las muestras de seales de audio muestreadas a 8 khz.
Se trata de una seal de audio de buena calidad. Este codec presenta un
bajo procesamiento para ser implementado y es el esquema de codicacin
usado por los circuitos de telefona digital tradicional, como E1. Este codec
no provee ninguna compresin.
Existen dos variantes de las tcnicas de digitalizacin PCM usadas en el
codec G.711: uLaw y ALaw. La primera utiliza una escala de digitalizacin
logartmica para discretizar los niveles de amplitud, mientras la otra usa una
escala lineal. Entre ellos no son compatibles y deben ser transcodicados si
cada uno de los extremos de la conversacin estn utilizando uno de ellos.
uLaw suele ser usado en Norte America y parte Asia, mientras que ALaw
prevalece en el resto del mundo.

G.721, G.723, G.726, G.728 y G.729A


Estos codecs hacen un mejor uso de la capacidad de la red, permitiendo la
reproduccin de sonido de alta calidad a una tasa de bit de 8 a 32 kbps. Este
grupo de codecs usa los algoritmos ADPCM ( Adaptatice dierential Pulse
Code Modulation) o CELP ( Code Excited Linear Predition) para reducir los
requerimientos de ancho de banda.

G.722.
Este codec tiene ocupa un gran ancho de banda, ya que hace un muestreo de
la seal de audio al doble de valor normal: 16 Khz. El efecto es que el sonido
tiene mucha mayor calidad que el resto de los codecs usados para VoIP. Por
lo dems, es idntico al codec G.711.

GSM.
Este codec, usado en el sistema de telefona movil global, ofrece una tasa de
13 Kbps. Como muchos otros codec salido de las recomendaciones de la ITUT, hace uso del algoritmo CELP para lograr una alta escala de compresin y
,a su vez, presenta un procesamiento mucho menor.

22

3 LA VoIP.

ILBC.
El Internet Low Bitrate Code, es un codec de audio que puede adquirirse
gratuitamente. Presenta caractersticas similares, en cuanto a consumo de
ancho de banda e intesidad de procesamiento, a las del codec G.729A, pero
con un mejor comportamiento ante la prdida de paquetes.

Speex.
Este codec presenta una tasa de muestreo comprendida entre 8 y 32 kHz,
adems de una tasa binaria variable. Speex permite cambiar la tasa binaria
en medio de la transmisin, sin tener que establecer una nueva llamada, lo
que puede ser til en situaciones de congestin de la red. Se trata de un codec
disponible gratuitamente y con implemenataciones bajo cdigo abierto.

Cada uno de estos codecs tiene sus ventajas e inconvenientes. G.711 es adecuado en
enlaces donde hay suciente capacidad y presentan poca latencia, como es el caso de
Ethernet. ste presenta un buen comportamiento ante los errores, pero, por ejemplo, no
sera adecuado su uso en un enlace Frame Relay de 56 kbps, ya que no se dispondra del
suciente ancho de banda. Recprocamente, los codecs que proveen una algn tipo de
compresin, lo hacen a costa de degradar la calidad de la seal

3.3.5.

TASA DE PAQUETIZACIN DE LOS CODECS.

Adems de los bits que representan los datos de audio, todos los paquetes transportan
otros bits usados para funciones de rutaje, correccin de errores, etc. Esta sobre carga de
bits no representa ningn benecio para la aplicacin de VoIP, ms que permirtir a los
niveles inferiores transmitir cabeceras ethernet, cabeceras IP o cualquier otra informacin
necesaria para el transporte del paquete a travs de la red. Cuanto mayor sea la cantidad
de datos de audio transmitidos por paquete, menos sobrecarga de cabeceras se transmite
por la red, ya que hacen falta menos paquetes para transportar el mismo sonido, y por
tanto mejor se aprovecha la capacidad del canal.

Como se ha comentado anteriormente, la clave para reducir la sobrecarga en una red


de VoIP es reducir el nmero de paquetes por segundo usado para transmitir la seal
de audio. Pero esto incrementa el impacto de los errores sobre la llamada telefnica.

23

3 LA VoIP.

As que se necesita llegar a un compromiso entre un valor de sobrecargar aceptable y


un aceptable nivel de resistencia a los errores. En esta parte es donde la eleccin de
un determinado codec puede ayudar, ya que cada uno proporciona distintas tasas de
transmisin de paquetes por segundo y distintos cantidades de cabeceras.

Los diferentes tipos de codecs usan diferentes tasas de paquetes. Al espacio entre los
paquetes transmitidos se le conoce como intervalo entre paquetes, y es expresado en
relacin a la tasa de paquetes. Algunos codecs, especialmente aquellos que usan algoritmos CELP avanzados, requieren una mayor cantidad de audio ( 20 ms, 30 ms) en un
mismo tiempo, para poder realiazar la codicacin y decodicacin. El intervalo entre
paquetes tiene un efecto directo sobre la sobrecarga. Cuanto mayor es ste, menor ser
la sobrecarga requerida para transmitir los datos de audio, y viceversa. Pero por contra,
el aumento del mismo provoca un aumento directo de la latencia o retraso de los datos,
es decir, la diferencia de tiempo entre el momento en el que el sonido fue originado hasta
que ste fue codicado, transportado, decodicado y reproducido en el extremo receptor,
ser mayor. Ya que un paquete IP no ser transmitido hasta que ste sea totalmente
construido, una trama de audio no podr viajar a travs de la red hasta que ste est
totalmente codicado. Esta latencia afecta negativamente a la calidad de la llamada,
percibida en el receptor.

Pero la latencia no es el nico inconveniente que se deriva de tener un intervalo entre


paquetes grandes: cuanto mayor sea la duracin de sonido transportada por cada paquete, mayor ser la porbabilidad de que el extremo receptor note un efecto negativo en el
sonido si un paquete es perdido debido a una congestin u error de la red. La prdida de
un paquete que transporta 20ms de audio es apenas imperceptible con el codec G.711,
pero no as la prdida de 60 ms de audio, que puede ser bastante molesto. El principal
motivo por el que el sonido es transmitido bajo datagramas UDP, es porque ofrece un
servicion no able y no orientado a conexin, de tal forma que aquellos paquetes perdido
no sern retransmitidos. El hecho de implementar el protocolo de VoIP sobre el TCP,
implicara que todos los paquetes que se notiquen como perdidos seran retrasmitidos.
Este efecto hara que los paquetes en el extremo receptor llegasen completamente fuera
de secuencia, con la consecuente perdidad de calidad que esto conlleva.

Si se considera un muestreo de 8khz para una seal de audio bsica con 8 bits por muestra, y se asume un intervalo entre paquetes de 20ms, puede verse que la cantidad de datos
de audio, utilizando el codec G.711, transportada es de 1.280 bits. Si a estos se le aade

24

3 LA VoIP.

los bit de cabecera introducidos por cada protocolo que encapsula el mensaje, resulta
1.904 por trama, suponiendo que se utiliza ethernet como tecnologa de transimisin.

Figure 3.2: Trama de voz sobre tecnologa Ethernet.

3.3.6.

SISTEMAS DE TRANSIMISIN DTX/VAD/CNG.

Adems de la conversin analgico-digital, el codec intenta comprimir lo mximo posible


la informacin a transmitir, para que as los requerimientos de ancho de banda necesarios
para llevar a cabo la comunicacin sean los menores posibles.

Una forma importante de reducir ancho banda, adems del que se consigue al comprimir
la seal, es el uso del sistema DTX / VAD / CNG. Se trata de un sisitema de transmisin
discuntnua ( Discontinous Transmision, DTX), que se emplea conjuntamente con un
detector vocal ( Vocal Activity Detector, VAD) y un generador de ruido de fondo (
Confort Noise Generator, CNG). Dicho sistema consiste en no enviar paquetes de datos
durante los silencios de las conversaciones. En estos silencios, aunque no se hable, seguir
habiendo ruido de fondo, por lo que ser necesario transmitir algn tipo de informacin
que sirva para reproducir el ruido de fondo en el receptor y no perder as la naturaleza

25

3 LA VoIP.

de la conversacin. Este tipo de tramas con informacin para el ruido se conocen como
tramas SID ( Silence Insertion Descriptor) y son de poco tamao comparadas con las
tramas de datos. El elemento del codec encargado de generar el ruido de fondo a partir
de la informacin de las tramas SID, es el generador de ruido de fondo ( CNG).
Utilizando el sistema de transmisin discontnua se ahorra mucho ancho de banda. Este
algoritmo DTX, tambin es menos sensible a los errores de transmisin que en un sistema
en el que se enviaran las tramas activas de datos constntemente, ya que si se pierden
tramas tramas SID, se cogen los parmetros de las anteriores para generar el ruido
actual, de manera que afecte poco esa prdida. En el caso en que se pierda la primera
trama SID de un tramo de silencio, durante la fases de habla se van estimando tambin
dichos parmetros para su posterior reproducin.
Para que este sistema funcione es fundamental el buen funcionamiento de los detectores
de actividad vocal. Estos analizan intervalos de conversacin de una determinada duracin y concluyen si en este fragmento analizado ha habido voz ( tramo de "active voice"),
o no ( tramo de "inactive voice"). En los tramos de voz activa se envia informacin til,
y en los tramos de voz inactiva, se mandan tramas SID, para que el decodicador pueda
generar un ruido de fondo adecuado, o , incluso, no se enva nada. Las tramas SID slo
se envian si el ruido ha cambiado desde la ltima trama transmitida.
Para determinar si estamos ante un tramo de voz inactica o activa, los VAD's se basan
en diferentes medidas, tales como:

Los coecientes del ltro LP de esa trama de voz.

La energia de la banda de frecuencias completa.

La energa de la banda de frecuencias que va desde 0 hasta 1 khz.

La tasa de cruces por cero de la seal de voz.

3.4.

EL ESTANDAR VoIP.

Este apartado describe los estndares de sealizacin de llamadas en una red de VoIP.
Tambin se describe la forma en la que estos estndares compiten y se complementan.

26

3 LA VoIP.

3.4.1.

PROTOCOLOS DE SEALIZACIN DE VoIP.

Un protocolo se sealizacin es un lenguaje comn hablado por telfonos, servidores


de administracin de llamadas (por ejemplo, centrales telefnicas implementadas via
software), PBX tradicionales y por cualquier otro elemento que pueda interferir en una
comunicacin telefnica, a travs del cual pueden comunicarse para establecer, negociar
y nalizar llamadas.
La tecnologa de voz sobre IP, provee una familia de protocolos de sealizacin. La mayor
parte de los protocolos de sealizacin tienen en comn una serie caractersticas:

Sus propsitos son sealizar, registrar y facilitar los eventos claves de una llamada:
el comienzo, el nal de llamada y cundo los usuarios estn intentando usar una
serie de servicios de telefona como transferencia de llamada o conferencia.

Aunque las llamadas de sealizacin suelen establecerse usando UDP como protocolo de transporte, no son vistas como trco en tiempo real, como ocurre con la
transmisin de los datos de voz.

El patrn de trco que sigue la sealizacin cuando sta es transmitida por la red,
suele ser de poca duracin y a rfagas, en oposicin al trco de voz que tiende a
ser consistente y de larga duracin.

La mayora de estos protocolos de sealizacin no suelen estar implementados


simultneamente en un mismo dispositivo IP.

Actualmente, existen dos importantes protocolos de sealizacin en el mundo de la telefona IP: el Protocolo de Inicio de Sesin (SIP), desarrollado por el IETF ( Internet
Engeneering Task Force); y H.323, desarrollado por la ITU-T. Existen otra serie de protocolos de sealizacin, desarrollado por compaias privadas, como pueden ser: SCCP,
desarrollado por Cisco Company, o IAX, propiedad de la empresa Digium.
Entre todos los estndar de sealizacin que existen, aquellos que han sido elaborados
por organismos pblicos, como son SIP y H.323, nos aportarn una mayor exibilidad
y extensibilidad, ya que se encuentran bajo libre disposicin, distribucin y modicacin para toda la comunidad de Internet. Entre estos dos principales standares existen

27

3 LA VoIP.

sustanciales diferencias, en cuanto a los distintos tipos de caminos por donde pueden
establecer las llamadas telefnicas. H.323, hace posible establecer una comunicacin entre central de conmutacin y central de conmutacin, entre la RTC y una central de
conmutacin, y entre terminales y centrales de conmutacin. Esto signica que H.323
posee una interfaz que le permite establecer una llamada con los sistemas de telefona
tradicionales, especialmente con la RTC. Comparativamente, SIP es mucho ms limitado
en cuanto a su alcance dentro de la red. ste no soporta la comunicacin con ningn
terminal tradicional, sea analgico o digital. Fue diseado para permitir una comunicacin entre terminales IP. Sin embargo, una gran ventaja de SIP es su exibilidad para
soportar aplicaciones de caracter no telefnico, tales como mensajera instantnea, video conferencias, etc. Dicha propiedad es la principal caracterstica de SIP y la mayor
carencia de H.323.

Familia de protocolos

Escenarios de sealizacion

Mantenedor

H.323

Telefona y video.

ITU-T

SIP

Telefona, video y mensajeria instantnea.

IETF

IAX

Telefona.

Digium Inc.

SCCP

Telefona( conmutadores<>terminales)

Cisco System

MEGACO/H.248

Telefona(control de gateway's)

ITU-T

MGCP

Telefona(control de gateway's)

IETF

3.4.2.

EL PROTOCOLO H.323.

H.323, actualmente en su versin 2, es una recomendacin de la ITU-T para un estilo


de sealizacin basada en PBX que soporta transmicin sobre redes de conmutacin de
paquetes. H.323 no tiene que ser entregado completamente usando una red IP. Ciertas
subrecomendaciones de H.323 permiten a las redes de telefona tradicional ser integradas, por medio de la sealizacin, con todos los dispositivos que intervienen en una
comunicacin. Por ejemplo, H.323 permite la sealizacin sobre las lneas de telfonos
tradicionales de la RTC, a travs de las recomendaciones H.320 y H.324.

Mientras que el estndar H.323 se encuentra en un estado bastante maduro y bien documentado por la ITU-T, ste ha sido implementado en partes especcas por cada
fabricante que no son, desafortunadamente, totalmente interoperables. Esta incompatibilidad de las implementaciones de H.323 es un problema cuando se pretende enlazar

28

3 LA VoIP.

sistemas de distintos fabricantes. Para conseguir este objetivo, se hace uso de dispositivos trandicionales, tales como E1, como elemento intermediador, ya que la mayora de
las implementaciones de los protocolos de telefona tradicional de cada fabricante son,
casi siempre, compatibles entre s.

Los paquetes de mensajes H.323 son compactos, y la sealizacin H.323 es muy rpida,
especialmente comparada con SIP, el cual usa mensajes ms largos y basados en texto
plano. El diseo de H.323 est basado en los fundamentos del diseo de la Red Telefnica
Conmutada: brevedad y disponibilidad. La red es usada tan poco como sea posible para
transportar la sealizacin de la llamada, y tanto como sea posible para transporta el
sonido.

3.4.2.1.

3.4.2.1.1.

ARQUITECTURA .

GATEKEEPER H.323.

El gatekeeper es un equipo de la red que provee monitorizacin, centralizada de llamadas y capacidades de sealizacn hacia terminales H.323. El alcance de un gatekeeper
puede ser un segmento particular de una LAN o , incluso, todo un continente.

Al alcance de red dentro del cual un gatekeeper opera se le denomina "zona". Puede
haber slo un gatekeeper por zona y una zona por gatekeeper. Es normal referirse a un
gatekeeper H.323 como una central software de conmutacin, una softPBX.

Tanto los terminales H.323 como los gateways, para que puedan ser accesibles a las
aplicaciones de telefona, deben llevar a cabo un proceso de registro ante el gatekeeper.
Esto quiere decir que cada terminal H.323 debe informar al gatekeeper de cules son
sus caractersticas nicas que lo identican: nmero de telefno, direccin IP, etc. Este
proceso puede ser autenticado si se desea.

En la conguracin de cada terminal hay que indicar la direccin IP o el nombre de


dominio del gatekeeper de la zona a la que pertenezca el terminal. Tambin existe la
posibilidad de descubrir la precencia de un gatekeeper usando un IP multicast a la
direccin y puerto: 224.0.1.41:1718.

El proceso de registro es llevado a cabo mediante el protocolo RAS: Resgistration, Admission y Status. Este protocolo slo govierna el proceso de registro y no el establecimiento

29

3 LA VoIP.

de llamadas. Sin la presencia de un gatekeeper en una red H.323 no se podra establecer mucho ms que canales dedicados con otro terminal, se perderan, entre otras, las
funciones de rutaje de mensajes.

De acuerdo a las recomendaciones de la ITU-T, un gatekeeper debe proveer:

Resolucin de direcciones via un estndar llamado E.164.

Registro y autenticacin.

Control de ancho de banda.

Zona de administracin de registro y llamada.

Sealizacin de las llamadas de control.

Monitorizacin de las llamadas.

El proceso que sigue un terminal H.323 cuando se registra, es el siguiente:

1. El terminal enva un mensaje RRQ ( Registration Request) al gatekeeper, que


consiste en la direccin IP y puerto del terminal, su direccin E.164 y un alias
para ser usado como identicador cuando ste efectue una llamada.

2. El gatekeeper guarda toda la informacin proveida por el terminal en memoria,


para posterior uso cuando autentique al terminal, junto con un hash, que es
usado para asegurar la identidad del terminal, evitando posibles suplantaciones de
identidad.

3. El gatekeeper responde al terminal con un mensaje RCF ( Registration Request


Conrm), indicando que est listo para realizar y recibir llamadas en la red.

30

3 LA VoIP.

3.4.2.1.2.

TERMINALES H.323.

Cada terminal H.323, ya ste implementado en software o hardware, contiene una pila
de elementos software que le permiten cubrir diferentes aspectos del proceso de llamada:

H.245, el cual le provee de capacidades de negociacin, que le permiten estar seguro


de saber si existe en ambos extremos de la comunicacin una aplicacin y codecs
compatibles.

H.225, el cual le provee servicios de taricacin y monitorizacin necesarios para


el establecimiento able de llamadas y contabilidad de las mismas.

RTP, el estndar del IETF para la transmisin de datos mulitmedia en tiempo


real.

Seleccin de uno o ms codecs de audio.

Opcionalmente, un terminal H.323 puede ofrecer T.120, un protocolo para habilitar


aplicaciones interactivas.

3.4.2.1.3.

GATEWAY H.323.

El propsito de un gateway es hacer de interfaz entre los canales de voz basados en IP


y las tecnologa tradicionales de sealizacin y transportes tales como FXO, FXS, RDSI,
E1, etc. Este elemento es requerido slamente cuando se pretende hacer interoperar la
red de VoIP con una red de telefona tradicional.
Un gateway H.323 ofrece una convergencia especializada de los protocolos de sealizacin
que soportan ciertos tipos de circuitos tradicionales:

H.320 soporta paquetizacin de la voz sobre circuitos RDSI y E1.

H.324 soporta paquetizacin de la voz sobre lneas de telfono analgicas usando


el codec G.711.

Los gateways tambin deben registrarse con el gatekeeper para la zona en la que ellos
sirven, si las llamadas van a ser rutadas a travs de sus interfaces.

31

3 LA VoIP.

3.4.2.1.4.

UNIDAD DE CONTROL MULTIPUNTO.

Una MCU, es un dispositivo H.323 que tiene un nico propsito: poder establecer una
multiconferencia entre tres o ms canales de voz. sta puede ser implementada en un
servidor dedicado, o bien, ser integrada como parte de un terminal H.323.

Una MCU est formada por dos componentes fundamentales: MP (mulipoint processing)
y MC (multipoint controller). La primera de ellas, es el elemento software dentro de
la MCU encargado de llevar a cabo las accciones de un DSP, para agregar canales
multimedia a una multiconferencia. El controlador multipunto o MC, es el encargado
de gestionar las negociaciones H.245 entre todos los terminales para determinar las
capacidades comunes para el procesado de audio y datos. Tambin controla los recursos
de la conferencia para determinar cules de los ujos, si hay alguno, sern multipunto
(multicast). Las capacidades son enviadas por el MC hacia todos los extremos de la
conferencia, indicando los modos en los que pueden transmitir.

3.4.2.2.

TORRE DE PROTOCOLOS .

H.323, es recomendacin que impone los protocolos a utilizar para la comunicacin.

Figure 3.3: Torre de protocolos H.323

32

3 LA VoIP.

Algunos protocolos, como RTP ( Real Time Protocolo) y RTCP (Real Time Control
Protocol), ya existan cuando se deni la recomendacin y fueron reutilizados directamente. Otros, como H.225.0 y H.245, derivarn del ITU-T H.320, H.221 y H.242, y
algunos otros, como el protocolo RAS, fue diseado especcamente para H.323.
Como se describe ms adelante, cada protocolo o conjunto de ellos en H.323 tiene como
objetivo ofrecer un servicio a las capas superiores:

Direccionamiento.
RAS: protocolo utilizado para la bsqueda de un gatekeeper por parte de un terminal, para establecer un registro en la zona que ste controla.

Sealizacin:
H.225.0: protocolo que describe cmo el audio, los datos y la informacin de control, en una red de conmutacin de paquetes, pueden ser usados para proporcionar
servicios telefnicos. Se encarga de la sealizacin de las llamadas. Los mensajes
H.225.0 siguen el estndar Q.931 y son del tipo: mensaje de establecimiento de llamadas, mensajes de informacin de la fase de la llamada, mensajes de terminacin
de la llamada y otros.
H.245: protocolo de control para especicar mensajes de apertura y cierre de cnales lgicos para comunicaciones de voz, para realizar las negociaciones de los
parmetros y establecer conexiones UDP.
Los mensajes siguen la sintaxis ASN.1. Consisten en un intercambio de mensajes
que pueden ser del tipo: peticiones, respuestas, comandos y mensajes de indicacin.

Informacin de audio:
Todos los terminales deben soportar el codec G.711. Tambin pueden utilizarse
cualquiera de los codecs G.7xx estandarizados por la ITU-T.

Informacin de vdeo:
En el caso que los terminales H.323 soporten vdeo llamada o vdeo conferencia,
sern utilizados los protocolos H.261 y H.263, que dene la manera de transportar
ujos de videos utilizando RTP.

33

3 LA VoIP.

Envio de datos entre terminales H.323.


Funcionaliadad opcional, que en el que caso de que sea soportada ser implementada por los protocolos de la familia T.12x.

Transporte de los paquetes:


UDP: la transimicin de los paquetes de datos en VoIP se suele realizar sobre
paquetes UDP, que aunque no ofrezca integridad a los datos, el aprovechamiento
del ancho de banda es mayor que con TCP.
RTC: protocolo que proporciona funciones de transporte convenientes para aplicaciones que transmiten en tiempo real. Maneja los aspectos relativos a la temporizacin, marcando los paquetes UDP para un reordenamiento de los mismo en el
receptor.

Control de la transmisin:
RTCP: protocolo de control de RTP. Se utiliza principalmente para detectar situaciones de congestin en la red y tomar acciones correctoras. Se basa en la
transmisin peridica de paquetes de control a todos los participantes en la sesin,
usando el mismo mecanismo de distribucin que los paquetes de datos.

Servicios suplementarios.
A travs de los protocolos de la familia H.450.x se ofrence servicios tales como:
llamada en espera, intrusin de la llamada, etc.

3.4.2.2.1.

INTERCAMBIO DE MENSAJES DURANTE EL PROCESO DE

SEALIZACIN.
Hay cinco pasos generales, a seguir por cada extremo de la llamada, para llevar a
cabo el proceso de sealizacin de la misma: establecimiento/nalizacin, negociacin de
capacidades, establecer canales de audio y/o video, llevar a cabo la llamada y liberacin
de la llamada.

1. Establecimiento/nalizacin:

34

3 LA VoIP.

Para iniciar una llamada se hace uso del protocolo H.225. Durante este paso, cada
terminal involucrado en la llamada es puesto al da del estado en que se encuentra
la llamada, a travs de uno de los posibles estados que dene H.225:

En proceso: esto signica que el terminal de origen est intentando establecer


una conexin de red con el terminal de destino.

Alerta: esto signica que el extremo receptor est siendo noticado de que
alguin est intentando alcanzarle. En otras palabras, que el extremo receptor
est sonando, y que el terminal que origin la llamada est recibiendo una
indicacin de ello.

Conectar: esto signica que el receptor ha aceptado la llamada y que un canal


de audio/video puede ser establecido.

Liberar: esto signica que uno de los extremos de la llamada ha sealizado


en nal de la misma. Cuando este estado es indicado, la llamada pasa a ser
nalizada.

2. Negociacin de capacidades

Despus de establecer la llamada, se hace uso del protocolo H.245 para negociar
los requerimientos de aplicacin de la llamada y seleccionar el codec apropiado.
H.245 determina:

Qu tipo de apliacacin multimedia puede cada terminal soportar: audio,


video u otras.

Cules son los codecs disponibles para cada terminal y cules son sus preferencias.

Cmo los canales sern estructurados y qu tipo de intervalo ser usado.

Qu terminal jugar el papel de maestro y cul de esclavo durante la duracin


de la llamada. Los papeles de maestro y esclavo hacen referencia a quin
actuar como cliente o servidor en el proceso de envio de seales durante la
llamada, se trata exclusivamente de una formalidad del protocolo.

35

3 LA VoIP.

Cmo debe noticarse al terminal que inici la llamada si la negociacin falla.


Normalmente, el terminal mostrar un mensaje de error mientras suena una
seal de ocupado.

3. Establecer canales de audio/video.


Una vez que se ha llevado a cabo la negociacin de capacidades, RTCP ( RTP
Control Protocol) es utilizado para establecer un canal UDP donde tendr lugar
la transmisin de audio/video. Tras abrir el canal UDP, un ujo de paquetes UDP,
que encapsulan al protocolo RTP, atravesar a la red usando el codec e intervalo
entre paquetes negociados anteriormente.

4. Llevar a cabo la llamada.


Una vez que la llamada est en progreso, RTCP, que se ejecuta junto a RTP en
puertos UDP consecutivos, puede guardar ventanas del canal de comunicacin, que
permanecern intactas hasta el n de la llamada.

5. Liberacin
Al nalizar la llamada, H.225 entra en su estado de liberacin, sealizando el
nal a los canales multimedia, a la sesin H.245 de negociacin de capacidades
y al proceso de taricacin llevado a cabo por el gatekeeper. Dependiendo de los
terminales, ambos podrn oir un tono o una seal de ocupado.

Figure 3.4: Sealizacin directa, sin Gatekeeer.

36

3 LA VoIP.

En la anterior gura puede verse el proceso de sealizacin que tiene lugar cuando un
terminal H.323 intenta establecer una llamada con otro terminal via un gatekeeper:

1. El llamante enva un mensaje de peticin de admisin, ARQ, al gatekeeper de su


zona, identicndose a s mismo y a la direccin E.164 del terminal con el que
quiere establecer la llamada. Este mensaje es parte del protocolo RAS.

2. El gatekeeper contesta con una conrmacin ARQ (ACF). Esto conrma al llamante que la peticin de sesin ha sido recibida por el gatekeeper.

3. El llamante enva un mensaje de establecimiento de llamada al otro extremo de la


llamada.

4. El receptor enva un mensaje provisional H.225 "Call Proceeding". Se trata de un


mensaje provisional porque el receptor debe vericar la autenticidad del llamante
antes de proseguir con la llamada.

5. El receptor enva un mensaje "Called Party ARQ Adminsion Request" al gatekeeper, preguntndole si la llamada es legtima. En este punto, el gatekeeper debera
tener una copia de la peticin de registro del llamante para validar la llamada.

6. Si el gatekeeper tiene una copia de este registro, devuelve el mensaje "Called Party
ACF" al receptor, dando paso a que el receptor comienze a sonar.

7. El receptor, una vez que comienza a sonar, enva en mensaje H.225 "Alerting",
indicando al extremo que origin la llamada que el receptor est sonando.

8. Una vez que el receptor conteste a la llamada, ste enva un mensaje H.225 "Connect" al otro extremo de la comunicacin. Esto deja paso a que el proceso H.245,
de negociacin de capacidades, comienze.

La diferencia entre sealizacin basada en gatekeeper y sealizacin directa entre terminales, es el papel que juega ste en las sesiones H.225, sin inuir en el camino que
seguirn los datos multimedia a travs de la red.

37

3 LA VoIP.

Figure 3.5: Sealizacin a travs gatekeeper.

3.4.2.3.

ESQUEMA DE DIRECCIONES E.164 .

E.164 es una convencin para asignar nmeros de telfonos a terminales en una red de
VoIP. E.164, permite a los terminales de una red de VoIP registrar dinmicamente sus
nmeros de direcciones E.164 desde una lista de nmeros almacenados en una base de
datos en el gatekeeper.

Esta base de datos es una lista de direcciones MAC Ethernet, cada una de las cuales
corresponden a una o ms direcciones E.164. De esta forma se controla que terminal va
a usar un determinado nmero, permitindo as una fcil movilidad de los terminales en
la red: no importar a qu lugar vaya el terminal H.323, su direccin E.164 siempre ser
la misma.

Pero exiten una serie de incovenientes usando direcciones MAC como enlaces hacia una
direccin E.164: dicultad a la hora de memorizarlas e imposibilidad de cambiar su valor.
Existen mejores formas de manejar la asignacin de alias a los terminales H.323, ya que
basarse en este mtodo, es intrnsicamente basarse en la tecnologa Ethernet. Esto es
unos de los grandes inconvenientes de H.323 en comparacin a SIP.

38

3 LA VoIP.

3.4.3.

EL PROTOCOLO SIP.

El Protocolo de Inicio de Sesin, fue desarrollado por el IETF, como una forma de
sealizacin multiusuario de telefona distribuida y de aplicaciones de mensajerias en
una red IP.

Los deberes y escenarios de SIP son los mismos que los de H.323. Es decir, hay terminales
de VoIP de distintas capacidades y servidores que participan en el proceso de sealizacin
y establecen polticas para la red de VoIP. Sin embargo, SIP es ms exible que H.323,
puede considerarse ms que un conjunto de protocolos de telefona para audio y video. Se
trata entorno de trabajo para todos los tipos de aplicaciones basadas en el intercambio de
mensajes, desde aplicaciones de telefona hasta mensajera instantnea u otros servicios.

SIP, en vez de usar una estructura de mensajes compacta y orientada a la mquina,


como H.323, usa cabeceras de gran longitud y codicadas en texto plano, como es el
caso de SMTP o HTTP, lo que permite, de forma ms cmoda, la solucin de problemas
y una mayor aceptacin.

SIP, se encuentra acutalmente en su versin 2.0 y su denicin completa se encuentra


recogida en las RFC's 3261-3265. El propsito denido de SIP es coordinar y facilitar
la monitorizacin de sesiones multimedia en la red. ste soporta una variedad de esquemas de direccionamiento y es diseado tanto para una topologa centralizada como
distribuida.

39

3 LA VoIP.

Figure 3.6: Torre de protocolos SIP.

3.4.3.1.

ARQUITECTURA.

SIP sigue el modelo cliente/servidor. En el entorno SIP, tanto servidores como los puntos
nales de una comunicacin, son llamados "nodos". Un telefno SIP, es un nodo, y como
cada nodo, puede comunicarse directamente con cualquier otro para, de esta forma,
poder establecer sesiones multimedias, tal y como los terminales H.323 pueden establecer
canales directos entre ellos. Pero la conguracin ms usual es usar servidores SIP, a los
cuales el resto de los telfonos SIP debern noticar su presencian, es decir, debern
registrarse, una vez que empiecen a funcionar.
Los elementos funcionales en la arquitectura SIP son:

1. Agentes de Usuario ( User Agent, AU).

2. Servidores de red.

Los agentes de usuario son aplicaciones que residen en los nodos terminales SIP, y contienen dos componentes: Agentes de Usuario Clientes ( User Agent Client, UAC) y Agentes

40

3 LA VoIP.

de Usuario Servidores ( User Agent Server, UAS). Los UAC originan las peticiones SIP
, y los UAS responden a estas peticiones, es decir, originan respuestas SIP asociadas al
extremo que recibe la llamada. Los UA's deben implementar el transporte tanto sobre
TCP como UDP.

Los UA's y UAS's pueden establecer, por s solos, una comunicacin. No obstante, la
potencialidad de SIP se aprovecha con el empleo de los servidores de red. Los servidores
de red, se clasican desde el punto de vista logico, de la siguiente manera:

Servidores de redireccin.

Servidores Proxy.

Servidores de Registro.

3.4.3.1.1.

SERVIDORES DE REDIRECCIN.

Se encargan de procesar mensajes INVITE, que son solicitudes SIP emitidas por la
parte que origina la llamada, y retornan la direccin , o direcciones, de la parte llamada,
es decir la URL de la parte llamada, o cmo contactar con ella. En caso contrario,
rechazan la llamada enviando una respuesta de error. Anlogamente a H.323, juegan el
papel de gatekeeper.

Cuando un servidor SIP responde a la solicitud INVITE, enviada por la parte que origina
la llamada, con una respuesta 3xx, el servidor SIP est redireccionando a dicha parte
hacia otro servidor SIP. Posteriormente, el nodo SIP debe contactar con el nuevo servidor
SIP a travs de otra solicitud SIP. Esta caracterstica no est implementada en todos
los sistemas que soportan SIP, y suele ser propia de entornos extensos que operan bajo
redes exclusivamente SIP.

3.4.3.1.2.

SERVIDORES PROXY.

Ejecutan un programa intermediario que acta como servidor y cliente: desde al punto
de vista del llamante se comporta como un servidor y desde el punto de vista del receptor
como un cliente. Un servidor proxy puede reenviar solicitudes hasta el destino nal sin
efectuar cambio alguno en ellas, o cambiar alguna parmetro si se requiere.

41

3 LA VoIP.

Los servidores proxy desarrollan el rutaje de los mensajes de solicitudes y respuestas


SIP, y pueden ser del tipo "stateful" o "stateless".

Los servidores proxy statefull retienen informacin dela llamada durante el proceso que
dure el establecimiento de sta, no as los servidores stateless, que procesan un mensaje
SIP y entonces olvidan todo lo referente a la llamada hasta que vuelvan a recibir otro
mensaje asociado a la misma. Las implementaciones stateless proveen buena escalabilidad, pues los servidores no requieren mantener informacin referente al estado de la
llamada una vez que la transaccin ha sido procesada. Adems, esta relacin es muy
rubusta, dado que el servicio no necesita recordar nada en relacin a la llamada. Sin
embargo, no todas las funcionalidades pueden ser implementadas por un servidor stateless, algunas como: contabilizacin, taricacin de llamadas,etc, pueden requerir que se
le sigua el rastro a todos los mensajes y estado de una comunicacin.

3.4.3.1.3.

SERVIDORES DE REGISTRO.

Se encargan de registrar las direcciones SIP, formato URL, y sus direcciones IP asociadas. Es decir, se encargan de mappear direcciones SIP en direcciones IP, y tpicamente
se encuentran implementados junto con los servidores proxy o servidores de redireccin.

Tambin se les denominan servidores de localizacin ( Location Server), pues son utilizados por los servidores proxy y de redireccin para obtener informacin de la localizacin
de la parte llamada. Realmente los servidores de localizacin, no son entidades propias
del sistema SIP, sino ms bien, base de datos que pueden formar parte de arquitecturas
que utilicen SIP. Entre stos y cualquier servidor SIP, sea proxy o de redireccin, no se
utiliza el protocolo SIP, sino protolos tpicos de bases de datos o servicios de directorio,
como por ejemplo LDAP.

La informacin registrada en los servidores de registros, no es permanente, sino que


requiere ser refrescada peridicamente, de lo contrario el registro correspondiente ser
borrado.

Usualmente, un servidor SIP implementa una combinacin de los diferentes tipos de


servidores SIP ya comentados.

42

3 LA VoIP.

Figure 3.7: Escenario SIP.

3.4.3.2.

DIRECCIONAMIENTO SIP: SIP-URI.

Los nodos SIP son referenciado usando URI ( Uniform Resources Indicator), con la
siguiente estructura
sip:usuario@servidor_sip
Esta convencin indica tanto el usuario al que quiere alcanzarse como el servidor SIP ,
que se espera que conozca la direccin SIP del usuario nal. Aquellas coneccines que
requieren una encriptacin para la sealizacin usaran el prejo "sips", en lugar de "sip"
en la descripcin de sus URI's. La encriptacin de dichas seales har uso de la capa de
transporte seguro (SSL).

3.4.3.3.

MTODOS SIP Y RESPUESTAS.

Los mensajes de sealizacin SIP, solicitudes y respuestas, emplean el formato de mensaje


genrico establecido en la RFC 822, esto es:

43

3 LA VoIP.

Una lnea de inicio.


Uno o ms campos de cabeceras (header).
Una lnea vaca indicando el nal del campo cabeceras.
Cuerpo del mensaje.

Figure 3.8: Formato de un mensaje SIP.

Mientras que H.323 usa la sintaxis ASN.1 para la descripcin del formato de los mensajes,
SIP se basa en texto plano.
Las solicitudes SIP se clasican dentro de diez categoras, llamadas mtodos. Cada mtodo lleva a cabo una funcin diferente dentro de la arquitectura SIP:

1. INVITE: este mtodo es usado para establecer sesiones y anunciar las capacidades
de los nodos SIP.
2. ACK: es usado para conrmar que el cliente solicitante ha recibido una respuesta
nal desde un servidor a una solicitud INVITE, reconociendo la respuesta como
armativa.
3. OPTIONS: es usado para preguntar a un nodo SIP por sus capacidades, sin que
ningn canal multimedia haya sido establecido an.
4. BYE: este mtodo ocurre cuando la llamada es completada, es decir, cuando alguna
de los extremos involucrados en la comuniacacin desea nalizar la llamada.
5. CANCEL: cancela una solicitud pendiente, pero no afecta a una solicitud ya completada. Este mtodo naliza una solicitud de llamada incompleta.

44

3 LA VoIP.

6. REGISTER: notica al servidor SIP en qu terminal SIP un usuario puede ser


alcanzado.
7. INFO: es usado para trnasmitir seales de aplicacin de telefona a travs del canal
usado por la sealizacin SIP. Tales seales pueden ser dgitos marcados, etc.
8. PRACK: este mtodo es usado en lugar de ACK para noticar al otro extremo
que se est estableciendo una llamada.
9. SUBSCRIBE: este mtodo provee una forma de establecer manejadores de eventos
dentro de aplicaciones de telefona SIP.
10. NOTIFY: este mtodo entrega mensajes entre estremos SIP, tales como eventos
ocurridos durante la llamada.

Cuando una llamada debe ser establecida, nalizada o alterada, un evento SIP es empleado. Los eventos precedentes son similares en concepto a los mtodos de HTTP:
GET y POST; y como en HTTP, SIP espera cdigos de respuestas cuando un mtodo
es enviado. Los cdigos de respuestas SIP son clasicados en seis categorias:

1xx: informativo. Solicitud recibida, se continua para procesar la solicitud.


2xx:solicitud exitosa. La solicitud fue recibida de forma adecuada, procesada y
aceptada.
3xx: re-direccionamiento. Ms acciones deben ser consideradas para completar la
solicitud.
4xx: error del cliente. La solicitud contiene mal la sintaxis o no puede ser resuelta
en este servidor.
5xx: error de servidor. El servidor no ha podido resolver una solicitud aparentemente vlida.
6xx: fallo global. La solicitud no puede ser resuelta en servidor alguno.

Los mensajes 1xx, son respuestas provisionales y no terminan la transaccin SIP, a


diferencia de lo que ocurre en el resto de las categorias.

45

3 LA VoIP.

Figure 3.9: Intercambio de mensajes SIP.

3.4.4.

EL PROTOCOLO IAX.

IAX, Inter-Asterisk Exchange Protocol, actualmente en su segunda versin, es un protocolo de sealizacin para redes VoIP, tal y como ocurre con H.323 y SIP. La principal
diferencia con estos ltimos es que IAX no implementa RTP como mecanismo de paquetezacin, sino que ste tiene su propia forma de empaquetar los datos de voz codicada.
IAX es un protocolo a prueba de NAT, donde cientos de llamadas simultneas origindas desde detrs de un rewall con enmascaramiento funcionarn correctamente, como
ocurre con HTTP.
IAX es implementado de forma ms simple y menos exhaustiva que SIP o H.323. A
diferencia de estos ltimos, que son ms extensibles, IAX va dirigido exclusivamente a
aplicaciones de telefona.
Mientras que un ciclo completo de registro, sealizacin de llamada, transmisin de
voz y nalizacin, puede usar varios puertos TCP y UDP, en el caso de SIP o H.323, el
protocolo IAX maneja todas estas funciones usando un nico puerto UDP. Tanto cuando
el cliente IAX, terminal, se registra con el servidor o proxy IAX, as como cuando una
llamada es establecida o se trasnmite tramas de voz, se utiliza el mismo puerto UDP.
La forma que IAX utiliza para distinguir las distintas funcionalidades llevadas a cabo

46

3 LA VoIP.

durante la llamada, es la inclusin de cabeceras y meta-datos en cada paquete, que


denen cul es el propsito de ste y si lleva datos adjuntos.
La documentacin del protocolo IAX describe el orden de estas cabeceras y los metadatos, tales como tramas de control, meta-tramas y elementos de informacin, cada uno
de los cuales tiene su propia sintaxis. IAX no est codicado usando ASCII, ni ASN.1,
en vez de esto, usa un esquema propietario de codicado binario ms orientado a la
interfaz mquina-mquina.
Al contrario que ocurre con H.323 y SIP, IAX no es una recomendacin estndar, sino
ms bien un protocolo independiente creado por Mark Spencer. Aunque propietario, la
especicacin de IAX es abierta y ha sido aceptada por la comunidad VoIP.

Funciones/Caractersticas

SIP

47

H.323

IAX

3 LA VoIP.

Localizacin de terminales

Mtodo SIP

y admisin

REGISTER

Establecimiento y

Mtodo SIP INVITE

Protocolo RAS

Tramas de control
IAX REG

Protocolo H.225

liberacin de llamada

Tramas de control
IAX NEW y
HANGUP

Negociacin de capacidades,

Protocolo de

codecs y puertos para datos

Denicin de Sesin

Protocolo H.245

Informacin de

multimedias
Paquetizacin y transmisin

Meta-trama de

Capacidades IAX
Protocolos

de muestras de sonido

RTP/RTCP

Streaming de video y

Protocolo RTSP

audio grabado

Protocolos

Tramas IAX

RTP/RTCP

VOICE/DATA

Ninguno

Ninguno

recomendado

recomendado

Codicacin de trama

ASCII

ASN.1

Binario

Simulitud de mensajes

HTTP

RDSI/Q.931

Propietario

Rutaje de llamada descrito

Proxy

Gatekeeper-

Software PBX

como
Dipositivo de referencia

rutado
Registrar

Gatekeeper

Servidor

Redirect

Sealizacin

Sealizacin

directa

directa

Gateway H.323

Ninguna

para el rutaje de llamadas


Ruta de llamada
independiente
Interfaz RDSI

Ninguna
recomendada

Identicacin de terminales

SIP-URI, direccin

recomendada
Direccin E.164

de email, direccin

SIP-URI,
direccin de

E.164 o alias

email, direccin
E.164 o alias

Conexin a traves de
cortafuegos

Redireccin a travs
de Proxy/softPBX

Redireccin a

No se necesita

traves de Gate-

Proxy

keeper/SoftPBX
Puertos UDP

5060/5061

48

1503,1720,1731

5036

3 LA VoIP.

3.4.5.

LOS PROTOCOLOS MEGACO Y SIGTRAN

Estos dos protocolos surgieron con la aparicin, como consecuencia de la liberacin del
servicio telefnico, de escenarios que permiten el trnsito de llamadas entre terminales
telefnicos de la RTC, a travs de una red IP. En estos escenarios no exiten terminales
VoIP nativos conectados directamente a la red IP. La solucin se basa en el empleo de
pasarelas VoIP conectadas entre s a travs de una red dorsal IP, y localmente, a una o
ms centrales telefnicas.
Con objeto de que las pasarelas que proporcionan el inter-funcionamiento entre la red la
red telefnica y la red IP sean lo ms sencillas posibles, el proceso de llamada y el manejo
de la sealizacin se realizan en un servidor de llamadas (controlador de pasarelas). De
esta forma, las pasarelas slo tienen que encargarse del manipulado fsico de los ujos
de voz: codecs, empaquetado, control de jitter, cancelacin de ecos, etc.

Pasarela de medios (MG):

1. Conmutacin de ujos de voz, bajo las rdenes de su controlador.


2. Conversin de medios: codecs a usar, cancelacin de ecos, etc. Controlado por
el MGC
3. Deteccin de eventos bsicos: colgar, descolgar, marcacin de dgitos, etc.

Controlador de pasarelas (MGC):

1. Procesos de llamadas: encaminamiento, etc.


2. Controlar a las pasarelas de medios (MG): codecs a utilizar, establecer conexiones, etc
3. Recibir noticaciones de diversos eventos desde las pasarelas.

Esta arquitectura da lugar a dos protocolos, que deben coexistir:

1. MEGACO/H.248: protocolo del tipo cliente/servidor denido conjuntamente por


el IETF y la ITU-T, para el control remoto de las pasarelas de medios desde el
controlador de las mismas. Una MGC controlar a varios MC a travs del protocolo
H.248, y se comunicar con otras MGC a travs del protocolo SIP o H.323.

49

3 LA VoIP.

2. SIGTRAN: familia de protocolos del IETF que permite el transporte de la sealizacin telefnica sobre la red IP hasta el servidor de llamadas, MGC

Figure 3.10: Integracin de las redes RTC e IP.

50

S-ar putea să vă placă și