Documente Academic
Documente Profesional
Documente Cultură
caciones de voz en tiempo real a través de redes IP, inicialmente desarrolladas para el
transporte de datos. Las redes IP han evolucionado desde la transmisión de datos única-
mente, hasta realizar las funciones de una red tradicional de conmutación de circuitos.
La mayor parte de las redes de conmutación que existen en la actualidad serán rempla-
sólo una reducción de los costes, sino que proporcionará también el desarrollo de una
serie de nuevos servicios para voz y datos que no hubiesen sido posible con las redes de
En este apartado se describirán los elementos del estándar de VoIP, así como una des-
dominante del futuro, debido tanto a su reducido coste como a su exibilidad, será otro
3.1. INTRODUCCIÓN.
logía que permita hacer convivir en la misma red voz y datos. Esto obliga a establecer
un modelo o sistema que permita encapsular la voz para ser transmitida junto con los
Protocol) y a encontrar un método que nos permita la transmisión de voz sobre dicho
protocolo. Esto se consigue con el estándar VoIP (Voice Over Internet Protocol).
14
3 LA VoIP.
Dicho estándar, regula el transporte de los datos de voz a través de redes IP en forma
de paquetes de datos. El interés de transportar la voz por este tipo de redes, en lugar
de éstas últimas y a las ventajas aportadas por las redes de conmutación de paquetes:
3. Mantenimiento caro.
banda disponible.
3. Al no tener que reservar canales exclusivos para cada llamada, permite la reducción
integración de éstas con las redes de telefonía tradicional es un reto difícil y ,actualmente,
presentan ciertas limitaciones. Hay que tener en cuenta que los principios de diseño que
dieron lugar a la red de telefonía que actualmente conocemos, son casi los opuestos a los
que originaron la red IP. Mientras que IP proporciona un servicio de tipo "Best-Eort"
15
3 LA VoIP.
una aplicación especíca: la telefonía, y construyó una red adaptada a sus necesidades.
Internet, por otro lado, comenzó exactamente en el extremo opuesto: creó una nueva
tecnología de red y buscó, con éxito, aplicaciones que pudieran hacer uso del servicio
ofrecido.
IP cuenta con varias limitaciones, que se han hecho más evidente conforme la red au-
go, el tráco por la red no sólo ha cambiado en volumen, sino también ha cambiado en
Entre estas nuevas aplicaciones, la telefonía se destapa como una de las más exigentes.
de las aplicaciones más difíciles de satisfacer. A pesar de ser una aplicación multimedia,
sus requisitos de ancho de banda son muy escasos, apenas 8 Kbytes por segundo en cada
durante la comunicación.
tiempo real, los requisitos de temporización son mucho más restrictivos que los de capa-
incremento del ancho de banda es una primera solución para los problemas de latencia,
ancho de banda una vez que éste es añadido, de manera que esto no supone una salida.
Son imprescindibles nuevas medidas que aseguren cierta calidad del servicio prestado.
En los siguientes apartados se irán viendo los elementos necesarios utilizados por la
Este capítulo describe los pasos necesarios llevados a cabo para transmitir la voz a través
de redes IP, desde que ésta es capturada en el origen de la comunicación hasta que es
16
3 LA VoIP.
formato digital nal empleado por la tecnología de VoIP para su transmisión a traves
técnicas vienen impuestas según los diferentes tipos de enlaces de datos y dispositivos,
sión son usadas en circunstancias diferentes. No siempre las propiedades de los enlaces
de datos, tales como capacidad o latencia, son factores decisivos en la elección de estas
técnicas. Esta conversión de la señal a formato digital es llevada a cabo tanto en el mun-
DAC incluye digitalización de la voz, cuantización de la señal digital, ltrado para pre-
servar el ancho de banda y compresión de la señal para una mejor eciencia del ancho
de banda. La técnica de muestreo más común para convertir señales audibles a señales
digitales es la Modulación por Implusos Codicados (MIC), donde la señal analógica será
Para establecer una llamada telefónica, un teléfono tradicional, sea analógico o digital,
requirirá un enlace con suciente capacidad como para transportar un ujo de datos de
64 Kbps. Ésta es la velocidad jada para cualquier línea de teléfono tradicional. Tanto
sistemas de telefonía analógica como digital ofrecen una claridad del sonido similar, ya
que operan en el mismo rango de muestreo de la señal de voz: 8000 Hz. Esta frecuencia
64kbps.
17
3 LA VoIP.
digital como analógica, requirirá un ancho de banda de 64kps, es por ello que este valor
VOZ.
3.3.1. EMPAQUETADO
El empaquetado de la voz es el proceso, en tiempo real, por el cual un ujo de voz digi-
sobre la red.
18
3 LA VoIP.
recibida mediante terminales IP. Esto hace que la señal sea más manejable para ser
diferencia del sistema de telefonía digital RDSI, la señal de voz en una llamada a través
través de la red en unidades que también son usadas para transportar otros tipos de
3.3.2. MULTIPLEXACIÓN.
La red de telefonía tradicional (RTC) ofrece una forma de proveer una mayor capaci-
dad de llamadas que la que provee la linea telefónica tradicional. A través de una línea
compuesta por dos pares de hilos conductores, a diferencia de la línea tradicional, com-
puesta por un sólo par de hilos, puede transmitirse hasta 24 llamadas simultáneas. Esta
unir centrales telfónicas (PBX). La técnica usada para aprovechar mejor los recursos
proveen una mayor densidad de llamadas a través de un mismo medio. Por contra, la
adquisición de estos cirtcuitos tiende a ser bastante cara y es por ello que suelen em-
de datos, suelen ser usados por los proveedores de servicio a Internet (ISP) que necesitan
3.3.3. COMPRESIÓN.
VoIP provee una forma más económica de compartir el medio de transmisión. Para ello
emplea técnicas de compresión sobre las muestras de sonido usadas para representar la
voz en la red, de tal forma que una menor cantidad de enlaces físicos son requeridos
usados en una conversación telefónica tradicional, por debajo de los 44 kbps, sin llegar
algoritmos usados por VoIP para codicar los datos de sonido o para decrementar los
19
3 LA VoIP.
3.3.4. CODECS.
Los codecs, llamados así por la función que desempeñan tanto en el transmisor, como
algoritmos usados para empaquetar ujos de datos multimedia (voz y/o audio), que
transportados en tiempo real sobre la misma. Existen docenas de codecs para audio
y video, pero aqui sólo describiremos los que son más comunes en las redes VoIP.
La mayoría de estos codecs usados en redes VoIP son denidos por recomendaciones
Dentro del grupo de codec denidos por la ITU-T, pueden distinguirse dos tipos: los que
van destinados a aplicaciones que requieren una alta delidad como puede ser la difusión
de voz que serán transmitidas en tiempo real. Será sobre estos últimos sobre los que nos
centraremos posteriormente.
Los codecs de audio para aplicaciones de telefonía, así mismo, se dividen en dos grupos:
aquellos que se basan en la modulación por impulsos codicados para transmitir la señal
formato más adecuado. Así estos dos grupos de codecs de telefonía son los codec PCM,
que son los codecs básicos de 64 kbps, y los vocoders, los cuales van un paso más alla del
algoritmo PCM. Por último, puede considerarse un tercer grupo de codecs, los codecs
de codecs se caracterizan por tener una tasa de bit de 64 kbps, siendo el más
representativos de todos ellos el codec G.711. Esta tasa es muy elevada para las
posibilidades de algunas partes de la red, por lo que cada vez se utilizan menos
En este grupo también se encuentran los codecs predictivos, que comparan a codi-
car con las anteriores y codican sólo la señal de error, con una menor cantidad
de bits y también mediante forma de onda. Se usan menos bits ya que la señal de
error es más pequeña que la muestra en sí, tiene un menor rango dinámico. Con
20
3 LA VoIP.
estos codecs se puede reducir la tasa de error hasta los 18 kbps, a cambio de perder
un poco de calidad.
Vocoders:
30ms), según el tipo de codec. Una vez con estas muestras, la analizan mediante
determinados algoritmos para sacar los coecientes del ltro vocal ( que hará el
papel del tracto vocal de la persona que habla) y para crear la señal de excitación
( que simula el impulso del aire que pasa por las cuerdas vocales al hablar). Con
receptor.
transmisión muy bajas, por contra la voz reproducida suena muy sintetizada, poco
Codecs híbridos:
Estos codecs tienen las ventajas de los vocoders, en cuanto a que se basan en
el modelo de excitación, más un ltro vocal para conseguir bajas tasas de bit
con la original, para así transmitir también el error cometido con muy pocos bits y
ser codicado bien mediante índices o por forma de onda, según el codec, y se
transmite junto con los coecientes del ltro vocal y la señal de excitación. Con
esto se consiguen tasas de transmisión también muy bajas y además una calidad
Dentro de este grupo, podemos encontrar a los codecs: G.729 y G.723.1, estan-
telefonía IP:
21
3 LA VoIP.
• G.711.
usado por los circuitos de telefonía digital tradicional, como E1. Este codec
logarítmica para discretizar los niveles de amplitud, mientras la otra usa una
uLaw suele ser usado en Norte America y parte Asia, mientras que ALaw
Code Modulation) o CELP ( Code Excited Linear Predition) para reducir los
• G.722.
Este codec tiene ocupa un gran ancho de banda, ya que hace un muestreo de
tiene mucha mayor calidad que el resto de los codecs usados para VoIP. Por
• GSM.
Este codec, usado en el sistema de telefonía movil global, ofrece una tasa de
T, hace uso del algoritmo CELP para lograr una alta escala de compresión y
22
3 LA VoIP.
• ILBC.
• Speex.
además de una tasa binaria variable. Speex permite cambiar la tasa binaria
Cada uno de estos codecs tiene sus ventajas e inconvenientes. G.711 es adecuado en
enlaces donde hay suciente capacidad y presentan poca latencia, como es el caso de
Ethernet. Éste presenta un buen comportamiento ante los errores, pero, por ejemplo, no
sería adecuado su uso en un enlace Frame Relay de 56 kbps, ya que no se dispondría del
suciente ancho de banda. Recíprocamente, los codecs que proveen una algún tipo de
Además de los bits que representan los datos de audio, todos los paquetes transportan
otros bits usados para funciones de rutaje, corrección de errores, etc. Esta sobre carga de
bits no representa ningún benecio para la aplicación de VoIP, más que permirtir a los
necesaria para el transporte del paquete a través de la red. Cuanto mayor sea la cantidad
por la red, ya que hacen falta menos paquetes para transportar el mismo sonido, y por
de VoIP es reducir el número de paquetes por segundo usado para transmitir la señal
de audio. Pero esto incrementa el impacto de los errores sobre la llamada telefónica.
23
3 LA VoIP.
un determinado codec puede ayudar, ya que cada uno proporciona distintas tasas de
Los diferentes tipos de codecs usan diferentes tasas de paquetes. Al espacio entre los
relación a la tasa de paquetes. Algunos codecs, especialmente aquellos que usan algorit-
mos CELP avanzados, requieren una mayor cantidad de audio ( 20 ms, 30 ms) en un
paquetes tiene un efecto directo sobre la sobrecarga. Cuanto mayor es éste, menor será
la sobrecarga requerida para transmitir los datos de audio, y viceversa. Pero por contra,
el aumento del mismo provoca un aumento directo de la latencia o retraso de los datos,
es decir, la diferencia de tiempo entre el momento en el que el sonido fue originado hasta
será mayor. Ya que un paquete IP no será transmitido hasta que éste sea totalmente
construido, una trama de audio no podrá viajar a través de la red hasta que éste esté
percibida en el receptor.
paquetes grandes: cuanto mayor sea la duración de sonido transportada por cada paque-
te, mayor será la porbabilidad de que el extremo receptor note un efecto negativo en el
un paquete que transporta 20ms de audio es apenas imperceptible con el codec G.711,
pero no así la pérdida de 60 ms de audio, que puede ser bastante molesto. El principal
motivo por el que el sonido es transmitido bajo datagramas UDP, es porque ofrece un
servicion no able y no orientado a conexión, de tal forma que aquellos paquetes perdido
implicaría que todos los paquetes que se notiquen como perdidos serían retrasmitidos.
Este efecto haría que los paquetes en el extremo receptor llegasen completamente fuera
Si se considera un muestreo de 8khz para una señal de audio básica con 8 bits por mues-
tra, y se asume un intervalo entre paquetes de 20ms, puede verse que la cantidad de datos
24
3 LA VoIP.
los bit de cabecera introducidos por cada protocolo que encapsula el mensaje, resulta
1.904 por trama, suponiendo que se utiliza ethernet como tecnología de transimisión.
la información a transmitir, para que así los requerimientos de ancho de banda necesarios
Una forma importante de reducir ancho banda, además del que se consigue al comprimir
la señal, es el uso del sistema DTX / VAD / CNG. Se trata de un sisitema de transmisión
Confort Noise Generator, CNG). Dicho sistema consiste en no enviar paquetes de datos
durante los silencios de las conversaciones. En estos silencios, aunque no se hable, seguirá
habiendo ruido de fondo, por lo que será necesario transmitir algún tipo de información
que sirva para reproducir el ruido de fondo en el receptor y no perder así la naturaleza
25
3 LA VoIP.
de la conversación. Este tipo de tramas con información para el ruido se conocen como
tramas SID ( Silence Insertion Descriptor) y son de poco tamaño comparadas con las
tramas de datos. El elemento del codec encargado de generar el ruido de fondo a partir
algoritmo DTX, también es menos sensible a los errores de transmisión que en un sistema
tramas tramas SID, se cogen los parámetros de las anteriores para generar el ruido
actual, de manera que afecte poco esa pérdida. En el caso en que se pierda la primera
trama SID de un tramo de silencio, durante la fases de habla se van estimando también
Para que este sistema funcione es fundamental el buen funcionamiento de los detectores
ción y concluyen si en este fragmento analizado ha habido voz ( tramo de "active voice"),
o no ( tramo de "inactive voice"). En los tramos de voz activa se envia información útil,
y en los tramos de voz inactiva, se mandan tramas SID, para que el decodicador pueda
generar un ruido de fondo adecuado, o , incluso, no se envía nada. Las tramas SID sólo
Para determinar si estamos ante un tramo de voz inactica o activa, los VAD's se basan
Este apartado describe los estándares de señalización de llamadas en una red de VoIP.
26
3 LA VoIP.
software), PBX tradicionales y por cualquier otro elemento que pueda interferir en una
comunicación telefónica, a través del cual pueden comunicarse para establecer, negociar
y nalizar llamadas.
La tecnología de voz sobre IP, provee una familia de protocolos de señalización. La mayor
Sus propósitos son señalizar, registrar y facilitar los eventos claves de una llamada:
el comienzo, el nal de llamada y cuándo los usuarios están intentando usar una
Aunque las llamadas de señalización suelen establecerse usando UDP como proto-
colo de transporte, no son vistas como tráco en tiempo real, como ocurre con la
El patrón de tráco que sigue la señalización cuando ésta es transmitida por la red,
suele ser de poca duración y a ráfagas, en oposición al tráco de voz que tiende a
lefonía IP: el Protocolo de Inicio de Sesión (SIP), desarrollado por el IETF ( Internet
Engeneering Task Force); y H.323, desarrollado por la ITU-T. Existen otra serie de pro-
tocolos de señalización, desarrollado por compañias privadas, como pueden ser: SCCP,
Entre todos los estándar de señalización que existen, aquellos que han sido elaborados
por organismos públicos, como son SIP y H.323, nos aportarán una mayor exibilidad
ción para toda la comunidad de Internet. Entre estos dos principales éstandares existen
27
3 LA VoIP.
sustanciales diferencias, en cuanto a los distintos tipos de caminos por donde pueden
establecer las llamadas telefónicas. H.323, hace posible establecer una comunicación en-
posee una interfaz que le permite establecer una llamada con los sistemas de telefonía
terminal tradicional, sea analógico o digital. Fue diseñado para permitir una comunica-
ción entre terminales IP. Sin embargo, una gran ventaja de SIP es su exibilidad para
carencia de H.323.
paquetes. H.323 no tiene que ser entregado completamente usando una red IP. Ciertas
das, por medio de la señalización, con todos los dispositivos que intervienen en una
comunicación. Por ejemplo, H.323 permite la señalización sobre las líneas de teléfonos
Mientras que el estándar H.323 se encuentra en un estado bastante maduro y bien do-
cumentado por la ITU-T, éste ha sido implementado en partes especícas por cada
28
3 LA VoIP.
sistemas de distintos fabricantes. Para conseguir este objetivo, se hace uso de dispositi-
vos trandicionales, tales como E1, como elemento intermediador, ya que la mayoría de
Los paquetes de mensajes H.323 son compactos, y la señalización H.323 es muy rápida,
especialmente comparada con SIP, el cual usa mensajes más largos y basados en texto
plano. El diseño de H.323 está basado en los fundamentos del diseño de la Red Telefónica
Conmutada: brevedad y disponibilidad. La red es usada tan poco como sea posible para
sonido.
3.4.2.1. ARQUITECTURA .
Al alcance de red dentro del cual un gatekeeper opera se le denomina "zona". Puede
haber sólo un gatekeeper por zona y una zona por gatekeeper. Es normal referirse a un
Tanto los terminales H.323 como los gateways, para que puedan ser accesibles a las
Esto quiere decir que cada terminal H.323 debe informar al gatekeeper de cuáles son
sus características únicas que lo identican: número de telefóno, dirección IP, etc. Este
29
3 LA VoIP.
cer mucho más que canales dedicados con otro terminal, se perderían, entre otras, las
Registro y autenticación.
para ser usado como identicador cuando éste efectue una llamada.
para posterior uso cuando autentique al terminal, junto con un hash, que es
identidad.
Conrm), indicando que está listo para realizar y recibir llamadas en la red.
30
3 LA VoIP.
de elementos software que le permiten cubrir diferentes aspectos del proceso de llamada:
compatibles.
real.
aplicaciones interactivas.
y las tecnología tradicionales de señalización y transportes tales como FXO, FXS, RDSI,
E1, etc. Este elemento es requerido sólamente cuando se pretende hacer interoperar la
el codec G.711.
Los gateways también deben registrarse con el gatekeeper para la zona en la que ellos
31
3 LA VoIP.
multiconferencia entre tres o más canales de voz. Ésta puede ser implementada en un
Una MCU está formada por dos componentes fundamentales: MP (mulipoint processing)
la MCU encargado de llevar a cabo las accciones de un DSP, para agregar canales
de gestionar las negociaciones H.245 entre todos los terminales para determinar las
capacidades comunes para el procesado de audio y datos. También controla los recursos
de la conferencia para determinar cuáles de los ujos, si hay alguno, serán multipunto
(multicast). Las capacidades son enviadas por el MC hacia todos los extremos de la
32
3 LA VoIP.
Algunos protocolos, como RTP ( Real Time Protocolo) y RTCP (Real Time Control
tamente. Otros, como H.225.0 y H.245, derivarón del ITU-T H.320, H.221 y H.242, y
algunos otros, como el protocolo RAS, fue diseñado especícamente para H.323.
Como se describe más adelante, cada protocolo o conjunto de ellos en H.323 tiene como
Direccionamiento.
Señalización:
H.225.0: protocolo que describe cómo el audio, los datos y la información de con-
trol, en una red de conmutación de paquetes, pueden ser usados para proporcionar
H.225.0 siguen el estándar Q.931 y son del tipo: mensaje de establecimiento de lla-
de la llamada y otros.
nales lógicos para comunicaciones de voz, para realizar las negociaciones de los
que pueden ser del tipo: peticiones, respuestas, comandos y mensajes de indicación.
Información de audio:
Todos los terminales deben soportar el codec G.711. También pueden utilizarse
Información de vídeo:
En el caso que los terminales H.323 soporten vídeo llamada o vídeo conferencia,
serán utilizados los protocolos H.261 y H.263, que dene la manera de transportar
33
3 LA VoIP.
Funcionaliadad opcional, que en el que caso de que sea soportada será implemen-
caciones que transmiten en tiempo real. Maneja los aspectos relativos a la tempo-
receptor.
Control de la transmisión:
Servicios suplementarios.
capacidades, establecer canales de audio y/o video, llevar a cabo la llamada y liberación
de la llamada.
1. Establecimiento/nalización:
34
3 LA VoIP.
Para iniciar una llamada se hace uso del protocolo H.225. Durante este paso, cada
Alerta: esto signica que el extremo receptor está siendo noticado de que
está sonando, y que el terminal que originó la llamada está recibiendo una
indicación de ello.
nalizada.
2. Negociación de capacidades
Después de establecer la llamada, se hace uso del protocolo H.245 para negociar
H.245 determina:
video u otras.
Cuáles son los codecs disponibles para cada terminal y cuáles son sus prefe-
rencias.
Cómo los canales serán estructurados y qué tipo de intervalo será usado.
35
3 LA VoIP.
señal de ocupado.
Control Protocol) es utilizado para establecer un canal UDP donde tendrá lugar
Una vez que la llamada esté en progreso, RTCP, que se ejecuta junto a RTP en
puertos UDP consecutivos, puede guardar ventanas del canal de comunicación, que
5. Liberación
36
3 LA VoIP.
En la anterior gura puede verse el proceso de señalización que tiene lugar cuando un
terminal H.323 intenta establecer una llamada con otro terminal via un gatekeeper:
2. El gatekeeper contesta con una conrmación ARQ (ACF). Esto conrma al lla-
llamada.
tener una copia de la petición de registro del llamante para validar la llamada.
6. Si el gatekeeper tiene una copia de este registro, devuelve el mensaje "Called Party
7. El receptor, una vez que comienza a sonar, envía en mensaje H.225 "Alerting",
8. Una vez que el receptor conteste a la llamada, éste envía un mensaje H.225 "Con-
nect" al otro extremo de la comunicación. Esto deja paso a que el proceso H.245,
minales, es el papel que juega éste en las sesiones H.225, sin inuir en el camino que
37
3 LA VoIP.
E.164 es una convención para asignar números de teléfonos a terminales en una red de
VoIP. E.164, permite a los terminales de una red de VoIP registrar dinámicamente sus
números de direcciones E.164 desde una lista de números almacenados en una base de
datos en el gatekeeper.
Esta base de datos es una lista de direcciones MAC Ethernet, cada una de las cuales
corresponden a una o más direcciones E.164. De esta forma se controla que terminal va
a usar un determinado número, permitiéndo así una fácil movilidad de los terminales en
la red: no importará a qué lugar vaya el terminal H.323, su dirección E.164 siempre será
la misma.
Pero exiten una serie de incovenientes usando direcciones MAC como enlaces hacia una
Existen mejores formas de manejar la asignación de alias a los terminales H.323, ya que
38
3 LA VoIP.
El Protocolo de Inicio de Sesión, fue desarrollado por el IETF, como una forma de
Los deberes y escenarios de SIP son los mismos que los de H.323. Es decir, hay terminales
y establecen políticas para la red de VoIP. Sin embargo, SIP es más exible que H.323,
puede considerarse más que un conjunto de protocolos de telefonía para audio y video. Se
trata entorno de trabajo para todos los tipos de aplicaciones basadas en el intercambio de
como H.323, usa cabeceras de gran longitud y codicadas en texto plano, como es el
caso de SMTP o HTTP, lo que permite, de forma más cómoda, la solución de problemas
distribuida.
39
3 LA VoIP.
3.4.3.1. ARQUITECTURA.
SIP sigue el modelo cliente/servidor. En el entorno SIP, tanto servidores como los puntos
nales de una comunicación, son llamados "nodos". Un telefóno SIP, es un nodo, y como
cada nodo, puede comunicarse directamente con cualquier otro para, de esta forma,
poder establecer sesiones multimedias, tal y como los terminales H.323 pueden establecer
canales directos entre ellos. Pero la conguración más usual es usar servidores SIP, a los
cuales el resto de los teléfonos SIP deberán noticar su presencian, es decir, deberán
2. Servidores de red.
Los agentes de usuario son aplicaciones que residen en los nodos terminales SIP, y contie-
nen dos componentes: Agentes de Usuario Clientes ( User Agent Client, UAC) y Agentes
40
3 LA VoIP.
de Usuario Servidores ( User Agent Server, UAS). Los UAC originan las peticiones SIP
, y los UAS responden a estas peticiones, es decir, originan respuestas SIP asociadas al
extremo que recibe la llamada. Los UA's deben implementar el transporte tanto sobre
Los UA's y UAS's pueden establecer, por sí solos, una comunicación. No obstante, la
potencialidad de SIP se aprovecha con el empleo de los servidores de red. Los servidores
Servidores de redirección.
Servidores Proxy.
Servidores de Registro.
es decir la URL de la parte llamada, o cómo contactar con ella. En caso contrario,
papel de gatekeeper.
Cuando un servidor SIP responde a la solicitud INVITE, enviada por la parte que origina
la llamada, con una respuesta 3xx, el servidor SIP está redireccionando a dicha parte
hacia otro servidor SIP. Posteriormente, el nodo SIP debe contactar con el nuevo servidor
SIP a través de otra solicitud SIP. Esta característica no está implementada en todos
los sistemas que soportan SIP, y suele ser propia de entornos extensos que operan bajo
de vista del llamante se comporta como un servidor y desde el punto de vista del receptor
como un cliente. Un servidor proxy puede reenviar solicitudes hasta el destino nal sin
41
3 LA VoIP.
Los servidores proxy statefull retienen información dela llamada durante el proceso que
dure el establecimiento de ésta, no así los servidores stateless, que procesan un mensaje
SIP y entonces olvidan todo lo referente a la llamada hasta que vuelvan a recibir otro
llamada una vez que la transacción ha sido procesada. Además, esta relación es muy
rubusta, dado que el servicio no necesita recordar nada en relación a la llamada. Sin
embargo, no todas las funcionalidades pueden ser implementadas por un servidor state-
También se les denominan servidores de localización ( Location Server), pues son utiliza-
dos por los servidores proxy y de redirección para obtener información de la localización
del sistema SIP, sino más bien, base de datos que pueden formar parte de arquitecturas
que utilicen SIP. Entre éstos y cualquier servidor SIP, sea proxy o de redirección, no se
utiliza el protocolo SIP, sino protolos típicos de bases de datos o servicios de directorio,
borrado.
42
3 LA VoIP.
Los nodos SIP son referenciado usando URI ( Uniform Resources Indicator), con la
siguiente estructura
sip:usuario@servidor_sip
Esta convención indica tanto el usuario al que quiere alcanzarse como el servidor SIP ,
que se espera que conozca la dirección SIP del usuario nal. Aquellas conecciónes que
requieren una encriptación para la señalización usaran el prejo "sips", en lugar de "sip"
43
3 LA VoIP.
Mientras que H.323 usa la sintaxis ASN.1 para la descripción del formato de los mensajes,
Las solicitudes SIP se clasican dentro de diez categorías, llamadas métodos. Cada mé-
1. INVITE: este método es usado para establecer sesiones y anunciar las capacidades
2. ACK: es usado para conrmar que el cliente solicitante ha recibido una respuesta
armativa.
3. OPTIONS: es usado para preguntar a un nodo SIP por sus capacidades, sin que
4. BYE: este método ocurre cuando la llamada es completada, es decir, cuando alguna
5. CANCEL: cancela una solicitud pendiente, pero no afecta a una solicitud ya com-
44
3 LA VoIP.
6. REGISTER: notica al servidor SIP en qué terminal SIP un usuario puede ser
alcanzado.
7. INFO: es usado para trnasmitir señales de aplicación de telefonía a través del canal
usado por la señalización SIP. Tales señales pueden ser dígitos marcados, etc.
8. PRACK: este método es usado en lugar de ACK para noticar al otro extremo
10. NOTIFY: este método entrega mensajes entre estremos SIP, tales como eventos
Cuando una llamada debe ser establecida, nalizada o alterada, un evento SIP es em-
pleado. Los eventos precedentes son similares en concepto a los métodos de HTTP:
GET y POST; y como en HTTP, SIP espera códigos de respuestas cuando un método
aceptada.
solicitud.
4xx: error del cliente. La solicitud contiene mal la sintaxis o no puede ser resuelta
en este servidor.
mente válida.
45
3 LA VoIP.
tocolo de señalización para redes VoIP, tal y como ocurre con H.323 y SIP. La principal
diferencia con estos últimos es que IAX no implementa RTP como mecanismo de paque-
tezación, sino que éste tiene su propia forma de empaquetar los datos de voz codicada.
IAX es implementado de forma más simple y menos exhaustiva que SIP o H.323. A
diferencia de estos últimos, que son más extensibles, IAX va dirigido exclusivamente a
aplicaciones de telefonía.
voz y nalización, puede usar varios puertos TCP y UDP, en el caso de SIP o H.323, el
protocolo IAX maneja todas estas funciones usando un único puerto UDP. Tanto cuando
el cliente IAX, terminal, se registra con el servidor o proxy IAX, así como cuando una
La forma que IAX utiliza para distinguir las distintas funcionalidades llevadas a cabo
46
3 LA VoIP.
La documentación del protocolo IAX describe el orden de estas cabeceras y los meta-
datos, tales como tramas de control, meta-tramas y elementos de información, cada uno
de los cuales tiene su propia sintaxis. IAX no está codicado usando ASCII, ni ASN.1,
interfaz máquina-máquina.
Al contrario que ocurre con H.323 y SIP, IAX no es una recomendación estándar, sino
más bien un protocolo independiente creado por Mark Spencer. Aunque propietario, la
47
3 LA VoIP.
HANGUP
como rutado
recomendada recomendada
E.164 o alias
keeper/SoftPBX
48
3 LA VoIP.
Estos dos protocolos surgieron con la aparición, como consecuencia de la liberación del
telefónicos de la RTC, a través de una red IP. En estos escenarios no exiten terminales
pasarelas VoIP conectadas entre sí a través de una red dorsal IP, y localmente, a una o
Con objeto de que las pasarelas que proporcionan el inter-funcionamiento entre la red la
red telefónica y la red IP sean lo más sencillas posibles, el proceso de llamada y el manejo
esta forma, las pasarelas sólo tienen que encargarse del manipulado físico de los ujos
el MGC
xiones, etc
controlador de las mismas. Una MGC controlará a varios MC a través del protocolo
H.248, y se comunicará con otras MGC a través del protocolo SIP o H.323.
49
3 LA VoIP.
50