Documente Academic
Documente Profesional
Documente Cultură
CARLOS GABRIEL GMEZ VILLAGRN ASESORADO: ING. ENRIQUE EDMUNDO RUIZ CARBALLO
FACULTAD DE INGENIERA
TRABAJO DE GRADUACIN
INGENIERO ELECTRNICO
FACULTAD DE INGENIERA
Ing. Sydney Alexander Samuels Milson Ing. Murphy Olympo Paiz Recinos Lic. Amahn Snchez Alvarez Ing. Julio David Galicia Celada Ing. Kenneth Issur Estrada Ruiz Br. Elisa Yazminda Vides Leiva Ing. Pedro Antonio Aguilar Polanco
Ing. Herbert Ren Miranda Barrios Ing. Edwin Alberto Solares Martnez Ing. Enrique Edmundo Ruiz Carballo Ing. Julio Cesar Solares Peate Inga. Gilda Marina Castellanos de Illescas
Cumpliendo con los preceptos que establece la ley de la Universidad de San Carlos de Guatemala, presento a su consideracin mi trabajo de graduacin titulado:
Tema que me fuera asignado por la Direccin de la Escuela de Ingeniera Mecnica Elctrica con fecha 24 de febrero de 1998; No. Ref. EIME.053.98.
ndice general
NDICE GENERAL
NDICE DE ILUSTRACIONES _________________________________________ xi LISTA DE SMBOLOS ________________________________________________xv GLOSARIO _______________________________________________________ xvii RESUMEN _______________________________________________________ xxvii INTRODUCCIN __________________________________________________ xxix
1. SISTEMA BSICO DE RADIOLOCALIZACIN PAGING ________________1 1.1. Sistema bsico_____________________________________________________1 1.1.1. Codificador___________________________________________________2 1.1.2. Estacin base _________________________________________________3 1.1.3. Receptores ___________________________________________________3 1.2. Sistemas de radiolocalizacin ________________________________________4 1.2.1. Sistema manual de radiolocalizacin _______________________________5 1.2.2. Sistemas automticos de radiolocalizacin __________________________6 1.2.2.1. Terminales de radiolocalizacin ____________________________6 1.2.2.2. Flujo de mensajes________________________________________6 1.2.2.2.1. Tono, voz y numrico _____________________________7 1.2.2.2.2. Alfanumrico ___________________________________7 1.3. Cobertura de un sistema de radiolocalizacin_____________________________8 1.3.1. Factores que afectan la cobertura__________________________________9 1.3.1.1. Potencia del transmisor __________________________________10 1.3.1.2. Sensibilidad del receptor _________________________________10 1.3.1.3. Ganancia de antena _____________________________________10 1.3.1.4. Altura de antena ________________________________________11 1.3.1.5. Frecuencia de transmisin ________________________________11 i
1.3.1.6. Prdidas en la trayectoria _________________________________12 1.3.1.7. Desvanecimiento _______________________________________12 1.3.2. Transmisin simultnea ________________________________________13 1.3.2.1. Ventajas operacionales de la transmisin simultnea ___________13 1.3.2.2. Requerimientos operacionales _____________________________14 1.3.3. Red de radiolocalizacin _______________________________________15 1.4. Protocolos de sealizacin en radiolocalizacin (Formatos de codificacin)____17 1.4.1. Formato anlogo o digital ______________________________________18 1.4.1.1. Formato de codificacin por tonos__________________________18 1.4.1.2. Formato de codificacin binaria____________________________19 1.4.1.3. POCSAG (Post Office Code Standardization Advisory Group) _______________________________________________20 1.4.1.4. FLEXtm Cdigo de radiolocalizacin de alta velocidad __________21 1.5. Soporte fsico tpico de la radiolocalizacin _____________________________22 1.5.1. Receptores o radiolocalizadores__________________________________22 1.5.1.1. Caractersticas comunes de los radiolocalizadores _____________23 1.5.2. Terminales de radiolocalizacin__________________________________27 1.5.2.1. Caractersticas del MPS2000 interruptor modular de radiolocalizacin ______________________________________27 1.5.2.2. Caractersticas Unipage __________________________________28 1.5.2.3. Controladores _________________________________________29 1.5.2.3.1. C-net _________________________________________29 1.5.2.3.2. Ncleos transmisores ____________________________30 1.5.3. Estaciones base ______________________________________________30
2. Reconocimiento de voz _______________________________________________31 2.1. Reconocimiento de voz ____________________________________________33 2.1.1. Tipos de reconocimiento de voz _________________________________33 2.1.1.1. Palabra aislada y/o expresin simple _______________________33
ii
ndice general
2.1.1.2. Dependencia del hablante ________________________________34 2.1.1.3. Discurso continuo y discreto ______________________________34 2.1.1.4. Independiente del hablante _______________________________35 2.1.1.5. Comando y control _____________________________________35 2.1.1.6. Dictado discreto _______________________________________35 2.1.2. Funcionamiento de la tecnologa del reconocimiento de voz ___________36 2.1.2.1. Conversin anloga digital ______________________________36 2.1.2.2. Anlisis espectral y transformadas de Fourier ________________38 2.1.2.2.1. Aproximaciones del reconocimiento de voz __________39 2.1.2.2.1.1. Aproximacin acstica fontica ___________40 2.1.2.2.1.2. Aproximacin por medio del reconocimiento de la muestra _________________________41 2.1.2.2.1.3. Aproximacin por medio de la inteligencia artificial _____________________________43 2.1.2.2.2. Tracto vocal y seal de voz _______________________46 2.1.2.2.2.1. Modelo del tracto vocal _________________47 2.1.2.2.2.2. Voz representada en el tiempo y en el dominio de la frecuencia _______________________49 2.1.2.2.3. Procesamiento de seal y mtodos de anlisis del reconocimiento de voz ___________________________51 2.1.2.2.3.1. Preprocesamiento y procesamiento de seal _52 2.1.2.2.3.2. Modelos del anlisis espectral ____________54 2.1.2.2.3.2.1. Procesador de banco de filtros _58 2.1.2.2.3.2.1.1. Tipos de banco de filtros utilizados para el reconocimiento de voz ___________64
iii
2.1.2.2.3.2.1.2. Desarrollo de banco de filtros _68 2.1.2.2.3.2.1.2.1. Respuesta de impulso infinito (IIR) _________68 2.1.2.2.3.2.1.2.2. Respuesta de impulso finito (FIR) _________69 2.1.2.2.3.2.1.3. Desarrollo de un banco de filtros uniforme basado en la transformada corta de Fourier usando FFT ____74 2.1.2.2.3.2.1.4. Desarrollo de un banco de filtros FIR no uniforme ____75 2.1.2.2.3.2.1.5. Banco de filtros no uniformes basados en FFT ________79 2.1.2.2.3.2.1.6. Resumen de consideraciones para banco de filtros de reconocimiento de voz ___________79 2.1.2.2.3.2.2. Anlisis de prediccin lineal para el reconocimiento de voz (LPC) 81
iv
ndice general
2.1.2.2.3.3. Comparacin de la muestra ______________84 2.1.2.2.3.3.1. Restriccin local ____________86 2.1.2.2.3.3.2. Restriccin global ___________87 2.1.2.2.3.3.3. Medida de disimilitud ________88 2.1.2.2.3.4. Cuantizacin vectorial __________________90 2.1.2.2.3.5. Anlisis de formantes ___________________92 2.1.2.2.3.5.1. Obtencin de picos en el espectro suave _____________________93 2.1.2.2.3.5.2. Obtencin de picos en el espectro LP ________________93 2.1.2.2.3.6. Anlisis de voz ________________________94 2.1.2.2.3.6.1. Tono de voz ________________94 2.1.2.2.3.6.2. Grado de voz _______________95 2.1.2.2.3.7. Caractersticas acsticas y lingsticas ______96 2.1.2.2.3.7.1. Mdulo de procesado acstico _97 2.1.2.2.3.7.2. Mdulo de anlisis fontico ___97 2.1.2.2.3.7.2.1. Realizacin fontica _______98 2.1.2.2.3.7.2.2. Clasificacin de fonemas _______98 2.1.2.2.3.7.2.2.1. Fonemas consonnticos 98 2.1.2.2.3.7.2.2.1.1. Lugar de Articulacin 99 2.1.2.2.3.7.2.2.1.2. Manera de articulacin 100
2.1.2.2.3.7.2.2.1.3. Articulaciones sonoras y sordas ___100 2.1.2.2.3.7.2.2.2. Fonemas voclicos ___101 2.1.2.2.3.7.3. Mdulo de anlisis fonolgico 103 2.1.2.2.3.7.4. Mdulo de anlisis morfolgico103 2.1.2.2.3.7.5. Mdulo de anlisis sintctico _104 2.1.2.2.3.7.6. Mdulo de anlisis semntico _104 2.1.2.2.3.7.7. Mdulo de anlisis pragmtico 105 2.1.2.2.3.8. Procesos discretos de Markov ___________107 2.1.2.2.3.8.1. Caractersticas de un HMM ___109 2.1.2.2.3.8.2. Reconocedor basado en HMMs ___________________110 2.1.2.2.3.9. Codificacin de voz ___________________111 2.1.2.2.3.9.1. Vocoder de canal ___________114 2.1.2.2.3.9.2. Vocoder de formantes _______115 2.1.2.2.3.9.3. Vocoder articulatorio ________115 2.1.2.2.3.9.4. Vocoder homomrfico _______115 2.1.2.2.3.9.5. Vocoder LPC ______________115
3. SISTEMA IRIDIUM _______________________________________________117 3.1. Constelaciones de satlites de rbita baja (LEO) ________________________117 3.1.1. Satlites geoestacionarios (GEO) _______________________________117 3.1.2. Satlites de rbita media (MEO) ________________________________117 3.1.3. Satlites de rbita baja (LEO) __________________________________118 3.1.3.1. Ventajas ____________________________________________118
vi
ndice general
3.1.3.2. Desventajas __________________________________________119 3.2. Funcionamiento del sistema Iridium _________________________________120 3.2.1. Componentes del sistema _____________________________________121 3.2.1.1. Satlites _____________________________________________121 3.2.1.1.1. rbitas ______________________________________121 3.2.1.1.2. Celdas _______________________________________122 3.2.1.1.3. Bus _________________________________________124 3.2.1.1.4. Antenas ______________________________________125 3.2.1.1.4.1 Antenas bsicas de phased array _________126 3.2.1.1.4.2. Antenas de enlace secundario ___________126 3.2.1.1.4.3. Antena de enlace lateral ________________126 3.2.1.1.4.4. Antena mvil de pasarela (gateway) o de enlace vertical ________________________127 3.2.1.1.5. Mdulo de control _____________________________127 3.2.1.2. Puertas de enlace (gateways) ____________________________127 3.2.1.3. Terminales del usuario _________________________________129 3.2.2. Asignacin de frecuencias ____________________________________130 3.2.2.1. Enlace entre satlites (ISL) ______________________________131 3.2.2.1.1. Tipos de enlace entre satlites (ISL) ________________132 3.2.3. Modulaciones y accesos mltiples que utiliza el sistema Iridium ______133 3.2.3.1. Modulaciones ________________________________________133 3.2.3.1.1. Cambio de fase (PSK) __________________________133 3.2.3.1.2. Cambio de fase en cuadratura (QPSK) ______________135 3.2.3.1.3. Modulacin por codificacin de pulsos (PCM) _______139 3.2.3.2. Accesos mltiples _____________________________________142 3.2.3.2.1. Acceso mltiple por divisin de frecuencia (FDMA) __142 3.2.3.2.2. Acceso mltiple por divisin de tiempo (TDMA) _____143 3.2.3.3. Arquitectura de la comunicacin del sistema Iridium __________144 3.2.4. Servicios __________________________________________________145
vii
3.2.4.1. Voz ________________________________________________146 3.2.4.2. Radiolocalizacin _____________________________________147 3.2.4.3. Fax _________________________________________________147 3.2.5. Comunicacin pas a paso del sistema ___________________________148 3.2.6. Mercado del sistema Iridium ___________________________________149
4. RED SISTEMA INTEGRADO DE MENSAJERA 4.1. Planificacin y dimensionado de red _________________________________151 4.1.1. Relacin trfico por usuario ___________________________________152 4.1.1.1. Hora activa o pico _____________________________________153 4.1.1.2. Tiempo medio de conversacin ___________________________154 4.1.1.3. Nmero promedio de llamadas por usuario en la hora pico _____156 4.1.2. Intensidad de trfico telefnico _________________________________157 4.1.3. Grado de servicio ___________________________________________158 4.2. Diseo de red sistema integrado de mensajera _________________________161 4.2.1. Acceso de llamadas __________________________________________162 4.2.1.1. Fuentes de entrada _____________________________________162 4.2.1.2. Conmutacin virtual ___________________________________164 4.2.1.2.1. Controlador de conmutacin virtual (VCS) __________169 4.2.1.2.2. Puerta de enlace o gateway de medios (MG) _________171 4.2.1.2.3. Punto de control de servicio (SCP) ________________171 4.2.1.2.4. Nodo de servicios ______________________________172 4.2.1.2.5. H.323 _______________________________________172 4.2.1.3. Centro de llamadas de telefona de paquetes (PTCC Packet Telephony Call Center) _________________________________177 4.2.2. Unidad de control ___________________________________________180 4.2.2.1. Arquitectura red Lan ___________________________________181 4.2.2.2. Servidores de aplicaciones especiales ______________________183 4.2.2.2.1. Servidor de base de datos y reconocimiento de voz ____183
viii
ndice general
4.2.2.2.1.1. Base de datos ________________________184 4.2.2.2.1.2. Reconocimiento de voz ________________191 4.2.2.2.1.3. Caracterstica del hardware del servidor ___193 4.2.2.2.2. Servidor de correo electrnico ____________________194 4.2.2.2.3. Servidor de Internet ____________________________194 4.2.2.3. Terminal de radiolocalizacin ____________________________195 4.2.2.4. Protocolos del Sistema Integrado de Mensajera _____________196 4.2.2.4.1. Protocolo de la PSTN al sistema de radiolocalizacin __197 4.2.2.4.2. Protocolos de Internet y correo electrnico __________197 4.2.2.4.3. Protocolos sobre la infraestructura del sistema de radiolocalizacin ______________________________198 4.2.2.4.4. Protocolos entre la infraestructura del sistema de radiolocalizacin y los radiolocalizadores ___________199 4.2.2.5. Sistema de control de radiolocalizacin ____________________204 4.2.2.6. Puertas de enlace (gateways) ____________________________205 4.2.2.6.1. Puertas de enlace (gateway) de Internet _____________205 4.2.2.6.2. Puerta de enlace (gateway) satelital ________________206 4.2.2.7. Medios de transmisin _________________________________206 4.2.3. Transmisin ________________________________________________207 4.2.3.1. Ncleos _____________________________________________209 4.2.3.2. Antenas _____________________________________________210 4.2.4. Recepcin _________________________________________________211 4.2.4.1. Radiolocalizadores ____________________________________212 4.2.4.1.1. Radiolocalizadores numricos ____________________212 4.2.4.1.2. Radiolocalizadores alfanumricos _________________213 4.2.4.1.3. Radiolocalizadores Iridium ______________________215 4.3. Evaluacin Sistema Integrado de Mensajera _________________________218 4.3.1. Estudio de preinversin _______________________________________218 4.3.1.1. Idea ________________________________________________220
ix
4.3.1.2. Perfil y prefactibilidad __________________________________220 4.3.1.3. Factibilidad __________________________________________221 4.3.1.3.1. Estudio de mercado ____________________________223 4.3.1.3.2. Estudio tcnico ________________________________227 4.3.1.3.3. Estudio econmico _____________________________230 4.3.1.3.3.1. Perodo de recuperacin de la inversin ___236 4.3.1.3.3.2. Valor actual neto o valor presente ________237 4.3.1.3.3.3. Tasa interna de retorno (TIR) ____________241
CONCLUSIONES ___________________________________________________243 RECOMENDACIONES ______________________________________________245 REFERENCIAS BIBLIOGRFICAS ___________________________________247 BIBLIOGRAFA ____________________________________________________249 A. FORMATOS DE 2 Y 5/6 TONOS ____________________________________253 B. HANDOVER ______________________________________________________257
ndice de ilustraciones
NDICE DE ILUSTRACIONES
FIGURAS
1. 2. 3. 4. 5. 6. 7. 8. 9. Sistema bsico de radiolocalizacin paging _______________________________4 Diagrama de bloques de un receptor o radiolocalizaddor ___________________22 Sistema de reconocimiento de voz por aproximacin acstica fontica ________42 Reconocimiento de voz por aproximacin por medio del reconocimiento de la muestra ______________________________________________________43 Capacidad de correccin de palabras con sintaxis _________________________44 Procesador bottom-up _______________________________________________45 Procesador top down ________________________________________________46 Seales sonoras ____________________________________________________47 Seales no sonoras _________________________________________________47
10. Modelo del tracto vocal _____________________________________________49 11. Formas de onda de la voz ____________________________________________50 12. Forma general de un filtro de primer orden ______________________________53 13. Ventana de Hamming _______________________________________________54 14. Aproximacin por medio del reconocimiento de la muestra _________________55 15. Aproximacin acstica fontica _______________________________________55 16. Modelo de anlisis de banco de filtros __________________________________57 17. Modelo de anlisis de LPC ___________________________________________57 18. Proceso de filtrado y muestreo de una seal _____________________________58 19. Modelo completo de anlisis de banco de filtros __________________________59 20. Proceso de filtrado de una seal _______________________________________60 21. Formas de onda y espectros tpicos en el anlisis de banco de filtros __________63 22. Serie de filtros pasabanda de Q canales _________________________________65 xi
23. Variacin del ancho de banda con respecto a la frecuencia __________________67 24. Modelo general filtro IIR ____________________________________________69 25. Modelo general filtro FIR ____________________________________________69 26. Ventana de Hamming funcin coseno __________________________________73 27. Funcin ventana rectangular y de Hamming _____________________________74 28. Forma general de un banco de filtros FIR no uniforme _____________________76 29. Anchos de banda de banco de filtros no uniformes de 3 y 7 bandas ___________77 30. Alineamiento temporal dinmico ______________________________________86 31. Restriccin local ___________________________________________________87 32. Restriccin global __________________________________________________88 33. Mezcla de gausianas ________________________________________________94 34. Organizacin jerrquica de los mdulos acsticos y lingsticos ____________105 35. Estructura para un flujo inverso ______________________________________106 36. Esquema de funcionamiento del proceso de clasificacin basado en HMM ____108 37. Modelo de codificacin ____________________________________________111 38. Modelo de produccin de voz ________________________________________114 39. Vocoder LPC ____________________________________________________116 40. rbitas de la tierra ________________________________________________120 41. Sistema de satlites ________________________________________________122 42. Haces de cada satlite Iridium _______________________________________123 43. Mapa de cobertura del sistema Iridium ________________________________124 44. Estructura de los satlites Iridium _____________________________________125 45. Estructura de una puerta de enlace gateway ___________________________128 46. Asignacin de frecuencias __________________________________________131 47. BPSK ___________________________________________________________135 48. QPSK __________________________________________________________136 49. Generacin de estados de fase en QPSK _______________________________138 50. Transmisin PCM _________________________________________________140 51. Recepcin PCM __________________________________________________141
xii
ndice de ilustraciones
52. FDMA __________________________________________________________142 53. TDMA __________________________________________________________143 54. Servicios del sistema Iridium ________________________________________145 55. Comportamiento poissoniano del tiempo de duracin de una llamada ________155 56. Muestra de llamadas en la hora pico durante una semana __________________156 57. Diseo en bloques red Sistema Integrado de Mensajera ___________________162 58. Conmutacin de circuitos frente a conmutacin de paquetes ________________165 59. Arquitectura de telefona de paquetes abierta ____________________________167 60. Modelo de referencia OSI sobre IP ___________________________________168 61. Arquitectura de redes de voz por paquetes ______________________________170 62. Modelo de interconexin de la red telefnica a la red IP ___________________176 63. Centro de llamadas de telefona de paquetes ____________________________179 64. Infraestructura comn para los agentes de llamadas ______________________179 65. Interrelacin de elementos principales de la red _________________________184 66. Mdulo eventos del sistema _________________________________________184 67. Mdulo mantenimiento de radiolocalizadores ___________________________185 68. Mdulo de mensajes _______________________________________________186 69. Mdulo de operadores _____________________________________________187 70. Mdulo sistema __________________________________________________187 71. Mdulo cuenta abonados ___________________________________________188 72. Caractersticas en el proceso de reconocimiento de voz ___________________192 73. Modelo de comunicacin para el reconocimiento de voz __________________193 74. Patrn de radiacin _______________________________________________211 75. Diagrama general Sistema Integrado de Mensajera _____________________217 76. Esquema de administracin de recursos ________________________________219 77. Implementacin fsica ______________________________________________222 78. Organizacin recursos humanos ______________________________________229
xiii
TABLAS
I. II. III. IV. V. VI. VII. VIII. IX. X. XI. XII. XIII. XV. Clasificacin de las consonantes de acuerdo a su articulacin ____________101 Clasificacin de los fonemas voclicos ______________________________102 Comparacin ISL entre Leonet e Iridium _____________________________133 Componentes H.323 estndar ______________________________________173 Pila de protocolos en VoIP ________________________________________175 Caractersticas generales de la red Lan Ethernet _______________________181 Caractersticas topologa 10BaseT __________________________________182 Lmites mximos de datos del protocolo FlexTM _______________________201 Comparacin de caractersticas de los tipos de protocolo ________________202 Matriz de comparacin de los protocolos ms recientes _________________203 Frecuencias de operacin sistema de radiolocalizacin en Guatemala ______208 Especificaciones elctricas ________________________________________210 Caractersticas del radiolocalizador alfanumrico _____________________214 Balance inicial _________________________________________________231
XIV. Costos de equipos de la red _______________________________________228 XVI. Estimacin de ventas ____________________________________________231 XVII. Depreciaciones y diferidos ________________________________________232 XVIII. Financiamiento _________________________________________________233 XIX. Programa de inversin ___________________________________________234 XX. Beneficios anuales ______________________________________________235 XXI. Flujo neto de efectivo ____________________________________________236 XXII. Clculo del VAN _______________________________________________238 XXIII. Beneficios anuales con operadores _________________________________239 XXIV. Flujo neto de efectivo con operadores _______________________________240 XXV. Clculo del VAN con operadores ___________________________________240 XXVI. Clculo TIR ___________________________________________________242 xiv
Lista de smbolos
LISTA DE SMBOLOS
Convolucin circular Sumatoria Factor de crecimiento logartmico Convolucin discreta Relacin trfico por usuario Intervalo
xv
xvi
Glosario
GLOSARIO
Alfono
Variante en la pronunciacin de un sonido con respecto a su pronunciacin ideal. Son dos toroides cuyo eje es el geomagntico y estn poblados de partculas que daan el satlite. Posicin adoptada por los rganos de la cavidad bucal en el momento de producirse un sonido.
Articulacin
Asignacin dinmica de canales DCA, tcnica en la cual las portadoras estn semipermanentemente asignadas a las celdas del satlite segn las previsiones del trfico. Reduccin en potencia de una onda electromagntica, debido al aumento en la distancia que recorre desde la fuente. Frecuencia comprendida entre los 18 y los 30 GHz., utilizada por el sistema Iridium para la comunicacin entre satlites, y entre satlites y puertas de enlace (Gateway). Frecuencia comprendida entre 1 y 2 GHz., utilizada por el sistema Iridium para la comunicacin entre el satlite y un telfono o radiolocalizador Iridium. xvii
Atenuacin
Banda K
Banda L
Bit
Bps
Cap code
Coarticulacin
Variacin de las caractersticas de un sonido en funcin de la articulacin de los sonidos que lo preceden y lo siguen.
Cobertura
Codificacin de voz
Representacin eficiente en formato digital de la seal de voz para su almacenamiento y/o transmisin.
Correo electrnico
Aplicacin en la cual pueden ser transmitidos mensajes de texto, sobre varios tipos de redes, usando varios tipos de protocolos.
dB
Decibeles, dcima parte de un bel o unidad para la medicin de la intensidad de niveles de potencia de seal.
Desvanecimiento
Fenmeno en el cual los niveles de seal varan en cortas distancias debido a la propagacin por multitrayectorias.
xviii
Glosario
DTW
Dyanamic
Time
Warping,
tcnica
conocida
como
alineamiento temporal dinmica, la cual compara la variacin en el tiempo de dos palabras. Esquema de transmisin digital de rea extendida, predominantemente utilizado en Europa, en el cual se puede transportar informacin a velocidades de 2.048 Mbps. Radioenlace entre dos satlites, tambin conocido como conexin entre satlites. Radioenlace que conecta la estacin terrestre de una puerta de enlace (Gateway) con el satlite para transmitir datos de mensajes. Equipos de transmisin que reciben la seal de la unidad de control, para luego transmitirla a una frecuencia de radio asignada. Frequency Divisin Mltiple Access (Acceso mltiple por divisin de frecuencia), asigna a los usuarios distintas frecuencias en las que pueden comunicarse. Transformada rpida de Fourier Formato de radiolocalizacin de alta velocidad, el cual puede mover datos a una tasa de transferencia de 6400 bps.
E1
Enlace cruzado
Enlace de alimentacin
Estaciones base
FDMA
FFT FLEXTM
xix
Fonema
Unidad estructural ms pequea de sonido que se usa para distinguir una pronunciacin. Realizacin acstica de un fonema. Estudia la estructura o funcin de los sonidos del lenguaje. Propiedad fsica correspondiente a las frecuencias de resonancia del tracto vocal. Se definen perceptualmente. Medida de la direccionalidad de la seal si esta es recibida o enviada a travs del antena. (rbita terrestre
Fono
Fonologa
Formantes
Ganancia de antena
GEO
Geostationary
Earth
Orbit
geostacionaria), mantiene una posicin constante relativa a la superficie de la tierra. Conjunto de reglas que limita el nmero de combinaciones permitidas de las palabras del vocabulario. Llamada en progreso de un abonado, que cruza la frontera de la celda adyacente, asignndole un nuevo canal a la llamada en la nueva celda, para evitar la terminacin de la misma. Patrn de energa de radiofrecuencia emitido por un antena. Los satlites Iridium transmiten hacen radioelctricos muy concentrados.
Gramtica
Handover
Haz de antena
xx
Glosario
HMM
Modelos Ocultos de Markov, se distinguen tres clases generales: modelos continuos, modelos discretos y modelos semi-continuos. Red global de interconexin de redes, donde cientos de miles de redes alrededor del mundo tienden a compartir recursos. Protocolo TCP/IP para envo de paquetes. Constelacin de satlites de rbita baja. Equipos conectados en una red geogrficamente prxima, por ejemplo en el mismo edificio. Low Earth rbita (rbita terrestre baja), altitud orbital inferior a 1,600 Km. sobre la superficie terrestre. Anlisis de prediccin lineal, tcnica que parametriza la seal en un nmero pequeo de patrones con los cuales es posible reconstruirla adecuadamente. Parmetros que representan la envolvente espectral de la voz, utilizando un espaciamiento o resolucin en frecuencia semejante a la que utiliza el odo. Mdium Earth Orbit (rbita terrestre media), franja comprendida entre los 3,200 y los 16,000 Km. sobre la superficie terrestre.
Internet
IP
Iridium
LAN
LEO
LPC
Mel-cepstrum
MEO
xxi
Morfologa
Estudia las reglas de formacin de las palabras a partir de los morfemas elementales.
Parametizacin de la voz Extraccin de rasgos caractersticos de la voz. Post Office Code Standardization Advisory Group. Formato de radiolocalizacin digital sincrnico que permite la transmisin de la informacin en una estructura de conjunto. Estudia el contexto del significado. Proceso en el cual se suaviza el espectro de una seal, para reducir inestabilidades de clculo de precisin finita. Proceso por el cual se extrae la informacin acstica de la seal de voz emitida. Radiacin de ondas electromagnticas. Relacin entre los diferentes sonidos del mensaje hablado que refleja tanto elementos lingsticos (modalidades, nfasis, etc), como elementos no lingsticos (caractersticas del hablante, estado de nimo, etc.). Juego de reglas diseado para facilitar de manera eficiente y creble la transferencia de informacin entre dos dispositivos.
POCSAG
Pragmtico
Prenfasis
Preprocesamiento
Propagacin
Prosodia
Protocolo
xxii
Glosario
Puerta de enlace (Gateway) Iridium Punto de interconexin terrestre que conecta la red de satlites Iridium con la red telefnica pblica conmutada.
Puerta de enlace (Gateway) Se refiere a un dispositivo de propsito especial que realiza la conversin protocolar de informacin entre uno y otro nodo. Quadrature Phase Shift Keying, Modulacin por cambio de fase en cuadratura. Parte del espectro electromagntico entre las regiones de audio e infrarrojas (10 KHz. a 10,000,000 MHz.). Receptor de FM sintonizados a la frecuencia de RF de la estacin base. Pequeo y ligero que funciona con pilas, recibe los mensajes alfanumricos / numricos que pueden leerse en una pantalla, alertando al abonado en formas acsticas, luminosas, vibratorias. Servicio de comunicacin de una va que ofrece mensajera, en el cual los abonados reciben un mensaje alfanumrico / numrico en un receptor (radiolocalizador) designado.
QPSK
Radio Frecuencia
Radiolacalizador
Radiolocalizacin
xxiii
Reparto fijo de canales FCA, tcnica en la cual un conjunto de canales est permanentemente asignado a cada celda. Dispositivo de capa de red que usa uno o ms medios para determinar la trayectoria ptima a lo largo de la red. Estudia como se encadenan las palabras para dar significado a una frase. Sistema Integrado de Mensajera. Estudia la combinacin de las palabras para construir frases de forma correcta. Protocol. Protocolo de
Router
Semntica
SIM
Sintctico
TAP
Telocator
Alphanumeric
comunicacin para enviar mensajes del usuario a la terminal de radiolocalizacin. Time Divisin Mltiple Access (Acceso mltiple por divisin de tiempo), permite a los usuarios utilizar un solo canal de comunicaciones en tiempo compartido. Telocator Network Paging Protocol. Protocolo que hace posible la interconexin entre terminales de radiolocalizacin de diferentes fabricantes.
TDMA
TNPP
xxiv
Glosario
Transponder
Dispositivo
que
recibe
las
portadoras
del
enlace
ascendente, las amplifica, cambia sus frecuencias y las retransmite a la Tierra en nuevas frecuencias. Transmisin Simultanea Envo de seal de radiolocalizacin desde mltiples transmisores al mismo tiempo, consiguiendo una gran rea de cobertura. Interfaz inteligente, recepciona, codifica los mensajes y avisos de acuerdo con un protocolo determinado, los sita en cola y los enva a los transmisores para su difusin. Ventana que no tiene tanta precisin frecuencial, pero su objetivo es suavizar la seal en los bordes. Nmero de palabras diferentes que debe reconocer el sistema de reconocimiento de voz. Voz transmitida sobre el protocolo internet, permite a los usuarios establecer llamadas de voz, fax, datos, etc., sobre conexiones IP.
Unidad de control
Ventana Hamming
Vocabulario
VoIP
xxv
xxvi
Resumen
RESUMEN
Este trabajo, consiste en el diseo de un Sistema Integrado de Mensajera (SIM) adecuado para tener cobertura nacional y global. El tema, versa sobre la adaptacin a radiolocalizacin de las siguientes tecnologas: Reconocimiento de voz, sistema Iridium y voz sobre IP, que al integrarse proporcionan servicios de mensajera virtual. Se aportan suficientes conocimientos conjuntos en dichas tecnologas como para poder afrontar adecuadamente el diseo del SIM. El resultado deseado fue el de un diseo hbrido del SIM, inicindole con el debido dimensionamiento de la red, continuando con el desarrollo de cada parte que contiene el sistema, en cada una de las partes, se describe su funcin y sus requerimientos tcnicos para su debido funcionamiento. Por ejemplo, en la parte de la base de datos se desarrollo la operabilidad de la misma y los campos que debe llevar como mnimo. Para finalizar la parte tcnica, se desarrolla un diagrama general en bloques del sistema que provee el punto de partida para evaluar los servicios prestados y observar un sistema automtico vanguardista en el presente y en un futuro inmediato. Y finalmente se presenta la evaluacin econmica, la cual se enfoca solo en el estudio de preinversin (por ser este un sistema que no se implementar), en este estudio se profundiza en la factibilidad tcnica econmica, distinguiendo tres etapas del mismo, plan de mercado, estudio tcnico (diseo del sistema) y el anlisis econmico por mtodos que consideran el efecto que tiene el tiempo en el dinero y que determinan la conclusin ms significativa, que el sistema en estudio es econmicamente factible.
xxvii
xxviii
Introduccin
INTRODUCCIN
Se presencia en estos das, una progresiva proliferacin por un aprovechamiento y optimacin de los recursos de telecomunicaciones, por ello, resulta cada vez ms atractivo desde un punto de vista de ingeniera y tambin comercial, pensar en una combinacin de las tecnologas para que en un sistema se conjunten varios servicios que se le pueden prestar a un abonado, que debido a su movilidad, este siempre comunicado. Es por esta razn, que el Sistema Integrado de Mensajera propone una unin de servicios de comunicacin, siendo la piedra angular del mismo, un sistema de radiolocalizacin conocido ya por todos como una forma de comunicacin gil, al cual se le incorporan sistemas innovadores como reconocimiento de voz (interfaz hombre mquina), voz sobre IP y el sistema Iridium, que juntos forman la solucin hbrida para prestar servicios de radiolocalizacin automtica con cobertura local y global, servicios de voz sobre IP, datos y otros que se pueden agregar beneficindose de la versatilidad del sistema. Ya que es fundamental el conocimiento de las partes del sistema, se inicia con la radiolocalizacin, la cual, se desglosa en aspectos relevantes que se requieren para su funcionamiento; primero, se describe lo bsico, luego los sistemas de radiolocalizacin manuales y automticos, cobertura, protocolos, y otros temas afines. Reivindicando algo tan simple como, que la voz, es y seguir siendo el interfaz ms natural de comunicacin para las personas, se incorpora a la red de radiolocalizacin un equipo de reconocimiento de voz, el cual hace posible la comunicacin del hombre con las mquinas utilizando la voz. Esta comunicacin no es ms que el proceso de conversin de un mensaje hablado en texto que permita al usuario enviar su mensaje, con satisfaccin y sin recurrir a operadoras. xxix El captulo dos,
contempla la teora necesaria en la que se basan los sistemas de reconocimiento de voz, describiendo las disciplinas aplicadas en los mismos, tipos de reconocimiento de voz, y las formas utilizadas en el anlisis del reconocimiento, siendo una de ellas ms compleja que la otra, ya que trata de reconocer la voz desde un anlisis espectral (utilizando tcnicas completas como LPC, MFCC), pasando por un reconocimiento de fonemas (utilizando DTW, HMM) para determinar las caractersticas acsticas, y luego determinar caractersticas gramaticales. Tambin se describen temas afines al anlisis de reconocimiento como cuantizacin, alineamiento temporal dinmico (DTW), modelos de Markov y codificacin.
La gran demanda de un sistema mvil global, la diversidad de normas celulares terrestres, las grandes reas continentales y, sobre todo, martimas con cobertura limitada o sin ningn tipo de infraestructura de telecomunicaciones y los servicios aeronuticos sin aplicaciones globales son los principales argumentos para que naciera el sistema Iridium y diera respuesta a estas necesidades. Consiste en una constelacin de satlites en orbita baja (LEO) que ofrece servicios de telefona, datos y radiolocalizacin que adems hace interfaz con las redes terrestres existentes. La incorporacin de Iridium al sistema integrado de mensajera se debe a que ofrece ventajas significativas respecto a las redes terrestres, proporcionando una cobertura global, un rpido despliegue de la red, pretendiendo con ello que los abonados reciban mensajes de los satlites desde cualquier punto terrestre, martimo o incluso en el aire (principalmente partes de Guatemala sin cobertura), teniendo con ello un sistema que integra un mundo, un radiolocalizador y una factura. El captulo titulado sistema Iridium habla y desglosa los temas principales: Constelacin de satlites de orbita baja (LEO) y funcionamiento del sistema.
El captulo red Sistema Integrado de Mensajera, no es ms que la unificacin de los sistemas hablados en los captulos del uno al tres, ms la incorporacin de voz sobre IP. Empieza con un tema importantsimo en el diseo de redes, que es la planificacin y xxx
Introduccin
dimensionado de red; continuando con el diseo del sistema, el cual se desglosa en bloques para ir describiendo cada bloque y cada componente que lo conforma (por ejemplo: servidores, terminales de radiolocalizacin, transmisin, recepcin y otros) hasta llegar a un diseo general del Sistema Integrado de Mensajera y sus servicios. Se da tambin, una breve introduccin a voz sobre IP, su arquitectura, funcionamiento del intercomunicador de redes de telefona tradicional a voz sobre IP, caractersticas del estndar H.323 y protocolos utilizados en el proceso de una llamada. Y para finalizar con una evaluacin econmica del sistema, dicha evaluacin solo comprende el estudio de preinversin que determina la bondad del proyecto analizada por mtodos cuantificados. Finalmente, se comentan la conclusiones, recomendaciones y se dan dos apndices con temas interesantes, el primero, formatos de 2 y 5/6 tonos y el segundo, handover de la constelacin Iridium
xxxi
xxxii
Captulo 1
El sistema de radiolocalizacin es probablemente el ms simple de los servicios mviles va radio que existen, es un sistema de comunicacin unidireccional, personal y selectivo de alerta, sin mensaje o con un mensaje definido, compuesto por caracteres numricos y alfanumricos. En este captulo, se describen los fundamentos tericos del sistema de radiolocalizacin, incluyendo su clasificacin en sistemas manual y automtico, caractersticas de factores determinantes en la cobertura del sistema, protocolos de sealizacin, estructura y caractersticas de los receptores y para finalizar, caractersticas de terminales de radiolocalizacin, controladores y estaciones base.
radiolocalizador y busca en el directorio o base de datos la direccin del abonado, conocida como cap code, convirtiendo la direccin y el mensaje al protocolo apropiado de sealizacin de radiolocalizacin. El cap code es una direccin nica la cual, lo habilita para encontrar el radiolocalizador que se quiere alcanzar en cualquier lugar dentro del sistema. La seal codificada de radiolocalizacin se enva a los transmisores (estaciones base), mediante los sistemas de control de transmisin de radiolocalizacin, y es radiado al rea de cobertura en la frecuencia especificada.
1.1.1. Codificador
Los dispositivos de codificacin convierten nmeros de radiolocalizador a cdigos que pueden transmitirse. Hay dos formas en las cuales los codificadores aceptan nmeros de radilocalizador: manual o automticamente. En la codificacin manual, un operador del sistema ingresa los nmeros y mensajes mediante un teclado conectado al codificador. Mientras que en un codificador automtico, alguien marca a una terminal automtica y usa el teclado telefnico para ingresar los nmeros del radiolocalizador. El codificador genera el cdigo del radiolocalizador correspondiente al nmero marcado y lo enva a la estacin base para su radio transmisin.
Captulo 1
1.1.3. Receptores
Estos son esencialmente receptores de FM sintonizados a la frecuencia de RF de la estacin base del sistema. Una unidad decodificadora incorporada en cada A los radiolocalizador podr reconocer su cdigo y rechazar otros cdigos.
radiolocalizadores pueden asignrseles intencionalmente los mismos cdigos para la radiolocalizacin de grupo. Hay tambin, radiolocalizadores que pueden asignrseles cdigos de mensaje mltiple, tpicamente a un mximo de cuatro, individualmente, de grupo y otras funciones de radiolocalizacin. La funcin bsica del radiolocalizador es alertar. Al recibir su cdigo, el receptor pone una alarma que puede ser audible (tono), visual (indicador de pestaeo) o silenciosa (vibrador). Otras funciones de mensajera tambin pueden realizarse y estas incluyen voz y/o despliegue (numrico / alfanumrico) del mensaje en la pantalla. Algunos radiolocalizadores pueden realizar las tres funciones de mensajera.
Equipo Tx
Recep tor
Equipo Tx
R ecep tor
Centro de llamadas
R ecep tor
PC
Equipo T x.
Recep tor
Captulo 1
Conexin telefnica: respuesta automtica y corte. Sugerencias (voz o tonos): le indica al usuario cuando proporcionar el nmero y el mensaje. Base de Datos: tiene los nmeros, cdigos, tipos de mensajes esperados..., etc., en un archivo de computadora. Codificador: genera cdigos anlogos o binarios transmisibles. Unidad de Control del transmisor: monitorea canales, transmite claves y enva seales al transmisor.
Captulo 1
El usuario marca el nmero. El usuario marca el mensaje numrico con su teclado o dice el mensaje; entonces indica el fin del mensaje. Verificacin del nmero marcado; la aceptacin de la llamada es enrutada al conmutador. Para llamadas por tonos, un sonido especial se enva para indicar al usuario que el mensaje ha sido aceptado. Para mensajes numricos o de voz, un patrn especfico de tonos o de voz inducen al usuario a enviar su mensaje o nmero telefnico. Un mensaje especfico de aceptacin por tono o voz se enva al usuario; Una seal de fin de llamada se enva a la telefnica. Las llamadas se enrutan a una terminal de radiolocalizacin. Se establece un canal entre el usuario y la terminal de radiolocalizacin. Desconecta el canal de voz.
1.2.2.2.2. Alfanumrico
El usuario ingresa el nmero telefnico, el nmero del radiolocalizador y el mensaje alfanumrico en un dispositivo A/N. El dispositivo marca el nmero telefnico. El dispositivo sealiza. El dispositivo enva el nmero del radiolocalizador y mensaje de A/N. El mensaje se divide en segmentos, si es demasiado largo. El dispositivo enva una secuencia de desconexin. El dispositivo desconecta la lnea telefnica. La terminal de radiolocalizacin responde.
La terminal alerta al dispositivo para sealizacin (por clave) ms adelante. Responde con una seal de aceptacin a la sealizacin, enva secuencia de adelante cuando est lista, cada segmento es probado para asegurar su correcta recepcin. De acuerdo al resultado de la prueba se da la apropiada respuesta, por ejemplo, un reenvo debera ser requerido si hay error de transmisin. Cuando l ultimo segmento se recibe, se enva una seal de mensaje aceptado.
La terminal de radiolocalizacin responde y desconecta la lnea telefnica. Encamina la llamada a la terminal de radiolocalizacin. Coloca un canal de voz directo entre el usuario y la terminal de radiolocalizacin. Desconecta el canal.
Para los sistemas privados locales, por ejemplo aquellos que se usan en hospitales, hoteles y fbricas, la cobertura esta limitada y generalmente usan un solo sistema con transmisor compacto de bajo costo, poca potencia (hasta 10W).
La cobertura para sistemas de radiolocalizacin pblicos puede variar significativamente en extensin. Para una ciudad pequea o pas pequeo, un transmisor debera ser suficiente, pero cuando el rea a cubrirse es grande podra ser necesario tener varios sitios de transmisin. Cuando se usa ms de un transmisor con el propsito de 8
Captulo 1
mejorar la cobertura, la tcnica de transmisin simultnea desde todos los transmisores necesita utilizarse. Tambin, una red de radiolocalizadores se examinar, este es un arreglo mediante el cual se encadena o conecta con otros sistemas de manera que el subscriptor fuera del rango de su sistema propietario an puede ser localizado. Esto es posible transfiriendo los requerimientos desde su sistema a travs de la red al sistema que cubre su nueva localizacin. Las redes habilitan localizacin a lo ancho de la nacin de grandes pases como los Estados Unidos y cuando se encadenan con satlites en la red se pueden realizar localizaciones internacionales o globales.
10
Captulo 1
Una antena omnidireccional irradia una seal con igual ganancia en todas las direcciones mientras que una antena direccional provee una ganancia relativamente grande en una direccin en particular. La eleccin del tipo de antena apropiado y la alineacin y el ajuste dan un patrn consistente con la cobertura deseada. Algunas veces el patrn de cobertura tambin se ajusta con antenas direccionales, para minimizar la interferencia con otros sistemas de comunicacin que usan una frecuencia similar o cercana a la del sistema de radiolocalizacin.
11
1.3.1.7. Desvanecimiento
El desvanecimiento es un fenmeno mediante el cual los niveles de seal varan en cortas distancias debido a la propagacin por multitrayectorias. Adicionalmente, las condiciones atmosfricas varan, la trayectoria de transmisin se altera y esto podra incrementar o decrementar la efectiva transparencia de la trayectoria. El severo desvanecimiento por multitrayectoria usualmente aumenta conforme la frecuencia se incrementa, y esto puede predecirse usando mtodos estadsticos. Un margen de tolerancia se agrega con frecuencia mediante el clculo de cobertura para cuidarse del desvanecimiento.
12
Captulo 1
Para comprobar si un lugar esta dentro del rea de cobertura de una estacin de radiolocalizacin, se calcula la intensidad del campo de recepcin en ese lugar. Esto se hace iniciando con la potencia de transmisin, agregando prdidas y ganancias al antena y restndole todas las prdidas mencionadas ms las prdidas en la lnea de transmisin, conectores y filtros. En un punto en el margen del rea de cobertura, debe tener un valor mayor de intensidad de seal que la sensibilidad del receptor, para tener algn margen de desvanecimiento.
13
b)
Una configuracin especial de sectores la cual podra disearse en un sistema de mltiple transmisin permitira programar transmisiones por sector. Cada sector puede tener varios transmisores. El control de sectores permitira direccionar solamente el grupo requerido de transmisores para un servicio en particular. Esto permite tambin variar las tarifas a cobrar a los abonados.
c)
Las prdidas por obstruccin debidas a colinas, rboles, y edificios, resultan considerablemente reducidas por las configuraciones de transmisores mltiples. Por ejemplo, si un abonado esta oculto por una colina con respecto a un transmisor, hay una alta probabilidad de que un segundo transmisor tenga una trayectoria libre.
14
Captulo 1
Los transmisores incorporan osciladores sumamente estables para asegurarse que cualquier diferencia en la frecuencia de la portadora, se mantenga por debajo de los lmites especificados para una apropiada operacin en transmisin simultnea. portadora se ajustan a lmites aceptables. Las diferencias en distancias desde el radiolocalizador hacia los diferentes transmisores provoca que las seales de audio lleguen en diferentes momentos, por ejemplo llegan fuera de fase una respecto de la otra. Los ecualizadores de audio, que son elementos de tiempo de retraso variable, se utilizan en las emisoras para ocuparse de este indeseable desfasamiento. Ajustes precisos en los niveles de audio se ejecutan en los transmisores para optimar el sistema de transmisin simultnea. A intervalos regulares s resintonizan los osciladores, por ejemplo las frecuencias de
15
Para comunicaciones entre redes de radiolocalizadores, se han desarrollado varios protocolos de comunicacin. Un protocolo de comunicacin, se define como un juego de reglas diseado para facilitar de manera eficiente y creble, la transferencia de informacin entre dos estaciones. Por ejemplo, un protocolo puede especificar que la informacin puede dividirse en paquetes de cierto tamao y que el envo de la informacin de la direccin de destino debe preceder a los datos. Y si hay errores en un paquete recibido, la estacin de destino puede pedir su reenvo desde el original. Los protocolos propietarios son en su mayora incompatibles con otros, de ah que las redes de radiolocalizadores estn usualmente usando radiolocalizadores de un nico proveedor. A fin de permitir la interconexin de equipos provenientes de diferentes fabricantes en una misma red, debern usarse puertas de enlace (gateways). Hay esencialmente dispositivos interconectables los cuales efectan conversiones de protocolo es decir que actan como traductores de idiomas, lo que permite que redes de equipo incompatibles hablen y trabajen juntos. La mejor solucin es crear un protocolo estndar de la industria, tal como X.25 y TNPP. El TNPP son siglas de Telocator Network Paging Protocol es uno de los protocolos mas ampliamente aceptados y empleados para la creacin de redes constituidas por equipos provenientes de diferentes fabricantes. Tambin puede usarse en el caso de redes que usan equipo semejante. Es un protocolo de comunicaciones digitales punto a punto, que asegura confiablemente el envo de informacin de una terminal a otra. El enrutamiento de radiolocalizacin a travs de la red no esta cubierto en las especificaciones del TNPP, es solamente un protocolo punto a punto. Sin embargo, en una gran red de radiolocalizadores, el enrutamiento debe efectuarse eficientemente y, en la mayora de tales redes, los algoritmos de enrutamiento son siempre implementados para trasladar mensajes entre uno y ms nodos.
16
Captulo 1
El TNPP no esta restringido a encadenar radiolocalizadores a travs de lnea fsica. Los requerimientos de radiolocalizacin pueden eventualmente ser radiados a satlite para terminales en lugares distantes. Esto puede extender la cobertura por sobre las fronteras internacionales en un sistema de red satelital, el protocolo asegura confiabilidad en el envo de datos mediante la transmisin de los mismos muchas veces desde la fuente, al mismo tiempo asegura que la informacin duplicada no se recibe en el destino. Esta tcnica de mltiple retransmisin se requiere porque la comunicacin a larga distancia involucra evitar el envo de seales desde el destino a la fuente, confirmando que los datos han sido correctamente recibidos. El TNPP a provedo facilidades tales como correo electrnico y monitoreo de estado remoto.
17
18
Captulo 1
19
Los formatos de cdigo binario proveen las siguientes mejoras y caractersticas sobre los formatos anlogos previos: Mayor nmero de cdigos y mltiple capacidad de direccionamiento. Expansin del tamao de usuarios y flexibilidad. Capacidad de multifuncin: timbre, tono, voz y mensajes de datos. Eficiente uso de las bateras. Sealizacin rpida. Excelente capacidad de correccin de error y probabilidad de recepcin.
20
Captulo 1
c.
Deteccin y correccin de error: la mxima ventaja de la velocidad es la capacidad de deteccin y correccin de error incorporado dentro de los formatos de codificacin digital. Esto permite errores en la transmisin que pueden ser detectados y corregidos.
21
Seales de Radio
Modulo de Radio
Datos
Vibrador
Pantalla
22
Captulo 1
Basndose en la figura 2, un radiolocalizador moderno tpico esta constituido de los siguientes mdulos: a) b) c) d) e) Receptor: recibe y demodula las seales de localizacin. Decodificador: decodifica informacin binaria. Pantalla: presenta los mensajes y otras informaciones. Control: permite a los usuarios la colocacin de parmetros y el acceso a la informacin. Batera: fuente de energa.
23
b.
Llamada de grupo El radiolocalizador esta provisto de dos cdigos. Uno de estos para llamadas
individuales y el otro para llamadas de grupo. Las llamadas de grupo permiten a un seleccionado grupo de individuos dentro del sistema que sean localizados simultneamente por ejemplo: los bomberos y rescatistas. c. Correccin y deteccin de error La mayora de los protocolos digitales de sealizacin, estn equipados con cdigos de deteccin y correccin de errores para asegurar una confiable recepcin de los datos transmitidos. Esto involucra el envo de informacin adicional "con los datos" el cual habilita al receptor para verificar la presencia de errores en la transmisin y efectuar la correccin si es necesaria. d. Alerta silente Algunos localizadores tienen un vibrador para avisar la recepcin de llamadas. Muy til es en situaciones o lugares donde el tono de alerta no es aceptable, reuniones, servicios religiosos, etc. e. Deteccin de mensajes duplicados Si un mensaje nuevo es idntico a un mensaje almacenado este no se memorizar. Aparecer un indicador de duplicado para alertar que el mensaje ha sido recibido ms de una vez. Esto previene el uso innecesario de memoria por mensajes duplicados.
24
Captulo 1
f.
Retencin de memoria (Memoria no voltil) Los mensajes y parmetros del radiolocalizador permanecen en memoria an
cuando este se apague o se le cambie la batera. g. Contador de mensajes no ledos Cada vez que un mensaje se recibe, se actualiza la pantalla para reflejar el nmero de mensajes no ledos en memoria. h. Mensajes protegidos Un cierto nmero de mensajes puede protegerse dentro de la memoria. Esto previene que tales sean sobrescritos por mensajes nuevos o se borren por error. i. Mensaje congelado El abonado puede detener un mensaje en la pantalla manteniendo presionado el botn read. Esto permite mantener el mensaje mientras se marca el nmero telefnico o se copia. j. Presentador iluminado Presionar un botn ilumina la pantalla. Esto permite leer en condiciones de poca luz.
25
k.
Murmullo de alerta Cuando un radiolocalizador esta puesto en modo vibrador, se emite un tono corto a
la recepcin de un mensaje. Esto es en lugar del timbrazo habitual que puede molestar. l. Indicador de memoria llena Cuando el nmero de mensajes o caracteres almacenados alcanza su capacidad, el radiolocalizador presenta Memorie Full en la pantalla. Esto le da la oportunidad al abonado de ver sus mensajes y evitar as que algunos importantes sean sacados de la memoria por nuevos mensajes. m. Programacin El EEPROM del radiolocalizador puede reprogramarse mediante una PC y un programa de protocolo. Este mtodo puede usarse para configurar al radiolocalizador sus cdigos y opciones remotamente sin que el usuario tenga ningn inconveniente. El radiolocalizador no tiene que ir necesariamente a un centro de servicio para ser configurado. n. Indicador de fuente Cuando selecciona, un indicador de fuente aparecer al final de cada mensaje de datos. La fuente dir que nmero telefnico se utiliz para enviar el mensaje y proveer informacin adicional al abonado.
26
Captulo 1
o.
previamente asignado. Esto minimiza consumo de batera y el inconveniente de tener que apagarlo manualmente. p. Servicios de informacin Los cdigos de los radiolocalizadores pueden programarse con servicios de informacin, por ejemplo resultados deportivos, bolsa de valores, estado del tiempo, etc. dicha informacin se recibe y se almacenan en sus propias localidades de memoria. Esto permite al usuario acceder a informacin especfica en cualquier momento y siempre tendr la informacin mas actualizada.
1.5.2. Terminales de radiolocalizacin 1.5.2.1. Caractersticas del MPS2000 interruptor modular de radiolocalizacin
Diseo modular para fcil y efectiva expansin. Gran capacidad de procesamiento y ms de un 1,000,000 de usuarios. Arquitectura flexible, procesador de entrada y salida que pueden encontrarse local o remotamente mientras se use un procesador central como nico punto de facturacin y mantenimiento. Manejo eficiente del trfico: soporta un gran volumen de llamadas. Capacidad de red: provee un nmero de opciones de red incluyendo TNNP, EUROMESSAGING, X.25, y Follow-me.
27
Anuncios de voz: tiene disponibilidad para mensajes de voz de alta calidad de norma y personalizados. Redundancia: Cualquiera de todos los mdulos principales del sistema son configurables como redundantes, proveyendo una verdadera redundancia a mltiples niveles.
28
Captulo 1
29
Control por microprocesador ofrece la mxima flexibilidad para cambios en el sistema y parmetros de operacin.
Un sistema de procesamiento digital de la seal soporta cuatro niveles de operacin y cdigos de alta velocidad.
Un diseo trmico ptimo y disipadores trmicos confiables para prolongar la vida de los componentes e incrementar la confiabilidad de la estacin.
Fcil mantenimiento debido a su diseo completamente modular, panel frontal de acceso y mdulos de componentes tipo gaveta.
Trabaja con diferentes distribucin de medios: lnea fsica, radio enlaces, microondas.
Una amplia variedad de salidas de RF disponibles desde 20 hasta 350 watios. Disponible en diferentes bandas de frecuencia: VHF, 280 Mhz, 900 Mhz y UHF.
Acomoda todos los formatos de localizacin: voz, 2 tonos, 5/6 tonos, POCSAG, GSC, y FLEXTM que pueden usarse solos o en combinacin.
Las estaciones base pueden ser local o remotamente controladas y monitoreadas. Un controlador remoto centralmente localizado, ofrece muchas ventajas operacionales. Esto es especialmente cierto en el caso de transmisin simultanea donde la ecualizacin del sistema de parmetros importantes en la estacin base pueden realizarse automticamente desde cualquiera de las estaciones.
30
Captulo 2
Reconocimiento de voz
2. RECONOCIMIENTO DE VOZ
La investigacin en el rea del tratamiento de la voz, ha permitido desarrollar sistemas de reconocimiento de voz que el hecho de comunicarse con un procesador ya no es una utopa, y mediante una serie de herramientas, se pueden crear programas en los que la interaccin del usuario y la mquina sea lo ms cercana posible a la relacin comn que se tiene con las dems personas. La meta de este captulo es dar una serie de principios de reconocimiento de voz, que permitan adecuarlo a un sistema integrado de mensajera ya que en teora, el reconocimiento de voz nunca escucha conversaciones entre personas, y cuando se da un comando de parte del usuario, el ordenador nunca comete un error. Si los ordenadores tuvieran un reconocimiento de voz perfecto, todos estaran hablando con ellos en forma natural. Pasarn dcadas antes de que esta tecnologa sea perfecta. A pesar de este detalle, el reconocimiento de voz es muy til en un sistema integrado de mensajera, ya que nicamente permite introducir nuevas interfaces del usuario para un mejor manejo del entorno informtico, y as en combinacin con otras tecnologas existentes poder ampliar las funcionalidades de este sistema y obtener un rendimiento mximo del mismo. Uno de los aspectos ms difciles del reconocimiento de voz es su naturaleza interdisciplinaria, a continuacin, se consideran las disciplinas aplicadas en el reconocimiento de voz:
31
1.
Procesamiento de seal: es el proceso de extraer informacin pertinente de la seal de voz en una manera robusta y eficiente. Incluido en el procesamiento de seal, el anlisis espectral usado para caracterizar las propiedades variantes en el tiempo de la voz, as como varios tipos de preprocesamiento y postprocesamiento de seal de la misma, para hacer la voz ms robusta al ambiente magnetofnico y tener una seal de voz perfeccionada.
2.
Acstica: la ciencia que comprende la relacin entre la seal fsica de la voz y los mecanismos fisiolgicos (mecanismo del tracto vocal humano) que producen la voz y la perciben (mecanismo del odo humano).
3.
Modelo del reconocimiento de voz: juego de algoritmos usados para agrupar datos y crear prototipos en base a esos datos, y comparar un par de modelos en base a las caractersticas medidas de los patrones.
4.
Teora de la comunicacin y la informacin: procedimientos para estimar parmetros de modelos estadsticos; los mtodos para detectar la presencia de modelos particulares de voz, juego de algoritmos de codificacin y decodificacin (algoritmos de pila, decodificacin Viterbi) usados para buscar un camino mejor en el reconocimiento del habla continua.
5.
Lingstica: comprende la relacin entre sonidos (fonologa), palabras de un idioma (sintaxis), significado de las palabras habladas (semntica), y el sentido derivado del significado (pragmtico). Incluido dentro de esta disciplina la metodologa de la gramtica y equivalencia de un lenguaje.
6.
Fisiologa: comprende los mecanismos de orden alto del sistema nervioso humano que cuenta para la produccin y la percepcin de la voz.
32
Captulo 2
Reconocimiento de voz
7.
Ciencia de la computacin: comprende el estudio de algoritmos eficientes para llevar a cabo, en software y/o hardware, los varios mtodos usados en un sistema prctico de reconocimiento de voz.
8.
Psicologa: comprende los factores que permiten usar una tecnologa para seres humanos en tareas prcticas.
reconocimiento de voz la cual es el tamao del vocabulario, este puede incluir un vocabulario pequeo que permite a los usuarios dar rdenes simples a sus ordenadores; o grande que permite al usuario dictar un documento, este aumenta los requisitos de memoria y procesador del ordenador.
34
Captulo 2
Reconocimiento de voz
continuo en lugar del discreto, con la salvedad de que el continuo requiere ms tiempo
Aunque cualquier combinacin de las cuatro tcnicas es posible, dos de ellas son las ms utilizadas actualmente:
Control slo pueden decir frases especficas, stas deben ser visibles en pantalla para que el usuario sepa qu decir en cualquier momento.
36
Captulo 2
Reconocimiento de voz
La mayora de formas de reconocimiento de voz, convierten datos de audio entrantes en fonemas especficos que se traducen en texto (un fonema es la unidad estructural ms pequea de sonido que puede usarse para distinguir una pronunciacin de otro en un idioma hablado). Esta tcnica tiene como base un programa de software residente que queda en memoria una vez instalado, en primer lugar el software debe de tener la capacidad para determinar cuando empieza y termina una orden, esto lo logra transformando la seal de voz que entra por el micrfono en tensiones. Cuando la seal de voz excede un cierto valor, en ese momento la orden habr comenzado y cuando, la seal caiga por debajo de ese nivel, la orden habr finalizado. La transformacin de la seal de voz a tensiones requiere que se utilice un convertidor analgico digital (ADC), las tensiones son convertidas en nmeros binarios o un formato puramente digital, generalmente en el rango de 127 a 128 para un convertidor de 8 bits, y de 32768 a 32767 para un convertidor de 16 bits. Cada uno de los valores representa la posicin de la onda de sonido en un instante determinado.
Esta cadena de bits resultante es almacenada en algn lugar de la memoria (buffer), despus de que el software determina que se ha terminado de pronunciar la orden, generalmente captando una pausa significativa en la voz, pasar el contenido del buffer por una serie de filtros para eliminar el ruido de fondo que puede interferir en el proceso de reconocimiento de patrones.
Despus del proceso de filtrado, el software realiza el algoritmo de reconocimiento de patrones. La cadena de bytes grabada por el software se compara con cada uno de los patrones disponibles, que son cadenas de bits que el sistema ha grabado previamente cuando se entrena para reconocer una serie de rdenes habladas. Al realizarse cada comparacin, se calcula una puntuacin basada en cuanto se parece la palabra al patrn. Cuando se ha calculado la puntuacin para cada patrn, el software escoge aquella o aquellas con una puntuacin mayor. Si la puntuacin est dentro de unos mrgenes de tolerancia determinados, el sistema ejecutar una macro asociada a ese patrn. La 37
ejecucin de la macro slo ocurre si un solo patrn es seleccionado por el software. Si selecciona ms de uno, el sistema supone que no puede asociar la palabra pronunciada con uno de los patrones y simplemente ignora la orden.
A continuacin se muestra un algoritmo general para este tipo de tcnica de reconocimiento de voz.
Inicio; Recibir seal de voz Transformar seal de voz a formato digital Grabar formato digital de voz Filtrar formato digital de voz Inicio; Compara la voz con las pregrabadas Puntuar cada voz Fin; Escoger la voz regrabada con la puntuacin mayor Ejecutar macro Fin.
38
Captulo 2
Reconocimiento de voz
Tpicamente el reconocimiento comienza con el muestreo digital del lenguaje. El siguiente paso es el proceso de la seal acstica. Las tcnicas ms frecuentes incluyen el anlisis espectral; por ejemplo, anlisis LPC (Linear Predictive Coding, prediccin lineal codificada), MFCC (Mel Frequency Cepstral Coefficients), modelado de la cclea, y otras. El siguiente paso es el reconocimiento de fonemas, grupos de fonemas y palabras. Este paso puede ejecutarse de varias formas, mediante DTW (Dynamic Time Warping), HMM (Hidden Markov Modelling), NNs (Neural Networks), sistemas expertos y combinacin de tcnicas. Actualmente los sistemas basados en HMMs son los ms frecuentemente utilizados, y la aproximacin ms exitosa. A continuacin se describen los mtodos aproximados de reconocimiento de voz y los procesos anteriormente mencionados que lleva producir un sistema de reconocimiento de voz, donde se pueda utilizar un dictado continuo y que sea independiente del hablante.
39
El prximo paso en el proceso es el de deteccin de la caracterstica de la voz. La idea aqu es convertir las medidas espectrales a un juego de caractersticas grandes que describen las propiedades acsticas de las diferentes unidades fonticas. Entre las caractersticas propuestas para el reconocimiento esta la presencia o ausencia de la resonancia nasal, la presencia o ausencia de la excitacin cuando se habla, las frecuencias de las tres primeras resonancias, la forma aperidica o peridica, y la presencia de frecuencias altas y bajas. Estas caractersticas propuestas son binarias y continuas inherentemente. Este proceso normalmente consiste en un juego de detectores que operan en paralelo y tienen la lgica apropiada para tomar la decisin acerca de la presencia o ausencia de un valor o una caracterstica.
Los algoritmos usados para estos detectores son bastantes sofisticados que hacen ms fcil el procesamiento de seal.
El tercer paso en este proceso es la segmentacin y calificacin con que el sistema intenta encontrar regiones estables para luego calificar la regin segmentada que otorga las caractersticas dentro de esa regin para luego igualar las unidades acsticas fonticas. Esta es la base del reconocedor acstico fontico y es la ms difcil de llevar a cabo.
40
Captulo 2
Reconocimiento de voz
La figura 3 (pgina 42) muestra un diagrama en bloques de un sistema de reconocimiento de voz por aproximacin acstica fontica.
41
Detectores de caractersticas
S(n)
Control estratgico
Reconocimiento de voz
Detectores de caractersticas Formantes Tono Voz Energa Fonemas Segmentacin Designacin probabilstica Anlisis estratgico rbol de decisiones
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 45.
Figura 4. Reconocimiento de voz por aproximacin por medio del reconocimiento de la muestra
Evaluacin de la muestra Preparacin de la muestra Modelos o patrones
Medida de la caracterstica de s(n) Voz s(n) Sistema de anlisis Banco de filtros LPC DFT
Decisin lgica
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 51.
42
Captulo 2
Reconocimiento de voz
43
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 54.
44
Captulo 2
Reconocimiento de voz
Emisin de Voz
Procesamiento de seal
Extraccin de caractersticas
Conocimiento de fuentes
Segmentacin
Designacin
Fusin de sonidos
Reglas fonticas
Verificacin de palabra
Lxico
Modelo de lenguaje
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 55.
45
Sistema de comparacin
Diccionario de palabras
Hipotesis lexicogrfica
Verificador de expresin
Expresin reconocida
Gramtica
Hiptesis sintntica
Modelo ajustado
Hiptesis semntica
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 55.
46
Captulo 2
Reconocimiento de voz
a.
Las seales sonoras que se caracterizan por tener alta energa y contenido frecuencial en el rango de los 300 Hz a 4000 Hz las cuales se generan por intermedio de las cuerdas vocales y adems presentan cierta periodicidad como se muestra en la figura 8.
b.
Las seales no sonoras tambin conocidas como fricativas se caracterizan por tener baja energa y componente frecuencial uniforme presentando aleatoriedad en forma de ruido blanco se muestra en la figura 9.
Este modelo se caracteriza en dividir la seal de voz en dos partes, anteriormente mencionadas las cuales se modelan como dos fuentes de excitacin las que alimentan al sistema acstico que conforma el tracto vocal.
47
El tracto vocal modelado se manifiesta como un filtro variable en el tiempo cuyos parmetros varan en el tiempo en funcin de la accin consciente que se realiza al pronunciar una palabra. El filtro variable en el tiempo tiene dos posibles seales de entrada que dependern del tipo de seal, sonora o no sonora. Para seales sonoras la excitacin ser un tren de impulsos de frecuencia controlada, mientras que para las seales no sonoras la excitacin ser ruido aleatorio. La combinacin de estas seales simula el funcionamiento de la glotis. El espectro de frecuencias de la seal de voz puede obtenerse a partir del producto del espectro de la excitacin por la respuesta en frecuencia del filtro. El tracto vocal manifiesta un nmero muy grande de resonancias, sin embargo, se consideran solo las tres o cuatro primeras que toman el nombre de formantes y cubren un rango de frecuencias entre 100 y 3500 Hz. Esto debido a que las resonancias de alta frecuencia son atenuadas por la caracterstica frecuencial del tracto que tiende a actuar como un filtro pasabajo con una cada de aproximadamente 12 dB por octava. Este modelo es una simplificacin del proceso de voz. Los sonidos fricativos no se filtran por el tracto con la misma extensin en que lo hacen las seales sonoras por lo que el modelo no es muy preciso para este tipo de seales. Adems, el modelo supone que las dos seales pueden separarse sin considerar ninguna interaccin entre ellas, lo cual no es cierto ya que la vibracin de cuerdas vocales es afectada por las ondas de presin dentro del tracto. Sin embargo estas consideraciones pueden ser ignoradas resultando el modelo lo suficientemente adecuado, el cual se muestra en la figura 10.
48
Captulo 2
Reconocimiento de voz
x
Generador de ruido aleatorio
Voz
49
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 18.
Analizando la figura 11, se tiene que cada lnea de la forma de onda corresponde a 100 mseg de seal (1/10 seg.), y que cada parte entera abarca aproximadamente 0.5 seg. La naturaleza variante de la seal en el espacio de tiempo puede empezar a ser vista en los primeros 100 mseg de la forma de onda (primera lnea) que corresponde a el silencio de fondo que por consiguiente es baja en amplitud; en los prximos 100 mseg de la forma de onda (segunda lnea), se empieza a mostrar pequeos aumentos en la amplitud que van marcando aumentos significativos para que la forma de onda tenga un cambio grande y empiece a tener una periodicidad. Hay varias formas de clasificar los eventos de la voz, quizs la ms simple est en va de la produccin de la voz como se muestra en la figura 11. Se pueden tener aqu tres estados que son:
50
Captulo 2
Reconocimiento de voz
1. 2. 3.
Silencio (S): donde ningn sonido se produce, Sin voz (U): donde los cordones vocales no estn vibrando y la forma de onda es aperidica, y Voz (V): donde los cordones vocales se tensan y por consiguiente vibran peridicamente, entonces tenemos una forma de onda casi peridica. Debe quedar claro que la segmentacin de la forma de onda en varias partes de las
expresiones de voz no es tan exacta, ya que a menudo es difcil distinguir un sonido dbil de uno fuerte.
codificada (LPC). Tambin se describe la tcnica llamada cuantizacin vectorial que es un procedimiento que codifica la representacin espectral continua, el conjunto de formas tpicas espectrales codificadas hacen un ndice codificado (codebook), conformando los niveles de cuantizacin, esta tcnica de cuantizacin vectorial puede aplicarse a cualquier representacin espectral y puede ser incluida en los modelos de banco de filtros y LPC.
( z ) = az 1
donde a = 0.95 La ecuacin diferencial es:
(2.1)
S (n) = s (n) a * s (n 1)
52
(2.2)
Captulo 2
Reconocimiento de voz
s(n)
Z-1
S(n)
En la etapa siguiente, la seal preacentuada se toma cada 10mseg., por espacio de 20 mseg., y se la somete a una ventana de Hamming con el objeto de suavizar la seal en los bordes de dicha ventana, la cual se muestra en la figura 13. Esta es la ventana que generalmente se usa para el anlisis de seales de voz, y se define como:
0<n< N
(2.3)
53
La funcin de la medida de los parmetros esta representada por eventos acsticos relevantes de la seal de voz en trminos simples y eficientes de los parmetros de voz. Aunque la decisin de cual de los parmetros utilizar debe considerarse por otras causas (ejemplo, eficiencia en el software, tipo de aplicacin, memoria disponible), la forma en que la representacin debe elegirse debe basarse estrictamente en las consideraciones de procesamiento de seal. En el modelo del reconocimiento acstico fontico, el primer paso en el proceso es esencialmente idntico al utilizado en el reconocimiento de la 54
Captulo 2
Reconocimiento de voz
Patrones de referencia
Voz
M edicin de parmetros
Reglas de decisin
Voz reconocida
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 71.
Detector de caracterstica 1
Caractersticas vocabulario
Voz
Medicin de parmetros
Evaluacin de hiptesis
Voz reconocida
Detector de caracterstica Q
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 71.
55
Como se mencion previamente, los procesos de seal comnmente seleccionados desde el principio y final del reconocimiento de voz son un modelo de banco de filtros y un modelo LPC (Linear Predictive Coding). La estructura completa del modelo del banco de filtros se muestra en la figura 16. La seal de voz, S(n), es pasada a travs de un banco de filtros pasabanda el cual cubre el rango de frecuencia del rango que nos interesa en la seal (ejemplo 100 3000 Hz para seales telefnicas de calidad, 100 8000 Hz para seales de banda ancha). Los filtros individuales pueden y generalmente se solapan en frecuencia, como se muestra en la figura 16. La salida del filtro pasabanda ith, Xn(ejwi) (donde wi es la frecuencia normalizada 2fi/Fs, y Fs frecuencia de muestreo) es una representacin espectral en tiempo corto de la seal S(n), en el tiempo n, visto a travs del filtro pasabanda ith con el centro de frecuencia en wi. El modelo aproximado LPC se muestra en la figura 17, el anlisis espectral se realiza sobre bloques de voz (fragmentos de voz) con un modelo limitado en polos completos. Esto significa que el resultado de la representacin espectral Xn(ejw) est limitada hacer de la forma (/A(ejw), donde A(ejw) es un polinomio de orden pth con una transformada en z.
A( z ) = 1 + a1 z 1 + a 2 z 2 + ......... + a p z p
(2.4)
El orden p, es llamado anlisis de orden LPC. As la salida del bloque del anlisis espectral LPC es un vector de coeficientes (parmetros de LPC) eso especifica (paramtricamente) el espectro de un modelo de todos los polos en el espectro sealado sobre un perodo de tiempo en el que el marco de muestras de la voz es acumulado.
56
Captulo 2
Reconocimiento de voz
Filtro pasabanda 1
Xn(ejw1)
Filtro pasabanda Q
w1
w2
w3
wQ
w1L w2L
w1H
w3L w2H
w3H
wQL
wQH
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 72.
Voz s(n)
Entrada de tram as
a(n)
cn
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 72.
57
Antes de muestrear una seal es necesario filtrarla. Tericamente la mxima frecuencia que puede representar es la mitad de la frecuencia de muestreo. En la prctica se utiliza una frecuencia de muestreo ms alta para poder utilizar filtros no ideales.
La seal pasa a representarse en mltiplos del perodo de muestreo, T, como s(nT), o lo que es lo mismo, sn.
El sonido telefnico se muestrea de 8kHz. a 16kHz, y se considera suficiente para el reconocimiento y sntesis del lenguaje. El estndar de audio es una frecuencia de muestreo de 44kHz (Compact Disc, CD) o 48kHz (Digital Audio Tape, DAT) para representar frecuencias de hasta 20kHz.
58
Captulo 2
Reconocimiento de voz
Un diagrama de bloques de la estructura cannica de un banco de filtros es mostrado en la figura 19. Por ejemplo la seal de voz S(n), es pasada a travs de un banco de Q filtros pasabanda, obteniendo las seales mostradas en las ecuaciones 2.5 y 2.5b, estos filtros cubren todos los rangos de frecuencia de modo que no se pierda informacin. Un ejemplo del filtrado se muestra en la figura 20.
1 i Q
(2.5a)
S i ( n) =
h ( m) s ( n m)
i
(2.5b)
Donde se asume que la respuesta al impulso del filtro pasabanda ith es hi(m) con una duracin de Mi muestras; por lo tanto, se utiliza la convolucin para representar la operacin del filtrado para dar una expresin clara de Si(n), de la seal de voz filtrada en el pasabanda.
Filtro pasabanda 1
s1(n)
No linealidad
V1(n)
Filtro pasabajo
t1(n)
Compresin de amplitud
x1(m)
s(n)
Filtro pasabanda 1
sQ(n)
No linealidad
VQ(n)
Filtro pasabajo
uQ(m)
Compresin de amplitud
xQ(m)
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 74.
59
El propsito de analizar el banco de filtros es brindar una medida de la energa de la seal de voz en una banda de frecuencia dada, por lo que no es tan importante la fase de la seal, cada seal del pasabandas Si(n) es pasada a travs de un dispositivo no lineal, semejante a un rectificador de onda completa o de media onda. El cambio no lineal del espectro de seal del pasabanda de la banda de frecuencia baja puede crear imgenes con frecuencia alta. Un filtro pasabajo se utiliza para eliminar imgenes de frecuencia alta, dando un juego de seales, ui(n), 1<i<Q, representando una estimacin de la energa de la seal de voz en cada una de las bandas de frecuencia Q. Para entender los efectos no lineales y del filtro pasabajo, se asume que la salida de un filtro pasabanda es una seal senoidal pura con frecuencia wi.
S i (n) = i sen( wi n)
(2.6)
Esta asuncin es vlida para la voz en el caso en que los sonidos de voz sean firmes cuando el ancho de banda del filtro es suficientemente estrecho que solo una simple armnica de voz pasa a travs del filtro pasabanda. Si se utiliza un rectificador de onda completa, se tiene,
(2.7)
60
Captulo 2
Reconocimiento de voz
(2.8)
+ 1 wi ( n) = 1
esto se ilustra en la figura 21a y 21c.
si s i (n) 0 si s i (n) 0
(2.9)
Entonces la salida no lineal puede ser vista como una modulacin en el tiempo, como se muestra en la ecuacin (2.8), y en el dominio de la frecuencia se puede obtener el resultado siguiente:
v i (e jw ) = S i (e jw ) W (e jw )
(2.10)
donde Vi(ejw), Si(ejw) y W(ejw) son las transformadas de Fourier de las seales Vi(n), Si(n) y w(n) respectivamente, y es una convolucin circular. El espectro Si(ejw) es un solo impulso con wo = wi, mientras que el espectro W(ejw) es un juego de impulsos de frecuencias armnicas extraas wq = wiq, q = 1,3,.. qmax. Por lo tanto el espectro de Vi(ejw) es un impulso con w = 0 y un juego de impulsos con amplitud mas pequea con wq = wiq, q = 2,4,6,.., como se muestra en la figura 21d y 21f. El efecto del filtro pasabajo es retener la componente de DC de Vi(ejw) y la salida del filtro tiene componentes de alta frecuencia a causa de la no linealidad.
61
El anlisis anterior, solo es estrictamente correcto para una senoidal pura, es un buen modelo para voces casi peridicas de sonidos del habla, tan largos como el ancho del filtro pasabanda que no puede poseer dos o mas seales armnicas fuertes. Porque la variacin en el tiempo de la seal de voz, (ejemplo: es casi peridica), el espectro de la seal pasabaja no es un impulso de DC puro. Pero mientras la informacin de la seal este contenida en una banda baja de frecuencia alrededor de DC. El papel final del filtro pasabajo es eliminar los picos espectrales no deseados. El ancho de banda de la seal, Vi(n), esta relacionado con la rpida velocidad del movimiento de las armnicas del habla en una banda estrecha, y sta generalmente se conoce en el orden de 20 a 30 Hz. Por lo tanto los dos ltimos bloques del modelo de banco de filtros de la figura 19 son un ejemplo de la reduccin de la velocidad de la seal filtrada con un filtro pasabajo, ti(n), esta es remplazada por una velocidad del orden de 40 a 60 Hz., y la seal de rango dinmico es comprimida utilizando una compresin de amplitud (ejemplo codificacin logartmica o codificacin ley ).
62
Captulo 2
Reconocimiento de voz
si(n)
w(n) +1 n -1 v(n)
n si(ejw)
W(ejw)
wi
Vi(ejw)
wi
3wi
2wi
4wi
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 75.
63
fi =
Fs i, N
1 i Q
(2.11)
Donde Fs es una muestra de la velocidad de la voz y N es el nmero de espacios uniformes del filtro que requiere para ampliar un rango de frecuencia de la voz.
QN
(2.12)
Con igualdad cuando el rango de frecuencia completa de la seal de voz es usada en el anlisis
Q=N
(2.13)
bi
Fs N
(2.14)
64
Captulo 2
Reconocimiento de voz
Con igualdad significa que no hay frecuencia sobrepuesta entre canales de filtros adyacentes y sin igualdad significa la superposicin en los canales de filtros adyacentes. (Si bi < Fs/N entonces las porciones seguras del espectro de voz se perderan en el anlisis y el resultado del espectro de voz no sera considerado muy significativo). La figura 22a muestra un juego de Q filtros ideales, no sobrepuestos, filtro pasabanda de rango de cobertura de Fs/N(1/2) a (Fs/N) (Q+1/2). Al mismo tiempo, la figura 22b muestra un juego ms realista de Q filtros sobrepuestos cubriendo el mismo rango aproximadamente.
1 Fs / N
f Fs / N 2Fs / N 3Fs / N Q Fs / N
f Fs / N 2Fs / N 3Fs / N Q Fs / N
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 77.
La alternativa para uniformar el banco de filtros es disear un banco de filtros no uniforme diseado acorde a algn criterio para filtros individuales debiendo espaciar la frecuencia. Un criterio comnmente utilizado es espaciar el filtro uniformemente a lo largo de la escala de frecuencia logartmica (una frecuencia logartmica se obtiene para justificar la percepcin auditiva humana). Adems para un juego de Q filtros pasabanda con frecuencia central fi y ancho de banda bi, 1 < i< Q, se tendra
65
b1 = C bi = bi 1 ,
i 1 j =1
2iQ (bi b1 ) 2
(2.15)
f i = f1 + b j +
donde C y f1 son anchos de banda arbitrarios en frecuencias centrales del primer filtro y es el factor de crecimiento logartmico. Los valores de mas comnmente utilizados son = 2 el cual da un 1/8 del espacio de banda del filtro adyacente, y = 4/3 el cual da 1/3 del espacio del octavo filtro. Un criterio para disear un banco de filtros no uniforme es utilizar directamente una escala de banda crtica. El espacio del filtro a lo largo de la banda critica esta basado sobre un estudio de percepcin y esta proyectado a escoger la banda que da contribucin igual a la articulacin de la voz. La forma general de la banda critica esta en la figura 23. La escala es cerrada hasta las frecuencias lineales debajo de 1000 Hz (el ancho de banda es esencialmente constante como una funcin de f), y es cercana a las frecuencias logartmicas a partir de 1000 Hz (el ancho de banda es esencialmente exponencial como una funcin de f). Muchas variantes de la escala de banda critica han sido utilizadas, incluyendo la escala mel y la escala bark.
66
Captulo 2
Reconocimiento de voz
1000 Hz.
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 79.
La mayor parte del diseo de uniformidad o no uniformidad esta basado en la escala de bandas crticas. Ya que estas escalas de frecuencias no lineales aproximan la sensibilidad del odo humano y evitan el problema de relacin entre frecuencia y tiempo, a continuacin se mencionan varias de ellas:
Q constante: Q es la relacin del ancho de banda del filtro sobre la frecuencia central, por lo que implica una forma exponencial.
Ancho de banda rectangular equivalente (ERB): se miden los anchos de banda de los filtros auditores.
Mel: la solucin de los ingenieros que tiene una forma analtica sencilla: m=1125 log(0.0016f + 1), donde la f es la frecuencia en Hz y m es la frecuencia resultante.
y n = a i y n i + b j x n j
i =1 j =0
(2.16)
68
Captulo 2
Reconocimiento de voz
a
n
yn
z-1 yn-p
z-1 yn-2
z-1 yn-1
z-1
Xn
z-1
Xn-1
z-1
Xn-2
z-1
z-1
Xn-q
b1 bo
b2
bq
yn
69
y n = b0 x n + b1 x n 1 + b2 x n 2 + ......... + bq x n q = b j xn j
j =0 q
(2.17)
Esta es la forma ms directa y simple de desarrollar filtros individuales, son computacionalmente caros de implementar pero no necesitan introducir distorsiones de fase, por lo que son tiles en el reconocimiento de voz de alta calidad. Como ejemplo para un banco de filtros, si denotamos la respuesta al impulso por el canal ith como hi(n), 0 < n < L-1, entonces la salida del canal ith, Xi(n), puede ser expresada como una convolucin discreta finita de una seal de entrada, s(n), con una respuesta al impulso, hi(n).
x i ( n ) = s ( n ) * hi ( n )
= hi ( m) s ( n m)
m=0 L 1
(2.18a) (2.18b)
El clculo de la ecuacin anterior es repetida para cada canal i, donde i = 1,2,.....Q. Otra alternativa es considerar un filtro pasabajo donde se considera que cada filtro tenga una respuesta al impulso; cuya respuesta deseada es:
hi (n) = w( n)e jw n
i
(2.19)
70
Captulo 2
Reconocimiento de voz
x i (n) = w(m)e jw m s (n m)
i
(2.20)
=e
jwi n
S n (e jw
donde Sn(ejwi) es la transformada de Fourier en tiempo corto de s(n) con frecuencia wi= 2fi. La transformada corta de Fourier para s(m) es definida como:
(2.21)
(2.22)
Con estas ecuaciones se puede establecer lo siguiente para L que es la duracin de la muestra:
1.
Si L es grande en relacin a la seal peridica, entonces Sn(ejwi) brinda una buena resolucin de la frecuencia. Esto significa que se pueden resolver los picos armnicos pero solo se puede verlo de una manera aproximada sobre el espectro de la seccin de voz dentro de la ventana.
71
2.
Si L es pequea en relacin a la seal peridica, entonces Sn(ejw) brinda una resolucin de frecuencia pobre (no hay picos armnicos involucrados), pero una buena estimacin del grosor de la figura espectral se obtiene. La ecuacin 2.20 indica que se necesitan un nmero infinito de coeficientes, en
realidad los filtros ideales son imposibles y los ms cercanos son difciles de disear, por lo que hay algunas soluciones que a continuacin se describen: Truncar la seal: es simple y efectivo si los ciclos son cortos. Ventana: en el proceso de la voz, se asume que la seal es estacionara en intervalos de tiempo lo suficientemente cortos y se realizan transformadas de Fourier en cada intervalo, por lo que se procede a multiplicar la seal por una funcin ventana de Hamming cuyo valor fuera de un determinado rango casi cero; esta minimiza la energa en los extremos evitando discontinuidades, es por eso que no se utiliza una ventana rectangular. figura 26. Una forma general de la ventana de Hamming se da en la ecuacin (2.23) y es una funcin coseno que se muestra en la
(2.23)
72
Captulo 2
Reconocimiento de voz
Como se puede observar una ventana de Hamming no tiene tanta precisin frecuencial, pero provoca efectos mucho menores que una ventana rectangular. ventana rectangular la primera y una funcin ventana de Hamming la segunda. A continuacin en las figuras 2.27a y 2.27b se muestra una seal senoidal, con una funcin
73
Usar un sistema de diseo de filtros ms complejo, por ejemplo el algoritmo de intercambio Parks-McClelland-Remez, que disea filtros FIR de fase cero ptimos con frecuencias arbitrarias.
2.1.2.2.3.2.1.3. Desarrollo de un banco de filtros uniforme basado en la transformada corta de Fourier usando FFT
Este procedimiento permite mejorar la eficiencia a nivel software de un banco de filtros uniforme con salida igual a la ecuacin 2.20. Interesa entonces una frecuencia uniformemente espaciada que puede ser:
F f i = i s N ,
i = 0, 1, ........, N 1
(2.24)
74
Captulo 2
Reconocimiento de voz
x i ( n) = e
(2.25)
Si se parte sobre m muestras de tamao N y se asume que m = Nr + k donde 0 k N-1 y - < r < ; se tiene una seal de ventana sn(m) = s(m)w(n-m) donde m = n L +1,....,n, tiene L muestras de duracin y se puede escribir la ecuacin 2.25 como:
2 j in N 2 j ik N 1 N u n ( k )e k =0
x i ( n) = e
(2.26)
75
x1(n) h1(n)
x2(n) h2(n)
s(n)
xQ(n) hQ(n)
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 89.
76
Captulo 2
Reconocimiento de voz
En esta forma tan general cada filtro pasabanda es desarrollado va una convolucin directa cuya estructura FFT no eficiente puede ser utilizada. En este caso cada filtro pasabanda es diseado segn el mtodo de ventana utilizando la misma ventana pasabaja, se puede mostrar que la frecuencia compuesta responde al canal Q del banco de filtros y es independientemente del nmero y distribucin de los filtros individuales. As que un banco de filtros con tres filtros tiene exactamente la misma frecuencia compuesta que la de uno de 7 filtros, esto se muestra en la figura 29.
f fL f1 f2 f3 fH
f fL f1 f2 f3 f4 f5 f6 f7 fH
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 90.
Para mostrar esto se denota la respuesta del impulso del filtro pasabanda kth como
(2.27)
77
Donde w(n) es la ventana FIR, y hk ( n) es la respuesta ideal al impulso del filtro pasabanda diseado. La respuesta en frecuencia del filtro pasabanda kth, Hk(ejw), puede ser escrita como:
H k (e jw ) = W (e jw ) H k (e jw )
(2.28)
As que la respuesta en frecuencia del banco de filtros compuesto, Hk(ejw) puede ser escrita como:
H (e
jw
) = H (e ) = W (e ) H (e )
Q Q jw jw jw k =1 k k k =1
(2.29)
H (e
jw
) = W (e ) H (e )
Q jw jw k k =1
(2.30)
La sumatoria de la ecuacin (2.30), es la sumatoria ideal de la respuesta en frecuencia de cada filtro, se ve que es independiente del nmero y distribucin de los filtros individuales y se puede escribir como:
Q 1, (e jw ) = H k (e jw ) = H k =1 0,
(2.31)
Donde wmin es la frecuencia baja en el banco de filtros y wmax es la frecuencia ms alta. Entonces la ecuacin (2.30) puede expresarse como:
(e jw ) H (e jw ) = W (e jw ) H
(2.32)
78
Captulo 2
Reconocimiento de voz
La cual es el resultado deseado, independientemente del nmero de filtros ideales, Q, y de su distribucin en frecuencia.
X k = X k + X k +1
(2.33)
no ideales para tener una aproximacin. Por otro lado, los filtros del FIR pueden lograr fase lineal sin considerar caractersticas de magnitud ideales. Para aplicaciones del reconocimiento de voz, se ha mostrado cmo una estructura de FTT puede aplicarse a menudo para aliviar la ineficacia del software en los bancos de filtro FIR, las estructuras de banco de filtro digitales ms prcticas usan el FIR (normalmente en una realizacin de FFT). Una vez decidido el tipo de filtro a utilizar, la prxima consideracin es el nmero de filtros a ser usados en el banco de filtros. Para los bancos de filtros uniformes, el nmero de filtros, Q, no puede ser demasiado pequeo o la eficiencia del banco de filtros para filtrar el espectro de voz se daa grandemente; as los valores de Q son aproximadamente menos de 8. Semejantemente, el valor de Q no puede ser demasiado grande (a menos que hallan filtros solapados), porque los anchos de banda del filtro seran demasiados estrechos para algunos hablantes (ej., mujeres con alto diapasn o nios), y habra una probabilidad alta de error ya que ciertos pedazos de voz tendran baja energa (es decir, ningn prominente armnico caera dentro de la ventana). As, en la prctica tienden a tener valores de Q 32. Aunque en los bancos de filtros uniformes se pueden utilizar, muchos sistemas prcticos usan los no uniformes para reducir el software y para caracterizar el espectro de voz de una manera ms consistente con la percepcin humana. Una consideracin final para banco de filtros es la opcin no lineal y filtro pasabajo usados para mejorar el rendimiento de la salida de cada canal. Tpicamente para la no lineal se ha usado un rectificador de onda completa, rectificador de media onda, o un recortador. El espectro resultante es dbil, sensible a la no linealidad. El filtro pasabajo usado en la prctica vara de un simple integrador a un filtro pasabajo IIR de buena calidad (tpicamente un filtro de Bessel).
80
Captulo 2
Reconocimiento de voz
Mediante esta tcnica, se puede representar a la seal de voz mediante parmetros que varan en el tiempo y que estn relacionados con la funcin de transferencia del tracto vocal y las caractersticas de la fuente sonora.
Otra ventaja es que no requiere demasiado tiempo de procesamiento, lo que es importante a la hora del desarrollo.
El modelo matemtico expuesto establece que el tracto vocal puede modelarse mediante un filtro digital siendo los parmetros los que determinan la funcin de transferencia. El problema consiste en, dado un segmento de palabra, extraerle sus parmetros que en este caso vienen a ser los coeficientes del filtro.
El anlisis de prediccin lineal permite aproximar una seal a partir de seales pasadas. En este caso se trata de predecir seales de voz mediante un filtro FIR (filtro de respuesta infinita), cuya funcin de transferencia se deduce a partir de:
s(n ) = a k s (n k ) + Gu (n )
p k =1
(2.34)
81
Como se puede observar la seal de voz se representa por medio de seales anteriores y u(n) es la entrada del filtro, el cual es un tren de impulsos peridicos o una fuente de ruido aleatorio. El tren de impulsos producir seales sonoras mientras que la fuente de ruido aleatorio producir seales no sonoras a la salida del filtro. De esta manera el filtro viene a representar un modelo del tracto vocal. La funcin de transferencia del filtro se obtiene sacando la transformada z a la relacin anterior entonces se tiene:
H (z ) =
S (z ) = GU ( z ) 1
a
k =1
=
k
1 A( z )
(2.35)
Donde G es la ganancia del filtro y depender de la naturaleza de la seal. Dada la seal s(n), el problema consiste en determinar los coeficientes de prediccin a k y la ganancia G. Ya que estos coeficientes se usarn como parmetros del reconocimiento de voz. Su determinacin se realiza minimizando el error que se comete cuando se intenta realizar la aproximacin de la seal.
~ s (n) = a k s ( n k )
k =1
(2.36)
82
Captulo 2
Reconocimiento de voz
e( n ) = s ( n ) ~ s (n) = s (n) a k s ( n k )
k =1
(2.37)
Mediante el mtodo de los mnimos cuadrados, los coeficientes de prediccin se calculan minimizando el error cuadrtico medio con respecto a cada uno de los coeficientes. Entonces se tiene:
E n = e n2 (m)
m
2.38
p E n = s n ( m) a k s n ( m k ) m k =1
(2.39)
Para resolver la ecuacin anterior, para los coeficientes predictores, se realiza la diferenciacin En con respecto a cada ak ({En/ak = 0} k = 1,2,....,p), entonces se tiene:
k s n (m i ) s n (m k ) s n ( m i ) s n ( m) = a
m k =1 m
(2.40)
Como la ecuacin anterior, tiene trminos de la covarianza de sn(m), esta puede escribirse como:
n (i,0) = a k n (i, k )
k =1
(2.41)
83
n = s n2 (m) a E k s n ( m) s n ( m k )
m k =1 n
(2.42)
Examinando el error cuadrtico se puede notar que consiste en trminos fijos y trminos que dependen de los coeficientes predictores expresados por la covarianza y siendo esta funcin de (i,k) se reduce a una autocorrelacin simple, por lo que se procede a realizar un anlisis de autocorrelacin; este proporciona una medida de la correlacin de la seal con una copia desfasada en el tiempo de si misma. De aqu se obtienen los p coeficientes de autocorrelacin los cuales deben tener valores entre 10 y 15. La funcin de autocorrelacin es simtrica en rn(-k) = rn(k), con lo cual da una matriz de pxp tipo Toeplitz (simtrica con todos los elementos diagonales iguales), la solucin de esta matriz de autocorrelacin es ms eficiente por medio del algoritmo de Durbin. Teniendo los coeficientes ak del filtro se dispone de la forma con que la cavidad vocal se comporta y que junto con la seal de excitacin se obtiene el sonido emitido en ese momento.
84
Captulo 2
Reconocimiento de voz
El problema se presenta cuando se pronuncia una palabra la cual no siempre se realiza a la misma velocidad, produciendo distorsiones temporales afectando sus componentes acsticos. Estas variaciones no son proporcionales a la velocidad de locucin y podrn variar de locutor a locutor; es por esto que se hace necesario un procedimiento que permita comparar dos palabras, sin considerar distorsiones temporales; todo esto lo hacen los algoritmos de programacin dinmica. Estos algoritmos al comparar dos palabras proporcionan una medida de disimilitud o medida de distancia que es aprovechada en el reconocimiento de voz. Sea R(n) donde n = 1, 2,...N la secuencia de ventanas que representan el patrn de la palabra de referencia donde n es en general un vector de parmetros multidimensionales que describe las caractersticas de la n-sima ventana de una palabra. Los componentes del vector en este caso vendran a ser los coeficientes de prediccin lineal, pudiendo ser algn otro tipo de parmetro. Sea T(m), donde m = 1,2,....M la secuencia que representa el patrn de la palabra que se desea reconocer. Se necesita hallar la funcin de alineamiento m = w(n), la cual describir el camino ptimo. No se puede garantizar que este camino buscado sea una relacin funcional simple por lo que en tales casos se hace necesario definir una tercera variable comn a los ejes n y m tal que n = i(k), k = 1,2,...K; m = j(k), k = 1,2,...K donde K es la longitud del eje temporal comn. En la figura 30 se muestran R(n) y T(m) distribuidos sobre un par de ejes coordenados donde cada abscisa n corresponde a un vector de catorce coeficientes los cuales representan el espectro de una ventana de 30 ms. de la palabra R(n). Cada ordenada m corresponder a un vector de 30 ms. de la palabra T(m).
85
10 9 8 7 6 5 4 3 2 T(m )
1 0 1 R(m ) 1 N 2 3 4 5 6 7 8 9 10
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 203.
Para que el algoritmo tenga la mayor eficiencia posible, es decir para garantizar un camino ptimo se hace necesario que se cumplan la siguientes consideraciones.
Captulo 2
Reconocimiento de voz
aparece en la figura 31, donde se muestra que los caminos vlidos solo pueden provenir de los puntos (n- 1,m-1), (n-1,m-2) o (n-2,m-1).
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 210.
87
j[k]={2[i[k]-N]}/2+M
[1,1] j[k]=2[i[k]-N]+M
[N,1]
Fuente: Lawrence Rabiner & Biing-Hwang Juang, Fundamentals of speech recognition, Pg. 215.
D(i(k ), j (k )) =
(i(k ), j (k ))W (k )
~) N (W
(2.43)
88
Captulo 2
Reconocimiento de voz
Donde D(i(k),j(k)) es una funcin, cuyo clculo proporciona la distancia total a lo largo del camino ptimo, d(i(k),j(k)) es la distancia local entre las ventanas i(k) de la palabra referencia y j(k) de la palabra a reconocer, W(k) es una funcin de ponderacin para k, y N(W) es un factor de normalizacin que depende de W. El camino corresponder a aquel que minimice la funcin de distancia total representada por:
= D
(2.44)
(2.45)
Se conoce como la distancia cepstral y est en funcin de los coeficientes cepstrales ct y cr de la palabra a reconocer y de la palabra referencia deducidos a partir de:
c(1) = a
n 1 k c(n) = a n 1 a k c(n k ), k =1 n
1< n p
(2.46)
Como se puede observar es una distancia eucldea y su uso est muy difundido en procesamiento de voz debido a su simplicidad y porque resulta ser una aproximacin de la distancia entre dos espectros logartmicos representados por sus coeficientes cepstrales. Es independiente de como se efecta el algoritmo DTW.
89
90
Captulo 2
Reconocimiento de voz
Para efectuar la cuantificacin de un vector de entrada, se hace asignndole la direccin del vector del libro ndice ms cercano, evaluado mediante una medida de disimilitud que puede ser la distancia cepstral eucldea o cualquier otra como la distancia de Itakura. Un aspecto muy importante de cualquier sistema de cuantificacin vectorial es la obtencin del libro ndice, el espacio vectorial debe ser dividido en sectores los cuales se hallan partiendo de vectores de entrenamiento. fielmente el espacio de inters. El libro ndice se obtiene empleando un algoritmo conocido como LBG, cuyo nombre se deriva de los creadores Yoseph Linde, Andrs Buzo y Robert Gray. El algoritmo LBG debe partir de un libro ndice inicial 0 con el cual se compara cada vector del espacio a cuantizar con cada componente del libro ndice. Se compone una particin de distorsin mnima P(m) clasificando cada vector mediante la distancia mnima con los vectores del libro ndice. La suma de las distancias se compara con el umbral de distorsin, si resulta mayor se vuelve a calcular una nueva particin hasta que la de distancia total sea inferior al umbral. La recursin se muestra a continuacin: Sea 0 el libro ndice, xj : j=0,...,n-1 los vectores de entrenamiento, m = 0 y D-1 = . Dado m = {yi : i=1,...,N} N = niveles de cuantificacin, encontrar la particin de distorsin mnima P(m) = {Si ; i=1,...,N}. Si es el i-simo sector. xj pertenecer a Si si d(xj,yi)d(xj,yl) para todo I. Se calcula la distorsin media:
nI min m) = 1 D m = D m , P(A d ( x j , y) n j = 0 y Am
(2.47)
91
Si se cumple
donde es el umbral de distorsin. Si no se cumple la relacin anterior entonces se toman los centroides de los sectores hallados como componentes de un libro ndice nuevo, al cual se le asigna . Se incrementa m en uno y se vuelve al segundo punto hasta que el error sea menor al umbral de distorsin . Parte del algoritmo comprende la obtencin del libro ndice inicial, el cual se calcula partiendo del espacio vectorial hallando su centroide. Este centroide ser el vector inicial yi a partir del cual se obtendrn dos nuevos vectores yi + D e yi - D y se procede a calcular el libro ndice con el algoritmo LBG para 2 vectores. A continuacin se vuelve a fragmentar los centroides en dos y se emplea el algoritmo LBG para 4 vectores. Se procede as sucesivamente hasta el valor N que se requiera. Como se podr apreciar N debe ser una potencia de dos y depender del grado de distorsin, la eleccin del valor de N. Su valor generalmente puede ser 64 o 128.
92
Captulo 2
Reconocimiento de voz
1 1+ ak z
k =1 p k
(1 + z
p k =1
ck k =1 ( 1 + z k z 1 )
p
(2.48)
Este resultado da races en pares complejos conjugados (ya que el polinomio es real en ai) y el ngulo define la frecuencia del formante. Como ocurre con el espectro LP, se pueden tomar todos los picos o aquellos cercanos al crculo unitario. El comportamiento del formante es aproximadamente gausiano, por lo que se puede tratar su densidad del espectro de potencia como una funcin de densidad de probabilidad. Dicha funcin puede ser modelada como una mezcla de gausianas, las cuales se muestran en la figura 33, estas encajan en un espectro de magnitud DFT.
93
b j ( x) = c jm
m =1
1 2
jm
1 jm 2 jm
(2.49)
94
Captulo 2
Reconocimiento de voz
Las discontinuidades asociadas al uso de ventanas se pueden reducir si el anlisis se lleva a cabo sincronizadamente respecto con el tono; en la mayor parte de los casos se aplica a las tcnicas basadas en LP, ya que es ms fcil trabajar con ventanas de longitud arbitraria. Este anlisis se puede realizar por los siguientes mtodos: Puntos de cruce por cero. Picos en la funcin de autocorrelacin. Pico en la funcin de autocorrelacin del residuo LP. Funcin de la diferencia media de magnitud. Pico en el cepstrum.
Todos estos mtodos producen aproximaciones dudosas, pero el tono posee continuidad y restricciones en la tasa de cambios; los errores ms frecuentes son multiplicar o dividir el tono por dos.
95
Esto es difcil, provocando una enorme diferencia en la calidad subjetiva de un codificador LP; en la prctica se combinan varios mtodos utilizando tcnicas estadsticas de reconocimiento de patrones. El mtodo ms frecuente es del tipo binario, el cual indica si hay voz o no la hay; en ocasiones un valor real puede resultar til esto se hace mezclando excitaciones de voz o de no voz con las potencias adecuadas, aplicando un filtro pasa alto a las excitaciones de no voz y un filtro pasa bajo a las excitaciones de voz, el grado de voz se define como el punto limite entre unas y otras.
96
Captulo 2
Reconocimiento de voz
A continuacin se describen los distintos niveles o mdulos bsicos en que se podra subdividir el sistema de reconocimiento basado en caractersticas acsticas y lingsticas.
Los fonemas se realizan por medio de sonidos. Los encargados de producir esos sonidos, de realizarlos fonticamente son los rganos de fonacin.
98
Captulo 2
Reconocimiento de voz
En la produccin y clasificacin de las consonantes hay que tener en cuenta los siguientes factores: Lugar de articulacin. Manera de articulacin. Articulaciones sonoras y sordas.
99
100
Captulo 2
Reconocimiento de voz
Fonemas sonoros
s, j, f, ch, p, t, k
Fonemas sordos
b, d, g, m, n, , l, r, rr, y
101
Tambin hay tres posiciones de la lengua de frente hacia atrs. Anterior, cuando la parte alta de la lengua est muy cerca del alveolar; Central, cuando la parte ms alta de la lengua est en el centro de la cavidad oral; y Posterior, donde la parte ms alta de la lengua, el dorso, est muy cerca del velo. Por esto se puede clasificar a las vocales en un cuadro bidimensional. En el espaol hay cinco posiciones principales, y se muestran en la tabla II.
Central
Posterior
U O
Las vocales son de mayor duracin que las consonantes y estn bien definidas espectralmente. Por esto las vocales usualmente son fciles de reconocer y contribuyen significativamente al proceso de reconocimiento de voz. De acuerdo a la manera en que el tracto vocal se configure se determinan las frecuencias de resonancia del mismo (las formantes) y por ello el sonido se produce. Las vocales se identifican por sus formantes, las cuales son muy fuertes durante todo el fonema. Cada vocal tiene su propia configuracin de formantes, esto es muy til en el reconocimiento de voz, ya que las frecuencias al ser medidas pueden sealar en determinado momento de que tipo de fonema se esta hablando. 102
Captulo 2
Reconocimiento de voz
103
104
Captulo 2
Reconocimiento de voz
Procesador morfolgico
Procesador sintctico
Procesador semntico
105
Este sistema de organizacin no tiene ningn tipo de retroalimentacin que pueda aumentar la eficiencia del sistema, se puede pensar en aprovechar mejor el sistema teniendo un tipo de flujo inverso entre algunos mdulos. La figura 35 muestra una estructura de interconexin que refleja esta idea.
Voz
Experto acstico
Experto fontico
Experto en prosodia
Experto silbico
Experto sintctico
Experto morfolgico
106
Captulo 2
Reconocimiento de voz
107
ai
1
aij
ai
2
aij
ai
3
Seal de voz Vector de caractersticas O1 O2 b1(O1) O5 O6 b5(O5) OT Oi bj(Oi) Probabilidad de observar el vector caracterstico Oi en el estado i
Fuente: X. Huang, Y. ARIKI and M. Jack, Hidden Markov Models for Speech Recognition.
Adicionalmente, a cada vector de caractersticas asociado a un estado determinado, el modelo de Markov le asigna una probabilidad; la probabilidad total obtenida para todos los vectores de caractersticas ser la puntuacin que se utilice para realizar el proceso de clasificacin. As vista la generacin de la palabra, las caractersticas espectrales de cada fragmento de seal dependen del estado activo en cada instante, y la evolucin del espectro de la seal durante la pronunciacin de una palabra depende de la ley de transicin entre estados. En cuanto a la generacin de puntos de la plantilla, en estos modelos se asume que el primer vector de caractersticas se produce desde el primer estado, y el ltimo se emite desde el ltimo estado. Recurdese que la secuencia de estados es la parte oculta del modelo: se conocen los vectores de caractersticas, pero no desde qu estado se han producido.
108
Captulo 2
Reconocimiento de voz
N, nmero de estados del modelo. Matriz de transiciones, de dimensin (N x N). Define la estructura del modelo: cada uno de sus elementos, aij, define la probabilidad de pasar del estado i al estado j. Normalmente A ser bidiagonal o triagonal, significando que desde cada estado se pueden producir dos o tres tipos distintos de transicin.
Conjunto de funciones de densidad de probabilidad que modelan estadsticamente las observaciones producidas desde cada estado. Habr pues tantas funciones de densidad de probabilidades como estados.
P vector de dimensin N. Cada uno de sus elementos, Pi indica la probabilidad de encontrarse inicialmente en el estado i. Para modelos de izquierda a derecha, P1 = I y Pj = 0 para los dems estados.
Como en el caso DTW, la seal de voz viene representada por una plantilla o secuencia de vectores de caractersticas O = {O1, O2,....OT}, donde cada Oj es un conjunto de parmetros (coeficientes LPC, Cepstrum, ...) que caracteriza la seal de voz en una ventana de tiempo centrada en t = i, y T es el nmero de total de puntos de la plantilla. Los modelos HMM basados en este tipo de observaciones se llaman HMM continuos, y sern un conjunto de funciones de densidad de probabilidad continuas. Si, para simplificar las cosas, se hace pasar esa secuencia de observaciones O = {O1, O2,...OT} a travs de un cuantificador vectorial (en que cada vector de parmetros Oi es codificado como un nmero entero), la seal de voz quedar representada por una secuencia de centroides del cuantificador. Los HMMs que trabajan sobre este tipo de datos se conocen como HMM discretos y son una matriz con tantas filas como estados tenga el modelo y tantas columnas como centroides tenga el codificador vectorial, en 109
que cada elemento bjk es la probabilidad de que, estando en el estado i, se produzca el centroide k.
Una vez definido lo que es un modelo de Markov, se describe a continuacin como se aplica a un problema real: el de reconocimiento de palabras (la metodologa a usar sera la misma si se utilizasen otras unidades acsticas: fonemas, demisilabas, frases cortas, etc.).
El reconocedor dispondr de un modelo por cada palabra del vocabulario de reconocimiento, y la estructura de esos modelos se define en la fase de diseo: el nmero de estados (N) se elige "a priori' segn la complejidad que se pueda permitir y la calidad deseada. Valores tpicos de N son entre 5 y 15 estados. Lo mismo ocurre con el tipo de transiciones: la matriz A tendr slo ciertas componentes distintas de cero, y su nmero es un parmetro de diseo. El tipo de funciones estadsticas que se utilizarn para modelar las probabilidades de observacin de los puntos de la plantilla desde cada estado, tambin se fija antes de entrar en la fase de entrenamiento de los modelos. Suelen ser gaussianas multivariables, combinaciones lineales de gaussianas multivariables, funciones gamma, etc.
Una vez fija la estructura de los modelos se lanza la fase de entrenamiento[2], con el fin de calcular los valores ptimos de todos los parmetros que se han mencionado. Para ello, se usa un cierto nmero de repeticiones de cada palabra del vocabulario, que depende del tipo de reconocedor que se quiera construir (dependiente o independiente del locutor), de las prestaciones esperadas del sistema y del tipo de unidades que formen el vocabulario. Se puede decir que ese nmero de repeticiones varia entre 4 o 5 y unos cuantos centenares, lo que da idea del volumen de datos y de clculos necesarios. Del 110
Captulo 2
Reconocimiento de voz
anlisis de todas esas repeticiones saldr el conjunto de parmetros que define cada modelo de Markov, y que formara la base de datos del reconocedor.
Voz
Codificador
Canal
Decodificador
Voz
Parmetros
Parmetros
La seal de voz es una seal limitada en banda, aproximadamente entre 20 Hz y 20 KHz. Sin embargo, la mayor parte de la energa se concentra por debajo de 2 KHz, y se asegura casi toda la inteligibilidad con un ancho de banda entre 300 y 3400 Hz (salvo algunas consonantes fricativas, con rasgos distintivos hasta 667 KHz).
111
El margen dinmico de la voz es muy amplio, tanto entre locutores (unos 20 dB) como para un mismo locutor (hasta 40 dB de diferencia entre zonas sonoras y sordas). Su distribucin de probabilidad se puede aproximar, para segmentos lo bastante largos, mediante una funcin laplaciana o gamma. Al ser una seal limitada en banda, se puede muestrear y recuperar sin error si se muestrea por encima de la frecuencia de Nyquist siendo: fs = frecuencia de muestreo W = ancho de banda
Valores tpicos de frecuencia de muestreo son 8 KHz para aplicaciones telefnicas, y 44 KHz para codificacin de muy alta calidad (Compact Disc). Puesto que las muestras obtenidas tienen valores continuos dentro del margen dinmico, su entropa es infinita, y es imposible codificarlas y recuperarlas sin error. Sin embargo, la seal de voz es muy redundante, y el receptor final es muy robusto (el odo y el cerebro humano), y se pueden aplicar estrategias de codificacin que permiten almacenar y transmitir la voz con un rgimen binario moderado y recuperarla con una degradacin aceptable de la calidad.
R = Mf s
Siendo R = rgimen binario M = nmero medio de bits para codificar un smbolo del alfabeto fs = frecuencia de muestreo
(2.50)
112
Captulo 2
Reconocimiento de voz
Ya se ha visto que para poder recuperar la forma de onda, es necesario muestrear al menos a la frecuencia de Nyquist. Para ofrecer una seal con 4 KHz de ancho de banda (calidad telefnica), es necesario muestrear al menos a 8 KHz. Para reducir el rgimen binario, slo se puede actuar sobre el nmero de bits con el que se codifica cada muestra (nmero de estados permitidos). El estndar de calidad telefnica es de 12 bits (4096 estados) de codificacin lineal, que se pueden reducir a 8 con tcnicas de compresin / expansin (PCM a 64 kbits). Otras tcnicas explotan la gran redundancia de la seal de voz para reducir a 4 el nmero de bits por muestra, mediante adaptacin del tamao del escaln de cuantificacin y prediccin del valor de las muestras a partir de los valores anteriores (ADPCM a 32 Kbits). Sin embargo, si se renuncia a recuperar la forma de onda, se puede burlar el lmite de la frecuencia de Nyquist en la transmisin, y reducir ms el rgimen binario. A ttulo orientativo, cuando se lee un texto a una velocidad normal, unas 200 palabras/minuto, la informacin presente en el texto se transmite a una velocidad de unos 75 bit/seg. Sin embargo, hay que recordar que en la seal de voz se transmite ms informacin que la que figuraba en el texto (emociones, entonacin, nfasis, identidad del locutor, etc.). Ya se ha sealado que la seal de voz, aunque muy distinta para cada uno de los sonidos, mantiene sus caractersticas durante perodos bastante grandes, correspondientes aproximadamente a los alfonos que se estn pronunciando. Se puede intentar encontrar algunas de las caractersticas que definen estos sonidos, y transmitirlas slo al ritmo que estas cambian, cada pocas decenas de milisegundos. Para definir y extraer esas caractersticas es preciso desarrollar un modelo de la seal. El modelo ms empleado y aceptado est muy relacionado con la descripcin que se ha hecho de la generacin de la voz.
113
Se divide la seal de voz en intervalos, en los que mantiene sus caractersticas, y se supone que las propiedades de la seal en cada intervalo se extienden indefinidamente en el tiempo. figura 38. En cada uno de estos intervalos se separan e independizan las caractersticas de la excitacin y las del tracto vocal y la radiacin, esto se muestra en la
Excitacin
Voz
Los mtodos de codificacin que utilizan propiedades de la seal de voz en vez de intentar regenerar la forma de onda, suelen denominarse genricamente Vocoders. Los parmetros con los que trabajan suelen estar relacionados con una descripcin del espectro, aunque tambin hay esquemas hbridos que manejan algn tipo de seal residual, difcil de caracterizar, y que mejora notablemente la calidad del sistema. A continuacin se describen algunos tipos de Vocoders.
114
Captulo 2
Reconocimiento de voz
En el caso ms sencillo, el modelo de excitacin es una seal peridica de pulsos (caracterizada por el perodo de repeticin de los pulsos), o ruido (normalmente ruido blanco gaussiano). Esta descripcin es bastante pobre, y limita la calidad de estos sistemas. Surgen por tanto sistemas hbridos para representar la excitacin: una versin filtrada de la voz original (VEV), una versin filtrada del residuo del anlisis LPC (RELP), una seal de excitacin seleccionada entre un amplio registro ya fijado (CELP), o una secuencia de pulsos, cuya amplitud y situacin se ajusta para minimizar el error (definido sobre el espectro) entre la seal original y la reconstruida (MPLPC).
116
Captulo 3
Sistema Iridium
3. SISTEMA IRIDIUM
117
En un punto concreto de la superficie terrestre, el tiempo en que el satlite permanece sobre el es de alrededor de 15 minutos (este es el tiempo en que un mvil es servido por su satlite, tras el cual otro satlite pasa a prestarle servicio), siendo necesarios para esto ms de unos 40 satlites para la cobertura total.
Los sistemas LEO son similares a las redes celulares. La diferencia es que el tamao del radio celular es mayor y que las clulas se mueven. Este movimiento es el que determina el intervalo de traspaso de una celda a otra.
Ejemplos de sistemas LEO son GlobalStar e Iridium que es el que se tratar ms adelante.
Para el futuro se planea usar este tipo de sistema de baja altitud en los diferentes servicios teniendo ste sus ventajas y desventajas.
3.1.3.1. Ventajas
Las prdidas de propagacin van a ser menores, usando entonces menores antenas y potencias de transmisin. Menores retardos de propagacin. Actualmente este tipo de rbitas no estn congestionadas.
118
Captulo 3
Sistema Iridium
La cobertura no ser pobre para altas latitudes y el ngulo de elevacin con que se va a ver el satlite desde estos puntos ser alto, lo cual con llevar una mayor calidad de comunicacin. Esto es importante sobre todo en entornos urbanos.
Al haber ms satlites, habrn ms canales de comunicacin disponibles y reutilizables, y por tanto, mayor nmero de usuarios.
3.1.3.2. Desventajas
El diseo del sistema ser ms complejo porque: el nmero de satlites necesarios para una cobertura global es mayor, se deber emplazar la constelacin de satlites con mayor o menor proximidad a los anillos de Van Allen. Estos anillos son 2 toroides cuyo eje es el eje geomagntico y estn poblados de partculas que daan el satlite. En el caso de Iridium, la constelacin va a estar por debajo del primer anillo de Van Allen. El mantenimiento del sistema va a ser mayor pues los satlites van a verse ms afectados por la atmsfera y los anillos de Van Allen. La velocidad de desplazamiento relativo entre emisor y receptor en un escenario como ste va a ser muy elevada, por lo que: el tema del handover (o handoff) va tener que ser tratado con ahnco. Las celdas de cobertura de un satlite van a desplazarse a gran velocidad sobre la superficie de la tierra, ocasionando sesiones de conexiones entre satlites que debern ser llevadas a cabo de manera eficiente con objeto de que el sistema resultante tenga buenas prestaciones.
119
El efecto doppler va a presentar otro problema a resolver. El tamao de la velocidad de desplazamiento relativo provocar altas derivas en las frecuencias de trabajo.
Fuente: Iridium
120
Captulo 3
Sistema Iridium
121
Fuente: Iridium
3.2.1.1.2. Celdas
El rea de cobertura de un satlite se divide en celdas cada una de ellas iluminada por una antena multihaz (multispot). Cada satlite tiene una proyeccin de 4,700 Km. de dimetro de cobertura, la cual esta subdividida en 48 celdas originadas por 3 antenas de 16 spot beams proyectadas sobre la superficie terrestre pudiendo reutilizar frecuencias en diferentes celdas no adyacentes segn un patrn que ha sido facilitado y que es conforme al Seamless handover, esto se muestra en la figura 42. La huella que deja cada uno de estos haces sobre la superficie terrestre tiene un dimetro aproximado de 660 Km. En el modelo de ensayo de Iridium todas las celdas tienen la misma forma en este caso hexagonal y el margen de enlace es de 16 dB. Los enlaces a tierra se llevan a cabo en banda L (1616 a 1626.5 Mhz, enlace de usuarios) y en banda Ka (para enlaces de pasarela y satlite; 19.4 a 19.6 Ghz para enlaces descendentes, y 29.1 a 29.3 Ghz para enlaces ascendentes).
122
Captulo 3
Sistema Iridium
La constelacin de satlites y su proyeccin de celdas es algo anloga a la de un sistema telefnico celular, en la figura 43, se muestra el mapa de cobertura. En el caso de telefona celular un juego de celdas estticas da cobertura a un gran nmero de usuarios mviles; en el caso de Iridium, los usuarios se mueven a mucha menor velocidad que las celdas, ya que la velocidad de los satlites es altsima, en concreto, se ha calculado que cada 0.9 segundos el satlite que cubre vara, de manera que el usuario parece inmvil y las celdas son las que se mueven. En esta situacin, esto representa una ventaja: los handoffs son deterministas, en general no se producen con igual probabilidad hacia una de las 6 celdas adyacentes, sino que en muchos casos, el handoff se produce hacia la celda superior o la inferior depende de hacia donde est girando el satlite, de norte a sur o viceversa. Cabe destacar que el enfoque de haces tan ajustado permite en recepcin minimizar el eco y aumentar la calidad de las conexiones. Adems permite el uso en recepcin de antenas lo suficientemente pequeas como para ser integradas en el terminal de bolsillo.
Fuente: Iridium
123
Fuente: Iridium
3.2.1.1.3 Bus
El bus es bsicamente la nave, quitando la carga til, es decir, hace de plataforma soporte para la carga til electrnica y las antenas. Viene en tres piezas: Unidad modular del bus que ser integrada con la carga til de comunicaciones. Las placas solares. Mdulo batera, conjunto radiador / acumulador.
124
Captulo 3
Sistema Iridium
3.2.1.1.4. Antenas
Los satlites Iridium darn una vuelta a la tierra pasando por los polos cada 100 minutos. Tendrn varias antenas que les permitirn comunicarse con los otros satlites visibles de la constelacin, y con estaciones terrenas (puertas de enlace); la estructura de los satlites se muestra en la figura 44. distribuidas de la siguiente manera: Cada satlite tiene 13 antenas en total,
Fuente: Iridium
125
126
Captulo 3
Sistema Iridium
Annapolis, Maryland que diseo el software que llevan los satlites Iridium, este se ha desarrollado para el control y direccin de la red. IONA Technologies Ltd. est compaa desarrollo el software para el sistema de control que lleva el nombre de ORBIX y permite que en el segmento de control espacial trabaje varias aplicaciones e interactuen entre ellas.
127
Para la conexin con los satlites, las puertas de enlace cuentan con una antena parablica de largo alcance de 10 pies de dimetro (operando en frecuencias de banda Ka en un rango de 19 a 29 Ghz). Cada puerta de enlace controla un solo satlite Iridium a la vez, los satlites que viajan a una velocidad aproximada de una rbita cada 100 minutos, son captados por la terminal terrestre cuando se encuentran a una elevacin de 8 por encima del horizonte y son seguidos hasta llegar a la misma elevacin sobre el horizonte opuesto. Esto significa que si un usuario estuviera situado sobre la lnea del Ecuador, podra estar conectado con cada satlite una media de 10 minutos, antes de realizar handover al siguiente satlite. Almacenarn la validez de la cuenta de cada abonado y la situacin del usuario. El sistema Iridium seguir la posicin de cada usuario esta se almacenar en las puertas de enlace. La necesidad de almacenar la posicin del telfono viene del hecho de que se puede recibir una llamada en cualquier momento y el sistema debe saber en que celda se encuentra para poder enviar la llamada. Asimismo por ejemplo, el usuario destino es un usuario de PSTN, la puerta de enlace har de interfaz entre la red de satlites Iridium y la PSTN a la que se deba accesar. El sistema debe ser capaz de localizar y de utilizar la PSTN en cuestin y de esto se encargarn las puertas de enlace. En la figura siguiente se muestra una estructura de una puerta de enlace.
Fuente: Iridium
128
Captulo 3
Sistema Iridium
130
Captulo 3
Sistema Iridium
Fuente: Iridium
131
Inconvenientes: Necesidad de antenas, transmisores, receptores y dispositivos de conmutacin para esta funcin de ISL. Estas antenas han de ser adems orientables para apuntamiento, adquisicin y seguimiento de otros satlites. Mayor complejidad y coste de la carga til. No obstante, los inconvenientes se ve reducidos al tratarse de un sistema LEO de cobertura global, a diferencia de los sistemas ICO.
132
Captulo 3
Sistema Iridium
ISL
Distancia (Km.) Variacin de la prdidas (dB) Apuntamiento horizontal () Apuntamiento vertical ()
Fuente: Iridium.
Leonet
Intraplano 15,000 --------------0 -36 nterplano 4,550 a 18,460 12.2 -106 a 106 -10 a -46 4,030
Iridium
Intraplano nterplano 3,270 a 4,480 2.7 34 a 65 -16
---------------0 -16
3.2.3. Modulaciones y accesos mltiples que utiliza el sistema Iridium 3.2.3.1. Modulaciones 3.2.3.1.1. Cambio de fase (PSK)
La forma mas simple de PSK es PSK binario (BPSK), los datos digitales modulan una portadora senoidal la salida modulada puede ser vista o asumida como dos posibles estados de fase (digamos 0 y radianes) durante el periodo del bit (Tb), representando cualquiera el binario 0 o el binario 1. Esta forma de modulacin es realmente idntica a la modulacin en amplitud con portadora suprimida y una seal modulante que tiene valores positivos y negativos (para binario 0 y 1). En tal modulacin la amplitud de la portadora viene hacer negativa durante la parte negativa de la seal. Esto corresponde a la fase de radianes de la portadora como se describe en la terminologa BPSK. En el 133
dominio del tiempo, la portadora modulada aparece como una constante de envoltura senoidal, con rpidos cambios de fase a una velocidad llamada la velocidad de llaviado, dependiente de la velocidad de los datos digitales. En el dominio de la frecuencia la densidad espectral de potencia de la portadora modulada varia de acuerdo con
2
sen w H ( w) = w
(3.1)
Como se ilustra en la figura 47, la mayora de la energa de la seal modulada esta contenida en el lbulo mayor del ancho del cual depende del perodo del bit o de la velocidad de llaviado. El ancho de banda de la seal modulada esta considerado para ser la porcin del espectro contenido dentro del lbulo mayor, los lbulos menores del espectro se repiten indefinidamente a amplitudes cada vez mas pequeas, decreciendo a una tasa de 1/f2. Sin embargo, as como en FM, el espectro de las seales PSK moduladas es tericamente infinito. En BPSK, imitando el ancho de banda va hacer aproximadamente igual a la tasa de bits, la energa de los lbulos laterales que se pierde, con poco impacto en el desempeo. En la prctica las tcnicas mas sofisticadas de modulacin se utilizan para restringir ms la energa de la portadora modulada en el lbulo mayor y reducir la potencia en los lbulos laterales. Esto se logra procesando la seal digital de tal manera que las transiciones de datos sean lo menos abrupto posible resultando en mas suaves transiciones en fase. Esto permite limitar un ancho de banda esencial y provee una operacin ms eficiente. La tcnica mas usada para este propsito es llamada Minium-Shift Key (MSK).
134
Captulo 3
Sistema Iridium
cos w
(a)
ct
H (w ) =
sen w w
2 T
(b)
b
Fuente: Wilbur L. Pritchard, Henri G. Suyderhoud, Robert A. Nelson; Satellite Communication Systems Engineering; Pgina 336
la salida del dispositivo sumador depende de ambos bits Q e i. Sin embargo el estado de salida para cada intervalo de seal (llamado un smbolo) depende de un par de bits. En el dominio de la frecuencia el espectro de potencia de nuevo toma el perfil
[(sen w) / w]
mitad del necesario para la seal BPSK para la misma rata de bits. Esta reduccin en el ancho de banda es el resultado del hecho, que la velocidad de llaviado a la salida del modulador se a reducido por un factor de 2 en el caso del QPSK comparado con el caso del BPSK.
q i
Modulacin QP SK
00
cos w M ux
c
10
11
01
t pi/2
+
Sim bolo = 2 "bits"; T
s
q
(a)
=T
2 2T b
(b)
Fuente: Wilbur L. Pritchard, Henri G. Suyderhoud, Robert A. Nelson; Satellite Communication Systems Engineering; Pgina 340
136
Captulo 3
Sistema Iridium
Hay cuatro estados de fase que pueden asumirse para una seal QPSK como se ilustra en la figura 49. Ntese que cada estado de fase depende de un par de bits. Vindolo vectorialmente, los bits del canal i operan en el eje horizontal en estados de fase 0 y radianes; mientras que los bits del canal Q operan en el eje vertical en estados de fase /2 y 3/2. El vector suma de la fase del canal i y de la fase del canal Q producen uno de los cuatro estados mostrados en el diagrama de fase. Dado que los canales Q e i son ortogonales en uno con respecto del otro, la ventaja de una deteccin coherente puede ser completamente realizada en canal independientemente. Esto significa que sobre el canal i solamente la componente de ruido enfasado puede causar un error, mientras que en el canal Q solamente la componente en cuadratura del ruido puede causar un error. Entonces la probabilidad de un bit errado en un canal es idntica a la realizada en la operacin BPSK a su correspondiente velocidad y sobre la base de la probabilidad de bit errado, ambos BPSK y QPSK se desempean idnticamente de acuerdo a la ecuacin
Pb =
1 2 2
e v dv
2
(3.2)
Sin embargo el uso de QPSK provee una ventaja significativa comparada con BPSK, dado que QPSK puede obtener la misma tasa de error en un ambiente ruidoso dado mientras esta utilizando solamente la mitad de la banda requerida por BPSK.
137
(01) x
(11) x
(00) x
(10) x
Fuente: Wilbur L. Pritchard, Henri G. Suyderhoud, Robert A. Nelson; Satellite Communication Systems Engineering; Pgina 341
138
Captulo 3
Sistema Iridium
139
Emisor
Filtrado
Muestreo
Cuantificacin
Codificacin
Seal PCM
4 2 0 -2 -4
Cuantificacin
110 111 100 011 101 101 010 000 110 110 010
010
140
Captulo 3
Sistema Iridium
Decodificacin
Retencin
Filtrado
Rx
Decodificacin
110 111 100 011 101 101 010 000 110 110 010
010
Retencin
4 2 0 -2 -4
141
Fuente: Wilbur L. Pritchard, Henri G. Suyderhoud, Robert A. Nelson; Satellite Communication Systems Engineering; Pgina 360
142
Captulo 3
Sistema Iridium
Fuente: Wilbur L. Pritchard, Henri G. Suyderhoud, Robert A. Nelson; Satellite Communication Systems Engineering; Pgina 360
143
144
Captulo 3
Sistema Iridium
3.2.4. Servicios
La oferta de servicios Iridium tienen como denominador comn la conveniencia de la movilidad e integracin tecnolgica. La propuesta comercial de Iridium se basa en los siguientes servicios: voz, radiolocalizacin (paging), fax, datos; estos servicios se pueden obtener en cualquier punto de la Tierra (tierra, mar y aire) siempre que la altitud sea inferior a 185 Km. La figura 54 muestra los servicios prestados por el sistema Iridium.
Fuente: Iridium
145
3.2.4.1. Voz
Por el modo de telefonear, el usuario de Iridium puede utilizar un sistema local terrestre (cuando esta disponible) o el Iridium que esta disponible las 24 horas del da, por medio del cual puede llamar, localizar o transmitir llamadas, la alta calidad de la transmisin provee un servicio de voz digital con muy pocos segundos de retraso no como los que se encontraron en sistemas de satlite geoestacionarios. Adems, la banda L de enlaces celulares esta diseada con canales fuertes. El acceso para la constelacin de satlites Iridium es a travs de las tcnicas de acceso FDMA/TDMA, usando una antena de bajo contorno. La unidad del usuario utiliza baja potencia a comparacin con los telfonos actuales que utilizan satlites. El protocolo de sistemas como TDMA, combinado con el protocolo nico de Iridium enva la voz al destino apropiado. Iridium para el servicio de voz ofrece los siguientes planes: Solo Satlite: ofrece comunicaciones mviles con terminales de mano a travs de satlite, desde cualquier punto del globo. Universal: Con la ayuda de terminales duales celular satelital, el usuario podr utilizar la constelacin de satlites cuando su estndar celular no est disponible y viceversa, asegurando un roaming bidireccional, cobertura global y las ventajas de ambas tecnologas. Ciudad a Ciudad: Sin utilizar la constelacin de satlites, este servicio ofrece la posibilidad de efectuar roaming entre protocolos celulares terrestres como el GSM, TDMA y el IS-41 (AMPS, en Amrica principalmente). El usuario utilizar su suscripcin GSM y los servicios ofrecidos por ella en el mundo AMPS y viceversa, conservando un nico nmero personal y un nico recibo con su proveedor de servicios.
146
Captulo 3
Sistema Iridium
3.2.4.2. Radiolocalizacin
El sistema Iridium ofrece la solucin al actual problema de roaming en redes de radiolocalizacin, a travs de la emisin de mensajes por satlite en las reas suscritas por el usuario, incluyendo la posibilidad de bsqueda en todo el globo. El sistema incluye un servicio de mensajes tanto numricos con alfanumricos, las unidades de radiolocalizacin tienen una forma similar a la de los radiolocalizadores que se utilizan hoy. La funcin de rescate del mensaje utiliza una multiplexacin FDMA/TDMA para compartir la banda L con los enlaces de voz y otros servicios del Iridium. En la transmisin al radiolocalizador se puede alcanzar gran exactitud de los caracteres en el mensaje siendo este de gran alcance o no, segn sea la posicin de la unidad receptora.
3.2.4.3. Fax
El sistema Iridium tiene comunicacin de mensajes de fax, los faxes son formateados en paquetes digitales de voz usando el mismo protocolo e interfaces de ruteo que las unidades del abonado. Estas unidades tienen incorporado un puerto de datos para que funcione de interfaz entre estas y una unidad de fax.
147
148
Captulo 3
Sistema Iridium
149
150
Captulo 4
Despus de describir e informarse de la teora necesaria que involucran a los componentes bsicos de este sistema integrado de mensajera, se procede a integrar estos, en un diseo de red que pueda cumplir los objetivos y aplicaciones especiales para que el sistema sea vanguardista. Este captulo pretende trasmitir todos los pasos necesarios llevados a cabo en la integracin de los componentes que forman el sistema integrado de mensajera. Como se sabe, al momento de disear una red, el punto de partida es la planificacin y dimensionado de red y es por all donde se empieza, ya que es uno de los procesos clave para el desarrollo del negocio de un operador de telecomunicaciones. Luego se procede a desarrollar el diseo de red, enfatizando en las funciones y caractersticas principales que debe llevar cada componente del sistema para que este sea ptimo. Y para finalizar, se realiza una evaluacin del sistema por medio de un estudio de preinversin el cual contempla anlisis econmico el cual determina la factibilidad del sistema.
151
La capacidad de un sistema depende de varios factores. Un factor importante es el nmero de canales disponibles para la voz y datos. Asignar el nmero correcto de canales para cada rea especfica requiere una aplicacin de la teora del trfico telefnico. La teora del trfico telefnico utiliza estimaciones acerca de la conducta del subscriptor y de la manera como l utiliza el sistema; con estos estimados y modelos matemticos se puede calcular el nmero requerido de canales. Se pueden deducir varios perodos en el cual el volumen de trfico vari, estos regularmente pueden ser: a) variaciones de semana a semana, b) de da a da y c) de hora a hora. Estas variaciones se toman en la hora ms activa o pico. Antes de empezar a calcular las variables que interesan para llegar a saber el nmero de canales de voz, sera bueno definir qu es l trfico telefnico y de all partir hacia estas variables, las cuales son: relacin trfico por usuario; intensidad del trfico telefnico; y grado de servicio. El trfico telefnico se mide en erlangs[3], consiste en el conjunto de llamadas ofrecidas a un grupo de circuitos o canales de voz. Y un erlang es la ocupacin de un circuito durante una hora. Con esto se puede ver la cantidad de tiempo que un usuario ocupa un circuito de voz o datos.
152
Captulo 4
Basndose en las definiciones y estimaciones que se realizarn, se utilizar la ecuacin siguiente para calcular la relacin trfico por usuario.
= (n k / T )Tk
N k =1
(4.1)
Donde
Se tomo este perodo de referencia, dado que es un dato real usado por Telered.
153
154
Captulo 4
Luego de un recordatorio de las caractersticas principales del tiempo de duracin de una llamada se procede a calcular el tiempo medio de conversacin. Lo que se hace es promediar los tiempos de cada llamada de un usuario en la hora pico durante cinco das, se toma durante cinco das asumiendo que los otros dos son fin de semana y el trfico no tiene mucha demanda; por lo tanto se tiene:
Tk = (T1 + T2 + T3 +T4 + T5 ) / 5
Tk = (1+ 0 +1.5 +3 + 2.5 ) / 5 =1.6 [min .]
(4.2)
(4.3)
Como resultado se obtuvo que el tiempo medio de conversacin estimado es de 1.6 minutos. Esto muestra que tiempos de duracin de llamadas de 1 a 3 minutos son relativamente frecuentes mientras duraciones de llamadas de 10 ms minutos ocurren con mucha menor frecuencia, esto se visualiza en la figura 55.
155
nk = (n1 + n2 + n3 + n4 + n5 ) / 5
(4.4)
(4.5)
156
Captulo 4
Las ecuaciones anteriores proporcionan el nmero promedio de llamadas por usuario en la hora pico durante una semana y el cual es igual a 0.8 llamadas / usuario.
Despus de haberse definido y estimado las variables de inters se procede a calcular la relacin trfico por usuario, ingresando los valores de variables encontradas en la ecuacin (4.1).
Se puede escribir la ecuacin (4.1) de la forma siguiente, para luego hacer el clculo y obtener la relacin trfico por usuario ( ):
(4.6)
(4.7)
Dada la cantidad de trfico generado por un usuario, se puede calcular el trfico total del sistema y ste no es ms que la intensidad de trfico telefnico que en otras palabras representa el promedio de la densidad de trfico durante un perodo de una hora y tambin representa:
a. b.
El promedio de llamadas originadas durante un perodo de tiempo igual al promedio del tiempo de ocupacin; y El tiempo total, expresado en horas para cursar todas las llamadas.
157
Para el clculo de la intensidad de trfico slo se multiplica la relacin de trfico por usuario (o el trfico de un usuario) por el nmero total de usuarios que se esperan, ecuacin (4.8), en este caso se estima que inicialmente el sistema estar diseado para un nmero total de 10,000 subscriptores o abonados.
E=N *
(4.8)
Donde: E es la intensidad de trfico telefnico o el trfico total del sistema N es el nmero de usuarios
Entonces, para 10,000 abonados se generar un trfico total igual al calculado en la ecuacin (4.9) que es de 427 erlangs.
El objetivo final es fijar unas estructuras y un dimensionado, de tal manera que se garantice un grado de servicio adecuado a la demanda de los usuarios. El grado de servicio se define como la probabilidad de que el usuario llamante pueda conseguir el establecimiento de su llamada en un instante determinado. En el caso de que en ese instante la red no disponga de recursos insuficientes para realizar este establecimiento, la llamada ser rechazada; por lo que con esto es necesario abandonar el concepto ideal de servicio sin bloqueo, por lo que el usuario debe realizar otra vez la llamada o retrazarla.
158
Captulo 4
Se puede calcular el grado de servicio como la relacin entre el nmero de llamadas perdidas y el nmero total de llamadas ofrecidas o recibidas por la central; esta relacin siempre se estima durante la hora activa o pico de la semana de muestra. Para este caso se asume que se atienden 1500 llamadas diarias, de las cuales, 30 llamadas van hacer desbordadas o perdidas, entonces se tiene:
GOS =
(4.10)
(4.11)
El resultado de este clculo es de un grado de servicio igual al 4%, el cual es aceptable ya que esta entre el rango del 2% al 5%. Aunque esto es aceptable es algo muy engaoso porque una calidad ms alta de servicio es una probabilidad ms alta de congestionamiento. Despus de haber encontrado las variables de inters, siendo ellas: la intensidad de trfico telefnico y el grado de servicio, se procede averiguar el nmero de canales de voz que necesita el sistema y para eso se utiliza el concepto de erlang B, el cual se basa en el bloqueo de llamadas sin espera y abandono inmediato; donde el usuario no intenta hacer otra llamada y la cual realiza ms tarde.
159
Siguiendo en el clculo, se tiene E = 427 erlangs y GOS = 4%, con estos valores se utiliza una tabla de trfico de erlang B para que sea ms fcil un calculador de trfico de erlang B, los cuales proporcionan el nmero de canales de voz; se utiliz un calculador de erlangs B que dio un resultado igual a 426 canales de voz.
Luego de saber el nmero de canales de voz que el sistema requiere, se debe calcular el nmero de enlaces digitales de voz o E1s. Se utiliza el E1 debido a que puede transportar voz, datos y video, adecundose ms a esta aplicacin por su alta capacidad y calidad de transmisin.
La trama E1 esta compuesta de 32 canales DS0 cada uno a 64 kb/s (8 bits/por palabra PCM muestreada a 8000 muestras por segundo), estos 32 canales DS0 son multicanalizados en conjunto para formar una trama de 256 bits (8 bits/palabra PCM x 32 (tiempos) = 256 bits). As de esa forma, la trama E1 opera a una velocidad de 2048 kbits/seg, que brindan la compatibilidad a la red con la PSTN.
La multicanalizacin para E1 es por Divisin de Tiempo (TDM) para manejar varios canales PCM (30 canales de voz) dentro del flujo de bits de 2.048 Mb/s. Para mantener la alineacin de trama y sincronizacin, se maneja informacin en la ranura de tiempo 0 del E1.
Nmero de E1s =
(4.12)
Nmero de E1s =
(4.13)
160
Captulo 4
El resultado que proporciona la ecuacin 4.13 es de 14.2 E1s, para mejor conveniencia en costos se utilizarn 14 E1s, que satisfacen la demanda que debe atender la capa de conmutacin para prestar de buena forma los diferentes servicios a los 10,000 abonados. El costo del total de E1s se ver ms adelante en el anlisis de costos de red.
161
Radiolocalizador
Radiolocalizador
Acceso de llamadas
Unidad de control
Radiolocalizador
Transmisores
Radiolocalizador Radiolocalizador
Esta seccin describe el primer bloque de la estructura del sistema, este es el acceso de llamadas. Este bloque esta compuesto de las fuentes de entrada para acceder al sistema y la capa de conmutacin que en este caso es un centro de llamadas y un controlador de conmutacin virtual basado en la infraestructura de paquetes.
Para poder contar con un servicio muy eficiente, el sistema maneja los mensajes de una forma automtica, evitando gran cantidad de operarios en el proceso y solo requiriendo supervisores tcnicos de red.
162
Captulo 4
Los elementos primarios en el bloque de acceso de llamadas del sistema son las fuentes de entrada, estas son importantes porque de ellas dependen los diferentes servicios que se puedan prestar a los abonados. Las fuentes de entrada por la que el usuario puede conectarse al sistema pueden ser: a) por un telfono a travs de la PSTN, b) telfonos IP, ya que se tiene telefona sobre IP, c) Internet o red IP a travs de un computador personal. a) Telfono a travs de la PSTN: el usuario llama a travs de un telfono de la PSTN, a un centro de llamadas de telefona de paquetes (PTCC) el cual remplazar a una PBX, del PTCC se hablar ms adelante. b) Telfonos IP: en una infraestructura de IP, se pueden utilizar funciones de datos como el protocolo de configuracin dinmica de host. Este protocolo permite que un dispositivo (un PC o un telfono IP) reciba dinmicamente una direccin IP. Por lo tanto, si el usuario tiene un telfono IP configurado, podr comunicarse con el sistema entrando en el servidor de red, teniendo la ventaja de que a la red IP no le importa dnde se encuentre este. c) Internet o red IP: un servicio muy prometedor es el envo de texto o, an ms, archivos completos de una computadora al abonado, quien despus podr manipular los datos o el archivo en una computadora personal. Este servicio se puede llevar a cabo por medio de Internet o la red IP, el usuario se conecta a travs de Internet o por medio de la red IP al servidor del sistema, para eso el usuario deber tener una direccin IP configurada en su PC.
163
164
Captulo 4
Concentracin de lnea
Control de llamadas Control de conexin Prestaciones Canal comn Complejo de sealizacin Administracin Mantenimiento Facturacin
Red Conmutada
Fuente: Jonathan Davidson & James Peters. Fundamentos de voz sobre IP. Pg. 20.
b)
Capa de control de llamadas establecidas: dirige el control de llamadas, el cual es el proceso de tomar una decisin de enrutamiento o sealizacin sobre donde necesita ir una llamada y como hacer que la llamada ocurra, en el modelo de circuito conmutado esto se hace por el SS7 (Sistema de sealizacin 7). Utiliza protocolos de control de llamadas los cuales indican al flujo RTP donde terminar y donde empezar; tambin traducen una numeracin telefnica en direccin IP. Como principales protocolos de esta capa se tienen: H.323, SGCP (Simple Gateway Control Protocol), IPDC (Internet Protocol Device Control), MGCP (Media Gateway Control Protocol), SIP (Session Initiation Protocol).
165
c)
Capa de aplicaciones de servicios abiertos: En esta capa se conectan los servicios o aplicaciones para que el usuario tenga una interfaz con el sistema, as esta infraestructura es aprovechada al mximo. Ejemplo de aplicaciones tenemos el centro de llamadas, llamadas en espera o desvo de llamadas, llamada por Internet, teniendo con todo esto un servicio de mensajera unificada.
Ya que lo que se requiere es intercomunicar las redes de telefona tradicional con las redes de datos, se utiliza un conmutador virtual que est basado en el nuevo modelo descrito anteriormente, este equipo empaqueta las conversaciones y las enva va una Lan Ethernet, la cual tiene mayor calidad de servicio y seguridad.
El conmutador virtual, como en la telefona de paquetes se basa en tres planos lgicos, control de conexin, control de llamadas y control de servicios, como el que se muestra en la figura 59. Cada plano representa un aspecto funcional diferente e interacta con los otros planos a travs de interfases abiertas bien definidas.
Estos planos estn organizados jerrquicamente, con el plano de control de conexin en el nivel ms bajo, este plano abarca las funciones de configurar, mantener y borrar rutas de voz a travs de la red de paquetes. El plano siguiente es el de control de llamadas este se encarga de sealizar, procesar y enrutar llamadas de voz y datos sobre la red de paquetes, sus funciones se asemejan a las que se encuentran en la lgica del procesamiento de llamadas de un conmutador TDM. Las funciones tpicas del plano de control de llamadas incluyen el protocolo del sistema de sealizacin (SS7), el anlisis y manipulacin de dgitos, la seleccin de ruta, el seguimiento, las funciones basadas en conmutador y la comunicacin con programas lgicos de servicios externos. Esta organizacin de los planos permite que el plano de control de llamadas sea independiente del transporte de paquetes de voz subyacente, permitiendo que se utilice el mismo plano de control de llamadas con gateway de medios (MG) orientado a la capa dos y/o tres del modelo OSI de referencia sobre VoIP, mostrado en la figura 60. Este 166
Captulo 4
plano tambin comunica con el plano de servicios para proporcionar servicios flexibles mejorados, esta interfaz es tpicamente un protocolo de red inteligente (IN) basado en estndares que funcionan sobre TCAP del sistema de sealizacin (SS7), esto se realiza teniendo puntos de control de servicio (SCP) o nodos de servicio.
Plano de servicios
Lgica de servicios
SN
SCP
Plano de control de llamadas Sealizacin y control de llamadas Funcin de servicios de conmutacin Servicios de voz de extremo a extremo Lgica de llamada
VSC
VSC
Fuente: Jonathan Davidson & James Peters. Fundamentos de voz sobre IP. Pg. 280.
167
M o d e lo d e r e f e r e n c ia O S I 7 A p lic a c i n
C o n j u n t o d e l p r o t o c o lo d e I n te r n e t NFS F T P , T e ln e t , SM TP, SN M P
P r e s e n t a c i n
XDR
S e s i n
RPC
T r a n sp o r te P r o t o c o lo s d e e n r u t a m ie n t o
TCP, UDP
R ed
I P
IC M P
E n la c e
ARP, RARP
F s ic a
N o e s p e c if ic a d o s
Fuente: Jonathan Davidson & James Peters. Fundamentos de voz sobre IP. Pg. 146.
El conmutador virtual se compone de los siguientes elementos: Controlador de conmutacin virtual (VCS); Gateway de medios (MG); Punto de control de servicio (SCP); Nodo de servicios; H.323.
168
Captulo 4
Interfaces de administracin que utilizan el protocolo SNMP para errores, rendimiento y configuracin; herramientas de configuracin basadas en la web y sistemas de administracin de elementos.
VSC SS7 STP Terminacin de sealizacin PSTN/SS7 Gateway de medios Sealizacin inter-VSC
VSC
Control de conexin Gateway de medios Terminacin de sealizacin (residencial) Cable head-end PBX
GW Nodo de servicios
Residencial
Fuente: Jonathan Davidson & James Peters. Fundamentos de voz sobre IP. Pg. 282.
170
Captulo 4
171
4.2.1.2.5. H.323
Es una especificacin de la ITU para transmitir audio, video y datos a travs de una red de protocolo Internet (IP), incluida la propia Internet. El H.323 estndar dirige la sealizacin y control de llamadas, transporte y control multimedia y control del ancho de banda para conferencias punto a punto y multipunto. El H.323 estndar consta de funciones y protocolos, como a continuacin se muestra en la tabla IV.
172
Captulo 4
Funcin
Sealizacin de llamadas Control de medios Codificadores de audio Codificadores de video Compartir datos Transporte de medios
Protocolo
H.225 H.245 G.711, G.722, G.723, G.728, G.729 H.261, H.263 T.120 RTP / RTCP
Fuente: Jonathan Davidson & James Peters. Fundamentos de voz sobre IP. Pg. 223.
El H.323[4] consta de varios elementos que aqu solo se mencionarn y no se entrar en detalle, estos elementos utilizan los protocolos antes descritos en la tabla IV para proporcionar un flujo de llamada entre dos puntos. Los elementos del H.323 incluyen terminales, gateways, gatekeepers, y unidades de control multipunto (MCU, Multipoint Control Units). Luego de haber revisado los componentes ms importantes de un conmutador virtual, el cual se basa en una serie de elementos y estndares y se apoya en una serie de protocolos que cubre los distintos aspectos de la comunicacin. A continuacin se presenta un resumen de las funciones que realiza y protocolos utilizados en la proceso de una llamada, tambin se muestra en la tabla V la pila de protocolos en VoIP.
173
1.
Direccionamiento: a. b. RAS (Registration, Admisin and Status): permite a una estacin H.323 localizar otra estacin H.323 a travs de un Gatekeeper. DNS (Domain Name Service): Servicio de resolucin de nombres en direcciones IP con el mismo fin que el protocolo RAS pero a travs de un servidor DNS.
2.
Sealizacin: a. Q.931 (Mensajes de control de llamadas): sealizacin inicial de llamada entre dos puntos, para el propsito de conectar, mantener y desconectar las llamadas. b. c. H.225 (Control de llamadas): sealizacin, registro, admisin, paquetizacin y sincronizacin del flujo de voz. H.225 (Control de medios): especifica mensajes de apertura y cierre de canales para flujos de voz.
3.
Compresin de voz: para llevar a cabo esto se necesitan mensajes que intercambian de manera segura las capacidades entre dos terminales, estos indican las capacidades del terminal para transmitir y recibir audio, vdeo y datos. Para audio el intercambio de capacidades incluye codificadores de transcodoficacin de voz de la serie G. a. b. Requeridos: G.711 a 64 kbps y G.723 a 5.3 6.3 kbps. Opcionales: G.728 a 16 kbps, G.729 a 8kbps y G.722 a 48, 56 y 64 kbps.
174
Captulo 4
4.
Transmisin de voz:
a.
UDP (User Datagram Protocol): la transmisin se realiza sobre paquetes UDP, pues aunque UDP no ofrece integridad en los datos, el aprovechamiento del ancho de banda es mayor que con TCP.
b.
RTP (Real Time Protocol): Maneja los aspectos relativos a la temporizacin, marcando los paquetes UDP con la informacin necesaria para la correcta entrega de los mismos en recepcin.
5.
Control de la Transmisin:
a.
RTCP (Real Time Control Protocol): se utiliza principalmente para detectar situaciones de congestin de la red y tomar, en su caso acciones correctoras.
Direccionamiento
DT MF
Direccionamiento
RAS (H.225)
RT P / RT CP
H.245
Q .931 (H.225)
DNS
175
Despus de haber visto el funcionamiento de VoIP y el controlador de conmutacin virtual, para la interconexin de la red telefnica a IP se utilizar un equipo de Cisco llamado Access Server 5300 que cumple con todas las caractersticas antes mencionadas, ya que incluye un mdulo dedicado que realiza las tareas de gateway y viceversa; en la figura 62 se muestra un modelo de cmo se utiliza, este permite que en un ancho de 10 kbps se pueda transportar el equivalente a 64 kbps de una lnea telefnica tradicional con buena calidad.
Cisco AS5300 Puerto voz 0:D 1:D Router 1 T1 ISDN PRI wan IP
Cisco AS5300
176
Captulo 4
A continuacin se describe la configuracin del equipo AS5850-G-SK para que pueda funcionar en esta red, se describen los componentes ms importante, pero tambin hay que tomar en cuenta licencias para datos, upgrades y otros aspectos que son fundamentales en el costo y que se consideran a la hora de elegir el equipo. Equipo AS5850, interfaz Gigabit Cable de alimentacin AC para AS5800 (120 / 240 VAC) Tres cables de alimentacin AC Tarjeta Router switch controller para AS5850 Interfaz Gigabit, con convertidor 1000Base-SX (longitud de onda corta, Short Wavelength) Proveedor plus IOS de la serie de Cisco 5850 Administrador de puertos IOS serie AS5000 IOS SS7 serie AS5000 Tarjeta canalizadora para T3 ms 216 puertos universales, serie AS5800 Tarjeta de puerto 324, serie AS5800
4.2.1.3. Centro de llamadas de telefona de paquetes (PTCC Packet Telephony Call Center)
Lo que se trata es que este sistema de mensajera sea vanguardista, y permitirle al usuario un servicio al cliente ms rpido, es por eso, que en lugar de una PBX, se tiene un centro de llamadas por paquetes (PTCC Packet Telephony Call Center) el cual brinda una integracin de la telefona en la nueva red de soporte web, VoIP y comunicaciones unificadas.
177
Este centro de llamadas se compone de un procesador de llamadas y un Call Center, los cuales estn conectados a un Call Manager a travs de enlaces de telefona y de computadoras, la figura 63 muestra los componentes y diseo de un centro de llamadas PTCC. El procesador de llamadas permite que las llamadas de los usuarios sean respondidas automticamente y que estos puedan introducir y obtener informacin bsica; para esto se utilizan funciones mejoradas de sistemas como, IVR basados en IP (tambin conocidos como unidades de respuesta de voz VRU, [Voice Response Units]) y servicios de mensajera unificada como, fax a correo electrnico, voz a texto, texto a texto, para su enrutamiento final, lo cual hace que las llamadas sean manejadas con mayor rapidez. El Call Center permite que teletrabajadores o agentes de llamadas respondan a las llamadas con interrogantes de los abonados y usuarios, teniendo en pantalla los datos de los mismos, de tal manera que el agente pueda manejar la llamada de una forma ms rpida y eficientemente. Tambin evita que al haber una transferencia de la llamada a un nuevo agente, este pueda hacer la misma pregunta; esto es posible gracias a que la informacin del primer agente es volcada en la pantalla del segundo cuando la llamada le es transferida. Es necesario notar que el abonado tambin puede hacer su consulta por la red en lnea con el agente. El acceso a una infraestructura comn otorga a todos las mismas condiciones y da al usuario una idea y sentimiento comn, como muestra la figura 64.
178
Captulo 4
Sucursal
Call manager
Clientes
IP / ATM / Trama
Voz Texto
179
180
Captulo 4
Ethernet es actualmente la arquitectura de redes ms popular. Esta arquitectura de banda base utiliza la topologa de bus o bus en estrella, suele transmitir a 10 Mbps y utiliza el mtodo de acceso en CSMA / CD para regular el trfico en el segmento principal del cable.
El medio de Ethernet es pasivo, es decir, su fuente de alimentacin es el equipo y, por tanto, no falla a menos que el medio se corte fsicamente o se termine incorrectamente. En la tabla VI se resumen las caractersticas generales de Ethernet.
Topologa tradicional: Otras topologas: Tipo de arquitectura: Mtodo de acceso: Especificaciones: Velocidad de transmisin: Tipos de cables
Bus lineal Bus en estrella Banda base CSMA / CD IEEE 802.3 10 Mbps o 100 Mbps Cable delgado, cable grueso, UTP
181
En este diseo se tendr una red Lan Ethernet de 10BaseT, con una topologa de bus en estrella, es una red Ethernet con una velocidad de transmisin de 10 Mbps, que suele utilizar un cable UTP (par trenzado no blindado) para conectar los equipos. Este tipo de red requiere que cada terminal de usuario tenga un adaptador de red, el cual es una tarjeta que se conecta en un puerto ISA o PCI. La longitud mxima de un segmento 10BaseT es de 100 metros y la longitud mnima de cable entre dos equipos es de 2.5 mts., este tipo de red puede dar servicio a 1024 equipos. En la tabla VII se resumen las caractersticas de la topologa 10BaseT.
Categora
Cable: Conectores: Transceptor: Distancia del transceptor al concentrador: Total de equipos por red sin componentes de conectividad: Nmero mximo de segmentos conectados:
Especificacin
Categoras 3, 4 o 5 UTP RJ 45 al final de los cables Cada equipo requiere uno; en algunas tarjetas ya estn incorporados 100 metros como mximo 1024 segn la especificacin 5 (utilizando 4 repetidores); solo tres segmentos pueden tener equipos conectados
182
Captulo 4
A continuacin se dan las caractersticas de los equipos o pcs de los usuarios de la red. Procesador: Intel Pentium 4 su equivalente; a 2 GHz. Memoria: 128 MB. Disco duro: 20 GB. Unidades externas de almacenamiento: Disco 3.5 y CD-ROM Monitor: SVGA de 14 Sistema operativo: Unix Tarjeta de red: Gigabit (10/100/1000) Ethernet Perifricos: Modem a 9600, mouse, puerto serial
183
Operador
Base de datos
Operador
La base de datos debe estar constituida por las siguientes partes: 1. Eventos del sistema: esta parte se encarga del almacenar los acontecimientos del sistema, como son: a) entradas y salidas en los mdulos cliente, administracin y de comunicaciones, b) cambios en los datos de abonados y claves, y c) eliminacin de informacin. La estructura se muestra en la figura 66.
184
Captulo 4
2.
Mantenimiento: se encarga de los radiolocalizadores que estn en reparacin o mantenimiento, llevando un registro de estos equipos se logra tener un mejor control de daos. Los campos de esta parte se muestran en la figura 67.
3.
Mensajes: Es la encargada de almacenar los datos referentes a todos los mensajes que van ha ser enviados a travs del mdulo de comunicacin del terminal de paginacin, los mensajes son grabados originalmente con el estado de envo igual a NO, esto significa que estos mensajes estn esperando para ser enviados, el mdulo de comunicaciones peridicamente busca los mensajes no enviados o con estado igual a NO para luego distribuirlos a travs de la terminal de paginacin. En esta tabla se guardan los siguientes datos: cdigo del abonado, mensaje tipo alfanumrico, ndice de la cola de mensajes (sirve para llevar un consecutivo de mensajes), estado de envo del mensaje, fecha y hora del envo, capcode del abonado, opciones (como son el formato de bloque, prioridad, talk, alfanumrico y funcin), operador quien enva el mensaje (por ser el sistema automtico, solo se utilizar de emergente), y envo (cuantas veces a sido reenviado el mensaje); en la figura 68 se muestran los campos de este bloque.
185
4.
Operadores: Esta informacin corresponde a las personas autorizadas (en caso de emergencia) para enviar mensajes a los abonados conectados al sistema, cada vez que se ingresa un mensaje para un abonado a la base de datos, se verifica el nombre o identificacin del operador con su respectiva clave, si la identificacin o clave no es correcta no se permite el acceso al sistema. En la figura 69 se muestran los campos de esta tabla. Los operadores cuando ingresen al sistema podrn realizar las siguiente labores: Enviar mensajes a un abonado o grupo de abonados. Buscar informacin acerca del cdigo, nombre, apellido de un abonado registrado en la base de datos. Reenviar mensajes que ya han sido transmitidos al abonado.
186
Captulo 4
5.
Sistema: En este lugar la base de datos deposita informacin general acerca del sistema y cmo debe operar, hay datos tales como la clave del equipo servidor de mensajes, clave administrativa, indicacin si el servidor de mensajes se encuentra activo, longitud de mensajes, autoarranque del servidor de mensajes. Los campos se muestra en la figura 70.
6.
Abonados: En esta tabla se encuentra la informacin de los abonados del sistema, estos datos se pueden dividir en varias clases, primero se encuentran los datos generales del abonado: nombres, apellidos, telfono1, telfono2, Nit, observaciones y las observaciones del abonado para el operador; en una segunda parte se colocan los datos del radiolocalizador: cdigo radiolocalizador, capcode, capcode auxiliar, longitud del mensaje, marca del radiolocalizador, modelo y serie. En la tercera parte que se encuentra dividido estn los datos tcnicos: formato de 187
bloque, funcin, alfanumrico, prioridad y talk; y en la ltima parte se encuentra informacin referente a la cuenta: cuenta activa, clave para enviar mensajes, clave para recibir mensajes, tamao de la cola de mensajes y el ndice de la cola de mensajes. En la figura 71 se muestran estos campos.
188
Captulo 4
A continuacin se describen los mdulos del sistema con los cuales la base de datos tiene una interrelacin: a. Mdulo de administracin: es el encargado de coordinar los diferentes mdulos del sistema, adems a esta parte se le ha asignado labores que solo competen al administrador del sistema. Entre las tareas del administrador se encuentran: Permitir la adicin, modificacin o borrado de registros tanto de abonados, operadores, o radiolocalizadores en mantenimiento. Crear estadsticas de envos de mensajes como por ejemplo: Mes del ao: mensajes enviados por mes, durante un ao. Da del mes: mensajes enviados por da, durante un mes. Das de la semana: mensajes enviados por da, durante una semana. Hora del da: mensajes enviados en una hora, durante las veinticuatro horas del da. Impresin de reportes o informes de los registros de la base de datos, se puede imprimir informacin de abonados, operadores, mantenimiento y estadsticas. b. Llevar controles de los servidores conectados a la terminal de paginacin.
Mdulo operador: el trabajo primordial es de distribuir los mensajes de los usuarios hasta la base de datos para luego ser enviados al abonado correspondiente, cabe aclarar que este trabajo solo se realizar en el momento de tener una emergencia cuando el sistema no pueda ser automtico. Otro de los trabajos de este mdulo es atender las consultas e interrogantes del abonado, sirviendo como un Call Center.
189
c.
Mdulo de comunicacin con la terminal de paginacin: este mdulo sirve de interfaz entre los mensajes a enviar y el protocolo del terminal de radiolocalizacin, entre las funciones de este mdulo se encuentran: Verificar que el terminal de radiolocalizacin se encuentre presente, o sea que se encuentre conectado al equipo y encendido para su correcto funcionamiento. Conectar al terminal de radiolocalizacin y colocar en la tabla sistema el registro servidor en SI, que da la opcin de comenzar a enviar mensajes. El servidor busca peridicamente mensajes sin enviar, los codifica en el protocolo que maneja el terminal de radiolocalizacin y los despacha, luego hace el cambio respectivo en la base de datos, o sea consigna en la base de datos que el mensaje ha sido enviado cambiando el valor del registro con estado de envo igual a SI. El servidor tambin verifica que el mensaje no sea posfechado, o sea se pueden programar mensajes para que se enven a una hora y fecha programada, esto se logra cuando el servidor compara la fecha actual con la del mensaje, si la fecha es mayor que la actual el servidor no enva este mensaje, solo se distribuye el mensaje cuando la fecha del mensaje sea menor o igual que la presente y el estado de envo es igual a NO.
d.
Mdulo de comunicacin cliente externo: debido a la estructura de esta red, se ofrece una conexin va Internet, mdem y por IP. De esta forma el usuario podr enviar mensajes directos sin pasar a travs de la red de conmutacin. Este mdulo est equipado con una interfaz de software el cual permite hacer la conexin con el servidor de Internet, un mdem, etc.
190
Captulo 4
Proveer un enlace constante entre los usuarios externos (quienes se conectan a travs de Internet, mdem, o IP) y el servidor de mensajes el cual se encarga de conectarse con la base de datos y enviar los mensajes.
Verificar la integridad de los datos del abonado en el envo de mensajes. Manejo de seguridad de los clientes externos, as no habrn intromisiones de personas no autorizadas para el envo de mensajes.
Bsicamente, el reconocimiento de voz es un proceso de clasificacin de patrones, cuyo objetivo es clasificar la seal de entrada (onda acstica) en una secuencia de patrones previamente aprendidos y almacenados en unos diccionarios de modelos acsticos y de lenguaje. Este proceso de clasificacin supone, en primer lugar que la seal de voz puede ser analizada en segmentos de corta duracin y representar cada uno de los segmentos mediante su contenido frecuencial, de forma anloga al funcionamiento del odo. En segundo lugar, que mediante un proceso de clasificacin podemos asignar a cada segmento o conjuntos consecutivos de segmentos una unidad con significado lingstico. En tercer lugar, que mediante un procesador lingstico podemos dar significado a las secuencias de unidades. Este ltimo paso del sistema, supone incorporar al sistema de reconocimiento de voz, conocimiento acerca de la 191
estructura sintctica, semntica y pragmtica del lenguaje. Todas estas caractersticas se muestran en la figura 72.
Procesamiento acstico
Modelo de lenguaje
Voz
Procesamiento acstico
Cadena de palabra
En la figura 73 se muestra un diagrama del modelo de comunicacin para reconocimiento de voz, el acceso a la informacin contenida en una base de datos comienza con la produccin de un mensaje hablado por el usuario, pero utilizando una forma o estilo de habla restringido (en este poca, esperando que en un futuro si se pueda dar el reconocimiento en un 100%). A partir de la seal de voz, un proceso de clasificacin, basado en reconocimiento de patrones asociados a diferentes unidades lingsticas (palabras, fonemas, slabas, etc.), permite a una interfaz de comunicaciones proporcionar a la base de datos la informacin que el usuario necesite enviar. Cabe mencionar que en este momento slo se encontr en el mbito de las telecomunicaciones 192
Captulo 4
tres aplicaciones que usan reconocimiento de voz, marcacin por tono en la red privada, reconocimiento de letras (palabras aisladas independiente del locutor) y reconocedor de palabras aisladas dependiente del locutor aplicado a la marcacin de nmeros de telfonos por voz.
Usuario
Estilo de habla
Base de datos
194
Captulo 4
Unidades externas de almacenamiento: Disco 3.5 y CD-ROM. Monitor: SVGA de 14. Sistema Operativo: Unix Tarjeta de red: Gigabit (10/100/1000) Ethernet. Perifricos: Mdem a 9600, ratn, puertos seriales y paralelos.
Cabe hacer notar que por seguridad para Internet se requiere de un firewall basado en software; este debe estar conectado a el servidor de correo electrnico y al servidor de Internet para lograr protegerlos.
Mensajes alfabticos, numricos, por tonos y voz. Soporta troncales anlogas y digitales. Mensajes de voz: un sistema de mensajes verstil de voz y nmeros puede proveer desde 6 hasta 600 Hrs. de almacenamiento de voz. Tambin posee caractersticas adicionales como mensajes desechados, notificaciones, recordatorio de mensajes no contestados, saludos y anuncio de cambio de nmero.
Trascripcin alfabtica: convierte todos los mensajes de voz a los mensajes alfabticos a travs de un operador para su posterior transmisin. Capacidad de red: ofrece toda la posibilidad de interconexin por red. Mantenimiento flexible y fcil: de diagnstico local o remoto y capacidad estadstica, mantenimiento en lnea y una opcin de sistema de redundancia.
196
Captulo 4
Capacidad de direccionamiento. Velocidad de transmisin acorde con el trfico. Alta proteccin frente a llamadas dirigidas a otro receptor. Mtodos que permiten consumo bajo de energa a los receptores. Permitir la transmisin secuencial y cuasisncrona. Decodificacin sencilla en los receptores. Proteccin contra efectos de transmisin: interferencias, solapamiento, etc. Permitir convivir a varios fabricantes sobre un mismo sistema. Capacidad de transmisin de mensajes numricos y alfanumricos adems de avisos. Proteccin contra la generacin de mensajes incorrectos.
197
El SMTP es un protocolo usado para enviar correo electrnico por una red, con la limitante de que no define mtodos para enviar otras formas de informacin y documentos adjuntos. El http es usado para enviar mensajes por medio de sitios de Internet, es implementado en los gateways que son usados como portales a los sistemas de radiolocalizacin, requiere una conexin fiable y es soportado en redes de TCP / IP.
198
Captulo 4
199
El protocolo FlexTM define diferentes tipos de campos que contienen diferente informacin como: configuracin y control del sistema, sincronizacin, direccin del radiolocalizador, datos del usuario y otros. Cada trama contiene una combinacin de estos tipos de campos; donde los datos del usuario son parte de la informacin que se transmite. Los datos son encapsulados en cadenas ( codewords) de 32 bits (4 octetos) de longitud, donde solo 21 bits estn habilitados para informacin, los otros 11 son usados para deteccin de errores. Los datos se condensan en cada cadena no importando cuantas cadenas se usan; es decir, se llena la informacin en los 21 bits habilitados, hasta que est lleno, lleno este se contina con otro y as se repite hasta que la informacin del usuario est completa. Los datos numricos se codifican usando 4 bits por dgito, los alfanumricos 7 bits por carcter y los hexadecimales y binarios se toman como bits individuales. Con esto se sabe que: a) el nmero mximo de mensajes numricos que pueden enviarse en una trama es de 8 cadenas (codewords) conteniendo 41 dgitos, b) el nmero mximo de mensajes alfanumricos que pueden enviarse en una trama es de 84 cadenas (codewords) conteniendo 252 caracteres, y c) el nmero mximo de mensajes hexadecimales y binarios que pueden enviarse en una trama es de 84 cadenas (codewords) conteniendo 1764 bits. Cabe mencionar que en los mensajes alfanumricos y hexadecimales / binarios pueden enviarse en las subsiguientes tramas con una longitud mxima no especificada, que por lo regular el operador del sistema de radiolocalizacin limita el tamao de los mensajes. En la tabla VIII se muestra los limites mximos de datos en el protocolo FlexTM.
200
Captulo 4
Mensaje numrico
Mensaje alfanumrico
83 en la 1ra. trama, 8 84 en las tramas subsiguientes 249 caracteres en la 41 dgitos 1ra. trama, 252 en las tramas subsiguientes No Si (sin lmite en la trama)
83 en la 1ra. trama, 84 en las tramas subsiguientes 1743 bits en la 1ra. trama, 1764 en las tramas subsiguientes Si (sin lmite en la trama)
Mximo de datos del usuario por trama Continuacin de tramas Mximo de datos del usuario impuestos por el protocolo
41 dgitos
Sin lmite
Sin lmite
Fuente: Motorola
En las siguientes tablas se dan algunas comparaciones de caractersticas importantes de los protocolos y demuestran el porqu de la escogencia de protocolo FlexTM. En la tabla IX se muestra una comparacin de velocidad y nmero de abonados por canal de los distintos tipos de protocolo; luego en la tabla X se muestra una matriz de comparacin de caractersticas de protocolos ms recientes incluido el FlexTM.
201
Tipo de radiolocalizador
Tipo de codificacin
Tono y voz Tono y voz nicamente tono nicamente tono Numrico Numrico Numrico
Numrico
4 segundos 0.25 segundos 512 bps 1200 bps 512 bps 1200 bps 2400 bps
6400 bps
Alfanumrico Alfanumrico
Alfanumrico
POCSAG POCSAG
FlexTM
10,464 24,525
131,000
Fuente: Motorola
202
Captulo 4
Protocolo
POCSAG
ERMES
Tecnologa de
Descripcin
Tecnologa de una va, velocidad alta Numrico y alfanumrico (4/7 bit, binario y caracteres simblicos) Cualquier frecuencia habilitada para el sistema de radiolocalizacin
Aplicacin
Frecuencia de operacin
Capacidad de
roaming
No soporta
sistemas roaming
Soporta
25 kHz
25 kHz
6250 bps
6250 bps
Fuente: Motorola
203
El sistema de control o controlador a utilizar es el C-Net y el cual tiene las siguientes caractersticas:
Controlador avanzado de redes RF. Enlaces de la terminal a la estacin de base. C-Net se puede conectar a la estacin base por medio de lnea fsica, radio enlace, microonda o satlite. C-net reduce grandemente la necesidad de viajar a las estaciones base y permite actualizar su software sin tener que hacer el viaje. Soporta multiplexacin de mltiples sistemas digitales radiolocalizadores montados en un enlace simple. Soporta seal de radiolocalizacin de ms de 6,400 bps. y formatos de alta velocidad como FlexTM. Soporta correccin de error saliente para todos los datos de localizacin y en todos los formatos. Soporta autoalineamiento de modulacin en retraso. Soporta regeneracin de seales en los puntos de transmisin. Provee un sistema comprensible y equipo de diagnostico. 204
Captulo 4
proveedor de Internet y la red de radiolocalizacin es necesario contar con puertas de enlace o gateways, los cuales manejan la traslacin protocolar y enrutan la informacin entre los sistemas externos y la infraestructura de la red.
205
206
Captulo 4
Alimentacin 48 Vdc.
La distancia tpica alcanzada por estos radios es de 40 Km. Para el enlace se utilizan antenas parablicas de 3 pies de dimetro en ambos extremos.
4.2.3. Transmisin
La parte de transmisin es la encargada de aceptar y propagar los mensajes provenientes de la infraestructura de radiolocalizacin a los radiolocalizadores de los abonados. Reciben la seal del sistema de control o controlador, extraen la orden de disparo y modulan convenientemente a una portadora de radiofrecuencia. La transmisin es diseada para operar en un rango de frecuencias asignadas exclusivas para el sistema de radiolocalizacin de Guatemala, la cuales se pueden ver en la tabla XI. En estas frecuencias no hay refraccin y las sombras de la seal radioelctrica se producen en cara no iluminada del objeto que obstruye, por ejemplo una montaa; La peor obstruccin es la del radiohorizonte, debida a la curvatura terrestre. Tambin se puede mencionar que la seal se refleja sobre la superficie de los objetos prximos, y las zonas de sombra se rellenan de reflexiones de la seal. Esto permite que en ncleos urbanos la recepcin sea posible tanto directamente desde el transmisor como por el conjunto de diversos rayos reflejados.
207
Servicio
Paging Paging Paging Paging Paging Paging two way Paging two way Paging two way
Tx (MHz)
931.000 929.000 460.000 156.8375 150.050 901.000 940.000 930.000 932.000 930.000 470.000 174.000 156.7625 902.000 941.000 931.000
Otro aspecto importante a considerar es el rea de cobertura de la ciudad principal y reas adyacentes, en este caso son la Ciudad Capital y sus departamentos, del anlisis de cobertura se toma la decisin de cuantos sitios transmisores debe tener la red de transmisin, para este se puede utilizar algn software que analice reas de cobertura deseadas, estos softwares hacen su anlisis en base al criterio de Ohmori Okumura[5]. Cabe mencionar que se utilizar transmisin simultnea, en la cual la seal se enva a mltiples transmisores los cuales se sincronizan por un sistema GPS, para que esta llegue al mismo tiempo; esto evita que se tengan problemas por interferencias en la propagacin por solapamiento de las seales provenientes de los transmisores prximos.
208
Captulo 4
Despus de considerar aspectos importantes como frecuencias y rea de cobertura, los equipos encargados de la transmisin son ncleos, antenas, que juntos hacen las estaciones base y el satlite Iridium del que se habl en el captulo 3 y en el apartado 4.2.2.6.2.
4.2.3.1. Ncleos
Bsicamente los ncleos son el cerebro de la transmisin, reciben los mensajes de los controladores, los cuales son codificados segn el protocolo usado en la transmisin, para luego transmitirse en el momento preciso indicado por el controlador. Por lo regular el sistema de radiolocalizacin maneja una tasa de transferencia de datos entre 1200 a 6400 bps en el canal de salida y el cual tradicionalmente, los protocolos de radiolocalizacin lo usan a 25 kHz. A continuacin se dan las caractersticas que tienen los ncleos: Control por microprocesador ofrece la mxima flexibilidad para cambios en el sistema y parmetros de operacin. Un sistema de procesamiento digital de la seal, soporta cuatro niveles de operacin y cdigos de alta velocidad. Un diseo trmico ptimo y disipadores trmicos confiables para prolongar la vida de los componentes e incrementar la confiabilidad de la estacin base. Fcil mantenimiento debido a su diseo completamente modular, panel frontal de acceso y mdulos de componentes tipo gaveta. Trabaja con diferentes distribuciones de medios de transmisin: lnea fsica, radio enlaces, microondas. Una amplia variedad de salidas de RF disponibles desde 20 hasta 350 vatios. Disponible en diferentes bandas de frecuencia: VHF, 280 MHz., 900 MHz., y UHF. 209
Acomoda todos los formatos de radiolocalizacin: voz, 2 tonos, 5/6 tonos, POCSAG, GSC y formatos FLEXTM que pueden usarse solos o en combinacin.
4.2.3.2. Antenas
El servicio de radiolocalizacin requiere penetracin dentro de los edificios. A las frecuencias de la tabla XI. la penetracin es buena, aunque se producen prdidas. Las antenas suelen ser omnidireccionales, en la tabla XII y en la figura 74 se dan las especificaciones elctricas y el patrn de radiacin del antena, del modelo CT1D0F0083-012 de Andrew, que se utilizar en el diseo, aunque se pueden utilizar de otras marcas tambin siempre y cuando cumplan con los requisitos.
Banda de frecuencia, MHz Ganancia, dBd (dBi) Elevacin Beamwidth (grados) Retorno de prdidas, dB (VSWR) Impedancia, ohms Tipo de polarizacin Inclinacin elctrica vertical, grados Potencia mxima de entrada, Watts Proteccin Tipo de conector Posicin del conector
Fuente: Andrew
806 a 869 10 (12.2) 4.5 >14.0 (<1.5) 50 Simple / Vertical 0 500 Tierra DC 7 16 DIN hembra Bajo
210
Captulo 4
Fuente: Andrew
4.2.4. Recepcin
El bloque de recepcin lo componen radiolocalizadores, que son dispositivos de comunicacin personal del abonado. En el siguiente apartado se da un resumen del tipo de radiolocalizador a utilizar, tomando en cuenta que en el captulo uno se describieron ciertas caractersticas de funcionamiento y funciones de los mismos. Adems se toma en cuenta los radiolocalizadores Iridium que son un complemento a los servicios prestados por este sistema integrado de mensajera.
211
4.2.4.1. Radiolocalizadores
Tpicamente los radiolocalizadores operan en una banda de frecuencia limitada, la frecuencia se programa en el dispositivo y corresponde a la frecuencia que el portador es autorizado a usar; una de las consideraciones es el uso del protocolo FlexTM por lo que los dispositivos a usar deben de soportar dicho protocolo. Los radiolocalizadores que utilizan el protocolo FlexTM, se clasifican con base en la forma en que se comunican, y tomando en cuenta que dicho protocolo acepta mensajes numricos y alfanumricos, entonces los posibles radiolocalizadores a utilizar son alfanumricos por lo que a continuacin se dan ciertas caractersticas de ellos y se comparan con los numricos.
212
Captulo 4
213
Caractersticas
Funcin
Modo de comunicacin
El contenido de la informacin es el ms alto de todos los dispositivos. La sealizacin es rpida, por lo que la capacidad de canal de radio es grande. Los mensajes son privados. Los mensajes pueden ser salvados para una revisin posterior. Notificacin de noticias, informacin climatolgica, deportes, finanzas, etc. El costo es ms elevado que el numrico.
Desventajas:
Fuente: Motorola
Ya que se ha resuelto que se utilizarn radiolocalizadores alfanumricos con protocolo FlexTM, para este protocolo se tienen los siguientes modelos de radiolocalizadores: Advisor FLX32TM, Advisor Gold FLXTM, Advisor Pro FLXTM, Memo Jazz FLEXTM, ScriptorTM FLX2, ScriptorTM FLX4, Wordline FLXTM.
214
Captulo 4
215
Una vez descrito cada bloque del Sistema Integrado de Mensajera, puede este representarse en un diagrama general donde se muestre cada componente, visualizndose en la figura 75. Teniendo en el diagrama la solucin integrada de mensajera, se pueden definir los siguientes servicios que el sistema puede prestar. Servicio de radiolocalizacin con reconocimiento de voz: a travs de un telfono PSTN o telfono IP al sistema, en la cual el mensaje del usuario es convertido a texto para su transmisin a un radiolocalizador o al correo electrnico del abonado, segn la eleccin del usuario. Servicio de radiolocalizacin a travs de Internet o correo electrnico: envo de mensajes de texto a un radiolocalizador o al correo electrnico del abonado. Servicio de radiolocalizacin va satlite: envo de mensajes a un radiolocalizador Iridium en cualquier parte del globo. Una vez se tiene una red VoIP, se puede empezar a ofrecer otros servicios de valora aadido y comunicaciones interactivas de multimedia, como son la llamada por Internet en espera (ICW, Internet Call Waiting) y segunda lnea virtual (V2L, Virtual Second Line). Bsicamente, el ICW es un servicio que permite a los abonados recibir la notificacin de una llamada de voz entrante en su PC, mientras estn conectados a Internet; la notificacin se realiza mediante una pantalla emergente y en ese momento pueden hacer lo siguiente: Enviar la llamada al correo de voz. Recibir la llamada en el PC utilizando software H.323 (VoIP). Suspender la sesin de Internet y recibir la llamada en el telfono tradicional (PSTN). Transferir la llamada a un telfono celular. 216
Captulo 4
El V2L, es un servicio sencillo, ya que permite a los usuarios de Internet hacer y recibir llamadas de telfono a travs de su servidor de servicios de Internet slo cuando estn conectados a travs de su conexin a Internet.
WMtp
e-mail Internet
x Fle
Fle x
Estacin base
Zona A, Freq. 1
Access Server
Telfono IP
x Fle
Estacin base
Zona C, Freq. 1
Fle x
Zona B, Freq. 1
Estacin base
217
218
Captulo 4
Servicios
Recursos financieros
M ercado
Los recursos financieros son en general escasos ya que las posibilidades de utilizacin del dinero son mayores que la disponibilidad de capital. Luego se requiere de una serie de criterios y tcnicas para distribuir racionalmente el recurso financiero para que el proyecto sea ms rentable. De esta forma la evaluacin econmica mide las ventajas y desventajas de un proyecto, con el propsito de que los recursos disponibles sean asignados a un proyecto que sea factible.
La seleccin de un proyecto de telecomunicaciones no puede ser hecha arbitrariamente, sino que debe ser el resultado de una decisin cuidadosa, basada sobre consideraciones objetivas. Lo que se requiere son tcnicas tales como mtodos de evaluacin, los que guan la seleccin de un curso particular de accin de entre varias alternativas, por mtodos cuantificados.
219
Por la naturaleza y caractersticas propias este proyecto entrega un servicio de comunicacin, con una funcin estratgica independiente, con origen en un sector econmico privado. Por otro lado el objetivo para la elaboracin de este proyecto (hipotticamente) se origina para presentrsele a posibles inversionistas. El desarrollo de un proyecto de telecomunicaciones requiere generalmente pasar por una serie de etapas desde la idea, perfil hasta la puesta en marcha del servicio. El proceso general distingue una primera fase de concepcin intelectual (preinversin), en la cual el proyecto se analiza por medio de tcnicas de evaluacin realizando primeramente un estudio de viabilidad o prefactibilidad, para luego continuar, con el estudio de factibilidad tcnico econmico o evaluacin de proyecto propiamente. En los siguientes apartados se describen estas etapas de preinversin.
4.3.1.1. Idea
El origen de este diseo, prev un sistema donde se tengan varios servicios integrados que hagan fcil la comunicacin a usuarios que necesiten estar localizables.
220
Captulo 4
4.3.1.3. Factibilidad
El estudio de factibilidad tcnico econmico, se define como el conjunto de antecedentes que permiten analizar las ventajas y desventajas tanto tcnicas, como econmicas de asignar recursos a una unidad productiva para producir un servicio. Si la evaluacin del proyecto concluye que es rentable, se pasa a la segunda fase de implementacin fsica en la cual se realiza la ingeniera final del proyecto, su construccin, montaje y puesta en marcha, tal y como se aprecia en la figura 77, como se mencion anteriormente esta segunda fase no se desarrollar. La evaluacin tcnica econmica es una herramienta analtica que responde a la pregunta sobre si un proyecto es o no rentable y si se recomienda su implementacin a travs de la asignacin de los recursos financieros requeridos, o por el contrario, si se rechaza el proyecto analizado por no poseer factibilidad econmica y por generar futuras prdidas financieras; al no ser capaz de originar flujos que amorticen las inversiones requeridas y costos asociados al proyecto, todo esto es lo que se comprueba en las siguientes paginas. Para cumplir los objetivos, la evaluacin del proyecto sigue habitualmente una metodologa que distingue tres etapas principales que darn las conclusiones esperadas en cuanto la factibilidad del proyecto, estas son: estudio de mercado, estudio tcnico y estudio econmico.
221
Estudio de viabilidad
Re-estudiar
Adquisiciones
Rechazar
Fin
Pruebas tcnicas
Aprobar
Estudio de factibilidad
Re-estudiar
Puesta en marcha
Pruebas de mercado
Rechazar
Fin
Pre ingeniera Aprobar Especificaciones tcnicas
Fin
Ingeniera
Ingeniera diseo
Van
222
Captulo 4
forma, un radiolocalizador le ayuda a estas personas a ser ms efectivas en su trabajo. 2 Radiolocalizador personal: en la actualidad existe un mayor nfasis para usar un radiolocalizador para mantenerse en contacto con miembros de la familia. Si se tiene xito en abrir el mercado del consumidor, se ver que el nmero de radiolocalizadores en uso se multiplicar por diez. 3 Radiolocalizador en lneas no tradicionales: En la actualidad los sistemas de informacin son muy importantes en la radiolocalizacin. Una variacin muy prometedora de este tipo de servicio es el envo de texto o, an ms, de archivos de completos de una computadora al usuario, quien despus podr manipular los datos o correr el archivo en su computador. Obviamente, este servicio es de mucho ms valor para el abonado. b. En que negocio se est? El negocio de radiolocalizacin, realmente proporciona un medio de comunicacin personal a personas con un estilo de vida dinmico. Desde el punto de vista puramente de ventas, es ms rentable vender el servicio que vender el radiolocalizador. La gente responde a la idea de estar en contacto con sus clientes bien, con sus superiores, el hecho de estar disponible brinda muchos beneficios palpables. Una vez que estn convencidos de que esto es algo bueno, la idea de andar con un radiolocalizador todo el tiempo ser aceptada con mayor facilidad. As que se vende el servicio, el servicio es enviarle mensajes a nuestros clientes. Estos mensajes son transmitidos a travs de un canal de radio, as que lo que verdaderamente se vende son pedacitos de tiempo en el canal de radio. Nunca hay que olvidar que este canal de radio es el recurso ms valioso. Una vez que la hora ms ocupada del da en el canal de radio est topada, ser imposible aadir ms clientes para el servicio de radiolocalizacin personal.
224
Captulo 4
c.
Como promover nuestro servicio? 1 Promocin tradicional: el aliado tradicional es el anuncio en el peridico, esto an funciona muy bien, especialmente en la seccin comercial del peridico. La televisin probablemente resulta cara, a menos que se haya tomado la decisin de captar el mercado del consumidor. Las papeletas parecen funcionar en pueblos pequeos pero con frecuencia son ignoradas en la ciudad. Anuncios en la radio son efectivos, especialmente durante las horas en que las personas viajan a y desde sus trabajos. que se estanque. 2 Distribucin al por menor: el mejor negocio hoy en el mundo de radiolocalizacin es la distribucin al por menor de radiolocalizadores; ya que estos se pueden tener en vitrinas donde los clientes pueden llegar y comprarlos. 3 Ventas directas: esta es todava la mejor forma de captar cuentas, especialmente las cuentas vitales de clientes grandes corporativos, esto se llama mercadeo de empuje, se debe contar con buenos vendedores, bien entrenados, motivados y agresivos. Se debe ofrecer un proceso sencillo y placentero al cliente cuando ste quiera conseguir un radiolocalizador y as se publicitar el servicio dentro de la gente. Demasiada publicidad puede llevar un negocio a la bancarrota, muy poca puede hacer
225
d.
Que tipo de gente se necesita? 1 Gerencia: se necesita un buen gerente, un lder, que pueda motivar a la gente y comprenda las exigencias de administrar bien un negocio y la labor de ventas. 2 Ventas: las tres primeras reglas para manejar exitosamente un equipo de ventas es: motivacin, motivacin y motivacin. Los rubros que siguen pueden parecer obvios, pero es sorprendente ver que con frecuencia son ignorados. Comisiones: un buen plan de comisiones mantendr al equipo de ventas continuamente gil y atrayendo a nuevos clientes, y estos nuevos clientes son el pulso de la empresa. Apariencia: los vendedores deben de tener una presentacin profesional ya que esto les ayudar a ser percibidos como tal. Actitud: este rubro es ms complejo, posiblemente es el aspecto ms difcil de la conducta humana con el cual se enfrenta siempre; se necesitan empleados con una buena actitud, el respeto a la dignidad humana y la cortesa de parte de los empleados no sucede automticamente, debe darse desde arriba hasta abajo en la compaa, para as estos a los clientes y se tenga una satisfaccin total hacia el cliente. 3 Gestin administrativa y operacional: a menudo se considera que esta parte del personal est detrs del teln y que es poco importante. Nada ms lejos de la verdad, este grupo consiste de personas de apoyo y son vitales para la organizacin. Deben ser escogidos por su talento y personalidad, recibir entrenamiento sobre como operar el equipo y sobre la etiqueta a observar en sus relaciones telefnicas comerciales. 4 Tecnificacin: es esencial que se disponga de personal tcnico altamente entrenado y calificado. La confiabilidad del sistema no es tan slo un asunto 226
Captulo 4
de tener un buen negocio, es tambin un asunto de tica. Se debe de tener un personal tcnico (ingenieros y tcnicos) debidamente entrenado, con repuestos adecuados y equipo para realizar pruebas que deben mantener funcionando el sistema. e. Cmo planificar una expansin? 1 Capacidad del sistema: Se recomienda que el sistema siempre est por lo menos un ao delante de su ritmo de crecimiento, con una configuracin inicial apta para los primeros cinco aos. La buena planificacin es una buena prctica comercial, hay que evitar no ignorarla. 2 rea de cobertura: El rea de comercializacin debe estar saturada con la seal de radiolocalizacin, debe penetrar edificios, alcanzar a los sitios de estacionamiento subterrneo y extenderse hasta afueras del rea que se pretende abarcar. Una expansin planificada del rea de cobertura debe ser un evento continuo hasta los lmites de la licencia o concesin y debe incluirse en cada presupuesto anual.
227
Cantidad
Nombre equipo
Costo unitario
Costo total
Costo total
14 1 1 1 1 1 1 1 1 1 1 1 6 6 6 6
E1s Access server Call manager Red Lan Ethernet Servidor base de datos Servidor correo electrnico Servidor Internet Base de datos Software reconocimiento de voz Terminal de radiolocalizacin Control de radiolocalizacin Gateway Internet Radios Ncleos Antenas Sitios estaciones base
Totales
$. $. $. $. $. $. $. $. $. $. $. $. $. $. $. $.
2,000 $. 2,000 $. 11,200 $. 1,000 $. 2,500 $. 4,000 $. 5,000 $. 1,500 $. 5,000 $. 12,000 $. 2,000 $. 9,200 $. 14,000 $. 1,200 $.
28,000 Q. 224,000 12,000 Q. 11,200 Q. 1,000 Q. 2,500 Q. 4,000 Q. 5,000 Q. 1,500 Q. 5,000 Q. 12,000 Q. 2,000 Q. 96,000 89,600 8,000 20,000 32,000 40,000 12,000 40,000 96,000 16,000
228
Captulo 4
229
230
Captulo 4
Balance inicial
1 2 3
Activo Caja Q. Diferidos Q. Activos fijos Q. Total Q.
3,017,280 1,293,120
4,310,400
Desde un principio vale la pena estimar las ventas, teniendo en cuenta la capacidad de operacin de la empresa y los precios unitarios asignados a los servicios, se considerar un precio promedio de todos los servicios prestados siendo este de Q.480.00. Se puede observar que el primer ao se dedica a la instalacin de la empresa y, por lo tanto, no se prestan servicios; durante los prximos aos, se considera que el proyecto est activo y paulatinamente se incrementarn los abonados hasta llegar a la ptima utilizacin de su capacidad instalada. En la tabla XVI se presenta la estimacin del incremento de abonados y las ventas por perodos establecidos.
Ventas
Perodo Abonados Ventas 1 2 3 4 5 6 1500 1750 2000 2250 2500 Q.720,000 Q.840,000 Q. 60,000 Q.1,080,000 Q. 1,200,000
Como lo que interesa es obtener flujos de efectivo, entonces se disea un modelo que permite alcanzar este objetivo. Primeramente se considera que para costos de operacin se tendr el primer ao de operacin Q.96,000.00 y los cuales se incrementan en promedio un 5% en cada ao, debido a que crece la utilizacin de la capacidad instalada. Cabe mencionar que los costos de operacin se clasifican en gastos de fabricacin, gastos administrativos, gastos de ventas y gastos de financieros; discriminados en costos fijos y variables.
231
Otro factor importante a considerar es el tratamiento que se les da a las depreciaciones y a la amortizacin de diferidos, pues siendo contabilizados como costos no constituyen erogaciones reales de la empresa durante el periodo de operacin. La tabla XVII ilustra su comportamiento.
Depreciaciones y diferidos
Perodo 1 2 3 4 5 6
Inv. Fijas Q. 4,218,400 depreciables Deprec. Anual (20%) Q. 32,000 Diferidos Amort. diferidos
Q.843,680 Q. 8,000
Q.843,680 Q. 8,000
Q.843,680 Q. 8,000
Q.843,680 Q. 8,000
Q.843,680 Q. 8,000
Considerando, que los aportes de los socios no son suficientes para atender las necesidades financieras, se precisa acudir al crdito; tal como lo precisa la informacin del balance inicial se requieren Q.3,017,280 de crdito que se consiguen en las siguientes condiciones: pagadero en 5 aos, con uno de gracia (no se amortiza a capital, pero si se pagan intereses) y con una tasa de inters anual del 19% sobre saldos. Los intereses se causan y se pagan en cada perodo dependiendo del monto del saldo del crdito vigente. En la siguiente tabla se muestra el manejo del crdito.
232
Captulo 4
Manejo de crdito
Perodo 1 2 3 4 5 6 Totales Intereses (19%) Amortizacin crdito Saldo Total
Q. Q. Q. Q. Q. Q.
Q. Q. Q. Q. Q.
Q. Q. Q. Q. Q. Q. Q.
Q. Q. Q. Q. Q. Q.
A continuacin se presenta la tabla XIX que permite recoger y organizar la informacin sobre la utilizacin inicial de los recursos, es el presupuesto de inversiones con financiamiento 2. Cabe mencionar que en el perodo sptimo, ao de liquidacin del proyecto, se estima que los activos fijos tendrn un valor comercial calculado en el 33.33% de su valor inicial, por lo tanto se recuperan Q.1,405,993 por este concepto al liquidar el proyecto.
De la tabla XIX en adelante se encontraran algunas cantidades con signo negativo o con parntesis, estas son cantidades negativas que significan inversin o gasto.
233
1
-4,310,400 3,017,280
2
0.00
3
0.00
4
0.00
5
0.00
6
0.00
7
1,405,993
0.00 -1,293,120
- 754,320 - 754,320
- 754,320 - 754,320
- 754,320 - 754,320
A continuacin se presenta el programa de beneficios anuales, que con la utilizacin de financiamiento por parte de la empresa genera una disminucin en los impuestos. A partir de la ventas se resta el monto de los costos de operacin para obtener la utilidad antes de impuestos, a este valor se le descuentan los impuestos (34 %), para llegar a las utilidades despus de impuestos; a esta cifra se le agregan las depreciaciones, amortizacin de diferidos y reserva legal para obtener finalmente el flujo de efectivo o flujo de ingresos de operacin, el cual se presenta a continuacin.
234
Captulo 4
2
Q. 720,000 Q. 96,000 Q. 624,000 Q. 573,283 Q. 50,717 Q. 17,244 Q. 33,473 Q. 3,347 Q. 30,126 Q. 843,680 Q. 8,000 Q. 3,347 Q. 885,153
3
Q. 840,000 Q. 100,800 Q. 739,200 Q. 573,283 Q. 165,917 Q. 56,412 Q. 109,505 Q. 10,951 Q. 98,555 Q. 843,680 Q. 8,000 Q. 10,951 Q. 961,185
4
Q. 960,000 Q. 105,840 Q. 854,160 Q. 429,962 Q. 424,198 Q. 144,227 Q. 279,970 Q. 27,997 Q. 251,973 Q. 843,680 Q. 8,000 Q. 27,997 Q.1,131,650
5
Q.1,080,000 Q. 111,132 Q. 968,868 Q. 286,642 Q. 682,226 Q. 231,957 Q. 450,269 Q. 45,027 Q. 405,242 Q. 843,680 Q. 8000 Q. 45,027 Q.1,301,949
6
Q.1,200,000 Q. 116,689 Q.1,083,311 Q. 143,321 Q. 939,991 Q. 319,597 Q. 620,394 Q. 62,039 Q. 558,354 Q. 843,680 Q. Q. 62,039 Q.1,464,074
Como resultado del flujo ajustado de inversiones y del flujo de efectivo, se obtiene el flujo neto de efectivo, que da una idea clara de los valores que el proyecto retribuye en cada uno de los perodos y el cual queda como en la tabla siguiente.
235
Ahora que se ha definido el flujo neto de efectivo, se procede aplicar los mtodos de evaluacin que se basan en el valor temporal del dinero para medir su rendimento y actan sobre actualizaciones peridicas de los flujos netos determinados para cada ao de operacin, considerado en el horizonte de evaluacin del proyecto. Los procedimientos de actualizacin que se emplearn, proporcionan una base para la comparacin de los ingresos y costos que se produzcan en el futuro, reducindolos a un valor actualizado, que determinar la factibilidad del proyecto en estudio. continuacin se presentan los anlisis con los mtodos de evaluacin econmica. A
PR =
(4.14)
236
Captulo 4
VAN =
(1 + r )
j =0
FNj
(4.15)
Aplicando la frmula (4.15) para varios flujos de efectivo en los distintos perodos se puede elaborar la tabla del VAN siguiente:
237
Resultados VAN
Perodo Flujo ajustado de inversin -1,293,120 0 0 0 0 0 Factor VAN (19%) 1.0000 885,153 0.8403 206,865 0.7062 377,330 0.5934 547,629 0.4987 709,754 0.4190 1,405,993 0.3521 VAN (+) Flujos netos de efectivo Inflacin (7.10%) Factor con inflacin 1.0000 0.7846 0.6156 0.4830 0.3790 0.2974 0.2333 VAN flujo efectivo
1 2 3 4 5 6 7
Observando la tabla XII se tiene un VAN > 0, esto indica que el proyecto es factible, y quiere decir que la rentabilidad supera la tasa de actualizacin o TIR elegida. Teniendo en cuenta que el Sistema Integrado de Mensajera se ha diseado para manejar mensajes en forma automtica, sin que un operador se involucre en el proceso; a medida de comparacin si el sistema no fuera automtico, se tiene una repercusin del costo econmico de cada operador que se necesita para recibir mensajes en los costos de operacin. Si para el trfico destinado se tienen 125 operadores con un sueldo de Q.1600.00 ms prestaciones en turnos diurnos y nocturnos (para el clculo esto no se toma en cuenta), entonces en cinco aos se tiene un gasto en sueldos igual a Q.12,000,000 que aumenta los costos de operacin; las tablas siguientes se presentan con los costos de operacin aumentados y reflejas la repercusin de ellos.
238
Captulo 4
2
720,000 Q.
3
840,000 Q.
4
960,000 Q.
5
1,080,000 Q.
6
1,200,000
Q. 12,096,000 Q. 12,700,800 Q. 13,335,840 Q. 14,002,632 Q. 14,702,764 Q.(11,376,000) Q.(11,860,800) Q. (12,375,840) Q. (12,922,632) Q. (13,502,764) Q. 573,283 Q. 573,283 Q. 429,962 Q. 286,642 Q. 143,321
Q.(11,949,283) Q.(12,434,083) Q. (12,805,802) Q. 13,209,274) Q. (13,646,084) Q. (4,062,756) Q. (4,227,588) Q. (4,353,973) Q. (4,491,153) Q. (4,639,669)
Q. (7,886,527) Q. (8,206,495) Q. (8,451,830) Q. (8,718,121) Q. (9,006,416) Q. (788,653) Q. (820,649) Q. (845,183) Q. (871,812) Q. (900,642)
Q. (7,097,874) Q. (7,385,845) Q. (7,606,647) Q. (7,846,309) Q. (8,105,774) Q. Q. Q. 843,680 Q. 8,000 Q. (788,653) Q. 843,680 Q. 8,000 Q. (820,649) Q. 843,680 Q. 8,000 Q. (845,183) Q. 843,680 Q. 8000 Q. (871,812) Q. 843,680 (900,642)
239
Resultados VAN
Perodo Flujo ajustado Flujos netos Factor Inflacin Factor VAN flujo de inversin de efectivo VAN (19%) 7.10% c/infacin efectivo
1 2 3 4 5 6 7 -1,293,120 0 0 0 0 0 -7,034,847 -8,109,135 -8,354,470 -8,620,761 -8,917,056 1,405,993 1.0000 0.8403 0.7062 0.5934 0.4987 0.4190 0.3521 VAN (-) 0.0000 0.9337 0.8718 0.8140 0.7600 0.7097 0.6626 1.0000 0.7846 0.6156 0.4830 0.3790 0.2974 0.2333 -1,293,120 -5,519,695 -4,992,263 -4,035,547 -3,267,167 -2,651,927 328,060 -21,431,659
Observando la tabla XXXV se tiene un VAN < 0, esto indica que el proyecto no es factible, y refleja la repercusin de optar por un sistema con operadores de mensajes.
240
Captulo 4
I = Donde: I N
FN1 FN 2 FN 3 FN n + + + ............. + 2 3 (1 + r ) (1 + r ) (1 + r ) (1 + r ) n = Inversin inicial; = Horizonte de evaluacin; = Flujos netos de efectivo = Tasa interna de retorno
(4.16)
FN1, FN2,....FNn r
241
Resultados VAN
Perodo Flujo ajustado de inversin -1,293,120 0 0 0 0 0 Flujos netos de efectivo TIR Inflacin (32.3429%) (7.10%) Factor con inflacin 1.0000 0.7055 0.4978 0.3512 0.2478 0.1748 0.1233 VAN flujo efectivo
1 2 3 4 5 6 7
El retorno porcentual del proyecto en promedio es del 32.34297%, que se encuentra arriba del 19% del requerimiento del inversionista, por lo que se considera factible y aceptado.
242
Conclusiones
CONCLUSIONES
1. El Sistema Integrado de Mensajera, es una red de radiolocalizacin con incorporacin de voz sobre IP, que es una de las tres tecnologas que lo complementan. Proporciona al sistema una innovacin en telefona al comunicar las redes de telefona tradicional con las de datos. Esto permite integrar una variedad de nuevos servicios apenas imaginados y no cayendo en obsolescencia, ya que en un futuro la red tendr el mismo tamao que el sistema telefnico actual. 2. Permite la unificacin de estructura y la interoperabilidad entre los distintos fabricantes. 3. Ahorro de costos de comunicacin, ya que las llamadas entre las distintas divisiones de la empresa no tendrn costo. La voz se integra sobre una Intranet como un servicio ms de la red, tal como otros servicios informativos. A medida que se sale de un mercado regulado (voz) y se va hacia uno desregulado (datos), hay un ahorro significativo a causa de la competencia. 4. La voz sobre IP es ms econmica que la convencional porque el sistema de encaminamiento y conmutacin es ms eficiente que el de las grandes centrales telefnicas, que necesitan un circuito por cada conversacin, mientras que en IP la informacin se trocea en paquetes y se pueden enviar varias conversaciones multiplexadas sobre un nico circuito fsico.
243
5. La incorporacin del reconocimiento de voz al Sistema Integrado de Mensajera, se dificulta el da de hoy, ya que todava no hay un sistema de reconocimiento de voz que sea independiente del hablante (solo prototipos de laboratorio). Los que fallan en precisin y robustez en la comunicacin para diferentes usuarios y diferentes entornos. Uno de los inconvenientes de la adaptacin de los sistemas de reconocimiento de voz sobre la red telefnica, es debido a las limitaciones del ancho de banda, sensibilidad frente al ruido y a la variabilidad de las lneas telefnicas (coexistencia de lneas analgicas junto con lneas digitales).
6. A pesar de los inconvenientes que hay, al no contar con un sistema de reconocimiento de voz donde se pueda pronunciar las palabras como habitualmente se hace, el Sistema Integrado de Mensajera en un futuro al incorporrsele el reconocimiento sobre la red telefnica, ofrece ventajas respecto al mtodo tradicional de comunicacin entre el usuario y la maquina. Permite que la comunicacin sea ms rpida. Permite tener las manos libres, permite movilidad, accesibilidad a usuarios con discapacidades fsicas
7. Iridium servicio alto costo, aporta novedades de diseo de sistemas de telecomunicaciones espaciales revolucionarias: como la conmutacin a bordo de los satlites, que dotan de una gran ventaja tecnolgica al sistema en aras de una mayor calidad de comunicacin, tcnicamente hablando es un sistema bastante equilibrado que complementa el servicio de radiolocalizacin en todo el mundo.
8. El Sistema Integrado de Mensajera, maneja los mensajes que van a ser enviados de una forma automtica (sin operador que se involucre en el proceso). Fusiona diferentes tipos de servicios de informacin, por ejemplo, radiolocalizacin, correo electrnico, correo de voz, varios servicios de voz sobre IP. Da una versatilidad en el servicio de envo de mensajes; por ejemplo, texto a texto, voz a texto (con reconocimiento), texto a correo electrnico, mensajes va Internet. 244
Recomendaciones
Recomendaciones
1. El automatismo del sistema, comprime muchos servicios en un solo dispositivo de uso muy generalizado, permitiendo ampliar su panorama de accin, a travs del mercadeo y seminarios que ahonden su funcionalidad. 2. El sistema es viable desde el punto de vista econmico, fundamentalmente debido a su independencia de la mano de obra y una vida til de por lo menos cinco aos. 3. Debido a que involucra tecnologa de punta, permitira en una considerable medida una mejor calificacin del personal a cargo. 4. A pesar de la limitaciones actuales del reconocimiento de voz, es posible utilizar un identificador de voz dependiente del usuario (hay que personalizar la voz). Lo que implica tener la necesidad de educar al usuario en el uso del sistema. 5. Ponderar el hecho que sea factible econmicamente, no necesariamente significa que sea exitoso, ya que el xito de un nuevo sistema de comunicacin, depende en gran medida del mercadeo y del entorno social donde se pretenda colocar. Como por ejemplo: Primero, diferencia entre entornos urbanos y rurales y Segundo, en los sistemas de telefona celular, es un hecho frecuente que se compren aparatos que no tienen ninguna ventaja competitiva sobre otros, es ms, tienen un costo ms elevado. Sin embargo son smbolo de estatus; es decir existe un valor puramente psicolgico asociado (prestigio).
245
246
Referencias bibliogrficas
REFERENCIAS BIBLIOGRFICAS
1. Dalbor, John. Spanish Pronunciation: Theory and Practice. (New York, USA: Holt, Rinehart and Winston, 1969).
3. Andr Girard. Routing and Dimensioning Circuit Switched Networks. (Addison-Wesley, 1990),
4. Jonathan Davidson y James Peters. Fundamentos de voz sobre IP. (Primera edicin; Madrid, Espaa: Pearson Educacin, S.A. 2001).
5. Ohmori, Okumura, Kawano and Fukuda. Field strength and Its Variability in
VHF an UHF Land Mobile Radio Service. (Tokio, Japon: Review Tokyo
247
248
Bibliografa
BIBLIOGRAFA
1. Armbruster Pete y Mala Laurin. THE IRIDIUM NETWORK FOR GLOBAL PERSONAL COMMUNICATIONS. Satellite Communications Group, Motorola Inc., USA, August, 1997. 2. Bates, Regis J. y Donald Gregory. bice and Data Communications Handbook. USA: McGraw-Hill, 1998. 3. Davidson Jonathan y James Peters. Fundamentos de voz sobre IP. 1ra. Edicin Espaa: PEARSON EDUCACIN, S.A., 2001. 4. Duarte Cordn, Julio Cesar. Elaboracin y Evaluacin de Proyectos. 1ra. Edicin Guatemala: Dpto. de Publicaciones, Facultad de Ciencias Econmicas, USAC., 1995. 5. Evans, John V. New Satellites for Personal Communications. Scientific American (USA): 70-77. April, 1998. 6. Gradecki, Joseph D. The Virtual Reality Construction. USA: Editorial John Wiley & Sons, Inc., 1995. 7. Hon, A.S. An Introduction To Paging. Motorola. 1993. 8. Huang, Xuedong y otros. Spoken Language Processing. USA: Prentice Hall, 2001. 9. Huidobro, Jos Manuel. Todo sobre COMUNICACIONES. 2da. Edicin Espaa: Editorial Paraninfo, 1999. 10. Hutcheson Jonathan y Mala Laurin. Network Flexibility of the Iridium Global Mobile Satellite System. Proceeding of the International Mobile Satellite Conference, Ottawa, IMSC, 1995.
249
11. ICE. Curso Trfico Telefnico. Costa Rica: Oficina de Capacitacin en Telecomunicaciones, 1988. 12. INTELSAT. TECNOLOGIA DE ESTACIONES TERRENAS. 3ra. Edicin USA: INTELSAT Assistance and Development Program, 1987. 13. Jim, W. Roberts. Traficc Theory and the Internet. IEEE Communications Magazine. Enero 2001. 14. Johansson, Johny K y Ikujiro Nonaka. Implacable. Colombia: Editorial Norma, 1997. 15. Lee, William C. Y. Mobile Cellular Telecommunications Systems. USA: McGraw Hill, 1989. 16. Li Qi y otros. Recent Advancements in Automatic Speaker Authentication. IEEE Robotics & Automation Magazine. (USA)(6): 24-34. Marzo, 1999. 17. Madden Jeff y Stuart J. Stuple. Fundamentos de Redes. 2da. Edicin Colombia: Microsoft Press, 1998. 18. Maine, Kris y otros. Overview of Iridium Satellite Network. IEEE Western Conference, San Francisco, California, USA, 1995. 19. Miller Irwin y John E. Freud. Probabilidad y Estadstica para Ingenieros. 3ra. Edicin USA: Prentice-Hall, 1985. 20. Miranda Miranda, Juan Jos. Gestion de Proyectos. 4ta. Edicin Colombia: Editora Guadalupe Ltda., 2002. 21. Motorola FlexTM. Motorola New High Speed Paging Protocol. USA: Motorola, 1993.
250
Bibliografa
22. Motorola. Inc. Telecator Alphanumeric Protocolo. Edicin electrnica, Enero 1996. 23. Motorola. Inc. Telecator Network Paging Protocol (TNPP). Edicin electrnica, Septiembre 1996. 24. Motorola. Issues and Guidelines Paging Systems Emphasis. USA: Motorola, 2000. 25. Mundo Electrnico. Telecomunicaciones Mviles. Mxico: Alfaomega & Marcombo, 1995. 26. Pelton, Joseph N. Telecommunications for the 21st Century. Scientific American (USA): 80-85. April, 1998. 27. Ph. D. Peter A. Swan. A Revolution in Progress: IRIDIUM LEO Operations Space Operations Lessons Learned and Current Experiences. 1997 AIAA Defense & Space Programs, Conference & Exhibit Huns, Hunstsville, Alabama, USA, September 23-25, 1997. 28. Poza M. J. y otros. Design of an Isolated Word ASR for the Spanish Telephone Network. Proceedings of International Conference on Signal Processing, Beiging, 1990. 29. Pritchard, Wilbur L. Satellite Communication Systems Engineering. 2da. Edicin USA: Prentice Hall, 1993. 30. Rabiner, L. R. Y B. H. Juang. An Introduction to Hidden Markov Models. IEEE ASSP Magazine, Enero, 1986. 31. Rabiner, Lawrence y R. Schafer. Digital Processing of Speech Signals. USA: Prentice Hall, 1978.
251
32. Rabiner; Lawrence y Biing-Hwang Juang. Fundamentals of Speech Recognition. USA: Prentice Hall, 1993. 33. Rosenblatt, Alfred. Satellites Free The Mobile Pone. IEEE Spectrum. (USA)(35): 26-35. Marzo, 1998. 34. Sheth, Dinesh I y John S. Colonias. The History of Paging: Technology Advances Paging. USA. Telocator, Motorola, 1993. 35. Siemens. Telecomunicacin Digital Tomo 1. Espaa: Editorial Marcombo, 1988. 36. Taub Herbert y Donald L. Schilling. Principles of Communications Systems. 2da. Edicin USA: McGraw Hill, 1986. 37. Weston, J. F. y E.F. Brigham. Fundamentos de Administracin Financiera. 5ta. Edicin Mxico: Nueva Editorial Interamericana, 1982. 38. Witowsky, William E. IP Telephone Design and Implementation Issues. USA: Texas Instruments, 1998. 39. Zue, Victor. Acoutic Segmentation and Phonetic Classification in the Summit System. In proceedings of the International Conference on Acoustics, Speech and Signal Processing, Scotland, 1989.
252
Apndice A
253
254
Apndice A
Sin embargo, muchos sistemas de radiolocalizacin todava pueden soportar este formato porque existen radiolocalizadores antiguos. Otro nuevo formato puede transmitir arriba de 60 veces ms rpido y tener una alta capacidad de cdigos.
255
256
Apndice B
Handover
B. HANDOVER
En los sistemas mviles, se pueden necesitar varios handover para completar una nica llamada. Entonces, el estudio del sistema se expresa en trminos de distribucin del nmero de handover implicados en la duracin de una nica llamada y la probabilidad media de cada de una llamada. O sea, se trata de ver la probabilidad de que la llegada de una nueva llamada no pueda ser completamente servida a causa de un bloqueo inicial o un handover insatisfactorio.
257
258
Apndice B
Handover
Se llama celda fuente a la celda donde la llamada del abonado mvil empieza y todas aquellas celdas alcanzadas por el abonado mvil asociado durante el tiempo de vida de la llamada se les llama celda de trnsito. Entonces teniendo en cuenta la configuracin de la red celular de satlite el rea de overlap es:
R(2 3 ) = 0.31 R
B. 3. Distribucin de handover
(B.1)
En los sistemas LEO se necesita distinguir entre dos clases de handover dependiendo de la arquitectura e implementacin del sistema: Handover celda a celda (handover haz a haz). Handover satlite a satlite.
Esta distincin se debe al hecho de que el procesamiento posterior implicado en estos handovers pueden ser distintos. Se define una zona como trmino genrico tanto para celda, haz o satlite. El rea de la zona est claramente determinada por su radio el cual se define por el radio de la celda, haz o satlite. La distribucin del nmero de handovers zona a zona durante la duracin de una llamada est como funcin de: 1. 2. 3. El radio de la zona r La velocidad orbital del satlite LEO, Vorb La duracin media de la llamada 1/
259
Debido a la complejidad del sistema subyacente, deben asumirse algunas hiptesis para simplificarlo: La velocidad es constante en una direccin fija durante la duracin entera de la llamada. Slo estn permitidos cuatro direcciones con movimientos ortogonales. Cuando ocurre un handover, la celda destino es la celda vecina en la direccin del movimiento del satlite. El clculo de la distribucin del nmero de los handovers para una primera llamada arbitraria condiciona a la probabilidad de que una llamada atraviese al menos n handovers, llamada P nH. Esta probabilidad puede ser calculada mediante condiciones adicionales para todas las direcciones del usuario (el cual es bastante determinista en el sistema Iridium, ya que el satlite tiene un movimiento de Sur - Norte y por tanto se considera que el abonado mvil slo atraviesa las celdas superiores a la actual). Para cada direccin, primero se calcula la probabilidad de que un abonado cruce n limites de zonas en un tiempo fijo t; entonces P nH se obtiene por darse cuenta del hecho de que para una llamada con tiempo de servicio t, si el tiempo para el limite nsimo cruzado es ms pequeo o igual a t, asegura al menos n handovers antes de que la llamada termine. Por lo tanto:
P nH = 0 P[T
t]
s (t )dt
(B.2)
donde P[...] es la probabilidad de que la n-sima frontera la hayamos cruzado antes del instante t, y s(t) es la funcin de la densidad de probabilidad de tiempo de servicio. Para simplificar la notacin se define:
260
Apndice B
Handover
r V orb.
(B.3)
Despus de algunas
P( 2 m +1)H ( ) = e
2 3 3 ( ) ( + 1 e 1+ e 2 9 9 2 (e e 2 ) + e 3m 2 3
3m
) +e
2 3m
3 (1 e 9
)
2
( B.4)
P( 2 m )H ( ) = e
3m
1 (e 2 9
) +e
2 3m
3 (e 9
)
2
( B.5)
+ e
3m
1 2 2 3 2 (e e )
De las ecuaciones anteriores se deriva la siguiente expresin para el nmero medio de handovers ( h ):
h=
(3 + 2 3 ) 0.7182 V
9 r
orb .
(B.6)
261
Se puede observar que el nmero medio de handovers es igual a las veces en que una llamada de duracin promedio cruza un nmero medio de fronteras de zonas en una unidad de tiempo por el abonado mvil. Adems, el nmero medio de zonas limtrofes cruzadas por unidad de tiempo es una funcin lineal de r/Vorb.
Se asume que la duracin de la llamada est exponencialmente distribuida con el parmetro 1/ igual a la inversa de la duracin media de una llamada. La aleatorizacin se adopta en cada inicio de llamada y en cada handover. Estas presunciones llevan a la hiptesis de que la distribucin exponencial puede proporcionar una mejor adaptacin para la distribucin de la ocupacin de los canales. El parmetro de la distribucin exponencial apropiada, denotada por es igual a la suma de la inversa de la duracin media de una llamada y la media del tiempo consumido por un abonado en una celda dada:
= + hc
(B.7)
262
Apndice B
Handover
Para medir la diferencia total entre los resultados simulados y los modelos exponenciales, se usa la prueba llamada Kolmogorov-Smirnov (K-S). continua especifica, en este caso distribucin exponencial. La prueba de Kolmogorov-Smirnov, es una prueba paramtrica que se utiliza para diferencias entre distribuciones acumuladas. La prueba unimuestral se refiere a la concordancia entre una distribucin acumulada observada de valores muestrales y una funcin de distribucin continua determinada; es, pues, una prueba de bondad de ajuste. La prueba bimuestral est relacionada con la conformidad entre dos distribuciones acumuladas observadas; prueba la hiptesis de que dos muestras independientes provienen de distribuciones continuas idnticas y es sensible a diferencias de la poblacin con respecto a localizacin, dispersin o sesgo. La prueba de Kolmogorov-Smirnov unimuestral es en general ms eficiente que la ji-cuadrada para bondad de ajuste en muestras pequeas, y puede emplearse en muestras muy pequeas donde la prueba ji-cuadrada no se aplica. La prueba unimuestral se fundamenta en la diferencia absoluta mxima D entre los valores de la distribucin acumulada de una muestra aleatoria de tamao n y una distribucin terica determinada. La prueba est realizada mediante: 1. El clculo de la diferencia mxima de la distribucin entre la simulacin y el modelo ajustado exponencialmente Dn (donde n es el tamao de muestreo de la prueba) y 2. Comparndolo con valores crticos Ddelta es igual al tiempo medio de ocupacin en una celda, para un nivel significativo dado. Se acepta que la hiptesis original es nula si Dn < Ddelta y la rechaza de otro modo. Esta prueba permite evaluar la hiptesis de que un muestreo de datos sea sacado de una distribucin
263
Para realizar esta prueba se disearon y probaron simulaciones. Las presunciones usadas en la simulacin se resumen en: 1. Se asume que todas las celdas generan el mismo trfico, por ejemplo, todas las celdas tienen la misma velocidad de inicializacin. Puede verse, que en el caso de celdas de trfico equivalente, el trfico medio que deja una celda, es decir, entregado a otras celdas debe compensar exactamente el trfico medio entrante a esa celda, es decir, pasado por otras celdas. trfico generado por el sistema entero. 2. Este principio devuelve las llamadas de handover a la llamada inicial tantas veces como necesite mantener una llamada dentro de la celda inicial hasta su terminacin. Despus de cada handover o en la iniciacin de una llamada, empieza un nuevo perodo de ocupacin de canal. Cada perodo termina en el siguiente handover o cuando la llamada termina. Esta presuncin nos libera del requisito de seguir el trfico del sistema entero y as poder centrarse simplemente en una celda. 3. Se asigna una posicin aleatoria del usuario de una distribucin uniforme en el rea de la celda. Las coordenadas angulares y radiales del usuario mvil, estn relacionadas con el centro de la celda. La componente radial se asume que sea una variable distribuida uniformemente en [0,r] y La componente angular se toma como una variable distribuida uniformemente en [0, 2]. La direccin inicial del usuario tambin se elige como una distribucin uniforme en [0, 2]. Esta presuncin permite considerar slo el trfico generado por una celda, y no el
264
Apndice B
Handover
El nmero total de llamadas varia en la simulacin desde 3100 a 10000, y la duracin media de la llamada se elige que sea de 2, 5, 10, 15 y 20 minutos. Cada celda contribuye a un tiempo de ocupacin de canal de acuerdo al nmero de handovers que haya realizado.
( )
1 K!
(B.8)
Como el nmero de handovers implicados en cada llamada (incluidos los handovers haz a haz y satlite a satlite) es c, la probabilidad de cada de una llamada se da con:
265
Pa = 1 (1 Pb )
hc
1 K n 1 K 1 ( ) = 1 1 ( ) n! K ! n=0
hc
(B.9)
Apndice B
Handover
Contrariamente, en GSM, los handovers corren a cargo de la red fija (estaciones base y centros de conmutacin para servicios mviles). Esta eleccin se hizo porque, por una parte, la mayora de las capacidades de una llamada en progreso del abonado mvil se atendan en la llamada correspondiente (y por lo tanto no puede usarse para procesar los niveles de potencia recibidos relacionados con varias portadoras) y, por otra parte (las tcnicas tradicionales de TDMA proveen la reserva de una cierta ranura de tiempo para la duracin entera de la llamada) en cada handover es necesario consultar el mapa de asignacin de las ranuras-canal almacenadas en la estacin base, que sirve a la nueva celda; adems, los procedimientos de handover requieren alcanzar el correcto alineamiento de la trama respecto a la nueva estacin base.
Tales dificultades pueden ser superadas en el entorno de la tercera generacin donde, por una parte, se espera que los usuarios mviles sean provistos con capacidades mayores de proceso y, por otra parte, una apropiada divulgacin del control por las estaciones base (estaciones fijas en Tierra, en los sistemas de satlite) pueda informar al abonado mvil sobre la carga de la celda actual.
Un posible procedimiento de handover el cual descentraliza la mayora de las funciones de control del abonado mvil, para mantener un mnimo de intercambios de sealizacin, basada en la tcnica PRMA, puede trabajar de forma similar al procedimiento de reseleccin de celda en GSM. De todos modos, en este caso, el abonado mvil debe comprobar los paquetes de control transmitidos por la estacin base que sirve a la nueva celda candidata b, para detectar el porcentaje de ranuras de tiempo disponible en las portadoras asignadas a la celda b. Si, en una de estas portadoras, llamada c, tal porcentaje es mayor que un cierto umbral (seleccionado, sobre consideraciones estadsticas, para mantener una tolerable probabilidad de colisin), se autoriza al abonado mvil a realizar el handover hacia la celda b. As, conmuta su transmisor a la portadora c, mientras est todava recibiendo de la celda antigua a, hasta 267
que la red fija se de cuenta de el handover y proporcione un enrutamiento del trfico avanzado hacia la nueva celda b.
Apndice B
Handover
en un cierto mdulo CDMA permanece en tal mdulo durante su duracin entera, a pesar de los haces spot que el abonado mvil cruza durante la llamada. En el caso de que soft handover sea posible, puede introducirse el concepto de macrodiversidad. Una llamada en progreso abonado mvil la cual va a cambiar de celda de satlite puede simultneamente conectarse con ms de una celda satlite; el conjunto de tales celdas satlites se refieren al conjunto activo. Tpicamente, un abonado mvil el cual pasaba desde un haz spot a otro puede ser conectado con dos celdas satlites. En el enlace de subida gracias al receptor de barrido (rake receptor) el usuario mvil puede combinar juntas las seales provenientes de todas las estaciones fijas en tierra en su conjunto activo; igualmente, en el enlace de bajada, las seales recibidas por las distintas estaciones fijas en tierra relacionadas con las celdas satlite en el conjunto activo de un cierto abonado mvil, pueden combinarse juntas (la red fija debe estar provista para esta misin).
S=
M K
(B.10)
269
Se llama A(x) al conjunto de canales disponibles para la celda x en el instante de llegada de una llamada a x. Cuando llega una llamada debe servirse en la celda x, si resulta A(x) distinto de cero, el mejor canal para el reparto se selecciona sobre la base de la evaluacin de la funcin coste Cx(i),i perteneciente a A(x), de acuerdo al siguiente criterio de mnimo coste:
D2 K= 3R ' 2
(B.11)
Si lo cumplen ms canales, se lleva a cabo una eleccin aleatoria. Se puede distinguir dos alternativas segn cmo se evalu la funcin coste. Estas son: DCA1, DCA2.
El canal i, el cual queda encerrado en un mnimo nmero de celdas pertenecientes a I(x), se reparte a la celda x. Entonces, la funcin coste del reparto se define como :
(B.12)
270
Apndice B
Handover
Esta tcnica slo interesa para la optimizacin local de la asignacin del canal. Esto conlleva a una ineficiente distribucin de canales en la red, en particular bajo condiciones de trfico muy adversas, es decir, la distancia de reutilizacin de canales es mucho mayor que D. Esto permite un incremento de llamadas bloqueadas, incluso mayor que en FCA. Para resolver este problema, se propuso la tcnica DCA2. Comienza con una tcnica de reparto fija de canales, de acuerdo con la distancia de reutilizacin D. Se llama Fd(x) al conjunto de canales repartidos segn FCA a la celda x. Se fuerza a que el reparto fijo asegure una distribucin de canales entre las celdas de la red, con la distancia mnima posible de reutilizacin. Con la tcnica DCA2, aunque sea una tcnica de reparto dinmico de canales, siempre que sea posible se seleccionan los canales pertenecientes a Fd(x). Entonces, la contribucin al coste del reparto del canal i perteneciente a A(x), debido a la interferencia de la celda k perteneciente a I(x), Cx(k,i), puede expresarse como:
0, qK (i ) = 1,
si i FD ( K ) el resto
(B.13)
Al definir la funcin coste Cx(k,i), relacionada con el estado del canal i en la celda k perteneciente a I(x), el primer trmino tiene en cuenta la disponibilidad el canal i en la celda k, mientras que el segundo trmino representa el canal i perteneciente al conjunto ptimo para la celda k (es decir Fd(x)). Adems de esto, se ha elegido ponderar el segundo trmino con un factor 2, para seguir tanto como sea posible la distribucin de canales FCA. Cx(k,i) slo puede adoptar cuatro valores diferentes:
271
0, 1, C x (K , i ) = 2, 3,
si i A( K ) y i FD ( K ) si i A( K ) y i FD ( K ) si i A( K ) y i FD ( K ) si i A( K ) y i FD ( K )
(B.14)
C x (i ) = q x (i ) + {C x (k , i )}
Donde: K I(x) A(x)
(B.15)
donde el trmino qx(i) se introduce para tener en cuenta que es preferible repartir en x un canal i perteneciente al conjunto de canales de x (Fd(x)). En particular, qx(i) se ha incluido slo para distinguir entre las diferentes situaciones con coste igual por las celdas interferentes, para repartir en x, si es posible, un canal perteneciente a Fd(x).
Apndice B
Handover
lado, si una entidad central de una estacin de control de red (NCS) est encargada de la actualizacin de las asignaciones, se necesita una multitud de intercambios de informacin de sealizacin. Una de las soluciones a los problemas expuestos anteriormente es la implementacin de la estrategia DCA con control distribuido; por una parte, la asignacin de portadoras a las celdas es actualizada dinmicamente en tiempo real, para poder atender la demanda, cambiante incesantemente, de canales de comunicacin. Y por otro lado, las decisiones las toman las FES (Estaciones fijas de tierra) y no una NCS, reducindose as los intercambios de informacin de sealizacin y aumentado la robustez del sistema, el sistema de satlites ya no depende de la NCS. La estrategia DCA prev que tan pronto como los canales disponibles en cierta celda de satlite es decir, la suma de los canales disponibles sobre todas las portadoras asignadas actualmente a esta celda de satlite es inferior a un umbral dado Ta, la FES intenta una adquisicin de portadora; igualmente, tan pronto como el nmero de canales disponibles es mayor que un umbral Tr, la FES libera una portadora posiblemente despus de efectuar un cierto nmero de handovers intracelulares para liberar dicha portadora. Para poder evitar decisiones conflictivas en la adquisicin de portadora, cada FES tiene asignado un intervalo de tiempo diferente de decisin dentro de una trama de decisin de duracin T; se permite a cada FES intentar la adquisicin de portadora solo al principio de su intervalo de tiempo es decir, cada T segundos. La presencia de los ya mencionados umbrales compensa los inconvenientes causados por los retardos en la adquisicin de portadora. El intervalo de decisin debe ser suficientemente largo como para permitir que las decisiones tomadas por una FES puedan ser comunicadas a todas las dems FES va un canal de control dedicado terrestre.
273
Las FES pueden descubrir portadoras disponibles o algunas portadoras libres bien por el enlace con otra FES va un canal de control dedicado terrestre, bien en caso de que el enlace de control (feeder link) enlace entre la FES y el satlite y viceversa tenga un haz global, monitoreando el nivel de potencia recibido de algunas portadoras.
Las FES pueden seguir varias estrategias para seleccionar la portadora a adquirir entre el juego de portadoras disponibles, o para seleccionar la portadora a liberar de entre las que tiene asignadas la celda; la Asignacin Dinmica Geomtrica de Canales (GDCA) realiza funciones muy eficientes en la que cada FES trata de mantener el mismo juego de portadoras (como en FCA) siempre que as lo permita el trfico ofrecido; esto significa que las portadoras con ms alta prioridad para una FES a sern las primeras que intentar recuperar y las ltimas que estar dispuesta a liberar son aquellas que en un esquema FCA habran estado semipermanentemente asignadas a la FES a.
274