Sunteți pe pagina 1din 84

Enviar Search

Upload Browse Go Pro Login Signup

Email

Like

Save

Embed

Related

More Filosofia Del Mantto


14477 views

Like Nilo Egaf3


2536 views

Like Paper rosendo


629 views

Like Confiabilidas
192 views

Like Pascual Mantemin 2006


1757 views

Like Tema 3. Mantenimiento Y Confiabilidad


35264 views

Like Ingenieria de confiabilidad ok


1471 views

Like Fernandez Mantemin08


767 views

Like 7 Ericsson Solo Pruebas 2009


32 views

Like Confiabilidad ca
279 views

Like Curso de Ingeniera de Software basado en Ian Sommerville -

Capitulo3
2057 views

Like Mantenimiento industrial


2749 views

Like Mantenimiento industrial


495 views

Like Fiabilidad
327 views

Like ANLISIS DE FALLAS - ASME


193 views

Like Modern reliability techniques in industrial applications


1383 views

Like Modulo 2 rcm 1 a


335 views

Like Modulo 2 rcm 1 a


427 views

Like Mantenimiento
12097 views

Like Duarte paper


346 views

Like Confiabilidad mantenibilidad


442 views

Like ingenieria de mantenimiento industrial


7925 views

Like Calidad Del Servicio De Energia Electrica


10229 views

Like Software para el analisis matematico

802 views

Like Trabajo finalproyecto de diseo ii


7179 views

Like 8 Gmv Solo Pruebas 2009


40 views

Like 11 Intro
3697 views

Like Confiabilidad humana elemento esencial de la gestin de activos ogp 2012


87 views

Like Confiabilidad humana elemento esencial de la gestin de activos ogp 2012


167 views

Like Optimizacin de paradas de plantas


2930 views

Like Confiabilidad
431 views

Like Modulo 3 femeca-practico


421 views

Like Modulo 3 femeca-practico


303 views

Like Estrategias de Confiabilidad


23684 views

Like Curso Lean Manufacturing


37697 views

Like Tm 04-007
113 views

Like

Guia mantenimiento clase mundial


199 views

Like El Mantenimiento
14077 views

Like Ingenieria de Mantenimiento


58965 views

Like Propuesta de RCM Equipo Ferroviario


72 views

Like

/53

Apuntes confiabilidad y disponibilidad de redes ss


by Francisco Apablaza
+ Follow

1,711
views

Se reunen las bases tericas para el anlisis de confiabilidad y disponibilidad de redes y servicios de telecomunicaciones, incluyendo algunos ejemplos practicos de estudios estadsticos ...
More

No comments yet

Post Comment

Subscribe to comments

2 Likes jfduquev
4 weeks ago

Jordan Ruiz Arevalo


5 months ago

Apuntes confiabilidad y disponibilidad de redes ss


Document Transcript

1. CALIDAD DE REDES Y SERVICIOS DE TELECOMUNICACIONESFrancisco Apablaza M.PRESENTACINEl tema ha sido siempre conflictivo y a la vez apasionante,conflictivo por las mltiples interpretaciones que se dan a losconceptos al llevarlos a la praxis, por como se manejan lasestadsticas, as como al pobre conocimiento formal que existesobre esta importante rea de la ingeniera, en comparacin conlos sectores mineros, de la construccin o de la mecnica.Apasionante, por integrar conceptos estadsticos, deprobabilidades y de tecnologa, como por el impacto que puedegenerar en una mejora continua, en la excelencia operacional deuna red de telecomunicaciones y sus servicios y su relacin conlos costos e ingresos. Esto es lo que ha motivado preparar estosapuntes (ello significa que no todo lo expuesto es original ycorresponde ms que nada a un material recopilado yexperiencias), que se espera sirvan de base para estudiar masprofundamente estas materias y sean una modesta contribucinpara formalizacin y aplicacin en el anlisis de la calidad de lasredes de telecomunicaciones. 1| 2. INTRODUCCINEl establecimiento de calidad operacional de las redes y servicios, dice relacin con loscriterios de diseo de las redes, la disponibilidad de RRHH y tcnicos calificados, losprocedimientos de operacin y mantenimiento, como as de las situaciones particularesdel medio en que se encuentren desplegados los recursos de redes y servicios, todo locual redunda, evidentemente, en los costos en que pueda incurrirse para conseguir unacalidad deseada.Se alcanzarn distintas calidades operacionales de las redes respaldadas con respectode aquellas que no disponen de recursos de respaldo, o de repuestos en sitio. De igualmodo debe tenerse en cuenta que distintas tecnologas pueden otorgar calidadesdiferenciadas, como puede ser el caso de un circuito va fibra ptica con relacin a unopor radio.Es preciso establecer claros criterios de definicin y medicin de ndices o indicadores dedesempeo, que aunque no sean de una precisin absoluta, permitirn observar, en lamedida que se mantengan las definiciones por un largo periodo, los comportamientos ytambin deducir criterios de mantenimiento, diseo, e instalacin que redunden enmejoras de los mismos ndices.Se presentan en estos apuntes los fundamentos y consideraciones prcticas relativas alos distintos aspectos relativos a disponibilidad, confiabilidad y SLA (Service LevelAgreement) de redes de telecomunicaciones. Aunque sin duda, son conceptos aplicablesa otras disciplinas, como redes de energa, o procesos industriales. Siempre debe tenersepresente, que se trata de anlisis de sistemas estocsticos, lo que conlleva que sontemas a tratar con un profundo conocimiento de los fundamentos probabilsticos como porbases de datos confiables de interpretacin estadstica.Es imprescindible refrescar los conceptos de estadistica descriptiva,

as como los deprobabilidades, ya que son fundamentales para la comprensin de los conceptos deconfiabilidad, como para los anlisis de disponibilidad, no obstante su importancia, no seconsidera afrontarlos en este documento.Los temas tratados se han organizado en:- Aspectos Generales de la Calidad Tcnica de las Redes y los Servicios .........3- Teora de la Confiabilidad .........4- Teora de la Disponibilidad .......10- Confiabilidad, Disponibilidad y Mantenibilidad .......16- Criterios de Riesgo y Costos .......22- Aplicaciones y Anlisis Estadstico de Eventos .......27- Estadsticas de Disponibilidad en Redes de Telecomunicaciones .......32- Calidad, SLA, Disponibilidad de Servicios .......46- Conclusin .......50- Referencias .......51- Anexo: ejercicios 2| 3. Aspectos Generales de la Calidad Tcnica de las Redes y los ServiciosUno de los aspectos de la calidad son las definiciones tcnicas de fidelidad de las sealesde telecomunicaciones, tales como ruidos, tasas de errores, distorsiones, etc., muchos delos cuales estn sujetos a una sensibilidad subjetiva, sin embargo, hoy, por lapreponderancia de los datos, tambin hay una serie de parmetros de calidad, tales comoerrores, prdidas, retardos y otros.La calidad como continuidad operativa de las redes y por ende de los servicios, es quizs,el enfoque ms importante a la hora de establecer medidas de dicha calidad frente alcliente y a la vez, l mas complicado de definir por su condicin de variable aleatoria y delas expectativas del cliente.Tpicamente se habla de confiabilidad fiabilidad (Reliability), performance, disponibilidad(Availability), MTBF, MTTR, etc., sin embargo, el gran dilema es establecer la definicinde estos parmetros y llevarlos a mediciones prcticas y hacer un buen uso ycomprensin de ellos.Es importante llegar a definir criterios para delimitar entre condiciones de degradacin, deintermitencia y de indisponibilidad, que son todos grados de un deterioro y degradacindel servicio de telecomunicaciones.Se constata que no es usual que renan bajo un mismo objetivo los conceptos de calidad,mejora continua, mantenibilidad y confiabilidad-disponibilidad. Hay que crear concienciaque la confiabilidad comienza por la calidad de la ingeniera de diseo y construccin delas redes.No es menos cierto que las administraciones encargadas de la operacin y mantencin deredes y sistemas, realizan todas o algunas de las acciones que ac se comentarn, yasea en forma consciente, metdica, y sistemtica, o en forma intuitiva. Las distintastcnicas que se desarrollan, no hacen otra cosa que formalizar el conocimiento y laexperiencia.A continuacin se procurar introducir a los conceptos ms bsicos de estos temas, a daralgunas definiciones, que quizs no sean las ms cannicas, pero que buscan llevarlas aaplicaciones reales que puedan ser medidas. Es importante contemplar, que cualquierade los ndices o indicadores de desempeo, deben estar sustentados en un mecanismode medicin automatizado, de registros sistemticos y de buena calidad. 3| 4. Teora de la Confiabilidad Es la probabilidad que se presente una falla en un intervalo de tiempo definido,excluyendo las interrupciones producto de intervenciones programadas. Dice relacin conel intervalo de tiempo que el elemento o sistema est libre de falla. Se dice, tambin, de laprobabilidad de sobrevivir correctamente en funciones una vez que comienza a operar. Sepropone como ndice de confiabilidad a definir por ao, dependiendo de la topologa ytecnologa de la red, correspondiendo a una estimacin terica que se convierte en lareferencia objetivo.Tpicamente se ha descrito, para equipos y sistemas, que la confiabilidad esperada,obedece a una tendencia de fallas que sigue un comportamiento en el tiempo, en unafuncin que se le denomina la

curva de la baera, la cual es una grfica que representalos incidentes de falla durante el perodo de vida til. Se llama as porque tiene la formauna baera. En ella se pueden apreciar tres etapas: (t) Tasa de Fallas Mayor mantenimiento Mortalidad Temprana Vida til Envejecimiento Tiempo de Vida Figura N1a) Fallas iniciales: esta etapa se caracteriza por tener una elevada tasa de fallas quedesciende rpidamente con el tiempo. Estas fallas pueden deberse a diferentes razonescomo equipos defectuosos, instalaciones incorrectas, errores de diseo del equipo,desconocimiento del equipo por parte de los operadores o desconocimiento delprocedimiento adecuado (mortalidad infantil).b) Fallas normales: etapa con una tasa de errores menor y constante. Las fallas no seproducen debido a causas inherentes al equipo, sino por causas aleatorias externas.Estas causas pueden ser accidentes fortuitos, mala operacin, condiciones inadecuadas uotros.c) Fallas de desgaste: etapa caracterizada por una tasa de desperfectos rpidamentecreciente. Las fallas se producen por desgaste natural del equipo debido al transcurso deltiempo: cumple su vida til como activo.Pocos son los modelos de confiabilidad que se han desarrollado para hacer estimacionesde confiabilidad, quiz los ms clsicos sean los desarrollados para radio propagacin, enque un sistema de radio enlace puede deteriorarse, en cuanto a una variabilidad de laatenuacin en el medio de propagacin, por condiciones atmosfricas, lo que se conocecomo desvanecimiento (fading) y modelos de probabilidad de desvanecimiento deRayleigh, como as tambin la probabilidad de atenuacin por lluvia con otros modelospredictivos. 4| 5. Si se considera que, el tiempo hasta que se presente una falla, es una variable aleatoriaX, que puede tomar cualquier valor real T entre 0 e !. Siendo F(t) la funcin dedistribucin y f(t) la funcin de densidad de X, se tiene que: f.1 donde F(0) = 0 y F(!) = 1F(t) corresponde a la probabilidad de que el dispositivo falle antes o en el instante t (X < t).La probabilidad complementaria corresponde a la probabilidad de que el fallo se produzcadespus de t y es la funcin de confiabilidad R(t). Se supone que inicialmente eldispositivo funciona correctamente, por tanto, R(0) = 1 y que cuando el tiempo tiende ainfinito, la probabilidad de funcionamiento es nula.Si tenemos un dispositivo que est funcionando correctamente en un instante de tiempodeterminado t, la probabilidad de que falle en t + "t es una probabilidad condicionada quese expresa: f.2La tasa media de fallo en el intervalo (t , t + "t) queda definida como Z(t, "t) y se obtienedividiendo el valor anterior por la longitud del intervalo: f.3El lmite de Z(t + "t), cuando t tiende a cero, es la tasa instantnea de falla o tasa de fallaen t: f.4que indica que la tasa de fallas es la densidad de probabilidad de falla en t condicionada ano haber fallado antes de t. La confiabilidad de un sistema se puede calcular a partir de sutasa de fallas. Si suponemos que el sistema falla, siguiendo una distribucin exponencial,la tasa de fallas para un instante t es una constante denominada . 5| 6. As, en general, la Funcin de Confiabilidad Fiabilidad es del tipo: R(t) = exp [ t (t) dt ] f.5es su Distribucin de Probabilidades y =

(independiente de t)es la tasa de fallas porunidad de tiempo (tpicamente por miles o millones de horas de funcionamiento), otambin, la expresin conocida como la ecuacin de Lusser, que es la forma ms simplede estimar, como una distribucin exponencial, para describir fallas aleatorias: R=e- ( #) = e- (#/$) = e- N f.6donde, $ = 1/ = MTBF (Tiempo Medio entre Fallas), y T es el tiempo de observacin otiempo de misin (1 semana, 1 mes, 1 ao, o lo deseado) y N es el N de fallas durante eltiempo de observacin T. Notar que este intervalo de

tiempo, si bien es tericamentediscrecional, en situaciones practicas debe ser un tiempo suficientemente largo para quetenga un buen sentido estadstico, es recomendable 1 ao.Entonces, la Funcin de Confiabilidad R(T) es la probabilidad que un sistema, puesto enservicio en el instante t = 0, todava se encuentre en funcionamiento en el tiempo T. Si segrafica, es posible observar que R baja constantemente al aumentar el tiempo. El efectodel mantenimiento en un tiempo dado, es elevar nuevamente la funcin de confiabilidad.Las curvas de confiabilidad son del tipo que se muestran en la figura: Figura N2En forma ms generalizada, se ha propuesto la formula de Weibull, R=e- (#/$)^% f.7 6| 7. donde, $ = 1/ = MTBF es la caracterstica tasa de edad-a-falla (ello supone un MTBFdistinto segn la edad del sistema) y % el factor Weibull de forma (pendiente), el quedefine el modo y etapa de la vida del sistema, as si: % < 1, implica el modo de mortalidad infantil, % = 1, corresponde al modo posibilidad de falla, y % > 1, modo de mayor certeza de falla Figura N3En la figura N 3 se grafica para varios valores del parmetro %, valores que dicen relacincon las tres fases de la curva de la baera, que es el resultado de un grfico compuesto.En la mayor parte de los casos de anlisis, puede bastar comenzar con el modeloexponencial simple, y obtener resultados suficientemente vlidos para modelar laconfiabilidad de un sistema. Notar que si el valor del MTBF es largo, con relacin altiempo de misin o operatividad, entonces se tendr una buena condicin deconfiabilidad, con pocas posibilidades de falla, por el contrario si ste es corto o similar adicho intervalo, entonces una alta posibilidad de falla se prev, siendo una situacin noconfiable. Funcin de Confiabilidad X = cul ser el instante de falla? 1,20000000 R(0)= 1 "certeza de No falla" 1,00000000 0,80000000 Probabilidad R1 R(t)= e^(-&t) 0,60000000 R2 R3 0,40000000 R(! )= 0 "certeza de No falla" 0,20000000 prob. de falla =< t t= ? confiabilidad = prob. de NO falla > t 0,00000000 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 1E+05 1E+05 1E+05 1E+05 1E+05 2E+05 2E+05 Horas Figura N4En la figura se grafica la funcin confiabilidad para MTBF = 50.000 (R1), 150.000 (R2) y300.000 (R3) y %= 1 7| 8. En situaciones reales, los sistemas o redes son complejos, es decir, constan de mltiplescomponentes constitutivos, en cuyos casos para determinar su confiabilidad pareceevidente, que ella depende de la confiabilidad de cada una de sus partes, y stas puedenser un punto simple de fallas, o ser un elemento con redundancia. Para su anlisis seconsidera un diagrama en bloques como el de la figura N5, as a modo de ejemplo, stees un sistema con puntos simples de falla y la confiabilidad total deber ser menor que ladel eslabn ms dbil. FUENTE DISCO CPU PODER MTBF=200.000 MTBF=150.000 MTBF=50.000 Figura N5Calculando la confiabilidad para 10.000 Hrs desde la ecuacin f.6, se tieneindividualmente un R(t) = R(10.000) = 0,8187; 0,9512 y 0,9355 respectivamente, y para elsistema total, se calcula como la probabilidad de que uno u otro de los elementos falle: RT(t) = P[E1 ! E2 ! E3] RT(t) = P(E1) * P(E2) * P(E3) RT(t) = R1 * R2 * R3En general, para N componentes, RT(t) = f.8Para el caso analizado: RT(t) = RFP (t) * RD(t) * RCPU(t) = 0.7286Esto es, existe la probabilidad de un 72,86% de que el sistema no caiga en falla antes delas 10.000 Hrs. Y si se calcula lo mismo para 50.000 Hrs, esta probabilidad cae a un20,53%, lo que evidentemente tiene lgica, pues a mas tiempo un mayor envejecimiento,y por lo tanto es ms probable que algn elemento falle.De este mismo ejemplo, el componente menos confiable es la fuente de poder, enconsecuencia, para mejorar la confiabilidad del sistema, se puede contemplar colocarredundancia de sta, tal como se muestra en la figura

N 6. 8| 9. FUENTE DISCO CPU PODER MTBF=200.000 MTBF=150.000 MTBF=50.000 FUENTE PODER MTBF=50.000 Figura N6En este caso la confiabilidad total del sistema, tiene un clculo ms complejo, ya queprimero deber calcularse la confiabilidad del subsistema redundante, como laprobabilidad de que fallen simultneamente uno y otro dispositivo: R FPR(10000) =1- [1- RFP (t) )*(1- RFP(t)] = 0.9672 f.9Y para el sistema completo con un elemento con redundancia para la confiabilidad de las10.000 Hrs. es: RT(t) = RFPR (t) * RD(t) * RCPU(t) = 0.8606Logrndose una mejor confiabilidad, con respecto al 72,86% del sistema sin redundanciade fuente de poder. Lo mismo para 50.000 Hrs sube desde 20,53% a 33,51% suconfiabilidad. Si se desease una confiabilidad an mayor, deber aumentar lossubsistemas redundantes.Bajo este concepto, se ha desarrollado RAID (Redundant Array of Inexpensive Disks)para el almacenamiento seguro de grandes bases de datos. 9| 10. Teora de la Disponibilidad Si bien se puede usar estimadores probabilsticos para la disponibilidad, es ms comn elacercamiento a travs de una medida estadstica en un intervalo de tiempo y bajocondiciones de medicin objetivas por elemento de red o servicio. El intervalo de tiempodebiera ser el mes-calendario y el periodo de 12 meses previos (ao mvil o fijo), demodo que permita ver la tendencia del sistema y as poder tomar medidas operacionales.La disponibilidad tambin se le conoce como el uptime y la condicin antnima es laIndisponibilidad (Outage).Se define un Tiempo de funcionamiento MT(R), el cual corresponde al tiempo en que laconfiabilidad del sistema cae por debajo de un nivel R dado. Se utiliza en sistemas noreparables o en sistemas que tienen un tiempo fijo entre sucesivos mantenimientos.La relacin entre R(t) y MT(R) viene dada por la ecuacin: R(MT(R)) = R y MT(R(t)) = tSuponiendo tambin que el dispositivo tiene una distribucin de fallas del tipoexponencial, con tasa de fallas , y es posible calcular el tiempo de funcionamiento como: MT(R) = t en el momento en que R(t) = R, se tiene: t R(t ) e RAplicando logaritmos para obtener t

en funcin de : f.10La Disponibilidad A(t) de un componente o sistema, es la probabilidad de que estfuncionando en un instante de tiempo t determinado. A(t) se refiere a la disponibilidadinstantnea, que en el caso de un sistema no reparable coincide con la confiabilidad. Sipor el contrario el sistema se puede reparar, ste puede fallar antes de t, pero puede serreparado, de modo que en t est funcionando correctamente. Para este tipo de sistemasse cumple que A(t) > R(t).Definiendo el coeficiente de disponibilidad media en el intervalo (t1,t2) , como el valormedio de la disponibilidad instantnea, esto es: f.11Y si se expresa el coeficiente de disponibilidad asinttica o estabilizada, entonces se esthablando del lmite de la funcin de disponibilidad instantnea, cuando t"!, entonces:En cuyo caso, la disponibilidad estimada o proyectada, viene a ser 10| 11. f.12Si son distribuciones exponenciales para las variables aleatorias de que NO falle elsistema con tasa o intensidad de fallas , y que con tasa ' como tasa de mantenibilidad orecuperacin, entonces el coeficiente de disponibilidad asinttica es: A = ' / ( +') f.13Para modelar el sistema, se recurre a un diagrama de estados binario, un estado encondicin de operatividad normal y otro en situacin de falla. El sistema puede estar enuno de los dos estados, y transita de uno a otro con una frecuencia media fm= 1/Tm ,siendo Tm el ciclo

medio operacional. La probabilidad de transicin desde el estado deoperacin a fuera de servicio es 1/m, mientras que a la inversa, es 1/r. En la figura N 7 semuestra grficamente. _ Ciclo medio T MTBF Diagrama de Estados En Operacin m1 m2 m3 _ _ 1/r 1/m En falla r1 r2 r3 T1 T2 T3 Figura N 7Se definen los siguientes parmetros tpicos, que caracterizan tpicamente elcomportamiento en estado estacionario del sistema: MTTF (Mean Time To Failure), MTTR(Mean Time To Repair) y MTBF (Mean Time Between Failure), siendo _ _ MTTF = m MTTR = r MTBF = MTTF + MTTRDados los estados en operacin y en falla, se define la Disponibilidad (Availability) eIndisponibilidad (Outage Unavailability), que corresponde a: A + U = 1, donde, _ _ _ _ A = m / T = m/(m + r) = MTTF / (MTTF + MTTR) f.14 _ _ _ _ f.15 U = r / T = r / (m + r) = MTTR / (MTTF +MTTR)dado que MTTR << MTTF, suele usarse indistintamente, MTTF = MTBF 11| 12. Definiciones:Tiempo Medio a la Falla {MTTF}, es el tiempo medio que transcurre hasta que tienelugar el primer fallo en un conjunto de sistemas idnticos libres de fallo. f.16 !Tiempo Medio de MTTF 0 R(t) dt

Reparacin {MTTR}, es eltiempo medio que se tarda en reparar orestaurar un sistema o equipo que ha fallado. Como este parmetro es difcil de medir,normalmente se estima desde la experiencia o desde la estadstica histrica,considerando los tiempos de traslado, diagnstico y ubicacin de repuestos para podercalcular la capacidad de reparacin.Tiempo Medio entre Fallas {MTBF}, corresponde al tiempo medio entre fallasconsecutivas en un sistema reparable. Este parmetro vale aproximadamente la suma delos dos anteriores. MTBF = MTTR + MTTF f.17Recordemos que se podr estimar la prediccin de la confiabilidad a partir del MTBFmediante la ley o ecuacin de Lusser {f.6}. As, como ejemplo, la probabilidad de que unequipo trabaje sin fallar por un tiempo T, si el MTBF es 250.000Hrs y la expectativa deltiempo de operacin es de 5 aos (43.800 Hrs), entonces, / R(T) = e--(T MTBF) = e-(43800/250000) = 0,8393Esto significa que con un 83,93% de probabilidad el equipo no falle antes de 5 aos. Elparmetro base del MTBF lo entregan en general los fabricantes, quienes hacen pruebasde laboratorio, con envejecimiento acelerado (ver ref.12) y condiciones operacionales desimulacin de las condiciones ambientales de humedad y temperatura. Cuando existemedicin estadstica operacional, esta cifra podr deducirse de mediciones prcticas.Hay casos en que en vez del MTBF, se define el FIT Hrs (Failure in Time) = 109 / MTBF,unidad para expresar la tasa de fallas esperada de elementos electrnicos y tambin desistemas pticos, y que viene a ser 1 FIT igual a 1 falla por 109 horas (1 vez en alrededorde 114.155 aos).Para la evaluacin del MTBF, considerando el funcionamiento de un equipo o elementode red, durante un determinado intervalo T, en el que ocurren n ( n>1) defectos o eventos,el tiempo medio entre fallas es definido como: MTBF = T/(n-1) f.18En general no existe un solo equipo o elemento de red, por lo que la expresin semodifica a: MTBF = N * T/(n-1) f.19La disponibilidad (Availability) puede determinarse 12| 13. simplemente como el porcentaje de tiempo, con relacin a un determinado periodo deobservacin en que un elemento, red o sistema, permanece en condiciones operacionalesde cursar trfico. Esta disponibilidad, real o medida, se puede calcular como: A = (1 - Ti/To) 100% f.20Donde: To = periodo de observacin considerado Ti = sumatoria de los tiempos de interrupcin en el periodo de observacin.Disponibilidad multicomponentesEn el mundo real, los sistemas, las redes (mltiples nodos), los equipos estn constituidospor

mltiples componentes (tarjetas), como ya se insinu en los casos de los ejemplos delas figuras N 5 y 6. Sin embargo, en estos casos cada componente es parte funcional deltotal del equipo o sistema.Existen otras situaciones en que se desea determinar una disponibilidad de sistemas oredes, tales como pueden ser, un mltiplex en una ruta que tiene mltiples canales ocircuitos entre dos puntos, en consecuencia su disponibilidad debe analizarse como lacontribucin de cada uno de ellos a la disponibilidad total del sistema.Hay mas de una opcin para definir la manera de calcular, debido a que los conceptos deconfiabilidad y disponibilidad dicen relacin a la operatividad de UN equipo, sistema omquina, Sin embargo, para redes multinodos o para equipos, en que, aunque sepresenten fallas, no significa que se pierda la funcionalidad total de sus servicios, ese esel caso de un multiplex, una central o un router o un conjunto de ellos como parte denodos interconectados de red. Pueden fallar algunas puertas de acceso y no la totalidad,puede fallar un nodo, pero no toda la red. En consecuencia, se definen criterios de clculoque toman en cuenta la capacidad total instalada y la parcialidad de las fallas. Hayoperadores que definen la indisponibilidad del sistema completo cuando se presenta laindisponibilidad de un porcentaje de sus servicios (p. Ej. Un 30% de sus rutas, ancho debanda o puertas). Tout Eq N Eventos >>> Acumulado 1 1 1 1 0 1 0 1 + $$$ 0 1 2 2 1 $$$ 0 1 0 1 0 1 0 1 1 3 4 1 0 1 0 1 4 4 1 0 1 0 1 0 1 3 3 1 0 1 0 1 0 1 0 Tot Eq= 21 To To Tout= 14 Hrs Figura N 8 13| 14. En el diagrama de la figura N8 se muestra un sistema que consta de 21 elementosindividuales e independientes, en cuanto a su operatividad, esto es que la falla de uno deellos, no afecta la correcta funcionalidad del resto. Es evidente que la disponibilidad decada uno de los 5 elementos fallados es aproximadamente 99,9% (3 nueves) y del restoes de un 100%.Una primera opcin para determinar la disponibilidad del conjunto de elementoscomponentes de este sistema, puede ser la disponibilidad promedio: A = (1 - Tim/To) 100 % f.21 Tim = ( N tn) / NDonde: Tim = tiempo medio de interrupcin de los elementos considerados N = nmero de elementos considerados N tn = sumatoria de los tiempos de interrupcin del elemento 1 al NAs, para este caso el resultado es una disponibilidad de 99,992% (4 nueves) para latotalidad del sistema y no 99,84% si se calculase de acuerdo a f.20.Una segunda opcin de calculo es: A = ((Tos - Ti) / Tos )100% f.22 Tos = To* N, periodo de observacin considerado para todos los elementos (Tos NTi) = tiempo total sin interrupcin de servicio en el periodo de observacin.En cuyo caso da una cifra levemente diferente de 99,907% para la disponibilidad delmismo sistema.Como tercera opcin de calculo, se puede calcular como: A= ( Td + Td Ti) / Tos Nd Ni Ni f.23siendo, NdTd :

total de tiempos sin falla (Td) de equipos que no fallaron (Nd) NiTd : total de tiempos sin falla (Td) de equipos que fallaron (Ni) NiTi : total de tiempos con fallas (Ti) de equipos que fallaron (Ni)resultando en este caso una disponibilidad del sistema de 99,954%.En todos estos casos se toma en cuenta la base total instalada, cuando fallan sloalgunos de los componentes del conjunto. De las tres opciones se recomienda la primerade ellas, por ser la ms cannica.Es importante aclarar que conceptualmente la Confiabilidad NO ES IGUAL a laDisponibilidad, la primera corresponde a en cunto tiempo aparecer una falla?, ya quedice relacin al tiempo libre de fallas y el segundo concepto dice relacin con cmo seutiliza o aprovecha operacionalmente en el tiempo, un dispositivo o sistema: cunto 14| 15. tiempo est utilizable?. Ambos conceptos son iguales en el mundo ideal en

que no hayfallas ni intervalos de tiempo fuera de servicio.Siendo, A(t) la funcin de probabilidad de disponibilidad y U(t) la funcin de probabilidadde fallar, stas son funciones complementarias del sistema, ya que la suma de susvalores en un determinado instante t es igual a 1, es decir, de certeza de que el sistemaestar en uno de los dos estados posibles. 15| 16. Confiabilidad, Disponibilidad y MantenibilidadComo ya se ha mencionado, confiabilidad y disponibilidad van de la mano de lamantenibilidad, la cual es el proceso de recuperacin desde un estado de falla y extensino aseguramiento de la vida til del activo. DISPONIBILIDAD CONFIABILIDAD MANTENIBILIDAD Figura N9El mantenimiento se puede clasificar en distintos tipos, segn sus objetivos. Desde elpunto de vista de la confiabilidad, sta tiene por objeto recuperar o asegurar laoperatividad del sistema, esto se consigue en forma preventiva o correctiva.Preventivamente, conociendo las perspectivas de probabilidad de falla, a medida que seacerca el instante de tiempo predicho por las curvas de confiabilidad, debiera aplicarse elmantenimiento para no caer imprevistamente en una indisponibilidad. Obviamente unmantenimiento correctivo, que corrige una imperfeccin, que ha llevado a un equipo osistema a no prestar adecuadamente los servicios esperados de l, est recuperando sunueva puesta en servicio, es decir, es un nuevo to para las curvas de confiabilidad, perocon nueva pendiente o factor Weibull, debido a que seguramente persistirn algunascondiciones de envejecimiento.Desde el punto de vista de las estadsticas de disponibilidad, se excluyen los eventos deinterrupcin programada por mantenimiento, ya que una intervencin bien programada yplanificada, evitar la interrupcin de servicios, o bien, podr acordar con los usuarios untiempo de interrupcin controlado.La mantenibilidad se define tambin como la probabilidad de que un equipo que hafallado pueda ser reparado dentro de un perodo de tiempo dado. Existen equipos cuyaoperacin es continua a lo largo del tiempo, por lo tanto, si el equipo est fuera de servicioes la falla, pero si el proceso de operacin indica que el equipo est sujeto a un intervalode tiempo prefijado (o eventual, como un grupo electrgeno de respaldo) defuncionamiento y de descanso, entonces, en estos intervalos, cuando el sistema estapagado, se le puede efectuar el mantenimiento preventivo o programado y se consideraque falla slo cuando se requiere de su servicio y no funciona.La mantenibilidad se interpreta etimolgicamente como la accin de mantener y conservarlos sistemas. Cuando se habla de sistemas continuos, una accin es el trabajo efectuadopara corregir o reparar una falla.Generalizando, mantenimiento es el conjunto de todas las acciones que tienden a reponerlas condiciones operativas iniciales del sistema, el mantenimiento aumenta ladisponibilidad del sistema, pero requiere accesibilidad del sistema para permitir el 16| 17. mantenimiento. En el lenguaje comn se usa indistintamentamente el trminomantenimiento o mantencin, a pesar que ste ltimo no lo reconoce la RAE.La Posibilidad de Mantenimiento, es la aptitud de un dispositivo, en condicionesespecificadas de uso, a ser conservado o repuesto en un estado, en el cual puedaefectuar las funciones requeridas, cuando el mantenimiento se efecta en condicionespreestablecidas y usando los procedimientos y medios descritos. Se mide mediante latasa de reparabilidad '. MTTR = 1 / ' f.29Mantencin Centrada en Confiabilidad = RCMOtro concepto y estrategia que se ha incorporado con relacin al mantenimiento es el quese conoce como RCM (Reliability Centered Maintenance) o Mantenimiento Centrado en laConfiabilidad. Esta metodologa se origin en la industria aeronutica y dice

relacin conuna estrategia diferente de planificar el mantenimiento, su relacin con el aseguramientode los activos, toma de conciencia en qu, cundo y cmo se debe realizar las accionesde mantenimiento, con el objetivo de controlar los costos, para enfocarse en las funcionesms importantes de los sistemas, y evitando o quitando acciones de mantenimiento queno son estrictamente necesarias. Se mencion previamente que el mantenimientorecuperaba las proyecciones de confiabilidad, pero ello implica tener absoluta claridad enconocer el estado en que se encuentra el activo a intervenir una vez qu se requiere larecuperacin, para que l cumpla con las funciones que se espera pueda desarrollar.Se dice que el proceso RCM formula algunas preguntas antes de intervenir:hay un entendimiento de que la gran mayora de los fallas no estn necesariamentevinculadas a la edad de los activos? Recordar que el modelo de confiabilidad se basa, enque una accin de mantencin obedece a un modelo "sin memoria" exponencial dedistribucin de probabilidad, es decir, el cual se reinicia como si fuese To.es necesario cambiar los esfuerzos para predecir la esperanza de vida del activo, atratar de gestionar el proceso de fallas?existe una comprensin de la diferencia entre los requisitos de un activo, desde laperspectiva del usuario, y el diseo y la fiabilidad de los mismos al proyectarlos? se comprende cabalmente la importancia de la gestin de

activos en su condicin operacional? a menudo denominada condicin de supervisin, de mantenimiento y condicin de mantenimiento predictivo. se

ha vinculado los niveles tolerables de riesgo con el desarrollo de estrategias de mantenimiento? se entienden las cuatro tareas bsicas de mantenimiento de

rutina? RCM ofrece cuatro opciones entre las estrategias de gestin del riesgo: condicin de las tareas de mantenimiento, descartar las tareas de mantenimiento, bsqueda de potenciales fallas y 17| 18. cambios a tiempo en el sistema, cambios a un diseo de hardware, a las restauracin programada o

tareas de mantenimiento como

operaciones, u otras situaciones.Un buen modelo analtico de confiabilidad y disponibilidad, puede ser til para condicionarcontratos para tareas de externalizacin del mantenimiento, lo mismo que paracompromisos con los clientes. Existen estudios en que se procura demostrar que unabuena mtrica de los resultados de la mantenibilidad llevan a una reduccin de costos encontratistas.La mantenibilidad no es slo cuestin de calidad o de costos, sino tambin de seguridad,cuando se trata por ejemplo, de mquinas de transporte o de mquinas de salud. Losriesgos en que puede incurrirse por una mantenibilidad mal planificada pueden costarvidas, ya sea por accidentes debidos a fallas mecnicas, o por no disponer de buenosdiagnsticos en instituciones de salud, casos en que pudieron evitarse si existe una buenaplanificacin del mantenimiento.Asegurar la confiabilidad de un equipo o sistema, por lo general va unida a la redundanciaen espacio y tiempo, es decir, que se opere desde sitios diferentes y alejados entre s yque funcionen simultneamente e indistintamente para ejercer la funcin para la cualestn destinados. Asegurar los niveles de confiabilidad que hoy son expectativa, del tipo4 nueves (99,99% = indisponibilidad de 52 minutos/ao) o de 5 nueves (99,999% =indisponibilidad de 5 minutos/ao), los que se exigen tan fcilmente a la O&M de redes yservicios, requerira excesivos costos de implementacin en mejoras en instalaciones ycomplejos refuerzos en recursos humanos y de repuestos. Adicionalmente, con lasmejoras tecnolgicas, de remotizacin de la gestin y configuracin, los automatismos deredundancias, no resuelven el hecho de que la intervencin de recursos humanoscalificados para reparar un

desperfecto, los que siempre consumen mucho tiempo, encomparacin a las escalas de tiempo que significa la disponibilidad esperada. Por todo loanterior, debe existir una tendencia al mantenimiento proactivo que trate de evitar la falla.Tipos de MantenimientoSiempre que se formaliza el estudio de alguna rea del conocimiento, se intentanclasificaciones, as se encuentra una taxonoma del mantenimiento o mantencin, segnse puede ver en el diagrama de la prxima figura. Mantencin Mantencin Mantencin post falla pre falla Mantencin Mantencin Mantencin Mantencin Mantencin Correctiva Proactiva Preventiva Predictiva Proactiva Figura N10 18| 19. Estas formas de mantenimiento, sin duda, son una orientacin de clasificacin segn suoportunidad en el tiempo, la mantencin preventiva es sistemtica y programada; lapredictiva est centrada en la condicin de operatividad del elemento, mientras lamantencin proactiva est para evitar la aparicin o recurrencia de las fallas, y lamantencin correctiva viene luego de una falla, y es la mas comnmente ejercida porrazones obvias, y a la vez la que exige un nivel de estrs mayor.Mantenimiento correctivo: tipo tradicional, es la accin de mantenimiento (reparacin) quese efecta despus de la aparicin de la falla. El tiempo de reparacin puede ser largoporque est ligado a la individualizacin y diagnstico de la falla. Afecta a este tiempotambin la existencia de repuestos insitu, como as los tiempos de traslado, sobre todo entelecomunicaciones, en que existe una gran dispersin geogrfica de las instalaciones.Conociendo lamda (la tasa de fallas), puede realizarse un dimensionamiento del stock derepuestos de almacn (s lamda es elevado se necesitan muchos repuestos).El diagnstico es un conjunto de tcnicas aptas para evaluar el estado de un sistema ytambin prever que pueda surgir la falla. Es la etapa crtica para la restitucin del sistemafallado. Requiere de personal con mucha experiencia, con habilidades de deduccin,rapidez de interrelacionar experiencias anteriores y toma de decisiones acertadas. Es tilpredisponer de tcnicas de diagnsis de falla para reduce tiempos y costos demantenimiento, pero agrega costos de sensores, transductores, sistemas de supervisn ygestin remota de las configuraciones, y software de sistemas expertos, que ayudan a laauto diagnosis (redes neuronales, tests estadsticos, etc.).Mantenimiento preventivo: el componente es sustituido antes de que falle, cuando seprev que est entrando en periodo de fallas por desgaste. La accin de mantenimientoes efectuada en tiempos prefijados (time-based maintenance), se aprovechan losmomentos en los que no se requiere la disponibilidad del sistema, su tiempo de activacines de duracin inferior, respecto del mantenimiento correctivo. La disponibilidad crece, acondicin de que se logre, con un buen control de calidad, utilizar para la sustitucindispositivos con tasa de falla constante o estable (es decir privados de fallas infantiles).En electrnica de telecomunicaciones es complejo ejercer este tipo de mantencin puesen envejecimiento o desgaste no es tan manifiesto como en dispositivos mecnicos.La definicin de los objetivos del mantenimiento, debiera definirse en la etapa deproyecto, as como la eleccin del tipo de mantenimiento (correctivo o preventivo) paraestablecer la condicin ptima para alcanzar los niveles de confiabilidad preestablecida enel diseo. Es necesario poder determinar los tiempos requeridos en horas hombre, paracada una de las fases de mantenimiento, lo mismo que el desarrollo de la documentacintcnica que incluya el plan logstico de intervencin.Con el tiempo, la estrategia de mantenimiento ha evolucionado, se propende al mnimocosto de reparacin, mxima disponibilidad operativa, mnimo costo de usuario. Se pasade

mantenimiento basado en tiempo, a mantenimiento basado en condicin, esto es enprevenir, ms que en reparar. 19| 20. Los tiempos de reparacin de un equipo caracterizan la mantenibilidad y, el tiempopromedio para reparar (MTTR) se define como el total de horas inoperables dividido entreel nmero de acciones de mantenimiento.Los tiempos para reparar dependen generalmente de la duracin de las actividades de: enfriamiento del equipo (no aplica en algunos casos) El

Administrativas (si las Traslados al sitio Espera de

hay, como obtencin de permisos de acceso o de viticos) siniestrado (si corresponde) los materiales y repuestos

Ubicacin y diagnstico de la falla Reemplazo de componentes daados Reinicio,

Calentamiento del equipo (no aplica en algunos casos)

reconfiguracinLos tiempos requeridos para el enfriamiento, el calentamiento y los trmitesadministrativos son, generalmente, constantes pero la sumatoria de los tiempos para laubicacin de la falla, espera de los repuestos y reemplazo de los componentes, tienen uncomportamiento aleatorio sujeto a toda la estructura logstica, al entrenamiento delpersonal, al tipo de falla, etc. Sin embargo, el tiempo de duracin de la falla es lasumatoria de los tiempos parciales antes mencionados. En algunos sistemas hay untiempo implcito en el intervalo de falla, el cual incrementa la duracin de la misma y sedefine como tiempo muerto, en donde an cuando se ha presentado la falla, no hayconocimiento de ella por falta de reporte; por lo general, ocurre con equipos que seencuentran ubicados en lugares distantes o en zonas aisladas de los grupos de trabajo.Causas de fallasEnumerar causas, nunca va a ser exhaustivo, por la diversidad de tecnologas y desituaciones. Slo a modo de ejemplo se comentan algunos casos.En transformadores de sistemas de distribucin elctrica, la falla es en general unaprdida de aislamiento, sobrecalentamiento, sobre tensiones, envejecimiento (trmico,elctrico, mecnico, ambiental), y tambin proyecto o construccin inadecuados.Los interruptores, fallan por problemas de perdida de aislamiento, sobre tensiones,sobrecalentamiento, envejecimiento, malfuncionamiento del rel de control, o problemasde circuitos auxiliares, y por problemas mecnicos, como rotura de piezas en movimientoo estticas.Las lneas areas de media tensin, fallan componentes como terminales, tensores,juntas, aisladores, postes.Los cables, ya sean de energa o de telecomunicaciones, sufren de rotura mecnica engran proporcin, por situaciones exgenas a la operacin, por intervenciones de terceros.Aunque tambin en este caso hay deterioro y envejecimiento, como condiciones adversasambientales.Para los aisladores es la descarga superficial, rotura mecnica, contaminacin,envejecimiento (polimricos) y actos vandlicos. 20| 21. En dispositivos mecnicos, grupos generadores, bancos de batera existe un desgaste yenvejecimiento inherente, por lo tanto la prevencin es absolutamente necesaria. Lomismo en partes como antenas y torres, que estn sujetas a las condiciones ambientales.Si bien en la electrnica, es difcil predecir probabilidades de falla y la mantenibilidadpreventiva no es totalmente efectiva, pero si en algunos aspectos que s los afectan, enespecial a las condiciones ambientales. Tambin aplican bien algunas accionesproactivas operacionales, ya que se puede alcanzar una indisponibilidad por falta deancho de banda o falta de capacidad de procesamiento para cursar y procesar el trficodemandante.Una de las principales preocupaciones para asegurar una buena confiabilidad de losequipos de telecomunicaciones, debe ser el tener bajo control las condicionesambientales de los recintos de instalacin. Los equipos disipan altas temperaturas que deno correctamente evacuadas, por malas

condiciones de filtros, insuficiente separacin deracks y inadecuadas condiciones de enfriamiento, llevan a un calentamiento del equipo,mas all de las correctas condiciones operacionales de la circuitera electrnica. CONSUMO DE POTENCIA FLUJO AIRE ESPACIO Figura N11Para terminar con estos conceptos de mantenibilidad, digamos que sta, estestrechamente vinculada con los conceptos de calidad, de mejora continua, de kaizen, deanlisis de Pareto, rboles de causa efecto de Ishikawa, temas que se recomiendainvestigar. 21| 22. Criterios de Riesgo y CostosAnalizado desde la perspectiva de los costos, los gastos (OPEX) propios de unmantenimiento preventivo, redundan en un beneficio por evitar indisponibilidades queincurran en el no cumplimiento de los SLA o en prdidas de trfico. Costo Costo Total Total Costo Costo CAPEX+OPEX CAPEX+OPEX Prdidas por Prdidas por Interrupcin Interrupcin Confiabilidad % Confiabilidad % 90 90 ptimo ptimo 100 100 Figura N12Un anlisis de probabilidades de disponibilidad (probabilidades de falla y probabilidad deltiempo de recuperacin) asociados a costos, permitir definir estrategias demantenimiento, como puede ser la oportunidad de realizar un mantenimiento correctivo,preventivo o de diagnstico. Desde estos datos se podr priorizar acciones e inversiones.Como primera opcin un anlisis de Pareto podr ser til para dedicar mayores esfuerzosen aquellos problemas que tienen ms relevancia, detectando los pocos vitales de losmuchos triviales, ya que por lo general, el 80% de los resultados totales se originan en el20% de los elementos.De la figura N12 se puede deducir que no es cosa de invertir indiscriminadamente, ni deesperar que la confiabilidad de las redes y sistemas sea a toda instancia de 5 nueves.La indisponibilidad redunda en un dao econmico para el usuario final, lo mismo quepara el operador. Si la confiabilidad de los componentes no varia, el dao econmicocrece al crecer la complejidad del sistema. El dao econmico crece al crecer la tasa defalla de cada uno de los componentes simples.Nuevamente se insiste en que las acciones sobre el proyecto, pueden maximizar laconfiabilidad de un producto industrial, de un sistema, o de una red, en esta fase sealcanza la confiabilidad intrnseca. En las fases sucesivas del ciclo de vida, R disminuye,como consecuencia de apartarse del proyecto inicial durante la produccin u operacin, opor la puesta en servicio, o por el envejecimiento durante el funcionamiento. El proyectodebe prever todos los aspectos de confiabilidad, con referencia a las prestacionesrequeridas en servicio. Para dispositivos reparables (disponibilidad ms que confiabilidad)es necesario tomar en consideracin, sobre el proyecto, tambin todas las acciones quefavorecern el mantenimiento del producto, sistema o red que se activa para prestarservicios. 22| 23. La estructura de costos, en trminos generales considera como Costo global = Costointervencin + Costo de falla + Costo almacenamiento + Costo sobreintervencin. El Costo Intervencin (Ci) (por unidad de tiempo = ci) rene la Mano de obra, los Materiales fungibles, y los Repuestos. El Costo de Falla (Cf) (por unidad de tiempo = cf), tiene los Ingresos no percibidos y los Gastos extras de produccin, y la Materia prima no utilizada El Costo de almacenamiento Ca (por unidad de tiempo = ca), toma en cuenta, el Inters financiero por capital detenido, la Mano de obra dedicada a gestin e inventario, los Costos de explotacin de edificio (energa, mantencin), la Depreciacin comercial, etc. Por ltimo, el Costo de sobre-intervencin, considera los costos de equipos con mayores costos iniciales, pero menor costo de ciclo de vida (menores costos de

mantenimiento, almacenamiento, vida til mayor, etc).A estos costos debe agregarse aquellos que significan prdidas de ingresos, por ejemplopor prdidas de trfico, o por pago de multas, y otras ms intangibles como la prdida decredibilidad o imagen.Un ejemplo de vnculo de disponibilidad y costos es analizar el impacto que puede teneruna falla, el CAPEX de la inversin necesaria para reducir la probabilidad deindisponibilidad y los potenciales costos de prdida de ingresos por trfico perdido o retirode clientes insatifechos.Suponiendo que un conjunto de radio bases celulares, dependen todas ellas de una rutasin respaldo, con una disponibilidad dada y se desea evaluar si una determinadainversin, para duplicar la diversidad de ruta, es necesario valorizar las potencialesprdidas en ingresos. DISPONIBILIDAD PERDIDA Sin Respaldo Sin Respaldo Con Respaldo Con Respaldo Sin Respaldo Sin Respaldo Con Respaldo celda Disp. Ruta Indisp Ruta Disp. Ruta Indisp. Ruta Trfico Ingreso Traf. - Ingreso 30% Churn - Ingreso US$/ao evento/ao mins/ao evento/ao mins/ao min/mes (10 meses) US$/ao US$/ao US$/ao BTS1 99,89% 587,5 99,9999% 0,7 14.629 14.629 59 4.389 0,07 BTS2 99,22% 4.089,3 99,9939% 31,8 53.946 53.946 409 16.184 3,18 BTS3 99,83% 887,0 99,9997% 1,5 33.773 33.773 89 10.132 0,15 BTS4 99,83% 887,0 99,9997% 1,5 8.376 8.376 89 2.513 0,15 BTS5 99,83% 887,0 99,9997% 1,5 2.868 2.868 89 860 0,15 BTS6 99,79% 1.126,5 99,9995% 2,4 35.838 35.838 113 10.752 0,24 BTS7 99,83% 887,0 99,9997% 1,5 5.808 5.808 89 1.742 0,15 BTS8 99,88% 647,4 99,9998% 0,8 5.933 5.933 65 1.780 0,08 BTS9 99,89% 587,5 99,9999% 0,7 7.654 7.654 59 2.296 0,07 BTS10 99,89% 587,5 99,9999% 0,7 9.752 9.752 59 2.926 0,07 11.173,9 43,0 178.577 178.577 1.117 53.573 4,30Desde el anlisis, la probabilidad de indisponibilidad es de 11.174 minutos por ao, quemediante la ruta respaldada se podran reducir a 43 mins/ao. La prdida de ingresos porcausa de los minutos de trfico perdidos (bajo el supuesto que afecta a minutos de mayoractividad) es del orden de US$ 1.117, que difcilmente justifiquen cualquier inversin deduplicacin de la ruta mencionada. Sin embargo, si se considera la imagen y potencialrenuncia de clientes (churn) por una mala calidad del servicio, la prdida si puede serconsiderable, que en ejemplo se ha valorizado para un 30% de churn en la zona deservicio de las celdas, en cuyo caso si se puede llegar a justificar una inversin, si sumonto est dentro la evaluacin econmica del tiempo de retorno. 23| 24. Anlisis FMECAOtra til tcnica para la eliminacin de las caractersticas de diseo deficientes, es elanlisis de los modos y efectos de fallas (FMEA:Failure Mode and Effects Analysis); oanlisis de modos de fallas y efectos crticos (FMECA: Failure Mode, Effects, andCriticality Analysis). La intencin es identificar las reas o ensambles o partes del todoque es ms probable que den lugar a fallas del conjunto.El FMEA define la funcin como la tarea que realiza un componente --por ejemplo, lafuncin de una vlvula es abrir y cerrar-- y los modos de falla son las formas en las que elcomponente puede fallar. La vlvula fallar en la apertura si se rompe su resorte, perotambin puede tropezar en su gua o mantenerse en posicin de abierta por la leva,debido a una rotura en la correa de rbol de levas.La tcnica consiste en evaluar tres aspectos del sistema y su operacin: operacin, y el fallo ms probable. Condiciones anticipadas de

Efecto de fallo en el rendimiento.

Severidad del fallo en el mecanismo.La probabilidad de fallos se evala generalmente en una escala de 1 a 10, con lacriticidad aumentando con el valor del nmero. Esta tcnica es til para evaluarsoluciones alternativas a un

problema pero no es fcil de usar con precisin en nuevosdiseos. El FMEA es til para evaluar si hay en un ensamble un nmero innecesario decomponentes puesto que la interaccin de un ensamble con otro multiplicar los efectosde un fallo. Es igualmente til para analizar el producto y el equipo que se utiliza paraproducirlo, ayuda en la identificacin de los modos de fallo que es probable que causenproblemas de uso del producto. Facilita tambin, eliminar debilidades o complicacionesexcesivas del diseo, y a identificar los componentes que pueden fallar con mayorprobabilidad. Puede tambin usarse eficazmente para evaluar las causas de detencin enlas mquinas de produccin o en nodos de una red.En resumen, el objetivo de un FMECA, cuando se realiza como parte de un proyecto dediseo, es eliminar las potenciales futuras fallas que se presuma con gran severidad yprobabilidad, y para reducir lo ms posible, aquellas con la ms alta gravedad y/o mayorprobabilidad. Esto permite la clasificacin de prioridades, por medio del llamado nmerode prioridad de riesgo (RPN). El RPN es el resultado de una multiplicacin de laDetectabilidad (D) x Severidad (S) x Ocurrencia (O), cada uno en una escala de 1 a 10. Elmayor RPN es 10x10x10 = 1000, o que significa que este evento de falla no es detectablepor la inspeccin, es muy grave y la incidencia es casi segura. Si la ocurrencia es muyescasa, ste sera igual a 1 y el RPN reducira a 100. Por lo tanto, el anlisis de criticidadpermite centrarse en los ms altos riesgos.Nivel de CriticidadPara definir un nivel de criticidad, usualmente los efectos de la falla se clasifican en: I. Insignificante: el efecto sobre la confiabilidad y/o disponibilidad es mnimo. II. Menor: no afecta la seguridad, pero s la confiabilidad-disponibilidad. III. Mayor: no afecta la seguridad, pero s la confiabilidad-disponibilidad de manera importante. IV. Crtica: es afectada la seguridad 24| 25. El autor del El Arte de Mantener (ref9) recomienda los siguientes criterios para definir elnivel de criticidad:En una red de telecomunicaciones podr analizarse todas las situaciones devulnerabilidad que puedan existir y asociarlas a un nivel de criticidad, para centrar losesfuerzos de mejoras.Una buena ingeniera contemplar desde los inicios de un proyecto, en sus etapa deconcepcin y diseos, la confiabilidad esperada y todos los medios para alcanzarla. Sicomo se espera de una red de telecomunicaciones, que presta servicios fundamentalespara la sociedad, una disponibilidad de 5 nueves debe analizarse de acuerdo a losdistintos criterios que se han desarrollado aqu.Un anlisis detallado desde los cimientos (componentes, sistemas y subsistemas) hasta elresultado final de la red implementada, conlleva contemplar una revisin de la arquitecturatotal, definir objetivos de confiabilidad, ejecutar una asignacin a las partes. DISPONIBILIDAD RED % INDISPONIBILIDAD NIVEL de minutos/ao SISTEMAS MTBF NIVEL de CIRCUITOS horas (tarjetas) TASA FALLAS NIVEL de COMPONENTES FITs Figura N13Realizar una evaluacin de la arquitectura, identificar deficiencias de diseo, desarrollarlos diagramas en bloque de confiabilidad (tcnica RBD: Reliability Block Diagrams)) y 25| 26. modelos de Markov, hacer la simulaciones y obtener resultados de fallas posibles ydocumentarlas, as se podr reducir los costos de mantencin y reparacin, identificandopreviamente posibles problemas de confiabilidad antes que la red entre en operacin.Existiendo riesgos y costos involucrados, es necesario poder establecer compromisoscontractuales, a los que se les denomina SLA o OLA, temas que sern tratados en unapartado especfico. 26|

27. Aplicaciones y Anlisis Estadstico de EventosDe lo estudiado anteriormente, se ha visto que una red o sistema, tiene uncomportamiento aleatorio en cuanto a sus estados de operacin correcta y con fallasoperacionales. Cuando hay historia, se puede analizar los registros de tiempos en uno yotro estado (Disponibilidad real), y desde all proyectar lo que pueda suceder en el futurode incertidumbre operacional (Disponibilidad proyectada). Incertidumbre OK OUT to t1 t2 t3 t4 t Figura N14qu significan las cifras? cmo obtener resultados de anlisis? qu deducciones sepueden obtener? cmo ayudan a la calidad? Para todo esto, es fundamental disponerde registros y bases de datos con buenas clasificaciones de los eventos, y con igualdetalle del que se desea lograr en los estudios. Si se desea analizar a nivel deconfiabilidad de componentes electrnicos, a nivel de mdulos o a nivel de sistemas, esadeber ser la desagregacin de los registros.A fin de conseguir datos confiables, en los sistemas de registro debe evitarse dejar alarbitrio de quien completa el dato, por o tanto lo aconsejable es que previamente sedefinan las tablas de validacin del dato. Adems, es imprescindible un entrenamientoprofundo que permita la comprensin del fin ltimo de esos datos, como as tambin delsignificado especfico de las clasificaciones.Hay que recordar que la validez estadstica, est basada en las tendencias, y para ello lasbases de datos deben disponer de registros histricos de largo tiempo, as los resultadosde anlisis sern ms cercanos a la realidad. Por la misma razn, debe evitarse cambiarmuy frecuentemente los criterios de medicin, o los tipos de clasificacin.Los ordenes de magnitud en las mediciones de los parmetros fundamentales dedisponibilidad, suponiendo un instrumento constituido de cuatro elementos, son del tipo:Component MTBF MTTR Availability Downtime Hr Hr % mins/aoTransductor de Entrada 100.000 2 99,998% 10,5118Signal Processor Hardware 10.000 2 99,980% 105,0990Signal Processor Software 2.190 0,0833 99,996% 19,9992Visualizador 100.000 2 99,998% 10,5118En la referencia citada como Estadstica bsica aplicada al Mantenimiento se menciona,que la recoleccin de los datos de tiempo y su anlisis, para la estimacin de los ndicesde mantenimiento, acarrean una serie de problemas: 27| 28. (a) Como los fenmenos de funcionamiento de los equipos se relacionan con procesos aleatorios, stos por su propia naturaleza generan un alto volumen de informacin, el cual se incrementa cuando aumenta el nmero de equipos con las mismas caractersticas de operacin.(b) La precisin es otro de los factores considerados, debido a que cuando ocurre una falla, no se sabe a cabalidad el momento exacto en el que ocurre y, la exactitud de los ndices a obtener depende de la precisin con la cual se recopila la informacin sobre el tiempo de operacin y el tiempo fuera de servicio del sistema.(c) La veracidad de la informacin va a estar sujeta a la honestidad y habilidad del personal encargado de recolectarla.(d) La informacin que genera cada equipo requiere del conocimiento de la estadstica para el procesamiento de los datos recopilados.(e) Como el volumen de los datos es tan alto y las ecuaciones matemticas complejas, se requiere del uso de computadoras lo cual implica la contratacin de recursos humanos especializados para el manejo de datos y de los programas, as como para la trascripcin de la informacin.(f) Dependiendo de la distancia entre el equipo y el computador, y del tiempo que demora la trascripcin de los datos se va a presentar un desfasaje entre los sucesos ocurridos en el equipo y los resultados emitidos por el computador, lo que puede ocasionar una decisin errnea sobre el mantenimiento a seguir; por no

ajustarse a la realidad del equipo, ya que ste pudo haber generado otra serie de datos de tiempo.(g) Aunque se utilizan los computadores para calcular los ndices de mantenimiento se presenta el inconveniente de la interpretacin de los resultados, porque para llegar a la decisin acertada, se deben tener conocimientos de las tcnicas de mantenimiento y de los modelos estadsticos. (h) En general, se puede decir que lo sofisticado de la cuantificacin de los ndices de mantenimiento y su interpretacin ha ocasionado, que en determinados niveles gerenciales, tengan una aplicacin restringida, por lo tanto, existe una incertidumbre en la toma de decisiones que distorsiona la utilizacin ptima de los recursos humanos y el control de inventarios de repuestos.Se entiende por parmetros de mantenimiento, a una cantidad que est sujeta orestringida a determinados valores que pueden ser, en una situacin especial, una seriehistrica que describa las caractersticas o el comportamiento de un equipo.(sic)El anlisis de datos en este campo, no es slo sacar resultados de tendencia, sinotambin deducir conclusiones y recomendar acciones de mejoras. Para ello lasmetodologas de Pareto e Ishikawa son clsicas.Diagramas de ParetoWilfredo Pareto (1848-1923) economista italiano, realiz un estudio sobre la riqueza y lapobreza, descubriendo que el 20% de las personas controlaba el 80% de la riqueza enItalia. Pareto observ muchas otras distribuciones similares en su estudio.A principios de los aos 50, el Dr. Joseph Juran descubri la evidenciapara la regla del "80-20" en una gran variedad de situaciones. En particular, el fenmenopareca existir, sin excepcin, en problemas relacionados con la calidad. Una expresincomn de la regla 80/20 es que "el 80% de nuestro negocio proviene del 20% de nuestrosclientes." 28| 29. Por lo tanto, el Anlisis de Pareto es una tcnica que separa los "pocos vitales" de los"muchos triviales". Una Grfica Pareto es utilizada para separar grficamente los aspectossignificativos de un problema desde los triviales de manera que se pueda tomar unadecisin y se sepa dnde dirigir sus esfuerzos para mejorar.El Diagrama de Pareto consiste en un grfico de barras similar al histograma que seconjuga con una ojiva o curva de tipo creciente y que representa en forma decreciente elgrado de importancia o peso que tienen los diferentes factores que afectan a un proceso,operacin o resultado. Anlisis de Pareto 80 120% 70 Pocos Vitales 100% 60 80% 50 Cantidad 40 60% Muchos Triviales 30 40% 20 20% 10 0 0% D A C F E G B H Tipo Evento Figura N15La tabla de frecuencias de los eventos (clasificados desde A a H) y su aporte porcentualse ordena en forma descendente y se calcula el porcentaje acumulado. El resultado se leutiliza para, Identificar y analizar un producto o servicio para mejorar la calidad. Cuando existe la necesidad de llamar la atencin a los problemas o causas de una forma sistemtica. Al analizar las diferentes agrupaciones de datos (ejemplo: por producto, por segmento del mercado, rea geogrfica, etc.) Al buscar las causas principales de los problemas y establecer la prioridad de las soluciones. Al evaluar los resultados de los cambios efectuados a un proceso (antes y despus).En casos tpicos, los pocos vitales (pasos, servicios, tems, problemas, causas) sonresponsables por la mayor parte en el impacto negativo sobre la calidad. Un equipo deanlisis puede utilizar la Grfica de Pareto para varios propsitos para: lograr mejoras,analizar las causas, estudiar resultados, planear una mejora continua, demostrar queprogreso se ha logrado de un "antes y despus". 29| 30. Diagramas de IshikawaOtra til metodologa se le debe a Ishikawa, Kaoru Ishikawa quin naci en Japn en1915 y muri en 1989. Ishikawa fue un gran terico de la administracin de empresas y unexperto en control de calidad.

Ishikawa se incorpor a la ISO en 1960 y, desde 1977, fueel presidente de la delegacin del Japn. Fue adems presidente del Instituto deTecnologa Musashi de Japn. De los muchos aportes que hizo Ishikawa en susnumerosos libros sobre control de calidad, se destaca el conocido diagrama de causaefecto, o mejor conocido como el diagrama de espina de pescado, por la forma que stetiene. Un ejemplo: Figura N16La manera de obtener comienza por decidir cul va a ser la caracterstica de calidad quese va a analizar. Por ejemplo, en un caso de un determinado producto, podra ser el pesodel frasco lleno, la densidad del producto, el porcentaje de aceite, etc. Se traza una flechagruesa que representa el proceso y a la derecha se escribe la caracterstica de calidad.Se indican los factores causales ms importantes y generales que puedan generar lafluctuacin de la caracterstica de calidad, trazando flechas secundarias hacia la principal.Por ejemplo: Materias Primas, Equipos, Operarios, Mtodo de Medicin, etc. Para unamejor visualizacin, cada una de las caractersticas debe tener una ponderacin decunto pesa en proceso y un desglose de las causas que pueden contribuir cada unoprevias. Figura N17 30| 31. En general los aportes de Kaoru Ishikawa, establecen las herramientas bsicas para laadministracin de la calidad:1. La calidad empieza con la educacin y termina con la educacin. Sistema humano,dado que para que se tenga la cultura de calidad se tiene que tener un ambiente decultura en las personas y esto se da por medio de la educacin.2. El primer paso en la calidad es conocer las necesidades de los clientes. Elposicionamiento en el mercado, se debe a que uno necesita saber las necesidades de losclientes para poder satisfacerlas y as cumplir con los estndares de calidad.3. El estado ideal del control de calidad ocurre cuando ya no es necesaria la inspeccin.Se debe controlar el proceso de la calidad para que en un futuro no se presentendefectos.4. Eliminar la causa raz y no los sntomas. Planeacin estratgica, se debe a que unodebe tener un enfoque total del sistema para poder as definir las polticas correctas de lacalidad.5. El control de calidad es responsabilidad de todos los trabajadores y en todas las reas.Se necesita que toda la empresa trabaje junta, es decir, se integre para que puedan tenerxito los procesos de la calidad.6. No confundir los medios con los objetivos. Debe haber un buen lder para que lleve a laempresa a cumplir todos los objetivos, que son la bsqueda de la calidad.7. Ponga la calidad en primer trmino y dirija su vista a las utilidades a largo plazo. Mejorade la calidad, por que se tiene que tener a la calidad como primer trmino.8. La mercadotecnia es la entrada y salida de la calidad. El posicionamiento de mercado,es muy importante saber que le gusta al cliente y que no.9. La gerencia superior no debe mostrar enfado cuando sus subordinados les presentenhechos. Se debe tener en cuenta que lo que se busca es la calidad, as que cualquierqueja se debe tomar en cuenta para intentar mejorar y as alcanzar la calidad.10. El 95% de los problemas de una empresa se pueden resolver con simplesherramientas de anlisis y de solucin de problemas. La planeacin estratgica, siemprese tiene que analizar en el lugar donde se trabaja para as poder resolver los problemasque puedan presentarse. 31| 32. Estadsticas de Disponibilidad en Redes de TelecomunicacionesLa problemtica de un operador de redes de telecomunicaciones es que su producto esun intangible, en la forma de servicios, y su fbrica (que opera 7*24) son las redes, queestn constituidas por mltiples nodos que forman redes de mucha diversidad, entecnologas y origen de fabricacin. En consecuencia la complejidad del registro deeventos es igualmente compleja e implicar anlisis

de calidad tanto para redes comopara servicios.Las redes de telecomunicaciones estn estratificadas y se considera que hay sistemas oredes que son funcionalmente dependientes unos de otros. Como puede verse en lafigura N 18, las capas, que comnmente se definen, son la infraestructura de energa yclima, las redes de transporte, las redes de servicios y las redes de acceso. Servicios del Cliente Sistemas Operacionales Sistemas Comerciales Redes de Acceso Redes de Servicios Redes de Transporte Infraestructura,Energa y Clima Figura N 18El diagrama muestra que todos los componentes contribuyen al servicio del cliente, labase fundamental de las redes y sistemas es la infraestructura de obras civiles, energa yclima, sobre la que se montan las distintas redes. A su vez la red de transporte es la basede soporte para el resto de las redes a las que les provee las interconexiones de nodos.Las redes de servicios soportan la variedad de servicios de telecomunicaciones, comopueden ser las comunicaciones telefnicas, las de datos o de video. A todos estoselementos se debe acceder desde los recintos de clientes mediante las redes de acceso.La correcta operacin de todas las instalaciones es apoyada por sistemas de soporte alos procesos, en el caso de los operacionales, corresponde a sistemas de gestin deelementos de red (NMS) para su configuracin y monitoreo remoto, supervisin dealarmas, registro de tickets de fallas, respaldo de configuraciones, administracin derepuestos, inventarios de recursos de red, y de planimetras.En tanto los sistemas comerciales, apoyan esta gestin, en cuanto a rdenes de trabajode servicios, bases de clientes, registros de trfico, sistemas de tasacin, tarificacin, yfacturacin. Todos y cada uno contribuyen a la calidad del servicio final. La imagenpiramidal indica que las plataformas inferiores soportan a todas las superiores y por ellorevisten mayor importancia desde el punto de vista de asegurar confiabilidad. 32| 33. En la figura N 19 se describe en forma mas detallada las distintas redes y tecnologasque forman parte de las instalaciones tpicas de un operador, para entrar a continuacin arealizar algunos anlisis tpicos de redes. Figura N 19Cualquier estudio de consfiabilidad o disponibilidad requiere definir modelos de red ymodelos de datos. La recopilacin de datos necesita un largo tiempo de recoleccin yvalidacin, los que tpicamente se obtienen de las bases de datos de los reportes de fallasy dependiendo de la profundidad del anlisis que se desea, es el mayor detalle delregistro: niveles de tecnologa, equipos, tarjetas, mdulos, responsabilidades operativas,proveedores, etc.Para informes o reportes de SLA es comn el anlisis de datos de un mes paradeterminar comportamiento de disponibilidad de corto plazo, sin embargo, para anlisis deproyecciones de confiabilidad lo recomendado es un anlisis de lo por lo menos un ao dedatos.El proceso de anlisis requiere muchas horas especializadas y ms an si las bases dedatos requieren de mucha validacin. Por ello se han desarrollados herramientasinformticas especializadas, que como referencia se mencionan algunos: http://www.i-mtbf.com/ http://www.relex.com/ http://www.raytheoneagle.com/asent/index.htm http://www.reliasoft.com/BlockSim/ http://www.isograph.com/workbench.htm http://www.plant-maintenance.com/freestuff/1006.shtml 33| 34. Sistemas de energa o poderComenzando por un Modelo de Clculo para instalaciones de energa paratelecomunicaciones, la recomendacin es estructurar los registros de datos quecontengan: Fecha H:M:S Inicio / Fin del evento. Si se desea evaluar el proceso registrar tiempos intermedios. Sistema AC CC Tableros Bateras Disyuntores, inventario de base instalada, etc. Marcas, fabricantes Ubicacin: Lugar geogrfico Estacin - Sala Alarma

inicial Diagnstico - Solucin Tcnico responsable: diagnstico y reparacin, Si se desea evaluar, tambin recursos externos identificarlos Recursos utilizados, control de repuestos y anlisis de costosEn consideracin a que se est en presencia de instalaciones de mltiples sitios ymultiples equipos debe recurrirse a la formula f.21 para el calculo. Adems, debegenerarse una medida de impacto, es decir, que en una instalacin (sitio o estacin) unafalla no siempre afecta a todos los servicios de energa, ello por que pueden haberdiferentes mdulos rectificadores, diferentes tableros de distribucin, y mltiples breakers,protecciones o automticos (segn el trmino que se acostumbre).La recomendacin es que sea ste ltimo nivel el que permita ponderar el impacto, ya quees el ltimo elemento del sistema que permite evaluar el impacto sobre el nmero deequipos de telecomunicaciones o TI que fueron afectados.Si se est frente a la necesidad de evaluar confiabilidad de una instalacin, en primerlugar establecer el diagrama en bloques de todos los componentes del sistema que estnsusceptibles de analizar, en una cadena serie-paralelo y aplicar los MTBF histricos de almenos un ao de registro o los que entregue el fabricante. Un modelo de una posibleplanta de energa se muestra en la figura N 20. Figura N 20 34| 35. El objetivo de confiabilidad de todo el sistema, es el resultante en la carga, enconsecuencia en el calculo intervienen al menos 7 elementos, aportando cada uno supropia confiabilidad. cul es la probabilidad de estar libre de falla en 1 ao? MTBF Confiabilidad Hr % Elem 1 1000000 0,9901 Elem 2 300000 0,9607 Elem 3 500000 0,9802 Elem 4 1000000 0,9901 Elem 5 300000 0,9672 Elem 6 1000000 0,9901 Elem 7 300000 0,9672 TOTAL 89,8538%Se puede esperar con un 89.9% de probabilidad de que no falle antes de las 10.000 Hrs(el ao son 8.760), notando que cada elemento por separado tiene un buen nivel deconfiabilidad, y bajo el supuesto que los dos primeros elementos operan como respaldo.Este estudio es vlido para esa configuracin de sistema y para todas las instalacionesque sean iguales y con los mismos componentes.Si se analiza la disponibilidad, se incluye la mantenibilidad expresada por el MTTR. MTBF MTTR Disponibilidad Downtime Hr Hr % mins/ao Elem 1 1000000 2 99,99980% 1,05 Elem 2 300000 4 99,99867% 7,01 Elem 3 500000 1 99,99980% 1,05 Elem 4 1000000 1 99,99990% 0,53 Elem 5 300000 1 99,99967% 1,75 Elem 6 1000000 1 99,99990% 0,53 Elem 7 300000 1 99,99967% 1,75 TOTAL 99,9989% 5,61El resultado es que se espera que el 99,9989 del tiempo de operacin el sistema estdisponible, y como complemento un tiempo de indisponibilidad de 5,6 minutos por aoque se podra perder el servicio. Si las cifras de MTBF y MTTR provienen de la estadisticaprevia del ao, no es lo que se espera sino es un hecho, y que si se pudiese proyectarcomo comportamiento futuro de mantenerse las condiciones operativas.Suponiendo que se analiza con otra perspectiva, que sea detectar puntos de debilidad delos distintos sistemas similares, en cuyo caso se tuviese los siguientes datos (no dicenninguna relacin con ejemplo anterior): Cantidad Eventos Sum Tpos out MTBF MTTR Disponibilidad Downtime Instalada Hr Hr Hr % mins/ao Elem 1 100 50 458 175 9,2 99,948% 274,80 Elem 2 50 38 1432 231 37,7 99,673% 1718,40 Elem 3 200 41 783 214 19,1 99,955% 234,90 Elem 4 639 1 321 8760 321,0 99,994% 30,14 Elem 5 43 14 53 626 3,8 99,986% 73,95 Elem 6 173 73 837 120 11,5 99,945% 290,29 Elem 7 491 200 38 44 0,2 99,999% 4,64 35| 36. Se deduce que el elemento 7, a pesar de presentar una alta tasa de fallas (200 eventos),pero por tener MTTR muy bajo, su disponibilidad es de 99,999%

del ao. Por el contrario,puede tambin deducirse, que el elemento 2 debe analizarse en mas detalle sucomportamiento (oportunidad para Ishikawa), ya que tiene la mayor contribucin a laindisponibilidad del sistema, tanto por impacto del MTBF y MTTR. Del diagrama figuraN21 el responsable es el mdulo 2 que deber resolverse con el fabricante su solucin. falla operativa= 6 falla HW=23 Instalacin=1 Mdulo1=6 mantencin=3 Mdulo2=13 provisin= 2 Mdulo3=4 de 50 Eq fallaron 45 Calidad Equipo Config=3 falta=1 Bloqueo=4 distancia=1 falla SW Repuestos=2 Figura N 21Si se desease analizar la disponibilidad de la entrega de energa a todos los equipos delas redes, suponiendo un universo de 500 alimentadores, para los que se registran loseventos de falla y semanalmente se calcula los parmetros de disponibilidad real yproyectada, luego de determinar los MTBF y MTTR evolutivos. Disponibilidad Proyectada MEDIDA PROYECTADA 4,5 100,5000% 4 99,5000% 3,5 1-(TiTo) MTBF/(MTBF+MTTR) 98,5000% 3 2,5 97,5000% Eventos 2 96,5000% Disponibilidad % 1,5 95,5000% 1 0,5 94,5000% 0 93,5000% 1 2 3 4 5 6 7 8 9 10 1112 1314 15 1617 1819 20 2122 TIEMPO Figura N 22Los calculos se muestran en la tabla siguiente: Eventos Eventos Tpo. out Tpo. Out Acum. MTBF MTTR Disponibilidad Acum Hr Hr Hr Hr % 1 1 0,4 0,4 168 0,4 99,9995% 3 4 0,34 0,74 42 0,2 99,9991% 1 5 1,3 2,04 34 0,4 99,9976% 1 6 1,45 3,49 28 0,6 99,9958% 4 10 4,3 7,79 17 0,8 99,9907% 0 10 0 7,79 17 0,8 99,9907% 1 11 0,98 8,77 15 0,8 99,9896%La notable diferencia se debe a la poca historia de los eventos. Lo recomendable esaumentar el tiempo de anlisis para que la proyeccin sea ms fiable. Se insiste que lossistemas de poder sustentan la totalidad de los dems elementos de las redes, por ellodebe asegurarase la mxima confiabilidad. 36| 37. Red de cables de FOLos tendidos de cables de FO se han constituido en el elemento fundamental deinterconexin de la redes de telecomunicaciones y de ellos depende la confiabilidad de latotalidad de nodos de servicios que comunican diferentes localidades regionales onacionales. La confiabilidad esperada de ellos depende, como en otras tcnicas, de unaingeniera de detalle acusuosa que contemple en sus calculos la disponibilidadproyectada, y en funcin de las tecnicas de costruccin tpicas de los tendidos: areos,canalizados, soterrados, etc. En gran medida, estas variantes afectan al MTBF por laprobabilidad de cortes ocasionados por terceros o por deterioros propios del tiempo, comoas tambin afectan al MTTR, por tiempo de recuperacin y desplazamiento.Un cable OPGW (Optical Ground Wire) cable de tierra en torres e alta tensin con fibraptica tiene del orden de cuatro veces mejor confiabilidad que uno canalizado (0,05eventos / Km contra 0,2 de una canalizada), sin embargo, est sometido a deteriorosambientales y de esfuerzos mecnicos, pero estos ltimos pueden ser detectadospreventivamente y actuar en intervenciones programadas, mientras que el canalizadotiene un alto riesgo de ser destruido por excavaciones involuntarias (ver ref.11).La recomendacin es llegar a definir factores de Weibull que modelen estos fenmenos.Calculando la confiabilidad segn f.7 con % = 1 se obtiene para un cable OPGW (MTBF=100 aos/Km) una probabilidad de 98,865% que no falle antes de 10.000 Hrs, mientrasque para el cable canalizado (MTBF=25 aos/Km) es de un 96,536%. Si existenantecedentes de zona de vandalismo u otros riesgos que se desee incorporar en elmodelo, puede ser recomendable un factor de % = 0,75, con lo que las confiablidadesanteriores se reducen a 95,568% y 90,594% respectivamente.Recordar que se acuaba otra unidad alternativa al MTBF es el FIT (ver definiciones deDisponibilidad), que en este caso suele ser ms

utilizada, por lo que puede decirse que uncable OPGW tiene un FIT de 1.142/Km y uno canalizado un FIT de 4.566/Km. Los datosde ejemplo, corresponden a estadsticas de largo tiempo de observacin, por lo tantoconsiderar como valor tpico para un cable OPGW un FIT/Km de 1.000 y para Canalizadouno de 4.000 puede ser una buena aproximacin para modelar.Las redes de larga distancia llegan a ser de varias decenas o centenas de Kms, y portanto es deducible, que en la medida que los tendidos sean de mayor longitud, laprobabilidad de que se presente un evento de falla es mayor, de ah que estos parmetrosse definan en funcin de una unidad de longitus, a modo de introducir este otro factor deriesgo. Adems, en consideracin a la alta importancia en la sobrivivencia de la totalidadde las redes, los cables de FO se respaldan entre distintos operadores, con losrespectivos alementos de conmutacin automtica.Uno de los cables se define como principal (working) y el otro como respaldo (protection),tal como se muestra en la figura N 23 y las confiabilidades a esperar para los datos deejemplo, son de 99,393% y 98,502% para cada cable entre los extremos A y B con trestramos. 37| 38. MTBF=100 aos/Km MTBF=100 aos/Km MTBF=25 aos/Km oper 1A Tramo 1 = 50 Km Tramo 2 = 100 Km Tramo 3 = 25 Km B oper 2 MTBF=25 aos/Km MTBF=25 aos/Km MTBF=25 aos/Km Figura N 23Sin embargo, para el sistema de fibras protegidas la confiabilidad es de 99,991% para laprobabilidad de que sufran cortes ambos cables simultneamente, aunque este calculo noes el adecuado, pues debe considerarse la probabilidad de falla de los conmutadores, conlo que se alcanza una confiabilidad de 99,333% considerando que en la cadenaintervienen seis elementos adicionales sujetos a falla. MTBF Op 1 Confiabilidad MTBF Op 2 Confiabilidad tramo 1 43.800.000 99,814% 21.900.000 99,688% tramo 2 87.600.000 99,890% 10.950.000 99,120% tramo 3 21.900.000 99,688% 5.475.000 99,688% Red FO 99,393% 98,502% Red FO Prot 99,991% Switch ( 6 ) 87.600.000 99,342% Red FO c/Sw 99,333%Analizada la disponibilidad proyectada, considerando las cifras de MTTR para cada tramo,incluidos los tiempos de desplazamiento para los tres tramos de 175 Kms entre laslocalidades A y B. MTBF Op 1 MTTR Op 1 Disponibilidad MTBF Op 2 MTTR Op 2 Disponibilidad tramo 1 43.800.000 4 99,99999% 21.900.000 6 99,99997% tramo 2 87.600.000 6 99,99999% 10.950.000 8 99,99993% tramo 3 21.900.000 4 99,99998% 5.475.000 4 99,99993% Red FO 99,99997% 99,99983% Red FO Prot 99,9999999999% Switch ( 6 ) 87.600.000 2 99,99999% Red FO c/Sw 99,99999%Los calculos anteriores estn suponiendo que ante un corte de cable se conmutansimultneamente los tres tramos de cable al respaldo. Si esa es una condicionante de lossistemas de conmutacin, puede analizarse la probabilidad condicionada de que se dencortes simultaneos de tramos distintos de un operador y otro, y la conmutacin no esefectiva. P (A|B)= {P(A)*P(B)} / P(B) f.30 As, por ejemplo, la probabilidad de que haya un corte en el tramo 1 del operado 1 dadoque ya hay un corte en tramo 2 del operador 2, la probabilidad condicionada de tal 38| 39. situacin es de 7*9 y no de 12 nueves como calculado anteriormente (sin considerar losswitchs).Red de TransporteProgresando en la pirmide de los sistemas de telecomunicaciones, los constituyentes dela red de transporte de alta capacidad, incluyen equipos multiplexores SDH -TDM, WDM(Wave Division Multiplex) que son multiplicadores de fibra ptica que utilizan como mediode transmisin la fibra ptica, y por ser sistemas electrnicos deben recibir unaalimentacin de energa elctrica. En consecuencia el anlisis de

disponibilidad comosistema de transporte de seales de telecomunicaciones ya deber tomar en cuenta todsestos componentes. En un primer anlisis se puede estudiar su comportamiento aisladocomo equipos, pero funcionalmente ser siempre en el conjunto ante smencionado.En general los equipos de telecomunicaciones son construidos en mdulos funcionalesque son tarjetas, y que en una determinada combinacin, dan las prestacionesespecficas para el sistema diseado. Por tanto, para el estudio de confiabilidad serequiere el dato del MTBF o FIT de cada mdulo que entrega el fabricante y que ellosdeducen de estudios de simulacin ambiental acelerada (ver ref.12). Para el calculotambin debe establecerse el diagrama en bloques funcional, para detectar mdulosserie-paralelo en la estructura del equipo.En primer lugar, se define la confiabilidad-disponibilidad del equipo, suponiendo un equipoconstituido por un grupo de tarjetas: A A A A A A A A A A 1 2 3 3 4 5 6778XXXXXXXXXXXXXXXXXXXXXXXXXXXXX XQue operan de acuerdo al diagrama funcional: A3XXX A7XXX A1XXX A2XXX A4XXX A5XXX A6XXX A8XXX A3XXX A7XXX Figura N 24Los mdulos A3 y A7 pueden funcionar con redundancia. Considerando a modo deejemplo, que el fabricante entrega como datos la siguiente tabla de tasa de fallas paracada tarjeta, se puede calcular em MTBF del equipo desde: 1 MTBF= FR1+FR2+....FRn f.31 39| 40. FR Tarjeta Failure Rate MTBF(hrs) MTBF(yrs) (FITs) 1,454E-06 A1XXX 1.454,00 687.757,9 78,5 7,22E-07 A2XXX 722,00 1.385.041,6 158,1 2,68E-07 A3XXX 268,00 3.731.343,3 426,0 1,499E-06 A4XXX 1.499,00 667.111,4 76,2 1,521E-06 A5XXX 1.521,00 657.462,2 75,1 1,223E-06 A6XXX 1.223,00 817.661,5 93,3 1,234E-06 A7XXX 1.234,00 810.372,8 92,5 1,823E-06 A8XXX 1.823,00 548.546,4 62,6 1,842E-06 A9XXX 1.842,00 542.888,2 62,0 1,452E-06 A11XXX 1.452,00 688.705,2 78,6 1,435E-06 A12XXX 1.435,00 696.864,1 79,6 1,763E-06 A13XXX 1.763,00 567.215,0 64,8 1,756E-06 A14XXX 1.756,00 569.476,1 65,0Bajo el supuesto de que el equipo es reparable en un tiempo medio de 1 Hr, se obtiene ladisponiblidad del equipo. En este caso la mejora, producto del respaldo de los dosmdulos, no es muy significativo en la disponibilidad final. FR Equipo MTBF Equipo MTTR A 0,0000097 102.627 1 99,99903% 0,0000082 121.330 1 99,99918%Ahora bien, el anlisis de disponibilidad para los servicios de transporte entre los extemosA y B, dependen de todos los elementos constitutivos de estas instalaciones, cuyodiagrama es: A B MUX WDM MUX WDM SDH SDH PODER PODER Figura N 25Slo por razones de simplicidad, para el ejercicio se toman valores arbitrarios, que dicenrelacin con situaciones reales en ordenes de magnitud, pero no necesariamente puedenser tomados con valores tpicos a todo evento. Notar que en este calculo, intervienen losequipos de ambos extremos, adems del tendido de fibra ptica. MTBF MTTR A Mux 150.000 2 99,99867% WDM 200.000 2 99,99900% Poder 300.000 3 99,99900% Fibra 1.000.000 6 99,99940% Red 99,99273% 40| 41. Si bien, individualmente, se encuentran cifras de cinco nueves, se puede observar comose reduce la expectativa de disponibilidad para el conjunto de los elementos de red queconstituyen el servicio de extremo a extremo.La topologa de red, tambin debe ser considerada en los anlisis, la que se ha utilizadoaqu es del tipo lineal, que se presta para las redes troncales nacionales, por nuestrageografa, sin embargo, en una red metropolitana, pueden establecerse redes del tipoanillo o enmalladas (ver ref.13).En cada una de las tcnicas que se han analizado, se han introducido distintos enfoquesa poner en practica, para los

estudios de confiabilidad y disponibilidad, pero stas sonsolamente las bases para la ingeniera de mantenimiento de redes. En los sistemas depoder, deben incorporarse en los calculos la confiabilidad de red de distribucin elctrica,materia prima para todo el sistema de poder de una estacin, a menos que seaautnoma en la generacin. Del mismo modo, hay que incorporar confiabilidades degrupos electrgenos y bancos de rectificadores, protecciones y todo elemento. Nada seha mencionado de los sistemas de climatizacin que tambin son parte fundamental delas instalaciones para mantener las condiciones ambientales operativas reguladas quesupone todo equipamiento electrnico.Tampoco se ha mencionado, que debe incorporarse en los anlisis el tema de laautonoma, de respaldo de la energa de las plantas de bateras y grupos elctrgenos,que debe estar dimensionada de acuerdo a los MTTR de la energa primaria y de lascapacidades de consumo de las cargas.Red de ServiciosContinuando el ascenso en las capas de red de la figura N18, la red de serviciosconstituida por nodos que son interconectados entre s por las redes de transporte, sonnodos donde de configuran los servicio sde clientes y que dan acceso a los mismos. Engeneral estos nodos efectan conmutacin dinmica acorde a los trficos que demanda elcliente, por tanto optimizan los anchos de banda de interconexin. A B MUX WDM MUX WDM SDH SDH PODER PODER Figura N 26Las tecnologas que habitualmente se asocian a esta capa de red, son nodos DSLAM,ATM, MPLS, centros de conmutacin telefnica, ya sean TDM o softswitch. Comoconfiabilidad de equipos se aplica la misma metodologa de configuracin de tarjetas ysus MTBF asociados que se mencion anteriormente. Sin embargo, es comn que enestos tipos de equipos influyan fuertemente aspectos de software y de dimensionamientode acuerdo al trfico que deben manejar segn demanda. Los primeros, aunque 41| 42. actualmente es un componente de todo equipamiento, tambin debieran tener asociadoMTBFs entregados por el fabricante y debiera ser tratado separadamente y como comoprte integrante de vada tarjeta y los segundos son de carcter operacional preventivo parano caer en degradaciones del servicio.En los conceptos de trfico deben aplicarse los modelos de prediccin de la demandapara el dimensionamiento, En instantes de congestin se cae en una baja de calidad deservicio y muchas veces tambin de prdida de ingresos, y de igual modo un sobredimensionamiento tambin se refleja en una prdida por activos ociosos. Enconsecuencia, los estimadores de congestin, se asocian tambin como un factor decalidad o disponibilidad.Una probabilidad de prdida de trfico por congestin, ya sea porcapacidad de procesamiento, falta de ancho de banda de canal u otro factor similar, debeasociarse como una probabilidad de falla adicional.En este caso no se puede hablar de un MTBF, incluso si lo hubiese, significara que nohay acciones preventivas de dimensionamiento, en general debe ser un procesopredictivo y no aleatorio. SI se pensara en un MTTR, ste sera habitualmente muy alto,ya que al presentarse un fenmeno de congestin, la reaccin para una ampliacin notoma horas, sino puede llegar a varios dias. Por tanto se recomienda asociar laprobabilidad de congestin directamente como una probabilidad de falla, as si sedimensiona para una probabilidad de prdida de un 1%, sta es la probabilidad deindisponibilidad del servicio. MTBF MTTR A Servicios 200000 2 99,99900% Congestin 99,00000% Mux 150.000 2 99,99867% WDM 200.000 2 99,99900% Poder 300.000 3 99,99900% Fibra 1.000.000 6 99,99940% Red 98,99083%Notar como la disponibilidad de extremos a extremo baja de 4*9 a 98,99% con respecto alcalculo de la red de transporte.Hay oportunidades en que por razones

de metas o SLA se define un factor de castigo ode ponderacin a determinados nodos que fallen, asociandolos a un orden de importanciaya sea por capacidad de servicios o de ancho de banda. En cualquier caso, esto se alejatotalmente del concepto ce confiabilidad, sino es una decisin administrativa.Redes de Acceso Las redes de acceso son las que incluyen mas vulnerabilidad a los servicios, ya que porlo general, no tiene respaldo, y slo en muy contados casos, grandes clietes as losolicitan. La tecnologa de acceso ms utilizadas son XDSL usando como medio detransmisin el par de cobre, PON usando como medio de transmisin la fibra ptica, 42| 43. VSAT, WIMAX, enlaces de radio dedicados usando como medio de transmisinpropagacin electromagntica.Los medios fsicos de planta externa, tienen la vulnerabilidad de estar en zonas urbanasde alta incidencia de eventos exgenos y de deterioro ambiental, mientras que lapropagacin est sometida a interferencias y desvanecimientos propios de lascondiciones atmosfricas sobre la cual se propaga una onda electromagntica.Conocidos son los modelos de probabilidad de Rayleigh para estimar la degradacin deun radioenlace. MTBF MTTR A MTBF MTTR A Servicios 200.000 2 99,99900% Servicios 200.000 2 99,99900% Congestin 99,00000% Congestin 99,00000% Mux 150.000 2 99,99867% Mux 150.000 2 99,99867% WDM 200.000 2 99,99900% WDM 200.000 2 99,99900% Poder 300.000 3 99,99900% Poder 300.000 3 99,99900% Fibra Trk 1.000.000 6 99,99940% Fibra Trk 1.000.000 6 99,99940% Acc Radio Eq 200.000 2 99,99900% Acc PEX 150.000 4 99,99733% Acc Radio Propg 99,99000% Red 98,98555% Red 98,97994%En los resultados puede verse al aumento de la probabilidad de falla o disminucin de ladisponibilidad, el primero con acceso de planta externa en ambos extremos, y el segundocon un solo acceso de radio, como podra ser un servicio internet.Hasta aqu se han visto las metodologas de calculo de disponibilidad y confiabilidad, paralso principales componetes de uan red de telecomunicaciones. Es recomendable realizarestudios de bases de datos histricos de los eventos de las distintas tecnologas, paradeterminar bajo condiciones reales operacionales y tecnolgicas, resultados de MTBF yMTTR histricos, distribuciones de eventos por fabricantes o por geografa. As a modo deejemplo, la figura N27 se muestra un diagrama de frecuencia de tasas de fallas deservicios responsabilidad de fallas de redes. TASA DE FALLAS DE SERVICIOS CON RESPONSABILIDAD DE REDES 14,00% 12,48% 12,00% 10,21% 10,00% 9,81% 9,61% 8,52% Tasa de falla 8,00% 8,20% 7,65% Resp.Redes sobre TASA 7,27% 7,39% 7,27% 6,99% 7,02% 6,92% 6,96% total 6,55% 6,33% 6,50% 6,51% Serv.Reclamados 6,00% 6,01% 6,06% 6,05% 6,04% 6,15% 5,45% 5,30% 5,22% 4,82% 4,72% 4,61% 4,59% 4,70% 4,83% 4,19% 4,14% 4,14% 4,34% Tasa de falla 4,00% 3,90% Resp.Redes sobre 3,21% total 2,00% Serv.Reclamados (Excl.Mant.Progr.) 0,00% Tasa de falla Resp.Redes solo MAYO MAYO ENERO ENERO JULIO JULIO JUNIO JUNIO MARZO MARZO ABRIL ABRIL FEBRERO FEBRERO AGOSTO OCTUBRE DICIEMBRE NOVIEMBRE SEPTIEMBRE corte traf. MES Figura N 27 43| 44. De igual modo, llegar a determinar las tecnologas que tienen mayor incidencia en lasfallas de servicios finales, cuando se correlacionan fallas de red con fallas de servicios ypoder hacer un anlisis de Pareto. G R A F IC A D E S E R V IC IO S A F E C T A D O S P O R F A L L A S D E R E D P E R IO D O E N E R O -J U L IO 2 0 0 9 2000 120,0% 1800 1612 9 8 ,6 % 9 9 ,5 % 1 0 0 ,0 % 1 0 0 ,0 % 1 0 0 ,00%% 10 ,0 1600 9 5 ,6 % 9 7 ,1 % 9 2 ,3 % 9 4 ,0 % 9 0

,5 % 8 8 ,5 % 1400 8 6 ,1 % 8 2 ,3 % 80,0% 7 7 ,6 % 7 2 ,4 % N R O .F A L L A S 1200 6 6 ,4 % S E RV 1000 5 9 ,4 % 60,0% % S E RV P A R E TO 5 1 ,9 % 800 732 677 4 0 ,3 % 40,0% 600 437 2 7 ,7 % 408 400 351 303 20,0% 272 219 200 139 119 102 98 95 91 83 56 27 0 0 IN T E R N A C 0 F O E Q U IP A D M /O N U 0,0% FO TRNC CO BRE FO URB CXLO C W IM A X MMOO BBG E CXLD XDSL MPLS W LL T F IP A L IM SAT ATM TDM IP P L AT AF O RM A Figura N 28Otro tipo de anlisis, que permite analizar la distribucin geogrfica de las fallas de nodosde una red. Nodos que aportan el 90% de indisponibilidad Total 2005 2006 2007 2008 general Localidad 1 44,36 94,99 279,09 148,56 567,00 Localidad 2 46,56 39,15 12,84 13,40 111,95 Localidad 3 14,23 8,04 17,30 21,17 60,74 Localidad 4 4,80 6,52 8,89 29,62 49,83 Localidad 5 0,08 4,76 31,23 8,09 44,16 Localidad 6 3,85 3,40 36,55 43,80 Localidad 7 21,62 7,83 29,45 Localidad 8 3,03 11,79 14,82 Localidad 9 5,20 8,55 13,75 Localidad 10 1,60 11,17 12,77 Localidad 11 3,88 6,04 0,92 10,84Un anlisis de la tipificacin de las fallas, puede ser como la de la tabla siguiente, quecorrabora lo antes mencionado en cuanto a la alta incidencia del softwre de los equipos.Las fallas de red destacadas, no son de la propia red o son trabajos programados, por Eventos Tout Conf 19 41,56 Cong 9 17,8 HW 5 14,35 Indef 16 33,26 Poder 3 9,06 Reboot 22 14,89 Resset 11 11,95 TrabProgr 165 385,19 Tx 9 37,95 44| 45. tanto eventos bajo control determinstico.Una vista de los MTTR histricos por tecnologa, permite confirmar la media para larestitucin de las fallas de cada una de las tecnologas. G AIC M T RF A T R 2 ,0 40 2 ,0 20 2 ,0 00 1 ,0 80 1 ,0 60 1 ,0 40 P O E IO2 0 - 0 6 R M D 0 42 0 H RS 1 ,0 20 20 07 OA 1 ,0 00 20 08 80 ,0 60 ,0 40 ,0 20 ,0 00 ,0 IP M ILL SL TF_IP PLS MO PO ER TD C BE MO OR XD W D C CL SA L M FO R A A X_LO A TELITA FO U S FO O C L _U B N _EQ IPO _TR N A RD E Figura N 29Como comentarios finales de este captulo, volver a mencionar que stos son anlisis desistemas estocsticos espacio-temporal y por lo tanto, al mencionarse o determinarsevalores medios, no hay que olvidar las dispersiones, y que todo obedece a un modelo,que no siempre llega a represntar todas las variables a que se ve enfrentada la red.Una vista que acerca a estos conceptos, corresponde al anlisis en zonas de operacinwearout o de envejecimiento (ref.14), que demuetra como los valores medios ydesviaciones se desplazan, segn sea la generacin de elementos de reemplazo que sevan utilizando en el mantenimiento correctivo.La calidad, no son slo anlisis estadsticos de desempeo o de pronstico, sino de quecada grupo de O&M cuete con los procedimientos de mantenimiento, contemplandomantencin preventiva, bastante disminuida en equipamientos electrnicos, pero sifortalecida en la verificacin de los mecanismos de respaldo y monitoreo proactivo delcomportamiento de los principales parmetros caractersticos de la tecnologa. Mtodosde diagnstico, procedimientos de intervencin, escalamiento, documentacin tcnico-operacional, poltica de repuestos e instrumentos, informes de desempeo de red, etc.Las fallas que inducen una indisponibilidad operacional de los servicios, son productotanto de las fallas individuales de los componentes de red, reflejadas en el MTBF, comode las intervenciones de operacin errneas o de la habilidad de las acciones deoperaciones dirigidas a la restauracin de una interrupcin y contar con los medios dediagnstico adecuados (gestores, instrumentos, herramientas, medios de accin remota,etc.), en consecuencia la relacin con la capacitacin y el entrenamiento sonfundamentales. 45|

46. Calidad, SLA, Disponibilidad de ServiciosPara facilitar el anlisis de cmo aplicar los conceptos de confiabilidad-disponibilidad a losservicios finales, que se desarrollan sobre una red de telecomunicaciones, debe contarsecon un Modelo de Servicio. El modelo tradicional aplicado a todo servicio consiste en trescomponentes de red, por cada extremo, que desde el punto de vista de probabilidades, elvalor compuesto de la disponibilidad ser el producto de las probabilidades de cadacomponente. En cambio los ndices MTBF y MTTR son variables independientes. Los trescomponentes obedecen a una taxonoma que permite ordenar y organizar estoscomponentes en redes de Acceso, Servicios y Transporte. AL cliente le interesa laDisponibilidad, ms que la confiabilidad cuando se entienden bien ambos conceptos. Red de Red de A cceso A cceso Red de Red de S e r v ic io S e r v ic io C lie n t e C lie n t e E q u ip o E q u ip o T e r m in a l E q u ip o Red E q u ip o T e r m in a l A p lic a c i n de A p lic a c i n Red T ra n sp o rte Red I n te r io r I n te r io r - PABX - R o u te r - M u ltip le x o r e s - D a to s - Fax - I n te r n e t - E tc . - T e le f o n a L o c a l - T F . L D N a c io n a l - T F . L D I n te r n a c io n a l - C o b re - F ib r a O p tic a - I n a l m b r ic o - T r a n s p o r te U rb a n a - S a te lita l - T r a n s p o r te I n te r u r b a n a - xD SL - T r a n s p o r te I n te r n a c io n a l - TDM - T r a n s p o r te s a te lita l Fig. 5 Modelo general de los ServiciosEn redes de Acceso podr existir dos componentes de acceso, cuando se trate deservicios que contemplan un nodo de acceso de datos TDM o xDSL mas un CPE,pudiendo llegar, las componentes de la cadena de servicio, de responsabilidad delproveedor de red, a ser 13 de extremo a extremo. Si se desea precisar, puede agregarsela complejidad de considerar el nmero de nodos de conmutacin o trnsito quecontempla una red de servicios, sin embargo, se recomienda que en una primeraaproximacin al establecimiento de criterios de medicin, se tome el modelo de dosnodos.Los ndices de Disponibilidad y MTTR son los ms significativos en los SLA de losservicios y para llevarlos a cmo se reflejan en cada servicio especfico, debe aplicarse acada modelo de servicio una matrz con elementos componentes de red que intervienen. Disponibilidad >>> Terminal ITI / Medio Nodo Red Red Tx Disponibilidad CPE / NT Acometida Acceso Acceso Servicios Compuesta Servicio Servicio 1 99,900% 98,500% 99,90% 99,95% 99,99% 99,999% 98,243% Servicio 2 99,900% 98,500% 99,90% 99,90% 99,99% 99,999% 98,194% Servicio 3 99,950% 100,000% 99,90% 100,00% 99,99% 99,999% 99,839% Servicio 4 99,900% 98,500% 99,90% 99,98% 99,99% 99,999% 98,273% Servicio 5 99,900% 98,500% 99,90% 99,90% 99,99% 99,999% 98,194% Servicio 6 99,920% 100,000% 99,90% 100,00% 99,99% 99,999% 99,809% Servicio 7 99,900% 98,500% 99,90% 99,90% 99,99% 99,999% 98,194% Servicio 8 99,900% 98,500% 99,90% 99,90% 100,00% 99,999% 98,204% NOTA: se usa 100% para elemento que no existe 46| 47. Si el servicio transita de extremo a extremo por las redes, obviamente deben considerarselas componentes de ambos extremos, en cambio un servicio internet tiene un modeloasimtrico.Compromisos de disponibilidad hacia clienteCada da hay una mayor y controlada exigencia hacia la provisin de servicios, hayorganismos pblicos que protegen el cumplimiento y cursan multas a los operadores. Porello es importante que se presenten muy transparentemente los compromisos que puedenesperar el contratante de los servicios y que el operador debe responder. A modo deejemplo las condiciones operacionales de los servicios ofrecidos por operadores:http://www.xentrip.com/w2/SLA%20Xentrip%20v1.5-

web.pdfhttp://dts.utah.gov/services/enterprise/resources/3132.07.10SpecialAgreements20090219.pdfhttp://www.wavetelecom.com/upload/documents/terms_and_conditions/Wave%20SLA%20issue%201.2.pdfA continuacin se presentan algunos aspectos de los clculos de disponibilidad y decompromisos de un SLA de los servicios y su relacin con el cliente.El Service LevelAgreement (SLA) es aquel que se asocia con los servicios al cliente, tambin se haacuado el trmino Operational Level Agreement (OLA) para los compromisos entregrupos operacionales de una TIC.Un acuerdo a nivel operativo (OLA) es un contrato, que define la manera en quecontribuyen los diversos grupos, dentro de un plan de empresa, para ofrecer un servicio oun conjunto de servicios. OLAs estn diseados para abordar y resolver el problema delas responsabilidades de las partes organizacionales, ya que establecen un conjuntoespecfico de criterios y de servicios de TI que cada departamento es responsable. Cabesealar que el concepto de Acuerdo de Nivel de Servicio (SLA) se utiliza en muchasempresas a la hora de discutir los acuerdos entre dos grupos de internos, pero deacuerdo a la Biblioteca de Infraestructura de Tecnologa de la Informacin (ITIL) para lasmejores prcticas, este tipo de contrato interno debe ser llamado un Acuerdo de NivelOperacional.Por otro lado, un acuerdo de nivel de servicio (SLA) es un contrato entre un proveedor deservicios de red y un cliente, en el que se especifica, usualmente en trminos medibles, loque los servicios del proveedor de red proporcionar. Cada vez mas frecuentemente, lasgrandes empresas han adoptado la idea de incorporar un acuerdo de nivel de serviciopara sus contratos. Algunos indicadores que un SLA puede especificar son: Qu porcentaje de tiempo los servicios estarn disponibles? El nmero de usuarios que puede servir al mismo tiempo una conexin. Parmetros de rendimiento especficos, cuyo valor real ser peridicamente comparado con un objetvo especfico. El calendario para la notificacin con anticipacin de los cambios de red que pueden afectar a los usuarios. Un servicio de mesa de ayuda con tiempo de respuesta para las diferentes clases de problemas que puedan presentarse al cliente y procedimiento de escalamiento. Metodologa estadstica que se aplicar. 47| 48. Disponibilidad de un Servicio MultipuntoUn tipo de servicio de conectividad, constituye una red de datos de tipo multipunto, la quese puede considerar, para los efectos del clculo de disponibilidad y compromisoasociado, topolgicamente compuesta como una red tipo estrella, donde existe un sitiocentral cuya importancia relativa para la interconectividad es mucho mayor que el resto depuntos sucursales.Como se vi anteriormente, la disponibilidad tiene su mayor significado estadstico paraintervalos de largo plazo, recomendndose al menos 1 ao. Sin embargo, para un SLA elvalor de la disponibilidad mensual tiene mucho mayor sentido para el cliente. Enconsecuencia, para un acuerdo contractual de servicio, una buena opcin, es ofrecer unadisponibilidad mensual que est sujeta a retribucin o multa, definida como la del peormes. Tambin, al cliente le interesa ms que la disponibilidad, el MTBF y el MTTR, estoes, la frecuencia en que se le presentan fallas y el tiempo de restitucin. La base de datospara el anlisis debe ser un registro formal de las notificaciones de interrupcin delservicio realizada pr el cliente: la boleta de reclamos o ticket.Por lo general, el cliente no desea una disponibilidad de su red de servicios, sino msbien, le interesa una disponibilidad por extremo de servicio, por lo tanto, un anlisis comored, tiene slo una finalidad de informacin complementaria. Para el clculo de este

ltimovalor se tiene la misma problemtica para la cual se plante la frmula f.21.Como ejemplo un servicio de una matriz y 10 oficinas sucursales, registran ladisponibilidad de la tabla siguiente. Para esos datos la disponibilidad promedio es de un99,953%, y si se utiliza una condicin de ponderacin, por la capacidad comprometida, seobtiene una disponibilidad de 99,086%. Tener presnete lo entes mencionado, de que estacifra slo tiene una validez administrativa o contractual, ya que dimensionalmente oestadsticamente en la confiabilidad no tiene significado. Capacidad I I A {Mbps} {Hr} Ponderada {%} Matriz 10 0,2 2 99,972% Sucursal 1 2 0,5 1 99,931% Sucursal 2 2 1,1 2,2 99,847% Sucursal 3 1,2 0,4 0,48 99,944% Sucursal 4 0,5 1,4 0,7 99,806% Sucursal 5 2 0,1 0,2 99,986% Sucursal 6 2 0 0 100,000% Sucursal 7 2 0 0 100,000% Sucursal 8 1,2 0 0 100,000% Sucursal 9 1,2 0 0 100,000% Sucursal 10 0,5 0 0 100,000%Como siempre el punto de mayor vulnerabilidad es el acceso, por ello hay clientes quecontratan un doble acceso con diversidad de ruta e ingresos a sus depemdencias, enespecial en sus instalaciones de matriz. Para ello el operador debe estar preparado paraque sus productos permitan que en la red de acceso, sean stos nodos DSLAM o nodosMPLS dispongan de equipos redundantes para esta clase de clientes de altadisponibilidad. 48| 49. Para el cliente un SLA, no slo est relacionado con el tema de disponibilidad, por lotanto, es comn que se incorporen otras medidas de calidad tecnolgica, que se registranen base a parmetros tales como retardos, prdidas de paquetes, tasa de errores, etc.Ello ha llevado a que tambin se ofrezcan productos relacionados con estos conceptos, alponer a disposicin del cliente las mediciones en lnea de tales mediciones. Un SLA debeser evaluado con relacin a las multas por incumplimiento, evaluar los riesgos, hacerestimaciones probabilsticas de cumplimiento y los costos a incurrir para asegurar unamayor confiabilidad. 49| 50. ConclusinUn sistema podr ser considerado en cuanto a calidad operacional como bueno s suMTBF >>> MTTR, y a la vez su MTBF nos pronosticar que la probabilidad de que vuelvaa fallar, ser en un intervalo de tiempo esperado, que se podr pronosticar de acuerdo almodelo de confiabilidad de Lusser-Weibull.Se ha intentado establecer la diferencia entre confiabilidad y dispobibilidad, como astambin las metodologas de anlisis tanto de datos como del comportamiento de lasredes y sistemas, para detectar posibles mejoras.Tambin hemos mencionado que la calidad comienza desde la concepcin de unproyecto de red o del diseo de un sistema o del servicio a un cliente, por ello debeestimarse desde sus inicios y considerarse las condiciones para alcanzarla, con sistemasde respaldo, redundancia, buena capacidad de energa y clima, repuestos adecuados,capacitacin y entrenamiento profundo.A fin de formalizar todos estos aspectos, ISO 9001 tambin platea un Plan deAseguramiento de Calidad (PAC) para definir y describir todos aquellos requisitos que laempresa ha de cumplir, para desarrollar con eficacia y correccin de las tareas deasistencia tcnica en el control o ejecucin de la obra u proyecto, objeto de undeterminado contrato. Est orientado fundamentalmente a las reas de ingeniera deproyectos, y contempla un: A.MANUAL DE CALIDAD 1.- Objeto 2.- Fuentes Documentales 3.- Descripcin del Proyecto 4.- Organizacin General de la Asistencia Tcnica 5.Organizacin del Personal 6.- Recursos Materiales 6.1.- Oficina de Obra 6.2.Material de topografa e informtica 6.3.- Calibracin de los equipos de medida 6.4.- Vehculos 7.- Sistemas Documentales Propuestos 8.- Archivo de Documentos 9.- Revisin Interna de las Actuaciones 10.- Revisin Interna de la

Documentacin Emitida 11.- Auditorias 12.- Descripcion de Procedimientos 12.1.- Introduccin 12.2.- Definiciones 12.3.- Listado de Impresos B.Procedimientos Especificos - Procedimientos Generales de Inters Procedimientos TcnicosPor ltimo debe tomarse consciencia, de que la disponibilidad compuesta de los servicios,en que aportan todos los elementos de red, es muchsimo mas baja que lasdisponibilidades unitarias, por mucho que se hayan diseado para 5*9. <<<<<*****>>>>> 50| 51. Referencias de Documentos de Consulta1. Estadstica bsica aplicada al mantenimiento, James Massiah, Monografas.com2. Electric power distribution system engineering cap.11 - Turan Gonen - McGraw-Hill.3. Carrier Grade Servers in Telco Evironment, Ren Wu, Intel 20024. Field, Data Collection and Evaluation on the Performance of Equipments, Networks and Service, ITU-T Rec. E8805. Evaluacin de Sistemas Tolerantes a Fallos, Rafael J. Martnez,Universidad de Valencia6. Mantenibilidad, Jezdimir Knezevic, ISDEF, 1996, Madrid7. Prediction Of The System Availability Using Simulation Modeling, Alexej Chovanec, Faculty of Special Technology / Alexander Dubcek University in Trencin, 20088. Mantenimiento Centrado en la Confiabilidad, John Moubray, 20049. El Arte de Mantener, R. Pascual, DIMEC, U. Ch.10. Proactive Fault Handling, Felix Salfner and Miroslaw Malek, Institut fr Informatik-Humboldt Universitt zu Berlin11. Reliability of Fiber Optic Cable Systems: Buried Fiber Optic Cable, Optical Groundwire Cable All Dielectric, Self Supporting Cable, ALCOA FUJIKURA LTD., Mayo 200112. Ensayos Acelerados de Componentes Pasivos, Sonia Linio Bragado, E.U.I.T. Telecomunicacin, 2000.13. Availability models for protection techniques in WDM networks, Daniele Arci et al, Dept. of Electronics and Information, Politecnico di Milano14. Operation in the wearout region, L. HaackeOtras consultas adicionales en

web:http://canteach.candu.org/library/20040109.pdfhttp://www.weibull.com/http://www.dacs.dtic.mil/about/services/goel.shtmlhttp://citeseer.ist.psu.edu/136325.htmlhttp://www.relex 0470094885,descCdtableOfContents.htmlhttp://www.relex.com/resources/prmodels.asphttp://www.itl.nist.gov/div898/handbook/apr/section2/apr23.htmhttp://www.apcmedia.com/salestools/SADE5TNQYW_R0_EN.pdfhttp://www.corning.com/docs/opticalfiber/wp5049_06-

01.pdfhttp://www.availability.com/http://www.solomantenimiento.com/m_confiabilidad_crm.htmhttp://www.confiabilidad.net/http://ranger.uta.edu/~das/5347.htmlhttp://www.securel NetworkManagement.htmlhttp://www.barringer1.com/index.shtmlhttp://www.e-

reliability.com/Index.htmhttp://www.fundibeq.org/metodologias/herramientas/diagrama_de_pareto.pdfhttp://www.ongconcalidad.org/pareto.pdfhttp://www.monografias.com/trabajos1 ishikawa/paretoishikawa.shtmlhttp://www.mappinginteractivo.com/plantilla.asp? id_articulo=980&titulo=&autor=&contenido=&tipo=Se termina de preparar en: Agosto de 2009 51| 52. ANEXOEjercios, tomado de Confiabilidad de Sistemas de Distribucin Elctrica PUCVProblemas y soluciones1 - Un transformador tiene una probabilidad de falla de una falla en 2500 aos. Pf = 1 / 2500 = 0.0004 = 4.E-4 fallas por ao La confiabilidad es: Rf = 1 0.0004 = 0.9996 La reparacin de la falla demora (en promedio) 1 semana 7 / 365 de ao. La probabilidad de no contar con el transformador en servicio es entonces Pr = (7 / 365) * (1 / 2500) = 0.0000078 = 7.8E-6 de ao sin servicio La confiabilidad de operacin es: Rr = 1 0.0000078 = 0.9999922 del ao en servicio2 Un cable tiene una probabilidad de falla de 1 falla por milla cada 100 aos, siendo 1 milla = 1.609 km, entonces una falla por km cada 100 / 1.609 = 62.15 aos. El cable tiene una longitud de 3 km, cuales seran los valores que caracterizan la falla? Pf = 3 / 62.15 = 0.048 = 4.8E-2 fallas por ao = 1 / 20.7 una falla cada 20.7 aos La

confiabilidad es: Rf = 1 0.048 = 0.953 La reparacin de la falla demora (en promedio) 1 dia 1 / 365 de ao. La probabilidad de no contar con el cable en servicio es entonces Pr = (1 / 365) * (3 / 62) = 0.000132 = 1.32E-4 de ao sin servicio La confiabilidad de operacin es: Rr = 1 0.000132 = 0.99987 del ao en servicio Comparando estos resultados entre transformador y cable se tienen las siguientes relaciones Pf = 0.0004 / 0.048 = 0.0083 = 120 Rf = 0.9996 / 0.953 = 1.049 = 0.953 Pr = 0.0000078 / 0.000132 = 0.059 = 16.92 Rr = 0.9999922 / 0.99987 = 1.0001 = 0.999883 La alimentacin de la carga se realiza a travs de un cable y un transformador,interesa evaluar los valores que caracterizan el sistema. La probabilidad de falla es la probabilidad de ocurrencia de cualquiera de dos hechos independientes La confiabilidad es la no ocurrencia de cualquiera de los dos hechos Rf = 0.9996 * 0.953 = 0.952 = (1 0.0004) * (1 0.048) = 1 (0.0004 + 0.048) Pf = 1 - 0.952 = 0.048 La probabilidad de no contar con servicio y la confiabilidad de operacion resultan Rr = 0.9999922 * 0.99987 = (1 0.0000078) * (1 0.000132) = 1 (0.0000078 + 0.000132) Pr = 0.00014 Los resultados obtenidos muestran que la probabilidad de falla repite pacticamente la del elemento de mayor probabilidad (en este ejemplo el cable)4 Veamos ahora la probabilidad de falla de dos cables en paralelo, lgicamente tambienhay elementos de maniobra que en caso de falla de un cable ponen en servicio el otro, oestando ambos en servicio separan al que sufre la falla. Todo funciona bien, y loselementos de maniobra no tienen ninguna probabilidad de falla (esto es una mentira, peropermite simplificar la solucin!) 52| 53. La probabilidad de falla es la probabilidad de ocurrencia de ambos de dos hechos independientes La confiabilidad es la no ocurrencia de ambos hechos Pf = 0.048 * 0.048 = 0.0023 Rf = 1 0.0023 = 0.9977 La probabilidad de no contar con servicio o la confiabilidad de operacin resultan Pr = 0.000132 * 0.000132 = 1.7E-8 Rr = 1 1.7E-8 La probabilidad de falla del conjunto de dos cables se compara con la de un cable solo y se observa la notable reduccin, Pf = 0.0023 / 0.048 = 0.048 Pr = 0.000000017 / 0.000132 = 0.0001325 Se pone la doble alimentacin del transformador, y se observa el incremento deconfiabilidad que se presenta en la alimentacin a los usuarios en comparacin con elcaso de un solo cable alimentador Para dos cables en paralelo: Pf1 = 0.0023 de falla de los dos cables en paralelo Pr1 = 1.69E-08 de perdida del servicio de los dos cables Y un transformador Pf2 = 0.0004 de perdida del transformador Pr2 = 7.67123E-06 Perdida del servicio por cables o transformador Pf = 0.0027 de falla de ambos cables o transformador Rf = 0.9973 Pr = 7.68813E-06 Rr = 0.999992312 confiabilidad 53|

Search

Follow us on LinkedIn Follow us on Twitter Find us on Facebook Find us on Google+ Learn About Us About Careers Our Blog Press Contact us Help & Support Using SlideShare SlideShare 101 Terms of Use

Privacy Policy Copyright & DMCA Community Guidelines SlideShare on mobile Pro & more Go PRO New Business Solutions Developers & API Developers Section Developers Group Engineering Blog Blog Widgets 2013 SlideShare Inc. All rights reserved. RSS Feed ENGLISH English Franais Espaol Deutsch

S-ar putea să vă placă și