Sunteți pe pagina 1din 11

INSTITUTO TECNOLGICO DE COSTA RICA ESCUELA DE INGENIERA EN COMPUTACIN ADMINISTRACIN DE LA FUNCIN DE INFORMACIN

Plan de Contingencia
Empresa MovilSoft

Elaborado por: Diego Rojas Chacn Eduardo Gamboa Urea Manuel Murillo Snchez

01/10/2012

Instituto Tecnolgico de Costa Rica Plan de Contingencia MovilSoft

Plan de Contingencia
Introduccin
MovilSoft es una empresa costarricense dedicada a desarrollar, implementar y mantener soluciones de software para cualquier plataforma, as como servicios computacionales en la nube con sistemas y herramientas de alta tecnologa para empresas. Los sistemas de informacin son esenciales para la empresa, pues adems de ofrecer servicios en la nube a sus clientes, quienes requieren que ese servicio est siempre disponible y funcionando de una manera ptima, la empresa tambin apoya sus procesos de desarrollo, administrativos y financieros en esos sistemas de informacin y en plataformas tecnolgicas que son vulnerables a amenazas de origen natural, humano y tcnico. Lo anterior evidencia la necesidad de que MovilSoft cuente con un plan de contingencia de tecnologas de informacin y comunicaciones que permita mitigar el impacto que pueda generar cualquier eventualidad que ponga en riesgo la integralidad y acceso a la informacin de la empresa tanto en medio fsico como electrnico. Para esto se necesita hacer partcipes a todos los miembros de la empresa, con el fin de lograr una mayor capacidad de respuesta ante cualquier eventualidad que se pueda presentar. El presente documento contiene los detalles del plan de contingencia de tecnologas de informacin de la empresa MovilSoft.

Informacin de Soporte
Objetivos del plan
Objetivo General Establecer el plan de contingencia que permita el desarrollo gil y estructurado que garantice la continuidad de las operaciones de Tecnologas de Informacin y Comunicaciones de la empresa MovilSoft y del cual tengan conocimiento todos los miembros de la empresa. Objetivos Especficos 1. Proteger al personal y activos corporativos. 2. Asegurar la continuidad de las operaciones. 3. Garantizar la reanudacin de los procesos crticos dentro de los mrgenes de tiempo tolerables. 4. Minimizar el proceso de toma de decisiones durante una contingencia. 5. Reducir los efectos negativos ocasionados por el caos. 1

Instituto Tecnolgico de Costa Rica Plan de Contingencia MovilSoft

6. Cumplir con requerimientos legales, contractuales y gubernamentales al aplicar las medidas de contingencia. 7. Eliminar la necesidad de desarrollar nuevos procedimientos durante la contingencia. 8. Minimizar la posibilidad de prdida de informacin crtica para el servicio. 9. Mantener el servicio al cliente.

Alcance del plan


El plan de contingencia aqu especificado comprende los siguientes aspectos: Activacin y notificacin de eventos que ocurran. Aseguramiento de la continuidad del servicio por falla de continuidad del fluido elctrico, falla de los sistemas de informacin o falla del servicio de internet. Recuperacin de desastres: Recuperacin de informacin de los sistemas. Actividades de reconstitucin para los riesgos identificados.

Anlisis e identificacin de riesgos y amenazas A continuacin se enlistan los riesgos y sus factores contemplados dentro del alcance del plan: Riesgo/Amenaza Fallas en el equipo Accin de virus Fallas por tensin Fuego Terremoto Factor Alto Medio Alto Medio Medio

Impacto en el negocio
Cese de operaciones de desarrollo. Interrupcin del servicio en la nube. Prdidas econmicas. Prdida de confianza de lo clientes. Prdida de clientes. Imposibilidad de realizar tareas administrativas como facturacin. Imposibilidad de admitir pedidos. Impacto negativo en el tiempo de desarrollo.

Supuestos
El Director del Departamento de Tecnologas de Informacin revisa y aprueba todos los aspectos incluidos en este plan de contingencia. La empresa cuenta con los recursos necesarios para la ejecucin de las acciones propuestas en este plan de contingencias. El plan de contingencias es conocido por cada miembro de la organizacin, independientemente de su posicin dentro de la empresa. 2

Instituto Tecnolgico de Costa Rica Plan de Contingencia MovilSoft

Fase de activacin y notificacin


Criterios de activacin
Riesgo/Amenaza Fallas en el equipo Criterios de activacin Comportamiento inesperado del equipo. Apagado o suspensin repentina. Problemas de conexin a la red Local o Internet. Sonidos extraos del equipo. Comportamiento inesperado del sistema operativo de los dispositivos/equipo. Aumento de tiempo de iniciacin de los sistemas. Sectores de disco duros daados. Aparicin de mensajes de error no comunes. Cambio en caractersticas de archivos. Anomalas en teclado, video, RAM. Reduccin considerable de espacio en disco. Aparicin de programas residentes en memoria desconocidos. Oscilaciones de tensin elctrica. Apagado y encendido inmediato de equipo. Equipo daado por tensin. Humo. Sobrecalentamiento de equipo. Corto circuitos. Movimiento telrico.

Accin de virus

Fallas por tensin

Fuego

Terremoto

Instituto Tecnolgico de Costa Rica Plan de Contingencia MovilSoft

Procedimientos de notificacin
En todos los riesgos descritos anteriormente, se avisar primero, a las autoridades correspondientes, con tal de bajar, al menos en lo posible, los riesgos que se tengan en la estructura o equipo de las empresas. En el caso de las fallas de equipo (las cuales pueden ser variadas), se le notificar al departamento de TI para que tomen las acciones pertinentes. Primero, se enviar un mensaje automtico (si el error es detectado por medio de algn programa de monitoreo) o de manera manual, cuando un usuario advierta el problema. Luego de esto, se enva un mensaje a los usuarios, para advertir que sus actividades estn en riesgo, y si es necesario, evacuen el rea, esto en caso de que la estructura se vea comprometida.

Gestin y evaluacin de imprevistos


En el caso de que surja algn evento, del cual no se tenga documentacin del mismo, se avisar al departamento correspondiente para poder encontrar una solucin eficaz, de manera rpida y sin comprometer las actividades cruciales del negocio. Para poder llevar esto a cabo, y recuperar los equipos que se han daado, en especial, la informacin contenidas en ellos, se harn respaldos peridicamente, adems de tener equipos en modo de fallo, los cuales entraran en accin en el momento que el dispositivo principal falle. Esto para poder continuar con los trabajos crticos de la empresa, mientras se soluciona el problema principal.

Fase de recuperacin
Secuencia de actividades de recuperacin
A continuacin se detalla la secuencia de actividades de recuperacin a realizar en caso de que ocurra cada una de las amenazas descritas en la seccin de informacin de soporte: En caso de fallas en el equipo (Tipo de Riesgo Alto) Proceder de la siguiente manera: 1. 2. 3. 4. 5. 6. 7. Traslado de operaciones a otras dependencias fsicas que estn en buen estado. Revisar el estado fsico del equipo problemtico. Revisar el entorno o ambiente donde est ubicado el equipo. Si todo parece estar bien, realizar pruebas especficas al equipo. Reportar el equipo daado. Remplazar el equipo en un lapso de 15 minutos. Reanudar operaciones utilizando el nuevo equipo.

Instituto Tecnolgico de Costa Rica Plan de Contingencia MovilSoft

En caso de Infeccin por Accin de Virus (Tipo de Riesgo Medio) La empresa cuenta con un Software de antivirus que es el MCAfeee versin 8 para los servidores y Kasperski 2011 para las estaciones y se pone en lnea a todos los servidores y PC desde una carpeta publica, realizando esta accin, mediante un correo electrnico que el usuario ejecuta con un simple botn del Mouse, tambin se enva, esta actualizacin a las unidades, as como las recomendaciones de seguridad sobre el tema. Sin embargo en caso de infeccin masiva de virus se debe de seguir el siguiente plan de contingencia. Si la infeccin es va red a los Servidores y PCS, proceder de la siguiente forma: 1. Revisar las alertas que enva el antivirus instalado en forma peridica y ver el tipo de virus que esta propagando. 2. Detectar el origen de la infeccin del virus (mediante el mismo software les indica el usuario y archivos). 3. Desconectar de la red el equipo que esta infectado y que est renviando el virus. 4. Comprobar si el usuario ha actualizado el ltimo DAT. 5. Comprobar si tiene carpetas compartirlas. compartidas en forma total y proceder a no

6. Proceder a limpiar los archivos con la opcin de: LIMPIAR o CLEAN INFECTED FILES NO CON DELETED por que esta opcin podra borra archivos del sistema operativo, quedando inutilizada la maquina. 7. Una vez limpio el equipo, proceder a realizar una copia de Seguridad solo de la DATA. 8. Si no se lograra limpiar en forma satisfactoria, el equipo, por que los archivos del sistema operativo han sido daados se proceder a formatear el disco reinstalndole el sistema operativo y transfiriendo la data de seguridad, que se tiene en caso de Servidores y de los buzones personales en caso de PC, donde se custodia la data de los usuarios. Si la infeccin es por lista de correo proceder de la siguiente forma: Seguir los pasos anteriores: 8..1. Coordinar con los soporte de las unidades de negocio, para realizar la accin coordinada.

Instituto Tecnolgico de Costa Rica Plan de Contingencia MovilSoft

8..2. Entrar al Servidor donde esta instalado el Correo a los servicios y deshabilitar el servicio de Message Transfer Agent para que no siga reenviando los correos. 8..3. Proceder a eliminar el mensaje que se encuentra en cola y que esta infectado. 8..4. Proceder a pasar el antivirus con las opciones indicadas. En Fallas por tensin (Tipo de Riesgo Alto) La empresa a pesar de que cuenta con sistemas de proteccin elctrica como son, pozos a tierra, lneas filtradas e independientes, para sus equipos de computo y de comunicaciones, en cada uno de sus locales, adicionalmente a que tambin se cuenta con otros tipos de proteccin como son los sistemas de reserva de energa UPS, (stand by) y supresores de pico para las PC y estabilizadores en algunos casos, etc. Sin embargo muchos de estos locales quedan en lugares donde la tensin no es de la mejor calidad caso de la Sede Principal, lugares donde se registran continuas oscilaciones, fluctuaciones de tensin etc. eventos que muchas veces nos han malogrado equipos, debiendo de expresar nuestra queja contra la calidad de proteccin interna que tienen los equipos los cuales son muy sensibles, requiriendo sistemas de proteccin mas complejos y caros para la proteccin de estos; estos equipos de proteccin ya han sido solicitados pero no se compran en la actualidad, tales como UPS TRUE ON LINE y no STAND BY que son los que actualmente se tiene, transformadores de aislamiento, etc. En caso de presentarse fallas por tensin se deber proceder de la siguiente forma: Fluctuaciones Son fallas que se presentan como parpadeos constantes, de la energa, causando problemas en las instalaciones internas, llegando a malograr equipos de cmputo si no se tiene las siguientes precauciones: 1. Si hubiere fluctuaciones (flickers), constantes y prolongadas, proceder a apagar los equipos, previo aviso a los usuarios. Llamar a la ENOSA para identificar si la falla es del sistema general, o es un problema aislado, en el tablero de alimentacin de la sala de Cmputo. Si la falla es originada en el sistema general, se debe esperar a que se normalice, para proceder a encender los equipos Y conectar a los usuarios. Si la falla es originada por algn factor local, deber, proceder a revisar, lo elementos del tablero de la sala de Computo como son, fusibles, trmicos, cables flojos, o revisar si existe algn equipo que este ocasionando esta falla, si no se detecta localmente se debe de proceder a revisar la conexiones, en la Subestacin de donde se esta independizando la energa, revisar los bornes flojos u otros, Si aun 6

2.

3.

4.

Instituto Tecnolgico de Costa Rica Plan de Contingencia MovilSoft

no se detecta la falla ubicar si estn realizando algn trabajo con equipos de alto consumo, como son maquinas soldadoras, etc. y que se hayan conectado a la red de los equipos de computo por equivocacin. Corte de energa imprevisto Es el corte intempestivo del suministro de la energa elctrica, ocasionado por algn factor externo, como son (corte de la lnea de transmisin, accidentes, falla en los sistemas de proteccin, etc.) esta falla, tanto en el origen como al final (retorno de la energa) pueden causar daos a los equipos de computo por lo que se debe de seguir el siguiente procedimiento: 1. 2. Se activar la luz de emergencia Revisar la carga del UPS que alimentan los equipos, para los casos de corte de energa y determinar el tiempo que queda de energa auxiliar. Llamar a ENOSA, para identificar si la falla es del sistema general, o es un problema aislado, en el tablero de alimentacin de la sala de Cmputo. Por seguridad utilizar la energa que se tiene en los UPS para apagar los equipos en forma correcta. Si la falla es originada en el sistema general, se debe esperar a que se normalice, (siempre en coordinacin), para proceder a encender los equipos conectar a los usuarios. Si la falla es originada por algn factor local, deber, proceder a revisar, los elementos del tablero de la sala de Computo como son, fusibles, trmicos, cables flojos, o revisar si existe algn equipo que este ocasionando la falla, si no se detecta localmente se debe de proceder a revisar la conexiones, en la Subestacin de donde se esta independizando la energa, revisar los bornes flojos u otros, Si aun no se detecta la falla ubicar si estn realizando algn trabajo con equipos de alto consumo, como son maquinas soldadoras, etc., y que hayan conectado a la red ocasionando un corto circuito, y que no permita, restituir la energa, en forma normal. Si la falla es en el sistema Interconectado (general) se deber esperar que restituya la energa, mas un tiempo de unos 15 minutos ms, aproximadamente para que se estabilic y se puedan levantar los sistemas. Si la falla es local proceder a la reparacin, o remplazo, de los elementos que causaron la falla, para esto se debe de solicitar el apoyo de los tcnicos de emergencia, (se recomienda tener fusibles, y una llave trmica de respaldo de acuerdo a la capacidad de su tablero). Una vez reparada la falla se debe de conectar la energa para ver el comportamiento, de esta y no encender los equipos de 7

3.

4.

5.

6.

7.

8.

Instituto Tecnolgico de Costa Rica Plan de Contingencia MovilSoft

cmputo hasta despus de 15 minutos aproximadamente despus de la restitucin de la energa. En caso de Fuego (Tipo de Riesgo Medio) La empresa, a pesar de que cuenta con sistemas de proteccin, contra incendios, como son, extintores manuales, conexiones nuevas de energa (en algunas reas), equipos de bajo consumo, vas de acceso y de evacuacin, amplias, etc., sin embargo algn incidente involuntario, puede ocasionar, el inicio de un Incendio para lo cual se deber proceder de la siguiente manera: 1. Si el inicio del incendio se produce en horas de labores, deber de proceder a dar la alarma a todo el personal de la oficina y colindantes, y a los bomberos. 2. Desconectar las fuentes de alimentacin elctricas (sin perjuicio de exponer la vida). 3. Si el tiempo lo permite y si la fuente del siniestro esta lejos pero se puede propagar hacia los equipos principales de computo (servidores) deber retirar los equipos hacia un lugar seguro, discos o ultimas copias q tenga a la mano y (sin que esto signifique riesgo de exponer su vida). 4. Se deber proceder a sofocar el fuego utilizando el extintor correcto para el tipo de fuego, se adjunta un cuadro prctico como gua. En caso de terremoto (Tipo de Riesgo Medio) Se deber proceder de la siguiente manera: 1. 2. 3. 4. Cesar operaciones de la empresa de manera inmediata. Seguir el protocolo de la empresa para sismos y terremotos. Revisin de instalaciones de la empresa por parte de un experto en construcciones. Si las instalaciones estn bien y se da el visto bueno por parte del experto, revisar los sistemas de informacin de la empresa, los equipos y dems activos fsicos. En caso contrario se suspenden las operaciones de la empresa en el lugar por un periodo que ser comunicado por el director del departamento de TI. 5. Analizar y corregir fallas. 6. Reanudar operaciones.

Procedimientos generales de recuperacin


Una vez que la situacin haya sido controlada en su totalidad, se deben hacer un recuento de los daos, tanto a corto como a largo plazo, para poder averiguar que equipo se ha daado, y si es crtico su remplazo. Luego de esto, se remplazar el equipo y se cargar en el con los respaldos que se han guardado en periodos anteriores, retornando al sistema en un estado antes de que ocurriera el evento que

Instituto Tecnolgico de Costa Rica Plan de Contingencia MovilSoft

caus su prdida. Este punto tambin aplica si el dao se da en los datos almacenados dentro del equipo. Si el caso es que el equipo se apag durante la operacin, por cualquiera de las razones expuestas en los puntos de arriba, se procede a encender el equipo e iniciar los servicios necesarios, siempre y cuando, la situacin actual lo permita. Las acciones anteriores se harn siempre con el aval tanto del administrador de TI como con la aprobacin del gerente general, tomando en consideracin los factores de riesgos para el equipo o para los empleados de la compaa

Fase de Reconstitucin
En este apartado, se describir de manera general, como la empresa se va a recuperar de un desastre determinado.

Procesamiento actual
Se medir la capacidad del procesamiento de datos, dndole nfasis a que tan rpido se hacen las labores criticas de la empresa, ignorando los procesos no cruciales, o que no son de vital importancia para el negocio. Una vez determinado dicho valor, se analiza la posibilidad de que se necesite equipo nuevo, de manera que se mantenga la eficiencia que se tena antes del riesgo generado.

Pruebas
Se realizarn pruebas de rendimiento del sistema nuevo, para poder deducir el dao que se haya producido, de manera medible y comparable. Entre las pruebas que se harn son las siguientes: Dao Estructural: Se har una inspeccin visual preliminar, para poder ver si se vieron comprometidas partes del edificio, y si es posible repararlas a la brevedad. Pruebas de Corriente Elctrica: Se determinar si el flujo elctrico llega correctamente a todo el edificio, enfocndose en las reas primordiales del mismo. Pruebas de eficiencia de equipo: Se prueba el funcionamiento del equipo despus de que haya pasado el incidente, valorando si puede continuar operando con normalidad, o necesita un remplazo en un plazo determinado,

Notificaciones
Una vez pasado el problema, se proceder a notificar a las autoridades que corresponden, luego de verificar que todo se encuentra en un estado estable. Luego, se notifica al gerente general acerca del problema, sus posibles implicaciones, y el estado del equipo, tanto operativo, como de trabajo.

Instituto Tecnolgico de Costa Rica Plan de Contingencia MovilSoft

Adems de esto, se le estarn enviando notificaciones peridicas acerca del como se ha ido avanzando en la recuperacin de la empresa, y del momento en que se termine la recuperacin inicial. Obviamente, se informar a los empleados de la situacin interna, y de cuando podrn volver a sus operaciones, en caso de que el ambiente de trabajo no sea el mejor para realizar sus labores diarias.

Almacenamiento de datos
De ser posible, los datos sern almacenados en el mismo equipo que se tenan anteriormente. Esta posibilidad cambia en caso de que dicho equipo sea daado, y quede en estado inoperable (tal como se define en las pruebas realizadas). Si este es el caso, se procede a evaluar si los datos son crticos. Si este es el caso, se restaurar un respaldo en un equipo alterno y en un lugar distinto al actual. Esto para que se pueda recuperar o cambiar el equipo original. En caso de que no se pudiera conseguir algn equipo en un lugar distinto, se alquilar, por tiempo indefinido, hasta que se pueda adquirir el equipo equivalente al que la empresa tenia anteriormente.

10

S-ar putea să vă placă și