Sunteți pe pagina 1din 24

ANÁLISIS DE CAUSA RAÍZ DE FALLA

Aníbal Serna G.
Ingeniero Metalúrgico, M.Sc., Ph.D I.Q.
Mail: anibalsernag@gmail.com; jose.serna@odl.com.co

1. GENERALIDADES

Las metodologías de evaluación de integridad y confiabilidad operacional, basadas en el


riesgo, se implementaron a partir de los 1990´s en la industria del petróleo, con el
nombre genérico de “Risk and Reliability Management System – RRMS”[1]. Complementarias
al Análisis de Falla - FA, se desarrollaron el Análisis de Causa Raíz de Falla - RCA, la
Inspección Basada en Riesgo - RBI, el Mantenimiento Centrado en Confiabilidad - RCM, las
Funciones de Protección Instrumentadas - IPF, la Evaluación de Equipos y Componentes
por Condición y Propósito - FFS / FFP, Evaluación de Integridad y Vida Útil Remanente de
Equipos – LA / RLA.

El Análisis de Causa Raíz de Falla – RCA, se concibió como una metodología eficiente de
toma de decisiones para solución de problemas causados por fallas, generalmente en
equipos y componentes críticos. Es un proceso estructurado, consciente, enfocado y
analítico que permite identificar las causas responsables de las fallas. Es un método pro-
activo, capaz de prevenir la ocurrencia de fallas y podría considerarse como una
herramienta de mejora continua[2].

Dependiendo del campo de acción donde se origine el RCA, se ha clasificado en 5 tipos:

a) RCA – HSE, adaptado para la investigación de incidentes – accidentes, que afectan


la salud, la seguridad de las personas y al medio ambiente.
b) RCA – Manufactura, direccionado hacia el análisis estadístico del control y
aseguramiento de la calidad de productos en la industria
c) RCA – Proceso, dedicado al análisis del riesgo, a la seguridad del proceso y las
consecuencias de las fallas por procesos fuera de control
d) RCA – Ingeniería y Mantenimiento, enfocado a la solución de problemas y fallas de
equipos y componentes mecánicos.
e) RCA – Administrativo y Financiero, dedicado al análisis del cambio en los sistemas
administrativos y financieros de las empresas.

1
Aunque es muy diversa la aplicabilidad del RCA, existen principios generales compatibles
para definir un proceso estructurado, considerado universal, para la toma de decisiones y
solución del problema.

1.1 Análisis de Falla

Procedimiento sistemático de recolección y análisis de datos y hechos para encontrar el


¿cuándo?, ¿dónde?, ¿cómo? y ¿por qué? un componente estructural o sistema falló, con el
fin de evitar su recurrencia y prevenir fallas en componentes y sistemas similares[3].

En el análisis de falla, se utiliza el método forense de evaluación de la evidencia con


métodos científicos, herramientas e instrumentos de análisis, revisión de históricos,
registros y reportes de eventos e incidentes en la línea de tiempo. Se incluyen los factores
humanos como posibles causas determinantes de la falla.

1.2 Análisis de Sistemas

Evaluación interdisciplinaria de todas las partes que intervienen en un proceso. Todas las
partes están interconectadas, cada acción sobre alguna de las partes afecta las demás. Los
sistemas complejos se pueden subdividir en componentes simples y para el resultado, se
unen los análisis y las síntesis de cada uno.

1.3 Principios Generales del RCA[4]

 Con el objetivo de mejoramiento continuo, es más efectivo determinar la causa


raíz del problema que tratar los síntomas visibles del mismo.
 El Análisis de Causa Raíz, está basado en hechos y datos. Debe ser sistemático,
con hipótesis y conclusiones evidentes y documentadas.
 Las causas y la solución de los problemas rara vez son obvias. Usualmente, pueden
existir más de una causa raíz para un problema dado
 El análisis de causa raíz es confiable y eficaz, cuando existe una relación
inequívoca entre la causa y la definición del problema.
 El análisis de causa raíz es un metodología proactiva, utilizada para mitigar el
riesgo.

1.4 Aplicaciones del RCA

Existen innumerables aplicaciones del Análisis de Causa Raíz de Falla. Frecuentemente se


aplica en:

2
 Reducción de fallas crónicas, repetitivas.
 Fallas esporádicas que ocurren un vez pero con alto coto (consecuencia)
 Reducción de costos de mantenimiento
 Eliminación de cuellos de botella operacionales
 Mejora de la calidad de los productos
 Reducción del consumo de energía, etc…

2. PROCESO GENERAL PARA REALIZAR UN ANÁLISIS DE CAUSA RAÍZ DE FALLA

Todo análisis de causa raíz de falla se enfoca en 4 fases operativas, descritas en la Fig. 1,
donde se describen las actividades a realizar y los resultados o entregables de cada fase.
Adicionalmente, se debe incluir una fase administrativa, que consiste en la elaboración de
planes de acción, seguimiento y verificación de resultaos en campo.

RCA
GENERALIDADES DEL PROCESO: “SOLUCIÓN DEL PROBLEMA”
FASES DESCRIPCIÓN PASOS

1. REGISTRO DE - REGISTRO INFORMACIÓN RELEVANTE 1. REPORTE DE INCIDENTE


- DECIDIR SI REQUIERE RCA 2. CLASIFICACIÓN
INCIDENTES - NIVEL DE LA INVESTIGACIÓN

3. IDENTIFICACIÓN DE
2. ANÁLSIS DE - DIVIDIR SITUACIÓN COMPLEJA EN
PROBLEMAS
PROBLEMAS PARTES MANEJABLES
4. DEFINICIÓN DE
- R/ CUÁL ES EL PROBLEMA?
PROBLEMAS

3. ANÁLISIS DE 5. ANÁLISIS DE POSIBLES


¿PORQUÉ? CAUSAS
POSIBLES 6. CONFRONTACIÓN DE DATOS
CAUSA RAÍZ BÚSQUEDA SISTEMÁTICA DE CAUSAS 7. VERIFICACIÓN DE CAUSAS

4. DESARROLLO - SELECCIONAR ALTERNATIVA BALANCEADA 8. IDENTIFICAR DECISIÓN


9. SELECCIÓN DE CRITERIOS
DE UNA - ELIMINAR CAUSA SIN CREAR NUEVOS Ó 10. SOLUCIONES ALTERNAS
SOLUCIÓN PEORES PROBLEMAS 11. ANÁLISIS DE DECISIONES

5. PLANES DE ACCIÓN Y SEGUIMIENTO – VERIFICACIÓN DE RESULTADOS EN CAMPO

Figura 1. Diagrama esquemático de las etapas, actividades y herramientas utilizadas para


realizar un RCA

3
2.1 FASE I. REGISTRO DE INCIDENTES

En esta Fase, se describen y se analizan los reportes de incidentes, se cuantifican los


riesgos materializados, se clasifica el nivel y la magnitud de la investigación o alcance del
RCA y se conforma el equipo de trabajo, con asignación de roles, responsabilidades, con
total apoyo gerencial.

2.1.1 Reporte de Incidentes

Todo incidente debe ser reportado. En las empresas, el reporte inicial está a cargo del área
de HSE, quienes utilizan formatos específicos para detallar lo ocurrido, con los datos que
lo describen (Qué pasó?, Cómo?, Cuándo?, Dónde?, Por qué?) y la matriz de riesgo para
valorar el impacto del mismo.

2.1.2 Valoración y clasificación del incidente

Para la valoración del riesgo materializado se utiliza una matriz similar a la mostrada en la
Fig. 2., donde se describe la frecuencia de falla y la consecuencia. Dependiendo de la
consecuencia, se define el equipo investigador que conducirá el taller de RCA y el nivel de
investigación.

REFINERÍA
REFINERÍA

Figura 2. Matriz de Análisis de Riesgo – RAM, elaborada para una refinería de petróleo.

4
2.1.2.1 Conformación del Equipo de Trabajo
La integración de un equipo de trabajo interdisciplinario es fundamental para el éxito de
un Taller de RCA. El nombramiento de los integrantes debe obedecer a una directriz
gerencial, con respaldo administrativo y representatividad de los intereses corporativos. El
equipo básico de trabajo estaría conformado por:

- 1 Facilitador (Manejo de software aplicado – Aseguramiento de la calidad)


- 1 Profesional de proyectos – Especialista mecánico / materiales
- 1 Profesional de operaciones – Especialista en procesos
- 1 Profesional de mantenimiento – Especializado en el tema de análisis
- 1 Supervisor / Operador de campo – relacionado con el tema de análisis
- 1 Supervisor / Operador de tablero – relacionado con el tema de análisis
- 1 Profesional especialista en Electricidad – Instrumentación y Control

Los perfiles, roles y responsabilidades para un RCA de la falla de un tanque de


almacenamiento de hidrocarburos se detallan en la Tabla 1.

Tabla 1. Roles, perfil y responsabilidades del equipo básico para un taller de RCA

ROL PERFIL RESPONSABILIDADES

Facilitador Ingeniero / Supervisor con  Orientar el análisis de acuerdo con


experiencia en Gestión de la metodología probada y adoptada
Activos, plantas de proceso y por la Corporación
transporte de fluidos,  Mantener el interés y ritmo del
Conocimiento en: taller, evitar las discusiones que no
- Metodología de análisis y agreguen valor
solución de problemas  Llevar un registro de las preguntas,
- Modos de falla y MTBF dudas o requerimientos técnicos y
administrativos. Direccionar las
- Conocimiento de la
preguntas y respuestas a las
metodología RRMS
autoridades correspondientes.
- ORMS (Sistema de Gestión
 Acompañar a los especialistas en la
de la Confiabilidad
búsqueda y selección de la
Operacional
información.
- Gestión de Activos – PAS 55
 Realizar el informe final y presentar
- Gestión de competencias y
los resultados del taller
recursos humanos.

Profesional de - PMP - PMI  Evaluar e interpretar la información


proyectos - Metodología de maduración técnica contenida en planos de

5
de proyectos de la ingeniería
Corporación  Comparar la información de las
- Especificaciones de normas y estándares con las de
materiales y equipos construcción
- Mejores prácticas de diseño  Verificar especificaciones técnicas
e ingeniería

Profesional de - Transporte de  Conocer los P&ID de la planta


operaciones hidrocarburos  Conocer los Diagramas de flujo, de
- Almacenamiento de proceso y Diagramas Grandes de
hidrocarburos Control
- Procesamiento de  Conocer la operación del tema de
hidrocarburos análisis
- Blending de hidrocarburos  Participar activamente en la
- Mecánica de fluidos realización del análisis, de acuerdo
con la metodología
- Fenómenos de transporte
 Proponer oportunidades de
mejoramiento.

Profesional de - Métodos de arranque y  Conocer los diferentes tipos y


mantenimiento paradas de planta (SU/SD) modos de falla
- Métodos de inspección de  Establecer mediciones del Tiempo
equipos y RBI Medio entre Fallas en equipo
- Elaboración de planes de rotativo
mantenimiento  Explicar los diferentes mecanismos
- Reparación y de falla en equipos de proceso
mantenimiento de equipos  Participar activamente en la
de proceso realización del análisis, de acuerdo
- Evaluación de integridad y con la metodología
aptitud para el servicio  Proponer oportunidades de
mejoramiento.

Supervisor / - Procedimientos de  Conocer las especificaciones de


Operador de operación del equipo o diseño relacionadas con parámetros
campo componente objeto del operacionales
análisis  Conocer las ventanas operativas
- Normas y estándares  Conocer los procedimientos de
relacionados operación en emergencias y fuera
- Certificación de operadores de control
de campo  Conocer la seguridad operacional,
alarmas y sistemas de seguridad

6
Supervisor / - Procedimientos de  Conocer las especificaciones de
Operador de operación del equipo o diseño relacionadas con parámetros
Tablero componente objeto del operacionales
análisis  Conocer las ventanas operativas
- Normas y estándares  Conocer los procedimientos de
relacionados operación en emergencias y fuera
- Certificación de operadores de control
de tablero  Conocer la seguridad operacional,
alarmas y sistemas de seguridad
 Conocer los sistemas de control y
manejo de consolas operacionales
 Conocer los protocolos de
comunicaciones, pare y arranque de
planta y equipos

Profesional - Sistemas de redes eléctricas  Especificar ventanas operacionales


especialista en - Sistemas de protección y y sistemas de control
Electricidad – control de equipos y  Especificar equipos de seguridad
Instrumentación procesos operacional
y Control
- Alarmas y dispositivos de  Diseñar controles operacionales
seguridad  Definir procedimientos de
- Comunicaciones y señales seguridad y control operacional
análogas y digitales

2.1.2.2 Inducción – entrenamiento


Es necesario realizar una inducción sobre la metodología a utilizar, sobre los objetivos y el
alcance del RCA, para todos los participantes, con el propósito de unificar criterios de
evaluación y garantizar la consistencia y calidad de los resultados del taller. La inducción
deberá ser orientada por el facilitador.

2.1.2.3 Recolección de Datos


Es muy importante iniciar con la recolección de datos inmediatamente después de
ocurrido el incidente, para evitar la pérdida de evidencia. La información debe contener las
condiciones antes, durante y después del evento; personal involucrado con descripción de
la función que realizaban; parámetros operacionales y condiciones ambientales; muestras
físicas y registros fotográficos, diagramas, esquemas y planos de los componentes que
fallaron. Esta recolección de evidencias debe realizarse a pesar de la presión de
operaciones por restaurar las condiciones y colocar los equipos en servicio.

7
En la Fig. 3, se muestran las principales fuentes de información para la recolección de
datos: Sistemas de cómputo de los cuartos de control y del análisis operacional,
comunicaciones escritas, entrevistas personales, actas de reuniones y toma de decisiones
para el manejo del cambio, análisis de tendencias de parámetros operacionales y
comportamiento de sistemas.

RECOLECCIÓN DE DATOS

Figura 3. Fuentes de recolección de información para utilización en el RCA.

La información requerida para el inicio del taller se refiere a:

a) Históricos
- Históricos de diseño, procura, construcción, montaje. Esta información debe estar
contenida en el Dossier de construcción – precomisionamiento – comisionamiento
y puesta en operación del producto del proyecto.
- Histórico de operación. Incluye la información operacional desde la puesta en
marcha.
- Históricos de inspección – mantenimiento. Incluye los resultados de inspecciones,
reparaciones, cambios, alteraciones y modificaciones.
- Históricos de paradas y arrancadas, incluidas las paradas programadas, de
emergencia y temporales por falta de carga.
- Reportes de incidentes, requerimientos de seguridad operacional, indicadores de
desempeño de equipos, resultados de auditorías técnicas, ambientales y de
seguridad operacional.

b) Histogramas de falla
Los histogramas de falla, tal como el mostrado en la Fig. 4, facilitan la ubicación de
equipos y componentes críticos. Los equipos y componentes con mayor frecuencia de
daño, se denominan malos actores “Bad Actors”. Uno de los objetivos del RCA es
eliminarlos. Se debe considerar la necesidad de soporte especializado de laboratorios,
análisis de falla y ensayos no destructivos

c) Línea de tiempo de hechos e incidentes


La elaboración de un listado de hechos e incidentes, generalmente registrados en el
cuarto de control, con las acciones tomadas, las alarmas y señales detectadas, los
8
cambios realizados, las acciones de mitigación de daños, los trabajos de
mantenimiento documentados, los cambios en las especificaciones de diseño, cambios
o modificaciones en el proceso, todos deben relacionarse en una línea de tiempo.
Toda la información recopilada debe estar soportada en hechos y datos verificables y
reproducibles, incluidos los informes de campo, bitácoras de proceso, comunicaciones
físicas y digitales, tablas de datos y registros de control.

d) Manuales de operación y mantenimiento


Se deben incluir los procedimientos de operación, mantenimiento e inspección. Los
manuales de descripción de proceso, los catálogos de fabricante, las corridas de
prueba y aceptación con sus respectivos protocolos de entrega por el constructor.

HISTOGRAMAS DE FALLA

20 1. Aislamiento Térmico Zona de Convección


2. Lámina de la Carcaza (Z.R.,Z.C.)
3. Aislamiento Térmico Zona de Radiación
18
4. Cabezales (Asientos, Pernos, Soldadura de Sello)
5. Aislamiento Térmico Ductos de Chimenea
16 6. Refractario Olla de Quemadores
FRECUENCIA DE FALLA (1982-1996)

7. Pernos de Anclaje de Aislamiento Térmico


14 8. Zona de Convección Taponada/Sucia
9. Damper de Chimenea
10. Termocuplas (Rotura)
12
11. Boquillas de Pilotos y Quemadores
12. Refractario del Piso
10 13. Aislamiento Térmico Salida a Cabezales
14. Termopozos (Erosión)
8 15. Tubos Toma-Muestra de gases (Rotos)
16. Refractario de Chimenea (Agrietado)
17. Refractario de Mirillas
6
18. Lineas de Decoking (Bajo espesor)
19. Tubería de Zona de Radiación Fisurada
4 20. Linea de Transferencia
(Coquización/Taponamiento)
2 21. Tubería Cabina A, Zona de radiación
(Coquización)
22. Estructura Soporte Ducto-Chimenea
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
23. Tubería de Vapor de Sofocación
24. Tubería de Zona de Radiación (Bajo Espesor)
ELEMENTO / PARTE
25. Tubo Aleteado Deformado

Figura 4. Histograma de falla, determinado para un horno de viscorreducción

2.2 FASE 2. ANÁLISIS DEL PROBLEMA

Los problemas complejos se suelen dividir en partes más comprensibles o subsistemas. El


Análisis Sistémico, el Análisis de Negocios, la Ingeniería de Manufactura y la Arquitectura
de Empresas son ejemplo de estas metodologías. Lo importante en esta etapa es definir
claramente ¿cuál es el problema?. Se redacta una frase que define el escenario de falla, la
frecuencia comparativa de falla y la consecuencia.

9
2.2.1 Identificación del problema

La metodología más utilizada para identificar el problema es la lluvia de ideas, agrupando


los hallazgos del análisis de la información y relacionándolos con uno de los siguientes
elementos:
- Materiales y equipos
- Procedimientos
- Error humano
- Diseño e ingeniería
- Especificaciones y suministros
- Entrenamiento y competencias
- Administración
- Causas externas – Daños por terceros
- Fuerzas naturales

Los tres primeros están asociados a la realización de una tarea; los dos siguientes se
asocian con el aseguramiento de la calidad; los dos siguientes con la gestión de recursos
humanos y los dos últimos, están fuera del control directo. En consecuencia, la causa raíz
de un problema puede estar relacionada con una tarea, aunque la causa directa del
problema sea de carácter administrativo, dependiendo de la naturaleza del incidente.

La falla de un sistema de protección se constituye en el hecho del incidente, pero no es el


problema real. La condición o acción inesperada o no planeada que ocasionan el hecho se
constituye en el problema a resolver. Un ejemplo muy común es la ejecución de una labor
siguiendo un procedimiento incorrecto que genera un incidente, el problema no es el
operador, la causa real del problema es el procedimiento incorrecto. Sin embargo, si el
operador tuviera la competencia (experiencia, conocimiento y habilidad) para realizar la
tarea detectaría el error en el procedimiento. En este caso existe un problema directo con
la gestión del recurso humano.

2.2.2 Definición del Problema

Para definir el problema es necesario identificarlo, determinar la importancia del incidente


con la cuantificación de la consecuencia, determinar si es un problema recurrente o poco
común, si está relacionado con una tendencia detectada en el sistema de alarmas, con una
cultura de la seguridad o con la deficiencia de un sistema de control.

Para definir el problema se hace una lista de hechos, ya sea eventos de fallas de
mantenimiento, de operación, etc. Esta lista es la base del análisis, ya que todas las causas

10
de falla se deben poder verificar con los hechos listados en cada etapa. Se plantean
hipótesis adheridas a los hechos, circunscritas a unas fronteras físicas determinadas, con
puntos de vista de diferentes disciplinas.

2.2.3 Herramientas para analizar el problema

Las principales herramientas para identificar y definir un problema son:

2.2.3.1 Cronología de eventos


En la línea de tiempo se describen los eventos relacionados con la falla, tal como se
muestra en la Fig. 5. Estos eventos generalmente, se encuentran en los registros de los
cuartos de control.

INCIDENTE INCIDENTE INCIDENTE INCIDENTE


RELACIONADO 1 RELACIONADO 2 RELACIONADO 3 RELACIONADO 4

ENERO FEBRERO MARZO ABRIL MAYO

Figura 5. Descripción de eventos relacionados con la falla y con el tiempo.

2.2.3.2 Modelos de cambio


En los cuartos de control, se manejan las tendencias operacionales, se gestiona las
alarmas de seguridad y se monitorean las variables de acuerdo con las ventanas
operacionales. Las incursiones de variables por encima o por debajo de los valores
estipulados generan alarmas y cortes, tal como se muestra en la Fig. 6.

MODELOS DE CAMBIO
EVENTO 2
EVENTO 1 COMPORTAMIENTO
REAL

VENTANA OPERACIONAL

EVENTO 3

TIEMPO

Figura 6. Incursión de variables comparadas con la ventana operacional.

11
2.2.3.3 Asociación de eventos
En el taller de RCA, los diferentes eventos se asocian con un elemento, tal como se
muestra en la Fig. 7. Es una herramienta básica para poder definir y describir el problema.
Cuando se tiene claramente descrito y definido el problema, se dice que ya existe mucha
parte de la solución.

ASOCIACIÓN DE EVENTOS

MANTENIMIENTO OPERACIÓN
PROCESO
POLÍTICAS FUERA DE
SOBRECARGA
PLANEACIÓN CONTROL

PLANTEAR EL
PROBLEMA

IMPACTO

FLUIDO PERSONAS ADMINISTRACIÓN


AGRESIVO CAPACITACIÓN SUMINISTROS
CORROSIVO ENTRENAMIENTO COMPRAS

Figura 7. Agrupación de eventos con un elemento común principal

2.3 FASE 3. ANÁLISIS DE CAUSA RAÍZ

En esta fase, se identifican todas las causas posibles (acciones o condiciones) anteriores
que pudieron generar el problema, se plantean las hipótesis y se construyen los
diagramas causa – efecto. Existen hipótesis que pueden ser probadas y que están
relacionadas con el hecho, se convierten en posible causa raíz. En las comprobaciones,
surgen nuevos hechos o hipótesis que requieren ser probadas con apoyo de análisis
especializado, se convierten en causas probables y también, se dan hipótesis que no
pueden ser probadas y que no están relacionadas con el problema, estas no son causa del
problema y se descartan.

2.3.1 Análisis de causas posibles

Existen diferentes métodos para el análisis de causa raíz: Análisis Programático, Análisis
de Barreras, Análisis del Cambio, Árbol de Lógica – CRT (Current Reality Tree), Análisis del
Árbol de Falla, Resolución de Problemas, Análisis Estadístico o Deducción Bayesiana,
Análisis MORT, Evaluación de Desempeño Humano, Espina de Pescado, Análisis de Causa-
12
Efecto, Modo de Falla y Análisis de Efectos – FMEA, 5 Porqués?, Análisis de Problemas
Kepner-Tregoe, Diagrama de Ishikawa y Análisis del Pareto.

La selección apropiada del método a aplicar en la solución de un problema específico, es


un balance entre la competencia de los realizadores del RCA, la necesidad de la solución y
la economía del negocio.

2.3.2 Validación de Hipótesis

Identificar las razones por las cuales una acción o condición existe, cuál es el fenómeno
que genera la causa y cuál es el efecto. Si se elimina la causa con una acción correctiva
apropiada y se eliminan o mitigan los efectos recurrentes, la hipótesis es demostrable y
válida y se convierte en una causa posible.

2.3.3 Verificación de Causas

Resumir los hallazgos, listar las causas probadas y las acciones correctivas, clasificadas
por categorías o elementos principales, ayuda a seleccionar la causa más directa o la
Causa Raíz, aquella cuya acción preventiva elimina el efecto y la recurrencia. La selección
de la causa raíz debe ser enfocada y sistemática, debe explicar el Cómo? y el Porqué? de la
ocurrencia de la falla. Es importante describir la acción correctiva seleccionada para
prevenir la recurrencia, incluyendo las razones por las cuales fue seleccionada y como ella
puede prevenir la falla.

2.4 DESARROLLO DE LA SOLUCIÓN

La implementación y ejecución efectiva de acciones correctivas para cada causa probada,


reduce la probabilidad de ocurrencia de la falla e incrementa la confiabilidad y seguridad
del sistema analizado. El objetivo es seleccionar una alternativa de solución balanceada,
que elimine la causa raíz del problema sin crear uno nuevo y mayor.

2.4.1 Selección de Criterios

Se listan y definen los requerimientos mínimos o “deberes” y los requerimientos deseables


o “deseos” del análisis desde el punto de vista de que es lo que queremos lograr, evitar y
mantener.

2.4.2 Soluciones Alternativas

13
Las causas raíz de falla, listadas en la Fase 3, se agrupan de acuerdo con la interacción
entre ellas y se plantean soluciones para cada causa y grupo de causas. El objetivo es
asegurar que se está analizando el problema de forma amplia, se busca enfocar
soluciones desde otros puntos de vista. Ejemplo, mejoramiento del equipo existente o
selección de equipo de nueva tecnología.

2.4.3 Identificación de la Decisión

Cada solución debe ser redactada de tal forma que contenga al menos un sujeto, una
acción y un objetivo.

2.4.4 Análisis de la Decisión

Para cada grupo de soluciones, se selecciona un porcentaje de éxito y el valor de la


implementación, con el fin de calcular la reducción del riesgo con un plan de prevención
como el mostrado en la Fig. 8. De igual forma se determina una prioridad para las
diferentes soluciones con el fin de facilitar su implementación. Desechar las soluciones
que no cumplen con los “debería”.

PLAN DE PREVENCION
Prevenir problemas futuros que pueden resultar de la
implementación de la solución.
– Qué puede ir mal?
– Qué problemas nuevos puede esto causar?
– Debo estar preocupado?
Probabilidad

ALTA
Seguro de implementar?

MEDIA
Si, con ó sin mitigación

BAJA
OK, con mitigación

BAJA MEDIA ALTA


Evite esta situación
h

Consecuencia

Figura 8. Plan de prevención para implementar las soluciones resultantes del RCA

14
2.5 ETAPA 5. PLANES DE ACCIÓN CORRECTIVA Y SEGUIMIENTO – VERIFICACIÓN DE
RESULTADOS EN CAMPO.

La implementación de la solución, requiere de planes de acción y seguimiento que


identifiquen la efectividad de la misma. Se deben documentar las soluciones efectivas y
generar las lecciones aprendidas, socializarlas dentro de la organización con el fin de
evitar que el problema se repita en el mismo equipo u otros similares en otros sitios de
trabajo.

La implementación de una acción correctiva debe responder las siguientes inquietudes:


- Está la acción correctiva conectada con todas las causas?
- Puede la acción correctiva causar otros daños colaterales?
- Cuáles son las consecuencias de implementar la acción correctiva?
- Cuáles son las consecuencias de no implementar la acción correctiva?
- Cuál es el costo de implementar la acción correctiva (Capex - Opex)?
- Requiere algún entrenamiento especial la implementación?
- En qué tiempo se puede implementar la acción correctiva?
- Qué recursos se requieren para una implementación efectiva?
- Qué impacto tiene la acción correctiva sobre otros procesos y equipos?
- Se puede medir el impacto de la implementación de la acción correctiva?

El resultado de un taller de Análisis de Causa Raíz de Falla y la documentación de las


lecciones aprendidas, conlleva a la generación de Mejores Prácticas de Ingeniería,
elaboración de procedimientos, guías, manuales e instructivos seguros y confiables.

2.6 INFORME FINAL

2.6.1 Estructura del Informe

Se ha estandarizado una estructura para la elaboración del informe final, el cual debe
contener como mínimo la siguiente información:
- Introducción
- Documentos relacionados
- Participantes
- Análisis de la Causa Raíz
- Conclusiones
- Acciones correctivas – Recomendaciones
- Anexos. Se debe anexar la metodología utilizada, los diagramas causa-efecto,
documentos, tablas y gráficas que soporten los hechos.

15
2.6.2 Entrega del Informe

Se debe socializar el resultado del taller de RCA con los profesionales de proyectos,
operaciones y mantenimiento, especialmente con los involucrados en la gestión de
integridad mecánica y confiabilidad operacional. El informe final en copia dura y
magnética, debe ser entregado al Centro de Documentación Técnica, para que sea
colocado en la intranet institucional.

3. MÉTODOS Y HERRAMIENTAS DE ANÁLISIS DE CAUSA RAÍZ

Los métodos y las herramientas de Análisis de Causa Raíz son aplicables a casos
específicos, se seleccionan dependiendo del alcance y de la consecuencia del incidente o
falla. Las herramientas tienen un uso limitado, los métodos involucran varias etapas y son
de uso más generalizado. Para comparar los métodos y las herramientas, se deben tener
en cuenta los siguientes criterios[6]:

- Que definan claramente el problema y su importancia al propietario


- Que describan las causas conocidas y la relación con las que pueden causar el
problema
- Que establezcan la relación entre la causa raíz y el efecto o problema
- Que presenten de forma simple y enfocada la evidencia y el soporte de las causas
identificadas
- Que expliquen. sin ambigüedad cómo la solución puede prevenir el problema
recurrente.
- Que el reporte sea conciso, fácil de entender y de análisis lógico.

3.1 PASO DE LA ESCALERA – 5 PORQUÉ

Es un método simple de pregunta – respuesta, usado para explorar la relación entre causa
– efecto, para encontrar la causa raíz y solucionar problemas, Fig. 9. El método fue
desarrollado por Sakichi Toyoda y fue utilizado por la Toyota Motor Corporation durante la
evolución de su proceso de manufactura, como parte de la inducción de sus trabajadores
y como elemento en la solución de problemas en el sistema de producción de vehículos[5].
Actualmente se utiliza en programas de Mejoramiento Continuo, Mantenimiento
Productivo y Seis Sigma.

PROBLEMA PORQUÉ 1?
PORQUÉ 2?
PORQUÉ 3?
PORQUÉ 4?
PORQUÉ 5?
CAUSA ?

Figura 9. Diagrama esquemático del método de la escalera para RCA.

Ejemplo: Viajando del trabajo a casa, el vehículo se detuvo en medio de la vía y no volvió a
arrancar.

16
1. Porqué 1? – El tanque de gasolina está vacío
2. Porqué 2? – El medidor de combustible está desajustado
3. Porqúe3? – Nunca lo he calibrado
4. Porqué 4? – No conozco un taller, en la ruta, que realice esta labor
5. Porqué 5? – Realmente no le he hecho el mantenimiento recomendado por el
concesionario.

El quinto Porqué, se considera una causa raíz del problema. El objetivo es que el analista
del problema evite hacer suposiciones y deducciones y mejor se enfoque en el
encadenamiento de hechos y datos y en la causa – efecto, hasta encontrar la causa raíz
que generó el problema.

3.2 DIAGRAMA CAUSA – EFECTO

Método utilizado para el análisis de problemas complejos, se identifican una secuencia de


eventos alineados con el tiempo y con las condiciones que los causan. Los eventos y
condiciones evidentes se identifican con líneas sólidas en un diagrama de árbol, sin
describir las evidencias; los eventos y condiciones asociadas, se muestran con líneas
punteadas. Con el ensamble completo, la pregunta frecuente es si el incidente cambia si
las condiciones cambian, es decir si existe la relación causa – efecto. En la Fig. 10, se
muestra un ejemplo del arreglo del árbol.

Causa nivel
Causa Causa 2
Causa nivel
principal 2
principal

Causa nivel 1
Causa nivel 1

Problema a
resolver - Efecto

Causa nivel 1
Causa nivel 1
Causa nivel
Causa 2
principal Causa Causa nivel
principal 2

Figura 10. Diagrama de Ishikawa o espina de pescado para el análisis de causa – efecto en
la solución de problemas

El diagrama “espina de pescado”, fue propuesto por Kaoru Ishikawa en los años 1960´s,
para solución de problemas en la construcción de buques Kawasaki y como fundamento
de la administración moderna[7].

17
En los talleres de RCA, durante la tormenta de ideas, las causas se van agrupando por
afinidad. Las causas principales están relacionadas con las 4 M´s. Las causas de primer
nivel están relacionadas con los servicios y comportamientos y las de segundo nivel, se
asocian con elementos externos.

Causa Principal
- Machine (Equipos - Activos)
- Method (Procesos – Procedimientos – Inspecciones)
- Material (Materias primas – Consumibles – Suministros)
- Man Power (Personas – Recurso humano)

Otras Causas principales


- Medio ambiente
- Mantenimiento
- Inversiones
- Administración

Causas de Nivel 1
- Competencias
- Procesos
- Políticas
- Procedimientos
- Precios
- Productos
- Información – documentación – publicidad

Causas de Nivel 2
- Entorno
- Proveedores
- Sistemas – software – hardware
- Disponibilidad

El método de Causa – Efecto es uno de los más comunes con diferentes variaciones y
nombres comerciales. El más conocido es el “Diagrama de Ishikawa”, “Espina de pescado”,
“Management Oversight and Risk Tree Analysis – MORT”, “Human Performance Evaluations
System – HPES”. Todos los métodos mencionados utilizan la misma categorización lógica
básica.

Después de revisar cada categoría, se define cual causa está más relacionada con el
problema. Si la solución planteada elimina la recurrencia del problema, se convierte en
una causa raíz. En la industria se han desarrollado “Sistemas Expertos”, para apoyar el
análisis y la solución de problemas complejos.

3.3 ANÁLISIS DEL ÁRBOL DE FALLAS - FTA

Es un método cuantitativo del diagrama causa – efecto utilizado para identificar fallas en
un sistema, a partir del análisis de subsistemas. Su uso es generalizado en proyectos de
ingeniería, biología y diseño, requiere de datos específicos como “velocidad de daño”,
“frecuencia de fallas”, “Tiempo Medio entre Fallas”. La relación de causa – efecto, está
relacionada con la interacción de las variables. La Fig. 11 muestra un árbol de falla simple.
18
El árbol de análisis de falla está compuesto de diagramas lógicos que muestran el estado
de un sistema, se construye utilizando técnicas de diseño gráfico. Involucra eventos
externos, falla de materiales, mal funcionamiento y combinación de todas las
interconexiones del sistema. El FTA, se desarrolló en los 1960´s por la Bell Telephone
Laboratories para el análisis de proyectos donde el error no es una opción.
Posteriormente, la Boeing Company y la industria nuclear lo han utilizado extensivamente
en sus plantas de construcción y generación de energía, respectivamente.

El FTA, es un método capaz de identificar accidentes potenciales y de eliminar costosos


cambios en el diseño. Especialmente útil para el manejo del cambio en industrias de alto
riesgo{7].

Falla de Equipo

Diseño Fabricación / Montaje Uso

Fallas de Mal Uso


Mal Falla de Soldadura
Diseño Sobre -
Flexibilidad
Esfuerzo
No Cumple
Especificaciones Envejecimiento
Obsolescencia

Figura 11. Diagrama de Árbol de Falla de un equipo de proceso.

En el método FTA, un efecto indeseado se coloca como evento superior, luego en la parte
inferior con uniones lógicas se colocan las causas que genera el efecto. Cuando se han
completado todas las posibles causas, se recurre a programas de cómputo especializados
para determinar la probabilidad de falla.

Programas de cómputo de uso frecuente son: el CAFTA del Electric Power Research
Institute, utilizado en las plantas de generación de energía nuclear y por los fabricantes de
equipos aeroespaciales en USA; el SAPHIRE del Idaho National Laboratory, utilizado para
evaluar la seguridad y la confiabilidad de reactores nucleares, de los transbordadores
espaciales, de la Estación Espacial Internacional. Fuera de Estados Unidos, para el análisis
de riesgo en plantas nucleares, se utiliza el RiskSpectrum

El Árbol de Falla es muy útil para el análisis de eventos simples, uno, y generalmente
cumple cinco pasos:

a) Definición del evento indeseado a estudiar (Efecto)


b) Definir y entender bien el sistema. Todas las causas deben ser secuenciales, en
orden de ocurrencia
c) Construir el árbol de falla, con las causa-efecto y sus probabilidades

19
d) Evaluar el árbol de falla, desde el punto de vista del riesgo y mejorarlo.
e) Controlar los riesgos identificados, con el objeto de disminuir o eliminar la
probabilidad de ocurrencia de la falla.

3.4 ÁRBOL REAL ACTUAL DE FALLA - CRT

Método desarrollado por Eliahu M. Goldratt en su Teoría de Restricciones, la cual guía al


facilitador en la identificación de causas raíz utilizando el análisis de causa-efecto cuyos
elementos están unidos por reglas lógicas (categorías de reserva legítima). El CRT inicia
con una lista de cosas o eventos indeseables a nuestro alrededor y promueve el hallazgo
de una o más causas raíz que lo generan. Este método en poderoso para la solución de
problemas complejos en organizaciones, donde no es obvia la relación entre lo observado
y las cosas o eventos indeseables y donde se requiere profundizar en la causa raíz, que
puede ser común a varios problemas a la vez [9].

El proceso de análisis trata múltiples problemas y síntomas comunes que conllevan a las
mismas causas raíz. Se describe en forma simple y en un diagrama visual los principales
síntomas apreciables y síntomas asociados a un problema que terminan en una causa raíz.
La ventaja de su uso radica en la identificación de conexiones entre los síntomas y los
problemas con sus causas. El enfoque de solución se centra en la causa que genera el
mayor cambio.

En la Fig. 12 se muestra un ejemplo típico de Árbol Real Actual de Falla. Se inicia con una
lista de problemas, conocidos como efectos indeseables. Los síntomas se asume que
tienen una causa común:

- El motor del vehículo no arranca al darle encendido


- Las luces del vehículo no encienden
- El equipo de sonido del vehículo no funciona

El razonamiento sería el siguiente:

- Si el motor para arrancar requiere energía y ésta no le llega, entonces el motor no


arranca
- Si para que las luces enciendan se requiere energía y a éstas no les llega, entonces
las luces no encienden
- Si el equipo de sonido requiere energía para su funcionamiento y no le llega, el
equipo no suena.

Uniendo todos los síntomas, se llega a una causa raíz: La batería del vehículo falló, no
genera energía y en consecuencia, el vehículo no arranca, ni las luces encienden ni el
equipo suena.

La relación entre causa – efecto se relacionan con conectores lógicos: Si, y, entonces (IF,
AND, THEN)

20
Efecto 1 Efecto 2 Efecto 3
El motor del Las luces no El equipo de sonido
vehículo no arranca encienden no funciona

El motor requiere El interruptor de Ninguna farola Al equipo no le


energía para arranque tiene energía llega energía
arrancar requiere energía

La batería esta Las celdas de la No hay


sulfatada batería no tienen generación en
agua la batería

La batería del vehículo se descargó

La batería del vehículo La batería del


hizo cortocircuito vehículo falló

Figura12. Diagrama esquemático de un Árbol Real Actual de Falla

3.5 ANÁLISIS KEPNER - TREGOE

Método desarrollado en 1958 por el Dr. Charles Kepner y el Dr. Benjamín Tregoe, Kepner-
Tregoe Inc., organización dedicada a la consultoría sobre solución de problemas, toma de
decisiones y metodología de ejecución de proyectos [8], denominado también como
“Proceso KT”. Es un sistema estructurado para maximizar el pensamiento crítico de los
involucrados en un problema específico, con el objeto de tomar una decisión o encontrar
una oportunidad, consta de:

- Evaluación de situaciones: Establecer y priorizar eventos


- Análisis de problemas: Hallazgo de la causa de una desviación positiva o negativa
- Análisis de decisiones: Elección balanceada de alternativas
- Evaluación de oportunidades de mejora: Establecer un plan de acción y
seguimiento.

3.6 INFERENCIA BAYESIANA

Es un método de deducción estadística con la cual las evidencias u observaciones se


utilizan para inferir que la probabilidad de ocurrencia o la hipótesis nueva puede ser
prevista y cierta. El método está basado en el “Teorema de inferencia del Reverendo
Thomas Bayes[10]”

El método Bayesiano utiliza herramientas del método científico, el cual incluye la


recolección de evidencias y la verificación de la consistencia de las hipótesis. Las hipótesis
con alto nivel de soporte se aceptan como verdaderas mientras que las hipótesis con bajo
nivel de soporte se consideran erradas o falsas.

21
El método Bayesiano utiliza además, simulación y modelamiento numérico para
estimación del grado de confiabilidad de una hipótesis y lo compara con la evidencia
observada. Es un método inductivo que requiere de analistas con formación matemática
avanzada.

3.7 ANÁLISIS DE BARRERAS

Herramienta utilizada en la solución de problemas en procesos industriales. Está basado


en el seguimiento de los dispositivos de protección, enfocándose en los cortes o barreras
del flujo y en Cómo y Porqué no actúan antes de que se produzca un incidente. Un
ejemplo es la máquina de afeitar cuya cuchilla se encuentra en una carcasa protectora, si
la carcasa falla, la cuchilla puede ocasionar un incidente. La causa de la falla de la carcasa,
se convierte en una causa raíz directa del problema.

3.8 ANÁLISIS DEL CAMBIO

Herramienta de investigación utilizada para el análisis de problemas o accidentes. Está


basada en la comparación de situaciones antes y después del evento, con el objeto de
identificar los cambios o diferencias que puedan explicar el incidente ocurrido y las
consecuencias. El resultado del cambio es la causa que origina el problema, generalmente
está asociada al tiempo. Esta herramienta proporciona causas específicas que no son
necesariamente causas raíz del problema, Fig. 13.

ANÁLISIS DE CAMBIO

QUÉ QUÉ
QUÉ
PASÓ PASÓ
CAMBIÓ
AHORA ANTES

Figura 13. Diagrama esquemático para el análisis del cambio.

3.9 DIAGRAMA DE PARETO

Herramienta de aproximación estadística a la solución del problema, utiliza bases de


datos de problemas identificados, con las causas que los han generado, en un
determinado proceso o negocio. El principio de Pareto se conoce como la regla del 80-20,
el cual dice que el 80% de los problemas son generados por el 20% de las causas. Se
entiende como la relación directa del problema con las causas más comunes. No es
precisamente un método para resolver problemas, se utiliza para determinar dónde iniciar
el análisis, para priorizar las acciones más efectivas [11, 12, 13].

Al graficar el Pareto de causas y frecuencia de falla, nos quedaría una curva similar a la
mostrada en la Fig. 14. En una planta de la industria del petróleo, el número de equipos
críticos es del orden del 20% del total. Esta información es muy importante para definir los
planes de acción de inspección y mantenimiento. Se dedicará el 80% de los recursos a la
evaluación detallada del 20% de los equipos críticos

22
EVALUACIÓN DE CRITICIDAD TÍPICA EN PLANTAS

PORCENTAJE
EQUIPOS CRÍTICOS POR PLANTA
DEL RIESGO
TOTAL

PORCENTAJE DE EQUIPOS

Figura 14. Graficación del diagrama de Pareto para la criticidad de equipos en una planta
de tratamiento de gas.

3.10 MODOS DE FALLA Y ANÁLISIS DE EFECTOS - FMEA

4. REFERENCIAS

1. Oliver, M. A Guide to the Fact Based Problem Solving Process, Shell Global Solutions,
2000, The Hague OGF/3

2. Duran, José, Análisis de Causa Raiz, Wood House Partnership ltd., 2000, UK

3. Yonke, C., Araujo, F., Koehler K., Strawn T., Developing and Implementinga Failure-
Analysis Process to Optimize Well-Servicing Operations SPE Production & Facilities,
May 1997.

4. DOE Guideline, Root Cause Analysis Guidance Document, DOE-NE-STD-1004-92,


Deparment of Energy, Febraury 1992, USA.

5. Taiichi Ohno, Norman Bodek. Toyota Production System: Beyond Large-Scale


Production. Productivity Press, Portland, 1988. ISBN 0915299143

23
6. Dean L. Gano. From the Book: Apolo Root Cause Analysis – A New Way Thinking, Third
Edition, 2007.

7. Acharya, Sarbes; et al. Severe Accidents Risks: An Assessment for Five U.S. Nuclear
Power Plants. Washington D.C., U.S. Nuclear Regulatory Commission, NUREG-1150,
1990 (Desclasificado 2010-01-17)

8. Thinking About Problems: Kepner-Tregoe. http://www.itsmsolutions.com/newsletters

9. Kepner, Ch. Tregoe B.B., “El nuevo directivo racional”, Mc Graw Hill

10. Dettmer, H. W. “Goldratt’s Theory of Constraints: A Systems Approach to Continuos


Improvement”, ASQC Quality Press, USA, 1998, pp 62-119

11. Hubbard, D. “How to Measure Anything: Finding the Value of Intangibles in Business”,
John Wiley & Sons, New York, 2007.

12. Kume, H. , “ Herramientas Estadísticas Básicas para el Mejoramiento de la Calidad”,


Editorial Norma, 1992, Colombia.

13. Karatsu, H., Ikeda T., Mastering the Tools of Quality Control”, PHP Institute, Inc, 1985,
Tokyo.

24

S-ar putea să vă placă și