Wednesday, 30 April 2014


After the taxonomy process, that results in a classification of equipment in systems, subsystems and components, we start the RCM analysis based in SAE JA 1011.
The first step is to establish comprehensive alphanumeric equipment identification. Then, we can start to give answers to the first five questions of the SAE JA 1011.

The questions are:

1.  What are the functions and associated desired standards of performance of the asset in its present operating context?

Answers must include all the functions of the asset under the operating context and the level of performance desired.

These functions can be divided in Primary Functions or the reason why the organization acquires the asset, and Secondary Functions or other as environmental integrity, safety / structural integrity, control / containment / comfort, appearance, protective devices and systems, economy / efficiency and superfluous.

FMEA - 1

2.  In what ways can it fail to fulfil its functions?
These are the failed states associated with each function; they can be Partial or Total Failures.  

FMEA - 2
3.  What causes each functional failure?
These are the failures modes reasonably likely to cause each failure. Lists of failure modes can include failure modes that have happened before, that are currently being prevented, or that are credible in the operating context that can be obtained from technical reports or databases.
Recommend databases for mechanical components are the OREDA – Offshore Reliability Data – Handbook by Det Norske Veritas, and the Handbook of Reliability Prediction Procedures for Mechanical Equipment by the Naval Surface Warfare Center – Carderock Division, this last handbook also includes effects of failures data.
  Other sources are the results of Root Causes Analysis of unidentified failures.
The failure modes can be classified into one of the following categories: Incorrect Operation, Incorrect Assembly, or External Damage.
To define if a failure mode is Evident or Hidden under normal circumstances is crucial to continue with the analysis and define the best task or action.

FMEA - 3
4.  What happens when each failure occurs?
The answers describe what would happen if no specific tasks are done to anticipate, prevent, or detect the failure. The Failure Effects include all the information needed to support its evaluation, such as evidence that the failure has occurred, if it can kill or injure someone, or to have an adverse effect on the environment, to have an adverse effect on production or operations, physical damages, or what must be done to restore the function of the asset. 
FMEA - 4
5.  In what way does each failure matter?
These are the failure consequences that must take in account if they are consequences of hidden failure modes; and if they have safety and/or environmental consequences or only have economic consequences.
FMEA - 5
At this point, we can consider finishing the full FMEA – Failure Modes and Effects Analysis - giving values to Probability (of the failure mode), Detection (of the failure) and Severity (of the failure consequence) and multiplicity them to calculate the RPN - Risk Priority Number-. This is the methodology most commonly used in RCM analysis. The standard SAE J 1739 gives us a methodology to perform an effective FMEA.

FMEA - 6

Other option is to use the COFA – Consequences of Failures Analysis – methodology proposed by Neil B. Bloom that defines a Component Classification, based in a RCM COFA Logic Tree, that classify the components in Critical, Potentially Critical, Commitment, Economic, or Run-to-Failure.
The COFA methodology is more straightforward and comprehensive than FMEA to give a final component classification to support the choice of the best maintenance tasks or actions, keeping all the SAE JA 1011 standard requirements.



Sunday, 27 April 2014


Después del proceso de taxonomía, que da como resultado una clasificación del equipo en sistema, subsistema y componentes, podemos comenzar el análisis RCM basado en la norma SAE JA 1011.
 El primer paso es establecer un código alfanumérico para la identificación de los equipos, una vez hecho esto comenzamos con las cinco primeras preguntas de la norma:
1. ¿Cuáles son las funciones y los niveles de rendimiento deseados para el active en sus condiciones actuales de operación?

La respuesta a esta pregunta debe incluir todas las funciones del active bajo las condiciones de operación y el nivel de rendimiento deseado.

Estas funciones pueden dividirse en Funciones Primarias, o la razón para la que hemos adquirido el activo, y Funciones Secundarias, o cualquier otra función como protección del medio-ambiente, seguridad / integridad estructural, control / contención / confort, apariencia, dispositivos y sistemas de protección, economía / eficiencia y funciones superfluas.
Análisis FMEA - 1

2. ¿De qué maneras puede fallar en el cumplimiento de sus funciones?

Estos son los estados de fallo asociados a cada función; estos fallos pueden ser Fallos Parciales o Fallos Totales.  

Análisis FMEA - 2
3. ¿Qué causa cada fallo funcional?

Estos son los modos de fallo que, de forma razonable, pueden causar cada fallo. Las listas de modos de fallos pueden incluir a aquellos que ya hayan sucedido, que estén siendo actualmente prevenidos, o que son posibles en las condiciones de utilización y que pueden ser obtenidos de informes técnicos o de bases de datos. Otro recurso puede ser la realización de Análisis de Causa Raíz de fallos no previstos.

Los modos de fallo pueden clasificarse en alguna de estas categorías: Operaciones Incorrectas, Ensamblaje Incorrecto o Daños Externos.

Definir si un modo de fallo es Evidente u Oculto bajo condiciones normales resulta crucial para continuar el análisis y definir las mejores tareas o acciones.

Análisis FMEA - 3
4.     ¿Qué sucede cuando ocurre cada fallo?

Las respuestas describen que podría suceder si no realizamos alguna tarea específica para anticipar, prevenir o detectar el fallo. Los Efectos de los Fallos incluyen toda la información necesaria para llevar a cabo su evaluación, así como que evidencias existen de que el fallo ha ocurrido, si puede matar o herir a personas o tiene efectos adversos para el medio-ambiente, tiene efectos adversos para la producción o las operaciones, que daños sufre o que debe realizarse para recuperar las funciones del activo. 

Análisis FMEA - 4

5.     ¿De qué manera nos afecta cada fallo?

Estas son las consecuencias de los fallos, que deben tener en cuenta si son consecuencia de modos de fallos ocultos, y si afectan a la seguridad, al medio-ambiente o sólo tienen consecuencias económicas.
Análisis FMEA - 5
En este punto, podemos considerar si realizar un Análisis de Modos de Fallos y Efectos - FMEA – dando valores de Probabilidad (del modo de fallo), Detección (del modo de fallo) y Severidad (de las consecuencias del fallo) y multiplicarlos para obtener en valor de RPN – Número de Prioridad de Riesgo-. Esta es la metodología más utilizada en los estudios de RCM. La norma SAE J 1739 nos proporciona una metodología para realizar FMEA.
Análisis FMEA - 6
Otra opción es utilizar la metodología COFA – Análisis de Consecuencias de Fallos – propuesta por Neil B. Bloom que define una Clasificación de Componentes, basada in el árbol de decisión RCM COFA, que clasifica los componentes en Críticos, Potencialmente Críticos, Comprometidos, Económicos o Funcionar hasta Fallar.

Análisis COFA

 La metodología COFA es más sencilla que la basada en FMEA al aportar una clasificación final en base a la cual se deciden las tareas o acciones de mantenimiento, a la vez que mantiene todos los requisitos de la norma SAE JA 1011.

Monday, 21 April 2014

Trainings in Madrid / Cursos en Madrid

 En estos meses voy a impartir los siguientes cursos en Madrid. / Next months I'm going to give the following trainings and workshops in Madrid:

- Jornada sobre Gestión de un Sistema de Mantenimiento Eficaz, con Ángel Partida, en el COITIM el 6 de mayo. / Conference about Management of an Effectiveness Maintenance System, in collaboration with Ángel Partida, in COITIM, May 6th.

- Curso sobre Mantenimiento Lean y TPM, en Preditec 20 al 22 de mayo. / Course about Lean Maintenance and TPM, in Predictec May 20th to 22th.

- Curso sobre Gestión de Activos basada en Riesgos, en Preditec 17 al 19 de junio. / Course about Risk based Asset Management, in Predictec June 17th to 19th.

- Curso sobre Ingeniería de Fiabilidad y RCM, en Preditec 25 al 27 de junio. / Course about Reliability Engineering and RCM, in Predictec June 25th to 27th.

 Los cursos en Preditec son totalmente prácticos, utilizando la metodología de manos a la obra para que los asistentes puedan aprender el contenido de una forma sencilla y entretenida. / The courses in Preditec are full practical and use the hand-on methodology to ensure the attendants learn the topics in a easy and funny way.

Monday, 14 April 2014

RCM 2: Taxonomy and Core Principles.

Most organizations own hundreds or thousands of physical assets. These assets can be of different sizes, in only one site or spread in hundreds of locations, can be fixed or mobile. Before any organization can apply RCM it must know what and where the assets are.

 To perform equipment partitioning facilitates analysis and specifies analysis boundaries before start the analysis. The MIL-STD-3034 standard recommends that care must be taken when defining what the boundaries of a single development will encompass so that no items are forgotten or are covered within multiple developments. Within this process the assigned developers may still find it advantageous to subdivide the subsystem to simplify the analysis. This hierarchical approach to dividing subsystems enables the identification of an optimum level.

 The ISO 14224 considers that a clear boundary description is imperative for collecting, merging and analyzing Reliability and Maintenance data from different industries, plants or sources. It also facilitates communication between operators and equipment manufacturers. Otherwise, the merging and analysis is based on incompatible data. It is wise not to be too rigid about boundary definitions, because as understanding grows during the RCM process, perceptions about what should or should not be incorporated in the analysis can change.

 It is possible to develop a hierarchy showing the primary functions of each of the assets in the assets hierarchy; it shows the relationship between functions at the same level. Then we must classify the assets and their elements into generic groups based on factors possibly common to several of the items (location, use, equipment subdivision, etc.). The name of this systematic classification is taxonomy.
Taxonomy ISO 14224
  The first five levels represent a high-level categorization that relates to industries and plant application regardless of the equipment units involved. This is because an equipment unit can be used in many different industries and plant configurations and, for analyzing the reliability of similar equipment, it is necessary to have the operating context.

The last four levels are related to the equipment unit with the subdivision in lower indenture levels corresponding to a parent-child relationship. The number of subdivision levels for the collection of Reliability and Maintenance data depends on the complexity of the equipment unit and the use of the data. A single instrument might need no further breakdown, while several levels can be required for a large compressor; the last level is only used in too complex equipment.

Once we already performed the taxonomy of equipment we can start the RCM analysis, but before we must keep in mind these core principles:

·         Failures happen.

·         Not all failures have the same probability.

·         Not all failures have the same consequences.

·         Simple components wear out, complex systems break down.

·         Good maintenance provides required functionality for lowest practicable cost.

·         Maintenance can only achieve inherent design reliability.

·         Hidden functions require special treatment.

·         Unnecessary maintenance takes resources away from necessary maintenance.

·         Good maintenance programs undergo continuous improvement.

  These principles are very important because we always must think that to avoid all the failure are no possible and every failure is different, that the mission of a good maintenance is just provides the required functionality and reliability at lowest practicable recourses cost, deserving special attention to hidden failures.

Finally, we must consider that a good maintenance program undergo continuous improvement, so we never must finish our RCM program but we must refresh with new reliability data and new maintenance technologies. So we must include continuous improvement basics as the Deming Circle based:

Deming Circle used in Continuous Improvement programs.

  • Plan: Establishing the objectives of the RCM program.
  • Do: Implementing the program.
  • Check: Studying the actual results and compare against the expected results.
  • Act: Requesting actions on significant differences between actual and planned results.

1st Post: RCM: Commons sense applied to maintenance.

Saturday, 12 April 2014

RCM 2: Taxonomía y Principios Fundamentales.

Antes de comenzar el análisis RCM debemos dividir los equipos y especificar sus límites, con el objetivo de facilitar la realización del proceso. Tal y como recomienda la norma MIL-STD-3034, se debe tener una especial precaución al definir los límites de un equipo, de manera que ningún elemento quede suelto o esté incluida en varias clasificaciones. Esta división debe ser jerárquica.

La norma ISO 14224 considera que una descripción clara de los límites es un requisito necesario para recopilar, compartir y analizar datos de fiabilidad y mantenimiento de diferentes fuentes. Esto también facilita la comunicación entre operadores, personal de mantenimiento y fabricantes de maquinaria. De otro modo, la puesta en común y análisis de datos estaría basado en datos incompatibles.

Denominamos taxonomía a un sistema de clasificación de elementos en grupos genéricos basados factores comunes a varios de ellos (como pueden ser localización, utilización, subdivisiones de equipos, etc.).

Taxonomía, según ISO 14224.

Los cinco primeros niveles de este sistema de taxonomía representan la categorización de alto nivel, que están relacionados con las instalaciones en las que los equipos están operando, esto es porque un mismo equipo puede ser utilizado en diferentes industrias, configuraciones y, algo a tener en cuenta en el análisis de fiabilidad, en diferentes contextos de utilización.

Los cuatro niveles siguientes están relacionados con los equipos con sus subdivisiones en niveles inferiores en una relación jerárquica. El número de subdivisiones para la recopilación de datos depende de la complejidad del equipo y de la utilización de los datos. Para un instrumento simple podría ser suficiente un solo nivel de jerarquización, mientras que para un equipo complejo, como un compresor, se podrían necesitar varios niveles; el último nivel (elemento) sólo se utilizará en equipos muy complejos.

Una vez realizada esta taxonomía podemos comenzar el análisis, pero antes debemos tener en cuenta los siguientes principios:

·         Los fallos suceden.

·         No todos los fallos tienen la misma probabilidad.

·         No todos los fallos tienen la misma consecuencia.

·         Los componentes simples fallan por desgaste mientras que los sistemas complejos fallan aleatoriamente.

·         Un buen mantenimiento es el que proporciona el nivel de funcionalidad requerido al menos coste posible.

·         El mantenimiento solo puede recuperar la fiabilidad de diseño.

·         Las funciones ocultas requieren un tratamiento especial.

·         Las operaciones de mantenimiento innecesarias consumen recursos necesarios para la realización de operaciones de mantenimiento necesarias.

·         Un buen programa de mantenimiento es un proceso de mejora continua.

 De acuerdo a estos principios, debemos asumir la posibilidad de que ocurran fallos y que estos fallos presentan formas diferentes. Que la función del mantenimiento es, únicamente, recuperar la funcionalidad y fiabilidad requerida con el menor consumo en recursos posibles, prestando una atención especial a las funciones ocultas.

Finalmente, debemos considerar que un buen programa de mantenimiento, como es RCM, es un proceso de mejora continua, que nunca hay que dar por terminado y que se debe actualizar con nuevos datos de fiabilidad y nuevas tecnologías de mantenimiento.

Por lo tanto, el programa RCM debe incluir los principios básicos de mejora continua, como los basados en el Círculo de Deming:
Círculo de Deming: Planear - Hacer - Comprobar - Actuar.

  • Planear: Estableciendo los objetivos del programa RCM.
  • Hacer: Implementando el programa.
  • Comprobar: Estudiando la situación actual y comparandola con los resultados esperados.
  • Actuar: Planteando acciones para salvar las diferencias entre los resultados obtenidos y los planeados.

1er Post - RCM: Sentido común aplicado al mantenimiento.