Confiabilidad a lo Largo del Ciclo de Vida

Dominio V — Panorama del ciclo de vida

La Confiabilidad a lo Largo del Ciclo de Vida

El Dominio V integra todas las decisiones de diseño, selección de materiales y estrategias de mantenimiento en una visión unificada del ciclo de vida completo del producto.

Los dominios anteriores del BoK — fundamentos, riesgos, estadística, pruebas y modelado — son las herramientas que el ingeniero de confiabilidad domina. El Dominio V es el campo donde esas herramientas se aplican al producto real: desde el primer boceto conceptual hasta la disposición final del activo. Es el dominio más integrador del CRE BoK 2025, porque requiere la interacción simultánea de diseño, manufactura, operación y mantenimiento.

Sub-dominio A

Técnicas de Diseño para Confiabilidad

Evaluación del diseño, estrés-resistencia, DOE, optimización, factores humanos, DFX y Diseño para la Confiabilidad (DfR).

Sub-dominio B

Desarrollo de Partes y Sistemas

Selección de materiales y componentes, derating, estandarización de partes y simplificación del sistema.

Sub-dominio C

Mantenibilidad

Estrategias de mantenimiento (correctivo, preventivo, predictivo, RCM), análisis de mantenimiento preventivo y correctivo, disponibilidad, MTTR.

El principio integrador del Dominio V

El CRE Primer establece que durante el proceso de diseño, el producto debe someterse a evaluaciones periódicas para asegurar que los objetivos y requisitos de diseño se están cumpliendo. El ingeniero de confiabilidad participa en todos los comités de revisión de diseño — desde la fase conceptual hasta la fase V de diseño finalizado — con la responsabilidad específica de evaluar el diseño para la confiabilidad.

BoK V.A.1 — Evaluación del diseño

Evaluación y Revisiones de Diseño

La confiabilidad del diseño se evalúa en cada etapa del ciclo de vida usando validación, verificación y otras técnicas de revisión — no como auditoría final sino como proceso paralelo al desarrollo.

Los principios básicos para cumplir con los requisitos de confiabilidad incluyen: simplicidad, uso de componentes probados y diseños preferidos, análisis estrés-resistencia, redundancia, control ambiental local, identificación y eliminación de modos de falla críticos, auto-reparación (detección automática de fallas), detección de fallas inminentes, mantenimiento preventivo, evaluación de tolerancias e ingeniería humana.

Validación versus Verificación

Validación es la confirmación, mediante examen y evaluación de evidencia objetiva, de que una intención específica ha sido cumplida. La realiza el cliente (usuario final) para comprobar si el producto satisface sus necesidades.
Verificación es la confirmación, mediante examen y evaluación de evidencia objetiva, de que una especificación de diseño específica ha sido cumplida. La realiza ingeniería para determinar si el componente, módulo, subsistema o sistema cumple con las especificaciones de diseño.

Investigación de mercado

Necesidades del cliente, benchmarking competitivo

Conceptos

Generación de alternativas, FMEA conceptual, análisis de riesgo

III

Diseño

Diseño preliminar y detallado, estrés-resistencia, DOE

Ingeniería de manufactura

FMEA de proceso, pruebas de calificación, ESS

Diseño finalizado

Validación, lanzamiento, lecciones aprendidas

Fuente: CRE Primer, Sección VIII — Reliability Designs, V.A.1. Tabla 8.2 — Membresía y responsabilidades del comité de diseño.

BoK V.A.2 — Stress-Strength Analysis

Análisis de Estrés-Resistencia

En los términos más básicos, un ítem falla cuando el estrés aplicado excede la resistencia del ítem. El análisis cuantitativo de esta interferencia es fundamental para el diseño confiable.

En la práctica real, tanto el estrés como la resistencia son variables estocásticas — no valores fijos. Hay variabilidad alrededor de los valores nominales de estrés y resistencia. Cuando las distribuciones están bien separadas, la probabilidad de interferencia (y de falla) es baja. Cuando las distribuciones se superponen significativamente, la probabilidad de falla aumenta en proporción al área de interferencia.

Probabilidad de falla por interferencia estrés-resistencia

Z = (μ_x − μ_y) / √(σ_x² + σ_y²)

μ_x = media de la resistencia | μ_y = media del estrés aplicado
σ_x = desviación estándar de la resistencia | σ_y = desviación estándar del estrés
Ejemplo del CRE Primer: μ_x=1600W, σ_x=30W, μ_y=1500W, σ_y=20W → Z = 100/√1300 = 2.77 → P(falla) = 0.28%
Para distribuciones no normales, se puede usar simulación Monte Carlo para calcular la probabilidad de falla.

Factor de seguridad y margen de seguridad

El CRE Primer define el factor de seguridad como la razón μ_x/μ_y (media de la resistencia sobre media del estrés) y el margen de seguridad como (μ_x − μ_y)/μ_y. Un factor de seguridad de 50% de derating para componentes electrónicos puede disminuir la tasa de falla en más del 30% — una de las formas más efectivas de mejorar la confiabilidad sin cambiar el diseño fundamental.

BoK V.A.3 — Design of Experiments

Diseño de Experimentos y Diseño Robusto

El DOE permite al ingeniero evaluar múltiples factores simultáneamente, identificar los que más impactan la confiabilidad y encontrar las condiciones óptimas del diseño con el menor número de experimentos posible.

El enfoque tradicional de experimentación — cambiar solo un factor a la vez (1FAT) — tiene limitaciones fundamentales: requiere demasiados experimentos, puede no revelar nunca la combinación óptima de variables, no puede determinar las interacciones entre factores, y frecuentemente produce conclusiones incorrectas o poco concluyentes. El DOE supera estos problemas mediante una planificación cuidadosa.

Taguchi · DOE Robusto

Diseño Robusto — Metodología Taguchi

Concepto, Parámetro y Tolerancia · Razón Señal/Ruido · Arreglos ortogonales

El diseño robusto usa el concepto de control de parámetros para colocar el diseño en una posición donde el "ruido" aleatorio no causa falla. Un producto o proceso es controlado por factores de control (parámetros controlables por el diseñador) y factores de ruido (no controlables, como variación de temperatura ambiente, voltaje de línea, etc.).

El objetivo del diseñador es seleccionar los factores de control de manera que el impacto de los factores de ruido sobre la respuesta sea minimizado, mientras se maximiza la respuesta a los factores de señal.

Los tres pasos del diseño robusto: El diseño de concepto selecciona la arquitectura del producto o proceso. El diseño de parámetros establece el diseño usando componentes de menor costo y optimiza la respuesta para el control y el ruido. El diseño de tolerancias reduce tolerancias cuando el diseño de parámetros no cumple los requisitos — usando componentes más caros según sea necesario.

El caso más celebrado del DOE aplicado a confiabilidad fue el de una empresa de baldosas en Japón (1953): al tratar la temperatura del horno como factor de ruido y variar el contenido de piedra caliza como factor de control, redujeron el porcentaje de deformación del 30% a menos del 1% — y con el material más barato del proceso.

Tres casos de la razón señal-ruido (S/N)

S/N₁ "Menor es mejor" — Para minimizar desgaste, contracción, deterioro. S/N = −10 log(media al cuadrado de la respuesta). Ejemplo: vibración, defectos, consumo de energía.
S/N₂ "Mayor es mejor" — Para maximizar resistencia, vida, eficiencia de combustible. S/N = −10 log(media al cuadrado del recíproco). El sistema busca los valores más altos de S/N.
S/N₃ "Nominal es mejor" — Para dimensiones, holguras, pesos, viscosidades. S/N = 10 log(varianza objetivo / varianza del error). Busca la condición óptima con la menor varianza.

Experimento factorial completo vs. fraccionado

El CRE Primer ilustra que para 3 factores a 2 niveles, el factorial completo requiere 2³=8 experimentos, mientras que el fraccionado requiere solo 4 y aún permite estimar los efectos principales. El ejemplo de temperatura, presión y concentración muestra que se obtienen conclusiones equivalentes — temperatura es el factor dominante con +23.5% de mejora en el rendimiento — con la mitad del esfuerzo experimental.

BoK V.A.4 — Reliability Optimization

Optimización de la Confiabilidad

La misma confiabilidad de sistema puede alcanzarse por muchos caminos diferentes. El ingeniero de confiabilidad debe ayudar a elegir el mejor camino considerando costo, peso, cronograma y facilidad de mantenimiento.

Existen dos enfoques fundamentales para mejorar la confiabilidad de un sistema: la evitación de fallas (mejorar la confiabilidad de los componentes individuales) y la tolerancia a fallas (diseñar un sistema donde una falla es aceptable, típicamente mediante redundancia).

Evitación de fallas (Fault Avoidance)

Seleccionar componentes de mayor confiabilidad
Derar componentes (operar bajo condiciones de menor estrés)
Reducir el número de componentes (simplificación)
Conducir pruebas de cribado para eliminar mortalidad infantil
Mejorar las condiciones de mantenimiento

Tolerancia a fallas (Fault Tolerance)

Redundancia activa (todos los componentes activos simultáneamente)
Redundancia en standby (uno activo, otros en espera)
Diseño robusto que tolera fallas de componentes
Hot swapping (sustitución en caliente sin detener el sistema)
Modos de reversión (operación "limp along" degradada)

El CRE Primer presenta un ejemplo concreto: tres componentes en serie con confiabilidades R₁=98%, R₂=90%, R₃=97% producen RT=85.6%. Si el objetivo es 90%, el componente 2 debe mejorar a al menos 94.7%. Alternativamente, añadir un componente 2 en paralelo eleva el sistema a RT=0.98×0.99×0.97=94.1%, superando el objetivo. La elección depende del costo relativo de mejorar el componente versus añadir redundancia.

Diseño tolerante a fallas (Fault Tolerant Design)

El diseño tolerante a fallas (FT), también conocido como diseño fail-safe, habilita un sistema para continuar operando — posiblemente a un nivel reducido o degradado — en lugar de fallar completamente cuando algún componente, software o subensamble del sistema falla.

→Sin punto único de falla: Ninguna falla individual de componente debe causar una falla del sistema. Triple redundancia en controles de vuelo del Airbus 330 y Boeing 777.
→Aislamiento de fallas: Cuando ocurre una falla, el sistema debe poder aislarla al componente defectuoso. El Built-in Self-Test (BIST) es un ejemplo — permite reparar subensambles fallados mientras el sistema continúa operando.
→Contención de fallas: Algunos mecanismos de falla pueden propagar el fallo al resto del sistema. Los mecanismos que aíslan el componente fallado — como bits de paridad y sistemas RAID — protegen al sistema completo.
→Control de variabilidad: DOE y métodos Taguchi para hacer el diseño insensible a variaciones de parámetros operacionales (voltaje, temperatura, envejecimiento).
→Modos de reversión: Operación degradada o "limp along" cuando la seguridad humana o los peligros ambientales no están involucrados. Ejemplo: neumático run-flat que permite conducción limitada sin presión de aire.

BoK V.A.5 — Human Factors

Factores Humanos en el Diseño

En muchos proyectos de diseño de producto, la integración de las personas en los segmentos de hardware y software es el desafío más complejo — y el factor humano es frecuentemente un componente clave del éxito o falla de la misión.

Los factores humanos deben considerarse en cualquier diseño de producto en tres categorías: seguridad (incluyendo el uso no previsto — los seres humanos son famosos por no seguir instrucciones), mano de obra durante manufactura (diseños que requieren alta precisión artesanal afectan la mortalidad infantil del producto), y mantenibilidad (el diseñador no realiza el mantenimiento, pero es responsable de incluir las consideraciones de mantenimiento).

Ergonomía · Human Factors

Principios universales de diseño humano-máquina

Preguntas por fase de diseño · Comparativo humano vs. máquina · 5 principios

El CRE Primer identifica cinco principios de diseño humano-máquina con aplicación universal: estandarización (¿puede el producto operarse más fácilmente si los componentes clave son estandarizados?), automatización (¿pueden operaciones aburridas, fatigosas o complejas ser automatizadas?), simplificación (¿qué puede eliminarse del diseño?), distribución de carga (¿pueden aliviarse tareas físicas o psicológicas del operador?) y amplificación sensorial (¿qué puede alterarse para asistir el desempeño humano considerando edad, peso, audición, visión y destreza?).

La tabla comparativa humano-máquina del CRE Primer (adaptada de NASA SP-6506) establece que el ser humano es superior en: originalidad y creatividad, reentrenamiento rápido, operar bajo condiciones de sobrecarga, razonamiento inductivo, evaluación de riesgos en eventos inesperados, y sensibilidad a estímulos que las máquinas no detectan. Las máquinas son superiores en: movimientos repetitivos precisos, reacción en microsegundos, almacenar y recuperar grandes cantidades de datos, razonamiento deductivo, y monitoreo uniforme bajo condiciones de estrés.

BoK V.A.6 — Design for X

Diseño para X — DFX

DFX es la familia de disciplinas que incorpora objetivos específicos al proceso de diseño desde sus etapas más tempranas — mucho antes de que los cambios sean costosos.

El DFX integra herramientas como el Quality Function Deployment (QFD) — la "voz del cliente" — para capturar las características de ingeniería que afectan los atributos del cliente y traducirlas al lenguaje del diseñador. El QFD compara características de diseño con la competencia, identifica interacciones positivas y negativas entre características, y establece valores objetivo para la verificación.

DFM

Design for Manufacturability

Diseño orientado a facilitar la fabricación: minimizar operaciones, reducir variación de procesos, estandarizar materiales y métodos de unión.

DFA

Design for Assembly

Reducir el número de partes, orientación y manipulación durante el ensamble. Diseño que permita ensamble con una sola herramienta y en una sola dirección.

DFC

Design for Cost

Optimización de costo del ciclo de vida completo: adquisición, operación, mantenimiento y disposición final. Incluye compensaciones entre costo inicial y costo de campo.

DFT

Design for Testability

Incorporar puntos de prueba accesibles, capacidades Built-in Self-Test (BIST), y diagnósticos que reduzcan el tiempo de detección y aislamiento de fallas.

DFS

Design for Serviceability

Facilitar el acceso a componentes de mantenimiento, reducir el número de herramientas necesarias, y estandarizar los intervalos de mantenimiento para simplificar la planificación.

DfE

Design for Environment

Minimizar el consumo de energía durante el uso, minimizar emisiones y residuos, facilitar el reciclaje y disposición al final de la vida útil.

Fuente: CRE Primer, Sección VIII — Reliability Designs, V.A.6. Design for X Introduction.

BoK V.A.7 — Design for Reliability

Diseño para la Confiabilidad — DfR

El DfR es la práctica de incorporar metas cuantitativas de confiabilidad desde las primeras etapas del proceso de diseño, cuando los cambios son menos costosos y más efectivos.

La tolerancia a fallas es el corazón del DfR para sistemas críticos. El CRE Primer establece que los criterios para determinar qué componentes son elegibles para enfoques tolerantes a fallas incluyen: cuán crítico es el componente (en un marcapasos, casi toda función es crítica), cuán probable es que falle (un eje de transmisión raramente falla; las luces externas de un avión pueden predecirse), y cuán costoso es hacerlo tolerante a fallas (un motor redundante de avión puede ser prohibitivo en costo y peso).

DfR — V.A.7

Características del diseño tolerante a fallas

Shooman (2002) · Blischke (2003) · O'Connor (2002) · BIST · N-versiones

Las seis características básicas del diseño tolerante a fallas son: (1) ningún punto único de falla de componente debe causar falla del sistema, (2) ningún punto único de reparación debe detener el sistema, (3) aislamiento de fallas al componente fallado, (4) contención de fallas para prevenir propagación, (5) control de variabilidad por diseño o selección de componentes, y (6) modos de reversión o "limp along" deseables.

Para software, los métodos de tolerancia a fallas incluyen: software de auto-verificación, inyección de fallas, análisis de circuitos ocultos, bloques de recuperación, programación N-versiones, opciones de votación, advertencias y banderas en el sistema, y límites de configuración. El software que "aprende" mientras opera representa la nueva frontera del FT en sistemas embebidos modernos.

"No hay tal cosa como certeza absoluta, pero existe la garantía suficiente para los propósitos de la vida humana."

— John Stuart Mill, 1859 · Epígrafe de la Sección VIII — Reliability Designs, CRE Primer

BoK V.B.1 y V.B.2 — Parts and Systems Development

Selección de Partes, Derating y Estandarización

La selección adecuada de partes es uno de los mecanismos más poderosos y económicos para mejorar la confiabilidad: componentes probados, estándar y correctamente deratados crean una base de confiabilidad robusta desde el inicio.

El CRE Primer define el derating (MIL-STD-721C) como: "el uso de un ítem de tal manera que los estrés aplicados están por debajo de los valores nominales, o la reducción del valor nominal de un ítem en un campo de estrés para permitir un incremento en el valor nominal en otro campo de estrés." La tasa de falla de un componente es una combinación de la resistencia de ese ítem relativa a los estrés aplicados — a menores estrés, generalmente se observa una menor tasa de falla.

Valores típicos de derating por tipo de componente — RAC RBPR-3 (1996)

Capacitores

Voltaje DC: 60% (severo) · 90% (benigno)
Disipación de potencia: 70% · 90%
Temperatura máxima de unión: 125°C

Microcircuitos

Voltaje de alimentación: ±5%
Fan Out: 80% (severo) · 90% (benigno)
Temperatura máxima de unión: 125°C

Resistores

Disipación de potencia: 50% (severo) · 80% (benigno)
Temperatura desde límite máximo: 30°C (severo)
Regla práctica: 50% derating → reducción >30% en tasa de falla

El CRE Primer presenta el caso clásico de Rolls Royce: el intento de introducir paletas de composites no metálicas en el motor R8211 — superiores en peso y resistencia — que nunca alcanzaron la confiabilidad requerida, casi llevando a la quiebra a la compañía. Este caso ilustra el riesgo de la tecnología no probada o exótica en aplicaciones críticas.

Criterios de selección de partes — RAC RBPR-3

Para la selección adecuada de partes se deben considerar: definición del entorno operativo, establecimiento de requisitos de vida útil, uso de modelos de confiabilidad para estimar la vida bajo condición de uso, derating de los componentes al estrés máximo permitido, seleccionar solo partes aprobadas en la lista de partes preferidas de la empresa, evitar partes casi obsoletas o con fuente única de suministro, y evitar el uso de tecnología no probada o exótica en aplicaciones críticas.

BoK V.C.1 — Maintainability

Mantenibilidad y Estrategias de Mantenimiento

La mantenibilidad no es un atributo que se añade después del diseño — es una característica intrínseca del diseño que determina cuánto tiempo, esfuerzo y costo se requerirán para restaurar el activo a su función prevista después de una falla.

Mantenimiento Correctivo

Reactivo · Falla ocurrida

Se realiza después de que ocurrió la falla para restaurar la función del sistema. El objetivo es minimizar el MTTR. En equipos no críticos con tasa de falla constante (fase de vida útil exponencial), puede ser el enfoque óptimo de costo.

Mantenimiento Preventivo

Programado · Basado en tiempo

Se realiza a intervalos predeterminados, independientemente del estado del equipo. El CRE Primer presenta el modelo de costo de Dodson (1994) para determinar el tiempo óptimo entre PM usando la distribución Weibull: T = m·θ + δ, donde m depende del cociente Cf/Cp y del parámetro β.

Mantenimiento Predictivo

Basado en condición · Monitoreo continuo

Monitorea el estado real del equipo para predecir la falla antes de que ocurra. Las técnicas incluyen: análisis de vibración, termografía, análisis de aceite y ultrasonido. Los datos recolectados incluyen ruido, velocidad, flujos, temperaturas, vibración, posicionamiento, precisión, emisiones y corrosión.

RCM — Reliability Centered

Moubray (1997) · MSG-3 · Tercera generación

Proceso para determinar los requisitos de mantenimiento de cualquier activo físico en su contexto operacional. Determina qué debe hacerse para asegurar que el activo continúe realizando su función mediante análisis de los modos de falla, sus consecuencias y las tareas que pueden prevenirlos o predecirlos.

Reliability Centered Maintenance — El proceso de 7 preguntas

El RCM es la piedra angular de la tercera generación del mantenimiento. La primera generación (hasta la Segunda Guerra Mundial) se basaba en "reparar cuando se rompe." La segunda generación (hasta mediados de los 70s) introdujo el mantenimiento preventivo a intervalos fijos. La tercera generación — el RCM — es ahora: disponibilidad más alta, mayor seguridad, mejor calidad del producto, mayor vida útil de equipos costosos y mayor efectividad en costos.

// El proceso RCM requiere responder 7 preguntas — Moubray (1997)

01¿Cuáles son las funciones y expectativas de desempeño del activo en su contexto operacional actual?
02¿De qué manera falla el activo en el cumplimiento de sus funciones?
03¿Qué causa cada falla funcional?
04¿Qué sucede cuando ocurre cada falla?
05¿De qué manera importa cada falla?
06¿Qué puede hacerse para predecir o prevenir cada falla?
07¿Qué debe hacerse si no se puede encontrar una tarea de prevención apropiada?

Estudios de RCM en la industria aeronáutica revelaron que la curva de bañera (Curva 1) describe solo el 4% de los componentes. El 89% de los componentes no exhibe envejecimiento o desgaste durante la vida útil del avión. El 72% de los componentes sí experimenta mortalidad infantil. Implicación crítica: los programas de sobrerrevisión a intervalos fijos son contraproducentes para la mayoría de los componentes — aumentan la mortalidad infantil sin beneficiar la fase de desgaste.

Las 6 curvas de confiabilidad del RCM — Smith (1993)

El análisis RCM reveló 6 patrones de falla en componentes de aeronaves. Curva 1 (4%): curva de bañera clásica. Curva 2 (2%): región de envejecimiento pronunciada. Curva 3 (5%): envejecimiento gradual. Curvas 4, 5 y 6 (89%): sin envejecimiento ni desgaste durante la vida útil. Curva 6 (y la 1) exhiben mortalidad infantil. Esta distribución demuestra que las revisiones programadas para toda la flota causan más daño que beneficio — la estrategia de mantenimiento debe ser específica al tipo de curva de falla del componente.

BoK V.C.1 — Maintenance Strategies

Mantenimiento Productivo Total — TPM

El TPM extiende la responsabilidad del mantenimiento al operador del equipo, creando un ambiente donde los objetivos de cero averías y cero defectos son alcanzables a través de la participación activa de toda la organización.

Seiichi Nakajima (Japan Institute of Plant Maintenance) es el creador del TPM, cuyo objetivo es maximizar la efectividad total del equipo mediante la participación activa de los operadores en la inspección, limpieza, mantenimiento rutinario y reparaciones menores. Los resultados documentados incluyen: reducción de averías al 2% del nivel base, aumentos del 25% en utilización de equipos, reducción del 90% en defectos de calidad, y mejoras de productividad del 40%.

Las "6 grandes pérdidas" del TPM que deben eliminarse

Pérdidas por tiempo de inactividad: (1) Fallas de equipo por averías, (2) ajustes y preparaciones. Pérdidas de velocidad: (3) paros menores e idling, (4) velocidad reducida. Pérdidas por defectos: (5) defectos en el proceso, (6) rendimiento reducido al arranque. El programa TPM típicamente requiere un esfuerzo de tres años para alcanzar resultados significativos, con inversiones adicionales en restauración de equipos y capacitación del personal.

BoK V.C.1 — Availability and Maintainability

Disponibilidad, MTTR y Repuestos

La disponibilidad es la métrica que integra la confiabilidad (MTBF) y la mantenibilidad (MTTR) en una medida operacional del desempeño del sistema — cuánto tiempo el activo está disponible para realizar su función.

Nivel I

Disponibilidad Inherente

Aᵢ = MTBF / (MTBF + MTTR)

Estado ideal: las reparaciones comienzan inmediatamente al fallo, los repuestos están disponibles y los recursos listos. Ignora tiempos de espera administrativos y logísticos.

Nivel II

Disponibilidad Lograda

Aₐ = MTBM / (MTBM + MMT)

Basada en acciones de mantenimiento preventivo y correctivo, y el tiempo promedio de acción de mantenimiento (MMT). Los repuestos están disponibles y los recursos listos.

Nivel III

Disponibilidad Operacional

Aₒ = MTBM / (MTBM + MDT)

El cálculo más realista: incluye el tiempo de inactividad medio (MDT) que considera demoras por mala coordinación, repuestos sin inventario y falta de recursos. Es la métrica que los clientes experimentan en campo.

Asignación de MTTR y repuestos

MTTR del sistema — Asignación (MIL-HDBK-472, Método II)

MTTR = Σ(λᵢ · tᵢ) / Σλᵢ | Factor de ajuste K iterativo hasta MTTR_a = requisito

λᵢ = tasa de falla del subsistema i | tᵢ = tiempo de reparación del ítem i
Ejemplo del CRE Primer (Ej. 9.1): 4 componentes, MTTR objetivo = 3.0 horas. Con K=1.0 → MTTR_a=3.18. Con K=0.9427 → MTTR_a=3.00 (exacto). Las horas MTTR finales asignadas: A=2.5h, B=1.7h, C=3.9h, D=3.3h.

Requisito de repuestos (Doty, 1989): Repuestos/unidad = λt + Z_(1-α)·√(λt) | Donde λt es el número esperado de fallas y Z_(1-α) es el desvío normal estándar para la confianza deseada.

El CRE Primer presenta el Análisis ABC para gestión de inventarios de repuestos: el 20% de los ítems representa el 80% del costo (Categoría A — requiere atención muy cercana), el siguiente 30% es Categoría B, y el 50% restante es Categoría C. Las políticas de reorden, el EOQ (Cantidad Económica de Pedido) y la simulación Monte Carlo son las herramientas cuantitativas disponibles para optimizar los niveles de inventario de repuestos.

Optimización del reemplazo preventivo — Modelo de Dodson (1994)

El tiempo óptimo entre acciones de mantenimiento preventivo se encuentra minimizando el costo total por unidad de tiempo, balanceando el costo de PM (Cp) y el costo de falla (Cf). El CRE Primer presenta el Ejemplo 9.2: Cp=$80, Cf=$2,400, β=3.0, θ=120 días, δ=3. Cf/Cp=30 → m=0.258 → T=0.258×120+3=34 días como intervalo óptimo de PM. El Ejemplo 9.3 con horas demuestra que la sensibilidad alrededor del óptimo es importante: 300h cuesta $27,740/año; 290h cuesta $28,091/año; 350h cuesta $28,627/año.

Síntesis del Dominio V

El Dominio V como Integrador del Ciclo de Vida

La confiabilidad del ciclo de vida no es la suma de herramientas independientes — es el resultado de una filosofía coherente aplicada desde la primera decisión de diseño hasta la última hora de operación del activo.

El Dominio V del CRE BoK 2025 establece que el ingeniero de confiabilidad interviene en cada fase del ciclo de vida del producto: en concepto, define metas de garantía; en diseño, aplica DfR, DOE, estrés-resistencia y DFX; en verificación, asegura que los requisitos de confiabilidad se cumplen; en producción, coordina con RCM y TPM para optimizar el mantenimiento; y en el fin de vida, asesora sobre el reemplazo versus reparación y la disposición responsable.

Lo que distingue al DfR del DFX genérico es su énfasis en los números: objetivos cuantitativos de confiabilidad traducidos a decisiones de diseño verificables. Un componente derated al 50% de su capacidad, operando en un sistema RCM-gestionado con repuestos optimizados por la distribución Weibull, no es el resultado de intuición — es el resultado de las herramientas cuantitativas que el Dominio V del CRE BoK pone en manos del ingeniero.

Posición del Dominio V en el BoK CRE 2025 y para el examen

El Dominio V — Life-Cycle Reliability — es el dominio que más requiere síntesis de todos los dominios anteriores. Para el examen CRE, los temas con mayor frecuencia de evaluación en este dominio incluyen: análisis estrés-resistencia (con cálculo de Z y probabilidad de falla), diseño robusto de Taguchi (los tres pasos y los tres casos de razón S/N), los seis criterios del diseño tolerante a fallas, los valores de derating de componentes electrónicos, el proceso de 7 preguntas del RCM, las 6 curvas de confiabilidad de RCM, los tres niveles de disponibilidad (con sus fórmulas), y el cálculo del MTTR del sistema mediante el factor K iterativo.