- Zuverlässigkeitstechnik
-
Die Zuverlässigkeit eines technischen Produkts ist eine Eigenschaft (Verhaltensmerkmal), die angibt, wie verlässlich eine dem Produkt zugewiesene Funktion in einem Zeitintervall erfüllt wird. Sie unterliegt einem stochastischen Prozess und kann qualitativ oder auch quantitativ (durch die Überlebenswahrscheinlichkeit) beschrieben werden, sie ist nicht unmittelbar messbar.
Hiervon sind die sogenannten deterministischen Eigenschaften (Merkmale) eines Produkts zu unterscheiden, welche direkt messbar sind (wie Gewicht, Abmessungen, Festigkeit, Farbe, elektrische und Wärmeleitfähigkeit).
Das Merkmal Zuverlässigkeit ist allen technischen Produkten inhärent, das heißt, dass kein technisches Produkt frei von der Möglichkeit auszufallen ist.
Die Zuverlässigkeit eines Produkts kann entweder empirisch, durch die Ermittlung der Ausfallhäufigkeit, oder analytisch, aus der Ableitung der Zuverlässigkeitswerte der Teile des Produkts, ermittelt werden. Bei einfachen technischen Geräten wird in der Regel der empirische Ansatz gewählt. Bei komplexen industriellen Großanlagen kann der Zuverlässigkeitsnachweis hinsichtlich gefährlicher Zustände in aller Regel nur analytisch geführt werden.
Inhaltsverzeichnis
Historie der Zuverlässigkeitstechnik
Die Entwicklung erster militärischer Fluggeräte in den 1940er und -50er Jahren war mit hohen Ausfallraten der Fluggeräte verbunden (V1-Rakete in Deutschland, Minuteman System in den USA /VDI 4002/, /MIL-HDBK-338/). Je umfangreicher und komplexer ein Gerät war, desto fehleranfälliger zeigte es sich. Es bestand daher die Notwendigkeit, Methoden zu entwickeln, mit denen die Zuverlässigkeit der Geräte gesteigert werden konnte. Dieses leitete die Entwicklung der Zuverlässigkeitsmethoden ein und ließ die Disziplin Zuverlässigkeitstechnik entstehen.
In einer der ersten deutschsprachigen Zuverlässigkeitsliteratur, Technische Zuverlässigkeit, Messerschmitt-Bölkow-Blohm, Springer Verlag, 1977 heißt es:
„Die Zuverlässigkeit ist eine Sacheigenschaft, die durch eine statistisch zu messende Größe aufgrund beobachteter Ausfallhäufigkeiten empirisch oder mit Hilfe der Wahrscheinlichkeitsrechnung abgeschätzt werden kann.“
Der Bedarf nach geeigneten Methoden zur Ermittlung der Zuverlässigkeit technischer Produkte zeigte sich insbesondere in der Luft- und Raumfahrt und mit einigem Zeitversatz in der Kerntechnik. Die Modellierung der großtechnischen Systeme mit dem einfachen Blockdiagramm (Black Box) war nicht mehr ausreichend und erforderte verbesserte Methoden. In der amerikanischen Luft- und Raumfahrt kamen bereits Ende der 1960er-Jahre die Methoden der Fehlerbaum-, Ausfallart- und Fehlereffekt- (FMEA) und Fault Hazard Analyse zur Anwendung (beispielsweise Boeing – System Safety Documents).
In Deutschland erhielt die Zuverlässigkeitstechnik mit der Gründung des VDI-Fachausschusses Zuverlässigkeit und Qualitätskontrolle im Jahr 1964 /VDI 4001/ und dem DIN-Facharbeitskreis Fachbereich KT Zuverlässigkeit kerntechnischer Anlagen ihre wesentliche methodische Grundlage. Sie fand ihren Niederschlag im VDI-Handbuch Technische Zuverlässigkeit /VDI 4001/ sowie in den DIN-Normen Fehlerbaum-, Ereignisbaum-, Ausfallart- und Fehlereffekt-Analyse /DIN 25 424, DIN 25 419, DIN 25 448/. Diese Normen wurden über mehrere Jahre der Facharbeitstätigkeit erarbeitet und haben noch heute ihre Gültigkeit. Die Verwendung der verschiedenen Analysearten war jedoch je nach Erfahrungsstand des Anwenders sehr unterschiedlich. Es fehlte noch ein gesamtheitlicher Ansatz für die Methoden.
Aus diesem Erfahrungsstand heraus entwickelte sich auch die Methode der Risikoanalyse, die sich gleichermaßen der Methoden der Zuverlässigkeitstechnik bedient. Mit der ersten Risikoanalyse für eine großtechnische Anlage, der sogenannten „Rasmussen-Studie” WASH-1400 Reactor Safety Study, an Assessment of Accident Risk in US Commercial NPP, NUREG -75/014, 1975 wurde auch erstmals ein gesamtheitlicher Ansatz für die Ereignisbaum- und Fehlerbaumanalyse erarbeitet. Die zu analysierenden Störfallabläufe waren derart komplex, dass sie nicht unmittelbar in einem Fehlerbaummodell dargestellt werden konnten. Die logischen Strukturen der Störfallabläufe ließen sich ungleich übersichtlicher in Ereignisbäumen darstellen. Über die Verzweigungspunkte im Ereignisbaum sind die Systeme, die zur Beherrschung des Störfalls dienen, eingebunden. Sie werden in dann in den Fehlerbäumen analysiert und dargestellt. Das Risikomodell der Gesamtanlage besteht dementsprechend aus einer Vielzahl von ineinander verzahnter Ereignis- und Fehlerbäume, die in ihrer Gesamtheit nur noch mit den Mitteln eines Rechenprogramms analysiert und qualitätsgesichert werden können.
Mit der Anwendung der Risikoanalyse wurde auch der Bedarf für eine Weiterführung der Zuverlässigkeits-Methoden deutlich, wie zum Beispiel die Human Factor Analyse (Menschlicher Faktor) (/VDI 4006/), die Analyse des abhängigen Ausfalls redundanter Komponenten (sogenannte Gemeinsam verursachte Ausfälle, GVA oder Common cause failure, CCF) und die Quantifizierung der Unsicherheiten der Analyseergebnisse.
Die Methoden und Begriffe der Zuverlässigkeitstechnik sind heute in den nationalen und internationalen Normenwerken und Risikostandards umfassend beschrieben und gelten im Grundsatz für alle technischen Produkte und Systeme (vergleiche auch Abschnitt Anwendungsbereiche der Zuverlässigkeitstechnik).
Zuverlässigkeitsmodelle
Die Zuverlässigkeiten großtechnischer Anlagen – wie ein Chemiewerk oder Kernkraftwerk – können aufgrund ihrer Komplexität und der geringen Versagenswahrscheinlichkeiten nicht allein aus der Betriebsbeobachtung gewonnen werden. Hierzu bedient man sich analytischer Zuverlässigkeitsmodelle, wie dem Fehlerbaum- und Ereignisbaummodell, in denen die Ausfallstruktur des Gesamtsystems abgebildet und berechnet wird. Die Berechnung der Zuverlässigkeit beziehungsweise der Versagenswahrscheinlichkeit des Gesamtsystems erfolgt dann auf der Grundlage der empirisch gewonnenen Ausfallhäufigkeiten (Ausfallraten) der Einzelkomponenten des Systems. Die mathematische Ableitung der Zuverlässigkeit durch die Ausfallrate ist in Ausfallrate dargestellt.
Die Durchführung komplexer Zuverlässigkeitsanalysen erfordert ein erfahrenes Bearbeitungsteam, eine systematische Planung aller erforderlichen Arbeitsschritte, eine geeignete Zuverlässigkeitsdatenbasis und eine Zuverlässigkeitssoftware.
Diese organisatorische Aufgabe wird mit Zuverlässigkeitsmanagement (Dependability Management) bezeichnet und ist in VDI 4003 und IEC 60300 umfassend beschrieben. VDI 4003 gibt auch einen Gesamtüberblick über die Vielzahl der heute zur Anwendung kommenden analytischen Methoden zur Zuverlässigkeitsanalyse und -ermittlung.
Zuverlässigkeitsdaten
Die Ermittlung verlässlicher probabilistischer Daten ist für die Zuverlässigkeitsanalyse von besonderer Bedeutung. Sie werden aus der Betriebserfahrung im Einsatz der technischen Produkte gewonnen, in dem die Häufigkeiten und Ursachen der Ausfälle gleichartiger Produkte systematisch ausgewertet werden.
Die Erfahrungen aus diesen Datenerhebungen zeigen, dass das Ausfallverhalten technischer Produkte über ihre Lebensdauern generell drei verschiedene Phasen durchläuft. Zu Beginn des Einsatzes des Produktes treten vermehrt die sogenannten Frühausfälle auf, die durch anfängliche Auslegungsschwächen begründet sind und mit zunehmender Betriebserfahrung ausgemerzt werden. Danach schließt sich die sogenannte Brauchbarkeitsphase an, die durch ein geringes und weitgehend konstantes Ausfallverhalten gekennzeichnet ist. Die Ausfallwahrscheinlichkeit eines solchen Systems ist exponentialverteilt. Am Ende der Lebensdauer treten vermehrt Verschleißausfälle auf, die wiederum zum Anstieg der Ausfallhäufigkeit – bis hin zur Unbrauchbarkeit des Produktes – führen. Der Verlauf der Ausfallrate ist durch die sogenannte „Badewannen-Kurve“ („Bathtube curve“) (Gerätelebensdauer) charakterisiert (/VDI 4010, Blatt 3/). Zur Modellierung dieses Alterungsprozesses wird die Weibull-Verteilung verwendet. Die Ermittlung von Lebensdauerdaten kann u.a. mittels End of Life Tests erfolgen.
MTBF (engl.: mean time between failure) ist auch ein Maß für die Zuverlässigkeit von Einheiten (Baugruppen, Geräte oder Anlagen), die instandgesetzt werden. Für den Fall, dass die Ausfallrate konstant ist (die Zuverlässigkeitsgröße ist exponentialverteilt), erhält man aus dem Kehrwert der Ausfallrate den MTBF.
Die systematische Erhebung von Zuverlässigkeitsdaten aus der Betriebserfahrung ist in der Regel aufwendig, kostenintensiv und über längere Zeiträume notwendig. Die Bereitstellung qualifizierter Zuverlässigkeitsdaten erfordert nicht nur ein erfahrenes Team von Zuverlässigkeitsexperten, sondern auch die – nicht immer selbstverständliche – Mitwirkung von erfahrenen Betriebsingenieuren, die für eine qualifizierte Beurteilung der beobachteten Ausfallursachen notwendig sind. Allgemein zugängliche Zuverlässigkeitsdatenbanken standen daher – im Vergleich zu den Zuverlässigkeitsmethoden – auch erst zu einem sehr viel späteren Zeitpunkt zur Verfügung.
Begriffsdefinitionen
Der Begriff Zuverlässigkeit (Reliability/Dependability) hat in den Normwerken zwei unterschiedliche Bedeutungen. Er wird einerseits als ein übergeordnetes Merkmal, das andere Merkmale mit einschließt, und andererseits als alleinstehendes Merkmal angesehen (vgl. nachstehende Definitionen). Die zum Teil abweichenden Definitionen im deutschen und englischen Sprachraum machen auch deutlich, dass der Prozess der Begriffsdefinitionen zur Zuverlässigkeitstechnik noch nicht abgeschlossen ist.
- Zuverlässigkeit
- Zusammenfassender Ausdruck für die Funktionszuverlässigkeit, Verfügbarkeit, Sicherheit, Instandhaltbarkeit. (VDI 4003 – Zuverlässigkeitsmanagement, 2005-07)
- „Beschaffenheit einer Einheit bezüglich ihrer Eignung, während oder nach vorgegebenen Zeitspannen bei vorgegebenen Anwendungsbedingungen die Zuverlässigkeitsforderung zu erfüllen.“ (DIN 40 041, Dez. 1990)
- Dependability
- „Collective term used to describe the availability performance and its influencing factors: reliability performance, maintainability performance and maintenance support performance.“ (IEC 60050, 191-02-06)
- RAMS
- Abkürzung für Reliability, Availability, Maintainability, Safety
Der Begriff RAMS hat sich in verschiedenen Industriebranchen durchgesetzt, wie beispielsweise in EN 50126: Bahnanwendungen – Spezifikation und Nachweis der Zuverlässigkeit, Verfügbarkeit, Instandhaltbarkeit, Sicherheit (RAMS); Deutsche Fassung: 1999
- Funktionszuverlässigkeit
- Fähigkeit einer Betrachtungseinheit, eine geforderte Funktion unter gegebenen Bedingungen für ein gegebenes Zeitintervall zu erfüllen. Die Funktionszuverlässigkeit kann einerseits qualitativ beschrieben oder andererseits quantitativ als Überlebenswahrscheinlichkeit ermittelt werden. (VDI 4003)
- Reliability
- „The ability of an item to perform a required function under given conditions for a given time interval.“ (IEC 60050, 191-02-06)
- „The probability that an item can perform a required function under given conditions for a given time interval.“ (IEC 50, 1992)
- „The capability of the software product to maintain a specified level of performance when used under specified conditions.“ (IEC 9126-1, 2001)
- Verfügbarkeit
- Fähigkeit einer Einheit, zu einem gegebenen Zeitpunkt oder während eines gegebenen Zeitintervalls eine geforderte Funktion unter gegebenen Bedingungen erfüllen zu können, vorausgesetzt, dass die erforderlichen äußeren Hilfsmittel bereitgestellt sind. (IEV 191-02-05)
- Betrachtungseinheit
- Die Betrachtungseinheit (auch Einheit) ist Gegenstand der Zuverlässigkeitsuntersuchung, sie kann Teil eines Produktes oder das gesamte Produkt sein. Sie muss definiert werden. (VDI 4003)
- Produkt
- Unter dem Begriff Produkt werden eindeutig beschriebene, lieferbare, aus Hardware- und/oder Software-Anteilen zusammengesetzte Geräte, Systeme, Verfahren, Prozesse, Anlagen und Dienstleistungen verstanden und als abgegrenzte Einheit (Betrachtungseinheit) aufgefasst. (VDI 4003)
- Beispiele:
- Straßenverkehr - Verkehrswege (Straßen) - Verkehrsregeln - Fahrzeuge - Personen (Fahrer, Passanten)
- Fahrzeuge - Fahrzeugteilsysteme (Bremssystem) - Scheibenbremse - Bremsklötze.
Die Begriffe Produkt, Betrachtungseinheit und System werden im Sinne der hier genannten Definitionen als synonym verstanden.
Ziele des Zuverlässigkeitsmanagements
Allgemein
- Nachweis einer geringen Ausfallwahrscheinlichkeit des Produkts
- Optimierung der Zuverlässigkeit, Verfügbarkeit, Instandhaltung und Sicherheit des Produkts über seinen gesamten Lebenszyklus
- Systemverbesserung durch Vergleich alternativer Systementwürfe mittels Zuverlässigkeitsbewertung
- Erkennung kritischer Komponenten (Schwachstellenanalyse)
- Optimierung der Instandhaltungsprozesse
Spezifisch
- Gewinnung von Planungswerten für den Einsatz des Produktes unter ökonomischen wie Risikoaspekten
- Definition der Zuverlässigkeitsziele – Vergleich der Zielwerte mit Daten aus der Betriebsbeobachtung
- Garantie, Gewährleistung, Produkthaftung.
- Aufbau einer Wissensbasis über die Zuverlässigkeitsmerkmale des Produkts.
Zuverlässigkeitserhöhende Maßnahmen
- Einsatz betriebsbewährter und qualifizierter Komponenten
- Einsatz redundanter und diversitärer Komponenten
- Maßnahmen der Fehlerselbsterkennung
- Anwendung des Prinzips „Fail-Safe“
- Prüfbarkeit der Komponenten und Systemkomplexe
- Qualifizierung der Instandhaltung der Komponenten
- Ergonomische Gestaltung der Bedienbarkeit der Komponenten
- Auswertung des Erfahrungsrückflusses zur Verbesserung der Zuverlässigkeitsdatenbasis, die gleichermaßen Aufschluss über die Effektivität des Zuverlässigkeitsmanagements gibt.
Anwendungsbereiche und Regelwerke der Zuverlässigkeitstechnik
Die Anwendung der Zuverlässigkeitstechnik in den verschiedenen Industriebereichen spiegelt sich ganz wesentlich in den branchenspezifischen Regelwerken wider, welche hier nachfolgend – ohne Anspruch auf Vollständigkeit – aufgeführt sind.
Luft- und Raumfahrt
- FAA: System Safety Handbook, December 2000
- NASA: Fault Tree Handbook with Aerospace Applications, office of safety and mission assurance, W. Vesely et al, Version 1.1, August 2002
- MIL-HDBK-338B Electronic Reliability Design Handbook (1998)
- EUROCONTROL: Review of techniques to support the EATMP safety assessment methodology, Volume 1, 01/2004
Kerntechnik
- NUREG-0492, Fault Tree Handbook, W. E. Vesely, F. F. Goldberg, N. H. Roberts, D. F. Haasl, 1981
- NUREG CR-2300, PRA, Procedure Guide, 1983
- IAEA: Procedures for Conducting Probabilistic Safety Assessment of Nuclear Power Plants (Level 1), Safety Series No. 50-P-4, Vienna, 1992
- Bundesamt für Strahlenschutz:
- Methoden zur probabilistischen Sicherheitsanalyse für Kernkraftwerke, Dez. 1996, BfS-KT-16-97
- Daten zur Quantifizierung von Ereignisablaufdiagrammen und Fehlerbäumen, März 1997, BfS-KT-18/97
Automobilelektronik
- Robustness Validation
- Homepage ZVEI
- Knowledge-Matrix
- Handbook for Robustness Validation of Semiconductor Devices in Automotive Applications, ZVEI, 04/2007
- http://www.sae.org/standardsdev/robustnessvalidation/
Chemie, Öl- & Gasindistrie
- Health and Safety Executive: Application of QRA in operational safety issues, 2002
- NORSOK STANDARD Z-013 Risk and emergency preparedness analysis, 2001-09-01
- American Petroleum Institute: API-Publication 581, Base Resource Document – Risk-Based Inspection [1]
- OREDA – Offshore Reliability Data Handbook (2002)
Bahnindustrie
- EN 50126-2: Bahnanwendungen – Spezifikation und Nachweis der Zuverlässigkeit, Verfügbarkeit, Instandhaltbarkeit, Sicherheit (RAMS); Deutsche Fassung: 1999
- The Yellow Book: Engineering Safety Management Published by Rail Safety and Standards Board on behalf of the UK rail industry [2]
Quellen
- VDI 4001 – Allgemeine Hinweise zum VDI-Handbuch Technische Zuverlässigkeit (1985-10)
- VDI 4002 – Systemtechnische Grundlagen; Erläuterungen zum Problem der Zuverlässigkeit technischer Erzeugnisse und / oder Systeme (1986-07)
- VDI 4003 – Zuverlässigkeitsmanagement (2005-07)
- VDI 4004 – Zuverlässigkeitskenngrößen; Übersicht (1986-09)
- VDI 4006 – Menschliche Zuverlässigkeit; ergonomische Forderungen und Methoden (2002)
- IEC 60300-1 – Dependability management systems (2003)
- IEC 60300-2 – Guidelines for dependability management (2004)
- IEC 9126-1 - Software engineering — Product quality — Part 1: Quality model (2001)
- SN 29500 - Ausfallrate, Bauelement, Erwartungswert; weltweit anerkannte Hausnorm der Siemens AG; (2005)
- MIL-HDBK-338 – Electronic Reliability Design Handbook (1998)
- BfS-KT – Methoden zur probabilistischen Sicherheitsanalyse für Kernkraftwerke (1996)
- VDI 4010 – Überblick über Zuverlässigkeits-Daten-Systeme (ZDS) (1997-03)
- ZEDB – Zentrale Zuverlässigkeits- und Ereignisdatenbank, VGB-TW804 (2004)
- MIL-HDBK-217F – Reliability Prediction of Electronic Equipment (1991)
- OREDA – Offshore Reliability Data Handbook (2002)
- T-Book – Reliability Data of Components in Nordic Nuclear Power Plants.
Wikimedia Foundation.