Hochverfügbarkeit

Hochverfügbarkeit

Hochverfügbarkeit (englisch High Availability) bezeichnet die Fähigkeit eines Systems, trotz Ausfall einer seiner Komponenten mit einer hohen Wahrscheinlichkeit (oft 99,99 % oder besser) einen ununterbrochenen Betrieb zu gewährleisten.

Inhaltsverzeichnis

Verfügbarkeit und Hochverfügbarkeit

Ein System wird als verfügbar bezeichnet, wenn es in der Lage ist, die Aufgaben zu erfüllen, für die es vorgesehen ist. Als Verfügbarkeit wird die Wahrscheinlichkeit bezeichnet, dass ein System innerhalb eines spezifizierten Zeitraums funktionstüchtig (verfügbar) ist. Die Verfügbarkeit wird als Verhältnis aus fehlerbedingter Stillstandszeit (= Ausfallzeit) und Gesamtzeit eines Systems bemessen:

  • \mathrm{Verf\ddot{u}gbarkeit (in~Prozent)} = \left( 1 -  \frac{\mathrm{Ausfallzeit}}{\mathrm{Produktionszeit}+\mathrm{Ausfallzeit}}\right) \cdot 100

oder auch:

  • \mathrm{Verf\ddot{u}gbarkeit (in~Prozent)} = \left(\frac{\mathrm{Produktionszeit (uptime)}}{\mathrm{Produktionszeit (uptime)}+\mathrm{Ausfallzeit (downtime)}}\right) \cdot 100

Die genaue Definition von Hochverfügbarkeit kann variieren. Das Institute of Electrical and Electronics Engineers (IEEE) gibt folgende Definition:

“High Availability (HA for short) refers to the availability of resources in a computer system, in the wake of component failures in the system.”[1]

Eine andere Definition der Hochverfügbarkeit lautet:

„Ein System gilt als hochverfügbar, wenn eine Anwendung auch im Fehlerfall weiterhin verfügbar ist und ohne unmittelbaren menschlichen Eingriff weiter genutzt werden kann. In der Konsequenz heißt dies, dass der Anwender keine oder nur eine kurze Unterbrechung wahrnimmt. Hochverfügbarkeit (abgekürzt auch HA, abgeleitet von engl. High Availability) bezeichnet also die Fähigkeit eines Systems, bei Ausfall einer seiner Komponenten einen uneingeschränkten Betrieb zu gewährleisten.“

Andrea Held: Oracle 10g Hochverfügbarkeit[2]

Hochverfügbarkeit und Verfügbarkeitsklassen

Die Frage, ab welcher Verfügbarkeitsklasse ein System als hochverfügbar einzustufen ist, wird je nach Definition der Verfügbarkeit unterschiedlich beantwortet.

Eine Verfügbarkeit von 99 % definiert im allgemeinen keine Hochverfügbarkeit, sie wird allgemein heutzutage als grundlegend oder normal angesehen, zumindest bei qualitativ hochwertigen EDV-Geräten. Folglich wird von Hochverfügbarkeit erst ab 99,9 % oder höher gesprochen. Ob aber bereits 3*9 ausreichen oder erst 4*9 oder 5*9 ein System zum Hochverfügbaren System machen, ist quellen- und herstellerabhängig sowie unter dem jeweiligen Einsatzszenario zu bewerten. Im allgemeinen kann ein System als hochverfügbar eingestuft werden, wenn seine jährliche Ausfallzeit im Bereich weniger Minuten (~ 99,999 % bzw. AEC-2) oder darunter liegt.

Berechnet man mit der obigen Formel die Verfügbarkeit im Zeitraum eines Jahres, so entspricht eine Verfügbarkeit von 99,99 % beispielsweise einer Stillstandszeit von 52,6 Minuten. Man benutzt nun üblicherweise die Anzahl der Neunen in der Prozentangabe, um die Verfügbarkeitsklasse zu kennzeichnen: so bedeutet das obige Beispiel mit 99,99 % die Verfügbarkeitsklasse 4.

Es folgt eine Übersicht der relevanten Klassen 2 bis 6, wobei ein Jahr mit durchschnittlich 365,25 Tagen, der Monat als 1/12 Jahr gerechnet wird:

Verfügbarkeitsklasse 2
99 % ≡ 438 Minuten/Monat bzw. 7:18:18 Stunden/Monat = 87,7 Stunden/Jahr, d.h. 3 Tage und 15:39:36 h.
Verfügbarkeitsklasse 3
99,9 % ≡ 43:48 min/Monat oder 8:45:58 Stunden/Jahr.
Verfügbarkeitsklasse 4
99,99 % ≡ 4:23 Minuten/Monat oder 52:36 Minuten/Jahr
Verfügbarkeitsklasse 5
99,999 % ≡ 26,3 Sekunden/Monat oder 5:16 Minuten/Jahr
Verfügbarkeitsklasse 6
99,9999 % ≡ 2,63 Sekunden/Monat oder 31,6 Sekunden/Jahr

Availability Environment Classification

Die Harvard Research Group (HRG) teilt Hochverfügbarkeit in ihrer Availability Environment Classification (AEC) in sechs Klassen ein.[3]

HRG-Klasse Bezeichnung Erklärung
AEC-0 Conventional Funktion kann unterbrochen werden, Datenintegrität ist nicht essentiell.
AEC-1 Highly Reliable Funktion kann unterbrochen werden, Datenintegrität muss jedoch gewährleistet sein.
AEC-2 High Availability Funktion darf nur innerhalb festgelegter Zeiten oder zur Hauptbetriebszeit minimal unterbrochen werden.
AEC-3 Fault Resilient Funktion muss innerhalb festgelegter Zeiten oder während der Hauptbetriebszeit ununterbrochen aufrechterhalten werden.
AEC-4 Fault Tolerant Funktion muss ununterbrochen aufrechterhalten werden, 24/7-Betrieb (24 Stunden, 7 Tage die Woche) muss gewährleistet sein.
AEC-5 Disaster Tolerant Funktion muss unter allen Umständen verfügbar sein.

Vereinbarter Zeitraum der Verfügbarkeit

Die Hochverfügbarkeit wird in Unternehmen häufig im Rahmen von Service Level Agreements (SLA) definiert, und stellt ein wesentliches Bewertungskriterium für IT-Services dar.

Viele hochverfügbare Systeme müssen 24 Stunden * 7 Tage online sein, also das ganze Jahr "rund um die Uhr". Manche dieser Systeme müssen die Eigenschaft der Hochverfügbarkeit jedoch nur für einen bestimmten Zeitausschnitt haben: Handelssysteme der Deutschen Börse etwa brauchen nachts und an börsenfreien Tagen nicht hochverfügbar zu sein. Die Hochverfügbarkeit bezieht sich bei diesen Systemen damit nur auf die Tageszeit und/oder die Arbeitstage, an denen es benötigt wird.

Voraussetzungen für hohe Verfügbarkeiten

Generell streben HA-Systeme danach, sogenannte Single-Point-of-Failure-Risiken (SPOF) zu eliminieren (ein SPOF ist eine einzelne Komponente, deren Versagen zum Ausfall des gesamten Systems führt).

Ein Hersteller eines hochverfügbaren Systems muss dieses mit folgenden Merkmalen ausstatten:

Typische Beispiele für Komponenten, die zum Erreichen einer erhöhten Fehlertoleranz eingesetzt werden, sind unterbrechungsfreie Stromversorgungen (USV, auch UPS), doppelte Netzteile, ECC-Speicher oder der Einsatz von RAID-Systemen. Weiter kommen Techniken zur Serverspiegelung oder auch redundante Cluster zum Einsatz.

Je höher die geforderte Verfügbarkeit ist, desto mehr Aufwand muss der Betreiber investieren in:

  • schnell erreichbares Fachpersonal
  • Ersatzteilverfügbarkeit
  • vorbeugende Wartung
  • qualifiziertes Fehlermeldungs- und schnelles Kommunikationssystem

Hochspezialisierte Systeme mit höchsten Verfügbarkeiten sind die Continuum Serien von Stratus, die aus der Übernahme von Tandem hervorgegangenen Integrity NonStop Serien bei Hewlett-Packard oder die Server der System z Serie der Firma IBM.

Siehe auch

Literatur

  • Martin Wieczorek, Uwe Naujoks, Bob Bartlett (Hrsg.): Business Continuity. Springer, 2003, ISBN 3-540-44285-5.
  • Marcus, Evan u. Stern, Hal: Blueprints for High Availability: Designing Resilient Distributed Systems. John Wiley & Sons, 2000, ISBN 0-471-35601-8.
  • Floyd Piedad, Michael Hawkins: High Availability: Design, Techniques and Processes. Prentice Hall Ptr, 2000, ISBN 0-13-096288-0.

Weblinks

Einzelnachweise

  1. High Availability (HA). IEEE Task Force on Cluster Computing, abgerufen am 26. Oktober 2010 (englisch).
  2. Andrea Held: Oracle 10g Hochverfügbarkeit. Addison-Wesley, 2004, ISBN 3-8273-2163-8.
  3. HRG 2002, siehe auch Andrea Held: Hochverfügbarkeit: Kennzahlen und Metriken. In: TEC Channel. 6. Juni 2005, abgerufen am 26. Oktober 2010.

Wikimedia Foundation.

Игры ⚽ Нужно решить контрольную?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • High-Availability — Der Begriff Hochverfügbarkeit (engl. High Availability) bezeichnet die Fähigkeit eines Systems, bei Ausfall einer seiner Komponenten einen uneingeschränkten Betrieb zu gewährleisten. Typisches Beispiel ist die Ausführung mit einer… …   Deutsch Wikipedia

  • High Availability — Der Begriff Hochverfügbarkeit (engl. High Availability) bezeichnet die Fähigkeit eines Systems, bei Ausfall einer seiner Komponenten einen uneingeschränkten Betrieb zu gewährleisten. Typisches Beispiel ist die Ausführung mit einer… …   Deutsch Wikipedia

  • Application Gateway — Eine externe (Netzwerk oder Hardware ) Firewall (von engl. firewall [ˈfaɪəwɔːl] „die Brandwand“) stellt eine kontrollierte Verbindung zwischen zwei Netzen her. Das könnten z. B. ein privates Netz (LAN) und das Internet (WAN) sein; möglich ist… …   Deutsch Wikipedia

  • Cluster (Computer) — NASA Computercluster Ein Computercluster, meist einfach Cluster (engl. „Schwarm“, „Gruppe“, „Haufen“), bezeichnet eine Anzahl von vernetzten Computern, die von außen in vielen Fällen als ein Computer gesehen werden können. In der Regel sind die… …   Deutsch Wikipedia

  • Cluster Computing — NASA Computercluster Ein Computercluster, meist einfach Cluster (engl. „Schwarm“, „Gruppe“, „Haufen“), bezeichnet eine Anzahl von vernetzten Computern, die von außen in vielen Fällen als ein Computer gesehen werden können. In der Regel sind die… …   Deutsch Wikipedia

  • Cluster Management Software — Ein Cluster Manager ist eine Software für das Management eines Computerclusters (Verbund aus mehreren Rechnern). Er steht für Verwaltungsvorgänge im Cluster zur Verfügung und automatisiert meist Vorgänge wie den Failover vom Primärsystem zum… …   Deutsch Wikipedia

  • Clusterbetrieb — NASA Computercluster Ein Computercluster, meist einfach Cluster (engl. „Schwarm“, „Gruppe“, „Haufen“), bezeichnet eine Anzahl von vernetzten Computern, die von außen in vielen Fällen als ein Computer gesehen werden können. In der Regel sind die… …   Deutsch Wikipedia

  • Clusterknoten — NASA Computercluster Ein Computercluster, meist einfach Cluster (engl. „Schwarm“, „Gruppe“, „Haufen“), bezeichnet eine Anzahl von vernetzten Computern, die von außen in vielen Fällen als ein Computer gesehen werden können. In der Regel sind die… …   Deutsch Wikipedia

  • Clusternode — NASA Computercluster Ein Computercluster, meist einfach Cluster (engl. „Schwarm“, „Gruppe“, „Haufen“), bezeichnet eine Anzahl von vernetzten Computern, die von außen in vielen Fällen als ein Computer gesehen werden können. In der Regel sind die… …   Deutsch Wikipedia

  • Clusterware — Ein Cluster Manager ist eine Software für das Management eines Computerclusters (Verbund aus mehreren Rechnern). Er steht für Verwaltungsvorgänge im Cluster zur Verfügung und automatisiert meist Vorgänge wie den Failover vom Primärsystem zum… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”