- Hochleistungsdatenbanksystem
-
"Ein Hochleistungs-Datenbanksystem ist ein Datenbanksystem, welches bei vielen gleichzeitigen Anfragen und hohen Transaktionsraten kurze Antwortzeiten, hohen Durchsatz und hohe Verfügbarkeit auch bei großen Datenmengen garantieren kann."
Typische Einsatzbereiche für Hochleistungsdatenbanksysteme sind Online Transaction Processing (OLTP) und Online Analytical Processing (OLAP). Beispiele von Einsatzgebieten der Hochleistungsdatenbanksysteme sind E-Commerce, E-Bibliotheken, Geoinformationssysteme, multimediale Archive u. a.
Zu den Hochleistungsdatenbanksystemen zählen zurzeit vorwiegend parallele Datenbanksysteme und wenige Datenbankmaschinen wie beispielsweise Teradata Database, GAMMA u. a. Voraussichtlich können zukünftig wesentlich mehr Datenbankmaschinen als Hochleistungs-DBS auf Grund der Fortschritte in der Entwicklung der Hardwaretechnologien realisiert werden. Diese Entwicklung ist bei Datenbankmaschinen jedoch anscheinend noch nicht eingetreten.
Zu den wichtigsten Anforderungen an Hochleistungsdatenbanksysteme zählen:
- Kurze Antwortzeiten/hoher Durchsatz und
- Hochverfügbarkeit.
Kurze Antwortzeiten/hoher Durchsatz
Die Erfüllung der Anforderungen 'Kurze Antwortzeiten/hoher Durchsatz' hängt überwiegend von folgenden Faktoren ab:
- Interprozessorkommunikationsaufwand,
- Parallelverarbeitungsmöglichkeiten,
- Lastbalancierung,
- Cache-Kohärenzkontrolle,
- Synchronisation.
Folgende Auswirkungen haben die oben fünf genannten Faktoren: Niedriger Kommunikationsaufwand verbessert die Antwortzeiten und den Durchsatz bei Anfragen und Transaktionen. Parallelität auf der Hardware- und/oder Softwareebene können Anfragen bzw. Transaktionen erheblich beschleunigen. Effiziente Lastbalancierung sorgt für eine gleichmäßige Prozessorauslastung und ermöglicht damit eine Beschleunigung der Beantwortung von Anfragen. Zu hoher Aufwand für die Cache-Kohärenzkontrolle und aufwändige Synchronisation erfordern i. d. R. zusätzlichen Kommunikations- und Verwaltungsaufwand und führen zur Verschlechterung der Antwortzeiten und der Minimierung des Durchsatzes.
Hochverfügbarkeit
Eine der wichtigsten Anforderungen an Hochleistungsdatenbanksysteme ist die Fähigkeit, eine hohe Verfügbarkeit der Datenbank beim Ausfall von Hardwarekomponenten zu garantieren. In einem System mit mehreren Tausend Prozessoren ist beispielsweise die Wahrscheinlichkeit von Prozessorenausfällen deutlich höher als in einem System mit nur einem Prozessor. Die Problematik der Hochverfügbarkeit in verteilten Datenbanksystemen ist deshalb von großer Bedeutung. Nach der Klassifizierung von Harvard Research Group (HRG) wird ab einer Verfügbarkeit von mindestens 99,99 Prozent ein System als hochverfügbar bezeichnet. Die Verfügbarkeit des Datenbanksystems darf nur minimal unterbrochen werden, das gilt entweder für festgelegte Zeiten oder zu den Hauptbetriebszeiten. Beispielsweise darf bei Forderung der Hochverfügbarkeit von 24 Std/Tag das Datenbanksystem nur 0,14449 Minuten pro Tag, beziehungsweise ca. 52 Min. im Jahr, ausfallen.
Literatur
- Larissa Janssen: Hochleistungs-Datenbanksysteme: Theorie und Praxis. Books on Demand GmbH, 2008, ISBN 3-8334-9326-7.
Wikimedia Foundation.