- DOLAP
-
Online-Analytical-Processing (OLAP) wird neben dem Data-Mining (auch Datenschürfung) zu den Methoden der analytischen Informationssysteme gezählt. OLAP wird weiterhin den hypothesengestützten Analysemethoden zugeordnet. Der Analyst muss vor der eigentlichen Untersuchung wissen, welche Anfragen er an das OLAP-System stellen möchte. Seine Hypothese wird dann durch das Analyseergebnis bestätigt oder abgelehnt.
OLAP-Systeme beziehen ihre Daten entweder aus den operationalen Datenbeständen eines Unternehmens oder aus einem Data-Warehouse (Datenlager). Hierdurch wird verhindert, dass die Analysedaten mit den transaktionsorientierten Datenbeständen in Kontakt kommen und deren Leistungsfähigkeit beeinträchtigt wird. Ebenso ist die Leistung eines OLAP-Systems von der verwendeten Datenhaltungsform und deren Anbindung an den Analyse-Client abhängig.
Im Gegensatz zum Online-Transaction-Processing (OLTP) steht hier die Durchführung komplexer Analysevorhaben im Vordergrund, welche ein sehr hohes Datenaufkommen verursachen. Das Ziel ist, durch multidimensionale Betrachtung dieser Daten ein entscheidungsunterstützendes Analyseergebnis zu gewinnen. Als besondere Zielgruppe wird hier das Management in seiner Rolle als Entscheidungsträger genannt.
Die OLAP zugrunde liegende Struktur ist ein OLAP-Cube, der aus der operationalen Datenbank erstellt wurde. Dieser ist meist nach dem Sternschema aufgebaut, mit einer Faktentabelle und den jeweiligen Dimensionstabellen.
Inhaltsverzeichnis
Arten
Man unterscheidet zwischen ROLAP („relationales OLAP“), das auf eine relationale Datenbank zugreift, und MOLAP („multidimensionales OLAP“), das auf eine multidimensionale Datenbank zugreift. HOLAP („H“ für „Hybrid“) ist eine Zwischenform zwischen ROLAP und MOLAP. Jeder Typ hat seine Vor- und Nachteile. MOLAP speichert die aggregierten Kennzahlen persistent. Dadurch hat MOLAP einen Performance-Vorteil gegenüber OLAP-Systemen, die zur Laufzeit Kennzahlen aggregieren. ROLAP skaliert besser, ist dafür aber je nach Performance der eingesetzten relationalen Quellen langsamer als MOLAP. Dies liegt bei ROLAP daran, dass die Daten neben den teils vielleicht schon vorausberechneten Aggregationen in einer vielseitigen aber evtl. langsameren Datenbank gespeichert vorliegen, während diese Daten bei MOLAP in geeigneter, schnell zugänglicher Form meist direkt im Dateisystem abgespeichert sind. Ein Vorteil von ROLAP wiederum ist, dass kaum eigener Speicherplatz benötigt wird und vorhandene Datenbanken ausgenutzt werden. Dies bietet sich vor allem bei der Auswertung auf Basis von Massendaten in komplexen Data Warehouse Umgebungen an. HOLAP bietet oft einen guten Kompromiss aus ROLAP und MOLAP. Ein vierter Architekturtyp wird mit DOLAP (D für Desktop) bezeichnet. Hierbei werden die Basisdaten zunächst lokal in den Analyseclient importiert, um eine lokale Analyse vollziehen zu können. Als Nachteil kann hier allerdings eine evtl. zu schwache Hardwareauslegung gesehen werden. Zeitintensiv bei OLAP ist nicht die Auswertung der Daten sondern die Erstellung und Auffrischung der angelegten Cubes. Einen weiteren, neuerdings wieder sehr populären Typ stellt memory based OLAP dar. Hier werden alle Daten im RAM gehalten und alle Werte in Echtzeit berechnet. Diese Technik war in der Vergangenheit hinsichtlich der Datenmengen limitiert. Aufgrund der zunehmenden Verbreitung von 64 Bit Rechner-Architekturen können jedoch heutzutage auch große Datenmengen mit memory based OLAP analysiert werden.
OLAP-Werkzeuge werden häufig durch Multidimensionalität charakterisiert. Durch diese Multidimensionalität sollen relevante betriebswirtschaftliche Kennzahlen (bspw. Umsatz- oder Kostengrößen) anhand unterschiedlicher Dimensionen (z. B. Kunden, Regionen, Zeit) mehrdimensional betrachtet und bewertet werden können. Zur bildlichen Darstellung werden Würfel (Cubes) verwendet. Diese Würfel sind unterteilt in verschiedene Dimensionen, die wiederum in Elemente untergliedert sind. Diese Elemente bilden einen Verdichtungsbaum oder allgemeiner einen nicht zyklischen gerichteten Graphen, welcher die Aggregationen darstellt.
Anforderungen an ein OLAP-System
12 Regeln nach Codd
Der OLAP-Begriff wurde 1993 von Edgar F. Codd geprägt. Er formulierte zunächst 12 Regeln, die er bis zuletzt auf 18 Regeln erweitert hat. Diese Evaluierungsregeln stellten die erste Anforderungsliste an ein OLAP-System dar. Zwar werden diese Regeln noch gern aufgeführt, aber ihre Bedeutung für die Bewertung eines OLAP-Systems kann heute nicht mehr als besonders hoch eingestuft werden. Dies liegt im Besonderen an ihrer stark anwendungsbezogenen Ausrichtung und ihren teils umstrittenen Regeln. Die Regeln waren aus der Zusammenarbeit mit dem Unternehmen Arbor entstanden, das kurz zuvor die OLAP-Datenbank Essbase vorgestellt hatte – Essbase wird heute durch Oracle unter dem Produktnamen Hyperion Solutions weiterentwickelt und vertrieben.
Wegen ihres Pionierstatus werden die Regeln jedoch gern zitiert:
- Multidimensionale konzeptionelle Sicht auf die Daten (wichtigstes Kriterium für OLAP)
- Transparenz (klare Trennung zwischen Benutzerschnittstelle und der zu Grunde liegenden Architektur)
- Zugriffsmöglichkeiten (Bezug der Basisdaten aus externen oder operationalen Datenbeständen)
- Konsistente Leistungsfähigkeit der Berichterstattung (möglichst schnelle Reportingfunktionalität)
- Client-Server-Architektur (auf den Verwendungszweck optimierte Lastverteilung)
- Generische Dimensionalität (alle Dimensionen in ihrer Struktur und Funktionalität einheitlich)
- Dynamische Handhabung dünn besetzter Matrizen (dynamische Speicherstrukturanpassung)
- Mehrbenutzerunterstützung
- Unbeschränkte dimensionsübergreifende Operationen
- Intuitive Datenanalyse (direkte Navigation innerhalb der Datenwürfel)
- Flexibles Berichtswesen (Ergebnisse im Report frei anordenbar)
- Unbegrenzte Anzahl von Dimensionen und Konsolidierungsebenen (15 bis 20 Dimensionen mit beliebig vielen Aggregationsstufen)
FASMI-Regeln nach Pendse und Creeth
Pendse und Creeth stellten 1995 (Lit.: Pendse) unter dem Akronym FASMI fünf herstellerunabhängige Evaluierungsregeln auf, um damit das OLAP-Konzept zu beschreiben. FASMI steht für „Fast Analysis of Shared Multidimensional Information“ und besagt im Einzelnen:
- Fast: Abfragen sollen durchschnittlich fünf Sekunden dauern dürfen. Dabei sollen einfache Abfragen nicht länger als eine Sekunde und nur wenige, komplexere Abfragen bis zu 20 Sekunden Verarbeitungszeit beanspruchen.
- Analysis: Ein OLAP-System soll jegliche benötigte Logik bewältigen können. Dabei soll die Definition einer komplexeren Analyseabfrage durch den Anwender mit wenig Programmieraufwand zu realisieren sein.
- Shared: Ein OLAP-System soll für den Mehrbenutzerbetrieb ausgelegt sein. Dies bedingt eine Verfügbarkeit geeigneter Zugriffsschutzmechanismen.
- Multidimensional: Als Hauptkriterium fordern Pendse und Creeth eine mehrdimensionale Strukturierung der Daten mit voller Unterstützung der Dimensionshierarchien.
- Information: Bei der Analyse sollen einem Anwender alle benötigten Daten transparent zur Verfügung stehen. Eine Analyse darf nicht durch Beschränkungen des OLAP-Systems beeinflusst werden.
Zusammenfassend lässt sich feststellen, dass die FASMI-Regeln stärker auf Benutzeranforderungen als auf technische Anforderungen eingehen. Insgesamt sind sie allerdings weniger spezifisch als die Regeln nach Codd, deswegen können nach dieser Definition wesentlich mehr Systeme dem OLAP zugeordnet werden.
Marktübersicht
Im 2006er OLAP Report[1] teilt sich der internationale OLAP-Markt wie folgt auf:
- Microsoft Corporation - 31,6 %
- Hyperion Solutions - 18,9 % (inzwischen von Oracle übernommen)
- Cognos - 12,9 % (inzwischen von IBM übernommen)
- Business Objects - 7,3 % (inzwischen von SAP übernommen)
- Microstrategy - 7,3 %
- SAP AG - 5,8 %
- Cartesis - 3,7 % (inzwischen von Business Objects übernommen, Business Objects dann von SAP übernommen)
- Applix - 3,6 % (inzwischen von Cognos übernommen, Cognos dann von IBM übernommen)
- Infor Global Solutions - 3,5 %
- Oracle Corporation - 2,8 %
- Digital Equipment - 0,2 % (inzwischen von HP übernommen)
Siehe auch
- Business-Intelligence
- Business-Performance-Management
- Data-Mining
- Data-Warehouse
- Palo, eine freie Implementierung
Literatur
- Nils Clausen: OLAP - Multidimensionale Datenbanken. Addison-Wesley-Longman, Bonn 1998, ISBN 3-8273-1402-X.
- Edgar F. Codd, S. B. Codd, C. T. Salley: Providing OLAP to User-Analysts: An IT Mandate. Codd & Associates, Ann Arbor/Michigan 1993.
- Bernd Held, Hartmut Erb: Advanced Controlling mit Excel. Unternehmenssteuerung mit OLAP und PALO. Franzis, Poing 2006, ISBN 978-3-7723-7585-9.
- Hartmut Messerschmidt, Kai Schweinsberg: OLAP mit dem SQL-Server. Eine Einführung in Theorie und Praxis. dpunkt, Heidelberg 2003, ISBN 3-89864-240-2.
- Nigel Pendse, Richard Creeth: The OLAP Report. In: Business Intelligence. 1995.
- Carsten Bange u. a.: OLAP & BI - 8 multidimensionale Datenbanken und 17 Reporting und Analyse-Werkzeuge im Vergleich. Oxygon Verlag, München 2005, ISBN 3-93781-805-7.
Einzelnachweise
- ↑ Nigel Pendse: Market share analysis. The OLAP market grew faster than predicted in 2006. In: The OLAP Report. 10. April 2007. Abgerufen am 10. Mai 2007.
Weblinks
- The OLAP Report Analysen über das Thema von N. Pendse (englisch)
- Microsoft-OLAP-Informationen ist eine Ansammlung von Microsoft-OLAP-Informationen
- Mondrian ist eine freie ROLAP-Implementierung
Wikimedia Foundation.