OLAP

OLAP

Online-Analytical-Processing (OLAP) wird neben dem Data-Mining (auch Datenschürfung) zu den Methoden der analytischen Informationssysteme gezählt. OLAP wird weiterhin den hypothesengestützten Analysemethoden zugeordnet. Der Analyst muss vor der eigentlichen Untersuchung wissen, welche Anfragen er an das OLAP-System stellen möchte. Seine Hypothese wird dann durch das Analyseergebnis bestätigt oder abgelehnt.

OLAP-Systeme beziehen ihre Daten entweder aus den operationalen Datenbeständen eines Unternehmens oder aus einem Data-Warehouse (Datenlager). Hierdurch wird verhindert, dass die Analysedaten mit den transaktionsorientierten Datenbeständen in Kontakt kommen und deren Leistungsfähigkeit beeinträchtigt wird. Ebenso ist die Leistung eines OLAP-Systems von der verwendeten Datenhaltungsform und deren Anbindung an den Analyse-Client abhängig.

Im Gegensatz zum Online-Transaction-Processing (OLTP) steht hier die Durchführung komplexer Analysevorhaben im Vordergrund, welche ein sehr hohes Datenaufkommen verursachen. Das Ziel ist, durch multidimensionale Betrachtung dieser Daten ein entscheidungsunterstützendes Analyseergebnis zu gewinnen. Als besondere Zielgruppe wird hier das Management in seiner Rolle als Entscheidungsträger genannt.

Die OLAP zugrunde liegende Struktur ist ein OLAP-Cube, der aus der operationalen Datenbank erstellt wurde. Dieser ist meist nach dem Sternschema aufgebaut, mit einer Faktentabelle und den jeweiligen Dimensionstabellen.

Inhaltsverzeichnis

Arten

Man unterscheidet zwischen ROLAP („relationales OLAP“), das auf eine relationale Datenbank zugreift, und MOLAP („multidimensionales OLAP“), das auf eine multidimensionale Datenbank zugreift. HOLAP („H“ für „Hybrid“) ist eine Zwischenform zwischen ROLAP und MOLAP. Jeder Typ hat seine Vor- und Nachteile. MOLAP speichert die aggregierten Kennzahlen persistent. Dadurch hat MOLAP einen Performance-Vorteil gegenüber OLAP-Systemen, die zur Laufzeit Kennzahlen aggregieren. ROLAP skaliert besser, ist dafür aber je nach Performance der eingesetzten relationalen Quellen langsamer als MOLAP. Dies liegt bei ROLAP daran, dass die Daten neben den teils vielleicht schon vorausberechneten Aggregationen in einer vielseitigen aber evtl. langsameren Datenbank gespeichert vorliegen, während diese Daten bei MOLAP in geeigneter, schnell zugänglicher Form meist direkt im Dateisystem abgespeichert sind. Ein Vorteil von ROLAP wiederum ist, dass kaum eigener Speicherplatz benötigt wird und vorhandene Datenbanken ausgenutzt werden. Dies bietet sich vor allem bei der Auswertung auf Basis von Massendaten in komplexen Data Warehouse Umgebungen an. HOLAP bietet oft einen guten Kompromiss aus ROLAP und MOLAP. Ein vierter Architekturtyp wird mit DOLAP (D für Desktop) bezeichnet. Hierbei werden die Basisdaten zunächst lokal in den Analyseclient importiert, um eine lokale Analyse vollziehen zu können. Als Nachteil kann hier allerdings eine evtl. zu schwache Hardwareauslegung gesehen werden. Zeitintensiv bei OLAP ist nicht die Auswertung der Daten sondern die Erstellung und Auffrischung der angelegten Cubes. Einen weiteren, neuerdings wieder sehr populären Typ stellt memory based OLAP dar. Hier werden alle Daten im RAM gehalten und alle Werte in Echtzeit berechnet. Diese Technik war in der Vergangenheit hinsichtlich der Datenmengen limitiert. Aufgrund der zunehmenden Verbreitung von 64 Bit Rechner-Architekturen können jedoch heutzutage auch große Datenmengen mit memory based OLAP analysiert werden.

OLAP-Werkzeuge werden häufig durch Multidimensionalität charakterisiert. Durch diese Multidimensionalität sollen relevante betriebswirtschaftliche Kennzahlen (bspw. Umsatz- oder Kostengrößen) anhand unterschiedlicher Dimensionen (z. B. Kunden, Regionen, Zeit) mehrdimensional betrachtet und bewertet werden können. Zur bildlichen Darstellung werden Würfel (Cubes) verwendet. Diese Würfel sind unterteilt in verschiedene Dimensionen, die wiederum in Elemente untergliedert sind. Diese Elemente bilden einen Verdichtungsbaum oder allgemeiner einen nicht zyklischen gerichteten Graphen, welcher die Aggregationen darstellt.

Anforderungen an ein OLAP-System

12 Regeln nach Codd

Der OLAP-Begriff wurde 1993 von Edgar F. Codd geprägt. Er formulierte zunächst 12 Regeln, die er bis zuletzt auf 18 Regeln erweitert hat. Diese Evaluierungsregeln stellten die erste Anforderungsliste an ein OLAP-System dar. Zwar werden diese Regeln noch gern aufgeführt, aber ihre Bedeutung für die Bewertung eines OLAP-Systems kann heute nicht mehr als besonders hoch eingestuft werden. Dies liegt im Besonderen an ihrer stark anwendungsbezogenen Ausrichtung und ihren teils umstrittenen Regeln. Die Regeln waren aus der Zusammenarbeit mit dem Unternehmen Arbor entstanden, das kurz zuvor die OLAP-Datenbank Essbase vorgestellt hatte – Essbase wird heute durch Oracle unter dem Produktnamen Hyperion Solutions weiterentwickelt und vertrieben.

Wegen ihres Pionierstatus werden die Regeln jedoch gern zitiert:

  1. Multidimensionale konzeptionelle Sicht auf die Daten (wichtigstes Kriterium für OLAP)
  2. Transparenz (klare Trennung zwischen Benutzerschnittstelle und der zu Grunde liegenden Architektur)
  3. Zugriffsmöglichkeiten (Bezug der Basisdaten aus externen oder operationalen Datenbeständen)
  4. Konsistente Leistungsfähigkeit der Berichterstattung (möglichst schnelle Reportingfunktionalität)
  5. Client-Server-Architektur (auf den Verwendungszweck optimierte Lastverteilung)
  6. Generische Dimensionalität (alle Dimensionen in ihrer Struktur und Funktionalität einheitlich)
  7. Dynamische Handhabung dünn besetzter Matrizen (dynamische Speicherstrukturanpassung)
  8. Mehrbenutzerunterstützung
  9. Unbeschränkte dimensionsübergreifende Operationen
  10. Intuitive Datenanalyse (direkte Navigation innerhalb der Datenwürfel)
  11. Flexibles Berichtswesen (Ergebnisse im Report frei anordenbar)
  12. Unbegrenzte Anzahl von Dimensionen und Konsolidierungsebenen (15 bis 20 Dimensionen mit beliebig vielen Aggregationsstufen)

FASMI-Regeln nach Pendse und Creeth

Pendse und Creeth stellten 1995 (Lit.: Pendse) unter dem Akronym FASMI fünf herstellerunabhängige Evaluierungsregeln auf, um damit das OLAP-Konzept zu beschreiben. FASMI steht für „Fast Analysis of Shared Multidimensional Information“ und besagt im Einzelnen:

  1. Fast: Abfragen sollen durchschnittlich fünf Sekunden dauern dürfen. Dabei sollen einfache Abfragen nicht länger als eine Sekunde und nur wenige, komplexere Abfragen bis zu 20 Sekunden Verarbeitungszeit beanspruchen.
  2. Analysis: Ein OLAP-System soll jegliche benötigte Logik bewältigen können. Dabei soll die Definition einer komplexeren Analyseabfrage durch den Anwender mit wenig Programmieraufwand zu realisieren sein.
  3. Shared: Ein OLAP-System soll für den Mehrbenutzerbetrieb ausgelegt sein. Dies bedingt eine Verfügbarkeit geeigneter Zugriffsschutzmechanismen.
  4. Multidimensional: Als Hauptkriterium fordern Pendse und Creeth eine mehrdimensionale Strukturierung der Daten mit voller Unterstützung der Dimensionshierarchien.
  5. Information: Bei der Analyse sollen einem Anwender alle benötigten Daten transparent zur Verfügung stehen. Eine Analyse darf nicht durch Beschränkungen des OLAP-Systems beeinflusst werden.

Zusammenfassend lässt sich feststellen, dass die FASMI-Regeln stärker auf Benutzeranforderungen als auf technische Anforderungen eingehen. Insgesamt sind sie allerdings weniger spezifisch als die Regeln nach Codd, deswegen können nach dieser Definition wesentlich mehr Systeme dem OLAP zugeordnet werden.

Marktübersicht

Im 2006er OLAP Report[1] teilt sich der internationale OLAP-Markt wie folgt auf:

  1. Microsoft Corporation - 31,6 %
  2. Hyperion Solutions - 18,9 % (inzwischen von Oracle übernommen)
  3. Cognos - 12,9 % (inzwischen von IBM übernommen)
  4. Business Objects - 7,3 % (inzwischen von SAP übernommen)
  5. Microstrategy - 7,3 %
  6. SAP AG - 5,8 %
  7. Cartesis - 3,7 % (inzwischen von Business Objects übernommen, Business Objects dann von SAP übernommen)
  8. Applix - 3,6 % (inzwischen von Cognos übernommen, Cognos dann von IBM übernommen)
  9. Infor Global Solutions - 3,5 %
  10. Oracle Corporation - 2,8 %
  11. Digital Equipment - 0,2 % (inzwischen von HP übernommen)

Siehe auch

Literatur

  • Nils Clausen: OLAP - Multidimensionale Datenbanken. Addison-Wesley-Longman, Bonn 1998, ISBN 3-8273-1402-X. 
  • Edgar F. Codd, S. B. Codd, C. T. Salley: Providing OLAP to User-Analysts: An IT Mandate. Codd & Associates, Ann Arbor/Michigan 1993. 
  • Bernd Held, Hartmut Erb: Advanced Controlling mit Excel. Unternehmenssteuerung mit OLAP und PALO. Franzis, Poing 2006, ISBN 978-3-7723-7585-9. 
  • Hartmut Messerschmidt, Kai Schweinsberg: OLAP mit dem SQL-Server. Eine Einführung in Theorie und Praxis. dpunkt, Heidelberg 2003, ISBN 3-89864-240-2. 
  • Nigel Pendse, Richard Creeth: The OLAP Report. In: Business Intelligence. 1995. 
  • Carsten Bange u. a.: OLAP & BI - 8 multidimensionale Datenbanken und 17 Reporting und Analyse-Werkzeuge im Vergleich. Oxygon Verlag, München 2005, ISBN 3-93781-805-7. 

Einzelnachweise

  1. Nigel Pendse: Market share analysis. The OLAP market grew faster than predicted in 2006. In: The OLAP Report. 10. April 2007. Abgerufen am 10. Mai 2007.

Weblinks


Wikimedia Foundation.

Игры ⚽ Поможем написать реферат

Schlagen Sie auch in anderen Wörterbüchern nach:

  • OLAP — (англ. online analytical processing, аналитическая обработка в реальном времени)  технология обработки данных, заключающаяся в подготовке суммарной (агрегированной) информации на основе больших массивов данных, структурированных по… …   Википедия

  • OLAP — es el acrónimo en inglés de procesamiento analítico en línea (On Line Analytical Processing). Es una solución utilizada en el campo de la llamada Inteligencia empresarial (o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes… …   Wikipedia Español

  • OLAP —   [Abk. für Online Analytical Processing, dt. »analytische Online Verarbeitung«], Konzept der entscheidungsorientierten Informationsverarbeitung, insbesondere der Datenfilterung. Man fasst unter diesem Begriff alle Technologien, Methoden und… …   Universal-Lexikon

  • Olap — Olap, Pflanze, ist Sterculia foetida …   Pierer's Universal-Lexikon

  • OLAP — es el acrónimo en inglés de procesamiento analítico en línea (online analytical processing). Es una solución que suministra respuestas rápidas a consultas a una base de datos compleja. Se usa en informes de negocios de ventas, márketing, informes …   Enciclopedia Universal

  • OLAP — (online analytical processing) category of software programs designed to enable many types of analyses of data stored in a database (Computers) …   English contemporary dictionary

  • OLAP — Online Analytical Processing Online Analytical Processing (OLAP) désignait à l origine les bases de données multidimensionnelles (aussi appelées cubes ou hypercubes) destinées à des analyses complexes sur des données. Ce terme a été défini par… …   Wikipédia en Français

  • OLAP cube — An OLAP cube (for online analytical processing) is a data structure that allows fast analysis of data.[1] It can also be defined as the capability of manipulating and analyzing data from multiple perspectives. The arrangement of data into cubes… …   Wikipedia

  • OLAP-куб — OLAP куб  многомерный массив данных, как правило, разрежённый и долговременно хранимый. Может быть реализован на основе универсальных реляционных СУБД или специализированным программным обеспечением (см. также OLAP). В программных продуктах… …   Википедия

  • OLAP сервер Mondrian — Mondrian OLAP Server Файл:Modrian logo.png Тип OLAP Server Разработчик Pentaho Corporation ОС Cross platform (JVM) Версия …   Википедия

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”