Star-Schema

Star-Schema

Das Sternschema ist eine besondere Form eines Datenmodells, dessen Ziel nicht die Normalisierung ist, sondern eine Optimierung auf effiziente Leseoperationen. Hauptanwendungsfeld sind Data Warehouses und OLAP-Anwendungen.

Die Bezeichnung Sternschema rührt daher, dass die Tabellen sternförmig angeordnet werden: Im Zentrum steht eine Faktentabelle, um die sich mehrere Dimensionstabellen gruppieren.

Ein Sternschema liegt in der Regel denormalisiert vor. Mögliche Anomalien und ein erhöhter Speicherbedarf werden dabei aus Performanzgründen in Kauf genommen. Eine Verbesserung ist durch das dem Sternschema verwandte Schneeflockenschema möglich. Dort müssen allerdings mehrstufige Dimensionstabellen über Join-Abfragen verknüpft werden.

Inhaltsverzeichnis

Fakten- und Dimensionstabellen

Die zu verwaltenden Daten werden als Fakten bezeichnet; sie werden typischerweise fortlaufend in der Faktentabelle gespeichert. Andere Namen für die Fakten sind Metriken oder Messwerte. Faktentabellen können sehr groß werden, was ein Data-Warehouse zwingt, die Daten nach und nach zu verdichten (aggregieren) und schließlich nach einer Halteperiode zu löschen oder auszulagern (Archivierung).

Im Gegensatz dazu enthält die Dimensionstabelle die „beschreibenden“ Daten. Die Faktentabelle enthält Fremdschlüssel auf die Dimensionseinträge, die deren Bedeutung definieren. Typischerweise stellt die Gesamtmenge der Fremdschlüssel auf die Dimensionstabellen gleichzeitig den Primärschlüssel in der Faktentabelle dar. Das impliziert, dass es jeden Eintrag zu einer Kombination von Dimensionen nur einmal geben kann.
Dimensionstabellen sind vergleichsweise statisch und üblicherweise erheblich kleiner als Faktentabellen. Die Bezeichnung „Dimension“ rührt daher, dass jede Dimensionstabelle eine Dimension eines mehrdimensionalen OLAP-Würfels darstellt.

Vorteil der Trennung von Fakten und Dimensionen ist, dass die Fakten nach jeder Dimension generisch und unabhängig analysiert werden können. Eine OLAP-Anwendung benötigt kein „Wissen“ über die Bedeutung einer Dimension. Die Interpretation ist allein dem Benutzer überlassen.

Slowly Changing Dimensions

Ein Problem des Sternschemas ist, dass Daten in den Dimensionstabellen über einen langen Zeitraum hinweg einen Bezug auf Daten in den Faktentabellen haben. Über die Zeit hinweg können aber auch Änderungen der Dimensionsdaten notwendig werden. Diese Änderungen dürfen sich aber in der Regel nicht auf Daten vor der Änderung auswirken. Wenn sich beispielsweise der Verkäufer für eine Produktgruppe ändert, dann darf der jeweilige Eintrag in der Dimensionstabelle nicht einfach überschrieben werden. Stattdessen muss ein neuer Eintrag generiert werden, da sonst die Verkaufszahlen des vorherigen Verkäufers nicht mehr feststellbar wären. Ein Konzept zur Vermeidung solcher Konflikte sind Slowly Changing Dimensions.

Beispiel

Beispiel eines Sternschemas

Beispielsweise sind die Dimensionstabellen Zeit, Kunde, Verkäufer, Produkt, während in der Faktentabelle Verkäufe, Lohnzahlungen, Kundenbesuche, etc. gespeichert sind.

In der Faktentabelle werden quantitative Daten gespeichert, beispielsweise die Anzahl der Verkäufe oder der Preis. Die Dimensionstabelle beschreibt das, was verkauft wurde, von wem, wann und an wen.

Literatur

  • R. Kimball & M. Ross: The Data Warehouse Toolkit. The Complete Guide to Dimensional Modeling. 2nd Edition, New York et al.: John Wiley & Sons, 2002 ISBN 0-471-20024-7

Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Star schema — The star schema (sometimes referenced as star join schema) is the simplest style of data warehouse schema. The star schema consists of a few fact tables (possibly only one, justifying the name) referencing any number of dimension tables . The… …   Wikipedia

  • STAR — bezeichnet: Vögel: Star (Plural: Stare), Sturnus vulgaris (von althochdeutsch stara): häufigster Vertreter der Vogelfamilie der Stare Stare (Sturnidae), eine artenreiche Vogelfamilie der Singvögel Personen: Star (Person) (Plural: Stars) (engl.… …   Deutsch Wikipedia

  • Star Wars: Battlefront II — Star Wars Battlefront II Éditeur LucasArts Développeur …   Wikipédia en Français

  • Star Wars: Battlefront 2 — Star Wars: Battlefront II Star Wars: Battlefront II Éditeur LucasArts Développeur Pandemic Studios Date de sortie PC, PS2, Xbox AN 1er novembre 2005 …   Wikipédia en Français

  • Star Wars : Battlefront II — Star Wars: Battlefront II Star Wars: Battlefront II Éditeur LucasArts Développeur Pandemic Studios Date de sortie PC, PS2, Xbox AN 1er novembre 2005 …   Wikipédia en Français

  • Star wars battlefront 2 — Star Wars: Battlefront II Star Wars: Battlefront II Éditeur LucasArts Développeur Pandemic Studios Date de sortie PC, PS2, Xbox AN 1er novembre 2005 …   Wikipédia en Français

  • Star Trek:DS9 — Seriendaten Deutscher Titel: Star Trek: Deep Space Nine Originaltitel: Star Trek: Deep Space Nine Produktionsland: USA …   Deutsch Wikipedia

  • Star Trek - Deep Space Nine — Seriendaten Deutscher Titel: Star Trek: Deep Space Nine Originaltitel: Star Trek: Deep Space Nine Produktionsland: USA …   Deutsch Wikipedia

  • Star Trek DS9 — Seriendaten Deutscher Titel: Star Trek: Deep Space Nine Originaltitel: Star Trek: Deep Space Nine Produktionsland: USA …   Deutsch Wikipedia

  • Snowflake schema — A snowflake schema is a logical arrangement of tables in a relational database such that the entity relationship diagram resembles a snowflake in shape. Closely related to the star schema, the snowflake schema is represented by centralized fact… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”