- Staging (Datenbank)
-
Staging ist ein Prozess der Informationsintegration, in dem Daten in einem Datenbereich (engl.: staging area, der Bereitstellungsraum oder Sammelplatz beim Militär) temporär zwischengespeichert werden, um sie dort zu bereinigen und zu transformieren. Nach dem Bereinigungs- und Transformationsschritt werden die Daten in eine Zieldatenbank geladen.
Staging und der ETL-Prozess
Staging wird typischerweise bei der Implementierung eines ETL-Prozesses verwendet. Dieser Prozess dient dazu, Daten aus einer Reihe von operativen Datenbanken in einer zentralen Datenbank - häufig ein Datenlager (data warehouse) - zusammenzuführen. Dort können die Daten mittels Methoden wie u. a. OLAP, Data Mining, Text Mining analysiert werden.
Staging-Area
Die Daten werden dabei zunächst aus den Datenquellen extrahiert (extract) und in der Staging-Area gesammelt und zwischengespeichert. Dort werden die Daten bereinigt (cleanse, scrub) und transformiert (transform), ohne die Datenquellen weiter zu belasten. Die so aufbereiteten Daten werden abschließend aus der Staging-Area in die Zieldatenbank gespeichert (load). Die bereinigten Daten können auch genutzt werden, um die Daten in den jeweiligen Quell(system)en anzugleichen.
Wikimedia Foundation.