Google BigTable

Google BigTable

BigTable ist ein proprietäres Hochleistungs-Datenbanksystem des Unternehmens Google. Es baut unter anderem auf dem Google File System (GFS) und Chubby Lock Service auf. Es wird zurzeit beispielsweise beim Platform-as-a-Service-Dienst (PaaS) Google App Engine genutzt.

Inhaltsverzeichnis

Geschichte

Die Entwicklung von BigTable begann 2004. Es wird mittlerweile von vielen Google-Produkten, wie etwa MapReduce, Google Reader, Google Maps, Google Bücher, YouTube oder Google Earth, genutzt. Da BigTable-Datenbanken sehr groß werden können, wurde besonderer Wert auf Skalierbarkeit (durch Unterstützung sehr großer Computercluster) und Geschwindigkeit (durch eine nichtrelationale Struktur) gelegt.

Design

Charakteristisch für in BigTable gespeicherte Daten ist, dass sehr häufig Datensätze hinzugefügt werden, vorhandene Datensätze aber sehr selten geändert werden. Eine BigTable besteht grundlegend aus sehr vielen Zeilen, die durch einen Datensatzidentifikator benannt werden. Innerhalb einer Zeile können beliebig viele Spalten definiert werden. Im Gegensatz zu relationalen Datenbanken können die Spalten für jede Zeile unterschiedlich groß sein. Lediglich die sogenannten Family Columns, die einen gleichen Datentyp (wie beispielsweise einen Link, der auf eine Seite verweist) beinhalten, müssen bei der Implementierung der Datenbank bekannt sein, können aber beliebig viele Instanzen pro Zeile enthalten.[1]

Jede Tabelle ist mehrdimensional. Zur Versionierung erhält jeder Eintrag einen Timestamp. Mithilfe von Timestamps kann stets die neueste Version der Daten berücksichtigt werden, ohne ältere Daten zu bearbeiten oder zu löschen.

Beispiel

Google selbst beschreibt in einer Publikation[1] ein Beispiel für die Verwendung von BigTable durch die Google-Suchmaschine: Für jede zuvor durch einen Crawler gescannte neue Webseite wird eine Zeile in der entsprechenden BigTable angelegt. Die erste Spalte enthält den ersten Inhalt (in HTML-Syntax) der Seite. Die Multidimensionalität entsteht durch spätere Versionen der gleichen Seite und den zugeordneten Zeitstempel (Timestamp). Die nachfolgenden Spalten entstammen alle der gleichen FamilyColumn "anchor" und enthält jeweils die URL einer anderen Seite, die auf die entsprechende Seite verlinkt. Somit kann die Anzahl der Spalten theoretisch unendlich groß werden. Die gesammelten Links sind eine Grundlage des PageRank-Verfahrens.

Einzelnachweise

  1. a b http://labs.google.com/papers/bigtable-osdi06.pdf

Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • BigTable — is a compressed, high performance, and proprietary database system built on Google File System (GFS), Chubby Lock Service, and a few other Google programs; it is currently not distributed or used outside of Google, although Google offers access… …   Wikipedia

  • BigTable — est un système de gestion de base de données compressées, haute performance, propriétaire, développé et exploité par Google[1]. C est une base de données orientée colonnes, dont se sont inspirés plusieurs projets libres, comme HBase, Cassandra ou …   Wikipédia en Français

  • Google App Engine — appengine.google.com Kommerziell ja Beschreibung Platform as a Service …   Deutsch Wikipedia

  • Google Scholar — Logo Google Scholar ist ein Suchdienst des Unternehmens Google Inc. und dient der allgemeinen Literaturrecherche wissenschaftlicher Dokumente. Dazu zählen sowohl kostenlose Dokumente aus dem freien Internet als auch kostenpflichtige Angebote.… …   Deutsch Wikipedia

  • Google App Engine — Google App Engine …   Википедия

  • Google App Engine — Développeur Google Dernière version 1.5.0 (10 mai 2 …   Wikipédia en Français

  • Google Maps — Screenshot of Google Maps showing a route from San Francisco to Los Angeles on Interstate 5 …   Wikipedia

  • Google+ — Google+ …   Википедия

  • Google Chrome OS — 0.13.587.135 Company / deve …   Wikipedia

  • Google bomb — Google bombing here causes the search query miserable failure to be associated with George W. Bush and Michael Moore The terms Google bomb and Googlewashing refer to practices, such as creating large numbers of links, that cause a web page to… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”