Distributed Hashtable

Distributed Hashtable

Eine verteilte Hashtabelle (VHT) [engl.: distributed hash table (DHT)] ist eine Datenstruktur, die versucht, das allgemeine Problem in P2P-Systemen – das Finden des Speicherorts einer gesuchten Datei – mit möglichst geringem Aufwand effizient zu lösen und zu dezentralisieren, um es von Ausfall, zum Beispiel durch Abschalten eines BitTorrent-Trackers unabhängig zu gestalten. Die Datenobjekte sollen dabei möglichst gleichmäßig über die Knotenmenge verteilt und ein von jedem beliebigen Einstiegsort ortsunabhängiges Routing zum verantwortlichen Knoten ermöglicht werden. Jeder Knoten ist dabei analog zu einem Behälter einer Hashtabelle. Die Datenstruktur muss ständige Anpassungen durch Ausfall, Beitritt und Austritt von Knoten überstehen, sich selbst organisieren und skalierbar sein. Die Grundlage für verteilte Hashtabellen bilden konsistente Hash-Funktionen.

Inhaltsverzeichnis

Eigenschaften

Eigenschaften von VHTs sind:

  • Selbstorganisation: Es ist keine manuelle Konfiguration nötig.
  • Skalierbarkeit: Das System sollte in der Lage sein, auch mit einer großen Anzahl von Knoten funktionsfähig zu bleiben.
  • Lastenverteilung: Schlüssel werden gleichmäßig auf alle Knoten verteilt.
  • Fehlertoleranz: Das System sollte zuverlässig funktionieren, auch wenn Knoten ausfallen oder das System verlassen.
  • Robustheit: Das System sollte „korrekt“ funktionieren können, auch wenn ein Teil (möglicherweise ein Großteil) der Knoten versuchen, das System zu stören.

Prinzipielle Arbeitsweise

Mittels einer Hash-Funktion werden den Datenobjekten Schlüssel in einem linearen Wertebereich vergeben, welcher möglichst gleichmäßig über die Knoten der Knotenmenge verteilt wird. Jeder Knoten ist dabei mindestens für einen Teilbereich des Schlüsselraumes zuständig, oft sind jedoch auch mehrere Knoten für denselben Bereich verantwortlich, wobei sich die Zuständigkeiten dynamisch ändern. Ein Beitrittsprotokoll regelt die Aufnahme neuer Knoten in ein existierendes System, normalerweise indem mit einem anderen Knoten, der bereits Teil des Systems ist, verbunden wird. Das Protokoll stellt dann die Verbindungen zu den Nachbarknoten her und regelt üblicherweise auch die Konstruktion von Routingtabellen. Routingtabellen werden von VHT-Knoten benutzt, um effizient herausfinden zu können, welcher andere Knoten für einen bestimmten Satz Informationen zuständig ist. Die Definition von "Entfernung" ist dabei mit der Struktur und der Topologie verbunden und variiert in unterschiedlichen Systemen und muss nichts mit der physikalischen Organisation der Knoten zu tun haben. Eine VHT, die beispielsweise Knoten in einem euklidischen Raum platziert, könnte einfach den Knoten mit dem geringsten euklidischen Abstand zu einem Schlüssel wählen. Routingtabellen sollen es jedem Knoten erlauben, den nächsten Knoten zu einem Schlüssel in O(log n) zu erreichen.

Inhalte können direkt, das heißt bei dem für sie zuständigen Knoten, oder indirekt durch einen Verweis auf die Adresse des Knotens, welcher die Daten enthält, gespeichert werden.

Da Schlüssel keine semantische Bedeutung haben, sind die verwalteten Inhalte anwendungsunabhängig. Durch die generische Schnittstelle, welche nur die zwei Funktionen publish(Schlüssel, Inhalt) und lookup(Schlüssel) anbietet, lassen sich die implementierten Algorithmen auswechseln.

Implementierungen

Implementierungen verteilter Hashtabellen sind etwa Chord und Kademlia.

Anwendungen

VHTs zur Datenspeicherung

Applikationen

VHT-Forschung

  • Project IRIS (Infrastructure for Resilient Internet Systems)

Wikimedia Foundation.

Игры ⚽ Поможем решить контрольную работу

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Distributed hash table — Table de hachage distribuée Pour les articles homonymes, voir DHT. Une table de hachage distribuée (ou DHT pour Distributed Hash Table), est une technologie permettant l identification et l obtention, dans un système réparti, comme certains… …   Wikipédia en Français

  • Damon Middleware — Damon Initial release 2011 Development status beta Written in Java Type …   Wikipedia

  • CloudSNAP — Initial release 2011 Development status beta Written in Java …   Wikipedia

  • Azureus (Filesharing-Client) — Vuze Entwickler: Vuze Entwicklerteam Aktuelle Version: 4.2.0.2 (09. April 2009) Betriebssystem …   Deutsch Wikipedia

  • Vuze (Filesharing-Client) — Vuze Entwickler: Vuze Entwicklerteam Aktuelle Version: 4.2.0.2 (09. April 2009) Betriebssystem …   Deutsch Wikipedia

  • Hash table — Not to be confused with Hash list or Hash tree. Unordered map redirects here. For the proposed C++ class, see unordered map (C++). Hash Table Type unsorted dictionary Invented 1953 Time complexity in big O notation Average Worst case Space …   Wikipedia

  • Computer software — Software redirects here. For other uses, see Software (disambiguation). Computer software, or just software, is a collection of computer programs and related data that provide the instructions for telling a computer what to do and how to do it.… …   Wikipedia

  • NoSQL — (steht für englisch Not only SQL) ist eine Bewegung, eine neue Art von Datenbanken voranzutreiben. Es handelt sich dabei um Datenbanken, die einen nicht relationalen Ansatz verfolgen und damit mit der langen Geschichte von relationalen… …   Deutsch Wikipedia

  • Table de hachage distribuee — Table de hachage distribuée Pour les articles homonymes, voir DHT. Une table de hachage distribuée (ou DHT pour Distributed Hash Table), est une technologie permettant l identification et l obtention, dans un système réparti, comme certains… …   Wikipédia en Français

  • Table de hachage distribuée — Pour les articles homonymes, voir DHT. Une table de hachage distribuée (ou DHT pour Distributed Hash Table), est une technologie permettant l identification et l obtention, dans un système réparti, comme certains réseaux P2P, d une information. L …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”