Gewichteter binärer Suchbaum

Ein binärer Suchbaum mit 2 Knoten und Gewichts-Angaben (rot)

In der Informatik ist ein gewichteter binärer Suchbaum eine Ausprägung der abstrakten Datenstruktur binärer Suchbaum, bei der jedem Knoten neben Schlüssel und anderen Daten ein Gewicht (Zugriffswahrscheinlichkeit) zukommt. (Der Vollständigkeit halber kommt ein solches auch seinen Nachbarintervallen zu.)

Zu optimieren ist die gewichtete Pfadlänge des Baums.

Das Gewicht ist an den Schlüssel gebunden, somit macht das Zulassen von mehreren Objekten („Duplikaten“) mit gleichem Schlüssel keinen Sinn.

Sind Gewichte überhaupt nicht bekannt oder sind sie untereinander praktisch gleich, dann sind höhen-balancierte Bäume eine gute Wahl. Ein Beispiel ist der AVL-Baum, der als optimiert auf die gewichtete Pfadlänge bei Einheitsgewichten angesehen werden kann.

Inhaltsverzeichnis

1 Beispiele
2 Zugriffsverteilung und gewichtete Pfadlänge
3 Siehe auch
4 Literatur

Beispiele

Ist der Baum statisch, spielen also Einfüge- oder Entfernoperationen keine Rolle, so bietet sich der Bellman-Algorithmus an, der einen optimalen gewichteten binären Suchbaum konstruiert. Seine Effizienz ist auch dann gegeben, wenn die Gewichte nur ungefähr bekannt sind.

Geometrische Verteilung

Bei der geometrischen Gewichtsverteilung $p i = (1 - q) q i$ für $i = 0, 1,...$ mit $0 < q < 1$ haben wir $\sum_{i \geqq 0}p_i = 1$ und die gewichtete Pfadlänge $\sum_{i \geqq 0}(i+1)p_i = 1/(1-q)$ ist konstant und unabhängig von der Anzahl der Knoten. Allerdings gibt es dann sehr seltene Suchanfragen, die in nur linearer Zeit beantwortet werden.

Natürliche Vokabulare

Im Englischen ist die Wahrscheinlichkeit für das Vorkommen des $i$ -t häufigsten Wortes ungefähr

$\alpha_i \approx i^{-1{,}12} / \sum_{i \geqq 1}i^{-1{,}12}$ .

Die gewichtete Pfadlänge eines optimalen binären Suchbaums für alle englischen Wörter ergibt sich zu ungefähr $10, 2$ .

Dynamische Gewichte

Sind Einfüge- oder Entfernoperationen wichtig, so sind im Prinzip auch die Gewichte zu pflegen. Im Grenzfall sogar beim Aufsuchen, da sich hierbei zumindest die Zugriffsstatistik ändert.

Mehlhorn beschreibt „Nahezu optimale binäre Suchbäume“. Ferner führt er BB[α]-Bäume ein, die sich ebenfalls nicht weit vom Optimum entfernen.

Bei den Splay-Bäumen werden trotz völlig anderer Vorgehensweise ebenfalls die am häufigsten angesprochenen Knoten in die Nähe der Wurzel gespült.

Zugriffsverteilung und gewichtete Pfadlänge

Sei $S = \left\{ k_1 < k_2 < ... < k_n \right\}$ eine Schlüsselmenge aus einem total geordneten Reservoir $R$ von Schlüsseln, sei $p i$ resp. $q j$ die Wahrscheinlichkeit, dass auf das Element $x \in R$ zugegriffen wird, wobei $x = k i$ resp. $k j < x < k j + 1$ für $1 \leqq i \leqq n$ resp. $0 \leqq j \leqq n$ . (Dabei sind $k_0 := -\infty$ und $k_{n+1} := +\infty$ zusätzliche nicht zu $R$ gehörende Elemente mit der üblichen Bedeutung.) Das $(2 n + 1)$ -Tupel $ζ: = (q 0, p 1, q 1,..., p n, q n)$ heißt Zugriffsverteilung für die Menge $S$ , wenn alle $p_i, q_j \geqq 0$ und $\sum p_i + \sum q_j = 1$ .

Sei nun $T$ ein Suchbaum für die Menge $S$ mit obiger Zugriffsverteilung $ζ$ , sei $a_i^T$ die Tiefe des Knotens $k i$ und $b_j^T$ die Tiefe des Blattes $(k j, k j + 1)$ (s. Abb.). Wir betrachten die Suche nach einem Element $x \in R$ . Wenn $x = k i$ , dann vergleichen wir $x$ mit $a_i^T+1$ Elementen im Baum. Wenn $k j < x < k j + 1$ , dann vergleichen wir $x$ mit $b_j^T$ Elementen im Baum. Also ist

$P^T := \sum_{i=1}^n p_i (a_i^T+1) + \sum_{j=0}^n q_j b_j^T$ die (mit der Zugriffsverteilung

ζ

) gewichtete Pfadlänge des Baumes

T

Siehe auch

Binärer Suchbaum
Bellman-Algorithmus (Konstruktion des optimalen gewichteten binären Suchbaums)
Splay-Baum

Literatur

Kurt Mehlhorn Datenstrukturen und effiziente Algorithmen Teubner Stuttgart 1988, ISBN 3-519-12255-3.

Kategorie:

Suchbaum

Wikimedia Foundation.

Игры ⚽ Поможем решить контрольную работу

Schlagen Sie auch in anderen Wörterbüchern nach:

Binärer Suchbaum — der Höhe 5 mit 13 Knoten: Wurzel J und Blättern C, G, N, Q, U und X In der Informatik ist ein binärer Suchbaum eine spezielle Implementierung der abstrakten Datenstruktur Suchbaum. Ein binärer Suchbaum, häufig abgekürzt als BST (von englisch … Deutsch Wikipedia
AVL-Baum — Abbildung 1: AVL Baum mit Balance Werten (grün) AVL Baum Komplexität Platz O(n) … Deutsch Wikipedia
Balancierter Baum — Ein Balancierter Baum ist in der Informatik ein Spezialfall der Datenstruktur Baum, der eine maximale Höhe von garantiert, wobei n die Anzahl der Elemente im Baum angibt und c eine von n unabhängige Konstante ist. Manche Autoren rechnen auch… … Deutsch Wikipedia

Academic dictionaries and encyclopedias

Gewichteter binärer Suchbaum

Inhaltsverzeichnis