HITS-Algorithmus

HITS-Algorithmus

Als Hubs und Authorities lassen sich in der Netzwerktheorie herausragende Knoten anhand ihrer Verlinkung einteilen. Vereinfacht gesagt sind Hubs und Authorities dabei Knoten, die mit vielen anderen Knoten verbunden sind – beispielsweise bekannte Persönlichkeiten in sozialen Netzwerken und Linkverzeichnisse im World Wide Web.

Berechnung

Das Konzept der Hubs und Authorities liefert ähnlich wie der PageRank-Algorithmus ein Konzept zur automatischen Beurteilung von Webseiten anhand ihrer Verlinkung, mit dem sich ein Ranking-Verfahren angeben lässt. Es wurde 1999 von Jon Kleinberg vorgeschlagen und ist unter dem Namen hypertext-induced topic selection (HITS) bekannt.

Dabei wird davon ausgegangen, dass jede Seite zum einen als Hub bewertet werden kann, der durch Hyperlinks auf andere Seiten bestimmt, welche Seiten gut sind, und zum anderen als Authority, das heißt als eine Seite, die als besonders gut angesehen wird. Hubs sind beispielsweise populäre Linksammlungen. Authorities sind Seiten, die von Hubs oft verlinkt werden. Jeder Seite i aus einer Grundmenge von i=1\ldots n Seiten wird ein Hub-Gewicht hi und ein Authority-Gewicht ai zugeordnet. Beide Werte hängen folgendermaßen zusammen:

h_i = \delta \sum_{j=1}^n A_{ij} \,a_j
a_i = \lambda \sum_{k=1}^n {A^T}\!_{ik} \,h_k

Dabei ist A die Verlinkungsmatrix, in der Ai,j = 1, falls die Seite i einen Link auf die Seite j besitzt, und Ai,j = 0, falls dies nicht der Fall ist. AT ist die Transponierte Matrix von A, d.h. {A^T}\!_{ij}=A_{ji}. Es gilt also:

  • Der Hub-Wert einer Seite i ergibt sich aus der Summe aller Authority-Werte der Seiten, die von i verlinkt sind.
  • Der Authority-Wert einer Seite i ergibt sich aus der Summe aller Hub-Werte der Seiten, die auf i verlinken.

Die Werte für h und a können folgendermaßen berechnet werden. Durch gegenseitiges Einsetzen der Definitionen erhält man die Gleichungen

h=\delta\,\lambda\, A A^T \,h\,
a=\delta\,\lambda\, A^T\!\!A \,a\,

Mögliche Werte für h und a ergeben sich als Eigenvektoren der Matrizen AAT bzw. ATA.

Siehe auch: Skalenfreies Netzwerk

Literatur

  • Jon Kleinberg: Authoritative sources in a hyperlinked environment. In: Journal of the ACM, vol. 36 nr. 5, S. 604-632, 1999 (pdf)

Wikimedia Foundation.

Игры ⚽ Нужно решить контрольную?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Hyperlink Induced Topic Search (HITS) — Hyperlink Induced Topic Search (angek. HITS ) bezeichnet einen Algorithmus zur Ermittlung der kompetentesten Ergebnisse in einem Suchprozess. Wesentliches Merkmal dieses Algorithmus ist es, dass die Qualität von Inbound Links bei der… …   SEO Wörterbuch

  • BLAST-Algorithmus — BLAST (Abk. für engl. Basic Local Alignment Search Tool) ist der Überbegriff für eine Sammlung der weltweit am meisten genutzten Programme zur Analyse biologischer Sequenzdaten. BLAST wird dazu verwendet, experimentell ermittelte DNA oder Protein …   Deutsch Wikipedia

  • Web-Mining — Unter Web Mining versteht man die Übertragung von Techniken des Data Mining zur (teil)automatischen Extraktion von Informationen aus dem Internet, speziell dem World Wide Web. Web Mining übernimmt Verfahren und Methoden aus den Bereichen… …   Deutsch Wikipedia

  • Webmining — Unter Web Mining versteht man die Übertragung von Techniken des Data Mining zur (teil)automatischen Extraktion von Informationen aus dem Internet, speziell dem World Wide Web. Web Mining übernimmt Verfahren und Methoden aus den Bereichen… …   Deutsch Wikipedia

  • Web Mining — Unter Web Mining (web mining) auch Webmining versteht man die Übertragung von Techniken des Data Mining zur (teil)automatischen Extraktion von Informationen aus dem Internet, speziell dem World Wide Web. Webmining übernimmt Verfahren und Methoden …   Deutsch Wikipedia

  • Heavy Rotation — Rotation ist eine Maßangabe für die Häufigkeit der Einsätze eines Musiktitels in Hörfunk und Musikfernsehen. Das einzelne Spielen eines Songs wird auch als Spin bezeichnet. Im Englischen spricht man von „light rotation“, wenn ein Song 5 bis 15… …   Deutsch Wikipedia

  • SecurID — Klassisches Modell der RSA SecurID als Schlüsselanhänger. Neuere …   Deutsch Wikipedia

  • Sing Star — SingStar Entwickler: Sony Computer Entertainment, London Studio Verleger: Sony Computer Entertainment, London Studio …   Deutsch Wikipedia

  • Singstar — Entwickler: Sony Computer Entertainment, London Studio Verleger: Sony Computer Entertainment, London Studio …   Deutsch Wikipedia

  • UltraStar — SingStar Entwickler: Sony Computer Entertainment, London Studio Verleger: Sony Computer Entertainment, London Studio …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”