- Graphpartitionierung
-
Graphpartitionierung bezeichnet die Anwendung geeigneter Algorithmen zur Berechnung von Graphpartitionen (vgl. Schnitt (Graphentheorie)) mit gewünschten Eigenschaften.
Inhaltsverzeichnis
Graphpartitionierung in der parallelen Programmierung
Formulierung des Problems
Graphpartitionierung findet vor allem in der Parallelverarbeitung Verwendung: Um in einem rechenintensiven Computerprogramm die Vorteile eines parallelen Systems optimal ausnutzen zu können, muss dieses zwei Kriterien erfüllen:
- Die Rechenlast muss gleichmäßig auf die Recheneinheiten verteilt werden.
- Die zur Abarbeitung des Programms nötige Kommunikation zwischen den Recheneinheiten soll möglichst klein gehalten werden, da diese immense Ausführungszeit beansprucht.
Das Optimierungsproblem als Graphpartitionierungsproblem
Dieses Optimierungsproblem lässt sich als Graph-Partitionierungsproblem formulieren:
- Die einzelnen Berechnungsaufgaben im Programm werden als Knoten eines Graphen modelliert.
- Für jede Berechnung, welche vom Resultat einer anderen Berechnung abhängig ist, werden die entsprechenden Knoten mit einer Kante verbunden.
- Nach dem Partitionieren spiegeln die berechneten Teilmengen des Graphen die Prozessoren wider, auf welche die Aufgaben verteilt werden sollen.
Damit lautet das Optimierungsproblem neu: Finde eine Partition des gegebenen Graphen so, dass:
- Die Knoten gleichmäßig auf die Teilmengen verteilt sind.
- Möglichst wenig Kanten Knoten aus zwei verschiedenen Teilmengen verbinden.
Kanten, deren adjazente Knoten in unterschiedlichen Teilmengen liegen, werden durch die Partition geschnitten und deshalb als Schnittkanten bezeichnet.
Gewichtete Graphen
Man kann das Optimierungsproblem auch für gewichtete Graphen formulieren. Damit lassen sich unterschiedlich intensive Rechenaufgaben durch verschiedene Knotengewichte darstellen. Ebenso kann durch gewichtete Kanten der Datenaustausch von unterschiedlichen Datenmengen modelliert werden. Das Optimierungsproblem heißt also allgemeiner:
- Das Knotengewicht gleichmäßig auf die Teilmengen aufteilen und
- die Summe der Gewichte der geschnittenen Kanten minimieren.
Die Summe der Gewichte der geschnittenen Kanten wird auch als Schnittgröße (engl. cutsize, edge-cut) bezeichnet. Die obige, spezielle Formulierung des Optimierungsproblems ist mit diesem äquivalent, wenn alle Kanten und Knoten das Gewicht 1 erhalten.
Beispiel
In der obigen Abbildung wurde ein (ungewichteter) Graph mit sechs Knoten und acht Kanten in zwei Teile geschnitten, zu je drei Knoten. Eine Teilmenge wird Prozessor 1 zugewiesen, die andere Prozessor zwei. Dabei werden zwei Kanten geschnitten, was einen gewissen Kommunikationsaufwand bedeutet. Es existiert keine andere gleichmäßige Verteilung der Knoten, die nicht mehr als zwei Schnittkanten bewirken würde. Somit ist diese Partition optimal.
Algorithmen
Die optimale Partition für einen Graphen zu berechnen, ist ein NP-vollständiges Problem. Deshalb existiert eine Reihe von vorgeschlagenen Heuristiken, um in kurzer Zeit wenigstens annähernd optimale Partitionen zu finden.
Diese lassen sich in etwa gliedern nach den Ansätzen, die sie verfolgen:
Rekursive Bisektion
Dieses Verfahren kann in allen der im Folgenden erwähnten Algorithmen angewendet werden. Es verfolgt das verbreitete Divide-and-conquer-Prinzip und besteht darin, dass der Graph nur in 2 Teilmengen geschnitten wird. Die entstehenden Teilgraphen werden dann rekursiv wieder zweigeteilt, bis die gewünschte Anzahl k von Teilmengen erreicht ist. Diese Zahl muss somit eine Zweierpotenz sein, d. h. k = 2t für ein (= Rekursionstiefe). Das ist in der Praxis in der Tat oft der Fall, z. B. in einem Parallelrechner, der 2t Prozessoren enthält.
Durch Anwendung von rekursiver Bisektion nimmt man eine suboptimale Lösung in Kauf, um einen großen zeitlichen Gewinn zu erzielen.
Geometrische Algorithmen
Geometrische Algorithmen machen Gebrauch von Koordinateninformationen der Knoten. Ein Graph besitzt als solches keine Koordinaten. Bei manchen Anwendungsbereichen wird der Graph aber aus einem zwei- oder dreidimensionalen Netz gebildet. Das ist z. B. der Fall, wenn in einer physikalischen Simulation ein reelles Objekt mittels eines Netzes modelliert wird, an welchem dann Berechnungen in jedem Knoten durchgeführt werden sollen. Meist sind diese jeweils nur von den Resultaten der benachbarten Knoten abhängig, so dass das Netz direkt als Graph für die Partitionierung übernommen werden kann. Die Koordinateninformationen solcher Netze widerspiegeln dann ziemlich gut die Topologie des Graphen.
Beispiele für geometrische Algorithmen:
- Koordinatenbisektion: Wähle die Koordinate (z. B. x), in welcher die Knoten am weitesten voneinander entfernt sind, und für diese einen Grenzwert c so, dass für die Hälfte der Knoten (x > c) gilt.
- Inertialbisektion: Berechne die Inertialachse und wähle diese anstelle einer Koordinatenachse.
Spektrale Bisektion
Die Idee der spektralen Bisektion ist, das (diskrete) Optimierungsproblem mathematisch in einem stetigen Gleichungssystem zu formulieren und die Lösung analytisch herzuleiten. Danach versucht man, die Lösung des stetigen Gleichungssystems diskret anzunähern.
Kombinatorische Algorithmen
Für Graphpartitionierung ohne Koordinateninformation gibt es eine Reihe kombinatorischer Algorithmen, welche hier nur namentlich erwähnt werden:
- Graph growing
- Greedy-Algorithmen
- Kernighan-Lin/Fidduccia-Mattheyses
Multilevel-Partitionierung
Die Idee hierbei ist, einen großen Graphen mittels sogenannter Matchings zusammenzuschrumpfen zu einem kleineren, welcher die globale Struktur des ursprünglichen repräsentiert. Diese Schrumpfung (engl. coarsening) wird mehrmals wiederholt, bis nur noch wenige (z. B. weniger als 100) Knoten vorhanden sind. Danach wird der kleinste Graph partitioniert. Die Partitionierung wird auf den nächstgrößeren Graphen zurückgerechnet und dort z. B. mittels Kernighan-Lin optimiert (engl. refinement), danach wieder auf den nächstgrößeren Graphen zurückgerechnet, bis man beim ursprünglichen Graphen gelandet ist. Mit diesem Schema wird sowohl die lokale als auch die globale Topologie des Graphen berücksichtigt, was zu sehr guten Ergebnissen führt.
Literatur
- U. Elsner: Graph partitioning - a survey. 1997 (englisch).
Kategorie:- Parallelverarbeitung
Wikimedia Foundation.