- Blue Gene
-
Blue Gene ist ein Projekt, eine High-End-Computertechnik zu entwerfen und zu bauen. Laut IBM sowohl zur Erforschung der Grenzen des Supercomputing: in der Computerarchitektur, der zur Programmierung und Kontrolle massiv paralleler Systeme nötigen Software und um die Rechenkraft zur Erlangung eines besseren Verständnisses biologischer Prozesse wie etwa der Proteinfaltung zu nutzen.[1] Letzteres war auch für die Namensgebung verantwortlich.
Im Dezember 1999 kündigte IBM ein auf fünf Jahre angelegtes Programm an, einen massiv parallelen Computer zu bauen, der bei der Erforschung biomolekularer Phänomene wie der Proteinfaltung helfen soll. Zielvorgabe war dabei, Geschwindigkeiten im Peta-FLOPS-Bereich zu erreichen.
Es handelt sich um ein kooperatives Projekt zwischen dem US-Energieministerium (welches das Projekt teilweise auch finanziert), der Industrie (insbesondere IBM), und den Hochschulen. In der Entwicklung befinden sich fünf Blue Gene-Projekte, darunter Blue Gene/L, Blue Gene/P und Blue Gene/Q (siehe Advanced Simulation and Computing Program).
Als erste Architektur war Blue Gene/L vorgesehen. Die Vorgaben lagen bei einem System mit einer Spitzenleistung von 360 TFLOPS auf 65.536 Nodes und Fertigstellung 2004/2005. Die darauffolgenden Maschinen sollen bis zu 1000 TFLOPS (Blue Gene/P, 2006/2007) beziehungsweise 3000 TFLOPS (Blue Gene/Q, 2007/2008) erreichen. Die Dauerleistung dieser Nachfolgesysteme von Blue Gene/L soll bei 300 TFLOPS beziehungsweise 1000 TFLOPS liegen.
Der Chef-Architekt des Projekts bei IBM ist Monty Denneau.
Inhaltsverzeichnis
Blue Gene/L
Bei Blue Gene/L handelt es sich um eine Familie sehr gut skalierbarer Supercomputer. Das Projekt wird von IBM gemeinsam mit dem Lawrence Livermore National Laboratory finanziert.
Die Architektur besteht aus einem Basisbaustein (Knoten oder Compute-Chip), der immer wieder wiederholt werden kann, ohne dass Flaschenhälse entstehen. Jeder Knoten des BG/L besteht aus einem ASIC mit zugehörigem DDR-SDRAM-Speicher. Jeder ASIC wiederum enthält zwei 0,7 GHz PowerPC Embedded 440 Prozessorkerne, zwei „Double Hummer“ FPU[2], ein Cachesubsystem und ein Kommunikationssubsystem.
Die doppelten TFlops-Raten (2,8 bzw. 5,6 TFLOPS) auf verschiedenen Zeichnungen im Netz rühren von der Tatsache her, dass ein ASIC mit zwei Prozessoren in zwei Modi betrieben werden kann, welche entweder beide Prozessoren für Rechenaufgaben verwenden, oder nur einen für Rechenaufgaben und den anderen als Coprozessor für Kommunikationsaufgaben. Für die Kommunikation zwischen den Prozessoren steht ein Hochgeschwindigkeitsnetzwerk mit einer 3D-Torus-Topologie, sowie ein hierarchisches Netzwerk für kollektive Operationen zur Verfügung.
Der Zugriff auf das Torus-Netzwerk erfolgt über speicher-gemappte Netzwerkadapter, um ähnlich wie bei InfiniBand sehr niedrige Latenzzeiten zu erzielen. Für die Kommunikation wurde eine modifizierte MPICH2-Implementierung entwickelt. Auf den Rechenknoten läuft ein speziell hierfür programmierter, sehr kleiner POSIX-Kernel, welcher kein Multitasking unterstützt – das laufende Programm ist also der einzige Prozess auf dem System.
In der Ausgabe November 2004 der TOP500-Liste übernahm das noch im Aufbau befindliche System Blue Gene/L am Lawrence Livermore National Laboratory mit 16 Racks (16.384 Knoten, entspricht 32.768 Prozessoren) den Spitzenplatz. Seitdem wurde es schrittweise ausgebaut und erreichte am 27. Oktober 2005 mit 65.536 Knoten über 280 TFLOPS, was ihm die Führung in der TOP500 11/2005 einbrachte. Zwar war diese Ausbaustufe ursprünglich als Endausbau deklariert worden, er wurde 2007 jedoch noch einmal erweitert und erbringt seitdem mit 212.992 Prozessoren in 104 Racks über 478 TFLOPS. Damit war er Mitte 2008 das viertschnellste System weltweit, befindet sich mittlerweile jedoch nur noch auf Platz 14 wieder.
Die Architektur taugt jedoch auch für andere Installationen wie den Blue Gene Watson (BGW) am IBM-eigenen Thomas J. Watson Research Center (Platz 98 in der TOP500 6/2011), JUGENE (Jülich Blue Gene am Forschungszentrum Jülich, Juni 2011 mit Platz 12 sogar vor seinem Vorgänger) und sechs weiteren Einträgen in den Top 100. Diese fallen alle unter die Bezeichnung eServer Blue Gene Solution.
Blue Gene/P
Die Blue Gene/P-Serie wurde erstmalig im Juni 2007 auf der ISC in Dresden vorgestellt. Zu den Änderungen gegenüber BG/L zählen die Verwendung von mit 850 MHz getakteten PowerPC 450 Kernen von denen jetzt vier in einem Knoten enthalten sind. Auf jeder Compute-Card sitzt jetzt zwar nur noch ein statt zweier solcher Knoten, jedoch enthält eine Node-Card als nächstgrößere Einheit 32 statt 16 solcher Compute-Cards.
Ansonsten sind die Baueinheiten gleich geblieben und ein Rack enthält somit doppelt so viele Prozessoren wie ein BG/L. Bei einer zur Taktratenerhöhung parallelen Leistungssteigerung jedes Prozessors von rund 21 % (jedenfalls beim Linpack) leistet jedes Rack nun 14 statt 5,6 TFLOPS (jeweils Rpeak). Die Speicherbandbreite wuchs im gleichen Maße, die Bandbreite des Torus-Netzwerks wurde von 2,1 GB/s auf 5,1 GB/s mehr als verdoppelt und die Latenzzeiten halbiert. Der Energiebedarf hat sich dabei laut Hersteller nur um 35 % erhöht. Für ein aus 72 Racks bestehendes System, das die Peta-FLOPS-Grenze erreichen soll, sind das ca. 2,3 Megawatt.
Eine der ersten Auslieferungen ging ins Forschungszentrum Jülich, wird dort unter dem Namen JUGENE betrieben und steht mit 180 TFLOPS in der TOP500-Liste Ende 2008 auf Platz 11[3] erste Messungen für die TOP500. Im November 2008 sind sieben Blue Gene/P-Systeme unter den 100 weltweit schnellsten Systemen vertreten.
Am 26. Mai 2009 wurde eine verbesserte Version von JUGENE (Jülich Blue Gene) eingeweiht, bei der die Anzahl der Prozessoren von 65.536 auf 294.912 erhöht wurde und damit eine Spitzenleistung von 1 Petaflops erreicht wird. Dieser Rechner ist damit derzeit (2009) der schnellste Rechner in Europa und belegt in der 33. TOP500-Liste den dritten Platz unter den schnellsten Superrechnern weltweit.[4][5]
Blue Gene/Q
Das neueste Supercomputer-Design der Reihe, Blue Gene/Q, zielt darauf ab, 20 Petaflops im Zeitrahmen bis 2011 zu erreichen. Es ist konzipiert als weitere Verbesserung und Erweiterung der Blue Gene/L- und P-Architekturen mit einer höheren Taktfrequenz bei wesentlich verbesserter Leistung pro Watt. Blue Gene/Q wird eine vergleichbare Anzahl von Knoten aber 17 anstatt vier Kerne pro Knoten aufweisen.[6][7]
Die Referenzinstallation eines Blue Gene/Q-Systems namens Sequoia wird am Lawrence Livermore National Laboratory im Jahr 2011 als Teil des „Advanced Simulation and Computing Program“ erfolgen und zur nuklearen Simulationen und der fortgeschrittenen wissenschaftlichen Forschung dienen. Es wird aus 98.304 Rechenknoten mit 1,6 Millionen Prozessorkernen bestehen und 1,6 PB Speicher in 96 Racks umfassen, die eine Fläche von etwa 280 Quadratmeter einnehmen sowie eine elektrische Leistung von 6 Megawatt benötigen.[8]
Ein Blue Gene/Q-System namens Mira wird Anfang 2012 am Argonne National Laboratory installiert werden. Es wird aus zirka 50.000 Rechenknoten bestehen (16 Rechenkerne pro Knoten), 70 PB Plattenspeicher (mit 470 GB/s I/O-Bandbreite) aufweisen und mit Wasser gekühlt werden.[9][10]
Weblinks
- IBM Research: Blue Gene (englisch)
- IBM REDP-4247-00: Evolution of the IBM System Blue Gene Solution (englisch)
- Installation am LLNL mit vielen Infos (englisch)
Referenzen
- ↑ www.research.ibm.com
- ↑ IBM PowerPC 440 FPU with complex-arithmetic extensions
- ↑ Schnellster Rechner Europas kommt nach Jülich. IBM Deutschland, 25. Juni 2007, abgerufen am 23. Juni 2007.
- ↑ Von 100 Teraflops bis 1 Petaflops: Drei neue Supercomputer in Jülich, Pressemitteilung auf heise-online vom 26. Mai 2009
- ↑ 33. TOP500-Liste vom Juni 2009, TOP500-Liste. Abgerufen am 25. August 2009
- ↑ cse.scitech.ac.uk
- ↑ http://www.heise.de/ct/artikel/Prozessorgefluester-1144202.html
- ↑ http://www.hpcwire.com/features/Lawrence-Livermore-Prepares-for-20-Petaflop-Blue-GeneQ-38948594.html
- ↑ http://www.er.doe.gov/ascr/ASCAC/Meetings/Nov09/Nov09Minutes.pdf
- ↑ http://workshops.alcf.anl.gov/gs10/files/2010/01/betsy_riley.pdf
Wikimedia Foundation.