- Nvidia Tesla
-
Tesla ist ein Prozessor mit stark parallelisiertem Design, auch Streamprozessor genannt, der Firma Nvidia. Der auf GPU-Technik basierende Prozessor kann durch die hauseigene CUDA-API und OpenCL angesprochen werden. Das Produkt steht in direkter Konkurrenz zu AMD FireStream[1] des Konkurrenten AMD.
Nachdem die ersten Karten Mitte 2007 auf Basis der G80-GPU vorgestellt wurden, folgten ein Jahr später Tesla-Karten mit dem GT200-Grafikchip, der auch für Desktopgrafikkarten der Geforce-200-Serie genutzt wird.
Unter dem Codename „Fermi" stellte Nvidia am 30. September 2009 auf der hauseigenen „GPU Technology Conference“ den Grafikprozessor der nachfolgenden Generation vor, der in Produkten wie Tesla, Quadrokarten und in abgewandelter Form (z.B. bei Double Precision beschnitten) [2] auch in der Geforce-400-Serie verwendet wird. Teslakarten auf Basis des Fermi-Grafikprozessor kündigte Nvidia auf der Supercomputing-Messe 09 für das zweite und dritte Quartal 2010 an.[3]
Inhaltsverzeichnis
Technik
G80
Der G80-Grafikprozessor war der erste Prozessor von Nvidia, der auf der neuentwickelten Unified-Shader-Architektur basierte. Nachdem der G80 seit Ende 2006 auf den Geforce-Grafikkarten 8800 GTX und GTS verbaut wurde, stellte Nvidia erste Teslamodelle Mitte 2007 vor. Dabei wird primär der G80 im A3-Stepping verwendet, wie er auf der Geforce 8800 Ultra verbaut wurde.
GT200
Der GT200-Prozessor war der zweite Chip, welchen Nvidia auf der Teslaserie verbaute. Im Gegensatz zum G80 plante Nvidia von Anfang an mit dem Einsatz auf den Teslamodellen (daher das T in der Kennung) und implementierte die Double-Precision-Fähigkeiten über 30 zusätzliche MADD-Einheit nach der IEEE-754R-Spezifikation, was für die Geforce-Grafikkarten nicht notwendig gewesen wäre.
Fermi
Der Fermikern wird im 40-nm-Fertigungsprozess hergestellt und verfügt über rund drei Milliarden Transistoren. Er ist, im Gegensatz zu seinem Vorgänger, dem GT200, in weiten Teilen eine Neuentwicklung auf Basis der Unified-Shader-Architektur des G80-Grafikprozessors. Fermi unterteilt sich in 16 Shaderclustern, wobei jeder Cluster über 32 Streamprozessoren verfügt. Damit sind insgesamt 512 Streamprozessoren vorhanden. Der Fermi-Chip verfügt über 16 „Load/Store“-Einheiten, sowie um vier separate „Special Function Units“ zur Sinus- und Kosinus-Berechnung. Des Weiteren sind auf dem Fermikern sechs 64-Bit-Speichercontroller für GDDR5-Speicher vorhanden, woraus ein 384-Bit-Speicherinterface resultiert. Dieses ermöglicht den Ausbau des Speichers auf 1,5 GB, 3 GB und 6 GB. Die Speichercontroller können nun auch mit ECC-Speicher umgehen, der eine eigene Fehlerkorrektur aufweist.
Nvidia misst dem GPU-Computing inzwischen eine immer größere Bedeutung zu, weshalb viele Architekturänderungen des Fermikerns zu Leistungsverbesserung in diesem Bereich durchgeführt worden sind. So verfügt Fermi als erster Grafikprozessors überhaupt über eine komplette Unterstützung von C++ und ist mit dem IEEE-754-2008-Standard vollständig kompatibel (vorher noch IEEE-754-1985). Letzteres wurde notwendig, um zur Verbesserung der Double-Precision-Fähigkeiten (Rechnen mit doppelter Genauigkeit), dem gegenüber MAD genaueren FMA (Fused Multiply-Add) verwenden zu können. Dadurch kann jeder Shadercluster des Fermikerns 16 Operationen mit doppelter Genauigkeit pro Taktzyklus ausführen. Damit kann Fermi insgesamt 256 Berechnungen mit doppelter Genauigkeit pro Takt ausführen, wohingegen auf dem GT200 nur 30 möglich waren. Ebenfalls zur Verbesserung der GPU-Computing-Fähigkeiten weist der Fermi-Grafikprozessor neben dem Shared Memory auch einen L1- und L2-Cache auf.
Prozessoren
Chip Fertigung Einheiten OpenCL
VersionSchnitt-
stelleProzess
(in nm)Transistoren
(in Mio.)Die-Fläche
(in mm²)ROP-
PartitionenROPs Unified-Shader Stream-
prozessorenShader-
ClusterG80 90 681 484 6 24 128 8 1.0 PCIe GT200 / b 65 / 55 1400 576 / 470 8 32 240 10 1.0 PCIe 2.0 Fermi 40 3000 526 6 48 512 16 1.1 PCIe 2.0 Modelldaten
Modell Prozessor Speicher Typ Stream-
prozessorenChiptakt[4]
(MHz)Shadertakt
(MHz)Rechenleistung[5]
(GFlops)Größe
(MB)Takt
(MHz)Typ Speicher-
interfaceSpeicherdurchsatz
(GB/s)Tesla C870 G80 128 600 1350 519 1536 800 GDDR3 384 Bit 77 Tesla D870 2× G80 256 600 1350 1037 3072 800 GDDR3 2× 384 Bit 2× 77 Tesla S870 4× G80 512 600 1350 2074 6144 800 GDDR3 4× 384 Bit 4× 77 Tesla C1060 GT200 240 602 1296 SP: 936 / DP: 78 4096 800 GDDR3 512 Bit 102 Tesla S1070 4× GT200 960 602 1296 SP: 3732 / DP: 311 16.384 800 GDDR3 4× 512 Bit 4× 102 4× GT200b 1440 SP: 4147 / DP: 345 Tesla C2050 Fermi 448 575 1150 SP: 1030 / DP: 515 3072 1500 GDDR5 384 Bit 144 Tesla M2050 Fermi 448 575 1150 SP: 1030 / DP: 515 3072 1550 GDDR5 384 Bit 148 Tesla C2070 Fermi 448 575 1150 SP: 1030 / DP: 515 6144 1500 GDDR5 384 Bit 144 Tesla M2070 Fermi 448 575 1150 SP: 1030 / DP: 515 6144 1550 GDDR5 384 Bit 150 Tesla S2050 4× Fermi 1792 575 1150 SP: 4120 / DP: 2060 12.288 1500 GDDR5 4× 384 Bit 4× 144 Tesla S2070 4× Fermi 1792 575 1150 SP: 4120 / DP: 2060 24.576 1500 GDDR5 4× 384 Bit 4× 144 Tesla M2090[6][7] Fermi 512 ? 1300 SP: 1331 / DP: 665 6144 1850 GDDR5 384 Bit 177 Weblinks
- nVidia Tesla auf der offiziellen nVidia Homepage
- Fermi-Architektur auf der offiziellen Nvidia Homepage
- Whitepaper - nVidia Fermi Architektur (englisch)
Einzelnachweise
- ↑ AMD: ATI Stream Technology - Commercial
- ↑ Tomshardware: DP-Geschwindigkeit der GTX 480 beschnitten, Nachricht vom 6. April 2010
- ↑ golem: Nvidia nennt erste Leistungswerte zu Fermi, Nachricht vom 16. November 2009
- ↑ The Register: The GPU tails wag the CPU dogs at Nvidia show
- ↑ Rechnerisch ermittelte, theoretische maximale Rechenleistung, die real mit sinnvollem Programmcode nie erreicht werden kann.
- ↑ TESLA M2090 DUAL-SLOT COMPUTING PROCESSOR MODULE Board Specification
- ↑ Produktübersicht M2090
Grafikprozessoren: NV1 | Riva | TNT | TNT2 | Vanta | Quadro
Geforce-Familie: Geforce 256 | Geforce 2 | Geforce 3 | Geforce 4 | Geforce FX | Geforce 6 | Geforce 7
Geforce 8 | Geforce 9 | Geforce 100 | Geforce 200 | Geforce 300 | Geforce 400 | Geforce 500Mobil und Ultramobil: Goforce | Tegra | Geforce Go | Geforce M
Chipsätze: Nforce | Nforce2 | Nforce3 | Nforce4 | Nforce 500 | Nforce 600 | Nforce 700 | ION
Prozessoren: Nvidia Tegra | Nvidia Tesla
Sonstiges: Optimus | CUDA | PhysX | PureVideo HD | SLI | TurboCache | VDPAU
Wikimedia Foundation.
Schlagen Sie auch in anderen Wörterbüchern nach:
Nvidia Tesla — The Tesla graphics processing unit (GPU) is nVidia s third brand of GPUs. It is based on high end GPUs from the G80 (and on), as well as the Quadro lineup. Tesla is nVidia s first dedicated General Purpose GPU. The Tesla series takes its name… … Wikipedia
Nvidia Tesla — C870 Tesla название семейства вычислительных систем NVIDIA на основе графических процессоров с архитектурой CUDA, которые могут быть использованы для научных и технических вычислений общего назначения … Википедия
Nvidia Tesla Personal Supercomputer — est le nom d un ordinateur de bureau[1] destiné à démontrer les capacités des cartes graphiques TESLA. Elles utilisent le système CUDA Pour faire du calcul parallèle. De 1 à 4 cartes TESLA peuvent être intégrées à la machine, totalisant jusqu à… … Wikipédia en Français
Nvidia Tesla personal supercomputer — est le nom d un ordinateur de bureau[1] destiné à démontrer les capacités des cartes graphiques TESLA. Elles utilisent le système CUDA Pour faire du calcul parallèle. De 1 à 4 cartes TESLA peuvent être intégrées à la machine, totalisant jusqu à… … Wikipédia en Français
NVIDIA Tesla — Tesla cерия графических процессоров фирмы NVIDIA для высокопроизводительных вычислений по кластерной технологии. Графические ускорители на базе Tesla поддерживают технологию центрального процессора. Благодаря очень высокой вычислительной мощности … Википедия
Nvidia Tesla Personal Supercomputer — The Tesla Personal Supercomputer is a desktop computer (personal supercomputer) that is backed by Nvidia and built by Dell, Lenovo and other companies[1]. It is meant to be a demonstration of the capabilities of Nvidia s Tesla GPGPU brand; it… … Wikipedia
NVidia Tesla — … Википедия
Tesla (Nvidia) — Pour les articles homonymes, voir Tesla. Tesla est le nom d un processeur et d une gamme de produits annoncés par NVIDIA le 21 juin 2007. Tesla est basé sur un ou des processeur graphique capable d assister le processeur central pour les calculs… … Wikipédia en Français
Tesla (nVidia) — Pour les articles homonymes, voir Tesla. Tesla est le nom d un processeur et d une gamme de produits annoncés par NVIDIA le 21 juin 2007. Tesla est basé sur un ou des processeur graphique capable d assister le processeur central pour les calculs… … Wikipédia en Français
NVidia GT300 — Фотография кристалла NVIDIA Fermi NVIDIA GT300 (официальное название NVIDIA Fermi) это графический чип (GPU) нового поколения от корпорации NVIDIA, который первым в арсенале компании поддерживает последнюю версию API от корпорации… … Википедия