Nvidia Tesla

Nvidia Tesla: Nvidia Tesla C870

Tesla ist ein Prozessor mit stark parallelisiertem Design, auch Streamprozessor genannt, der Firma Nvidia. Der auf GPU-Technik basierende Prozessor kann durch die hauseigene CUDA-API und OpenCL angesprochen werden. Das Produkt steht in direkter Konkurrenz zu AMD FireStream^[1] des Konkurrenten AMD.

Nachdem die ersten Karten Mitte 2007 auf Basis der G80-GPU vorgestellt wurden, folgten ein Jahr später Tesla-Karten mit dem GT200-Grafikchip, der auch für Desktopgrafikkarten der Geforce-200-Serie genutzt wird.

Unter dem Codename „Fermi" stellte Nvidia am 30. September 2009 auf der hauseigenen „GPU Technology Conference“ den Grafikprozessor der nachfolgenden Generation vor, der in Produkten wie Tesla, Quadrokarten und in abgewandelter Form (z.B. bei Double Precision beschnitten) ^[2] auch in der Geforce-400-Serie verwendet wird. Teslakarten auf Basis des Fermi-Grafikprozessor kündigte Nvidia auf der Supercomputing-Messe 09 für das zweite und dritte Quartal 2010 an.^[3]

Inhaltsverzeichnis

1 Technik

1.1 G80

1.2 GT200

1.3 Fermi

1.4 Prozessoren

2 Modelldaten

3 Weblinks

4 Einzelnachweise

Technik

G80

Der G80-Grafikprozessor war der erste Prozessor von Nvidia, der auf der neuentwickelten Unified-Shader-Architektur basierte. Nachdem der G80 seit Ende 2006 auf den Geforce-Grafikkarten 8800 GTX und GTS verbaut wurde, stellte Nvidia erste Teslamodelle Mitte 2007 vor. Dabei wird primär der G80 im A3-Stepping verwendet, wie er auf der Geforce 8800 Ultra verbaut wurde.

GT200

Der GT200-Prozessor war der zweite Chip, welchen Nvidia auf der Teslaserie verbaute. Im Gegensatz zum G80 plante Nvidia von Anfang an mit dem Einsatz auf den Teslamodellen (daher das T in der Kennung) und implementierte die Double-Precision-Fähigkeiten über 30 zusätzliche MADD-Einheit nach der IEEE-754R-Spezifikation, was für die Geforce-Grafikkarten nicht notwendig gewesen wäre.

Fermi

Der Fermikern wird im 40-nm-Fertigungsprozess hergestellt und verfügt über rund drei Milliarden Transistoren. Er ist, im Gegensatz zu seinem Vorgänger, dem GT200, in weiten Teilen eine Neuentwicklung auf Basis der Unified-Shader-Architektur des G80-Grafikprozessors. Fermi unterteilt sich in 16 Shaderclustern, wobei jeder Cluster über 32 Streamprozessoren verfügt. Damit sind insgesamt 512 Streamprozessoren vorhanden. Der Fermi-Chip verfügt über 16 „Load/Store“-Einheiten, sowie um vier separate „Special Function Units“ zur Sinus- und Kosinus-Berechnung. Des Weiteren sind auf dem Fermikern sechs 64-Bit-Speichercontroller für GDDR5-Speicher vorhanden, woraus ein 384-Bit-Speicherinterface resultiert. Dieses ermöglicht den Ausbau des Speichers auf 1,5 GB, 3 GB und 6 GB. Die Speichercontroller können nun auch mit ECC-Speicher umgehen, der eine eigene Fehlerkorrektur aufweist.

Nvidia misst dem GPU-Computing inzwischen eine immer größere Bedeutung zu, weshalb viele Architekturänderungen des Fermikerns zu Leistungsverbesserung in diesem Bereich durchgeführt worden sind. So verfügt Fermi als erster Grafikprozessors überhaupt über eine komplette Unterstützung von C++ und ist mit dem IEEE-754-2008-Standard vollständig kompatibel (vorher noch IEEE-754-1985). Letzteres wurde notwendig, um zur Verbesserung der Double-Precision-Fähigkeiten (Rechnen mit doppelter Genauigkeit), dem gegenüber MAD genaueren FMA (Fused Multiply-Add) verwenden zu können. Dadurch kann jeder Shadercluster des Fermikerns 16 Operationen mit doppelter Genauigkeit pro Taktzyklus ausführen. Damit kann Fermi insgesamt 256 Berechnungen mit doppelter Genauigkeit pro Takt ausführen, wohingegen auf dem GT200 nur 30 möglich waren. Ebenfalls zur Verbesserung der GPU-Computing-Fähigkeiten weist der Fermi-Grafikprozessor neben dem Shared Memory auch einen L1- und L2-Cache auf.

Prozessoren

Chip Fertigung Einheiten OpenCL
Version Schnitt-
stelle

Prozess
(in nm) Transistoren
(in Mio.) Die-Fläche
(in mm²) ROP-
Partitionen ROPs Unified-Shader

Stream-
prozessoren Shader-
Cluster

G80 90 681 484 6 24 128 8 1.0 PCIe

GT200 / b 65 / 55 1400 576 / 470 8 32 240 10 1.0 PCIe 2.0

Fermi 40 3000 526 6 48 512 16 1.1 PCIe 2.0

Modelldaten

Modell Prozessor Speicher

Typ Stream-
prozessoren Chiptakt^[4]
(MHz) Shadertakt
(MHz) Rechenleistung^[5]
(GFlops) Größe
(MB) Takt
(MHz) Typ Speicher-
interface Speicherdurchsatz
(GB/s)

Tesla C870 G80 128 600 1350 519 1536 800 GDDR3 384 Bit 77

Tesla D870 2× G80 256 600 1350 1037 3072 800 GDDR3 2× 384 Bit 2× 77

Tesla S870 4× G80 512 600 1350 2074 6144 800 GDDR3 4× 384 Bit 4× 77

Tesla C1060 GT200 240 602 1296 SP: 936 / DP: 78 4096 800 GDDR3 512 Bit 102

Tesla S1070 4× GT200 960 602 1296 SP: 3732 / DP: 311 16.384 800 GDDR3 4× 512 Bit 4× 102

4× GT200b 1440 SP: 4147 / DP: 345

Tesla C2050 Fermi 448 575 1150 SP: 1030 / DP: 515 3072 1500 GDDR5 384 Bit 144

Tesla M2050 Fermi 448 575 1150 SP: 1030 / DP: 515 3072 1550 GDDR5 384 Bit 148

Tesla C2070 Fermi 448 575 1150 SP: 1030 / DP: 515 6144 1500 GDDR5 384 Bit 144

Tesla M2070 Fermi 448 575 1150 SP: 1030 / DP: 515 6144 1550 GDDR5 384 Bit 150

Tesla S2050 4× Fermi 1792 575 1150 SP: 4120 / DP: 2060 12.288 1500 GDDR5 4× 384 Bit 4× 144

Tesla S2070 4× Fermi 1792 575 1150 SP: 4120 / DP: 2060 24.576 1500 GDDR5 4× 384 Bit 4× 144

Tesla M2090^[6]^[7] Fermi 512 ? 1300 SP: 1331 / DP: 665 6144 1850 GDDR5 384 Bit 177

Weblinks

nVidia Tesla auf der offiziellen nVidia Homepage

Fermi-Architektur auf der offiziellen Nvidia Homepage

Whitepaper - nVidia Fermi Architektur (englisch)

Einzelnachweise

↑ AMD: ATI Stream Technology - Commercial

↑ Tomshardware: DP-Geschwindigkeit der GTX 480 beschnitten, Nachricht vom 6. April 2010

↑ golem: Nvidia nennt erste Leistungswerte zu Fermi, Nachricht vom 16. November 2009

↑ The Register: The GPU tails wag the CPU dogs at Nvidia show

↑ Rechnerisch ermittelte, theoretische maximale Rechenleistung, die real mit sinnvollem Programmcode nie erreicht werden kann.

↑ TESLA M2090 DUAL-SLOT COMPUTING PROCESSOR MODULE Board Specification

↑ Produktübersicht M2090

Nvidia-Grafiklösungen, -Chipsätze und -Technologien

Grafikprozessoren: NV1 | Riva | TNT | TNT2 | Vanta | Quadro

Geforce-Familie: Geforce 256 | Geforce 2 | Geforce 3 | Geforce 4 | Geforce FX | Geforce 6 | Geforce 7
Geforce 8 | Geforce 9 | Geforce 100 | Geforce 200 | Geforce 300 | Geforce 400 | Geforce 500

Mobil und Ultramobil: Goforce | Tegra | Geforce Go | Geforce M

Chipsätze: Nforce | Nforce2 | Nforce3 | Nforce4 | Nforce 500 | Nforce 600 | Nforce 700 | ION

Prozessoren: Nvidia Tegra | Nvidia Tesla

Sonstiges: Optimus | CUDA | PhysX | PureVideo HD | SLI | TurboCache | VDPAU

Chip	Fertigung	Einheiten	OpenCL Version	Schnitt- stelle
Prozess (in nm)	Transistoren (in Mio.)	Die-Fläche (in mm²)	ROP- Partitionen	ROPs	Unified-Shader
Stream- prozessoren	Shader- Cluster
G80	90	681	484	6	24	128	8	1.0	PCIe
GT200 / b	65 / 55	1400	576 / 470	8	32	240	10	1.0	PCIe 2.0
Fermi	40	3000	526	6	48	512	16	1.1	PCIe 2.0

Modell	Prozessor	Speicher
Typ	Stream- prozessoren	Chiptakt^[4] (MHz)	Shadertakt (MHz)	Rechenleistung^[5] (GFlops)	Größe (MB)	Takt (MHz)	Typ	Speicher- interface	Speicherdurchsatz (GB/s)
Tesla C870	G80	128	600	1350	519	1536	800	GDDR3	384 Bit	77
Tesla D870	2× G80	256	600	1350	1037	3072	800	GDDR3	2× 384 Bit	2× 77
Tesla S870	4× G80	512	600	1350	2074	6144	800	GDDR3	4× 384 Bit	4× 77
Tesla C1060	GT200	240	602	1296	SP: 936 / DP: 78	4096	800	GDDR3	512 Bit	102
Tesla S1070	4× GT200	960	602	1296	SP: 3732 / DP: 311	16.384	800	GDDR3	4× 512 Bit	4× 102
4× GT200b	1440	SP: 4147 / DP: 345
Tesla C2050	Fermi	448	575	1150	SP: 1030 / DP: 515	3072	1500	GDDR5	384 Bit	144
Tesla M2050	Fermi	448	575	1150	SP: 1030 / DP: 515	3072	1550	GDDR5	384 Bit	148
Tesla C2070	Fermi	448	575	1150	SP: 1030 / DP: 515	6144	1500	GDDR5	384 Bit	144
Tesla M2070	Fermi	448	575	1150	SP: 1030 / DP: 515	6144	1550	GDDR5	384 Bit	150
Tesla S2050	4× Fermi	1792	575	1150	SP: 4120 / DP: 2060	12.288	1500	GDDR5	4× 384 Bit	4× 144
Tesla S2070	4× Fermi	1792	575	1150	SP: 4120 / DP: 2060	24.576	1500	GDDR5	4× 384 Bit	4× 144
Tesla M2090^[6]^[7]	Fermi	512	?	1300	SP: 1331 / DP: 665	6144	1850	GDDR5	384 Bit	177

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

Nvidia Tesla — The Tesla graphics processing unit (GPU) is nVidia s third brand of GPUs. It is based on high end GPUs from the G80 (and on), as well as the Quadro lineup. Tesla is nVidia s first dedicated General Purpose GPU. The Tesla series takes its name… … Wikipedia
Nvidia Tesla — C870 Tesla название семейства вычислительных систем NVIDIA на основе графических процессоров с архитектурой CUDA, которые могут быть использованы для научных и технических вычислений общего назначения … Википедия
Nvidia Tesla Personal Supercomputer — est le nom d un ordinateur de bureau[1] destiné à démontrer les capacités des cartes graphiques TESLA. Elles utilisent le système CUDA Pour faire du calcul parallèle. De 1 à 4 cartes TESLA peuvent être intégrées à la machine, totalisant jusqu à… … Wikipédia en Français
Nvidia Tesla personal supercomputer — est le nom d un ordinateur de bureau[1] destiné à démontrer les capacités des cartes graphiques TESLA. Elles utilisent le système CUDA Pour faire du calcul parallèle. De 1 à 4 cartes TESLA peuvent être intégrées à la machine, totalisant jusqu à… … Wikipédia en Français
NVIDIA Tesla — Tesla cерия графических процессоров фирмы NVIDIA для высокопроизводительных вычислений по кластерной технологии. Графические ускорители на базе Tesla поддерживают технологию центрального процессора. Благодаря очень высокой вычислительной мощности … Википедия
Nvidia Tesla Personal Supercomputer — The Tesla Personal Supercomputer is a desktop computer (personal supercomputer) that is backed by Nvidia and built by Dell, Lenovo and other companies[1]. It is meant to be a demonstration of the capabilities of Nvidia s Tesla GPGPU brand; it… … Wikipedia
NVidia Tesla — … Википедия
Tesla (Nvidia) — Pour les articles homonymes, voir Tesla. Tesla est le nom d un processeur et d une gamme de produits annoncés par NVIDIA le 21 juin 2007. Tesla est basé sur un ou des processeur graphique capable d assister le processeur central pour les calculs… … Wikipédia en Français
Tesla (nVidia) — Pour les articles homonymes, voir Tesla. Tesla est le nom d un processeur et d une gamme de produits annoncés par NVIDIA le 21 juin 2007. Tesla est basé sur un ou des processeur graphique capable d assister le processeur central pour les calculs… … Wikipédia en Français
NVidia GT300 — Фотография кристалла NVIDIA Fermi NVIDIA GT300 (официальное название NVIDIA Fermi) это графический чип (GPU) нового поколения от корпорации NVIDIA, который первым в арсенале компании поддерживает последнюю версию API от корпорации… … Википедия

Academic dictionaries and encyclopedias

Nvidia Tesla

Inhaltsverzeichnis

Technik

G80

GT200

Fermi

Prozessoren

Modelldaten

Weblinks

Einzelnachweise

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Nvidia Tesla

Inhaltsverzeichnis

Technik

G80

GT200

Fermi

Prozessoren

Modelldaten

Weblinks

Einzelnachweise

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link