NVIDIA GTX 480 Grafikkarte im Test

Leistungsfön?

Seite 2: Details und Neuerungen

NVIDIA war trotz vollmundiger Versprechen nicht in der Lage die Karte nach dem Launch für ihre wartende Kundschaft bereitzustellen. Bis heute lassen sich die GTX 480 Karten kaum in unserem Preisvergleich mit der frohen Botschaft „Auf Lager“ blicken. Selbst versprochene Pressesamples wurden nicht abgegeben, da auch hier anscheinend die Versprechungen des Marketings von der harten Realität überholt wurden. Unser Dank gilt daher der Firma Zotac, die möglichst schnell eine GTX 480 Grafikkarte im Referenzdesign bereitstellen konnte.

   
(*klick* zum Vergrößern)


   
(*klick* zum Vergrößern)


Gefertigt werden die neuen GTX 400 ("Fermi") Grafikbeschleuniger im 40nm Verfahren bei TSMC, welche auch für die Fertigung von AMDs aktueller HD5000 Serie verantwortlich sind. Primär bestehen die neuen Fermi Grafikprozessoren aus maximal vier GPCs (Graphic Processing Clusters). Diese GPCs beherbergen neben der Raster Engine vier Streaming Multiprocessors (Shader Cluster). Jeder dieser Cluster verfügt maximal über 32 CUDA Cores (Streamprozessoren, Shadereinheiten), vier TMUs (Texture Mapping Units, Textureinheiten) sowie eine PolyMorph Engine.
Dazu stehen je GPC 16 Load/Store Einheiten zur Verfügung, welche die Quell und Zieladressen von 16 Threads pro Takt berechnen und die Ergebnisse in den Cache oder VRAM schreiben können. Zusätzlich dazu hat Nvidia noch pro GPC vier Special Function Units (SFU) zur Sinus- und Kosinus Berechnung vorgesehen. Jede dieser SFUs kann pro Takt eine Instruktion pro Thread ausführen.

Bei den CUDA Cores handelt es sich weiterhin um einfache skalare Streamprozessoren, die aus einer vollwertigen ALU (Arithmetic Logic Unit) und einer FPU (Floating Point Unit) bestehen. Texture Processing Clusters wie sie noch bei G80 und GT200 vorhanden waren entfallen bei der Fermi Architektur komplett, stattdessen sind hier je Shader-Cluster vier Textureinheiten vorhanden.
Dadurch verschlechtert sich zwar das Verhältnis von Shadern zu TMUs, dafür ist allerdings ein 12KB L1-Texture-Cache pro Shader-Cluster vorhanden. Zusätzlich verfügen die Textureinheiten nun über eine eigene "High Clock Domain", welche mit einer höheren Frequenz als die restlichen Einheiten auf dem Chip angesprochen werden können.
Die sechs ROPs (Raster Operation Processors) sind weiterhin an den jeweiligen Speichercontroller angegliedert, fassen statt vier nun acht Rastereinheiten pro Partition. Ein ROP kann dabei nach einem Takt ein 32-Bit-Integer-Pixel, ein 16 Bit-Floating-Point-Pixel nach zwei Takten oder ein 32-Bit-FP-Pixel nach vier Takten ausgeben. Die Anzahl der maximal zu bearbeiteten Pixel wird aber dadurch limitiert, das jeder der Shader-Cluster pro Takt nur 2 Pixel an die ROPs weitergeben kann.
Das heißt das bei der aktuellen GTX 480/470 die volle Anzahl der ROPs nur bei der überwiegenden Bearbeitung von 16- und 32-Bit-Floating-Point-Pixeln genutzt werden kann, wodurch die maximale Pixelfüllrate limitiert wird. Werden Formate genutzt die höher als 32-Bit-Pixel liegen können aufgrund anderer Belegung der Datenpfade ebenfalls nicht alle ROPs genutzt werden. Durch die starke Auslegung der Fermi-Architektur auf GPU-Computing weist ein Fermi Grafikprozessor neben Shared Memory auch einen L1- und L2-Chache auf, dadurch kann jeder Shader-Cluster auf insgesamt 76 KB Cache zugreifen. 12 KB sind dabei als L1-Texture-Cache für die TMUs vorgesehen, die restlichen 64 KB sind frei konfigurierbar (L1-Cache und Shared Memory). Weiter ist bei der Fermi Architektur ein globaler, als Unified ausgelegter L2 Cache vorhanden, welcher mit 768 KB bemessen ist. Dieser L2-Cache ist dafür zuständig alle Load-, Store- und Textur-Anfragen aufzunehmen. Alle Einheiten können auf diesen gleichzeitig zugreifen. Auch die Renderingpipeline hat Nvidia bei der Fermi Architektur neu organisiert. Zunächst erhält die GPU Befehle von der CPU über das Host-Interface. Daraufhin kopiert die GigaThread Engine Daten aus dem Arbeitsspeicher in den Videospeicher der Grafikkarte und teilt diese in Thread-Blöcke ein. Über die bereits erwähnten GPCs werden diese dann an die jeweiligen Shader-Cluster (oder auch Streaming Multiprocessors) übermittelt. Jeder dieser Block wird danach in 32 Threads (bzw. Warps) unterteilt, wobei jeder Shader-Cluster 48 Warps verarbeiten kann bevor diese an die Streamprozessoren weitergeleitet werden.

Der Chiptakt der NVIDIA GTX 480 Grafikkarte im Referenzdesign liegt bei 700 MHz, der GDDR5 Speichertakt des 1.536 MB großen Speicher mit einer 384 Bit Anbindung, bei 1.848 MHz und die Shader-Einheiten gehen mit 1.401 MHz zu Werke.


HD 5870
GTX 285
GTX 480
GTX 470
unit
Codename
RV870
GT200b
GF100
GF100
-
Process
40
55
40
40
nm
Transistors
2150
1400
3000
3000
millions
Stream Procesors
320 (5D)
240 (1D)
480 (1D)
448 (1D)
-
Texture Mapping Units
80
80
60
56
-
Raster Operation Units (ROPs)
32
32
40
48
-
Core clock
850
648
700
607
MHz
Shader clock
850
1476
1401
1215
MHz
Memory
1024
1024
1536
1280
MB
Memory interface
256
512
384
320
Bit
Memory clock
2400
1242
1848
1676
MHz x2 (DDR)
Memory bandwith
153600
158976
177408
134080
MB/s
Shader-Model
5.0
4.0
5.0
5.0
-
Dual/Triple SLI/CF support
/
/
/
/
-
Bus Technology
PCIe 2.1
PCIe 2.0
PCIe 2.1
PCIe 2.1
-
Form Factor
Dual
Dual
Dual
Dual
slot
Preis
ab ~350
ab ~280
ab ~479
ab ~349



 
(*klick* zum Vergrößern)


Die Länge der GTX 480 liegt bei knapp 27cm und bleibt identisch zur GTX 285. Zur Erinnerung, AMD kommt mit der HD 5870 Grafikkarte auf 28cm. Vor dem Kauf müssen bei beiden Grafikkarten die Platzverhältnisse im heimischen Gehäuse auf Kompatibilität hin überprüft werden. Das Dual-Slot Kühlsystem auf dem schwarzen PCB verdeckt die Kühlplatte und Aluminium Kühlfinnen darunter. Gleich vier Heatpipes kümmern sich um die Abwärme der Grafikkarte. Unterstützt wird das Ganze durch einen 65 mm Radiallüfter, der die erwärmte Luft über rückwärtige Öffnungen ableitet. Er dreht zwar normalerweise mit rund 1.500 U/min, gebärdet sich unter Vollast mit bis zu 4.100 U/min wie eine Turbine.

   
(*klick* zum Vergrößern)


   
(*klick* zum Vergrößern)


Als Anschlussmöglichkeiten bietet die GTX 480 zwei Dual-Link DVI und einen Mini-HDMI Anschluss nach HDMI Verion 1.3. Auf einen Display Port wurde verzichtet. Maximal können so mit einer Grafikkarte zwei Monitore angesteuert werden. Für 3D Vision (3 Monitore) sind zwei Grafikkarten notwendig.
Für die Stromzufuhr stehen je ein 6-Pin Anschluss und ein 8-Pin Anschluss bereit, die löblicherweise nicht an das Grafikkartenende platziert wurden, sondern seitlich. Damit wird die Länge im Gehäuse nicht noch durch die Stecker erhöht. NVIDIA gibt die Leistungsaufnahme unter Last mit 250W an. In Windows taktet der Speicher nur noch mit 135 MHz und der Shader mit 101 MHz. Zusätzlich spendierte NVIDIA der GTX 480 eine Abschaltung von mehreren nicht benötigten Einheiten sowie ein herabsetzen der TMU-Domäne auf 50 MHz um im Windows Betrieb einiges an Energie einzusparen. Dies erfolgt schrittweise je nach Auslastung. Zumindest in der Theorie sollte die Leistungsaufnahme erträglich bleiben, später dazu mehr.
Nächste Seite: Lieferumfang Zotac Referenzkarte