Zotac GeForce GTX 680 AMP!

Schwergewicht für Gamer

Seite 2: Der GK104 Chip

Die GeForce GTX 680 soll neben der hohen Performance durch Effizienz und eine geringe Leistungsaufnahme punkten. Erreicht wird dies zum einen durch den verwendeten 28 nm-Fertigungsprozess und viele Design-Verbesserungen im Gegensatz zur Fermi-Architektur. Besonders das Perfomance-/Watt-Verhältnis stand laut NVIDIA beim Design im Vordergrund. Die Streaming-Multiprozessoren, kurz SMX, werden nun parallel zum Chiptakt getaktet und nicht wie früher mit dessen doppelter Frequenz (Hotclocks) betrieben. Um die Leistung der GPU nicht zu schmälern, wurden infolgedessen ganze 1536 Cuda-Kerne in den GK104-Chip integriert. Demzufolge ist das Performance-/Watt-Verhältnis doppelt so gut wie beim Vorgängerchip Fermi.

Die Architektur des Kepler-Chips setzt sich folgendermaßen zusammen. Wie Fermi, besteht die Kepler-GPU aus einer Kombination aus Graphics Processing Clusters (GPCs), Streaming Multiprozessoren (SMs) und Speichercontrollern. Die neue GeForce GTX 680 kann dabei auf ganze vier GPCs, acht SMs und vier Speichercontroller zurückgreifen. Jeder einzelne GPC hat eine eigene Raster-Engine und zwei SMX-Einheiten. Mit den insgesamt acht SMX-Einheiten kommt die GeForce GTX 680 auf ganze 1536 Cuda-Kerne.

Das Speichersystem wurde ebenfalls komplett überarbeitet, was einen deutlich angestiegenen Speichertakt von 6008 MHz ermöglichte. Dies ist ein neuer Rekord im Bereich der GPU-Industrie. Jeder einzelne Speichercontroller besitzt 128 KByte L2-Cache und acht ROP-Einheiten. Insgesamt hat die GeForce GTX 680 mit vier Speichercontrollern also 512 KByte L2-Cache und 32 ROP-Einheiten.

Ein weiteres, innovatives Feature der neuen GeForce GTX 680 ist zweifellos die GPU Boost Funktion. Die GPU Boost Funktion entspringt dabei Beobachtungen der NVIDIA-Ingenieure während die thermischen Eigenschaften des Chips untersucht wurden, auf deren Basis die finalen Taktfrequenzen determiniert werden. Es wurde ersichtlich, dass eine Vielzahl der aktuellen Spiele, deren Leistungshunger von Spiel zu Spiel unterschiedlich ist, niemals die gesamte TDP des Chips ausreizt. Die GPU Boost Funktion setzt genau an diesem Punkt an. Sobald eine 3D-Anwendung die GPU nicht an das TDP-Limit bringt, ist die GPU in der Lage die Taktfrequenz dynamisch anzuheben. Ein extra zu diesem Zwecke integrierter Hardware-Schaltkreis überwacht dabei die Leistungsaufnahme der GPU. So wird der maximal mögliche Chiptakt im Rahmen der vordefinierten TDP erreicht.



Die GPU Boost-Funktion operiert dabei vollkommen autonom. Das heißt, dass keine weitere Software oder Game-Profile nötig sind. Der Endanwender kann sich also zurück lehnen, während die Funktion eigenständig arbeitet. Die Taktfrequenz der GeForce GTX 680 beträgt 1006 MHz und wird "Base Clock" genannt. Der "Base Clock" stellt die minimale 3D-Taktfrequnz der GPU dar die während Anwendungen, die die volle TDP ausnutzen, anliegt. Der sogenannte "Boost Clock" ist die durchschnittliche Taktfrequenz der GPU, die beim Ausführen von Anwendungen die nicht die volle TDP ausreizen, angelegt werden kann. Der "Boost Clock" liegt durchschnittlich bei 1058 MHz und damit 5 Prozent über dem "Base Clock".

In vielen Szenarien ist die Leistungsaufnahme jedoch so gering, dass GPU Boost die GPU-Taktfrequenz noch weiter anheben kann. Insofern genug Spielraum in Sachen TDP beziehungsweise aktueller Leistungsaufnahme vorhanden ist, kann GPU Boost den Takt kontinuierlich anheben. Taktfrequenzen von 1100 MHz und mehr sollen dabei möglich sein. Des Weiteren ist GPU Boost mit herkömmlichen Übertakten vereinbar. Mittels Overclocking-Tools kann der Anwender die maximale Leistungsaufnahme der GeForce GTX 680 anpassen und somit höhere Taktfrequenzen erreichen. Dies geschieht nachdem der Anwender die maximale Leistungsaufnahme angepasst hat mittels des GPU-Takt offset-Werts.

Ein weiteres neues Feature der GeForce GTX 680 ist adaptives VSync. Adaptives VSync steht ab der ForceWare 300 zur Verfügung. Die Funktion schaltet VSync dynamisch an und ab um dadurch die einzelnen Frames in einer regelmäßigeren Art und Weise darzustellen. Dadurch sollen Ruckler in Spielen minimiert werden. Sobald die Framerate unter 60 FPS fällt, schaltet die adaptive VSync-Technologie VSync automatisch ab um die eigentliche FPS-Rate wiederherzustellen und das Spiel dadurch wieder flüssiger erscheinen zu lassen. Sobald die Grenze von 60 FPS wieder überschritten wird, wird VSync wieder angeschaltet um die Bildqualität zu verbessern. Neben der GeForce GTX 680 werden auch ältere NVDIA-GPUs diese Funktion unterstützen.



FXAA ist weiteres Feature, das mit der neuen GPU-Architektur flächendeckend eingeführt wird. Bei FXAA handelt es sich um einen auf Pixel-Shadern basierenden Filter, der parallel zu anderen Post-Processing-Schritten wie Motion Blur und Bloom angewendet wird. FXAA soll einen Leistungs- und Speichernutzungs-Vorteil gegenüber Multi-Sample-Anti-Aliasing (MSAA) bieten. FXAA zielt auf Kanten-Aliasing, Single-Pixel- und Sub-Pixel-Aliasing ab. FXAA soll dadurch den visuellen Kontrast dieser Features verringern, so dass diese weniger ins Auge stechen. FXAA soll zwar nicht gänzlich das Sub-Pixel-Aliasing-Problem lösen können, es aber dennoch deutlich reduzieren können. Der Hauptvorteil von FXAA ist die höhere Performance im Vergleich zu MSAA. FXAA benötigt in vielen Fällen lediglich 1 ms oder weniger pro Frame und kann infolgedessen oftmals eine doppelt so hohe Framerate wie bei der Benutzung von 4x MSAA bieten. Die Bildqualität soll dabei in einem vergleichbaren Rahmen sein. Ab der ForceWare 300 steht die FXAA-Option im Control Panel bereit und kann in hunderten von Spielen genutzt werden.



Als letzte Neuerung führt NVIDIA das TXAA-Anti-Aliasing-Verfahren ein. TXAA soll von der FP16-Texturperformance der GTX 680 profitieren und ist eine Mischung aus Hardware-Anti-Aliasing und Custom CG Film-Style Anti-Aliasing. Bei 2x TXAA wird noch eine Komponente zur Bildverbesserung hinzugefügt. Der normale TXAA-Filter ist ein High-Quality-Resolve Filter der mit der HDR-Korrektur-Post-Processing-Pipe zusammenarbeitet. TXAA 1 bietet eine Bildqualität auf dem Level von 8x MSAA bei einer Performance auf dem Level von 2x MSAA. TXAA 2 bietet dagegen eine bessere Bildqualität als 8x MSAA bei einer Performance vergleichbar mit der Nutzung von 4x MSAA.



Alle zukünftigen Kepler-GPUs besitzen eine neue Display-Engine, die für die kommende 4K- und 3 GHz HDMI-Display-Generationen, Multi-Display-Gaming mit NVIDIA Surround, Multi-Stream-Audio und verbessertes Video-Transcoding ausgelegt ist. Die Display-Engine der GTX 680 ist in der Lage bis zu vier Bildschirme simultan anzusprechen und bietet native Surround-Unterstützung mit nur einer GeForce GTX 680-Grafikkarte. Die GTX 680 kommt mit zwei Dual-Link-DVI-Anschlüssen, einem HDMI- sowie einem DisplayPort-Anschluss daher.

Nächste Seite: Testsystem