Gigabyte GeForce GTX 970 G1 Gaming

Abgehoben!

Seite 2: Die Maxwell-Architektur im Überblick

Wie schon bei den Vorgängern werden auch die aktuellen High-End-GPUs von NVIDIA im 28nm Prozess bei TSMC gefertigt. Im Vorfeld wurde bereits schon länger spekuliert, ob TSMC die Fertigung im 20nm Prozess nicht doch noch auf stabile Beine stellen würde und NVIDIA die neuen GeForce GPUs eben in diesem fertigen lässt. Doch es scheint so, als wäre NVIDIA von der Fertigung und Ausbeute noch nicht überzeugt, sodass man mit dem 28nm Prozess in die nächste Runde ging. Sowohl bei der GeForce GTX 980, als auch der GeForce GTX 970 kommt die neue Maxwell-GPU mit dem Codenamen GM204 zum Einsatz. Diese setzt sich aus 5,2 Milliarden Transistoren zusammen und ist 398mm² groß.


Vergleicht man den GM204-Chip mit dem High-End-Vorgänger der Kepler-Serie, dem GK110, fällt auf das die Maxwell-Architektur mit rund 35 Prozent weniger Transistoren an den Start geht. Anders als bei den Vorgängern erlaubt dies NVIDIA scheinbar deutlich kräftiger an der Taktschraube zu drehen und lässt die 1.664 Shader-Einheiten mit 1.050 MHz im Basis-Takt arbeiten. Bei gewährleisteter Kühlung soll die GPU mindestens 1.178 MHz im Boost erreichen, hier ist aber noch deutlich mehr drin wie einige Custom-Designs der NVIDIA-Partner zeigen. Der GPU zur Seite stehen 4.096 MByte GDDR5 Grafikspeicher, die mit einem Takt von 1.750 MHz betrieben werden. Für die GeForce GTX 970 als auch die größere GTX 980 verwendet NVIDIA die schnellsten GDDR5-Speicherchips. Angebunden sind diese allerdings nur mit 256 Bit, was eine Speicherbandbreite von 224 GByte pro Sekunde ergibt. Zum Vergleich, eine AMD Radeon R9 290(X) ist mit einem 512 Bit Speicherinterface (320 GB/s) ausgestattet, eine GeForce GTX 780 Ti mit 384 Bit (336 GB/s) und eine GeForce GTX 770 mit 256 Bit (224 GB/s).

Insgesamt vier Graphics-Processing-Cluster (GPC) bietet der GM204-Chip im Vollausbau. Jeder GPC setzt sich aus vier Maxwell-Streaming-Multiprozessoren (SMM) zusammen. Ein SMM teilt sich wiederum in vier Blöcke zu je 32 Shadereinheiten auf. Insgesamt ergibt das 16 SMM x 4 SMM-Blöcke x 32 ALUs und damit 2.048 Shadereinheiten. Weiter sind jedem SMM zusätzlich acht Textureinheiten zugeordnet, was insgesamt 128 dieser Einheiten ergibt. Nicht zu vergessen sind 64 ROP Pixel-Piplines und die vier Speichercontroller mit jeweils 64 Bit. Die Eckdaten der GeForce GTX 970 erreicht NVIDIA durch die Deaktivierung von drei SMM, sodass insgesamt nur noch 1.664 Shadereinheiten zur Verfügung stehen (13 SMM x 4 SMM-Blöcke x 32 ALUs).

Weiter stehen jedem 32er SMM-Block ein Instruction Buffer und ein Warp Scheduler zur Verfügung. Jeweils zwei Dispatch Units haben Zugriff auf 16.384 Register mit 32 Bit. 128 Shadereinheiten werden mithilfe von vier Warp Schedulern und acht Dispatch Units über 65.536 Register bei 32 Bit die Daten beziehungsweise Rechenaufgaben zugeteilt. Jeder einzelnen Recheneinheit stehen bei Maxwell somit theoretisch 512 Register zur Verfügung, während es bei Kepler circa 341 sind. Diese Maßnahme soll dazu führen das die Shader bis zu 35 Prozent schneller arbeiten können.

Speicherkomprimierung für mehr Bandbreite

Dem bereits erwähnten geschrumpften Speicherinterface will NVIDIA mit einer neuen Speicherkomprimierung entgegenwirken. Hierfür verwendet man die sogenannte Delta Color Compression. Bei diesem Verfahren wird ein Basispixelwert gespeichert und für die umliegenden Pixel in einer 8x8 Matrix nur noch der Unterschied (Delta) gespeichert. Da Delta ein deutlich kleinerer Wert ist, kann dieser schneller bei geringerem Speicherverbrauch gespeichert werden. Durch diese Optimierung sollen aus der Speicherbandbreite von 224 GByte pro Sekunde 297 GByte pro Sekunde werden.


Die Möglichkeiten der Komprimierung präsentierte NVIDIA anhand eines Screenshots aus GRID 2. Hierbei zeigt sich das sich große Bereiche effektiver speichern lassen. Auch wenn das Beispiel von NVIDIA sicherlich extrem gewählt wurde und so in der Praxis nicht allzu oft auftritt, ist die Speicherkomprimierung ein entscheidender Schritt mit dem man die Leistung des 256 Bit breiten Speichercontrollers steigert. AMD verwendet bei der Tonga-GPU der Radeon R9 285 ebenfalls eine Speicherkomprimierung.

Dynamic Super Resolution

Mit Maxwell führt NVIDIA Dynamic Super Resolution (DSR) ein. Diese Technik soll dafür sorgen, dass Spiele auch auf 1.080P Displays noch besser aussehen können. Dahinter verbirgt sich im Grunde eine Technik die nicht wirklich neu ist – Downsampling. Mit DSR will NVIDIA Gamern den Griff zu spezieller Software oder Programmanpassungen ersparen, da auf die Funktion direkt aus dem Treiber heraus zugegriffen werden kann.


In der Tech-Demo zeigt NVIDIA wie sich DSR auf die Darstellungsqualität auswirken kann. Zusätzlich zum Downsampling verwendet NVIDIA einen speziellen Filter, der die Darstellungsqualität weiter verbessern soll. Um die DSR-Effekte nutzen zu können greift der Treiber auf dedizierte Hardware im Framebuffer und den Render-Pipelines der Maxwell-Architektur zurück. DSR steht auch für Grafikkarten der GeForce 700 Serie zur Verfügung.

MFAA – Multiframe Sampled Anti-Aliasing

Eine weitere Neuerung die mit Maxwell Einzug hält ist MFAA (Multiframe Sampled Anti-Aliasing). Der neue AA-Algorithmus soll die Bildqualität von Multisampling-Antialiasing (MSAA) erreichen, hierbei aber nur die halbe Performance benötigen.


MFAA basiert grundlegend auf herkömmlichem 2x MSAA, nutzt jedoch zwei verschiedene Abtastmuster welche sich von Frame zu Frame abwechseln. Die mit unterschiedlichem Muster abgetasteten Punkte vom aktuellen und dem vorherigen Frame werden abschließend verrechnet und dargestellt. Durch dieses Verfahren soll 4x MFAA das optische Resultat von 4x MSAA erreichen, dabei aber nur den Performancehunger von 2x MSAA mit sich bringen. Durch das Einbeziehen von Abtastpunkten aus dem vorangegangenen Bild kann sich jedoch, insbesondere bei schnelleren Bewegungen, ein ungewollter Motion-Blur-Effekt (Bewegungsunschärfe) einstellen. NVIDIA deaktiviert aus diesem Grund MFAA bei Frameraten unter 40 Bildern pro Sekunde automatisch.


Um MFAA zu nutzen muss dies lediglich im Treiber aktiviert werden. Wird in einem Spiel anschließend 2x MSAA ausgewählt, greift 4x MFAA und liefert eine bessere Bildqualität. Da es sicher hierbei um ein Software-Feature handelt, ist die Technik auch mit älteren GPUs kompatibel, soll aber vorerst noch speziell der GeForce GTX 900 Serie vorbehalten sein.

VXGI (Voxel Global Illumination)

Mit Voxel Global Illumination (VXGI) verfolgt NVIDIA das Ziel eine möglichst realistische Berechnung der Beleuchtung zu ermöglichen. Raytracing ist dabei das angestrebte Ziel, doch bis dies in aktuellen Auflösungen möglich sein wird soll VXGI einen Zwischenschritt darstellen. Die Beschreibung der Art und Weise wie VXGI im Detail funktioniert ist derart komplex, sodass wir an dieser Stelle darauf verzichten da dies den Rahmen sprengen würde. Stattdessen zeigt NVIDIA mit der nachgestellten Apollo 11 Mondlandung die Leistungsfähigkeit von VXGI und beweist dabei zudem dass diese tatsächlich stattgefunden hat.


DirectX 12

Maxwell ist NVDIAs erste Architektur die Unterstützung für den künftigen DirectX-Standard in der Version 12 bietet. Noch hat Microsoft die finalen Spezifikationen von DirectX 12 nicht festgelegt, doch hat NVIDIA bereits zumindest einen Teil der notwendigen Spezifikationen mit der Maxwell-Architektur umgesetzt. Ob dies gleichzeitig auch bedeutet, dass man alle Features auf Hardwareebene unterstützen wird ist noch unklar.

Nächste Seite: Die Grafikkarte im Detail