KFA² GeForce GTX 670 EX OC

Seite 2: Der GK104 Chip

Die GeForce GTX 670 soll neben der Performance durch Effizienz und eine geringe Leistungsaufnahme punkten. Erreicht wird dies zum einen durch den verwendeten 28 nm-Fertigungsprozess und viele Design-Verbesserungen im Vergleich zur Fermi-Architektur. Besonders das Perfomance-/Watt-Verhältnis stand laut NVIDIA beim Design im Vordergrund. Die Streaming-Multiprozessoren, kurz SMX, werden nun parallel zum Chiptakt getaktet und nicht wie früher mit dessen doppelter Frequenz (Hotclocks) betrieben. Um die Leistung der GPU nicht zu schmälern, wurden infolgedessen ganze 1.536 Cuda-Kerne (GTX 670 Ti 1.344 Cuda-Kerne) in den GK104-Chip integriert. Demzufolge ist das Performance-/Watt-Verhältnis doppelt so gut wie beim Vorgängerchip Fermi.

small gtx 680 die


Die Architektur des Kepler-Chips setzt sich folgendermaßen zusammen. Wie Fermi, besteht die Kepler-GPU aus einer Kombination aus Graphics Processing Clusters (GPCs), Streaming Multiprozessoren (SMs) und Speichercontrollern. Die GeForce GTX 670 kann dabei auf vier GPCs, sieben SMs und vier Speichercontroller zurückgreifen. Jeder einzelne GPC hat eine eigene Raster-Engine und zwei SMX-Einheiten. Mit den insgesamt sieben SMX-Einheiten kommt die GeForce GTX 670 auf 1.344 Cuda-Kerne.

Das Speichersystem wurde ebenfalls komplett überarbeitet, was einen deutlich angestiegenen Speichertakt von 6008 MHz ermöglichte. Jeder einzelne Speichercontroller besitzt 128 KByte L2-Cache und acht ROP-Einheiten. Insgesamt hat die GeForce GTX 670 mit vier Speichercontrollern also 512 KByte L2-Cache und 32 ROP-Einheiten.

Ein weiteres, innovatives Feature der GeForce GTX 670 ist zweifellos die GPU Boost Funktion. Die GPU Boost Funktion entspringt dabei Beobachtungen der NVIDIA-Ingenieure während die thermischen Eigenschaften des Chips untersucht wurden, auf deren Basis die finalen Taktfrequenzen determiniert werden. Es wurde ersichtlich, dass eine Vielzahl der aktuellen Spiele, deren Leistungshunger von Spiel zu Spiel unterschiedlich ist, niemals die gesamte TDP des Chips ausreizt. Die GPU Boost Funktion setzt genau an diesem Punkt an. Sobald eine 3D-Anwendung die GPU nicht an das TDP-Limit bringt, ist die GPU in der Lage die Taktfrequenz dynamisch anzuheben. Ein extra zu diesem Zwecke integrierter Hardware-Schaltkreis überwacht dabei die Leistungsaufnahme der GPU. So wird der maximal mögliche Chiptakt im Rahmen der vordefinierten TDP erreicht.
Nächste Seite: Testsystem