Effizienz von Grafikkarten: Nichts als heisse Luft?

Seite 4: Fertigungsprozess, Taktfrequenz und Leistungsaufnahme

Die Geforce2 war im Grunde mehr ein Refresh-Chip als eine völlige Neuentwicklung. In erster Linie wurde der Fertigungsprozess von 220nm auf 180nm verfeinert. Dadurch konnte trotz höherem Takt die Verlustleistung halbiert werden!
Der Vergleich zwischen der GF3 und der GF5700 ist auch sehr schön. Die 5700 besitzt mehr Transistoren und mehr als den doppelten Takt, da sie aber in 130nm gegenüber 150nm hergestellt wurde, ist die Verlustleistung nur geringfügig höher.

Ganz anders sieht es bei identischen Chips mit unterschiedlichen Taktraten aus, beispielsweise 5700 gegenüber 5700Ultra. Der geringfügig höhere Takt der Ultra verlangt wohl nach einer höheren Versorgungsspannung des Chips was sich deutlich in einer viel höheren Verlustleistung niederschlägt.
Dasselbe beobachtet man zwischen einer 9800PRO/XT, X800PRO/XT, 6800GT/Ultra etc.

Wir stellen also folgendes fest: Vom Aspekt der Verlustleistung betrachtet ist ein komplexer Grafikchip mit vielen Pipelines aber niederem Takt einem Chip mit hohem Takt aber wenig Pipelines vorzuziehen.

Dies, weil die Verlustleistung mit steigender Transistorzahl proportional, mit steigendem Takt jedoch überproportional zunimmt.

Da wir davon ausgehen können, dass Nvidia und Ati diese Weisheit ebenfalls bereits erlangt haben, stellt sich die Frage, ob sie daraus auch einen Nutzen ziehen konnten. Sprich: ist die die Effizienz heutiger Karten trotz höherer Verlustleistung (wegen den vielen Transistoren) tatsächlich besser als früher?

Betrachten wir dazu den Vergleich zwischen einer GF2GTS und der neuen 7800GTX. Die 7800GTX besteht aus rund elfmal so vielen Transistoren wie die GF2. Darüber hinaus ist auch der Takt der 7800GTX rund doppelt so hoch. Es ist daher anzunehmen, dass die 7800GTX etwa die 20-fache Rechenleistung einer GF2GTS haben müsste. Ihre Leistungsaufnahme beträgt aber nur das Neunfache einer GF2!
Demzufolge müsste die Effizienz einer 7800GTX grob geschätzt etwa doppelt so hoch wie die einer GF2 sein.

Um diese Vermutungen nachzuweisen, haben wir Benchergebnisse zu den in der Tabelle gelisteten Karten zusammengetragen und verglichen.
Es wurden nur Unreal2-Benchs verglichen, einerseits um den Aufwand in Grenzen zu halten, andererseits aber auch, da Titel wie HL2 und Doom3 stark auf gewisse Chips optimiert und 3Dmarks zu treiberabhängig sind, was einen neutralen Vergleich zwischen mehreren Generationen von Karten praktisch verunmöglicht.

efficiency


Settings für den Bench: 1024x768, siehe dazu Quelle [7]. Werte für X800, 6800 und 7800-Karten wurden anhand von UT2004-Benches aus Quelle [8] hochgerechnet.
In der hintersten Spalte der Tabelle die resultierende Effizienz des Grafikchips in FPS pro Watt.
Vergleichen wir die Ergebnisse grafisch:

ati


Der effizienteste Chip von Ati ist in diesem Falle der x800pro, der je Watt Leistungsaufnahme ganze 3.81 Bilder pro Sekunde schafft. Der ineffizienteste hingegen ist der 9800XT, mit nur 1.70 Bildern pro Sekunde und Watt.

nvidia


Ähnliches Bild bei Nvidia. Die High-End Karten der mittlerweile vorletzten Generation sind am ineffizientesten, hoher Takt bei vergleichsweise wenig Pipelines.
Am schlechtesten schneidet die FX5950Ultra ab, mit gerade mal 1.20 FPS pro Watt.
Überraschenderweise entpuppt sich der stromhungrigste 7800GTX als der Effizienteste unter den verglichenen Chips von Nvidia. Er arbeitet mit 3.82 Bildern pro Sekunde und Watt sogar effizienter als eine x800pro!
Hier kann man den Kaliforniern nur zu der ausgezeichneten Arbeit gratulieren.

nvidia ati


Wie man beim direkten Vergleich zwischen den beiden Kontrahenten sieht, arbeiteten die Chips von Ati tendenziell immer etwas sparsamer als ihre Pendants von Nvidia. Allerdings muss man Nvidia zu gute halten, dass sie auch meistens eine etwas bessere Bildqualität liefern. Hohe Farbtiefen und Genauigkeit haben nun mal ihren Preis in Form von Transistoren, Nvidias Chips bestanden schon immer aus mehr Transistoren als die von Ati.







Nächste Seite: Fazit