Neue Fakten zum Nvidia GF100: Neue technische Details

Nach langer Zeit gibt es nun endlich wieder Informationen zur kommenden GF100-Grafikkarten-Generation aus dem Hause Nvidia.

 
(*klick* zum Vergrößern)


Nach dem G80 Refresh-Chip GT200, will Nvidia mit dem kommenden GF100 eine komplette Neuentwicklung vorstellen. Dazu hat Nvidia erstmals einige Eckdaten zur kommenden Grafikkarten-Generation veröffentlicht. Wie schon bekannt, wird die neue Grafikkarten-Generation auch im 40nm-Verfahren bei TSMC gefertigt. Dabei soll die Anzahl der Transistoren auf ca. 3,0 bis 3,2 Milliarden gestiegen sein (GT200 1,4 Mrd). Mit 512 Shadereinheiten, 48 ROPs (Raster Operation Processors) und 64 TMUs (Texture Mapping Units) will Nvidia mit dem neuen GF100 Chip auftrumpfen. Im Gegensatz zum Vorgängerchip GT200 wurde die Anzahl der TMUs durch die laut Nvidia gesteigerte Effizienz auf 64 Einheiten verringert, trotzdem soll die Texturfüllrate im Vergleich zum Vorgänger deutlich gestiegen sein.


HD4870
HD4890
HD5870
GTX 275
GTX 285
GF100
unit
Codename
RV770
RV790
RV870
G200b
GT200b
GF100
-
Process
55
55
40
55
55
40
nm
Transistors
965
965
2150
1400
1400
ca. 3000 - 3200
millions
Stream Procesors
160 (5D)
160 (5D)
320 (5D)
240 (1D)
240 (1D)
512 (1D)
-
Texture Mapping Units
40
40
80
80
80
64
-
Raster Operation Units (ROPs)
16
16
32
32
32
48
-
Core clock
750
850
850
633
648
keine Angaben
MHz
Shader clock
750
850
850
1404
1476
keine Angaben
MHz
Memory
512/1024
1024
1024
896
1024
ca. 1500
MB
Memory interface
256
256
256
448
512
384
Bit
Memory clock
1800
1950
2400
1134
1242
keine Angaben
MHz x2 (DDR)
Memory bandwith
115200
125000
153600
127000
159000
keine Angaben
MB/s
Shader-Model
4.1
4.1
5.0
4.0
4.0
5.0
-
Dual/Triple SLI/CF support
/
/
/
/
/
/
-
Bus Technology
PCIe 2.0
PCIe 2.0
PCIe 2.0
PCIe 2.0
PCIe 2.0
PCIe 2.0
-
Form Factor
Dual
Dual
Dual
Dual
Dual
Dual
slot
Preis
ab ~109 mit 1024MB
ab ~142
ab ~329
ab ~171
ab ~259
keine Angaben



Auch an der Architektur hat Nvidia viel verändert und so zum ersten Mal seit dem G80 wirklich große architektonische Neuerungen in die GPU eingeführt. So wurden die einzelnen Teile der GPU in im Vergleich zu den Vorgängern komplett anders aufgeteilt. Hiermit möchte man laut Nvidia nicht nur die Effizenz erhöhen sondern die Architektur auch flexibler gestalten können.

Der GF100 besteht daher aus mehreren sog. Graphics Processing Clusters (GPCs) in denen Streaming-Multiprozessoren (SM), Texture Mapping Units (TMUs) und Rasterengines untergebracht sind. In seiner größten Ausbaustufe verfügt der GF100 über vier GPCs in denen jeweils vier SMs bestehend aus je 32 arithmetisch-logischen Einheiten (ALUs) was zu einer Gesamtzahl von 512 Shadereinheiten aus 16 SMs mit je 32 ALUs führt. Weiterhin verfügt ein GPC über vier TMUs, was einer maximalen Anzahl von 64 und damit weniger als den 80 des GT200 entspricht. Trotzdem behauptet Nvidia die Gesamtleistung der TMUs um bis zu 70% gesteigert zu haben. Der GPC zugeordnet ist eine sog. GigaThreadEngine, die nach Übernahme der CPU-Befehlen durch den Hostcontroller die für die Berechnungen nötigen Daten aus dem Systemspeicher in den eigenen Puffer kopiert.

Im GF100 kann jeder Shader nun pro Taktzyklus eine Bildkomponente (Rot, Grün, Blau oder Alphawert) berechnen, wobei jeder SM in jedem Taktschritt unterschiedliche Berechnungen in seinen ALUs parallel durchführen kann. Neu im System der GPCs ist auch, dass jedem nun nicht nur eine eigene Raster-Engine zur Verfügung steht, die sich um Teile der Geometrieberechnung, Rasterisiserung und die sog. Sichtbarkeitsprüfung kümmert, sondern auch eine sog. PolyMorph Engine die ebenfalls geometrische Berechnungen durchführt und neben anderem auch den sog. Tessellator enthält. Mit diesen beiden Bauteilen möchte man bei Nvidia besonders deutlich auf die Effizienz einwirken.

Um die Berechnungen weiter zu beschleunigen ist der Cache der SMs beim GF100 deutlich angewachsen. Jeder SM verfügt über 64kB Gesamtcache, der sich aus einem eigenen Shader-Memory-Cache und einem gemeinsam mit den anderen SMs genutzten L1-Cache zusammensetzt. Hierbei kann es frei konfiguriert werden, ob der L1-Cache 48kB und der Shader-Memory-Cache 16kB groß ist oder umgekehrt. Hinzukommt ein 12kB L1-Texture-Cache. Daneben existiert noch ein 768kB großer 2nd-Level-Cache auf den alle Shadereinheiten zur gleichen Zeit zugreifen können.

Als neue "Technologie" bei der Grafikausgabe liefert Nvidia nun das sog. 3D Vision Surround, welches als direkter Konter auf AMDs Eyefinity anzusehen ist. Hierbei ist es nur nur möglich bis zu drei Monitore und gleichzeitig eine 3D Vision Brille zu betreiben und dann in stereoskopischem 3D zu spielen. Pferdefuß der Sache: für mehr als zwei Monitore werden weiterhin zwei Grafikkarten benötigt, da der GF100 nur zwei Bildschirme ansteuern kann.

Abschließend kann man sagen, dass Nvidia am heutigen Tage ein kleines Aufblitzen der theoretischen Möglichkeiten des GF100 zum besten gegeben hat. Mehr als hohes Potential kann man dem Chip aber auch nach diesen Informationen nicht bescheinigen - ob sich dieses auch in der Praxis umsetzen lassen wird muss die Zukunft zeigen. Im Endeffekt verwundert es aber wenig, dass sich die Kalifornier mit ihrem neuen Flaggschiff so viel Zeit lassen: Man hat sich viel vorgenommen mit der neuen GPU-Architektur und diese soll ja auch nicht nur für eine Generation sondern ähnlich dem schon fast legendären G80 für lange Zeit als Grundlage von Nvidia-Karten dienen.

Für Fragen, Hinweise, Meinungen oder sogar eigene Erfahrungen zum Produkt bitte die Kommentarfunktion etwas weiter unten nutzen, oder direkt im Forum posten.
Veröffentlicht:

Kategorie: Grafikkarten
Kommentare: 0