Neue Fakten zum Nvidia GF100: Neue technische Details

Nach langer Zeit gibt es nun endlich wieder Informationen zur kommenden GF100-Grafikkarten-Generation aus dem Hause Nvidia.

(*klick* zum Vergrößern)

Nach dem G80 Refresh-Chip GT200, will Nvidia mit dem kommenden GF100 eine komplette Neuentwicklung vorstellen. Dazu hat Nvidia erstmals einige Eckdaten zur kommenden Grafikkarten-Generation veröffentlicht. Wie schon bekannt, wird die neue Grafikkarten-Generation auch im 40nm-Verfahren bei TSMC gefertigt. Dabei soll die Anzahl der Transistoren auf ca. 3,0 bis 3,2 Milliarden gestiegen sein (GT200 1,4 Mrd). Mit 512 Shadereinheiten, 48 ROPs (Raster Operation Processors) und 64 TMUs (Texture Mapping Units) will Nvidia mit dem neuen GF100 Chip auftrumpfen. Im Gegensatz zum Vorgängerchip GT200 wurde die Anzahl der TMUs durch die laut Nvidia gesteigerte Effizienz auf 64 Einheiten verringert, trotzdem soll die Texturfüllrate im Vergleich zum Vorgänger deutlich gestiegen sein.

	HD4870	HD4890	HD5870	GTX 275	GTX 285	GF100	unit
Codename	RV770	RV790	RV870	G200b	GT200b	GF100	-
Process	55	55	40	55	55	40	nm
Transistors	965	965	2150	1400	1400	ca. 3000 - 3200	millions
Stream Procesors	160 (5D)	160 (5D)	320 (5D)	240 (1D)	240 (1D)	512 (1D)	-
Texture Mapping Units	40	40	80	80	80	64	-
Raster Operation Units (ROPs)	16	16	32	32	32	48	-
Core clock	750	850	850	633	648	keine Angaben	MHz
Shader clock	750	850	850	1404	1476	keine Angaben	MHz
Memory	512/1024	1024	1024	896	1024	ca. 1500	MB
Memory interface	256	256	256	448	512	384	Bit
Memory clock	1800	1950	2400	1134	1242	keine Angaben	MHz x2 (DDR)
Memory bandwith	115200	125000	153600	127000	159000	keine Angaben	MB/s
Shader-Model	4.1	4.1	5.0	4.0	4.0	5.0	-
Dual/Triple SLI/CF support	/	/	/	/	/	/	-
Bus Technology	PCIe 2.0	PCIe 2.0	PCIe 2.0	PCIe 2.0	PCIe 2.0	PCIe 2.0	-
Form Factor	Dual	Dual	Dual	Dual	Dual	Dual	slot
Preis	ab ~109 mit 1024MB	ab ~142	ab ~329	ab ~171	ab ~259	keine Angaben	€

Auch an der Architektur hat Nvidia viel verändert und so zum ersten Mal seit dem G80 wirklich große architektonische Neuerungen in die GPU eingeführt. So wurden die einzelnen Teile der GPU in im Vergleich zu den Vorgängern komplett anders aufgeteilt. Hiermit möchte man laut Nvidia nicht nur die Effizenz erhöhen sondern die Architektur auch flexibler gestalten können.

Der GF100 besteht daher aus mehreren sog. Graphics Processing Clusters (GPCs) in denen Streaming-Multiprozessoren (SM), Texture Mapping Units (TMUs) und Rasterengines untergebracht sind. In seiner größten Ausbaustufe verfügt der GF100 über vier GPCs in denen jeweils vier SMs bestehend aus je 32 arithmetisch-logischen Einheiten (ALUs) was zu einer Gesamtzahl von 512 Shadereinheiten aus 16 SMs mit je 32 ALUs führt. Weiterhin verfügt ein GPC über vier TMUs, was einer maximalen Anzahl von 64 und damit weniger als den 80 des GT200 entspricht. Trotzdem behauptet Nvidia die Gesamtleistung der TMUs um bis zu 70% gesteigert zu haben. Der GPC zugeordnet ist eine sog. GigaThreadEngine, die nach Übernahme der CPU-Befehlen durch den Hostcontroller die für die Berechnungen nötigen Daten aus dem Systemspeicher in den eigenen Puffer kopiert.

Im GF100 kann jeder Shader nun pro Taktzyklus eine Bildkomponente (Rot, Grün, Blau oder Alphawert) berechnen, wobei jeder SM in jedem Taktschritt unterschiedliche Berechnungen in seinen ALUs parallel durchführen kann. Neu im System der GPCs ist auch, dass jedem nun nicht nur eine eigene Raster-Engine zur Verfügung steht, die sich um Teile der Geometrieberechnung, Rasterisiserung und die sog. Sichtbarkeitsprüfung kümmert, sondern auch eine sog. PolyMorph Engine die ebenfalls geometrische Berechnungen durchführt und neben anderem auch den sog. Tessellator enthält. Mit diesen beiden Bauteilen möchte man bei Nvidia besonders deutlich auf die Effizienz einwirken.

Um die Berechnungen weiter zu beschleunigen ist der Cache der SMs beim GF100 deutlich angewachsen. Jeder SM verfügt über 64kB Gesamtcache, der sich aus einem eigenen Shader-Memory-Cache und einem gemeinsam mit den anderen SMs genutzten L1-Cache zusammensetzt. Hierbei kann es frei konfiguriert werden, ob der L1-Cache 48kB und der Shader-Memory-Cache 16kB groß ist oder umgekehrt. Hinzukommt ein 12kB L1-Texture-Cache. Daneben existiert noch ein 768kB großer 2nd-Level-Cache auf den alle Shadereinheiten zur gleichen Zeit zugreifen können.

Als neue "Technologie" bei der Grafikausgabe liefert Nvidia nun das sog. 3D Vision Surround, welches als direkter Konter auf AMDs Eyefinity anzusehen ist. Hierbei ist es nur nur möglich bis zu drei Monitore und gleichzeitig eine 3D Vision Brille zu betreiben und dann in stereoskopischem 3D zu spielen. Pferdefuß der Sache: für mehr als zwei Monitore werden weiterhin zwei Grafikkarten benötigt, da der GF100 nur zwei Bildschirme ansteuern kann.

Abschließend kann man sagen, dass Nvidia am heutigen Tage ein kleines Aufblitzen der theoretischen Möglichkeiten des GF100 zum besten gegeben hat. Mehr als hohes Potential kann man dem Chip aber auch nach diesen Informationen nicht bescheinigen - ob sich dieses auch in der Praxis umsetzen lassen wird muss die Zukunft zeigen. Im Endeffekt verwundert es aber wenig, dass sich die Kalifornier mit ihrem neuen Flaggschiff so viel Zeit lassen: Man hat sich viel vorgenommen mit der neuen GPU-Architektur und diese soll ja auch nicht nur für eine Generation sondern ähnlich dem schon fast legendären G80 für lange Zeit als Grundlage von Nvidia-Karten dienen.

Für Fragen, Hinweise, Meinungen oder sogar eigene Erfahrungen zum Produkt bitte die Kommentarfunktion etwas weiter unten nutzen, oder direkt im Forum posten.

Veröffentlicht: 18.01.2010 09:21
Autor: Tim Voigtländer
Kategorie: Grafikkarten
Kommentare: 0

Links