Nach langer Zeit gibt es nun endlich wieder Informationen zur kommenden GF100-Grafikkarten-Generation aus dem Hause Nvidia.
Nach dem G80 Refresh-Chip GT200, will Nvidia mit dem kommenden GF100 eine komplette Neuentwicklung vorstellen. Dazu hat Nvidia erstmals einige Eckdaten zur kommenden Grafikkarten-Generation veröffentlicht. Wie schon bekannt, wird die neue Grafikkarten-Generation auch im 40nm-Verfahren bei TSMC gefertigt. Dabei soll die Anzahl der Transistoren auf ca. 3,0 bis 3,2 Milliarden gestiegen sein (GT200 1,4 Mrd). Mit 512 Shadereinheiten, 48 ROPs (Raster Operation Processors) und 64 TMUs (Texture Mapping Units) will Nvidia mit dem neuen GF100 Chip auftrumpfen. Im Gegensatz zum Vorgängerchip GT200 wurde die Anzahl der TMUs durch die laut Nvidia gesteigerte Effizienz auf 64 Einheiten verringert, trotzdem soll die Texturfüllrate im Vergleich zum Vorgänger deutlich gestiegen sein.
Auch an der Architektur hat Nvidia viel verändert und so zum ersten Mal seit dem G80 wirklich große architektonische Neuerungen in die GPU eingeführt. So wurden die einzelnen Teile der GPU in im Vergleich zu den Vorgängern komplett anders aufgeteilt. Hiermit möchte man laut Nvidia nicht nur die Effizenz erhöhen sondern die Architektur auch flexibler gestalten können.
Der GF100 besteht daher aus mehreren sog. Graphics Processing Clusters (GPCs) in denen Streaming-Multiprozessoren (SM), Texture Mapping Units (TMUs) und Rasterengines untergebracht sind. In seiner größten Ausbaustufe verfügt der GF100 über vier GPCs in denen jeweils vier SMs bestehend aus je 32 arithmetisch-logischen Einheiten (ALUs) was zu einer Gesamtzahl von 512 Shadereinheiten aus 16 SMs mit je 32 ALUs führt. Weiterhin verfügt ein GPC über vier TMUs, was einer maximalen Anzahl von 64 und damit weniger als den 80 des GT200 entspricht. Trotzdem behauptet Nvidia die Gesamtleistung der TMUs um bis zu 70% gesteigert zu haben. Der GPC zugeordnet ist eine sog. GigaThreadEngine, die nach Übernahme der CPU-Befehlen durch den Hostcontroller die für die Berechnungen nötigen Daten aus dem Systemspeicher in den eigenen Puffer kopiert.
Im GF100 kann jeder Shader nun pro Taktzyklus eine Bildkomponente (Rot, Grün, Blau oder Alphawert) berechnen, wobei jeder SM in jedem Taktschritt unterschiedliche Berechnungen in seinen ALUs parallel durchführen kann. Neu im System der GPCs ist auch, dass jedem nun nicht nur eine eigene Raster-Engine zur Verfügung steht, die sich um Teile der Geometrieberechnung, Rasterisiserung und die sog. Sichtbarkeitsprüfung kümmert, sondern auch eine sog. PolyMorph Engine die ebenfalls geometrische Berechnungen durchführt und neben anderem auch den sog. Tessellator enthält. Mit diesen beiden Bauteilen möchte man bei Nvidia besonders deutlich auf die Effizienz einwirken.
Um die Berechnungen weiter zu beschleunigen ist der Cache der SMs beim GF100 deutlich angewachsen. Jeder SM verfügt über 64kB Gesamtcache, der sich aus einem eigenen Shader-Memory-Cache und einem gemeinsam mit den anderen SMs genutzten L1-Cache zusammensetzt. Hierbei kann es frei konfiguriert werden, ob der L1-Cache 48kB und der Shader-Memory-Cache 16kB groß ist oder umgekehrt. Hinzukommt ein 12kB L1-Texture-Cache. Daneben existiert noch ein 768kB großer 2nd-Level-Cache auf den alle Shadereinheiten zur gleichen Zeit zugreifen können.
Als neue "Technologie" bei der Grafikausgabe liefert Nvidia nun das sog. 3D Vision Surround, welches als direkter Konter auf AMDs Eyefinity anzusehen ist. Hierbei ist es nur nur möglich bis zu drei Monitore und gleichzeitig eine 3D Vision Brille zu betreiben und dann in stereoskopischem 3D zu spielen. Pferdefuß der Sache: für mehr als zwei Monitore werden weiterhin zwei Grafikkarten benötigt, da der GF100 nur zwei Bildschirme ansteuern kann.
Abschließend kann man sagen, dass Nvidia am heutigen Tage ein kleines Aufblitzen der theoretischen Möglichkeiten des GF100 zum besten gegeben hat. Mehr als hohes Potential kann man dem Chip aber auch nach diesen Informationen nicht bescheinigen - ob sich dieses auch in der Praxis umsetzen lassen wird muss die Zukunft zeigen. Im Endeffekt verwundert es aber wenig, dass sich die Kalifornier mit ihrem neuen Flaggschiff so viel Zeit lassen: Man hat sich viel vorgenommen mit der neuen GPU-Architektur und diese soll ja auch nicht nur für eine Generation sondern ähnlich dem schon fast legendären G80 für lange Zeit als Grundlage von Nvidia-Karten dienen.
Für Fragen, Hinweise, Meinungen oder sogar eigene Erfahrungen zum Produkt bitte die Kommentarfunktion etwas weiter unten nutzen, oder direkt im Forum posten.
(*klick* zum Vergrößern)
Nach dem G80 Refresh-Chip GT200, will Nvidia mit dem kommenden GF100 eine komplette Neuentwicklung vorstellen. Dazu hat Nvidia erstmals einige Eckdaten zur kommenden Grafikkarten-Generation veröffentlicht. Wie schon bekannt, wird die neue Grafikkarten-Generation auch im 40nm-Verfahren bei TSMC gefertigt. Dabei soll die Anzahl der Transistoren auf ca. 3,0 bis 3,2 Milliarden gestiegen sein (GT200 1,4 Mrd). Mit 512 Shadereinheiten, 48 ROPs (Raster Operation Processors) und 64 TMUs (Texture Mapping Units) will Nvidia mit dem neuen GF100 Chip auftrumpfen. Im Gegensatz zum Vorgängerchip GT200 wurde die Anzahl der TMUs durch die laut Nvidia gesteigerte Effizienz auf 64 Einheiten verringert, trotzdem soll die Texturfüllrate im Vergleich zum Vorgänger deutlich gestiegen sein.
HD4870 | HD4890 | HD5870 | GTX 275 | GTX 285 | GF100 | unit | |
Codename | RV770 | RV790 | RV870 | G200b | GT200b | GF100 | - |
Process | 55 | 55 | 40 | 55 | 55 | 40 | nm |
Transistors | 965 | 965 | 2150 | 1400 | 1400 | ca. 3000 - 3200 | millions |
Stream Procesors | 160 (5D) | 160 (5D) | 320 (5D) | 240 (1D) | 240 (1D) | 512 (1D) | - |
Texture Mapping Units | 40 | 40 | 80 | 80 | 80 | 64 | - |
Raster Operation Units (ROPs) | 16 | 16 | 32 | 32 | 32 | 48 | - |
Core clock | 750 | 850 | 850 | 633 | 648 | keine Angaben | MHz |
Shader clock | 750 | 850 | 850 | 1404 | 1476 | keine Angaben | MHz |
Memory | 512/1024 | 1024 | 1024 | 896 | 1024 | ca. 1500 | MB |
Memory interface | 256 | 256 | 256 | 448 | 512 | 384 | Bit |
Memory clock | 1800 | 1950 | 2400 | 1134 | 1242 | keine Angaben | MHz x2 (DDR) |
Memory bandwith | 115200 | 125000 | 153600 | 127000 | 159000 | keine Angaben | MB/s |
Shader-Model | 4.1 | 4.1 | 5.0 | 4.0 | 4.0 | 5.0 | - |
Dual/Triple SLI/CF support | / | / | / | / | / | / | - |
Bus Technology | PCIe 2.0 | PCIe 2.0 | PCIe 2.0 | PCIe 2.0 | PCIe 2.0 | PCIe 2.0 | - |
Form Factor | Dual | Dual | Dual | Dual | Dual | Dual | slot |
Preis | ab ~109 mit 1024MB | ab ~142 | ab ~329 | ab ~171 | ab ~259 | keine Angaben | € |
Auch an der Architektur hat Nvidia viel verändert und so zum ersten Mal seit dem G80 wirklich große architektonische Neuerungen in die GPU eingeführt. So wurden die einzelnen Teile der GPU in im Vergleich zu den Vorgängern komplett anders aufgeteilt. Hiermit möchte man laut Nvidia nicht nur die Effizenz erhöhen sondern die Architektur auch flexibler gestalten können.
Der GF100 besteht daher aus mehreren sog. Graphics Processing Clusters (GPCs) in denen Streaming-Multiprozessoren (SM), Texture Mapping Units (TMUs) und Rasterengines untergebracht sind. In seiner größten Ausbaustufe verfügt der GF100 über vier GPCs in denen jeweils vier SMs bestehend aus je 32 arithmetisch-logischen Einheiten (ALUs) was zu einer Gesamtzahl von 512 Shadereinheiten aus 16 SMs mit je 32 ALUs führt. Weiterhin verfügt ein GPC über vier TMUs, was einer maximalen Anzahl von 64 und damit weniger als den 80 des GT200 entspricht. Trotzdem behauptet Nvidia die Gesamtleistung der TMUs um bis zu 70% gesteigert zu haben. Der GPC zugeordnet ist eine sog. GigaThreadEngine, die nach Übernahme der CPU-Befehlen durch den Hostcontroller die für die Berechnungen nötigen Daten aus dem Systemspeicher in den eigenen Puffer kopiert.
Im GF100 kann jeder Shader nun pro Taktzyklus eine Bildkomponente (Rot, Grün, Blau oder Alphawert) berechnen, wobei jeder SM in jedem Taktschritt unterschiedliche Berechnungen in seinen ALUs parallel durchführen kann. Neu im System der GPCs ist auch, dass jedem nun nicht nur eine eigene Raster-Engine zur Verfügung steht, die sich um Teile der Geometrieberechnung, Rasterisiserung und die sog. Sichtbarkeitsprüfung kümmert, sondern auch eine sog. PolyMorph Engine die ebenfalls geometrische Berechnungen durchführt und neben anderem auch den sog. Tessellator enthält. Mit diesen beiden Bauteilen möchte man bei Nvidia besonders deutlich auf die Effizienz einwirken.
Um die Berechnungen weiter zu beschleunigen ist der Cache der SMs beim GF100 deutlich angewachsen. Jeder SM verfügt über 64kB Gesamtcache, der sich aus einem eigenen Shader-Memory-Cache und einem gemeinsam mit den anderen SMs genutzten L1-Cache zusammensetzt. Hierbei kann es frei konfiguriert werden, ob der L1-Cache 48kB und der Shader-Memory-Cache 16kB groß ist oder umgekehrt. Hinzukommt ein 12kB L1-Texture-Cache. Daneben existiert noch ein 768kB großer 2nd-Level-Cache auf den alle Shadereinheiten zur gleichen Zeit zugreifen können.
Als neue "Technologie" bei der Grafikausgabe liefert Nvidia nun das sog. 3D Vision Surround, welches als direkter Konter auf AMDs Eyefinity anzusehen ist. Hierbei ist es nur nur möglich bis zu drei Monitore und gleichzeitig eine 3D Vision Brille zu betreiben und dann in stereoskopischem 3D zu spielen. Pferdefuß der Sache: für mehr als zwei Monitore werden weiterhin zwei Grafikkarten benötigt, da der GF100 nur zwei Bildschirme ansteuern kann.
Abschließend kann man sagen, dass Nvidia am heutigen Tage ein kleines Aufblitzen der theoretischen Möglichkeiten des GF100 zum besten gegeben hat. Mehr als hohes Potential kann man dem Chip aber auch nach diesen Informationen nicht bescheinigen - ob sich dieses auch in der Praxis umsetzen lassen wird muss die Zukunft zeigen. Im Endeffekt verwundert es aber wenig, dass sich die Kalifornier mit ihrem neuen Flaggschiff so viel Zeit lassen: Man hat sich viel vorgenommen mit der neuen GPU-Architektur und diese soll ja auch nicht nur für eine Generation sondern ähnlich dem schon fast legendären G80 für lange Zeit als Grundlage von Nvidia-Karten dienen.
Für Fragen, Hinweise, Meinungen oder sogar eigene Erfahrungen zum Produkt bitte die Kommentarfunktion etwas weiter unten nutzen, oder direkt im Forum posten.