Die Architektur Unterschiede im Überblick
Es stehen der GTX 280 Grafikkarte im Referenzdesign 1.024 MB DDR3 Speicher mit 1.107 MHz an Taktrate (2.214 MHz DDR) zur Verfügung, bei einer 512 bit Anbindung. Insgesamt werkeln knapp 1.400 Millionen Transistoren auf der in weiterhin 65nm gefertigten GPU. NVIDIA wird erst in ca. einem halben Jahr auf 45nm umsteigen und den 55nm Prozess einfach übergehen. Die GPU wird mit 602 Mhz getaktet, währen der Shadertakt bei 1.296 MHz liegt. Anstatt 28 Raster Operation Units (ROPs), können nun 32 verwendet werden. Weiterhin erhöht wurden die Texture Mapping Units von 64 auf 80, sowie die Stream Procesors von 192 auf 240.
Der Shader Modus bleibt auf 4.0 und wird nicht auf 4.1 erweitert. Neben der drastischen Erhöhung der Recheneinheiten gehen mit der neuen Generation der GeForce Grafikkarten auch einige Detailverbesserungen an der Architektur einher. Was sofort auffällt beim Betrachten der Daten, ist das doppelt so breite Speicherinterface, welches im Vergleich zu den G90 GPUs verdoppelt wurde, womit eine Verdoppelung der Speicherbandbreite einhergeht. Ein neuer Scheduler soll zudem 20% effizienter mit Texturen umgehen.
PhysX
Nachdem AGEIA von NVIDIA Anfang des Jahres aufgekauft wurde, war schnell klar, dass PhysX zukünftig nicht mehr durch Add-in-Karten unterstützt wird, sondern über CUDA von aktuellen sowie kommenden GeForce GPUs unterstützt würde. Mit der GTX 200 Serie kommt nun die zweite Generation an Grafikkarten von NVIDIA auf den Markt, welche PhysX mittels CUDA unterstützen.
CUDA 2.0
Was ist CUDA?
CUDA ist eine Software und GPU Architektur, die es möglich macht, die in großer Anzahl vorliegenden Prozessorkerne einer GPU allgemeine mathematische Berechnungen durchführen zu lassen. Da Grafikkarten in bestimmten Berechnungen heute eine um ein Vielfaches höhere Rohleistung haben als CPUs, macht es Sinn, diese Rechenleistung nicht nur für Computerspiele zu nutzen. CUDA ist allen Programmierern zugänglich, durch eine Erweiterung der C und C++ Programmiersprachen im Bereich der Berechnung von parallelen Algorithmen.
Jeder Multiprozessor in CUDA unterstützten Grafikkarten enthält 16 Kb Shared Cache. Dieser Cache ermöglicht es, dass unterschiedliche Threads miteinander kommunizieren können und Daten austauschen.
Im Bereich des Transkodierens eines Videos, zum Beispiel in HD Qualität, führt NVIDIA einen Vergleich zwischem den neuen GPUs und den aktuellen CPUs auf und der Leistung durch CUDA (Der Clip ist laut nVidia 110 Sekunden lang, in welcher Auflösung dieser vorliegt, ist nicht bekannt, es handelt sich jedoch um ein "HD Video")
Powermanagement erreicht nVidia Grafikkarten
Es stehen der GTX 280 Grafikkarte im Referenzdesign 1.024 MB DDR3 Speicher mit 1.107 MHz an Taktrate (2.214 MHz DDR) zur Verfügung, bei einer 512 bit Anbindung. Insgesamt werkeln knapp 1.400 Millionen Transistoren auf der in weiterhin 65nm gefertigten GPU. NVIDIA wird erst in ca. einem halben Jahr auf 45nm umsteigen und den 55nm Prozess einfach übergehen. Die GPU wird mit 602 Mhz getaktet, währen der Shadertakt bei 1.296 MHz liegt. Anstatt 28 Raster Operation Units (ROPs), können nun 32 verwendet werden. Weiterhin erhöht wurden die Texture Mapping Units von 64 auf 80, sowie die Stream Procesors von 192 auf 240.
Der Shader Modus bleibt auf 4.0 und wird nicht auf 4.1 erweitert. Neben der drastischen Erhöhung der Recheneinheiten gehen mit der neuen Generation der GeForce Grafikkarten auch einige Detailverbesserungen an der Architektur einher. Was sofort auffällt beim Betrachten der Daten, ist das doppelt so breite Speicherinterface, welches im Vergleich zu den G90 GPUs verdoppelt wurde, womit eine Verdoppelung der Speicherbandbreite einhergeht. Ein neuer Scheduler soll zudem 20% effizienter mit Texturen umgehen.
(*klick* zum Vergrößern)
PhysX
Nachdem AGEIA von NVIDIA Anfang des Jahres aufgekauft wurde, war schnell klar, dass PhysX zukünftig nicht mehr durch Add-in-Karten unterstützt wird, sondern über CUDA von aktuellen sowie kommenden GeForce GPUs unterstützt würde. Mit der GTX 200 Serie kommt nun die zweite Generation an Grafikkarten von NVIDIA auf den Markt, welche PhysX mittels CUDA unterstützen.
CUDA 2.0
Was ist CUDA?
CUDA ist eine Software und GPU Architektur, die es möglich macht, die in großer Anzahl vorliegenden Prozessorkerne einer GPU allgemeine mathematische Berechnungen durchführen zu lassen. Da Grafikkarten in bestimmten Berechnungen heute eine um ein Vielfaches höhere Rohleistung haben als CPUs, macht es Sinn, diese Rechenleistung nicht nur für Computerspiele zu nutzen. CUDA ist allen Programmierern zugänglich, durch eine Erweiterung der C und C++ Programmiersprachen im Bereich der Berechnung von parallelen Algorithmen.
Jeder Multiprozessor in CUDA unterstützten Grafikkarten enthält 16 Kb Shared Cache. Dieser Cache ermöglicht es, dass unterschiedliche Threads miteinander kommunizieren können und Daten austauschen.
Im Bereich des Transkodierens eines Videos, zum Beispiel in HD Qualität, führt NVIDIA einen Vergleich zwischem den neuen GPUs und den aktuellen CPUs auf und der Leistung durch CUDA (Der Clip ist laut nVidia 110 Sekunden lang, in welcher Auflösung dieser vorliegt, ist nicht bekannt, es handelt sich jedoch um ein "HD Video")
Daten gemäss NVIDIA (*klick* zum Vergrößern)
Powermanagement erreicht nVidia Grafikkarten
Mit der neuen Serie führt NVIDIA ein dreistufiges Powermanagement ein. Neben der Möglichkeit auf einem HybridSLi fähigen Mainboard die zusätzliche Karte komplett abzuschalten, takten sich die neuen Karten je nach Last automatisch runter bzw. rauf. Somit soll eine GTX 200 GPU im 2D-Betrieb nur mehr 25W verbrauchen und führt HybridPower ad absurdum, da die Karte im Idle-Mode kaum mehr verbraucht als eine interne GPU. Zumal der Wechsel zwischen den PowerModes automatisch von statten geht, wogegen der Wechsel auf die interne Grafikkarte vom User gesteuert werden muss. Die zweite Stufe des Powermanagements verbraucht knapp 35W und stellt sich beim betrachten von hochauflösendem Videomaterial ein. Die Karte geht somit auch beim Filmeschauen sparsam zu Werke und ruft ihre volle Leistung erst dann im 3D-Betrieb ab, wenn sie wirklich benötigt wird.
Max Board Power | ||||||||||||
| ||||||||||||
0 300 150 | W | |||||||||||
GTX 280 | GTX 260 | 9800 GTX | 8800 Ultra | HD 3870 | HD 3850 | unit | |
Codename | G200 | G200 | G92 | G80 | RV670 XT | RV670 | - |
Process | 65 | 65 | 65 | 90 | 55 | 55 | nm |
Transistors | 1400 | 1400 | 754 | 681 | 666 | 666 | millions |
Stream Procesors (1D) | 240 | 192 | 128 | 128 | 320 | 320 | - |
Texture Mapping Units | 80 | 64 | 64 | 56 | 16/32 | 16/32 | - |
Raster Operation Units (ROPs) | 32 | 28 | 16 | 24 | 16 | 16 | - |
Core clock | 602 | 576 | 675 | 612 | 775 | 670 | MHz |
Shader clock | 1296 | 1242 | 1675 | 1512 | 775 | 670 | MHz |
Pixel Fill Rate | 19264 | 16100 | 10800 | 14688 | 12400 | 10690 | MPix/s |
Texel Fill Rate | 48200 | 36900 | 43200 | 39168 | 12400 | 11200 | MTex/s |
Memory | 1024 | 896 | 512 | 768 | 512 | 512 | MB |
Memory interface | 512 | 448 | 256 | 384 | 256 | 256 | bit |
Memory clock | 1107 | 999 | 1100 | 1080 | 1125 | 830 | MHz x2 (DDR) |
Memory bandwith | 141700 | 111900 | 70400 | 103680 | 76800 | 52992 | MB/s |
Shader-Model | 4.0 | 4.0 | 4.0 | 4.0 | 4.1 | 4.1 | - |
Dual/Triple SLI/CF support | / | / | / - | / | / | / | - |
Bus Technology | PCIe 2.0 | PCIe 2.0 | PCIe 2.0 | PCIe 1.x | PCIe 2.0 | PCIe 2.0 | - |
Form Factor | Dual | Dual | Dual | Dual | Dual | Single | slot |
Power Connectors | 1x 8 Pin, 1x 6 Pin | 2x 6 Pin | 2x 6 Pin | 2x 6 Pin | 1x 6 Pin | 1x 6 Pin | - |