Zotac GTX280 AMP Edition: Vorstellung NVIDIAS GTX 200 Serie

Seite 2: Technische Daten

Die Architektur Unterschiede im Überblick

Es stehen der GTX 280 Grafikkarte im Referenzdesign 1.024 MB DDR3 Speicher mit 1.107 MHz an Taktrate (2.214 MHz DDR) zur Verfügung, bei einer 512 bit Anbindung. Insgesamt werkeln knapp 1.400 Millionen Transistoren auf der in weiterhin 65nm gefertigten GPU. NVIDIA wird erst in ca. einem halben Jahr auf 45nm umsteigen und den 55nm Prozess einfach übergehen. Die GPU wird mit 602 Mhz getaktet, währen der Shadertakt bei 1.296 MHz liegt. Anstatt 28 Raster Operation Units (ROPs), können nun 32 verwendet werden. Weiterhin erhöht wurden die Texture Mapping Units von 64 auf 80, sowie die Stream Procesors von 192 auf 240.
Der Shader Modus bleibt auf 4.0 und wird nicht auf 4.1 erweitert. Neben der drastischen Erhöhung der Recheneinheiten gehen mit der neuen Generation der GeForce Grafikkarten auch einige Detailverbesserungen an der Architektur einher. Was sofort auffällt beim Betrachten der Daten, ist das doppelt so breite Speicherinterface, welches im Vergleich zu den G90 GPUs verdoppelt wurde, womit eine Verdoppelung der Speicherbandbreite einhergeht. Ein neuer Scheduler soll zudem 20% effizienter mit Texturen umgehen.

(*klick* zum Vergrößern)



PhysX

Nachdem AGEIA von NVIDIA Anfang des Jahres aufgekauft wurde, war schnell klar, dass PhysX zukünftig nicht mehr durch Add-in-Karten unterstützt wird, sondern über CUDA von aktuellen sowie kommenden GeForce GPUs unterstützt würde. Mit der GTX 200 Serie kommt nun die zweite Generation an Grafikkarten von NVIDIA auf den Markt, welche PhysX mittels CUDA unterstützen.

CUDA 2.0

Was ist CUDA?
CUDA ist eine Software und GPU Architektur, die es möglich macht, die in großer Anzahl vorliegenden Prozessorkerne einer GPU allgemeine mathematische Berechnungen durchführen zu lassen. Da Grafikkarten in bestimmten Berechnungen heute eine um ein Vielfaches höhere Rohleistung haben als CPUs, macht es Sinn, diese Rechenleistung nicht nur für Computerspiele zu nutzen. CUDA ist allen Programmierern zugänglich, durch eine Erweiterung der C und C++ Programmiersprachen im Bereich der Berechnung von parallelen Algorithmen.
Jeder Multiprozessor in CUDA unterstützten Grafikkarten enthält 16 Kb Shared Cache. Dieser Cache ermöglicht es, dass unterschiedliche Threads miteinander kommunizieren können und Daten austauschen.
Im Bereich des Transkodierens eines Videos, zum Beispiel in HD Qualität, führt NVIDIA einen Vergleich zwischem den neuen GPUs und den aktuellen CPUs auf und der Leistung durch CUDA (Der Clip ist laut nVidia 110 Sekunden lang, in welcher Auflösung dieser vorliegt, ist nicht bekannt, es handelt sich jedoch um ein "HD Video")

Daten gemäss NVIDIA (*klick* zum Vergrößern)


Powermanagement erreicht nVidia Grafikkarten

Mit der neuen Serie führt NVIDIA ein dreistufiges Powermanagement ein. Neben der Möglichkeit auf einem HybridSLi fähigen Mainboard die zusätzliche Karte komplett abzuschalten, takten sich die neuen Karten je nach Last automatisch runter bzw. rauf. Somit soll eine GTX 200 GPU im 2D-Betrieb nur mehr 25W verbrauchen und führt HybridPower ad absurdum, da die Karte im Idle-Mode kaum mehr verbraucht als eine interne GPU. Zumal der Wechsel zwischen den PowerModes automatisch von statten geht, wogegen der Wechsel auf die interne Grafikkarte vom User gesteuert werden muss. Die zweite Stufe des Powermanagements verbraucht knapp 35W und stellt sich beim betrachten von hochauflösendem Videomaterial ein. Die Karte geht somit auch beim Filmeschauen sparsam zu Werke und ruft ihre volle Leistung erst dann im 3D-Betrieb ab, wenn sie wirklich benötigt wird.


Max Board Power
GTX 280 Full Load
236
GTX 260 Full Load
182
9800 GTX
152
GTX 280/260 BluRay Mode
35
GTX 280/260 Idle Mode
25
 
0
300
150
W




GTX 280
GTX 260
9800 GTX
8800 Ultra
HD 3870
HD 3850
unit
Codename
G200
G200
G92
G80
RV670 XT
RV670
-
Process
65
65
65
90
55
55
nm
Transistors
1400
1400
754
681
666
666
millions
Stream Procesors (1D)
240
192
128
128
320
320
-
Texture Mapping Units
80
64
64
56
16/32
16/32
-
Raster Operation Units (ROPs)
32
28
16
24
16
16
-
Core clock
602
576
675
612
775
670
MHz
Shader clock
1296
1242
1675
1512
775
670
MHz
Pixel Fill Rate
19264
16100
10800
14688
12400
10690
MPix/s
Texel Fill Rate
48200
36900
43200
39168
12400
11200
MTex/s
Memory
1024
896
512
768
512
512
MB
Memory interface
512
448
256
384
256
256
bit
Memory clock
1107
999
1100
1080
1125
830
MHz x2 (DDR)
Memory bandwith
141700
111900
70400
103680
76800
52992
MB/s
Shader-Model
4.0
4.0
4.0
4.0
4.1
4.1
-
Dual/Triple SLI/CF support
/
/
/ -
/
/
/
-
Bus Technology
PCIe 2.0
PCIe 2.0
PCIe 2.0
PCIe 1.x
PCIe 2.0
PCIe 2.0
-
Form Factor
Dual
Dual
Dual
Dual
Dual
Single
slot
Power Connectors
1x 8 Pin, 1x 6 Pin
2x 6 Pin
2x 6 Pin
2x 6 Pin
1x 6 Pin
1x 6 Pin
-





Nächste Seite: Impressionen