Lynx-Plattform: AMD A8-3850

Llano auf dem Desktop!

Seite 1: AMDs Llano Architektur im Detail

Heute haben wir mit dem A8-3850 die erste Llano Desktop APU von AMD im Review. Die Prozessoren der Fusion Serie haben schon vor längerem im Netbook- und vor kurzem auch im Notebook-Markt erfolgreich ihr Debüt gefeiert. Mit der „Lynx“ Plattform kommen die Prozessoren mit integrierter Grafikeinheit jetzt auch in Desktop-Systemen zum Einsatz.

Lesezeichen:

Von den Netbook Prozessoren mit Bobcat-Architektur und von den Llano Prozessoren aus dem Notebookbereich, ist die Integration eines Grafikkerns in die CPU bereits bekannt. Auch beim diesjährige "Intel-Tock" wurde ein Grafikkern in der CPU eingeführt. AMD hat mit der eigenen Grafiksparte natürlich einen gewissen Vorteil, welcher sich in der Grafikleistung widerspiegeln sollte.
AMD fokussiert mit der Lynx Plattform PC-Käufer, welche für ihr System zwischen 400 und 700 Dollar ausgeben möchten. Hier hat AMD den größten Markt ausgemacht, so soll der Mainstream/Value Bereich mehr als sechs mal soviel Spieler beinhalten als der Performance Bereich und gar 40 mal so viele wie der High-End Bereich.
Ideale Voraussetzungen also für eine APU mit schnellem Grafikchip möchte man meinen. So sieht das auch AMD und sieht in den kommenden Jahren den Markt von APUs dominieren und CPUs ohne Grafikchip aussterben.

Architektur

Die Architektur der unter dem Codenamen Llano entwickelten Chips basiert zum größten Teil auf bereits bewährter Technik. So enthält eine APU neben einem Grafikchip mit der mehr oder weniger aktuellen VLIW5 Architektur derzeitiger Radeon Grafikkarten, zwei bis vier Kerne der K10 Architektur, welche bereits in den aktuellen Athlon II und Phenom II CPUs Verwendung finden.
AMD setzt in den einzelnen Bereichen also auf altbewährtes und kombiniert den Grafik- und Prozessorchip zusammen mit Northbridge, DDR3 Dual-Channel Memory-Controller und Displayanbindung auf einem Stück Silizium. Dazu gesellt sich die aktuelle Video-Decoding Einheit UVD3, welche bereits mit 3D Inhalten umgehen kann. Zur Anbindung diskreter Grafikkarten gesellen sich noch 24 PCIe Lanes hinzu. Das ganze bringt AMD auf einem Die mit einer Größe von 228 mm² unter.
Größte Neuerung neben der Integration auf einem Die dürfte der Shrink auf 32nm sein. Mit der kleineren Fertigungstechnik schließt man zu Intel auf und erhofft sich niedrigeren Stromverbrauch und höhere Taktraten.
Im Gegensatz zu aktuellen Phenom Prozessoren bekommt jeder Kern 1MB L2-Cache zur Seite. Selbst die Kerne des Topmodells Phenom II 1100T besitzt da nur die Hälfte. Allerdings wird dafür auf einen L3-Cache verzichtet. Der L1-Cache hat eine Größe von 128KB pro Kern. Zudem wurden kleinere Optimierungen vorgenommen. AMD spricht von bis zu 6% Performance-Gewinn im Vergleich zu aktuellen CPUs der "Stars" Familie. Der größte Teil davon dürfte auf den größeren Cache zurückzuführen sein.
Ausgewählte Modelle dürfen außerdem per Turbo Core 2.0 einzelne Kerne höher takten oder ganz abschalten.

Das es mit der alten Prozessor-Architektur nichts zu gewinnen gibt haben auch unsere letzten Reviews der Phenom II CPUs gezeigt. Somit setzt AMD voll auf die Grafik-"Karte". Denn das Gesamtkonzept soll überzeugen und für einen Gelegenheitsspieler alles nötige mitbringen. So sprach AMD bereits 2007 in einer CPU Roadmap von einer Performance im Bereich diskreter Grafikkarten. Die APUs müssen sich also mit der aktuellen Low-End Grafikkarte Radeon HD 6450 messen und mindestens ebenbürtig sein, um das Versprechen aus dem Jahre 2007 einzuhalten.
Mit Blick auf die technischen Daten ist dieses unterfangen bereits gelungen. Mehr als doppelt so viel Shader- und Textureinheiten als die schwächste diskrete Grafikkarte bietet die A8 Reihe dem gewillten Käufer. Selbst die deutlich schnellere Radeon HD 6570 ist beinahe in Schlagdistanz.
Beim Vergleich mit der letzten Generation an Chipsatz IGPs sind die Werte der APU dann noch beeindruckender. So hatte die damals schnellste Version zwar einen um 100MHz höheren Takt, konnte mit 40 Shader-Kernen aber gerade mal auf ein Bruchteil dessen zurückgreifen, was den neuen APUs zur Verfügung steht.
Wem die Performance der Grafikeinheit in der APU nicht ausreicht kann einfach eine diskrete Grafikkarte des Typs Radeon HD 6450, 6570 oder 6670 dazustecken und per "DualGraphics" koppeln, im Endeffekt also nichts weiter als eine Crossfire Konfiguration. Ein Gespann aus A8 GPU und einer Radeon HD 6570 soll so etwa 30-40% schneller sein als eine einzelne Radeon HD 6570 Grafikkarte. In der Vergangenheit war ein ähnliches Feature bei den Chipsätzen unter "Hybrid CrossFireX" bekannt.

	Radeon HD 6570	A8 Reihe	A6 Reihe	Radeon HD 6450	890GX
GPU:	AMD Radeon HD 6570	AMD Radeon HD 6550D	AMD Radeon HD 6530D	AMD Radeon HD 6450	AMD Radeon HD 4290
Shader-Kerne:	480	400	320	160	40
SIMDs:	6	5	4	2
Textur-Einheiten:	24	20	16	8	4
Render Backends:		2	2
Z/Stencil ROPs:		32	32
Color ROPs:		8	8
Speicher- anbindung:	128Bit	64/128Bit *	64/128Bit *	64Bit	64/128Bit *
Speicher- bandbreite:	bis 28,8GB/s (DDR3) bis 64GB/s (GDDR3)	bis 29,8GB/s	bis 29,8GB/s	bis 12,8GB/s (DDR3) bis 28,8GB/s (GDDR3)
GPU Takt:	650MHz	600MHz	443MHz	625-750MHz	700MHz
Video-Processing:	UVD3	UVD3	UVD3	UVD3	UVD2
* Anbindung über Hauptspeicher

(*klick* zum Vergrößern)

Dem Speichercontroller der neuen APUs liegt ganz besonders im Fokus, so wollen nicht nur die vier CPU-Kerne ausreichend schnell mit genügend Daten versorgt werden, sondern es gesellen sich noch bis zu 400 Shader-Kerne dazu. Im Grafikkartenmarkt ist allseits bekannt, dass die Performance der Chips auch mit der Geschwindigkeit des angebundenen Speichers steigt und fällt, kann der Chip nicht schnell genug mit Daten versorgt werden, wird er unnötigerweise ausgebremst und die theoretisch mögliche Leistung verpufft. Auch bei den IGPs der letzten beiden Chipsatz-Generationen war das bei AMD bekannt und man versuchte mit "Sideport Memory" – direkt an den Chip angebunden Speicher – den Flaschenhals über Northbridge und CPU zum Speicher zu umgehen. Bei den APUs entfällt jetzt dieser Umweg über HyperTransport und CPU. So ist der Grafikteil des Chips direkt über die in der APU integrierten Northbridge an den Hauptspeicher angebunden. AMD will im Vergleich zu den alten IGPs die Latenz deutlich gesenkt und die Geschwindigkeit um den Faktor drei gesteigert haben. Dies wird auch dadurch erreicht, dass die neuen Prozessoren DDR3 Hauptspeicher mit einer Geschwindigkeit von bis zu 1866MHz unterstützen. Kleiner Haken an der Sache: DDR3 1866 wird nur bei einem Modul pro Kanal unterstützt. Bei vier Speichermodulen ist also wie bisher maximal DDR3 1600 möglich.
Insgesamt gibt es also einen hohen Bedarf an schnellem Speicher, denn neben Grafik- und Prozessorenteil wollen ja auch noch etwaige über PCIe angeschlossene Chips per DMA auf den Speicher zugreifen. Auf den späteren Seiten werden wir noch klären inwieweit AMDs neuestes Werk auf schnelleren Speicher reagiert, insbesondere beim Betrieb mit der integrierten Grafik.

Stromsparmechanismen und Turbo Core

Die Llano APUs verfügen über erweiterte Stromsparmechanismen. So hat zum Beispiel jeder CPU-Kern seine eigene Spannungsversorgung bekommen und kann sich somit unabhängig der anderen komplett abschalten. Auch die GPU und die UVD Einheit haben eigene Spannungsversorgungen und können komplett abgeschaltet werden.
Ebenfalls unter den Punkt Stromsparen fällt eine Technik die AMD unter dem Namen "Display power optimizations" führt. AMD versucht damit bei der Bildwiedergabe die Helligkeit der einzelnen Pixel anzuheben und im Gegenzug – damit sich die Gesamtoptik des Bildes nicht verändert – die Hintergrundbeleuchtung etwas zu dimmen.

(*klick* zum Vergrößern)

In Sachen Turbo Core hat AMD ebenfalls nachgelegt. So teilen sich in den neuen APUs der Grafikkern als auch die CPU-Kerne eine maximal TDP. Ob die CPU-Kerne eine Stufe Hochtakten hängt, abgesehen von der Unterstützung durch die APU, auch von diversen weiteren Faktoren ab. So muss in allererster Linie gewährleistet werden, dass der Chip nicht seine TDP übersteigt. AMD misst hierzu digital den Verbrauch der CPU-Kerne und gibt diese Information an einen "P-State Manager" weiter, welcher dann entscheidet, ob 'ne Schippe draufgelegt wird oder nicht.
In Sachen TDP-Verteilung hat die GPU immer Vorrang. Das heißt, wenn die GPU nichts zu tun hat, steht den CPU-Kernen der meiste Spielraum nach oben zur Verfügung und es ist wesentlich wahrscheinlicher, dass hochgetaktet wird. Ist die GPU unter Volllast, bleibt unter Umständen kein weiteres TDP-Budget für die CPU-Kerne übrig.
Der Grafikkern ist bei der ganzen Geschichte allerdings nicht soweit mit in den Turbo eingebunden, dass die GPU über den spezifizierten Maximaltakt hinaussteigt, falls die komplette TDP noch nicht ausgeschöpft ist und die Temperatur es zu lässt. Die Zeit wird zeigen, ob AMD in Zukunft hier reagiert und den Grafikteil der APUs bei zukünftigen Generationen noch weiter in den Turbo einbindet.

(*klick* zum Vergrößern)

Nächste Seite: Modelle / Chipsätze

Veröffentlicht: 10.07.2011
Autor: Markus Helwig
Kategorie: CPU's
Kommentare: 0