Interview mit Hardware Spezialisten von Intel

Seite 2: Interview Christian Anderka

interview intel banner 


Bei dem Interview waren neben Christian Anderka auch noch Olaf Höhne (Manager Produktmarketing Europa) und Thomas Kaminski (Pressereferent Fachpresse) anwesend. Das eigentliche Interview fand zwischen den Technic3D Redakteuren und Christian Anderka statt.

Technic3D: Inwiefern beschleunigt Intel in der kommenden CPU-Architektur (Westmere) die einzelnen Kerne?
Christian Anderka: Verschiedene Optimierungen verbessern die Verarbeitungsgeschwindigkeit bei den Westmere-basierten Prozessoren. Ein auffälliges Beispiel sind die Befehlserweiterungen, die die AES-Verschlüsselungsalgorithmen beschleunigen.

Technic3D: Was genau beschleunigen diese speziellen Befehle?
Christian Anderka: Software, die mit Hilfe der AES-Verschlüsselungstechnik Daten verschlüsselt kann mit diesen Prozessorbefehlen schneller ablaufen. Ein gutes Beispiel ist das Programm Winzip– die neueste Version unterstützt schon die AES-NI und damit werden ZIP Archive – wenn gewünscht – schnell und sicher verschlüsselt. Wenn bisher ein Archiv mit AES verschlüsselt werden sollte, wurde der komplette Algorithmus mit den normalen Prozessorbefehlen gelöst. Mit den neuen Befehlserweiterungen gibt es die Möglichkeit, Teile der Berechnungsschritte schneller abzuarbeiten. Dies kann allerdings nur erfolgen, wenn die Software die neuen Prozessorbefehle nutzt. Entwicklern hilft da der Intel Compiler. Die neuen Prozessorbefehle sorgen dafür, dass für AES notwendige Berechnungsschritte schnell im Prozessor abgearbeitet werden können.

Technic3D: In welcher Größenordnung beschleunigt dies die Verschlüsselung und in welchen anderen Anwendungen als Winzip können die Vorteile ausgespielt werden?
Christian Anderka: Der Everest-Benchmark zeigt bei AES eine um den Faktor 17 höhere Performance. In aktuellen Anwendungen ist dieses Potential aber noch nicht ausgeschöpft. Im Falle von Winzip beschleunigten die neuen Befehl die Verschlüsselung ungefähr um 30%. Wesentlich interessanter ist diese Erweiterung, wenn man sich die Sicherheitsrichtlinien von großen Firmen anschaut. Diese verlangen inzwischen, dass die Daten auf Festplatten von Notebooks und Desktops verschlüsselt werden. Das heißt, dass alle Daten, die auf die Festplatte geschrieben werden, für das Betriebssystem transparent verschlüsselt auf die Festplatte geschrieben werden. Und hier können die neuen Befehle dafür sorgen, dass die zusätzliche Sicherheit nicht mit Performance-Einbußen erkauft werden müssen.

Technic3D: Eben diese transparente Verschlüsselung wurde ja bisher nur in Software ausgeführt
Christian Anderka: Genau, an diesem Punkt greifen die neuen Hardwarebefehle an und beschleunigen Schreib- und Lesezugriffe auf die Festplatten spürbar, ein Beispiel ist Truecrypt.

Technic3D: Mit dem Architekturwechsel von dem Pentium III auf den Pentium IV haben sie viele Verbesserungen eingeführt, zu nennen wären hier als Beispiel Hyper Threading
Christian Anderka: Ja, die NetBurst Mikroarchitektur des Pentium 4 Prozessors setzte viele neue Ideen um. Die Intel Hyper-Threading Technik ist da ein gutes Beispiel. Diese Technik hat ja jetzt in einer verbesserten Form wieder Einzug in die neue Core-Mikroarchitektur gehalten. Mit der Intel Hyper-Threading Technik haben wir damals für die Software-Hersteller einen starken Anreiz geschaffen, Software so zu gestalten, dass sie mit mehreren Threads arbeitet. Das hat früher nicht immer gut geklappt.

Technic3D: Sie wollen damit sagen, dass sie versucht haben, mit einer Innovation die Performance von Software zu verbessern indem sie diese parallelisierten, dazu aber auf die Hilfe der Softwarehersteller gebaut haben, allerdings enttäuscht wurden?
Christian Anderka: Wir sehen schon, dass immer mehr Software in der Lage ist mit mehreren Kernen, bzw. Threads umzugehen. Vielleicht sind wir ein wenig ungeduldig und vielleicht war die NetBurst Mikroarchitektur des Pentium 4 Prozessors ein wenig zu sehr auf Softwareanpassungen angewiesen. Die Nachfolge-Architektur, also die Core-Mikroarchtektur kommt mit der verfügbaren Software viel besser zurecht. Software-Optimierungen helfen natürlich nach wie vor, aber die Rechenleistung ist nicht mehr so sehr davon abhängig. Diese Strategie haben wir mit dem nächsten "Tock" Schritt zur aktuellen Nehalem Architektur sehr erfolgreich fortgesetzt und wieder eine Mikroarchitektur entworfen, die vorhandene Software sehr schnell abarbeiten kann.

Technic3D: Konträr zu den "Tock" Schritten, verringern sie ja in den "Tick" Schritten die Strukturbreite, im Moment haben sie die 32nm erreicht. Wie groß waren die Schwierigkeiten auf dem Weg um die aktuelle Stufe zu erreichen?
Christian Anderka: Die Regelmäßigkeit mit der Intel die Strukturbreiten verringert und so das Moorsche Gesetz fortschreibt täuscht eine Leichtigkeit vor, die nicht der Wirklichkeit entspricht. Es bedarf eines immensen Aufwands, um neue Fertigungstechniken einzuführen. Ein Beispiel: Bis hin zur Strukturbreite von 65nm haben wir mit normalem Siliziumdioxid als Sperrschicht im Transistor gearbeitet. Im Rahmen der Verkleinerung der Strukturbreite haben wir die Dicke dieses Isolationsmaterials immer weiter verringert, bis wir bei einer Dicke von drei bis fünf Atomlagen ankamen. Ab hier war es mit dem bisherig verwendeten Material nicht mehr garantiert, dass die Schicht seinen Zweck erfüllte. Bei der 45 nm Technik hat unsere Fertigungsentwicklung das Material gewechselt und das seit Jahrzehnten benutzte Siliziumdioxid durch Hafnium in Kombination mit einem Metall ersetzt. Das machte natürlich den Fertigungsprozeß aufwendiger, aber gab uns auch die Transistorperformance, die wir für diese Fertigungstechnik erwarteten. Bei zukünftigen Fertigungstechniken werden wir immer wieder in die Trickkiste greifen müssen, um die erwünschten Kennwerte zu erreichen.

Technic3D: Sie sind also zuversichtlich, auch weitere Verkleinerungsschritte vollziehen zu können?
Christian Anderka: Ja sind wir. Im Moment sieht es so aus, dass wir über 22nm hinaus gehen können. Die Hürden werden immer größer, aber wir sehen uns der Herausforderung gewachsen.

Technic3D: Wird diese Verkleinerung hinunter bis zu 22nm noch mit Immersionslithografie stattfinden oder setzt Intel da im Produktionsprozess schon auf EUV
Christian Anderka: Wir werden noch mit Immersionslithografie arbeiten, da die Technologie für EUV leider noch nicht so weit ist, wie wir uns das vor ein paar Jahren vorgestellt hatten. Aber Intel ist hier vor allem auf seine Lieferanten aus dem Anlagenbau angewiesen, da diese Grundlagenforschung herstellerübergreifend vor allem von den Anlagenbauern vorangetrieben wird. Es ist wie beim Autofahren im Nebel, manchmal sieht man bis zu 100m weit und manchmal eher nur 10m. Bis vor 10 Jahren war die Sichtweite konstant bei ca. 100m gelegen, man konnte einfach die Transistoren weiter verkleinern und die Taktschraube nach oben drehen. Dann lagen wir vor ein paar Jahren nur bei ganz wenigen Metern Sichtweite und heute können wir sagen, wir sehen zumindest 15m weit.
 
(*klick* zum Vergrößern)


Technic3D: Mit dem aktuellen "Tock" Schritt stellen Sie ja auch ein neues Spitzenprodukt mit sechs Kernen und Zwölf Threads vor.
Christian Anderka: Richtig, wir stellen den neuen Core i7-980X auf dem bekannten X58 Chipsatz vor. Der neue Prozessor zeichnet sich durch die bereits besprochene Strukturverkleinerung auf 32nm aus, durch die wir 6 Kerne auf ungefähr der gleichen Chipfläche unterbringen konnten. Natürlich hat der Core i7-980X wieder die Turbo Boost Technologie, sowie einen Memory Controller an Board, der drei DDR3 Kanäle zur Verfügung stellt.

Technic3D: Intel verfolgt also eine zweigleisige Strategie, auf der einen Seite verlässt sich Intel doch auf Verbesserungen in der Softwareindustrie, versucht aber auf der anderen Seite alte Software mit Verbesserungen der Core Geschwindigkeit, zu beschleunigen
Christian Anderka: a. Unser Ziel ist eigentlich recht einfach: Wir wollen die schnellsten und stromsparendsten Prozessoren bieten können. Das erreichen wir durch eine Mikroarchitektur, die mit vorhandener Sofware gut umgehen kann, aber genügend neue Funktionen bringt um größere Sprünge zusammen mit der Software-Industrie zu realisieren. Hier wäre zum Beispiel die AVX Befehlserweiterung zu nennen. Um die Hardware zu beschleunigen, haben wir ja bei der aktuellen Architektur schon die TurboBoost Technologie eingeführt, die einen einzelnen Kern massiv beschleunigen kann, wenn die anderen nichts zu tun haben.

Technic3D: AVX ist auch bekannt als Vektorerweiterungen, mit denen Zahlen bis 512 Bit breite verarbeitet werden können
Christian Anderka: Bei AVX handelt es sich um Befehle, die mathematische Operationen erheblich beschleunigen werden, vor allem Gleitkommaoperationen mit hoher Genauigkeit, wie sie in der Bildbearbeitung und Wissenschaftlichem Rechnen verstärkt auftreten, werden davon profitieren. Diese Befehlserweiterungen werden wir erstmals mit der kommenden Sandy Bridge Architektur einführen.

Technic3D: Aufgaben der Bildbearbeitung und Videoko- bzw. dekodierung, lassen sich ja wunderbar parallelisieren, wo sehen Sie die Grenze bei der Anzahl der Kerne pro CPU?
Christian Anderka: Hier muss man unterscheiden für welchen Aufgabenbereich eine CPU geeignet sein soll. Im Bereich der CPUs für Heimanwender und Spieler, ist es schon schwieriger. Da kommt es schon bei einer relativ geringen Kernzanzahl zu massiven Skalierungsproblemen auf der Softwareseite. Mit einem Forschungsprojekt in dessen Rahmen wir einen Prozessor mit 48 Kernen einigen Universitäten zur Verfügung stellen, erforschen wir, wie viele Kerne besser skalieren können.
Im Serverbereich, bei dem viele Leute gleichzeitig auf einen Service zugreifen und jeweils nur eine geringe Last erzeugen, können diese Zugriffe leichter auf viele Kerne verteilt werden.

Technic3D: Sie haben gerade den Serverbereich angesprochen, hier sind ja eher die Zugriffszeiten auf die Festplatten das Problem. Intel hat letztes Jahr seine erste SDD auf den Markt gebracht, welche weiteren Innovationen sind in diesem Bereich zu erwarten?
Christian Anderka: Unsere nächste Controllergeneration wird wohl der Konkurrenz wieder einen Schritt voraus sein. Außerdem wird Intel in Zukunft ausschließlich auf MLC-Flash setzen, hier haben wir aktuell 8 Gbit pro Zelle erreicht. Der Preis pro Gigabyte wird bei den SSDs fallen, aber absolut wird eine SSD weiterhin teuer sein im Vergleich zu herkömmlichen Festplatten.

Technic3D: Auf der diesjährigen CeBit ist USB 3.0 ein großes Thema. Intel zählt zu den führenden Entwicklern von USB 3.0 und hat auch die Treiber für den Linux Kernel beigesteuert, wann wird USB 3.0 direkt in Intel Chipsätzen unterstützt?
Christian Anderka: Dazu kann ich Ihnen leider nicht viel sagen, nur soviel: Für das Jahr 2010 wird Intel keine neuen Chipsätze mehr vorstellen. USB 3.0 wird also erstmal über Zusatzchips wie den von NEC realisiert werden. Intel wird abwarten, inwieweit der Markt USB 3.0 annimmt.

Technic3D: Wir bedanken uns ganz herzlich für das Gespräch.
Christian Anderka: Ich bedanke mich ebenfalls, viel Erfolg noch auf der CeBit.
Christian Anderka   2006 February   small square
(Christian Anderka - Platform Architecture Specialist Intel GmBH)






Für Fragen, Hinweise, Meinungen bitte die Kommentarfunktion etwas weiter unten nutzen, oder direkt im Forum posten.
Veröffentlicht:

Kategorie: Neue Technologie
Kommentare: 0