AMDs Zen - Weitere Architekturdetails

Locuza

Lötkolbengott/-göttin
Schritt für Schritt kommt AMD und die interessierte Technikmeute der neuen CPU-Zukunft von AMD näher.
Herrschte vor vielen Jahren generelles Unwissen über AMDs Zukunftspläne, wurden diese sehr grob 2014 von AMD auf der Core Innovation Summit offen gelegt.
Es folgten viele (falsche&richtige) Gerüchte, Spekulationen und potentielle Leaks, garniert mit weiteren offiziellen AMD-Angaben.

Ein echtes Bild konnte und kann man sich leider nur grob machen, da offizielle oder verlässliche Informationen rar gesät sind.
Klar und offiziell von AMD herausgegeben sind nur grobe Details:

AMDZen.jpg




Der Schleier hat sich aber seit dem 30. September nennenswert geöffnet, dank einem von AMD eingesendeten Compiler Patch für die GNU Compiler Collection, kurz GCC, welcher die ersten Optimierungen für Zen einpflegt:
https://patchwork.ozlabs.org/patch/524324/

Mit diesen Informationen hat sich ein bekannter Technik Veteran Matthias Waldhauer (Dresdenboy), welcher seit vielen Jahren eingereichte Patente analysiert und CPU-Entwicklungen verfolgt, auseinandergesetzt.
Citavia Blog

Folgendes, von Dresdenboy gezeichnete Schema, könnte Zen sehr nahe kommen:

Zen-Architektur%2BCore%2BV0.2.png


Aus den Patch-Einträgen ergibt sich pro Zen-Kern:

- Ein 32-KB großer L1-Cache und 512-KB großer L2-Cache.
- Es gibt 4-Decoder
- Jeweils 4-Integer-Pipes, 2-AGUs, und 4-Floating-Point-Pipes.
- Zwei davon stellen ADD-Pipes und zwei MUL-Pipes dar, welche alle 128-Bit breit sind.

Auf der Integer-Seite fällt ein Zen-Kern damit sehr breit aus.
4 Integer-Pipes stellen das doppelte eines Jaguar oder Bulldozer Integer-Cores dar und sind auf dem selben Niveau wie Intel seit Haswell.
Das man 4-Integer-Pipes mit einzelnen Threads schwer auslasten kann, teilweise sogar 3, zeigt sich bei Intel seit Jahren, weswegen SMT eine geeignete Möglichkeit darstellt die Auslastung zu erhöhen.

Auf der Floating-Point-Seite überraschen mich die Daten.
Diese sind interessant ausgerichtet.
Der Durchsatz ist mit 2x 128-Bit ADD und MUL bei den "handelsüblichen" Operationen doppelt so hoch, wie bei Intels Prozessoren und der alten Bulldozer Linie von AMD (Jeweils 1x ADD+MUL pro Takt).
Kommt allerdings AVX und/oder FMA ins Spiel, zeigen sich Nachteile.
Bei 256-Bit AVX werden jeweils zwei Ausführungsschritte gebraucht, wo Intel schon ab Sandy-Bridge dank 256-Bit Pipes nur jeweils einen benötigt (Der Durchsatz liegt dann auf gleicher Höhe).
Bei FMA-Operationen soll laut Patch nur eine ADD-Pipe zur Funktion bereitstehen.
Damit würde sich pro Takt nur eine 1x 128-Bit FMA-Operation herausquetschen lassen, gegenüber 2 vom alten Bulldozer und ebenso 2 bei Intel ab Haswell (Welcher sogar 2x 256-Bit schafft).

Den normalen Verbraucher interessiert das unter Umständen wenig, da die meisten Programme nicht Gebrauch von AVX machen, geschweige denn FMA, bisher kenne ich selber nur die Codemasters Rennspiele, welche AVX verwenden und unter einfachen 128-Bit ADD/MUL Operationen ist der Durchsatz am höchsten, für spezielle Anwender und Enterprise/Hochleistungsrechner fällt die FPU dagegen schwach aus.

Unter Umständen wird AMD aber einen ähnlichen Ansatz wie Intel mit Skylake verfolgen.
Für Client-Kunden gibt es eine schmalere Floating-Point-Unit, während Enterprise-Kunden eine viel größere bekommen.
Diese Möglichkeit hat vor vielen Jahren schon die italienische Seite Bits&Chips genannt, welche angeblich Informationen erhalten haben, dass AMD mit Zen ein sehr modulares Konzept verfolgt, wo sogar unterschiedliche FPUs verbaut werden können, je nach Marktsegment.
 
Zuletzt bearbeitet:
Unter Umständen wird AMD aber ähnlich wie Intel eine Aufspaltung verfolgen, wo die normalen Verbraucher mit schmalen Kernen bedient werden und etwas später eine Variante mit angepassten Kernen für Enterprise-Kunden folgt.

Würde dazu passen, wenn AMD erst den "High-End-Gaming-Sektor" bedienen will, wenn ich es richtig in Erinnerung habe. Erstmal die CPU bei Kunden testen, um dann zu sehen, ob sich ein breiterer Kern finanziell lohnt.
 
Wirklich eine sehr gute User-News (oder sollte man schon eher News sagen ;) ) Kann man daraus schon auf die maximale Anzahl der Kerne schließen?
 
Zuletzt bearbeitet:
Das ist schon mehr ein User-Artikel als eine bloße News, saubere Arbeit :daumen:
Das alte Zen-Thema mit den "geleakten" Folien war mehr Arbeit, gut das die alle gefälscht waren. :ugly:
http://extreme.pcgameshardware.de/user-news/387056-amds-zen-core-potenziell-geleaked.html

Ich habe mich aber ehrlich gesagt versucht kurz zu halten, um den Einstieg nicht zu groß zu gestalten, aber Dresdenboy hatte noch einige weitere, "essentielle" Informationen in seinem Blog stehen.
Z.B. die sehr geringen Latenzen die für die Grund-Operationen angegeben werden, welche auf "niedrige" Taktraten hindeuten.
3-Zyklen für die jeweiligen 128-Bit Pipelines und 5-Zyklen für eine FMA-Operation.
5-Zyklen braucht auch ein Haswell:
http://images.anandtech.com/reviews/cpu/intel/Haswell/Architecture/flops.jpg

Ich erwarte da ähnlich wie Dresdenboy ein Taktbereich von 3-4 Ghz, in einer ähnlichen Range, wo auch Intel ihre SKUs herausbringt.

Wenn man von den Patenten ableitet und die dann auch tatsächlich verwendet werden, wäre der L1-Cache 8-Fach Assoziativ. (Genau so wie Jaguar)
Viel interessanter ist aber ein Patent, welches sich um die "checkpoint" Technik handelt.
Leider verlinkt es Dresdenboy nicht, keine Ahnung was dort genau steht, aber es soll die Kosten bei falscher Vorhersage von Code-Verzweigungen senken.

Ein Punkt der von mir schlecht ausarbeitet ist und mich kirre macht, ist die ganze Floating-Point-Sache.
Getrennte ADD/MUL-Pipes, dann reine FMA-Units wie bei Bulldozer und dann noch Intels Schaubilder.
Ich steig da ehrlich gesagt vom theoretischem Durchsatz nicht durch.

Vielleicht hat da jemand anderes Lust, dass genauer zu erklären und aufzuarbeiten.
 
Sehr interessant :daumen:

Aber wie immer gilt, abwarten ! ;)

Auch der Bulldozer sollte einmal einschlagen wie eine Bombe :D
 
Man, das brodelt ja die super nochmal an... Ich freue mich echt auf die zen CPUs und hoffentlich kann man mit Intel wieder konkurrieren.
Wenn diese im ersten Quartal 2016 kämen, würde ich sogar zu Zen updaten... Und nicht zu dem, was Intel da haben wird!

PS: von einem möglichen Release Datum wird doch nichts erwähnt oder?
 
irre ich mich vielleicht aber sind Gaming Leistungen nicht zuerst abhängig von FPU Leistungen ?
Ich habe jetzt leider keine konkrete Auflistung wie die Balance bei Spielen aussieht, aber einen nennenswerten Anteil hat die FPU gewiss.
Zen steht allgemein aber gar nicht schlecht da.
Solange AVX256-Bit nicht verwendet wird oder FMA ist der Durchsatz mit 4 x 128-Bit Pipes bei 128-Bit Instruktionen sogar höher als bei Bulldozer und Intels CPUs.

PS: von einem möglichen Release Datum wird doch nichts erwähnt oder?
Q4 2016 ist wahrscheinlich.
Im Best-Case gibt es spät im Q3 schon Produkte, im Worst-Case sogar erst 2017.
 
Bisher sind ja keine Verspätungen bekannt. 14nm sollte bis dahin auch ohne Probleme laufen.

Sollte also schon spätestens im Weihnachtsgeschäft 2016 zu kaufen sein.
 
Es gibt 2 dinge die mich an dem AMD etwas stören.

1. Warum wird so wenig Augenmerk auf AVX gesetzt? AMD war früher oft mal vorreiter was zukünftige Technologien angeht. Die erste x64 CPU kam von AMD. Als Otto normal Anweder ist das zwar egal, aber mir geht es gerade eher um das Prizip.

2. Wieso AMD erst so spät rafft, das die ganze Bulldozer Technik rein in der Theorie zwar gut, aber in der Praxis ******* war und die, die erst jetzt einstampfen.

In der Theorie klingt der Zen bis jetzt auch großartig für den Gamer/normal Anwender. Wie es jetzt in der Praxis ist muss sich noch heraus stellen.

Aber nehmen wir mal AMD würde es schaffen eine CPU zu bringen wo das Topmodell einem 5820K entspricht, ist das schon ein riesen erfolg für AMD. Im Moment halten die nicht einmal bei den kleinen i5 mit.
 
Es gibt 2 dinge die mich an dem AMD etwas stören.

1. Warum wird so wenig Augenmerk auf AVX gesetzt? AMD war früher oft mal vorreiter was zukünftige Technologien angeht. Die erste x64 CPU kam von AMD. Als Otto normal Anweder ist das zwar egal, aber mir geht es gerade eher um das Prizip.

2. Wieso AMD erst so spät rafft, das die ganze Bulldozer Technik rein in der Theorie zwar gut, aber in der Praxis ******* war und die, die erst jetzt einstampfen.

In der Theorie klingt der Zen bis jetzt auch großartig für den Gamer/normal Anwender. Wie es jetzt in der Praxis ist muss sich noch heraus stellen.

Aber nehmen wir mal AMD würde es schaffen eine CPU zu bringen wo das Topmodell einem 5820K entspricht, ist das schon ein riesen erfolg für AMD. Im Moment halten die nicht einmal bei den kleinen i5 mit.

1. AVX wird bisher quasi ausschließlich im HPC Bereich verwendet, also in riesigen Serverfarmen. Gut möglich, dass da AMD mit Zen noch kein Licht sehen wird und sich die Technik nicht lohnen würde.

2. AMD hat das schon vor langer Zeit gemerkt - womöglich sogar schon vor dem Release des Bulldozers. Nur zaubert man eine gänzlich neue Architektur nicht einfach so aus dem Hut. das dauert Jahre, um so was zu entwickeln. Intel musste auch lange mit dem Pentium 4 vorlieb nehmen, obwohl sie ganz genau wussten, dass dieser nicht auf der Höhe sei.

Dass es AMD schon vor Release des Bulldozers bewusst war, dass jener ein Schlag ins Wasser sein würde, ist sogar recht wahrscheinlich, denn 5 Jahre (Bulldozer kam Oktober 2011 auf den Markt) sind eigentlich für eine komplette Neuentwicklung, auch wenn man von anderen Prozessoren etwas abkupfert, doch eigentlich eine verdammt kurze Entwicklungszeit. Vor allem wenn man die ganze Zeit sowohl mit finanziellen als auch mit personellen Schwierigkeiten kämpfen muss.
 
1. Warum wird so wenig Augenmerk auf AVX gesetzt? AMD war früher oft mal vorreiter was zukünftige Technologien angeht. Die erste x64 CPU kam von AMD. Als Otto normal Anweder ist das zwar egal, aber mir geht es gerade eher um das Prizip.

Wie schon erwähnt, ist AVX bis auf wenige Spezialanwendungen kaum vertreten und quasi zu 99% nutzlos für den Normal-Anwender.

Es gibt da 2 Möglichkeiten, warum es AMD so gemacht hat und nicht wie gewünscht:

1. AMD will ja Zen zuerst im Desktop bringen. Da dort AVX kum eine Rolle spielt, haben sie nach dem Release eine etwaige Übersicht, ob sich eine breitere FPU vom zu erwartenden Gewinn her lohnt oder nicht. Evtl. bringen sie auch mit der Nachfolgegeneration breitere FPU.

2. AMD baut nur eine FPU in Zen ein, die für den weit verbreiteten 128Bit-SSE-Anwendungen ausreichend ist. Für die breiteren FPU-Anwendung kann die GPU herhalten, die diese deutlich effizienter und schneller als eine CPU-Implementierung abarbeiten kann. AMD kann diesen Weg gehen, da sie schlagkräftige iGPU's haben im Vergleich zu Intel.
 
Ich sehe diese Entwicklung positiv auch wenn man auf dieser Basis natürlich nur schwer abschätzen kann wie gut Zen wirklich wird. Auf dem Papier war Bulldozer auch nicht schlecht wenn auch wohl schwerer einzuschätzen.

AVX sollte man b2w nicht unterschätzen, in ein paar Jahren könnte das schon auch für normale Programme eine Rolle spielen und es ist fallweise potenziell wirklich viel schneller.
 
Zurück