AMDs Zen Core potenziell geleaked

Locuza

Lötkolbengott/-göttin
Informierte Leser und sicherlich viele gespannte AMD Fans werden wissen, was am 6. Mai stattfinden wird.
Der Financial-Analyst-Day von AMD, bei dem erste Informationen bezüglich der neuen Architektur für ARM und x86 (K12 bzw. Zen) und mögliche Roadmaps zu erwarten sind.

Ein Bild der kommenden Präsentation scheint im Planet3DNow! geleaked worden zu sein, von einem neu registrierten User (insider2015), ohne viel Begleittext:

zen.jpg



Gegenüber der alten Bulldozer Architektur erkennt man sofort, dass es bei AMD wieder etwas klassischer zugeht.
CMT (Clustered-Multithreading) bzw. das Teilen von vielen wichtigen Ressourcen und Arbeitsschritten hat sein Ende gefunden.

Unter Zen gibt es nur noch einen Integer-Core, welcher dabei etwas dicker ausfällt, als einer von Bulldozer.
Anstatt 4 Pipes (2 ALUs, 2 AGUs) werden 6 (Entsprechend 3 ALUs, 3 AGUs oder 4 ALUs, 2 AGUs) verbaut.
Aufgrund der höheren Ressourcen und nun exklusiven Fetch/Decode/Dispatch-Stufe für einen Integer-Core, ist eine viel höhere Single-Thread IPC zu erwarten.
Ebenso bietet sich mit 3 (vielleicht auch 4) ALUs die Möglichkeit nach dem spekulierten SMT an, womit zwei Threads von einem Kern bearbeitet werden können, ebenso wie bei Intel.
Die vier Pfeile ausgehend vom Decoder suggerieren hier möglicherweise jeweils einen Thread.

Anders als bei Intel gibt es keinen gemeinsamen Sheduler für Integer und FP, sondern wie seit Ewigkeiten getrennte.
Ansonsten würde es für AMD vermutlich zu komplex ausfallen.

Auf der Floating-Point Seite stehen zwei FMACs mit 256-Bit zur Stelle bereit.
Damit verdoppelt sich der theoretische Durchsatz bei AVX256 Operationen gegenüber einem alten Bulldozer Modul.
Anders wie früher mit 128-Bit FMA-Pipes muss eine 256-Bit Instruktion nun nicht mehr in zwei Schritten berechnet werden oder gemeinsam von zwei Pipes.

Unter Umständen ist es weiterhin möglich beide FMACs verschaltet berechnen zu lassen, somit könnte AMD sogar AVX512 unterstützen, welches erst mit Skylake-EP kommen sollte.
Möglicherweise ist es dafür aber noch zu früh.

Update:
insider2015 hat in einem zweiten Beitrag hinzugefügt, dass ein Zen-Core weniger als 10mm² belegen soll.
Sollte sich die tatsächliche Größte nicht deutlich darunter befinden, so spielt ein Zen-Core definitiv nicht in der unteren small-core Klasse.
Ein Broadwell Kern von Intel soll unter Intels 14nm Prozess grob 7mm² Platz verbrauchen.

Update Nr.2:
Neuer Tag, neues Futter:

unit.jpg


Abermals scheinen sich die Gerüchte gegenseitig zu "bestätigen".
So soll jeder Zen Kern über 512 KB L2-Cache verfügen, dabei stellen insgesamt vier Zen Kerne eine Quad-Core-Unit dar, welche sich 8MB L3-Cache teilen.
Zusätzliches wird ein inklusives Cache-Design genannt, für hohe Performance und geringe Latenzen.
Das Design ist an dieser Stelle sehr ähnlich gegenüber dem von Intel, welches seit Nehalem zum Einsatz kommt.
Weniger und privater L2-Cache pro Kern, dafür ein großer geteilter L3-Cache.

Reicht eine Quad-Unit nicht aus, kann man einfach zusätzliche verbauen, somit wird ähnlich skaliert wie bei Jaguar.
Damit das ganze auch gut funktioniert, braucht man natürlichen einen sehr schnellen Interconnect, welcher so als Stichpunkt genannt wird.
Der letzte Stichpunkt dreht sich um die Möglichkeit, flexibel von High-Performance bis zu low-power seine Produkte designen zu können.

Update Nr.3:
Ein neuer Tag und sicher ahnen es schon viele Leser, neue Bilder!
Dieses mal handelt es sich um zwei Roadmaps für Desktop und Mobile:

desktop.jpg


mobile.jpg



Desktop:
2015 bleiben Piledriver, Beema und praktisch auch Kaveri erhalten.
Kaveri soll nur einen kleinen Refresh in Form von Godaveri bekommen.

Dafür fällt das Jahr 2016 für Desktop-Nutzer unglaublich spannend aus.
Nachdem 2012 mit Piledriver (Vishera) Schluss war, bekommt der Anwender nun nach 4(!) Jahren mit "Summit-Ridge" einen echten High-Performance Nachfolger.
8 Zen Cores und damit 2 Quad-Units, fußen auf dem neuen Sockel FM3, gefertigt in 14nm.
Summit-Ridge stellt dabei eine reine CPU dar, ohne iGPU Anteil.

Eine Stufe darunter wird der Kunde im Mainstream mit der "Bristol Ridge" APU bedient.
Wer sich noch erinnern mag, Bristol Ridge wurde schon vor längerer Zeit von der Gerüchteküche erwähnt, allerdings in einer gänzlich anderen Form, die sich mit dieser Roadmap hoffentlich als falsch herausstellt.
Damals wurde Bristol-Ridge als ein überarbeiter Carrizo mit Excavator für den Desktop genannt, weiterhin im 28nm Prozess, allerdings für 2016 mit DDR4 ausgestattet und auf dem gleichem Sockel FM3.
Die geleakte Roadmap stellt Bristol-Ridge aber gewaltig attraktiver dar.
Bristole-Ridge ist demnach ein moderner SoC, in 14nm gefertigt und mit 4 Zen Kernen ausgestattet.
Neben der CPU gesellt sich die nächste Generation von GCN mit vollem HSA 1.0 Support dazu.
Bristol-Ridge teilt sich wie Summit-Ridge den selben Sockel FM3.

Für Low-Power und small-form-factor Produkte bekommen wir Basilisk.
Ein ironischer Name, welcher schon viele Jahre auf den Buckel hat.
Damals war Basilisk als ein High-Performance Produkt in Form von Bulldozer geplant.
Nun ist es ein kleiner SoC, in 14nm mit zwei Zen Cores und ebenso der neusten GCN Generation und ausgestattet mit HSA 1.0 Support.
Allerdings wird Basilisk verlötet, im BGA Format mit dem Namen FT4.
Gegenüber Beema darf man sich in dieser Klasse auf TrueAudio freuen, welcher bisher nur in Kaveri und gewissen GPUs zum Einsatz kam.

Mobile:

2015 ist ähnlich wie beim Desktop relativ bekannt.
Carrizo und Carrizo-L stellen das obere und mittlere Produktfeld dar.
Hinzukommt allerdings Amur.
Ein 20nm ARM SoC mit Cortex A57 Kernen von ARM lizenziert.
Kenner wissen, dass Amur der ARM-Pendant für das Projekt Skybridge ist, ein gemeinsamer Sockel für x86 und ARM-Cores, welche in 20nm gefertigt werden.
Dieser Sockel stellt sich nun als BGA-Sockel FT4 heraus, welcher auch für "Basilisk" und "Styx" in der Zukunft verwendet wird.
Allerdings scheint der x86 Core zu fehlen.
Von diesem gibt es keine Spur.
Ebenso fehlt irgendein Hinweis nach HSA.
Zum Schluß werden 2W SDP für Amur angegeben.

Blicken wir in das Jahr 2016 für Mobile.
Hier stellt Bristol-Ridge die höchste Klasse dar.
Wie schon erwähnt, ein SoC mit 4 Zen-Kernen und neuster GCN-GPU.
Etwas genauer wird man hier, indem man TPD-Werte angibt.
15-35W.
Als BGA-Sockel wird FP4 verwendet.

Für Low-Power bis Essential wird entsprechend Basilisk verwendet.
5-15W und wie im Desktop wird der BGA-Sockel FT4 genutzt.

Für Ultra-Low-Power bis Essential gibt es einen neuen ARM-Nachfolger.
Mit dem Codenamen "Styx" kommen zwei K12 Kerne zum Einsatz, mit neuster GCN-Architektur, HSA 1.0 Support, FT4 BGA und einer SDP von ~2W.
In dieser kleinsten Klasse wird allerdings TrueAudio nicht mehr verbaut.

Fazit:
Es mag sicher kleine Freudensprünge bereiten, 2016 eine top-moderne Produktpalette in 14nm zu sehen.
Sollte sich nicht jemand die Mühe gemacht haben die Folien zu fälschen, so kann man vermutlich ohne Übertreibung sagen, dass wir 2016 das spannendste Line-Up von AMD in seiner Unternehmensgeschichte zu erwarten haben!
Auffällig ist, dass Zen dabei als universaller Nachfolger verwendet wird.
Mit einer neuen CPU-Architektur die alle davorigen ablöst, von low-power bis high-performance, der neusten GCN Generation und nach einer gefühlten Ewigkeit, der Umstellung von der 32/28nm planar Fertigung auf 14nm mit FinFETs, haben wir den größten und saubersten Sprung vor uns.

*(Gemäß dem Fall das AMDs neue Architekturen überzeugen und auch die Fertigung durch Verspätung, schlechte yield oder Effizienzwerte keinen Strich durch die Rechnung macht)

Wie immer ist Vorsicht und Skepsis gegenüber Leaks hervorzubringen.

Update Nr.4:

Der Financial-Analyst-Day von AMD ist seit kurzer Zeit vorüber und die traumhaften Folien, bleiben (teilweise) ein fiktiver Traum.
Ab hier vergleiche ich chronologisch die gefälschten Folien mit den offiziellen Informationen von AMD.

Zen-Core:

AMDZen.jpg


Im Gegensatz zu den gefälschten Folien ging AMD was die Architektur betrifft, kaum ins Detail.
Grobe Eckpunkte stimmen allerdings überein.

Zen ist ein sehr skalierbarer Kern, welcher sowohl die Katzen-, als auch Bulldozer-Familie ersetzen wird.
Leistung soll dabei aber kein Kompromiss darstellen.
So wird Zen als total neuer High-Performance Core betitelt, welcher Support für SMT bietet, um hohen Multithreading Durchsatz zu erreichen.
Daneben steht ein neues Cache-System an, für hohe Bandbreiten und niedrige Latenzen.
Auf den Punkt gebracht erwartet AMD eine 40% höhere IPC gegenüber Excavator.

Viel mehr Informationen gab es nicht.
Der grobe Aufbau, Cache-Größen oder sonstige Architekturdetails wurden nicht explizit genannt.

Roadmap:

AMDCPUPlatforms.jpg


Das Jahr 2015 stimmt wenig überraschend (fast) überein.
Einzig Amur als 20nm SoC wurde nicht erwähnt.
Skybridge als gemeinsamer ARM/x86 Sockel wurde allerdings offiziell gestrichen.
Entsprechend sind vielleicht alle Pläne gemeinsam vergraben worden.

Für 2016 hält sich AMD sehr grob.
In der Mittelklasse werden für Mobile und Desktop einfach nur APUs angeführt, wo AMD von der siebten Generation spricht.
Was sich dahinter verbirgt ist ein kleines Rätselraten, was sich leider sicher nicht dahinter verbirgt sind die Zen-Cores, diese sollen nämlich erst 2017 in APUs zu finden sein.
Wenn wir wieder zu den Gerüchten gehen wo wir am Anfang waren, dann erwartet uns Bristol Ridge, allerdings als eine 28nm APU mit Excavator Cores.
Was 2016 entsprechend langweilig und schwach gegenüber der Konkurrenz ausfallen dürfte.

Worauf man sich aber wenigstens definitiv freuen darf, ist auf Zen.
Dieser soll 2016 als reine CPU für den neuen Sockel AM4 erscheinen.
Mehr Details gibt es abermals nicht, wie viele Kerne AMD anbieten möchte ist damit unklar, wobei ich persönlich weiterhin von 8 Kernen ausgehe.
Bei AM4 gibt es noch ein weiteres Detail, was wenigstens mit den gefälschten Folien übereinstimmt.
Zwar heißt der Sockel AM4 und nicht FM3, er soll aber dennoch sowohl für die Zen CPUs, als auch für die APUs gemeinsam verwendet werden können.
Bei der Mobile-Roadmap sieht es ähnlich aus, FP4 von Carrizo(L) wird weiterhin als Sockel dienen und kann damit mehrere Chips supporten.

K12 findet sich übrigens nirgendwo. AMD fokussiert sich zuerst auf Zen und hat die K12 Pläne lieber auf 2017 verschoben.


Zum Schluss:

Ich danke den vielen Lesern dieser News und hoffe das wir uns gemeinsam auf die Ankunft von Zen 2016 freuen können.
Zwar möchte AMD nicht 100% in jedem Segment voll durchstarten, aber aus vernünftiger Sicht wäre AMD damit überfordert gewesen und müsste ein (zu) großes Risiko eingehen.

Quelle:
AMD Zen - 14nm, 8 Kerne, 95W TDP & DDR4? - Seite 17
AMD Zen - 14nm, 8 Kerne, 95W TDP & DDR4? - Seite 17
 
Zuletzt bearbeitet:
Viel sagt uns das allerdings freilich nicht und das das Konzept in diese Richtung gehen dürfte war ja auch bisher schon bekannt.

Wir wissen nach wie vor vieles nicht etwa:
-Cachegrößen
-Takt
-Anzahl der Takte die diverse Befehle zur Durchführung benötigen
-Befehlssatzerweiterungen und Umfang in dem diese implementiert werden
-Pipelinestufen
-Sprungvorhersage, Out-of-order Befehlsausführung
-Geschwindigkeit interner Busse
-SMT
-Superskalarität, Kerninterne Parallelisierung, Anzahl der ALUs pro Kern usw.
...

Was die Geschwindigkeit der CPUs aus Anwendersicht (und das interessiert uns ja primär) betrifft wissen wir also nicht mehr als zuvor: Ein "Zen" Kern wird wohl wesentlich schneller als ein Bulldozer/Excavator Kern (denn sonst wäre das Konzept ja sinnlos) und das wahrscheinlich auch in Relation zum Takt.
 
Wenn das Bild von Fudzilla kein Fake ist, dann besitzt jeder Zen Core 512 KB L2$ und vier Kerne stellen praktisch ein Modul dar, welche sich bis zu 8 MB L3$ teilen:
http://www.fudzilla.com/media/k2/items/cache/f82923a2b3af2ff3d2aed183b6b61fec_L.jpg

Falls AMD da nicht sehr flexibel ist, wird es interessant sein, wie AMD Consumer-Produkte damit bestückt.
APUs mit einem Modul, 4 Kerne, 8 MB L3-Cache (am besten mit der GPU zusammen) und CPU-Angebot mit sogar zwei Modulen, 8 Kernen und 16 MB L3$?
Das wäre natürlich nett.
 
" Jaguar is tiny, just 3.1 mm2 per core. " Quelle: AMD teases Beema SoC, or something rather
Und das in 28nm. Nehmen wir mal an, dass man mit 14nm realistisch 35% mehr Transistoren/Fläche packen kann, dann haben wir laut altbewährter Milchmädchenrechnung 4,35 mal so viele Transisotoren pro Kern im Vergleich zu Jaguar. Die Dinger wären.. ...groß...


Nachtrag: Ich hab das below nicht gelesen.. ...ich geh jetzt besser ins Bett...
 
Zuletzt bearbeitet:
Das Problem ist, seine Aussage ist ein bisschen nichtssagend.
Kleiner als 10, ist ohne etwas genauer zu werden, halt relativ grob.
Normalerweise würde ich vom Sprachgebrauch nicht kleiner als 9 erwarten, aber sein dritter Beitrag könnte nicht so eindeutig interpretiert werden:
Insider2015 schrieb:
Excavator has 14,48 sqmm w/o cache in 28nm, Jaguar's L2 is ~2 sqmm.

Just because I said <10 sqmm for Zen doesn't mean it's exactly 10. It's smaller.
Könnte vielleicht auch 8 sein oder gar 7?

Solange ein Core nicht extrem kleiner ist, wäre Zen jedenfalls kein Winzling.
 
Es deuten sich relativ große Cores an, wenn dass Zitat von insider2015 halbwegs sinnvoll ist.
Damit verbunden wäre ein deutlicher IPC-Anstieg im Vergleich zum Bulldozer möglich.
Die Folie selbst ist leider noch relativ allgemein gehalten.

In den nächsten Tagen kommen bestimmt noch einige Leaks dazu, die dass Bild abrunden werden.
 
Weiß man schon was über den Sockel und Bus? Steigen sie komplett auf PCIe um (vermutlich, bei 64 Lanes) und kann man da bei PGA bleiben oder "müssen" sie auf LGA umsteigen weil sich das besser mit vielen Pins ausgeht? Ich erwarte jetzt von niemandem seine Glaskugel aufzuwärmen aber vielleicht gibts hier Leute, die das gut einschätzen können^^
 
Da gabs mal "einigermaßen" glaubwürdige Gerüchte, dass Zen auf FM3 kommt und mit dem Carrizo-Dekstop-Ableger Pinkompatibel sein wird.
 
Anders als bei Intel gibt es keinen gemeinsamen Sheduler für Integer und FP, sondern wie seit Ewigkeiten getrennte.
Ansonsten würde es für AMD vermutlich zu komplex ausfallen.

Das liest sich irgendwie merkwürdig. Meinst du sie seien technologisch nicht dazu in der Lage, oder wie genau ist das zu verstehen?
 
Da gabs mal "einigermaßen" glaubwürdige Gerüchte, dass Zen auf FM3 kommt und mit dem Carrizo-Dekstop-Ableger Pinkompatibel sein wird.

Es wird keinen Carrizo-Ableger für den Desktop geben. Sonst hätte man den jetzt schon gebracht. Aber bei hohen Taktfrequenzen lässt die Effizienz dort einfach zu sehr nach. Nach neueren Gerüchten wird Summit Ridge doch ein 14nm-Chip mit Zen.
 
Weiß man schon was über den Sockel und Bus? Steigen sie komplett auf PCIe um (vermutlich, bei 64 Lanes) und kann man da bei PGA bleiben oder "müssen" sie auf LGA umsteigen weil sich das besser mit vielen Pins ausgeht? Ich erwarte jetzt von niemandem seine Glaskugel aufzuwärmen aber vielleicht gibts hier Leute, die das gut einschätzen können^^
Wie Oromis gesagt hat, wurde FM3 mal genannt, als LGA-Sockel.
Ich hoffe es stimmt auch, PGA ist jetzt nicht das gelbe vom Ei.

Das liest sich irgendwie merkwürdig. Meinst du sie seien technologisch nicht dazu in der Lage, oder wie genau ist das zu verstehen?
Von der Komplexität.
Bei Intel hängt echt alles an einem gemeinsamen Sheduler der unified reservation station:
http://cdn.arstechnica.net/wp-content/uploads/2013/04/HSW_IMG_3.png

AMD trennt das mehr, indem sie Integer und FP einzeln ansteuern.
Das ist weniger komplex, hat dann aber Nachteile was die Latenz angeht, falls man Daten von einer Domain zur anderen verschiebt.

Aber so einen großen Sheduler wie bei Intel muss man natürlich auch erst einmal hinkriegen, möglichen Port-Konflikten intelligent aus dem Weg gehen, immer auf Stalls aufpassen usw.
Power von IBM hängt glaube ich auch das meiste an einem Sheduler.
Aber ansonsten weiß ich jetzt nicht, wer auch auf so eine Lösung setzt.

Apple setzt bei ihrem ARM-Design auf getrennte Sheduler.

AMD hat sich am Ende entscheiden müssen, was von der Komplexität und dem resultierendem Ergebnis Sinn macht.
Am Ende wie gehabt, getrennte Sheduler.
 
Ah, danke für die Erläuterung. Ich denke allerdings schon, dass sie das schaffen würden, wenn sie das nötige Kapital für diese Entwicklung hätten. Bei AMD ist die Handbremse (fehlendes Investitionskapital) leider sehr fest angezogen.
 
Vermutlich ist es so.
Wie immer gilt Kosten, Zeit und Manpower abzuwägen.
Und wenn alles an einem Sheduler zu komplex wird, dann sagt man lieber, neh, wir machen das wie früher, dann checken wir das durch, müssen nicht soviel R&D darein stecken und uns mit der Validierung befassen.
 
wccftech schrieb:
Zen takes on a more traditional AMD CPU layout resembling that of Phenom and Athlon K series cores.
AMD Zen CPU Core Block Diagram Leaked - Features 512bit AVX And Wider Integer Pipeline

Das hatten sich ja viele AMD Käufer gewünscht, einen Phenom II, mit modernen Befehlssätzen, und besserer Fertigungstechnik.
Zen geht genau in diese Richtung. Auch wenn der Vergleich nicht ganz stimmt.

Es war schon witzig wie der Slide gestern weltweit verteilt wurde. ^^
Schon 2h später als insider2015 das gepostet hatte, gab es den Bericht von wccftech.
 
Update Nr.2:
Neuer Tag, neues Futter:

unit.jpg


Abermals scheinen sich die Gerüchte gegenseitig zu "bestätigen".
So soll jeder Zen Kern über 512 KB L2-Cache verfügen, dabei stellen insgesamt vier Zen Kerne eine Quad-Core-Unit dar, welche sich 8MB L3-Cache teilen.
Zusätzliches wird ein inklusives Cache-Design genannt, für hohe Performance und geringe Latenzen.
Das Design ist an dieser Stelle sehr ähnlich gegenüber dem von Intel, welches seit Nehalem zum Einsatz kommt.
Weniger und exklusiver L2-Cache pro Kern, dafür ein großer geteilter L3-Cache.
Reicht eine Quad-Unit nicht aus, kann man einfach zusätzliche verbauen, somit wird ähnlich skaliert wie bei Jaguar.
Damit das ganze auch gut funktioniert, braucht man natürlichen einen sehr schnellen Interconnect, welcher so als Stichpunkt genannt wird.
Der letzte Stichpunkt dreht sich um die Möglichkeit, flexibel von High-Performance bis zu low-power seine Produkte designen zu können.
 
Zuletzt bearbeitet:
Zurück