AMD Milan-X angeblich mit X3D-Packaging

PCGH-Redaktion

Kommentar-System
Teammitglied
Jetzt ist Ihre Meinung gefragt zu AMD Milan-X angeblich mit X3D-Packaging

Milan-X von AMd soll angeblich mit X3D-Packaging kommen, das bereits vor rund einem Jahr erstmals offiziell erwähnt wurde. AMD kombiniert hier Technologien. um Dies zu kombinieren.

Bitte beachten Sie: Der Kommentarbereich wird gemäß der Forenregeln moderiert. Allgemeine Fragen und Kritik zu Online-Artikeln von PC Games Hardware sind im Feedback-Thread zu veröffentlichen und nicht im Kommentarthread zu einer News. Dort werden sie ohne Nachfragen entfernt.

lastpost-right.png
Zurück zum Artikel: AMD Milan-X angeblich mit X3D-Packaging
 
Na wenn das nicht mal an der Abwärme scheitert.. Da gibt es ja keine Kühlfläche mehr für die gestackten Dies.
Es gibt da ja schon einige brauchbare Ideen. Hier haben wir aber mehrere Chiplets, die wenig Abwärme erzeugen und sich problemlos stapeln ließen und daneben welche, die deutlich heißer werden können und daher nicht gestapelt werden. So bleiben gerade der große IO-Die recht kühl und auch HBM-Speicher wird schon länger erfolgreich gestapelt. Auch an Nanotubes wird schon lange geforscht, die könnten als dünne Zwischenschicht zur Ableitung der Wärme gut genutzt werden, andere Techniken kämen aber auch in Frage...
Ich gehe schon davon aus, dass AMDs Entwickler das Problem gründlich bedacht haben. Genau, wie Intel, die vor den selben Problemen stehen aber vermutlich schon ein wenig weiter sind...^^
 
Ich denke auch, es kommt drauf an, was man stapelt. Gerade Serverprozessoren dürften nicht gerade hohe Hotspot-Temperaturen haben, weil sie nicht so hoch takten wie die Geschwister aus dem Desktop.

Ein möglicher Stapel:

-IHS
-schnelle, hochtaktende Kerne
-langsame, kleine Kerne
-HBM-Cache
-IO-DIE
-Interposter
 
Dieses Gerücht ist auch insofern interessant, als dass dafür das InfinityFabric bzw. die Vermeer-DIEs deutlich flexibler sein müssten, als bislang bekannt. Anscheinend sollen ja die gleichen DIEs weiterverwendet werden, was nach einem großen Schritt klingt.
Also zumindest persönlich hielt ich die Bezeichnung InfinityFabric bislang mehr für Marketing als tatsächliche für substanzielle Technologie...
 
Das was hier als X3D angekündigt wird, drüfte im Wesentlichen einem leicht modifizierten Milan mit HBM2-Speicher entsprechen. Die Kernzahl wird nach bisherigem Vernehmen unverändert bleiben, entsprechend werden hier keine Chiplets gestapelt. Das einzige, was denkbar wäre ist, dass man das I/O-Die vergrößert und obendrauf einige Chiplets packt, damit das gesamte CPU-Package nicht zu groß wird. Letzten Endes wäre aber auch das nicht trivial, da man dafür theoretisch auch schon komplett neu entwicklete Chiplets bräuchte, denn die von unten kommende zusätzliche Abwärme des IOD würde ansonsten das Verhalten der CCDs obendrauf deutlich verändern.
Auf jeden Fall eine interesssante Entwicklung, die sich schon von langer Hand angekündigt hat, da man hier mit Bezug auf Supercomputer von "HPC/AI-optimierten Milan's" sprach, d. h. damit konnten nicht die Milans von der Stange gemeint sein. Und von Sapphire Rapids SP weiß man ja bereits, dass der bis zu 64 GiB HBM2E auf dem Package haben wird.

@bschicht86: Das bleibt ein modifizierter Milan, mehr nicht, daher keine langsamen, kleinen Kerne, etc.
 
Intel ist in der Rubrik führend, ja.

Ich denke auch, es kommt drauf an, was man stapelt. Gerade Serverprozessoren dürften nicht gerade hohe Hotspot-Temperaturen haben, weil sie nicht so hoch takten wie die Geschwister aus dem Desktop.

Ein möglicher Stapel:

-IHS
-schnelle, hochtaktende Kerne
-langsame, kleine Kerne
-HBM-Cache
-IO-DIE
-Interposter

Auf HBM kann man nicht stapeln und kühltechnisch sind weniger Hotspots ein Problem als die Gesamtleistung. In Querrichtung leiten die Siliziumschichten eines Stacks ganz gut und wirken somit als Heatspreader, aber von Schicht zu Schicht sieht es etwas schlechter aus und insgesamt steigt die Verlustleistung pro Fläche eben enorm, wenn man 2-3-4 aktive Schichten übereinander stapelt. Lakefield (IO/Compute/RAM) hat eine sehr niedrige TDP, friert sich aber trotzdem nicht die Füße ab.


Das was hier als X3D angekündigt wird, drüfte im Wesentlichen einem leicht modifizierten Milan mit HBM2-Speicher entsprechen. Die Kernzahl wird nach bisherigem Vernehmen unverändert bleiben, entsprechend werden hier keine Chiplets gestapelt. Das einzige, was denkbar wäre ist, dass man das I/O-Die vergrößert und obendrauf einige Chiplets packt, damit das gesamte CPU-Package nicht zu groß wird. Letzten Endes wäre aber auch das nicht trivial, da man dafür theoretisch auch schon komplett neu entwicklete Chiplets bräuchte, denn die von unten kommende zusätzliche Abwärme des IOD würde ansonsten das Verhalten der CCDs obendrauf deutlich verändern.
Auf jeden Fall eine interesssante Entwiclung, die sich schon von langer hand angekündigt hat, da man hier mit Bezug auf Supercomputer von "HPC/AI-optimierten Milans" sprach, d. h. damit konnten nicht die Milans von der Stange gemeint sein. Und von Sapphire Rapids SP weiß man ja bereits, dass der bis zu 64 GiB HBM2E auf dem Package haben wird.

@bschicht86: Das bleibt ein modifizierter Milan, mehr nicht, daher keine langsamen, kleinen Kerne, etc.

Wenn man den IOD auf eine Gesamtfläche von den Ausmaßen aller Chiplets zuzüglicher aller HBM-Stacks verteilt wäre die Wärmdichte der IOD-Einheiten gering. Zudem sollte man die Leistungsaufnahme des bislang problematischen IF drastisch senken können, wenn man nur noch 1-Millimeter-Links zwischen Silizium-Chips statt 10-Millimeter-Links durch PCBs realisieren muss und ich würde auch erwarten, dass ein derart Cache-lastiges Design mit einem langsameren IMC auskommt. Aber der Chip=Interposer als solcher wäre ein ziemliches Monster und könnte, wenn man die Zahl der Chiplets nicht deutlich reduziert, nicht mehr am Stück belichtet werden. Die gezeigten 4 CCD + 4 HBM sehen mir realistischer aus.
 
Über eine derartige Vergrößerung dachte ich auch kurz nach, habe sie dann aber vorerst verworfen, weil man hierbei extrem viel Leer-Silizium verschwenden müsste, insbesondere wenn man gewzungen wäre zwecks Verwendung der Technologie einen moderneren, kleineren TSMC-Node zu verwenden (ob hier eine Interoperabilität zwischen TSMC und GloFo gegeben ist, ist unklar, tendenziell aber eher weniger wahrscheinlich). Die acht CCDs nehmen aktuell immerhin rd. 600 mm2 Fläche in Anspruch.
Da man das aber nicht ausschließen kann, erwähnte ich das Szenario dennoch als eine Möglichkeit.
Bezüglich der "4 Chips" auf dem Roadmap-Bild würde ich mir vorerst jedoch keine allzu großen Gedanken machen. Die könnten den Aufbau durchaus vorwegnehmen, könnten aber auch lediglich künstlerische Freiheit darstellen.
Folgt man dennoch dem 4er-Aufbau, wäre auch denkbar, dass man den IOD aufteilt und quasi einen 1/4-IOD mit bspw. zwei Speichercontrollern, 32 PCIe-Lanes und einem HBM-Controller implementiert, auf den man dann zwei CCDs oben draufstacken könnte. Und hierbei könnten dann ggf. vier solche Stacks auf einem Package zzgl. HBM2 untergebracht werden. Wäre auch denkbar, würde dann aber weitere Probleme bzgl. der I/O-Latenzen aufwerfen, wobei das nicht heißen muss, dass die unlösbar sind.

Auch denkbar wäre, dass AMD CCD und IOD schlicht reorganisiert und zusammenfasst und in einen gemeinsamen Chip packt, den man dann zu viert auf einem Package bündeln kann. Also das I/O wie oben beschrieben aufgeteilt/verkleinert und dazu 16 Cores und 64 MiB L3, sodass ein solcher Chip quasi gar eine eigenständige kleine CPU darstellen könnte. Der Chip wäre dann planar/monolithisch und das 3D würde sich in dem Falle lediglich auf den HBM beziehen.
Von einem deratigen Ansatz gehe ich bspw. derzeit bei Sapphire Rapids SP aus, also vier 20-Kerner mit eingenem (verkleinertem) I/O, die via EMIB wie ein großer Chip zusammengeschaltet werden (und zusätzlich bis zu 64 GiB HBM2E auf dem Package haben).

Gabs das nicht schon vor Jahren von Intel?
Bin da nicht so tief im Thema, aber sollte doch das gleiche sein?
Mit Lakefield gab es ein erstes Foveros-Design in 2019 und Intel verwendet die Technologie nun für diverse Produkte, so geradezu exzessiv in Verbindung mit Xe-HPC (von Foveros hörte man schon Anfang 2017, EMIB geht bis vor 2010 zurück).
Ob die Technologien jedoch vergleichbar sind und in welchem Rahmen (abseits von dem simplem Umstand, dass hier was "aufeinandergepackt" wird), kann man derzeit nicht so recht sagen, selbst nicht, wenn man annimmt, dass AMDs X3D zumindest in Teilen echtes 3D-Stacking verwendet (was noch nicht gesichert ist).

AMD erwähnte X3D erstmals auf dem Financial Analyst Day 2020, gab jedoch so gut wie keine Details dazu bekannt außer das Roadmap-Bild, das eine 10x höhere Bandbreite skizziert, was aber mit viel HBM2 nachvollziehbar leicht zu realisieren ist und von Intel ja bereits bekanntermaßen in der Art verfolgt wird.
 
Zuletzt bearbeitet:
Auch denkbar wäre, dass AMD CCD und IOD schlicht reorganisiert und zusammenfasst und in einen gemeinsamen Chip packt, den man dann zu viert auf einem Package bündeln kann. Also das I/O wie oben beschrieben aufgeteilt/verkleinert und dazu 16 Cores und 64 MiB L3, sodass ein solcher Chip quasi gar eine eigenständige kleine CPU darstellen könnte. Der Chip wäre dann planar/monolithisch und das 3D würde sich in dem Falle lediglich auf den HBM beziehen.

Wenn man die inhärenten Skalierungsprobleme und Fertigungskosten so einer Lösung in den Griff bekommt, bräuchte man nur noch einen griffigen Namen für so ein Design. Wie wäre es mit "Airship"? :-)

Allerdings ging es hier nicht um die Frage, wie man ein MCM allgemein gestalten könnte, sondern ob eine Chip-on-Chip-Konstruktion mit herkömmlichen CCDs auf IOD denkbar wäre. Und davon sind Vorschläge mit verteilter IO-Infrastruktur meilenweit entfernt, während Designs mit einem IOD nur unter einigen CCDs den Packaging-Aufwand deutlich vergrößern, ohne die generellen Vorteile eines Si-Interposers zu bieten. So wird das also definitiv nichts mit 3D.
 
Zurück