Samsung kündigt HBM2E mit bis zu 538 GB/s an

AW: Samsung kündigt HBM2E mit bis zu 538 GB/s an

Klar ist das technisch möglich, nur eben aktuell vorne und hinten nicht wirtschaftlich.
Nein!

Ser Speichercontroller in der CPU oder am MB müsste das handeln können.
HBM als DIMM geht aber nicht...

Auf dem Intel Core i7-8705G ist das ja umgesetzt
Nein!

man könnte wenn der Speichercontroller das unterstützt auf dem gemeinsamen Interposer der CPU der Speicher direkt bereitstellen.
Warum redest du jetzt von einem Interposer?
Dachte du willst dne HBM am Mainboard per DIMM-Slot unterbringen?
 
AW: Samsung kündigt HBM2E mit bis zu 538 GB/s an

Nein!


HBM als DIMM geht aber nicht...


Nein!


Warum redest du jetzt von einem Interposer?
Dachte du willst dne HBM am Mainboard per DIMM-Slot unterbringen?

Hab ich das gesagt? Auf meinem 8705 sitzt auf nem speziellen Interposer der aus einem organischem Substrat besteht die CPU, eine GPU sowie der HBM Speicher zusammen. Die GPU ist über den Interposer via PCI Express angebunden und über selbigem mit dem HBM Speicher. Technisch wäre es auch kein Problem das die CPU auf den HBM Speicher zugreift, aktuell wäre nur die Anbindung etwas umständlich und vor allem bringt es auch vom Grundsatz her nichts derzeit. Wenn man ohne Verzögerung beides aus dem HBM bedienen könnte und der HBM auch seinen Durchsatz gleichzeitig an die CPU bringen könnte wäre das ne interessante Sache.

Kabylake.jpg
 
AW: Samsung kündigt HBM2E mit bis zu 538 GB/s an

Für die GPU gut und schön, aber jetzt stell dir mal RAM Module im HBM Format vor[...]

Tech_Blogger's knappes "so nicht möglich" ist hier durchaus zutreffend. Hier sprechen diverse Punkte dagegen.

a) Die Speicherbausteine sprechen unterschiedliche Szenarien an und sind dementsprechend mit unterschiedlicher Zielsetzung entwickelt worden. Bei DDR geht es um den Transfer vieler kleiner Datenblöcke mit möglichst geringer Latenz, während GDDR und HBM auf den Transfer großer Datenblöcke mit maximaler Bandbreite ausgelegt sind, wobei hier der Latenz nur eine untergeordnete Rolle zukommt. Hier werden umfangreiche Datenblöcke angefordert und transferiert, so Maps (Texturen, Light, Specular, etc.) und umfangreiche Geometriedaten, während CPUs dagegen viele einzelne, kleine Requests all ihrer unterschiedlichen Threads über den gesamten Hauptspeicher verteilen, sodass hier eine möglichst geringe latenz essentiell ist.
Hinzu kommt, dass bspw. bereits GDDR und DDR ein komplett anderes Interface verwenden und daher nicht direkt austauschbar sind. Beispielsweise kann GDDR pro Clock Cycle lesen und schreiben, während DDR nur lesen oder schreiben kann, was bereits unterschiede auf PHY-Ebene bedingt.

b) Eine Verwendung im Steckformat, wie bspw. ein DIMM-Modul, wäre ein Fiasko. Einmal aufgeschlüsselt:

(1) DDR4 nutzt derzeit 288 Pins auf 13 cm Länge. Bereits die 1024 Bus-Kontakte eines HBM2-Stacks würden in der gleichen Bauform zu einer Länge von 45 cm führen, yeah, ein 1/2 m langes, 3 cm hohes PCB auf dem ein einziger, fingernagelgroßer HBM2-Chip drauf sitzt. :-D
Man könnte jetzt noch annehmen, dass man die Kontaktgrößen (im Wesentlichen die Breite) verkleinert, sodass man vielleicht nur auf die halbe Länge kommt, also grob 23 cm Länge, jedoch dürfte das bzgl. den Toleranzen des Stecksystems, und dem Einbau bereits problematisch werden und wäre möglicherweise nicht mehr endkundentauglich.

(2) Leitungsbahnlängen bei dieser Größenordnung, Signallaufzeiten und Anzahl der Bahnen. Ob die ersten beiden Punkte überhaupt sinnvoll zu lösen wären in dieser makroskopischen Dimension, wage ich nicht einmal abzuschätzen. Der dritte Punkt jedoch würde die Komplexität der Mainboards beträchtlich erhöhen, da sich hier die notwendigen Leiterbahnen vervielfachen und damit bräuchte man deutlich mehr als nur eine zusätzliche Layer im Mainboard-PCB, was die Boards deutlich verteuern und mindestens in die Kateogie Serverboards heben würde, falls nicht noch gar darüber hinaus. (Epyc mit seinen 8 Kanälen kommt gerade mal auf 8 x 64/72 Datenleitungen = 512/576 und hier soll es ja nicht einmal bei einem HBM2-Stack bleiben ;-))

(3) Die 1024 Bit stellen lediglich den Datenbus eines HBM2-Stacks dar. Beispielsweise ein DDR-Kanal arbeitet mit 64 Bit, das DIMM-Modul verwendet jedoch in Summe 288 Kontakte. Beim HBM konnte ich nie die Zahl der ausgeführten Kontakte eruieren, aber es gibt bspw. in diesem Kontext von der JEDEC eine Micro-Pillar Grid Array Definition, die 3982 Micro-Bumps definiert. Schlussendlich kann man hier eine deutlich höhere Zahl an Kontakten annehmen, als nur die 1024!

(4) Jetzt soll es aber nicht nur ein einzelner HBM2-Stack auf einem solchen Speichermodul sein, was nach aktueller Spezifikation auch bestenfalls nur vernachlässigbare 24 GiB wären, sondern es sollen gleich vier Stacks gebündelt werden. Wenn man Punkt (3) ignoriert und bei (1) die gar angenommene halbe Kontaktbreite unterstellt, käme man damit gar auf ein 92 cm langes Modul mit vier winzig kleinen Chips darauf. :-D

So viel zur Überlegungen von einem HBM2-Vierer-Stack auf einem DIMM-ähnlichen Steckmodul.

(c) Dein "weitergesponnenes" Szenario gibt es schon weitestgehend und nennt sich gemeinhin SoC, so bspw. heutzutage in jedermanns Hand in Form eines Mobiltelefons. Das Problem ist jedoch die fest vorgegebene Zusammensetzung der Hardwarekomponenten, die nicht jedermanns Sache ist, weder mit Blick auf Privatpersonen noch mit Blick auf die Industrie, deren Anforderungen noch viel differenzierter sind. Die Modularität der heutigen IT-Hardware kommt nicht von ungefär. (Beispielsweise Intels Lakefield ist ein komplettes SoC im 3D-Packaging mit 4 GiB DRAM oben auf dem Chip.)

(d) Und nein, Intel hat noch nicht gemacht, was du skizzierst. Wenn das eine Anspielung auf Kaby Lake G war, dann ist das nicht zutreffend. In einer vereinfachten Darstellung ist das Design schlicht eine Intel-CPU mit einer über PCIe angeschlossenen Vega-GPU (die genaugenommen gar nicht mal "echt" Vega, sondern Semi-Custom ist und eher auf Polaris basiert).
Verwendet wird hier ein bekannter Kaby Lake Core und auf dem gleichen Package wird mittels 8 PCIe-Lanes die "Vega"-GPU angeschlossen. An der GPU wird zudem mittels EMIB ein einzelner 4 GiB-HBM2-Stack angeschlossen, der ausschließlich der GPU und nicht der CPU zur Verfügung steht.
Vielleicht hast du das mit dem Core i7-5775C aus 2015 verwechselt, der 128 MiB Embedded-DRAM auf dem Package hatte, der tatsächlich als L4-Cache fungierte und von dem Cache-lastige CPU-Tasks beträchtlich profitierten und in kleinerem Rahmen auch die iGPU.

Als Steckmodul und DRAM/DDR-Ersatz kann man sich HBM2 zweifelsfrei abschminken, was schon alleine an dem viel zu breiten Bus scheitert. Vielleicht wird man aber in 18 bis 36 Monaten zumindest auf Servern einen HBM2/3-L4-Cache zu sehen bekommen, wer weiß.
 
AW: Samsung kündigt HBM2E mit bis zu 538 GB/s an

Wie gesagt, ist ja alles richtig was du da sagst. Es gibt da einige Hürden und technisch basiert gibt es dafür keine Plattform. Der generelle Gedanke ist aber eben nicht abwegig, wenn auch Zukunftsmusik.
Als Dimm macht das Null Sinn, das ist klar.
Wenn man den HBM beispielsweise wie auf meinem Bild mittig platzieren würde könnte man zur CPU wie auch zur GPU ein Interface verbauen so das beide auf den Speicher zugreifen könnten.

Das würde wie erwähnt, sehr kompakte Geräte ermöglichen die sehr Leistungsstark sein könnten. Die Kommunikation von CPU und GPU müsste dann aber auch wesentlich schneller sein, PCIEx 5.0 könnte da Abhilfe schaffen.
Denkbar wäre aber auch dass der HBM als Chache für beide fungiert. Technisch aber extrem anspruchsvoll das zu routen, keine Frage.
 
AW: Samsung kündigt HBM2E mit bis zu 538 GB/s an


Wo ein Wille da ein Weg! Selten habe ich so einen Dünnschiss gelesen, wieso und warum dieses und jenes nicht gehen soll. Dann bekommt die CPU anstelle eines DDR RAM Controllers eben einen HBM Controller eingebaut und fertig. Geht bei der GPU ja auch. Geht nicht gibts nicht. Wird nicht gemacht, weil man den DRAM Herstellerpartnern nicht ans Bein pinkeln will und die etablierten Strukturen von "Füllst du mir die Taschen, dann fülle ich dir auch deine" nicht stören will, hätte ich noch akzeptiert. Aber das hier, nä.....

Ja klar, eine HBM Steckkarte ist einen halben Meter lang.... Die Grastüte, die du geraucht hast, war einen halben Meter Lang... xD

Mit HBM geht alles. Da kann man sogar M.2 SSDs dran anschließen und das läuft. Also rede hier keinen gekifften Quark. :)
 
Zuletzt bearbeitet von einem Moderator:
AW: Samsung kündigt HBM2E mit bis zu 538 GB/s an

Wenn man den HBM beispielsweise wie auf meinem Bild mittig platzieren würde könnte man zur CPU wie auch zur GPU ein Interface verbauen so das beide auf den Speicher zugreifen könnten.e.
Das würde so halt nicht wirklich funktionieren;)

Mit HBM geht alles. Da kann man sogar M.2 SSDs dran anschließen und das läuft. Also rede hier keinen gekifften Quark. :)
Mach dich doch nicht immer so lächerlich!
HBM ist als DIMM nicht möglich...
 
AW: Samsung kündigt HBM2E mit bis zu 538 GB/s an

[...]Da [an HBM] kann man sogar M.2 SSDs dran anschließen und das läuft.[...]

Lol, da stellt sich wohl eher die Frage, ob du hier nicht gerade 'ne Grastüte geraucht hast. :-D Abgesehen davon, hast du dir schon mal die Bandbreiten von M.2-Steckkarten angesehen oder weißt du hier gar nicht wovon du redest?
Und darüher hinaus kamst du mit der unsinnige Idee ums Eck, "RAM Module im HBM Format", was eh schon extrem unbeholfen formuliert war, da du offensichtlich HBM-Chips im/auf Ram Modul-Format meintest, denn HBM selbst gibt es nicht modular bzw. steckbar ... und aus gutem Grund.

[...]Dann bekommt die CPU anstelle eines DDR RAM Controllers eben einen HBM Controller[...]

Ja, könnte man wohl machen und wäre für bspw. Intel auch nichts Neues, da sie schon lange HBM2 verwenden, jedoch, wie schon geschrieben, ist HBM nicht auf niedrige Latenzen ausgelegt und abseits dessen scheint die Industrie da vollkommen andere Vorstellung als du zu haben (trotz der steigenden Bandbreitenanforderungen) und hat sich für die Einführung von DDR5 entschieden, das übrigens komplett neue Hardware erforderlich macht *), sodass man, wenn HBM eine sinnvolle Idee/Alternative gewesen wäre, auch gleich dieses hätte nehmen können.

[...]Wird nicht gemacht, weil man den DRAM Herstellerpartnern nicht ans Bein pinkeln will[...]

Lol, noch mehr Gras-induzierte Träumereien? HBM wird hergestellt von Samsung, Micron und SK Hynix. Nun rate mal, wer die weltgrößten DRAM-Hersteller sind? Ein kleiner Tipp: die drei zusammen halten in 3Q19 bereits 94 % am weltweiten DRAM-Revenue. Für die wäre das nur eine interne Verschiebung der Fertigung, die zudem deutlich höhere Margen versprechen würde, weil HBM deutlich aufwendiger zu fertigen ist als einfaches DRAM und warum sollen die, sowie der Rest der Industrie auf möglicherweise einige andere kleine Zulieferer Rücksicht nehmen, wenn HBM tatsächlich der Heilige Gral wäre.

Am Ende gehts schlicht um "für jede Aufgabe das richtige Werkzeug" und einen Nagel schlägst du ja schließlich auch nicht mit einem Schraubenzieher in die Wand ... wobei ich da bei einigen handwerklichen Laien nicht so sicher wäre. ;-)


*) Unter anderem reduziert sich die Spannung, der Prefetch erhöht sich , die Burst-Länge erhöht sich, CRC wird nun für Read und Write und nicht nur letzteres unterstützt und es gibt auch die Möglichkeit On-Chip-ECC-Funktionalität zu implementieren. Zudem verwenden die neuen DIMMs zwar weiterhin 288 Pins, deren Layout weicht aber signifikant von DDR4 ab.
 
AW: Samsung kündigt HBM2E mit bis zu 538 GB/s an

HBM ist als DIMM nicht möglich...
Doch das wäre möglich (HMC) unter Einbuße bestimmter Eigenschaften. Dem entgehen stehen preiswertere Speichertechnologien, HBM ist dafür einfach zu teuer.

HB2E hebt vor allem die Yield und kommt mit einem Überhitzungsschutz, was vermutlich die Taktraten weiter steigen lässt und der Stabilität dienlich ist. Man kann ihn als Dram in einer Größe von bis zu 24GiB gleich neben der CPU auf dem Substrat platzieren. Er kann grundsätzlich als Dram für CPUs und GPUs dienen (je nach Ausführung). Als Dimm ginge ihm die Eigenschaft verloren, besonders sparsam im Phy auszufallen was auch zu Lasten der Übertragungsgeschwindigkeit ginge. Zudem müsste ein Phy entwickelt werden, das diese Leitungsverluste berücksichtig.

Entwickler wie Skhynix würden aufgrund der Kosten eher auf 3D-XPoint setzen.
 
Zuletzt bearbeitet von einem Moderator:
AW: Samsung kündigt HBM2E mit bis zu 538 GB/s an

Was ist denn der Unterschied zwischen HMC und HBM?

Da nichts mehr kommt beantworte ich meine Frage allein.

HMC2 und HBM2 sind 3d Stacked Dram ersterer mit einem eigenen Logiclayer, zweiterer mit einem Deviselayer. HMC2 erreicht bei 4Modulen eine Bandbreite von 480GB/sec, HBM2E jetzt 538GB/s.

AMD und das HMC Konsortium führen beide Speicherarten (Unterschiede gibt es ja kaum) als DRAM für CPUs aus. Das feste verlöten auf Interposern oder Substraten brauchen beide Formen nicht zwingend. Als Dimm sind sie trotzdem zu teuer, würden wenn eher im Bereich HPC Verwendung finden, wobei dort diese Modularität nicht unbedingt gefordert ist und höhere Bandbreite bei weniger Energiebedarf zählt.

Also schreibe bitte nicht, das ginge nicht. HBM ist nichts weiter als 3D Stacked DRAM und unterscheidet sich nur im Bereich seiner speziellen Konnektivität, das ursprüngliche Konzept lässt sich in viele andere Bereiche weiterentwickeln. Was anderes haben weder downsampler noch gurdi gemeint. Das man HBM nicht einfach auf ein DIMM Substrat verlötet, wissen die selbst.
 
AW: Samsung kündigt HBM2E mit bis zu 538 GB/s an

Moin,

ich hab mal durchgewischt.
Wie immer gilt: Wenn ihr Probleme miteinander habt, dann tragt diese bitte nicht öffentlich sondern via PN aus.

Danke! :daumen:

Gruß
Pain
 
AW: Samsung kündigt HBM2E mit bis zu 538 GB/s an

Es sind halt 2 eigene Speicherstandards, die nicht aufeinander basieren.

HBM funktioniert nicht ohne SI-Interposer!
Doch das geht, mit eigenem Base Die. Das HBM auf SI Interposer verlötet wird ist nur eine von vielen Varianten von Stacked-DRAM. Sieh dir das nochmal an. Anderes minimiert nur die Vorteile der sehr kurzen Anbindung und fördert Verluste auf dem Phy, wobei es mehr Strom verbraucht. Gerade das ist ja der Vorteil von HBM. HBM und HMC werden anders geboundet (Stack intern angebunden). Ein SI Interposer ist keine Pflicht, es ist möglich was Skhynix in einer Präsentation damals auch vorstellte. Vor allem, weil ein Interposer von vielen Leitungen durchzogen wird, was sich negativ auf die Stabilität und internen Migrationen auswirken kann.

Die Hersteller hielten es trotzdem für die sinnigste Variante, weil es nicht zu kostenintensiv ist. Der Interposer kostet im Vergleich zu anderen Komponenten fast nix.
 
AW: Samsung kündigt HBM2E mit bis zu 538 GB/s an

OK, HBM könnte man auch direkt auf einer Compute-Die verbauen.

Aber über das normale Package geht es halt defintiv nicht!
 
Zurück