HBM3-Speicher: Rambus will mehr als ein Terabyte pro Sekunde übertragen

Die Stromaufnahme sagt ja jetzt nichts über die Temperaturen aus. Ist ja auch nur ein Spekulatius.

Der Trend geht momentan aber wieder weg von "Green IT". Mehr Stromaufnahme, mehr Abwärme.

Ein Video von Corsair:
Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.

Dort zeigen sie gegen Ende, daß es auf DDR5 Modulen einen Spannungswandler geben wird und ein Kupferelement zur Kühlung auf der Platine des Speichermoduls. Wird bestimmt gut heiß werden, ansonsten hätten sie es nicht so gestaltet.
 
Zuletzt bearbeitet von einem Moderator:
Auf den bisherigen Serveraccelerators von NV und AMD konnte man auch spielen. Informier du dich lieber mal.


Da ist ein Bildchen vom Blockdiagram. Wieso hat das Teil eine Shaderengine wenn es angeblich nicht Grafikfähig ist?

Womit betreibt Google seine Stadia Plattform?
 
Bloß weil kein Grafikausgang dran ist, heißt das nicht, daß es was völlig anderes ist. Die Stromaufnahme usw. wird anders sein, aber zocken kann man bestimmt damit. Naja ungelegte Eier und so...
Du kennst "Zurück in die Zukunft" und Biff's neckisches Treiben? ;-)
Also noch mal: Bei CDNA hat AMD nahezu fast alle für die 3D-Verarbeitung relevante Funktionalität entfernt. Selbst wenn du dem Design einen Videoausgang zur Verfügung stellen würdest, könnte der Chip nichts damit anfange, da er nicht einmal mehr eine DisplayEngine besitzt und selbst wenn er diese noch hätte, könnte er dennoch keine Grafikausgaben generieren, da er auch dafür keinerlei Funktionalitäten mehr besitzt.
Ich zitieren erneut: "Die MI200 [die CDNA-Architektur] ist ein reiner Rechenbeschleuniger, der auf Fließkomma- und AI-Workloads ausgelegt ist."
Und nein, diese Aussage hat rein gar nichts damit zu tun, dass AMD bisher ihre Consumer-Designs aus Ressourcenmangel für ihre Datacenterprodukte "missbraucht" hat.
CDNA == Rechenbeschleuniger bzw. CDNA != GPU && CDNA != RNDA
 
HBM war für Zocker leider nur Nerdporn. Ich meine es ist extrem beeindruckend gewesen, dass die Fury X 512GB/sec (im CF hatte man dann sein TB) und die Radeon VII sogar 1000GB/sec (wobei ich das TB noch voll gemacht hätte) hatte, aber das nützt nichts, wenn Nvidia teilweise nur die Hälfte gereicht hat.

Naja, wenn Nvidia eins gezeigt hat mit der 3090, dann daß der GDDR eh im sterben liegt.

Eigentlich hat Nvidia HBM, was Gaming betrifft, absolut beerdigt. Die RTX 2080 konnte es mit der Radeon VII aufnehmen, obwohl sie weniger als die Hälfte an Bandbreite hat. Die RTX 3090 steht extrem gut da und sie hat nichtmal ein 512 Bit Interface. AMD hat, mit seinem Unendlichkeitscache gezeigt, dass da noch ordentlich Luft nach oben ist.

Du kommst mir vor, wie der ehemalige irakische Informationsminister, kurz vor dem Fall Bagdads.

HBM ist, abseits des Profibereichs tot und es wird wohl so schnell keine Wiederauferstehung geben.

Wenn du mit dem DDR5 RAM unbedingt deine Bude heizen willst, nur zu.

DDR5 ist wesentlich sparsamer, als DDR4, dank der halbierten Realfrequenz.
 
Wir werden sehen. :rolleyes:
Da gibt es nicht zu sehen, das ist jetzt schon schlichter Fakt, denn diese Änderungen hatte AMD bereits Anfang 2020 für das originale CDNA (Arcturus) erklärt. Und in CDNA2 wird man zweifellos diese Funktionalität nicht wieder nachträglich hinzufügen, sondern tendenziell eher noch mehr wegrationalisieren (wenn man denn könnte), denn man braucht die Siliziumfläche um den marktspezifischen Anforderungen im HPC/AI-Umfeld gerecht zu werden. *)
Die Entwicklungslinien sind komplett separiert worden. Nimm's einfach zur Kenntnis, macht dir das Leben leichter und die Wahrscheinlieichtkeit, dass du hier einem Hoax aufgesessen bist, beträgt in diesem konkreten Kontext 0 %. ;-)

*) Und jetzt braucht man zudem zusätzliche Siliziumfläche für die Chip-zu-Chip-Kommunikation. ;-)

Womit betreibt Google seine Stadia Plattform?
Um dir auch die letzte Frage noch zu beantworten. Google verwendet eine Custom GPU für Stadia. Sieht man sich die geringen TFlops-Werte an (etwa das Äquivalent einer alten Vega 56), darf man vermuten, dass es sich erneut um die Wiederbelebung eines alten Vega-Designs handelt, das vielleicht um Virtualisierungs/Partitionierungsfunktionalität erweitert wurde. Zudem hat der Chip bei Google nur 56 CUs, könnte also tatsächlich eine minimal angepasste Vega 10 sein, die zwecks besserem Yield und geringeren Kosten nur mit 56 CUs vertrieben wird.
Im "Best Case" wäre das hier bei Google ein nochmals runtergestrippter Vega 20, dann aber auch nochmals mit deutlich niedrigerem Takt, denn andernfalls ließe sich die geringe TFlops-Rate nicht erklären. Auch das wäre nicht ausgeschlossen, weil man so eine optimale Resteverwertung der Vega 20-Fertigung hätte erzielen können.
Mit Blick auf Virtualisierung und den Serverbetrieb würde eine Vega 20-Resteverwertung gar noch plausibeler erscheinen, denn da hat man die Funktionalität schon implementiert, sodass der Aufwand für AMD gering ausfällt. Zudem kann man sich das Offenhalten einer separaten Produktionslinie für ein extrem altes Produkt damit ersparen.
 
Zuletzt bearbeitet:
Himmel, es ist eine Sache was nicht zu wissen (und dann im besten Falle einfach mal eine Frage in die Runde zu stellen), aber eine ganz andere, dann nicht einmal Lesen zu können. Bitte noch einmal oben bei mir nachschauen, da steht explizit: "... könnte also tatsächlich eine minimal angepasste Vega 10 seinn ..."
Ich habe also schon längst gesagt, dass das eine Vega 10 sein könnte und jetzt kommst du an uns sagst "ja ABER das ist doch eine Vega 10!". :confused:

AMD hatte zur Zeit der MI25 weder Ressourcen noch Geld für eine serparate Entwicklungslinie und drittverwertete hier lediglich seine ganz normalen Consumer-Chips für profesionelle Lösungen.

Darüber hinaus ist das aber letzten Endes auch ausgeschlossen, dass Google hier eine MI25 verwendet, denn weder die TFlops-Werte noch die CU-Werte kommen hin, denn bei der MI25 wird der Vega 10-Vollausbau verwendet, während Google explizit zu Stadia erklärte, dass sie ein Design mit nur 56 CUs verwenden. Eine MI25 kann es also kategorisch nicht sein. Darüber hinaus, bevor du jetzt mit dem nächsten Unsinn ankommst: eine MI8 oder MI6 kann es auch nicht sein, denn die kleineren Ableger basierten gar nur auf Polaris unf Fiji und kommen nicht auf die TFlops, die Google auswies für Stadia. Das war also ein Schuss in den Ofen von dir.
Wie gesagt, es wird irgendein Vega 10- oder bestenfalls Vega 20-Desing sein und das sogar gesichtert jenseits jeden Zweifels, denn AMD hat überhaupt nichts anderes im Portfolio, mit dem sie das in der Form abbilden könnten (und erst recht noch unter wirtschaftlichen Aspekten). ;-)

Und da beides ganz normale (alte) GPUs sind, kann man mit denen auch spielen, wenn die auf ein entsprechendes PCB verlötet wurden. Mit dem heutigen Ist-Stand hat das jedoch nichts mehr zu tun. Die Instinct-Serie ist seit CDNA (2020) ein reiner Rechenbeschleunige und das nicht, weil ihr kein Videoausgang spendiert wurde, sondern weil die Architektur über keine 3D-Funktionalität mehr verfügt.

google_stadia_mar2019.jpg
 
Zuletzt bearbeitet:
Ich glaube, Google erzählt den Leuten bloß Scheiße! So wie Nvidia auch. Und alle anderen.

Das Marketing enspricht nicht immer der Realität.

Dieses Bild gab mir einst die Hoffnung, das es irgendwo eine Vega 56 mit aktivierter SR/IOV Funktion gibt, leider gibt es sie nicht. Und ohne das kann man kein Gamestreaming realisieren.
 
Zuletzt bearbeitet von einem Moderator:
HBM läuft deutlich kühler als GDDR6X und hat eine höhere Speicherbandbreite > siehe Radeon VII.
Gebracht hat es AMD deshalb so wenig, weil die Entwickler der Spielestudions nicht daraufhin optimiert haben.
Würde man heute es machen und würde noch vernünftig das HBCC implementieren, würden einige moderne Karten sogar gegen eine alte Vega abstinken :stick:Natürlich RT ausgenommen.
Gruß T.
Verkürzt dargestellt: was natürlich aus vielen Gründen völlig falsch ist. Der Grund hinter Vegas schwachem Abschnriden lag an der ineffektiven (Auslastung) und ineffizienten Architektur. Um RAM zu füttern brauchts zuerst mal eine flotte GPU und da war selbst Nvidias wesentlich kleinere 1080 besser
Wie RDNA2 mit HBM2 funktioniert sehen wir ja demnächst mit der Radeon MI200. Ich finde 90 bis über 100 Grad auf dem Speicher jedenfalls kritisch. Und die 60 Grad, die der DDR5 RAM haben soll, ebenso.

Bei sommerlichen Temperaturen zocken wird dann schnell zur Sauna.
Temperaturen am Hotspot und Verbrauch sind 2 völlig unterschiedliche Dinge.
Abgesehen davon ist DDR5 effizienter ausgelegt als DDR4
 
Zuletzt bearbeitet:
Trotzdem lutscht RNDA2 mehr Saft als alle vorherigen. Effizienzsteigerung sagt nichts über den Realverbrauch und überhaupt nix über die Temperaturen aus. Denn der ist kräftig nach oben gegangen. Genauso wie die Temperaturen. Bei den Temperaturen war schon die RDNA1 Generation nicht so prickelnd.

HBM ist dem GDDR klar überlegen. Fehlt nur noch, daß Micron mit einsteigt und schon hätten wir auch günstigere Preise und eine weitere Verbreitung. Leider läuft das so mit allem geilen Scheiß, zuerst werden die Kunden mit den tiefen Taschen bedient und das sind nunmal nicht die Gamer.
 
Zuletzt bearbeitet von einem Moderator:
Damit HBM seinen Vorteil ausspielen muss ist es zuerst nötig, dass die Anbindung zwischen RAM und Chip der größte Flaschenhals ist. Derzeit sehen wir kaum einen Unterschied zwischen einer 3080Ti mit 1GB Chips und einer 3090 mit 2GB Chips. Wäre die Bandbreite zwischen Chip und RAM wirklich so ein Hindernis, dann würden wir auch einen stärkeren Leistungseinbruch sehen, wenn wir das Verhältnis zwischen Bandbreite und Speichermenge um den Faktor zwei kippen.

Was wir anstattdessen sehen, ist dass die Cache Größen auf dem Chip selber verändert und vergrößert werden. Hier scheint aktuell viel eher der Flaschenhals zu sein und erst wenn der komplett entfernt ist, werden wir sehen, dass der Chip mit schnellerem RAM wieder direkter skaliert.

Wer sich ein aktuelles Laptop Mainboard ansieht, der sieht noch die klare Trennung zwischen CPU, GPU und einem Blob verlötetem RAM. Manchmal gibt es dazu einen RAM Steckplatz, aber das muss nicht mehr der Fall sein, das Laptop Mainboard ist dann nur ein Streifen mit allem verlötet und nur die M.2 ist gesteckt.

In dem Laptop Marktsegment entwickelt sich Apple weiter und weiter hin zur "ein Chip Lösung" CPU, GPU und RAM in einem Guss. Das ist auch die Richtung die AMD und Intel für ihre Laptops einschlagen werden. Das war auch in Gerüchten immer das was Sony für die PS5 schon geplant hatte, aber das war etwas zu ambitioniert. Letztlich ist es für eine Konsole am TDP Limit immer besser die Komponenten etwas breiter zu streuen. Am Laptop ist das nur sehr bedingt der Fall und ich denke hier wird HBM auch wirklich zuhause sein.
 
Ich glaube, Google erzählt den Leuten bloß *********************! So wie Nvidia auch. Und alle anderen.

Das Marketing enspricht nicht immer der Realität.

Dieses Bild gab mir einst die Hoffnung, das es irgendwo eine Vega 56 mit aktivierter SR/IOV Funktion gibt, leider gibt es sie nicht. Und ohne das kann man kein Gamestreaming realisieren.
Jetzt soll Google selbst nicht wissen, was die verbauen, aber du weißt genau was Google in seinen Rechenzentren installiert? Na du bist ja witzig ...
Und dir kann man echt nur immer wieder erneut den Rat geben: erst (ein)lesen, dann tippen.
Vega 10 unterstützt grundsätzlich SR-IOV (Single-root input/output virtualization). Das ist ein grundsätzliches Designfeature der Architektur. Dass AMD das in den Consumer-Produkten deaktiviert hat, liegt schlicht daran, dass man mit derartigen Features zusätzliches Geld verdienen will. Die Instinct MI25 basiert auf diesem Vega 10-Design (ja unglaublich, der selbe Chip, den Consumer quasi für n' Appel und n' Ei als Vega 64 kauften) und AMD wirbt hier bei der MI25 grundsätzlich mit dieser Funktionalität. Und noch mal ... Google verarbeitet hier ein Semi-Custom-Design, d. h. AMD kann sich das Dingen zusammenschrauben wie sie wollen und das Feature-Set entsprechend aktiviert belassen oder teildeaktivieren. Und dass es nichts von der Stange sein, kann, was Google da verbaut, ist ebenso offensichtlich, denn die Eckdaten der MI25 passen überhaupt nicht auf das was Google da laut eigener Aussage verwendet.

Und im nächsten Post auch gleich prompt die nächste schräge Aussage: "[HBM] Fehlt nur noch, daß Micron mit einsteigt". Micron fertigt HBM2E schon seit 2Q20, also schon über ein Jahr ... ;-)
 
Zurück