News Unified Memory für Gaming-Ryzen? AMDs CPU-Chef sieht "eine Welt voller Möglichkeiten"

PCGH-Redaktion

Kommentar-System
Teammitglied
AMDs David McAfee lobt Unified Memory als Zukunftsarchitektur - auf die Frage nach konkreten Gaming-Ryzen- oder Desktop-UMA-Produkten folgt statt eines konkreten Plans aber lediglich Optimismus.

Was sagt die PCGH-X-Community zu Unified Memory für Gaming-Ryzen? AMDs CPU-Chef sieht "eine Welt voller Möglichkeiten"

Bitte beachten: Thema dieses Kommentar-Threads ist der Inhalt der Meldung. Kritik und allgemeine Fragen zu Online-Artikeln von PC Games Hardware werden hier gemäß der Forenregeln ohne Nachfrage entfernt, sie sind im Feedback-Thread besser aufgehoben.
 
Also das übersteigt bzw Topt wirklich alles was wir bisher gehabt haben. Ich profitiere eher weniger davon. Ich brauche bessere Latenz. Spannend wird es dennoch sein auch wenn ich weiß das ich nicht die Zielgruppe bin von dem ganzen. Aber auch ich profitiere wenn sich indirekt davon. Damit wird kleinere Speicher menge auf Dauer günstiger werden. Also von daher so schlecht wird es nicht werden.
 
Wenn ich richtig gelesen habe, sollen alle drei Hauptkomponenten auf ein PCB("UMA - dabei handelt es sich um eine Architektur, bei der CPU, GPU und Arbeitsspeicher auf einem einzigen Chip einen gemeinsamen Speicherpool teilen")?
Na supi. Eines davon fällt aus/geht kaputt und dann geht nix mehr?
Alles nur für den heiligen Gral "KI", aber für Normalos völlig deplaziert und reparaturunfreundlich. Upgradepfade? Fehlanzeige. Entweder alles oder nichts.
Gruß T.
 
Eine GPU mit 160 GiB Speicher? Dann kann @PCGH_Raff ja endlich in 32K zocken!
Das zielt in den Abmessungen natürlich erst mal auf KI ab. Aber die APUs in für Gaming realitätsnäheren Austattungen bewähren sich ja auch schon eine ganze Weile. Dadurch, dass der PCIe-Bottleneck wegfällt, kann man den Speicher halt mit voller Geschwindigkeit für alles nutzen. Das ist ja schon ein erheblicher Vorteil.

Da wäre wohl wie in den Konsolen auch GDDR denkbar, um die Lücke in der Bandbreite zu dedizierten Grafikkarten zu schließen, eventuell in Kombination mit 3D-Cache, um die hohen Latenzen für die CPU etwas abzufedern.

Man opfert aber halt, zumindest bis jetzt, die Modularität und Reparierbarkeit. Aber auch starke APUs ließen sich ja gesockelt ausführen und vielleicht taugen CAMMs auch für entsprechend hohe Speichertransferraten.
 
"The future is fusion", hat AMD schon 2008 als Strategie ausgegeben. Leider gab es (soweit ich weiß) nie eine echte unified Architektur. GPU- und CPU-Speicher blieben immer getrennte Speicherbereiche, auch wenn sie sich den selben physischen RAM teilten.

AMD hätte hier Technologieführer sein können. Aber wie man so schön sagt: AMD lässt keine Chance aus, eine Chance auszulassen.
 
Der Käse wird alle paar Jahre wieder hochgekocht. Schon zu AGP-Zeiten sollte die GPU auf den RAM zugreifen, um teuren VRAM einzusparen, während die CPU darauf auch zugriff. Das war maximal lahm. Dann die APU-Phase mit dem Llano sollte billige Notebooks bringen. Für Notbooks mag sowas ausreichend sein, aber es gibt nicht ohne Grund dedizierten VRAM. Selbst für heutige CPUs ist direkter Zugriff auf denn RAM zu lahm. Sonst würden die keine ultraschnellen Caches bis hoch zum X3D-Cache besitzen.
Es ist ganz simpel: Schneller Speicher ist teuer, lahmer Speicher billig. Und da jedes Unternehmen maximal verdienen will, wird IMMER von schnellen Speicher so wenig wie notwendig eingesetzt und der Rest mit lahmen Speicher versehen. Also nix UMA....
 
"The future is fusion", hat AMD schon 2008 als Strategie ausgegeben. Leider gab es (soweit ich weiß) nie eine echte unified Architektur. GPU- und CPU-Speicher blieben immer getrennte Speicherbereiche, auch wenn sie sich den selben physischen RAM teilten.

AMD hätte hier Technologieführer sein können. Aber wie man so schön sagt: AMD lässt keine Chance aus, eine Chance auszulassen.

Eine "unified" Speicherverwaltung war meinem Wissen nach irgendwann 2010-2012 rum möglich. Auf einer physisch getrennten Architektur, wie man sie zwingend braucht wenn CPU und GPU unabhängig steckbar und nicht auf einem Chip zwangegebündelt verlötet werden sollen, ist das aber allenfalls für einige HPC-Anwendungen interessant, bei der Grafik- und Hauptprozessor am gleichen Problem rechnen. Im Spiele-PC dagegen bearbeiten sie primär unterschiedliche Inhalte und müssen relativ wenig Daten untereinander austauschen. Bei jedem einzelnen lokalen Zugriff eine übergreifende Speicherverwaltung zu berücksichtigen, wäre da einfach nur ein Bremsklotz.
 
Das Ganze muss dann aber auch die Vorteile ernten und nicht nur Hardware sparen. Kein starrer VRAM-Carve-out mehr, an dem sich Spiele orientieren, sondern flexibel allokierbare Blöcke aus einem gemeinsamen Pool. Im gleichen Zug dann bitte auch die Möglichkeit, einmal von SoC-Bestandteil A adressierte Bereiche an SoC-Bestandteil B weiterzugeben, ohne sie erst hin- und herzukopieren. Die Hardware kann das längst. Konsolen machen es schon lange vor, Apple am Mac ebenso. Wenn die dedizierte Grafikkarte weiterhin unbezahlbar bleibt, könnte sich das Optimieren auf APUs zusätzlich lohnen. Müsste Windows nur seine Brocken in Reihe bekommen, anstatt das Problem den Treiber-Workarounds der Hersteller zu überlassen. Wenn Microsoft nur wen kennen würde, der genau diese Art den Speicher zu verwalten in seiner Konsole schon einmal implementiert hat… da könnte man richtig was abschauen.
 
Kein starrer VRAM-Carve-out mehr, an dem sich Spiele orientieren, sondern flexibel allokierbare Blöcke aus einem gemeinsamen Pool.
Soweit ich weiß, gelten die einstellbaren Grenzen eher als Untergrenze und ich gerade noch mal nachgeschaut. Ich kann auf meinem Notebook mit 4800H maximal "2G" für den Framebuffer einstellen, konnte aber in einem Spiel laut MangoHUD knapp 8 GB VRAM belegen. Die Grenze scheint also zumindest schon mal verschiebbar zu sein. Solange die Belegung von RAM und VRAM nicht stark schwankt, während der RAM voll ist, sollte das eigentlich zu keinen größeren Problemen führen.
 
Selbst PCIe-Karten können in den normalen Arbeitsspeicher auslagern. Auch die geforderte Übergabe von Speicherinhalten ist meinem Wissen nach schon lange möglich, zumindest wenn der Speicher "flat" verwaltet wird. Aber das ist halt eine Schnapsidee, solange man getrennte Aufgaben und physisch unterschiedliche Speicherinterfaces hat. Letztere sind aber aus Gamer-Sicht äußerst wünschenswert, wenn man die Fps-pro-Euro und die Fps absolut von Strix Halo mit einer RX 9060 vergleicht.
 
Es hat ja einen Grund, warum man auf Grafikkarten kein normalen DDR5 verwendet und ebenso für CPUs keinen GDDR7 nutzt.

Man bräuchte einen neuen Speichertyp, der die geringen Latenzen von normalen DDR bietet, aber gleichzeitig die hohe Bandbreite von GDDR bereitstellen kann.

Dann könnte man darüber nachdenken, statt 32GB Ram + 16GB Vram vielleicht ~40 GB "Uram" zu verwenden.

Da dieser aber deutlich teurer sein wird, sowohl die Speicherchips an sich als auch die physikalische Anbindung/Platinenlayout, wird sich das Preislich sicherlich nicht lohnen.
 
Es hat ja einen Grund, warum man auf Grafikkarten kein normalen DDR5 verwendet und ebenso für CPUs keinen GDDR7 nutzt.
Letzteres passiert doch wie gesagt in Konsolen schon längst. Gut, es ist aktuell maximal GDDR6, aber im Endeffekt geht man doch genau diesen Trade-Off ein und vermutlich so rum, weil CPUs besser mit hohen Latenzen zurechtkommen als GPUs mit niedrigen Transferraten.
Man bräuchte einen neuen Speichertyp, der die geringen Latenzen von normalen DDR bietet, aber gleichzeitig die hohe Bandbreite von GDDR bereitstellen kann.
Ist halt die Frage, ob das überhaupt möglich ist. Vielleicht als HBM-Variante?
Da dieser aber deutlich teurer sein wird, sowohl die Speicherchips an sich als auch die physikalische Anbindung/Platinenlayout, wird sich das Preislich sicherlich nicht lohnen.
Kommt halt drauf an, wie sich die Preise für Speicher und Rechenleistung entwickeln. Auf absehbare Zeit wird man wohl an den meisten Stellen günstigen Speicher stärker bevorzugen.
 
Eine "unified" Speicherverwaltung war meinem Wissen nach irgendwann 2010-2012 rum möglich.
Stimmt. Ds war ich zu streng mit AMD. Seit 2012 gibt es den virtuellen, gemeinsamen Adressraum und seit 2014 (Kaveri, PlayStation 4) "echten" unified memory.

Der Apple M1 war also nicht doch nicht die erste CPU im Konsumentenbereich wie ich vermutet hatte. Apple hat das Konzept "nur" konsequenter umgesetzt und integriert.
 
Man bräuchte einen neuen Speichertyp, der die geringen Latenzen von normalen DDR bietet, aber gleichzeitig die hohe Bandbreite von GDDR bereitstellen kann.
M5 Max benutzt LPDDR5X 9600 MT/s mit 512 Bit Busbreite und kommt so auf 614 GByte/s.
Im Vergleich eine RX 9070 XT hat ca. 640 GByte/s.
Wenn man mit LPDDR5X genug breit geht, kann man auf Geschwindigkeiten von Grafikkarten kommen, aber dann kann man die Module nicht mehr einfach so austauschen.
 
Letzteres passiert doch wie gesagt in Konsolen schon längst. Gut, es ist aktuell maximal GDDR6, aber im Endeffekt geht man doch genau diesen Trade-Off ein und vermutlich so rum, weil CPUs besser mit hohen Latenzen zurechtkommen als GPUs mit niedrigen Transferraten.
Ich denke aber, dass ein "normaler" PC oder eine Workstation bei CPU-Lastigen Aufgaben deutlich von den geringeren Latenzen von normalen DDR5 profitieren würde.
Kommt halt drauf an, wie sich die Preise für Speicher und Rechenleistung entwickeln. Auf absehbare Zeit wird man wohl an den meisten Stellen günstigen Speicher stärker bevorzugen.
Ich würde mal davon ausgehen, dass solche Wollmilchsau-Chips immer teurer sein werden. Es wäre aber halt ein Rechenbeispiel, weil insgesamt ggf. weniger Speicher nötig ist. Aber das ist Glaskugel-Schauen...

M5 Max benutzt LPDDR5X 9600 MT/s mit 512 Bit Busbreite und kommt so auf 614 GByte/s.
Im Vergleich eine RX 9070 XT hat ca. 640 GByte/s.
Wenn man mit LPDDR5X genug breit geht, kann man auf Geschwindigkeiten von Grafikkarten kommen, aber dann kann man die Module nicht mehr einfach so austauschen.
Ich stecke da nicht ganz so tief drin. Aber baut, vereinfacht gesagt, Apple bei einem M5 Max nicht einen Quad Channel aus LPDDR5X? Außerdem hat LPDDR5X noch immer rund doppelt so hohe Latenzen wie normaler DDR5.

Interessant wären da aber die LPCAMM2. Die wäre immerhin aufrüst-/tauschbar.
 
Ich stecke da nicht ganz so tief drin. Aber baut, vereinfacht gesagt, Apple bei einem M5 Max nicht einen Quad Channel aus LPDDR5X? Außerdem hat LPDDR5X noch immer rund doppelt so hohe Latenzen wie normaler DDR5.

Interessant wären da aber die LPCAMM2. Die wäre immerhin aufrüst-/tauschbar.
der M5 Max hat quasi ein Octo-Channel (512 Bit). Strix Halo hat Quad-Channel (256 Bit) wie der M5 Pro. AM5/4 hat Dual Channel -> 128 Bit.

LPCAMM2 ist sicher interessant. Aber du musst dann auch 512 Leitungen von Sockel dahin routen, was schon sehr komplex wird.

Ja die Latenz ist ein wenig höher, vor allem weil die Spannung auch tiefer ist.
 
Ich denke aber, dass ein "normaler" PC oder eine Workstation bei CPU-Lastigen Aufgaben deutlich von den geringeren Latenzen von normalen DDR5 profitieren würde.
Vermutlich. In so einem Fall wäre normaler DDR-RAM vermutlich schon aus Kostengründen eine bessere Wahl.
Ich würde mal davon ausgehen, dass solche Wollmilchsau-Chips immer teurer sein werden. Es wäre aber halt ein Rechenbeispiel, weil insgesamt ggf. weniger Speicher nötig ist. Aber das ist Glaskugel-Schauen...
Ja, davon würde ich auch ausgehen. Wenn Speicher so teuer ist wie jetzt, ist es halt günstiger, möglichst wenig möglichst günstigen Speicher zu nutzen, auch wenn die Recheneinheiten dann suboptimal versorgt sind, als sonst, wenn es günstiger ist, die Recheneinheiten möglichst optimal zu versorgen. Oder man weicht halt auf komplexere PCBs aus und verschaltet paralleler, wie @dudellino sagt.
 
Zurück