Mir ist dazu auch noch nichts untergekommen, aber der Druck ist derzeit auch vergleichsweise gering, da das "Ausgereizt" relativ ist und sich primär auf nVidia bezieht (AMD steht Micron's OC-GDDR6 derzeit vermutlich noch nicht zur Verfügung, weil nVidia vermutlich alle produzierten Mengen aufkauft *):
a) Standard-GDDR6 geht bis 18 Gbps.
b) Micron bietet seine OC-Module bis 21 Gbps an, wie gesagt, nVidia nutzt das nicht ganz aus (läuft am oberen Limit vielleicht auch derzeit noch nicht so stabil oder produziert zu viel Abwärme).
c) Micron hat jedoch eine Weiterentwickung seiner OC-PAM4-Entwicklung schon Ende 2020 erklärt, d. h. man kann mit Optimierungen rechnen, EUV wäre eine Möglichkeit, und vielleicht kommen ja gar noch ein paar Gbps dazu in 2022? Zudem dürften in 2022 auch standardmäßig 16 Gb-BGAs zu Verfügung stehen.
d) Darüber hinaus wird natürlich ab einem gewissen Grade HBM2/3 auch kostentechnisch interessant, weil sich dann Mehrkosten und die technischen Vorteil wie Waage halten werden. Ein Punkt bei HBM ist natürlch auch immer die Verfügbarkeit, denn man muss berücksichtigen, dass Consumer-Produkte HighVolumeProdukte darstellen, d. h. da müsste man schon feste Zusagen seitens der Hersteller vorvereinbaren um nicht in Probleme zu laufen und die müssten vermutlich ihre Kapazitäten erhöhen (wiederum Kosten
)
*) Und da AMD derzeit die Schiene fährt Standard-GDDR6 + Cache, hat Micron hier auch keine Veranlassung seine Kapazitäten zu erhöhen, sondern wird sich weitestgehend auf die zugesagten Abnahmemengen von nVidia hin ausrichten.
Es wird auf jeden Fall interessant zu sehen sein, ob es auch in 2022 keine HBM-Designs geben wird, insbesondere bei den HigEnd-Chips, die beide Hersteller ja auch für professionelle Produkte mitverwenden werden. Ein paralleles Speichersubsystem in einem Chip wird sicherlich keiner implementieren, weil das pauschal Wafer-Fläche verschwendet. Wollte man GDDR6 und HBM2 nutztn, bräuchte man also zwei Chipdesigns. Bei AMD könnte das u. a. einfacher sein mit RDNA3, das angeblich einen separaten IOD nutzen soll, d. h. wenn der Speicher direkt am IOD hinge (und der nicht nur PCIe anbindet), könnte man zwei IODs designen, einen für GDDR6 und einen für HBM2 und die GPU-Tiles unverändert weiterverwenden.
Jedoch gibt es zwei Probleme bei der auf den ersten Blick eleganten Überlegung:
a) Die GPU-Tiles sind darauf ausgelegt mit der geringen GDDR6-Bandbreite auszukommen und haben deshalb große L3$ on-die. Die wären beim HBM-Design aber überflüssig und würden unnötig Wafer-Fläche verschwenden. Im worst case wäre die zusätzliche Cache-Stufe bei einem derart schnellen Speicher gar kontraproduktiv?
b) AMD hat grundsätzlich ein viel kleineres Umsatzvolumen bei seinen Profikarten, d. h. die zusätzlichen Aufwedungen fallen hier bei AMD für ein zusätzliches Design deutlich schwerer ins Gewicht.
Es gab jedoch auch mittlerweile Gerüchte im Äther, die behaupteten, dass bei RDNA3 der L3$ als separates Die am IOD hängt und damit optional und bspw. größentechnisch variabel wäre. Ob AMD bereits für 2022 ein derart fexibles und damit aber auch komplexes und teuer zusammengesetztes Design vorsieht ... wer weiß? Aktuell schwirren, wie zu RDNA2-Zeiten, noch sehr viel teils gegensätzliche Gerüchte durch den Äther und davon werden sich zwangsweise entliche als falsch erweisen ...
Darüber hianus gehe ich aber auch davon aus, dass man bei den großen Dreien sicherlich auch an etwas forschen wird, das später mal etwas wie GDDR7 werden könnte und das recht triviale Ziel haben wird wie etwas mehr Leistung als die Vorgeneration zu bieten, vielleicht auch effizienter sein wird, aber weiterhin implementationstechnisch günstiger zu sein als Stacked-DRAM wie bspw. HBM2/3. Der Vorteil von GDDR bleibt nun einmal die designtechnische Flexibilität. HBM muss mit dem Chip auf einem Interposer zusammenkonfiguriert werden und damit hat man ein weitaus teueres Design, das man bei Bedarf nicht mal eben in den unteren Marktsegmenten für weniger Geld vertreiben kann, weil die Kosten des gesamten Packages konstant bleiben. Bei separatem Speicher kann man hier zumindest noch am Speicher den Rotstift ansetzen und das Produkt runterstrippen und kleinere Chips verwenden oder gar auch grundsätzlich weniger Chips (und damit implizit ein schmaleres SI). Entsprechend würde ich davon ausgehen, dass aus kostengründen auch irgendwann noch tatsächlich etwas wie GDDR7 kommen wird.
a) Standard-GDDR6 geht bis 18 Gbps.
b) Micron bietet seine OC-Module bis 21 Gbps an, wie gesagt, nVidia nutzt das nicht ganz aus (läuft am oberen Limit vielleicht auch derzeit noch nicht so stabil oder produziert zu viel Abwärme).
c) Micron hat jedoch eine Weiterentwickung seiner OC-PAM4-Entwicklung schon Ende 2020 erklärt, d. h. man kann mit Optimierungen rechnen, EUV wäre eine Möglichkeit, und vielleicht kommen ja gar noch ein paar Gbps dazu in 2022? Zudem dürften in 2022 auch standardmäßig 16 Gb-BGAs zu Verfügung stehen.
d) Darüber hinaus wird natürlich ab einem gewissen Grade HBM2/3 auch kostentechnisch interessant, weil sich dann Mehrkosten und die technischen Vorteil wie Waage halten werden. Ein Punkt bei HBM ist natürlch auch immer die Verfügbarkeit, denn man muss berücksichtigen, dass Consumer-Produkte HighVolumeProdukte darstellen, d. h. da müsste man schon feste Zusagen seitens der Hersteller vorvereinbaren um nicht in Probleme zu laufen und die müssten vermutlich ihre Kapazitäten erhöhen (wiederum Kosten
)*) Und da AMD derzeit die Schiene fährt Standard-GDDR6 + Cache, hat Micron hier auch keine Veranlassung seine Kapazitäten zu erhöhen, sondern wird sich weitestgehend auf die zugesagten Abnahmemengen von nVidia hin ausrichten.
Es wird auf jeden Fall interessant zu sehen sein, ob es auch in 2022 keine HBM-Designs geben wird, insbesondere bei den HigEnd-Chips, die beide Hersteller ja auch für professionelle Produkte mitverwenden werden. Ein paralleles Speichersubsystem in einem Chip wird sicherlich keiner implementieren, weil das pauschal Wafer-Fläche verschwendet. Wollte man GDDR6 und HBM2 nutztn, bräuchte man also zwei Chipdesigns. Bei AMD könnte das u. a. einfacher sein mit RDNA3, das angeblich einen separaten IOD nutzen soll, d. h. wenn der Speicher direkt am IOD hinge (und der nicht nur PCIe anbindet), könnte man zwei IODs designen, einen für GDDR6 und einen für HBM2 und die GPU-Tiles unverändert weiterverwenden.
Jedoch gibt es zwei Probleme bei der auf den ersten Blick eleganten Überlegung:
a) Die GPU-Tiles sind darauf ausgelegt mit der geringen GDDR6-Bandbreite auszukommen und haben deshalb große L3$ on-die. Die wären beim HBM-Design aber überflüssig und würden unnötig Wafer-Fläche verschwenden. Im worst case wäre die zusätzliche Cache-Stufe bei einem derart schnellen Speicher gar kontraproduktiv?
b) AMD hat grundsätzlich ein viel kleineres Umsatzvolumen bei seinen Profikarten, d. h. die zusätzlichen Aufwedungen fallen hier bei AMD für ein zusätzliches Design deutlich schwerer ins Gewicht.
Es gab jedoch auch mittlerweile Gerüchte im Äther, die behaupteten, dass bei RDNA3 der L3$ als separates Die am IOD hängt und damit optional und bspw. größentechnisch variabel wäre. Ob AMD bereits für 2022 ein derart fexibles und damit aber auch komplexes und teuer zusammengesetztes Design vorsieht ... wer weiß? Aktuell schwirren, wie zu RDNA2-Zeiten, noch sehr viel teils gegensätzliche Gerüchte durch den Äther und davon werden sich zwangsweise entliche als falsch erweisen ...
Darüber hianus gehe ich aber auch davon aus, dass man bei den großen Dreien sicherlich auch an etwas forschen wird, das später mal etwas wie GDDR7 werden könnte und das recht triviale Ziel haben wird wie etwas mehr Leistung als die Vorgeneration zu bieten, vielleicht auch effizienter sein wird, aber weiterhin implementationstechnisch günstiger zu sein als Stacked-DRAM wie bspw. HBM2/3. Der Vorteil von GDDR bleibt nun einmal die designtechnische Flexibilität. HBM muss mit dem Chip auf einem Interposer zusammenkonfiguriert werden und damit hat man ein weitaus teueres Design, das man bei Bedarf nicht mal eben in den unteren Marktsegmenten für weniger Geld vertreiben kann, weil die Kosten des gesamten Packages konstant bleiben. Bei separatem Speicher kann man hier zumindest noch am Speicher den Rotstift ansetzen und das Produkt runterstrippen und kleinere Chips verwenden oder gar auch grundsätzlich weniger Chips (und damit implizit ein schmaleres SI). Entsprechend würde ich davon ausgehen, dass aus kostengründen auch irgendwann noch tatsächlich etwas wie GDDR7 kommen wird.
Zuletzt bearbeitet:




