AMD Radeon RX 7000: Modell mit 16.384 FP32-Shadern?

PCGH-Redaktion

Kommentar-System
Teammitglied
Jetzt ist Ihre Meinung gefragt zu AMD Radeon RX 7000: Modell mit 16.384 FP32-Shadern?

Die Twitter-Gerückteküche erwähnt nun für die Radeon RX 7000 ein Gaming-Modell mit 16.384 FP32-Shader. Das könnte die Karte sein, die zuvor mit 15.360 FP32-Shader die Runde machte und die sich gegen Nvidias Enthusiasten-Karten stemmen soll.

Bitte beachten Sie: Der Kommentarbereich wird gemäß der Forenregeln moderiert. Allgemeine Fragen und Kritik zu Online-Artikeln von PC Games Hardware sind im Feedback-Unterforum zu veröffentlichen und nicht im Kommentarthread zu einer News. Dort werden sie ohne Nachfragen entfernt.

Zurück zum Artikel: AMD Radeon RX 7000: Modell mit 16.384 FP32-Shadern?
 
da AMD aber ein MCM-Design wählt, wären das möglicherweise einfach zwei Chiplets von Navi 32

AMD wählt ein MCM Design?

Ist das jetzt bestätigt?

Mein letzter (Gerüchte-)Stand war der, dass ein Chiplet Design mit mehr als einer GPU für RX7000 explizit nicht zu erwarten sei.

Hat sich das geändert bzw. hatte ich das falsch verstanden?
 
Offiziell bestätigt ist nichts aber dass mindestens für das Highend-Modell MCM zum Einsatz kommt ist einer der sehr sicheren Gerüchteteile.

Bemerke: MCM bedeutet NICHT zwingend "mehrere GPUs", auch eine GPU mit weiteren Speicher-Dies (InfinityCache) ist ein MCM. ;-)
so wie ich es verstanden habe, sind die neuen karten schon mit nem mcm design und kommunizieren übern infinity fabric. jedoch ist es nur ein chiplet zuerst. so wie beim zen 2 8 kerner, ein chiplet + i/o die im package halt. nur mehrere chiplets gibts im profi bereich. im consumer bereich erst nachfolgende generation, soll ja idiotensicher sein und nen massenbenchmark-beta mit 0815 usern wäre too much. :ugly:
 
Die aktuellen Gerüchte, durchaus in unterschiedlichen Varianten, weisen eher daraufhin, dass zwei Compute- bzw. Shader-Tiles zum Einsatz kommen sollen. Hier wird man aber letzten Endes noch abwarten müssen und schlussendlich ist der interne Aufbau auch eher irrelevant sondern am Ende zählt eher wie viele Fps das eine oder andere Design schlussendlich auf den Monitor zaubern kann.
Hier darf man sicherlich gespannt sein wie sich AMDs MCM-Ansatz gegen nVidia's monolithischen Ansatz mit Lovelace schlagen wird und welche Kompromisse welcher Hersteller an welcher Stelle eingegangen sein wird.
 
Doppelte Shader pro Workgroup heißt nicht doppelte Performance in Spielen, etc..

Von dem was ich gelesen habe spricht man ja von 2 GPUs mit je 400mm². Also 20% kleiner als eine RX 6900. Bei Ohne Verdoppelung wären das ~4100 Shader pro GPU. Was ebenfalls 20% weniger wäre als wie bei einer RX6900.
Ohne Shaderverdoppelung hätte eine RX7900 also 60% mehr Shader als eine RX6900, mit 8200 Shader, aber mit 60% mehr Fläche also 800mm². Ist also ein Shaderzuwachs von 0% pro mm².

Als Vergleich nun Nvidia mit der RTX2000 vs RTX3000.
Die Größe wäre 754mm² zu 629mm². Und 4608 zu 5.376 Shader (ohne Verdoppelung).
Nvidia hatte hier einen ~13% kleineren DIE, aber einen Shaderzuwachs von ~17%.

Man sagt ja ein Dieshrink gibt entweder X Performance ODER X Effizienz. Und AMD könnte auf 0% Performacne und 100% Effizenz gehen. Die xxtra Performance kommt dann NUR durch die gesamt größere DIE-Fläche.
Effektiv wäre das z.b. 60% mehr DIE für 60% mehr Performance bei gleichem Verbrauch der RX6900XT.
Wohlgemerkt die Rechnung ist ohne die Verdoppelung der Shader, weil ich nicht weiß wie die sich auf die Performance auswirken ^^.
 
Doppelte Shader pro Workgroup heißt nicht doppelte Performance in Spielen, etc.......
AMD macht es hier wie NVIDIA.
Z.b. eine 6600XT hat 2048/128/64 Shader.
Der Nachfolger hatte jetzt einfach 4096/228/64 Shader, hier wurden einfach die FP32 Einheiten verdoppelt.
Aber die TMUs und ROPs sind unangetastet.

Bei 16384 Shader, hätten wir 512 TMUs, ROPs Je nach dem wie sie es an den 256 Bit Interface anbinden, 128 oder 256 ROPs.

Ich denke Mal das es am Ende so ist
16384/512/128 bei 2,5 GHz haben wir dann:
Pixel Rate:........320.0 GPixel/s
Texture Rate:..1250.0 GTexel/sFP16 (half) performance:...160.00 TFLOPS
FP32 (float) performance:..80.00TFLOPS

doppetle Leistung sieht anders aus.Ausser die Effizienz der TMUs und ROPs steigert sich nochmal.
Womit die theoretischen Leistungswerte näher an der Praxis sind.

Eine ähnliche Änderung der Shader, wie Nvidia es mit der 3000er Serie getan hat, gab es damals bei ATI auch.
X1800XT -> X1900XT
Von 16/16/16 auf 48/16/16
Das brachte zwischen 11-21% mehr Leistung
 
Zurück