AMD Navi 31: 15.360 Shader, aber dank RDNA 3 ohne Compute Units?

PCGH-Redaktion

Kommentar-System
Teammitglied
Jetzt ist Ihre Meinung gefragt zu AMD Navi 31: 15.360 Shader, aber dank RDNA 3 ohne Compute Units?

Die Aussagen mehrerer Leaker sprechen dafür, dass AMDs Navi-31-GPU auf 15.360 Shader setzt und diese in 60 Workgroup Processors zusammenfasst. Die bisher verwendete Aufteilung in Compute Units soll bei RDNA 3 hingegen vollständig entfallen.

Bitte beachten Sie: Der Kommentarbereich wird gemäß der Forenregeln moderiert. Allgemeine Fragen und Kritik zu Online-Artikeln von PC Games Hardware sind im Feedback-Thread zu veröffentlichen und nicht im Kommentarthread zu einer News. Dort werden sie ohne Nachfragen entfernt.

lastpost-right.png
Zurück zum Artikel: AMD Navi 31: 15.360 Shader, aber dank RDNA 3 ohne Compute Units?
 
Bei mir herrscht da Skepsis.
Denn zuerst muß so eine HW auch entsprechend von den Entwicklern berücksichtigt und angesprochen werden.
Leider war es in der Vergangenheit mit proprietärer Technik bei AMD eher schlecht gestellt. Weder wurde die riesige Speicherbandbreite richtig genutzt oder Features wie HBCC sind minimalste Randerscheinungen. Schade.
Aber wenn der Markanteil steigt, wer weiß?
Neue Wege zu begehen ist richtig und wichtig.
Gruß T.
 
"Ob die hier präsentierten Gerüchte zutreffen werden, ist im Moment kaum abzusehen."

Damit ist alles gesagt.
Der User Bondrewd aus dem beyond3d-Forum (von dem vieles kommt) hatte schon bei N21 Monate im Voraus ziemlich viel gewusst, was dann auch am Ende so gekommen ist. Der hat seine glaubwürdigen Quellen.
 
"ist für Navi 31 weiterhin nur ein 256-Bit-Interface vorgesehen."
Halte ich für nicht besonders schlau. In der jetzigen Generation hat es schon ordentlich Performance in höheren Auflösungen gekostet. Da nützen am Ende auch 32 GB VRAM nicht viel wenn das Speicherinterface zu langsam ist.
Interessant und sehr wichtig wird auch die Raytracing Leistung.
 
Letztlich ändert sich nur die interne Aufteilung, die Gesamtzahl der Shader wird nur enorm steigen. Was man nicht an den bsherigen Daten absehen kann., ist RT-Leistung und wieviel Strom eine so große GPU schlucken wird. Wenn sie ähnlich effizient ist, wie RDNA2, würde sie rund 900 Watt benötigen, was eher unwahrscheinlich ist ^^
 
Bei mir herrscht da Skepsis.
Denn zuerst muß so eine HW auch entsprechend von den Entwicklern berücksichtigt und angesprochen werden.
Aus siocher der Software handelt es sich um eine GPU, da muß nichts berücksichtigt werden!
In der jetzigen Generation hat es schon ordentlich Performance in höheren Auflösungen gekostet. Da nützen am Ende auch 32 GB VRAM nicht viel wenn das Speicherinterface zu langsam ist.
Mal abwarten wie sich der viel größere Cache auswirkt, falls es wirklich 512MB werden.
Die Gerüchte gehen aktuell von 256-512MB aus.
 
Also mal davon ausgehend das sich an der Taktung des Speichers nichts ändert , und auch die Art der Übertragung gleich bleibt. Können 256 Bit nur dann ausreichen wenn der l3 cache aka Infinitcache deutlich größer wird um auch bei höheren Auflösungen noch eine Gute Hitrate zu erzeugen.
Der Cache muss shared sein wie bei Ryzen 5000 aka Zen 3, was das an Performance bei Latency Sensitiven Anwendungen geben hat ist einfach zu groß um es zu ignorieren.
 
ist für Navi 31 weiterhin nur ein 256-Bit-Interface vorgesehen."
Halte ich für nicht besonders schlau. In der jetzigen Generation hat es schon ordentlich Performance in höheren Auflösungen gekostet.
Nein, hat es nicht. Der IF$ federt das ganze sehr gut ab.

Davon ab soll dieser mit N31 zudem viermal so groß werden, daher ist ein 256bit SI auch kein Problem. Entscheidend ist auch nicht die Größe des SI, sondern was für eine Hitrate der IF$ hat.
 
Mal abwarten wie sich der viel größere Cache auswirkt, falls es wirklich 512MB werden.
Die Gerüchte gehen aktuell von 256-512MB aus.
Wieso sollte der sich drastisch anders auswirken als jetzt? 512MB sind auch nicht viel.
Nein, hat es nicht. Der IF$ federt das ganze sehr gut ab.
Da sagen aber sämtliche Tests von PCGH und Computerbase etwas Anderes. Ab 4k Auflösung bricht die Leistung verhältnissmäßig drastisch ein.
Davon ab soll dieser mit N31 zudem viermal so groß werden, daher ist ein 256bit SI auch kein Problem. Entscheidend ist auch nicht die Größe des SI, sondern was für eine Hitrate der IF$ hat.
Ich bin da sehr sehr skeptisch das es viel schneller wird. Allerdings wurde ich von AMD in den letzten Jahren öfters ziemlich überrascht. Bin also sehr gespannt.
 
Letztlich ändert sich nur die interne Aufteilung, die Gesamtzahl der Shader wird nur enorm steigen. Was man nicht an den bsherigen Daten absehen kann., ist RT-Leistung und wieviel Strom eine so große GPU schlucken wird. Wenn sie ähnlich effizient ist, wie RDNA2, würde sie rund 900 Watt benötigen, was eher unwahrscheinlich ist ^^
Aha...
Also brauchst RDNA2 jetzt aktuell 450w? In welcher Welt genau?
In Spielen zieht eine 6900Xt ca 270W aus der Dose....

Ich sehe nach deiner Rechnung eher so 500-550W..... wobei das so nicht kommen wird.
Ich denke dass es in Richtung bis zu 400W geht oder aber der Produktionsshrink nochmal echt was bringt.
 
Da sagen aber sämtliche Tests von PCGH und Computerbase etwas Anderes. Ab 4k Auflösung bricht die Leistung verhältnissmäßig drastisch ein.
Ich halte das für eine mutwillig falsche Interpretation!
RDNA2 bekommt in 1080p und 1440p seine Rohleistung wesentlich besser auf die Strasse als Nvidias Ampere, der trotz wesentlich mehr Recheneinheiten hier große Probleme hat.
In 4k bricht bei RDNA2 nichts ein, sondern Ampere kann im Vergleich seine Rohleistung nun wesentlich besser auf die Strasse bringen und seine wesentlich mehr Recheneinheiten und Größe wirken sich nun aus.
Es wurde in zig Reviews bestätigt, das RDNA 2 bei 4K zu 100% ausgelastet ist, die GPU bringt das "physikalisch" Machbare auf die Strasse, muss sich hier aber Ampere geschlagen geben, da wesentlich weniger Recheneinheiten und wesentlich kleiner.
 
Ich halte das für eine mutwillig falsche Interpretation!
RDNA2 bekommt in 1080p und 1440p seine Rohleistung wesentlich besser auf die Strasse als Nvidias Ampere, der trotz wesentlich mehr Recheneinheiten hier große Probleme hat.
In 4k bricht bei RDNA2 nichts ein, sondern Ampere kann im Vergleich seine Rohleistung nun wesentlich besser auf die Strasse bringen und seine wesentlich mehr Recheneinheiten und Größe wirken sich nun aus.
Es wurde in zig Reviews bestätigt, das RDNA 2 bei 4K zu 100% ausgelastet ist, die GPU bringt das "physikalisch" Machbare auf die Strasse, muss sich hier aber Ampere geschlagen geben, da wesentlich weniger Recheneinheiten und wesentlich kleiner.

Genau das zeigen eigentlich alle Tests!
Ampere hat Auslastungsprobleme
 
Ich halte das für eine mutwillig falsche Interpretation!
RDNA2 bekommt in 1080p und 1440p seine Rohleistung wesentlich besser auf die Strasse als Nvidias Ampere, der trotz wesentlich mehr Recheneinheiten hier große Probleme hat.
In 4k bricht bei RDNA2 nichts ein, sondern Ampere kann im Vergleich seine Rohleistung nun wesentlich besser auf die Strasse bringen und seine wesentlich mehr Recheneinheiten und Größe wirken sich nun aus.
Es wurde in zig Reviews bestätigt, das RDNA 2 bei 4K zu 100% ausgelastet ist, die GPU bringt das "physikalisch" Machbare auf die Strasse, muss sich hier aber Ampere geschlagen geben, da wesentlich weniger Recheneinheiten und wesentlich kleiner.
Naja 100% Korrekt ist das nicht. Auch auf den Offiziellen Folien sieht man das bei Höheren Auflösungen die Hitraten des Infinity caches sinkt. Und damit wird die GPU immer Stärker ins Bandbreiten Limit gefahren.
Kannst du auch einfach Testen schnapp dir ein Modernes Spiel und Takte mal unter der 4k Auflösung und Max Textur Details den VRAM hoch du wirst sehen deine FPS steigen. Falls du nicht im CPU limit bist.
 
[RDNA2] Da sagen aber sämtliche Tests von PCGH und Computerbase etwas Anderes. Ab 4k Auflösung bricht die Leistung verhältnissmäßig drastisch ein.
"Drastisch einbrechen" ist dann schon arg übertrieben. Fakt ist aber auch, dass RDNA2 aufgrund des nur 128 MiB große L3$ in 4K tatsächlich schlechter performt. Schaut man sich die Leistungsskalierung in der hohen Auflösung an, dann fällt die Kurve erkennbar ab, jedoch ist auch nichts anderes zu erwarten und selbst AMD erklärt das recht unverblümt, da in 4K (hier wird ja nicht nur der Framebuffer größere sondern alle Buffer und zumeist auch die Texturen) die Hit-Rate des L3$ sich auf gemittelte 57 % reduziert, d. h. hier muss fast jede zweite Speicheranfrage auf den deutlich langsameren GDDR6 durchgereicht werden und das kostet Latenz und Bandbreite und dementsprechend Leistung, sodass die 80 oder 72 CUs hier nicht mehr vollumfänglich ausgelastet werden können.

Entsprechend ist es auch naheliegend, dass AMD an dieser Stellschraube Hand anlegt und den L3$ vergrößert. Wenn der Wert "512 MiB" übrigens zutreffen sollte, kann man gesichert davon ausgehen, dass hier von 2 x 256 MiB die Rede ist, also jeder Chip wird seine eigenen 256 MiB haben, die die Daten redundant vorhalten, d. h. effektiv wird es sich hierbei um einen doppelt so großen L3$ handeln, weil die Redundanz hier aus Performancegründen vermutlich nicht aufgelöst werden kann.
 
Naja 100% Korrekt ist das nicht. Auch auf den Offiziellen Folien sieht man das bei Höheren Auflösungen die Hitraten des Infinity caches sinkt. Und damit wird die GPU immer Stärker ins Bandbreiten Limit gefahren.
Kannst du auch einfach Testen schnapp dir ein Modernes Spiel und Takte mal unter der 4k Auflösung und Max Textur Details den VRAM hoch du wirst sehen deine FPS steigen. Falls du nicht im CPU limit bist.
Dein Test funktioniert doch aber bei den meisten GPUs.
 
Zurück