News RDNA 5 alias UDNA: Erste handfeste Informationen zu Navi 5X

Ich kann dich beruhigen. Hab gerade nochmal nachgesehen: in der News wird es nicht erwähnt, doch in der Originalquelle steht es klarer: es ist kein Leak von Kepler, sondern nur geraten/geschätzt/angenommen.

Es handelt sich also um keine Informationen sondern um Spekulationen
Danke für die Präzisierung. Oft werden Spekulationen als Leak in den Medien betitelt.
 
Danke für die Präzisierung. Oft werden Spekulationen als Leak in den Medien betitelt.
Der Newsauthor schreibt sogar von "Handfesten Infos", was natürlich falsch ist.

Der Leaker Kepler schreibt ja immer dazu, ob er die Info von jemand anderen (einem Insider) hat. Und in diesem Fall schreibt er sogar dazu, dass er sich das selbst ausgedacht hat.
 
Ach, RDNA 4 ist nicht für größere Shader-Counts ausgelegt? Seltsam, dass AMD in dem Fall ja Navi 41 und Navi 42 in Entwicklung hatte.
Ja aber nicht gebracht, musste einen Grund gehabt haben.
Navi 41 und Navi 42 sind - wenn man nach allen Informationen geht, die so rum flattern - nicht gekommen, weil das Multi-Chip-Konzept nicht vollendens aufgegangen ist und man gewisse Probleme per Software lösen wollte, das aber nicht geklappt hat und man diese Probleme auf Hardware-Ebene lösen muss.
Was nichts an der Richtigkeit meiner Aussage ändert, wärs so einfach hätte man es auch gebracht. Könnte auch sein das es darüber extrem schlecht skaliert hätte. Ist ja nicht so das NV das Problem nicht hat, siehe 4080 -> 4090 und 5080 -> 5090 was je nach Game oft sehr bescheiden skaliert. Man muss so einen fetten Chip auch füttern und auslasten können.
Du darfst nicht vergessen an der Stelle, dass AMD für RDNA 5 / UDNA weitere Verbesserungen für RT umsetzen wird.
Klar und Nvidia schläft
Immerhin bekommen wir bei der RTX 6000 dank TSMC mehr fps pro watt, selbst wenn Nvidia bei der Architektur wieder so eine Nullnummer hinlegt wie schon bei Blackwell.
Neural Rendering und FP4 hast du nicht mitbekommen?
Weil man keinen entsprechenden Chip hatte und vermutlich bei AMD selbst überrascht war, wie "schwach" Blackwell am Ende ist.
Ja so schwach das NV mit heavy RT/PT noch immer deutlich vorn ist, von Software Features nicht zu reden. Und Neural Rendering wird als nächstes kommen wo AMD wieder hinterherliegt. AMD versucht ja gerade mal mit Redstone aufzuschließen.
 
Zuletzt bearbeitet:
Neural Rendering und FP4 hast du nicht mitbekommen?
Ich bin ein einfacher Gamer.
Ich sah die Benchmarks und dachte mir, RTX 5000 ist nicht besser als die Geforce Karten aus dem Jahr 2022 was FPS pro Watt angeht.
Ich nutze eh noch eine 350€ Radeon aus dem Jahr 2020, also hab ich da nicht viel verpasst.
Im Prinzip nur eine Gen wenn man es mit RTX 3000 vs RTX 4000 vergleicht.
RTX 5000 ist für mich keine neue Gen.
Das ist so als ob ich anstatt Intel 13900K einen 14900K kaufe.
Mehr Stromverbrauch, toll. Kann man auch gleich den alten 13900K übertakten.
MFG und so Spielchen sind zwar nett, aber ich kenne niemanden der MFG nutzt.
Die wenigsten nutzen normale Frame gen. Aber niemand den ich kenne nutzt MFG x3 oder x4.
Also hat man keinen echten unterschied zu einer RTX 4000 in der Praxis im Alltag.
Ich muss dazu sagen, meine Bubble ist Star Citizen.
Da haben 99% eine Geforce, und extrem viele eine RTX 5090 oder RTX 4090 (die meisten GPU,s in unserer Gilde)
Star Citizen Spieler nehmen halt meistens die beste Hardware, und das Spiel benötigt diese auch.
 
Ich bin ein einfacher Gamer.
Ich sah die Benchmarks und dachte mir, RTX 5000 ist nicht besser als die Geforce Karten aus dem Jahr 2022 was FPS pro Watt angeht.
Ich nutze eh noch eine 350€ Radeon aus dem Jahr 2020, also hab ich da nicht viel verpasst.
Im Prinzip nur eine Gen wenn man es mit RTX 3000 vs RTX 4000 vergleicht.
RTX 5000 ist für mich keine neue Gen.
Das ist so als ob ich anstatt Intel 13900K einen 14900K kaufe.
Mehr Stromverbrauch, toll. Kann man auch gleich den alten 13900K übertakten.
MFG und so Spielchen sind zwar nett, aber ich kenne niemanden der MFG nutzt.
Die wenigsten nutzen normale Frame gen. Aber niemand den ich kenne nutzt MFG x3 oder x4.
Also hat man keinen echten unterschied zu einer RTX 4000 in der Praxis im Alltag.
Ich muss dazu sagen, meine Bubble ist Star Citizen.
Da haben 99% eine Geforce, und extrem viele eine RTX 5090 oder RTX 4090 (die meisten GPU,s in unserer Gilde)
Star Citizen Spieler nehmen halt meistens die beste Hardware, und das Spiel benötigt diese auch.
Naja zwischen 3000 und 4000 gab's auch einen guten Fertigungssprung, 4000 und 5000 sind quasi gleich. Bei 6000 gibt's wieder einen.

Ist halt wie Turing (2080ti) damals, da gab's auch nur einen kleinen rohen Performance-Sprung, mit dlss und rt wusste man noch nichts anzufangen. Heute kannst aber sogar dlss4 nutzen und so massiv Pixel einsparen. Neural Rendering wird wohl so ähnlich sein.
 
Jap bei Raster alleine sind die highend gpus wie nur kleine katzchen . Sie können nicht wirklich viel .
Und wenn man dann auch noch ohne diese dlss und so zockt dann wird der Abstand noch kleiner . Dann sieht man wie gut die rohleistung wirklich ist . Ich bezeichne diese herunter gerechne als Fake frames . Auch wenn das einige nicht so sehen .für mich sind frames die mit rohleistung wirklich geschaffene sind . Herunter regeln der Auflösung das kann ich selbst auch machen . Ich bin eben der klassische Nutzer . Für mich existiert das was Nvidia Anbietet eben nicht . Das kann also so gut sein wie es will . Man sieht ja das die Latenz drunter leidet . Die Latenz ist für mich sehr wichtig . Darum bleibe ich auch der klassische Nutzer und darum sind die teuren gpus keine Option für mich und würden wohl auch nicht so gut abschneiden wie bei Nvidia sie immer angeblich machen würden .
Aber AMD wird auch noch seine Stärken zeigen . Ich bin zwar mehr ein Nvidia Nutzer aber AMD wenn die sich mehr Mühe geben ,gebe ich gerne auch eine Chance . Nur bei älteren spielen da merkt man schon das AMD hält mehr Probleme als Nvidia hat . Liegt wohl daran das es halt nur eine kleinere Entwickler Gruppe hat . Kommt drauf an wie sehr sich AMD die Mühe macht .
 
Ja aber nicht gebracht, musste einen Grund gehabt haben.
Wenn man sich auch mit der Materie befasst und auch alle Informationshappen mal mit nimmt, dann gibt es genug Indizien, die erklären, warum Navi 41 und Navi 42 nicht gekommen sind und die Gründe dafür habe ich auch benannt.

Genau quasi ein Zitat später:
Navi 41 und Navi 42 sind - wenn man nach allen Informationen geht, die so rum flattern - nicht gekommen, weil das Multi-Chip-Konzept nicht vollendens aufgegangen ist und man gewisse Probleme per Software lösen wollte
Was nichts an der Richtigkeit meiner Aussage ändert, wärs so einfach hätte man es auch gebracht.
Ich wiederhole mich sehr gerne noch mal, dass Navi 41 und Navi 42 nicht gekommen sind, hat nichts mit dem CU-Count zutun. Man muss sich an der Stelle nur damit befassen, wie die Pixel verarbeitet und in Gruppen zusammeng gefasst werden.

Navi 41 und Navi 42 sollten Multi-Chiplett-GPUs werden und hier gab es Skalierungsprobleme, so dass die Chipletts nicht so skalierten, wie sie sollten. Die Probleme wollte man per Softwarelösen, das ging aber nicht, wodurch Hardwarelösungen kommen müssen.

Navi 48 wiederum ist eine Notfalllösung und ein verdoppelter Navi 44 - was an der Stelle sogar relativ einfach ist umzusetzen. Alle andere Lösungen hätten ein umfassenders Redesign erfordert, dass wesentlich länger gedauert hätte.
Ist ja nicht so das NV das Problem nicht hat, siehe 4080 -> 4090 und 5080 -> 5090 was je nach Game oft sehr bescheiden skaliert. Man muss so einen fetten Chip auch füttern und auslasten können.
Und, verstehst du auch, warum die Vega 64 damals - GCN allgemein - Auslastungsprobleme hatte, ebenso warum eine RTX 4090 und RTX 5090 diese Probleme haben und woher diese Probleme kommen, oder stocherst du nur im dunklen, damit du irgendwie recht behalten kannst, statt zu aktzeptieren, dass die Probleme bei Navi 41 und Navi 42 mit sehr hoher Wahrscheinlichkeit nichts mit der Anzahl der Shader zutun hatte, sondern mit dem Chiplett-Ansatz.

Wie gut eine große GPU ausgelastet werden kann hängt von vielen Faktoren ab, darunter die Anzahl der Pixel - Auflösung - als auch die Anzahl der Shader und wie diese geclustert werden könnnen. Eine SM benötigt vier Warps, eine CU benötigt zwei Waves.

RTX 4090 hat 128 SM, die RTX 5090 170 SM, im ganzen also 512 Warps oder 680 Waprs, die zusammen kommen müssen, damit die Karte ausgelastet wird. Bei der RX 9070 XT sind es 128 Waves. Pro Wave/Warp eben bis zu 32/64 Werte. Je weniger CU/SM eine Karte hat, um so einfacher ist sie auszulasten. AD102 und GB202 benötigen also die passende Anzahl an Shader-Programme, sowie die Auflösung, damit genug Warps zusammen kommen. Vor diesem Problem stand AMD - mit GCN und Vega 64 - und hat deswegen die CU umgebaut.

Das sind allerdings allgemeine Probleme, vor denen AMD, Intel und Nvidia stehen und die man nur durch Umorganistation der Rechenwerke lösen kann. AMD ging von Vec16 auf Vec32, Nvidia hat mit Maxwell auf das heutige System mit 4 Tiles a 32 Rechenwerke umgestellt und Intel zu letzt von Vec8 auf Vec16 um die Auslastung zu verbessern.

Für AMD ist es an der Stelle nicht schwerer potenziell eine 96 CU auszulasten wie es für Nvidia mit 96 SM ist, theoretisch ist es für AMD sogar etwas einfacher, da sie weniger Waves benötigen.

AMD hat nur keine 96 CU oder 128 CU dieses mal gebracht, weil die Chips, die diese Anzahl haben sollten, auf Chipletts setzen sollten und damit andere Probleme für die Skalierung hinzu kommen, die mit der Kommunikation innerhalb der Chiplets zutun haben. Bereits bei RDNA hat sich gezeigt, dass die der "interen" Fabric bei einem GCD + MCD-Design ca. 10 % die Latenzen erhöht und dass muss entsprechend aufgefangen werden - mehr Takt im Fabric - wodruch AMD auch hier plötzlich asynchrone Taktraten hatte. Die Shader/CU takten langsamer als der Rest des Chips, damit die Daten entsprechend schnell genug ankommen.

Und genau hier hat es bei RDNA 4 gekracht. Nach den Informationen die umher schwirren, gab es bei RDNA 4 potenziell 3 mögliche aufbauten:

GCD + GCD, wobei jede GCD eine vollwerige GPU gewesen wäre. Verbindung über den L2-Cache.
GCD + GCD + MCD, Verbindung der GCDs erneut über den L2-Cache, MCD mit dem Infinty-Cache.
GCD + MCD, wie bei RDNA 3.

Die Gerüchte gehen aktuell von GCD + GCD aus und da zeigte sich eben, dass GCD + GCD eben nicht so skaliert, wie AMD es erwartet hat. Das liegt an der Stelle aber nicht an dem CU-Count, sondern der Verbindung zwischen den GCDs. Als man das feststellte, wurde versucht die Probleme im Treiber zu lösen, das brachte allerdings nicht den Erfolg, wodurch hier eine Lösung auf Hardware-Ebene her muss. Da sowas sich aber bei RDNA 4 nicht mehr hat umsetzen lassen, wurde der kleinste Navi 44 "verdoppelt" - an der Stelle die einfachste Lösung. Vollständig neue Chips mit nun 80 CU - Navi 21 - oder gar 96 CU Navi 31 - zu entwerfen, hätte deutlich mehr Arbeit gemacht, weil hier ggf. die Menge der Caches und andere Faktoren noch mal hätten angefasst werden müssen und das deutlich länger dauert.

Und dazu kommen halt wirtschaftliche Überlegungen und auch wenn die uns nicht gefallen, die Lösungen die AMD für CDNA nutzt, wären für Consumer-Grafikkarten vermutlich zu teuer, gerade auch mit dem Blick, dass man mit den Mi-Karten deutlich mehr verdient.
Klar und Nvidia schläft
Nur das es für AMD und Intel an der Stelle deutlich einfacher ist aufzuholen, vielleicht sogar zu überholen, als es für Nvidia ist vorne zu bleiben. Die "relevanten" Hauptfähigkeiten bei RT brachte Nvidia mit Ada Lovelace. SER und die OMM. Beides sind nun Funktionen, die in der Shader Language 6.9 sowie damit DX 1.2 Einzug halten und damit Funktionen, die AMD und Intel "adaptieren" können.

Blackwell brachte für RT zwar neue Funktionen, nur werden viele diese Funktionen auch bereits ab Turing unterstützt. Blackwell enthält dann spezifische Anpassungen für diese Funktionen, die es effizienter machen, doch gibt es die Funktionen auch bei Ada Lovelace.

Dazu kommt, dass Turing, Ampere und Ada Lovelace etwas konnten, was Blackwell nun nicht mehr kann: FP und INT-Berechnungen zur gleichen Zeit. Blackwell kann - wie Maxwell und Pascall davor - nur FP oder Int.
Naja zwischen 3000 und 4000 gab's auch einen guten Fertigungssprung, 4000 und 5000 sind quasi gleich. Bei 6000 gibt's wieder einen.
Ja und? Selbst ohne Fertigungssprung hat Nvidia bereits zweimal geziegt, dass man sowohl die Rechenleistung als auch die Effizienz steigern kann.

Kepler und Maxwell wurden beide in der selben Fertigung bei TSMC bezogen, dennoch ist Maxwell deutlich effizienter unter Leistungsfähiger als Kepler und hatte damals sogar Verkleinerung der Chips mit gebracht. Hier hat Nvidia die Struktur der SMX zu den SM angepasst und damit Effizienz und Leistung gewonnen.
Ist halt wie Turing (2080ti) damals, da gab's auch nur einen kleinen rohen Performance-Sprung, mit dlss und rt wusste man noch nichts anzufangen.
Und dennoch hat auch hier Nvidia erneut gezeigt, dass man die Chips effizienter bekommt als die der Vorgänger, obwohl man bei der gleichen Fertigung bleibt. Die RTX 2080 Ti war knapp 10 - 15 % effizienter als die 1080 und fast 20 % als die 1080 Ti. Es war also möglich.

Und auch AMD zeigt mit RDNA 2 - N7 - und ebenso nun, dass es durchaus geht.
 
Da mache ich mir weniger sorgen.
RTX 4090 war ja wie Dr.Brown (dein Vorposter) bereits sagte nur 27% schneller im Raster als RX7900XTX.

Verbrauch der RTX 4090 war mit 450W aber über 27% höher als der Verbrauch der RX7900XTX mit 350W als Basiswert.
350 / 100 x 27 = 94W
Nur das die 4090 halt selten am TDP Limit kratzt und die XTX halt fast immer, du kannst nicht einfach die theoretischen TDP LImits nehmen wenn die Chips in Wahrheit weniger verbrauchen.
AMD hat nur keine 96 CU oder 128 CU dieses mal gebracht, weil die Chips, die diese Anzahl haben sollten, auf Chipletts setzen sollten und damit andere Probleme für die Skalierung hinzu kommen, die mit der Kommunikation innerhalb der Chiplets zutun haben.
Nachdem Chiplet also bei RDNA3 gefailed ist hat man es nochmals versucht und ist nochmals gefailed? Hätte zudem noch von keinem prototypen gehört, bei nvidia taucht da auch immer alles mögliche auf. Da hätte man parallel ja noch einen 96cu monolithen entwickeln können. Hört sich einfach nach Ausrede an hier.
 
Zuletzt bearbeitet:
Zurück