AMD Navi 31: 15.360 Shader, aber dank RDNA 3 ohne Compute Units?

Ich kann hier nur einen Groben Richtwert liefern aber meine 3090 benutzt mit Raytracing on Ca 50 Watt mehr wenn DLSS dazu kommt sind es ca 70 Watt mehr. Gemessen habe ich das in Cyberpunk in den Badlands ( wenig Objekte die sich verändern). Ich habe das so gemacht Takt habe ich fixiert auf 1800mhz und Powerlimit ( war offen).
DLSS senkt bei mir den Verbrauch um ~30 Watt. Wieso es bei Dir mehr wird ist mir ein Rätsel, es wird ja intern in kleinerer Auflösung gerendered.

Mich würde an der Stelle interessieren wie der Verbrauch in 4k und RT aussieht. Hier ist Ampere sehr viel schneller und Verbraucht da eine AMD RDNA 2 etwa massiv weniger, als ihre eigentliche TDP, oder verbraucht die Ampere da dann noch mehr?

Ist natürlich für alle RDNA2 und Ampere interessant.
Da ja in RT intensiven Spielen schon eine 3080 an der 6900XT vorbei fliegt.
Wenn das Spiel durch die RT Berechnungen bei den FPS begrenzt wird dann sollte Ampere mehr Watt ziehen da ja mehr RT Leistung vorhanden ist.
 
DLSS senkt bei mir den Verbrauch um ~30 Watt. Wieso es bei Dir mehr wird ist mir ein Rätsel, es wird ja intern in kleinerer Auflösung gerendered.


Wenn das Spiel durch die RT Berechnungen bei den FPS begrenzt wird dann sollte Ampere mehr Watt ziehen da ja mehr RT Leistung vorhanden ist.
Sorry ich editiere das mal war so gemeint mit DLSS 50 Watt Ohne 70Watt.
 
Weil vielleicht nur der Cache dafür zu klein war.

Was an der Größe liegen kann!
Wenn Sie endlich das Speicherinterface verbessern würden, müssten Sie nicht so ein gefrickel mit schnellem Cache und langsamen VRAM machen. Für mich ist das wie ein Notfalllösung weil Sie es nicht anders hinbekommen haben. Also wieder ein Zwischenschritt bis Sie dann bei der nächsten Generation endlich eine schnelle Anbindung haben und das mit dem Cache wieder verschwindet.
Sehr sehr ähnlich zu SSHD's die auch keine Bedeutung mehr haben.
Ich halte das für eine mutwillig falsche Interpretation!
Von mir aus. :schief:
RDNA2 bekommt in 1080p und 1440p seine Rohleistung wesentlich besser auf die Strasse als Nvidias Ampere, der trotz wesentlich mehr Recheneinheiten hier große Probleme hat.
In 4k bricht bei RDNA2 nichts ein, sondern Ampere kann im Vergleich seine Rohleistung nun wesentlich besser auf die Strasse bringen und seine wesentlich mehr Recheneinheiten und Größe wirken sich nun aus.
Es wurde in zig Reviews bestätigt, das RDNA 2 bei 4K zu 100% ausgelastet ist, die GPU bringt das "physikalisch" Machbare auf die Strasse, muss sich hier aber Ampere geschlagen geben, da wesentlich weniger Recheneinheiten und wesentlich kleiner.
Gebe dir mit dem Rest aber vollkommen recht.
 
Wenn Sie endlich das Speicherinterface verbessern würden, müssten Sie nicht so ein gefrickel mit schnellem Cache und langsamen VRAM machen. Für mich ist das wie ein Notfalllösung weil Sie es nicht anders hinbekommen haben.
Man braucht zu dem Thema gar nicht mutmaßen, AMD hat sich dazu öffentlich geäußert. Die Cache Lösung hat sich als optimal herausgestellt.
 
Ich kann hier nur einen Groben Richtwert liefern aber meine 3090 benutzt mit Raytracing on Ca 70 Watt mehr wenn DLSS dazu kommt sind es nur noch 50 Watt mehr. Gemessen habe ich das in Cyberpunk in den Badlands ( wenig Objekte die sich verändern). Ich habe das so gemacht Takt habe ich fixiert auf 1800mhz und Powerlimit ( war offen).
Nein ich meine eine Stock 3090, dürfte ja dennoch nicht mehr als rund 350W aufnehmen.
Wie sieht es dann bei einer 6900XT aus?
Weil hier wurde ja darüber gesprochen das Ampere ineffizienter sei.
Wenn die 3090 also in 4k mit RT (RT Test bei PCGH) 30-40% schneller ist im Schnitt und eine 6900XT in 4k mit RT immer noch an die 300W verbraucht, wäre die 3090 ja bei maximalen Details, bei neuen Spielen (mit RT) ja effizienter.
Man braucht zu dem Thema gar nicht mutmaßen, AMD hat sich dazu öffentlich geäußert. Die Cache Lösung hat sich als optimal herausgestellt.
Auch wenn es sich dabei nur um eine Aussage von AMD handelt, bin ich selbst auch der Meinung das die Rechnung aufgehen kann.
Sofern der Cache groß genug ist. Deswegen bin ich auch der Meinung, das der Cache Ansatz von AMD weit weg ist, von einer Notlösung.
 
Ein Stock 3090 senkt aber den Takt in RT jedenfalls wenn Sie ins Powerlimit läuft was sie unter 4k immer macht. Also meine 3090 ist eigentlich in jedem halbwegs Anspruchsvollen game im Powerlimit mit 350 Watt. Wenn ich das Powerlimit erhöhe steigt Automatisch der Takt und sie hängt wieder im Powerlimit ( das macht die ohne Hand OC bis 460 Watt mit).

Ohne Powerlimit säuft die Karte bei Fixiert Takt in RT halt einfach mal 70 Watt mehr.
 
Zuletzt bearbeitet:
Nein ich meine eine Stock 3090, dürfte ja dennoch nicht mehr als rund 350W aufnehmen.
Wie sieht es dann bei einer 6900XT aus?
Weil hier wurde ja darüber gesprochen das Ampere ineffizienter sei.
Wenn die 3090 also in 4k mit RT (RT Test bei PCGH) 30-40% schneller ist im Schnitt und eine 6900XT in 4k mit RT immer noch an die 300W verbraucht, wäre die 3090 ja bei maximalen Details, bei neuen Spielen (mit RT) ja effizienter.
Im PCGH Effiziensindex ist die 6900XT vor der 3090. Aber natürlich ist diese Ergebnis von den Testbedingungen abhängig.

Auch wenn es sich dabei nur um eine Aussage von AMD handelt, bin ich selbst auch der Meinung das die Rechnung aufgehen kann.
Sofern der Cache groß genug ist. Deswegen bin ich auch der Meinung, das der Cache Ansatz von AMD weit weg ist, von einer Notlösung.
Jede Lösung ist ein Kompromiss, auch bzw. grade ein 512Bit SI wäre einer.
 
Einfache Mathematik ist schon verdammt schwer... Die Gesamtzahl der Shader verdreifacht sich, bei genau gleicher Effizienz wäöre das auch ein 3mal höherer Verbrauch. Bei 300 Watt für eine 6900 XT wären das? Genau: die von mir genannten 900...
Dann geh doch bitte mal die Hardware der Vergangenheit durch und zeig mir auf, wo deine Rechnung auch nur einmal gepasst hätte?!

Seit wann sind die Shader alleine der Punkt an dem sich der Energieverbrauch rechnet?
Mit deiner Argumentation, bzw. einfachen Mathematik.....

Müsste doch ein Ryzen 9 5950x mit 16 Kernen 8x soviel Energie brauchen wie ein Athlon GE200 mit seinen 2 Kernen?

Aber AMD scheint die Mathematik nicht verstanden zu haben, wenn man aus 2Core 35W einfach mal 16 Core 95W macht statt 280W, so wie du es ja gerne hättest..... Seltsam oder?

Unds selbst wenn wir jetzt drauf achten das beide CPUs aus der gleichen Serie mit der gleichen Nanometer Bauweise kommen....
Dann nimm den 2700 non X.... 8 Kerne 65W gegen 2 Kerne und 35W.... wie genau machen die diesen Zauber!
Die einfache Mathematik sagt doch was anderes?

Erst denken dann schreiben! Danke!

Für dich vll noch kurz als Erklärung, auf einer GPU sitzen nicht nur Shader! Das gesamte Board ist so unheimlich Komplex, es gibt überall Einsparpotenzial....
 
Wird halt auch die Frage sein, was man an Speichermenge an das SI ranhängen will.

Bei 256 Bit SI gehen nur 16 oder 32 GiB.
Mit 384 Bit SI wären 24 GiB möglich.
 
Wenn Sie endlich das Speicherinterface verbessern würden, müssten Sie nicht so ein gefrickel mit schnellem Cache und langsamen VRAM machen. Für mich ist das wie ein Notfalllösung weil Sie es nicht anders hinbekommen haben. Also wieder ein Zwischenschritt bis Sie dann bei der nächsten Generation endlich eine schnelle Anbindung haben und das mit dem Cache wieder verschwindet.
Sehr sehr ähnlich zu SSHD's die auch keine Bedeutung mehr haben.
Kann ich nicht wirklich zustimmen. Eine Frickel- oder Notfalllösung wäre behelfsmäßig und würde eher schlecht als gut funktionieren. AMD kränkelte lange an der Speicherbandbreite und wirklich gelöst hatte man es nie. Und was der Cache bringt sieht man heute. Obwohl man im gleichen Node ist hat man die Leistung gesteigert als hätte man diesen gewechselt. Das finde ich durchaus beeindruckend, vor allem wenn man sieht wie es beim Konkurrenten läuft.
Denke auch, dass diese Lösung für die MCM notwendig sein wird ähnlich dem großen L3 bei Zen. Dann hat man gleich zwei Probleme auf einen Schlag gelöst.
 
Im PCGH Effiziensindex ist die 6900XT vor der 3090. Aber natürlich ist diese Ergebnis von den Testbedingungen abhängig.

Jede Lösung ist ein Kompromiss, auch bzw. grade ein 512Bit SI wäre einer.
Natürlich ist die da hinten, da wird doch mein skizziertes Szenario gar nicht betrachtet.
 
Zuletzt bearbeitet:
Warum sich amd für ein cache entschieden hat haben sie klar beantwortet.
Es liegt am teurem SI und die offentsichtlich speicherbandbreite Nachteil weil man kein gddr6x nutzt.
Da gddr7 nicht in Sicht ist und hbm2e so ziemlich das einzige wird was in Zukunft relevant ist.
Wird es auch kein gddr7 geben.
Ein 512bit Si erwarte ich nicht da die Logik zu teuer wäre in 4nm daher sind die 256bit Si schon arg am limit des vertretbaren.
Eine Lösung dahin wär nur ein hbm2e interface mit je 512bit je stack die Lösung.
Nur wird das amd erst mit rdna4 machen. und dann den cache als Sahne Häubchen für niedrigere Auflösungen schrumpfen. bsp wieder auf 128mb je 20wgt Modul.

Oder gar ein Modul auf 30wgt mit 128mb inf cache mit 4096bit hbm2e interconnect
ich kenne den ramtakt von hbm2e nicht aber vermutlich ist der höher als bei hbm2 in vega (radeon 7)
ich nehme mal 2000mhz für hbm2= pro stack 256gb/s
die radeon 7 hatte ein 4096bit si in 8 stacks also je stack 512bit
Die rdna4 gpu sehe ich dann mit einen si mit 8 stacks bei 4096bit je stack also max 512bit
4096*2500/8=1280gb/s +128mb inf cache auf einen 30wgt Modul.
30*256*2*2,4=36,8tf je Modul als n43
gefertigt in 3 oder 4nm ab 2024
Alles über 20tf braucht zwingend mehr als 800gb/s und mit gddr6 ist das nicht zu schaffen außer man vergrößert den SI
Der inf cache löst das nur bedingt bedenkt man das je Verdoppelung der tf Leistung auch das SI sich verdoppeln muss..
Amd hätte noch die Möglichkeit mittels 3dstack die Logik und die alu zu trennen.
das würde die kosten für den teuren 4nm Prozess mittels 7nm fürs I/O deutlich senken.
Dann wären auch 512bit si möglich mit gddr6.
am ende wird es eine Kostenfrage sein.
 
Ich halte das für eine mutwillig falsche Interpretation!
RDNA2 bekommt in 1080p und 1440p seine Rohleistung wesentlich besser auf die Strasse als Nvidias Ampere, der trotz wesentlich mehr Recheneinheiten hier große Probleme hat.
In 4k bricht bei RDNA2 nichts ein, sondern Ampere kann im Vergleich seine Rohleistung nun wesentlich besser auf die Strasse bringen und seine wesentlich mehr Recheneinheiten und Größe wirken sich nun aus.
Es wurde in zig Reviews bestätigt, das RDNA 2 bei 4K zu 100% ausgelastet ist, die GPU bringt das "physikalisch" Machbare auf die Strasse, muss sich hier aber Ampere geschlagen geben, da wesentlich weniger Recheneinheiten und wesentlich kleiner.
da ist nicht falsch interpretiert sondern ein fakt schau dir mal die tests von igor an da wird das auch noch mal ganz genau erklärt warum das so ist.

fakt ist das durch das kleinere speicherinterface die puste in uhd ausgeht.... da nützen auch die 16gb nix....
 
fakt ist das durch das kleinere speicherinterface die puste in uhd ausgeht.... da nützen auch die 16gb nix....
Wo sind deine Belege dafür?
Man kann viel erzählen wenn der Tag lang ist und die 6900XT Liquid Cooling, hier bei PCGH getestet, setzt ihre Takterhöhung und ihren wesentlich höheren Boost, in wesentlich mehr FPS in 4K um, als die normale 6900XT.
Das sieht alles andere als nach einem Bandbreitenproblem aus.
Also liefere die Beweise für deine Behauptungen!
 
Das klingt alles super spannend!

AMD scheint mit mehr Cache näher an den Rechenwerken jedes Problem totschlagen zu wollen. Für Chiplet-Designs dürfte das auch nochmal deutlich mehr bringen – siehe die AMD CPUs. Es hat natürlich schon seinen Grund warum es auch noch einen DDR gibt und nicht Gigabytes an Speicher direkt mit auf den Rechenchip gedruckt werden. Es hängt auch stark von der Anwendung ab ob und in welcher Größe diese Caches viel bringen. In der Regel gibt es aber immer einen gewissen Pool an Daten der mit vergrößerten Caches über L1/L2 hinaus sinnvoll vorgehalten werden kann (insbesondere der Programmcode eben). Würde die Software noch schlauer werden, welche Daten wann in welchem Cache benötigt werden wäre das eine noch bessere Lösung (hat da jemand KI-Training gesagt?). Man könnte also sagen dass AMD für Anwendungen die häufig die gleichen 256-512 MB Daten brauchen eine spezialisierte Lösung baut. Und den meisten GPU-Anwendungen scheint das sehr zu Gute zu kommen.

NVidia hingegen schaut eher auf die Rechenwerke an sich und löst Speicherthemen mit "viel hilf viel". Spezialisierte Einheiten für RT und ML-Rechenaufgaben werden bei nV auch weiter im Fokus sein. Das sind dann auch spezialisierte Lösungen für bestimmte Anwendungen von denen längst nicht jeder profitiert.

Man darf gespannt sein wie sich auch die Anforderungen der Spiele bis dahin entwickeln (Raytracing in Avatar!) und für wen welche Firma dann ein tolles Produkt baut.
Für mich wird es 2022 wohl nochmal nVidia da AMD in absehbarer Zeit keinen breiten Support bzw. bessere Leistung bei Renderengines von 3D-/CGI-Programmen bieten wird. Was hingegen (z.B. auch über Omniverse) an Echtzeit-Raytracing schon möglich ist, ist beeindruckend ("Raytracing is finally there"^^).
 
Das ausgerecchnet von dir? Schon witzig... aber die Diskussion mit dir ist eh sinnlos, daher beende ich das dumme Theater hier an der Stelle, die Mühe dir etwas zu erklären, ist es mir nicht wert...
Er hat aber recht, simples 1 mal 1 funktioniert bei der Rechnung nicht.
 
Er hat aber recht, simples 1 mal 1 funktioniert bei der Rechnung nicht.
Und wer hat hier Simple zusammengerechnet?

Nochmal aufgerollt, weil scheinbar scheint es schwer zu sein, zu lesen (unleserlich) was ich geschrieben habe und was er geschrieben hat.

Er sagte, die Karte wird 900W brauchen, bei dreifacher Anzahl der Shader.
Ich sagte, nein das glaube ich kaum.... Sie wird weniger brauchen, viel weniger....
Und habe das untermauert mit meinem Beispiel der Ryzen CPUs wo ein 2 Kerner mit 35W gegenüber einem 8 Kerner mit 65W aus der gleichen Generation und der identischen Fertigung kommen.

Vierfache "Shader" bzw. Kerne für nicht mal den doppelten Energiebedarf.
Wieso sollte das bei GPU so drastisch anders laufen?

Jetzt erkläre mir bitte im Details, wo er genau Recht behält?

Entweder habe ich was nicht richtig verstanden oder aber du.
 
da ist nicht falsch interpretiert sondern ein fakt schau dir mal die tests von igor an da wird das auch noch mal ganz genau erklärt warum das so ist.

fakt ist das durch das kleinere speicherinterface die puste in uhd ausgeht.... da nützen auch die 16gb nix....

Ich habe jetzt in beide Richtung gehört, " das ist Fakt, weil ..xy..das getestet hat".

Es gab mehrere Tests, mit anscheinend unterschiedlichem Fazit.

Ich möchte ein beginnendes Bandbreitenproblem bei der 6900XT nicht ausschließen, aber es ist eben auch so, das Amper in 1080p Schwierigkeiten hat, die rohen Kräfte auf die Straße zu bekommen.

Ich muss selber gestehen, das ich bis heutemorgen, auch noch dachte, das es Fakt ist, das die 6900XT Bandbreitenprobleme hat.

Gerade der Test der 6900XT LC zeigt in manchen Spielen unterierdische Ergbenisse, gemessen am Taktplus.
Klar sehe ich dafür nur auf die in 4k.

Es gibt Spiele die quasi sehr schlecht skalieren. 15% mehr Speichertransferrate, 5% mehr Takt und dazu 16,7% mehr TDP Budget münden in manchen Spielen in nur 2,5% mehr Fps.

Dafür in anderen Spielen in 4k aber auch wieder in 10+%, was sehr sehr gut ist.

Was sagt mir diese Beobachtung jetzt.

1. Die Karte muss doch Bandbreitenlimitiert sein, wenn die deutlich stärker steigen, als der Kerntakt. Bzw. der Speichertakt einen großen Impact auf die Performance hat.
2. Ist in Spielen in denen das ganze Übertakten extrem wenig bringt, der Cache vielleicht zu klein? Das wird ja extrem Spiel /Engine abhängig sein

Noch eine Frage am Rande, ist der Cache eigentlich an den Coretakt, oder den Speichertakt gekoppelt, oder gar losgelöst von beidem? Kann man den tweaken?
 
Zurück