AMD Radeon RDNA3 & MCM Laberthread

200fps in UHD Max inkl RT. So ein Blödsinn :haha:

Da krepelt man mit der 4090 zwischen 60 und 70fps rum.

Edit: Oder ist das ohne RT?
Kann man diese Seite für voll nehmen? Hier Mal PCGH Werte, welche übrigens RT in dem Game "loben".

PS Resultate mit Q-upsampling.
 

Anhänge

  • Screenshot_20230615_110841_Samsung Internet.jpg
    Screenshot_20230615_110841_Samsung Internet.jpg
    459,6 KB · Aufrufe: 73
Zuletzt bearbeitet:
zu F1 23beta gibts wohl auch schon 2x inoffizielle Betatreiber (für die 7600= neuer als für den Rest bzgl. Nr.)
(nen richtigen gameready dann vermutlich erst zum Launch)

btw.
Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.
 
Zuletzt bearbeitet:
zu F1 23beta gibts wohl auch schon 2x inoffizielle Betatreiber (für die 7600= neuer als für den Rest bzgl. Nr.)
Der RX 7600 Treiber ist sogar 50MB größer als der andere ... schon seltsam was die da zur Zeit treiben.
 
Monolithisch is perf technisch natürlich immer besser ^^
Ich glaube das nicht interessant wäre wie eine RTX 4090 mit dem Chip in einem Chiplet Design performen würde.
Ich glaube die RTX 4090 wäre dann noch mal ein gutes Stück schneller.

AMD hat bei der 7900XT und 7900XT einfach das Problem das der GPU Chip generell viel zu klein ist.
Wenn man mal Vergleicht: 6144 Steamprozessoren vs 16384 Einheiten

Und Verglichen mit der 4070TI:
6144 vs 7680 Einheiten

Ich denke das Chiplet Design ist perf. technisch besser nur die Dimension des angebundenen monolitischen GPU Chips in diesem Chiplet Design von AMD ist einfach zu klein gedacht.
Würde man z.B. 12288 Steamprozessoren in das Chiplet Design packen wäre die Performance im Raster wohl über der 4090 und um Raytracing vermutlich quasi auf dem Niveau der 4090.
 
AMD hat bei der 7900XT und 7900XT einfach das Problem das der GPU Chip generell viel zu klein ist.
Wenn man mal Vergleicht: 6144 Steamprozessoren vs 16384 Einheiten

Und Verglichen mit der 4070TI:
6144 vs 7680 Einheiten
Nein, so kannst du das nicht rechnen. Nvidia hat seit Ampere ebenfalls "Dual Issue Shader", es gibt da nur nicht so einen Namen für. Das bedeutet physisch vorhanden sind bei der 4090 "nur" 8192 Shader. Also 33% mehr Shader und das passt doch ganz gut zu den 30% mehr Raster Performance ;)
 
Nein, so kannst du das nicht rechnen. Nvidia hat seit Ampere ebenfalls "Dual Issue Shader", es gibt da nur nicht so einen Namen für. Das bedeutet physisch vorhanden sind bei der 4090 "nur" 8192 Shader. Also 33% mehr Shader und das passt doch ganz gut zu den 30% mehr Raster Performance ;)
Es ist nicht gerechnet sondern geschätzt.

Ich denke nicht das dass Chiplet hier dafür sorgt das es weniger Performance hat.
Sondern lediglich das der Monilitische Chip der im Chiplet integriert ist wirklich zu klein geraten ist bei der 7900XTX.

Und ich denke würde Nvidia ein Chiplet Design um ihre GPU Cores bauen würde auch derren Performance sich noch mal verbessern.
 
Es ist nicht gerechnet sondern geschätzt.

Ich denke nicht das dass Chiplet hier dafür sorgt das es weniger Performance hat.
Sondern lediglich das der Monilitische Chip der im Chiplet integriert ist wirklich zu klein geraten ist bei der 7900XTX.

Und ich denke würde Nvidia ein Chiplet Design um ihre GPU Cores bauen würde auch derren Performance sich noch mal verbessern.
Häh? Es ging mir nur um den Shadervergleich.
 
Ich denke nicht das dass Chiplet hier dafür sorgt das es weniger Performance hat.
Sondern lediglich das der Monilitische Chip der im Chiplet integriert ist wirklich zu klein geraten ist bei der 7900XTX.

Und ich denke würde Nvidia ein Chiplet Design um ihre GPU Cores bauen würde auch derren Performance sich noch mal verbessern.
Per se dürfte der Chiplet Ansatz sogar eher Performance kosten, da die Leitungslänge zunimmt und ggf. weitere Overheads bzgl. der Kommunikation zwischen den Chiplets entstehen. Etwas ausgeglichen wird dies dadurch, dass die einzelnen Chips jeweils deutlich kleiner als ein monolithischer Chip sind und dadurch die Yields besser sind.

AMD hat sogesehen den großen Vorteil diesen wichtigen Schritt nun bereits gegangen zu sein. Nvidia hat dies notgedrungen noch vor sich.

Bzgl. der generellen Leistung und Effizienz von Navi 31 würde ich nicht darauf wetten, dass das überhaupt was mit den Chiplets am Hut hat.

Generell wurden teils merkwürdige Designentscheidungen getroffen:

1. Das GPU Chiplet ist scheinbar auf sehr hohe Taktraten ausgelegt, kann diese aber wegen des absurd hohen Verbrauchs gar nicht ansatzweise in Spielen erreichen. Ein auf die niedrigen Taktraten optimierter Chip hätte vermutlich mehr Leistung pro Takt (siehe z.b. Intels P3 vs P4).

2. Trotz der niedrigen Taktraten profitiert Navi 31 noch ordentlich von mehr VRAM-Takt. Gefühlt auch mehr als dies bei Navi 21 noch der Fall war. Hier hätten sich entweder GDDR6X und/oder ein größerer Infinity-Cache positiv auf die Leistung ausgewirkt.

3. Der Performancegewinn durch die Dual-Issue Einheiten scheint überschaubar zu sein. Hier können wir aber nicht wirklich das Verhältnis aus Die-Fläche und Mehrleistung bewerten. Ich denke aber, dass AMD bei RDNA 4 den Dual-Issue Einheiten mehr Fläche zugestehen wird, damit diese häufiger genutzt werden können.
 
Ich denke auch dass das Chiplet Design eher aus der Not heraus entsteht um überhaupt irgendwie extrem große Chips fertigen zu können. Wenn man einfach nur stumpf die Leistung vergleicht muss der monolithische Chip schneller sein. Der Nachteil ist dann halt die Komplexität in Kombination mit den Kosten.
 
Per se dürfte der Chiplet Ansatz sogar eher Performance kosten, da die Leitungslänge zunimmt und ggf. weitere Overheads bzgl. der Kommunikation zwischen den Chiplets entstehen. Etwas ausgeglichen wird dies dadurch, dass die einzelnen Chips jeweils deutlich kleiner als ein monolithischer Chip sind und dadurch die Yields besser sind.

AMD hat sogesehen den großen Vorteil diesen wichtigen Schritt nun bereits gegangen zu sein. Nvidia hat dies notgedrungen noch vor sich.

Bzgl. der generellen Leistung und Effizienz von Navi 31 würde ich nicht darauf wetten, dass das überhaupt was mit den Chiplets am Hut hat.

Generell wurden teils merkwürdige Designentscheidungen getroffen:

1. Das GPU Chiplet ist scheinbar auf sehr hohe Taktraten ausgelegt, kann diese aber wegen des absurd hohen Verbrauchs gar nicht ansatzweise in Spielen erreichen. Ein auf die niedrigen Taktraten optimierter Chip hätte vermutlich mehr Leistung pro Takt (siehe z.b. Intels P3 vs P4).

2. Trotz der niedrigen Taktraten profitiert Navi 31 noch ordentlich von mehr VRAM-Takt. Gefühlt auch mehr als dies bei Navi 21 noch der Fall war. Hier hätten sich entweder GDDR6X und/oder ein größerer Infinity-Cache positiv auf die Leistung ausgewirkt.

3. Der Performancegewinn durch die Dual-Issue Einheiten scheint überschaubar zu sein. Hier können wir aber nicht wirklich das Verhältnis aus Die-Fläche und Mehrleistung bewerten. Ich denke aber, dass AMD bei RDNA 4 den Dual-Issue Einheiten mehr Fläche zugestehen wird, damit diese häufiger genutzt werden können.
Das AMD generell merkwürdige Designentscheidungen getroffen hat dem stimme ich zu.

Aber gerade Chiplet mit der sehr nahen Cash Anbindung erscheint mir vom generellen Ansatz nicht als Nachteil.
Der Monolithische Chip ist ja quasi immer noch im Chiplet nur wird er nun von deutlich größeren Einheiten unterstützt die deutlich näher am Die liegen als es bei einem rein monolithischen Chip der Fall ist.

Das wäre ein sehr spannender Ansatz wenn exakt der gleiche Core einmal komplett in mono und einmal als Chiplet konstruiert werden würde.
Ich denke auch dass das Chiplet Design eher aus der Not heraus entsteht um überhaupt irgendwie extrem große Chips fertigen zu können. Wenn man einfach nur stumpf die Leistung vergleicht muss der monolithische Chip schneller sein. Der Nachteil ist dann halt die Komplexität in Kombination mit den Kosten.
Problem ist einfach der Zugriff zum Cache der Monolithische muss doch den viel längeren Weg über den VRAM gehen, oder hat wesentlich kleinere eigene Cache Kapazitäten. Bei der massiven Anzahl an Einheiten die so ein Die hat könnte man wirklich an der Konstuktionsgrenze zur Effektivität angelangt sein. Die ganzen Einheiten müssen ja auch untereinander effektiv kommunizieren können.
 
Wieso? Du kannst den Cache doch ohne Probleme in den monolithischen Chip integrieren. Im Grunde macht Nvidia mit ihrem stark aufgebohrten L2 Cache genau das.
Sie haben es als stark aufgebohrten L2 Cache vermarktet allerdings wenn man sich 2080Ti / RTX 3090 / RTX 4090 anguckt ist der Cache in normalem Abstand einfach mitgewachsen ohne das da wirklich eine extreme Steigerung der Cache Größe passiert ist.

Bei der Cache Integration in einem einzelnen Monolithischen Chip wird es denke ich Grenzen in der Größe geben, alleine durch die Bauart da der gesamte Cache exakt auf die gleiche Größe gepackt werden muss wie der Rest des Die.
Das beeinflusst nicht nur die Kosten sondern auch die Größe in meinen Augen.
 
Sie haben es als stark aufgebohrten L2 Cache vermarktet allerdings wenn man sich 2080Ti / RTX 3090 / RTX 4090 anguckt ist der Cache in normalem Abstand einfach mitgewachsen ohne das da wirklich eine extreme Steigerung der Cache Größe passiert ist.
Emm, doch der Cache wurde massiv aufgebohrt:

Die 3090 kommt auf 6MB während die 4090 96MB hat ;)
Bei der Cache Integration in einem einzelnen Monolithischen Chip wird es denke ich Grenzen in der Größe geben,
Exakt das habe ich ja geschrieben. Der Leistungsvorteil kommt dann aber nicht durch das Chiplet Design an sich, sondern weil die Größe überhaupt erst so ermöglicht wird.
 
Emm, doch der Cache wurde massiv aufgebohrt:

Die 3090 kommt auf 6MB während die 4090 96MB hat ;)
Die 4090 hat 72 MB L2$.

Die 4090Ti kriegt vllt die vollen 96MB.

Aber ja, der L2 wurde sehr viel stärker erhöht als alles andere.
 
Zurück