AMD Navi 31: 15.360 Shader, aber dank RDNA 3 ohne Compute Units?

Don-71 · 27. Juli 2021

gerX7a schrieb:
"Drastisch einbrechen" ist dann schon arg übertrieben. Fakt ist aber auch, dass RDNA2 aufgrund des nur 128 MiB große L3$ in 4K tatsächlich schlechter performt. Schaut man sich die Leistungsskalierung in der hohen Auflösung an, dann fällt die Kurve erkennbar ab, jedoch ist auch nichts anderes zu erwarten und selbst AMD erklärt das recht unverblümt, da in 4K (hier wird ja nicht nur der Framebuffer größere sondern alle Buffer und zumeist auch die Texturen) die Hit-Rate des L3$ sich auf gemittelte 57 % reduziert, d. h. hier muss fast jede zweite Speicheranfrage auf den deutlich langsameren GDDR6 durchgereicht werden und das kostet Latenz und Bandbreite und dementsprechend Leistung, sodass die 80 oder 72 CUs hier nicht mehr vollumfänglich ausgelastet werden können.

Entsprechend ist es auch naheliegend, dass AMD an dieser Stellschraube Hand anlegt und den L3$ vergrößert. Wenn der Wert "512 MiB" übrigens zutreffen sollte, kann man gesichert davon ausgehen, dass hier von 2 x 256 MiB die Rede ist, also jeder Chip wird seine eigenen 256 MiB haben, die die Daten redundant vorhalten, d. h. effektiv wird es sich hierbei um einen doppelt so großen L3$ handeln, weil die Redundanz hier aus Performancegründen vermutlich nicht aufgelöst werden kann.

Deine Zahlen sind zwar richtig, aber AMD erklärt, dass das System immer noch besser arbeitet als ein klassisches 512 Bit breites Speicherinterface.
Darüber hinaus stellst du hier einfach eine Behauptung auf, (die CUs können in 4K nicht ausgelastet werden) ohne es in irgendeiner Weise zu belegen!

Zitat CB aus ihrem 6800XT Test

Warum der Cache 128 MB groß ist? Mehr Cache ist meistens besser und auch AMD gibt zu, dass ein größerer Cache noch mehr Leistung bieten würde. Doch kostet Cache viel Chipfläche, sodass eine Vergrößerung nicht ohne Weiteres möglich gewesen wäre. Die genutzten 128 MB sollen sich dabei perfekt für Ultra HD eignen, 8K könnte dagegen auch mit einem größeren Cache etwas anfangen. Weil die Auflösung aber vermutlich zu Lebzeiten von Navi 21 kaum bis gar keine Rolle spielen wird und die 128 MB durchaus noch gut, wenn auch eben nicht perfekt mit höheren Auflösungen als 4K zurecht kommen, hat es AMD bei der Größe belassen.

Ghostshield · 27. Juli 2021

Ich glaube daß es sich wie bei Nvidia verhält.
Doppelte FP32 Shader
Also sind es 7680 Shader wie gewohnt mit doppelter FP32 Einheit und somit virtuelle 15360 Shader

gerX7a · 27. Juli 2021

Don-71 schrieb:
Deine Zahlen sind zwar richtig, aber AMD erklärt, dass das System immer noch besser arbeitet als ein klassisches 512 Bit breites Speicherinterface.
Darüber hinaus stellst du hier einfach eine Behauptung auf, (die CUs können in 4K nicht ausgelastet werden) ohne es in irgendeiner Weise zu belegen!

Zitat CB aus ihrem 6800XT Test

Das vermeintliche Problem musst du eher auf deiner Seite suchen (wie so oft), denn die Aussage ist direkt von AMD:

Measurement calculated by AMD engineering, on a Radeon RX 6000 series card with 128 MB AMD Infinity Cache and 256-bit GDDR6. Measuring 4k gaming average AMD Infinity Cache hit rates of 58% across top gaming titles, ...

Und dein zweiter Satz ist mal wieder vollkommen aus dem Kontext gerissen und bestenfalls verzerrend in dieser pauschalen Formulierungsweise.
Aber um dir mal wieder unter die Arme zu greifen: Die Topmodelle mit den hohen CU/Shader-Zahlen und bei dem hohen Takt brauchen natürlichweise eine sehr hohe Speicherbandbreite, denn andernfalls warten die unnötige Taktzyklen auf Daten bevor sie weiterarbeiten können und das ist auch der Grund dafür, warum die Speicherbandbreiten bei GPUs seit Jahren unentwegt zunimmt.
Und genau aus diesem Grund kommt auch keiner auf die Idee ein 2020er-HighEnd-GPU-Modell nur mit einem 256 Bit breiten SI zu kombinieren, denn in dem Falle würden die Recheneinheiten schlicht verhungern.
Und mathematisch offensichtlich Zusammenhänge muss man wohl hoffentlich nicht bei jeder simplen (Re)Zitierung explit erneut "beweisen". Darüber hinaus sind die Messwerte hier eindeutig und AMD erklärte den Sachverhalt, nachdem diese Beobachtungen bei 4K gmacht wurden, ja schließlich nicht zum Spaß.
Eine "mutwillig falsche Interpretation" findet hier wohl eher nicht bei Vertretern der Medien, sondern eher bei dir statt, nennt sich im Fachjargon übrigens Confirmation Bias.

*) Die GTX 1080 Ti kam noch mit 484 GiB/s aus, die RTX 2080 Ti hatte 616 GiB/s und die RTX 3080 hat bereits 760 GiB/s, während die RTX 3090 in der gleichen Serie mit 936 GiB/s noch einmal gehörig drauflegt um die +21 % mehr SMs zu unterstützen, denn man kann sich leicht ausrechnen, dass nVidia zwecks einer höheren Marge auf die zusätzlichen 4 GiB sicherlich gerne verzichtet hätte und die RTX 3090 auch eher mit einem 320 Bit SI herausgebracht hätte, wenn es denn möglich gewesen wäre, denn 20 GiB Kapazität im Consumer-Markt wären allemal genug gewesen. Offensichtlich benötigte man aber auch die zusätzliche Bandbreite, damit die SMs ihre Leistung entfalten können und dafür nahm man sogar die zusätzlichen engertisch/thermischen Nachteil in Kauf.

Don-71 · 27. Juli 2021

@ gerX7a

Mann kann dich nur noch komplett auslachen!

Zitat CB

Das ist neu I: Die Geheimwaffe Infinity Cache
Navi 21 hat mit 80 CUs bei gleichem Takt eine doppelt so hohe Rechenleistung wie Navi 10, der L2-Cache ist aber weiterhin 4 MB groß und das Speicherinterface nur 256 Bit breit. In Kombination mit GDDR6 ist die Speicherbandbreite also vergleichsweise klein. Wie passt das zusammen?

Klassisch gar nicht, aber AMD ist bei RDNA 2 einen ganz neuen Weg gegangen. Navi 21 verfügt über einen 128 MB großen zusätzlichen Cache, den AMD „Infinity Cache“ nennt. Er ist über das auch von Ryzen bekannte Infinity Fabric mit den Recheneinheiten über sechzehn 64-Bit-Kanälen verbunden. Die maximale Bandbreite zwischen Infinity Cache und GPU liegt also bei unglaublichen 2 TB/s – die Radeon VII mit HBM2-Speicher bot gerade einmal 1 TB/s, Nvidias sündhaft teure A100 Tensor Core GPU mit 80 GB HBM2e schafft es ebenfalls auf 2 TB/s.

Der Infinity Cache ist an der Infinity-Fabric-Taktdomäne angeschlossen und kann daher unabhängig von der GPU takten. Der maximale Takt beträgt 1,94 GHz. Dieser Takt liegt aber nicht durchweg an, sondern nur dann, wenn auch so viel Speicherbandbreite benötigt wird. Ist der Bedarf geringer, fallen Takt und auch Energieverbrauch niedriger aus.

Ein klassisches 512-Bit-Interface soll langsamer sein

In Verbindung mit dem klassischen 256-Bit-Interface und dem 16-Gbps-GDDR6-Speicher soll die praktisch nutzbare Speicherbandbreite von Navi 21 dank Infinity Cache fast vier Mal so hoch wie nur mit einem 256-Bit-Interface ausfallen, weil viele Anfragen der GPU vom Cache abgefangen werden können. Auch gegenüber einem 384-Bit-Interface soll die auf Navi 21 genutzte Kombination um den Faktor 2,17 mehr Bandbreite liefern, also auch 512 Bit übertreffen. Die dafür benötigte Leistungsaufnahme soll wiederum nur 90 Prozent eines klassischen 512-Bit-Interfaces betragen, sagt AMD.

Weil eine GPU, die benötigten Daten schneller erhält und pro Takt mehr erledigen kann, ist der „Infinity Cache“ laut AMD einer der Gründe, warum die Rechenleistung pro CU mit RDNA 2 gegenüber RDNA am Ende effektiv doch steigen soll, auch wenn die CU an sich nicht schneller geworden ist.

In Spielen soll der Infinity Cache laut AMD sehr effektiv arbeiten können. Die Trefferquote variiere dabei je nach Auflösung, in 1.920 × 1.080 soll sie 80 Prozent betragen, in 3.840 × 2.160 noch 58 Prozent. Liegen die Daten im Cache nicht vor, müssen diese im 16 GB großen Speicher gesucht werden. Sind die Daten dagegen im großen Cache vorhanden, werden diese nie über das VRAM-Speicherinterface übertragen. Weil dieses Übertragen der Daten viel Energie benötigt (AMD spricht von sechs bis acht Mal so viel Energie pro übertragenem Bit im Vergleich zum Infinity Cache), steigt die Energieeffizienz gegenüber einer GPU ohne Infinity Cache an.

Mit dem großen Cache sollen nicht nur Bandbreite und Energieeffizienz steigen, zugleich soll die Latenz für einen Datenzugriff fallen. Das wundert nicht, da der Cache deutlich näher an den Rechenwerken sitzt als der quasi externe GDDR6-Speicher. AMD spricht von einer mehr als 40 Prozent geringeren Latenz als bei Navi 10. Liegen die Daten dagegen nicht im Cache, ist die Latenz schlechter, als wenn direkt im Speicher gesucht worden wäre. Bei über 50 Prozent Trefferquote liegt die Latenz im Durchschnitt aber niedriger. Dasselbe Spiel ist seit Zen 2 auch von Ryzen bekannt, wo der große L3-Cache „Game Cache“ heißt.

Du hast die Funktionsweise des Infinity Caches offensichtlich komplett nicht verstanden!
Die Hit Rate hat zwar Auswirkungen, aber da sie bei 58% aller Speicheranfragen immer noch 40% schneller abgearbeitet werden können, als mit einem klasischen Interface, ist es immer noch schneller und die Bandbreite des Infinity Caches liegt bei 2TB/s, also was sollen da als Beispiele die wesentlich kleineren Bandbreiten von Nvidias Ampere (Consumer Bereich) uns sagen?

Technologie_Texter · 27. Juli 2021

Ganjafield schrieb:
Wieso sollte der sich drastisch anders auswirken als jetzt?

Weil vielleicht nur der Cache dafür zu klein war.

Ganjafield schrieb:
Ab 4k Auflösung bricht die Leistung verhältnissmäßig drastisch ein.

Was an der Größe liegen kann!

gerX7a · 27. Juli 2021

Don-71 schrieb:
@ gerX7a
Mann kann dich nur noch komplett auslachen! ...

Du darfst gerne so viele lachende Smileys verteilen wie du möchtst, nur scheint dir das bzgl. deiner verständnistechnischen Defizite dennoch nicht weiterzuhelfen. Lese dich noch mal ein und versuche das Prinzip zu verstehen, vielleicht kommtst du ja irgendwann noch einmal dahinter, warum RDNA2 in 4K relativ gesehen stärker an Leistung verliert als die Ampere-Modelle.

Don-71 · 27. Juli 2021

gerX7a schrieb:
Du darfst gerne so viele lachende Smileys verteilen wie du möchtst, nur scheint dir das bzgl. deiner verständnistechnischen Defizite dennoch nicht weiterzuhelfen. Lese dich noch mal ein und versuche das Prinzip zu verstehen, vielleicht kommtst du ja irgendwann noch einmal dahinter, warum RDNA2 in 4K relativ gesehen stärker an Leistung verliert als die Ampere-Modelle.

Das ist ganz einfach, eine 3090 hat 10.496 FP32-ALUs , eine 6900XT hat 5.120 FP32-ALUs.
FP32-Leistung 3090 35,7 TFLOPS; 6900XT 20,6 TFLOPS.

Hier kann man sehen wie effizient eigentlich RDNA 2 arbeitet und wieviel Leistung AMD aus einem wesentlich kleineren Chip im Vergleich zu Ampere rausholen kann.

Ich warte immer noch auf die Belege, dass die CUs/ALUs von RDNA 2 in 4K nich ausgelastet werden (können).
Wo sind deine Beweise?

Bevier · 27. Juli 2021

Tzunamik schrieb:
Aha...
Also brauchst RDNA2 jetzt aktuell 450w? In welcher Welt genau?
In Spielen zieht eine 6900Xt ca 270W aus der Dose....

Ich sehe nach deiner Rechnung eher so 500-550W..... wobei das so nicht kommen wird.
Ich denke dass es in Richtung bis zu 400W geht oder aber der Produktionsshrink nochmal echt was bringt.

Einfache Mathematik ist schon verdammt schwer... Die Gesamtzahl der Shader verdreifacht sich, bei genau gleicher Effizienz wäöre das auch ein 3mal höherer Verbrauch. Bei 300 Watt für eine 6900 XT wären das? Genau: die von mir genannten 900...

raPid-81 · 27. Juli 2021

Bevier schrieb:
Einfache Mathematik ist schon verdammt schwer... Die Gesamtzahl der Shader verdreifacht sich, bei genau gleicher Effizienz wäöre das auch ein 3mal höherer Verbrauch. Bei 300 Watt für eine 6900 XT wären das? Genau: die von mir genannten 900...

So pauschal kann man das nicht rechnen, die 300 Watt kommen ja nicht nur von der GPU. VRAM + Board haben auch ihren Anteil an der TBP.

hanfi104 · 27. Juli 2021

Zu Navi und Bandbreite:
Es sei gesagt Navi mit 18Gbit Speicher (+15%) erreicht in den meisten Tests ein Plus von 7/8%

Jetzt hat die Karte 10% mehr Powerbudget und 5% mehr Takt als das Ref Model

Navi hängt NICHT in einem harten Bandbreitenlimit in 4K (in fast allen Spielen, Ausnahmen bestätigen die Regel (glaube Doom war eine))

Radeon RX 6900 XT Liquid Cooling im Test: Der langersehnte Geforce-RTX-3090-Killer?

Kann mit der wassergekühlten RX 6900 XT LC endlich eine Radeon den Grafikkarten-Thron besteigen? Das und mehr erfahren Sie im Test der RX 6900 XT Liquid.

www.pcgameshardware.de

Prozessorarchitektur · 27. Juli 2021

ja die neue aufteilung der gpu bi amd
aus gpc wird wgc
keine cu mehr
Ein cluster hat 256shader wovon amd in 20 40 und 60er chips herstellt
Die tmu und rop werden vermutlich an das SI gebunden was direkt zum inf cache geht
Der kleinste chip wird also 5120 shader haben 20*256
rop sind offen vermutlich 64
tmu ist auch offen aber weniger als bei rdna2 sind es nicht.
5120*2*2,6ghz=26,6tf
als rx7700xt-rx6800xt
vs aktuell
Da dies sich gut aufteilen lässt in mcm könnte es sogar sein das amd bis zu drei chips auf einen substrat beim n31 setzt
Womit der 20 wgt dann wohl als Baustein gelten wird und somit skaliert in mcm
1 chip consumer gpu mit 256mb inf cache 5120shader alles bis Mittelklasse. ~3,0ghz +-30tf
2 chips consumer high end 512mb inf cache 10240 ~3,0ghz +-61tf
3 chips hpc 15360 shader ~2,5ghz +-76,4tf

Hier muss ein cpu limit einsetzen.

ampere nun die 10496shader der rtx3090 sind nicht voll Einsatzfähig mit fp32 idealerweise sind es max bei 1,7ghz
10496*0,75=7872shder doe fp32 ausführen sofern kein cpu limit herrscht.
7872*2*1,7=26,7tf ohne cpu limit
Der grudn dafür ist ampoere aufbau des SM 64fp32 einheiten und 64 fp16
Die 64 fp16 können 32 fp32 berechnen.
Folgend sind es virtuell dann 96fp32 Einheiten
96*84=7872
Das cpu limit ist eine Tatsache die ab 1440p einsetzt
Das liegt am nvidia software sheduler der eine höhere cpu last verursacht. in 4k ist die rtx3090 zuhause aber es reicht nicht ganz.

gerX7a · 27. Juli 2021

Don-71 schrieb:
Das ist ganz einfach, eine 3090 hat 10.496 FP32-ALUs , eine 6900XT hat 5.120 FP32-ALUs.
FP32-Leistung 3090 35,7 TFLOPS; 6900XT 20,6 TFLOPS.

Hier kann man sehen wie effizient eigentlich RDNA 2 arbeitet und wieviel Leistung AMD aus einem wesentlich kleineren Chip im Vergleich zu Ampere rausholen kann.

Ich warte immer noch auf die Belege, dass die CUs/ALUs von RDNA 2 in 4K nich ausgelastet werden (können).
Wo sind deine Beweise?

Sieht man sich die detailierten Messreihen von PCGH und bspw. auch Igor an, fällt auf, dass die 6900XT von WQHD auf UDH tendenziell immer mehr Prozentpunkte an Fps verliert als eine 3090 und überraschenderweise verhält sich selbst eine 3080 recht ähnlich zur 3090 und liegt ebenso noch zumeist vor der 6900XT bzgl. der Ratio der abnehmenden Fps in UHD, also bleibt der Punkt schlicht als Fakt im Raume stehen, dass RDNA2 hier tendenziell nach oben hin etwas schlechter skaliert und daran wird der in seiner Größe zwangsweise beschränkte Infinity Cache seinen Anteil haben, denn Wafer-Fläche steht nicht unbeschränkt zur Verfügung und so musste AMD irgendwo die Grenze ziehen und die liegt nun mal bei den Topmodellen derzeit bei 128 MiB.
Darüber hinaus sollte es dir auch zu denken geben, dass AMD sich anscheinend gezwungen sieht bei RDNA3 den Cache noch einmal zu vergrößern, denn nur zum Spaß verschwendet man die dafür zusätzlich benötigte Wafer-Fläche sicherlich nicht, denn die will bezahlt werden und verheizt zudem ebenfalls Energie. ;-)

Witzigerweise hast du gerade erst von AMD mit der V-Cache-Demonstration der kommenden Ryzen's den Effekt eines großen L3$ eigentlich überdeutlich vor Augen geführt bekommen, aber hier versuchst du dich nun absichtlich Dumm zu stellen?

Warum du jetzt plötzlich mit dem Thema Effizienz ums Eck kommst, ist mir schleierhaft. Ist das jetzt ein Rückzug auf Raten? :-D

Ich habe nirgends behauptet, dass RDNA2 ineffizient ist und erst recht nicht in einer pauschalen Aussage. Wenn das der eigentliche Kernpunkt ist, der dich hier triggert, dann hast du dir den anscheinend selbst zusammengesponnen ... es ist immer das gleiche Thema: Lesen was bei mir geschrieben steht und nicht versuchen irgendwelche Fantastereien zwischen meine Zeilen hineinzuinterpretieren.
Darüber hinaus sind Navi21 (26,8 Mrd. Tr.) und der GA102 (28,3 Mrd. Tr.) bzgl. der Transistorzahl in etwa gleich groß, denn bei der 3090 kommt einerseits nicht der Vollausbau zum Einsatz, wesentlicher dürfte aber sein, dass Ampere noch deutlich erweiterte Tensor Cores mit auf dem Die hat die bei AMD komplett fehlen und für die Grafikleistung nicht zwingend erfoderlich sind. Der Wesentliche Unterschied resultiert hier aus dem Fertigungsprozess, 8LPP (alias 8N) auf der einen Seite und N7(P) auf der anderen und letzterer ist dem Samsung-Prozess absehbar überlegen, denn deren TSMC-Äquivalent wäre hier der 7LPP und entsprechend hat AMD hier auch mehr Spielraum. Zudem unterschieden sich die Designphilosophien grundlegend, denn nVidia ging mehr Leistung mit mehr Recheneinheiten an und war dabei offensichtlich sehr effizient bzgl. der Implementation, denn hier stehen schlussendlich 10496 FP32-Einheiten zur Verfügung auf der 3090. AMD dagegen hat sich designtechnisch dafür entschieden eine Leistungssteigerung primär über den Takt herbeizuführen und der Fertigungsprozess wird ihnen dafür zum Teil die Mittel in die Hand gelegt haben und implementiert somit nur 5120 FP32-Einheiten, jedoch nun mit etwa 300 - 400 MHz mehr Takt i. V. z. RDNA. Am Ende erreichen beide zumindest mit Bezug auf Gaming in etwa ein vergleichbares Leistungsniveau. Was das jetzt aber mit dem ursprünglichen Thema zu tun haben soll, müsstest du noch einmal darlegen.

Zum Thema "Beweise", natürlich wartest du da, weil du ja implizit hoffst, dass da nichts kommt, damit du dich mit dem Material auch nicht auseinandersetzen musst, aber das ändert die Sachlage auch nicht sondern hat bestenfalls Einfluss auf deine persönliche Sichtweise der Welt aber nicht auf die Welt selbst. Nur warum sollte ich dir jetzt alles hinterhertragen müssen, wo die Zahlen doch in jedem größeren Review frei zur Verfügung stehen. Schaue in die PCGH oder bspw. in die detailierten Messungen von Igor rein, nimm einen Taschenrechner zur Hand und hilf dir selbst.

Don-71 · 27. Juli 2021

gerX7a schrieb:
Sieht man sich die detailierten Messreihen von PCGH und bspw. auch Igor an, fällt auf, dass die 6900XT von WQHD auf UDH tendenziell immer mehr Prozentpunkte an Fps verliert als eine 3090 und überraschenderweise verhält sich selbst eine 3080 recht ähnlich zur 3090 und liegt ebenso noch zumeist vor der 6900XT bzgl. der Ratio der abnehmenden Fps in UHD, also bleibt der Punkt schlicht als Fakt im Raume stehen, dass RDNA2 hier tendenziell nach oben hin etwas schlechter skaliert und daran wird der in seiner Größe zwangsweise beschränkte Infinity Cache seinen Anteil haben, denn Wafer-Fläche steht nicht unbeschränkt zur Verfügung und so musste AMD irgendwo die Grenze ziehen und die liegt nun mal bei den Topmodellen derzeit bei 128 MiB.
Darüber hinaus sollte es dir auch zu denken geben, dass AMD sich anscheinend gezwungen sieht bei RDNA3 den Cache noch einmal zu vergrößern, denn nur zum Spaß verschwendet man die dafür zusätzlich benötigte Wafer-Fläche sicherlich nicht, denn die will bezahlt werden und verheizt zudem ebenfalls Energie.

Witzigerweise hast du gerade erst von AMD mit der V-Cache-Demonstration der kommenden Ryzen's den Effekt eines großen L3$ eigentlich überdeutlich vor Augen geführt bekommen, aber hier versuchst du dich nun absichtlich Dumm zu stellen?

Warum du jetzt plötzlich mit dem Thema Effizienz ums Eck kommst, ist mir schleierhaft. Ist das jetzt ein Rückzug auf Raten?
Ich habe nirgends behauptet, dass RDNA2 ineffizient ist und erst recht nicht in einer pauschalen Aussage. Wenn das der eigentliche Kernpunkt ist, der dich hier triggert, dann hast du dir den anscheinend selbst zusammengesponnen ... es ist immer das gleiche Thema: Lesen was bei mir geschrieben steht und nicht versuchen irgendwelche Fantastereien zwischen meine Zeilen hineinzuinterpretieren.
Darüber hinaus sind Navi21 (26,8 Mrd. Tr.) und der GA102 (28,3 Mrd. Tr.) bzgl. der Transistorzahl in etwa gleich groß, denn bei der 3090 kommt einerseits nicht der Vollausbau zum Einsatz, wesentlicher dürfte aber sein, dass Ampere noch deutlich erweiterte Tensor Cores mit auf dem Die hat die bei AMD komplett fehlen und für die Grafikleistung nicht zwingend erfoderlich sind. Der Wesentliche Unterschied resultiert hier aus dem Fertigungsprozess, 8LPP (alias 8N) auf der einen Seite und N7(P) auf der anderen und letzterer ist dem Samsung-Prozess absehbar überlegen, denn deren TSMC-Äquivalent wäre hier der 7LPP und entsprechend hat AMD hier auch mehr Spielraum. Zudem unterschieden sich die Designphilosophien grundlegend, denn nVidia ging mehr Leistung mit mehr Recheneinheiten an und war dabei offensichtlich sehr effizient bzgl. der Implementation, denn hier stehen schlussendlich 10496 FP32-Einheiten zur Verfügung auf der 3090. AMD dagegen hat sich designtechnisch dafür entschieden eine Leistungssteigerung primär über den Takt herbeizuführen und der Fertigungsprozess wird ihnen dafür zum Teil die Mittel in die Hand gelegt haben und implementiert somit nur 5120 FP32-Einheiten, jedoch nun mit etwa 300 - 400 MHz mehr Takt i. V. z. RDNA. Am Ende erreichen beide zumindest mit Bezug auf Gaming in etwa ein vergleichbares Leistungsniveau. Was das jetzt aber mit dem ursprünglichen Thema zu tun haben soll, müsstest du noch einmal darlegen.

Zum Thema "Beweise", natürlich wartest du da, weil du ja implizit hoffst, dass da nichts kommt, damit du dich mit dem Material auch nicht auseinandersetzen musst, aber das ändert die Sachlage auch nicht sondern hat bestenfalls Einfluss auf deine persönliche Sichtweise der Welt aber nicht auf die Welt selbst. Nur warum sollte ich dir jetzt alles hinterhertragen müssen, wo die Zahlen doch in jedem größeren Review frei zur Verfügung stehen. Schaue in die PCGH oder bspw. in die detailierten Messungen von Igor rein, nimm einen Taschenrechner zur Hand und hilf dir selbst.

Dein ganzer Beitrag wurde hier bei PCGH schon durch den von hanfi104 verlinkten Test der 6900XT Liquid Cooling ad absurdum geführt. Du hasst einfach unrecht und kannst deine Behauptungen auch nicht belegen. Genau das Gegentei ist der Fall, sonst könnte 6900XT Liquid Cooling, nicht durch die Bank höhere FPS in 4K erzielen als die 6900XT, wenn es ein Bandbreitenproblem/Limitierung geben würde! Deine Aussage, dass die CUs/ALUs der RDNA 2 KArten unter 4K nicht ausgelastet werden können, sind einfach falsch, wie die Messreihen von PCGH beweisen.
Tja sehr dumm gelaufen!

DKK007 · 27. Juli 2021

Don-71 schrieb:
RDNA2 bekommt in 1080p und 1440p seine Rohleistung wesentlich besser auf die Strasse als Nvidias Ampere, der trotz wesentlich mehr Recheneinheiten hier große Probleme hat.

Das Problem hatten große AMD-GPUs (Fury, Vega) aber auch früher, dass die schlecht in niedrigen Auflösungen liefen.
Es ist halt vor allem davon abhängig, wie gut die Shader skalieren.

Wobei so eine Navi31 mit 15k Shadern sich wohl eh nur für 5k/8k lohnt.

Gast1730416202 · 27. Juli 2021

gerX7a schrieb:
Darüber hinaus sollte es dir auch zu denken geben, dass AMD sich anscheinend gezwungen sieht bei RDNA3 den Cache noch einmal zu vergrößern, denn nur zum Spaß verschwendet man die dafür zusätzlich benötigte Wafer-Fläche sicherlich nicht, denn die will bezahlt werden und verheizt zudem ebenfalls Energie.

Witzigerweise gibst Du ja angeblich nie etwas auf Gerüchte, aber wenn es Deinem Nvidia-Intel-Bias nutzt, dann greifst Du gerne darauf zurück. Ganz ehrlich, Deine Nachrichten lesen sich oft so, als ob Du wenigstens etwas Ahnung hättest, aber gleichzeitig kannst Du es nie lassen AMD direkt oder indirekt schlecht dastehen zu lassen.
Erinnert ein wenig an schaffe.

Maxxx80 · 27. Juli 2021

Sehr interessant. Das wären dann umgerechnet so 30000 Nvidia Shader. Respekt falls das so kommen sollte.

raPid-81 · 27. Juli 2021

Julian K schrieb:
Witzigerweise gibst Du ja angeblich nie etwas auf Gerüchte, aber wenn es Deinem Nvidia-Intel-Bias nutzt, dann greifst Du gerne darauf zurück. Ganz ehrlich, Deine Nachrichten lesen sich oft so, als ob Du wenigstens etwas Ahnung hättest, aber gleichzeitig kannst Du es nie lassen AMD direkt oder indirekt schlecht dastehen zu lassen.
Erinnert ein wenig an schaffe.

Dass der Infinity Cache vergrößert wird ist ja absehbar, warum weiss man auch, dass dabei Chipfläche und Strom nötig ist sollte klar sein. Ich sehe da keinen Bias bei @gerX7a, er präsentiert hier meist belegbare Fakten (außer eben in einem Thread der sich komplett auf Gerüchte / Leaks stützt).

Ich frage mich: Warum mäkelst Du bei ihm einen vermeintlichen Bias an, tust dies aber nicht bei den drölfzig Team Red Beiträgen? Die beziehen sich auch nur auf die Gerüchte...

Ontopic: 15k Shader wollen Strom, wenn man das mal grob überschlägt sind das mindestens 500W nur für die GPU minus dem Sparpotenzial durch den 5nm Prozess.

https://www.tsmc.com/english/dedicatedFoundry/technology/logic/l_5nm

N5 technology provides about 20% faster speed than N7 technology or about 40% power reduction

Wenn man jetzt den kompletten Node Sprung einsetzt um Strom zu sparen und keine Takterhöhung mitnimmt, dann liegt man bei mindestens 300W nur für die GPU. Dann noch VRAM + Board Power drauf. Der Trend scheint sich fortzusetzen, beim nächsten GPU Wechsel also wieder ein neues Netzteil...

Gast1730416202 · 27. Juli 2021

raPid-81 schrieb:
Dass der Infinity Cache vergrößert wird ist ja absehbar, warum weiss man auch, dass dabei Chipfläche und Strom nötig ist sollte klar sein. Ich sehe da keinen Bias bei @gerX7a, er präsentiert hier meist belegbare Fakten (außer eben in einem Thread der sich komplett auf Gerüchte / Leaks stützt).

Ich frage mich: Warum mäkelst Du bei ihm einen vermeintlichen Bias an, tust dies aber nicht bei den drölfzig Team Red Beiträgen? Die beziehen sich auch nur auf die Gerüchte...

Ontopic: 15k Shader wollen Strom, wenn man das mal grob überschlägt sind das mindestens 500W nur für die GPU minus dem Sparpotenzial durch den 5nm Prozess.

https://www.tsmc.com/english/dedicatedFoundry/technology/logic/l_5nm

Wenn man jetzt den kompletten Node Sprung einsetzt um Strom zu sparen und keine Takterhöhung mitnimmt, dann liegt man bei mindestens 300W nur für die GPU. Dann noch VRAM + Board Power drauf. Der Trend scheint sich fortzusetzen, beim nächsten GPU Wechsel also wieder ein neues Netzteil...

Dass Du behauptest ich würde andere nicht in Zweifel ziehen (obwohl ich z.B. Chatstar hier mehrfach negativ erwähnt habe), zeigt ja wes Geistes Kind Du bist und dass Du gerade versuchst, nur Deines gleichen (also vor allem grün-gepolte Leute) zu unterstützen. Herzlichen Glückwunsch. ^^

Wie gesagt, mich nervt hier jeder, der ausschließlich nach Marke geht (und damit eben auch Du

).

raPid-81 · 27. Juli 2021

Julian K schrieb:
Dass Du behauptest ich würde andere nicht in Zweifel ziehen (obwohl ich z.B. Chatstar hier mehrfach negativ erwähnt habe), zeigt ja wes Geistes Kind Du bist und dass Du gerade versuchst, nur Deines gleichen (also vor allem grün-gepolte Leute) zu unterstützen. Herzlichen Glückwunsch. ^^

Wie gesagt, mich nervt hier jeder, der ausschließlich nach Marke geht (und damit eben auch Du ).

Das ist mir tatsächlich aufgefallen, allerdings bezieht es sich nur auf den einen User. Wie auch immer, Du gehst null auf meine Frage ein: Wieso darf @gerX7a keine Gerüchte heranziehen in einem auf Gerüchten basierenden Thread in dem Team Red genau so wild spekuliert?

Ich kann auch Gerüchte! https://www.tweaktown.com/news/8077...aks-beast-gpu-100-faster-than-3090/index.html

In the specs, NVIDIA's next-gen AD102 is expected to be made on TSMC's fresh new 5nm node, with an insane 18,432 CUDA cores (GA102 in the RTX 3090 has 10496 CUDA cores for comparison). The GPU clocks expected are now 2.2GHz and above, which will result in around 81 TFLOPs of compute performance (35.5 TFLOPs on the GA102 or RTX 3090).

Eins können wir wohl festhalten, die nächste Gen wird definitiv noch was auf die Stromrechnung drauflegen. Ich muss jetzt schon im Winter nicht heizen wenn mein Rechner läuft...

Gast1730416202 · 27. Juli 2021

raPid-81 schrieb:
Das ist mir tatsächlich aufgefallen, allerdings bezieht es sich nur auf den einen User. Wie auch immer, Du gehst null auf meine Frage ein: Wieso darf @gerX7a keine Gerüchte heranziehen in einem auf Gerüchten basierenden Thread in dem Team Red genau so wild spekuliert?

Ich kann auch Gerüchte! https://www.tweaktown.com/news/8077...aks-beast-gpu-100-faster-than-3090/index.html

Eins können wir wohl festhalten, die nächste Gen wird definitiv noch was auf die Stromrechnung drauflegen. Ich muss jetzt schon im Winter nicht heizen wenn mein Rechner läuft...

Es geht nicht darum, ob irgendwer eher Gerüchte heranziehen darf, sondern wie sich gewisse Personen vorher verhalten haben.

gerxsonstwie hat hier schon zigfach Leute angezählt, weil sie sich auf Gerüchte bezogen haben. Da sollte man meinen er/sie/es würde das selbst nicht tun. Ist hier aber geschehen, da darf sich die Person dann auch gerne zu äußern. Immerhin sind wir hier nicht bei "Wünsch Dir was".

AMD Navi 31: 15.360 Shader, aber dank RDNA 3 ohne Compute Units?

PCGHX-HWbot-Member (m/w)

Freizeitschrauber(in)

BIOS-Overclocker(in)

PCGHX-HWbot-Member (m/w)

Das ist neu I: Die Geheimwaffe Infinity Cache​

Ein klassisches 512-Bit-Interface soll langsamer sein​

BIOS-Overclocker(in)

BIOS-Overclocker(in)

PCGHX-HWbot-Member (m/w)

Volt-Modder(in)

raPid-81

Guest

Volt-Modder(in)

Lötkolbengott/-göttin

BIOS-Overclocker(in)

PCGHX-HWbot-Member (m/w)

PCGH-Community-Veteran(in)

Gast1730416202

Guest

Kabelverknoter(in)

raPid-81

Guest

Gast1730416202

Guest

raPid-81

Guest

Gast1730416202

Guest

Ähnliche Themen

Das ist neu I: Die Geheimwaffe Infinity Cache

Ein klassisches 512-Bit-Interface soll langsamer sein