News FSR 4 auf RX 7000: Mod ermöglicht bessere Qualität - das hat aber seinen Preis

PCGH-Redaktion

Kommentar-System
Teammitglied
Unter Linux kann FSR 4 auch mit älteren Radeon-Grafikkarten verwendet werden. Laut einem Bericht auf Reddit wird die Bildqualität dadurch teils deutlich verbessert. Ganz anders sieht es hingegen bei der Performance aus.

Was sagt die PCGH-X-Community zu FSR 4 auf RX 7000: Mod ermöglicht bessere Qualität - das hat aber seinen Preis

Bitte beachten: Thema dieses Kommentar-Threads ist der Inhalt der Meldung. Kritik und allgemeine Fragen zu Online-Artikeln von PC Games Hardware werden hier gemäß der Forenregeln ohne Nachfrage entfernt, sie sind im Feedback-Thread besser aufgehoben.
 
Vielleicht war mein Umstieg von 7900XT auf 9070XT vielleicht doch nicht so schlau?
Na mal sehen wie es sich weiter entwickelt. Ich hoffe für die RDNA3 User*innen, dass die Sache im Rahmen der Möglichkeiten noch nachgereicht wird.
 
Schade, dass es scheinbar keine Möglichkeit zu geben scheint, statt FP8 zu emulieren einfach FP16 zu nutzen. Ich könnte mir vorstellen, dass das deutlich schneller wäre und schaden sollte die höhere Genauigkeit ja eigentlich auch nicht.
 
Vielleicht war mein Umstieg von 7900XT auf 9070XT vielleicht doch nicht so schlau?
Na mal sehen wie es sich weiter entwickelt. Ich hoffe für die RDNA3 User*innen, dass die Sache im Rahmen der Möglichkeiten noch nachgereicht wird.
War sogar sehr schlau da deutlich mehr RT Leistung und fsr4 welches nie so schnell auf älteren rdna grakas laufen wird. Außerdem kommt noch Redstone dazu.
 
Schade, dass es scheinbar keine Möglichkeit zu geben scheint, statt FP8 zu emulieren einfach FP16 zu nutzen. Ich könnte mir vorstellen, dass das deutlich schneller wäre und schaden sollte die höhere Genauigkeit ja eigentlich auch nicht.
Ohne jetzt in der Architektur von RDNA4 zu wühlen: Das dürfte genau der Weg sein, mit dem FSR 4 auf RDNA 3 läuft.
Das Problem ist: Guter FP8-Support heißt, dass eine FP16-Einheit geteilt werden kann und FP8 damit doppelt so schnell läuft. Wenn sich die FP16-Einheit aber nicht aufteilen kann, dann kann man das schon trotzdem ausführen - aber im Vergleich eben nur halb so flott.
 
Ohne jetzt in der Architektur von RDNA4 zu wühlen: Das dürfte genau der Weg sein, mit dem FSR 4 auf RDNA 3 läuft.
Das Problem ist: Guter FP8-Support heißt, dass eine FP16-Einheit geteilt werden kann und FP8 damit doppelt so schnell läuft. Wenn sich die FP16-Einheit aber nicht aufteilen kann, dann kann man das schon trotzdem ausführen - aber im Vergleich eben nur halb so flott.
Ich bin nicht sicher, wie der aktuelle Stand ist, aber ich hatte mal Code dazu gesehen, den ich jetzt aber nicht mehr finde, in dem zu diesem Zweck zwischen FP8 und FP16 konvertiert wurde. Theoretisch wäre es schon möglich, dass so zu machen, wie du sagst, dafür müsste man aber den FSR4-Code komplett so erweitern, dass er auch nativ mit FP16 läuft. Ansonsten müsste man einen Wrapper haben, der eben FP8-Operationen ermöglicht. Dazu muss dann aber auf einer Hardware, die das nicht nativ kann, zwischen FP8 und FP16 konvertiert werden, was deutlich länger als das Ausführen der eigentlichen Operation dauert, das dann aber natürlich da noch mal oben drauf kommt.
 
Also ich habe mal nachgerechnet und es scheint so als wenn zu dem fsr 3.1 Overhead einfach ca. 6 bis 6,25ms dazu kommen.
Man kann also ausrechnen, dass beim gleichen Qualitätsgrad ca. Aus 60fps 44 werden und aus 120fps 68. (1000ms/60fps=~16,667ms 16,667ms+6,25ms=~22,9ms 1000ms/22,9ms=~44fps)
(1000/120=~8,333 8,333+6,25=~14,6 1000/14,6=~68)
Interessant wird's aber wie FSR in anderen Modi performt. Ich hoffe jemand testet die mal gegen.


Wie ich auf 6 bis 6,25 komme:
Oblivion hat 46 vs 36 fps
Um die Renderzeit für die gewählten settings inklusive Overhead auszurechnen muss man 1000ms/46fps rechnen=~21,7ms . Wir suchen den restlichen Overhead also rechnen wir die frametime mal fsr4 fps: 21,7*36=781,2ms. Nun ziehen wir davon 1000ms ab und teilen es durch die frames. (1000ms-781,2)/36=~6,08ms.
Wenn man das für die anderen Titel macht auch bei sehr viel höheren FPS bleibt der Overhead ca. Linear.
 
Zuletzt bearbeitet:
Die Performance Einbrüche werden immer so in der Art bestehen, denn die Rechneneinheiten mit der beschleunigten Berechnung fehlen halt.
Vielleicht hat AMD das gerade deswegen nicht gleich für die 7000er Karten freigeschaltet, weil es sich so kaum bis gar nicht mehr lohnt?
Aber vielleicht könnte man es ja trotzdem aktivien, damit jeder das für sich entscheiden kann, ob ihm dann (größere) Einsparungen bei der Detailstufe oder die geringen Frames noch ausreichend sind, hauptsache weniger Schlieren und Co.?
 
Damit ist FSR4 relativ nutzlos, da man dann einfach bei FSR3 eine oder zwei Stufen höher gehen kann. Die Leistungsverluste sind ja schon teil sehr deutlich, da hätte man gleich die Native Einstellung nutzen können.

Deshalb wird es AMD wohl auch nicht freigeben.

Aber vielleicht könnte man es ja trotzdem aktivien, damit jeder das für sich entscheiden kann, ob ihm dann (größere) Einsparungen bei der Detailstufe oder die geringen Frames noch ausreichend sind, hauptsache weniger Schlieren und Co.?

Ich vermute mal, dass AMD den Ruf von FSR4 nicht besudeln will, ist auch schlauer.

Vielleicht war mein Umstieg von 7900XT auf 9070XT vielleicht doch nicht so schlau?

Naja, das hättest du schon vorher wissen können.

War sogar sehr schlau da deutlich mehr RT Leistung und fsr4 welches nie so schnell auf älteren rdna grakas laufen wird.

Auf der Haben seit der 7900XT stehen 4GB mehr VRAM, auf der der RX 9070XT höhere Raytracingleistung und FSR4. Auch dass der Garantiezeitraum neu beginnt ist durchaus wichtig.

Am Ende stellt sich die Frage, wieviel dafür bezahlt wurde. Davon hängt es ab, ob das ein cleverer Schachzug oder einfach nur Geldverschwendung war.
 
Schade, dass es scheinbar keine Möglichkeit zu geben scheint, statt FP8 zu emulieren einfach FP16 zu nutzen. Ich könnte mir vorstellen, dass das deutlich schneller wäre und schaden sollte die höhere Genauigkeit ja eigentlich auch nicht.
:daumen:Jap, genau das ist die Performance Achillesferse hier: dass FP8 in FP16 emuliert einen Impact hat - ein haufen WMMA-brute forcing auf RDNA3's WMMA-schwacher Leistung.

Vor ein paar Wochen fand ich dazu diese Erfolgsmeldung rund um die FSR4-Hacks ganz gut:

Am Ende hat er genau das angedeutet: es bräuchte evtl. ein FSR16-eigenes Modell?

Und die letzten paar Tage sind in den Community-Foren weitere Erfolge zu vermelden. Es zeigt: das Thema ist noch nicht vom Tisch und macht weiter Fortschritte - und das in nur wenigen Wochen!
Jedenfalls wird weiter rumgetüftelt, experimentiert und gewerkelt.
Und wenn am Ende aus all diesen Erkenntnissen eine Art FSR 3.5 rauspurzelt, das wenigstens Ghosting und Shimmering von FSR 3 / 3.1.x auf halber Strecke mehr zur Qualität von FSR 4 bringt, dann wäre das doch auch ein toller Erfolg all dieser Bemühungen und Versuche.

Ich find's sehr cool, wie alle zusammenkommen, probieren und daran rumfeilen.
:bier:
 
Zuletzt bearbeitet:
Eigentlich (tm) sollte es reichen, wenn man im FSR-4-Code alle FP8-Initialisierungen gegen FP16-Initialisierungen austauscht, falls RNDA <4 erkannt wird.
Ja, ich glaube das meinte er damit.
Aber diese Berechnungsmodelle in FP16 gibt es halt (noch) nicht. Die müsste man halt mal erzeugen, um zu sehen, ob das dann die gewünschten Vorteile bringt.


Vielleicht war mein Umstieg von 7900XT auf 9070XT vielleicht doch nicht so schlau?
Na mal sehen wie es sich weiter entwickelt. Ich hoffe für die RDNA3 User*innen, dass die Sache im Rahmen der Möglichkeiten noch nachgereicht wird.
Kommt drauf an, was Dein Fokus ist.

Die 9070XT ist halt ein Tier drunter, macht aber signifikante Fortschritte in Raytracing und Upscaling durch die verbesserte Leitung bei KI-Modellen.
Sie ist sparsamer/effizienter und liefert bessere Ergebnisse (z.B. auch bei Video-Codecs wie etwa AV1 und AVC).
Dafür hat sie dann weniger VRAM. Leistungsstärkere aber weniger Recheneinheiten.

Wenn Du noch wenig auf Raytracing und KI-Aufwertung setzt, aber mehr von VRAM und Recheneinheiten profitierst, dann war es nicht so schlau.
Ein tragischer Fehler ware es jetzt aber auch nicht. Vor allem, wenn Du bei Deiner alten noch ausreichend rausgeholt hast/es finanziell keine Rolle spielt und du Deinen Spass hattest.

Ich finde die Verbesserungen beachtlich und habe leicht ähnliche Empfindungen, wie beim Steam Deck: das könnte ein Milestone-Hardware-Stück sein, das einen Wendepunkt markiert.
Vielleicht alleine deshalb interessant ;)

Ich selber bleibe erst mal bei meiner 7900XT. Die verrichtet gute Dienste und reicht mir noch vollkommen.
Ich plane erst bei RDNA5 zu upgraden (vielleicht erst, wenn RDNA6 rauskommt).

Sollte die 9070XT irgendwann für 500 oder weniger zu haben sein, könnte ich schwach werden. Für eine Media-Station/Gaming-Nuc oder rein für die Vitrine (und als Fallback Ersatzkarte) :ugly:

Was die FASR4-Basteleien angeht, finde ich es rein technisch und vom FOSS, sowie Optimierungs-Aspekt sehr spannend.
Ich bin jetzt selber aber kein großer Upscaling- oder KI-Enthusiast.
Also ganz entspannt. Wird schon :daumen:
Das nächste geile DIng wird, dass AMD all-in bei FOSS geht und auch die Firmware immer weiter rüberzieht. Bald ist die Software fast vollständig Open. Was das ermöglicht und an Entwicklung-/Polishing-Potential in der OpenSource-Gemeinschaft ermöglicht, brauche ich glaub nicht erklären.
 
Zuletzt bearbeitet:
Wenn Du weniger noch wenig auf Raytracing und KI-Aufwertung seztt, aber mehr von VRAM und Recheneinheiten profitierst, dann war es nicht so schlau.
Ja es kommt darauf an, deshalb habe ich das als Frage in den Raum geworfen. ^-^
Ich bin im Moment auf ältere Spiele fixiert und hauptsächlich wegen der Herstellergarantie umgestiegen.
Auf Raytracing und KI-Aufwertung bzw. Verschlimmbesserung mit Artefakten lege ich noch keinen Wert.
Wenn RT in der Zukunft einmal Standard ist ändert sich vielleicht meine Sicht darauf, aktuell betrachte ich es als ungeliebtes Anhängsel und habe es immer deaktiviert. in Diablo VI zum Bleistift.
 
Wenn RT in der Zukunft einmal Standard ist ändert sich vielleicht meine Sicht darauf, aktuell betrachte ich es als ungeliebtes Anhängsel und habe es immer deaktiviert. in Diablo VI zum Bleistift.
Naja, heute hat jede Hardware Support dafür. Ich nutze es halt entsprechend im Rahmen der Möglichkeiten der Hardware, die ich eh habe. Wenn es damit schnell genug ist, ist gut, wenn nicht, fliegt es halt raus.
 
Ich bashe gerne gegen NVidia und das, weil Sie es jederzeit verdient haben. Ihren Upscaler nach der 4.GENERATION !!! Ihres Versprechens, macht aber klar einen besseren Eindruck als FSR 3.x 2025.
Gegen 4.0 kann ich nicht sagen, verstand, dieser braucht auch KI?.

Gratulation. An die die noch einmal einen sehr schlecht bewerteten Aufguss namens RTX50xx gekauft haben.


Ich hätte auch gerne noch 4.x für meine RX6800xt.
Vielleicht wäre es an der Zeit für AMD auf die NVidia Nutzer zu "scheissen" , so wie es die selben auf AMD tun und sich nur um die eigene Linie zu kümmern??
 
Zurück