News FSR 4 für alle: AMDs KI-Upscaling läuft unter Windows und Linux auf allen Grafikkarten

Na offensichtlich funktioniert es nur schlecht bzw. gar nicht mit RDNA2:
"AMD’s final FSR4 release uses FP8 (8-bit floating point), which is only supported on RDNA4 architecture. The leaked INT8 version works on Radeon RX 7000 cards, but not on RX 6000 series, as RDNA2 lacks WMMA (matrix) acceleration. Those cards would need a different version to function."
So steht's zumindest auf https://videocardz.com/newz/amd-fsr...-support-on-radeon-rx-7000-and-geforce-rtx-30 ...
Grundsätzlich läuft es auch auf RDNA2. XeSS DP4a basiert übrigens genauso auf INT8. WMMA beschleunigt die Berechnung, ist aber keine zwingende Voraussetzung.
 
👍😁

Genau wie auch MultiFrameGen höchstwahrscheinlich auf ner 4000er Karte von Nvidia mit etwas weniger Leistung laufen würde. Oder FrameGen auf ner 3000er Karte.
Auch das ist nicht gelogen. Nvidia hat bereits gesagt, dass es geht und in Zukunft kommen könnte, aber nicht für alle Karten, weil die meisten zu schwach wären. Gehen tut alles, ist nur die Frage nach dem Nutzen bzw. der Sinnhaftigkeit.
 
In Kingdom Come Deliverance 2 hab' ich nun auch FSR4 auf meiner 7900XTX mit dem angepassten Optiscaler-Mod von Nexusmods zum laufen gebracht, inkl. MFGx2. Läuft trotz über das Monitor-Limit hinausschiessenden FPS sehr sauber (Chill ist derzeit auf 45-50 fps eingestellt).
Braucht halt bisschen mehr Strom.
Konnte noch nicht austesten, inwieweit es nun überhaupt noch sinnvoll ist, KCD2 mit FSRx nativ laufen zu lassen.

Einfach die FSR4-dll ersetzen.


Edit:
Die Mod ist für Radeon falsch konfiguriert. Das NV-Spoofing muss abgeschaltet werden, sonst gibt es Pixelart bei den Texturen...
 
Zuletzt bearbeitet:
Also hat AMD gelogen, das es zwingend die neunen Rechneinheiten der 9000 Serie brauch, und es war nur ein Vorwand für geplante Obsoleszenz?
Nein.
Sie mussten das Netzwerk requantisieren. Man kann nicht einfach FP8 mit INT8 ersetzen, da der Zahlenbereich der Zahlentypen nicht gleich ist.
Also sie mussten Aufwände investieren. Es gab schon länger Gerüchte, dass sie daran Arbeiten.

Der Linux hack hat anders funktioniert. Da wurde FP8 mit FP16 berechnet, was zu grösseren Performanceeinbrüchen geführt hat.
 
Es gab schon länger Gerüchte, dass sie daran Arbeiten.
Sie haben von Anfang an gesagt, dass sie es versuchen werden. Es war natürlich vorerst exklusiv und ein Killer-Feature für RDNA 4, aber das sie je gesagt haben es brauche zwingend RDNA 4 Hardware, wie hier im Thread schon behauptet wurde, ist schlicht gelogen. Facts matter.

 
BAM! Hab doch gesagt "die Katze ist aus dem Sack"! <-- ihr könnt ja mal lesen, was ich dort prophezeit habe (trifft ziemlich den Nagel auf den Kopf. Schauen wir mal, wie es sich weiter entfaltet. Ich bin da sehr zuversichtlich)

War nur noch eine Frage der Zeit.
Bin überrascht, wie schnell das jetzt ging. FOSS-Community to the win \o/

Geil, geil, geil!

Geht doch!

Danke @PCGH_Sven. Made my day
(hätte es noch schöner gefunden, wenn Du den Satz umgestellt hättest "und das sowohl unter Linux als auch unter Windows." ;):kuss:)
PS: ich finde Deine Infobox mit den wichtigsten Punkten als Bullet-points eine sehr gute Idee! *nice*
 
Zuletzt bearbeitet:
Sie haben von Anfang an gesagt, dass sie es versuchen werden. Es war natürlich vorerst exklusiv und ein Killer-Feature für RDNA 4, aber das sie je gesagt haben es brauche zwingend RDNA 4 Hardware, wie hier im Thread schon behauptet wurde, ist schlicht gelogen. Facts matter.

Nein sie haben nicht gelogen!

  1. Nur die RDNA4 hat FP8 Wenn du FP16 verwendest braucht die selbe Berechnung doppelt so lange. Sprich du hast ein ganz anderes Verhalten von Bottlenecks. Wenn du die Performanceziele nicht erreichst, gibst du Software nicht einfach so frei.
  2. Um die Performanceziele zu erreichen haben sie den Wechsel von FP8 auf INT8 vollzogen der aufwändig ist ein Aufwand. Es musst das ganze Modell requantisiert werden, berechnungen der Nodes angepasst werden. Dann musst du sicherstellen, dass keine visuelle Regression entstehen. Also n Spiele/Testcases mit m Karten testen. Das sind n x m Testläufe. Also einiges an Aufwand.
Es ist ja klar, dass bei FSR4 zuerst RDNA 4 prio hatte, dann Playstation und erst dann die älteren Generation.

Interessant wäre eine Analyse der Performance zwischen Linux FP8 emulation mit FP16 und INT8.
 
Nein sie haben nicht gelogen!

  1. Nur die RDNA4 hat FP8 Wenn du FP16 verwendest braucht die selbe Berechnung doppelt so lange. Sprich du hast ein ganz anderes Verhalten von Bottlenecks. Wenn du die Performanceziele nicht erreichst, gibst du Software nicht einfach so frei.
  2. Um die Performanceziele zu erreichen haben sie den Wechsel von FP8 auf INT8 vollzogen der aufwändig ist ein Aufwand. Es musst das ganze Modell requantisiert werden, berechnungen der Nodes angepasst werden. Dann musst du sicherstellen, dass keine visuelle Regression entstehen. Also n Spiele/Testcases mit m Karten testen. Das sind n x m Testläufe. Also einiges an Aufwand.
Es ist ja klar, dass bei FSR4 zuerst RDNA 4 prio hatte, dann Playstation und erst dann die älteren Generation.

Interessant wäre eine Analyse der Performance zwischen Linux FP8 emulation mit FP16 und INT8.
Auch dazu habe ich schonmal was geschrieben und auf FOSS-Developper-Beiträge rund um FSR4-Reverseengineering verlinkt.

-> (scroll runter ... unten ab Kapitel RDNA3?. Der Rest ist aber auch sehr lesenswert, um die gesamte Problematik der Performance und Unterschiede zu verstehen)

Dort wird gesagt, dass die Emulation von FP8 WMMA in FP16 suboptimal ist und nur ein Workaround - ein Proof of Concept in der Zwischenzeit.
Die elegantere Lösung wäre sogar noch, das FSR4-KI-Modell für FP16 nutzbar nochmal zu kompilieren.
Denke, das wird der nächste Milestone der FOSS-Bemühungen.

(Und hier mehrere ganz frühe Einschätzungen meinerseits zu dem Thema. Kann man ja mal gucken, wie gut die gealtert sind ;) )
 
Zuletzt bearbeitet:
1758047065436.png


Mehr muss man dazu nicht sagen.. Vielleicht noch ein dickes Danke.

Hab's getestet in CP, MHW und Wukong. Läuft einwandfrei.
 
ja ist doch prima..
Zurzeit gibt es nicht mal den kleinsten nutzen von FSR für mich und meine 7900XTX beim Spielen in WQHD.
Durch FSR4 könnte ich dann vlt bequem die GPU in 2-3 Jahren mit ins nächste Systemupgrade nehmen und muss erst in gut 4 Jahren die GPU upgraden.
Eventuell kann ich die 7900XTX ja auch wirklich bis 2028 oder länger nutzen die 1080Ti hab ich auch 6 Jahre genutzt ohne Upscaler

Mein Ziel mit der 7900XTX ist 2030!
 
Eventuell kann ich die 7900XTX ja auch wirklich bis 2028 oder länger nutzen die 1080Ti hab ich auch 6 Jahre genutzt ohne Upscaler

Mein Ziel mit der 7900XTX ist 2030!
Da haben wir ja einen ziemlich ähnlichen Weg hinter und vor uns. Wobei ich eher sechs Jahre und somit eher 2029 angepeilt habe. Aber mal gucken, was es bis dahin überhaupt so gibt.
 
Da haben wir ja einen ziemlich ähnlichen Weg hinter und vor uns. Wobei ich eher sechs Jahre und somit eher 2029 angepeilt habe. Aber mal gucken, was es bis dahin überhaupt so gibt.
Da ich Topaz LAPs nutze (Foto/Video KI) könnte es vlt auch etwas eng werden. Allerdings sind die 24GiB VRAM dafür grandios. Videos in 4K Rendern ist für den Privatgebrauch aber Zeitlich deutlich OK.

Die CPU AMD 5900X braucht !Deutlich! länger. Mal abgesehen davon das 32GiB RAM ziemlich knapp sind.
Deswegen werde ich sobald möglich ein Platform Upgrade machen.
Allerdings (Voll-)Sanieren wir grad unser gekauftes Haus, da muss man halt sehen was wichtiger ist...
Oberste Geschossdeckendämmung oder CPU
Badezimmer Sanieren oder Mainboard und RAM... ---naja der vergleich hinkt... Die Kreislaufdusche ist da fast drin.

:ugly::ugly:

P.S.
-Wir haben für die zusätzliche 18 cm WLS31 Untersparrendämmung. Von 134m² Dachfläche
-40cm x 49m² also ca 20m³ OG-Decken Holzweichfaserdämmung
-10/10cm Holzfaser und Mineralwolle Zwischen Geschossdämmung
-14cm Keller zu EG Dämmung
-10cm WLS 31 Treppenhaus...
--->2200€ bezahlt
Das bis auf wenige Reste die fehlen werden die gesamte Dämmung, oberhalb vom GEG 0.24 W/m²K Gesetz
(Die Kerndämmung (6-12cm) (Einblasdämmung) vom ganzen Haus+Anbau waren etwas über 5000€ zusätzlich)

Da kann man sich halt aussuchen hat man nen Gaming PC auf höchsten Niveau oder Dämmt man sein Haus mit dem gleichen Geld....Und dreht halt die Auflösung runter ODER:D Nutzt FSR4!!
 
Zurück