Sammelthread Nvidia Blackwell RTX 50xx Laberthread

Sammelthread
Du widersprichst dir selber.
Ist KI die Grundlage für DLSS oder nicht?
Wo widerspreche ich mir? Der Algorithmus wird per KI trainiert.

Das ist was komplett anderes als "dann ist der Frame schon zu zwei Drittel ein KI-Bild".

Im Kern funktioniert selbst TAA exakt genauso wie DLSS SR, mit dem Unterschied dass der Algorithmus von DLSS SR sehr viel mächtiger ist. Das heißt aber noch lange nicht dass da einfach Sachen "generiert" werden.
 
Das ist was komplett anderes als "dann ist der Frame schon zu zwei Drittel ein KI-Bild".
Es ist eine KI-gestützte Methode um fehlende Details zu rekonstruieren.
Ergo ist ein DLSS-Frame ein partielles KI-Bild. Das muss dir nicht gefallen, ändert aber nichts daran, dass hier mit KI gearbeitet wird.

In Zukunft wird immer mehr KI in den Frame kommen, bis der Frame vollständig einer KI entspringt.
Damit sollte man sich nun einmal anfreunden, diese Entwicklung ist nämlich unausweichlich.
 
Womöglich möchte man AMD direkt den Wind aus den Segeln nehmen mit FSR 4.1 und quasi den nächsten Schritt direkt verankern. Mit FSR 4.1 ist AMD mittlerweile so nah an DLSS 4.5, dass dies kaum ein Verkaufsargument mehr ist. Zwar hat NV immer noch die bessere Verbreitung, aber moderne Titel kommen heute grundsätzlich mit beiden Techniken.
Da hamm die aber genau das Gegenteil erreicht xD

Die Reaktionen sind ja zu nem großen Teil negativ.

Jetzt ist eig der beste Zeitpunkt um FSR4.1 rauszuhaun :daumen:
 
Nein, lokal wird keine AI ausgeführt. Da wird nichts generiert. Der Algorithmus wird per AI trainiert. Mehr ist das nicht bei DLSS SR.

Am Ende werden, wie bei jeder anderen temporalen AA Methode auch, einfach nur die Infos aus mehreren Frames verrechnet.

DLSS Super Resolution boosts performance by using AI to output higher-resolution frames from a lower-resolution input. DLSS samples multiple lower-resolution images and uses motion data and feedback from prior frames to construct high-quality images. A new second-generation Transformer AI model further improves stability, anti-aliasing, and visual clarity.

DLSS basiert auf KI. Ein DLSS Frame ist demzufolge ein KI-Bild.
Wenn DLSS nicht mit KI arbeiten würde, dann wäre ein DLSS Frame kein KI-Bild.

In Zukunft werden alle deine Frames direkt von einer KI erzeugt und nicht nur nach Anleitung einer KI aufgehübscht. Dem gegenüber solltest du dich entspannt hinsetzen, sonst wird das noch sehr holprig.
DLSS5 gibt ja schon einmal einen guten Vorgeschmack auf die künftige Entwicklung.
 
DLSS basiert auf KI. Ein DLSS Frame ist demzufolge ein KI-Bild.
Wenn DLSS nicht mit KI arbeiten würde, dann wäre ein DLSS Frame kein KI-Bild.
Das ist Marketingspeach, außerdem habe ich nie geschrieben dass DLSS SR kein AI nutzt. Es geht darum wo AI genutzt wird und das ist, wie schon beschrieben, beim Training des Algorithmus.

Wie soll das auch sonst funktionieren? Das Spiel rendert in einer geringeren Auflösung und die AI denkt sich den Rest dann aus, oder wie? Bei DLAA passiert dann was? Warum nutzt DLSS SR dann überhaupt die Informationen aus vorherigen Frames? Und und und. So viele Fragen :D
 
Das ist Marketingspeach, außerdem habe ich nie geschrieben dass DLSS SR kein AI nutzt. Es geht darum wo AI genutzt wird und das ist, wie schon beschrieben, beim Training des Algorithmus.

Wie soll das auch sonst funktionieren? Das Spiel rendert in einer geringeren Auflösung und die AI denkt sich den Rest dann aus, oder wie? Bei DLAA passiert dann was? Warum nutzt DLSS SR dann überhaupt die Informationen aus vorherigen Frames? Und und und. So viele Fragen :D
Ich breche das mal grob runter.

NV hat einen Cluster, welcher ein Künstliches Neuronales Netzwerk aufrecht erhält.
Dieses Netzwerk nimmt als Input niedrig aufgelöste Bilder und vergleicht diese mit den gleichen, hoch aufgelösten Bildern um zu lernen, was man der lowRes Variante hinzufügen muss um bei der highRes Variante zu landen.

Wenn man dieses Prozess nur lange genug ausführt und mit sehr viel Bildmaterial füttert erhält man ein Modell, welches mit einer besonders hohen Treffsicherheit schätzen kann, welche Bildinformationen in einem lowRes Frame fehlen, um auf einen highRes Frame zu kommen.

Dieses Modell packt man in den DLSS Treiber, welcher dann lokal auf einer GPU ausgeführt wird. Dieser Treiber/das Modell ist aber kein stupider Algorithmus, sondern eine Anleitung, welche abhängig vom Input mit hoher Wahrscheinlichkeit den korrekten Output erarbeitet (Inferencing).

Algorithmus: Wenn A, dann B.
Inferencing: Wenn A, wie wahrscheinlich ist B.

Dafür benötigt man spezifische Hardware, welche NV in Form der Tensor-Kerne implementiert hat. Die sind ausschließlich für Matrix-Multiplikationen zu gebrauchen und stützen das Inferencing.

Wäre DLSS ein simpler Algorithmus, dann könnte man es ja auch einfach auf Cuda Kernen laufen lassen und müsste nicht explizit spezielle HW implementieren.

Einfacher gesagt: NV erarbeitet im Cluster das "Wissen" wie man Frames skaliert und die Grafikkarte wendet das "Wissen" an, um Frames zu skalieren.

Das ist etwa vergleichbar damit, dass sich jemand aus einem Buch Wissen aneignet und dieses Wissen dann auf seine eigenen Problemstellungen anwendet. Damit folgt die Person dann auch nicht einem Algorithmus, sondern muss lokal abschätzen, wie dieses Wissen anzuwenden ist. Auch wenn von ihr selber keine Leistung erbracht wurde, um das Wissen aufzubauen, ist es intelligent, das Wissen spezifisch und korrekt anzuwenden.

Damit ist DLSS ein KI Scaler und ein DLSS Frame ein KI Bild.

Und die Informationen, welche DLSS aus dem vorherigen Frame nutzt sind Bewegungsvektoren. Dabei legt man Fixpunkte in den Frame und verfolgt deren Verlauf um abschätzen zu können, wo die jeweiligen Objekte im zukünftigen Frame sein müssten. Das ist unumgänglich, weil es sonst passiert, dass eine starke Diskrepanz zwischen Ist und Soll auftritt, was sich in Ghosting und Artefakten niederschlägt. Beispielsweise sieht man an Video-Modellen, welche keine Bewegungsvektoren zur Verfügung haben besonders gut, wie der Output darunter leidet.
 
Damit ist DLSS ein KI Scaler und ein DLSS Frame ein KI Bild.
Ich glaube wir haben komplett unterschiedliche Ansichten was das Wort "generiert" bedeutet ^^

Für mich heißt generieren etwas komplett Neues zu erzeugen. Genau das passiert bei DLSS SR aber nicht. Die Infos sind alle da. Sie werden nur aus vielen vorherigen Frames "zusammengesucht" und dann zusammengeführt.
 
Ich glaube wir haben komplett unterschiedliche Ansichten was das Wort "generiert" bedeutet ^^

Für mich heißt generieren etwas komplett Neues zu erzeugen. Genau das passiert bei DLSS SR aber nicht. Die Infos sind alle da. Sie werden nur aus vielen vorherigen Frames "zusammengesucht" und dann zusammengeführt.
So wie ich das verstehe, meinst du mit "Generieren" das Training des Modells, welches im Cluster stattfindet.

DLSS ist aber ein temporales Inference-Model, welches darauf trainiert wurde, aus Bildern mit niedriger Auflösung ein Bild mit hoher Auflösung zu schätzen und ist das Ergebnis der Arbeit, welche der Cluster gemacht hat.

Inference bedeutet in diesem Fall, dass das lokale Modell mit dem antrainierten Wissen abschätzen kann, wie ihm unbekannte Bilder (deine nativen, lowRes Renderframes) auf eine höhere Auflösung gebracht werden können.
Das findet in Echtzeit auf deiner GPU statt, welche mit ML-Accelerators (Tensor-Cores) diese Aufgabe ausführt.

Im Gegensatz zu TAAU/TSR ist DLSS kein statischer Algorithmus, sondern ein dynamischer Ansatz, welcher nicht mit einer strikten Vorgabe (Wenn dies, dann das) arbeitet, sondern das wahrscheinlichste Ergebnis abschätzt.

DLSS arbeitet auch mit Informationen aus den vorherigen Frames um ein ruhigeres Ergebnis zu erhalten. Dafür gibt es den History-Buffer in welchem alte Frames abgespeichert werden und die Motion-Vectors. Wenn du beispielsweise einen Zaun in großer Entfernung renderst, dessen Maschen unter einem Pixel Breite sind, dann hast du mal eine geschlossene und dann wieder eine unterbrochene Linie. Mit diesen Infromationen kann das ML-Modell besser abschätzen, wie der Zaun eigentlich aussehen müsste. Aber da wird dann trotzdem nicht generisch interpoliert, sondern für jeden Frame erneut abgeschätzt, ob die Informationen noch zutreffen.

Im Prinzip kannst du dir DLSS wie ChatGPT vorstellen, welches lokal auf deiner GPU ausgeführt wird und nur für diesen einen Zweck des Scalings dient, was es sehr effizient macht.
Mit jedem Render-Frame fragt der Postprocessor das Modell: "Wie sieht dieser QHD Frame in UHD, unter berücksichtigung der letzten Frames aus?"
Dann erledigt das Modell die Anfrage mit allem Drum und Dran und gibt seine Abschätzung zurück.

Und weil das Modell im Laufe der Zeit immer besser darin wurde, eine gute Schätzung zu liefern, hat sich die Bildqualität bei DLSS immer weiter erhöht. Salopp gesagt wird einfach klüger geraten, welche Elemente dem Bild hinzugefügt werden müssen um ein gutes Ergebnis zu bekommen.
 
So wie ich das verstehe, meinst du mit "Generieren" das Training des Modells, welches im Cluster stattfindet.
Nein, ich meine genau das was ich geschrieben habe ^^

Inference bedeutet in diesem Fall, dass das lokale Modell mit dem antrainierten Wissen abschätzen kann, wie ihm unbekannte Bilder (deine nativen, lowRes Renderframes) auf eine höhere Auflösung gebracht werden können.
Nein eben nicht, das würde ja bedeuten DLSS schaut sich das vorhandene gerenderte Bild an und generiert daraus ein höher aufgelöstes. Genau das passiert aber nicht. Alleine schon aus Gründen der Latenz wäre das völlig unmöglich.

Hier beschreibst du es ja im Grunde sogar:
Im Gegensatz zu TAAU/TSR ist DLSS kein statischer Algorithmus, sondern ein dynamischer Ansatz, welcher nicht mit einer strikten Vorgabe (Wenn dies, dann das) arbeitet, sondern das wahrscheinlichste Ergebnis abschätzt.
Das heißt aber nicht dass DLSS SR jetzt ein Bild generiert, sondern es werden die Bildinformationen aus vielen kumulierten Bildern zusammengenommen und der Algorithmus setzt diese Informationen dann wieder zusammen.

Das ist eben kein ChatGPT, dem ein paar Prompts mitgegeben werden und daraus wird dann ein fertiges Bild generiert. DLSS SR generiert auch keine Inhalte aus dem nichts. Das sind alles vorhandene Infos die aus vorherigen Frames gezogen werden.
 
Nein eben nicht, das würde ja bedeuten DLSS schaut sich das vorhandene gerenderte Bild an und generiert daraus ein höher aufgelöstes. Genau das passiert aber nicht. Alleine schon aus Gründen der Latenz wäre das völlig unmöglich.
Warum sollte das die Latenz großartig nach oben gehen. DLSS braucht doch nur ein paar ms.

Ist ja nicht wie bei FrameGen wo man warten muss bis der bereits gerenderte Frame ausgegeben werden darf.
 
Nein eben nicht, das würde ja bedeuten DLSS schaut sich das vorhandene gerenderte Bild an und generiert daraus ein höher aufgelöstes. Genau das passiert aber nicht. Alleine schon aus Gründen der Latenz wäre das völlig unmöglich.
Natürlich passiert das, irgendwo müssen die Infos für die Lücken ja herkommen. Wenn du von FHD auf UHD gehst, fehlen dir 75% des Bildinhaltes. Sonst wäre DLSS ja nur statisches TAA mit Jittering...

Das Inferencing dauert auf einer 5090 so ca. 0,5-1ms, dann ist der Frame fertig.

Das heißt aber nicht dass DLSS SR jetzt ein Bild generiert, sondern es werden die Bildinformationen aus vielen kumulierten Bildern zusammengenommen und der Algorithmus setzt diese Informationen dann wieder zusammen.

Das ist eben kein ChatGPT, dem ein paar Prompts mitgegeben werden und daraus wird dann ein fertiges Bild generiert. DLSS SR generiert auch keine Inhalte aus dem nichts. Das sind alles vorhandene Infos die aus vorherigen Frames gezogen werden.
Es wird nicht aus dem nichts generiert, sondern auf Grundlage des LowRes-Frames, den Infos aus den vorangegangenen Frames und den erzeugten Motion-Vectors.

Und wenn DLSS kein Inferencing-Model sein soll, wofür braucht deine GPU dann überhaupt ML-Accelerators mit 3,3k TOPS Leistung bei INT8, welche ausschließlich für ML genutzt werden können? Der gesamte Render-Stack kann mit Matrix-Multiplikation sonst ja gar nichts anfangen.

Wird bei Frame-Gen auch kein Zwischen-Bild generiert?
 
Es wird nicht aus dem nichts generiert, sondern auf Grundlage des LowRes-Frames, den Infos aus den vorangegangenen Frames und den erzeugten Motion-Vectors.
Ich bleibe dabei, wir haben einfach unterschiedliche Definitionen von "generieren". Im Kern meinen wir aber das gleiche denke ich.
Und wenn DLSS kein Inferencing-Model sein sol
Keine Ahnung wo ich das bestritten habe ^^
 
Ich will dich ja nicht ärgern, aber meine beiden GPUs aus der Klasse laufen geschmeidig bei 3,25Ghz durchgehend im Gaming. Sowohl die 5070 Ti TUF als auch meiner verkaufte 5080 Gamerock.
Meine Gigabyte rockt auch mit 3,25Ghz im max Gameprofil. Allerdings nutze ich das eigentlich nie, aktuell läuft se mit UV Profil sparsam vor sich hin.
 
Was ich schlimm finde ist das seit der RTX 2000er Serie Spulenfiepen als normal wahrgenommen wird,
ich finde es unter allem das so ein "Fehler" tolleriert wird seitens Kundschaft.

Auch meine 2060 ist davon betroffen, das einfachste Mittel,
Turbotakt Ratio runter um 15% und stille bzw bei offenem GH nur noch leises Surren.

Aber es ist ein Witz man muss sich seitens der Leistung die man gekauft hatte selbst auf 15% verzichten um dem Lärm der Spannungsversorgung Herr zu werden.

Und da wird es interssant wie man als Kunde einer 500,700,1000€ Karte sowas akzeptieren kann :-$ :devil:
 
Zuletzt bearbeitet:
Was ich schlimm finde ist das seit der RTX 2000er Serie Spulenfiepen als normal wahrgenommen wird,
Das gibt es schon immer und ja ich finde das auch extrem ungeil.
Aber es ist ein Witz man muss sich seitens der Leistung die man gekauft hatte selbst auf 15% verzichten um dem Lärm der Spannungsversorgung Herr zu werden.
Wie du auf die 15% kommst ist mir wiederum ein Rätsel. Meine 5090 ist auf 0,89V bei 2745MHz (in Spielen liegt damit meist ca 2650MHz an) undervolted und zusammen mit dem VRam OC auf 16000MHz lande ich damit ziemlich genau bei Stock Leistung.
 
Zurück