• Hallo Gast, du kaufst gerne günstig ein und erfährst oft vor deinen Freunden von interessanten Angeboten? Dann kannst du dein Talent als Schnäppchenjäger jetzt zu Geld machen und anderen PCGH-Lesern beim Sparen helfen! Schau einfach mal rein - beim Test der Community Deals!

Geforce RTX 3070 Ti und 3080 Ti: Erneute Verschiebung?

Gurdi

Kokü-Junkie (m/w)
Doch, ergibt es. Man benötigt eine schnellere Pipeline zwischen SSD -> RAM / VRAM mit deutlich erhöhten IO Rates um SFS zu ermöglichen. Bevor ich hier wieder einen Roman schreibe, bitte einfach folgenden MS Dev-Blog anschauen:
Ein Desktopsystem hat bereits die schnellste Pipeline, zum hundersten mal. Der Vorteil an DS ist dass man die Texturen erst on the fly decomprimieren muss währen diese IN DEN VRAM geschrieben werden und zwar selbstverständlich entkomprimiert! Die Übertragunsrate von der SSD in den Speicher spielt keine Rolle im Shadingprozess, es geht hierbei ausschließlich um Sachen wie Ladezeiten, verrringerung von Latenzen durch Signalwegverkürzung, reduktion der Größe eines Spiels (weil Texturen stärker komprimiert werden können) sowie reduzierung von Overhead indem man die CPU entlastet.

Du solltest deine Links lieber mal selber konsultieren.

Alles andere dichtest du dir dazu.
KEINE VRAM ERSPARNIS
KEIN STREAMING VON DER SSD, alles läuft weiterhin über den RAM.


Das Laden von Daten aus der SSD in den Vram macht beim Laden eines Spiel Sinn, kann dazu auch genutzt werden. Hier umgeht man dann tatsächlich den Systemspeicher. Hierbei geht es aber auch nur um das füllen des Vram damit die Anwendung starten kann.
 

raPid-81

Freizeitschrauber(in)
Ein Desktopsystem hat bereits die schnellste Pipeline, zum hundersten mal. Der Vorteil an DS ist dass man die Texturen erst on the fly decomprimieren muss währen diese IN DEN VRAM geschrieben werden und zwar selbstverständlich entkomprimiert! Die Übertragunsrate von der SSD in den Speicher spielt keine Rolle im Shadingprozess, es geht hierbei ausschließlich um Sachen wie Ladezeiten, verrringerung von Latenzen durch Signalwegverkürzung, reduktion der Größe eines Spiels (weil Texturen stärker komprimiert werden können) sowie reduzierung von Overhead indem man die CPU entlastet.

Du solltest deine Links lieber mal selber konsultieren.

Alles andere dichtest du dir dazu.
KEINE VRAM ERSPARNIS
KEIN STREAMING VON DER SSD, alles läuft weiterhin über den RAM.


Das Laden von Daten aus der SSD in den Vram macht beim Laden eines Spiel Sinn, kann dazu auch genutzt werden. Hier umgeht man dann tatsächlich den Systemspeicher. Hierbei geht es aber auch nur um das füllen des Vram damit die Anwendung starten kann.
Ok, dann erkläre mir bitte diese Folie aus dem MS Dev Blog:

x-times-more-memory.png

Insbesondere die Punkte:
- Better memory efficiency through data selectiveness with Sampler Feedback
- Makes it look like your GPU has x times more memory than what's physically available

Das hab ich mir nicht ausgedacht, das kann man GENAU SO im oben verlinkten Video anschauen.

Bitte zitiere doch auch die Stellen aus den Dev Blogs die Du vermeintlich gelesen hast wo Deine Argumente belegt werden. Ich habe meine ja bereits mehrfach durch Zitate belegt.
 

Gurdi

Kokü-Junkie (m/w)
Ja das ist deine Lieblingsfolie worum du dein Konstrukt errichtet hast.
- Better memory efficiency through data selectiveness with Sampler Feedback
Memory=Speicher, nicht Vram. Memory ist dann übertragbar auf den Einsatzort, am Rechner der Systemspeicher, auf einer Konsole der Datenträger.
- Makes it look like your GPU has x times more memory than what's physically available
Das bezieht sich auf die schnelle Umschichtung, damit ist es möglich Levelabschnitte und offene Welten granularer zu gestalten. Das beschleunigte Streamingsystem ist eine gute Sache. Daten liegen kleiner auf der Platte, können schneller abgerufen werden und mit weniger Aufwand bzw. schneller entpackt werden.

Das hat aber alles nichts mit dem Vram zu tun, da liegt was akut gebraucht wird und nur da, wirklich NUR DA ist es schnell genug. Die Performance einer GPU hängt direkt an der Copyrate des Speichers UND die GPU dekomprimiert sich ja sogar dann selbst die Daten. Wo soll die die ablegen außer in dem Vram, von dort aus liest diese die Daten wieder.

Das Gegenteil ist am Ende der Fall. Größere Welten, granuläre Aufteilung führen am Ende eher zu mehr Vram Bedarf da man viel mehr Daten verarbeiten kann.
 

raPid-81

Freizeitschrauber(in)
Ja das ist deine Lieblingsfolie worum du dein Konstrukt errichtet hast.

Memory=Speicher, nicht Vram. Memory ist dann übertragbar auf den Einsatzort, am Rechner der Systemspeicher, auf einer Konsole der Datenträger.

Das bezieht sich auf die schnelle Umschichtung, damit ist es möglich Levelabschnitte und offene Welten granularer zu gestalten. Das beschleunigte Streamingsystem ist eine gute Sache. Daten liegen kleiner auf der Platte, können schneller abgerufen werden und mit weniger Aufwand bzw. schneller entpackt werden.

Das hat aber alles nichts mit dem Vram zu tun, da liegt was akut gebraucht wird und nur da, wirklich NUR DA ist es schnell genug. Die Performance einer GPU hängt direkt an der Copyrate des Speichers UND die GPU dekomprimiert sich ja sogar dann selbst die Daten. Wo soll die die ablegen außer in dem Vram, von dort aus liest diese die Daten wieder.

Das Gegenteil ist am Ende der Fall. Größere Welten, granuläre Aufteilung führen am Ende eher zu mehr Vram Bedarf da man viel mehr Daten verarbeiten kann.
Du kannst also keine einzige Stelle in einem Dev Blog zitieren die Deine Argumente belegt. Na wer hätte das gedacht.

Und nein, mit Memory ist an dieser Stelle der VRAM gemeint, darauf bezieht sich nämlich die gesamte Folie:
Increase in game memory needs faster than increase in VRAM on GPUs
Das wird noch mal bestätigt durch den Punkt:
Better memory efficiency through data selectiveness with Sampler Feedback
Bei Minute 27 in dem verlinkten Video sagt Andrew Yeung explizit:
what it really looks like is, if instead you have a 10GB GPU it looks like you have a 20GB GPU


Und hier noch mal wie man es genau implementiert, MS Dev Blog: Link

How to adopt Sampler Feedback for Streaming​

To adopt SFS, an application does the following:

  • Use a tiled texture (instead of a non-tiled texture), called a reserved texture resource in D3D12, for anything that needs to be streamed.
  • Along with each tiled texture, create a small “MinMip map” texture and small “feedback map” texture.
    • The MinMip map represents per-region mip level clamping values for the tiled texture; it represents what is actually loaded.
    • The feedback map represents and per-region desired mip level for the tiled texture; it represents what needs to be loaded.
  • Update the mip streaming engine to stream individual tiles instead of mips, using the feedback map contents to drive streaming decisions.
  • When tiles are made resident or nonresident by the streaming system, the corresponding texture’s MinMip map must be updated to reflect the updated tile residency, which will clamp the GPU’s accesses to that region of the texture.
  • Change shader code to read from MinMip maps and write to feedback maps. Feedback maps are written using special-purpose HLSL constructs.

Man benötigt also "tiled textures". Und wofür benötigt man die tiled anstatt komplett? Riiichtig, damit man nur Teile der Textur laden kann die benötigt werden anstatt die gesamte Textur. Und jetzt hör bitte auf mit den wilden Behauptungen, ohne jeglichen Beweis durch Quellen. Da kommt nämlich weiterhin nichts...
 
Zuletzt bearbeitet:

Birdy84

Volt-Modder(in)
Wieso sollte es sich nicht lohnen die Daten von der SSD direkt in den VRAM zu schaufeln? Die Geschwindigkeit SSD -> VRAM ist doch dieselbe wie SSD -> RAM, man spart sich durch den direkten Weg in den VRAM eine ganze Station.
Der Vorteil von Transfer aus RAM Richtung GPU ist die niedrigere Zugriffszeit und die höhere maximale Bandbreite.

DirectStorage macht es aber so wie Du sagst, von der SSD -> RAM -> VRAM und die GPU dekomprimiert die Daten.
RTX IO dagegen nimmt nicht den Umweg über den RAM. Wenn SFS funktioniert, wie in der Techdemo zu sehen, dann reicht eben eine PCIe 3.0 M2 SSD für das direkte Streaming on-time.
Genau, rechtzeitig für zum Start des Rendervorgangs muss die (Teil-)Textur entpackt im Grafikspeicher liegen.


Wo behaupte ich das denn? Zum letzten Mal: DirectStorage enabled überhaupt erst SFS. Siehe hier, direkt aus einem MS Dev Blog:
Das stimmt so nicht ganz. Im Video wird gesagt, dass SFS zuerst für den PC kommt und erst später durch DS ergänzt wird. Die Systeme haben keine Abhängigkeit.
Es geht im der ganzen Präsi hauptsächlich darum die passenden Daten schneller zu laden, nicht um Zwischenspeicher zu sparen. Durch DS wird auch nicht an Speicherplatz gespart, lediglich an Bandbreite, da die Daten (erst) im VRAM entpackt werden.
Klar letzten Endes geht es bei SFS und DS um effizientere Nutzung der Hardware. Gegen Ende sagt er aber auch, dass der Speicherbedarf (im Hinblick auf VRAM) sich schneller entwickelt als die Speicherausstattung der Hardware.
Unterm Strich können wir (Spieler) uns alle darüber freuen, ich sehe die Techniken aber nicht als Erklärung an, warum Nvidia mit der Speichermenge knausert.

Edit:
Im Endeffekt geht es um eine gesteigerte Effiziens. Man erreicht entweder gleiche Bildqualität bei geringerem Speicherverbrauch oder bessere BQ bei gleichem Speicherverbrauch.
 
Zuletzt bearbeitet:

raPid-81

Freizeitschrauber(in)
Unterm Strich können wir (Spieler) uns alle darüber freuen, ich sehe die Techniken aber nicht als Erklärung an, warum Nvidia mit der Speichermenge knausert.
Zwei offensichtliche Punkte sind: Powerbudget + Pricing. Mehr VRAM will auch ein paar Watt, und umsonst ist er nicht.

Weiterer möglicher Punkt: Nvidia arbeitet eng mit MS (RTX IO und DS sind ja nicht von allein so nah beieinander) zusammen. MS baut in seine XBox Series X 10 GB VRAM ein, in die Series S 8 GB. RTX 3080 = 10 GB, 3070 = 8 GB. Auf diese VRAM Größen müssen sich also alle Entwickler einstellen wenn sie ein Cross-Platform-Game entwickeln.

DS+SFS sind Microsofts Lösung für wenig VRAM. Die Target Auflösung der Series X ist ja 4K nativ, die werden sich bei den 10 GB also was gedacht haben.
 

seahawk

Volt-Modder(in)
Naja, ich würde auch sagen, dass die XboX X so etwas wie des "saving grace" der 3080 ist, weil sicherlich viele engines auf 10GB hin optimiert werden. Wenn man allerdings die 8GB der 3070 auf Grundlage der lahmen Xbox S als akzeptabel ansieht, dann ist das leider falsch, denn die 3070 hat viel zu viel Rechenleistung um auf dem Level limitiert zu sein.
 

Gurdi

Kokü-Junkie (m/w)
Naja, ich würde auch sagen, dass die XboX X so etwas wie des "saving grace" der 3080 ist, weil sicherlich viele engines auf 10GB hin optimiert werden. Wenn man allerdings die 8GB der 3070 auf Grundlage der lahmen Xbox S als akzeptabel ansieht, dann ist das leider falsch, denn die 3070 hat viel zu viel Rechenleistung um auf dem Level limitiert zu sein.
Mann kann das Speichermanagment der Konsolen nicht wirklich mit dem vom PC vergleichen.
 

deady1000

Volt-Modder(in)
Naja, ich würde auch sagen, dass die XboX X so etwas wie des "saving grace" der 3080 ist, weil sicherlich viele engines auf 10GB hin optimiert werden.
Hat die 3080 gar nicht nötig, weil Spiele auf WQHD und selbst auf 4K selten auch nur annähernd 9-10GB fressen und ich wüsste auch nicht was sich daran in absehbarer Zeit ändern sollte. Da müsste man schon mutwillig eine Textur-Orgie anzetteln. Ausnahmen bestätigen natürlich die Regel, zB Simulationen, wobei hier in erster Linie allokiert wird. RT-Titel haben DLSS, was den Speicherbedarf oftmals um mehrere GB herabsetzt. Aber jetzt mal ohne Scheiß, die 3080 wird in ihrer Lebensspanne von 2-4 Jahren beim Otto Normalverbraucher keine großartigen Speicherprobleme verursachen. Ist zwar etwas auf Kante genäht, aber ich höre eigentlich keine Beschwerden aus der Besitzer-Community.
 

Gurdi

Kokü-Junkie (m/w)
Aber jetzt mal ohne Scheiß, die 3080 wird in ihrer Lebensspanne von 3-4 Jahren beim Otto Normalverbraucher keine großartigen Speicherprobleme bekommen.
Solange man die WQHD nutzt nicht, wobei die Karte dafür eigentlich nicht wirklich optimal ist.
Viel problematischer sind 60ti und die 70er. Die rennt bei mir heute schon out of Ram.
 

deady1000

Volt-Modder(in)
Solange man die WQHD nutzt nicht, wobei die Karte dafür eigentlich nicht wirklich optimal ist.
Selbst auf 4K bzw WQHD mit SS machen die 10GB selten Probleme. Die RTX3080 ist aber schon gut geeignet für WQHD. Für FHD hat sie deutlich zu viel Speicher, für WQHD auch noch mit Reserve und für 4K meistens auch passend, kann aber teilweise recht knapp werden. Kommt halt drauf an, ob man das überhaupt bemerkt.

Viel problematischer sind 60ti und die 70er. Die rennt bei mir heute schon out of Ram.
Ich sage mal, nur weil das Monitoring sagt "Speicher voll" heißt das noch lange nicht, dass es schlimm bzw spürbar ist. Wenn man Nachladeruckler bekommt, dann okay. 8GB sind halt schon nicht mehr so richtig zeitgemäß für moderne Spiele. Naja, wenn man sich eine Mid-Range-Grafikkarte kauft, dann muss man auch im Spiel die Texturen nicht auf "ultra" stellen. Man stirbt nicht, nur weil man die Texturen um eine Stufe zurücknimmt. ^^ Die relevanten Dinge sind meist trotzdem hochauflösend.
 

Gurdi

Kokü-Junkie (m/w)
Ich sage mal, nur weil das Monitoring sagt "Speicher voll" heißt das noch lange nicht, dass es schlimm bzw spürbar ist.
Die 70er hängt ja am TB Anschluss, da passiert es je Anwendung sogar dass die Anwendung einfach crasht.
Auch sonst merke ich das viel deutlicher als bei einem normalen System. Soviel übrigens zu streaming über 4x3.0.
Da ist der Leistungsverlust noch nicht mit drin der auch mal gut und gerne 50% betragen kann bei hohen Fps.
 

deady1000

Volt-Modder(in)
Also du sagst, dass das Ding nur mit Thunderbolt angeschlossen ist, schiebst es aber auf den Speicher, dass es schlechter läuft als mit einem normalen System? :ugly:
 

raPid-81

Freizeitschrauber(in)
Die 70er hängt ja am TB Anschluss, da passiert es je Anwendung sogar dass die Anwendung einfach crasht.
Auch sonst merke ich das viel deutlicher als bei einem normalen System. Soviel übrigens zu streaming über 4x3.0.
Da ist der Leistungsverlust noch nicht mit drin der auch mal gut und gerne 50% betragen kann bei hohen Fps.
Puh, jetzt wird hier aber ordentlich getrickst damit Du "Recht hast". Kommt man mit dem Thema dass 8 GB für WQHD ausreichen sagst Du "ne, sieht man an der RTX 3070", kommt man mit dem Thema "SFS+DS" sagst Du "man sieht anhand meiner 3070 per TB dass die Übertragungsrate nicht ausreicht". Also entweder liegt es an den 8 GB der RTX 3070 oder am PCIe 3.0 x4 Anschluss, Du machst es Dir halt passend wie Du es brauchst. :ugly:
 

Gurdi

Kokü-Junkie (m/w)
Also entweder liegt es an den 8 GB der RTX 3070 oder am PCIe 3.0 x4 Anschluss, Du machst es Dir halt passend wie Du es brauchst.
Da sieht man mal wieder dass du absolut keine Ahnung von dem Thema hast, wenn ich out of Memory laufe muss ich mehr streamen, kann die Engine nicht schnell genug streamen, hackt es, es gibt slowdowns oder im worst case nen Crash.

Der TB 3 verdeutlicht das Problem lediglich.
 

deady1000

Volt-Modder(in)
Kann doch die arme RTX3070 nichts dafür, dass du sie statt mit PCIe4.0x16 nur mit PCIe3.0x4 anschließt. Das ist ein künstliches Bottleneck. Die Probleme fallen wahrscheinlich nur auf, weil die Karte "unsachgemäß" angebunden ist.

Theoretische Geschwindigkeiten:
PCIe3.0x4 = 4 GB/s
PCIe4.0x16 = 32 GB/s

Und da wunderst du dich, dass es laggt, wenn die Karte aufgrund ausgelastetem Speicher mal nachladen muss? Mit normaler Anbindung würde man möglicherweise keine Probleme feststellen. Von daher sind deine Schlussfolgerungen schon sehr fragwürdig.
 

Gurdi

Kokü-Junkie (m/w)
Kann doch die arme RTX3070 nichts dafür, dass du sie statt mit PCIe4.0x16 nur mit PCIe3.0x4 anschließt. Das ist ein künstliches Bottleneck. Die Probleme fallen wahrscheinlich nur auf, weil die Karte "unsachgemäß" angebunden ist.

Theoretische Geschwindigkeiten:
PCIe3.0x4 = 4 GB/s
PCIe4.0x16 = 32 GB/s

Und da wunderst du dich, dass es laggt, wenn die Karte aufgrund ausgelastetem Speicher mal nachladen muss? Mit normaler Anbindung würde man möglicherweise keine Probleme feststellen. Von daher sind deine Schlussfolgerungen schon sehr fragwürdig.
Ja aber das spielt doch keine Rolle, der Speicher ist voll. Egal wie das angebunden ist. Es verdeutlicht lediglich den Umstand.
 

seahawk

Volt-Modder(in)
Hat die 3080 gar nicht nötig, weil Spiele auf WQHD und selbst auf 4K selten auch nur annähernd 9-10GB fressen und ich wüsste auch nicht was sich daran in absehbarer Zeit ändern sollte. Da müsste man schon mutwillig eine Textur-Orgie anzetteln. Ausnahmen bestätigen natürlich die Regel, zB Simulationen, wobei hier in erster Linie allokiert wird. RT-Titel haben DLSS, was den Speicherbedarf oftmals um mehrere GB herabsetzt. Aber jetzt mal ohne Scheiß, die 3080 wird in ihrer Lebensspanne von 2-4 Jahren beim Otto Normalverbraucher keine großartigen Speicherprobleme verursachen. Ist zwar etwas auf Kante genäht, aber ich höre eigentlich keine Beschwerden aus der Besitzer-Community.
Ich sagte ja, die 3080 geht noch, eine 3070ti hingegen geht imho nicht. Gerade wenn man bedenkt, dass eine 3060 12GB hat.
 

raPid-81

Freizeitschrauber(in)
Da sieht man mal wieder dass du absolut keine Ahnung von dem Thema hast, wenn ich out of Memory laufe muss ich mehr streamen, kann die Engine nicht schnell genug streamen, hackt es, es gibt slowdowns oder im worst case nen Crash.

Der TB 3 verdeutlicht das Problem lediglich.
Danke, damit bestätigst Du mich in allen Punkten. Eine aktuelle Streaming-Engine ist darauf angewiesen alle Texturen einer Szene vorzuladen, deswegen bekommt die Karte mit 8 GB an einer PCIe 3.0 x4 Anbindung Probleme. Die Daten sind zu groß und dazu nicht selektiert, es muss also zu viel in zu kurzer Zeit auf der Anbindung übertragen werden.

Enter SFS+DS: DS verbessert das Streaming deutlich da es die IO Rates massiv erhöht und den CPU Overhead reduziert. Durch SFS müssen nur noch die sichtbaren Teile der Texturen gestreamt werden, somit wird die Datenmenge stark verkleinert. Sieht man ja alles oben im Video. :D
 
Oben Unten