Special Nie wieder Ladezeiten? Direct Storage im ersten Test mit Radeon, Geforce und Arc

Der letzte Stand ist tatsächlich "ab RTX", also Turing/RTX 20 und neuer. Diese Geräte werden im Herbst fünf Jahre alt.


Fest installierter, flüchtiger Flash-Speicher. ;)

MfG
Raff
Eventuell würde es theoretisch auch auf älteren GPUs laufen - das ist ein Bestandteil von DirectX 12, ich bin mir aber nicht sicher, welchen Tier beim Memory Access das benötigt (es gibt aktuell Tier 3 mit DirectX 12 Ultimate).
Wenn es nur Tier 2 voraussetzt (was angesichts der PC-Radeons technisch etwas älteren Konsolen-Chips vielleicht gar nicht so abwegig wäre - wobei die natürlich auch Anpassungen erhalten haben und nur die Xbox Series DirectX und Direct Storage nutzt. Die PS5 nutzt eine eigene Variante, Direct Storage ist ja keine neue Idee), würde auch Direct X 12.0 reichen und theoretisch sogar Maxwell funktionieren.

Aber selbst dann: Das würde nicht bedeuten, dass dann auch die Nvidia-API damit funktioniert. Die können mit ihrer Schnittstelle und dem Support natürlich handverlesen, welche GPUs sie unterstützen können und wollen. Und da würde ich mal schwer davon ausgehen, dass nur RTX-GPUs unterstützt werden, wenn Nvidia das Teil schon "RTX IO" nennt (haben sie früher btw. nicht, es hieß mal GPUDirect - aber das sollte an der Stelle wohl auch eher Profis ansprechen, nicht Gamer. Ist wohl tendenziell gewinnfördernd umgebrandet worden).

Ich würde jedenfalls mal davon ausgehen, dass man da halbwegs aktuelle GPUs braucht - warum noch die alten unterstützen, das ist nicht sonderlich praktikabel, wenn man neue Grafikkarten verkaufen möchte (wenn einen da nicht die Konkurrenz in Bredouille bringt, indem die es tun). Und ich habe ein wenig den Eindruck, dass gerade bei den aktuellen Grafikkarten jedes noch so kleine Verkaufsargument geradezu verzweifelt benötigt wird...

Und weil das alles schon wieder nur in Richtung Ladezeiten geht: Wie lange man warten muss, bis das Spiel geladen ist, ist eigentlich eher sowas wie Beifang. Das eigentlich interessant ist das Streaming (also quasi das "Laden" beim eigentlichen Spielen) Da macht die Dekomprimiertung in Laufzeit einen riesigen Unterschied. Da gibt es Engpässe mit immer detaillierteren Meshes, Texturen und Welten, die damit dargestellt werden.

"Bessere Ladezeiten" erzählt man den technisch eher Unbedarften und das kann man natürlich schön in einfach verdaulichen YT-Videos zeigen: Hier läd es 7 Sekunden, da 2 - Geil! Fortschritt!

Aber das ist nicht das eigentlich coole: Das ist das dadurch theoretisch massiv schnellere und gescheidigere Streaming und die verringerte CPU-Last währenddessen - damit kann man dann wiederum nochmals detailliertere Welten darstellen, noch komplexere Berechnungen vornehmen, noch feinauflösendere Texturen mit noch umfangreicheren Shadern streamen. Das ist der eigentliche Vorteil.

Gruß,
Phil
 
Die Technik ist so effizient. Wirst du merken, wenn du anstelle von 60 Frames auf einmal nur noch 59,8 Frames hast? Die Konsolen zeigen doch, dass die Technik wunderbar funktioniert und eben quasi keine Nachteile hat.

Woran machst du das "keine Nachteile" fest? Sicherlich überwiegen bei einem System-RAM-losen System die Vorteile, aber um zu messen, dass es gar keine Nachteile gibt, bräuchte man erst einmal ein Alternativsystem mit RAM aber gleichem Silizium- und Power-Buget für CPU und GPU. Es täte mich sehr wundern, wenn das nicht flotter wäre, denn zum einen ist DS nicht annähernd so schnell wie RAM-Zugriffe und zum anderen hat insbesondere die PS5 einen ziemlich leistungsfähigen Coprozessor für die Dekomprimierung. Und "effizient" ist nicht das gleiche wie "niedriger Stromverbrauch". Wenn man 20-30 W verbrauchende CPU-Kerne durch eine zehnmal effizientere Spezialeinheit ersetzt, um die fünfache Leistung zu erhalten, dann sind das immer noch 10 bis 15 W Power-Budget.

Wiederum gilt: Bei einer Konsole lohnt sich das, denn 15 W minus 30 W in der gleichen APU sind Netto 15 W mehr für andere Aufgaben. Im PC sind 115 W statt 130 W auf einer 200-W-PPT-CPU aber kein Performance-Fortschritt und 15 W extra auf einer mit 300 W von 300 W laufenden GPU ein Rückschritt. Zudem verlangen Entpackvorgänge normalerweise nach viel RAM-Transferrate, das ist einer der Gründe warum Grafikkarten gut dafür geeignet sind, und während die eigentilche Rechenlast teilweise abseits der Shader erledigt wird, hat keine GPU ein extra RAM-Interface für DS.
 
800 finde ich auch unbezahlbar für eine festplatte. wenn ich bei jedem teil so denken würde dann wäre man schnell auf 10000€
Du darfst es ja gerne finden, wie Du willst. Aber wie MADman_One es richtig sagte:
2. "Unbezahlbar" ist ein sehr subjektiver Begriff.
Wenn Du oder andere es nicht bezahlen wollt oder könnt, ist es was anderes, als es als Tatsachenbehauptung hinzustellen. Unbezahlbar ist nichts, sondern an sich immer nur die Frage, ob es für einen zu diesem Preis wert ist.

Und wenn man 800 € für unbezahlbar hält, frage ich mich, was das für Lebensumstände sein sollen, die so eine Bezeichnung rechtfertigen. Schon mal geschaut, was das Leben selbst so kostet? Da sind die 800 € nichts zu anderen Dingen, wenn man zumindest in Deutschland lebt, und Familie mit Kindern, Fahrzeuge, Miet- und Wohneigentum hat, zum Arzt geht, Urlaub, Haustiere...

@PCGH_Torsten

Wenn mir jemand vor Jahren erzählt hätte, daß wir bei aktuellen Techologien uns um Verbrauchszahlen für den Energieverbrauch steiten, hätte ich ihn ausgelacht.
 
Nice, die Games belegen dann später vermutlich wieder nur 6-12GB vom RAM, selbst wenn 32GB oder 64GB (mit ~70GB/s Bandbreite) im System stecken, und wahrscheinlich wird auch eine RTX4090 mit ihren 24GB (~1000GB/s Bandbreite) nicht mal halb befüllt, aber dank Direct-Storage kann das Spiel dann seine Daten direkt von der PCIe-SSD (<15GB/s) nuckeln.

Ich würde mich nicht mal wundern, wenn du 64GB RAM im System hast, das Spiel ~10GB davon belegt, nach einiger Spielzeit Windows im RAM-Cache dann vielleicht 50GB Spieldaten auf Vorrat angesammelt hat, und das Spiel dann trotzdem lieber (die Daten die schon im RAM-Cache liegen) von der SSD laden will.

Solange die Games nicht erstmal ALLES an RAM/VRAM belegen was verbaut ist, und Windows ihnen unter die Nase reibt, machen Techniken um schneller vom Massenspeicher laden zu können mMn weniger Sinn.
 
4,5 Sekunden Einsparung in einer speziellen Demo? Dann können wir ja hoffen, dass davon noch 2,5 Sekunden übrig bleiben in realen Spielen mit 25 Sekunden Ladezeit! :-D

Mir wäre es trotzdem weiterhin lieber, wenn Entwickler einfach mal eine nicht- oder niedrig komprimierte Installation erlauben würden, damit das "Laden" nicht mehr zehnmal so lange dauern muss, wie ein kopieren der gleichen Datenmenge in den RAM. Die GPU könnte sich derweil um andere Dinge kümmern, zum Beispiel Grafik. Oder, wenn es noch kein Grafik zu rendern gibt, um ihre ureigensten Anliegen wie z.B. Shader compiling.
Das erinnert mich an die PS5 Präsentations-Folien. Das schnelle Befüllen des Speichers ist nur möglich dank dem Multiplikationseffekt von Datendurchsatz und Dekompressionsfaktor. Verbreiterung des Bus wär nur eine Addition. Ist auch einfacher mehr Leistung zu finden wenn zwei Stellschrauben hast als eine.
 
Woran machst du das "keine Nachteile" fest? Sicherlich überwiegen bei einem System-RAM-losen System die Vorteile, aber um zu messen, dass es gar keine Nachteile gibt, bräuchte man erst einmal ein Alternativsystem mit RAM aber gleichem Silizium- und Power-Buget für CPU und GPU. Es täte mich sehr wundern, wenn das nicht flotter wäre, denn zum einen ist DS nicht annähernd so schnell wie RAM-Zugriffe und zum anderen hat insbesondere die PS5 einen ziemlich leistungsfähigen Coprozessor für die Dekomprimierung. Und "effizient" ist nicht das gleiche wie "niedriger Stromverbrauch". Wenn man 20-30 W verbrauchende CPU-Kerne durch eine zehnmal effizientere Spezialeinheit ersetzt, um die fünfache Leistung zu erhalten, dann sind das immer noch 10 bis 15 W Power-Budget.

Mit effizient meine ich 1) deutlich schneller 2) weniger Stromverbrauch und 3) Entlastung.

Bisher gehts von der Festplatte doch über die CPU, den RAM und dann in die Grafikkarte bzw. den Grafikspeicher. Mit RTX IO gehts aber dann von der Festplatte direkt in die Grafikkarte bzw. den Grafikspeicher. Du entlastet also massiv die CPU und entsprechend spart man da auch deutlich an Strom ein. Man sollte dort sogar mehr Strom einsparen, als die Mehrarbeit für die Grafikkarte an Strom kostet.

Dazu kommen eben viel größere mögliche Datenmengen als es ein RAM je könnte und eine CPU, die wiederrum andere Aufgaben machen könnte. Ähnliches haben wir ja bei Streaming mit Nvidia Karten gesehen. Über die CPU kostet es verdammt viel Leistung und die Grafikkarte kann das quasi ohne Arbeit fast auf identischem Niveau.

PS: Mehr RAM kostet viel Geld. Eine NVME SSD haben viele bereits verbaut. Dazu ist es mit 32GB oder 64GB RAM auch häufig nicht getan. Dazu kommen andere Probleme mit dem flüchtigen Speicher. Außerdem gehts dann wieder den Umweg über die CPU.

PS2: Die Punkte könnte man ja mal notieren für einen Test mit Forspoken. Scheint ja viele zu interessieren wie sich das alles genau in Gaming auswirkt und nicht nur in der Theorie.
 
@AyC Die Frage, die ich explizit gestellt habe:
Was nützt eingesparter Strom auf der CPU, wenn die GPU schon vorher in ihrem Power Limit hängt und die Performance limitiert?

Zeitnah angeforderte Daten gehen übrigens in Zeiten von rBAR den Weg NVME => CPU => GPU-Speichercontroller > VRAM. Von der GPU ist nur der VRAM-Controller beteiligt und der System-RAM dient nur in gewissem Maße während der Dekomprimierung als Zwischenspeicher, genauso wie GPU-Entpacker die Daten mehrfach aus und in den VRAM schreiben, bis sie entpackt vorliegen. Mit DS ist die Reihenfolge halt NVME => GPU-Decoder > GPU-Speichercontroller > VRAM. Also ebenfalls vier Schritte, eingespart wird lediglich ein PCI-Express-Transfer. Da erwarte ich aber keinen Performance-Schub: Zumindest bei den Konsolen ist von Kompressionsfaktoren im Bereich zwei bis fünf die Rede und die PCI-E-Anbindung von GPUs ist in der Regel viermal, in einigen Systemen achtmal so schnell wie die der SSD. Das heißt komprimiertes Lesen von der SSD ist auch mit DS nicht schneller als entpackte Transfers von der CPU. Vorteile ergeben sich am PC nur, wenn das eigentliche Entpacken auf der GPU schneller als auf der CPU abläuft.

Das setzt aber eben zum Einen voraus, dass die Daten überhaupt entpackt werden. Bereits zuvor genutztes aus dem RAM-Cache zu laden geht viel schneller und CPUs können im System-RAM viel mehr zwischenspeichern, als GPUs in bislang freibleibenden Teilen des VRAMs. Zum Anderen muss man eben im CPU-Limit sein, während die GPU noch Luft in ihrem Power Budget hat. Die meisten Anwender beschweren sich aber eher über das Gegenteil. Daher löst DS in meinen Augen ein Problem, dass der PC gar nicht hat.
 
In der Gamebar sieht man, ob man Direct Storage bereit ist. GTX970 ist unterstützt. Win11 ist bereit. Meine SSDs aber nicht. Schaut mal bei euch mit Pascal und Maxwell.

Gaming Funktionen.png


Vorher war 1080Ti drin. Jetzt aber GTX970.
 
@AyC Die Frage, die ich explizit gestellt habe:
Was nützt eingesparter Strom auf der CPU, wenn die GPU schon vorher in ihrem Power Limit hängt und die Performance limitiert?

Zeitnah angeforderte Daten gehen übrigens in Zeiten von rBAR den Weg NVME => CPU => GPU-Speichercontroller > VRAM. Von der GPU ist nur der VRAM-Controller beteiligt und der System-RAM dient nur in gewissem Maße während der Dekomprimierung als Zwischenspeicher, genauso wie GPU-Entpacker die Daten mehrfach aus und in den VRAM schreiben, bis sie entpackt vorliegen. Mit DS ist die Reihenfolge halt NVME => GPU-Decoder > GPU-Speichercontroller > VRAM. Also ebenfalls vier Schritte, eingespart wird lediglich ein PCI-Express-Transfer. Da erwarte ich aber keinen Performance-Schub: Zumindest bei den Konsolen ist von Kompressionsfaktoren im Bereich zwei bis fünf die Rede und die PCI-E-Anbindung von GPUs ist in der Regel viermal, in einigen Systemen achtmal so schnell wie die der SSD. Das heißt komprimiertes Lesen von der SSD ist auch mit DS nicht schneller als entpackte Transfers von der CPU. Vorteile ergeben sich am PC nur, wenn das eigentliche Entpacken auf der GPU schneller als auf der CPU abläuft.

Das setzt aber eben zum Einen voraus, dass die Daten überhaupt entpackt werden. Bereits zuvor genutztes aus dem RAM-Cache zu laden geht viel schneller und CPUs können im System-RAM viel mehr zwischenspeichern, als GPUs in bislang freibleibenden Teilen des VRAMs. Zum Anderen muss man eben im CPU-Limit sein, während die GPU noch Luft in ihrem Power Budget hat. Die meisten Anwender beschweren sich aber eher über das Gegenteil. Daher löst DS in meinen Augen ein Problem, dass der PC gar nicht hat.
Da war doch ein Windows Software Overhead und IO Problem zuerst - was überhaupt die Entwicklung von direct storage angestossen hat. Das ist ja auch der Grund wieso die NVME SSD's kaum die Ladezeiten verkürzen obwohl Sie deutlich mehr Leistung bieten würden.
 
Ich lasse mich ja gern positiv überraschen, aber das Feature scheint ja eher für Konsolen ideal zu sein denen es einfach an Speicher mangelt.
Ein moderner PC hat heute 8-24 GB Vram und 32-64GB Ram, die sind allesamt zigfach schneller als selbst die schnellste SSD mit etwa 7GB/s am Markt.

Aber klar, man möchte Engines und Spiele nicht unterschiedlich programmieren, der einheitliche Weg via DirectStorage über alle Plattformen hinweg ist vermutlich einfacher.

Interessant wird auch noch sein welche Auswirkungen das Ganze auf das Vram Management hat.
 
Hallo @PCGH_Phil

Was wird in meinem Fall (3 Sata SSDs + 8700K + GTX970) der größte limitierende Faktor beim Laden sein, SSD oder CPU?
Wenns die CPU ist, würde OC helfen, oder höchstens im Zehntelsekundenbereich?

Grüße
Winnie
 
Die Erklärung, warum DS so Vorteilhaft gegenüber bisherigen Verfahren ist, verstehe ich nicht ganz. Ich verstehe, dass deine GPU schneller dekomprimieren kann, in der Praxis sehe ich aber, dass eine GPU tendenziell auch ohne DS viel häufiger vollausgelastet ist, während CPUs mit 6C/12T noch Luft haben und RAM selbst bei modernen Titeln meistens ungenutzt bleibt. Wie kann es da von Vorteil sein mit gradezu lächerlichen 15GB/s (im Bestfall!) von einer SSD zu lesen, während man seit knapp 10 Jahren aus dem (DDR4) RAM mit etwa 70GB/s lesen könnte?

Du vergisst das die Daten erstmal in den RAM rein müssen, dafür muss die CPU mit der SSD die Daten in den RAM schaufeln und dann muss die CPU im RAM die Daten auspacken ... all das fällt weg, weil sich die Grafikkarte direkt von der SSD bedient.

Das ganze könntest Du natürlcih beschleunigen mit einer RAM Disk indem Du das Spiel dort installierst. Aber das wäre flüchtig und Du müsstest bei jedem Neustart das Spiel neu installieren.
 
Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.
 
Da man offensichtlich Windows 11 dafür benötigt, hat sich die Sache direkt für mich erledigt. Mir reicht es, wenn ich mich jeden Tag auf Arbeit damit herumschlagen darf. Mir kommt es beim Rechtsklick-Menü bei der Maus immer noch hoch. :nene:
Gewöhnungssache...
Aber es gibt bestimmt auch Windows Mods, die das rückgängig machen oder?

Ich habe Windows 11 seit 2 Wochen auf dem PC... ich brauche auch noch länger um mich richtig wiederzufinden. -.-
Lustig ist aber auch, das der Unterbau von Windows immernoch derselbe ist. Z.b. Geräte-Manager sieht immernoch so aus wie Win XP...
Bleibt dann die Frage, warum es scheinbar trotzdem die Performance bzw. Ladezeiten deutlich verkleinert? Du hast ja zum Teil ein besseres Spielerlebnis auf der 500€ Konsole als auf dem 3000€ PC.
Optimierung. Bei der Konsole gibt es nur 2 Systeme pro Gen/Hersteller die man optimieren muss. Selbst Shader muss man nicht compilieren, weil die schon fertig auf der Bluray/beim Download sind.
Am PC gibt es so viele verschiedene Kombinationen, das man nicht allgemein für DEN einen PC optimieren kann.
Eine Ausnahme wäre aktuell das Steamdeck.
 
Zuletzt bearbeitet:
Was ist an 300-800 € für eine 4 TB NVMe unbezahlbar? :confused:

Es hat kein Sinn das zu machen (nur für Direct Storage)
z.B.
für 250€ kriegt man 14 TB HDD.
oder (für 350€)
6 TB HDD + 64 GB DDR5 6400RAM

Solange bis Direct Storage nicht verbreitet ist verbreitet UND spürbare Vorteile bringt würde ich dafür
nichts investieren. Gibt da andere Gründe warum ich ne SSD (auch gerne SATA) nutze.
Aber solange die Spiele am PC absichtlich so schlecht optimiert sind würde ich mir über das Thema keine
Gedanken machen.
 
Zurück