Windows 11: Kommt Direct Storage zum Launch und entlastet die CPU?

Damit es keine Leistung kostet, sollten entsprechende HW-Decoder auf der GPU vorhanden sein. Es sollte zwar möglich sein, alles auch als Shader-Code umzusetzen, aber die meisten Spiele-PCs sind durch ihre Shader- und nicht ihre CPU-Leistung limitiert. Würde man Aufgaben von der CPU auf die Shader verlagern, würde die Performance also sogar sinken.




Der GPU-Speicher wird in der Tat manchmal knapp, aber da hilft Direct Storage auch nicht weiter. VRAM enthält unmittelbar, nahezu ohne Latenz, und mit 400-1.000 GB/s zur Verfügung stehende Daten. Direct Storage hat eine relativ große Latenz für den Laufwerkszugriff als solchen und dann noch einmal für das Entpacken und erreicht selbst mit um Faktor 4-5 komprimierten Daten maximal 30-40 GB/s. Bei geringster Komprimierung sogar nur 7 GB/s – was die schnellsten SSDs halt liefern können. Bestenfalls kann man damit normalen System-RAM ersetzen, aber selbst der ist für die GPU in einem PCI-E-4.0-System mit 32 GB/s unkomprimiert zugänglich und natürlich können Texturen, etc. dort in komprimiertem Zustand abgelegt werden. Direct Storage kann also nur beim ersten Ladevorgang etwas bringen oder wenn der Hauptspeicher insgesamt zu klein ist, um alle innerhalb von ~30 Sekunden benötigten Daten zu fassen. (Längerfristige Wechsel der Spielwelt kann man entspannt im Hintergrund streamen.) Dazu sollten in allen heutigen Spielen 32 GiB reichen, in vielen 16 GiB. 8-GiB-Systeme könnten dagegen messbare Fortschritte verzeichnen, nur wird da niemand eine entsprechend starke/moderne Grafikkarte verbauen. (Einzige Ausnahme: Konsolen die haben zwar 16 GB, aber das sind 16 GB VRAM. Und jedes bisschen Speicher für weitere Aufgaben als Rendering muss da abgeknabbert werden.)
Nun um ganz ehrlich zu sein, kann ich da in der Tiefe nicht mehr mitreden. Dafür habe ich mich noch nicht genug mit der Theorie von Direct Storage oder RTX-IO beschäftigt. :-o

Sicherlich, dass VRAM extrem schnell ist im Verhältnis zu anderen Speichermedien sei es nun DDR4 Ram oder
NVMe SSD's ist mir bewusst, zumindest wenn es um transfers in die GPU Caches geht. Und ich bin auch nicht Naiv genug um zu glauben, dass wir hier eine neue "Heilsbringer Technik" am Start haben.

Meinem begrenztem Verständnis zu folge, werden aber ins Besondere in den Geschwindigkeitsregionen in die sich schnelle SSD's heute aufmachen auch Latenzen und "unnötige" Umwege bei Datentransfers immer Kritischer und nehmen mehr an Bedeutung zu als z.B. rohe Transferleistung.

Jeder der z.B. schon mal massenhaft Daten übers Netzwerk verschoben hat, wird sicher wissen, dass die Art der Daten die verschoben werden (viele kleine Dateien vs. wenige Große) hier wesentlich mehr Einfluss auf die Transferrate haben kann als die Theoretische Maximalleistung des Netzwerkes an sich. Neben diversen anderen Faktoren wie der CPU Leistung und der Leistung der Speichermedien, sind der Overhead des Netzwerkprotokolls, und das Betriebssystem selbst oft ein limitierender Faktor.

Lange Rede, wenig Sinn - je weniger variable Faktoren Einfluss auf einen Datentransfer haben um Latenzen einzufügen desto besser... Und wenn z.B. die CPU auch noch Rechenleistung einspart und unnötige Transfers von und in den Arbeitsspeicher vermieden werden, lässt sich der Einfluss einer Technik wie Direct Storage nur schwer Beziffern. Insbesondere bei kontinuierlichen Datentransfers die wir in diesem Zusammenhang sicherlich in Zukunft öfter sehen werden, wenn es um aufwendige Computerspielwelten geht.

Ich bin zumindest gespannt wie sich Direct Storage im Alltag schlägt... =)


Praktisch ist da nichts zu ermitteln, weil der ganze Artikel unter dem "könnte" Stern steht und es DirectStorage noch nicht gibt.

Und es werden laufend Standards erfunden und begraben. zB. SLI + CF + U.2 + ...
Ich wüsste nicht dass der "U.2" Standard begraben ist, zumal dieser ohnehin aus dem Servermarkt entliehen ist.
Dass dieser bei Consumern keine große Rolle spielt, ist für mich aber nicht mal überraschend.

M.2 ist hier schlicht Vorteilhafter. Sofern man nicht auf besonders Langlebige Enterprise SSD's setzt oder sehr viele im System benötigt.
 
Zuletzt bearbeitet:
Wie oft Daten aus dem VRAM rein- und ausgeladen werden, sieht man ja recht schön in @raPid-81's Video ab etwa der 8. Minute. Und hierbei ist zu beachten, dass es sich nur um eine kleine, geschlossene Demo-Szene handelt. Eine große Open-World-Szene mit weitaus mehr Objekten und noch komplexeren Texturen stellt da gleich ganz andere Anforderungen. *)
Auf dem PC kann man das sicherlich mit einem großen RAM-Cache zu erschlagen versuchen, dennoch sind die Entwickler auch hier gezwungen ihr Setup grundsätzlich auf die kleinsten Systeme auszulegen und das hat im worst case gar derzeit maximal 8 GiB RAM. Am Ende sind die Speicherressourcen so oder so endlich egal wie weit man es hochskaliert und mit etwas wie DirectStorage (in Kombination mit Sampler Feedback Streaming) öffnet man halt den Flaschenhals zum Massenspeicher und kommt schneller als die Assets ran.

*) Wenn mal irgendwann ein GTA6 oder RDR3 raukommt, erzählen die Entwickler mal vielleicht was aus dem Nähkästchen und dann wird man vielleicht durchaus so etwas in der Art zu hören bekommen wie, dass ein derartiger Detail-/Qualitätslevel ohne derartige Techniken nicht möglich gewesen wäre.
Andererseits vielleicht zwei schlechte Beispieltitel; bis die rauskommen, gehören diese Techniken vielleicht schon zum Alltag. ;-)

@RX480: Jo, "vermuten", denn im Gegensatz zu dir stelle ich keine vermeintlichen Tatsachenaussagen in den Raum nur um eine persönliche Agenda durchzusetzen.
AMD hat nirgends eine derartige Funktionalität in Verbindung mit RDNA2 in den Raum gestellt, die Konsolen-SoCs haben diese explizit separat und herstellerindividuell implementiert und mir scheint eher, dass du nicht zu Differenzieren weist zwischen den Konsolen-SoCs und dem was AMD als RDNA2 auf den PC-GPUs herausgebracht hat, also ja, offensichtlich habe ich hier ein "+1" verdient, nur das wäre eigentlich vollkommen unnötig gewesen, wenn du nicht vorher so einen Unsinn gepostet hättest.

Ergänzend kommt auch noch hinzu, dass es vollkommen unsinnig von AMDs Marketing wäre, mit einem entsprechenden Feature hinterm Berg zurückzuhalten, wenn es denn in einer gleichwertigen Art existieren würde. Da nVidia derzeit auch nicht mehr als teasern kann, weil das API noch nicht offiziell freigegeben ist, bräuchte man sich da bei AMD auch keine Gedanken zu machen und könnte das in gleicher Weise für die Vermarktung nutzen. Dies jedoch explizit nicht zu tun, ist dagegen weitaus schwerer zu begründen, denn egal wie man es nimmt, zahlt das bei Ampere zumindest in kleinem Rahmen unter der Rubrik "Zukunftssicherheit" ein (wenn man die so nennen will), etwas mit dem sich AMD-Fans ja auskennen sollten, wenn man sich den langen, beschwerlichen Weg von FSR ansieht, d. h. das ist zweifellos kein Punkt den man im Marketing für unbedeutend hält und daher leichtfertig unter den Tisch kehren würde.
 
Zuletzt bearbeitet:
Also in meine 16 GB System-RAM passen bestimmt nicht alle Texturen eines Open-World-Titels. Was sagst Du denn hierzu?

"Kauf mehr RAM". :-D
Im Ernst: Wenn in einem System eine Grafikkarte zu einem 15-25 mal höheren Preis werkelt, als in Arbeitsspeicher investiert wurde (je nach Kaufzeitpunkt), dann kann es natürlich zu Flaschenfälsen kommen, die nichts mit der Norm zu tun haben. Lange Zeit war eher so ein Verhältniss von 1:2 bis maximal 1:4 üblich. (Also 250 Euro RAM mit 1.000 Euro GPU als Extremfall, aber eher mal 300 + 600 Euro.)
Aber selbst in deinsem System muss das nicht auftreten. In den System-RAM müssen nicht alle Texturen eines Spiels passen. Sondern nur die von Objekten, die der Spieler in absehbarer Zeit erreichen kann. Dafür reichen 16 GiB meistens noch aus. Wenn über 5 Minuten Spielzeit von 12 GiB geladenden Texturen 6 GiB wegen wechselnder Landschaften ausgetauscht werden mussten, was extrem viel wäre, dann entspricht das gerade einmal 20 MB/s Streaming-Leistung. In vielen Spielen hättest du nicht einmal bei Schnellreisen ein Problem, weil die Schnellreisepunkte meist in der "Landschaft" liegen, die einen recht überschaubaren Satz Texturen nutzt.

Was sagst Du denn hierzu?
Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.

Das ist laut MS auch nur in Kombination DS + SFS möglich, mit der alten Pipeline wäre das Nachladen wohl zu langsam.

Wenn man mir Videos von mehr als 3 Minuten Länge vorsetzt sage ich normalerweise "was davon soll ich mir angucken?". In dem Fall kommt noch hinzu: "Was hat die X-Box mit einem PC zu tun?". Ohne System-RAM, nur mit 16 GiB-VRAM, ist Streaming direkt von der SSD natürlich extrem wichtig. Alles, was zwischen dicht aufeinander folgenden Szenen nicht gestreamt bekommt, sondern vorrätig halten muss, geht bei Konsolen zu Lasten des Texturbudgets innerhalb einer Szene und damit der Optik beziehungsweise macht diese unmöglich. Aber so eine Architektur haben wir im PC nicht. Und: Verglichen mit einer X-Box haben die meisten PCs eine nur wenig schnellere SSD (verglichen mit der PS5 gar eine deutlich langsamere), aber ein wesentlich schneller GPU. Das heißt die Rechenleistung muss bei uns als nicht nur nicht direkt vom Laufwerk bedient werden, sie kann es in relativ gleichem Maße auch gar nicht. Egal ob mit oder ohne Direct Storage.


Ich wüsste nicht dass der "U.2" Standard begraben ist, zumal dieser ohnehin aus dem Servermarkt entliehen ist.
Dass dieser bei Consumern keine große Rolle spielt, ist für mich aber nicht mal überraschend.

M.2 ist hier schlicht Vorteilhafter. Sofern man nicht auf besonders Langlebige Enterprise SSD's setzt oder sehr viele im System benötigt.

Hey: Dieses Post wurde auf einem Rechner mit U.2-SSD geschrieben! Mit einer PS/2-Tastatur. :-) Und spätestens wenn ich jetzt noch einen USB-Stick ins SATA-E-Front Panel stecke, führe ich unangefochten im Schnittstellen-Bingo.
 
@PCGH_Torsten

Nichts für ungut ;)

Abgesehen von meinem Tablet :wall: sind in meien PC's je mindestens eine U.2 Optane SSD verbaut.
10-60DWPD sind einfach zu verlockend in kombination mit der geringen Latenz...

Kleiner Nachtrag: Im Falle einer DC P4801X ist das sogar recht erschwinglich
(sofern man nicht gerade ne' Halbleiterkriese hat, wie ich gerade feststellen muss...)
 
Zuletzt bearbeitet:
@RX480: Jo, "vermuten", denn im Gegensatz zu dir stelle ich keine vermeintlichen Tatsachenaussagen in den Raum nur um eine persönliche Agenda durchzusetzen.
???

"Microsoft on Tuesday, in a developer presentation, confirmed that the DirectStorage API, designed to speed up the storage sub-system, is compatible even with NVMe SSDs that use the PCI-Express Gen 3 host interface. It also confirmed that all GPUs compatible with DirectX 12 support the feature." (x)

(x) Im Optimalfall alle DX12- GPU´s , aber evtl. nur DX12U-GPU´s haben dann SamplerFeedback.
Aus meiner laienhaften Sicht ist das Auspacken ja nur ein simpler ComputeJob, geht evtl. sogar runter bis Polaris.
Ob RDNA2-PC noch ein bisschen Anders damit umgeht, who knows. AMD muss ja net Alles veraten.

edit: Warum Sony nen Sonderweg einschlägt erklärt sich vllt. einfach aus der Tatsache, das der kleinere Chip net soviel Shader für AsyncCompute übrig hat wie bei MS und daher die explizite Lösung.
Sowas scheint eh ein spezielles Sony-Ding zu sein, wenn man sogar extra nochmal normale Inhalte auf der SSD komprimiert.
Ob die Kosteneinsparung für Speicherplatz Das wert ist?
 
Zuletzt bearbeitet:
"Kauf mehr RAM". :-D
Im Ernst: Wenn in einem System eine Grafikkarte zu einem 15-25 mal höheren Preis werkelt, als in Arbeitsspeicher investiert wurde (je nach Kaufzeitpunkt), dann kann es natürlich zu Flaschenfälsen kommen, die nichts mit der Norm zu tun haben. Lange Zeit war eher so ein Verhältniss von 1:2 bis maximal 1:4 üblich. (Also 250 Euro RAM mit 1.000 Euro GPU als Extremfall, aber eher mal 300 + 600 Euro.)
Aber selbst in deinsem System muss das nicht auftreten. In den System-RAM müssen nicht alle Texturen eines Spiels passen. Sondern nur die von Objekten, die der Spieler in absehbarer Zeit erreichen kann. Dafür reichen 16 GiB meistens noch aus. Wenn über 5 Minuten Spielzeit von 12 GiB geladenden Texturen 6 GiB wegen wechselnder Landschaften ausgetauscht werden mussten, was extrem viel wäre, dann entspricht das gerade einmal 20 MB/s Streaming-Leistung. In vielen Spielen hättest du nicht einmal bei Schnellreisen ein Problem, weil die Schnellreisepunkte meist in der "Landschaft" liegen, die einen recht überschaubaren Satz Texturen nutzt.
Warum sollte ich denn RAM aufstocken? Könnte doch gleich eine Grafikkarte mit 128GB RAM kaufen (wenn es diese im Consumer Bereich gäbe) und hätte komplette Open World Titel geladen! Aber klar, lieber alles mit Hardware erschlagen anstatt mal das Texture-Streaming ins Jahr 2021 zu bringen. :schief:

Wenn man mir Videos von mehr als 3 Minuten Länge vorsetzt sage ich normalerweise "was davon soll ich mir angucken?". In dem Fall kommt noch hinzu: "Was hat die X-Box mit einem PC zu tun?". Ohne System-RAM, nur mit 16 GiB-VRAM, ist Streaming direkt von der SSD natürlich extrem wichtig. Alles, was zwischen dicht aufeinander folgenden Szenen nicht gestreamt bekommt, sondern vorrätig halten muss, geht bei Konsolen zu Lasten des Texturbudgets innerhalb einer Szene und damit der Optik beziehungsweise macht diese unmöglich. Aber so eine Architektur haben wir im PC nicht. Und: Verglichen mit einer X-Box haben die meisten PCs eine nur wenig schnellere SSD (verglichen mit der PS5 gar eine deutlich langsamere), aber ein wesentlich schneller GPU. Das heißt die Rechenleistung muss bei uns als nicht nur nicht direkt vom Laufwerk bedient werden, sie kann es in relativ gleichem Maße auch gar nicht. Egal ob mit oder ohne Direct Storage.
Puh, ich hätte nicht gedacht dass ich das mal einem Redakteur meiner Lieblings-PC-Zeitschrift sagen würde, aber "echt jetzt"? Die 10 Minuten zeigen was Sampler Feedback Streaming, zusammen mit DirectStorage, ermöglicht. Und das beschränkt sich nicht auf die Konsolen, die beiden Techniken kommen auch für den PC. Sollte also auch für "euch" interessant sein.

Und was soll das mit 16 GB VRAM auf der Xbox Series X, ohne System-RAM? Das stimmt so einfach nicht.

Der Speicher in der Xbox Series X ist in vielerlei Hinsicht außergewöhnlich. Microsoft verbaut 16 GByte GDDR6 in einer asynchronen Bestückung an 320 Datenleitungen: 6 × 2 GByte und 4 × 1 GByte. 10 GByte erreichen eine Übertragungsrate von 560 GByte/s und 4 GByte müssen sich mit 336 GByte/s begnügen. Die im Vorfeld gemunkelten 20 GByte RAM ließen sich an 320 Bit zwar realisieren, wären aber auch teurer. Spielen stehen insgesamt 13,5 GByte RAM zur Verfügung, 10 GByte davon als Grafikspeicher, 3,5 GByte als System-RAM. Das Betriebssystem der Xbox Series X reserviert sich 2,5 GByte.
 
Zurück