SmartAccess Storage: Auch AMD hat keine Lust auf lange Ladezeiten

Oha, das kommt mir alles so vertraut vor. Als hätten wir diese Diskussion schon mehrfach geführt und dieses nervige Video schon x-mal gesehen. Déjà-vu vom aller feinsten. Bitte übertreibt es nicht wieder. Vor allem du, rapido. :stick:
 
Wenn es wirklich einmal implementiert wird, dann ist das natürlich eine nette Sache.
Aktuell aber noch (!) nutzloser als Raytracing.


Und dann muss man noch hoffen, dass die Programmierer:innen sich Mühe geben.


Sonst braucht es wie bei GTA einen frustrierten Spieler, der die Ladezeit um 40% (?) reduziert.
 
SSDs gehen bei minimaler Schreibleistung, gerade einmal 10TB Schreibleistung nach 5-10 Jahren Nutzung auch schon gerne mal kaputt. Das erlebe ich täglich in der Firma.
Dem Großteil passiert zwar nichts aber auf einen zweistelligen Prozentsatz kaputte SSDs kommt man da schon.

Und Privat ist mir auch schon eine Kingston 256GB kaputt gegangen..., die war bei knapp 3TB/w
Also SSDs halten mit Sicherheit nicht immer 70 Jahre und mehr!

Ich habe betont, wenn geschrieben wird... klar ist das meiste ein reiner Lesezyklus aber glaub mal nicht das dabei gar nichts auf eine SSD geschrieben wird...
Erkläre doch bitte wieso sich etwas an den Schreibvorgängen ändert wenn sich nur das Ziel der Asset-Pipeline verändert vom RAM zum VRAM. Ich verstehe es einfach nicht...


Oha, das kommt mir alles so vertraut vor. Als hätten wir diese Diskussion schon mehrfach geführt und dieses nervige Video schon x-mal gesehen. Déjà-vu vom aller feinsten. Bitte übertreibt es nicht wieder. Vor allem du, rapido. :stick:
Neue Technologie ist jetzt also "nervig". Und Präsentationsfolien von Entwicklern die an DirectStorage arbeiten sind "Übertreibungen".

Leider kann ich mich tatsächlich nur wiederholen, unser aktuelles Asset-Streaming ist 10+ Jahre alt. Dass da irgendwann mal was neues kommt ist doch wünschenswert!?
 
3,7 GB/s sind 3,7 MB/ms. Je nach FPS wird ein Frame für 16ms (60 FPS) oder 33ms (30 FPS) angezeigt. Heißt bei 60 FPS könnte man während eines Frames 16x3,7=59,2 MB komprimierte Assets nachladen was beim Faktor 2 ca. 120 MB wären.

Es geht nicht darum, ob die Technik für irgend etwas knapp reicht, sondern es geht es darum, dass die Techniker langsamer als bestehende sind. 2× 3,7 MB/ms sind weniger als 1× 32 MB/ms.

Davon abgesehen bringt die Möglichkeit, 120 MB pro Frame nachzuladen, bei angemessener Speicherausstattung auch nicht viel. Eine Sekunde Spielgeschehen reicht bequem aus, um in einen anderen Raum zu fallen oder eine bildschirmfüllende Explosion zu entfalten, also den gesamten darzustellenden Inhalt auszutauschen. Viele Spiele benötigen dafür nicht einmal eine halbe Sekunde. Eine Streamingtechnik, die dann 70 Sekunden Frames@60 Fps braucht, um den VRAM-Inhalt einer 8-GiB-Karte auszutauschen, löst keine Probleme. Daran ändert eine von dir in jedem einzelnen News-Thread zu dem Thema verlinkte Konsolen-Tech-Demo auch beim 100ten Mal rein gar nichts.


Anmerkung: So richtig mit RAM "gewuchert" wird auch auf dem PC nicht, da auch hier der Großteil der Anwender preissensitiv ist. Hier sollte man nicht den Enthusiast-Gamer, der keine Kosten und Mühen scheut, mit dem Mainstream verwechseln.
Bspw. auf Steam haben nicht einmal 15 % der Systeme mehr als 16 GiB RAM und gemäß den GPUs sind knapp über 70 % der dort erfassten Systeme Desktop-Systeme.

Auf Steam haben auch auch nur 7,5 Prozent der Systeme mehr als 8 GiB VRAM, 2/3 haben weniger als 6 GiB. Das heißt die Mehrheit der Anwender kann wenigstens das Dreifache der unmittelbar zum Rendern einsetzbaren Datenmenge im Arbeitsspeicher vorrätig halten. Viel mehr macht aufgrund der lokal auf der Grafikkarte erzeugten Daten, die dort ja auch noch Platz benötigen, und aufgrund der eingeschränkten PCI-E-Datentransferrate auch keinen Sinn.
 
Zuletzt bearbeitet:
Es geht nicht darum, ob die Technik für irgend etwas knapp reicht, sondern es geht es darum, dass die Techniker langsamer als bestehende sind. 2× 3,7 MB/ms sind weniger als 1× 32 MB/ms.

Davon abgesehen bringt die Möglichkeit, 120 MB pro Frame nachzuladen, bei angemessener Speicherausstattung auch nicht viel. Eine Sekunde Spielgeschehen reicht bequem aus, um in einen anderen Raum zu fallen oder eine bildschirmfüllende Explosion zu entfalten, also den gesamten darzustellenden Inhalt auszutauschen. Viele Spiele benötigen dafür nicht einmal eine halbe Sekunde. Eine Streamingtechnik, die dann 70 Sekunden braucht, um den VRAM-Inhalt einer 8-GiB-Karte auszutauschen, löst keine Probleme. Daran ändert eine von dir in jedem einzelnen News-Thread zu dem Thema verlinkte Konsolen-Tech-Demo auch beim 100ten Mal rein gar nichts.

8 GB : 120 MB = 67 hast Du wohl gerechnet? Ich habe meine Rechnung aber pro Frame und nicht pro Sekunde gemacht, heißt bei einer Frametime von 16ms (60 FPS) könnte man in einer Sekunde 62,5x59,2 MB = 3.700 MB komprimierte Assets nachladen was beim Faktor 2 ca. 7,4 GB wären. Man könnte also fast den gesamten VRAM innerhalb einer Sekunde austauschen.

Ist ja auch logisch, wenn die SSD 3,7 GB/s schafft, Faktor 2 wegen Komprimierung, dann sind 8 GB halt in einer Sekunde voll. Wie Du da jetzt 70 Sekunden draus machst hätte ich gerne erklärt. :D

Edit: Außerdem ignorierst Du völlig die gezeigten Vergleiche im verlinkten Video und technische Daten zu Sampler Feedback Streaming die man frei verfügbar einsehen kann. Es wird deutlich intelligenter "vorgeladen" was benötigt wird und durch den schnellen Austausch sind selbst schnelle Kameraschwenks mit komplettem Asset Austausch kein Problem.
 
Zuletzt bearbeitet von einem Moderator:
Da habe ich in der Tat ein Typo drin, es waren 70 Frames gemeint.
Die Aussage kam hoffentlich trotzdem rüber: SSDs sind nicht nur langsamer als RAM, sie sind auch zu langsam um überhaupt großen Einfluss auf den Rendering-Prozess eines modernen PCs zu nehmen. Das überrascht auch nicht, schließlich gilt bereits RAM respektiv die PCI-E-Verbindung dahin als zu langsam, um VRAM zu ersetzen und allenthalben werden 12, 16 oder mehr GiB gefordert, um alle Daten lokal auf der Grafikkarte vorrätig halten zu können.
 
Da habe ich in der Tat ein Typo drin, es waren 70 Frames gemeint.
Die Aussage kam hoffentlich trotzdem rüber: SSDs sind nicht nur langsamer als RAM, sie sind auch zu langsam um überhaupt großen Einfluss auf den Rendering-Prozess eines modernen PCs zu nehmen. Das überrascht auch nicht, schließlich gilt bereits RAM respektiv die PCI-E-Verbindung dahin als zu langsam, um VRAM zu ersetzen und allenthalben werden 12, 16 oder mehr GiB gefordert, um alle Daten lokal auf der Grafikkarte vorrätig halten zu können.
Da aber kein Open-World-Spiel in aktuelle RAM Größen passt müssen beim Streaming sowieso Assets von der SSD nachgeladen werden. Und genau in diesem Szenario ist doch eine direkte Verbindung von der SSD zum VRAM viel effizienter als der Umweg über den RAM, das Bottleneck "Read-Geschwindigkeit der SSD" ist ja bei beiden Wegen dasselbe.

Oder sprichst Du modernen Spielen ab nicht zu streamen?
 
Da aber kein Open-World-Spiel in aktuelle RAM Größen passt müssen beim Streaming sowieso Assets von der SSD nachgeladen werden. Und genau in diesem Szenario ist doch eine direkte Verbindung von der SSD zum VRAM viel effizienter als der Umweg über den RAM, das Bottleneck "Read-Geschwindigkeit der SSD" ist ja bei beiden Wegen dasselbe.

Oder sprichst Du modernen Spielen ab nicht zu streamen?
Das spielt doch keine Rolle,was willst du denn immer mit den Daten auf der SSD. Alles was in "Reichweite" ist wird vorgehalten im Hauptspeicher oder im Vram. Alles andere wird einfach umgewälzt, es gibt KEINEN, ich wiederhole, KEINEN Grund den Hauptspeicher auszuklammern dabei für eine PC.

Vorteile von RTX IO z.B. ist nicht das einsparen von Vram,sondern der CPU Drawcalls zu ersparen.
Verbessertes Streaming ist nützlich, z.B.für Spiele wie Forza Horizon 5. Der Punkt ist, diese Technik bewirkt nicht dass was du da rein interpretierst. Das wurde aber auch bereits mehrfach durchgekaut das Thema, du ignorierst es schlicht konsequent.

Hauptprofiteur der Technik sind SOC´s.
 
Vorteile von RTX IO z.B. ist nicht das einsparen von Vram,sondern der CPU Drawcalls zu ersparen.
Verbessertes Streaming ist nützlich, z.B.für Spiele wie Forza Horizon 5. Der Punkt ist, diese Technik bewirkt nicht dass was du da rein interpretierst. Das wurde aber auch bereits mehrfach durchgekaut das Thema, du ignorierst es schlicht konsequent.

Hauptprofiteur der Technik sind SOC´s.
Ja, die CPU Entlastung ist natürlich einer der Vorteile. Du ignorierst aber die verfügbaren Whitepaper und Aussagen der Techdemo von Microsoft. Noch mal ganz deutlich und eindeutig:

x-times-more-memory.png


"Makes it look like your GPU has x times more memory than what's physically available". Was interpretiere ich da jetzt falsch? Man sieht es auch in der Techdemo:

1653397375832.png


Das wovon Du sprichst ist der oberste Wert: 2 GB Assets für die gesamte Szene im VRAM.
Nächste Zeile: XboX Velocity Architecture ohne SFS (also bereits optimiertes Streaming).
Letzte Zeile: XVA mit SFS -> 70% weniger VRAM Belegung im Vergleich zum bereits verbesserten Streaming.
 
Sampler Feedback ist eine Technik, um nicht mehr benötigte Daten schneller aus dem VRAM zu entfernen. Behalte die Auslastungsanzeige der Tech-Demo während schneller Drehungen im Auge und du siehst, dass nur noch ein Bruchteil des Einsparpotenzials umgesetzt werden kann. Das, wie gesagt, auch nur wenn man eine vergleichbar langsame Konsolen-GPU mit einer recht flotten SSD kombiniert. Insbesonderen die bislang noch nicht betrachteten Latenzen letzterer sind auch in der X-Box auf dem Niveau von PCs (wenn nicht gar aus Gründen der schlankeren Software besser), während die Grafikausgabe ein gutes Stück genügsamer ist.

Da aber kein Open-World-Spiel in aktuelle RAM Größen passt müssen beim Streaming sowieso Assets von der SSD nachgeladen werden. Und genau in diesem Szenario ist doch eine direkte Verbindung von der SSD zum VRAM viel effizienter als der Umweg über den RAM, das Bottleneck "Read-Geschwindigkeit der SSD" ist ja bei beiden Wegen dasselbe.

Oder sprichst Du modernen Spielen ab nicht zu streamen?

Ich spreche modernen Spielen ab, in den Rendervorgang zu streamen. Das Nachladen von Open-World-Inhalten läuft auf viel längeren Zeiträumen ab; der PC hat mehrere Minuten Zeit um Inhalte die in-Game mehrere Minuten entfernt sind, in den RAM zu holen. Die Performance des Datensystem muss immer zu den Spielinhalten passen:
- Binnen 2-3 Frames müssen der GPU alle Inhalte vorliegen, die der Spieler z.B. durch eine Drehung, einen Schuss oder ähnliches sehen könnte. Das ist Aufgabe des VRAMs
- Binnen 1-2 Sekunden muss der Grafiktreiber der GPU alle Inhalte zupielen können, die der Spieler durch Fortbewegung, eventuell Quickload oder ähnliches erreichen könnte. Das ist Aufgabe des RAMs.
- Binnen 4-400 Stunden (je nach Titel) muss die Spiele-Engine den gesamten Spielinhalt der GPU anliefern können. Das ist Aufgabe der SSD, HDD und in seltenen Fällen des ODD.

Die Streaming-Routinen von Spielen beschäftigen sich vor allem mit dem Übergang von Ebene 3 zu 2: Welche Inhalte befinden sich in der weiteren Umgebung des Spielers? Wohin verweist ein Quickload? Welche großen Änderungen könnten NPCs auslösen? Ein sauber programmiertes Spiel weiß, was dem Spieler in den nächsten 2-20-200 Sekunden passieren kann und entpackt die Inhalte entsprechend vorab in den Arbeitsspeicher. Das führt zu einer gewissen CPU-Last, aber mit Ausnahme von Forza Horizon 5 auf einem Dual-Core-Prozessor hat Dave keinen einzigen Titel gefunden, wo dass ein Probelm darstellt, wie man in der noch aktuellen Ausgabe nachlesen kann.

Da in der Praxis keine Dual-Core-Systeme mit Grafikeinstellungen für eine 6900 XT unterwegs sein werden, ist aber auch das nur ein theoretisches Beispiel – Streaming ist am PC kein Problem. Praktisch jedem real existierenden System geht der Grafikspeicher oder, noch häufiger, die GPU-Leistung zur Ausgabe von Inhalten aus, ehe deren Transfer von der SSD in den RAM oder aus dem RAM auf die Grafikkarte limitiert.
 
Sampler Feedback ist eine Technik, um nicht mehr benötigte Daten schneller aus dem VRAM zu entfernen. Behalte die Auslastungsanzeige der Tech-Demo während schneller Drehungen im Auge und du siehst, dass nur noch ein Bruchteil des Einsparpotenzials umgesetzt werden kann.
Das ist so verdreht, ich fasse es kaum... Jegliches Interview, Whitepaper und Tech-Demo sagt etwas anderes, aber gut, Du weisst es bestimmt besser als Microsoft, NV und AMD. In diesem Sinn bin ich dann auch raus aus der Diskussion, hier wird ja jegliche Aussage seitens o.g. Hersteller bezweifelt.

Edit: In den Kameraschwenks ist weiterhin deutlich zu sehen dass SFS den VRAM Bedarf massiv senkt.

Während des Kameraschwenks:

1653398891430.png


Danach:
1653398918221.png
 
Das Problem ist schlicht dass du über Dinge referierst von denen du keine Ahnung hast weil du die Basics nicht verstehst oder nicht verstehen willst.

Deine tolles YouTube Video enthält EINE einzige statische Szene, kein Wind, kein dynamischen Lichtquellen, kein Nebel, keinerlei Veränderungen. Es dient lediglich zur Illustrierung und der Content richtet sich auch nicht an Leute wie dich, sondern Leute die Plan davon haben.
 
Sehe ich das falsch oder hat das Sampler Feedback Streaming gar keinen richtigen Einfluss auf die Übertragungsgeschwindigkeit?
Das dient doch nur dazu, Platz zu sparen?
Im Video sehe ich ad hoc keinen großen Unterschied zwischen SSD ohne SFS und mit SFS, was die "Füllgeschwindigkeit" angeht. Zur HDD ist dagegen schon ein Unterschied zu sehen.
Das ist zwar cool für die Konsolen aufgrund der Ressourcenreglementierung aber doch nicht sonderlich nützlich für den PC? :ka:
 
Das Problem ist schlicht dass du über Dinge referierst von denen du keine Ahnung hast weil du die Basics nicht verstehst oder nicht verstehen willst.

Deine tolles YouTube Video enthält EINE einzige statische Szene, kein Wind, kein dynamischen Lichtquellen, kein Nebel, keinerlei Veränderungen. Es dient lediglich zur Illustrierung und der Content richtet sich auch nicht an Leute wie dich, sondern Leute die Plan davon haben.
Ach jetzt habe ich plötzlich keine Ahnung, super Argument.

Was hat jetzt Wind, dynamische Lichtquellen oder Nebel mit den Texturen im VRAM zu tun? Erkläre mir das bitte damit ich es verstehe.

Ich habe mich in das Thema eingelesen, aktuelles Texture-Streaming lädt das was die Spiele-Entwickler vorgeben. Dabei ist das aktuelle PRT (partial resident texture -> wird auch in der UE4/5 verwendet und wird auch virtual texture genannt) ziemlich dumm und auch einfach alt. Hierbei werden die Texturen bereits in Tiles aufgeteilt um VRAM zu sparen und das Streaming zu beschleunigen. Leider gibt der Sampler bei PRT kein Feedback zurück, somit kann die Prediction nicht weiter optimiert werden. Auch weiss zum Zeitpunkt des Renderns "niemand" was aktuell im VRAM liegt.

Mit PRT+ (Sampler Feedback) kommt genau das dazu, der Sampler meldet zurück was er gerade an Texturen verarbeitet und kann ganz genau anfordern was gebraucht wird. Alles hervorragend hier erklärt: https://forum.xboxera.com/t/a-more-detailed-insight-about-sampler-feedback-streaming/3543/3

Aber ich hab ja keine Ahnung. Tschö.
Sehe ich das falsch oder hat das Sampler Feedback Streaming gar keinen richtigen Einfluss auf die Übertragungsgeschwindigkeit?
Das dient doch nur dazu, Platz zu sparen?
Im Video sehe ich ad hoc keinen großen Unterschied zwischen SSD ohne SFS und mit SFS, was die "Füllgeschwindigkeit" angeht. Zur HDD ist dagegen schon ein Unterschied zu sehen.
Das ist zwar cool für die Konsolen aufgrund der Ressourcenreglementierung aber doch nicht sonderlich nützlich für den PC? :ka:
Korrekt, SFS hat keinen Einfluss auf die Übertragungsgeschwindigkeit. Es verringert nur die nötige Menge an Texturen um bis zu 70% weil es nur die Texturen lädt die benötigt werden.

Es geht in dem Video ja darum dass die Füllgeschwindigkeit gleich schnell ist, das nachladen aber viel schneller und akkurater läuft. Außerdem wird der gesamte VRAM Bedarf verringert weil eben nur die Tiles der Texturen geladen werden die wirklich gebraucht werden.
 
Korrekt, SFS hat keinen Einfluss auf die Übertragungsgeschwindigkeit. Es verringert nur die nötige Menge an Texturen um bis zu 70% weil es nur die Texturen lädt die benötigt werden.

Es geht in dem Video ja darum dass die Füllgeschwindigkeit gleich schnell ist, das nachladen aber viel schneller und akkurater läuft. Außerdem wird der gesamte VRAM Bedarf verringert weil eben nur die Tiles der Texturen geladen werden die wirklich gebraucht werden.

Aber dann haben die anderen ja recht, dass es nur was bringt, wenn irgendwo ein speicherlimit auftritt. Was ja auf den Konsolen eher der Fall ist, als auf PC.
 
Aber dann haben die anderen ja recht, dass es nur was bringt, wenn irgendwo ein speicherlimit auftritt. Was ja auf den Konsolen eher der Fall ist, als auf PC.
Auf dem PC wird genauso gestreamt, siehe jedes Open-World-Game. Wenn die Texturen eines gesamten "Levels" in den VRAM passen, dann bringt SFS nichts. Sobald gestreamt werden muss sieht das anders aus.
 
Auf dem PC wird genauso gestreamt, siehe jedes Open-World-Game. Wenn die Texturen eines gesamten "Levels" in den VRAM passen, dann bringt SFS nichts. Sobald gestreamt werden muss sieht das anders aus.

Ja klar wird da auch gestreamt. Und da ist doch der erste limitierende Faktor die Art der Programmierung. Bin irgendwie auch auf dem Dampfer, dass das alles für Konsolen Sinn macht. Bei "ordentlicher" Programmierung, ausgelegt auf die Möglichkeiten des PCs, erübrigen sich solche Technologien doch schon wieder, wenn denn das Potential ausgeschöpft werden würde. Die Diskussion erinnert mich etwas an die Argumente von Altissima, der die ps5 Wunder-SSD so krass in den Himmel gelobt hat. :D nicht böse gemeint btw ;)
 
Aber dann haben die anderen ja recht, dass es nur was bringt, wenn irgendwo ein speicherlimit auftritt. Was ja auf den Konsolen eher der Fall ist, als auf PC.

Er vermengt ständig Dinge miteinander. Er wurschtet Streaming, RTX IO, Sampler Feedback, Direct Storage , Vram Ersparnis und Übertragungsgeschwindigkeiten die ganze Zeit wild durcheinander.

Ich habe nun schon zig mal versucht ihm das zu erläutern, aber er sieht es einfach nicht ein.
Dass die Texturen ein "Feedback" geben bei SFS ist grundsätzlich super, Direct Storage bringt Vorteile beim laden von Daten. RTX IO nutzt GPU Leistung zum dekomprimieren.

Rapid schmeißt alles in einen Topf, rührt kräftig und glaubt das kommt schon morgen und würde Vram Krüppel retten. Dazu präsentiert er uralte Folien die bald 2 Jahre alt sind, passiert ist in der Praxis aber noch nichts.
 
Zurück