News Nvidia: RTX IO kann Ruckelprobleme indirekt verbessern

Mach Dich doch einfach selbst schlau?
Dann macht RTX IO also "nichts" und ist nur ein belangloser Marketingname wie "Freesync" für Adaptive Sync oder der RTX Treiber und Software Stack für DXR. Wurde hier ja noch anders dargestellt.
Nvidia will mal wieder nur Marketing betreiben, sonst nichts weiter, aber wenigstens können sie damit AMD nicht ausbremsen.

Fraglich nur warum man Nvidia für diese Features werben lässt.
 
Zuletzt bearbeitet:
Dann macht RTX IO also "nichts" und ist nur ein belangloser Marketingname wie "Freesync" für Adaptive Sync oder der RTX Treiber und Software Stack für DXR. Wurde hier ja noch anders dargestellt.
Nvidia will mal wieder nur Marketing betreiben, sonst nichts weiter, aber wenigstens können sie damit AMD nicht ausbremsen.

Fraglich nur warum man Nvidia für diese Features werben lässt.

Ich kann Deiner Argumentation nicht folgen. So viel Bias tut niemandem gut...

Nochmal für Dich:
1. Nvidia hat das Kompressionsformat Gdeflate entwickelt und als OpenSource veröffentlicht
2. Microsoft hat einen Gdeflate Compressor ab DirectStorage 1.1 für jeden bereitgestellt
3. RTX IO ist die Umsetzung der GPU Decompression auf Nvidia Karten ab Turing (2000er Gen)
4. AMD unterstützt auch GPU Decompression, hat dafür allerdings noch keinen Namen (kommt bestimmt demnächst, siehe auch FSR, Freesync, HYPR-RX usw)

Dein verlinkter Kommentar stellt davon überhaupt nichts anders dar. Und RTX IO macht sehr wohl etwas, nämlich Gdeflate auf Shadern und das dazugehörige, interne Speichermanagement. Ob AMDs Lösung gleich schnell, langsamer oder schneller ist wissen wir bis zu den ersten Vergleichs-Tests nicht. Aber Nvidia hat da "keine Aktien drin" wie AMD es auf ihren Karten umsetzt.

Wie kommst Du eigentlich darauf dass man Nvidia verbieten könnte mit dem Feature zu werben? So klingt es nämlich wenn Du fragst warum man Nvidia damit werben lässt. Es ist deren Eigenentwicklung basierend auf dem von Ihnen als OpenSource bereitgestellten Gdeflate Kompressionsverfahren, in Zusammenarbeit mit Microsoft da die DirectStorage API dafür nötig ist.

Ich verrate Dir mal was: Microsoft, Nvidia, AMD, Intel, alle diese Unternehmen sitzen in diversen Gremien zusammen und überlegen sich wie man die nächste Generation an Produkten an uns verkaufen kann. Dazu schauen sie sich an was die Käufer wollen (schnellere Ladezeiten, größere Welten, schönere Texturen) und entwickeln daraus dann Ideen wie man das bewerkstelligen kann ohne 1024bit breite Speicheranbindungen und 48GB VRAM zu verbauen weil das unnötig die Kosten erhöht und Ressourcen verschwendet. Der Durchschnitts-Gamer will keine 5000€ Grafikkarte die 2000W verbraucht. Mit einer intelligenteren Speicherverwaltung kann man den VRAM Bedarf einfach mal halbieren (oder die Texturen doppelt so hoch auflösen), warum sollte man das nicht tun wenn es technisch machbar ist?
 
So viel Bias tut niemandem gut...
Ich habe grundsätzlich überhaupt keinen Bias was Features von Grafikkartenherstellern angeht, also spar dir das.

3. RTX IO ist die Umsetzung der GPU Decompression auf Nvidia Karten ab Turing (2000er Gen)
Also nichts anderes als Nvidias interne Umsetzung. Warum wird es dann in Spielen als RTX IO beworben? Weil Nvidia GDeflate mit Microsoft entwickelt hat?
Genauso dumm in einem Spiel statt DXR Raytracing RTX Raytracing ins Optionsmenü zu schreiben, sofern RTX IO nichts anderes darstellt.
4. AMD unterstützt auch GPU Decompression, hat dafür allerdings noch keinen Namen (kommt bestimmt demnächst, siehe auch FSR, Freesync, HYPR-RX usw)
Es braucht dafür nicht noch einen Namen. Das sorgt nur für Verwirrung.
Und RTX IO macht sehr wohl etwas, nämlich Gdeflate auf Shadern und das dazugehörige, interne Speichermanagement.
Das wäre dann rein Nvidias Treiber, für was dann eine Werbung und Nvidia Branding für etwas was ihnen nicht gehört?
Es ist deren Eigenentwicklung basierend auf dem von Ihnen als OpenSource bereitgestellten Gdeflate Kompressionsverfahren, in Zusammenarbeit mit Microsoft da die DirectStorage API dafür nötig ist.
Welche Eigenentwicklung? Es ist doch laut dir nur ein Name. Seit wann werden schnöde Treiberfunktionen die nur Microsofts Funktionen ansprechen in Spielen als Eigenentwicklungen geframed?
Mit einer intelligenteren Speicherverwaltung kann man den VRAM Bedarf einfach mal halbieren (oder die Texturen doppelt so hoch auflösen), warum sollte man das nicht tun wenn es technisch machbar ist?
Wer sagt man solle es nicht tun? Die Frage ist doch lediglich ob Nvidia damit die Konkurrenz ausbremst, bzw. was deren Werbung bezwecken soll, wenn es lediglich die Treiber/Hardware Umsetzung von GDeflate/Direct Storage ist.
 
Zuletzt bearbeitet:
Ich habe grundsätzlich überhaupt keinen Bias was Features von Grafikkartenherstellern angeht, also spar dir das.
Deine Formulierungen und Verdrehung von Tatsachen spricht dagegen. Und ich spare mir gar nichts, das ist ein freies Forum.

Also nichts anderes als Nvidias interne Umsetzung. Warum wird es dann in Spielen als RTX IO beworben? Weil Nvidia GDeflate mit Microsoft entwickelt hat?
Genauso dumm in einem Spiel statt DXR Raytracing RTX Raytracing ins Optionsmenü zu schreiben, sofern RTX IO nichts anderes darstellt.
1. Wissen wir noch gar nicht ob es dafür eine Option in Spielen gibt.
2. Jeder Hersteller bewirbt seine Features, wieso sollte Nvidia das nicht tun?
Beispiele: AMDs Resize-Bar Umsetzung haben sie SAM genannt, ihre Adaptive Sync Umsetzung heißt Freesync, ihre Nvidia Reflex Konkurrenz-Technologie soll HYPR-RX heißen, das DLSS Pendant heißt FSR. RTX IO ist einfach Nvidias GPU-seitige Umsetzung der GPU Decompression. Wo Problem?
3. Branding gab es schon immer und wird es immer geben.


Es braucht dafür nicht noch einen Namen. Das sorgt nur für Verwirrung.
Ich bin mir sicher dass AMD demnächst einen eigenen Namen dafür hat, siehe Beispiele oben.

Das wäre dann rein Nvidias Treiber, für was dann eine Werbung und Nvidia Branding für etwas was ihnen nicht gehört?
Häh? Ja, Nvidias Treiber mit einem neuen Feature welches einen Namen bekommen hat. Was soll Nvidia an ihrem Treiber und ihrem Feature nicht gehören? Du redest Unsinn...

Welche Eigenentwicklung? Es ist doch laut dir nur ein Name.
Häh zum zweiten? Nvidias Treiber und wie dort die GPU Decompression umgesetzt wird ist sehr wohl deren Eigenentwicklung. Du redest noch mehr Unsinn...

Wer sagt man solle es nicht tun? Die Frage ist doch lediglich ob Nvidia damit die Konkurrenz ausbremst, bzw. was deren Werbung bezwecken soll, wenn es lediglich die Treiber/Hardware Umsetzung von GDeflate/Direct Storage ist.
Du implizierst in Deinen Kommentaren dass Nvidia damit vielleicht vor hatte die Konkurrenz auszubremsen. Das steht ja komplett außer Frage, Gdeflate ist OpenSource und die DirectStorage API für jeden Programmierer nutzbar.

Werbung soll immer bezwecken ein Produkt anzupreisen. Nvidia hat einfach nur eine Pressemitteilung veröffentlicht dass RTX IO zum ersten Mal in Spielen zu sehen sein wird. Nicht mehr und nicht weniger.

Man wird zur Veröffentlichung von Ratchet&Clank ja sehen ob es einen Unterschied zu AMDs Implementierung gibt, denn ich gehe davon aus dass die Features "DirectStorage + GPU Decompression" auf Karten beider Hersteller unterstützt werden.
 
Und ich spare mir gar nichts, das ist ein freies Forum.
Steht dir natürlich frei Nvidia für jeden Blödsinn zu verteidigen.
Wenn es für jedes DirectX Standard-Feature, das in Spielen integriert ist, eine Herstellereigene Bezeichnung benötigt, die in Spielemenüs zur Auswahl steht, dann würde sich niemand mehr zurechtfinden. RTX-IO ist nicht Nvidias eigene Entwicklung, sondern nur deren Integration in die Hardware und dafür braucht man keine Herstellereigene Bezeichnung, die hat AMD mit SAM genausowenig benötigt, denn es war schlicht R-BAR.
 
Zuletzt bearbeitet:
Deine Formulierungen und Verdrehung von Tatsachen spricht dagegen.
Was habe ich denn verdreht? Darf ich mich nicht fragen, was Nvidia mit diesem Marketingstunt bezweckt? Habe ich deine Ehre verletzt?:schief:
Und ich spare mir gar nichts, das ist ein freies Forum.
Tut so viel Bias wie deiner nicht schon weh?^^
1. Wissen wir noch gar nicht ob es dafür eine Option in Spielen gibt.
Irrelevant. Die Newsseiten werben mit "Nvidias Feature" ist aber halt nicht ihres, sondern schlicht DirectStorage 1.2:ka:.

2. Jeder Hersteller bewirbt seine Features, wieso sollte Nvidia das nicht tun?
Das ist ja nicht Nvidias Feature, wieso sollten sie es folglich bewerben?
Der Entwickler von Ratched & Clank spricht schlicht von DirectX Direct Storage.=)
RTX IO? Interessiert keinen.
(...)ihre Adaptive Sync Umsetzung heißt Freesync, ihre Nvidia Reflex Konkurrenz-Technologie soll HYPR-RX heißen, das DLSS Pendant heißt FSR.(...)
Alles Antworten und Entwicklungen auf proprietäre Nvidia Features, hat mit Microsofts Directx12 oder Vulkan, gar nichts zu tun.
Das einzige was passt ist SAM und das ist schlicht R-BAR und dafür gibt es auch keinen Nvidia exclusiven Namen, genauso wie es für Direct Storage auch keinen braucht.
3. Branding gab es schon immer und wird es immer geben.
Gabs für solche Dinge eigentlich nie.:ka:
Ich bin mir sicher dass AMD demnächst einen eigenen Namen dafür hat, siehe Beispiele oben.
Glaube ich nicht. Die werden das einfach Direct Storage nennen.
Was soll Nvidia an ihrem Treiber und ihrem Feature nicht gehören? Du redest Unsinn...
Weil das Feature nun mal Direct Storage 1.2 heißt und nicht "RTX IO".
Mal davon abgesehen, dass ich nie gesagt habe Nvidias Treiber würden denen nicht gehören. Netter Strohmann.
Nvidias Treiber und wie dort die GPU Decompression umgesetzt wird ist sehr wohl deren Eigenentwicklung. Du redest noch mehr Unsinn...
Bestreitet auch niemand, aber eben nicht Direct Storage.:ka:
Nvidia oder AMD können ja für jede Direct X Funktion einen eigenen Marketingnamen überlegen wenn sie wollen. Ist halt lächerlich, reine Kundenverarsche.

Du implizierst in Deinen Kommentaren dass Nvidia damit vielleicht vor hatte die Konkurrenz auszubremsen.
Zumindest nach der Darstellung in dem letzten Diskussionsthread zu dem Thema, wird das so dargestellt, aber nachdem der Entwickler von DirectStorage spricht, ist es eigentlich klar, dass Nvidia hoffentlich nicht ihre Umsetzung von Direct Storage anderen Herstellern aufzwingt, wie es schon bei Hairworks war.
.
Nvidia hat einfach nur eine Pressemitteilung veröffentlicht dass RTX IO zum ersten Mal in Spielen zu sehen sein wird. Nicht mehr und nicht weniger.
Ist halt kein RTX IO, sondern Direct Storage, wie oft noch?
Was in deren Treibern passiert, ist dann wieder eine andere Geschichte, gibt ja auch keinen Nvidia Marketingnamen für 40-bit virtual address space.
 
Was habe ich denn verdreht? Darf ich mich nicht fragen, was Nvidia mit diesem Marketingstunt bezweckt? Habe ich deine Ehre verletzt?:schief:
Nvidia entwickelt ein neues Feature mit (wie so oft) und bewirbt seine Produkte damit. Ich kann da keinen Marketingstunt erkennen.

Und was soll das mit meiner "Ehre" zu tun haben? Ich habe Dir meine Zeit geschenkt indem ich Dir detailliert erkläre was RTX IO genau ist. Alles was von Dir kommt sind wilde Beschuldigungen, verdrehte Tatsachen und alternative Fakten. Daher wird das auch meine letzte Antwort auf Deine Kommentare in diesem Thread sein. Du verweigerst jegliche Fakten, macht keinen Sinn mit so jemand zu diskutieren.

Tut so viel Bias wie deiner nicht schon weh?^^
Soll das umgekehrte Psychologie sein? Wo habe ich hier einen Bias gezeigt? Ich habe neutral erklärt was DirectStorage, Gdeflate und RTX IO sind.

Ein Bias wäre es wenn ich sage "AMDs Integration kann nur schlechter werden". Das sage ich aber nicht.

Du bist derjenige der grundlos, anhand von Spekulationen und wilden Theorien, versucht Nvidia schlecht zu reden.

Irrelevant. Die Newsseiten werben mit "Nvidias Feature" ist aber halt nicht ihres, sondern schlicht DirectStorage 1.2:ka:.
Wie oft noch? Es ist NICHT DirectStorage. Du hast Dir nichts aus meiner ersten Antwort durchgelesen oder das Video angeschaut, das zeigt sich hier noch mal deutlich...

1. Es geht um DirectStorage 1.1, seitdem wird nämlich die GPU Decompression unterstützt.
2. DirectStorage verbessert NUR den Transfer der Daten von einer NVME zum VRAM.
3. Die Dekomprimierung auf den Shadern und interne Speicherverwaltung obliegt den GPU Herstellern. Das ist nicht Teil von DirectStorage.
4. GPU Decompression setzt zwingend DirectStorage voraus. Als Fallback (falls DirectStorage auf dem System nicht verfügbar ist) dient weiterhin DirectCompute für die Dekomprimierung per CPU im RAM (der alte Weg). Das bedeutet nicht dass GPU Decompression ein Feature von Microsoft wäre.


Das ist ja nicht Nvidias Feature, wieso sollten sie es folglich bewerben?
Der Entwickler von Ratched & Clank spricht schlicht von DirectX Direct Storage.=)
RTX IO? Interessiert keinen.
DOCH, RTX IO ist ein Nvidia Feature. Und ich interessiere mich dafür, andere hier im Forum offensichtlich auch, für uns sprichst Du also mit Deinem "interessiert keinen" schon mal nicht.

Alles Antworten und Entwicklungen auf proprietäre Nvidia Features, hat mit Microsofts Directx12 oder Vulkan, gar nichts zu tun.
Das einzige was passt ist SAM und das ist schlicht R-BAR und dafür gibt es auch keinen Nvidia exclusiven Namen, genauso wie es für Direct Storage auch keinen braucht.
Siehe oben, GPU Decompression ist kein Teil von DirectStorage. Kann es auch gar nicht sein da DirectStorage keinen Zugriff auf die Grafikkarte hat und diese nicht steuert. Du solltest vielleicht erst mal lernen was eine API ist und was man damit anstellt.


Gabs für solche Dinge eigentlich nie.:ka:
Doch, Beispiele dafür habe ich genügend genannt.

Glaube ich nicht. Die werden das einfach Direct Storage nennen.
Können sie nicht, siehe oben. Ich wiederhole es wie ein Mantra, schlimm: DirectStorage ermöglicht GPU Decompression, ist selbst aber nicht dafür zuständig oder dazu zu gebrauchen!

Weil das Feature nun mal Direct Storage 1.2 heißt und nicht "RTX IO".
Mal davon abgesehen, dass ich nie gesagt habe Nvidias Treiber würden denen nicht gehören. Netter Strohmann.
Siehe oben. Ich wiederhole es nicht zum 4. Mal.

Bestreitet auch niemand, aber eben nicht Direct Storage.:ka:
Nvidia oder AMD können ja für jede Direct X Funktion einen eigenen Marketingnamen überlegen wenn sie wollen. Ist halt lächerlich, reine Kundenverarsche.
Du gehst weiterhin von einer faktisch falschen Denkweise aus. Ich wiederhole nicht zum 5. Mal was DirectStorage ist und was nicht.

Von mir aus kannst Du die Namensgebung für Features doof finden. Nur machen das irgendwie alle...

Beispiele?

Könnte man alles "temporale Upscaler" nennen: Intel XeSS, AMD FSR, Nvidia DLSS
Könnte man alles "GPU Control" oder so nennen: MSI Afterburner, Radeon Wattman


Zumindest nach der Darstellung in dem letzten Diskussionsthread zu dem Thema, wird das so dargestellt, aber nachdem der Entwickler von DirectStorage spricht, ist es eigentlich klar, dass Nvidia hoffentlich nicht ihre Umsetzung von Direct Storage anderen Herstellern aufzwingt, wie es schon bei Hairworks war.
.
Hoffentlich? Du schwurbelst schon wieder.

- Gdeflate ist OpenSource von Nvidia bereitgestellt.
- DirectStorage hat keinen, null, nada, Einfluss auf Grafikkarten und deren Treiber. Es ist einfach ein Teil von DirectX.
- Hairworks hat mit DirectStorage und GPU Decompression so viel zu tun wie Äpfel mit Birnen.

Ist halt kein RTX IO, sondern Direct Storage, wie oft noch?
Was in deren Treibern passiert, ist dann wieder eine andere Geschichte, gibt ja auch keinen Nvidia Marketingnamen für 40-bit virtual address space.
Du fragst "wie oft noch" obwohl Du die Zusammenhänge offensichtlich nicht verstehst. Schon witzig. :ugly:

Noch mal extra für Dich:
https://devblogs.microsoft.com/directx/directstorage-1-1-now-available/

Optimized Drivers Available Now​


GPU decompression is supported on all DirectX 12 + Shader Model 6.0 GPUs. However, one of the benefits of DirectStorage 1.1 is that GPU hardware vendors can provide additional optimizations for their hardware, called metacommands. For more information about support for these metacommands from our partners, see the links below. As always, we recommend updating to the latest drivers for your gaming hardware for the best performance.


AMD: https://gpuopen.com/amd-support-for-microsoft-directstorage-1-1
Intel: https://www.intel.com/content/www/us/en/developer/articles/news/directstorage-on-intel-gpus.html
NVIDIA: https://developer.nvidia.com/blog/a...mes-and-apps-with-gdeflate-for-directstorage/

https://developer.nvidia.com/blog/a...mes-and-apps-with-gdeflate-for-directstorage/

The NVIDIA RTX IO implementation of GDeflate is a scalable GPU-optimized compression technology that enables applications to benefit from the computational power of the GPU for I/O acceleration. It acts as a bandwidth amplifier for high-performance I/O capabilities of today and future systems.
 
Zuletzt bearbeitet von einem Moderator:
Um den Unterschied mal zu verdeutlichen habe ich die Avocado Demo laufen lassen, zu finden hier:
https://github.com/microsoft/DirectStorage/blob/main/Samples/BulkLoadDemo/README.md

Core i7 9700K, RTX 3080 10 GB, 16 GB RAM 3200 CL16
Win11, DirectStorage enabled auf der NVME SSD (checked per Windows Game Bar)

NVME: Samsung 970 EVO Plus 500GB, PCIE 3.0

1690271285931.png


NVME mit Command "BulkLoadDemo -gpu-decompression 0", also ohne GPU-Decompression (RTX IO):

1690271678173.png


Auf einer SATA SSD (also ohne DirectStorage) erhalte ich selbst mit GPU Decompression ähnliche Ergebnisse wie die im unteren Screenshot:

1690271929987.png



Der Unterschied ist krass, anders kann man das nicht bezeichnen. Wenn die GPU Decompression disabled wird hängt mein ganzes System kurz da die CPU zu 100% ausgelastet wird. Mit GPU Decompression dagegen merkt man nichts davon...
 
Man könnte auch die Speicherbandbreite großzügiger anlegen, das macht den Transfer von Daten auch schneller.

Man kann die Daten auch einfach rechtzeitig streamen und dann fertig dekomprimiert aus dem RAM laden und dadurch nicht nur die Wartezeit auf die CPU, sondern zusätzlich auch noch die aufs Laufwerk einsparen. Transferrate ist dabei auch kein Thema – die derzeit weit verbreiteste Kombination dürften 4.0-×16-GPUs (32 GB/s) mit 3.0-×4-SSDs (4 GB/s) sein. Das heißt man müsste im Schnitt mindestens Kompressionsfaktor acht halten, ehe eine hypothetische GPU mit unbegrenzt schnellem Entpacker und hinreichen lokalem VRAM via RTX-IO schneller laden könnte als aus dem RAM.

Selbst dann wäre es aber in den wenigsten Fällen wünschenswert. Eine RTX 4070 (Ti) kann ihren kompletten RAM-Inhalt beispielsweise bequem zweimal pro Sekunde komplett austauschen. Es darf aber bezweifelt werden, dass sie auch spielbare Frame-Raten in einem Spiel erreicht, dass alle 30 Fps 12 GiB an neuen Assets verwenden möchte. Direct Storage ist schneller als herkömmliche Nachladetechniken, aber nicht annähernd so schnell, dass es ständig auftretende Speicherüberläufe wegpuffern könnte. Situationen, die so kritisch sind, dass sie dadurch gerettet werden, sind eher zu erwarten, wenn man eine RTX 4060 mit zu wenig VRAM und nur ×8 in ein auf PCI-E-3.0 beschnittenes X470-System verbaut und dessen verbleibende CPU-Lanes für ein RAID 0 mit drei M.2-SSDs investiert, aber nur 2× 4 GiB RAM verbaut. Aber stellt sich schon einer derart absurde Kombination aus aktueller GPU, zu wenig RAM aller Orten und pfeilschneller SSD zusammen, außer Konsolenhersteller?

tl;dr: RTX IO ersetzt nicht die Nutzung von schnellem Arbeitsspeicher und schon gar nicht ausreichend VRAM, sondern ist die definitiv bessere Alternative zur Auslagerungsdatei.
 
Wer sagt denn was von Speicherüberläufe wegpuffern? Das ist doch gar nicht Sinn und Zweck.

Es geht darum, die CPU Last drastisch zu senken, indem man das Dekomprimieren der Assets für die GPU nicht mehr auf der CPU durchführt. Das ermöglicht es zudem die Datenraten massiv zu erhöhen, weil die GPU halt viel schneller ist.

Ich glaube das was du meinst ist die Vorstellung, dass man den Grafikspeicher durch Direct Storage besser ausnutzen kann und Agressiveres Streaming betreiben kann, weil weniger Daten im VRAM vorgehalten werden müssen, weil man neue Daten schneller nachschieben kann. Das wird sicherlich noch kommen und mit Sampler Feedback Streaming vielfach effizienter, da man so zusätzlich den VRAM Footprint der Assets minimieren kann, aber auch das soll doch nicht dafür sorgen, dass ein vollaufen des VRAMs kompensiert werden soll.

Wenn nur 8 GB vorhanden sind und 10 GB gebraucht werden, wird es mit Direct Storage genauso ruckeln wie bisher auch.
Der Unterschied wird sein, dass man mit reduzierten Settings, welche in 8 GB platz finden deutlich bessere Grafik qualität erzielen wird, eben dank Sampler Feedback Streaming, Virtual textures und allgemein agressiveres Streaming.
Damit letzteres möglich ist und die CPU damit nicht ständig genervt wird, hilft hier eben Direct Storage mit GPU Dekomprimierung.

Letztendlich kann man also aus vorhandenen Systemen mittlefristig mehr herausholen, da die Effizienz des Speichermanagements erhöht wird. Die Symptome bei Speichermangel werden aber identisch bleiben.

Aber das ist alles noch ziemlich weit weg und beschreibt nur das Potenzial das hier besteht. Zuerstmal soll Direct Storage das CPU Bottleneck beim Streaming von Assets beheben. Denn das wird in immer mehr Spielen jetzt schon zum Problem, selbst bei noch vergleichsweise geringer Streaminglast. Der aktuelle Ansatz ist einfach veraltet und ineffizient und wird den künftigen Anforderungen nicht mehr gerecht.
 
Zuletzt bearbeitet von einem Moderator:
Man kann die Daten auch einfach rechtzeitig streamen und dann fertig dekomprimiert aus dem RAM laden und dadurch nicht nur die Wartezeit auf die CPU, sondern zusätzlich auch noch die aufs Laufwerk einsparen.

Das würde bedeuten dass man alle Assets des Spiels (Texturen, Geometrie, zu kompilierende Shader) in den RAM laden müsste. Wir sprechen hier von 80+ GB bei manchen Titeln. Wer hat so viel RAM? Und wieso sollte man so viel RAM verbauen wenn man effizienter streamen kann?

"Rechtzeitig streamen" in Deiner Formulierung würde bedeuten dass man wieder CPU Cycles benötigt zum Übertragen und Dekomprimieren, womit die GPU wieder auf Assets warten muss bis die CPU fertig ist.

Mach doch einfach mal den Avocado Test und schau Dir den Unterschied lokal auf Deinem System an. In der Demo wird bei CPU Decompression anscheinend keine Rücksicht auf andere Threads genommen, mein ganzes System hing 1-2 Sekunden bis die CPU fertig war.
Mit GPU Decompression habe ich den Ladevorgang gar nicht mitbekommen, er war innerhalb von 480ms erledigt (CPU 2420ms) und hat die Daten mit einer Bandbreite von knapp 12GB/s (was wohl meiner NVME PCIE3.0 Schnittstelle x Komprimierung entspricht) gestreamed, während die CPU knapp 2,3GB/s hinbekommen hat.

Deine "Problemlösung" verschiebt das Bottleneck nur zeitlich anstatt es nachhaltig zu lösen.


tl;dr: RTX IO ersetzt nicht die Nutzung von schnellem Arbeitsspeicher und schon gar nicht ausreichend VRAM, sondern ist die definitiv bessere Alternative zur Auslagerungsdatei.
Wie oben bereits von @Lederjacke beschrieben ist das Ziel von DirectStorage + GPU Decompression (egal wie es bei den Herstellern heißt) allgemein das Asset-Streaming zu verbessern und die Dekomprimierung von der seriell arbeitenden CPU auf die hochgradig parallel arbeitende GPU zu verlagern.

In einem "Spiel startet" Szenario gümmelt meine GPU so lange rum bis die CPU endlich fertig ist mit Daten in den RAM laden, entpacken, rüberschaufeln, Threads starten, etc etc.

Warum soll das so bleiben? Es ist doch viel besser wenn die GPU in diesem Szenario die Dekomprimierung der Assets (Texturen, Geometrie, Shader) übernimmt und die CPU komplett umgangen wird. Dann kann die CPU ihre Aufgaben machen und die GPU eben ihre Aufgaben übernehmen da sie nichts zu tun hat und diese parallel viel effizienter erledigen kann.

Man braucht sich ja nur die Vergleiche hier anschauen:
https://developer.nvidia.com/blog/a...mes-and-apps-with-gdeflate-for-directstorage/

1690289580642.png


Die CPU Decompression hat keine Chance gegen die GPU Decompression.
 
@raPid-81
Ich versteh auch nicht, warum man das ganze immer als Konsolenproblem ansieht. Ja, du kannst dir am PC 128 GB RAM reinstecken, aber das löst halt das Problem nicht, ist für die meisten Spieler kostentechnisch nicht akzeptabel und es wäre ein Knieschuss, wenn Entwickler so programmieren würden und wie du schon gesagt hast, wird das eigentliche Problem, dass die ganzen Daten früher oder später von der CPU trotzdem dekomprimiert werden müssen nicht gelöst.

Zudem wirbt ja auch Nvidia selbst mit den Vorteilen. RTXIO wird ja eigentlich schon seit Turing beworben. Es ist halt ein industrieweiter Paradigmenwechsel. Dieser muss auch gar nicht zwingend von der Konsolenseite initiert worden sein. Wahrscheinlich war/ist das ganze schon viel länger in Planung gewesen und die Konsolenhersteller mussten es eben als erste auf den Markt bringen, da die Systeme dann ja wieder 8 Jahre am Markt bleiben werden.

Ich meine jeder sieht doch am PC wie Spiele von CPU Limitierungen und Nachladerucklern geplagt werden. Was soll mehr RAM denn da bringen, wenn man die Dekomprimierung nicht umgehen kann. Das was man potenziell an Rucklern während des Spielens verhindern kann "bezahlt" man dann mit unendlich langen Ladezeiten zum Spielstart und irrsinnig hohen Hardwarekosten für die unmengen an RAM, die schon heute und erstrecht morgen notwendig wären, wenn man diesen klassischen Ansatz weiter verfolgen würde. Und (De)Komprimierung ist nunmal notwendig, egal ob heute, morgen oder übermorgen.
 
Natürlich ist es das. Der Support für GDeflate wurde längst hinzugefügt.
Changelog 1.1.0. Nvidia kann sich ihre RTX IO Werbung sonst wohin stecken.:daumen:

Du kannst das immer weiter wiederholen, es wird dadurch nicht wahr.

Add support for GDeflate GPU decompression
Das bedeutet nur dass die DirectStorage API jetzt von Entwicklern für die Gdeflate GPU Decompression genutzt werden kann.

Die Dekomprimierung findet immer noch auf der GPU statt und wird NICHT durch DirectStorage sondern den Treiber des Herstellers bewerkstelligt.

Siehe dazu hier:
https://www.tomshardware.com/news/n...u-decompression-by-17-percent-on-pcie-50-ssds

Nvidia Driver Boosts GPU Decompression By 17 Percent On PCIe 5.0 SSDs​


Nvidia bringt einen neuen Treiber, der verringert die Dekomprimierungszeit um 17%, was hat jetzt DirectStorage damit zu tun? :stupid:
 
Der Unterschied wird sein, dass man mit reduzierten Settings, welche in 8 GB platz finden deutlich bessere Grafik qualität erzielen wird, eben dank Sampler Feedback Streaming, Virtual textures und allgemein agressiveres Streaming.
Die Sache ist doch um einiges schwerwiegender als dargestellt. Mit Sampler Feddback Streaming brauchst Du auflösungsabhängig nurmerhr einen festen Speicherpool (VRAM), also nur das "active working set" auf Texelbasis.
Der VRAM ist also nurmehr in Framebuffer und vielleicht noch ein kleiner Streaming- Buffer.

VRAM in der jetzigen Form wäre überflüssig. Um ein 4K Bild mit 16K vollgekleisterten Texturen auf den Bildschirm darzustellen, wird auf der Grafikkarte dann Szenenunabhängig ungefähr ein Bereich von 500 Megabyte genutzt.
Und ja- Das war kein Vertipper. Megabyte, nicht Gigabyte.

Letztendlich ist Sampler Feedback Streaming der Horror für alle Grafikkartenhersteller, die meinen sich ihren VRAM auf den Karten mit dem Kaufpreis "vergolden" zu lassen. Und jetzt fragt sich nochmal einer, warum diese revolutionäre Technik noch keinen Einzug in die Spieleengines/Software findet ;)
 
@ZeroZerp

Okay, dass man mit einem festen Pool auskommt war mir so noch nicht bewusst, aber ja es ergibt irgendwie Sinn.
Kann man sich wahrscheinlich im übertragenen Sinne vorstellen wie Nanite in der UE5, welches unabhängig von der Qualität der Assets immer nur die gleiche Rechenlast (und vermutlich auch VRAM footprint) abhängig von der Auflösung erzeugt.

Aber ich vermute mal, dass es früher oder später genutzt werden wird oder auch werden muss. Denn letztendlich wird primär für Konsolen entwickelt, da sie den kleinsten gemeinsamen Nenner am markt bilden. Und da gibts kein VRAM Upgrade. Will ein Entwickler "mehr" machen, wird er also auf Techniken wie SFS zurückgreifen müssen.

Stellt sich nur die Frage, ob Sony was gleichwertiges zu Sampler Feedback Streaming anbietet. Ist ja letztendlich nur ein Softwarefeature der Grafik API und nichts, was in Hardware gegossen sein muss.
 
@ZeroZerp

Okay, dass man mit einem festen Pool auskommt war mir so noch nicht bewusst, aber ja es ergibt irgendwie Sinn.
Kann man sich wahrscheinlich im übertragenen Sinne vorstellen wie Nanite in der UE5, welches unabhängig von der Qualität der Assets immer nur die gleiche Rechenlast (und vermutlich auch VRAM footprint) abhängig von der Auflösung erzeugt.

Aber ich vermute mal, dass es früher oder später genutzt werden wird oder auch werden muss. Denn letztendlich wird primär für Konsolen entwickelt, da sie den kleinsten gemeinsamen Nenner am markt bilden. Und da gibts kein VRAM Upgrade. Will ein Entwickler "mehr" machen, wird er also auf Techniken wie SFS zurückgreifen müssen.

Stellt sich nur die Frage, ob Sony was gleichwertiges zu Sampler Feedback Streaming anbietet. Ist ja letztendlich nur ein Softwarefeature der Grafik API und nichts, was in Hardware gegossen sein muss.

Ich kann Dir leider noch keine privaten Nachrichten schicken, daher hier falls Du Interesse hast:

Das Video ist ein "must-see" zu Sampler Feedback Streaming, vorallem die Demo ab Minute 7:30:
Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.

Und hier ein paar Hintergründe zum aktuellen Asset-Streaming und wo Sampler Feedback Streaming ansetzt:
https://forum.xboxera.com/t/a-more-detailed-insight-about-sampler-feedback-streaming/3543
 
Steht dir natürlich frei Nvidia für jeden Blödsinn zu verteidigen.
Wenn es für jedes DirectX Standard-Feature, das in Spielen integriert ist, eine Herstellereigene Bezeichnung benötigt, die in Spielemenüs zur Auswahl steht, dann würde sich niemand mehr zurechtfinden. RTX-IO ist nicht Nvidias eigene Entwicklung, sondern nur deren Integration in die Hardware und dafür braucht man keine Herstellereigene Bezeichnung, die hat AMD mit SAM genausowenig benötigt, denn es war schlicht R-BAR.
Vielleicht hier mal ein andere Betrachtungswinkel.

Gdeflate/Directstorage ist quasi eine API.

RTX IO ist die Art und weise, wie und welche Daten Nvidia Grafikkarten von dieser API anfragen.
Daher ist dies sehr wohl eine eigenentwicklung.

Wenn du ein Programm schreibst welches API Anfragen an Google Maps oder AWS oder Microsoft Azure stellt und dieses danach Verkaufst (sofern du die Rechte/Lizenzen zahlst). Bist du sehr wohl der Inhaber deines Produktes und kannst das Teil nennen wie du willst. Und du musst das ding nicht irgendwie AmazoneWebApi irgendwas nennen.

Auch kann dein Programm effizienter als z.B. die Konkurenz sein. Daher die "unterschiedliche" Implementierung eines Offenen Standards.

PS: Kann auch diskussionen einfacher machen.
Ala "Findest du RTX IO besser oder FX IO?" (Frei erfundener Name)

Anstelle von. "Findest du die GPU seitige Implementierung des Gdeflate Standards besser umgesetzt auf Grafikkarten von Nvidia oder AMD?"

PPS: Es ist wie Programiersprachen. Irgendwo ist der höchste Level erreicht der dem Kunden gegenüber aufgetischt wird.
Der Windows Calculator fragt dich auch ob du eine Multiplikation mit 2 machen willst und nicht ob du alle Bits aus nem Register um eins nach Links verschieben willst.
 
Gdeflate/Directstorage ist quasi eine API.
Das ist kein anderer Betrachtungswinkel, das ist eine falsche Information.

DirectStorage ist eine API die zu DirectX12 Ultimate gehört (wie Direct3D, DirectCompute,usw). Diese API wird dazu genutzt Daten von einem Datenträger woanders hin zu transportieren. Sie wurde komplett neu gebaut (optimiert für NVME SSDs) und beinhaltet viele neue Funktionen die es vorher schlicht nicht gab.

Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.

Gdeflate ist eine von Nvidia weiter entwickelte DEFLATE Komprimierung die auf hoch-parallelisierte Bearbeitung optimiert wurde:

https://github.com/microsoft/DirectStorage/blob/main/GDeflate/README.md

GDeflate is a new compression stream format that closely matches the DEFLATE format. The key difference lies in the way the bits in the compressed bitstream are stored. The GDeflate stream is essentially a reformatted version of any DEFLATE stream where the data is ordered in a particular way to efficiently extract 32 way parallelism without increasing the size of the input stream. This means that GDeflate can get very high decompression throughput on the GPU while still maintaining the exact same compression ratio of DEFLATE (with some small caveats about end effects).
 
Zurück