Geforce RTX 30 am Limit: Vergleich zwischen 10, 12 und 24 GiByte Grafikspeicher

Das ist aber nur ein Ecosystemen ein Vorteil bei den CPU-Leistung+RAM knapp sind. Heutige compressed Textureformats werden ja auch im RAM nicht mehr dekomprimiert, sondern komprimiert an den VRAM gesendet und erst bei Nutzung durch die GPU on-the-fly dekomprimiert. Sampler Feedback spart natürlich echt VRAM, aber dafür ist es im Prinzip egal ob ich die Texturdaten im RAM oder auf der SSD vorhalte. Eigentlich sollte der RAM immer noch die schnellste Lösung sein, wenn genug RAM da ist.
Bist Du sicher bezüglich des Dekomprimierungs-Vorgangs? Soweit mir bekannt ist die aktuelle Pipeline immer:
SSD compressed texture -> CPU schaufelt compressed in den RAM -> im RAM wird decompressed durch CPU -> CPU schaufelt uncompressed texture in VRAM

Da setzt ja DS an und verkürzt auf:
SSD compressed texture -> CPU schaufelt compressed in den RAM -> CPU schaufelt compressed in den VRAM -> GPU decompresses textures

Bei RTX IO entfällt dann sogar noch der RAM Zwischenschritt:
SSD compressed texture -> CPU schaufelt compressed in den VRAM -> GPU decompresses textures

Aus dem MS Dev Blog dazu:

no-direct-storage.png


direct-storage.png

Und von NV:

rtx-io.jpg
 
Für mich sieht die Sache ganz einfach aus: rtx3060/ti = 8GB, 3070=10GB, 3080=12 GB.
Das wäre angemessen. Meine im Verhältnis zu den aktuellen alte+lahme Gtx1070 hat schon 8GB, und der ist oft >7GB ausgelastet. Da sind ja 3070/3080 mit 8Gb lachhaft.
Die rtx2060 wurde auch schon von ihren mickrigen 6gb ausgebremst.
Da kann man nur sagen, zum Glück ist die aktuelle GPU Generation eh nicht kaufbar, daher ist es auch egal wieviel ram die hat. Die sind wohl für die Zielgruppe der Miner gebaut wurden.
Vielleicht ist es einfach besser die aktuellen gpu's mal komplett auszublenden, auch keine News mehr drüber zu bringen.
Als Gamer über die aktuellen nicht kaufbaren GPU'S zu philosophieren ist so wie darüber zu debattieren wer nun die bessere Warp Technologie hat, Klingonen oder Vullanier. Kann man machen, ist aber völlig nutzlos und rein theoretisch/abstrakt.
Es wäre so gut wenn keine GPU Tech-News mehr auf Gaming Webseiten erscheinen, so lange bis es GPU'S wieder zu vernünftigen Preisen gibt.
Der Trend gehört boykottiert.
 
Was ja gerne mal vermutet wird ist, dass der VRAM Bedarf immer weiter steigen wird.

Ich habe da mal ein paar Indizien, dass vielleicht sogar das Gegenteil eintreffen wird.

- DLSS, findet immer mehr Verbreitung, wird in viele große Engines eingebettet und senkt den Verbrauch.
- Die Konsolen als Orientierungspunkt. Ich nehme sie eigentlich schon lange als solchen und bin damit immer gut gefahren. Denn...
- Entwickler kennen doch die verfügbare Hardware, warum sollte man daran vorbei entwickeln und viel mehr noch die Frage, ist das überhaupt notwendig!?
- Unreal Engine 5. Wie im Digital Foundry Video zu sehen ist der VRAM Bedarf extrem wenig.
- Was ist mit AMDs Lösung zur Bildrekonstruktion? Wird wohl auch sehr stark verbreitet werden, auch hier weniger VRAM Bedarf?
- Neue (Streaming) Techniken

Also ich glaube nach wie vor, dass VRAM aktuell eher ein Ausnahme-Problem bleibt.
Wenn ich mir die Performance der UE5 Demo so ansehe, dann wird es wohl eher die Geschwindigkeit aktueller GPU Architekturen sein. ^^

Und auf der anderen Seite. Es ist zwar schön und gut und sicherlich optisch sehr ansprechend, 4k oder 5k+ Auflösungen zu beschauen. Oder halt solche extrem Experimente.
Aber man darf ja bei Spielen auch nicht die FPS vergessen oder!?
Ich persönlich finde 4k auch ganz toll, aber mein persönlicher Geschmack mag die damit verbundenen FPS nicht.
Ich liebe mindestens 90+ und das in Verbindung mit solchen Auflösungen beißt sich leider (noch) zu oft.

Aber das sind auch nur meine Gedanken, Meinungen und Vermutungen. 21:9 Widescreen Fanboy halt :ka:
 
Für mich sieht die Sache ganz einfach aus: rtx3060/ti = 8GB, 3070=10GB, 3080=12 GB.
Das wäre angemessen. Meine im Verhältnis zu den aktuellen alte+lahme Gtx1070 hat schon 8GB, und der ist oft >7GB ausgelastet. Da sind ja 3070/3080 mit 8Gb lachhaft.
Du meinst hier wohl die 3060/3070 mit 8 GB. Die 3080 hat 10 GB.

Die rtx2060 wurde auch schon von ihren mickrigen 6gb ausgebremst.
Da kann man nur sagen, zum Glück ist die aktuelle GPU Generation eh nicht kaufbar, daher ist es auch egal wieviel ram die hat. Die sind wohl für die Zielgruppe der Miner gebaut wurden.
Also die Verbreitung laut Steam Umfrage ist quasi gleich zur Verbreitung der RTX2000er Gen im selben Zeitraum. Ein paar Gamer haben also sehr wohl Karten bekommen (sieht man auch hier im Forum).
 
Das ist aber nur ein Ecosystemen ein Vorteil bei den CPU-Leistung+RAM knapp sind.
Es ist ein Flaschenhals- Problem. Die CPUs können bezüglich der Kerne nur leicht ausgelastet sein, während die I/O Einheiten bereits begrenzen. Es gibt allerlei unterschiedliche Arten von CPU Limit.

Heutige compressed Textureformats werden ja auch im RAM nicht mehr dekomprimiert, sondern komprimiert an den VRAM gesendet
Ja. Das trifft auf die verschiedenen standardisierten Textur- Formate zu- Aber wie gesagt. Der stream der Container ist meist auch komprimiert (Kraken/oodle). -> Die neuen Konsolen haben die Dekompression in Hardware gegossen.
Sampler Feedback spart natürlich echt VRAM, aber dafür ist es im Prinzip egal ob ich die Texturdaten im RAM oder auf der SSD vorhalte. Eigentlich sollte der RAM immer noch die schnellste Lösung sein, wenn genug RAM da ist.
Es gibt unterschiede, ob Du mit einer CPU und den dazu notwendigen Wegen dazwischen auf den RAM zugreifst oder den SSD Speicher direkt Seitenweise in den VRAM einblenden kannst.
Das System ist meines Wissens nicht darauf abgestimmt, einen direct memory access auf den RAM zuzulassen.

Wozu auch, ist das ganze System ja letztendlich dazu gedacht, eben RAM und VRAM sinnvoller einzusetzen bzw. auf ein storage tier drunter binden zu können.

Siehe Schaubilder von raPid-81

Letztendlich spekulieren die User beider "Fraktionen" nur ins Blaue.

-Die einen gehen davon aus, dass Realtime- Raytracing und DLSS nicht an Traktion gewinnt bzw. noch länger irrelevant bliebe.

-Die anderen, dass dem steigenden VRAM Bedarf mit den neuen Techniken Einhalt geboten wird.

Kann alles sein, muss aber nicht. Da hängt noch zu viel von der eigenen "Titelauswahl" statt.

Geht man davon aus, dass die Konsolen den Takt angeben werden, dann sieht es so aus, als ob RTRT inkl. moderner Streaming- Verfahren und immer ausgefeilterem Upscaling eher wahrscheinlich sind, als dass der VRAM Bedarf weiter explodieren würde.
Wie hier schonmal von irgendjemand angemerkt. Die VRAM Menge (8GB) reicht bereits, um bei sinnvoller Nutzung den gesamten Bildschirm mit 4K Texturen auszupflastern.

Auf der PS5 bleibt nach Abzug des Betriebsystems und des Gamecodes nämlich auch nicht mehr so viel zur VRAM Nutzung übrig...

Siehe Ratchet und Clank auf der PS5. Ein tolles Beispiel, was wir künftig zu erwarten haben.
 
Zuletzt bearbeitet:
Bist Du sicher bezüglich des Dekomprimierungs-Vorgangs? Soweit mir bekannt ist die aktuelle Pipeline immer:
SSD compressed texture -> CPU schaufelt compressed in den RAM -> im RAM wird decompressed durch CPU -> CPU schaufelt uncompressed texture in VRAM

Da setzt ja DS an und verkürzt auf:
SSD compressed texture -> CPU schaufelt compressed in den RAM -> CPU schaufelt compressed in den VRAM -> GPU decompresses textures

Bei RTX IO entfällt dann sogar noch der RAM Zwischenschritt:
SSD compressed texture -> CPU schaufelt compressed in den VRAM -> GPU decompresses textures

Aus dem MS Dev Blog dazu:

Anhang anzeigen 1366632

Anhang anzeigen 1366633
Und von NV:

Anhang anzeigen 1366634
Wir reden hier über 2 Schritte an Komprimierung. Im VRAM arbeitet man heute mit dxtc/s3tc/bcn, diese Formate werden noch einmal gepackt. Das Entpacken der gepackten dxtc/s3tc/bcn erfolgt dann wirklich durch CPU und RAM. Bei Direktstorage würde dieser Schritt entfallen und die GPU würde den auch übernehmen. Es ändert aber nichts am VRAM Bedarf, und ist auch nicht schneller, wenn der RAM groß genug ist. Natürlich ist die GPU viel schneller als die CPU, aber es ist nur relevant, wenn man den Fall betrachtet bei dem die Daten noch auf der SSD liegen. Liegen sie bereits erstentpackt im RAM, ändert sich nichts. Ist der RAM groß genug kann man das bei Laden des Levels schon vorab erledigen.
 
Ist der RAM groß genug kann man das bei Laden des Levels schon vorab erledigen.
Du hast die Problematik, dass CPU gestützte Lade- und Entlade bzw. Swap- Vorgänge überwiegend nur single- threaded abgearbeitet werden können.

Wie man es dreht und wendet. Es wird langsamer bleiben als der "direkte" Weg, da in diesem Bereich weniger die Maximalbandbreite denn die Gesamtlatenz eine Rolle spielt und wie gesagt- Die neuen Techniken wurden ja gerade deshalb entwickelt, um sich den Umweg über den RAM und andere beteiligte Systeme sparen zu können.

Dass das Loading über den RAM in der Praxis nicht sonderlich effektiv ist, lässt sich für jeden einfach testen.
RAM- Disk erstellen, Spiel reininstallieren und schauen, wie schnell das dann läuft.

Theoretisch sollten die Spiele laden rennen, als ob es kein Morgen mehr gäbe, also um Faktoren schneller. Tun sie aber nicht....
Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.

Aber ich weiss, was Du meinst. Würde es so einen Direkttransfer in Richtung RAM geben und eine darauf optimierte Software, sollte dies schneller ablaufen können.
 
Zuletzt bearbeitet:
Jo guter Punkt mit der RAM-Disk. Hab auch permanent eine RAM-Disk mit 32GB aktiv (RAM wird nur allokiert, wenn sich RAM-Disk füllt) und darüber habe ich auch schon ein paar Spiele laufen lassen. Ist manchmal ganz nützlich, wenn man mit Wegwerf-Dateien arbeitet oder eine temporäre Umgebung benötigt, wo es schnell gehen soll. [Die Dateien auf der RAM-Disk überleben logischerweise keinen Reboot und müssen, wenn man sie behalten will, vor dem Beenden (automatisch) auf ein Image gespiegelt oder manuell gesichert werden. Aber für temporäre Daten und für Testzwecke ist das perfekt.]

Spiele laden manchmal ein bisschen schneller als mit einer SSD, aber nicht zwangsläufig, obwohl die Geschwindigkeit der RAM-Disk so hoch ist, dass selbst CrystalDiskMark teilweise völlig überfordert ist. Da kann keine SSD mithalten. ^^

1623506787541.png
1623505623078.png
 
Zuletzt bearbeitet:
Mir ging es nicht darum, dass es nicht schneller sein kann, mir ging es darum, dass es den VRAM Bedarf nicht ändert. Bei den Konsolen hilft man sich ja auch damit, dass das Erstentpacken von extra Chip erledigt wird. Trotzdem muss man sich klar sein, dass selbst dann die Bandbreite lächerlich ist im Vergleich zur Bandbreite zwischen GPU und VRAM.
 
Mir ging es nicht darum, dass es nicht schneller sein kann, mir ging es darum, dass es den VRAM Bedarf nicht ändert. Bei den Konsolen hilft man sich ja auch damit, dass das Erstentpacken von extra Chip erledigt wird. Trotzdem muss man sich klar sein, dass selbst dann die Bandbreite lächerlich ist im Vergleich zur Bandbreite zwischen GPU und VRAM.
Das Problem liegt ja darin dass "viel zu viele" Texturen im VRAM vorgehalten werden müssen weil die Prediction, was als nächstes benötigt wird, nicht gut genug ist und das Nachladen von Texturen zu langsam ist.

Wenn das Streaming schnell genug ist on-the-fly die benötigten Daten einer Szene zu laden, dann benötigt man eben für ein 4K Frame "nur" maximal 8GB.

Und genau da setzen ja DirectStorage und Sampler Feedback Streaming an:
DirectStorage - erhöht die IO Rates und somit die Streaming Effizienz.
Sampler Feedback Streaming - ermöglicht das dedizierte Laden von Teilen der Texturen im benötigten MIP Level die man tatsächlich benötigt. Außerdem werden nicht mehr benötigte Texturen schnellstmöglich wieder aus dem VRAM geworfen.

Sieht man alles in der verlinkten Xbox Velocity Architecture Tech Demo.
 
Mir ging es nicht darum, dass es nicht schneller sein kann, mir ging es darum, dass es den VRAM Bedarf nicht ändert.
Eben genau darum geht es.

Es ist ein Unterschied, ob Du beim Roaming durch eine Openworld vorausschauend ein Preloading der "chunks" durchführen musst (was zwangsläufig eine höhere Speicherbelegung zur Folge hat), oder ob Du nur das aktuelle Workingset im VRAM haben musst, weil das letzte storage tier so schnell angesprochen werden kann, dass es Texturen in entsprechender Bildschirmauflösung umgehend liefern kann.
 
Soweit ich das verstehe ist das Problem, das GDDR6 ein 8er Bus und GDDR6X ein 12er Bus hat.
Man kann den Chip bzw den Memory Bus beschneiden und weniger Chips verbauen, was aber die Transferrate verringert. Aber nicht mehr verbauen?
Also wenn GDDR6 verbaut ist können nur max 8 VRAM Chips verbaut sein (daher 8er Bus). Deshalb hat die 3070 8x1GB VRAM.
Man könnte auch 8x 2GB Chips wie AMD verbauen, nur die kosten mehr XD.
Die 3060 hat aun ein 8er Bus, aber nur 6 Chips, was dem geschnittenen Chip geschuldet ist. Aber Nvidia meint 6GB ist doch zu wenig und hat 2GB Chips genommen. Daher 6x2GB
Bei der 3090 hat man einen anderen Weg genommen und den Bus gedoppelt mit 24x1GB VRAM. Man tat dies weil es Probleme gibt mit den 2GB VRAM Chips in GDDR6X.

Für eine 3070 mit 10GB müsste man also 5x2GB VRAM Chips verbauen, was die Transferrate stark verringern würde.
Oder es geht nicht, weil sonst 3 Memory-Schnittstellen auf dem Chip ohne Anschluss wären?

Das ist nur grob das was ich als Laie verstanden habe :P
 
Soweit ich das verstehe ist das Problem, das GDDR6 ein 8er Bus und GDDR6X ein 12er Bus hat.
Man kann den Chip bzw den Memory Bus beschneiden und weniger Chips verbauen, was aber die Transferrate verringert. Aber nicht mehr verbauen?
Also wenn GDDR6 verbaut ist können nur max 8 VRAM Chips verbaut sein (daher 8er Bus). Deshalb hat die 3070 8x1GB VRAM.
Man könnte auch 8x 2GB Chips wie AMD verbauen, nur die kosten mehr XD.
Die 3060 hat aun ein 8er Bus, aber nur 6 Chips, was dem geschnittenen Chip geschuldet ist. Aber Nvidia meint 6GB ist doch zu wenig und hat 2GB Chips genommen. Daher 6x2GB
Bei der 3090 hat man einen anderen Weg genommen und den Bus gedoppelt mit 24x1GB VRAM. Man tat dies weil es Probleme gibt mit den 2GB VRAM Chips in GDDR6X.

Für eine 3070 mit 10GB müsste man also 5x2GB VRAM Chips verbauen, was die Transferrate stark verringern würde.
Oder es geht nicht, weil sonst 3 Memory-Schnittstellen auf dem Chip ohne Anschluss wären?

Das ist nur grob das was ich als Laie verstanden habe :P
Das hast Du ganz gut beschrieben, es ist immer ein Zusammenspiel von Speicher-Bus und Bausteinen. Nur ein Punkt ist "falsch":

Man tat dies weil es Probleme gibt mit den 2GB VRAM Chips in GDDR6X.
Es gab zu dem Zeitpunkt noch keine 2GB GDDR6X Chips von Micron. Ich bin mir nicht mal sicher ob es die aktuell bereits gibt, eigentlich waren sie für Anfang 2021 angekündigt, habe aber nichts mehr diesbezüglich gehört. Laut der Official Page gibt es weiterhin nur die kleinen Bausteine.

https://www.micron.com/products/ultra-bandwidth-solutions/gddr6x
 
Es gab zu dem Zeitpunkt noch keine 2GB GDDR6X Chips von Micron. Ich bin mir nicht mal sicher ob es die aktuell bereits gibt, eigentlich waren sie für Anfang 2021 angekündigt, habe aber nichts mehr diesbezüglich gehört. Laut der Official Page gibt es weiterhin nur die kleinen Bausteine.
DAS meinte ich mit dem Problem ja XD
 
Man kann auch (fast) beliebeig andere Speicherkonfigurationen bereitstellen mit dann aber jeweils abweichenden Bandbreiten.

Was dann passiert haben wir am Beispiel der GTX 970 gesehen, für die NVIDIA am nächsten Baum aufgehängt wurde, obwohl das in meinen Augen (bei entsprechender Transparenz) ein garnicht so unattraktiver Weg wäre, die Speichermenge bei niedrigen Kosten zu erhöhen.
Nicht alle Speicherresidenten Daten im VRAM der Grafikkarte, die zur Berechnung einer Szene notwendig sind, sind Bandbreitenkritisch und könnten auch im "langsameren" Bereich vorgehalten werden.
Die Latenzen bleiben ja gleich.
 
Zuletzt bearbeitet:
5K-DLSS entspricht (auf dem Quality-Preset) ca nativ gerendertem 1900p, was wiederum beinahe 4K ist. Die 12% machen den Braten nicht fett und 5K-DLSS sieht höchstwahrscheinlich auch besser aus als 4K-nativ, wenn selbst 4K-DLSS oftmals besser aussieht als 4K-nativ. Von daher... ist doch super. Eine BigNavi-Karte wurde sowieso nicht mitgetestet, also warum darüber aufregen?

Die Frage müsste viel eher sein, warum wird jedes andere Spiel außer Wolfenstein Youngblood mit DLSS getestet, wenn es doch verfügbar ist?

Wirkt alles ein bisschen willkürlich.
Sehe da keine Struktur oder Absicht drin.
So what?

RE8 = kein DLSS verfügbar; ist logischerweise aus
Godfall = kein DLSS verfügbar; ist logischerweise aus
Minecraft = DLSS verfügbar; wurde eingestellt
Call of Duty Black Ops Cold War = DLSS verfügbar; wurde eingestellt
Wolfenstein Youngblood = DLSS verfügbar; wurde nicht eingestellt

[Falls einer fragt, warum es kein DLSS gibt... Das hat AMD in diesen Spielen druch Sponsoring verhindert.]
 
Eben genau darum geht es.

Es ist ein Unterschied, ob Du beim Roaming durch eine Openworld vorausschauend ein Preloading der "chunks" durchführen musst (was zwangsläufig eine höhere Speicherbelegung zur Folge hat), oder ob Du nur das aktuelle Workingset im VRAM haben musst, weil das letzte storage tier so schnell angesprochen werden kann, dass es Texturen in entsprechender Bildschirmauflösung umgehend liefern kann.
Kann es eben nicht. Wir sind zwar schneller als HDD -> CPU -> RAM -> VRAM -> GPU aber immer noch um rund Faktor 80+ unter VRAM -> GPU.

PCIe 4.0 kann maximal 32 GB/s selbst, eine typische NVME SSD vielleicht 5,5 GB/s, eine RTX 3700 hat 448 GB/s, eine 3080 760 GB/s. Natürlich ist das immer noch eine andere Hausnummer als das was heutige Streamingengines mit ner HDD schaffen (~ 50 MB/s)
 
Also die Geschwindigkeit, die im Video gezeigt wurde reicht mir als Normalo aus.
Ich kann net 100x schneller gucken.
 
Kann es eben nicht. Wir sind zwar schneller als HDD -> CPU -> RAM -> VRAM -> GPU aber immer noch um rund Faktor 80+ unter VRAM -> GPU.

PCIe 4.0 kann maximal 32 GB/s selbst, eine typische NVME SSD vielleicht 5,5 GB/s, eine RTX 3700 hat 448 GB/s, eine 3080 760 GB/s. Natürlich ist das immer noch eine andere Hausnummer als das was heutige Streamingengines mit ner HDD schaffen (~ 50 MB/s)
Für den PC sind diese Techniken völlig irrelevant im Bezug auf den Vram.
Nützlich ist einzig dass die GPU kommunizieren kann was sie wirklich sieht, Während die Engine normalerweise bereitstellen würde was man sehen könnte.

Die Wunschträume dass sich der Vram Bedarf dadurch reduziert, ist reine Träumerei. Die Entwickler würden die geringen Einsparungen direkt in Qualität investieren, einfacher kann man keine Qualität erzeugen als durch hochauflösenden Texturen.

Das Subsystem eines PC lacht sich tot über die Bandbreite von einer SSD.
 
Zurück