• Hallo Gast, du kaufst gerne günstig ein und erfährst oft vor deinen Freunden von interessanten Angeboten? Dann kannst du dein Talent als Schnäppchenjäger jetzt zu Geld machen und anderen PCGH-Lesern beim Sparen helfen! Schau einfach mal rein - beim Test der Community Deals!

GeForce RTX 3080 Ti: Polnischer Händler listet neues MSI-OC-Modell

raPid-81

Freizeitschrauber(in)
Da lügt keiner, du interpretierst da lediglich Dinge rein die es nicht gibt. Hier geht es um Streaming, das hat nichts mit dem eigetnlich Vram zh tun. Streaming ist ein notwendiges Übel weil Vram nie ausreicht. Wer eine 3090 hat wäre eigentlich froh wenn er diesen Schrott ganz deaktivieren könnte.
Jo, ich "interpretiere" da total was rein. "Makes it look like your GPU has x times more memory". Das bilde ich mir nur ein. Komm, geh weg....
 

Gurdi

Kokü-Junkie (m/w)
Du musst nur ganz fest dran glauben dass diese Feature dir in 8 Jahren deinen Vram entlastet, viel Glück.
 

raPid-81

Freizeitschrauber(in)
Du musst nur ganz fest dran glauben dass diese Feature dir in 8 Jahren deinen Vram entlastet, viel Glück.
Danke. Dir viel Spaß mit 16 GB VRAM und hoffentlich gutem "Super Resolution" wenn ich mit RT, DLSS und den ganzen neuen Features in 2-3 Jahren immer noch alles mit meinen 10 GB zocken kann. :lol:

Ernsthaft Gurdi, hast Du überhaupt mal GELESEN was die Features ermöglichen? Und dass sie bereits seit Turing / RDNA1 integriert sind? Was fehlt ist nur DirectStorage, und das kommt noch dieses Jahr.

Edit: Und was redest Du da von 8 Jahren? Ich habe noch nie eine Grafikkarte SO lange besessen. Das ist eine absurde Erwartung. KEINE Grafikkarte von vor 8 Jahren kann die Spiele von heute mit hohen Details (ohne RT versteht sich) flüssig darstellen, selbst wenn sie 128 GB VRAM hätte...
 

Gurdi

Kokü-Junkie (m/w)
Bis wir eine sinnige implementierung in der Breite von IO oder Direct Storage sehen werden sind 8 Jahre vergangen.

Ich hab mich schon länger mit den Techniken beschäftigt,die Folien sind extra so aufgezogen dass Leute wie du denken dass man damit Vram sparen könnte, tut man aber nicht. Es geht rein um eine Beschleunigung des Streaming in den Vram was ausdrücklich zu begrüßen ist, es reduziert aber in keiner Weise den Verbrauch sondern der Sinn dahinter ist die CPU zu entlasten, Latenzen zu reduzieren indem man den Umweg über den Ram spart sowie via kompression Bandbreite zu sparen. Am Ende landet es aber immer im Vram. Immer, immer,immer.

Ein PC ist keine Konsole, wir nutzen keinen SOC.
 

raPid-81

Freizeitschrauber(in)
Bis wir eine sinnige implementierung in der Breite von IO oder Direct Storage sehen werden sind 8 Jahre vergangen.

Ich hab mich schon länger mit den Techniken beschäftigt,die Folien sind extra so aufgezogen dass Leute wie du denken dass man damit Vram sparen könnte, tut man aber nicht. Es geht rein um eine Beschleunigung des Streaming in den Vram was ausdrücklich zu begrüßen ist, es reduziert aber in keiner Weise den Verbrauch sondern der Sinn dahinter ist die CPU zu entlasten, Latenzen zu reduzieren indem man den Umweg über den Ram spart sowie via kompression Bandbreite zu sparen. Am Ende landet es aber immer im Vram. Immer, immer,immer.

Ein PC ist keine Konsole, wir nutzen keinen SOC.
Was Sampler Feedback Streaming ist hast Du anscheinend nicht verstanden. Aber spiel Du mal mit einer Geforce 700 / Rx 200 die Spiele von heute, das sind die 8 Jahre alten Generationen...

Sampler Feedback Streaming reduziert die benötigten Texturen um bis zu 90%! Das ist garantiert übertrieben und in der Praxis wird es niemals erreicht, aber selbst wenn es nur HALB so gut ist dann reduziert es den VRAM Bedarf immer noch um fast 50%.
 

Opprobrium

PC-Selbstbauer(in)
Game textures are optimized at differing levels of detail and resolution, called mipmaps, and can be used during rendering based on how close or far away an object is from the player. As an object moves closer to the player, the resolution of the texture must increase to provide the crisp detail and visuals that gamers expect. However, these larger mipmaps require a significant amount of memory compared to the lower resolution mips that can be used if the object is further away in the scene. Today, developers must load an entire mip level in memory even in cases where they may only sample a very small portion of the overall texture. Through specialized hardware added to the Xbox One X, we were able to analyze texture memory usage by the GPU and we discovered that the GPU often accesses less than 1/3 of the texture data required to be loaded in memory. A single scene often includes thousands of different textures resulting in a significant loss in effective memory and I/O bandwidth utilization due to inefficient usage. With this insight, we were able to create and add new capabilities to the Xbox Series X GPU which enables it to only load the sub portions of a mip level into memory, on demand, just in time for when the GPU requires the data. This innovation results in approximately 2.5x the effective I/O throughput and memory usage above and beyond the raw hardware capabilities on average.


Ich versteh nicht viel davon, aber es wird deutlich weniger Vram verschwendet.
So eine dumme Diskussion von dir Gurdi.:daumen2:
 

seahawk

Volt-Modder(in)
Man kann die hoch optimierte Konsole nicht mit dem PC vergleichen und wenn man einen Grafikkarte für 2000 Euro kauft (3080), dann möchte man wahrscheinlich auch eine bessere Grafik sehen, als auf der 500 Euro Konsole, aber die Konsole ist halt voll moderner AMD Technik.
 

raPid-81

Freizeitschrauber(in)
Man kann die hoch optimierte Konsole nicht mit dem PC vergleichen und wenn man einen Grafikkarte für 2000 Euro kauft (3080), dann möchte man wahrscheinlich auch eine bessere Grafik sehen, als auf der 500 Euro Konsole, aber die Konsole ist halt voll moderner AMD Technik.
Nichts wird gelesen, es wird einfach ignoriert und stur behauptet dass man das nicht vergleichen kann. Ich kann nur DOCH sagen:

PCIe 3.0 x4 = 32 GBit/s = 4 GB/s
PCIe 3.0 x2 = 16 GBit/s = 2 GB/s

Xbox Series X will include a 1TB NVME SSD, delivering 2.4 GB/s of raw I/O throughput.

Mit einer PCIe 3.0 M2 SSD kommt man also leicht auf ähnliche oder höhere Übertragungsraten.

Zum Verständnis was Sampler Feedback Streaming verändert (danke @Opprobrium für den Link):

Sampler Feedback Streaming is a brand-new innovation built on top of all the other advancements of the Xbox Velocity Architecture. Game textures are optimized at differing levels of detail and resolution, called mipmaps, and can be used during rendering based on how close or far away an object is from the player. As an object moves closer to the player, the resolution of the texture must increase to provide the crisp detail and visuals that gamers expect. However, these larger mipmaps require a significant amount of memory compared to the lower resolution mips that can be used if the object is further away in the scene. Today, developers must load an entire mip level in memory even in cases where they may only sample a very small portion of the overall texture. Through specialized hardware added to the Xbox One X, we were able to analyze texture memory usage by the GPU and we discovered that the GPU often accesses less than 1/3 of the texture data required to be loaded in memory. A single scene often includes thousands of different textures resulting in a significant loss in effective memory and I/O bandwidth utilization due to inefficient usage. With this insight, we were able to create and add new capabilities to the Xbox Series X GPU which enables it to only load the sub portions of a mip level into memory, on demand, just in time for when the GPU requires the data. This innovation results in approximately 2.5x the effective I/O throughput and memory usage above and beyond the raw hardware capabilities on average. SFS provides an effective multiplier on available system memory and I/O bandwidth, resulting in significantly more memory and I/O throughput available to make your game richer and more immersive.
 

Gurdi

Kokü-Junkie (m/w)
Die theoretischen Übertragunsraten werden NIE erreicht. ein 4x3.0 Anschluss erreicht bei einer NV Graka gerade mal 2,3GB/s
Screenshot (25).png

Eine AMD Karte so etwa 2,5 GB/s
Screenshot (20).png


Selbst das sind aber eher theoretische Werte die im eigentlichen Alltag nicht erreicht werden könne, da kommen noch so Dinge wie Latenzen, Protokolle, andere Verbraucher etc hinzu.
 

raPid-81

Freizeitschrauber(in)
Die theoretischen Übertragunsraten werden NIE erreicht. ein 4x3.0 Anschluss erreicht bei einer NV Graka gerade mal 2,3GB/sAnhang anzeigen 1361928
Eine AMD Karte so etwa 2,5 GB/s
Anhang anzeigen 1361929

Selbst das sind aber eher theoretische Werte die im eigentlichen Alltag nicht erreicht werden könne, da kommen noch so Dinge wie Latenzen, Protokolle, andere Verbraucher etc hinzu.

Kann ich nicht bestätigen:

1619420496107.png


Und 2,4 GB/s sind ja äquivalent zu der XSX SSD. Was willst Du damit sagen?
 

Gurdi

Kokü-Junkie (m/w)
was kannst du nicht bestätigen? Du erreichst doch gerade mal 12,8 das ist weit entfernt vom maximalen Durchsatz und übrigens ein sehr schlechter Wert.
 

raPid-81

Freizeitschrauber(in)
was kannst du nicht bestätigen? Du erreichst doch gerade mal 12,8 das ist weit entfernt vom maximalen Durchsatz und übrigens ein sehr schlechter Wert.
1. Der "3DMark PCI Express feature test" testet ja nur die PCIe Bandbreite zur GPU, ich arbeite gerade parallel. Somit läuft aktuell bei mir beim testen Diverses im Hintergrund.
2. Wo ist das Problem mit ~ 2,4 GB/s von der NVME zur GPU? Das ist ja der XSX Wert mit dem Microsoft plant.
3. DirectStorage setzt bei Deinen Kritikpunkten an: Latenzen, Protokolle, andere Verbraucher etc. Bitte erst mal lesen: Link
 

raPid-81

Freizeitschrauber(in)
Du willst es einfach nicht verstehen...
Dann erklär mir doch bitte warum es nicht funktioniert was sich MS, Nvidia und Sony da ausgedacht haben...

1. DirectStorage beschleunigt den Datenaustausch zwischen NVME und GPU. Höherer throughput durch verbesserte IOPS, Dekompression findet auf der GPU statt.
direct-storage.png


direct-storage-windows.png


2. Sampler Feedback Streaming, ich kann hier nur noch mal zitieren: " With this insight, we were able to create and add new capabilities to the Xbox Series X GPU which enables it to only load the sub portions of a mip level into memory, on demand, just in time for when the GPU requires the data. This innovation results in approximately 2.5x the effective I/O throughput and memory usage above and beyond the raw hardware capabilities on average. SFS provides an effective multiplier on available system memory and I/O bandwidth, resulting in significantly more memory and I/O throughput available to make your game richer and more immersive."

Du willst offensichtlich nicht verstehen dass damit Deine Kontra-Argumente abgefrühstückt sind. Entsprechende Teile habe ich extra für Dich fett markiert.
 

Gurdi

Kokü-Junkie (m/w)
Hierbei wird nur das Streaming beschleuningt, Streaming will man aber eigentlich gar nicht.Der ideale Zustand ist, alle Daten innerhalb des Vram direkt auf Abruf.

Das das Streamingsystem Daten schneller liefern kann ist praktisch, ändert aber immer noch nichts am Vram Bedarf für EINEN PC! Das ist ein großer Vorteil für Konsolen weil diese als SOC sich den Speicherbereich aufteilen. Ein PC hat aber schnellen Ram der via PCI Ex 4.0 angebunden ist, das Spiel hält also Daten einfach im Ram vor auf einem Rechner und jagt dass dann via PCi Express in den Speicher.

Du verstehst bereits die Grundlagen nicht von dessen was du hier zitierst, interpretierst dir da was rein was auf dein System garnicht übertragbar ist, dass ist das Problem.

Der Hauptvorteil für einen PC besteht darin dass die Kompression dann schneller durch die GPU erfolgen kann, man benötigt daher keine Kommunikation mehr mit der CPU. Das spart Bandbreite und Zeit. Das kostet aber auch GPU Leistung, dafür muss die GPU aber nicht mehr so lange warten bis die (verhältnismäßig langsame) CPU das gebacken bekommt, an der Menge an Vram ändert das nichts, im Gegenteil, es wird sogar lukrativer mehr Daten direkt im Vram abzulegen. Man kann so vor allem große GPU´s mit vielen Shadern besser auslasten da Leerlaufzyklen entfallen in denen die GPU auf die dekoprimierten Daten warten müsste.

Ein SOC handhabt das ganz anders, dem fehlt bereits grundlegend der Systemspeicher in der benötigten Größe, der SOC streamt permanent von der Platte und rollt seine Daten im Speicher, verschiebt diese sogar teils innerhalb des Speichers.

Du kannst da noch soviele Folien zitieren, du hast einfach keinen Plan über die Zusammenhänge.
 

raPid-81

Freizeitschrauber(in)
Hierbei wird nur das Streaming beschleuningt, Streaming will man aber eigentlich gar nicht.Der ideale Zustand ist, alle Daten innerhalb des Vram direkt auf Abruf.

Das das Streamingsystem Daten schneller liefern kann ist praktisch, ändert aber immer noch nichts am Vram Bedarf für EINEN PC! Das ist ein großer Vorteil für Konsolen weil diese als SOC sich den Speicherbereich aufteilen. Ein PC hat aber schnellen Ram der via PCI Ex 4.0 angebunden ist, das Spiel hält also Daten einfach im Ram vor auf einem Rechner und jagt dass dann via PCi Express in den Speicher.

Du verstehst bereits die Grundlagen nicht von dessen was du hier zitierst, interpretierst dir da was rein was auf dein System garnicht übertragbar ist, dass ist das Problem.

Der Hauptvorteil für einen PC besteht darin dass die Kompression dann schneller durch die GPU erfolgen kann, man benötigt daher keine Kommunikation mehr mit der CPU. Das spart Bandbreite und Zeit. Das kostet aber auch GPU Leistung, dafür muss die GPU aber nicht mehr so lange warten bis die (verhältnismäßig langsame) CPU das gebacken bekommt, an der Menge an Vram ändert das nichts, im Gegenteil, es wird sogar lukrativer mehr Daten direkt im Vram abzulegen. Man kann so vor allem große GPU´s mit vielen Shadern besser auslasten da Leerlaufzyklen entfallen in denen die GPU auf die dekoprimierten Daten warten müsste.

Ein SOC handhabt das ganz anders, dem fehlt bereits grundlegend der Systemspeicher in der benötigten Größe, der SOC streamt permanent von der Platte und rollt seine Daten im Speicher, verschiebt diese sogar teils innerhalb des Speichers.

Du kannst da noch soviele Folien zitieren, du hast einfach keinen Plan über die Zusammenhänge.
Jo, klar, das ist garnicht übertragbar auf einen PC. Deswegen kommt DirectStorage + SFS auch nicht für Windows. Oh wait...

Komm, is gut, lassen wir das und warten ab.
 

raPid-81

Freizeitschrauber(in)
Es hat ja auch Vorteile auf dem Rechner, nur hat das nichts mit deinen Aussagen zu tun.
Natürlich. Weil ich mir nicht die MS Dev Blogs durchgelesen und angeschaut habe hat das alles nichts mit meinen Aussagen zu tun. Ich gebe hier zig Quellen an wo VOM PC gesprochen wird, alles egal, die ganzen Fachidioten haben keine Ahnung. Bzw weniger Ahnung als Forum User Gurdi. Bitte lass es einfach mal gut sein...
 

raPid-81

Freizeitschrauber(in)
Die haben schon Ahnung, nur du verstehst nicht was du da liest.
sampler-feedback.png


Jo, genau, ich verstehe nicht was "Memory Multiplier techniques" bedeuten soll. Auch "better memory efficiency" und "makes it look like your GPU has x times more memory than what's physically available" kann ich nicht übersetzen. Bin zu dumm...

Ich glaube eher Du verstehst nicht die Zusammenhänge. Hier noch mal eine sehr ausführliche Erklärung:

How this works
The Xbox Series X has a moderately fast SSD, with read speeds of 2.4GB/s, and decompression hardware that should effectively double that speed for textures using a custom algorithm they call BCPack. New techniques are needed to use this bandwidth effectively.

Sampler Feedback Streaming uses the results of the previous rendered frame to determine which textures to read into memory. The idea is that most textures are only kept in memory at a lower detail, and as the game needs higher resolution textures, those are loaded in for the next frame.

Each texture is made of mipmaps, which is a chain of progressively smaller versions of the same texture. Developers should also use tiled resources, which splits large textures into small squares, each of which can be loaded individually.

A 1024x1024 texture might be made up of 64 tiles of size 128x128. Its mipmap would include a 512x512 texture made of 16 tiles of size 128x128, and an even smaller 256x256 texture made of 4 tiles, and even smaller textures for even further away views, each no larger than a tile.

Each tile can either be loaded into memory, or simply reserved without using up memory. When a GPU renders a scene, it looks at specific tiles on specific mipmaps. The Sampler Feedback extension means that every time the GPU loads a tile, it can mark in a buffer saying that the resource was needed, and at what level of detail. If the tile it needs is not loaded into memory, the GPU will fall back to a lower-resolution version of the texture, but it will still mark in the buffer that it wanted that mipmap.

This means that after rendering the CPU has a bunch of information on exactly what tiles are needed. It can quickly compare this data to the tiles it has loaded, and will end up with a list of tiles that the GPU wanted, but didn't have. The CPU can also keep track of which tiles have not been requested recently, since those can probably be discarded.

What this means
Two things determine how fast an SSD can read: the size of the request (how much data you want), and the queue depth (how many things you are asking for in parallel). For an SSD, 4kiB reads at queue depths of 1 or 2 is a typical ‘random’ workload, and is generally fairly slow. In contrast, 128kiB reads at queue depths of 16 should utilize most of the speed of most SSDs.

With 128x128 tiles, and 4 bytes of data per texel, a tile is 64kiB. Multiple textures, like the color and normal, will always be needed at the same time, and so can be loaded and unloaded together. After compression, each request might be 64kiB or more. Because the CPU knows all the textures it needs at the same time, it can queue all the reads as fast as it wants to. This means that you should be able to use close to the full speed of the SSD for texture streaming.

If the speed of texture loading, after decompression, is around 3.8 GiB/s, that would allow loading 64 MiB per frame at 60fps. This is fast enough to load 1000 tiles each frame, about the equivalent of a single 4096x4096 texture.

For objects approaching from afar, textures will be loaded in when the GPU changes which mipmap it is rendering from, with only a frame or two's delay, so loading should be effectively invisible. If you look at an uncached object up close for the first time, it might render using lower resolution textures for a frame or two. How low that is depends on how much memory the developer wanted to save.

I believe this API requires specific GPU hardware to support, but it is not exclusive to consoles.
 

DaPopCOH

PC-Selbstbauer(in)
Mh. Kann ich so nicht Bestätigen. Ich habe aktuell so um die 220 Mods Installiert. Die Grafikmods sind alle mit 4K Texturen und Knacken nicht die 11GB Marke. In den Höhlen sind es Sogar nur 6GB. Wie du auf die Idee kommst das dort über 20GB Vram Verbraucht werden ist mir ein Rätsel. Aber um ehrlich zu sein , hätte ich es auch so gedacht. Aber im realen schaut es anders aus. Die 11 GB werden nicht geknackt. Gezockt wird mit einer RTX3090
weil die anzahl deiner mods nichts aussagt , sondern welche du nimmst. zudem natürlich die auflösung, die du verwendest. ich hab zb noble skyrim +alle texturen von pfuscher 2021 + zusätzlich 8k texturen + noch diverse andere textur mods (haare, fell, gesichter, rüstungen usw.). d.h es gibt im prinzip keine einzige textur mehr im spiel die nicht mindestens 2k, meist aber 4k oder im einzelfall sogar 8 k hat. ich verbrauche dabei immer zwischen 10 und 17 gb vram, je nach umgebung.
 
Oben Unten