Und bei welchem Spiel soll das der Fall sein? Wenn ich mir die GPU RAM Auslastung anschaue bei aktuellen Spielen, habe ich c.a. 4GB belegt, von 12GB !!!
Zukünftige Spiele werden auch keine Monster Texturen nutzen!!!! Denn dann werden die Spiele zu groß!
Wer will denn 500GB große Spiele haben?
Erzähl das mal der "Nvidia Speicherkrüppel" Fraktion... Aber egal, lassen wir das mal außen vor.
Das betrifft ziemlich viele Spiele, immer wenn Du einen Aufzug / langen schlauchartigen Gang in einem Spiel nehmen musst, dann lädt er im Hintergrund in dieser "downtime" die Texturen des neuen Bereichs. Da wird sehr viel getrickst...
Und welche Spiele spielst Du die nur 4GB belegen? Große Open World Titel schon mal nicht, die liegen in WQHD mit RT bereits bei ~7-8 GB. RT kostet dabei ~ 1 GB (etwas weniger) VRAM, wobei DLSS (Quality) fast dieselbe Menge wieder einspart.
Du vergisst hier auch die Texturen Kompression, wir haben ja jetzt schon 4K Texturen und die Spiele sind ~70GB groß. Nur siehst Du im Spiel dann nicht überall die 4K Textur, weil sie so auch gar nicht in den Speicher passen würde. Stichwort "Sampler Feedback Streaming" welches nur den Teil einer Textur in der benötigten Auflösung in den VRAM lädt.
Durch DirectStorage / RTX IO wird übrigens auch massiv Bandbreite und CPU Leistung gespart da damit nicht mehr die CPU die Dekompression der Texturen übernimmt und diese dann per PCIE zur Grafikkarte sendet. In Zukunft werden die komprimierten Texturen direkt von der SSD in den VRAM geschoben (zumindest bei RTX IO, bei DirectStorage gibt's nen Zwischenstopp im RAM) und dort von der GPU entpackt.
Ich hab dazu auch Links zu diversen Microsoft Devblogs, Präsentationen und Techdemos. Die habe ich hier nur schon so oft gepostet, möchte ich jetzt nicht ohne Not noch mal tun. Wenn Du sie haben möchtest kann ich das aber gerne noch mal machen.
Das ist halt alles zu 100 % Blödsinn. Auch wenn es bei NV möglich sein sollte viel flexibler RT Einheiten ran und wieder weg zu bauen, das Lineup einer Serie ist fix. Es wird jetzt keine RTX 3060 auf dem Markt kommen die nen komplett neuen Chip hat der 50 % mehr RT Einheiten besitzt nur weil das möglich wäre.
Merke, nur weil etwas möglich ist heist es noch lange nicht das der Anwender einen Nutzen davon hat
Du hast meinen Post zu 100% falsch interpretiert, ich habe nirgends behauptet dass Nvidia die Skalierung innerhalb derselben Gen vornehmen kann. Innerhalb einer Gen lässt sich maximal sowas wie der "Super" Refresh bringen der durch bessere Fertigung / Selektion ein paar mehr aktivierte Shader / RT Cores mitbringt.
Ich meinte, dass der generelle Ansatz von dedizierten RT Cores vs Rayaccelerators hinter jeder Compute Unit, einfacher mit dedizierten RT Cores zu skalieren ist. Nvidia ist mit den dedizierten RT Cores technologisch vorne und kann auf Lovelace / Ampere Next Next nach belieben die Anzahl der Cores skalieren. AMD dagegen muss entweder umschwenken auf dedizierte Cores oder ist an eine RT-Skalierung per Compute Unit gebunden. Siehe auch dieser Teil des verlinkten Artikels:
AMD’s RDNA 2 GPUs employ a rather interesting approach to hardware-accelerated ray-tracing. The Ray Accelerator found in each Compute Unit (2 in every WGP) accelerates ray-box and ray-triangle intersections which are the most performance-intensive parts of the ray-tracing pipeline. However, the step prior to this, BVH (tree) traversal isn’t accelerated by the RAs and is instead offloaded to the shaders (stream processors). While an optimized shader code can perform these calculations in decent render time, in other cases it can slow down the overall rendering pipeline by occupying previous render cycles that could have otherwise been used by the mesh or pixel shaders.
Dagegen bei Nvidia:
NVIDIA’s method essentially involved offloading the entire ray-tracing pipeline to the RT cores. This involves the BVH traversal, box/triangle testing as well as sending the return pointer back to the SM. The SM casts the ray, and then from there onwards to the return hit/miss, the RT core handles basically everything. Furthermore, NVIDIA’s Ampere GPUs leverage Simultaneous Computer and Graphics (SCG) which is basically another word for Async Compute. However, unlike AMD’s implementation where the compute and graphics pipelines are run together, this allows the scheduler to run ray-tracing workloads on the RT Core and the graphics/compute workload on the SM, in addition to matrix-based calculations on the Tensor cores all at once.
Ich spreche vom generellen Ansatz der beiden im Vergleich.