Die beste und hardwareschonendste Alternative zu RTRT ist mMn das Software RT von der Cryengine in Kombination mit SVOGI.
Hoffe beides kommt in Zukunft noch öfters in Spielen zum Einsatz zumindest in den Spielen von Crytek: Crysis 4, Ryse 2 etc.
Ich glaube du missverstehst hier Crytek's Zielsetzung. Raytracing is the next big thing in graphics und die wollen ihre Engine konkurrenzfähig halten und eine breitere Adaption der Technik ermöglichen, mehr nicht. Die haben nicht den Anspruch irgendwelche dedizierte Hardware damit obsolet zu machen.
Je mehr Raytracing-basierte Effekte man nutzt, desto mehr Rechenleistung wird benötigt und die kann man nur (kosten)effizient mit spezialisierter Hardware bereitstellen. Hat man zu wenig Rechenleistung, muss man Abstriche machen: weniger Effekte, niedriger aufgelöste Reflektionen, niedrigere Bildschirmauflösung, niedrigere Fps, etc. Das ist unvermeidbar. Die Frage ist schlicht, was der Entwickler als Vision für sein Projekt vor Augen hat.
Und auch Crytek selbst sieht für ihre Engine eine direkte Hardwareuntersützung in zukünftigen Versionen vor und schreibt in diesem Kontext klar von:
"
However, the future integration of this new CRYENGINE technology [Raytracing] will be optimized to benefit from performance enhancements delivered by the latest generation of graphics cards and supported APIs like Vulkan and DX12."
Beispielsweise die Pascal-Karten brechen an manchen stellen mit aktiviertem RTX nicht ohne Grund deutlich ein, weil hier schlicht die Rechenleistung fehlt. *)
Beispielsweise in Blender erreichet Cycles über RTX bis zur zweifachen Performance ggü. der reinen Nutzung der CUDA Cores. Im kommerziellen Octane wird gar bis zur dreifachen Leistung erzielt, d. h. die Nutzung der RT Cores bietet hier einen deutlichen Mehrwert. Nimmt man vereinfachend den Faktor 2 als Grundlage, bräuchte man über die universelleren CUDA Cores also die doppelte Anzhal SMs, also einen doppelt so großen Chip, was in jeder nur erdenklichen Art ineffizient wäre (kosten- wie auch verbrauchstechnisch). Dagegen die RT Cores verbrauchen nur wenig mehr Chipfläche auf dem Die. (Ebenso übrigens auch bei RDNA2. Beispielsweise Microsoft spricht hier von einer Beschleunigung dieser Berechnungen um 3x - 10x, d. h. eine äquivalente Vergrößerung der ALUs steht vollkommen außer Frage.)
*) Verschwörungstheoretiker könneen jetzt natürlich wieder munkeln, dass nVidia den Treiber absichtlich sabotiert, wahrscheinlich ist das aber nicht und ohne Belege nicht mehr als eine böswillige Unterstellung, die zudem leicht auffallen würde.
Die Noir Demo von Crytek sieht super aus und das ohne dedizierte HW für RT zu benötigen und dabei ist es auch noch rel. hardwareschonend.
Ja, tatsächlich, ist aber dennoch eine weitestgehend statische Szene. Darüber hinaus ist das "
hardwareschonend" relativ, denn du kannst davon ausgehen, dass die GPU mit aktiviertem Raytracing weitaus mehr ausgelastet wurde, als ohne und wenn du ans Kartenlimit gelangst, fällt schlicht die Framerate; am Ende alles ein Trade-off.
Genaugenommen ist gerade hier die Verwendung hochspezialisierter Funktionseinheiten sogar hardwareschonender, denn die verbrauchen weniger Energie und Taktzyklen für die Berechnungen als wenn man über die ALUs gehen müsste. Genau das ist ja der Grund, warum man sich die Arbeit macht, deratig spezialisierte Einheiten zu implementieren.
[...]
Aber nichtsdestotrotz ist das SW RT von Crytek schon eine tolle Alternative zumindest solange HW RT noch zu schwach ist, was es offensichtlich ja auch tatsächlich ist.[...]
Die Raytracing-Implementation in der Cryengine will ich nicht in Abrede stellen oder gar schlecht reden (ich glaube die meisten begrüßen das), aber was du hier schreibst, ist ein völliger Widerspruch.
Wenn die Hardware-Raytracing-Leistung, wie du es schreibst, zu schwach ist, dann ist jeder andere "softwareseitige" (also über die ALUs) Lösungsansatz ohne spezialisierte Funktionseinheiten grundsätzlich noch viel leistungsschwächer!
Die Implementation von Crytek ist eine kompromissbehaftete Ergänzung aber keine vollwertige Alternative (bei vorgegebenem Leistungsniveau), schlicht weil die ohne speziele HW-Unterstützung grundsätzlich weniger leistet. Nicht umsonst wird Crytek ja auch eine direkte HW-Unterstützung via Vulkan und DXR integrieren um an die Raytracing-Hardware der GPUs zu gelangen.
Crytek will Raytracng mittels seiner Engine breiter verfügbar machen, indem es auch einen "Softwarepfad" für den "kleinen Bedarf" gibt, damit wird es aber nicht leistungsfähiger, denn die Leistung bestimmt grundsätzlich die verwendete GPU, so oder so. Und ab einem gewissen Grade kann die RT-Leistung auf den GPUs nur noch sinnvoll nach oben skalieren, wenn für diesen Workload speziellen HW-Einheiten zur Verfügung gestellt werden. Alles andere ist unwirtschaftlich, da Performanceugewinne ansonsten in einem nicht vertretbaren Verhältnis zu Fertigungskosten (Chipgröße) und Verlustleistung stehen.
Die Frage, die sich dir schlussendlich stellt, ist schlicht mit welcher visuellen Qualität, Bildauflösung und Framerate du dich zufrieden geben willst. Für einfache Anwendungen hatte man auch schon in 2016/17 genügend Leistung auf den HighEnd-GPUs. Offensichtlich will man sich heute aber nicht mit so "einfachen" Aufwertungen mittels Raytracing zufrieden geben und zudem versucht der Markt gerade 4K mit 60 - 120 Hz zu etablieren. Wenn du mit 540p zufrieden bist, könntest du selbst auf Pascal Raytracing ihn den aktuellen Titel (nahezu) ohne Einschränkungen genießen, nur den meisten scheint mir ein derartiges Vorgehen schwer verkaufbar zu sein. Hier verfährt man eher nach dem Motto alles oder Nichts (
zumindest bis das finanzielle, persönliche Limit erreicht ist).
Im Umkehrschluss: Will man das, woran man heute gewöhnt ist beibehalten (bspw. FullHD oder WQHD bei hohen Bildraten) und dann noch in umfangreichem Maße das Rendering mit Raytracing aufwerten, wird bedeutend mehr Leistung benötigt, als die universelleren ALUs bereitstellen können. Und einige wollen das gar nicht mal "beibehalten", sondern erwarten mittlerweile 4K ...
(
AMD, Intel und nVidia haben HW-Einheiten für Raytracing nicht zum Spaß implementiert, sondern weil sie für diese Anforderungen schlicht unumgänglich sind. Die TFlop-Leistung der GPUs ist im Laufe des Jahrzehnts auch nicht ohne Grund sukzessive angestiegen 
)