[...] Faszinierend finde ich aber, dass die RTX 3090 wohl die neue Titan ist, oder Nvidia bastelt noch im Geheimen an einer Titan mit 32gb...
Die 3090 wird keine neue Titan. nVidia wird erneut eine eigene Titan auf Basis von Ampere aufsetzen, da die ein anderes Marktsegment bedient und die Brücke zwischen dem Consumer-HE und den großen Quadro's schlagen muss. Analog der letzten Generation wird diese wohl auf dem Vollausbau des GA102 setzen, ebenso wie die große(n) Quadro(s). Vermutlich werden es hier 48 GiB VRAM werden wie auch bei der Quadro. (Dafür werden es jedoch möglicherweise "nur" 16 Gbps werden.)
Ich dachte das einer Compute Unit vier Raytracing-Beschleuniger haben? Bei Nvidias RTX-20-Turing wird nur ein Raytracing-Kern pro Shader-Cluster verbaut.
AMD verfolgt mit Raytracing in RDNA2 einen grob vergleichbaren Ansatz zu Turing mit dedizierten Intersection-Engines in den TMUs, d. h. auch hier wird zusätzliche Transistorfläche für spezialisierte Hardwareineheiten implemerntiert und auch hier ist der zusätzliche Flächenbedarf vergleichweise gering, ebenso wie bei Turing auch (das kann man bereits von der Xbox herleiten). Bei Ampere dagegen zeichnet sich voraussichtlich eine größere Änderung bei der Raytracing-Implementation ab, sodass nVidia hier möglicherweise erneut einen Schritt weiter sein wird als AMD.
Die Anzahl der Cores/Funktionseinheiten lässt übrigens aktuell wenig Rückschlüsse auf die Leistung zu. Die zur Xbox gegebenen Peak-Werte sind mit nVidia's GigaRays/s nicht vergleichbar, wobei letztere auch weitaus praxisnäher sind, während es sich bei den Xbox-Werte um theoretische Peak-Werte handelt die nur einzelne Tests quantifizieren.
@owned139: Der einzig nennenswerte Unterschied zwischen RDNA2 und Turing ist, dass die RT Cores (vereinfacht betrachtet) einen Strahl bis zu einem Triangle-Hit nachverfolgen und erst danach das Ergebnis an den Shader Processor zurückmelden. Bei AMD dagegen initiiert der SP eine Strahlverfolgung (wie auch bei Turing) und beauftragt die Intersection-Einheit in den TMUs mit einer einzelnen Intersection-Prüfung auf das erste infrage kommende Element der BVH. Das Ergebnis gibt die Einheit daraufhin an den SP zurück der dann weiterentscheiden kann, ob er dem Strahl weiter folgen will, was er in der Regel muss, denn bis man ein Triangle in einer BVH trifft, benötigte es eine Vielzahl an Intersection-Tests. Bei AMD geht es hier also immer hin und her zwischen der spezialisierten Intersection-Einheit (in den TMUs) und dem SP. Programmiertechnisch verspricht das etwas mehr Flexibilität, weil man einfacher in die Strahlverfolgung eingreifen kann. Welchen Einfluss dieses Hin-und-her jedoch bzgl. der Performance hat, wird man in konkreten Tests abwarten müssen. Zudem können die TMUs, wenn sie RT-Operationen ausführen, keine Textur-Operationen berechnen, d. h. es ist hier ein entweder/oder.
Und wie schon erwähnt, wird Ampere bzgl. Raytracing wohl voraussichtlich einen deutlich größeren Umbau präsentieren, der tatsächlich einen beträchtlichen Leistungszugewinn liefern könnte. Bei der Rasterizer-Leistung erwarte ich hier weitestgehend eine Skalierung aufgrund der größeren Zahl an SMs und dem Takt, ggf. unter Berücksichtigung geringfügiger Optimierungen. Beim Raytracing könnte Ampere dagegen tatsächlich einen deutlich größeren Sprung aufweisen ... man wird noch 36 h abwarten müssen.

[...] Mein Stand war, daß man Tensor braucht um den DLSS-Set zu erstellen, aber nicht um... beim Endkunden das Ergebnis zu visualisieren. Das DeepLearning also z.B. nicht erst während des Spielens stattfindet.
Über die Tensor Cores kann das NN effizienter angewendet werden, man kann diese Berechnungen aber auch über die SPs laufen lassen. Beispielsweise die ersten, vorläufigen DLSS 2.0-Implementationen verwendeten noch die SPs und nicht die Tensor Cores. Letzteres ist jedoch performanter.
Wenn also AMD entsprechendes Know How angehäuft hat, spricht nichts dagegen, dass sie etwas zu DLSS ähnliches über die SPs implementieren. Wird man abwarten müssen, mittelfristig werden sie so etwas brauchen, wenn sie bei höheren Auflösungen im Gaming konkurrenzfähig bleiben wollen ... denn die "Bedürnisse" der Gamer "entwickeln" sich hier zweifelsfrei schneller als die Hardware
Noch bessere Grafik mit noch mehr Raytracing-Effekten für alles Mögliche von GI, Reflektionen bis zu Schatten, dann in min. 4K und möglichst noch mit Bildraten jenseits der 60 FPs wird absehbar weiterhin selbst die jetzt kommende stärkste Hardware in die Knie zwingen und Kompromisse fordern. Mit etwas wie DLSS kann man diese Kompromisse verringern ...
Zuletzt bearbeitet:
und war zu erwarten, dass da nicht wenig verbraucht wird.