RT bei RDNA 2 läuft über die TMUs. Davon gibt es 4 pro CU. [...]
Ohne jetzt zu tief einzusteigen, weil das immer weiterführende Spekulationen sind, die auf noch mehr Spekulationen aufbauen ...
Die Intersection-Angabe zu RDNA2 kann nicht direkt mit nVidia's Gigarays/s verglichen werden.
Für die Berechnung eines Rays sind eine Vielzahl an Intersection-Berechnungen notwendig. Der Großteil davon sind Box-Intersections gegen die BVH und am Ende, wenn die letzte Box gefunden wurde, folgt eine Triangle-Intersection gegen alle Triangles, die sich in der letzten Box befinden.
Du nimmst hier einen Faktor 10 für einen Vergleich an, machst also aus 380 Mrd. Intersection-Tests rd. 38 Mrd. Rays/s, was jedoch nicht wirklich realistisch erscheint. Die vermeintlichen 10 Intersection-Tests pro Ray, wirst du typischerweise schon alleine bei einem etwas größeren Modell aufwenden müssen, tendenziell gar mehr. Und dann hast du noch nicht einmal das Modell selbst in der gesamten Szene/BVH gefunden, was weitere Tests erforderlich macht.
Schlussendlich wird man abwarten müssen. Und darüber hinaus bleibt ebenso die Frage, wie nVidia die Architektur in Ampere überarbeitet hat. Hier gibt es viele denkbare Wege, von schlicht mehr RT-Cores pro SM oder einer gesteigerten Intersection-Leistung pro RT-Core, etc. Am Ende werden das Benchmarks zeigen müssen, auch wenn deren Vergleichbarkeit systembedingt grundsätzlich eingeschränkt bleiben wird, aber für eine grobe Indikation sollten diese ausreichen.
Im Vergleich zu Turing könnte RDNA2 mit Blick auf Raytracing möglicherweise gut abschneiden, jedoch muss man auf den Konsolen zudem auch immer noch das beschränkte Power-Limit bedenken, denn während ein Enthusiast-PC sich auch problemlos gemittelte 500 W ziehen darf, wird das bei den Konsolen nicht einmal ansatzweise der Fall sein dürfen und die Physik kann man nun mal nicht überlisten. Am Ende wird man abwarten müssen, wie alle diese vielen kleinen, einzelnen Faktoren zusammenspielen.
Womit du jedoch wahrscheinlich recht haben wirst ... die Konsolen als "Raytracing-Krücken" zu bezeichnen ist abwegig. Hinzu kommt zudem, dass die potentiell mit der Zeit HW-nähere Programmierung das Thema zusätzlich schwer einschätzbar und vergleichbar macht.
Für das Geld der Konsolen bekommt man auf jeden Fall einen gehörige Portion relativ leistungsstarker Hardware geboten. Ebenso klar bleibt aber auch, dass die Konsolen spätestens nicht mehr mit der jetzt in kürze kommenden HighEnd-PC-GPU-Generation mithalten können werden. Das ist jedoch nur für Enthusiasts relevant, die bereit sind, sich ihr Hobby einiges kosten zu lassen.
Nachtrag:
Hinzu kommt noch, dass die zur Xbox angegeben 379,6 Mrd. Intersection-Berechnungen sich recht genau nach dem theoretisch möglichen Maximum anhören/lesen, d. h. dies setzt eine 100 % Auslastung dieser Einheiten voraus. (In gleicher Art gibt man auch die TFlops zu GPUs an, wobei man die Funktionseinheiten nimmt und hierbei den Idealfall mit einer FP-Operation (also Addition oder Multiplikation) pro Taktzyklus ansetzt.) Den Wert kann man natürlich so angeben, jedoch dürfte der für die Praxis eher weniger aussagekräftig sein, denn bspw. bei AMD (zumindest gemäß deren Patent) wird eine einzelne Intersection-Berechnung ausgeführt und deren Ergebnis wird danach mit einem Pointer auf die BVH-Struktur zurück an den Shader Processor gegeben (Fig.18), der dann in jedem Schritt entscheiden kann wie es weitergeht, sprich ob abgebrochen wird, oder ob die BVH weiterverfolgt wird. Es handelt sich hierbei also um einen Low-(Low-)Level-Durchsatzwert.
Die Angabe von GigaRays/s dagegen ist eher ein in der Praxis errechneter, bzw. schlicht gemessener Wert, der zudem nötige BVH-Operatione miteinschließt. Beispielsweise in wissenschaftlichen Arbeiten, die in diesem Kontext auch die Turing-Architektur untersuchten, konnten mit typischen Testmodellen bis etwa 12,2 GigaRays/s auf einer RTX 2080 Ti gemessen werden, d. h. nVidia hat hier seine offizielle Angabe schon nach unten korrigiert (voraussichtlich mit Blick auf echte/komplexe Game-Engines).
Am Ende wird man schlicht Tests abwarten müssen, bis man sich hier ein schlüssiges Bild zusammenreimen kann ...

Zuletzt bearbeitet:
im Gegensatz zur Box ist ja genug Platz einen Ventilator zu verstauen 



