AMD lässt die Berechnung wohl auf den normalen Einheiten ausführen.
Und genau das ist auch Teil von DXR, während DXR v1 und RTX einen (ersten) eigenen Ansatz von Nvidia verfolgt und auf NGX basiert.
Die Renderingszene besteht dabei aus FP32, INT32, RT-Core-Operationen und die der Tensor Cores. Das heißt, dass sich RTX Ops in prozentualem Anteil der jeweiligen Szenen verteilen muss und damit auch der Raytracing Workload (also der Impact recht unterschiedlich ausfallen kann). Nvidia gab das damals in Gigarays an und verglich diese Rechenleistung in einer ausgewählten Szenen mit der 1080ti, dabei haben sie aber vergessen zu erwähnen, dass die 1080ti nicht nur in der Lage ist 1,1 GRays darzustellen/berechnen, sondern je nach Implementation des Levels die Hälfte von dem einer 2080ti schaffen kann. Ich hab das hier schon zig mal versucht zu erklären, es ist aber nutzlos. Und genau deshalb gab es bei Besitzern der Titan V Zweifel daran, als Nvidia behauptete man könne RTRT nur mit dem RT Cores schnell genug berechnen, dass stimmt absolut nicht. Das liegt daran, weil man es per Treiber nur dort schnell genug zulässt und nur eine Lösung im Markt haben will.
Es gab also schon immer die DXR Option Raytracing auch ohne dedizierten RT Cores auszuführen, nur hat das Microsoft erst später und jetzt im Nachgang mit DXR v1.1 nochmal gepusht. Es gibt also den RT Core von Nvidia und die Möglichkeit das Traversal auch über einen Intersectionsshader berechnen zu lassen. Das gute daran ist, die Shader können zwischenzeitlich andere Berechnungen ausführen und müssen nicht expliziet auf der Ergebnis des Kreuzungstest warten.
Grundsätzlich steuert auch bei Nvidia der Shader (also Compute die Berechnung), Nachteil ist das die wenn der RT Core rechnet der Rest warten muss. Und auch bei Nvidia ist das Modell ein Hybridmodell aus Rasterisation und Raytracing, wobei der Treiber etwaige Berechnungen auch auf die CPU auslagert und die CPU weiterhin das Rendering steuert.
Ich habe auch ehrlich gesagt keine Lust mehr, das in diesem Forum ständig herunterzubeten, zumal hier sehr viel Unsinn darüber berichtet wird.
Nvidias RT Cores besitzen dafür spezielle SFU, um die Durchläufe in der Sub Box (Kreuzungstest) zu beschleunigen. Letztlich ist es ähnlich dem hauseigenen VXGI, wobei man mit Tensor in der Lage ist, die Datenmenge die die GPU dabei berechnen und beschleunigen muss zu minimieren, es gibt also die Intersectionsengine und den RT Cores, und beides ist absolut nicht das Gleiche. Nur passt das hier in bestimmte Köpfe nicht rein.
AMDs Ansatz lässt sich daher sehr schwer einstufen bzw. kann man nicht heute einfach sagen, sie seien um so und so viel langsamer.