In wie weit z.B. DLSS überhaupt auf die Tensor-Kerne angewiesen ist Das Marketing von NVidia ist da etwas schwammig. DigitalFoundry hatte mit ihrem ersten Video zu DLSS2 in Control mal behauptet, das würde ohne Tensor Kerne funktionieren. Aber so ganz kann ich das auch nicht glauben, denn dann hätte NVidia sich die für Ampere gleich gespart.
Cuda Core:
ein Cuda Core hat eine bestimmte Rechengenauigkeit meist FP32. Das bedeutet, dass das Register eine bestimmte Länge hat (die man für die Berechnung benötigt) und das hat eine Auswirkung auf die Menge Transistoren aus denen es gebaut ist.
Tensor Core:
jetzt gibt es jedoch Rechenaufgaben, die erfordern gar nicht, dass die Rechengenauigkeit FP32 ist. Nvidia braucht dafür Kerne mit weniger Rechengenauigkeit. Das hat den Vorteil, dass man auch weniger Transistoren pro Register braucht, denn das Register ist ungenauer, also kürzer.
Milchmädchenbeispiel:
Ich baue einen Cuda Core auf meine GPU der verbraucht Platz X
Ich baue daneben einen Core mit "halber" Genauigkeit, der verbraucht dann 0,5X Platz.
Rechnung die ungenau bleiben dürfen kann ich so platzsparend erledigen.
DLSS könnte also bequem auf den Cuda Kernen laufen, aber es wäre halt Verschwendung, weil viel zu genau gerechnet wird und das verschwendet Platz. Die DLSS Berechnung braucht nur geringere Genauigkeit und das machen diese anderen Kerne die man in der Registerlänge beschnitten hat, damit man mehr Stückzahl bekommt.Nach der PR Begrifflichkeit ist das dann nicht mehr der Cuda Kern, man nennt es jetzt den Tensor Kern. Weil Tensor kommt als Begriff hier aus der KI Programmiersprache, dort gibt es auch von Google Tensor Processing Units, DLSS ist ja etwas das mit KI was zu tun hat und fertig.
Der Übertrag auf AMD wäre es die Frage zu stellen, ob die AMD Karte alles pauschal in FP32 rechnen MUSS, oder ob es für Berechnungen mit geringerer Genauigkeit Register gibt die weniger Platz benutzen und entsprechend mehr Stück sind.
Da muss man klar sagen, ja AMD hat solche Kerne, aber in welchem Verhältnis die aufgeteilt sind wird nicht so genau gesagt. Das AMD Marketing fasst das dann unter dem Begriff Variable Rate Shading zusammen. Bei AMD wird das aber nicht nur benutzt um wie bei DLSS das Bild zu rekonstruieren. Diese variable Genauigkeit kann immer auf den passenden Kern verteilt werden wenn schon der Shader-Effekt berechnet wird. Daher vermeidet AMD den direkten Bezug zu KI. Warum auch, ein Register ist ein Register und es hat halt eine Genauigkeit. Der Befehlssatz den der Chip fähig ist zu verarbeiten verändert sich ja dadurch nicht.
Wer sich jetzt fragt, ob das nicht Hölle ineffizient ist ständig seine Shader auf der Karte hin und herzuschieben, damit sie vom passenden Register mit der passenden Genauigkeit berechnet werden, der hat seine Antwort warum AMD da mit L3 Cache und Infinity Fabric operiert. Denn das hat AMD nötig um Effizienz zu realisieren. Nvidia macht das etwas statischer deswegen sind dort die Kerne nach Funktion in Reihe geschalten.
Was an Optik am Bildschirm rauskommt wird sich nicht groß unterscheiden. ABER. Nvidia hat das Fundament für einen Grafikchip, wohingegen AMD mit seinem Design das Fundament für einen CPU/GPU Hybrid Prozessor hat. Das ist ja auch was in der PS5 dann drinsteckt. Das ist auch das Produkt mit dem AMD den PC Gaming Sketor komplett auf den Kopf stellen kann. Man stelle sich nicht vor ein Ryzen-G mit 8 Core Vega oder Navi. Man stelle sich vor AMD geht auf dem PC mit einem Ryzen in Serie der wie die PS5 8 Kerne und 40 CUs hat.