Du lässt den Takt komplett aussen vor? 9728 Cuda mit 2,5 Ghz vs 10495 Cuda mit 1,8 Ghz. Mich würde es schwer wundern wenn die 4080 16 GB nicht vor der 3090 liegt.
Boostclock 3090 = 1695
Boostclock 4090 = 2520
Das ist ein Boostclock Vorteil von Faktor 1,48 für die 4090.
Obendrauf zum Cuda-Count Vorteil von Faktor 1,56
Das wäre in der Summe ein Vorteil von Faktor 2,3, aber nicht einmal der Halo Benchmark von der PCGH schafft es, dass die 4090 um Faktor 2,3 schneller ist als die 3090 und der Durchschnitt zieht erheblich nach unten.
Das bringt mich zu einem ganz bösen Wort, das ich zweifelsohne bis heute Nacht bereue gesagt zu haben hier und das ist Flaschenhals, die 4090 hat einen. Denn sonst würde sie, wie du ja auch annimmst, nach Cuda und Takt skalieren und nicht nur nach einem von beiden.
Wir wissen Nvidia hat den L2 Cache massiv von 6GB auf 72GB erhöht, aber das scheint nichts geholfen zu haben.
Wir nehmen zur Kenntnis, dass der GDDDRX6 Speicher im Wesentlichen der gleiche ist, vielleicht sehen wir hier das Limit. Wir würden ja auch kein GDDRX4 auf eine 3080 schnallen und erwarten, dass die 100% ihrer Leistung liefert. Vielleicht sehen wir hier das Limit von GDDRX6.
Für die "kleinen" Modelle wären das aber gute Nachrichten. Denn wenn der Flaschenhals dadurch kommt, dass nicht alle Cudas voll ausgelastet werden, dann würde der Zuwachs den wir im PCGH Test sehen vor allem vom Takt herrühren. Dann bekommt der RAM einfach nicht die vielen Cuda Kerne bedient und das Cache Upgrade hilft da auch nicht. Dann sollten RTX40 Modelle mit weniger Cuda aber trotzdem RTX30 Karten mit gleicher Cuda Anzahl sehr einfach outperfomen.
Als Anhaltspunkt dafür haben wir nur den Nvidia Benchmark der die 4080 bei 73% einer 4090 einordnet. Wenn sie das mit 59% der Cuda Kerne einer 4090 schafft muss man innerhalb einer Generation wirklich sagen, dass es hier einen Grund geben muss, warum die gleiche Architektur unterschiedliche Effizienz zu haben scheint. Ein Hinweis mehr auf einen Flaschenhals.
Die andere verrückte Theorie wäre, dass nicht jedes Spiel mit beliebig vielen Cuda Cores skaliert, oder nicht beliebig mit dem Cuda Takt. Das wäre dann vielleicht so eine Treiberlimit Geschichte, wo Nvidia ja auch jüngst 10% für alle gefunden hat mit denen niemand gerechnet hätte.
Ich werde das jedenfalls nachrechnen, sobald die PCGH Test zu den anderen Karten hat, denn die Frage in wie weit mehr Cudas und mehr Takt Einfluss auf die Leistung der RTX40 Generation haben, scheint ja doch eine sehr spannende Frage zu werden. Bei der RTX30 war das ja tot-langweilig, da konnte man die Benchmarks der Karten am Küchentische ausrechnen ohne sie testen zu müssen.