@
BlubberLord: TFlops kann man nicht unmittelbar auf/über Fps abbilden. Das sollten doch schon die Vega's eindeutig belegt haben.
In typischen Spieletiteln liegt das INT:FP-Op-Verhältnis bei bestenfalls 1:2, tendenziell jedoch eher deutlicher in Richtung 1:3.
Ampere auf der RTX 3080 hat einen Basisdurchsatz von 14,9 TFlops über den reinen FP32-Block pro CUDA Core. Nimmt man nun das eher zu großzügige 1:2-Op-Verhältnis an, dann kann der kombinierte FP32/INT32-Block nur in 2/3 der Zeit FP32 berechnen (9,9 TFlops). Tendenziell bewegt sich die Op-Verteilung jedoch eher in Richtung 1:3 (11,2 TFlops). Die real in Spielen zur Verfügung stehende,
theoretische Peak-TFlops-Leistung liegt also irgendwo zwischen 24,8 - 26,1 TFlops und wird zudem in Abhängigkeit des jeweiligen Titels schwanken, da hier deutliche Unterschiede vorliegen können.
Bei der Betrachtung handelt es sich dennoch weiterhin nur um
eine theoretische Betrachtung, die sich nicht direkt auf Fps ummünzen lässt (was für RDNA2 in exakt der gleichen Art und Weise gilt). Beispielsweise BF1 kommt tatsächlich dem 1:2 nahe, während The Witcher 3 gar eher bei einem 1:5-Verhältnis zwischen INT- und FP-Operationen liegt. In Benchmarks sieht man dennoch keine direkt übertragbare äquivalente Leistungssteigerung RTX 3080 vs. 2080 Ti in 4K, PCGH in BF5 +32 %, in TW3 +32 %. Hier hängt es schlicht davon ab, was die Game-Engine sonst noch so alles macht und vor allem wie (PCGH testete leider nur BF5 und nicht BF1. Die Engine wird ähnlich sein, aber schlussendlich stellt sich hier schon die Frage, ob sich diese Frostbite-Version in BF1 nicht stellenweise bereits deutlich anders verhält als in BF5. Bereits eine weitere Unsicherheit, schlussendlich, wie gesagt, alles eher theoretisch
).
Und bei AMD ist seit RDNA zu beachten, dass sie ihre offiziellen TFlops-Angaben auf einen höheren Takt anrechnen, als nVidia. Die RX 5700 XT rechnet gegen ihren offiziellen Boost-Takt von 1.905 MHz, der deutlich näher am Peak-Takt der Karte liegt als nVidia, die für bspw. ihre RTX 2080 nur gegen 1.800 MHz rechnen.
Schlussendlich kann man hier viel hin und her wenden. Am Ende wird man konkrete Tests abwarten müssen. Mit dem was sich bei RDNA2 abzeichnet sieht es zumindest gut aus bzgl. einer echten Konkurrenzsituation im HighEnd. Das 80 CU-Design sollte sich problemlos im Bereich einer RTX 3080 bewegen können. Ebenso klar ist auch, das Ampere für Pro-Workloads zweifelsfrei die bessere Wahl ist, denn an die hohe TFlops-Leistung, die die Architektur maximal bietet, kommt RDNA2 gesichert nicht heran, da sie weiterhin mit nur 2 Flops pro SP pro Takt aufwarten kann.