AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!
Natürlich macht es einen Unterschied. Du darfst den Kontext hier nicht vergessen. Hast du XXX Shader zu verfügung, dann spielt es natürlich idR kaum eine rolle, nur hast du innerhalb einer GameEngine eben nicht XXX Shader NUR für das GPU-Culling.
Meiner letzten information zufolge nutzen sie RPM fürs GPU-Culling, siehe im Game Optionsmenue (GPU-Culling)
Async Compute:
Früher bzw. ohne AC kommt eine Queue zum Einsatz, wo alle Befehle in eine Warteschlange kommen, mit Async Compute kommt eine oder mehre zusätzliche Compute-Warteschlangen zum Einsatz, wo der Entwickler die Aufgaben splittet.
Anstatt alles in eine Queue zu packen, gibt es mehrere.
Grundsätzlich wird das absolut gleiche berechnet, egal ob man eine oder mehrere Queues verwendet.
Der Vorteil darin mehrere Queues zu verwenden, besteht darin, dass man jetzt die Möglichkeit hat die Aufgaben genauer einzuteilen und der GPU durch Synchronisationspunkte Zeitpunkte anzugeben, ab wann sie mehrere Operationen flexibel berechnen kann.
Hängt gerade etwas an einer Fixed-Function-Einheit wie dem Front-End oder dem Back-End und die ALUs drehen gerade Däumchen, könnte die GPU mit einer zusätzlichen Compute-Queue wissen, okay ich kann noch diese Operationen in der Zwischenzeit ausführen.
Async Compute macht im Prinzip nicht anderes, als potentiell Idle-Times zu verkürzen, an den Berechnungen wird nichts geändert.
Deswegen ist es auch egal, ob FP16 mit Async Compute verwendet wird oder nicht, da man so oder so den Vorteil davon genießt, zwei FP16-Operationen in einem Schritt zu berechnen.
Die GPU hat dann entweder die Möglichkeit das ganze flexibel einzureihen und zu berechnen oder sie hat es nichts, aber das eine bedingt nicht das andere, außerhalb von der grundlegenden Designperspektive die man sich bei Async Compute immer stellen muss, welche Workloads haben unterschiedliche Flaschenhälse und wären günstig gemeinsam zu berechnen?
Ich sehe jedenfalls keine direkte Korrelation, wo AC + FP16 eine besondere Synergie aufweisen würden.
Im Optionsmenü steht bei GPU-Culling in der deutschen Fassung nichts anderes, außer:
"GPU-Triangle-Culling aktivieren/deaktivieren. (Empfohlene Einstellung für AMD: Aktiviert; für Nvidia: Deaktiviert)"