Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

welche Regler müsste ich denn runterstellen um die FPS Eibrüche vorallem in außenarealen zu vermeiden? Grundsätzlich läuft das Spiel auf Ultra um die 60 Fps herum (fps lock)

r9 290 i7 3820
 
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Wo ist da die Korrelation?
Zwei unabhängige Features, die man auch zusammen verwenden kann.
Korrelation bedingt nicht grundsätzlich einen kausalen Zusammenhang. Worüber beide, in Wechselwirkung, profitieren ergibt sich erst unter Einbeziehung einer dritten Größe - der Ausführungsgeschwindigkeit (FPS).
Und hier profitieren beide ganz erheblich voneinander (mit bezug auf die Ausführungsgeschwindigkeit).
Das eine profitiert nicht direkt vom anderem.
Das sehe ich komplett anders, gerade zb AC ist ein Feature welches fast ausschließlich nur von wechsewirkungen profitiert, auch von wechselwirkungen zu sich selbst.
Ein hypothetisches Beispiel, was in dem Fall auch gelten sollte, AC bringt 5% Performance auf die Waage, RPM ebenso 5%, beides gemeinsam 10%, fehlt ein Feature, dann sind es eben auch nur 5%.
Aber der Fall den du andeutest ist, wenn zusätzlich noch eine Synergie entstehen würde, wo das Ergebnis nicht aus einer simplen Addition und 10% bestehen würde, sondern beide zusammen aus Grund X mehr auf die Waage bringen, als einzeln zusammengerechnet, z.B. 15 oder 20%.
Und genau Grund X sehe ich nirgendwo, der das bedingen würde.
Bitte komm von dem "Nvidia AC style" weg, wir sind hier bei AMDs AC, also auch wirklich parallel.
Im besten fall bekommt man zB GPU-Culling kostenlos da es mit RPM weniger destruktive wirkt und schlicht parallel, wärend der "normalen" GFX berechnung abläuft. Dies kommt vorallem duch gesparte Ressourcen (VRAM, Cache, Register, ALUs) so dass die "normale" gfx Berechnung eben kaum beeinflusst wird. Insofern also eine 1a positive Wechselwirkung besteht, ohne wirklichen Kausalzusammenhang.
 
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

So hab mir gestern den neusten Nvidia Patch 388.13 geholt und selbe Sache in ... Achtung Wortspiel... "grün" :D Ebenfalls bei dem neusten Patch tanzt die Bildrate zwischen 59 und 61 hin und her, auch wenn man stumpf in eine Richtung schaut, läuft man dazu SEITLICH, merkt man in schon fast gleichmäßigen Abständen eine unruhige Framerate.
 
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

VRam Limit - deine Performance passt zu den Benchmark Ergebnissen, wo alle 4GiB Karten nicht aus dem Knick kommen.

Kommt zudem öfter mal vor, dass die LL-API Games 4GiB VRam als absolutes Minimum vorraussetzen. Das Speichermanagement muss vom Entwickler gemacht werden (in DX11 macht das die API automatisch, ist dafür aber auch weniger performant) und da optimieren die meisten Entwickler auf 4+ GiB.

Naja, wohl eher mangelnde Performance der 290. Die ist eben schon ein wenig älter und gehört nicht mehr zu Riege der Performancekarten.

Im Vergleich, eine GTX 970 fällt bei Extreme Settings und FHD nur sehr selten überhaupt unter 60fps und die 290 ist im Verhältnis einfach langsamer. Das hat also nichts mit VRAM-Limitierung zu tun. Die Karte packt es eben einfach nicht mehr ;)
 
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Korrelation bedingt nicht grundsätzlich einen kausalen Zusammenhang. Worüber beide, in Wechselwirkung, profitieren ergibt sich erst unter Einbeziehung einer dritten Größe - der Ausführungsgeschwindigkeit (FPS).
Und hier profitieren beide ganz erheblich voneinander (mit bezug auf die Ausführungsgeschwindigkeit).

RPM bedeutet "lediglich", dass eine FP32 ALU zwei FP16 Operationen zeitgleich ausführen kann. Wie asynchron diese Berechnungen relativ zu anderen Berechnungen durchgeführt werden, ändert nichts an der absoluten Performancesteigerung durch RPM.
 
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Wo stell ich eigentlich die Qualität der Texturen ein? Bin ich blind und finde den Schalter nicht?
 
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

RPM bedeutet "lediglich", dass eine FP32 ALU zwei FP16 Operationen zeitgleich ausführen kann.
Was bedeutet, dass Ressourcen wie ALU, Vram, Register, Cache,"Bandbreite" gespart wird und so für AC (zb graphics queue) mehr Ressourcen zu verfügung stehen.
Im besten fall kann so die "RPM compute queue" wärend der graphics queue berechnet werden, was eben ohne die Resource-Einsparungen unwahrscheinlicher gewesen wäre.
Wie asynchron diese Berechnungen relativ zu anderen Berechnungen durchgeführt werden, ändert nichts an der absoluten Performancesteigerung durch RPM.
Es geht aber nicht um eine "absolute Performancesteigerung" sondern um eine reale Performancesteigerung.
 
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Was bedeutet, dass Ressourcen wie ALU, Vram, Register, Cache,"Bandbreite" gespart wird und so für AC (zb graphics queue) mehr Ressourcen zu verfügung stehen.
Im besten fall kann so die "RPM compute queue" wärend der graphics queue berechnet werden, was eben ohne die Resource-Einsparungen unwahrscheinlicher gewesen wäre.
Dafür gibt es aber in keinem Fall eine Garantie, vor allem da keine Informationen darüber vorliegen, was bei Wolfenstein 2 in der GFX-Queue und in der Compute-Queue gemeinsam verwaltet wird und wo FP16 überhaupt zum Einsatz kommt.
Entsprechend kann man auch nicht einfach behaupten, dass RPM ohne AC keinen wirklich Sinn ergibt, da das völlig von der einzigartigen Arbeitspipeline von einem Spiel abhängt.
Bei Async Compute muss man allgemein immer auf die Wechselwirkung von unterschiedlicher Arbeitslast schauen und das mixen, was zusammen effizient funktioniert, so kannst du aber auch behaupten, dass jede Optimierung von der anderen direkt profitiert und ohne ein Zusammenspiel nicht wirklich Sinn ergibt.

Wolfenstein 2 könnte auch RPM in der GFX-Queue verwenden und danach in der Graphics-Pipe noch etwas berechnen, bevor erst zusätzlich eine Compute-Queue zum Einsatz kommt.
In dem Fall wäre es bezogen auf RPM völlig egal, ob noch AC verwendet wird oder nicht, da beide gar nicht in Berührung kommen.
Oder wenn die Ressourcen egal ob mit oder ohne RPM ausreichend ausfallen, dann würde sich kein spezieller Unterschied herausstellen.
Während man ebenso bei völlig normalen Berechnungen das Budget übersteigen kann, wenn unpassende Berechnungen zusammen verwendet werden.
 
Zuletzt bearbeitet:
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Das sehe ich komplett anders, gerade zb AC ist ein Feature welches fast ausschließlich nur von wechsewirkungen profitiert, auch von wechselwirkungen zu sich selbst.
Nein, AC ist nur eine Krücke, weil AMD das FrontEnd nicht auf das Niveau von NVIDIA heben kann und daher unnütze Shaderperformance auf der GPU hat. AC kann nun genutzt werden, um diese brachliegenden Shader mit etwas anderem als der Grafikberechnung - für die diese Shader eigentlich da sind - nutzen zu können.

Tatsächlich wäre bei einem perfekten Chip der Effekt von AC gleich null - weil die Shader zu 100% ausgelastet sind. NVIDIA ist da sehr nahe dran - deutlich näher als AMD - und daher hat AC dort auch keinen großen Effekt. Daher spart es sich NVIDIA auch dort zu optimieren. Auch bei AMD sinkt der Effekt von AC von Fury über Polaris hin zu Vega deutlich. Wahrscheinlich wird in 2 Jahren niemand mehr AC nutzen, weil einfach der Effekt gleich null geht.

Was bedeutet, dass Ressourcen wie ALU, Vram, Register, Cache,"Bandbreite" gespart wird und so für AC (zb graphics queue) mehr Ressourcen zu verfügung stehen.
Im besten fall kann so die "RPM compute queue" wärend der graphics queue berechnet werden, was eben ohne die Resource-Einsparungen unwahrscheinlicher gewesen wäre.
Bitte die entsprechenden Dokus lesen, FP16 bei AMD nutzt trotz der FP16-Berechnung immer das load/store in den Grafikspeicher ausschließlich FP32 ist, genauso wie viele Compileroperationen wie sin, cos & Co.

Daher ist der Effekt bei Wolfenstein II trotzdem ganzen Aufwand auch eher mäßig. Um wirklich FP16 sinnvoll nutzen zu können, müsste sämtliche Infrastruktur in FP16 wie auch FP32 vorgehalten werden.

Deine Aussage zum Beispiel, dass FP16 VRAM oder Bandbreite spart ist einfach falsch, weil die FP16-Daten tatsächlich vor der Übertragung und Speicherung in den Grafikspeicher in FP32 umgewandelt wird. Tatsächlich hat hier FP16 eher negative Auswirkungen, weil erstmal die Konvertierung hin zu FP32 getätigt werden muss, die dauert auch einige Takte. Vorteile durch weniger VRAM und/oder Bandbreite sind nicht existent.
 
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

AMD hat ja schon Anfang Jahr, kurz vor ^^ VEGA Release ^^ - all die tollen propäritären AMD Features wie Rapid Packed Math fp16, Async Compute und Shader Intrinsics im Internet beworben.

Dank AMD Rapid Packed Math (fp16) konnten satte 50 FPS erreicht werden, mit (fp32) jeweils nur 44 FPS - (knapp 14% mehr) der Wahnsinn /// Oder betreibt AMD auch hier 'Flase' Marketing ?!?
id Software: Wolfenstein 2 unterstutzt FP16 und Vulkan - Golem.de /// AMD - Rapid Packed Math (fp16) to be used in FM Serra, Wolfenstein 2 and Far Cry 5

"Vorzeigespiel für AMDs neue Radeon RX Vega: In Wolfenstein 2 nutzt id Software die D3D12- und die Vulkan-Grafikschnittstelle."
"Dank Async Compute plus FP16-Berechnungen sowie Shader-Intrinsics soll die Bildrate besonders hoch liegen."

Wolfenstein 2 - The New Colossus Entwickler id Software nutzt erneut Async Compute, was Radeon-Modellen dank paralleler Pipelines mehr Leistung entlockt. Wieder enthalten sind zudem Shader-Intrinsics, womit Hardware-Instruktionen ohne API-Abstraktion angesprochen werden, was ebenfalls für einen Geschwindigkeitszuwachs sorgt. Awo ?!?

FP16 als Radeon-Bonus

Neu bei der für Wolfenstein 2 - The New Colossus entwickelten Version der id Tech 6 sind FP16-Berechnungen. Diese erfolgen mit halber Präzision, was bei einigen Shadern zu einer höheren Bildrate führt, ohne dabei die Grafikqualität sichtbar negativ zu beeinflussen. Für was genau id Software auf FP16 statt FP32 setze, sagte AMD nicht. Denkbar wären Post-Processing-Effekte, etwa Bloom. Die Leistung sollte im zweistelligen Prozentbereich steigen, id Software wollte sich dazu noch nicht äußern.

Überraschend kommt der Einsatz von FP16 nicht: Schon vor einigen Wochen sagte Billy Khan, Lead Engine Programmer bei id Software, dass die nächste id-Tech-6-Iteration auf Half-Precision-Shader setzen werde. Abseits von den Radeon RX Vega profitiert davon auch die Playstation 4 Pro, da deren Grafikeinheit in Teilen die Vega-Architektur verwendet.
 

Anhänge

  • Gear up - for Tomorrow's Games.png
    Gear up - for Tomorrow's Games.png
    358,8 KB · Aufrufe: 34
  • Rapid Packed Math fp16 to be used in FM Serra, Wolfenstein 2 and Far Cry 5.png
    Rapid Packed Math fp16 to be used in FM Serra, Wolfenstein 2 and Far Cry 5.png
    675,7 KB · Aufrufe: 40
Zuletzt bearbeitet:
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Nein, AC ist nur eine Krücke, weil AMD das FrontEnd nicht auf das Niveau von NVIDIA heben kann und daher unnütze Shaderperformance auf der GPU hat. AC kann nun genutzt werden, um diese brachliegenden Shader mit etwas anderem als der Grafikberechnung - für die diese Shader eigentlich da sind - nutzen zu können.

Tatsächlich wäre bei einem perfekten Chip der Effekt von AC gleich null - weil die Shader zu 100% ausgelastet sind. NVIDIA ist da sehr nahe dran - deutlich näher als AMD - und daher hat AC dort auch keinen großen Effekt. Daher spart es sich NVIDIA auch dort zu optimieren. Auch bei AMD sinkt der Effekt von AC von Fury über Polaris hin zu Vega deutlich. Wahrscheinlich wird in 2 Jahren niemand mehr AC nutzen, weil einfach der Effekt gleich null geht.
Klassische Grafikberechnungen haben es so an sich, dass sie auf spezialisierte Hardwareblöcke angewiesen sind, welche nicht völlig gleichzeitig mit den ALUs arbeiten können, deswegen finden sich hier Idle-Times die man durch weitere Operationen in der Queue stopfen kann.
AMD hat GCN speziell so designed, dass ein Grafikkontext ziemlich State arm ist und der Overhead für das Switching zwischen Compute und GFX günstig ausfällt, auch kann AMD beides auf einer CU laufen lassen, dass hat Nvidia bis Heute nicht drauf.
Wäre Nvidias Design in der Hinsicht ähnlich, würden sie gewiss auch mehr profitieren.

Da es bei keinem Chip möglich ist, dass man alles in eine Queue stopft und der Chip 100% Auslastung automatisch extrahieren kann, wird diese Entwicklerkontrolle auch in der Zukunft seinen Nutzen haben.

AMD hat ja schon Anfang Jahr, kurz vor ^^ VEGA Release ^^ - all die tollen propäritären AMD Features wie Rapid Packed Math fp16, Async Compute und Shader Intrinsics im Internet beworben.

Dank AMD Rapid Packed Math (fp16) konnten satte 50 FPS erreicht werden, mit (fp32) jeweils nur 44 FPS - (knapp 14% mehr) der Wahnsinn /// Oder betreibt AMD auch hier 'Flase' Marketing ?!?

AMD - Rapid Packed Math (fp16) to be used in FM Serra, Wolfenstein 2 and Far Cry 5
RPM ist nur proprietär, wenn es AMD exklusiv programmiert wurde, wo Informationen fehlen.
Async Compute ist nicht proprietär, Shader Intrinsics dagegen schon.

In wie fern betreibt AMD false Marketing, wenn sie die Zuwächse von einem neuem 3D Mark mit FP16-Optimierungen angeben?
Wenn man meint deswegen automatisch auf jede andere Anwendung schließen zu können bzw. das es AMD suggeriert, dann hat jeder Hersteller eine Menge false Marketing am laufen, was natürlich auch stimmt.
 
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

mal was anderes, zur performance: was macht die grafik option "image streaming" ausser mehr oder weniger viel grafikkartenspeicher zu belegen? hat sie optische auswirkungen? habe diese option seit "the new order" auf mittel gestellt und dadurch immer nen extremen performance schub von unspielbar nach gut spielbar erhalten, und das ohne sichtbare optische verluste.. kann ich nur jedem mit schwächerer grafikkarte empfehlen.
 
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Klassische Grafikberechnungen haben es so an sich, dass sie auf spezialisierte Hardwareblöcke angewiesen sind, welche nicht völlig gleichzeitig mit den ALUs arbeiten können, deswegen finden sich hier Idle-Times die man durch weitere Operationen in der Queue stopfen kann.
AMD hat GCN speziell so designed, dass ein Grafikkontext ziemlich State arm ist und der Overhead für das Switching zwischen Compute und GFX günstig ausfällt, auch kann AMD beides auf einer CU laufen lassen, dass hat Nvidia bis Heute nicht drauf.
Grundsätzlich sollte es Ziel jeder Hardwareentwicklung sein, die vorhandenen Ressourcen zu 100% auszulasten. NVIDIA ist hier deutlich näher daran, die Shader zu 100% auszulasten, als AMD. Erkennt man daran, dass AMD-Karten deutliche Vorteile in Sachen Shaderleistung auf dem Papier haben, diese aber praktisch nie im Spiel zeigen können.

Wäre Nvidias Design in der Hinsicht ähnlich, würden sie gewiss auch mehr profitieren.
Ist es zum Glück nicht, denn das NVIDIA Design ist deutlich besser, weil es immer funktioniert, unabhängig davon, ob DX9, 10, 11, 12 oder auch Vulkan oder OpenGL. AMD benötigt dagegen mindestens DX12 für ASync und eben entsprechend angepasste Spiele.

Von weiteren Vorteilen wie z.B. der viel besseren Leistungsaufnahme von NVIDIA, sei da jetzt nur mal am Rande eingegangen.
 
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

mal was anderes, zur performance: was macht die grafik option "image streaming" ausser mehr oder weniger viel grafikkartenspeicher zu belegen? hat sie optische auswirkungen? habe diese option seit "the new order" auf mittel gestellt und dadurch immer nen extremen performance schub von unspielbar nach gut spielbar erhalten, und das ohne sichtbare optische verluste.. kann ich nur jedem mit schwächerer grafikkarte empfehlen.

Bei reduziertem image streaming werden manche (aber nicht alle) Texturen später geladen. Wurde hier zumindest so vermeldet...
 
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Bei reduziertem image streaming werden manche (aber nicht alle) Texturen später geladen. Wurde hier zumindest so vermeldet...

das kann ich nachvollziehen, aber sehe ich das optisch irgendwie? mir ist nämlich nix aufgefallen.. ausser wesentlich mehr fps
 
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

das kann ich nachvollziehen, aber sehe ich das optisch irgendwie? mir ist nämlich nix aufgefallen.. ausser wesentlich mehr fps

Man muss halt direkt darauf achten. Es wird schon so gedreht worden sein das eher die unaufälligen Texturen später geladen werden.
 
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

[...]Ist es zum Glück nicht, denn das NVIDIA Design ist deutlich besser, weil es immer funktioniert, unabhängig davon, ob DX9, 10, 11, 12 oder auch Vulkan oder OpenGL. AMD benötigt dagegen mindestens DX12 für ASync und eben entsprechend angepasste Spiele.
Und das liegt nur daran, weil Nvidia eine größere State-Maschine hat was ihren Grafikkontext angeht und weniger flexibel bei der Ausführung ist?
Oder weil sie in anderen Hardwarebereichen vor AMD liegen und auch bessere Treiber schreiben?

Pascal hat dynamisches Scheduling implementiert und profitiert als erste GPU-Architektur von Nvidia, wenn zusätzlich eine Compute-Queue zum Einsatz kommt, ist das etwa ein Rückschritt?
Natürlich nicht und Volta wird vielleicht noch flexibler und möglicherweise landet man bei einer ähnlichen Lösung, wie sie AMD schon seit der ersten GCN Generation implementiert hat.
 
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Und das liegt nur daran, weil Nvidia eine größere State-Maschine hat was ihren Grafikkontext angeht und weniger flexibel bei der Ausführung ist?
Oder weil sie in anderen Hardwarebereichen vor AMD liegen und auch bessere Treiber schreiben?

Pascal hat dynamisches Scheduling implementiert und profitiert als erste GPU-Architektur von Nvidia, wenn zusätzlich eine Compute-Queue zum Einsatz kommt, ist das etwa ein Rückschritt?
Natürlich nicht und Volta wird vielleicht noch flexibler und möglicherweise landet man bei einer ähnlichen Lösung, wie sie AMD schon seit der ersten GCN Generation implementiert hat.

Ist halt dann eine Frage der Resourcen und Designphilosophie ob mam gleich versucht akle Features und volle Flexibilität in eine Architektur zu "quetschen" oder das Schrittweise macht, wenn der Markt es braucht.

Ersteres hat den Vorteil, dass man bereits Jahrelang Erfahrungen sammeln und Softwaee dafür entwickeln kann aber den Nachteil, dass man vermutlich ein unglaublich komplexes Design wie GCN erst verstehen muss und wenn wo Performanceprobleme bestehen diese langsam gefunden und behoben werden, sowie es wohl teurer ist diese Architektur zu optimieren bzw schwieriger bei knappen personellen Resourcen. Vermutlich braucht es dann auch mehr Transistoren als ein weniger flexibler Ansatz. Das würde erklären, warum man bei AMD immer deutlich mehr Transistoren und größere Chips als die Konkurrenz braucht um in Spielen (!) aufs gleiche Ergebnis zu kommen

Ps entschuldigt die Tippfehler bin am Handy
 
Zurück