• Hallo Gast, du kaufst gerne günstig ein und erfährst oft vor deinen Freunden von interessanten Angeboten? Dann kannst du dein Talent als Schnäppchenjäger jetzt zu Geld machen und anderen PCGH-Lesern beim Sparen helfen! Schau einfach mal rein - beim Test der Community Deals!

Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

dj_the_one

PC-Selbstbauer(in)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

welche Regler müsste ich denn runterstellen um die FPS Eibrüche vorallem in außenarealen zu vermeiden? Grundsätzlich läuft das Spiel auf Ultra um die 60 Fps herum (fps lock)

r9 290 i7 3820
 

openSUSE

Software-Overclocker(in)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Wo ist da die Korrelation?
Zwei unabhängige Features, die man auch zusammen verwenden kann.
Korrelation bedingt nicht grundsätzlich einen kausalen Zusammenhang. Worüber beide, in Wechselwirkung, profitieren ergibt sich erst unter Einbeziehung einer dritten Größe - der Ausführungsgeschwindigkeit (FPS).
Und hier profitieren beide ganz erheblich voneinander (mit bezug auf die Ausführungsgeschwindigkeit).
Das eine profitiert nicht direkt vom anderem.
Das sehe ich komplett anders, gerade zb AC ist ein Feature welches fast ausschließlich nur von wechsewirkungen profitiert, auch von wechselwirkungen zu sich selbst.
Ein hypothetisches Beispiel, was in dem Fall auch gelten sollte, AC bringt 5% Performance auf die Waage, RPM ebenso 5%, beides gemeinsam 10%, fehlt ein Feature, dann sind es eben auch nur 5%.
Aber der Fall den du andeutest ist, wenn zusätzlich noch eine Synergie entstehen würde, wo das Ergebnis nicht aus einer simplen Addition und 10% bestehen würde, sondern beide zusammen aus Grund X mehr auf die Waage bringen, als einzeln zusammengerechnet, z.B. 15 oder 20%.
Und genau Grund X sehe ich nirgendwo, der das bedingen würde.
Bitte komm von dem "Nvidia AC style" weg, wir sind hier bei AMDs AC, also auch wirklich parallel.
Im besten fall bekommt man zB GPU-Culling kostenlos da es mit RPM weniger destruktive wirkt und schlicht parallel, wärend der "normalen" GFX berechnung abläuft. Dies kommt vorallem duch gesparte Ressourcen (VRAM, Cache, Register, ALUs) so dass die "normale" gfx Berechnung eben kaum beeinflusst wird. Insofern also eine 1a positive Wechselwirkung besteht, ohne wirklichen Kausalzusammenhang.
 

TheJoker1987

Komplett-PC-Käufer(in)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

So hab mir gestern den neusten Nvidia Patch 388.13 geholt und selbe Sache in ... Achtung Wortspiel... "grün" :D Ebenfalls bei dem neusten Patch tanzt die Bildrate zwischen 59 und 61 hin und her, auch wenn man stumpf in eine Richtung schaut, läuft man dazu SEITLICH, merkt man in schon fast gleichmäßigen Abständen eine unruhige Framerate.
 

pbStoRm

Schraubenverwechsler(in)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

VRam Limit - deine Performance passt zu den Benchmark Ergebnissen, wo alle 4GiB Karten nicht aus dem Knick kommen.

Kommt zudem öfter mal vor, dass die LL-API Games 4GiB VRam als absolutes Minimum vorraussetzen. Das Speichermanagement muss vom Entwickler gemacht werden (in DX11 macht das die API automatisch, ist dafür aber auch weniger performant) und da optimieren die meisten Entwickler auf 4+ GiB.

Naja, wohl eher mangelnde Performance der 290. Die ist eben schon ein wenig älter und gehört nicht mehr zu Riege der Performancekarten.

Im Vergleich, eine GTX 970 fällt bei Extreme Settings und FHD nur sehr selten überhaupt unter 60fps und die 290 ist im Verhältnis einfach langsamer. Das hat also nichts mit VRAM-Limitierung zu tun. Die Karte packt es eben einfach nicht mehr ;)
 

DARPA

Volt-Modder(in)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Korrelation bedingt nicht grundsätzlich einen kausalen Zusammenhang. Worüber beide, in Wechselwirkung, profitieren ergibt sich erst unter Einbeziehung einer dritten Größe - der Ausführungsgeschwindigkeit (FPS).
Und hier profitieren beide ganz erheblich voneinander (mit bezug auf die Ausführungsgeschwindigkeit).

RPM bedeutet "lediglich", dass eine FP32 ALU zwei FP16 Operationen zeitgleich ausführen kann. Wie asynchron diese Berechnungen relativ zu anderen Berechnungen durchgeführt werden, ändert nichts an der absoluten Performancesteigerung durch RPM.
 

Oi!Olli

Software-Overclocker(in)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Wo stell ich eigentlich die Qualität der Texturen ein? Bin ich blind und finde den Schalter nicht?
 

openSUSE

Software-Overclocker(in)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

RPM bedeutet "lediglich", dass eine FP32 ALU zwei FP16 Operationen zeitgleich ausführen kann.
Was bedeutet, dass Ressourcen wie ALU, Vram, Register, Cache,"Bandbreite" gespart wird und so für AC (zb graphics queue) mehr Ressourcen zu verfügung stehen.
Im besten fall kann so die "RPM compute queue" wärend der graphics queue berechnet werden, was eben ohne die Resource-Einsparungen unwahrscheinlicher gewesen wäre.
Wie asynchron diese Berechnungen relativ zu anderen Berechnungen durchgeführt werden, ändert nichts an der absoluten Performancesteigerung durch RPM.
Es geht aber nicht um eine "absolute Performancesteigerung" sondern um eine reale Performancesteigerung.
 

Locuza

Lötkolbengott/-göttin
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Was bedeutet, dass Ressourcen wie ALU, Vram, Register, Cache,"Bandbreite" gespart wird und so für AC (zb graphics queue) mehr Ressourcen zu verfügung stehen.
Im besten fall kann so die "RPM compute queue" wärend der graphics queue berechnet werden, was eben ohne die Resource-Einsparungen unwahrscheinlicher gewesen wäre.
Dafür gibt es aber in keinem Fall eine Garantie, vor allem da keine Informationen darüber vorliegen, was bei Wolfenstein 2 in der GFX-Queue und in der Compute-Queue gemeinsam verwaltet wird und wo FP16 überhaupt zum Einsatz kommt.
Entsprechend kann man auch nicht einfach behaupten, dass RPM ohne AC keinen wirklich Sinn ergibt, da das völlig von der einzigartigen Arbeitspipeline von einem Spiel abhängt.
Bei Async Compute muss man allgemein immer auf die Wechselwirkung von unterschiedlicher Arbeitslast schauen und das mixen, was zusammen effizient funktioniert, so kannst du aber auch behaupten, dass jede Optimierung von der anderen direkt profitiert und ohne ein Zusammenspiel nicht wirklich Sinn ergibt.

Wolfenstein 2 könnte auch RPM in der GFX-Queue verwenden und danach in der Graphics-Pipe noch etwas berechnen, bevor erst zusätzlich eine Compute-Queue zum Einsatz kommt.
In dem Fall wäre es bezogen auf RPM völlig egal, ob noch AC verwendet wird oder nicht, da beide gar nicht in Berührung kommen.
Oder wenn die Ressourcen egal ob mit oder ohne RPM ausreichend ausfallen, dann würde sich kein spezieller Unterschied herausstellen.
Während man ebenso bei völlig normalen Berechnungen das Budget übersteigen kann, wenn unpassende Berechnungen zusammen verwendet werden.
 
Zuletzt bearbeitet:

Sonnenkoenig

Gesperrt
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Das sehe ich komplett anders, gerade zb AC ist ein Feature welches fast ausschließlich nur von wechsewirkungen profitiert, auch von wechselwirkungen zu sich selbst.
Nein, AC ist nur eine Krücke, weil AMD das FrontEnd nicht auf das Niveau von NVIDIA heben kann und daher unnütze Shaderperformance auf der GPU hat. AC kann nun genutzt werden, um diese brachliegenden Shader mit etwas anderem als der Grafikberechnung - für die diese Shader eigentlich da sind - nutzen zu können.

Tatsächlich wäre bei einem perfekten Chip der Effekt von AC gleich null - weil die Shader zu 100% ausgelastet sind. NVIDIA ist da sehr nahe dran - deutlich näher als AMD - und daher hat AC dort auch keinen großen Effekt. Daher spart es sich NVIDIA auch dort zu optimieren. Auch bei AMD sinkt der Effekt von AC von Fury über Polaris hin zu Vega deutlich. Wahrscheinlich wird in 2 Jahren niemand mehr AC nutzen, weil einfach der Effekt gleich null geht.

Was bedeutet, dass Ressourcen wie ALU, Vram, Register, Cache,"Bandbreite" gespart wird und so für AC (zb graphics queue) mehr Ressourcen zu verfügung stehen.
Im besten fall kann so die "RPM compute queue" wärend der graphics queue berechnet werden, was eben ohne die Resource-Einsparungen unwahrscheinlicher gewesen wäre.
Bitte die entsprechenden Dokus lesen, FP16 bei AMD nutzt trotz der FP16-Berechnung immer das load/store in den Grafikspeicher ausschließlich FP32 ist, genauso wie viele Compileroperationen wie sin, cos & Co.

Daher ist der Effekt bei Wolfenstein II trotzdem ganzen Aufwand auch eher mäßig. Um wirklich FP16 sinnvoll nutzen zu können, müsste sämtliche Infrastruktur in FP16 wie auch FP32 vorgehalten werden.

Deine Aussage zum Beispiel, dass FP16 VRAM oder Bandbreite spart ist einfach falsch, weil die FP16-Daten tatsächlich vor der Übertragung und Speicherung in den Grafikspeicher in FP32 umgewandelt wird. Tatsächlich hat hier FP16 eher negative Auswirkungen, weil erstmal die Konvertierung hin zu FP32 getätigt werden muss, die dauert auch einige Takte. Vorteile durch weniger VRAM und/oder Bandbreite sind nicht existent.
 

Pro_PainKiller

Gesperrt
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

AMD hat ja schon Anfang Jahr, kurz vor ^^ VEGA Release ^^ - all die tollen propäritären AMD Features wie Rapid Packed Math fp16, Async Compute und Shader Intrinsics im Internet beworben.

Dank AMD Rapid Packed Math (fp16) konnten satte 50 FPS erreicht werden, mit (fp32) jeweils nur 44 FPS - (knapp 14% mehr) der Wahnsinn /// Oder betreibt AMD auch hier 'Flase' Marketing ?!?
id Software: Wolfenstein 2 unterstutzt FP16 und Vulkan - Golem.de /// AMD - Rapid Packed Math (fp16) to be used in FM Serra, Wolfenstein 2 and Far Cry 5

"Vorzeigespiel für AMDs neue Radeon RX Vega: In Wolfenstein 2 nutzt id Software die D3D12- und die Vulkan-Grafikschnittstelle."
"Dank Async Compute plus FP16-Berechnungen sowie Shader-Intrinsics soll die Bildrate besonders hoch liegen."

Wolfenstein 2 - The New Colossus Entwickler id Software nutzt erneut Async Compute, was Radeon-Modellen dank paralleler Pipelines mehr Leistung entlockt. Wieder enthalten sind zudem Shader-Intrinsics, womit Hardware-Instruktionen ohne API-Abstraktion angesprochen werden, was ebenfalls für einen Geschwindigkeitszuwachs sorgt. Awo ?!?

FP16 als Radeon-Bonus

Neu bei der für Wolfenstein 2 - The New Colossus entwickelten Version der id Tech 6 sind FP16-Berechnungen. Diese erfolgen mit halber Präzision, was bei einigen Shadern zu einer höheren Bildrate führt, ohne dabei die Grafikqualität sichtbar negativ zu beeinflussen. Für was genau id Software auf FP16 statt FP32 setze, sagte AMD nicht. Denkbar wären Post-Processing-Effekte, etwa Bloom. Die Leistung sollte im zweistelligen Prozentbereich steigen, id Software wollte sich dazu noch nicht äußern.

Überraschend kommt der Einsatz von FP16 nicht: Schon vor einigen Wochen sagte Billy Khan, Lead Engine Programmer bei id Software, dass die nächste id-Tech-6-Iteration auf Half-Precision-Shader setzen werde. Abseits von den Radeon RX Vega profitiert davon auch die Playstation 4 Pro, da deren Grafikeinheit in Teilen die Vega-Architektur verwendet.
 

Anhänge

  • Gear up - for Tomorrow's Games.png
    Gear up - for Tomorrow's Games.png
    358,8 KB · Aufrufe: 34
  • Rapid Packed Math fp16 to be used in FM Serra, Wolfenstein 2 and Far Cry 5.png
    Rapid Packed Math fp16 to be used in FM Serra, Wolfenstein 2 and Far Cry 5.png
    675,7 KB · Aufrufe: 40
Zuletzt bearbeitet:

Locuza

Lötkolbengott/-göttin
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Nein, AC ist nur eine Krücke, weil AMD das FrontEnd nicht auf das Niveau von NVIDIA heben kann und daher unnütze Shaderperformance auf der GPU hat. AC kann nun genutzt werden, um diese brachliegenden Shader mit etwas anderem als der Grafikberechnung - für die diese Shader eigentlich da sind - nutzen zu können.

Tatsächlich wäre bei einem perfekten Chip der Effekt von AC gleich null - weil die Shader zu 100% ausgelastet sind. NVIDIA ist da sehr nahe dran - deutlich näher als AMD - und daher hat AC dort auch keinen großen Effekt. Daher spart es sich NVIDIA auch dort zu optimieren. Auch bei AMD sinkt der Effekt von AC von Fury über Polaris hin zu Vega deutlich. Wahrscheinlich wird in 2 Jahren niemand mehr AC nutzen, weil einfach der Effekt gleich null geht.
Klassische Grafikberechnungen haben es so an sich, dass sie auf spezialisierte Hardwareblöcke angewiesen sind, welche nicht völlig gleichzeitig mit den ALUs arbeiten können, deswegen finden sich hier Idle-Times die man durch weitere Operationen in der Queue stopfen kann.
AMD hat GCN speziell so designed, dass ein Grafikkontext ziemlich State arm ist und der Overhead für das Switching zwischen Compute und GFX günstig ausfällt, auch kann AMD beides auf einer CU laufen lassen, dass hat Nvidia bis Heute nicht drauf.
Wäre Nvidias Design in der Hinsicht ähnlich, würden sie gewiss auch mehr profitieren.

Da es bei keinem Chip möglich ist, dass man alles in eine Queue stopft und der Chip 100% Auslastung automatisch extrahieren kann, wird diese Entwicklerkontrolle auch in der Zukunft seinen Nutzen haben.

AMD hat ja schon Anfang Jahr, kurz vor ^^ VEGA Release ^^ - all die tollen propäritären AMD Features wie Rapid Packed Math fp16, Async Compute und Shader Intrinsics im Internet beworben.

Dank AMD Rapid Packed Math (fp16) konnten satte 50 FPS erreicht werden, mit (fp32) jeweils nur 44 FPS - (knapp 14% mehr) der Wahnsinn /// Oder betreibt AMD auch hier 'Flase' Marketing ?!?

AMD - Rapid Packed Math (fp16) to be used in FM Serra, Wolfenstein 2 and Far Cry 5
RPM ist nur proprietär, wenn es AMD exklusiv programmiert wurde, wo Informationen fehlen.
Async Compute ist nicht proprietär, Shader Intrinsics dagegen schon.

In wie fern betreibt AMD false Marketing, wenn sie die Zuwächse von einem neuem 3D Mark mit FP16-Optimierungen angeben?
Wenn man meint deswegen automatisch auf jede andere Anwendung schließen zu können bzw. das es AMD suggeriert, dann hat jeder Hersteller eine Menge false Marketing am laufen, was natürlich auch stimmt.
 

sho_xen

Komplett-PC-Käufer(in)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

mal was anderes, zur performance: was macht die grafik option "image streaming" ausser mehr oder weniger viel grafikkartenspeicher zu belegen? hat sie optische auswirkungen? habe diese option seit "the new order" auf mittel gestellt und dadurch immer nen extremen performance schub von unspielbar nach gut spielbar erhalten, und das ohne sichtbare optische verluste.. kann ich nur jedem mit schwächerer grafikkarte empfehlen.
 

Sonnenkoenig

Gesperrt
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Klassische Grafikberechnungen haben es so an sich, dass sie auf spezialisierte Hardwareblöcke angewiesen sind, welche nicht völlig gleichzeitig mit den ALUs arbeiten können, deswegen finden sich hier Idle-Times die man durch weitere Operationen in der Queue stopfen kann.
AMD hat GCN speziell so designed, dass ein Grafikkontext ziemlich State arm ist und der Overhead für das Switching zwischen Compute und GFX günstig ausfällt, auch kann AMD beides auf einer CU laufen lassen, dass hat Nvidia bis Heute nicht drauf.
Grundsätzlich sollte es Ziel jeder Hardwareentwicklung sein, die vorhandenen Ressourcen zu 100% auszulasten. NVIDIA ist hier deutlich näher daran, die Shader zu 100% auszulasten, als AMD. Erkennt man daran, dass AMD-Karten deutliche Vorteile in Sachen Shaderleistung auf dem Papier haben, diese aber praktisch nie im Spiel zeigen können.

Wäre Nvidias Design in der Hinsicht ähnlich, würden sie gewiss auch mehr profitieren.
Ist es zum Glück nicht, denn das NVIDIA Design ist deutlich besser, weil es immer funktioniert, unabhängig davon, ob DX9, 10, 11, 12 oder auch Vulkan oder OpenGL. AMD benötigt dagegen mindestens DX12 für ASync und eben entsprechend angepasste Spiele.

Von weiteren Vorteilen wie z.B. der viel besseren Leistungsaufnahme von NVIDIA, sei da jetzt nur mal am Rande eingegangen.
 

Rolk

Lötkolbengott/-göttin
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

mal was anderes, zur performance: was macht die grafik option "image streaming" ausser mehr oder weniger viel grafikkartenspeicher zu belegen? hat sie optische auswirkungen? habe diese option seit "the new order" auf mittel gestellt und dadurch immer nen extremen performance schub von unspielbar nach gut spielbar erhalten, und das ohne sichtbare optische verluste.. kann ich nur jedem mit schwächerer grafikkarte empfehlen.

Bei reduziertem image streaming werden manche (aber nicht alle) Texturen später geladen. Wurde hier zumindest so vermeldet...
 

sho_xen

Komplett-PC-Käufer(in)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

welche Regler müsste ich denn runterstellen um die FPS Eibrüche vorallem in außenarealen zu vermeiden? Grundsätzlich läuft das Spiel auf Ultra um die 60 Fps herum (fps lock)

r9 290 i7 3820

"image streaming" ?
 

sho_xen

Komplett-PC-Käufer(in)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Bei reduziertem image streaming werden manche (aber nicht alle) Texturen später geladen. Wurde hier zumindest so vermeldet...

das kann ich nachvollziehen, aber sehe ich das optisch irgendwie? mir ist nämlich nix aufgefallen.. ausser wesentlich mehr fps
 

Rolk

Lötkolbengott/-göttin
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

das kann ich nachvollziehen, aber sehe ich das optisch irgendwie? mir ist nämlich nix aufgefallen.. ausser wesentlich mehr fps

Man muss halt direkt darauf achten. Es wird schon so gedreht worden sein das eher die unaufälligen Texturen später geladen werden.
 

Locuza

Lötkolbengott/-göttin
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

[...]Ist es zum Glück nicht, denn das NVIDIA Design ist deutlich besser, weil es immer funktioniert, unabhängig davon, ob DX9, 10, 11, 12 oder auch Vulkan oder OpenGL. AMD benötigt dagegen mindestens DX12 für ASync und eben entsprechend angepasste Spiele.
Und das liegt nur daran, weil Nvidia eine größere State-Maschine hat was ihren Grafikkontext angeht und weniger flexibel bei der Ausführung ist?
Oder weil sie in anderen Hardwarebereichen vor AMD liegen und auch bessere Treiber schreiben?

Pascal hat dynamisches Scheduling implementiert und profitiert als erste GPU-Architektur von Nvidia, wenn zusätzlich eine Compute-Queue zum Einsatz kommt, ist das etwa ein Rückschritt?
Natürlich nicht und Volta wird vielleicht noch flexibler und möglicherweise landet man bei einer ähnlichen Lösung, wie sie AMD schon seit der ersten GCN Generation implementiert hat.
 

Rollora

Kokü-Junkie (m/w)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Und das liegt nur daran, weil Nvidia eine größere State-Maschine hat was ihren Grafikkontext angeht und weniger flexibel bei der Ausführung ist?
Oder weil sie in anderen Hardwarebereichen vor AMD liegen und auch bessere Treiber schreiben?

Pascal hat dynamisches Scheduling implementiert und profitiert als erste GPU-Architektur von Nvidia, wenn zusätzlich eine Compute-Queue zum Einsatz kommt, ist das etwa ein Rückschritt?
Natürlich nicht und Volta wird vielleicht noch flexibler und möglicherweise landet man bei einer ähnlichen Lösung, wie sie AMD schon seit der ersten GCN Generation implementiert hat.

Ist halt dann eine Frage der Resourcen und Designphilosophie ob mam gleich versucht akle Features und volle Flexibilität in eine Architektur zu "quetschen" oder das Schrittweise macht, wenn der Markt es braucht.

Ersteres hat den Vorteil, dass man bereits Jahrelang Erfahrungen sammeln und Softwaee dafür entwickeln kann aber den Nachteil, dass man vermutlich ein unglaublich komplexes Design wie GCN erst verstehen muss und wenn wo Performanceprobleme bestehen diese langsam gefunden und behoben werden, sowie es wohl teurer ist diese Architektur zu optimieren bzw schwieriger bei knappen personellen Resourcen. Vermutlich braucht es dann auch mehr Transistoren als ein weniger flexibler Ansatz. Das würde erklären, warum man bei AMD immer deutlich mehr Transistoren und größere Chips als die Konkurrenz braucht um in Spielen (!) aufs gleiche Ergebnis zu kommen

Ps entschuldigt die Tippfehler bin am Handy
 

Sonnenkoenig

Gesperrt
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Und das liegt nur daran, weil Nvidia eine größere State-Maschine hat was ihren Grafikkontext angeht und weniger flexibel bei der Ausführung ist?
Oder weil sie in anderen Hardwarebereichen vor AMD liegen und auch bessere Treiber schreiben?
Weil NVIDIA viel Zeit in das Frontend gesteckt hat, beginnend ab Fermi und der Parallelisierung der Geometrieverarbeitung - ein absolutes Novum im Grafikchipbereich, leider viel zu wenig gewürdigt.

NVIDIA hat eben immer daran gearbeitet, die Karte perfekt für den Grafikkontext auszulegen. Und somit auch keine Notwendig für AC.

Pascal hat dynamisches Scheduling implementiert und profitiert als erste GPU-Architektur von Nvidia, wenn zusätzlich eine Compute-Queue zum Einsatz kommt, ist das etwa ein Rückschritt?
Natürlich nicht und Volta wird vielleicht noch flexibler und möglicherweise landet man bei einer ähnlichen Lösung, wie sie AMD schon seit der ersten GCN Generation implementiert hat.
Man hat aber nicht die Shaderleistung massiv hochgeschraubt, ohne entsprechend gesteigerte Gamingleistung. Wie es bei AMD der Fall ist.

Das ist der Unterschied. Und auch mit Pascal ist die Skalierung von AC ziemlich - durchwachsen. Es stellt sich schlicht die Frage, ob der Aufwand, der in Hardware für das zusätzliche Sheduling anfällt, den Benefit wert ist.
 

openSUSE

Software-Overclocker(in)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Dafür gibt es aber in keinem Fall eine Garantie, vor allem da keine Informationen darüber vorliegen, was bei Wolfenstein 2 in der GFX-Queue und in der Compute-Queue gemeinsam verwaltet wird und wo FP16 überhaupt zum Einsatz kommt.
Ein Garantie hat man bei einem NICHT kausalen Zusammenhang ohnehin nicht. Schau dir doch nurmal die Multithreading Programmierung an, auch dort gibt es eben keine Garantie.

Bitte die entsprechenden Dokus lesen, FP16 bei AMD nutzt trotz der FP16-Berechnung immer das load/store in den Grafikspeicher ausschließlich FP32 ist, genauso wie viele Compileroperationen wie sin, cos & Co.
Das load u. store FP32 ist und bleibt ist doch logisch und gewollt. Was du aber unterschlägst ist, dass im falle von RPM ein Load/FP32 gleich 2 FP16 Werte bedeutet(!) man also bei jedem load oder store gleich 2 FP16 Werte adressiert, eben FP16_high u. FP16_low -Verpackt ;) (Rapid Packed Math) in FP32. (Und für dich noch 16Bit+16Bit=32Bit - Cool, gell ;) )
Ps: Die "entsprechenden Dokus lesen" ist schon ein guter Anfang, aber verstehen musst du sie dann auch noch.
 
Zuletzt bearbeitet:

TheJoker1987

Komplett-PC-Käufer(in)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

So nach dem neusten Patch für das Spiel (Steam Overlay Patch) ist die gesamte Skybox zerschossen...
 

Rafftnix

Schraubenverwechsler(in)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Dein Text passt rein gar nicht zum kreativen und technisch sehr interessanten Werk Wolfenstein 2.

MfG,
Raff
bei dem technisch brillanten New Generation Vsync Tearing of Death, absolut richtig :)
Find es auch klasse, noch besser wäre es mit normalen Vsync verhalten.
 

Sonnenkoenig

Gesperrt
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Das load u. store FP32 ist und bleibt ist doch logisch und gewollt. Was du aber unterschlägst ist, dass im falle von RPM ein Load/FP32 gleich 2 FP16 Werte bedeutet(!) man also bei jedem load oder store gleich 2 FP16 Werte adressiert, eben FP16_high u. FP16_low -Verpackt ;) (Rapid Packed Math) in FP32. (Und für dich noch 16Bit+16Bit=32Bit - Cool, gell ;) )
Ps: Die "entsprechenden Dokus lesen" ist schon ein guter Anfang, aber verstehen musst du sie dann auch noch.
Verstanden habe ich sie, nur du offensichtlich nicht :)

Das Problem hatte ich ja nun schon erläutert, nur leider hast du wohl die Auswirkungen dessen, was ich geschrieben habe, nicht verstanden.
 

openSUSE

Software-Overclocker(in)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Verstanden habe ich sie, nur du offensichtlich nicht :)

Das Problem hatte ich ja nun schon erläutert, nur leider hast du wohl die Auswirkungen dessen, was ich geschrieben habe, nicht verstanden.
Du hast dich definitive auf den Grafikspeicher bezogen.

Bitte die entsprechenden Dokus lesen, FP16 bei AMD nutzt trotz der FP16-Berechnung immer das load/store in den Grafikspeicher ausschließlich FP32 ist, genauso wie viele Compileroperationen wie sin, cos & Co.
Dazu ist meine ausführung korrekt.
Also nochmal, lesen reicht nicht, du muss es auch verstehen.
 

Sonnenkoenig

Gesperrt
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Du hast dich definitive auf den Grafikspeicher bezogen.
Nein, das war ein Teilaspekt meiner Ausführungen.

Dazu ist meine ausführung korrekt.
Also nochmal, lesen reicht nicht, du muss es auch verstehen.
Nein, die Kombination zweier FP16-Werte in einem FP32-Load/Store Befehl ist eben NICHT möglich. Das ist genau dein Irrtum.

Es ist möglich zwei FP16-Werte in einer Ausführung zu berechnen, hinterher müssen die Werte aber getrennt, als zwei FP32-Werte abgespeichert werden!
 

openSUSE

Software-Overclocker(in)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Es ist möglich zwei FP16-Werte in einer Ausführung zu berechnen, hinterher müssen die Werte aber getrennt, als zwei FP32-Werte abgespeichert werden!
Nein, du musst sie nur trennen wenn du sie auch wirklich als FP16 (Datentype) weiterverwenden musst. Was aber eher seltener der Fall sein wird.
Es ist echt erstaunlich woher kommt denn der Stuss man müsse dies hin und her "konvertieren". Sorry aber das ist das blödeste was ich in letzter zeit hören/lesen musste.
 
Zuletzt bearbeitet:

Sonnenkoenig

Gesperrt
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Nein, du musst sie nur trennen wenn du sie auch wirklich als FP16 (Datentype) weiterverwenden musst. Was aber eher seltener der Fall sein wird.
Lies doch bitte erstmal, was ich schreibe. Du hast offensichtlich nicht verstanden, was da steht.
 

Locuza

Lötkolbengott/-göttin
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Ist halt dann eine Frage der Resourcen und Designphilosophie ob mam gleich versucht akle Features und volle Flexibilität in eine Architektur zu "quetschen" oder das Schrittweise macht, wenn der Markt es braucht.

Ersteres hat den Vorteil, dass man bereits Jahrelang Erfahrungen sammeln und Softwaee dafür entwickeln kann aber den Nachteil, dass man vermutlich ein unglaublich komplexes Design wie GCN erst verstehen muss und wenn wo Performanceprobleme bestehen diese langsam gefunden und behoben werden, sowie es wohl teurer ist diese Architektur zu optimieren bzw schwieriger bei knappen personellen Resourcen. Vermutlich braucht es dann auch mehr Transistoren als ein weniger flexibler Ansatz. Das würde erklären, warum man bei AMD immer deutlich mehr Transistoren und größere Chips als die Konkurrenz braucht um in Spielen (!) aufs gleiche Ergebnis zu kommen

Ps entschuldigt die Tippfehler bin am Handy
Die Frage kann wohl auch nur ein Hardware-Ingenieur beantworten und jemand der bei einer der beiden Architekturen gearbeitet hat, um die Kosten und den Nutzen davon abschätzen zu können.
Ebenso, ob GCN überhaupt komplexer, als Nvidias design ausfällt, rein von der Programmierung fällt GCN für Anwendungsentwickler in vielerlei Hinsicht simpler bzw. nachvollziehbarer aus, eine Workgroup wird statisch in 4 Takten abgearbeitet, viele Operationen laufen generalisiert über die ALUs, Register-Pressure und Memory-Flow ist nachvollziehbar und die Entwickler haben darüber Kontrolle.
Für Compiler-Entwickler bei AMD setzt das auch gleich einen Rahmen für Optimierungen, Register-Bank-Conflicts gibt es bei GCN nicht.

Wenn man GCN mal mit Kepler vergleicht, merkt man wie schlecht Nvidias Architektur generell vor Maxwell war und Nvidia hat ab Maxwell bei den Features und der Flexibilität nur draufgelegt, was sich bei Pascal stellenweise fortgesetzt hat.
Entsprechend bin ich geneigt zu glauben, dass viele Design-Aspekte nicht unbedingt daran scheitern, weil man schwere Kompromisse treffen musste, sondern weil das Design objektiv einfach schlechter war und man es sukzessiv umgebaut und verbessert hat.

[...]
Das ist der Unterschied. Und auch mit Pascal ist die Skalierung von AC ziemlich - durchwachsen. Es stellt sich schlicht die Frage, ob der Aufwand, der in Hardware für das zusätzliche Sheduling anfällt, den Benefit wert ist.
Da es seit jeder Generation bei Nvidia nur nach vorne geht, augenscheinlich schon.

3D Mark schafft es bei Time Spy mit einer 1080 GTX 7% durch eine Compute-Queue heraus zu bekommen:
Time Spy: 19 Grafikkarten im 3DMark fur DirectX 12 im Vergleich (Seite 3) - ComputerBase

Und das mit den Einschränkungen, die bei Nvidia nach wie vor herrschen und das Unternehmen wird sicherlich auch versuchen, ihre Hardware mehr zu generalisieren und GFX und Compute günstiger zusammen zu verwalten, da Compute offensichtlich der Trend ist und der Profit steigen sollte und nicht sinken.


Ein Garantie hat man bei einem NICHT kausalen Zusammenhang ohnehin nicht.
[...]
Deswegen trat ich auch von Anfang an auf die Behauptung, dass ohne AC RPM gar nicht wirklich Sinn ergibt, weil das kann man so einfach nicht behaupten.

Nein, du musst sie nur trennen wenn du sie auch wirklich als FP16 (Datentype) weiterverwenden musst. Was aber eher seltener der Fall sein wird.
Es ist echt erstaunlich woher kommt denn der Stuss man müsse dies hin und her "konvertieren". Sorry aber das ist das blödeste was ich in letzter zeit hören/lesen musste.
Kommt direkt von einem Engine Programmierer bei id Software, der an Doom, Wolfenstein 2 und am Vulkan-Renderer gearbeitet hat:
gravitationsfeld schrieb:
FP16 ist weniger nuetzlich als ich noch vor ein paar Monaten geglaubt habe. Es ist extrem schwierig fuer einen Compiler es zu verwenden, weil Instruktionen immer beide Operanden im gleichen Register haben muessen und auch auf beiden die gleiche Operation ausgefuehrt werden muss.

Dazu kommt, dass vieles nur FP32 ist (loads/stores (!), sin, cos, etc.) und dann von FP16->FP32 und zurueck konvertiert werden muss, was wieder mehr Instruktionen und Register braucht. Und Registerdruck ist ein ziemliches Problem bei GPUs.

Es kann sein, dass zukuenftige GPUs FP16 effizienter unterstuetzen werden, im Moment sieht es so aus als haette man es vor allem fuer neuronale Netzwerke eingebaut, wo es trivial zu verwenden ist.
gravitationsfeld schrieb:
Die Xbox One (und Xbox One X) haben null Unterstuetzung fuer FP16 in den ALUs. Und ja, man muss konvertieren. Hin und zurueck zu FP32. Alle Textur-Operationen liefern nur FP32-Werte, alle Interpolation-Inputs sind nur FP32. Framebuffer-Output muss FP32 sein. Transcedentals sind nur FP32. Usw. usf.
3DCenter Forum - AMD/ATI - Radeon RX Vega 56/64: Review-Thread - Seite 178
3DCenter Forum - AMD/ATI - Radeon RX Vega 56/64: Review-Thread - Seite 194
 

Sonnenkoenig

Gesperrt
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Da es seit jeder Generation bei Nvidia nur nach vorne geht, augenscheinlich schon.
Das hat aber wenig mit AC zu tun.

3D Mark schafft es bei Time Spy mit einer 1080 GTX 7% durch eine Compute-Queue heraus zu bekommen:
Ja. Trotzdem ist eine GTX1080 gegenüber dem Vorgänger durch andere Dinge deutlich schneller geworden, als dies AC geleistet hat. Und davon profitieren alle Spiele, nicht nur die 5, die ASync Compute nutzen (sind es überhaupt 5?). Das ist mein Punkt. Allgemeine Optimierung ist deutlich wichtiger/gewinnbringend, als das bisschen ASync Compute.

Und das mit den Einschränkungen, die bei Nvidia nach wie vor herrschen und das Unternehmen wird sicherlich auch versuchen, ihre Hardware mehr zu generalisieren und GFX und Compute günstiger zusammen zu verwalten, da Compute offensichtlich der Trend ist und der Profit steigen sollte und nicht sinken.
Hat nur leider null mit meiner Aussage zu tun. Auf die du nirgends eingehst, um es mal grad ganz ehrlich zu sagen.

Kommt direkt von einem Engine Programmierer bei id Software, der an Doom, Wolfenstein 2 und am Vulkan-Renderer gearbeitet hat:
Sehr gut, dann bin ich wohl doch nicht zu doof, die AMD Doku zu lesen :ugly:
 

Locuza

Lötkolbengott/-göttin
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

[...]
Ja. Trotzdem ist eine GTX1080 gegenüber dem Vorgänger durch andere Dinge deutlich schneller geworden, als dies AC geleistet hat. Und davon profitieren alle Spiele, nicht nur die 5, die ASync Compute nutzen (sind es überhaupt 5?). Das ist mein Punkt. Allgemeine Optimierung ist deutlich wichtiger/gewinnbringend, als das bisschen ASync Compute.


Hat nur leider null mit meiner Aussage zu tun. Auf die du nirgends eingehst, um es mal grad ganz ehrlich zu sagen.
Weil die Aussagen etwas ausufern.
Was würde denn Nvidia verlieren, wenn sie Async Compute effizienter und flexibler unterstützen würden?
50% Perf/Watt Verlust? Funktionieren dann die anderen Hardwareblöcke plötzlich alle ineffizienter?
Das ist jetzt übertrieben gefragt, aber darauf läuft es ja am Ende hinaus, wo aber vermutlich niemand eine konkrete Beweisführung zur Hand hat.
 

Sonnenkoenig

Gesperrt
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Weil die Aussagen etwas ausufern.
Was würde denn Nvidia verlieren, wenn sie Async Compute effizienter und flexibler unterstützen würden?
50% Perf/Watt Verlust? Funktionieren dann die anderen Hardwareblöcke plötzlich alle ineffizienter?
Das ist jetzt übertrieben gefragt, aber darauf läuft es ja am Ende hinaus, wo aber vermutlich niemand eine konkrete Beweisführung zur Hand hat.
Einfach: NVIDIA stehen nur begrenzte Ressourcen zur Verfügung. Sei es auf Seiten der Entwicklung, wie auf Seiten der Hardware.

Warum es für NVIDIA wenig Sinn ergibt, ASync Compute effizienter und flexibler zu unterstützen, hatte ich hier schon dargelegt. Die Beweisführung ist abgeschlossen und schlüssig. Lies es gern noch mal nach.

Fakt ist: Der Support von ASync Compute hat wenig mit "fortschrittlich" oder "besser" zu tun. Es ist schlicht "ungenutzt Shaderperformance".
 

Locuza

Lötkolbengott/-göttin
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Das ist kein Beweis zu behaupten, dass Async Compute nur eine Krücke ist und Nvidia es gar nicht nötig hat oder es die Kosten nicht Wert sei.
Dazu müsste man genau aufzeigen, dass Nvidias Shader-Auslastung hoch genug ist, dass ein erweitertes Scheduling mehr Kosten verursachen würde, als effektiv nützen.

Ich kann es dir gleich tun, Fakt ist: Nvidias Implementierung von Async Compute ist zu statisch und sie können Löcher in ihrer Pipeline nicht so effektiv füllen wie AMD.
Dabei kann ich auch völlig ausschließen, dass AMD in anderen Bereichen rückständig ist.
 

Sonnenkoenig

Gesperrt
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Das ist kein Beweis zu behaupten, dass Async Compute nur eine Krücke ist und Nvidia es gar nicht nötig hat oder es die Kosten nicht Wert sei.
Dazu müsste man genau aufzeigen, dass Nvidias Shader-Auslastung hoch genug ist, dass ein erweitertes Scheduling mehr Kosten verursachen würde, als effektiv nützen.
Strohmann-Argument, niemand hat das behauptet. Es ist nur ein Denkanstoß, warum NVIDIA relativ wenig tut, um ASync Compute besser zu unterstützen.

Ich kann es dir gleich tun, Fakt ist: Nvidias Implementierung von Async Compute ist zu statisch und sie können Löcher in ihrer Pipeline nicht so effektiv füllen wie AMD.
Auch hier wieder: Strohmann. Wenn NVIDIA keine/wenige Löcher in der Pipeline haben, können diese natürlich auch nicht gefüllt werden. Ziemlich logisch.

Dabei kann ich auch völlig ausschließen, dass AMD in anderen Bereichen rückständig ist.
Nicht? Siehe dein eigener Link von Computerbase:
Time Spy: 19 Grafikkarten im 3DMark fur DirectX 12 im Vergleich (Seite 3) - ComputerBase
FuryX und GTX1080 haben nahezu identische Rechenleistung auf dem Papier, 8,6 vs. 8,8 TFlops. Trotzdem ist die GTX1080 40-50% schneller, als die FuryX.

Das nennst du nicht "rückständig"? Na dann :lol:
 

Khabarak

BIOS-Overclocker(in)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

:wall: Es geht aber darum, dass die Vega eher mit der 300mm² 1080 vergleichbar ist, wie oft denn noch.
Und wenn mans mit dem GP102 vergleicht, dann schon mit der Titan und diese müsste dann auch mit HBM2 statt mit GDDR5X stattfinden, was dazu führen würde, dass die Titan nochmal schneller wäre und weniger "Sprit" brauchen würde.

Meist find ich deine Kommentare ja brauchbar.. diesmal allerdings...

Weshalb ist Vega denn meist eher auf 1080, als auf TI Niveau?
An mangelnder Rechenpower kann es nicht liegen.
Ein prinzipielles Problem mit der Speicherbandbreite kann es auch nicht sein - sonst gäbe es keine Spiele, in denen Vega gut abschneidet.

Wenn du dir die Spiele mal genau ansiehst, bemerkst du, dass Vega deutlich andere Optimierungen braucht, als Pascal - war schon immer so im Vergleich zwischen GCN und allen Nvidia Architekturen.
Bei Spielen, in denen Vega wirklich mal die Rechenleistung "auf die Straße" bringt, hat das Studio offensichtlich mehr Arbeit in die Optimierungen für beide Zweige gesteckt.
Du siehst ja, dass sowohl in Wolfenstein 2, als auch in Doom alle Karten ziemlich gut abschneiden - sofern der VRAM reicht.

DX11 ist für AMD abgefahren. Da ist nix mehr zu retten.

Aktuell müssen die Studios auch noch sehr viel Arbeit in die Optimierung stecken, wenn sie DX12 und Vulkan verwenden.
Sobald die Entwickler der Engines davon einen Teil schon übernehmen und als USP ihrer Engine nutzen, sinkt der Aufwand auf ein erträglicheres Niveau.
Bis dahin müssen wir allerdings mit ein paar Ausnahmespielen leben, in denen Vega (und z.T. alle GCN GPUs) gut funktioniert.

Die meisten Spiele werden sicher weiter auf einfacher zu handhabende 3D Schnittstellen setzen.
Für den Großteil davon ist es auch vollkommen egal.
Auf Steam sind letztes Jahr über 4000 Spiele erschienen. Davon sind sicher gerade mal 10% in der Lage, aktuelle Grafikkarten wirklich zu fordern.


Früher waren Spiele der Hauptgrund, neue Hardware zu kaufen.
Inzwischen sind die AAA Titel aber eine zu große Investition. So traut sich da keiner mehr wirklich ran.
Ich bin gespannt, wann Star Citizen raus kommt, und ob es dann einen solchen Effekt auslöst. (Nein, ich hab es bisher nicht unterstützt. Obwohl ich das Genre mag, fehlt mir einfach die Zeit.)
Eventuell kann uns ja Egosoft noch überraschen. Der nächste X Teil kommt auch mit einer Vulkan basierten Engine raus.
Wahrscheinlich noch vor Star Citizen.
Ja, das Ding wird am Anfang wieder ohne Ende bugs haben, aber bisher haben mir alle Teile viel Spaß bereitet. (sofern meine Zeit es zuließ)

X Rebirth VR läuft mit einer ersten Version der Vulkan Engine.


@PCGH wäre vielleicht auch mal interessant, sich X Rebirth VR unter dem Technik Aspekt anzusehen. Das Spiel verlangt auch kein VR Headset und kann rein am Bildschirm gespielt werden.
 

Palmdale

BIOS-Overclocker(in)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

...

Die meisten Spiele werden sicher weiter auf einfacher zu handhabende 3D Schnittstellen setzen.
Für den Großteil davon ist es auch vollkommen egal.
Auf Steam sind letztes Jahr über 4000 Spiele erschienen. Davon sind sicher gerade mal 10% in der Lage, aktuelle Grafikkarten wirklich zu fordern.

...

Fordern ist allerdings bei GPUs relativ im Vergleich zur CPU oder zumindest der Falsche Begriff. Denn je nach verwendetem Monitor bzw. DSR/VSR ist es eigentlich ein leichtes (und der Standardfall), dass die Grafikkarte zu 99% ausgelastet wird.

Gesendet von meinem HTC 10 mit Tapatalk
 

Khabarak

BIOS-Overclocker(in)
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Grundsätzlich sollte es Ziel jeder Hardwareentwicklung sein, die vorhandenen Ressourcen zu 100% auszulasten. NVIDIA ist hier deutlich näher daran, die Shader zu 100% auszulasten, als AMD. Erkennt man daran, dass AMD-Karten deutliche Vorteile in Sachen Shaderleistung auf dem Papier haben, diese aber praktisch nie im Spiel zeigen können.


Ist es zum Glück nicht, denn das NVIDIA Design ist deutlich besser, weil es immer funktioniert, unabhängig davon, ob DX9, 10, 11, 12 oder auch Vulkan oder OpenGL. AMD benötigt dagegen mindestens DX12 für ASync und eben entsprechend angepasste Spiele.

Von weiteren Vorteilen wie z.B. der viel besseren Leistungsaufnahme von NVIDIA, sei da jetzt nur mal am Rande eingegangen.

Dir ist hoffentlich bewusst, dass Nvidia unglaublich viele Ressourcen in die Treiberentwicklung steckt und gerade spezielle Optimierungen direkt im Treiber abhandelt, anstelle sie bei den Spielestudios machen zu lassen.
Entsprechend der Größe des Treiber Teams können sie ihren Treiber auch so gestalten, dass sie für jede Schnittstelle in jedem Spiel passende Optimierungen einbauen, um ihre Shader Kerne auszulasten.
Das hat nur wenig mit dem Hardwaredesign zu tun.


Edit:
Ist halt dann eine Frage der Resourcen und Designphilosophie ob mam gleich versucht akle Features und volle Flexibilität in eine Architektur zu "quetschen" oder das Schrittweise macht, wenn der Markt es braucht.

Ersteres hat den Vorteil, dass man bereits Jahrelang Erfahrungen sammeln und Softwaee dafür entwickeln kann aber den Nachteil, dass man vermutlich ein unglaublich komplexes Design wie GCN erst verstehen muss und wenn wo Performanceprobleme bestehen diese langsam gefunden und behoben werden, sowie es wohl teurer ist diese Architektur zu optimieren bzw schwieriger bei knappen personellen Resourcen. Vermutlich braucht es dann auch mehr Transistoren als ein weniger flexibler Ansatz. Das würde erklären, warum man bei AMD immer deutlich mehr Transistoren und größere Chips als die Konkurrenz braucht um in Spielen (!) aufs gleiche Ergebnis zu kommen

Ps entschuldigt die Tippfehler bin am Handy

Der Markt "braucht" solche Flexibilität seit Jahren.
Allerdings hat DX11 sowas nicht zugelassen - entsprechend konnte es auch niemand in irgendeiner Form nutzen.
Erst mit GCN und dem recht mutigen Schritt, Mantle loszutreten, kam Bewegung in die Sache.

Genau wie Nvidia erst ihre Version der variablen Sync Implementierung bringen musste, bis der Rest der Banche mal reagiert hat und ein theoretisch schon existentes Feature in flexiblere Bahnen zu lenken udn als offiziellen VESA Standard zu veröffentlichen.
 
Zuletzt bearbeitet:

Sonnenkoenig

Gesperrt
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Wenn du dir die Spiele mal genau ansiehst, bemerkst du, dass Vega deutlich andere Optimierungen braucht, als Pascal - war schon immer so im Vergleich zwischen GCN und allen Nvidia Architekturen.
Bei Spielen, in denen Vega wirklich mal die Rechenleistung "auf die Straße" bringt, hat das Studio offensichtlich mehr Arbeit in die Optimierungen für beide Zweige gesteckt.
Das ist auch genau meine Aussage. Wenn man die Wahl zwischen Optimierungen hat, die in 99,99% der Spielen Vorteilen bringt (wie es NVIDIA primär macht) oder andere Optimierungen, die nur in 0,01% der optimierten Spiele, dann fällt meine Wahl auch auf die erste Option.
 

Sonnenkoenig

Gesperrt
AW: Wolfenstein 2 im ersten Technik-Test: Shooterfest, Technik-Granate, Vega-Stärke, Vulkan only!

Dir ist hoffentlich bewusst, dass Nvidia unglaublich viele Ressourcen in die Treiberentwicklung steckt und gerade spezielle Optimierungen direkt im Treiber abhandelt, anstelle sie bei den Spielestudios machen zu lassen.
Entsprechend der Größe des Treiber Teams können sie ihren Treiber auch so gestalten, dass sie für jede Schnittstelle in jedem Spiel passende Optimierungen einbauen, um ihre Shader Kerne auszulasten.
Das hat nur wenig mit dem Hardwaredesign zu tun.
Toll, was du NVIDIAs Treiberabteilung zutraust - aber dass sie 30% Rückstand in Sachen Rechenleistung aufholen, ohne, dass die Hardware da eine Rolle spielt, ist doch etwas übertrieben :)
 
Oben Unten