Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Es gibt keinen "Full Stop".

Wenn es Dich wirklich interessiert, was AC - ein reiner Marketing-Begriff übrigens - eigentlich ist, dann empfehle ich Dir diese Lektüre: Demystifying Asynchronous Compute : nvidia
Vorsicht, da ist groß und breit das Nvidia Logo zu sehen. Mal sehen wann die ersten "Fake!" Rufe kommen ;)
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Die Steigerung von 4C/4T zu 4C/8T beträgt 5,858 %
Die Steigerung von 4C/8T zu 6C/6T beträgt 6,065 %
Ich verstehe zwar, dass du zeigen willst, dass mehr echte Kerne ohne SMT schneller sind, als weniger Kerne mit SMT.
Genau. Ich wollte primär nur erwähnen, das hier 6C/6T schneller sind als 4C/8T, und das man daran sehen kann, das "virtuelle Kerne" eben keine echten Kerne sind. Denn genau damit argumentieren viele User, wenn sie sagen, "ein Hexa-/Octa-Core macht erst dann Sinn, wenn die 8T des Quad-Cores ausgelastet sind/nicht mehr reichen". Das lese ich regelmäßig im Netz. Und genau das ist nicht korrekt.

Wenn dann zeigt der Test, dass 4C/4T völlig ausreichen und der Gewinn durch 50% mehr Kerne und 200% mehr Threads in diesem Spiel vernachlässigbar ist.
Und genau deswegen habe ich darauf hingewiesen, das hier alle simulierten CPUs auf einem Sockel 2011 Hexa-Core basieren. Die "simulierten" CPUs hier (da auf dem Sockel 2011 simuliert) also alle den min. doppelt so großen CPU-Cache (verglichen mit einem Quad-Core!) des Hexas nutzen, ebenso wie die fast doppelt so hohe RAM-Bandbreite vom Quad-Channel Interface. Ohne einen "echten" Quad-Core in dem Benchmark kann man also gar nicht sagen, wieviel ein Sockel 1151 Quad-Core langsamer wäre, als der simulierte Hexa-Quad-Core. Hier geht es rein um die Kernskalierung, und die läßt sich so nicht 1:1 auf den Sockel 1151 übertragen (aber genau das tun viele User jetzt gerade!).

Und natürlich weiß der informierte User, das virtuelle Kerne nur einen Teil der Performance erreichen, die echte Kerne leisten können. Aber da in entsprechenden Tests/Reviews (egal ob SW oder HW/CPUs) immer nur von "Threads" gesprochen wird, und ein Quad-Core mit HT derer nunmal 8 abarbeiten kann, denken viele User das ein 4C/8T in einer Anwendung/einem Spiel, das zb. 6 o. 8 "Threads" nutzt, den gleichen Vorteil daraus zieht, wie ein 6C/12T bzw. 8C/16T. Und das ist falsch.

Darum ging es mir.^^
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Du pickst dir wirklich unspielbaren minimum FPS bei 4K heraus um einen Vorsprung der Fury X zu suggerieren? Alles klar.:ugly:



Schonmal den Radiator mit eingebaut? Der ist jetzt nicht gerade winzig...



Als ob in 4K noch was flüssig laufen würde, was du machst ist Erbsenzählerei und Kirschen picken.



Wen interessierts, heute ist die Karte nurnoch für Full HD geeignet von den Frames her, oder willst du mit 30 FPS in 4K zocken?

Ja, allerdings, da ich eigentlich immer mit Vsync spiele. Genau deshalb ist das auch keine Kirschenpickerei, sondern Realität. Ich hab seit ende 2011 einen 1440p Monitor genutzt und seit geraumer Zeit einen 2160p, willst du mir das etwa verbieten? Andersherum könnte man dir das mit den Kirschen bei der 980ti vorwerfen, mach ich aber nicht. Ich kann doch nichts dafür, dass du scheinbar unter 60fps nichts triffst. Immer fleißig üben, würde ich sagen.

Was das mit dem Radi angeht, der sitzt doch idR dort hinter der CPU wo eh fast immer ein Lüfter sitzt, nimmt also dann keinen extra Platz weg. Das ist kein besonders gutes Argument. Allerdings Geschmackssache. Ändert aber trotzdem nichts daran dass sie die gesehene Leistung eben aus dieser kleinen Platine presst. Eine 980ti mini hab ich noch nicht gesehen und 970 und 980 sind schwächer. Also von meinem Standpunkt aus schon ein feines Stück Hardware.
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Ja, allerdings, da ich eigentlich immer mit Vsync spiele. Genau deshalb ist das auch keine Kirschenpickerei, sondern Realität.

30 FPS V-sync finde ich jetzt aber nicht besonders knackig.:schief:
Alleine schon dass du dir den einzigen Wert heraussuchst wo die Fury besser dasteht und dann auch noch die Minimum FPS die nur ein einziges mal kurz anliegen.
Das ist der Inbegriff von cherry picking dabei ist die 980 Ti in allen spielbaren AUflösungs Bereichen recht klar vorraus.

Ich hab seit ende 2011 einen 1440p Monitor genutzt und seit geraumer Zeit einen 2160p, willst du mir das etwa verbieten?

Ich dachte wir diskutieren um die Frameraten und die Leistung der Karte in diesem Game.
Wenn du über Verbote übers Internet reden willst und dich da bedrängt fühlst, solltest du vielleicht nen Seelsorgethread im Politikforum aufmachen.
Was das mit dem Radi angeht, der sitzt doch idR dort hinter der CPU wo eh fast immer ein Lüfter sitzt, nimmt also dann keinen extra Platz weg. Das ist kein besonders gutes Argument. Allerdings Geschmackssache

Natürlich, klar. Du kommst mit dem Vorteil der möglichst kleinen Fury X an und siehst dann nicht ein, wieso der fette Radiator überhaupt platzmäßig zur Diskussion steht.:schief:
Lass es einfach gut sein.
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Genau so eine Antwort habe ich erwartet! Ich suche mir (so wie du vermutlich) genau die Auflösung raus, in der ich spiele.
Gehst du auch in einen Baumarkt und machst Hämmer nieder, weil sie nicht so gut Nägel herausbekommen wie ein Nageleisen? AMD hat damals mit 4K geworben und ich nutze diese Auflösung, also bewerte ich auch genau diese. Jetzt kommst du daher und meinst wenn ich meine Monitorauflösung nutze, und die Karte genau für das einsetze, wofür AMD sie angedacht hat, dann wäre das cherrypicking?

Ich fasse zusammen: Ich soll meine Auflösung nicht bewerten, du willst mir aber nichts verbieten... Finde den Fehler!

Der Radi ist natürlich da und das bestreite ich auch nicht. Jedoch hat AMD freundlicherweise ein Format gewählt, dass in fast jedem Gehäuse der letzten 10 Jahre, ohne Probleme unterzubringen ist und damit keines besonderen Platzes bedarf.

Edit
Sonst nimm halt die Nano@1000MHz als Vergleich. Dann brauchst du dir den Radi nicht wegdenken. Ist dir das angenehmer? Das mit der Größe war doch letztlich nur nebensächlich.

Gesendet von meinem HTC 10 mit Tapatalk
 
Zuletzt bearbeitet:
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Es gibt keinen "Full Stop".
Unter Maxwell ist es sehr wohl ein "Full Stop" und Pascal kann Asynchronous Compute nur unter "hätte wäre wenn" Bedingungen -also eher schlecht.
Sniper Elite 4 nutzt jetzt Asynchronous Compute höchstens für 0,5-1% wobei es ein Genre wäre welches locker bei 10-15% Asynchronous Compute Nutzung liegen sollte.
Ich bin mir sicher wir werden die Tage genauer sehen für was und wie viel Asynchronous Compute bei dem Game genutzt wird.*wink*
Aber eins ist ja wohl jedem klar,es wird verdammt wenig sein => Checklist Feature.

Aber nochmal:
Warum meint PCGH das dieses Spiel "Async Compute endlich mal richtig umgesetzt" ? Wer weiß es? Wie wurde das festgestellt?
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Puh... wenn ich die Performance aller Grafikkarten hier in 1080P sehe, dann bin ich schon etwas verwundert.
Seit Jahren schreiben hier einige, dass Karten wie die GTX 780ti / 970 / R9 290 /390 und Pendants für FHD mit vollen Details mehr als ausreichend für flüssiges Gaming (60 FPS) sind und alles darüber "überdimensioniert", weil eher für WQHD gedacht.

Und dieses Spiel beweist nun, dass selbst aktuelle Karten wie die RX 480 und GTX 1060 6G ihre Probleme haben, die 60 FPS Minimum zu halten, oder diese in der Spitze überhaupt zu erreichen!

Und in WQHD reichen dafür dann alle Karten nicht mehr aus - nicht einmal die GTX 1070.

Das Spiel ist ja nun nicht gerade die allerschönste Augenweide, die man jemals gesehen hat - aber woran liegt das? Am noch nicht finalen Produkt? An nicht optimaler Programmierung?
Sind Grafikkarten ab 400 € aufwärts doch nicht genug, wenn man WQHD und volle Details bei 60 FPS sehen möchte?
Sorry, aber irgendwie muss es ja einen Grund haben, warum die meisten hier immer noch mit 1080P unterwegs sind - die Grafikkarten für mehr Leistung sind einfach viel zu teuer für den optischen Zugewinn.
Hier und da schafft man es, ein Spiel wenigstens per Downsampling auch auf FHD noch schöner aussehen zu lassen, aber im Falle dieses Spiels reicht ja nicht einmal eine GTX 1070 dafür aus und mit den älteren Karten vom Schlage einer R9 390 oder GTX 970 hat man schon in 1080P mehr als nur Probleme, wenn man die Details nicht reduziert.
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Es gibt keinen "Full Stop".

Wenn es Dich wirklich interessiert, was AC - ein reiner Marketing-Begriff übrigens - eigentlich ist, dann empfehle ich Dir diese Lektüre: Demystifying Asynchronous Compute : nvidia

Ausschnitt aus dem Artikel:

"So if we stop using the term asynchronous compute and focus on multi-engine all our lives would be much more pleasant, DX12 only requires you to have those "engines" and their queues exposed. It places no requirements whatsoever on how the independent command streams are executed; "Async Shaders" and "Dynamic Load Balancing" are just marketing terms used to introduce new features I guess, and frankly it's unusual for such a profoundly architecture-intimate feature to be propelled to the forefront of a marketing campaign.
GCN has one geometry engine and one rasterizer in each Shader Engine (usually 9 CUs). NVIDIA employs a geometry engine per SM and rasterizers shared by all SMs in a GPC ( 4 or 5). The balance of resources is radically different."


Sehr informativ. Danke für den Link.

Ich verstehe zwar ehrlich gesagt nicht sehr viel davon, aber aus dem Thread geht ganz klar hervor, dass AMD versucht, Async Compute bis zum geht nicht mehr zu pushen, was ja offensichtlich ist, obwohl nvidia ähnliche Funktionen bietet und sogar abseits davon noch sehr viel attraktivere und vielversprechendere DX12 Funktionen bietet als AMD.

Für mich ist es schwer, das ganze richtig zu gewichten (AMD *******, Nvidia *******?) weil ich die Relevanz und die Auswirkungen der gebotenen Funktionen überhaupt nicht einschätzen kann. Aber wie immer wird die Wahrheit wohl irgendwo dazwischen liegen.

Auf jeden Fall sollte man von Async Compute niemals auf die allgemeine DX12 performance einer GPU schließen. Ließt man hier im Forum könnte mein meinen, Async Compute wäre das in der Praxis einzig wirklich relevante DX12 Feature abseits von geringerem CPU overhead. Und der Meinung war ich bis eben auch.


Festhalten kann man wohl, dass das Thema für die meisten Leute einfach zu komplex ist bzw. zu viel Hintergrundwissen erfordert, als dass man sich anhand einiger simpler Benchmarks von unausgereiften DX12 gehversuchen ein aussagekräftiges Urteil über den DX12 support einer GPU bilden könnte.
 
Zuletzt bearbeitet:
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

War DirectX denn bisher nicht ein einziges Krebsgeschwür?:schief:

Ich meine, eine ineffektive, CPU-limitere Schnittstellenbibliothek, die ohne enormen Programmieraufwand, kaum auszureizen war?
Seit Vulkan gezeigt hat, wie stark die Rechenleistung von Grafikkarten bei Computerspielen eigentlich brach liegt, kann es eigentlich doch nur besser werden.:schief:
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

War DirectX denn bisher nicht ein einziges Krebsgeschwür?:schief:

Ich meine, eine ineffektive, CPU-limitere Schnittstellenbibliothek, die ohne enormen Programmieraufwand, kaum auszureizen war?
Seit Vulkan gezeigt hat, wie stark die Rechenleistung von Grafikkarten bei Computerspielen eigentlich brach liegt, kann es eigentlich doch nur besser werden.:schief:

Wo zeigt Vulkan das denn? Gibts da Beispiele?

Das einzig große Vulkan Game ist doch DOOM 2016. Und da heißt es nicht DirectX vs Vulkan sondern OpenGL vs Vulkan. Das Spiel besitzt keinen DirectX renderer.
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Es gibt keinen "Full Stop".
Doch, kann man schon so sagen, bis Maxwell auf jeden Fall. Ebenfalls aus deinem Reddit-Artikel (der übrigens in der Tat sehr informativ ist):

On Maxwell what would happen is Task A is assigned to 8 SMs such that execution time is 1.25ms and the FFU does not stall the SMs at all. Simple, right? However we now have 20% of our SMs going unused.So we assign task B to those 2 SMs which will complete it in 1.5ms, in parallel with Task A's execution on the other 8 SMs.
Here is the problem; when Task A completes Task B will still have 0.25ms to go, and on Maxwell there's no way of reassigning those 8 SMs before Task B completes.
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Unter Maxwell ist es sehr wohl ein "Full Stop" und Pascal kann Asynchronous Compute nur unter "hätte wäre wenn" Bedingungen -also eher schlecht.

Nein, Du hast es nicht im Ansatz verstanden. Lies doch einfach den Artikel, ok?

Sniper Elite 4 nutzt jetzt Asynchronous Compute höchstens für 0,5-1% wobei es ein Genre wäre welches locker bei 10-15% Asynchronous Compute Nutzung liegen sollte.
Ich bin mir sicher wir werden die Tage genauer sehen für was und wie viel Asynchronous Compute bei dem Game genutzt wird.*wink*
Aber eins ist ja wohl jedem klar,es wird verdammt wenig sein => Checklist Feature.

Wenn Du weiter wartest auf die Real-World Spiele, bei denen "Async Compute" generell und nicht nur in Extremfällen nennenswert mehr als nur 10% Performance-Gewinn bringen, dann wirst Du vermutlich sehr lange warten müssen.

War DirectX denn bisher nicht ein einziges Krebsgeschwür?:schief:

Ich meine, eine ineffektive, CPU-limitere Schnittstellenbibliothek, die ohne enormen Programmieraufwand, kaum auszureizen war?
Seit Vulkan gezeigt hat, wie stark die Rechenleistung von Grafikkarten bei Computerspielen eigentlich brach liegt, kann es eigentlich doch nur besser werden.:schief:

Vulkan hat insbesondere bei genau EINEM Spiel richtig reingehaun, und dort nicht im Vergleich zu Direct X sondern zu OpenGL - und das auch nur auf AMD, weil deren OpenGL schlicht außerordentlich schwach ist.
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

...
Auf jeden Fall sollte man von Async Compute niemals auf die allgemeine DX12 performance einer GPU schließen. Ließt man hier im Forum könnte mein meinen, Async Compute wäre das in der Praxis einzig wirklich relevante DX12 Feature abseits von geringerem CPU overhead. Und der Meinung war ich bis eben auch.
...
Naja, von geringererm CPU Overhead kann man bei diesem Spiel nun nicht unbedingt schreiben, zumindest nicht bei Nvidia. *wink*
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Ich meinte Mantle, jetzt fällt es mir wieder ein.:ugly::klatsch:

Wie gesagt, DirectX hat Grafikhardware doch noch nie sinnvoll ausgereizt. :schief:
Ausgliefert auf einem kostenpflichten Virus von Betriebssystem (Windows), ausgelegt für eine Plattform mit hunderten verschiedenen Rechnerkonfiguraitonen.

Selbst Spiele wie Crysis kratzten doch nur an der Oberfläche, was möglich gewesen wäre. Und OpenGL hat schon 2004 gezeigt, was so alles bei direkterer Programmierung möglich ist (Doom 3 hatte ein deutlich geringeres CPU-Limit als Far Cry, und TCoR war das mMn bestaussehendste Spiel damals).
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Doch, kann man schon so sagen, bis Maxwell auf jeden Fall. Ebenfalls aus deinem Reddit-Artikel (der übrigens in der Tat sehr informativ ist):

Das ist immer noch kein Full Stop sondern bedeutet nur, dass in diesem Beispiel 2 SM einige Zentel ms brach liegen. Und wie der Treiber die Tasks auf die SM aufteilt ist - wenn ich das richtig verstanden habe - immer noch Sache des Treibers.

Das AMD GCN 2 mehr aus den DX 12 "Multi-Engines" rausholen kann, hat nie jemand bestritten. Die falsche Aussage von openSuse war, dass Maxwell durch optimal implementiertes "AC" immer deutlich langsamer werden müsste, was schlicht quatsch ist.
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Nein, Du hast es nicht im Ansatz verstanden. Lies doch einfach den Artikel, ok?
Artikel? Du meinst Nvidias Selbstdarstellung? *lach*

Aber mal was für dich.
https://www.reddit.com/r/Amd/comments/4skgy1/async_compute_lots_of_misunderstanding_in_the/
A lot of talk around Async Compute is very misleading. To developers, it's not even about fully utilizing shaders at all, because such a focus will result in no gains on GPUs which have less shaders (as individually, the shaders are better utilized).
Think of DX12 & Vulkan as a Multi-Engine API that fully access GPUs sub-units. GPUs have various units, you may know these from reading reviews with diagrams, Shaders, Rasterizers (ROPs) and DMAs (Direct Memory Access units to stream data). In serial API like DX11 and older, if you run work on Shaders, you cannot run work on Rasterizers or DMA at the same time. Likewise if you stream assets from memory to prepare a frame, you can't run Shaders or Rasterizer. Yes, it's that stupid if you think about it, but it was the way things were done, one step at a time.
There's a much better explanation that what I can come up with here in this video:
Asynchronous Compute in DX12 & Vulkan: Dispelling Myths & Misconceptions Concurrently - YouTube
^ The sources in this video come from various IHVs (AMD ofc, Sony and Microsoft) and developers. It should explain what Async Compute is all about, it certainly helped me understand it better.
We often see devs on consoles hype up Async Compute, seeing major gains for them, but you all know console hardware is very low shader count. Console API also are fully multi-threaded and so shader utilization isn't an issue.
Likewise, with Vulkan in Doom on the RX 480 and even older GCN like Tahiti 7970/280X seeing massive gains, these lower shader-count GCN would get little gains if Async Compute was only about shader utilization.
Ultimately, think of it as a Multi-Engine API, tapping the Shaders, Rasterizers and DMAs simultaneously in parallel.
Asynchronous Compute in DX12 & Vulkan: Dispelling Myths & Misconceptions Concurrently - YouTube
 
Ok, openSUSE, und jetzt zeigst Du uns bitte noch auf, wo der Artikel (der nicht von nVidia ist) dem AMD Werbevideo widerspricht. Und dann sind wir alle happy.

Wie gesagt, DirectX hat Grafikhardware doch noch nie sinnvoll ausgereizt. :schief:

Wie kommst Du zu dieser Aussage? Dann dürfte es ja unter DX niemals GPU Limitierung geben.

Korrekt ist, dass DX (speziell 11 und älter) einige Flaschenhälse hat (DrawCalls) auf die der eine Treiber kritischer reagiert als der andere. Nicht mehr und nicht weniger.
 
Zuletzt bearbeitet von einem Moderator:
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Warum sollte ich nicht zu dieser Aussage kommen?:schief:

DirectX bis Version 11 war doch immer ziemlich indirekt, was die Grafikprogrammierung angeht. Das war ja der Kernanstoß von Mantle, direkterer Zugriff auf die Hardware, weniger CPU-Limitierung.

Was hat denn DirectX bisher je groß richtig gemacht?
Eine proprietäre Schnittstelle für ein kostenpflichtiges Betriebssystem von einem Hersteller, dem der Spiele-PC in den letzten 15 Jahren mehr oder weniger scheißegal war?:schief:
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Warum sollte ich nicht zu dieser Aussage kommen?:schief:
"nicht ausreizen" bedeutet, dass Kapazität der GPUs brachliegt. Und diese Aussage halte ich einfach mal für falsch.

DirectX bis Version 11 war doch immer ziemlich indirekt, was die Grafikprogrammierung angeht. Das war ja der Kernanstoß von Mantle, direkterer Zugriff auf die Hardware, weniger CPU-Limitierung.
Wenn ein Spiel an der CPU hängt, kann das helfen, klar. Wenn ein Spiel nicht an der CPU hängt eben nicht.
 
Zurück