Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Also sonderlich gut skaliert die Engine ohne DX12 wohl nicht mit AMD-Hardware, wenn man bedenkt dass die Ergebnisse dank DX12 ~20% höher ausfallen als mit DX11. Die GTX 980 Ti ist unter DX11 ganze 30% schneller als eine Fury X, GTX 970 und RX 480 liegen unter DX11 gleich auf. Schade eigentlich, denn DX12 sollte eigentlich mehr Leistung bringen und nicht nur die mangelnde Optimierungsarbeit der Entwickler ausgleichen! :ugly:
Also in den benches die ich sehe, ist eine Referenz Fury-X 6% vor der Custom 980ti. Auch legt die Fury-X knapp 20% zu unter DX12. Also was auch immer du da gesehen haben möchtest, schaust du vielleicht nochmal genauer hin.
 
Zuletzt bearbeitet:
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Anhang anzeigen 939166

Schön zu sehen wie der Unterschied 4C/4T zu 4C/8T geringer ausfällt, als 4C/8T zu 6C/6T, bzw. 6C/6T besser performt als 4C/8T. Vielleicht für die User interessant, die ständig meinen das ein Hexa-Core erst was bringt, wenn die Anwendung/das Spiel mehr als die 8 "Threads" eines Quad-Cores mit HT nutzt. Virtuelle Kerne sind eben keine "echten"/vollwertigen Kerne.

Was ich etwas schade finde ist, das man hier lediglich einen Hexa-Core genommen hat. Mit einem zusätzlichen Quad-Core hätte man die potentiellen Vorteile der "größeren" Architektur besser erkennen können. Klar, für die Messung der reinen Kernskalierung ist es so natürlich besser. Aber der quasi doppelt so große Cache, die fast doppelt so hohe Bandbreite des Quad-Channel RAMs, all das hat eine "normale" 4C/8T bzw. Quad-Core (usw) CPU ja eigentlich nicht.


Die Steigerung von 4C/4T zu 4C/8T beträgt 5,858 %
Die Steigerung von 4C/8T zu 6C/6T beträgt 6,065 %

Ich verstehe zwar, dass du zeigen willst, dass mehr echte Kerne ohne SMT schneller sind, als weniger Kerne mit SMT. Aber das ist doch nicht überraschend. Genau das zeigt sich doch schon seit vielen Jahren zwischen i3 und i5, was man auch im Benchmark zwischen 2C/4T und 4C/4T sehr viel besser sehen kann, als in deinem Beispiel.

Warum das aber in dem Spiel hier ein Argument sein soll ist mir ein Rätsel. Weder SMT noch mehr als 4 echte Kerne werden ordentlich ausgenutzt. Wenn dann zeigt der Test, dass 4C/4T völlig ausreichen und der Gewinn durch 50% mehr Kerne und 200% mehr Threads in diesem Spiel vernachlässigbar ist. Dazu kommt, dass CPUs mit 4 Kernen meist euch deutlich höher Takten können, als die 6 Kerner, wodurch in der Praxis hier ein hochgetakteter 4-Kerner wahrscheinlich schneller ist, als ein niedriger getakteter 6-Kerner, wenn man an die Kühlung die gleichen Anforderungen stellt.
 
Zuletzt bearbeitet:
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Hat dein Leben jetzt keinen Sinn mehr, weil Nvidia Karten nicht so stark einbrechen wie erwartet oder was?

Wieso kommst du jetzt mit Nvidia? Schau dir doch mal die AMD R9 280X an. Sorry, aber du bist hier der Fanboy.


@Grestorn
Was Du schreibst ist doch Unsinn, du kannst doch nicht einen context switch einer CPU mit dem "full stop" einer nicht Asynchronous Compute fähigen GPU vergleichen. *kopfschüttel*

Und ich frage nochmal:
Aber wie kommt ihr auf: "Direct X 12 & Async Compute endlich mal richtig umgesetzt"?

Darf Hardware die Asynchronous Compute nicht oder nur unzureichend unterstützt nicht langsamer werden? Oder darf Hardware die Asynchronous Compute gut/sehr gut unterstützt davon nicht zu viel profitieren?
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Also in den benches die ich sehe, ist eine Referenz Fury-X 6% vor der Custom 980ti. Auch legt die Fury-X knapp 20% zu unter DX12. Also was auch immer du da gesehen haben möchtest, schaust du vielleicht nochmal genauer hin.

Was heist "Benches" die Du siehst?

Einzig und allein in 4K hat sie 2 min. FPS mehr und av sind es ganze gewaltige 0,2 FPS.
Aber Respekt, die Fury x kann unter DX12 und gleichzeitigem 4K in einem Spiel zur ti aufschließen.Das ist der Fingerzeig

Nvidia kann nichts dafür, dass die Fury x an der Kotzgrenze läuft, während bei der ti noch genügend Luft nach oben ist.
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Die Steigerung von 4C/4T zu 4C/8T beträgt 5,858 %
Die Steigerung von 4C/8T zu 6C/6T beträgt 6,065 %

Ich verstehe zwar, dass du zeigen willst, dass mehr echte Kerne ohne SMT schneller sind, als weniger Kerne mit SMT. Aber das ist doch nicht überraschend. Genau das zeigt sich doch schon seit vielen Jahren zwischen i3 und i5, was man auch im Benchmark zwischen 2C/4T und 4C/4T sehr viel besser sehen kann, als in deinem Beispiel.

Warum das aber in dem Spiel hier ein Argument sein soll ist mir ein Rätsel. Weder SMT noch mehr als 4 echte Kerne werden ordentlich ausgenutzt. Wenn dann zeigt der Test, dass 4C/4T völlig ausreichen und der Gewinn durch 50% mehr Kerne und 200% mehr Threads in diesem Spiel vernachlässigbar ist.

Nun dann schau dir mal dieses Verhältnis an: 4C/8T zu 6C/6T sind 6,065% Steigerung. Hier sieht man deutlich, dass 6 echte Kerne und damit auch nur 6 Threads mehr bringen als 8 Threads, die nur zur Hälfte aus echten Kernen generiert wird. Da es sich hier um ein und die selbe CPU handelt, kann man gut erkennen, dass echte Kerne nur durch mehr echte Kerne zu ersetzen sind und das SMT nicht so potent ist, wie viele gerne glauben.

Das ganze spielt auf Beitrag 9 aus diese Diskussion an: i7-5930k zu schwach für die 1080 GTX
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Anhang anzeigen 939166

Schön zu sehen wie der Unterschied 4C/4T zu 4C/8T geringer ausfällt, als 4C/8T zu 6C/6T, bzw. 6C/6T besser performt als 4C/8T. Vielleicht für die User interessant, die ständig meinen das ein Hexa-Core erst was bringt, wenn die Anwendung/das Spiel mehr als die 8 "Threads" eines Quad-Cores mit HT nutzt. Virtuelle Kerne sind eben keine "echten"/vollwertigen Kerne.

Was ich etwas schade finde ist, das man hier lediglich einen Hexa-Core genommen hat. Mit einem zusätzlichen Quad-Core hätte man die potentiellen Vorteile der "größeren" Architektur besser erkennen können. Klar, für die Messung der reinen Kernskalierung ist es so natürlich besser. Aber der quasi doppelt so große Cache, die fast doppelt so hohe Bandbreite des Quad-Channel RAMs, all das hat eine "normale" 4C/8T bzw. Quad-Core (usw) CPU ja eigentlich nicht.

Was außerdem bewiesen wird, dass SMT (ab einer gewissen Stufe) auch dafür sorgen kann, dass der Prozessor schelchter dasteht, als wenn SMT nicht genutzt wird. Auch wieder auf den 6 Kerner bezogen. Obwohl 0,5 FPS wahrscheinlich in die Messungenauigkeiten fallen.

Was das Game angeht: Ich freue mich schon drauf und ob DX11 oder DX12: Mit der GTX1080 in 1440P und einem i7-5820K bin ich auf alle Fälle auf der sicheren Seite. :D

Die Steigerung von 4C/4T zu 4C/8T beträgt 5,858 %
Die Steigerung von 4C/8T zu 6C/6T beträgt 6,065 %

Ich verstehe zwar, dass du zeigen willst, dass mehr echte Kerne ohne SMT schneller sind, als weniger Kerne mit SMT. Aber das ist doch nicht überraschend. Genau das zeigt sich doch schon seit vielen Jahren zwischen i3 und i5, was man auch im Benchmark zwischen 2C/4T und 4C/4T sehr viel besser sehen kann, als in deinem Beispiel.

Warum das aber in dem Spiel hier ein Argument sein soll ist mir ein Rätsel. Weder SMT noch mehr als 4 echte Kerne werden ordentlich ausgenutzt. Wenn dann zeigt der Test, dass 4C/4T völlig ausreichen und der Gewinn durch 50% mehr Kerne und 200% mehr Threads in diesem Spiel vernachlässigbar ist.

Aus Edelhamsters Link zu GameGPU
se4_intel.png

Ich freu mich, daß mein i3-6100 auch ausreicht, aber ein 8C/16T hat doch noch massive Leistungsreserven, gerade mit HT. So sollten auch Steaming, Teamspeak und andere Dinge die nebenher laufen, kaum Einfluß auf das Spiel haben. Mit meinem i3 wäre das kaum Möglich ;)
 
Zuletzt bearbeitet:
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Nun dann schau dir mal dieses Verhältnis an: 4C/8T zu 6C/6T sind 6,065% Steigerung. Hier sieht man deutlich, dass 6 echte Kerne und damit auch nur 6 Threads mehr bringen als 8 Threads, die nur zur Hälfte aus echten Kernen generiert wird. Da es sich hier um ein und die selbe CPU handelt, kann man gut erkennen, dass echte Kerne nur durch mehr echte Kerne zu ersetzen sind und das SMT nicht so potent ist, wie viele gerne glauben.

Das ganze spielt auf Beitrag 9 aus diese Diskussion an: i7-5930k zu schwach für die 1080 GTX

Ja aber wie gesagt, das ist doch nicht neues? i3 vs i5 anyone? Genau das gleiche. Hat jemals irgend wer behauptet, dass SMT genauso viel bringt, wie echte Kerne? Idr. sorgen 100% mehr Threads mit SMT für im Schnitt 25% mehr Leistung. Mal mehr, mal weniger.


Aus Edelhamsters Link zu GameGPU
Anhang anzeigen 939247

Ich freu mich, daß mein i3-6100 auch ausreicht, aber ein 8C/16T hat doch noch massive Leistungsreserven, gerade mit HT. So sollten auch Steaming, Teamspeak und andere Dinge die nebenher laufen, kaum Einfluß auf das Spiel haben. Mit meinem i3 wäre das kaum Möglich ;)

Na ja, wie viel CPU-leistung braucht TS und ein Musikstream? Zusammen 1-2%, während die CPU im idle auf 800 MHz runtertaktet... Selbst ein Videostream braucht GPU-decodiert gerade mal 2-3% CPU-last.
Für Windows und "Multitasking" sind mehr Kerne normalerweise total nutzlos. Da reicht im Grunde auch ein alter Celeron, solange man keine wirklich CPU intensiven Aufgaben ausführt wie Videoencoding, gleichzeitiges packen oder entpacken von Archiven, Datenbank abfragen usw.
 
Zuletzt bearbeitet:
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

- 480 in DX12 schneller als 1060
- 390 in DX12 schneller als 970
- Standard Fury X in DX12 so schnell wie Custom 980Ti (leider nur in hohen Auflösungen, aber dazu siehe unten!)
- AC bringt auf Geforces nichts.

Bis hierhin ein typisches DX12 Szenario.

Was verwundert:
- Wieso hängen die Radeons in FullHD selbst unter DX12 noch im CPU Limit?
- Wieso ist DX11 im CPU Bench sogar einen Tick schneller als DX12?

Bei all dem Lob ("endlich mal richtig umgesetzt") ... so 100%ig scheint DX12 auch in SE4 noch nicht implementiert zu sein. Mal sehen, ob die Game Ready Treiber hier noch was verändern.
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

@Raff
eventuell auch eine CPU Skalierung unter DX11?
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Eher nicht, aber ich behalte das mal auf der "Hinterkopf-Agenda". :-)

MfG,
Raff
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Also in den benches die ich sehe, ist eine Referenz Fury-X 6% vor der Custom 980ti.

Also bei gut spielbaren Framerraten wie Full HD ist die 980 Ti 18% vor der Fury X, nicht mal in 4K was eh unspielbar ist, kann sie sich irgendwo 6% absetzen.
Also wo siehst du 6%?
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

@Raff
Ok, danke. Wie siehts mit 'nem mixedGPU Test aus? :D
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

So sollten auch Steaming, Teamspeak und andere Dinge die nebenher laufen, kaum Einfluß auf das Spiel haben. Mit meinem i3 wäre das kaum Möglich ;)

Ich kann mit dem i3 6100 sogar Amazon Prime schauen, Teamspeak und Rust gleichzeitig geschmeidig laufen lassen. Vll geht die Leistung etwas runter, aber nicht spürbar. Probiers mal aus.
 
Zuletzt bearbeitet:
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

@Schaffe89
Schwer möglich, ich bin ausnahmslos Singelplayer (bis auf Trackmania mal für n Jahr)
Deswegen hat mir der i3 auch für eine mögliche 4 Jahres-Nutzung ausgereicht.
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Was heist "Benches" die Du siehst?

Einzig und allein in 4K hat sie 2 min. FPS mehr und av sind es ganze gewaltige 0,2 FPS.
Aber Respekt, die Fury x kann unter DX12 und gleichzeitigem 4K in einem Spiel zur ti aufschließen.Das ist der Fingerzeig

Nvidia kann nichts dafür, dass die Fury x an der Kotzgrenze läuft, während bei der ti noch genügend Luft nach oben ist.
Ach und wofür sind Karten dieser Preisklasse gemacht? Also ich persönlich bin zufrieden. AMD hat ja leider damals falsch geplant mit dem HBM der fury, weswegen sie bald ein halbes Jahr nach Plan erschien. Wo steht der damalige Gegner, die 780ti jetzt? Als sie dann kam, hat Nvidia schnell noch die 980ti gebracht (Also schneller als AMD), welche deshalb jetzt als Gegner herangezogen wird (AMD selbst Schuld). Dafür ist die Karte gerade mal so groß wie eine 970mini und das kann die 980ti nicht von sich behaupten. Also wenn man das bedenkt, steht sie mMn nicht schlecht dar. Die 980ti ist in FullHD natürlich schneller, das ist mMn aber nicht die angedachte Auflösung. Bei AMD jedenfalls, die damals ganz klar überall von 4K gesprochen haben (wird auch gern vergessen von bestimmten Leuten).
Ich freu mich natürlich, da ich sie ja für nur 260 bekommen hab und sie mit 1155MHz bei Standard Spannung komplett lautlos unter Wasser zu Werke geht.

Edit
Schaffe, da stimmt was nicht bei dir mit dem Browser (oder bei mir), vermute ich. Wenn du unter 2160p auf die min.fps der 980ti klickst, steht da 100% und bei der fury 106%.

Gesendet von meinem HTC 10 mit Tapatalk

https://uploads.tapatalk-cdn.com/20170213/fb7c54cedfaaa5faeb713074b91a036c.jpg
 
Zuletzt bearbeitet:
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Schaffe, da stimmt was nicht bei dir mit dem Browser (oder bei mir), vermute ich. Wenn du unter 2160p auf die min.fps der 980ti klickst, steht da 100% und bei der fury 106%.

Du pickst dir wirklich unspielbaren minimum FPS bei 4K heraus um einen Vorsprung der Fury X zu suggerieren? Alles klar.:ugly:

Dafür ist die Karte gerade mal so groß wie eine 970mini und das kann die 980ti nicht von sich behaupten. Also wenn man das bedenkt, steht sie mMn nicht schlecht dar.

Schonmal den Radiator mit eingebaut? Der ist jetzt nicht gerade winzig...

Die 980ti ist in FullHD natürlich schneller, das ist mMn aber nicht die angedachte Auflösung.

Als ob in 4K noch was flüssig laufen würde, was du machst ist Erbsenzählerei und Kirschen picken.

Bei AMD jedenfalls, die damals ganz klar überall von 4K gesprochen haben (wird auch gern vergessen von bestimmten Leuten).

Wen interessierts, heute ist die Karte nurnoch für Full HD geeignet von den Frames her, oder willst du mit 30 FPS in 4K zocken?
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

IFTFY: Die um 20-22% übertaktete Custom GTX 980 Ti (Referenz GTX 980 Ti im geschlossenen PC-Gehäuse laut CB bei 1100-1115 MHz) ist unter DX11 ganze 30% schneller als eine Referenz Fury X mit Standardtaktraten. Unter DX12 ist der Vorsprung noch knapp 14%, bei immer noch 20-22% Übertaktung.

Schau dir bitte mal die Leistung von den anderen Modellen an. Eine übertaktete RX 480 sollte (auch bei DX11!) mit einer übertakteten GTX 1060 mithalten können. Hier ist aber die GTX 1060 15-20% schneller (basierend auf der Pascal-Skalierung DX11 zu DX12)! Das ist keine Glanzleistung, sondern verweist auf schlechte Optimierung.
 
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

@Grestorn
Was Du schreibst ist doch Unsinn, du kannst doch nicht einen context switch einer CPU mit dem "full stop" einer nicht Asynchronous Compute fähigen GPU vergleichen. *kopfschüttel*
Es gibt keinen "Full Stop".

Wenn es Dich wirklich interessiert, was AC - ein reiner Marketing-Begriff übrigens - eigentlich ist, dann empfehle ich Dir diese Lektüre: Demystifying Asynchronous Compute : nvidia

Ausschnitt aus dem Artikel:

"So if we stop using the term asynchronous compute and focus on multi-engine all our lives would be much more pleasant, DX12 only requires you to have those "engines" and their queues exposed. It places no requirements whatsoever on how the independent command streams are executed; "Async Shaders" and "Dynamic Load Balancing" are just marketing terms used to introduce new features I guess, and frankly it's unusual for such a profoundly architecture-intimate feature to be propelled to the forefront of a marketing campaign.
GCN has one geometry engine and one rasterizer in each Shader Engine (usually 9 CUs). NVIDIA employs a geometry engine per SM and rasterizers shared by all SMs in a GPC ( 4 or 5). The balance of resources is radically different."
 
Zuletzt bearbeitet:
AW: Sniper Elite 4 im Test: Direct X 12 & Async Compute endlich mal richtig umgesetzt

Irgendwie ruckelt das Video ein bisschen. Mit welche Karte habt ihr das Video gemacht.
 
Zurück