Eigene Analyse: Mantle VS DX11

uk3k

Software-Overclocker(in)
Hab heute mal Interesse halber eigene Benchmarks mit BF4 angefertigt, das Ergebnis überascht eigentlich nicht, dafür jedoch eine ganz andere Erkenntis.

Spiel:
Battlefield 4 Patch Stand 03.04.2014
5760x1080; Ultra-Preset

System:
Siehe Signatur; Catalyst 14.2 Beta 2; Treiber Default

Gebencht wurden folgende Kombinationen je einmal mit DX11 und einmal mit Mantle:
3.2 GHz ohne SMT + 1000MHz GPU Takt
3.2 GHz ohne SMT + 1100MHz GPU Takt
4.0 GHz ohne SMT + 1000MHz GPU Takt
4.0 GHz ohne SMT + 1100MHz GPU Takt
4.0 GHz mit SMT + 1000MHz GPU Takt
4.0 GHz mit SMT + 1100MHz GPU Takt

Benchmarkszene:
Leerer 32 Slot Server, Karte Golf of Oman, immer ca 60s nach Mapstart.
Spawn im Russischen Havok, Innenansicht, Start auf ca. 50m Höhe, in der Höhe bleibend Flug über "F" > "C" > "US Base" und wieder zurück.

Datenerfassung beide Renderpfade:
Consolen-Tool perfoverlay.framefilelogenable 1

Berechnung Durchschnitts-FPS:
Anzahl Ergebnisse / (Summe Ergebniswerte/1000)

Berechnung Durchschnitt Frametimes:
Summer Ergebniswerte / Anzahl Ergebnisse

Da meine Ergebnisse selbst bei "nur" 3.2GHz ohne SMT von denen bei 4.0GHz + SMT innerhalb der Messtoleranz abweichen mach ichs kurz:
GPU @ 1000MHz:
DX11: 57,28 FPS | avg. Frametime: 17,46ms
Mantle: 61,66 FPS | avg. Frametime: 16,22ms

GPU @ 1100MHz:
DX11: 60,78 FPS | avg. Frametime: 16,45ms
Mantle: 66,22 FPS | avg. Frametime: 15,10ms

Bis hier hin folgere ich aus den Ergebnissen (natürlich nur auf einem leeren Server):
Selbst wenn der i7 3930k auf 3.2GHz ohne SMT oder Turbo läuft, steckt man mit 2 R9 290 noch im GPU-Limit. Das Spricht auf alle Fälle für die Leistung der CPU. Darüber hinaus, bringt Mantle bei nicht ausgelastetem Prozessor nur magere 3,5% Mehrleistung. Darüber hinaus stemmen beide R9 290 Online-Shooter-taugliche Bildraten, selbst bei 3x FullHD-Auflösung.

Wie bereits nicht nur ich festgestellt habe, liegen die angezeigten FPS beim Spielen mit der Mantle-API meistens unter denen der DX-API. Jedoch behaupten alle Benchmarks etwas gegenteiliges. Selbst wenn man die absoluten Durchschnittswerte der einzeln ermittelten Frames betrachtet, liegen die Frametimes mit Mantle immer unter denen von DX11, was logischerweise auch in durchschnittlich höheren FPS resultiert:
Kürzere Berechnungsdauer >> Mehr Bilder pro Sekunde

Ich habe mir nun mal die Mühe gemacht und "grobe" Frametime-Diagramme aus meinen Messwerten angelegt, dabei ist mir nun endlich des Rätsels Lösung offenbar geworden:
Wenn man die Frameverläufe beider APIs vergleicht, sieht man dass DirectX über lange Zeitspannen hinweg sogar deutlich niedrigere Framelaufzeiten als Mantle hat, jedoch auch sehr viele Spikes mit extrem hohen Framezeiten.
Diese "Ausreiser" zählen nun logischerweise mit in den Durchschnitt hinein, was zur Folge hat, dass DirectX am Ende weniger Durchschnitts-FPS liefert obwohl die absolute Framerate während des Benchmark oder eben dem Spielen meistens höher als bei Mantle ist.

Bei Mantle hingegen ist der Frameverlauf sehr gleichmäßig, jedoch liegt das Grundniveau viel höher und dank der fehlenden Spikes ergibt sich am Ende eine im Durchnitt niedrigere Framelaufzeit und somit höhere Durchnitts-FPS.

€: Anders Ausgedrückt: Mantle liefert eigentlich gar nicht mehr FPS, sondern nur stabilere Bildraten was durch die gängigen Messverfahren in einem besseren Ergebnis resultiert :D

Zur Veranschaulichung:
001_Frametimes_DX11_1000MHz_3.2GHz.png 002_Frametimes_Mantle_1000MHz_3.2GHz.png 011_Frametimes_DX11_1100MHz_4GHz_SMT.png 012_Frametimes_Mantle_1100MHz_4GHz_SMT.png

Ob dieses Phänomen nur Multi-GPU-Systeme betrifft weiss ich nicht genau, auf alle Fälle fällt es da dank eh schlechter Framesynchronisation eher auf als bei Single-GPUs. Wenn jemand mag kann er ja gerne eine ähnliche Auswertung mit einer einzelnen GPU fahren. Vielleicht auch PCGH? Natürlich wären Ergebnisse auf einem randvollen Server auch spannend, jedoch finde ich, lässt sich das sehr schlecht reproduzieren :-)

Warscheinlich erzähl ich hier niemandem etwas wirklich neues, jedoch ist mir das Thema in der Art und Weise betrachtet noch nicht über den Weg gelaufen. Falls ich völligen Bullshit zusammengereimt hab, bin ich natürlich über Korrekturen erfreut :-)

Wer Interesse hat, meine kompletten Ergebnisse und Unterlagen im Anhang als Zip Datei.

€2: Im Text vergessen: Vom früher vorhandenen und nach wie vor oft verdächtigten SMT-Bug bin ich ganz offensichtlich nicht betroffen :-)

mfg
 

Anhänge

  • Vergleich_Mantle_DX11.zip
    802,3 KB · Aufrufe: 6
Zuletzt bearbeitet:
Hi, warum hast Du den Catalyst 14.2 Beta 2 genommen ? Es gibt doch schon den Catalyst 14.3 Beta 1.0 .

Mfg Elrom81
 
Leerer Server mit extrem hoher Auflösung = viel gpu Last, kaum CPU Last
Hauptsächlicher Sinn von mantle = CPU entlasten
Ergo mit deinem Benchmark war kein anderes Ergebnis zu erwarten mantle bringt viel wenn die CPU ins Limit läuft und dass verhinderst du durch einen leeren Server und extremer auflösung
 
Ja, das stimmt allerdings. Man könnte das gleiche Szenario noch einmal mit höherer CPU-Last durchlaufen. Der eigene Test von Mantle in einer privaten Umgebung ist dennoch eine gute Idee. :daumen:
 
Hi, warum hast Du den Catalyst 14.2 Beta 2 genommen ? Es gibt doch schon den Catalyst 14.3 Beta 1.0 .

Mfg Elrom81

Weil mir der Changelog zu mau ist um ein Upgrade durchzuführen bzw. mich die Sache mit der zweiten GPU die nicht in Idle geht abhält...
Feature Highlights of The AMD Catalyst™ 14.3 Beta V1.0 Driver for Windows®
BattleField 4: V-sync issues observed on CrossFire configurations (with Mantle enabled) have been resolved

Known Issues
Secondary GPUs do not enter low power state on CrossFire configurations; this issue will be addressed in the next AMD Catalyst beta release
Battlefield 4 (DirectX): Quad CrossFire configurations with Eyefinity Display configurations suffer slowdowns and stability issues

Leerer Server mit extrem hoher Auflösung = viel gpu Last, kaum CPU Last
Hauptsächlicher Sinn von mantle = CPU entlasten
Ergo mit deinem Benchmark war kein anderes Ergebnis zu erwarten mantle bringt viel wenn die CPU ins Limit läuft und dass verhinderst du durch einen leeren Server und extremer auflösung

Ist mir komplett bekannt, an der Stelle war das eigentlich auch noch ein Feldversuch, wie weit ich mitm CPU-Takt runter kann ohne dass sie bremst :-)
Davon mal ab, bringt Mantle trotz der in diesem Szenario überdimensionierten CPU reproduzierbar Mehrleistung, stellt also quasi den Worst-Case für Mantle dar.
Der Benefit würde natürlich größer ausfallen wenn die CPU mehr zu tun hätte.

Ja, das stimmt allerdings. Man könnte das gleiche Szenario noch einmal mit höherer CPU-Last durchlaufen. Der eigene Test von Mantle in einer privaten Umgebung ist dennoch eine gute Idee. :daumen:

Das ist aber kaum reproduzierbar! Wenns so einfach wäre, würde ich auf nem randvollen 64 Slot Server benchen, da hat man aber jedesmal nen anderen Spawnpunkt, die Map und somit Anforderung an die Graka ändert sich ständig und dann wird man noch permanent erschossen^^ Ma könnte vll mit Prime95 oder so n bisschen mehr "Grundlast" erzeugen :D

Um das mal noch klar zustellen:

Ich finde die Idee von AMD toll, das soll weiss Gott kein Anti-Mantle-Thread sein!!! und es geht nicht um die reinen (FPS-)Benchmarkergebnisse

Mich hat interessiert, warum ich unter identischen Voraussetzungen mit Mantle weniger FPS im Game angezeigt bekomme, obwohl ALLE Benchmarks dagegen sprechen. Ich glaube ich habe den Grund gefunden und will meine Erkenntnis teilen und ggf. darüber diskutieren.

Am Ende ist mein persönliches Fazit sogar positiv obwohl Mantle nachweisbar sogar weniger absolute Leistung, aber dafür viel konstantere Bildraten bringt. Und stabile Bildraten ohne FPS-Drops sind abseits von Balkenvergleichen meiner Meinung nach sogar der größere Gewinn für den Spieler!

mfg
 
Ja von Mantle profitieren defintiv alle überhaupt jetzt wo MS auch nachzieht. schaut im moment danach aus als ob wir noch lange mit unseren CPU´s das auslangen finden
Die konstanteren Frameraten kommen sicher von der CPU entlastung. Hab da irgendwo einen interessanten Benchmark gesehen mit Thief wo ein 4770 glaube ich wars mit 3,4Ghz DX genauso viele FPS ausgespuckt hat wie mit Mantle @2Ghz.
Da muss man sich wohl in Zukunft nur mehr eine neue CPU kaufen weil man es so will:-)
 
Zurück