3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute

AW: 3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute

Und wiedermal schlägt die Aluhut-Fraktion durch....ich kanns nicht mehr hören.
 
AW: 3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute

Was kannst du nicht mehr hören?
 
AW: 3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute

meine karte taktet mit 961mhz in dem benchmark ansonnsten 2025-2100mhz. schaffte nur am 1. tag einen run mit 6220 gpu score. ansonnstem immer die gleichen probleme
 
AW: 3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute

Koennte auch einfach in der Natur des Benchmarks liegen das der mit AC überdurchschnittlich performt auch wenn in der Praxis davon dann je nach Hardware vielleicht nicht mehr so viel übrigt bleibt. DIe MGPU 480er Variante im AMD Benchmark setzt sich ja auch überdurchschnittlich vor die single 1080er. Vielleicht einfach nur ein durch das Szenario bedingtes Phänomen aber nicht unbedingt gleich Manipulation oder Verschwörung :)
 
AW: 3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute

eine 480m ist crossfire sonnst nichts
 
AW: 3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute

Zeit die Sau wieder durch das Dorf zu treiben. :schief:

Falls es wahr sein sollte verstehe ich denn Sinn dahinter nicht. Es wird doch noch andere AC Test geben. Wenn da Nvidia immer schlecht abschneidet und besonders in den Games was haben sie davon es nur in diesem einen Benchmark vorzugaukeln?
Eben genau das, besser in einem Benchmark auszusehen als es in der Regel der Fall ist.
Das Marketing liebt es Spiele auszusortieren oder einfach nur einen synthetischen Benchmark wie den 3D Mark zu nehmen, um die Leistung der GPUs anzugeben, entsprechend wird auch gerne dafür optimiert.

Andererseits würde es aber ja bedeuten dass man Programme ja an diese Arbeitsweise anpassen kann wodurch die Grünen gewinnen. Ist irgendwo geregelt wie man AC genau zu nutzen hat? Wenn nicht bleicht es doch den Entwicklern überlassen auf welche Architektur sie sich einschießen. Wer scheibt denn vor dass man AC dann nur exakt auf GCN zuschneiden darf? Wie gesagt falls es da keine Reglung gibt.
Nein, der Vorwurf ist haltlos und das ist nicht das erste mal das Mahigans falsche Ausführungen eine Hysterie auslösen.

Das hier ist der öffentlich dokumentierte Abschnitt zu Multiengine:
Synchronization and Multi-Engine (Windows)

Man definiert hier welchen Queue-Typen man haben möchte, GFX, Compute oder Copy und fühlt diese dann mit den entsprechenden Befehlslisten auf.
Ein Synchronisationsmechanismus wird verwendet um im Programmverlauf anzugeben, ab wann die zusätzlichen Queues zum Einsatz kommen und ab wann sie beendet werden.
Es gibt noch die Möglichkeit die Priorität anzugeben, falls bestimmte Berechnungen und ihre Ergebnisse früher gewünscht sind.

Das ist auch schon praktisch das ganze Software-Konstrukt, dass einem allerdings keine Garantie darüber gibt, ob die Hardware die Anweisung genau so konsumiert wie man sich das vorstellt, da die Spezifikation in der Hinsicht der Hardware nichts vorschreibt.
Die Hardware könnte die Queues parallel bearbeiten, sie könnte allerdings auch das ganze nacheinander forcieren, die Hardware kann auf die angegebene Priorität achten, sie kann das aber auch ignorieren.
Der Knackpunkt ist einfach, dass dies eine Software-Abstraktion ist die unter jeder Hardware funktionieren muss, aber keine Vorschriften darüber macht wie genau.
Als Entwickler muss man sich deswegen bezüglich der Hardware erkundigen und Testläufe unternehmen, ob der Programmcode auch in der Praxis effizient ausgeführt wird.

Der 3D Mark verwendet hier den absolut gleichen Mechanismus, wie alle anderen Entwickler bei ihren DX12 Anwendungen auch.
Der Vorwurf hier würde gar nicht Async Compute verwendet werden, ist einfach falsch.
Was man sowieso bei der ganzen Async Compute Geschichte haben möchte, ist eine Überlagerung von Aufgabenbereichen die unterschiedliche Hardwareblöcke auslasten.
Z.B. bei Shadow-Maps drehen die ALUs häufig Däumchen, hier könnte die Hardware dank einer zusätzlichen Compute-Queue parallel noch Compute-Shader durch die ALUs berechnen lassen.
Daraus folgt dann ein effektiver Gewinn der Performance, man möchte natürlich nicht Aufgaben mixen, welche die selben Flaschenhälse hat.

Und die Time Spy Demo hat das erfolgreich umgesetzt, für AMD und sogar Nvidia:
3DMark Time Spy mit DirectX 12 im Benchmark (Seite 2) - ComputerBase

9-17% Gewinn für die Radeons, bei Ashes of the Singularity sind es ein paar % weniger, bei Hitman gibt der Entwickler 5-10% an.
Da muss es erst einmal ein Spiel geben, was auch bei den Radeons bessere Resultate hervorbringt.

Theoretisch wäre es vorstellbar das man das ganze in einem Benchmark so hindreht das man den Compute Pipes von Pascal genügend Möglichkeit gibt um die Grafik und Computing Aufgaben seperat voneinander "besser" zu erledigen und zu profitieren. Das wäre dann natürlich eine Verfälschung da man so etwas nur in einem fix definierten Szenario umsetzen koennte und in einem Game wohl eher so nicht machbar ist... Also in der Praxis dann wohl wertlos.[...]
Ohne den Programmcode zu kennen ist es natürlich nur eine Spekulation, ob Spiele ihre Pipelines genau so designen könnten oder nicht.
Ganz klar muss man sagen, dass jeder Entwickler das anders umsetzen könnte, die Time Spy Demo kann vom Code niemals eine allgemeine Referenz für alle Anwendungen sein.
Diese Erkenntnis ist aber nichts neues, man sollte die Ergebnisse immer als das betrachten was sie sind, Ergebnisse für eine einzige Anwendung.
Man kann keine App schreiben die 100% Herstellerneutral ist und die optimale Vergleichsbasis bietet, sowohl für die Hardware, als auch die Software.
 
AW: 3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute

Da bestätig ein 3DMark-Entwickler in der ersten Stellungnahme, dass Nvidia im Treiber Async Compute für Maxwell explizit deaktiviert hat und dann wird das im Update nicht mal in einem Nebensatz erwähnt. Halte das für ein wichtiges Detail, weil das die Spekulationen beendet, weshalb Maxwell in Time Spy weder Leistung verliert noch zugewinnt.
 
AW: 3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute

Da bestätig ein 3DMark-Entwickler in der ersten Stellungnahme, dass Nvidia im Treiber Async Compute für Maxwell explizit deaktiviert hat und dann wird das im Update nicht mal in einem Nebensatz erwähnt. Halte das für ein wichtiges Detail, weil das die Spekulationen beendet, weshalb Maxwell in Time Spy weder Leistung verliert noch zugewinnt.

Genau.

nVidia will Maxwell bewusst schlecht abschneiden lassen...
 
AW: 3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute

@Locuza

Danke für deinen immer sehr ausführlichen Beitrag.

Also ist es letzten Endes eine Entwicklersache wie er es umsetzt und auf die jeweilige Hardware anpasst.
AC kann auf verschiedene Weise ermöglicht werden.
Daher dann unterschiedliche Performancegewinne.
 
AW: 3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute

Genau.

nVidia will Maxwell bewusst schlecht abschneiden lassen...

Denke ich nicht, ist auch widersinning. Viel naheliegender ist, dass ohne Deaktivierung Maxwell an Leistung verlieren würde, wie bisher immer wenn Async Compute zum Einsatz kam.
 
AW: 3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute

Da bestätig ein 3DMark-Entwickler in der ersten Stellungnahme, dass Nvidia im Treiber Async Compute für Maxwell explizit deaktiviert hat und dann wird das im Update nicht mal in einem Nebensatz erwähnt. Halte das für ein wichtiges Detail, weil das die Spekulationen beendet, weshalb Maxwell in Time Spy weder Leistung verliert noch zugewinnt.
Nvidia hat es sehr wahrscheinlich für jede Applikation deaktiviert.
Wirklich interessant wäre es zu wissen wie der Treiber es genau handhabt?
Multiengine gibt Synchronisationspunkte vor, ich weiß nicht ob es sicher ist immer alle zu ignorieren.
Abhängig davon wie viele Sync-Punkte es gibt und welche Aufgaben in der Compute-Queue ausgeführt werden sollten, könnten sich messbare bis gar keine Verluste bei Nvidia einstellen.
Ashes of the Singularity ist leider das einzige Spiel, wo man explizit Async on/off testen kann und die Messschwankungen scheinen etwas höher als normal zu sein.
Jedenfalls hat CB teilweise bis zu 10% Verlust gemessen, im Schnitt lag der Unterschied aber bei unter 3%, egal ob Kepler oder Maxwell.
Ashes of the Singularity DirectX-12-Leistungsexplosion (Seite 3) - ComputerBase

[...]
Also ist es letzten Endes eine Entwicklersache wie er es umsetzt und auf die jeweilige Hardware anpasst.
AC kann auf verschiedene Weise ermöglicht werden.
Daher dann unterschiedliche Performancegewinne.
Wie halt immer, egal ob Tessellation, Pixel-Shader, Geometry-Shader oder Compute-Shader.
Die Hardware unterscheidet sich bezüglich der Fixed-Function-Pipelines, der Effizienz, der Cache- und Register-Größen, der Thread-Group-Size.
Alles hat Auswirkungen darauf wie effizient die Hardware etwas konsumiert, der Software-Mechanismus ist immer der gleiche, aber wie es unter der Haube abläuft ist unterschiedlich und da das starke Auswirkungen haben kann, muss man immer schauen wieso Hardware X schlechter oder besser performt, als Hardware Y.

Async Compute stellt dabei keinen Unterschied dar.
 
AW: 3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute

Also ist es letzten Endes eine Entwicklersache wie er es umsetzt und auf die jeweilige Hardware anpasst.
AC kann auf verschiedene Weise ermöglicht werden.
Daher dann unterschiedliche Performancegewinne.

So würd ich das nicht sagen , zutreffender ist wohl eher das ich je nach Applikation andere Anforderungen oder Intensität habe. Also was, wieviel und wie zeitkritisch sind diese Dinge. Der Performancegewinn entsteht ja in erster Linie durch verkürzte Wartezeiten, die sonst entsehen wenn eine Aufgabe auf die Fertigstellung der anderen warten muss. GCN kann hier sehr schnell und effizient abarbeiten, das geht bei Nvidia Architekturbedingt nicht so ohne weiteres bzw nicht so schnell.

Wenn ich als Entwickler für das Ende der Aufgabe schnell und mit hohere Priorität mehrere Sachen parallel abarbeiten muss kann ich mir nicht wirklich aussuchen ob ich jetzt AC so oder so implementiere. Dann bin ich darauf angewiesen das die GPU möglichst alle Aufgaben ohne große Verzögerung annehmen kann. Das ist dann ein Fall in dem eine GCN GPU typischwerweise immer deutlicher profitieren wird als Pascal. EIn Echtzeitstrategiespiel wie AotS ist da sicher ein gutes Beispiel dafür. der Timewalk Benchmark wohl eher einer wos etwas chiliger zugeht und wo Pascal entsprechend seiner Möglichkeiten dann auch etwas mehr profitiert. Da fallen ja auch noch viele andere Einflüsse wie Netzwerktraffic oder Input weg von daher schoent das das Ergebnis sicher sowohl bei rot als auch grün etwas weil die Engine einfach simpler ist.
 
Zuletzt bearbeitet:
AW: 3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute

Dem würde ich auch nicht wiedersprechen dass GCN effizienter und mehr abarbeiten kann.
Dass ein AotS andere Belastung zeigt als dieser Benchmark ist sicherlich richtig. Das meinte ich ja mit je nach Game wird mal Nvidia weniger gewinnen und mal mehr. GCN aber immer ein etwas höheres Plus zeigen. Vorausgesetzt es kommen halt dann nicht Fetaure-Level zum Einsatz die AMD vielleicht in Hardware noch nicht kann. Dann müssten sie auch mit Software gegensteuern was auch wieder 0 Zugewinn ider sogar Verlust bedeutet.

Kann mir halt nicht fanz vorstellen dass die Spieleentwickler den Marktanteil der Grünen auser Acht lassen und nur GCN voll ausnutzen.
Gewisse Dinge werden werden wegen dem Marketing anders entschieden.

Hiffe aber dass man nicht stark eingreift und nicht mit unlauteren Mitteln eine Seite ausbremst.
Schön wäre es wenn alle gewinnen.
 
AW: 3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute

Wegen den Konsolen. Richtig. Hat aber bei einigen Titeln in den letzten 2 Jahren irgendwie auch nicht geholfen.
Besonders da die PS4 doch eine andere API verwendet als die Xbox oder gar Wii U.
Kommt halt dann auch immer darauf an welche Plattform Leader ist, was die Hardware unterstützt in den Konsolen und wie der Entwickler an den PC Port ran geht.

Ein eindeutiges Bild hat sich da für mich nicht abgezeichnet. Spiele wie Project Cars, Witcher 3 oder Fallout 4 fallen auch auf einer PS4 ab. Selbst ein Rise of the Tomb Raider was sich MS für die Konsole zeitexklusiv gekrallt hat leutet das grüne Logo am Anfang auf. Gerade da die Konsolenfassung bei Multiplattform immer Performanceprobleme zeigen gegenüber Exklusivtitel scheint die Hardware ewentuell nicht ganz so entscheident von welchem Hesteller sie kommt. Was natürlich auch etwas in der Natur der Sache liegt ob man nur eine Hardwarekonfiguration oder mehrere bedient. Die Entwickler übertreiben es auch mit Effekten anstatt Performance.
Solange da oft nicht mal 30fps gehalten werden ist es für mich kein Anzeichen dass AMD Hardware alleine hilft durchstartet in Zukunft. Es sorgt aber sicherlich hier und da dafür auch mal bei einem Game besser zu glänzen. Dass AMD in den Konsolen steckt ist nicht ganz irrelewand. Sonst würde es vielleucht ganz anders am Markt aussehen als jetzt.
 
Zuletzt bearbeitet:
AW: 3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute

Die Hardwarebasis war bis jetzt tatsächlich nicht besonderes ausschlaggebend. Vieler eher war die DX11 Zeit vom sehr guten Support von Seiten Nvidia bestimmt. Die Entwickler wollen Geld verdienen und das geht nun mal am besten indem man Zeit spart. Tools wie Gameworks und Physix erleichtern da vieles ungemein. Was dann natürlich zu prangenden Logos und durchwachsener Performance, auf Konsolen oder Fremdhardware führen kann.
Mit den neuen APIS koennen die Entwickler aber jetzt zumindest schon mal etwas Erfahrung aus dem Konsolenbereich am PC nutzen. Und Nvidia wehrt sich ja auch nicht dagegen wie man ja an Pascal erkennen kann.
Das sie nicht schreiend und jubelnd auf den DX12 und Vulkan Zug aufgesprungen sind war klar aber es ist jetzt aus meiner SIcht nicht so das man sagen kann sie sabotieren das, bei Vulkan (das aus Mantle entstanden ist) hat man schlussendlich ja auch selbst mitgearbeitet, auch zu erwarten das sie ihre gesamte Architektur jetzt gleich in den Mistkübel werfen und ein Computing Wunder herauszaubern ist logisch. Brauchen sie ja auch nicht die Karten performen ja gut.
Die Studios sind mit den neuen APIs weniger auf irgendwelche nicht offenen Softwareprogramme von den Herstellern angewiesen um die bestmögliche Performance zu erzielen, für uns Kunden kann das eigentlich nur gut sein.
 
AW: 3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute

Man lernt schließlich nie aus:
http://s3.amazonaws.com/download-aws.futuremark.com/3DMark_Technical_Guide.pdf

Futuremark hat eine nette Dokumentation bezüglicher ihrer Benchmarks, viele Details wie Compute-Shader Aufrufe, Tessellation-Patches, verwendete Ressourcen und ihre Formate sind dokumentiert.
Auch wie und wo der Time Spy Benchmark Async Compute verwendet:
Seite 28 schrieb:
Asynchronous compute is utilized heavily to overlap multiple rendering passes for maximum utilization of the GPU. Async compute workload per frame varies between 10-20%.
Seite 30 schrieb:
Lighting is evaluated using a tiled method in multiple separate passes.

Before the main illumination passes, asynchronous compute shaders are used to cull lights, evaluate illumination from prebaked environment reflections, computescreen-space ambient occlusion, and calculate unshadowed surface illumination.
These tasks are started right after G-buffer rendering has finished and are executed alongside shadow rendering. All frustum lights, omni-lights and reflection capture probes are culled to small tiles (16x16 pixels) and written to an intermediate buffer.
Seite 31 schrieb:
Particles are simulated on the GPU using asynchronous compute queue.
Simulation work is submitted to the asynchronous queue while G-buffer and shadow map rendering commands are submitted to the main command queue.

Futuremark verwendet Async Compute für keinen unorthodoxen Fall, sie überlappen Aufgaben die genau so als Beispiel für Async-Compute genannt werden, Shadow-Map-Rendering + Compute-Shader Berechnungen wie Lightning, Post-Processing, Physics etc.
http://image.slidesharecdn.com/hode...directx12-and-vulkan-23-638.jpg?cb=1440081531

Ein BF4-Beispiel von DICE:
http://image.slidesharecdn.com/rend...efield-4-with-mantle-42-638.jpg?cb=1395313870
 
AW: 3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute

n der Community ist das Thema Async Compute auf Nvidia-Grafikkarten ein großes Thema -

hihi. wundert mich ehrlich gesagt nicht. Die Community hier unterstellt Nvidia gerne Dinge, viele AMD Fans hier. Aber soooo groß kann das Thema bei 158 Beiträgen ja nicht sein.
 
Zurück