Aber natürlich gibt DX12 vor, wie AC umzusetzen ist, das ist ja Sinn und Zweck von Standards bzw. Normierungen. So wie DX12 die AC-Verarbeitung anfordert, können nVidia-GPU's diese nicht bzw. nur unter Leistungseinbußen (da nicht in HW möglich, somit SW-Workaround) realisieren. nVidia möchte natürlich nicht schlecht dastehen, somit brät nVidia mal wieder seine Extrawurst und gaukelt dem User vor, die Karten wären AC-Fähig. Dazu fehlen diesen allerdings schlichtweg die HW-Einheiten. nVidia versucht mit Ihrer eigenen (von der Norm abweichenden) Methode die Tatsache zu vertuschen, dass sie eben kein DX12-standardisiertes AS/AC beherrschen und einen Umweg über speziell angepasste Renderpfade gehen müssen um, nicht an Leistung zu verlieren... Außerdem nennt sich TimeSpy "State of the art DX12-Benchmark", benutzt allerdings nur DX Feature Level 11_0...
Nein, gibt DX12 eben nicht vor, genauso wie DX allgemein in vielen Bereichen nicht genau vorgibt wie die Hardware es umzusetzen hat.
Die Funktionen müssen funktionieren, auf welchem Weg ist in vielen Bereichen aber offen.
Die DX Spec setzt z.B. nicht voraus, dass Tessellation über Fixed-Hardware umgesetzt werden muss, ARM setzt Tessellation nur über Shader um.
Die DX12 Spec Multiengine (Im "Volksmund" Async Compute) spezifiziert auch nicht das die unterschiedlichen Queue-Typen parallel abgearbeitet werden müssen, das gleiche gilt für Async Copy.
Intel führt die Copy-Queue je nach Fall auch über die ALUs durch und nicht über die DMA-Engine, dass läuft dann natürlich auch nicht "parallel".
Bei Multiengine gibt es keine AC-Anforderung, man verwendet das Konstrukt und fertig, wie es unter der Haube abläuft wird nicht vorgeschrieben.
Soll ich am besten den ganzen Inhalt vom verlinkten Thread hier rüber kopieren, weil lesen wird es anscheinend niemand?
Ich meine jeder kann sich die Multiengine Spec durchlesen, genauso wie die Time Spy Demo dokumentiert ist, Futurmark hat auch ein GPUView Screenshot von Time Spy veröffentlicht.
Es gibt keinen speziellen Renderpfad für Nvidia, alles ist DX12 konform.
Time Spy verwendet DX12 FL11.0 um so viel Hardware wie möglich anzusprechen, dass kann man kritisieren, ist aber auch eine Businessentscheidung.
Alle Möglichkeiten bzw. das technische Limit von DX12 kann man deswegen aber natürlich nicht demonstrieren.
Locuza,
natühlich, lasse doch mal bitte die volle leistung der hardware ausspielen durch ordentliche programierung für die hardware ! huh?
wie du merkst ohne ordentliche optimierungen bzw programierung, wird die hardware nicht ordentlich ausgespielt.
was ich damit sagen will, ist also ein klares beweis das nv hier ganz klar und deutlich die finger in den 3dmark und in vielen spielen hat.
aber her woran liegt das, das ihr es nicht sieht bzw begreifen wollt wie ich, das ihr auf solche antworten eingeht ?
Die volle Leistung der Hardware kannst du gar nicht realisieren, ohne für jeden einzelnen Hersteller einen super spezifischen Pfad zu schreiben.
Das ist praktisch nicht realisierbar.
Das ist überhaupt gar kein klarer Beweis das NV hier ihre Finger im Spiel hat.
Einige scheinen so blind zu sein das es ständig nur um AMD vs. Nvidai geht, Intel wird dann immer in den Hintergrund gerückt, als ob die Hardware von dem Unternehmen gar nicht existiert.
Hat sich dort jemand einmal gefragt wie die Sachen ablaufen und wie man dafür am besten optimiert?