AW: 3D Mark Time Spy: D3D12-Benchmark veröffentlicht, GTX 1070 / 1080 mit Zuwächsen durch Async Compute
eigentlich geht es um zwei Dinge warum AMD mehr Flops erreicht als Nvidia und was Nvidia mit dem Rest des Fläche macht oder wo genau der Unterschied ist
das zweite war warum Nvidia urplötzlich von ACs profitiert wenn auch relativ gering
1. Mehr FLOPs zu erreichen ist wirklich simpel, da es nur darauf ankommt wie viele Schaltungen du hast die pro Takt eine Floating-Point-Operation schaffen.
Wenn AMD oder Nvidia wollten, könnten sie auch jetzt einfach einen Chip designen der 50 TFs schafft, dann kann eine ALU aber wirklich nicht mehr als addieren und mulitplizieren und jegliche Fixed-Function-Pipeline für sagen wir mal Texturfilterung, Geometriedatenverarbeitung oder den Rastervorgang fehlt und mit minimalen Datenregistern und höchstens einer Cache-Stufe ist so ein Chip dann praktisch auch wertlos.
Da ein Chip aus tausenden von Komponenten besteht, kann man nicht alles nur von einer Portion ableiten.
Unterschiede zwischen Nvidia und AMD gibt es schließlich sehr viele, von Kopf bis Fuß.
2. Da Pascal wesentlich schneller als Maxwell eine Arbeitsanweisung nach vorne ziehen kann und auch die Ressourcen nicht mehr statisch zwischen GFX und Compute reserviert, habe ich nur erwartet das Pascal dann praktisch kaum einen Verlust erleidet, aber keinen Gewinn.
Jetzt stellt sich die Frage, was Pascal unabhängig ausführen kann, sodass Pre-Emption von Compute-Anweisungen idle-times verkürzen oder was der Code eigentlich macht.
ZeroCool hat folgende These aufgestellt:
Darauf habe ich gefragt welche "Spezialmodule" dies denn wären.Konnte er mir nicht erklären, bzw. hat eine falsche Behauptung aufgestellt. Kurz: Er kann sich nicht erklären warum bei nVidia bei gleicher Chipgröße weniger Flops pro Takt zustande kommen im Vergleich zu AMD.
[...]
Bezüglich Tessellation verwendet AMD auch Fixed-Function-Blöcke, allerdings kann man sich schon die Frage stellen, was eine ALU jeweils bei den Herstellern ausführt.
Da gibt es historisch einige Beispiele, die früher von Fixed-Function-Schaltungen berechnet wurden, jetzt aber allgemein von den ALUs ausgeführt werden.
Nvidia verbaut pro ALU-Cluster mehrere Special-Function-Units, die z.B. Kosinus/Sinus ausrechnen.
Das sind dann eben die kleinen Unterschiede, die es überall gibt, neben natürlich auch viel größeren.