Können denn 2048 Stream-Prozessoren überhaupt stimmen? Es handelt sich ja hier um die neue GCN-Architektur, wo die Stream-Prozessoren einzeln und nicht in Gruppen angeordnet sind.
Bei VLIW waren es ja auch deswegen mehr Stream-Prozessoren, weil eine Einheit aus 4 bzw. 5 eben solcher bestand.
Eine GTX 580 hat als momentan stärkste Single-GPU Karte gerade einmal 512 Stream-Prozessoren. Da finde ich die 2048 doch recht hoch gegriffen.
Die Größe der einzelnen Shader hat immer etwas mit ihrem Aufbau zu tun und ihrer Funktionsweiße. Ein Cayman-Shader kann bis zu 4 Instruktionen bündeln, was ja dann gerne als 4 Unabhängige Shader gezählt wird, was ja nicht stimmt, wenn mehrere Befehle von den anderen abhängig sind. (Cypress Shader-Einheiten haben 5 Slots und waren auch somit größer als ein Cayman-Shader)
Nvidia hat bisher das ganze durch Power, statt durch Masse gelöst. Die einzelnen Shader haben eine längere Pipeline, sind dadurch viel höher Taktbar und sparen somit Transistoren. Bloß haben beide Hersteller wohl gemerkt das sie mit ihren Lösungen langsam an die Grenze stoßen. AMDs super Sparansatz verliert mit zunehmender Masse immer mehr an Effizienz und skaliert schlechter, Nvidia sieht das Problem, dass bisheriges Hotclocking ebenso mit steigender Anzahl an ALUs weniger Effizienz bringt.
Irgendwann kommt halt der Punkt, wo der Mehrtakt an Hotclocking nicht mehr Performance rausholen kann, als wenn man einfach mehr Shader drauf haut.
Nvidia scheint also die Pipeline wieder verkürzen zu wollen, weniger Takt, aber dafür mehr Einheiten. Je kürzer die Pipeline, desto kleiner ist der Shader auch an sich und braucht weniger Platz oder Isolatoren wegen dem erhöhten Takt der mehr negative Effekte ausübt.
AMD hat auf einfacher Ebene die 4 Slots der bisherigen Cayman-Einheiten wohl in 4 Einzelne Einheiten re-organisiert.
So pauschal Shader-Einheiten vergleichen geht also nicht
