AW: AMD Fiji: "Weltweit erste GPU mit HBM" - Vortrag Ende August
Was ist dann der theoretische Vorteil von Dedizierten ALUs, sowie von Nvidia beim Maxwell verwendet, der alles andere als gut für den professionellen Einsatz geeignet ist?
Da kann man sich aus technischer Sicht streiten, was die Vor- und Nachteile sind.
Vor allem wenn das technische Marketing sich einschaltet, was nicht selten mehr mit Marketing als Technik zu tun hat.
Bei Kepler gab Nvidia an, es sei effizienter dedizierte FP64-Einheiten zu verwenden.
Wobei ob das stimmt, eine gute Frage ist, im speziellen Fall würde das vielleicht nur für Kepler und Maxwell gelten, die aus technischen Gründen es lieber so implementieren.
Bei Fermi gab es irgendwelche Einschränkungen was das zusammenlegen von DP-Instruktionen angeht, wobei ich da wirklich nicht durchschaue.
Mit dedizierten ALUs ist Nvidia in ihrem Design dem Problem so ausgewichen.
Was die Effizienz angeht, reine FP64-Einheiten sind pro Berechnung für sich selber vielleicht wirklich effizienter, als das verschalten von mehreren FP32-Einheiten, aber da fragt man sich im Gegenzug schon, ob das am Ende aufgeht.
Die FP32-Einheiten hat man ja daneben, die leaken immer Strom und das wird nicht re-used und damit das effizient funktioniert, müssen die heruntergetaktet werden oder sogar ganz abgeschaltet wenn das geht, da treibt man natürlich auch zusätzlichen Aufwand.
Für die FP64-Units braucht man zusätzliche Ports und Verschaltungen, dass bläht das Design auch auf, die Einheiten selber kosten natürlich Platz, unter Umständen gibt es einen negativen Einfluss auf die Signallaufzeiten.
Vielleicht hat Nvidia deswegen auch mit Maxwell auf ein enges Verhältnis verzichtet, weil Maxwell einfach zu groß ist und man dann in anderen Bereichen zu starke Kompromisse eingehen müsste.
Ich denke unterm Strich lohnt es sich nicht, weil es so fast niemand macht.
Alle CPUs verwenden mixed-precision Einheiten, AMD verwendet mixed-precision Einheiten, Nvidia setzt bei Pascal wieder darauf.
Es war vielleicht nur spezifisch für Kepler/Maxwell sinniger, weil es sonst gewisse Einschränkungen gäbe und mit einem Re-Design gibt es vielleicht keine großen Probleme mehr.
Im low-power herrscht aber ein kleiner Zoo, was die ALUs angeht.
Da gibt es Hersteller die dedizierte FP16, FP32 und FP64-Einheiten haben.
Irgendwer hat aber auch neulich mixed-precision Einheiten die von FP16 bis FP64 alles ausspucken können.
So wird Pascal am Ende auch designed.
Ich denke pauschal ist es schwer zu beantworten.