AW: Nvidia Ampere: 70-75 Prozent mehr Performance im Vergleich zum Vorgänger - bei HPC
[...] Nvidia bringt hier eine HPC Karte, die in einer Variante für ENTHUSIASTEN auch erscheinen könnte. [...]
Das was der Artikel thematisiert, ist ein HPC-Design und das wird aufgrund der Ausrichtung bzgl. spezifischer Worklads u. a. möglicherweise kaum oder gar überhaupt keine RT-Cores besitzen. Hier dürften Tensor Cores (v3 ?) für FP16/FP32 und FP64-Leistung für HPC dominieren.
Eine eierlegende Wollmilchsau wird zwar alles können, aber auch alles nur bestenfalls durchschnittlich gut und damit gewinnt man keinen Blumentopf mehr und wäre bspw. bzgl. AI den spezifischeren Produkten anderer Hersteller hoffnungslos unterlegen (in genau diese Situation kommt nVidia bereits jetzt mit Volta).
Und bspw. Volta gab es nie wirklich für
Enthusiasten und die aktuellen Titan-Karten gehören nicht mehr wirklich dazu, denn die zielen von nVidia's Ausrichtung her auf das semiprofessionelle Einsteigersegment im geschäftlichen und universitären Umfeld, beispielsweise wenn man nur spezielle Anforderungen hat und daher keine Quadro benötigt. In genau diese Kerbe schlägt zurzeit die Titan RTX, die ganz klar auf das Einstiegssegment AI/ML ausgerichtet ist. *)
Wenn sich der eine oder andere "verrückte" Gamer die bestenfalls 10 % **) mehr Fps kauft, ist das nVidia relativ gleich, denn am Ende könnten die genau so gut eine Quadro kaufen.
Daher gab es HPC-Designs wie den GP100 oder die V100 nicht wirklich für Consumer. Einziger Irrläufer war die Titan V mit Volta mit 3000 US$ exkl. VAT, die jedoch, wie schon gesagt, auf das semiprofessionelle Umfeld abzielte.
Von dem nun bald erscheinenden HPC-Design würde ich gar keinen Ableger mehr in der Titan-Serie erwarten, sondern entsprechend kleiner skalierte Tesla-Varianten. Eine neue Titan (vielleicht Anfang 2021 ?) wird sich dagegen bei dem Turing-Nachfolgedesign bedienen und hat damit voraussichtlich nichts mit dieser Architektur hier zu tun. ***)
*) Denn ansonsten klafft eine erhebliche Lücke in nVidia's Portfolio zwischen den teuersten Consumer-Karten und dem Vollausbau in Form der Quadro RTX 6000 bzw. 8000 und genau diese Lücke schließt die Titan RTX.
Auf den Consumer-Karten hat nVidia die für ML-Training wichtige, höhere Präzision FP16/FP32-Acc auf halben Durchsatz beschränkt, was auch nachvollziehbar ist, denn ansonsten würde sich keiner bzgl. AI eine Quadro RTX 6000 Karten kaufen, sondern sich einfach vier RTX 2080 Ti in den Rechner stecken.
In genau diese Kerbe schlägt nun die Titan RTX, die die volle Präzision mit vollem Durchsatz der Quadro inkl. 24 GiB hat, d. h. wenn AI das primäre Anwendungsziel ist, fährt man mit einer Titan RTX besser als mit einer Quadro RTX 6000. Dafür muss man aber auch auf einen Großteil der professionellen Treiber Verzichten, was für AI-Anwendungen aber verschmerzbar ist. (Unterm Strich geschicktes Product-Development und am Ende nimmt man noch absehbar ein paar "Verrückte" mit, die zu viel Geld für ihr Hobby übrig haben.
)
**) Im Vergleich zu einigen Custom-Ti's fällt der Vorsprung gar noch ernüchternder aus.
***) Natürlich abseits der Verwandschaft, dadurch, dass die beide von nVidia entwickelt wurden. Beispielsweise Turing stellt quasi eine Kreuzung zwischen Volta und Pascal dar, zzgl. den neuen RT-Cores und mit den notwendigen Kompromissen bzgl. der Consumer-Ausrichtung und dem damit verbundenen Preisgefüge. (U. a. ist der Vollausbau des TU102 immer noch rd. 12 % kleiner als Volta unter Verwednung des gleichen Fertigungsprozesses.)