AW: Nvidia Pascal: Fire-Strike-Benchmark zeigt 1.860 MHz Boost-Takt, neuer Hinweis auf Kühlerabdeckungen
Mal eine komplett nüchterne Rechnung:
Bevor es los geht, eine kurze Anmerkung:
Bis auf die P100 sind die andren Karten eher consumer Modelle, was aber bei Single Precision keine Auswirkung hat und sogar eher günstig für die Karten ausfallen, weil sie meistens höher takten als die Profi Modelle.
Pascal P100 - mit GP100 GPU:
Transistoren: 15,3 Milliarden
SP Kerne: 3584
Takt: 1328 base 1480 MHz boost
Single Precision Leistung: 10,6 TF (bei boost Takt)
Titan X mit GM200:
Transistoren: 8 Milliarden
SP Kerne: 3072
Takt: 1002 base, 1075 MHz boost.
Single Precision Leistung: 6,6 TF
Fury X mit Fiji GPU:
Transistoren: 8,9 Milliarden
Takt: 1050 MHz
Single Precision Leistung: 8.6 TF
Nun ziehen wir noch 1,5 Milliarden Transistoren bei der GP100 für die Double Precision Kerne ab - da muss mir sowieso mal wer erklären, weshalb Nvidia noch immer drauf besteht, die als dedizierte Kerne zu verbauen. GCN schafft 2:1 Single Precision : Double Precision Leistung mit einer einzigen Sorte von Kernen und die DP Kerne der GP100 können sowieso nicht mehr getrennt aus einer CU "geschnitten" werden.
Dann noch großzügig 0,5 Mrd Transistoren für NVLink.
Bleiben 13,3 Mrd Transistoren für 10,6 TF Single Precision Leistung.
Das sind 4,7 Mrd Transitoren für 2TF zusätzliche Leistung.... nicht gerade weltbewegend... und das auch noch bei 430 MHz höherem Takt.
Wenn ich einfach mal ganz flach rechne (wirklich komplett nur nach Anzahl der Transistoren) ist das Verhältnis noch schlechter.
GP100:
10,6TF / 15,3 Mrd Transitoren = 0,69 TF/Mrd Transistoren
GM200:
6,6 TF / 8 Mrd Transistoren = 0,825 TF/Mrd Transistoren
Fiji:
8,6 TF / 8,9 Mrd Transistoren = 0,97 TF/Mrd Transistoren
Rein auf die Anzahl der Transistoren gemünzt steht der GM200 im Vergleich zu Pascal ziemlich gut da.
Dabei ist mir keine Aussage zu den Verhältnissen zwischen Anzahl der Transistoren für die Kerne und die "nicht rechnende" Peripherie möglich.
Natürlich sind einige der zusätzlichen Transistoren von GP100 für die 512 zusätzlichen Single Precision Kerne, die der Chip seit Maxwell dazu bekommen hat. Leider geht dann wohl noch einiges vom Transistorbudget für die (aus meiner Sicht) unnötigen, dedizierten DP Kerne und die Peripherie, inklusive NVLink, drauf.
Wie sich da die Transistoren genau aufteilen, müssen andere klären.
Deshalb ist das auch nur eine reine Milchmädchenrechnung, die aber wenigstens ein bisschen die Größenverhältnisse zeigt.
Man könnte jetzt noch Leistung pro MHz oder Leistung pro Kern berechnen.
Bei letzterem gibt es auch keine Überraschung. Nvidia hat seit diversen Jahren weniger, aber stärkere Kerne pro GPU.
Aber beide Berechnungen sollte man eigentlich auch nur als eine Gesamtrechnung machen, in der Anzahl der Kerne und deren Takt berücksichtigt werden. Sonst kommt nur noch mehr Mist raus, als in der platten Rechnung oben schon steht.