Wer hat den grünsten HPC-Daumen?

AW: Wer hat den grünsten HPC-Daumen?

… und deswegen steht sie ja auch auf Platz 2 der schnellsten Computer der Welt.
Deswegen ist aber dein Argument nicht soo knalle. Solche Architekturen müssen Skalieren, was die Effizienz (R_max/R_Peak) anbelangt, und tun Sie ja auch, wie man bei K20x und BlueGene/Q sieht. Bei den XeonPhi sind es halt unterschiedliche Systeme, aner die Effizienz ist relativ konstant. Obs mit mehr XeonPhi auch noch skaliert muss man sich anschauen, aber wenn ja, steht eigentlich nichts im Wege, auch bei großen Systemen eine bessere Perf/W zu liefern. Vor allem hat Intel ja noch ein Ass im Ärmel, genau wie nVidia. Fragt sich nur, wer es zuerst bringt.

Naja, und AMD kann man halt mit einem System noch keine Abschätzung machen :ugly:
 
AW: Wer hat den grünsten HPC-Daumen?

Dann verstehe ich deine Aussage nicht - sowohl BlueGene/Q als Musterbeispiel für richtig richtig gute Skalierung einer richtig guten Architektur als auch - und gerade im Vergleich - die verfehlten Ziele von Nvidia.
 
AW: Wer hat den grünsten HPC-Daumen?

Ok, dann nochmal langsam, wir reden wohl aneinander vorbei.

Du meintest, man kann die Systeme nicht miteinander vergleichen, da Sie von der Größe her zu unterschiedlich sind. Da haste auch grundsätzlich Recht.

Aber:
Wie man am Beispiel von BlueGene/Q sieht, kann so ein Supercomputer praktisch 1:1 über 2 Größenordnungen skalieren. Man muss halt von Grund auf ihn bereits auf die gewünschte Größe auslegen.
BlueGeneQ skaliert halt in zweierlei Hinsicht 1. bzgl der Effizienz was R_max/R_Peak anbelangt, aber auch was die Perf/W anbelangt. In BEIDEN Metriken skaliert BlueGene/Q praktisch 1:1 mit der gesamten Leistungsaufnahme. So wünscht man sich das, da man so ein System sehr wahrscheinlich eben noch deutlich größer bauen kann ohne das diese beiden Metriken schlechter werden.

So Und jetzt kommen wir zum nVidia und XeonPhi System. Die nVidia Systeme skalieren in beiden Metriken auch ziemlich gut. Vor allem hat man aber zwei sehr ähnliche Systeme, die beide Enden Abdecken. Damit lässt sich dann zumindest für diese Art an Systemen eine gute Abschätzung für den Zwischenbereich erstellen.
Die XeonPhi Systeme sehen da etwas anders aus. Die Effizienz (R_max/R_Peak) der XeonPhi Systeme ist mit Ausnahme von zwei Systemen immer überhalb der Ausgleichsgeraden zwischen den beiden nVidia Systemen. Man kann also davon ausgehen, das es möglich ist, Systeme zu bauen, die eine ähnliche größe haben wie das nVidia System und skalieren. Sieht auf den erstem Blick so aus, als sei das nicht der Fall, da der Punkt zuvor so weit oben liegt. Damit ist die Steigung recht groß. Man sollte für den Vergleich direkt die 2 Systeme am Anfang nehmen, die fast genau gleich groß sind. Da sieht man dann auch, das XeonPhi ähnlich skalieren kann. Das passt schon.
Die Perf/W sieht dafür ziemlich schlecht aus in der Skalierung von XeonPhi. Das System, das besonders schlecht aussieht ist auch ein älteres Nehalem System. Da werden wohl nur wenige XeonPhis drin stecken. Das ist auch das Problem am XeonPhi Plot. Man hat sehr unterschiedliche Systeme. Allein die ersten 2 Datenpunkte zeigen das schon. Die haben beide etwa den gleichen Verbrauch und etwa die gleiche Effizienz, aber massiv unterschiedliche Perf/W! Das deutet stark darauf hin, dass die Server unterschiedlich bestückt sind. Wahrscheinlich hat der schlechtere eben weniger XeonPhi/Node.
Was aber auch auffällt ist, dass die Systeme mit "Intel Xeon Phi 5110P" sehr viel bessere Ergebnisse liefern als die ohne den 5110P Zusatz. Das sollte man auch nicht vergessen und getrennt betrachten. Irgendwann wirds aber halt SEHR detailiert. Die Betrachtung wollte ich jetzt nicht auch noch im Artikel ausbreiten. Siehst ja, gibt nochmal nen richtigen Batzen Text. Naja und eigentlich müsste man jetzt noch in Erfahrung bringen, wie denn die XeonPhi/Node Metrik aussieht.


Und die AMD-Kiste ist ne eigene Geschichte. Man hat eben nur einen Messpunkt, und dazu auch noch falsche Daten, die ich als Solche aber auch durchaus erkannt hatte. Mit den richtigen Werten sieht es deutlich weniger Spektakulär aus, und nicht mehr von deutlichen Verbesserungen bei der Perf/W ausgehen. Es sei denn eben AMD bringt ihr 7-8 S10000 System mal in so einen Cluster rein. Dann ist da schon noch eine Steigerung möglich. So was müssen Sie aber auch bringen auf mittlere Sicht, wenn man an Projekt Denver von nVidia und das DEEP Projekt mit XeonPhi denkt.

EDIT:
Was ich btw sehr schade finde ist, das keiner mal das Fazit aufgreift, das wir jetzt eben doch ein richtiges Kopf-an-Kopf-Rennen der Hersteller haben, welches man so definitiv NICHT erwarten konnte. Vor allem in der Reihenfolge nicht. :D

Oder mal jemand den mir durchaus wichtigen Punkt herausgreift, das nVidia nen halbes Jahr zuvor absolute Spitze gewesen wäre was die Green500 anbelangt. Von der Top500 mal ganz zu schweigen. Da sind Sie ja auch so auf Platz 1. Man hätte halt nur nochmal deutlich besser ausgesehen. Das zeigt halt mal wieder, wie schnell in der Computerhardwarebranche man von einem BOAH-IST-DAS-FETT nur noch auf ein jo-ist-ganz-nett abgestuft wird. Und genau deswegen gabs auch die etwas längere "Einleitung", um den Leuten nochmals den Werdegang von K20(x) zu zeigen. Denn was steht denn als nächstes auf der Roadmap? Richtig Maxwell, welcher nicht mehr 2013 sondern 2014 kommen soll, und wer weiß, ob es in anbetracht der letzten Erfahrungen, nicht gar 2015 wird? 2013 wäre Maxwell wohl absolut Dominant geworden. Sprich konkurrenzlos. Aber wie sieht es aus, wenn er dann mal wirklich kommt? Eventuell genau so wie mit Kepler?

Darüber hatte ich gehofft, das sich die Leute mal paar Gedanken machen :(

nVidia verpulvert da nämlich ziemlich viel Kohle und bringt auch gute Sachen, aber leider können Sie ihren Zeitplan nicht einhalten. Das bricht ihnen aber das Genick, da die Konkurrenz in der Zwischenzeit eben aufschließen, oder gar überholen kann. So gewinnt man halt auch keine Partner auf Dauer. Vor allem nicht, wenn dann Intel noch mit seinem XeonPhi rum winkt, und noch x86 und bekannte Tools, sowie leichte Protierbarkeit der Programme mit in die Waagschale wirft.

Ich bin ja bekanntlich ein großer Freund/Verfechter von Accelerated-Computing, was bisher meist auf GPU-Computing hinausgelaufen ist. Wenn ich die Ergebnisse von XeonPhi, vor allem aber unter Berücksichtigung der Perf/W mir anschaue, und dann daran denke, wie viel einfacher die ganze Softwareentwicklung ist/sein wird, dann frag ich mich schon, ob ich mir die GPUs wirklich "antun" will. Die zu programmieren gibt nämlich wirklich graue Haare...
 
Zuletzt bearbeitet:
AW: Wer hat den grünsten HPC-Daumen?

Und hier zerbröselt der Keks : Intel + Nvidia = 3.15 GFlop/W


„Grünster“ Supercomputer mit Nvidias Tesla K20 schafft 3,15 GFLOPS/W - ComputerBase

Die aktualisierte Auflage des HPCs „Aurora Tigon“ von Eurotech, die gerade in einem italienischen Forschungszentrum in Bologna unter der Bezeichnung „Eurora“ in Betrieb gegangen ist, hat dank Xeon-E5-Prozessoren in Zusammenarbeit mit Nvidias Tesla K20 den Platz an der Spitze der Green500-Liste der Supercomputer eingenommen.
 
AW: Wer hat den grünsten HPC-Daumen?

Schön für nVidia, das man so eine Effizienzsteigerung hinlegen konnte. Die Steigerung ist aber SEHR groß, was mich doch etwas stutzig macht. Die Pressemitteilung habe ich leider auch nicht gefunden.

Wie siehts eigentlich mit dem Interconnect aus?
 
AW: Wer hat den grünsten HPC-Daumen?

Jetzt ist auch klar, woher die Traumwerte kommen...

Eurotech aurora (eurora) - most efficient hpc

Die CPU bei nur 1,6GHz laufen lassen, und ein full custom Rackdesign... Das ist auf jeden Fall vergleichbar mit Titan, wobei Titan ja ein System ist, welches auf die Top500 ausgelegt war. Da hat man solche Scherze wie hier nicht gemacht...

Also wirklich representativ ist das Ergebnis also nicht...
 
AW: Wer hat den grünsten HPC-Daumen?

Das ist aber ein gewaltiger Unterschied, ob ich 3,15 GFLop/sW hab, oder nur 2,6....

Das eine mal sind es 26% mehr Flop/sW und das andere mal nur 4%...
 
AW: Wer hat den grünsten HPC-Daumen?

Die anderen beiden Systeme laufen aber auch nicht mit 3,1GHz.

Aktuelle #1 "Beacon" läuft mit 2,6GHz und die #2 "SANAM" gar nur mit 2,0GHz.

Da sind die 1,6GHz vom "Eurora“ schon nicht soweit drunter.
 
Zurück