Intel: MIC wird zu XeonPhi Update2: Nur PCI-E 2.0

Skysnake · 18. Juni 2012

Wie auf vielen Seiten zu lesen ist, wie z.B. Computerbase zu lesen ist, hat Intel nach langer Zeit nun endlich ihren Larrabee, entschuldigung, ich meine natürlich Ferry Knights,.. ach :-.-: Knights Corner... wat auch nicht? MIC? wie jetzt.. ach nciht? ... Ach ja XeonPhi offiziell vorgestellt. (Eine lange Reise scheint ihrem Ende entgegen zu gehen).

Über die genauen Daten ist leider allgemein noch nichts bekannt, außer das XeonPhi in 22nm gefertigt wird, über mehr als 50 Cores verfügt und dabei noch 8GB GDDR5 Speicher besitzen soll.

Auf einigen Seiten, darunter Heise.de wird auch über das erste Top500 System mit XeonPhi berichtet. Nach Aussagen von Heise soll dieses System über 140 XeonPhis (Heise nennt Sie noch Knights Corner) verfügen. Hierbei beruft man sich auf die allseits bekannte TOP500 Liste, welche auf der heute startenden ISC12 in Hamburg traditionell vorgestellt wurde.

Nach der Top500 Liste belegt das erste XeonPhi System Platz 150, also eher ein Mittelfeldplatz. Viele Informationen gibt die Top500 Liste hierbei nicht her, was für einige Spekulationen, wie die 140XeonPhis von Heise sorgt.
Demnach hat der Rechner nun 9800 Cores, nachdem der Vorgänger in der letzten Liste noch 5715 Cores aufwies, dabei aber auch auf Intel Xeons der E5 Reihe mit 8Cores und 2.6GHz, sowie FDR Infiniband setzte.
Hat das Endeavor System ohne XeonPhi noch 176,4 kW Verbraucht, sind es nun mit dem XeonPhi System, welches auf den Namen Discovery hört nur noch 100 kW. Wie jedem sofort klar sein sollte, kann dies nicht nur durch das Hinzustecken von XeonPhi erreicht worden sein. Nein, hier wurden ganz klar weniger Xeons verbaut als noch in Endeavor.

Schätzen wir zunächst die maximale Anzahl an CPU-Cores ab. 5712/176kW *100kW=~3245

Teilt man dies durch 16 Cores/Node, also 2 CPUs je node, erhält man maximal 203 nodes. Realistisch betrachtet eher 100-150 nodes.

Bleiben also von den 9800 Coes noch 8200-7400 Cores übrig, welche XeonPhi bereitstellen muss.

Gehen wir von den 140 Karten von Heise aus, würde dies bedeuten, das jede XeonPhi Karte zwischen 82 und 49 Kerne aufweisen würde.

Betrachten wir dies näher:
Angenommen eine XeonPhi Karte hätte 54 Cores und jeweils eine Karte wäre pro Node verbaut, kommen wir auf genau 140 nodes, was als realistisch zu betrachten ist, da auch weniger Switches usw. für die geringere Anzahl an Nodes benötigt wird.

Betrachten wir nun die Rechenleistung von XeonPhi auf dieser Grundlage:
Wir haben 140*16=2240 Xeon E5 Cores, welche nach Endeavor eine Rechenleistung von ca 118,8TFlops/5712Cores*2240Cores=~46,6 TFlops erwarten lassen.

Da Discovery eine Leistung von 180,99TFlops erreicht, müssen die XeonPhis noch 180,99TFlops-46,6TFlops=~134,4TFlops bereitstellen.

Bei den angenommenen 140 Karten entspräche dies einer Rechenleistung von "nur" 960 GFlop/s, was unterhalb der von Intel immer genannten >1TFlop/s in DGEMM bedeuten würde.

Dies passt auch ganz gut zu einem Bericht von hpcwire.com

Quellen:
TOP500 List - June 2012 (101-200) | TOP500 Supercomputing Sites
TOP500 -
TOP500 -
+ siehe Fließtext

Update:
Bereits in der Orginalnews wurde ja schon das Problem bzgl. der >1TFlop/s DP-Rechenleistungsaussage angesprochen. Nun habe ich eine weitere Folie von Intel gefunden, welche sich genauer bzgl den >1TFlop/s auslässt.

Wie man auf dem Bild sieht, steht hier "Linpack (HPL) in a node". Intel bezieht bei diesen >1TFlop/s also scheinbar die Rechenleistung der Host-CPUs mit ein, um die 1TFlop/s Marke zu knacken. Dies ist definitiv nicht die normale Vorgehensweise, bei der eigentlich immer die Rechenleistung jeder einzelnen Komponente angegeben wird. Insbesondere bei der Vorstellung neuer Hardware.

Zum Vergleich nachfolgend noch die ansonsten oft zu sehende Folie, in der keine Aussage über die Art der Rechenleistung getätigt wird und daher auf Grundlage einer früheren Aussage von Intel bzgl. >1TFlop/s DP Rechenleistung in DGEMM teilweise auch für Linpack angenommen wurde, da Intel eben auf dieser Folie, welche ebenfalls zur ISC veröffentlicht wurde, nur von >1TFlop/s an Rechenleistung spricht. Hier wäre auf Grundlage der Veröffentlichung der neuen Top500 eine derartige Beziehung zu erwarten gewesen.

In wie weit nun Intel die theoretische Rechenleistung von XeonPhi auch in Anwendungen realisieren kann wird sich wohl noch zeigen müssen. Bisher ging man davon aus, das XeonPhi hier, im Gegensatz zu bisherigen GPUs, recht effizient in der Umsetzung der theoretischen Rechenleistung sein sollte.

Hier könnte insbesondere nVidia mit ihrem K20 (GK110) am Ende sogar noch einen höheren Effizientwert bzgl theoretischen/effektiver Rechenleistung erreichen, da hier von >90% auf der GTC die Rede war.

Hier übrigends auch noch das neue Logo für XeonPhi für alle, die es noch nicht gesehen haben:

Quelle:
Intel Introduces Xeon Phi: Larrabee Unleashed | PC Perspective
Intel stellt
+Fließtext

Update2:
Die Internetseite nextbigfuture.com berichtet über ein interview von pcwelt.com mit dem "president of the Intel Architecture Group and general manager of technical computing", Rajeeb Hazra sowie einem und Jim McGregor, dem "principal analyst" bei "Tirias Research". Dort gibt es folgenden Wortlaut zu lesen:

The chip (Anmekrung: XeonPhi) sits in a PCI-Express 2.0 slot and combines vector processing units with standard CPU cores.

Übersetzung:
Der Chip (XeonPhi) sitzt in einem PCI-Express 2.0 slot und kombiniert Vektor-Recheneinheiten mit standard CPU-Kernen.

Leider ist nicht ersichtlich, ob die Aussage von Herrn Hazra oder Herrn McGregor stammt, oder überhaupt von einem der beiden. Auf jeden Fall ist es verwunderlich, das hier von PCI-E 2.0 gesprochen wird, da SB-E Xeons, welche ja in dem System aus den Top500 zusammen mit XeonPhi eingesetzt werden, über PCI-E 3.0 verfügen. Von verschiedenen Seiten [1], und auch von mir, wird daher davon ausgegangen, das XenonPhi nur über ein PCI-E 2.0 Interface verfügt.

Dies wäre in Anbetracht dessen, das auf der einen Seite nur Intel über eine PCI-E 3.0 Plattform für Erweiterungskarten verfügt, dann aber auf der anderen Seite aber selbst, im Gegensatz zu AMD und nVidia, keine PCI-E 3.0 Erweiterungskarten anbietet, eine schon fast komödiantische Begebenheit. Insbesondere aus dem Grund, das im HPC-Bereich PCI-E 3.0 einen weitaus höheren Stellenwert auf der Wunschliste von potenziellen Kunden hat, als es dies im Gamer-Bereich der Fall ist. Denn im Gegensatz zu Spielen gibt es im HPC-Bereich durchaus eine ganze Reihe von Applikationen die apriori von einer gesteigerten Bandbreite durchaus teilweise massiv profitieren könnten.

Quellen:
[1] Intel stellt Beschleunigerkarte Xeon Phi vor; heise online | ISC12: Intel stellt HPC-Beschleuniger Xeon Phi vor
+Fließtext

Star_KillA · 18. Juni 2012

AW: Intel: MIC wird zu XeonPhi

Sind die das jetzt Server Cpus ?

Locuza · 18. Juni 2012

AW: Intel: MIC wird zu XeonPhi

Star_KillA schrieb:
Sind die das jetzt Server Cpus ?

Intel bezeichnet MIC als Co-Prozessoren. MIC ist eher ein CPU/GPU-Hybrid, erinnert doch ganz arg an den Cell von der PS3

@ Skysnake besitzt jeder Core nicht eine 16-breite Vektor Einheit und hätte nach GPU-Zählung 1024 ALUs?

Superwip · 18. Juni 2012

AW: Intel: MIC wird zu XeonPhi

...das jede XeonPhi Karte zwischen 82 und 49 Kerne ...

Was für eine präzise Schätzung :ugly:

Sind die das jetzt Server Cpus ?

Der XeonPhi wird eine Art Vektor-Coprozessor für Supercomputer und Workstations (z.B. Raytracing)

GoldenMic · 18. Juni 2012

AW: Intel: MIC wird zu XeonPhi

Zwar ganz interessant aber als Usernews formmäßig meiner Ansicht nach eher schlecht gemacht.
Danke dennoch für die Infos.

Skysnake · 19. Juni 2012

AW: Intel: MIC wird zu XeonPhi

Was fehlt dir denn GoldenMich

Locuza · 19. Juni 2012

AW: Intel: MIC wird zu XeonPhi

Skysnake schrieb:
Was fehlt dir denn GoldenMich

Meiner bescheidenen Meinung nach fehlt es GoldenMic im Prinzip an gar nichts, sondern wie er gesagt hat, die Form empfindet er nicht als optimal.
Es ist wohl der Schreibstil, der sich eher gespielt präsentiert, indem du das Ganze versuchst aufzulockern und dabei wohl keinen klassischen, pragmatischen Text schreibst. Alles garniert mit vielen Punkten, Strichen und Beispielrechnungen, die zum gewissen Teil gar nicht nötig wären.

GoldenMic · 19. Juni 2012

AW: Intel: MIC wird zu XeonPhi

Locuza hats auf den Punkt gebracht.
Ist für mich von der Form her halt einfach keine News, allein die Einleitung eben. Ist ja nicht böse gemeint, nur eben ne Anmerkung.

Skysnake · 19. Juni 2012

AW: Intel: MIC wird zu XeonPhi

Naja, bei der "unendlichen Geschichte" kannste halt auch einfach nicht mehr 100% ernst bleiben. Also zumindest ich nicht

XE85 · 19. Juni 2012

AW: Intel: MIC wird zu XeonPhi

User News sind laut Regeln sachlich und objektiv zu schreiben. Wenn du das (bei gewissen Themen) nicht kannst solltest du diese nicht als User News aufgreifen.

@News ... ziemlich viel "hätte, wäre, könnte, würde..." drinnen.

Aber nett das nun doch ein Larrabee Produkt auf den Markt kommt, auch wenn wir Homeuser davon (entgegen früherer Pläne) nichts haben.

mfg

Skysnake · 19. Juni 2012

AW: Intel: MIC wird zu XeonPhi

Dir ist aber schon klar, das du von jedem Intel-PR (und wahrscheinlich sogar vielen Ingenieuren) gesteinigt wirst für diese Aussage...

XeonPhi ist kein Larrabee, auch wenn das eine natürlich aus dem anderen hervor ging, und gerade du solltest nicht mit dem ersten Stein werfen. Über BD konnte man sich auch trefflich auslassen bzgl der "gestiegenen" IPC, was man auch mehr als ausreichend getan hat, und das zu Recht.

So muss sich Intel halt auch gewisse Seitenhiebe wegen ihrer "unendlichen" Geschichte mit Larrabee eben anhören. Das ist halt inzwischen ein Runninggack bei Leuten, die auf das Ding warten/gewartet haben. Wobei da nicht mal alles drin ist...

Und wenn dir da zu viele "hätte, wäre, könnte,..." drin sind, dann les bitte 90% aller hardware-news nicht mehr, weil da wirklich nichts als heise Luft drin steht.

Hier habe ich ja extra durch Abschätzungen nach oben und unten recht deutlich gezeigt, welche werte zu erwarten sind, wobei die 54*140 eben als sehr sehr sicher gelten, da man von einem uniformen System ausgeht und eben auch alles in powerbuget passen muss.

Btw. kommt man so dann auch leicht auf ~220W pro Karte, was auch absolut im Rahmen dessen liegt, was man erwarten kann, und bestätigt gleichzeitig auch noch die Werte. Man kann also mit >90% Wahrscheinlichkeit davon ausgehen, das man 140 nodes mit 140 XeonPhis hat.

Ganz abgesehe davon weiß man damit nun auch sicher, das XeonPhi einen 6+8Pint Stecker hat

EDIT:
Und das "nicht sachlich" kannste zu Recht sagen, who cares. Man muss auch mal schmunzeln können. Das "nicht objektiv" verbitte ich mir aber entschieden! Bevor du weiterhin derartige Behauptungen tätigt fordere ich dich hiermit auf diese auch zu begründen. Ansonsten unterlasse Sie.

XE85 · 19. Juni 2012

AW: Intel: MIC wird zu XeonPhi

Skysnake schrieb:
Dir ist aber schon klar, das du von jedem Intel-PR (und wahrscheinlich sogar vielen Ingenieuren) gesteinigt wirst für diese Aussage...

Das nehme ich in kauf. Zumal ich ja nicht der einzige bin der das im Zusammenhang bringt. Das man das bei intel natürlich nicht gerne hört ist auch klar - schließlich wurde Larrabee auch schonmal als größtes Fail von intel bezeichnet.

Skysnake schrieb:
...Runninggack...

Running Gag

Skysnake schrieb:
Und wenn dir da zu viele "hätte, wäre, könnte,..." drin sind, dann les bitte 90% aller hardware-news nicht mehr, weil da wirklich nichts als heise Luft drin steht.

Naja, aber da musst man ja nicht aufspringen. Die News von CB, die du ja selbst auch verlinkt hast, gefällt mir da wesentlich besser. Da werden die Fakten präsentiert und nicht irgend welches herumgerechne an deren Ende ja auch nichts wirklich verwertbares rauskommt. 82 bis 49 Kerne ist schließlich keine wirklich bessere Info als 50+ Kerne. (mMn)

Skysnake schrieb:
EDIT:
Und das "nicht sachlich" kannste zu Recht sagen, who cares. Man muss auch mal schmunzeln können. Das "nicht objektiv" verbitte ich mir aber entschieden! Bevor du weiterhin derartige Behauptungen tätigt fordere ich dich hiermit auf diese auch zu begründen. Ansonsten unterlasse Sie.

Es genügt schon eins der beiden um gegen die User News Regeln zu verstoßen, den dort steht "und", nicht "oder". Also bitte zukünftig daran halten.(an beides!)

@Topic

Interessant wäre noch ob man beim Xeon Phi wie bei einem der Prototypen auf 4 Threads pro Kern setzt.

mfg

PCGH_Marc · 19. Juni 2012

AW: Intel: MIC wird zu XeonPhi

Der Vollausbau hat 64 Kerne, davon 62 aktiv (die aktuellen Karten haben 54/56). Die Quelle ist nicht CB, sondern wie von CB angegeben Intel.

http://blogs.intel.com/technology/2...rocessors-accelerate-discovery-and-innovation

kühlprofi · 19. Juni 2012

AW: Intel: MIC wird zu XeonPhi

Ich find die News interessant, ausführlich und die lustige Einleitung gefällt mir ebenfalls (bin kein Deutscher :ugly:

)

PCGH_Marc · 19. Juni 2012

AW: Intel: MIC wird zu XeonPhi

Abgesehen davon, dass Corner statt Korner heißt ... im Ansatz unterhaltsam :ugly:

Mashed · 19. Juni 2012

AW: Intel: MIC wird zu XeonPhi

Mal sehen, ob Intel diesmal auch wieder den Treiber verkackt. :ugly:

Skysnake · 19. Juni 2012

AW: Intel: MIC wird zu XeonPhi

XE85, dann les mal weiter.... Es sind 54 aktive Kerne mit SEHR hoher Wahrscheinlichkeit, ansonsten gehts nämlich nicht aus entweder mit den Kernen, oder der Rechenleistung, oder dem Stromverbrauch.

XE85 · 19. Juni 2012

AW: Intel: MIC wird zu XeonPhi

Skysnake schrieb:
Es sind 54 aktive Kerne mit SEHR hoher Wahrscheinlichkeit

Wiso Sehr Wahrscheinlich? - Marc hat doch geschrieben das es aktuell 54 sind.

mfg

Skysnake · 19. Juni 2012

AW: Intel: MIC wird zu XeonPhi

1. hat er (54/56) geschrieben, wobei nicht klar ist, ob er sich da jetzt nicht sicher ist, oder auf die "Spezial"-Kerne anspielt, welche angeblich nicht für Berechnungen bereitstehen sollen.
2. Wann hat Marc das geschrieben und wann ich?

XE85 · 19. Juni 2012

AW: Intel: MIC wird zu XeonPhi

Skysnake schrieb:
1. hat er (54/56) geschrieben, wobei nicht klar ist, ob er sich da jetzt nicht sicher ist, oder auf die "Spezial"-Kerne anspielt, welche angeblich nicht für Berechnungen bereitstehen sollen.

Also ich interpretiere das so das 54 von 56 aktiv sind - genauso wie offensichtlich beim 64 Core 62 aktiv sind. Das dekt sich zudem zB mit der Angabe dieses Artikels von heise: heise online | ISC12: Intel stellt HPC-Beschleuniger Xeon Phi vor - welcher im übrigen schon gestern, vor deiner News, online war.

Edit: andere Quellen sprechen hier von Reservekernen, wobei leider nicht genau erläutert wird was damit gemeint ist. Daraus lässt sich vll. maximal ableiten das 56(64 beim vollausbau) funktionsfähig sind, aber immer 2 ungenutzt bleiben.

Skysnake schrieb:
2. Wann hat Marc das geschrieben und wann ich?

Zum einen gabs die info schon gestern zu lesen und zum anderen sind User News ja nicht in Stein gemeißelt. Wie wärs also mit einem Update bzw einer gründlichen Überarbeitung unter einbeziehung dieser Infos? Diesmal sachlich und objektiv.

mfg

Intel: MIC wird zu XeonPhi Update2: Nur PCI-E 2.0

Lötkolbengott/-göttin

Volt-Modder(in)

Lötkolbengott/-göttin

Lötkolbengott/-göttin

Kokü-Junkie (m/w)

Lötkolbengott/-göttin

Lötkolbengott/-göttin

Kokü-Junkie (m/w)

Lötkolbengott/-göttin

Lötkolbengott/-göttin

Lötkolbengott/-göttin

Lötkolbengott/-göttin

Lötkolbengott/-göttin

BIOS-Overclocker(in)

Lötkolbengott/-göttin

PC-Selbstbauer(in)

Lötkolbengott/-göttin

Lötkolbengott/-göttin

Lötkolbengott/-göttin

Lötkolbengott/-göttin

Ähnliche Themen