AMD Zen 5: Epyc mit bis zu 256 Kernen und 600 Watt cTDP?

PCGH-Redaktion

Kommentar-System
Teammitglied
Jetzt ist Ihre Meinung gefragt zu AMD Zen 5: Epyc mit bis zu 256 Kernen und 600 Watt cTDP?

Die Epyc-Prozessoren mit dem Codenamen Turin könnten bis zu 256 Kerne bieten und 600 Watt cTDB haben. Das sagen zumindest aktuelle Gerüchte über die Zen-5-Technik.

Bitte beachten Sie: Der Kommentarbereich wird gemäß der Forenregeln moderiert. Allgemeine Fragen und Kritik zu Online-Artikeln von PC Games Hardware sind im Feedback-Unterforum zu veröffentlichen und nicht im Kommentarthread zu einer News. Dort werden sie ohne Nachfragen entfernt.

Zurück zum Artikel: AMD Zen 5: Epyc mit bis zu 256 Kernen und 600 Watt cTDP?
 
Bei den Strompreisen bestimmt sehr günstig.
Firmen bezahlen nicht den gleichen Strompreis wie du als Privatperson. ;)

Zumal die 600 Watt wohl nur

a) Die große Version mit 256 Kernen bzw. 512 Threads betrifft
b) Wohl nur kurzfristig für den Turbo anliegen.

Und wenn man dann noch bedenkt, dass eine solche CPU mal eben ein Multi-Sockel System ersetzen kann, erscheinen mir die 600 Watt als gar nicht soooo viel.
 
Firmen bezahlen nicht den gleichen Strompreis wie du als Privatperson. ;)

Zumal die 600 Watt wohl nur

a) Die große Version mit 256 Kernen bzw. 512 Threads betrifft
b) Wohl nur kurzfristig für den Turbo anliegen.

Und wenn man dann noch bedenkt, dass eine solche CPU mal eben ein Multi-Sockel System ersetzen kann, erscheinen mir die 600 Watt als gar nicht soooo viel.
Ja vor allem wenn man bedenkt wie viele VMs auf 2-3 solchen Servern laufen könnten .. Da sind die 600W cTDP pro Server schon fast dunkeldunkeldunkelgrünes A+++++ am Energieausweis :D
 
Ich will gar nicht wissen was für eine Performance rauskommt, wenn man so ein Monster mit einem HPE Nimble Storage kombiniert :D Unsere Firma bekommt dieses Jahr das kleinste Nimble.
 
Mit sowas zielt man ja darauf ab halbe Racks abzulösen, also Server die in der Summe bislang 16-24U im Schrank verbraten haben und weitaus mehr Strom zusammen als 600W.

Real wird man darauf abzielen 1kW/h an AMD in den Schrank zu schieben und damit 2,5kW/h an Intel Hardware abzulösen (alte AMD Hardware gibt es halt nicht). Bei Hetzner Colocation wären das 3700€ an Stromkosten pro Jahr weniger. Es ist schon was dran, wenn AMD sagt ihre Server bezahlen sich über die Laufzeit von selbst, sofern man die Intel Server vorher auch lange laufen hatte.
 
Zumal die 600 Watt wohl nur

a) Die große Version mit 256 Kernen bzw. 512 Threads betrifft
b) Wohl nur kurzfristig für den Turbo anliegen.
Beides nicht unbedingt...
Auch die Version mit "nur" 128 Kernen kann 600W TDP haben wenn die Taktraten etwas höher ausfallen und so etwas wie nur kurzfristig anliegen gibts im Profibereich nicht wenn das System passend dimensioniert ist - jemand der ein 256-Kern-Serversystem betreibt hat auch Workload der diese Kerne zu mindestens 80% dauerhaft belastet. Im Serverbereich gibt es deswegen die cTDP (Custom-TDP) weil der Betreiber so die Abwärme auf seine performance- und Effizienzziele, vor allem aber auf das vorhandene Kühlsystem auslegen will. Wenn du da "600" einträgst und die CPU für irgendwelche beispielsweise FEM-Simulationen nutzt (die irre gut parallelisierbar sind) dann haste nahezu 100% Last auf allen 512 Threads und so lange konstante 600W Wärmeabgabe bis die Berechnung fertig ist (was Tage dauern kann...).


Dennoch: Natürlich kommt wieder der "aahhhh 600WATT!!" Reflex bei manchen Leuten ohne dass gesehen wird wie verdammt wenig das eigentlich ist. Wir reden von 256 Kernen! Also 16x ein 5950X... was unter Vollast 2272W verbrauchen würde. Klar die Taktraten der Epycs sind etwas geringer aber dennoch sind weniger als 2,5 Watt pro Kern unter Vollast alles andere als viel - und deutlich unter dem, was es bisher oder auch bei der Konkurrenz gab.
 
Firmen bezahlen nicht den gleichen Strompreis wie du als Privatperson. ;)

Zumal die 600 Watt wohl nur

a) Die große Version mit 256 Kernen bzw. 512 Threads betrifft
b) Wohl nur kurzfristig für den Turbo anliegen.

Und wenn man dann noch bedenkt, dass eine solche CPU mal eben ein Multi-Sockel System ersetzen kann, erscheinen mir die 600 Watt als gar nicht soooo viel.

cTDP ist, wie der Name schon andeutet, keine Turbo-Leistung, sondern ein optional konfigurierbarer Dauer-/Durchschnittsverbrauch. Aber gegen das Gebotene muss der Wert natürlich immer aufgewogen werden – für sich genommen macht er nur ein interessante Aussage über die Skalierbarkeit der Designs: Eine auf >>400 W ausgelegte Plattform adressiert offenbar gezielt Leistungsbereiche, die AMD bislang gar nicht (Multi-Sockel-SP5-Bereich) oder nur mit dem maximalen Plattform-Ausbau (Single-SP5) bedienen kann. Umgekehrt wäre diese Plattform aber überdimensioniert für die heute von Single-SP3-Systemen versorgten Marktbereiche. Ergibt sich hier eine Portfolio-Umstrukturierung, der Epyc zum Konkurrenten von Octa-Xeon-Platinum-Systemen und HPC-Spezialisten aufgewertet wird, während der Threadripper Pro den Bereich übernimmt, mit dem Epyc in der ersten und zweiten Generation groß geworden ist?

Das wäre zumindest für mich überraschend. Eigentlich hat gerade Epyc bewiesen, dass die Nachfrage nach so stark gebündelter Rechenleistung ziemlich klein ist. Der Sweet-Spot liegt heute oft bei Single-Epyc respektive Dual-Xeon-Systemen.
 
Bei den Strompreisen bestimmt sehr günstig.
Die Antwort ist natürlich nicht zu Ende gedacht, 256 Kerne könnten 4 heutige Epcys ablösen (selbst ohne IPC Gewinn etc.) die jeweils 240W brauchen. Ergo löst man 600W gegen 960W ein? Finde ich jetzt nicht schlecht.

Ansonsten wäre so ein Monster schon der reine Wahnsinn und ich bin mal gespannt wie die das designen, mit 8 Kernen pro CCX wären das unfassbare 32 CCX pro CPU, das kann ich mir nicht vorstellen. Vieleicht bekommen wir ja noch einmal eine Verdoppelung der Kerne pro CCX, bleiben immer noch 16 CCX, aber die haben wir aktuell ja schon in Zen2 Epcys.
die AMD bislang gar nicht (Multi-Sockel-SP5-Bereich)
Stellt AMD den DualSockel ein mit der neuen Plattform? Aktuell gibts ja noch den DualSockel, oder meinst du mit MultiSockel mehr als 2 Sockel?

Wobei Intel dort doch auch nichts mehr anbietet, außer diese Speziallösungen mit den zusammengeklebten Platinums, wo dann effektiv 4 Stück verbaut werden. Aber nativ kenne ich auf der akuellen Plattform nur Dual CPU Boards.
 
Zuletzt bearbeitet:
Eine Anmerkung mal zu den Kernzahlen im allemeinen:
Für Zen 5 steht die Umstellung auf big.Little im Raum. Das macht die Interpretation solcher Zahlen beinahe unmöglich, bis ein paar detailliertere Informationen vorliegen. Solange alle Befehlssätze unterstützt werden, ist für Server auch ein all-Little-Ansatz sehr interessant, denn die meisten Aufgabe sind dort gut parallelisierbar. Für Intels Granite Rapids ziehe ich so etwas schon in Betracht, denn Intels Folien zeigen eine eigentlich nur mit "Next Mont" erklärbare Feinstruktur, und AMD hat big.Little bislang wegen den Problemen mit asymmetrischen Befehlssätzen abgelehnt, muss also für Zen 5 im Umkehrschluss kompakte Effizienzkerne mit vollem SIMD-Support in Arbeit haben.


Stellt AMD den DualSockel ein mit der neuen Plattform? Aktuell gibts ja noch den DualSockel, oder meinst du mit MultiSockel mehr als 2 Sockel?

Wobei Intel dort doch auch nichts mehr anbietet, außer diese Speziallösungen mit den zusammengeklebten Platinums, wo dann effektiv 4 Stück verbaut werden. Aber nativ kenne ich auf der akuellen Plattform nur Dual CPU Boards.

Die zusammengesetzten Skylake-AP für bis zu vier Dual-Chip Einheiten je Node sind meinem Wissen nach schon wieder Geschiechte und Ice Lake SP gibt es bis auf weiteres nur als 2S, darüber ist aber weiterhin Cooper Lake mit nativer 8S-Fähigkeit im Programm. Das ist natürlich nicht annähernd so schnell wie acht ICL, aber deutlich flotter als deren zwei und ich glaube er kann sogar mit zwei Epyc mithalten. (In der Rechenleistung. Bei der Heizleistung ist es keine Frage. :-))
Mit Sapphire Rapids wird Intel diesen Sammlung von Notlösungen aber wieder in einer Linie zusammenführen und auf dem Architecture Day wurde bereits verbesserte 8-Sockel-Tauglichkeit angekündigt, auch wenn ich das in meiner Berichterstattung für Gamer nicht weiter ausgewertet habe.

Wie AMD darauf beim SP5 reagiert, weiß ich aber nicht. Wie geschrieben gilt selbst Quad-Socket schon als scheintot außerhalb einiger weniger Spezialanwendungen und einigen Super-Computern. Ich glaube aber nicht, dass man reine Single-Socket-Plattformen entwickeln wird, denn so eine Entwicklung kostet viel Geld und zumindest die Unterstützung von 2-Wege-Systemen mit nur einem Crosslink (ggf. noch über PCI-E realisiert wie bei SP3) ist vergleichsweise einfach, verdoppelt aber mal eben den abgedeckten Leistungbereich. Ob sie darüber hinaus auch mal wieder Quad-Socket machen oder mit SP4, Dual-SP4, SP5 und Dual-SP5 (Namen spekulativ) ausreichend versorgt wären, kann ich nicht einmal raten. Deswegen "Multi" als Platzhalter.
 
Was ich nicht so ganz verstehe (Reaktionszeit?):

Warum kann man "normale" Kerne nicht dynamischer bauen? Also zb. statt den 8 Energiesparkernen bei den neuen Intels 1-2 zusätzliche normale Kerne, und dann alle Kerne bis auf wenige Watt drosseln/deaktivieren?

Ein Verbrennungsmotor zb. kann ja auch mit zb. <1Liter/Stunde im Standgas laufen, oder mit 15-20L/100KM unter Volllast. Warum kann man 12 oder 16 oder 256 Kerne im Idle nicht auf zb. 5 Watt drosseln, und dann je nach Last quasi stufenlos (bzw. 256/512/1024 Stufen) bis auf 150/300/600Watt Volllast fahren?

Wenn man zb. 8 Energiesparkerne voll auslastet, dann brauchen die doch auch den Strom eines oder zwei normaler Kerne - und leisten dann vermutlich auch nicht mehr.
 
Warum kann man "normale" Kerne nicht dynamischer bauen?
Ein Verbrennungsmotor zb. kann ja auch mit zb. <1Liter/Stunde im Standgas laufen, oder mit 15-20L/100KM unter Volllast.
Ein CPU Kern kann ja auch mit 1W laufen oder mit 15-20W.
Nur kann er ohne grobe Abschaltungen eben nicht mit wenigen Milliwatt laufen genau wie dein Verbrenner nicht mit 0,02 Liter/Stunde oder mit 50 UPM anbleibt.
Das abschalten wird aber in beiden Fällen gemacht - CPUs schalten ganze Kerne ab, Verbrenner schalten Zylinder ab.

Das ist aber weniger der Grund für die "Dynamik" die du glaube ich meinst. Du kannst auf Transistorebene schon entscheiden, ob du vereinfacht gesagt sehr schnell schaltende, größere Transistoren breiter baust um hohe Taktraten zu erreichen oder ob du langsamere, kleinere Transistoren baust um besonders effizient zu sein. Innerhalb eines Chips mehrere Versionen zu nutzen ist schon seit Jahrzehnten üblich, aber ganze Funktionseinheiten mit ihren entsprechenden Auslegungen in einen monolithen zu bringen ist im Desktop bei ADL erstmals der Fall.

Zusätzlich gibts drölfzig architekturbedingte Tweaks die eher Richtung Performance optimiert oder eher Richtung Energieeffizienz getrimmt werden können (Pipelinelängen, OutofOrder Executions, inklusive oder exklusive Cachehierarchien usw.). Beispielsweise könnte ein P-Core alle möglichen Berechnungen die wahrscheinlich demnächst kommen schon mal im Vorraus berechnen um im zutreffenden Falle schneller zu sein (aggressive BranchPrediction), ein E-Core würde eher nur das im Vorraus berechnen, was sehr sicher auch gebraucht wird um keine Energie zur Berechnung von Ergebnissen zu verschwenden die später ungenutzt verworfen werden müssen - auch wenn das tendentiell langsamer ist.
 
256 Kerne? Cool.
Dagegen dürfte Apple dann erst einmal keine schöngeredete eierlegende Wollmilchsau bei angeblich nur 25% Verbrauch präsentieren dürfen. ^^ ;-P
 
Was ich nicht so ganz verstehe (Reaktionszeit?):

Warum kann man "normale" Kerne nicht dynamischer bauen? Also zb. statt den 8 Energiesparkernen bei den neuen Intels 1-2 zusätzliche normale Kerne, und dann alle Kerne bis auf wenige Watt drosseln/deaktivieren?

Ein Verbrennungsmotor zb. kann ja auch mit zb. <1Liter/Stunde im Standgas laufen, oder mit 15-20L/100KM unter Volllast. Warum kann man 12 oder 16 oder 256 Kerne im Idle nicht auf zb. 5 Watt drosseln, und dann je nach Last quasi stufenlos (bzw. 256/512/1024 Stufen) bis auf 150/300/600Watt Volllast fahren?

Wenn man zb. 8 Energiesparkerne voll auslastet, dann brauchen die doch auch den Strom eines oder zwei normaler Kerne - und leisten dann vermutlich auch nicht mehr.

5 bis 25 W sind durchaus drin, das praktizieren aktuelle Prozessoren ja schon. Aber noch größere Spannen werden schwierig respektive ineffizient, genauso wie du einen Verbrenner, der 25 l/100 km dauerhaft verkraftet selten mit weniger als 5 l/100 km bewegt kriegst, auch wenn du mit Standgas im höchsten Gang rollst. PC-Anwender haben aber Leistungsanforderungen, die eher um Faktor 1.000 denn um Faktor 5 auseinander liegen und irgendwann lohnt es sich dann, zwei verschiedene Kerne einzubauen. Machen Autohersteller ja genauso, wenn sie einen Hybrid im Stadtverkehr primär elektrisch fahren lassen, auf der Autobahn aber den Verbrenner brauchen.

Der zweite wichtige Grund lässt sich aber nicht mehr aus hinkenden Vergleichen ableiten: der Platzverbrauch. Während ein Verbrennungsmotor mit doppelter Leistung meist weit weniger als doppelt so lang/hoch/breit ist, steigt der Platzverbrauch bei CPUs mit der Leistung exponentiell. Viele kleine Kerne bringen dir mehr Rohleistung als mit großen Kernen auf gleicher Fläche realisierbar wären. Deswegen zeigen ARM-Server-CPUs in einigen Benchmarks den Epyc bereits die Rücklichter und GPU-basierte Beschleuniger, die ja im Prinzip 1.000-Kern-Prozessoren sind, dominieren die Supercomputer-Ranglisten. Mittelfristig wird das Design für CPUs von kleinen Kernen ausgehen und nur so wenig Big-Cores hinzufügen, wie unbedingt nötig sind, um flüssige Systemreaktionen beim Endkunden zu garantieren und eine Hand voll schlecht parallelisierbarer Main-Tasks abzuarbeiten. Aber die Hauptarbeit machen mehr oder minder kleine Kerne, z.B. bei Meteor Lake gilt 8+16 schon als relativ sicher. Und für Server ist 0+128 sowieso interessanter als 32+0, solange man eben keine Abstriche bei den Befehlssätzen machen muss.
 
„Das Schiff machte den Kessel/Kossal-Flug in weniger als 12 Parsec.“

— Han Solo über den Falken, mit AMD Epyc 256 Kern Sprung Berechnung.

.
 
Ian Cutress hat da mal Tests gemacht und 20 Fps mit einem 5950X erzielt. Zwar immerhin in 1080p, aber nur mit niedrigstem Details und die Cryengine skaliert extrem weit nach unten. Offensichtich skaliert sie aber nicht mit vielen Kernen; ein 3995WX kam nur auf 15 Fps.
 
Also, die EPYC-Reihe ist ja wohl vor allem für den Server-Markt gedacht, und das gibt es durchaus Anwendungen, wo mehr als 100 Kerne auf einem Chip oder Substrat hilfreich sein können. Ich bin Schaltungsentwickler (ASIC design engineer), und da gibt es Programme wie z.B. analoge Schaltungssimulation (Spice, Spectre und dergleichen) die recht ordentlich mit der Core-Zahl skalieren.

Ich kann mir vorstellen, dass EPYC-Updates gut in Rechenzentren ankommen, wie das auch schon vor fast zwanzig Jahren mit der Opteron-Reihe lief. Auch in diesem Sektor gilt: Konkurrenz belebt das Geschäft und ist gut für den Kunden.
 
Zurück