Ryzen Threadripper 3990X: AMD nennt neue Details zum 64-Kerner und verneint Modell mit 48 Kernen

PCGH-Redaktion

Kommentar-System
Teammitglied
Jetzt ist Ihre Meinung gefragt zu Ryzen Threadripper 3990X: AMD nennt neue Details zum 64-Kerner und verneint Modell mit 48 Kernen

In einem Interview hat AMDs Senior Technical Marketing Manager Robert Hallock neue Details zum kommenden HEDT-Topmodell Ryzen Threadripper 3990X verraten. Derweil soll eine CPU mit 48 Kernen ("3980X") als möglicher Zwischenschritt nicht geplant sein.

Bitte beachten Sie: Der Kommentarbereich wird gemäß der Forenregeln moderiert. Allgemeine Fragen und Kritik zu Online-Artikeln von PC Games Hardware sind im Feedback-Unterforum zu veröffentlichen und nicht im Kommentarthread zu einer News. Dort werden sie ohne Nachfragen entfernt.

lastpost-right.png
Zurück zum Artikel: Ryzen Threadripper 3990X: AMD nennt neue Details zum 64-Kerner und verneint Modell mit 48 Kernen
 
Wer braucht schon einen 48 Kerner ?
Für INTEL reicht der 32 Kerner locker … ;-)

MfG, Föhn.
 
Warum genau kann eine CPU mit 64 Kernen nicht doppelt so viel leisten wie eine CPU mit 32 Kerne?


Kann man das schnell erklären?
 
Kann man das schnell erklären?

Steht doch eigentlich im Text. Die Daten müssen ja auch zu den Kernen hin und wieder weg transportiert werden, es müssten daher alle beteiligten Strukturen doppelt so breit sein und nicht nur die in der CPU, also auch RAM-Menge, RAM-Takt, RAM-Zugriffszeit, Cache-Speicher, HDD/SSD Geschwindigkeit, Netzwerk usw.
Es skaliert nur linear, solange überall die gleichen Reserven vorliegen. Sobald diese an einer Stelle ausgehen, skaliert es eben nicht mehr linear. Daher ist eine gute Balanche aller Komponenten wichtig. Wenn man an einer Stelle einsetig etwas massiv vergrößert, dann werden die nicht vergrößerten Stellen Probleme bereiten. Und AMD hat eben nicht auf alle diese Stellen Einfluss, weil einige eben auch im Betriebssystem, Anwendungssoftware oder Controllern liegen.

Ein ähnliches Phänomen ist auch für Staus auf den Straßen verantwortlich oder warum die doppelte Menge an Mitarbeitern nur selten die doppelte Menge an geleisteter Arbeit bedeutet ;)
 
Warum genau kann eine CPU mit 64 Kernen nicht doppelt so viel leisten wie eine CPU mit 32 Kerne?
Kann man das schnell erklären?

Exemplarische Milchmädchenrechnung: 280 W auf sTR4 als Limit ergibt unter Vernachlässigung aller weiteren Randbedingungen bis zu 8,75 W pro Kern und dessen Cache-Slice. Beim 64-Kerner auf der gleichen Plattform verbleiben entsprechend nur noch 4,375 W pro Kern und dementsprechend muss die Leistung eines derartigen Kerns geringer sein (also keine lineare Skalierung).
Wie gesagt, eine stark vereinfachende Milchmädchenrechnung, aber ein wesentlicher Faktor. (Zum Vergleich: Auf AM4 mit den 105 W-CPUs errechnen sich in der Art für einen 3900X 8,75 W; die PPT liegt hier bei 142 W, also maximal 11,833 W regulär.)

Darüber hinaus skaliert der IOD nicht linear, ebensowenig nicht die Hauptspeicherbandbreite, und insbesondere nicht die Massenspeicher.

Zusätzlich ein Cinebench R20 MT-Vergleich:
3950X : 570,9 Pkt/Kern
3900X : 591,7 Pkt/Kern
3700X : 607,0 Pkt/Kern
Als Grundlage die allgemein plausiblen, besten Ergebnisse ohne manuelles Tuning herangezogen.
Ein weiteres Problem bei der Betrachtung ist zudem die Vertriebspolitik, denn AMD hat sein Portfolio in der Art aufgesetzt, dass man die höheren Taktraten bei den größeren Modellen findet. Das macht zwar bei Cinebench eher weniger aus, dürfte aber zusätzliche Ungenauigkeiten in die Werte einbringen. Zudem müsste man für eine genauere Betrachtung das schlechtere CCD/IOD-Watt-Verhältnis beim 3700X berücksichtigen, da hier dessen IOD voraussichtlich einen tendenziell höheren Anteil an der Package-Power hat (das genau zu ermitteln dürfte schwer sein, zumal der gleiche IOD mit zwei angeschlossenen CCDs voraussichtlich etwas mehr ziehen wird).

Und wenn man es zunehmend genauer betrachten will (soviel zu "mal kurz" ;-)), dann müsste man auch den testenden Workload genauer untersuchen, denn auch bei so etwas wie dem Cinebench selbst kann man keine vollständig lineare Skalierung voraussetzen. Hier müsste man ab einer gewissen Skalierung ggf. eher mit mehreren Instanzen parallel arbeiten oder aber einen anderen, ggf. noch synthetischeren Benchmark für eine Messung verwenden.

Grob betrachtet macht die SPEC-Suite etwas Ähnliches mit ihren Speed- und Rate-Werten. Bei den Speed-Werten wird nur eine Instanz prozessiert (was je nach Test durchaus mehrere Threads inkludieren kann) und es wird gemessen wie schnell ein System diesen einen Task (bestehend aus mehreren, nacheinander durchlaufenden Einzeltests) verarbeiten kann.
Dagegen bei den Rate-Werten werden mehrere Instanzen parallel gestartet, d. h. man misst vornehmlich den insgesamt möglichen Durchsatz auf dem System, was insbesondere für Server und HCP-Systeme mit vielen Kernen und einer hohen Speicherbandbreite relevant ist. Die Linearität ist hierbei durchaus erstaunlich (INTrate / FPrate):
o Epyc 7742 [64C]: 344 / 268
o Dual Epyc: 670 / 524 : (195 % / 196 %)
o Platinum 8280 [28C]: 168 / 139
o Quad Platinum: 661 / 548 : (393 % / 394 %)
o Octa Platinum: 1315 / 1113 : (783 % / 801 %)

Nachfolgend der Versuch einer Hervorhebung der Speicherbandbreitenabhängigkeit in SPEC CPU 2017 rate *):
o Quad Gold 6226: 323 / 329
o Dual Platinum 8268: 304 / 260

Für die Beschleunigung eines einzelnen, spezifischen Tasks gibt es aber Grenzen bzgl. der Parallelisierung und Linearität, wie in nachfolgenden Posts angerissen.

*) Hier was zu finden, dass man sinnvoll gegenüberstellen kann, ist äußert schwierig. Bei AMD fällt alles weitestgehend raus aufgrund unpassender Konstellationen, daher der obige Vergleich. Xeon Gold 6226, 12 C, 2,7/3,7 GHz und Platinum 8268 24 C, 2,9/3,9 GHz. Die 24-Kerner haben sogar 200 MHz mehr Basistakt, müssen sich aber mit 2x6 Speicherkanälen zufrieden geben, während das Gold 6226-System aus 4x6 Speicherkanälen schöpfen kann.
Mit ein bischen Glück wird man ja in Zukunft auch TR in der Ergebnisliste finden, dann vielleicht auf einer TRX40- und auch auf einer TRX80-Plattform? Aktuell könnte man einen Vergleich versuchen mit einem Epyc 7742 64 C (345 / 267) gegen einen Dual Epyc 7502 32 C (416 / 363). Die 250 MHz mehr Basistakt des 32-Kerners können dessen Vorsprung nicht erklären und das L3-zu-Kern-Verhältnis ist bei beiden CPUs gleich.
 
Zuletzt bearbeitet:
Warum schafft mein BMW 320 mit 190 PS 7,1 sekunden von null auf hundert und der mehr als doppelt so starke 340 4,1 Sekunden, was viel mehr als die hälfte is? ;)
 
Warum schafft mein BMW 320 mit 190 PS 7,1 sekunden von null auf hundert und der mehr als doppelt so starke 340 4,1 Sekunden, was viel mehr als die hälfte is? ;)

190 PS vs 340 PS = mehr als doppelt so stark? :hmm: (381+ PS würde wohl eher passen)
Idealerweise sollte das schnelle Auto dann noch über Allradantrieb verfügen, damit die Leistung auch auf die Straße gebracht werden kann. (und nicht nur der Gummi)

Der Sinn der Aussage war natürlich klar. :D
 
190 PS vs 340 PS = mehr als doppelt so stark? :hmm: (381+ PS würde wohl eher passen)
Idealerweise sollte das schnelle Auto dann noch über Allradantrieb verfügen, damit die Leistung auch auf die Straße gebracht werden kann. (und nicht nur der Gummi)

Der Sinn der Aussage war natürlich klar. :D

Der BMW M340i hat aber nicht 340 PS. ;)
Aber xDrive hat er serienmäßig. Wenn ichs mit dem 320 xdrive vergleich wärs besser und der Vergleich aussagekräftiger, hast recht :daumen:
 
Die Antwort lautet: Physik!

Hexenwerk! :lol:

Ne jetzt ernsthaft: Den besten Vergleich dagür liefert mein 1950x, der eigentlich nur ein doppelter 1800x ist, mit doppeltem Cache, doppelter TDP, Speicherinterface und fast identen Takt. Und bis auf eine Handvoll Szenarien bietet der 1950x niemals auch nur 180% des 1800x. Eben weil hier auch andere Dinge eine wesentliche Rolle spielen.

Oder anders gesagt: 9 Frauen können auch nicht in einem Monat ein Kind austragen. :lol:
 
Warum schafft mein BMW 320 mit 190 PS 7,1 sekunden von null auf hundert und der mehr als doppelt so starke 340 4,1 Sekunden, was viel mehr als die hälfte is? ;)

Wenn du beide Werte vergleichst, merkst du dass das absolut linear ist... Also eher ein schlechtes Beispiel haha
Interpoliert man die 340 PS mit 4.1 s auf 380 PS, kommst du genau auf die Hälfte von 7.1 Sekunden...

7.1 x 190 = 4.1 x 340 = 3.55 x 380

Lg
 
Wenn du beide Werte vergleichst, merkst du dass das absolut linear ist... Also eher ein schlechtes Beispiel haha
Interpoliert man die 340 PS mit 4.1 s auf 380 PS, kommst du genau auf die Hälfte von 7.1 Sekunden...

7.1 x 190 = 4.1 x 340 = 3.55 x 380

Lg

Jetzt mal die genauen werte damit die Diskussion beendet ist:

320ix 184 PS 7,6 Sekunden
340ix 374 PS 4,4 Sekunden

374 / 184= 2,0326
7,6 / 4,4 = 1,7272

Ergo: bei den 2,03-fachen Pferdestärken schaft er nur die 1,73-fache Beschleunigung.

Eine Interpolation?! Echt jetzt? Du interpolierst linear zwischen 2 Punkten und wunderst dich dass dabei eine Gerade rauskommt? Aber ist ein netter Zufall dass die 340 reinpassen, auch wenns keinen BMW G20 mit 340PS gibt. Das Modell 340 war gemeint. ;)
 
Um das Thema abzuschließen: Der Hauptgrund warum mehr Kerne nicht linear skalieren liegt an der nicht unendlichen Parallelisierbarkeit von Aufgaben - noch vor Architektonischen Engpässen. Nachzulesen im Detail beispielsweise hier:
Amdahlsches Gesetz – Wikipedia

Auch wenn das nichts mit dem Thema zu tun hat: An der Stelle ist der Auto-/PS-Vergleich völlig unsinnig da es zig physikalische Einflussgrößen gibt die nichtlinear sind und alleine schon eine PS-Angabe bei Verbrennern nicht für sowas geeignet ist da der Motor diese PS-Zahl nur ein einem winzigen kleinen Betriebspunkt erreicht, ein Beschleunigungsvorgang aber noch viele viele andere Betzriebszustände abverlangt (böse gesagt: PS-Zahlen sind hauptsächlich Marketing).

Du interpolierst linear zwischen 2 Punkten und wunderst dich dass dabei eine Gerade rauskommt?
Tja, ich gewinne auch in der Kneipe Bier mit Figurenwerfen beim Dart - was ich dabei immer zum Besten Gebe: "das Dreieck". :ugly:
 
Ich würde mal sagen 3 bis 4 Jahre. Danach verhungert die CPU an der mangelnden ST Leistung.
So geht es den Käufern von Zen 1000 momentan, besonders die, die den 1700 gekauft haben.

Stimmt, denn jeder der 1700 Käufer befindet sich in jedem seiner Spiele im absoluten CPU limit. Egal was er so spielt...... "Confirmation Bias" ;)
DENN was der HyperHWHighlander mit seiner DaumenKino "High-Feature-Set" 2060 sagen möchte ist, alle Spielen mit ihrer 1700 CPU in Anno 1800 jeden Hardcore Highwaylander-Bullshit Nachfolger im CPU Limit .... :ugly:

Du solltest Dich nach deiner Schreibweise und Art der Argumentation in "HardwareConfirmationLander" umbenennen lassen. :P

Alternativ sind "HWStrohmanHighlander", " HWIchKümmereMichUmMeinKindSoSehrInDerElternTeilzeitObwohlIchDenGanzenTagInEinemBelanglosemForumRumhänge", ooooooder "HWFeatureSetHighlander" :ugly:
 
Zuletzt bearbeitet:
Zurück