Intel Rocket Lake-S: Achtkerner mit 12 Threads macht die Runde

Juckt die bloß wenig. Die freuen sich, dass Jemand für die Zeit aufwendet und die Aufmerksamkeit bekommen, sodass evtl irgendwann die Diskussion vollständig entgleist (was eh von vornherein ihr Ziel ist).

Also ist deren Ziel Unruhe in den threads zu bringen. Das macht denen Spaß und dient also nur zur Unterhaltung für diese. Chaos und Unruhe. Ich frage mich was sie damit bezwecken wollen. Denn sie haben doch selbst nichts davon chaos zu bringen. Den Schaden haben somit ja andere dann. Wenn die da drausen auch so sind, na dann um Gottes willen. Warscheinlich rennen diese zu fremden Menschen hin und gehen diese auf den Sack. Nerven die so lange bis sie dann gehen. Es macht also solchen Menschen freude andere zu quälen, habe ich das so richtig verstanden?
 
Die Beschränkung auf maximal 8 Kerne darf man wohl dem Backport zuschreiben, denn die Cores werden mit Sunny und Willow Cove größer, d. h. ein 10-Kerner auf 14nm+++ würde hier voraussichtlich noch einmal mehr ziehen als Comet Lake. Aber unterm Strich sind 8 Kerne für den Mainstream auch vollkommen ausreichend. Mehr Kerne betreffen nur Enthusiasten und derer gibt es vergleichsweise wenige. Wer sich dazu zählt, wird natürlich auch zukünftig bei Zen3 besser aufgehoben sein.

Du hast hier etwas Essenziell wichtiges vergessen. Intel baut Monolithen.. Je Größer der Die, desto höher die Fehlerquote und vor allem je geringer der Waferausstoß.
Das ist eben der Maximale Vorteil den AMD hat.. kleine CCDs die man günstig und in Massen herstellen kann.. Hier Limitiert dann eben nur die Physik.


Realistisch dürfte sein, dass der 8C Rocket Lake den 10C Comet Lake Paroli bieten kann, die wie du sagtest Willow Cove Backport Geschichte nehme ich Intel auch noch nicht ab. Aber das müssen die ES Samples zeigen. Sunny Cove dürfte es sehr wohl aber werden, denn sonst wäre ein 10C Skylake gegen einen 8C Skylake schneller. Intel wird den Ökonomischen Mittelweg gehen und vermutlich Teile von Willow Cove streichen um am Ende mehr aktive vollwertige Dies zu haben.

YouTube

Mich irritiert aber auch diese 8/12 Meldung massiv. Denn SMT kann man eigentlich nicht per Lasercut wegschneiden.. 6/12 wäre dann wieder logisch gewesen.. Aber wir werden es noch sehen


@DarkWing13

Solange es der Kunde kauft, hat Intel alles richtig gemacht. Und die Sind soooo Arm, dass sie nur knappe 60Mrd Spielgeld rumliegen haben.. Die Karten könnten aber auch hier bis 2022 neu gemischt werden wegen Apple
 
Zuletzt bearbeitet:
Steht Intel finanziell so schlecht da, dass sie auch noch den letzten Wurscht-Zipfel vermarkten müssen, und wieder eine weitere 10xxx CPU ins Portfolio reindrücken?
Reichen ein paar Dutzend, meist nur leicht unterschiedliche CPUs noch nicht?
Ein Wirrwarr, bei dem der durchschnittliche Käufer nur noch verwirrt den Kopf schüttelt...wohl auch ein Grund, warum AMD derzeit mit seiner überschaubaren CPU-Palette punktet...
 
Du hast hier etwas Essenziell wichtiges vergessen. [...]

Nein, habe ich nicht, weil das nur ein untergeordneter Parameter ist, m. M. n. Intel's 8-Kerner benötigen bereits (inkl. iGPU) weniger Wafer-Flache als AMDs 8-, 6-, 4-Kerner und bei deren 14nm handelt es sich um einen über viele Jahre eingefahrenen, hochgradig optimierten Prozess, der vergleichsweise hohe Yield-Raten aufweisen wird, insbesondere bei derart vergleichsweise kleinen Chips (Xeon HCC- und XCC-Chips dagegen sind ein anderes Thema). Beispielsweise Intels 10-Kerner bewegt sich flächentechnisch in etwa auf dem Niveau der 1-CCD-AMD-Prozessoren. Die paar Quadratmillimeter mehr Wafer-Flache für einen potentiellen 10-Kern-RKL dürften da eher das kleinere Problem gewesen sein. (Hinzu kommt, dass es Intel ihre inHouse-Fertigung nutzt, die man kostentechnisch weitaus besser steuern kann und in der Hand haben wird, als eine extern zugekaufte Dienstleistung, wie von TSMC und den diversen Herstellern, die für das Packaging zuständig sind.)

Darüber hinaus, ob es Willow Cove bzgl. der Mikroarchitektur werden wird, ist noch nicht gesichert *); es könnte auch Sunny Cove oder ein Hybrid zwischen beiden werden. Man wird sehen, Intel wird den Aufwand jedoch aus gutem Grund betreiben, sprich die IPC-Zugewinne sind erforderlich, um mit den alten 14nm weiterhin bzgl. Zen3 irgendwie "am Ball bleiben" zu können.

"[Architektonische] Teile zu streichen" ist möglich, aber aus Kostengründen nicht sehr wahrscheinlich, wenn dann eher aus technischen Gründen. Intel hat weitaus mehr Ressourcen und kann die Consumer-Chips effizienter als AMD fertigen, indem hier individuelle Designs herangezogen werden, was sich bei Intel's Umsatzvolumen durchaus lohnt. Beispielsweise die für den Mainstream volumentechnisch relevanteren 4- und 6-Kern-Chips sind bei Intel deutlich kleiner bzgl. der Wafer-Flache und damit deutlich günstiger für sie herzustellen. AMD fertigt in der Chiplet-Bauweise nicht, weil das durch die Bank durch so unglaublich günstig ist, sondern weil es ihnen auf anderem Wege gar nicht möglich gewesen wäre das komplette Portfolio von Destop, HEDT bis zum Server abzudecken, weil sie die Ressourcen für viele eigenständige Designs gar nicht haben. Ihre Chiplet-Fertigung ist hierbei schlicht eine Mischkalkulation, vergleichsweise aufwendig und teuer bei kleinen Chips, günstiger bei sehr großen Server-Chips und sie ermöglicht alle Segmente zumindest zum Teil mitzuversorgen, was für AMD eine unverzichtbare Notwendigkeit war (und auch heute noch sein wird).

Die 8 Kerne mit angeblichen 12 Threads bei dem kleineren RKL-Modell irritieren auch mich. Solnage es dafür keine Bestätigung gibt, gehe ich hierbei durchaus auch von der Möglichkeit aus, dass es sich um einen Typo handelt. Man wird sehen, bis zu RKL vergehen wohl noch um die 6 Monate.

*) Auch wenn es vielfach und relativ konsistent durch die Leaks/Presse geisterte, jedoch kürzliche Leaks zeigten deutlich kleinere Caches, die eher auf Sunny Cove hinweisen. Hier wird man einfach abwarten müssen ...

Steht Intel finanziell so schlecht da, dass sie auch noch den letzten Wurscht-Zipfel vermarkten müssen [...]

Dass es ihnen finanziell gut geht, weißt du voraussicht selbst, von daher eine unnötig rethorische Frage. Und schlussendlich gibt ihnen der Markt auch recht. Intel bietet seit vielen Jahren ein sehr differenziertes Portfolio an (nicht nur im Consumer-Segment) und das offensichtlich nicht ohne Grund.
Zum Markt gehören immer zwei, ein Anbiter und ein Käufer. Wenn letzterer irgendwelche Teile der Produktpalette für unsinnig erachtet und daher nicht kaufen würde, kannst du davon ausgehen, dass das in kurzer bis bestenfalls mittelfristiger Zeit zu einer Änderung/Anpassung beim Anbieter führen wird. Der Rückschluss ergibt sich damit von selbst, denn dass das Intel nicht aus Langeweile macht, dürfte ebenso offensichtlich sein, weil auch diese Produktdiversifikation mit zusätzlichen Aufwänden und Kosten bei Intel verbunden ist, sowohl rein technisch wie auch vertrieblich.

Und bei AMD sieht es ja nicht anders aus. Mit zunehmenden Ressourcen ihrerseits, fangen auch sie an ihr Portfolio zu differenzieren. Das scheiterte in der Vergangeneheit lediglich an ihrem kleinen Volumen und ihren beschränkten Ressourcen. Jetzt kommen XT-Refreshes hinzu, die sich irgendwo dazwischenschieben (obwohl Zen3 "kurz" bevorsteht), es kommen die Ryzen-Pro-Modelle, Threadripper wird um langsamer taktende pro-Varianten erweitert, parallel zur RDNA-GPU-Architektur hat man nun auch CDNA hervorgebracht, usw. Auch die machen das nicht aus Langeweile, sondern weil der Markt es von ihnen erwartet.
 
Zuletzt bearbeitet:
Spannend fände ich eine Architektur welche 4HT Threads auf 8 Kernen frei verteilen kann. Also quasi die Extraarbeit immer da einschiebt wo es am günstigsten scheint.
So dürften dann die Fälle wo HT an eher Nachteilig ist deutlich weniger werden. Aber ob das technisch geht :ka: ?

Das dürfte praktisch nicht möglich sein, da man Mikrotransaktionen nicht einfach an einen anderen Scheduler mit Zugriff auf andere L1-Cache-Bereiche übergeben kann. Für die von dir gewünschte Funktionalität müsste man im Prinzip einen Kern mit den Ressourcen von acht Kernen und mit 12-fachem HT fertigen. Letzteres wäre vergleichsweise einfach möglich, aber ein Scheduler über 64 Ports und L1-Caches in achtfacher Größe könnten unmöglich die heutige Geschwindigkeit erreichen und würden auch in ihrer Komplexität exponentiell wachsen, sodass das Projekt am Ende nicht nur viel zu teuer, sondern wegen zusätzlicher Latenzen und zusätzlichem Stromverbrauch auch langsamer wäre.


Dass es ihnen finanziell gut geht, weißt du voraussicht selbst, von daher eine unnötig rethorische Frage. Und schlussendlich gibt ihnen der Markt auch recht. Intel bietet seit vielen Jahren ein sehr differenziertes Portfolio an (nicht nur im Consumer-Segment) und das offensichtlich nicht ohne Grund.
Zum Markt gehören immer zwei, ein Anbiter und ein Käufer. Wenn letzterer irgendwelche Teile der Produktpalette für unsinnig erachtet und daher nicht kaufen würde, kannst du davon ausgehen, dass das in kurzer bis bestenfalls mittelfristiger Zeit zu einer Änderung/Anpassung beim Anbieter führen wird. Der Rückschluss ergibt sich damit von selbst, denn dass das Intel nicht aus Langeweile macht, dürfte ebenso offensichtlich sein, weil auch diese Produktdiversifikation mit zusätzlichen Aufwänden und Kosten bei Intel verbunden ist, sowohl rein technisch wie auch vertrieblich.

Und bei AMD sieht es ja nicht anders aus. Mit zunehmenden Ressourcen ihrerseits, fangen auch sie an ihr Portfolio zu differenzieren. Das scheiterte in der Vergangeneheit lediglich an ihrem kleinen Volumen und ihren beschränkten Ressourcen. Jetzt kommen XT-Refreshes hinzu, die sich irgendwo dazwischenschieben (obwohl Zen3 "kurz" bevorsteht), es kommen die Ryzen-Pro-Modelle, Threadripper wird um langsamer taktende pro-Varianten erweitert, parallel zur RDNA-GPU-Architektur hat man nun auch CDNA hervorgebracht, usw. Auch die machen das nicht aus Langeweile, sondern weil der Markt es von ihnen erwartet.

Sowohl XT als auch KS- und F-Modelle würde ich mittlerweile gar nicht mehr durch Kundenwunsch oder ökonomische Faktoren begründen, sondern als reines Marketing. Gerade bei Intels hohen Stückzahlen sind zusätzliche Modelle in den absatzstarken Klassen ein vertretbarer Aufwand und wenn man das eigentliche Portolio künstlich auf die doppelte Größe aufbläht, blockiert man einfach Platz in Top10-Listen, die sonst die Konkurrenz einnehmen könnte.
 
Am Ende ist Videoencoding nicht unbedingt der beste Workload, um sehr hochkernige CPUs zu testen bzw. zu benchmarken. Will man hier tatsächlich ausloten, was auf den CPUs an Durchsatz möglich ist, dann braucht es hier mehrere parallele Instanzen.

I/O: Das war nur eine Anmerkung, ein weiterer Punkt, der ab einer gewissen Auslastung auf die Rechnung einzahlt. Ein aktuelles 2-Kanal-Speicherinterface bietet grob 50 GiB/s durchsatz, ein 4-Kanal rd. 100 GiB/s, Epyc kommt in seinen größeren Modellen mit 8 Kanälen auf um die 200 GiB/s. Die spielen bei I/O-lastigen Workloads natürlich auch eine Rolle.

Zen3: Wie schon oben zuvor erklärt, hier darf man durchaus gesichert eine Leistungssteigerung im Bereich von +10 % bis bestenfalls +25 % erwarten, d. h. bspw. von einem 3950X auf einen 4950X. Aber selbst eine best case-Steigerung würde den 16-Kerner nicht in den Bereich eines 3970X heben (es sei denn natürlich, du vergleichst nicht korrekt und lastest den 32-Kerner mit deinem Benchmark nur unzureichend aus). Wenn du jetzt schon einen 3970X hast, brauchst du dir über einen 4950X keine Gedanken zu machen, versuche dann lieber deinen TR besser auszulasten, denn der kann deulich mehr.

Btw, wenn du schon weist, dass deine App maximal 18 Threads ausführt, dann kannst du von einem 3970X (32 Kerne, 64 Threads) mit nur einer Instanz natürlich keine übermäßigen Leistungssteigerungen erwarten, was auch deine gemessenen Renderzeiten erklärt. Versuche einfach mal mehrere Programminstanzen parallel auszuführen und ein paar unterschiedliche Projekte gleichzeitig zu rendern; dein Gesamtdurchsatz wird sich beträchtlich erhöhen.


Nun ich habe keinen 3970x,sondern nur einen i9 9980xe und hoffentlich bald sobald dann das ryzen 3950x system wirklich zum laufen gebracht wurde,auch einen 16 Kerner.Mir ist schon aufgefallen das ein 10 und 12 Kerner mit HT von Intel völlig ausgeastet wird.AUch ein 14 Kerner gewiss auch noch,habe es allerdings nie selbst getestet.Achja und ich verwende schon 2 instazen also 2 x die selbe Software.Könnte geringe Mehrleistung von 18 % gegenüber dem 16 Kerner ,wohl unter anderem auch an die nur 75 % auslastung daher rühren.Und das obwohl ich SMT schon eh beim testen so am ende rausbekommen habe.Das heißt also wenn man das so wie ich schon weis,dann wird Zen 3 erst recht nicht an einem Threadripper 3970x herankommen weil auch der 3950x keine 100 % auslastung erreicht.Könnte das die mehrleistung beeinflussen,wenn es keine 100 % auslastung hat oder ändert das nichts an das Ergebnis?
 
Zurück