Intel Raptor Lake: Core i9-13900K mit größeren Caches?

Cache benötigt viel Chipfläche und viel Energie. Es ist immer eine Gratwanderung was sich in Euro und in Watt noch rechnet. Sehr große Caches können schnell sein, die CPUs werden dadurch aber deutlich teurer und die möglichen Taktraten geringer (siehe auch 5800X3D gegenüber 5800X). Es gibt also optimale Punkte bei Performance pro Euro und Performance pro Watt und dieses Optimum liegt nunmal (für normalen Endanwenderworkload) nicht bei "maximale Cachegröße".
Hat Torsten ja schon gesagt, dass der Energieaufwand eher gering ist. Auch das mit dem Takt dürfte nicht das wahre Problem sein, denn OC-Versuche per BCLK haben gezeigt, dass der stacked Cache 5GHz locker mitmacht.

Ich habe immer noch teils den Verdacht, dass AMD den Ryzen 3D künstlich beschränkt. Das Marketing kann viel erzählen. ^^ Stellt euch die CPU mal mit 4.9GHz Boost in Games vor. Da würden ja selbst die großen Zen 4 Modelle nicht rankommen in den Spielerankings. Das wären locker 25% zum 5800X.

Eigentlich ist AMD am schnellsten. Sowohl beim Gaming (5800X3D) als auch bei der Mehrkernleistung (5950X).
Singlecore ist Intel deutlich vorne. Auch beim Gaming ist Intel vorne, sofern schneller DDR5 verwendet wird.
 
Zuletzt bearbeitet von einem Moderator:
Versteht mich bitte nicht so, dass Cache extrem viel Energie benötigt. Nur seht es von der Seite: Selbst wenn ein großer Zusatzcache unter Last nur 15W benötigt so sinkt das für die Kerne vorhandene Budget im Falle eines 5800x von 142 auf 127W. Das klingt nicht viel, bedeutet aber eben bei Last auf allen Kernen schon mal 200-300 MHz weniger oder ganz grob gesagt irgendwas um die 5 bis 10% wenige Kerntakt. Der Cache muss also IPC seitig schonmal mindestens diese 5 bis 10% bringen dass man nur so schnell ist wie vorher. In Spielen sieht man, dass der Gewinn sehr viel höher ist, da geht die Rechnung auf (zumindest die technische, die wirtschaftliche wie Torsten schon sagte ggf. weniger), bei vielen Anwendungen dagegen nicht.

Daher kam das Argument, dass auch technisch gesehen mehr Cache nicht zwangsläufig immer die bessere Option ist.


Aber was anderes zum Thema: Hab ich das wirklich falsch in Erinnerung, dass GoldenCove ohnehin schon größere Caches im Die hat (also beispielsweise 4MB pro 4er Cluster an eCores) und intel die nur beschnitten hat bei ADL? Da müssten sie für den Nachfolger eigentlich nur ihre eigene Bremse rauslöten :ugly:
 
Versteht mich bitte nicht so, dass Cache extrem viel Energie benötigt. Nur seht es von der Seite: Selbst wenn ein großer Zusatzcache unter Last nur 15W benötigt so sinkt das für die Kerne vorhandene Budget im Falle eines 5800x von 142 auf 127W.
Weiß nicht, ob man das so rechnen kann. Auf der anderen Seite spart der Cache ja auch Energie durch die gesparten Zugriffe auf den Hauptspeicher über den IF + I/O-Die. In Games spielt das max. Powerbudget eh keine Rolle, außer bei Rocket Lake... :fresse:

Aber was anderes zum Thema: Hab ich das wirklich falsch in Erinnerung, dass GoldenCove ohnehin schon größere Caches im Die hat (also beispielsweise 4MB pro 4er Cluster an eCores) und intel die nur beschnitten hat bei ADL? Da müssten sie für den Nachfolger eigentlich nur ihre eigene Bremse rauslöten
:ugly:
Jup, Sapphire Rapids hat 2MB L2 Cache. Man muss die Beschränkung hier einfach aufheben.
 
Zuletzt bearbeitet von einem Moderator:
Man sollte übrigens nicht den Fehler machen, den Cache zu addieren. Entscheidend ist, was ein Thread max. nutzen kann. Das sind bei Alder Lake 1.25MB + 30MB und bei Raptor Lake 2MB + 36MB. Das ist eine Steigerung von "nur" 21,6%.
 
Jetzt auch noch mehr Cache. Intel ist eh schon am schnellsten und dann noch schneller zoooom. AMD zittert!
:klatsch::wall:
Man sollte übrigens nicht den Fehler machen, den Cache zu addieren. Entscheidend ist, was ein Thread max. nutzen kann. Das sind bei Alder Lake 1.25MB + 30MB und bei Raptor Lake 2MB + 36MB. Das ist eine Steigerung von "nur" 21,6%.
Erfolgt die Zuordnung nicht pro Kern anstatt pro Thread? Dann wären das ja bei "normalem" HT 2 Threads anstelle von einem.
 
Man sollte übrigens nicht den Fehler machen, den Cache zu addieren. Entscheidend ist, was ein Thread max. nutzen kann. Das sind bei Alder Lake 1.25MB + 30MB und bei Raptor Lake 2MB + 36MB. Das ist eine Steigerung von "nur" 21,6%.

Du machst halt eben den Fehler den Cache doch zu addieren. Beim L2 Cache der P Kerne sind es 60% Steigerung und beim L2 Cache der E Kerne sogar 100%. Das wird beides sehr stark ins Gewicht fallen. (sofern die Gerüchte Korrekt sind)
 
Erfolgt die Zuordnung nicht pro Kern anstatt pro Thread? Dann wären das ja bei "normalen" HT 2 Threads anstelle von einem.
Pro Thread, aber Threads können Daten austauschen, was bezogen auf L1 und L2 sehr fix geht.
Du machst halt eben den Fehler den Cache doch zu addieren. Beim L2 Cache der P Kerne sind es 60% Steigerung und beim L2 Cache der E Kerne sogar 100%. Das wird beides sehr stark ins Gewicht fallen. (sofern die Gerüchte Korrekt sind)
Man darf halt schon entlang der Cachehierarchie addieren. Es ging mir ja um die Gesamtkapazität für einen Thread. Wenn es um die Geschwindigkeit geht, muss man trennen oder gewichten. Das stimmt schon.
 
Zuletzt bearbeitet von einem Moderator:
Man darf halt schon entlang der Cachehierarchie addieren.

Es ist strafrechtlich nicht verboten, von daher darf man das. Sinnvoll ist es nicht, da eine Vergrößerung des Caches sehr unterschiedliche Auswirkungen hat. Beim L1 Cache machen wenige Kilobyte schon einen riesen Unterschied, von einem MB brauchen wir garnicht zu reden. Bei L3 Cache fallen wenige KB nicht weiter ins Gewicht.

Da der L2 Cache angeblich stark gesteigert werden soll, sind da auch größere Auswirkungen zu erwarten.
 
"Das ist natürlich immer noch weniger, als AMD seinen Ryzen-Prozessoren - selbst ohne V-NAND - mitgibt"

Geiz ist Geil !
Oder eben halt auch nicht. Was nVidia am Speicher "geizt", macht INTEL dies am Cache ... :nene:

MfG Föhn.
Auch beim Gaming ist Intel vorne, sofern schneller DDR5 verwendet wird.
Ja, die Wahrheit schmerzt ! :nene:
Ich weiß, "Gammel RAM" und so ...

p.s. schnellen RAM können die "Anderen" frei auch ;)

MfG Föhn.
 

Anhänge

  • CPU Bench Games.jpg
    CPU Bench Games.jpg
    282,9 KB · Aufrufe: 83
  • CPU Bench 0522.jpg
    CPU Bench 0522.jpg
    290,5 KB · Aufrufe: 80
Zuletzt bearbeitet von einem Moderator:
"Das ist natürlich immer noch weniger, als AMD seinen Ryzen-Prozessoren - selbst ohne V-NAND - mitgibt"

Geiz ist Geil !
Oder eben halt auch nicht. Was nVidia am Speicher "geizt", macht INTEL dies am Cache ... :nene:

MfG Föhn.

Ich denke das ist eher Architektur bedingt, man verbrät mit den vielen Kernen und dem erwartet hohen Takt wohl schon genug Strom und damit auch vorallem Abwärme. :)
 
Wahnsinn, ganze 0,9% im Mittel. Der 5800X3D ist zwar auch nicht günstig, dafür kann man den mit noch schlimmerem RAM und 'nem B450-Mainboard für 50€ ganz gut betreiben (kann, nicht sollte). Ich hatte Ende Januar ein MSi B450M Pro-VDH Max im Angebot für 39€ gesehen.
 
Zuletzt bearbeitet:
Der Stromverbrauch von Caches ist relativ niedrig, wie der 5800X3D mal wieder eindeutig beweist. Der Rest stimmt aber um so mehr: Wie schon mehrfach vorgerechnet dürfte ein 5800X3D für AMD ähnlich teuer wie ein 5950X sein, der im gleichberechtigten Schnitt über Spiele und Anwendungen viel mehr Leistung und Effizienz bietet. Nur in Spielen, die schnell durch Speicherlatenzen ausgebremst werden, lohnt sich der Monster-Cache einigermaßen. Aber selbst hier würde ich schätzen, dass AMD den 5800X3D mit einer geringeren Marge als den 5800X, also letztlich auch über preissenkende Maßnahmen verkauft. Wäre der Mehraufwand voll eingepreist worden, wäre die CPU auch für Spieler weitaus weniger attraktiv.

Das ist so schlicht und ergreifend nicht richtig/wahr, was du hier schreibst.
Zum einen kannst du uns gerne mal die Rechnung zeigen, wo ein 5800X3D genauso teuer ist für AMD wie ein 5950X. Diesbezüglich gab es nämlich keine einzige Rechnung die das bestätigt.
Und zum anderen habt ihr selbst eine News zum Milan-X veröffentlicht, wo die Preisunterschiede zum normalen Milan 15% betragen und man gleichzeitig 60% in bestimmten Anwendungen bekommt. Was eher darauf schließen lässt, dass AMD sich noch eine extra Marge aus den Produkten holt.

Hier wird permanent der Fehler gemacht, dass Cache innerhalb eines CPUdesigns mit dem 3D-Cache gleichgesetzt wird und das ist einfach nur Käse. Ersterer führt nämlich in der Tat zu höheren Kosten, da dadurch die CPU Fläche zunimmt und weniger DIEs auf einen Wafer passen. Jedoch ist das hier eben nicht der Fall, egal ob mit oder ohne 3D-Cache es purzeln immer genausoviele Ryzen DIEs vom Wafer.

Die entscheidende Frage ist also, was kostet der extra 3D-Cache in der Herstellung? Von der Fläche her ist er deutlich kleiner wie ein Ryzen DIE, geht man also von der gleichen Yieldrate (korrigiert mich, aber bei reinem Speicher ist die in der Regel relativ hoch bei ausgereiften Prozessen und das haben wir in dem Fall) aus, so purzeln deutlich mehr 3D-Cache Speichersteine aus nem Wafer wie Ryzen DIEs. Ergo hätten wir da schonmal deutlich geringere Kosten.
Um es in Zahlen auszudrücken 81mm² zu 41mm², wie viel da pro Wafer mehr rausfallen darf dann gerne jemand anders ausrechnen ;-)
Dann wäre noch die Frage zu klären, was das Verfahren von TSMC kostet um beides zu vereinigen? Dazu hab ich kein belastbares Zahlenmaterial gefunden.
Also hilft an der Stelle nur ein Blick in AMDs Bilanzen, die eine stetig höhere Marge ausweisen, woraus sich vor allem auf Blick mit Milan-X ableiten lässt, dass AMD hier mindestens genauso hohe Margen einfährt wie mit Milan, tendenziell höher. (Weil es keinen Grund gibt Milan-X zu verramschen)
Und solange wir nicht wissen, was TSMC für das Verfahren berechnet kann man auch keine genaue Aussage treffen. Dass AMD also der 3D-Cache extrem teuer kommt, ist eine reine Annahme von dir und anderen Usern, für die es keinerlei Zahlenmaterial gibt.
Ansonsten darfst du das hier gerne mal im Detail vorrechnen und die Annahme auch mal konkret bestätigen.
 
Der 5800X3D zeigt sehr gut wie gut Cache beim zocken skaliert. Intel wird das schon länger auf dem Plan haben, kann mir aber vorstellen das sie sich den Cache für ZEN4 aufgespart haben weil sie eventuell taktmäßig ZEN4 nicht mehr viel entgegenzusetzen haben könnten, außer es gibt eine PV Anlage als kleines Zubehör dazu.
 
Zuletzt bearbeitet von einem Moderator:
Versteht mich bitte nicht so, dass Cache extrem viel Energie benötigt. Nur seht es von der Seite: Selbst wenn ein großer Zusatzcache unter Last nur 15W benötigt so sinkt das für die Kerne vorhandene Budget im Falle eines 5800x von 142 auf 127W. Das klingt nicht viel, bedeutet aber eben bei Last auf allen Kernen schon mal 200-300 MHz weniger oder ganz grob gesagt irgendwas um die 5 bis 10% wenige Kerntakt. Der Cache muss also IPC seitig schonmal mindestens diese 5 bis 10% bringen dass man nur so schnell ist wie vorher. In Spielen sieht man, dass der Gewinn sehr viel höher ist, da geht die Rechnung auf (zumindest die technische, die wirtschaftliche wie Torsten schon sagte ggf. weniger), bei vielen Anwendungen dagegen nicht.

Daher kam das Argument, dass auch technisch gesehen mehr Cache nicht zwangsläufig immer die bessere Option ist.

15 W wären schon viel. Ich schätze eher 10 W und davon müssen noch die Einsparungen beim RAM abgezogen werden. Betrachtet man die Untergrenze der TDP-Klassen, scheint AMD bei Milan-X gegenüber Milan mit miniaml 5 Prozent weniger Takt bei gleichem Stromverbrauch zu rechnen; aufgrund des allgemein effizienten Abstimmung dieser CPUs gibt es dort auch keine Temperatureffekte. Wenn zusätzlicher Cache in einem bestimmten Szenario gar nichts bringt, wäre es außerdem auch technisch leicht möglich, seinen Verbrauch durch Powergating auf null zu senken.

Aber was anderes zum Thema: Hab ich das wirklich falsch in Erinnerung, dass GoldenCove ohnehin schon größere Caches im Die hat (also beispielsweise 4MB pro 4er Cluster an eCores) und intel die nur beschnitten hat bei ADL? Da müssten sie für den Nachfolger eigentlich nur ihre eigene Bremse rauslöten :ugly:

Golden Cove ist nur eine Architektur, die sich auf verschiedene Arten implementieren lässt. Ich weiß nicht, ob jemals jemand bei Alder Lake unter dem Elektronen-Mikroskop nachgezählt hat, aber es gab zumindest nie Berichte über deaktivierte Cache-Bereiche. Bei Sapphire Rapids dagegen wird die gleiche Architektur mit mehr Cache und mit einer zusätzlichen, eigenständigen AVX512-Pipeline implementiert.

Die E-Cluster haben übrigens gar nichts mit Golden Cove zu tun, dass sind Tremont-Kerne. Aber für die gilt natürlich das Gleiche: Cache ist je nach Implementation variabel. Das praktiziert Intel eigentlich schon seit Beginn der integrierten L2s, dass man auf Basis der gleichen Architektur verschiedene Cache-Ausbaustufen baut. Mendocino hatte meinem Wissen nach die gleichen Rechenwerke wie Coppermine, nur weniger Cache. Gallatin war ein Prestonia mit doppeltem L3 und der wiederum war ein um L3 erweiterter Northwood. Penryn gab es mit 3 und mit 6 MiB je Chip (die 2-MiB-Versionen waren meinem Wissen nach teildeaktivierte 3-MiBler) und-so-weiter.

Der technische Aufwand für diese Flexibilität ist gering und wenn man in ausreichend großen Stückzahlen fertig, dass verschiedene Chips für verschiedene Marktsegemente praktikabel werden, dann spart man sehr viel Geld wenn nicht benötigter Cache gar nicht erst ausbelichtet wird. Wie gesagt: Das Zeug ist teuer. Pro Fläche müsste er sogar teurer als Logikschaltungen im gleichen Prozess sein, denn Cache braucht mehr Transistoren und Cache ist allgemein taktempfindlicher. Man hat also mehr Chancen auf Defekte und somit mehr Ausschuss bei gleicher Chipfläche – von der exponentiell mit der Chipgröße ansteigenden Gefahr, überhaupt einen Defekt zu haben, ganz zu schweigen.


:klatsch::wall:

Erfolgt die Zuordnung nicht pro Kern anstatt pro Thread? Dann wären das ja bei "normalem" HT 2 Threads anstelle von einem.

Sobald man mehr als einen Thread hat, kann der ohnehin nur noch einen Teil des Caches für sich beanspruchen. In der Summe aller Threads nähert man sich dann der Gesamtaddition allen nicht-inklusiven Speichers, aber die maximale Zwischenspeichergröße für einen einsamen Thread ergibt sich aus einem L2 + allem L3. Wie wichtig das für die Praxis ist, wäre ein anderes Thema.
 
Das mehr an Cache bezogen relativ zu den e cores ist irrelevant. (Große Zahlen nichts dahinter)
Das einzige was bleibt sind die 60% (bzw. + 6MB) mehr an L2 und ob dies ein signifikanter Performance boost geben wird bleibt abzuwarten.

Raptor Lake P-Core L2 - 2 MB (2 x 8 = 16 MB)
Alder Lake P-Core L2 - 1.25 MB (1.25 x 8 = 10 MB)
 
Zurück