News Core Ultra 400D/400DX: Intels Geheimwaffen gegen Ryzen X3D

Inzwischen sind die Ryzen mit 3D Cache nicht mehr eindeutig überlegen. Die aktuelle Generation von Intel kommt sehr nah an die Spieleleistung ran und ist als Allrounder klar besser.

Mich interessieren Stromverbräuche im Kleinbereich nicht sonderlich. Wichtig ist für mich, dass die CPU ein guter Allrounder ist. Deswegen würde ich aktuell den 270K Plus für 300€ jedem Ryzen Prozessor vorziehen.

Wenn es sich bewahrheitet, dass die kommenden Intel CPUs noch besser werden, dann muss AMD sich anstrengen. Ich sehe eine Wachablösung am Horizont.
 
Zuletzt bearbeitet:
Genau das steht in dem Satz den ich oben zitierte. :ka:

Und deine Artikel zeigen nullkomma nichts über architektonische Details. Da steht nur "is neu". Ja, hat nrn neuen Codenamen. Trotzdem werden sehr wahrscheinlich 95% identisch zum Vorgänger sein und der Rest optimiert werden. So wie es bei CPUs fast immer ist. Echte neue Architekturen sind selten und noch seltener erfolgreich. Das letzte Beispiel war ZEN/Ryzen1000. Bei intel dürfte das was heute aktuell ist noch zu großen Teilen Skylake bis Sandybridge sein.

Die Coves waren eine weitgehende Neuentwicklung und haben spätestens mit Golden, also der Alder Lake Generation, alles aus Skylake-Tagen über Board geworfen. Bei den E-Kernen gab es mit Skymont (Arrow Lake) zumindest so weit reichende Erweiterungen, dass die resultierenden Leistungseigenschaften nur noch wenig mit älteren Desktop-CPUs gemeinsam haben. Bei der Kommunikation innerhalb der Chips haben auch nur einzelne Elemente den Sprung zu Tiles überlebt. Also nein: auch ohne harten Bruch mit "komplett neuer Architektur" ist in den aktuellen Modellen nicht mehr viel altes zu finden und über Panther Lake weiter zu Nova könnte sich noch einmal einiges tun – auch wenn ich bislang nicht wüsste, was.

Das heißt aber alles nicht, dass CPUs plötzlich radikal besser werden. Um mit ähnlichen Fertigungsmöglichkeiten und mit ähnlichen Zielsetzungen ein radikal besseres Ergebnis zu erzielen, muss die Ausgangsposition miserabel gewesen sein. AMD hat mit Zen keine genial-überragende Architektur herbei gezaubert (sondern tatsächlich pro Takt und Kern weiter hinter Skylake hinterher gehechelt), sondern sie haben die zahlreichen, großen Fehler von Bulldozer beerdigt. Dito Intel bei Skylake => Conroe. Aber wenn der Ist-Zustand schon ganz gut ist, dann sorgen auch weitreichende Überarbeitungen nicht für ein komplett neues Ergebnis.

Guckt euch die Autoindustrie an, die alle paar Jahre neue Modelle entwickeln. Die sind zwar dann ein paar 100 kg schwerer und ein paar Zentimeter größer in jede Richtung (außer innen), fahren aber immer noch auf vier Rädern und das genauso "gut", wie ihre Vorgänger. Die spannenden Änderungen bei Nova Lake sind "zwei Compute Tiles" (für die Top-Modelle) und "viel Platz für Caches" (ab der Oberklasse), denn solche Entwicklungsziele gab es bei Arrow Lake einfach nicht.
 
Die Coves waren eine weitgehende Neuentwicklung und haben spätestens mit Golden, also der Alder Lake Generation, alles aus Skylake-Tagen über Board geworfen. Bei den E-Kernen gab es mit Skymont (Arrow Lake) zumindest so weit reichende Erweiterungen, dass die resultierenden Leistungseigenschaften nur noch wenig mit älteren Desktop-CPUs gemeinsam haben. Bei der Kommunikation innerhalb der Chips haben auch nur einzelne Elemente den Sprung zu Tiles überlebt. Also nein: auch ohne harten Bruch mit "komplett neuer Architektur" ist in den aktuellen Modellen nicht mehr viel altes zu finden und über Panther Lake weiter zu Nova könnte sich noch einmal einiges tun – auch wenn ich bislang nicht wüsste, was.
Dann braucht AMD, so verstehe ich deine Worte, eine neue Architektur, denn viel ist aus der aktuellen Architektur nicht mehr rauszuholen. AMD hat inzwischen mit seiner Zen5 und demnächst Zen6 Architektur so ziemlich alles ausgereizt (demnächst Doppel Cache; geringe Takt Leistungssteigerungen).

Intel hingegen hat den spezialisieren Cache auf Level 4 Basis noch gar nicht eingeführt und verbessert von Generation zu Generation zudem seine E-Cores mit beträchtlichen Leistungssprüngen.

Somit würde AMD am Ende seiner Ryzen Architektur stehen während Intel seine anfängt auszubauen.
 
Zuletzt bearbeitet:
Ich halte nicht viel von der Formulierung "am Ende einer Architektur" und "viel ist nicht mehr rauszuholen". Wie ausdrücklich geschrieben: AMDs Konkurrenz hatte schon länger keinen harten Bruch mehr. So circa seit 1995. Wenn AMD die wechselseitigen Optimierungen in verschiedenen CPU-Teilen fortsetzt, dann können sie "Zen N+1" noch lange fortsetzen. Die SIMD-Einheit von Zen 5 ist jedenfalls nicht für 1-2 Jahre konstruiert worden.
 
Zuletzt bearbeitet:
Das mit den signifikant verbessern der e Kerne ich hoffe du hast Recht. Weil genau das ist die Schwachstelle der Intel CPU. Ansonsten sehe ich Intel wirklich auf den richtigen Weg. Wenn das Problem also nicht wäre bei Intel ,würde Intel wohl weiter vorne sein und sogar den 9950x oder 9950x3d ganz schlagen. So reicht es halt noch nicht ganz . Mir ist schon klar das ich einen Mittelklasse CPU wie dem 265k mit einem highend Klasse wie dem 9950x/3d vergleiche . Dennoch fehlt die Leistung. Und auch wenn der 270/285k mehr Kerne wie e Kerne haben ,können sie sich halt kaum in bestimmten Anwendung absetzen. Das Problem ist halt das selbst die e Kerne noch so viel Strom ziehen und durch das das Power Limit sehr schnell erreicht sind .es sind halt rund 5 Watt pro e Kern. Und genau das führt halt dazu daß eben die Leistung einbricht. Also kann man sagen eigentlich sind die e Kerne beim Watt nicht das Problem. Die p Kerne brauchen nur halt sehr viel. Dafür sind sie aber super stark. Ich brauche halt nen hohen allcore Takt. Die e Kerne haben halt einen zu niedrigen. Hier kann Intel also durchaus was bewegen ,da bin ich mir sicher. Aber wie viel ist eine andere Frage. Bei AMD wird es auch spannend weil mehr Watt kann AMD nicht mehr drauf geben ohne gleich noch die Temperatur zu erhöhen. Also bleibt ihen nichts anderes übrig als bei anderen stellschrauben zu drehen.
 
Wenn das Problem also nicht wäre bei Intel ,würde Intel wohl weiter vorne sein und sogar den 9950x oder 9950x3d ganz schlagen.
Nach meinem Kenntnisstand ist der 285K in Spielen schneller als der 9950X ohne X3D. Im Leistungsindex von PCGH liegt er 2 % vor diesem im Gaming und 6 % hinter dem 9950X in Anwendungen. Der rund 300 Euro teure Intel Core Ultra 7 270 Plus ist zudem in allen Disziplinen schneller als der 9950X ohne X3D. Was Thomas schreibt, ergibt also Sinn.

lg
 
AMD wird sich jedenfalls bzgl. der AM5 Plattform etwas einfallen lassen müssen um nicht von der LGA1954 Plattform angehängt zu werden. Objektiv gesehen war LGA1851 ja schon eine sehr attraktive Basis.
Fluch und Segen, dadurch, dass Intel quasi monatlich neue Sockel auf den Markt wirft, haben sie kaum Probleme damit Altlasten über Bord zu werfen und Neuigkeiten einzubauen. Dafür braucht man aber eben immer ein komplettes System, oft genug mit neuem Speicher, neuem Board und neuer CPU; bei AMD kann man dagegen verhältnismäßig lange auf einem Board bleiben, dennoch schafft es AMD in der jünegren Vergangenheit ein mehr als attraktives Paket zu bieten und genug PCIe Lanes (außer für die drei weltweiten Nutzer mit 20 PCIe5.0 SSDs) bieten alle Plattformen.
Ob man Intel unerheblich wahrnimmt oder nicht hängt ja auch von einem selbst an.
Auch die Bayern werden von vielen dafür gehasst obwohl sie seit 20 Jahren schon nicht mehr überheblich auftreten (einzelne Funktionäre ausgenommen).
Wenn du Bayern als nicht überheblich wahrnimmst, muss es wirklich subjektiv sein. Kenne keinen Verein der überheblicher ist und das schon mit Saisoneröffnung wo man kurzerhand das Double zur Pflicht erklärt. Auch abseits von Rolex Kalle und AngerManager UH.

Intel hat bis 2020 / 2021 schon so einiges gerissen um ihr Image der überheblichen schwerfälligen Konzernmutti zu pflegen; ähnlich bspw. VW in Deutschland.

Schon mein Athlon 64 3500+ hat nur so geheißen, weil AMD damit suggeriert hat, dass man damit genau so schnell ist wie ein Pentium 4 3500 Mhz
Nur war das damals auch weitestgehend so; heute denken die Firmen sich ja das lustigste aus um zu verkaufen. Intel bspw. hat glaube ich über vier Gens hinweg die gleiche CPU verkauft, nur immer unter neuerem Namen. Nerven tut das schon.

Intel, der Erfinder des dicken Caches, hat endlich verstanden, was wir wollen – aber jetzt übertreiben sie richtig, hauen einfach voll auf die Kacke und sparen nicht am Cache.
Nur werden sie damit vermutlich zwei preislich relevante CPUs liefern, die 52 Kern CPU wird niemanden interessieren, denn entweder brauchst du Kerne oder Cache, zu selten beides, als das es im Desktop Sinn geben könnte.

Neue Kerne, neuer Sockel, neue Fertigung, neue Plattform, neue iGPU‑Generation und deutlich mehr Kerne – Arrow Lake war nur ein Zwischenschritt, Nova Lake hingegen der wirkliche Neustart. Oder liege ich da falsch?
Bei Intel ist selbst ein Refresh ein Neustart, schau mal Arrow Lake als Nachfolger von Meteor Lake / Raptor Lake, neue E-Kerne, neue P-Kerne, neue Fertigungen, neue iGPU Generation. Am Ende ist dennoch nix draus geworden, gut, auch weil man es falsch angegangen ist und nicht den AMD Move gemacht hat, man will nur noch in der oberen Mittelklasse mitmischen. Hätte man beim 265K aufgehört, wäre die CPU Gen echt gut gewesen, aber man musste den obsoleten 285k bringen.

Mach mal auf nem 9950er Ryzen und auf nem 285K ein Netflixvideo an und dann kuckste mal welche CPU dafür 15W und welche 50W verbraucht.
Es ist ein Problem, aber 50W sind nicht normal und liegen nach meiner Erfahrung zu 99% am Bord. Hab einen 5950X und bei Youtube etc. liege ich unter 30W @Stock, bei unter 20W mit UV. Den Vorteil hat Intel gerade mit der aktuellen Gen auch zu weiten Teilen abgegeben, früher lag man deutlich unter 10W und nun ist man gut was nach oben gesprungen.
Dann braucht AMD, so verstehe ich deine Worte, eine neue Architektur
Nochmal lesen!

AMDs Konkurrenz hatte schon länger keinen harten Bruch mehr. So circa seit 1995.
Wenn man den Pentium 4 (Netburst)ignoriert, dann ja. Der stellte schon einen recht harten Bruch dar, auch wenn man P6 ja fortlaufend weiterentwickelte und aus diesem schlussendlich Core wurde.

Nach meinem Kenntnisstand ist der 285K in Spielen schneller als der 9950X ohne X3D. Im Leistungsindex von PCGH liegt er 2 % vor diesem im Gaming und 6 % hinter dem 9950X in Anwendungen. Der rund 300 Euro teure Intel Core Ultra 7 270 Plus ist zudem in allen Disziplinen schneller als der 9950X ohne X3D. Was Thomas schreibt, ergibt also Sinn.
Das ist schon so, generell muss man aber auch sagen, dass AMD es aktuell nicht nötig gehabt hätte mehr Kerne zu bringen. Intel musste schon in die vollen gehen und man darf nicht vergessen, dass man bei Intel schon in N3 fertigt, während AMD in N4 einen Node (vieleicht keinen ganzen) Rückschritt in der Fertigung verkraftet und dennoch effizienter arbeiten kann als ein bis an die Kotzgrenze gezogener 285K.

Es ist alles ein wenig ins Blaue geraten, aber ich würde sagen, dass AMD in den Disziplinen Leistung / Kosten in der Herstellung vorne liegt, da man vermutlich einen 9950X3D nur minimal teurer fertigen lässt als einen 285k (auf Grund von N3, das wohl 30-35% teurer als N4 sein soll).

Also wenn man alles externe bereinigt, sprich gleiche Fertigung, gleiche Verlustleistung, gleiche Herstellungskosten, etc. dürfte AMDs Architektur der Intelschen aktuell noch überlegen sein. Mit dem Update wird es extrem spannend, AMD wird für uns Gamer 12 Kerne in einem CCD mit 3D bringen was mir viel Hoffnung macht, Intel wird erstmals seit langem wieder dicken Cache auf die Kerne schnallen, was mich auch hoffen lässt. Mein Gefühl sagt mir, dass Intel mehr im petto hat, aber ich weiß nicht, wie die Kerne auf Strom reagieren, hier sehe ich AMD eher im Vorteil, durch den großen Fertigungsstep erwarte ich mehr Takt als vorher, was bei Intel ja immer so eine Sache ist.
 
Interessant, wie viele Varianten da kommen werden.
Das dürfte die-verwertungsgetrieben sein. Nichts umkommen lassen. Alles zu Geld machen. Intel braucht Kohle.
Aber ehrlich gesagt mag ich diese P- und E-Core-Geschichte (und dann noch ne dritte Sorte aka LP-Kerne dazu) genauso wenig wie die aktuellen 16-Kern-Chimären mit X3D von AMD.

Und was soll eigentlich sowas schon wieder?
Core Ultra 9 400 22C = 6P+12E+4LP
Core Ultra 7 400D 24C = 8P+12E+4LP
Core Ultra 7 400K 24C = 8P+12E+4LP
Warum hat ein Ultra 9 weniger Powerkerne als ein Ultra 7? Da ist doch schon wieder Bauernfang bei MediaMarkt&Co. vorprogrammiert. Und dann gleich der Sprung auf 4 echte Kerne runter, nur weil das D bzw. K fehlt:
Core Ultra 7 400 16C = 4P+8E+4LP
Und hier das gleiche Spiel nochmal:
Core Ultra 5 400K/KF 22C = 6P+12E+4LP
Core Ultra 5 400 12C = 4P+4E+4LP
 
Nach meinem Kenntnisstand ist der 285K in Spielen schneller als der 9950X ohne X3D. Im Leistungsindex von PCGH liegt er 2 % vor diesem im Gaming und 6 % hinter dem 9950X in Anwendungen.
Naja kommt ganz drauf an. Bei mir weicht es halt von pcgh ab. Man kann sagen zum Glück. Wärend ein 9950x3d bei 4,8 GHz oder ein 9950x im Default langsamer sind als ein 265k bei RAM optimiert bis nix mehr geht ,ist ein 9950x3d der auf 4,8-5,2 GHz schwankt rund 2 % schneller als der 265k mit optimierten RAM. Wohin gegen ein 9950x3d mit ebenso optimierten RAM +200 MHz boost + -co also bei Spannung dazu führt das dieser auf 17 % ansteigt. Dabei jedoch dank der Watt Mauer der allcore Takt gedrosselt ist bei effektiven Takt. Ist schon spannend das AMD da mehr zulegt als Intel. Scheint wohl so zu sein das AMD mehr abhängig ist als Intel. Dann müsste ich das mit dem Zen 3 CPU ja auch sowas ähnliches hinlegen. Aber noch nie ausprobiert. Wird wohl mal Zeit alles Optionen zu nutzen. Wenn es so einfach ist 15 % noch heraus zu holen obwohl die CPU eigentlich gebremst wird.
So ein krasser Unterschied wird schwer sein das Intel das noch heraus holen kann.


Der rund 300 Euro teure Intel Core Ultra 7 270 Plus ist zudem in allen Disziplinen schneller als der 9950X ohne X3D. Was Thomas schreibt, ergibt also Sinn.

lg
Ja ich bin ja froh das es bei mir noch besser ist. Dafür hat der 285k nicht mehr zugelegt und stattdessen wird er dank der 248 Watt gedrosselt. Würde das Problem ein 285k nicht haben wäre mit Sicherheit der 285k/270k schneller aber so eben halt nicht.
Bei den e Kernen wird Intel wohl kaum noch was sparen können aber vielleicht bei den P Kernen. Dann könnten auch die e Kerne noch zu legen. Wenn also Intel es schafft bei 5,2 GHz den Stromhunger zu drosseln ,blieben den e Kernen mehr Strom übrig. Dann wäre auch mehr Takt möglich aber ist die Frage was Intel da so machen wird.
@BigBoymann
. Auch abseits von Rolex Kalle und AngerManager UH
Wer oder was ist denn ein Angermanager und was heißt das Uh am Ende davon ?
 
Zuletzt bearbeitet:
Naja kommt ganz drauf an. Bei mir weicht es halt von pcgh ab. Man kann sagen zum Glück. Wärend ein 9950x3d bei 4,8 GHz oder ein 9950x im Default langsamer sind als ein 265k bei RAM optimiert bis nix mehr geht ,ist ein 9950x3d der auf 4,8-5,2 GHz schwankt rund 2 % schneller als der 265k mit optimierten RAM.
Da liegst du falsch, schau dir mal den Beitrag hier an. Weiß nicht, ob du ihn schon gelesen hast, aber da geht noch einiges. Habe meinen 265K auch so betrieben, und der geht ab wie Schmidts Katze.


lg
 
Da liegst du falsch, schau dir mal den Beitrag hier an. Weiß nicht, ob du ihn schon gelesen hast, aber da geht noch einiges. Habe meinen 265K auch so betrieben, und der geht ab wie Schmidts Katze.


lg
Ja würde ich gerne aber sowas wie NoC-Fabric,d2d oder nug kann ich leider beim b860 nicht einstellen und der ringbus geht nur bis 38 und dann ist Schluss. Von 37 auf 38 brachte irgendwie keine Steigerung. Da greifen halt viel mehr Sachen ineinander rein . Ich habe dank der subtimings ,Latenz der unteren Timings die Leistung um 2,5 % gesteigert. Gemessen was so alles geht ist das irgendwie viel zu wenig. Tya noch ein neues zu kaufen und das andere mit Verlusten zu verkaufen und dann noch im Laden für die Arbeit zu bezahlen ist halt blöd. Und ob alles an Mehrleistung wirklich auch bei mir ankommt ist halt eine andere Frage. Die Timings mit cl26 wirkte bei mir ja garnicht. Bei AMD scheint dieser Effekt mehr Wirkung zu zeigen aber gut dann ist das halt so. Ich wollte eigentlich alles heraus holen aus dem ganzen aber dies ist halt leider nicht möglich. Ohne extra kosten wird das leider nix. Ich kann nur auf den Nachfolger warten.
 
Ja würde ich gerne aber sowas wie NoC-Fabric,d2d oder nug kann ich leider beim b860 nicht einstellen und der ringbus geht nur bis 38 und dann ist Schluss. Von 37 auf 38 brachte irgendwie keine Steigerung. Da greifen halt viel mehr Sachen ineinander rein . Ich habe dank der subtimings ,Latenz der unteren Timings die Leistung um 2,5 % gesteigert. Gemessen was so alles geht ist das irgendwie viel zu wenig. Tya noch ein neues zu kaufen und das andere mit Verlusten zu verkaufen und dann noch im Laden für die Arbeit zu bezahlen ist halt blöd. Und ob alles an Mehrleistung wirklich auch bei mir ankommt ist halt eine andere Frage. Die Timings mit cl26 wirkte bei mir ja garnicht. Bei AMD scheint dieser Effekt mehr Wirkung zu zeigen aber gut dann ist das halt so. Ich wollte eigentlich alles heraus holen aus dem ganzen aber dies ist halt leider nicht möglich. Ohne extra kosten wird das leider nix. Ich kann nur auf den Nachfolger warten.
Okay, dann verstehe ich dich, aber wie du sehen kannst, geht da einiges – man muss nur die richtige Hardware dafür haben.

lg
 
Was ich noch nicht ganz verstehe, da bin ich ehrlich, ist das dem Game egal, ob es ein hohen L3 oder L4 cache hat als Funktion das es ihm hilft? Und ist es egal, ob es ein 3D Cache ist, oder nicht? Oder müssen die Games erst dafür optimiert werden um dies genauso gut nutzen zu können wie AMD´s 3D Cache?
 
Da liegst du falsch, schau dir mal den Beitrag hier an. Weiß nicht, ob du ihn schon gelesen hast, aber da geht noch einiges. Habe meinen 265K auch so betrieben, und der geht ab wie Schmidts Katze.


lg
Hinzu kommt das sehr gute Preisleistungsverhältnis des 265K. Der 270K Plus kostet 320€ und ist auf dem Niveau eines 9950X und sehr nah an den 3D Cache Modellen bei der Spieleleistung.
 
Hinzu kommt das sehr gute Preisleistungsverhältnis des 265K. Der 270K Plus kostet 320€ und ist auf dem Niveau eines 9950X und sehr nah an den 3D Cache Modellen bei der Spieleleistung.
So sieht’s aus, aber um ehrlich zu sein, weiß ich nicht, ob man aus dem 270K noch so viel rausholen kann wie aus dem 265K. Dann wäre das Teil noch brutaler, als es ohnehin schon ist.

lg
Was ich noch nicht ganz verstehe, da bin ich ehrlich, ist das dem Game egal, ob es ein hohen L3 oder L4 cache hat als Funktion das es ihm hilft? Und ist es egal, ob es ein 3D Cache ist, oder nicht? Oder müssen die Games erst dafür optimiert werden um dies genauso gut nutzen zu können wie AMD´s 3D Cache?
Ich denke, dass dort nichts optimiert werden muss, die Technologie ist ja nichts Neues. Es wird immer wieder Spiele geben, die aus der Reihe tanzen und kaum Mehrleistung bringen, wie wir in Daves Benchmarks sehen konnten. Dann wird es auch wieder welche geben, die enorm davon profitieren, wie Baldur’s Gate.

lg
 
Was ich noch nicht ganz verstehe, da bin ich ehrlich, ist das dem Game egal, ob es ein hohen L3 oder L4 cache hat als Funktion das es ihm hilft? Und ist es egal, ob es ein 3D Cache ist, oder nicht? Oder müssen die Games erst dafür optimiert werden um dies genauso gut nutzen zu können wie AMD´s 3D Cache?
Grundsätzlich ist das Prinzip Cache nicht so schwer. Man hält Dinge extrem schnell vor die sehr häufig und zeitkritisch genutzt werden.
Weil es nun technisch extrem "teuer" wäre schnelle große (L1)-Caches zu verbauen hat man mehrere "Level" eingerichtet - von extrem schnell aber sehr klein (L1) über sehr schnell und mittelgroß (L2) zu langsamer aber groß (L3) und manchmal auch noch langsam und riesig (L4) - danach kommt dann RAM.

Jedes Programm, egal ob Spiel oder was anderes, läuft beim abarbeiten von Befehlen sehr vereinfacht gesagt gleich: Lade Daten --> verarbeite Daten --> schreibe Daten (load, compute, store). Beim Lade Daten kommt der Cache ins Spiel: Die gewünschten Daten sind bestenfalls im L1 vorhanden und können sofort verarbeitet werden. Wenn die CPU sie im L1 nicht findet geht sind in den L2 suchen. Treffer? Dann kanns weiter gehen, wenn nicht... in den L3 suchen gehen und so weiter.

Wenn nun ein L3 Cache sehr groß ist (völlig egal ob Tile, 3D oder sonstwie) erhöht sich schlichtweg die Chance, dass das gesuchte Datenpaket da schon drin ist und nicht erst aus dem vergleichsweise elend langsamen RAM geholt werden muss. Auf technisch gesagt die Anzahl von Cache misses (Daten nicht im Cache die nötig sind) verkleinert sich.

Dass Spiele da oft besser skalieren als viele andere Programme liegt in der "unvorhersehbaren" Natur von Spielen. Wenn ich ein Video konvertiere sind die Befehle in der CPU immer die gleichen, was passiert gut vorhersehbar und entsprechend immer kontrolliert alles im Cache was gebraucht wird, auch in einem kleineren Cache. Bei Spielen weiß der PC nie, was in der nächsten Sekunde berechnet werden muss da alles "live" je nach Spielerverhalten erzeugt werden muss. Hier ist ein großer Cache Gold wert, da viele "Optionen" reinpassen und viel vorgeladen werden kann - und dadurch seltener die Situation eintritt dass der Spieler oder die Spielengine etwas machen was unvorhergesehen war und deswegen die nötigen Daten nicht im Cache sind.

"Optimieren" ist da so eine Sache - prinzipiell arbeitet jeder bessere Kompiler so, dass das oben beschriebene ausgeführt wird, sprich wenn eine CPU spontan 100 MB Cache mehr an Bord hat wird sie diese auch nutzen. Nur kann man übergeordnet auf Spielebene optimieren indem man zum beispiel festlegt, dass ein bestimmtes Asset eines Levels immer im Cache bleibt sofern der groß genug ist da zu erwarten ist dass es ständig benötigt wird. Wenn beispielsweise die Zustände aller Einzelbewohner in Anno, deren Verhalten bei jedem Spieltick aus diesen Zuständen ermittelt wird, alle in den Cache passen, wird das viel schneller sein als das immer im RAM zu parken. Deswegen skaliert sowas wenn gut programmiert extrem gut mit Cache.
 
Grundsätzlich ist das Prinzip Cache nicht so schwer. Man hält Dinge extrem schnell vor die sehr häufig und zeitkritisch genutzt werden.
Weil es nun technisch extrem "teuer" wäre schnelle große (L1)-Caches zu verbauen hat man mehrere "Level" eingerichtet - von extrem schnell aber sehr klein (L1) über sehr schnell und mittelgroß (L2) zu langsamer aber groß (L3) und manchmal auch noch langsam und riesig (L4) - danach kommt dann RAM.

Jedes Programm, egal ob Spiel oder was anderes, läuft beim abarbeiten von Befehlen sehr vereinfacht gesagt gleich: Lade Daten --> verarbeite Daten --> schreibe Daten (load, compute, store). Beim Lade Daten kommt der Cache ins Spiel: Die gewünschten Daten sind bestenfalls im L1 vorhanden und können sofort verarbeitet werden. Wenn die CPU sie im L1 nicht findet geht sind in den L2 suchen. Treffer? Dann kanns weiter gehen, wenn nicht... in den L3 suchen gehen und so weiter.

Wenn nun ein L3 Cache sehr groß ist (völlig egal ob Tile, 3D oder sonstwie) erhöht sich schlichtweg die Chance, dass das gesuchte Datenpaket da schon drin ist und nicht erst aus dem vergleichsweise elend langsamen RAM geholt werden muss. Auf technisch gesagt die Anzahl von Cache misses (Daten nicht im Cache die nötig sind) verkleinert sich.

Dass Spiele da oft besser skalieren als viele andere Programme liegt in der "unvorhersehbaren" Natur von Spielen. Wenn ich ein Video konvertiere sind die Befehle in der CPU immer die gleichen, was passiert gut vorhersehbar und entsprechend immer kontrolliert alles im Cache was gebraucht wird, auch in einem kleineren Cache. Bei Spielen weiß der PC nie, was in der nächsten Sekunde berechnet werden muss da alles "live" je nach Spielerverhalten erzeugt werden muss. Hier ist ein großer Cache Gold wert, da viele "Optionen" reinpassen und viel vorgeladen werden kann - und dadurch seltener die Situation eintritt dass der Spieler oder die Spielengine etwas machen was unvorhergesehen war und deswegen die nötigen Daten nicht im Cache sind.

"Optimieren" ist da so eine Sache - prinzipiell arbeitet jeder bessere Kompiler so, dass das oben beschriebene ausgeführt wird, sprich wenn eine CPU spontan 100 MB Cache mehr an Bord hat wird sie diese auch nutzen. Nur kann man übergeordnet auf Spielebene optimieren indem man zum beispiel festlegt, dass ein bestimmtes Asset eines Levels immer im Cache bleibt sofern der groß genug ist da zu erwarten ist dass es ständig benötigt wird. Wenn beispielsweise die Zustände aller Einzelbewohner in Anno, deren Verhalten bei jedem Spieltick aus diesen Zuständen ermittelt wird, alle in den Cache passen, wird das viel schneller sein als das immer im RAM zu parken. Deswegen skaliert sowas wenn gut programmiert extrem gut mit Cache.
Das was du beschreibst entspricht dem, was ich auch während meiner Ausbildung gelernt habe.

Wobei der L4 Cache im Gegensatz zum RAM immer noch verallgemeinernd 50-100 mal schneller ist. Der Level 3 sollte 3-4 mal schneller sein als der L4 (sagt die KI).

Ich weiß gar nicht, ob es in Spielen einen großen Geschwindigkeitsvorteil gibt, ob nun L3 oder L4 Cache angesprochen wird?

Der L4 Cache ist größer (z.B. 128mb) und kann noch mehr fassen als ein Ryzen 3D Cache jemals vermag. Dieser ist als Anhängsel des L3 Caches konzipiert. Der Level 4 Cache lässt sich aber kostengünstiger, (vermutlich) um ein vielfaches erweitern.

Ergebnis: Mehr Daten können vorbehalten werden und das sollte den Geschwindigkeitsvorteil eines L3 Caches ausgleichen oder bei entsprechender Ausstattung überflügeln.

Wissen tue ich das aber nicht. Das sind nur Schlussfolgerungen. Aber für solche Fragen gibt es PCGH_Thorsten oder PCGH_Dave, die sich da besser auskennen als ich.
 
Zuletzt bearbeitet:
Ergebnis: Mehr Daten können vorbehalten werden und das sollte den Geschwindigkeitsvorteil ein L3 Caches ausgleichen oder bei entsprechender Ausstattung überflügeln.
Das wird häufig (leider) überschätzt. Das Ding ist, dass größerer Cache (in höheren Stufen) eine sehr ausgeprägte diminished returns Charakteristik hat. Wäre das nicht so hätten alle CPU-Hersteller schon lange Hunderte MB an Caches verbaut. Leider ist es so, dass die allermeisten Workloads nicht so arg viele ständig benötigte Daten verwenden und eher von sehr schnellen L1/l2 profitieren als von riesigen L3/L4, letzteres ist fast nur bei manchen Spielen der Fall - und entsprechend auf Plattformen wie unserer hier die sich viel damit beschäftigt overrated.

Die Kehrseite des ganzen ist: Cache (SRAM Zellen) benötigt viel Energie und Platz auf dem Die, ist also in jeder Hinsicht "teuer". Zusätzlich geht der Grenznutzen mit der Größe immer weiter gegen Null (ob ein L3/L4 Cache heute 100 oder 400 MiB groß ist macht in den allermeisten Fällen keinen Unterschied mehr). Daher ist das Mantra bei Cache nach wie vor "so viel wie nötig/nützlich, so wenig wie möglich". AMD hat mit ihrem X3D hier auch aus ihrer Marketingposition heraus strategisch eine Nische (Gaming) massiv bedient, für nahezu alles andere ist der große Cache oft völlig nutzlos. Dass Intel jetzt seinerseits einen bLLC bringt ist auch "nur" ein strategisches Konkurrenzprodukt um bei den Spielebenchmarks auch mal wieder einen setzen zu können für die sich vorher nicht wirklich interessiert wurde.
 
Zurück