Hm, bin ehrlich gesagt verwundert über deine Argumente.
PCIe 3 hat keine nennenswerten Auswirkungen in CPU-Tests (CPU-limitierten Szenarien). Die Gesamtgröße des Caches ist ja in der Regel nicht entscheidend, ansonsten müssten die 2-CCD Varianten von Ryzen 5000 mit 64MB L3 Cache deutlich schneller sein in Games, was takt- und corebereinigt nicht der Fall ist. Entscheidend ist vielmehr der pro Thread maximal verfügbare L3 Cache und der ist beim 5700G (1-CCD) und 3700X (2-CCX) mit 16MB identisch. So was wie shared oder Remote Cache gibt es bei Ryzen nicht.
Du kannst das Pferd auch anders herum aufzäumen. Warum bricht der 5700G gegenüber dem 5800X so deutlich ein? Der Takt ist ziemlich vergleichbar. Das PL ist nicht das Problem. Die Speicherspec ist identisch. Ist der Cache. Die IPC der Kerne spielt keine messbare Rolle.
Verstehe ich gerade auch nicht den Satz. Natürlich legen beide Archs zu, aber verglichen untereinander wird der Unterschied kaum messbar sein, weil das, was die CPUs schnell macht in Games nicht die Kerne mit mehr IPC sind, sondern der 3D Cache.
Und all das zeigen die Benchmarks mit dem 5700G.
Du verwirrst mich immer mehr bzgl. diesem Thema (nicht böse gemeint, aber meine Fragezeichen wachsen zunehmend).
(
Nachträglich ergänzt nach Durcharbeitung deines gesamten Posts: Vielleicht aber aufgrund nur einzelner, verwirrender Aussagen, s. u.)
Kurzform: Das Ergebnis 5700G zu 3700X ist vollkommen erwartbar und zeigt keine Überraschungen. Zudem zeigt es (anteilsmäßig) die Leistungsverluste durch einen kleineren Cache auf (relativ zu Vermeer).
Einerseits haben ich nirgends gigantische Leistungszugewinne von PCIe4 impliziert, andererseits wird die Beschränkung auf 3.0 dennoch einen kleine Effekt haben, möglicherweise hier gar einen etwas größeren, da hier wesentlich mehr Frames als in hohen Auflösungen berechnet werden und damit vermutlich auch noch etwas mehr über den PEG geschickt wird (
gesichert quantifizieren kann ich das nicht, lässt sich aber theoretisch leicht erahnen, denn wenn ich davon ausgehe, dass im Test angenommenerweise keine Assets nachgeladen werden müssen, steigt der Komminikaitonsaufwand zw. CPU und GPU dennoch mit jedem zusätzlichen Frame).
"
Die Gesamtgröße des Caches ist ja in der Regel nicht entscheidend"
Extrem obskur (
selbst im Rahmen deiner ansonsten zu diesem Thema getätigten Aussagen; ich vermute hier hast du dich vertan? Andererseits verfolgt du den Gedanke aj nachfolgend gar noch weiter?!?), denn AMD zeigte mit ihrer frühen V-Cache-Demonstration genau das Gegenteil und der um 200 % größere L3$ soll hier angeblich +12 bis +15 % mehr Fps bringen. und die Größe des L3$ ist der einzige Unterschied der V-Cache-Modelle nach AMDs bisherigen Aussagen.
Übrigens, dass die 2-CCD-Modelle keine gigantischen Leistungs-Booster aufgrund des Caches erfahren liegt schlicht daran, dass hier Daten redundant in beiden Caches vorgehalten werden. Effektiv ist das ein 2x32 MiB L3$ und kein 64 MiB L3$. Müssten hier Kerne von CCD1 unentwegt wegen Datentransfers den Weg über den IF und IOD nehmen um auf den Cache des CCD2 zuzugreifen, würde das den Chip beträchtlich ausbremsen und das zusätzlich, denn die Latenzen erhöhten sich bereits alleine in Verbindung mit der Vergrößerung auf 32 MiB/CCD mit Zen2.
Entsprechend schreibt auch AnandTech: "
The single chiplet design means 32 MB of L3 cache total (technically it’s still the same that a single core can access as the Ryzen 9 parts" und man sieht im Latency-Diagramm des 5950X auch, dass die Latenzen um ein Vielfaches ansteigen, sobald man die 32 MiB überschreitet. (
Beim 3950X findet diese "Latenz-Explosion" entsprechend bereits bei 16 MiB statt, weil hier dass ältere CCD bereits einen zweigeteilten L3$ besaß.)
Und dann verwirrst du gleich noch mehr im Kontext deiner vorausgegangenen Aussagen, denn
"
Entscheidend ist vielmehr der pro Thread maximal verfügbare L3 Cache und der ist beim 5700G (1-CCD) und 3700X (2-CCX) mit 16MB identisch. So was wie shared oder Remote Cache gibt es bei Ryzen nicht."
die wiederum ist plausibel. Witzigerweise widersprichst du dir damit aber gar selbst, s. o.
Und das hat nichts mit das Pferd-von-hinten-aufzäumen zu tun. Beim 5700G und 3700G hat man grob vergleichbaren Takt und einen vergleichbar großen L3$. Entsprechend fällt der Leistungszugewinn der Zen3-APU gering aus, weil hier die Zugewinne durch den größeren Cache fehlen, der offensichtlich einen nennenswerten Anteil an den Gesamtzuwächsen von Zen3 auf dem Desktop hat.
Ahhrg ... schon wieder Missverständnisse? Jedenfalls dein letzter Absatz deutet darauf hin:
"
Verstehe ich gerade auch nicht den Satz. Natürlich legen beide Archs zu, aber verglichen untereinander wird der Unterschied kaum messbar sein, weil das, was die CPUs schnell macht in Games nicht die Kerne mit mehr IPC sind, sondern der 3D Cache."
Noch mal: Ich rede immer noch und unverändert von absoluter Leistung:
Zen2 : 100
Zen3 : 115
Zen3+VC: 130
Zen4: 130
Zen4+VC: 145
Also bringt auch die Kombination des V-Cache mit Zen4 gegenüber der reinen Basisarchitektur noch einmal ein signifikantes Leistungsplus. (
Die Werte nicht wörtlich nehmen, rein zu Demonstrationszwecken).
Was natürlich absurd ist, wäre, dass ein V-Cache bei Zen3 +15 bringt, bei Zen4 aber plötzlich nur +5 oder gar +30 bringen können soll. (
Genaugenommen würde der Zugewinn gar tendenziell höher werden, da bei grob gleichschnellem DRAM die schnellere CPU zunehmend ausgebremst wird.)
Darüber hinaus an deinen früheren Satz angelehnt:
"
Meine ursprüngliche These war, dass Zen 4 (mit 3D Cache) im Vergleich mit Zen 3 (auch mit 3D Cache!) nicht mehr so stark bei der Gamingleistung zulegen wird ..."
Absolut gesehen wäre diese Aussage falsch (s. o. 130 vs. 145), wenn du dagegen den relativen Zugewinn meinst, dürfte das grob hinkommen, wobei, wie schon gesagt, eine noch schnellere CPU noch etwas mehr von einem größeren L3$ profitieren wird.
Anders dargestellt:
Theoretische IPC, wenn das DRAM nicht beschränken würde:
Zen3: 100
Effektive IPC im regulären Ausbau: 32 MiB L3$ + 3200er DRAM
Zen3: 83
Effektive IPC mit 96 MiB L3$
Zen3: 95
Zen4's theoretische IPC wird entsprechend deutlich höher liegen und die wird sich ähnlich verhalten.
Letzten Endes bestimmt die Cache-Größe einfach in welchem Umfang die jeweilige Architektur ihren vollen, theoretischen Leistungsdurchsatz entfalten kann. Dass die Cache-Größen typischerweise weit unterhalb des effektiven Maximums konzipiert werden, ist schlicht ein wirtschaftlicher Faktor, denn mit bspw. 32 MiB kann Zen3 seine Leistung offensichtlich schon ausreichend gut entfalten, mit dagegen 96 MiB offensichtlich gar noch deutlich besser (in vielen Szenarien). Möglicherweise würden selbst 128 MiB noch was signifikant bringen, darüber hinaus dürfte die "Wirkkurve" jedoch zunehmend abflachen, da vollkommener Random-Access dann doch eher wieder ein theoretischer Benchmark ist.
Bei Zen4 wird es gleichermaßen sein. Reguläre Modelle werden vielleicht weiterhin unverändert 32 MiB on-die haben. darüber hinaus wird es möglicherweise auch hier später erneut V-Cache-Modelle geben. Hier kann ich mir gut vorstellen, dass AMD die hinauszögern wird um Meteor Lake zu kontern, da man vielleicht bis dahin ansonsten nichts Neueres haben wird. (Zen5 dürfte wohl erst 2024 erscheinen).
Es wird interessant zu sehen sein, was eine mögliche HEDT-Plattform auf Basis von Sapphire Rapids SP werden könnte, wenn die bspw. auch 32 GiB HBM2 bieten sollten. Da hier ein DRAM-less Mode (zumindest beim Server) möglich sein soll, könnte man hier ein System mit gigantischer Bandbreite zusammenzimmern (wohl. 500+ GiB/s, also grob Faktor 5x ggü. regulärem 2-Kanal-DDR5). Eine jedoch andere Frage ist, wie sich das HBM2 bzgl. Latenzen verhält, wobei, da das alles on-Chip ist, wären die möglichen negativen Effekte vermutlich eher geringer. Könnte ein Enthusiast-Gamers-Dream werden.