Ryzen 7000: Gerüchte zum Release im Herbst

blautemple · 9. Mai 2022

Zer0Strat schrieb:
Die Leaks sind da auch wenig glamourös.

5600MT/s 1 Dimm + single ranked

5200MT/s 1 Dimm + dual ranked

4800MT/s 2 Dimms + single ranked

4400MT/s 2 Dimms + dual ranked

Der letzte Fall dürfte Standard in den Tests sein

Wie kommst du darauf? Es gibt aktuell kein einziges 16GB Dual Rank Modul.
Ich tippe mal das damit, wie bei Intel, die Dimms per Channel gemeint sind und damit wäre bei Boards mit 4 Slots 4800MT/s der Standard und bei 2 Slots 5600MT/s.

gruffi · 10. Mai 2022

Zer0Strat schrieb:
Alder Lake hat 5 x mal mehr L2 Cache als Comet Lake, 40% mehr IPC und 50% mehr L3 Cache, aber bei gleichem Speicher ist Alder Lake nur rund 16-18% schneller als Comet Lake. L2 wird überschätzt, was Spiele betrifft.

Alder Lake hat aber relativ schlechte Cache Latenzen. Zudem ist die Geschwindigkeit des L1 und L2 im Vergleich zu den Vorgängern insgesamt niedriger. Grösse alleine sagt nicht viel aus.

Zer0Strat schrieb:
~12% kommmen vom doppelten L3 Cache pro CCD und rund 6% vom höhere Takt. Da bleibt ansonsten nicht viel.

Eher nicht. Es sind ja nur ~4% maximaler Taktunterschied zwischen 3950X und 5950X. Da können keine 6% durch den Takt kommen. Und wenn man die 15% vom 5800X3D durch dreifachen L3 mit etwas schlechteren Latenzen und niedrigerer Taktrate betrachtet, dann wären vielleicht 12% durch doppelten L3 realistisch. Wenn er denn wirklich doppelte Kapazität hätte. So wie bei Vermeer im Vergleich zu Cezanne. Hat er aber nicht. Vermeer und Matisse haben die gleiche L3 Kapazität. Nur hat der L3 Zugriff bei Matisse teils eine höhere Latenz. Das macht aber keine 12% aus. Zumal der RAM Zugriff immer noch deutlich langsamer ist. Der L3 Zugriff limitiert auch bei Zen 3 schon vor den 32 MB, z.B. aufgrund des L2 TLB. Anandtech macht da immer recht interessante Analysen. Ich kann nur empfehlen, sich das mal durchzulesen. Ich denke ein Grossteil der höheren Gaming Performance ist auf jeden Fall auch auf die Verbesserungen der Architektur zurückzuführen. Hier wurden einige Flaschenhälse angegangen, was gerade auch bei Spielen einiges bringen sollte. Wie Prefetching, Micro-op Cache oder Load/Store.

Zer0Strat schrieb:
Zen 4 bringt vielleicht so 20-25% mehr IPC mit (was kaum Spieleleistung generiert, weil Spiele am Speicher hängen)

Nee, so einfach ist das nicht. Denn die Verbesserungen an der Architektur für mehr IPC sorgen genau dafür, dass die Daten effizienter und schneller von der Pipeline abgearbeitet werden können. So wie schnellerer Cache und Speicher dafür sorgen, dass die Daten schneller eingelesen werden können. Die Balance ist entscheidend.

Zer0Strat schrieb:
Mit DDR5-4800 taktet der IF mit 1200MHz. Mit DDR4-3200 hingegen mit 1600MHz. Das muss unweigerlich zu höheren Latenzen führen. Die Bandbreite wird gewiss doppelt so hoch sein.

Sofern man mit mehr Bandbreite höhere Latenzen mindestens kompensieren kann, sehe ich da kein Problem.

Zer0Strat schrieb:
Wo teasert AMD Zen 4 fürs Gaming?

Z.B. wurde das 5 GHz All Core Sample auf der CES anhand eines Spiels demonstriert. AMD hat auch immer wieder in Interviews betont, dass ein Fokus von Zen 4 Gaming war.

Zer0Strat schrieb:
Geringerer Takt des IFs, siehe oben.

Und das wurde wo offiziell bestätigt? Wissen wir, wie das IF in Zen 4 konkret arbeitet? Ich denke nicht. Insofern bleibt das spekulativ. Aber wie schon gesagt, höhere Latenzen sind an der Stelle vernachlässigbar, wenn man in der gleichen Zeit mehr Daten lesen oder schreiben kann. Latenz ist für den Cache wichtiger.

Zer0Strat schrieb:
Zen 3 hat aber das bekommen, was Spiele schnell macht: mehr Cache.

Nope. Wie oben schon gesagt, an der Kapazität hat sich mit Zen 3 nichts geändert.

Gelöschtes Mitglied 217606 · 10. Mai 2022

blautemple schrieb:
Wie kommst du darauf? Es gibt aktuell kein einziges 16GB Dual Rank Modul.
Ich tippe mal das damit, wie bei Intel, die Dimms per Channel gemeint sind und damit wäre bei Boards mit 4 Slots 4800MT/s der Standard und bei 2 Slots 5600MT/s.

Ich komme da nicht drauf. Es ist ein Gerücht. ^^ Bei Intel sieht es übrigens so aus. Single vs. dual ranked spielt nur eine Rolle, wenn 4 Module verwendet werden.

gruffi schrieb:
Alder Lake hat aber relativ schlechte Cache Latenzen. Zudem ist die Geschwindigkeit des L1 und L2 im Vergleich zu den Vorgängern insgesamt niedriger. Grösse alleine sagt nicht viel aus.

Nah, Alder Lake hat rund 15% schlechtere L2 Latenzen im Vergleich zu Rocket Lake. Man muss das in Relation setzen. Durch die schiere Größe wird ein großer Vorteil gewonnen. Die Hitrate steigt dadurch beachtlich an.

Anandtech schreibt dazu:

On the L2 side of things, compared to Rocket Lake’s Willow Cove cores, Alder Lake’s Golden Cove cores considerably increase the L2 cache from 512KB to 1.25MB. This does come at a 15% latency degradation for this cache, however given the 2.5x increase in size and thus higher hit rates, it’s a good compromise to make.

gruffi schrieb:
Eher nicht. Es sind ja nur ~4% maximaler Taktunterschied zwischen 3950X und 5950X. Da können keine 6% durch den Takt kommen.

Hast du die CPUs da? Hast du umfangreiche Tests gemacht? Das ist bei mir tatsächlich der Fall, ansonsten würde ich nicht solche Aussagen tätigen. Der 3950X boostet in Spielen auf ca. 4.3GHz allcore, der 5950X liegt fast 500MHz drüber. Rechnen wir mit 4.75GHz im Mittel, dann kommen wir auf ca. 10.5% mehr Takt, welche in ca. 6% mehr Leistungen umgewandelt werden können.

Edit: Hier mal ein Beispiel von meinem Alder Lake Launchreview. Das höchste, was ich an Boosttakt gefunden habe, ist Crysis Remastered. Das sind nicht mal 4.3GHz CPU Max Clock im Mittel.

gruffi schrieb:
Und wenn man die 15% vom 5800X3D durch dreifachen L3 mit etwas schlechteren Latenzen und niedrigerer Taktrate betrachtet, dann wären vielleicht 12% durch doppelten L3 realistisch.

Doch, das macht ca. 12%. Hier bei PCGH ist der 5800X3D 22% schneller als ein 5800X. Taktbereinigt sind das locker 25%. Das kommt ausschließlich vom Cache. Und du zweifelst immer noch daran, dass 12% bei Vermeer durch den Cache kommen? Du machst dabei übrigens einen Denkfehler, siehe folgende Punkte.

gruffi schrieb:
Wenn er denn wirklich doppelte Kapazität hätte. So wie bei Vermeer im Vergleich zu Cezanne. Hat er aber nicht. Vermeer und Matisse haben die gleiche L3 Kapazität. Nur hat der L3 Zugriff bei Matisse teils eine höhere Latenz. Das macht aber keine 12% aus.

Es zählt aber nicht die Gesamtkapazität, sondern jene Kapazität auf die ein Thread maximal zugreifen kann, ohne teure Remotezugriffe auf den L3 Cache des anderen CCX's.

gruffi schrieb:
Zumal der RAM Zugriff immer noch deutlich langsamer ist. Der L3 Zugriff limitiert auch bei Zen 3 schon vor den 32 MB, z.B. aufgrund des L2 TLB. Anandtech macht da immer recht interessante Analysen. Ich kann nur empfehlen, sich das mal durchzulesen.

Wie kann denn Ryzen 3D taktbereinigt 25% in Games zulegen, wenn der L2 der (dominierend?!) limitierende Faktor ist?

gruffi schrieb:
Ich denke ein Grossteil der höheren Gaming Performance ist auf jeden Fall auch auf die Verbesserungen der Architektur zurückzuführen. Hier wurden einige Flaschenhälse angegangen, was gerade auch bei Spielen einiges bringen sollte. Wie Prefetching, Micro-op Cache oder Load/Store.

Nein, du irrst dich. Der Großteil der Gamingperformance bei Vermeer kommt durch Cache und Takt. Außerdem, wie kann der Flaschenhals angegangen werden, indem man die Cores aufbohrt, wo doch der Flachenhals weiter "vorne", nämlich beim Speichersystem (Caches gehören dazu) liegt?

Teile der Leistungsteigerungen kommen natürlich durch die bessere Architektur. Das ist aber weniger als du denkst.

gruffi schrieb:
Nee, so einfach ist das nicht. Denn die Verbesserungen an der Architektur für mehr IPC sorgen genau dafür, dass die Daten effizienter und schneller von der Pipeline abgearbeitet werden können. So wie schnellerer Cache und Speicher dafür sorgen, dass die Daten schneller eingelesen werden können. Die Balance ist entscheidend.

Aber die Pipeline (ist übrigens was Logisches, nichts Physikalisches) muss doch schlicht auf Daten warten, wenn das Speichersystem limitiert. Schau dir einfach mal die Hitrates auf die Caches mit einem Profiler an.

Aber ja, die Balance ist tatsächlich entscheidend, denn andererseits bringt es wenig, wenn das Speichersystem blitzschnell ist, aber die Kerne zu schwach sind, die Daten wegzuschaufeln. Genau das ist bei modernen Architekturen aber nicht Fall. Prefetching kann übrigens keine Wunder bewirken, nur mal so am Rande. Je "randomisierter" auf die Daten zugriffen wird, desto weniger bringt Prefetching.

gruffi schrieb:
Sofern man mit mehr Bandbreite höhere Latenzen mindestens kompensieren kann, sehe ich da kein Problem.

Könnte man, aber wie soll das gehen, wenn das Grundprinzip weiterhin ein Interconnect auf einem Substrat ist? Latenzen hängen nun mal stark am Takt. Klar, es gibt immer weitere Möglichkeiten, aber am Ende müssen sie geringere Taktraten überkompensieren. Ich bin wirklich gespannt, wie sie das anstellen wollen.

gruffi schrieb:
Z.B. wurde das 5 GHz All Core Sample auf der CES anhand eines Spiels demonstriert. AMD hat auch immer wieder in Interviews betont, dass ein Fokus von Zen 4 Gaming war.

In welchem Interview wurde das gesagt, dass der Fokus Gaming war? Ich denke sogar, dass Zen 4 in Games scheinen kann. Dafür braucht es aber sehr schnellen DDR5 oder eben den Refresh mit stacked L3 Cache.

gruffi · 10. Mai 2022

Zer0Strat schrieb:
Hast du die CPUs da? Hast du umfangreiche Tests gemacht? Das ist bei mir tatsächlich der Fall, ansonsten würde ich nicht solche Aussagen tätigen. Der 3950X boostet in Spielen auf ca. 4.3GHz allcore, der 5950X liegt fast 500MHz drüber. Rechnen wir mit 4.75GHz im Mittel, dann kommen wir auf ca. 10.5% mehr Takt, welche in ca. 6% mehr Leistungen umgewandelt werden können.

Wie viele Spiele hast du das denn getestet? Sind es genügend, um aussagekräftig zu sein? Welche Spiele können einen 16-Kern Prozessor wirklich auslasten? Dürften relativ wenige sein. Spiele sind eher Teillast. CB hat bei 3 Spielen im Schnitt etwas weniger als 10% ermittelt. Für Rückschlüsse bräuchte es aber mehr Messwerte. Und wie kommst du auf 6%? Dafür bräuchte man ja Messwerte bei identischem Durchschnittstakt? Sowas zu ermitteln dürfte schwierig werden. Aber selbst mit 6% sieht man, dass immer noch sehr viel bis 30% fehlt, was zu einem grossen Teil auch durch die Architektur kommen muss.

Zer0Strat schrieb:
Doch, das macht ca. 12%.

Unwahrscheinlich. Nochmal, physisch den dreifachen Cache zu haben ist was völlig anderes als gleich viel Cache zu haben mit teilweise höherer Latenz.

Zer0Strat schrieb:
Es zählt aber nicht die Gesamtkapazität

Doch, die zählt sehr wohl. Da machst du einen Denkfehler. Wie ich schon sagte, greift ein Thread auf den "fremden" L3 zu, dann ist die Latenz immer noch deutlich besser als wenn er auf den RAM zugreifen müsste. Laut AT etwa Faktor 3 geringer.

Zer0Strat schrieb:
Wie kann denn Ryzen 3D taktbereinigt 25% in Games zulegen, wenn der L2 der (dominierend?!) limitierende Faktor ist?

Er legt taktbereinigt aber nicht 25% zu. Und dass L2 der limitierende Faktor ist, habe ich auch gar nicht gesagt. Ich sagte, dass auch Zen 3 schon vor den 32 MB L3 eine Latenz Penalty besitzt. Was den effektiven Latenz Vorteil mindert.

Zer0Strat schrieb:
Nein, du irrst dich.

Denke ich nicht. Ein grosser Teil kommt definitiv auch durch die verbesserte Architektur. Lass es 10% Cache sein, 5-7% Takt, dann bleiben immer noch mindestens 10% durch die Architektur.

Zer0Strat schrieb:
Außerdem, wie kann der Flaschenhals angegangen werden, indem man die Cores aufbohrt, wo doch der Flachenhals weiter "vorne", nämlich beim Speichersystem (Caches gehören dazu) liegt?

Flaschenhälse können an diversen Stellen liegen, nicht nur beim Speichersystem.

Zer0Strat schrieb:
Aber die Pipeline (ist übrigens was Logisches, nichts Physikalisches) muss doch schlicht auf Daten warten, wenn das Speichersystem limitiert.

Und wenn die Pipeline nicht schnell genug Daten verarbeiten kann, dann muss der Prefetcher warten, um neue Daten nachzuschieben, selbst wenn diese bereits zur Verfügung stehen. Was willst du also damit sagen? Wie schon gesagt, die Balance muss stimmen.

Zer0Strat schrieb:
Könnte man, aber wie soll das gehen, wenn das Grundprinzip weiterhin ein Interconnect auf einem Substrat ist?

Das hat doch nichts zu sagen. Dem Zen 4 IF wird schon seit letztem Jahr doppelt so viel Bandbreite bei gleichem Takt nachgesagt im Vergleich zum Zen 3 IF. Also selbst mit weniger Takt kann man so mehr Durchsatz erzeugen. Also warten wir doch einfach mal ab, was Zen 4 zu bieten hat. Jetzt irgendwas als Fakt hinzustellen, was gar keiner ist, bringt nichts.

Zer0Strat schrieb:
In welchem Interview wurde das gesagt, dass der Fokus Gaming war? Ich denke sogar, dass Zen 4 in Games scheinen kann. Dafür braucht es aber sehr schnellen DDR5 oder eben den Refresh mit stacked L3 Cache.

Ich führe keine Strichliste mit Interviews von AMD, wo über Gaming geredet wird. Falls du das meinst. Lies dir einfach mal ein paar Artikel durch. AMDs Joseph Toa betonte z.B. letztens explizit in einer "Meet the Experts" Episode, dass Raphael AMDs erste DDR5 Plattform für Gaming sei.

Gelöschtes Mitglied 217606 · 10. Mai 2022

gruffi schrieb:
Wie viele Spiele hast du das denn getestet? Sind es genügend, um aussagekräftig zu sein? Welche Spiele können einen 16-Kern Prozessor wirklich auslasten? Dürften relativ wenige sein. Spiele sind eher Teillast. CB hat bei 3 Spielen im Schnitt etwas weniger als 10% ermittelt. Für Rückschlüsse bräuchte es aber mehr Messwerte.

Es geht doch beim Max-Boost nicht um die Auslastung der CPU, nicht auf Spiele bezogen. Ich habe 10 Spiele getestet, welche alle möglichen Lastszenarien abdecken. Der Taktunterschied liegt bei knapp unter 500MHz im Mittel.

gruffi schrieb:
Und wie kommst du auf 6%? Dafür bräuchte man ja Messwerte bei identischem Durchschnittstakt? Sowas zu ermitteln dürfte schwierig werden. Aber selbst mit 6% sieht man, dass immer noch sehr viel bis 30% fehlt, was zu einem grossen Teil auch durch die Architektur kommen muss.

Exakt, man braucht Taktskalierungstests, welche ich gemacht hatte...

gruffi schrieb:
Doch, die zählt sehr wohl. Da machst du einen Denkfehler. Wie ich schon sagte, greift ein Thread auf den "fremden" L3 zu, dann ist die Latenz immer noch deutlich besser als wenn er auf den RAM zugreifen müsste.

Wirklich? Was glaubst du, wie hoch die RAM-Latenz ist? ^^

Laut AT etwa Faktor 3 geringer.

Hui, wo sagen sie das? Bezogen auf welche Gen?

gruffi schrieb:
Er legt taktbereinigt aber nicht 25% zu.

Doch, es sind taktbereinigt ca. 25%. Es ist doch wirklich nicht schwer, das abzuschätzen?! 22% Performanceunterschied (siehe Daves Launchreview) und 2-3% durch den Taktunterschied sind locker drin.

gruffi schrieb:
Und wenn die Pipeline nicht schnell genug Daten verarbeiten kann, dann muss der Prefetcher warten, um neue Daten nachzuschieben, selbst wenn diese bereits zur Verfügung stehen. Was willst du also damit sagen? Wie schon gesagt, die Balance muss stimmen.

Ist aber bei modernen CPUs/Archs so nicht der Fall. Die Pipeline ist eher tendentiell unterversorgt mit Daten. Gerade bei Spielen ist das der Fall. Dir scheint das Prinzip mit den Hitrates auf Caches nicht richtig klar zu sein.

gruffi schrieb:
Das hat doch nichts zu sagen. Dem Zen 4 IF wird schon seit letztem Jahr doppelt so viel Bandbreite bei gleichem Takt nachgesagt im Vergleich zum Zen 3 IF. Also selbst mit weniger Takt kann man so mehr Durchsatz erzeugen. Also warten wir doch einfach mal ab, was Zen 4 zu bieten hat. Jetzt irgendwas als Fakt hinzustellen, was gar keiner ist, bringt nichts.

Von doppelter Bandbreite ist zwingend auszugehen, ja. Latenzen sind aber eine andere Geschichte und spielen bei der Gamingperformance ebenfalls eine große Rolle.

Nathenhale · 10. Mai 2022

@Zer0Strat verlinke doch einfach deinen Test dazu dann sollte alles klar sein.
Oder verwechsle ich dich jetzt mit jemanden?

Gelöschtes Mitglied 217606 · 10. Mai 2022

Nathenhale schrieb:
@Zer0Strat verlinke doch einfach deinen Test dazu dann sollte alles klar sein.
Oder verwechsle ich dich jetzt mit jemanden?

Wird nicht viel bringen, denn die durchschnittlichen Taktraten habe ich dort nicht angeben.

Bärenmarke · 10. Mai 2022

gruffi schrieb:
Das hat doch nichts zu sagen. Dem Zen 4 IF wird schon seit letztem Jahr doppelt so viel Bandbreite bei gleichem Takt nachgesagt im Vergleich zum Zen 3 IF. Also selbst mit weniger Takt kann man so mehr Durchsatz erzeugen. Also warten wir doch einfach mal ab, was Zen 4 zu bieten hat. Jetzt irgendwas als Fakt hinzustellen, was gar keiner ist, bringt nichts.

Da stimme ich dir voll und ganz zu, auch bei deinen anderen Punkten. Alleine schon die Annahme, dass bei Zen 4 IF schlechter als aktuell werden soll halte ich für absolut grotesk, frei dem Motto die haben die letzten zwei Jahre nur Eier geschaukelt...
Und das wird definitiv nicht der Fall gewesen sein, zumal ja auch Verbesserungen diesbezüglich im Serversegment sehr wichtig sind.
Aber du wirst hier halt immer Leute haben, die bei AMD immer das Haar in der Suppe suchen - selbst dann nichtmal nen anständigen Test zu stande kriegen - obwohl es keinerlei offizielle Auflistung seitens AMD gibt was denn überhaupt alles geändert wurde und man eigentlich nur spekulieren kann...
Von daher kannst dir die Zeit sparen, für manche wird Zen4 nach ihrer Auffassung einfach ein Reinfall ;-)

Und das obwohl AMD selbst ja von einem üppigen Leistungsplus gesprochen hat...

Nathenhale · 10. Mai 2022

Bärenmarke schrieb:
Da stimme ich dir voll und ganz zu, auch bei deinen anderen Punkten. Alleine schon die Annahme, dass bei Zen 4 IF schlechter als aktuell werden soll halte ich für absolut grotesk, frei dem Motto die haben die letzten zwei Jahre nur Eier geschaukelt...

Hat hier niemand behauptet das die Anforderungen an den IMC (IF) wachsen mit DDR5 sieht man doch schon bei Intel und derren Alder Lake CPUS.
Gehen wir davon aus das AMD genau so clever ist wie Intel dann schätze ich das die Meisten Zen 4 CPUs Richtung DDR5 6600 bis 7000 schluss machen. Das würde einen IF-Takt von 3300-3500 bei 1zu1 bedeuten eher unwahrscheinlich als eher sowas wie 2zu1 mit 1650-1750.
Aber das ist nur meine Vermutung.

Bärenmarke · 10. Mai 2022

Nathenhale schrieb:
Hat hier niemand behauptet das die Anforderungen an den IMC (IF) wachsen mit DDR5 sieht man doch schon bei Intel und derren Alder Lake CPUS.

Dann solltest du dir die Beiträge von manchen Usern nochmal durchlesen, die hier von einer Verschlechterung ausgehen...
Und da wir keinerlei gesicherte Infos dazu haben... Gehe ich jetzt mal nicht davon aus, dass es hier einen Rückschritt in Sachen Leistung geben wird.
Ich denke mit Zen4 erhalten wir ein viel runderes Produkt, zumal der I/O Teil in einem deutlich besseren Verfahren gefertigt wird und hoffentlich auch mit entsprechenden Stromsparmechanismen ausgestattet.

Gelöschtes Mitglied 217606 · 10. Mai 2022

Nathenhale schrieb:
Das würde einen IF-Takt von 3300-3500 bei 1zu1 bedeuten eher unwahrscheinlich als eher sowas wie 2zu1 mit 1650-1750.
Aber das ist nur meine Vermutung.

Ist tatsächlich auch schon so geleakt worden. Angeblich soll der neue IF max bis 1800MHz gehen. Das entpräche DDR5-7200.

Natürlich wird der neue IF (auch) besser, weil doppelte Bandbreite, aber die Latenzen machen mir Sorgen. Ich weiß nicht, wie sie 1200MHz (DDR5-4800) derart (über)kompensieren wollen, dass am Ende sogar bessere Latenzen rauskommen als jetzt mit 1600MHz (DDR4-3200). Aber wer weiß, vielleicht wird Zen 4 in dieser Hinsicht eine Überraschung.

Dass so eine Anbindung auch mal schlechter werden kann bezogen auf bestimmte Aspekte, ist aber nicht auszuschließen. Man muss sich nur mal die Speicherlatenzen von Alder Lake mit Gear 2 anschauen.

Man muss bloß einen Test machen, wenn man eine Zen 4 CPU (mit 2 CCDs) in den Händen hält, um zu wissen, wo der Hase läuft: ein Intercore Latenztest. Da bin ich echt gespannt drauf.

mhmdemin · 10. Mai 2022

Zer0Strat schrieb:
@PCGH_Andreas 5.200 GT/ ist ein bisschen hoch... ^^

Die Leaks sind da auch wenig glamourös.

5600MT/s 1 Dimm + single ranked

5200MT/s 1 Dimm + dual ranked

4800MT/s 2 Dimms + single ranked

4400MT/s 2 Dimms + dual ranked

Der letzte Fall dürfte Standard in den Tests sein. Das zieht übrigens einen relativ geringen IF-Takt nach sich, der im letzteren Falls bei 1100MHz liegt. Das wird zu deutlich höheren Latenzen führen. Man sollte keine zu hohen Erwartungen an Zen 4 haben, wenn es um Gamingleistung geht.

hör doch auf Mist zu labern, das Gleiche hast du auch für den Ryzen 7 5800X3D "behauptet"
und danach hast du bei CB so getan, als ob diese Behauptung von Außerirdischen kam..
überall versuchst du AMD schlecht zu reden.

@Zer0Strat

ist jemand der sogar behauptet hat,
das seine Testergebnisse besser seien, als die von INTEL und intel untertrieben hätte!!!
das also selbst intel ihre eigene Leistung nicht im vollem Umfang dargestellt hätte ^^

Gelöschtes Mitglied 217606 · 10. Mai 2022

Lol, der 5800X3D kommt doch nicht mal an einem übertakteten 12700K vorbei in Spielen. Dabei hat die Intel CPU deutlich mehr Singlecore- und Anwendungsleistung. Der Ryzen 3D ist ein nettes Spielzeug für Leute mit AM4 Board, ein Nischenprodukt par Excellence.

mhmdemin · 10. Mai 2022

@Zer0Strat
du übertriffst dich jedesmal selbst.. du bist der neue zeedy..

die ganze Welt irrt sich, nur du und einpaar andere haben recht.
:ugly:

Bärenmarke · 10. Mai 2022

mhmdemin schrieb:
@Zer0Strat
du übertriffst dich jedesmal selbst.. du bist der neue zeedy..

die ganze Welt irrt sich, nur du und einpaar andere haben recht.

Das ist doch nichts neues oder? Ist ja schon schlimm genug, dass man auf CB immer die Schwachsinnskommentare unter jeder AMD News lesen muss, aber nein jetzt auch noch hier.
Wundert mich an der Stelle auch, wieso kein Mod eingreift, da es eindeutig Richtung Spam geht.
Und immer ist es die Selbe Laier, es wird schlecht geredet wo es nur geht und in der Regel über Dinge, über die nichtmal ausreichend Infos vorhanden sind... Aber ja der 58003XD war das Paradebeispiele, da konnte man ja in zig Beiträgen lesen wie schlecht das doch wird...
Nur die Realität sah halt wieder anders aus!
Und das von jemandem der nichtmal zwei Architekturen anständig miteinander vergleichen kann, nen 10 Kerner mit nem 12 Kerner vergleicht, die architektonischen Unterschiede ignoriert, nur damit das gewünschte Bild rauskommt.
Manchen scheint es einfach massiv schwer zu fallen, dass nach Jahren der intel Dominanz AMD einige sehr gute Produkte auf den Markt gehauen hat.
Ich freu mich aufjedenfall schon sehr auf die 7000er Reihe, auch wenn ich sie aufgrund des 58003XD überspringen werde und ich auf die Servervarianten noch viel gespannter bin, allein schon durch den nochmals höheren Corecount und nächstes Jahr mit Bergamo wird das sehr interessant werden.
Und letztendlich kommt ein gesunder Wettbewerb uns allen zu Gute, was aber auch nicht jeder versteht.

gruffi · 11. Mai 2022

Zer0Strat schrieb:
Exakt, man braucht Taktskalierungstests, welche ich gemacht hatte...

Nicht Skalierungstests. Wie ich schon sagte, einfach Tests bei identischem Durchschnittstakt. Hast du die gemacht?

Zer0Strat schrieb:
Hui, wo sagen sie das? Bezogen auf welche Gen?

Zen 2 auf 3. Kann aber sein, dass ich da ns und clks verwechselt hab. Ist schon länger her. Egal. Schau mal hier, das sollte meinen Standpunkt verdeutlichen.

Man sieht, dass auch der 5950X schon vor 32 MB deutlich ansteigende Latenzen aufweist. Zudem ist die Latenz vor 16 MB etwas schlechter als beim Vorgänger. Es ist also keineswegs so, dass Zen 3 hier nur Vorteile hätte. Man müsste schon testen, was über viele verschiedene Szenarien hinweg übrig bleibt. Und letztendlich ist auch der Scheduler des OS gefragt und wie clever er Threads verteilen kann. Es ist nicht nur die Hardware. Und selbst bei dieser spielt die Verteilung der Kapazität über die CCX hinweg nur eine untergeordnete Rolle. AT erwähnt das auch in ihrem Deep Dive:

Overall, although Zen3 doesn’t change dramatically in its cache structure beyond the doubled up and slightly slower L3, the actual cache behaviour between microarchitecture generations has changed quite a lot for AMD. The new Zen3 design seems to make much smarter use of prefetching as well as cache line handling – some of whose performance effects could easily overshadow just the L3 increase.

Ich denke genau diese Architekturverbesserungen sind hauptverantwortlich für effektiveres Caching und gesteigerte Performance. Zumal die L3 Kapazität, die ein Kern maximal reservieren kann, auch nicht immer zum Tragen kommt. Beispiel, ein Spiel erzeugt 2 Last-Threads. Beim 3800X werden diese auf Kern 0 und 4 ausgelagert. Jeder Kern kann 16 MB L3 ohne IF Penalty reservieren. Mehr könnte ein 5800X auch nicht. Der Unterschied ist lediglich, dass der 5800X den L3 flexibler verteilen kann ohne IF Penalty, also z.B. 20 MB für Kern 0 und 12 MB für Kern 4. Und je moderner ein Spiel ist und umso mehr fordernde Threads auf verschiedene Kerne ausgelagert werden, umso weniger sollte der 3800X Nachteile haben. Der 5800X3D ist da eben nochmal ein ganz anderer Sachverhalt. Der hat tatsächlich insgesamt mehr physischen Speicher und könnte jeweils 48 MB pro Kern reservieren. Deshalb anhand des 5800X3D generell Rückschlüsse auf die Auswirkung des L3 Cache von Zen 3 zu ziehen, halte ich für nicht zielführend.

Lange Rede, kurzer Sinn. Zu behaupten, Zen 4 würde in Spielen kaum zulegen, nur weil sich an der L3 Kapazität nichts ändert, halte ich für extrem kurzsichtig. Es gibt weitaus mehr Bereiche, wo AMD ansetzen kann. Und zur Bedeutung der Cache Kapazität noch ein kleines Beispiel. Der FX-8150 konnte bis zu 2 MB L2 und 8MB L3 pro Kern reservieren. Trotzdem hatte er keine Chance gegen den i7-2600K, der lediglich 256 KB L2 und genauso bis zu 8 MB L3 pro Kern reservieren konnte. Der ganze Cache nutzt nichts, wenn er von der restlichen Architektur nicht effektiv genutzt werden kann. Genauso gibt es immer die Möglichkeit, durch Verbesserungen der Architektur den vorhandenen Cache noch effektiver zu nutzen.

Zer0Strat schrieb:
Doch, es sind taktbereinigt ca. 25%.

Nein, sind es nicht. Die meisten Reviews zeigen genau den von AMD vermarkteten Vorsprung von 15%. Bei ~4% höherem Boost Takt des 5800X wären wir also selbst im optimistischsten Fall bei maximal 20%. Realistisch eher weniger, vielleicht 17-18% taktbereinigt.

Zer0Strat schrieb:
Ist aber bei modernen CPUs/Archs so nicht der Fall.

Doch, ist auch bei modernen Architekturen der Fall und auch bei Spielen. Schau dir einfach mal an was Apple aus der deutlich aufgebohrten Architektur im M1 raus holt. Dir scheint das Prinzip wie moderne Architekturen arbeiten nicht richtig klar zu sein. ^^

Zer0Strat schrieb:
Von doppelter Bandbreite ist zwingend auszugehen, ja. Latenzen sind aber eine andere Geschichte und spielen bei der Gamingperformance ebenfalls eine große Rolle.

Nicht wirklich. Wie schon gesagt, Latenz ist beim Cache deutlich wichtiger. Beim IF hat Bandbreite eine höhere Priorität.

Gelöschtes Mitglied 217606 · 11. Mai 2022

gruffi schrieb:
Nicht Skalierungstests. Wie ich schon sagte, einfach Tests bei identischem Durchschnittstakt. Hast du die gemacht?

Man muss mit 4.3GHz und dann stock testen. Das nennt man Taktskalierungstest. ^^ Wie kommst du denn auf identischen Durchschnittstakt? Ach, du meinst die 4.3GHz damit?! Die stock Ergebnisse fallen halt nicht vom Himmel...

gruffi schrieb:
Zen 2 auf 3. Kann aber sein, dass ich da ns und clks verwechselt hab. Ist schon länger her. Egal. Schau mal hier, das sollte meinen Standpunkt verdeutlichen.

Es ging doch um Intercore-Latenzen?! Die Speicherlatenzen liegen halt im ungefähr gleichen Bereich, daher passt deine Aussage nicht, dass es besser ist, Daten aus dem L3 des anderen CCX zu holen, statt auf den RAM zuzugreifen.

gruffi schrieb:
Man sieht, dass auch der 5950X schon vor 32 MB deutlich ansteigende Latenzen aufweist. Zudem ist die Latenz vor 16 MB etwas schlechter als beim Vorgänger.

Lol, das ist ein Standardverhalten, dass solche Kurven kurz vor der theoretischen Kapazität ansteigen. Was soll uns das nun sagen?

gruffi schrieb:
Ich denke genau diese Architekturverbesserungen sind hauptverantwortlich für effektiveres Caching und gesteigerte Performance. Zumal die L3 Kapazität, die ein Kern maximal reservieren kann, auch nicht immer zum Tragen kommt. Beispiel, ein Spiel erzeugt 2 Last-Threads. Beim 3800X werden diese auf Kern 0 und 4 ausgelagert. Jeder Kern kann 16 MB L3 ohne IF Penalty reservieren. Mehr könnte ein 5800X auch nicht. Der Unterschied ist lediglich, dass der 5800X den L3 flexibler verteilen kann ohne IF Penalty, also z.B. 20 MB für Kern 0 und 12 MB für Kern 4. Und je moderner ein Spiel ist und umso mehr fordernde Threads auf verschiedene Kerne ausgelagert werden, umso weniger sollte der 3800X Nachteile haben. Der 5800X3D ist da eben nochmal ein ganz anderer Sachverhalt. Der hat tatsächlich insgesamt mehr physischen Speicher und könnte jeweils 48 MB pro Kern reservieren. Deshalb anhand des 5800X3D generell Rückschlüsse auf die Auswirkung des L3 Cache von Zen 3 zu ziehen, halte ich für nicht zielführend.

Nochmal, Prefetching kannst du vergessen, wenn auf die Daten zufällig zugegriffen wird. Es kommt immer auf das Zugriffspattern an. Wenn du meinst, dass der Cache (reine Kapazität) so wenig bringt, dann schau dir doch einfach Cezanne an. Cezanne hat die vollen Zen 3 Architekturverbesserungen und ist dennoch nur knapp schneller als Matisse. Nun darfst du dreimal raten, woran das liegt...

gruffi schrieb:
Nein, sind es nicht. Die meisten Reviews zeigen genau den von AMD vermarkteten Vorsprung von 15%. Bei ~4% höherem Boost Takt des 5800X wären wir also selbst im optimistischsten Fall bei maximal 20%. Realistisch eher weniger, vielleicht 17-18% taktbereinigt.

Ich beziehe mich auf die Ergebnisse von PCGH. Warum? Weil die testen können. Komm mir bloß nicht mit dem Kram von diversen Youtubern.

gruffi schrieb:
Doch, ist auch bei modernen Architekturen der Fall und auch bei Spielen. Schau dir einfach mal an was Apple aus der deutlich aufgebohrten Architektur im M1 raus holt. Dir scheint das Prinzip wie moderne Architekturen arbeiten nicht richtig klar zu sein. ^^

Dann zeig doch mal Apples Gamingleistung.

Und selbst wenn du das schaffst, der M1 hat einen riesen L2 Cache. Das würde nur meine Theorie untermauern.

gruffi schrieb:
Nicht wirklich. Wie schon gesagt, Latenz ist beim Cache deutlich wichtiger. Beim IF hat Bandbreite eine höhere Priorität.

Das ist grober Unfug.

Duvar · 13. Mai 2022

Hmm Legga^^

Eingebundener Inhalt

An dieser Stelle findest du externe Inhalte von Twitter. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.

gruffi · 13. Mai 2022

Zer0Strat schrieb:
Lol, das ist ein Standardverhalten, dass solche Kurven kurz vor der theoretischen Kapazität ansteigen. Was soll uns das nun sagen?

Schau nochmal genau hin. Zen 3 steigt hier schon deutlich früher an, während Zen 2 die niedrigere L3 Latenz länger bis zum theoretischen Maximum halten kann. Es ist also keineswegs ein Standardverhalten. Auch das hatte ich schon erwähnt. AT schreibt dazu:

Latencies past 8MB still go up even though the L3 is 32MB deep, and that’s simply because it exceeds the L2 TLB capacity of 2K pages with a 4K page size.

Zer0Strat schrieb:
Nochmal, Prefetching kannst du vergessen, wenn auf die Daten zufällig zugegriffen wird.

Das ist sehr wohl relevant. Hier kommen z.B. die Verbesserungen der Prefetching Logik von Zen 3 zum Tragen. Zufällige Zugriffe sind auch weniger das Problem der Cache Grösse und der Penalty zum IF. Die Cache Grösse des L3 wird eher zum Problem bei sehr grossen Datensets. Wo eher der reine Durchsatz zum Flaschenhals werden kann. Oder die meist mit sequenzieller Verarbeitung einhergehen, die für Prefetcher einfacher vorhersehbar ist.

Zer0Strat schrieb:
Wenn du meinst, dass der Cache (reine Kapazität) so wenig bringt, dann schau dir doch einfach Cezanne an.

Erstens meine ich das nicht. Ich hatte doch bereits Cezanne oder den 5800X3D angesprochen. Die tatsächlich weniger oder mehr physischen L3 besitzen. Und zweitens ist die "reine Kapazität" des L3 von Matisse und Vermeer eben nicht unterschiedlich. Sie ist gleich. Auch das hatte ich bereits erwähnt. Beides bringt was, physische Kapazität und Latenz innerhalb dieser. Und nicht nur Latenz, so wie du glaubst.

Zer0Strat schrieb:
Cezanne hat die vollen Zen 3 Architekturverbesserungen und ist dennoch nur knapp schneller als Matisse.

Matisse/Vermeer unterstützen aber z.B. PCIe 4, Cezanne nur PCIe 3. Ich denke so ein Vergleich ist hier nicht wirklich zielführend. Man sollte schon beim gleichen Grunddesign bleiben. CB hatte ja seinerzeit den 3300X gegen den 3100 antreten lassen. Beide gleich viel physischer L3, 16 MB insgesamt. Aber beim 3100 gibt es von Kern 0/1 zu Kern 2/3 die IF Penalty, beim 3300X nicht. Also eine ähnliche Konstellation wie wenn man 3800X und 5800X vergleicht, nur dass dort die jeweilige Kernanzahl doppelt so hoch ist. Unterm Strich hat CB einen fps Vorteil von 13% ermittelt. Und das obwohl der 3300X einen Boost Vorteil von knapp über 10% hat. Also taktbereinigt liegen wir da im Bereich von maximal 5-10% Unterschied. Und mit mehr Kernen, die ohne Penalty auf den L3 zugreifen können, dürfte der Latenzvorteil eher geringer werden. Weil dann auch bei häufiger Lastverteilung zwischen Kernen die Chance auf eine Penalty geringer wird. Aber wie gesagt, das hängt auch davon ab wie clever der OS Scheduler agiert. AT hatte zwischen 3100 und 3300X @ Stock übrigens nur etwa 6% Unterschied beim Gaming ermittelt. Ich kann mich nur nochmal wiederholen. Du überschätzt die L3 Penalty zwischen Zen 2 und Zen 3 bezüglich Gaming. Sie macht sicherlich was aus. Aber nicht in dem Umfang wie du glaubst. Ein grosser Teil der Unterschiede sind definitiv auch auf die Architekturverbesserungen zurückzuführen.

Zer0Strat schrieb:
Ich beziehe mich auf die Ergebnisse von PCGH. Warum? Weil die testen können. Komm mir bloß nicht mit dem Kram von diversen Youtubern.

Ich rede von mehr oder weniger seriösen Webseiten, nicht von Youtubern. Vielleicht solltest du dir einfach mal mehr Reviews anschauen als nur PCGH.

Zer0Strat schrieb:
Das ist grober Unfug.

Nope. Ist ein Fakt. Und je mehr Cache AMD verbaut, z.B. eben mittels 3D V-Cache, umso unwichtiger wird die IF Latenz. Bandbreite hingegen kann man nie genug haben. Erst recht wenn man immer mehr Kerne füttern muss. Mit Zen 4 bleibt es voraussichtlich bei 16 Kernen. Da sollte es also noch recht entspannt bleiben. Aber spätestens Zen 5 soll mehr Kerne auch für Desktops bieten. Dann werden auch die Anforderungen an das IF deutlicher steigen.

Gelöschtes Mitglied 217606 · 14. Mai 2022

gruffi schrieb:
Ich rede von mehr oder weniger seriösen Webseiten, nicht von Youtubern. Vielleicht solltest du dir einfach mal mehr Reviews anschauen als nur PCGH.

Siehe Launchanalyse vom 3DCenter, taktbereinigt dann ca. 22-23%. Wenn man ein paar Ausreißer rauskickt, die im Bereich von 90% liegen wegen 1080p Tests, landet man locker bei 25%.

gruffi schrieb:
Matisse/Vermeer unterstützen aber z.B. PCIe 4, Cezanne nur PCIe 3. Ich denke so ein Vergleich ist hier nicht wirklich zielführend.

Das ist jetzt nicht dein Ernst?

gruffi schrieb:
Das ist sehr wohl relevant. Hier kommen z.B. die Verbesserungen der Prefetching Logik von Zen 3 zum Tragen. Zufällige Zugriffe sind auch weniger das Problem der Cache Grösse und der Penalty zum IF. Die Cache Grösse des L3 wird eher zum Problem bei sehr grossen Datensets. Wo eher der reine Durchsatz zum Flaschenhals werden kann. Oder die meist mit sequenzieller Verarbeitung einhergehen, die für Prefetcher einfacher vorhersehbar ist.

Wut? Es ging doch darum, dass Prefetching nicht greift, wenn die Daten zufällig gelesen werden. Davor ging es darum, dass Caches nicht alles sind, weil eben auch Verbesserungen am Prefetching die Leistung/Datenzugriffe verbessern können. Ja, das stimmt, aber das gilt nur bedingt für Spiele, denn hier werden Daten eher tendentiell zufällig gelesen. Faktor Mensch und so...

Mal abgesehen davon nutzt man das Prinzip eines zufälligen Zugriffs aus bei einem Latenztest, damit der Prefetcher weitestgehend neutralisiert wird, denn man will ja (auch) die reine Leistung/Latenz der Hardware wissen.

gruffi schrieb:
Nope. Ist ein Fakt. Und je mehr Cache AMD verbaut, z.B. eben mittels 3D V-Cache, umso unwichtiger wird die IF Latenz.

Hä? Es ging doch darum, dass du meintest, dass Bandbreite viel wichtiger als Latenzen sind, wenn um Zugriffe über den IF geht. Es ist schön und gut, dass Caches das verringern können, aber es geht gerade um die Fälle, wo RAM-Zugfriffe stattfinden, wegen Cache-Misses. Latenzen über den IF sind genau dann wichtig. Das gilt insbesondere dann, wenn häufig kleine Datenpakete geholt werden müssen, was bei Spielen übrigens der Fall ist.

Bevor du hier wieder abschweifst, der IF einer Zen 4 CPU wird langsamer takten (laut Leaks) so wie es scheint. Das hat negative Auswirkungen auf die Latenzen, was wiederum negative Auswirkungen auf die Spieleleistung hat. Ein 32MB goßer Cache kann das nicht verhindern, weil die Hitrate auf den L3 Cache halt nicht bei 99% liegt leider. Auch ein verbesserter Prefetcher kann das nur bedingt kompensieren, weil Prefetching bei zufälligen Zugriffen nicht greift.

Ryzen 7000: Gerüchte zum Release im Herbst

Kokü-Junkie (m/w)

PC-Selbstbauer(in)

Gelöschtes Mitglied 217606

Guest

PC-Selbstbauer(in)

Gelöschtes Mitglied 217606

Guest

Volt-Modder(in)

Gelöschtes Mitglied 217606

Guest

BIOS-Overclocker(in)

Volt-Modder(in)

BIOS-Overclocker(in)

Gelöschtes Mitglied 217606

Guest

PC-Selbstbauer(in)

Anhänge

Gelöschtes Mitglied 217606

Guest

PC-Selbstbauer(in)

Anhänge

BIOS-Overclocker(in)

PC-Selbstbauer(in)

Anhänge

Gelöschtes Mitglied 217606

Guest

Kokü-Junkie (m/w)

PC-Selbstbauer(in)

Gelöschtes Mitglied 217606

Guest

Ähnliche Themen