AMD Ryzen 3000: Zen 2 braucht keine neuen Software-Optimierungen

Selbst wenn es so ist, dann hat AMD bestimmt einen Weg gefunden das zu kompensieren. Sonst würde sie es wohl nicht so machen.;)

Dass der IF2 2.3 mal schneller sein soll, ist schon mal ein guter Ansatz in die richtige Richtung. Ich denke, es läuft im schlimmsten Fall auf 65-70ns hinaus. Unter 50ns in Richtung 40ns wie bei Intel werden wir nicht sehen, das ist unrealistisch. Ich hoffe auf 60-50ns mit Tuning.
 
Unter 60ns sollte AMD zusammen mit der besseren Singlecore-Leistung sehr weit aufrücken lassen auf Intel. Aber überholen wird so nicht funktionieren.
 
Zuletzt bearbeitet von einem Moderator:
Ist halt ein Gaming Forum hier. Da zählt sowas eher nicht. Sag das den Engine Entwicklern. Die sollen mal Gas geben, von wegen Multicore usw. ^^

Das wird nicht viel ringen. Optimieren kostet viel Geld. Da die Kosten eh schon so hoch sind, bezweifle ich das sie es weiter entwickeln. Zudem müssen sie für die große Masse entwickeln,das heißt unten bleiben. Wir sind hier alle nicht der Durchschnitt. Der Durchschnitt dümpelt bei weniger Kernen rum. Zudem sind auch noch die Konsolen die uns ausbremsen ab 2020/2021 da wird es für den PC besser. Warum weil Konsolen einen richtigen boost hinlegen werden. Das ganze wird langfristig der PC Plattform gut tuen. Im Moment nur halt eben nicht. Daran können wir halt wenig ändern. Da hilft es ja auch nix einen noch mehr Kerner einfach reinzustecken.
 
Spiele wie GhostReconWildlands profitieren doch schon deutlich von mehr als 4 Kernen. Also sieht man dort schon eine Optimierung.
Nur wird halt nur dann optimiert, wenn im Mainstream CPUs mit vielen Kernen angekommen sind, was erst mit Ryzen der Fall war.

Ich bin mal gespannt, wie das bei Anno 1800 aussieht. Solche Strategiespiele sind dafür bekannt bei großen Städten in ein starkes CPU-Limit zu kommen.
 
Das wird nicht viel ringen. Optimieren kostet viel Geld. Da die Kosten eh schon so hoch sind, bezweifle ich das sie es weiter entwickeln. Zudem müssen sie für die große Masse entwickeln,das heißt unten bleiben. Wir sind hier alle nicht der Durchschnitt. Der Durchschnitt dümpelt bei weniger Kernen rum. Zudem sind auch noch die Konsolen die uns ausbremsen ab 2020/2021 da wird es für den PC besser. Warum weil Konsolen einen richtigen boost hinlegen werden. Das ganze wird langfristig der PC Plattform gut tuen. Im Moment nur halt eben nicht. Daran können wir halt wenig ändern. Da hilft es ja auch nix einen noch mehr Kerner einfach reinzustecken.

Wieso bremsen die Konsolen aus? gerade dort herrscht doch das Problem, viele Kerne wenig Leistung pro Kern. Genau so Handys. Smartphones haben auch im Einstiegssegment meist 4 oder mehr (schwache) Kerne.
Ich finde das einige Engines schon sehr gut mit vielen Kernen umgehen können und natürlich wird weiter in diese Richtung optimiert.
 
Wieso bremsen die Konsolen aus? gerade dort herrscht doch das Problem, viele Kerne wenig Leistung pro Kern. Genau so Handys. Smartphones haben auch im Einstiegssegment meist 4 oder mehr (schwache) Kerne.
Ich finde das einige Engines schon sehr gut mit vielen Kernen umgehen können und natürlich wird weiter in diese Richtung optimiert.

Das mag zwar sein, aber es dauert halt ewig lange bis sich da was tut. Die Entwicklung geht langsam voran. Es ist aber noch nicht Regel sondern die Ausnahme. In sehr vielen einigen Jahren wird sich das mit Sicherheit ändern. Ich merke noch nichts davon das mehr Kerne unterstützt werden. Im Moment sind nur 8 Kerne Standard. Es wird zäher. Als ob es so einfach wäre, einfach aus dem Hut zu zaubern das dann automatisch noch mehr Kerne unterstützt werden. Bei mehr als 8 Kernen sieht es nicht mehr so gut aus. Hier werden die neuen Konsolen auch nicht das Ruder rumreisen. Als ob dank der Konsolen aufeinmal 10,12 oder noch mehr Kerne unterstützt werden. Aber das wird halt dann aufwendiger. Vielleicht kommt ja pysix, realistische dynamische umfallen. Verformung von Gegenständen. Oder das vielleicht raytracing doch irgendwann per CPU berechnet werden kann. Einfach halt mehr Interaktionen der Umgebung.

Bessere ki per CPU. Das sind so Sachen die die Entwickler verbessern könnten, um mehr CPU Leistung abzufragen. Aber ob die Entwickler Lust haben das so extrem zu entwickeln. Leicht wird das echt nicht und psyisxhkalisch immer mehr an der Grenze des machbaren
 
Selbst wenn es so ist, dann hat AMD bestimmt einen Weg gefunden das zu kompensieren. Sonst würde sie es wohl nicht so machen.;)

AMD profitiert vom neuen Fertigungsansatz bereits in drei wichtigen Bereichen:
- Sie können die CPU-Kerne in 7 nm fertigen, obwohl ein reiner 7-nm-Prozessor scheinbar noch zu teuer und/oder technisch aufwendig wäre.
- Sie können die gleichen Kern-Chiplets für alle Marktsegmente verwenden und somit in sehr großen Stückzahlen fertigen, haben aber trotzdem in jedem Prozessor nur die tatsächlich benötigten I/O-Einheiten verbaut.
- Sie können die Cache-Größe unabhängig von der Kernzahl skalieren.

Ich hoffe dass diese Vorteile nicht gegenüber einen Latenz-Nachteil abgewogen werden mussten, aber es ist keineswegs ausgeschlossen, dass sich AMD "trotzdem" für die getrennten Dies entschieden hat. Bereits die Bauweise mit zwei CCX war ja Latenz-technisch ein Nachteil und Multi-Die von Threadripper für einige Anwendungen katastrophal – Nachteile, die AMD zugunsten einer günstigeren Produktion in Kauf nehmen musste.


Aktuell sind wir ja bei ~60ns mit tuning, hoffe da geht noch was demnächst.

Wir liegen aktuell bei unter 10 ns für Zugriffe auf den CCX-eigenen L3, aber für Zugriffe auf Einheiten in anderen Dies wurden 200 ns gemessen. Das on-package IF ist verglichen mit klassischen Cache-Anbindungen sehr langsam und somit eine enorme Herausforderung für Zen2. Wir können nur hoffen, dass sie gemeistert wurde.
 
AMD profitiert vom neuen Fertigungsansatz bereits in drei wichtigen Bereichen:
- Sie können die CPU-Kerne in 7 nm fertigen, obwohl ein reiner 7-nm-Prozessor scheinbar noch zu teuer und/oder technisch aufwendig wäre.
- Sie können die gleichen Kern-Chiplets für alle Marktsegmente verwenden und somit in sehr großen Stückzahlen fertigen, haben aber trotzdem in jedem Prozessor nur die tatsächlich benötigten I/O-Einheiten verbaut.
- Sie können die Cache-Größe unabhängig von der Kernzahl skalieren.

Ich hoffe dass diese Vorteile nicht gegenüber einen Latenz-Nachteil abgewogen werden mussten, aber es ist keineswegs ausgeschlossen, dass sich AMD "trotzdem" für die getrennten Dies entschieden hat. Bereits die Bauweise mit zwei CCX war ja Latenz-technisch ein Nachteil und Multi-Die von Threadripper für einige Anwendungen katastrophal – Nachteile, die AMD zugunsten einer günstigeren Produktion in Kauf nehmen musste.
Würde das denn nochmal einen deutlichen Unterschied machen wenn der I/O Chip auch in 7nm gefertigt wird?
 
@PCGH_Torsten: Hast du Infos darüber, ob und inwiefern die Chiplets direkt mit einander verbunden sind?
 
Würde das denn nochmal einen deutlichen Unterschied machen wenn der I/O Chip auch in 7nm gefertigt wird?

Für die Produktionskosten sicherlich. Selbst bei Ryzen ist der I/O-Die circa 50 Prozent größer als das CPU-Chiplet. Bei halber Transistordichte entspricht dies immer noch einem Drittel der gesamten Schaltkreise und I/O-Funktionen skalieren meist schlecht mit feinerer Fertigung. Nimmt man noch die sinkende Yield-Rate mit steigender Chip-Größe; die hohen Fehlerquoten neuer Prozesse und die schlechteren Salvage-Möglichkeiten hinzu, würde eine Produktion von Ryzen 3000 als homogenes Design nach 1000-/2000-Vorbild vermutlich doppelt so viel teure 7-nm-Wafer-Fläche erfordern wie die jetzt gewählte Hybrid-Lösung.


@PCGH_Torsten: Hast du Infos darüber, ob und inwiefern die Chiplets direkt mit einander verbunden sind?

Ich habe keine Informatinen vorliegen, die nicht auch im Netz zu finden wären und wenn ich sie hätte, dürfte ich vermutlich nicht darüber sprechen. :-)
Bislang weißt aber nichts auf direkte Verbindungen hin und zumindest bei Rome, dessen Anforderungen sicherlich dem Design zu Grunde lagen, kann ich mir das auch kaum vorstellen. Die meisten Zugriffe erfolgen ohnehin auf den Cache im I/O-Die, AMD braucht also eine starke Verbindung hier hin. Mit einem weiteren Hopp kann diese Verbindung auch alle anderen Kerne erreichen. Wollte man stattdessen 1-Hop-Latenz zwischen allen Kernen bieten, müsste man jedes Chiplet mit jedem anderen verbinden. Das erfordert bei Rome acht IF-Controller pro Chiplet und würde enorm viel Platz und Strom verbrauchen – vom komplexen Routing im Package ganz zu schweigen.
 
Bring uns doch mal paar Infos, lass deine Connections sprechen und schreib uns eine PN, Shice auf NDA, weiß doch keiner, außer uns^^
Unterschreibe auch eine NDA, dass alles was du sagst, Geheim bleibt :D
 
Zurück