Was sind denn die anderen Faktoren? Und wenn nun der Takt gleich bleiben würde,was würde dann soviel verändern müssen damit man wirklich 15 % mehrleistung erreicht.Ich habe ja was von CPU Cache und die Anbindung beim Ram und auch deren Latenz gelesen die die IPC ebenfalls beeinflussen kann.Wenn man also einen Ram mit guter Latenz also sprich guter Timings erwischt,dann müsste das ja die CPU Leistung ebenfalls mit beeinflussen auch wenn nicht viel Ram genutzt wird.In Meinem Fall braucht die Software also sprich eine davon 380 MB Maximal.Bei zwei wären es ja 760 MB an Ram was die CPU davon braucht.Da kann ja die Timings ebenfalls Massiv das ganze beeinflussen.Inwiefern tirfft das denn das ganze zu?
Prinzipiell gibt es neben der IPC nur noch einen Faktor: Den Takt. Beides mit einander multipliziert ergibt die Absolutleistung beziehungsweise letztlich ist die IPC nichts weiter als ein abgeleiteter Faktor, Absolutleistung durch Takt. Allerdings gibt es außerhalb der eigentlichen Rechenleistung der Kerne viele Faktoren (L2- und L3-Cache-Größe und -Latenz, Speichergeschwindigkeit und -Latenz, Latenz der Kern-Kern-Kommunikation sowie Befehlssätze wären die in den letzten Jahren wichtigsten Punkte), die die Leistung (und damit IPC) je nach Anwendung unterschiedlich beeinflussen. Um 15 Prozent mehr Spieleleistung zu erreichen, sind also möglicherweise andere Maßnahmen nötig, als um "15 Prozent mehr IPC" in einem Computer-Benchmark zu verzeichnen. Insbesondere Speicher- und Rechengeschwindigkeit stehen für unterschiedliche Anwendungen in einem komplett unterschiedlichen Verhältnis zueinander.
Die IPC ist unabhängig vom RAM oder dem Takt. Die Angabe steht für "Wie viele Berechnungen können pro einen Zyklus durchgeführt werden?".
Nein. Die reine Laufzeit der Befehle ergibt nicht die IPC. Letztere wird für gewöhnlich über die Praxisleistung in der jeweiligen Anwendung ermittelt und umfasst dann auch etwaige Flaschenhälse (oder deren Fehlen) im Speichersystem.
Ryzen 4000 wird der Werbung nach 8 Kerne in einer CCX unterbringen, das würde die Speicherlatenz verringen. Die Daten müssen aber immer noch durch den IF-Chip zuerst gehen, wird immer noch langsamer als Intel in der Hinsicht sein. Picasso zeigt, was geht, wenn man den IF-Chip weglässt. Um dennoch krass vorbeiziehen zu können, benötigt Ryzen die 5GHz+ Marke beim Takt. Alles darunter ist Werbetrommelblabla.
Die Zusammenlegung der CCX sollte die RAM-Latenzen nicht beeinflussen und die L3-Latenz dürfte sogar steigen. Bei dieser Maßnahme wird vor allem die Latenz zwischen den Kernen reduziert, was aber auch bitter nötig ist. Zwischen CCX liegen die Zugriffszeiten bislang beim Vierfachen des Comet-Lake-Worst-Case.
also das mit dem Thema level 3 Cache,nicht immer springt es drauf an.2990wx hat nur 64 MB Level 3 Cache und 3970x hat 128 MB Level 3 Cache.Und dennoch trennt von den beiden CPUs nur 5 & 3 Sekunden.Das ist ja nicht viel.Und da ja zischen den beiden sich nur 100 mhz Takt Unterschied trennt,macht dies ja am meisten was aus.Der rest wird wohl was anderes ausgelöst sein oder die Anwendung leidet an Schwankungen,weil bei mehreren Durchläufen es nicht jedes mal die 100 %tig genau gleiches Ergebnis erzeugt wird.Da es ja 2 Videos gleichzeitig umgewandelt werden,sind somit Schwankungen nicht auszuschließen.Ich frage mich warum es nicht jedes Mal das selbe Ergebnis ausspuckt.
Man kann ja wirklich 1-2 Sekunden als Schwankungen sehen nicht war?
Dann wird es am ende wohl halt auf dem Takt hinauslaufen.Denn sobald ich bei jemanden getestet hatte den Ryzen 3950x bei 4,3 anstatt 4 ghz,dann rückte dieser dem Threadripper 3960 sehr nah auf der Pelle. Ich habe somit die Grenze herausgefunden.Genau darum habe ich ja soviele Unterschiedliche CPUS getestet gehabt.Ich selbst besitze diese allerdings nicht. Und ich habe auch HT bei den Threadripper 2970x,2990wx,3960x und 3970x alle samt ohne getestet.
Man kann also sagen das duell ist 32 echte gegen 16 echte mit 16 Virtuelle.Ich wusste ja nicht das inzwischen SMT so gut Optimiert wurde,das es fast zu einem gleichstand gekommen ist.Und ja du hast völlig recht,hier macht es sich bemerkbar.Als bei diesen Monster CPU smt an gewesen war,wurden alle Kerne ausgebremst.Da war wohl der Aufwand größer als der Nutzen.
SMT ist heute nicht so viel besser als zu Pentium-4-Zeiten. Aber der Nutzen hing und hängt immer davon ab, wie gut ein CPU-Kern durch einen einzelnen Thread ausgelastet wird und wie viele dieser Threads auf wie viele physische CPU-Kerne treffen. Praxisanwendungen, die mehr als 16 Kerne sinnvoll nutzen können, kann man meist an einer Hand abzählen. Oft genug auch an keiner Hand, weil es sie im Endverbrauchersegment kaum gibt. Vereinzelte Effekte, dass man wenige Prozent Performance gewinnt, wenn ein 17ter Thread nicht warten muss, lassen sich dann auch oft erzielen, wenn dieser mittels SMT mal schnell nebenbei berechnet wird. In den letzten Jahren wurde dieser Effekt in Spielen aber meist schon zwischen 8 und 16 Threads beobachtet. Ein Sechskerner mit SMT lieferte nicht selten bessere Ergebnisse als ein Achtkerner ohne, weil so viele leistungsfordernde, unabhängige Aufgaben einfach nicht zur Bearbeitung anstanden. Und ab 12 Kernen kann es weiterhin vorkommen, dass eine Deaktivierung von SMT das System in Spielen beschleunigt, weil der zusätzliche Verwaltungsaufwand für 24 logische Kerne mehr Rechenzeit kostet als durch SMT zusätzlich genutzt wird.
Ähnlich ambivalent ist Cache: Bis zu einer gewissen Größe kann es die Rechenleistung beinahe linear steigen, wenn Programmteile nicht mehr aus dem langsamen RAM nachgeladen werden müssen. Aber wenn bereits der gesamte Programmcode in den Cache passt und nur noch die einmalig zu bearbeitenden Daten geladen werden, dann bringt zusätzlicher Cache praktisch gar nichts mehr. Über mehrere Anwendungen und Szenarien hinweg, bei denen die Grenze jeweils anders liegt, ergibt sich dann ein abnehmender Grenzertrag. Zen2 ist hier sicherlich schon sehr extrem unterwegs, nutzt den Cache aber auch zum Ausgleich der langsamen Kern-zu-Kern-Kommunikation.