AMD Ryzen Threadripper: 32-Kerner sind denkbar

Zum Glück "verlieren die Hersteller den Verstand". Es gibt so unzählige Probleme, die sich gut parallelisieren lassen, so dass mehr Kerne auf jeden Fall Sinn machen.

Embarrassingly parallel - Wikipedia

Schau mal bitte in deinem Link unter dem Kapitel „Examples“ nach. Ich finde dort nur wenig, was für den Heimanwender (derzeit) von Belang wäre.

Mal flugs reinkopiert:
wikipedia schrieb:
• Distributed relational database queries using distributed set processing
• Serving static files on a webserver to multiple users at once.
• The Mandelbrot set, Perlin noise and similar images, where each point is calculated independently.
• Rendering of computer graphics. In computer animation, each frame or pixel may be rendered independently (see parallel rendering).
• Brute-force searches in cryptography.[8] Notable real-world examples include distributed.net and proof-of-work systems used in cryptocurrency.
• BLAST searches in bioinformatics for multiple queries (but not for individual large queries) [9]
•Large scale facial recognition systems that compare thousands of arbitrary acquired faces (e.g., a security or surveillance video via closed-circuit television) with similarly large number of previously stored faces (e.g., a rogues gallery or similar watch list).[10]
• Computer simulations comparing many independent scenarios, such as climate models.
• Evolutionary computation metaheuristics such as genetic algorithms.
• Ensemble calculations of numerical weather prediction.
• Event simulation and reconstruction in particle physics.
• The marching squares algorithm
• Sieving step of the quadratic sieve and the number field sieve.
• Tree growth step of the random forest machine learning technique.
• Discrete Fourier transform where each harmonic is independently calculated.
• Convolutional neural networks running on GPUs.
• Hyperparameter grid search in machine learning.

edit:
Das „mehr“ an Kernen ist ja hier nicht global zu betrachten sondern innerhalb einer Plattform für den Enthusiast-Anwender. Die ganzen Server- und HPC-Anwendungen werden ja bereits von EPYC & Co. entsprechend bedient.
 
Zuletzt bearbeitet:
Schau mal bitte in deinem Link unter dem Kapitel „Examples“ nach. Ich finde dort nur wenig, was für den Heimanwender (derzeit) von Belang wäre.
...

Ganz zu schweigen davon dass einige Beispiele dabei sind die sich zwar gut parallelisieren lassen, dafür aber sehr schnell in den Bereich kommen wo die Speicherbandbreite limitiert. So grob als Anhaltspunkt gilt hier 2 Kerne pro Speicherkanal, danach sinkt die parallele Effizienz sehr schnell und mehr Kerne helfen nichts. Nur mehr Systeme.
 
Das mag ja sein. Ich habe dabei nicht (nur) an den Heimanwender gedacht.
Natürlich hast du völlig recht, dass es reichlich sehr gut parallelisierbare Probleme gibt, bei denen viele Kerne hilfreich sind. Du hast aber mit deinem Posting direkt eines zitiert, in dem es um Heimanwender und entsprechende Anwendungszenarien ging. Zudem adressiert Threadripper im Gegensatz zu EPYC aber eben diesen Heimanwender.
 
Natürlich hast du völlig recht, dass es reichlich sehr gut parallelisierbare Probleme gibt, bei denen viele Kerne hilfreich sind. Du hast aber mit deinem Posting direkt eines zitiert, in dem es um Heimanwender und entsprechende Anwendungszenarien ging. Zudem adressiert Threadripper im Gegensatz zu EPYC aber eben diesen Heimanwender.

Aber wieso soll man denn beispielsweise als selbständiger Entwickler ein Epyc System kaufen, wo doch ein Threadripper wesentlich preiswerter ist?

Ganz zu schweigen davon dass einige Beispiele dabei sind die sich zwar gut parallelisieren lassen, dafür aber sehr schnell in den Bereich kommen wo die Speicherbandbreite limitiert. So grob als Anhaltspunkt gilt hier 2 Kerne pro Speicherkanal, danach sinkt die parallele Effizienz sehr schnell und mehr Kerne helfen nichts. Nur mehr Systeme.

Das kommt ganz auf das Problem an, was parallelisiert wird. Ich habe noch keine Problem mit der Bandbreite gehabt.
 
Und deshalb schrieb ich nicht "immer alles" sondern "einige Beispiele".

Aber wieso soll man denn beispielsweise als selbständiger Entwickler ein Epyc System kaufen, wo doch ein Threadripper wesentlich preiswerter ist?
Ich habs gemacht und bin vollauf zufrieden. TR hätte nicht ansatzweise die gleiche Leistung geliefert für meine Anwendungen. Mal ganz davon abgesehen dass bei 128GB RAM derzeit offiziell Schluss ist. Dass mit TR mehr geht wie die Spezifikationen nahe legen habe ich noch nicht in freier Wildbahn gesehen.
 
Nein. weil Threadripper nunmal nur 4 Speicherkanäle liefert. 2x8 ist da eine ganz andere Hausnummer, egal wie hoch man den RAM bei TR übertaktet.
 
Nein. weil Threadripper nunmal nur 4 Speicherkanäle liefert. 2x8 ist da eine ganz andere Hausnummer, egal wie hoch man den RAM bei TR übertaktet.

Kannst du da mal Beispiele nennen?
Meine Probleme sind eher Cache-lastig und mit vielen Operationen, wie zum Beispiel kombinatorische Optimierung. Selbst bei Fitnessfunktionen, die auf relativ große Datenmengen zugreifen, gabs keine Probleme mit der Bandbreite. Mein System schafft über 90Gb/s.
 
CFD und Strukturmechanik sind Paradebeispiele für bandbreitenlimitierte Anwendungen.
Einen relativ simplen Benchmark findest du hier: Download
Dazu die Software runterladen und das Beispiel in examples/benchmarks/cavity3d compilieren. Mit einer Problemgröße von 400 schaffe ich 252msu auf 32 Kernen bzw. 158msu auf 16 Kernen. Hätte ich DDR4-2666 statt DDR4-2133 ginge noch etwas mehr. Und je größer das Problem wird desto größer wird der Vorteil gegenüber CPUs mit weniger Speicherbandbreite.
 
Ich weis nciht wie Bauer zu der Aussage kommt - das spricht alles sehr dafür das sie die selbe Fertigungsstraße nutzen. Dafür müßen ja nicht alle komponenten die exakt selben sein. Die Platinen sind beinahe ident, bis auf kleine Identifizierungsmerkmale, aber keine ersichtlichen mechanischen Unterschiede. Auch ebi der bestückung ists das selbe - eienn Widerstand statt einem Kondensator aufzulöten ist kein Aufwand. Was wirklich neue Fertigungsstraßen brauchen würde währe wenn es Unterschiedliche Die-Größen/Anordnungen wären, oder die Lötstellen anders angeordnet wären.


Ist halt eben die Frage was stärker ins Gewicht fällt, die erhöhten Zugriffszeiten beim RAM oder die Tatsache, dass die vollen 64MB L3 Cache zur Verfügung stehen. Im Prinzip ,müsste das OS auf dieses Problem angepasst werden, einmal mit einer entsprechenden Threadzuweisung und zum anderen könnte man die Daten, für solche Anwendungen, in allen , den der jeweiligen CPU Cluster zugeordneten RAM Modulen, vorhalten. Das wird aber wohl noch etwas dauern, bis dahin muß man mit den paar % Leistungsverlust leben.

Nur hat RyZen effektiv nur 8MB L3 cache. wenn auf den cache der anderen Kernseite zugegriffen wird dann ist das beinahe gleich langsame wie ein RAM zugriff. die L3 Latenz steigt bei mehr als 4MB schon an, bis 8MB dann halbwegs gleichbleibend, und bei 8-16 MB ist der L3 fast nutzlos. Die 64 MB sind zwar vorhanden, aber eben "nur" als 8x8 MB, also wenn man sie pro CCX exklusiv nutzt.
Das ist auch eine der Ursachen warum Threadripper/Ryzen in manchen Aufgaben den Xeons haushoch überlegen sind während sie in anderen weniger als die hälfte der Leistung bringen.
 
Ich träume gerade von einem 32-Kern Threadripper mit 4,0 GHz und 250 W TDP mit Wakü, dazu ne Titan XpZ Dual GPU mit 32 GB VRAM (2x 16 GB).
So allmählich würden wir dann in Gefilde kommen, in denen man auch andere Spiele außer FIFA in 4K mit 160 fps zocken und nebenher noch mitschneiden und streamen kann :D
Okay, für den Preis von solcher Hardware kaufen sich andere ein Auto :ugly: Auf der anderen Seite könnte man einen solchen Rechner nahezu auf 10 Jahre abschreiben. Der würde bei der derzeitigen Entwicklung mit ziemlicher Wahrscheinlichkeit selbst im Jahr 2028 noch die Mindestanforderungen für Spiele erfüllen :lol:
 
Also irgendwie tut es mir schon weh, wenn der8auer teure CPUs köpft :rollen:. Aber insgesamt ein interessanter Fund.

Zum Thema Threadripper vs EPYC: ich denke Threadripper ist auch für kleine Unternehmen und Selbstständige / Freiberufler interessant und nicht nur für Enthusiasten / Heimanwender. Es bietet offiziell ECC-Unterstützung (Ryzen hingegen inoffiziell), was im professionellen Umfeld häufig vorausgesetzt wird und hat ein ausgezeichnetes P/L-Verhältnis. Es fehlt bei vielen Boards die Fernwartung, was aber eher bei mittleren / großen Unternehmen eine Rolle spielt.

EPYC ist im Workstation-Markt (noch) nicht angekommen - da mangelt es noch an Fertig-Workstations à la Dell Precision oder HP Z Workstation.
 
CFD und Strukturmechanik sind Paradebeispiele für bandbreitenlimitierte Anwendungen.

OK verstehe. Da wird kaum gerechnet und mehr "geschaufelt".

Im Rahmen der Kombinatorik kannst du du eine CPU mit wenigen Daten praktisch unbegrenzt beschäftigen.

die L3 Latenz steigt bei mehr als 4MB schon an, bis 8MB dann halbwegs gleichbleibend, und bei 8-16 MB ist der L3 fast nutzlos. Die 64 MB sind zwar vorhanden, aber eben "nur" als 8x8 MB, also wenn man sie pro CCX exklusiv nutzt.

Das habe ich auch schon beobachtet. Warum ist das eigentlich so? Eigentlich müsste es doch von 0-8MB gleichbleibend schnell sein.
 
Zuletzt bearbeitet von einem Moderator:
Ich träume gerade von einem 32-Kern Threadripper mit 4,0 GHz und 250 W TDP mit Wakü, dazu ne Titan XpZ Dual GPU mit 32 GB VRAM (2x 16 GB).
So allmählich würden wir dann in Gefilde kommen, in denen man auch andere Spiele außer FIFA in 4K mit 160 fps zocken und nebenher noch mitschneiden und streamen kann :D
Okay, für den Preis von solcher Hardware kaufen sich andere ein Auto :ugly: Auf der anderen Seite könnte man einen solchen Rechner nahezu auf 10 Jahre abschreiben. Der würde bei der derzeitigen Entwicklung mit ziemlicher Wahrscheinlichkeit selbst im Jahr 2028 noch die Mindestanforderungen für Spiele erfüllen :lol:

Dazu sollte das Spiel dann überhaupt erst starten!
Bei über 16 Kernen gibt es schon Probleme mit dem einen oder anderen Titel, irgendwie bescheuert im BIOS Kerne deaktivieren zu müssen um ein Spiel überhaupt spielen zu können.
Und Fifa ist eines der genügsamsten Titel überhaupt, das kann ich sogar mit DSR Faktor 4 ( wenn du so willst, 14k) mit über 100 Fps zocken (mal davon abgesehen das es ohne Synchronisation ruckelt).
 
Meiner bescheidenen Meinung nach macht Threadripper sowohl für Heimanwender (z.B. Rendering) als auch für Professionals Sinn. Erstens kommt es darauf an, was die Anwender damit machen und zweitens hat Threadripper gegenüber Epyc auch einige Vorteile. Da wäre der Preis und auch andererseits der höhere Takt und die Übertaktbarkeit. Für mich persönlich wäre ein Threadripper mit 32 Kernen sinnvoller als ein Epyc Pendant. Für andere wiederum ist es umgekehrt der Fall, ein Beispiel (FEM) haben wir ja nun gesehen.

Man sieht, das man hier ohne weiteres keine Pauschalaussagen treffen kann und Käufer sich vorab Gedanken machen müssen, was sie tun wollen und brauchen.
 
Das habe ich auch schon beobachtet. Warum ist das eigentlich so? Eigentlich müsste es doch von 0-8MB gleichbleibend schnell sein.
Da kann ich auch nur vermutungen anstellen da ich selbst dazu nur mal minimale tests gemacht hab und selbst jetzt keine RyZen beasierte CPU besitze.
Wenn man sich die Substrat-Bilder ansieht dann bemerkt man das der L3 Cache aus vielen kleineren Blöcken besteht. Auf AMDs eignen Unterlagen sieht man dann das es sich um 8 1MB Blöcke handelt, von denen in eine Richtung je 4 durchgehend verbunden sind und einen Datenkanal zur anderen Seite besitzen. Ich vermute das von dort die Verzögerung stammen.
 
Man sieht, das man hier ohne weiteres keine Pauschalaussagen treffen kann und Käufer sich vorab Gedanken machen müssen, was sie tun wollen und brauchen.
Kenne ähnliche Probleme und ist auch ein schwieriges Thema. Der Vorstand hätte am liebsten "Einheitsserver" für das ganze Unternehmen. So ein Sammelsurium von absolut unterschiedlichen Servern erhöht natürlich den Aufwand für die Wartung gewaltig.
Problematisch wird es, wenn du über 100 Benutzergruppen mit absolut unterschiedlichen Ansprüchen hast. Alleine die Anzahl der Ersatzrechner wird dann interessant.
Schwieriges Thema.
 
Aber wieso soll man denn beispielsweise als selbständiger Entwickler ein Epyc System kaufen, wo doch ein Threadripper wesentlich preiswerter ist?
Ich bin kein selbständiger Entwickler, daher kann ich dir diese Frage nicht beantworten. Ich könnte mir allerdings vorstellen, dass, wenn du dein Geld damit verdienst und auf Verfügbarkeit angewiesen bist, eine entsprechende Workstation etwa mit Service-Vertrag oder der mit registered-RAM mögliche Ausbau interessant ist. Oder auch die Option auf mehr als nur einen Sockel - je nachdem wie parallel ein Problem ist.

Wenn man als selbständiger Entwickler natürlich Javascript für Websites entwickelt, oder halbwegs normale Excel-Makros, dann braucht man auch keine so performante Workstation. Ist wie immer eine Frage der Ansprüche.
 
Zuletzt bearbeitet:
Zurück