AMD Ryzen: Windows 10 kennt AMD-SMT, aber nicht die CCX

Ich hätte gedacht, dass die Bandbreite da mit reinspielt. Schließlich müssen, wenn ein Prozess von einem CCX zum anderen wechselt, auch die Daten vom Cache rüber.
Das denkst du auch soweit richtig die Bandbreite ist genau da mit dem Standard ramtakt angegeben irgendwo hatte ich das mal gelesen.

GS6 via Web
 
Ich kann mir gut vorstellen, dass noch Besserung eintritt und die Kinderkrankheiten überstanden werden.

Allerdings ist es schon ein wenig peinlich, wenn das offiziell unterstützte Betriebssystem von MS dann schlechter läuft als eine deutlich ältere Version. Da beißt die Maus keinen Faden ab.

Kriegt man es in den Griff, kann man später drüber schmunzeln... ;)
 
Ich kann mir gut vorstellen, dass noch Besserung eintritt und die Kinderkrankheiten überstanden werden.

Allerdings ist es schon ein wenig peinlich, wenn das offiziell unterstützte Betriebssystem von MS dann schlechter läuft als eine deutlich ältere Version. Da beißt die Maus keinen Faden ab.

Kriegt man es in den Griff, kann man später drüber schmunzeln... ;)
Im CB Test ist Windows 7 teilweise langsamer als Windows 10 mit aktiven höchstleistungs Modus.

GS6 via Web
 
Na dann haben wir ja noch einige Jahrhunderte Zeit :-D




Er meint vermutlich nicht "reibungslos", sondern "arbeitet wie vorgesehen". Wenn tatsächlich die Inter-CCX-Kommunikation verantwortlich für den Leistungsverlust ist, dann resultieren die Leistungseinbußen direkt aus der Prioritätensetzung von AMD und sind kein "zu behebendes Problem".

Edit: hat sich erledigt.
 
Ich hätte gedacht, dass die Bandbreite da mit reinspielt. Schließlich müssen, wenn ein Prozess von einem CCX zum anderen wechselt, auch die Daten vom Cache rüber.

Klar. Aber die Bandbreite kannst du im Prinzip wirklich beliebig wählen, das kostet "nur" Leitungen bzw. Chipfläche.

Die Latenz hingegen kannst du nicht so leicht verringern. Dafür musst du nämlich die elektrischen Signale über besagte Leitungen schneller pulsen (= den Bustakt erhöhen), und da kommst du dann irgendwann an eine harte Grenze. Das ganze ist ganz analog zu den CPU-Kernen selbst, bei denen man seit Jahren bei ~ 4GHz rumdümpelt.

Bei den Interconnects liegt die Grenze aber niedriger, weil die Leitungen länger sind.
 
Klar. Aber die Bandbreite kannst du im Prinzip wirklich beliebig wählen, das kostet "nur" Leitungen bzw. Chipfläche.

Die Latenz hingegen kannst du nicht so leicht verringern. Dafür musst du nämlich die elektrischen Signale über besagte Leitungen schneller pulsen (= den Bustakt erhöhen), und da kommst du dann irgendwann an eine harte Grenze. Das ganze ist ganz analog zu den CPU-Kernen selbst, bei denen man seit Jahren bei ~ 4GHz rumdümpelt.

Bei den Interconnects liegt die Grenze aber niedriger, weil die Leitungen länger sind.

Also würdest du sagen, dass jegliche Multi-CCX-Chips Probleme mit der Latenz haben werden? Gerade bei Naples mit acht CCX-Modulen würde das doch nochmal höhere Latenzen erzeugen?
 
Macht es in Benchmarks einen Unterschied, ob ich einem Programm ...
1. 4+4 Kerne eines einzigen CCX zuweise und
2. 2+2 und 2+2 aus den beiden CCX zuweise?
 
Macht es in Benchmarks einen Unterschied, ob ich einem Programm ...
1. 4+4 Kerne eines einzigen CCX zuweise und
2. 2+2 und 2+2 aus den beiden CCX zuweise?
Wenn du bei CB schaust dann schon weil bei punkt 1 nicht über das Infinity Fabric kommuniziert werden muss. In Anwendungen wirst du kaum ein Unterschied spüren dafür in spielen wo last wechsel häufiger vorkommen können.

GS6 via Web
 
Macht es in Benchmarks einen Unterschied, ob ich einem Programm ...
1. 4+4 Kerne eines einzigen CCX zuweise und
2. 2+2 und 2+2 aus den beiden CCX zuweise?

Da ein R7 aus 2 CCX ( sind es auch 2 L3 Caches), sollte jetzt ein Kern mit einem anderen Kern ( anderer CCX) zusammenarbeiten drosselt dieses . am effektivsten wäre die Nutzung eines CCX da so keine Kommunikation zwischen den CCX drosselt. Aber an der Kommunikation und deren Latenzen ( Geschwindigkeit) kann sich durch Optimierungen schon noch was ändern. Nur wieviel dabei optimiert werden wird ist Glaskugel Sache.
 
Da ein R7 aus 2 CCX ( sind es auch 2 L3 Caches), sollte jetzt ein Kern mit einem anderen Kern ( anderer CCX) zusammenarbeiten drosselt dieses . am effektivsten wäre die Nutzung eines CCX da so keine Kommunikation zwischen den CCX drosselt. Aber an der Kommunikation und deren Latenzen ( Geschwindigkeit) kann sich durch Optimierungen schon noch was ändern. Nur wieviel dabei optimiert werden wird ist Glaskugel Sache.
Ich bin gespannt was AMD meint mit dem Update im April. Ob es microcode seitig ist oder durch MS.

GS6 via Web
 
Testet AMD die CPUs nicht?
Wie kann so ein eklatanter Fehler nicht auffallen?
Wenn du die Latenz der Infinity Fabric meinst die ist sogar schneller auf dem Papier als der ringbus von Intel da es eine Netz Struktur ist. Ich bin auf vergleiche von naples und Xeon gespannt welcher schneller ist auch wenn für Otto Normalverbraucher eher uninteressant.

GS6 via Web
 
Testet AMD die CPUs nicht?
Wie kann so ein eklatanter Fehler nicht auffallen?

Eklatanter Fehler? Naja bei mir brennt nix durch lach, es fehlt nur der Feinschliff damit alles optimal zusammenarbeitet. Getestet werden die schon, aber wie man sieht gab es wohl ein paar Szenarien in den benches die gezeigt haben das Ryzen in manchen Dingen dringend Optimierungsbedarf hat. Solange man die @ stock fährt sind sie soweit stabil. Abwarten wie bei allen neuen Architekturen ( da haben alle mit zu kämpfen gehabt.mal mehr ,mal weniger)
 
AMD wusste sicher um die Problematik und hatte entweder nicht die Zeit oder die Kapazitäten um rechtzeitig eine Lösung zu entwickeln.
 
Da ein R7 aus 2 CCX ( sind es auch 2 L3 Caches), sollte jetzt ein Kern mit einem anderen Kern ( anderer CCX) zusammenarbeiten drosselt dieses . am effektivsten wäre die Nutzung eines CCX da so keine Kommunikation zwischen den CCX drosselt. Aber an der Kommunikation und deren Latenzen ( Geschwindigkeit) kann sich durch Optimierungen schon noch was ändern. Nur wieviel dabei optimiert werden wird ist Glaskugel Sache.
Das ist mir durchaus bewusst. Daher war ja auch meine Frage, ob man das nicht irgendwie Nachstellen kann, wenn man im Taskmanager den Anwendungen nur die Nutzung bestimmt Kerne erlaubt (1 CCX vs 2 halbe CCX). Sofern dies in Benchmarks funktioniert, kann man schon heute eine grobe Aussage darüber Treffen, ob und wie viel die Optimierung bringt. ;)

Jetzt fehlt mir nur noch ein AMD Ryzen zum Probieren. :D
 
AMD wusste sicher um die Problematik und hatte entweder nicht die Zeit oder die Kapazitäten um rechtzeitig eine Lösung zu entwickeln.

AMD hat mit der Zuordnung der Threads in Windows nichts zu tun.
Microsoft wusste garantiert bescheid.. immerhin wird XBox Scorpio wahrscheinlich einiges von Zen verwenden, genau wie sie Vega Technik verwenden.
 
Zurück