News Zurück in die Zukunft: Intel setzt wieder auf Hyper-Threading

Ich kann mich auch noch daran erinnern, dass HT bzw SMT in einigen Spielen eher hinderlich war.
Aber das ist schon ein paar Jahre her. Mitlerweile können die wohl besser damit umgehen.
Ganz stark vereinfacht und verallgemeinert:
Je mehr Kerne eine CPU besitzt, desto weniger nützt HT / SMT beim Gaming, in Anwendungen ist es fast immer nützlich oder schadet zumindest nicht.

Ab 12 Kernen ist es eher hinderlich, bei 6 Kernen mittlerweile sehr nützlich und 4 Kerner sind quasi nur durch HT noch nutzbar.
 
der bench jetzt ist ca 3 jahre alt.. wie gesagt damals schon an euch weiter geleitet mit der bitte es gegen zu checken und es hatte euch nicht interessiert.
Vier Jahre. Und damit alles andere als aussagekräftig. Ich weiß nicht mehr, was ich dir vor vier Jahren gesagt hatte, aber womöglich, dass wir nach Spec testen und derlei experimentelle Optimierung höchstens in Tuning-Specials anwenden. Damals hat das CPU-Tuning aber noch Stephan gemacht. Das ist heute anders, denn ich habe hier das Zepter übernommen. Da ich derzeit jedoch einen 9950X3D optimiere und dort das Deaktivieren von CCD1 zu Problemen führt, werde ich das nicht ohne Weiteres testen können. Da AMD aber vermutlich weiter am CCD-Aufbau festhält, wird das Thema mit Zen 6 eine Renaissance erfahren.

Beim 9950X3D oder 7950X3D ist es jedenfalls essenziell, dass die Last bei CCD0 bleibt. Ob die Einstellungen im Power Explorer darauf einen Einfluss haben, sehe ich mir einmal an. CPPC habe ich jedoch bereits so konfiguriert, dass bevorzugt CCD0 verwendet werden soll. Leider kann ich jedoch nicht die Verbindung zur Xbox Game Bar lösen, was einfach nervig ist. Neue Spiele werden von letzterer regelmäßig nicht als "Spiel" erkannt und derzeit stürzt das Optionsmenü zum Konfigurieren dieser Einstellung reproduzierbar bei mir ab, da angeblich meine Win-10-Installation nicht mehr unterstüzt wird. Das macht Linux gerade etwas schmackhafter, muss ich sagen.
 
Wie es unter Intel wäre, weiß ich nicht. Aber bei mir habe ich SMT (Das Pendant zu Intels HT) deaktiviert, da es vor allem in CPU-Lastigen Spielen zu erheblichem Performanceverlust führte.
Meine CPU hat sowieso 12 Kerne, so viele nutzt kein Spiel.
Das l,iegt aber auch schon Jahre zurück das sowas passiert ist. Mittlerweile können ja alle Engines super mit SMT/HT umgehen und dies zu deaktivieren ist eher weniger clever.
 
@PCGH_Dave
Das ganze betrifft auch eher die nicht X3D CPUs mit 2 CCDs

5900x/5950x (hier konnt man cppc noch ausschalten im BIOS)
7900x/7950x
9900x/9950x

CPUs die gemischt aufgebaut sind wie der 9950X3D verhalten sich da ganz anders und du willst auch nicht das dort etwas gleichmäßig verteilt wird.


Da kann es jedoch sein das du mit dem powersetting Explorer auf "bevorzugt leistungsfähige Kerne" stellen musst (je nachdem wie Windows den x3D sieht.. entweder als efficent oder Performant)
Dann wird seitens Windows auch bevorzugt erst diese Kerne benutzt
 
Intel setzt wieder auf Hyper-Threading
Back to 2000...
Vor gut 25 Jahre kam HT auf den Markt mit dem Pentium 4 und nun setzt Intel wieder auf HT.
Tja, ob es heute noch Sinn macht lasse ich mal offen. Mittlerweile gibt es andere Techniken die HT übertrumpfen.
 
Um mal wieder zurück zum Thema zu kommen: Interessant ist, dass Intel damit keine Probleme hat. Es gibt also eine bessere Lösung und ich finds schade, dass AMD das nicht besser hinbekommt.
 
Um mal wieder zurück zum Thema zu kommen: Interessant ist, dass Intel damit keine Probleme hat. Es gibt also eine bessere Lösung und ich finds schade, dass AMD das nicht besser hinbekommt.
Nun Intel hat je nach Spiel eigene Probleme mit ihren P/E cores und dem sheduling
(Auch dazu kann man Tonnenweise im powersetting Explorer rumfuschen und einstellen...wenn man sich auskennt.. was ich aber nicht tue weil niemals so ne CPU in den Händen gehabt)

Vielleicht ist das ganze auch einfach ein Spiele Problem wie diese Programmiert sind ob sie von HT profitieren.. Anwendungen tun es auf jeden Fall.
 
Nun Intel hat je nach Spiel eigene Probleme mit ihren P/E cores und dem sheduling
Hatte, nicht hat. Anfänglich gab es Schwierigkeiten bei Alder Lake (weil Hybrid neu war) und ebenso anfänglich bei Arrow Lake, weil Intel die P- und E-Cores durch den Tile-Aufbau durcheinander gebracht hat. Aber wenige Monate nach dem Launch war das gegessen. Bei AMD hingegen kann man automatisch davon ausgehen, dass jedes neue Spiel erst einmal auf dem falschen CCD landet. Das ist das, was mich stört. Falls Intel jemals "3D-Cache" CPUs hat, werde ich AMD wohl den Rücken kehren, sollten sie nicht bald eine bessere Lösung in petto haben.
 
Hatte, nicht hat. Anfänglich gab es Schwierigkeiten bei Alder Lake (weil Hybrid neu war) und ebenso anfänglich bei Arrow Lake, weil Intel die P- und E-Cores durch den Tile-Aufbau durcheinander gebracht hat. Aber wenige Monate nach dem Launch war das gegessen. Bei AMD hingegen kann man automatisch davon ausgehen, dass jedes neue Spiel erst einmal auf dem falschen CCD landet. Das ist das, was mich stört. Falls Intel jemals "3D-Cache" CPUs hat, werde ich AMD wohl den Rücken kehren, sollten sie nicht bald eine bessere Lösung in petto haben.
Immerhin werden es ja bei AMD schon mehr Kerne pro CCD also die CCD´s größer. :daumen:
 
Hmm? Wir können das logischerweise nicht selbst bestätigen. Die Berichterstattung fußt auf einem einzelnen Beitrag bei X, der schon über ein Jahr alt ist, und ist ein Gerücht. Nicht mehr.
Wirklich? Das wäre schade. Ich dachte die Info wäre offiziell und gesichert. :ka:
Naja, das mit den größeren CCD und das was du geschrieben hattest. Wobei das mit dem CCD aber auch nur für den 12 Kerner gelten würde. Wenn wirklich 12 Kerne pro CCD kommen. Für den 24 Kerner nicht.
 
Back to 2000...
Vor gut 25 Jahre kam HT auf den Markt mit dem Pentium 4 und nun setzt Intel wieder auf HT.
Tja, ob es heute noch Sinn macht lasse ich mal offen. Mittlerweile gibt es andere Techniken die HT übertrumpfen.
Oder mehr SMT, wie es bei der Power-Architektur gemacht wird. Power11 fährt 8-fach SMT (bzw. gibt es die SMT-8 Option seit Power8).
 
Zuletzt bearbeitet:
Genau das ist doch der Sinn davon. Fast alle Spiele laufen auf einem einzelnen CCD besser. Muss auf das zweite ausgelagert werden, kostet das Leistung, immer.
Wenn ein Spiel zwölf Kerne nutzen kann, kann ich mir schon vorstellen, dass sechs Kerne langsamer sind als zwölf, auch wenn da ein Kommunikationsoverhead dazukommt. Eine 1:1-Skalierung steht ja gar nicht im Raum.
Um mal wieder zurück zum Thema zu kommen: Interessant ist, dass Intel damit keine Probleme hat. Es gibt also eine bessere Lösung und ich finds schade, dass AMD das nicht besser hinbekommt.
So wie das aussieht, sind bei Intel alle Kerne auf einem Tile, das löst natürlich das Problem der Latenzen zwischen den Tiles. Auf lange Sicht wäre vielleicht besser, wenn AMD dieses pauschale, automatische Parken, wenn ein Spiel erkannt wird, sein lässt. Das hat jetzt zwar in den meisten Fällen zu einem besseren Ergebnis geführt, mit steigender Parallelisierung ist aber abzusehen, dass das keine Lösung bleiben wird. Da müsste es dann schon für jedes Spiel ein Profil geben, bei dem vorher getestet wurde, ob es mit einem oder zwei CCDs besser läuft und das ganze auch noch in Abhängigkeit davon, wie viele Kerne jedes CCD hat.
 
Du vermischt hier einiges. Designkosten zu reduzieren oder SMT zu nutzen bedeutet nicht automatisch dass man hier langsamere Chips produziert.
Doch das tut es.
Bei SMT muss ein Kern oft 2 Threads gleichzeitig abarbeiten.
Der Intel P Kern ohne SMT kann in ruhe seine volle Power für 1 Thread nutzen und diesen dementsprechend schneller Abarbeiten.
 
So wie das aussieht, sind bei Intel alle Kerne auf einem Tile, das löst natürlich das Problem der Latenzen zwischen den Tiles.
Das Problem ist aber das gleiche oder zumindest sehr ähnlich, denn bei Intel gibt es ja mehr als einen Typ CPU Kern. Wenn der Thread Director also den falschen Prozess/Thread auf einen E-Kern legt, hat man nur noch die Performance von vor 5 Jahren.

Ich denke mal langfristig wird Microsoft Entwicklern eine bessere Schnittstelle zum OS Scheduler bieten müssen, damit die Entwickler der Engine im Zweifel selbst entscheiden können welcher Thread auf welchem Kern/Tile landet. Das geht zwar im Prinzip auch heute schon, ist aber besonders unter Windows eine Qual.
 
Das Problem ist aber das gleiche oder zumindest sehr ähnlich, denn bei Intel gibt es ja mehr als einen Typ CPU Kern. Wenn der Thread Director also den falschen Prozess/Thread auf einen E-Kern legt, hat man nur noch die Performance von vor 5 Jahren.
Eines der Gründe, warum z.B. die Raptor Lake basierenden Xeon ohne E-Cores daherkommen. VMs und Datenbanken machen sich in die Hose, wenn auf einmal ein wilder E-Core dazukommt oder im laufenden Betrieb auf einmal von P auf E Cores gewechselt wird.
 
Doch das tut es.
Bei SMT muss ein Kern oft 2 Threads gleichzeitig abarbeiten.
Der Intel P Kern ohne SMT kann in ruhe seine volle Power für 1 Thread nutzen und diesen dementsprechend schneller Abarbeiten.
Du kannst es ja deaktivieren. Es ist übrigens ganz normal, dass ein Kern mehrere Threads bearbeitet. Du kannst ja spaßeshalber mal schauen, wie viele Threads auf deinem System so laufen und das mit der Kernzahl deiner CPU vergleichen. Mit SMT können allerdings zwei Threads gleichzeitig die Ressourcen der CPU nutzen, was den Durchsatz insgesamt erhöht. Allerdings kann es passieren, dass zwei schwere Threads auf einem Kern laufen, wodurch einer davon langsamer läuft, was wiederum eine Anwendung ausbremsen kann, wenn die Threads voneinander abhängen. Festzustellen, welche Threads schwer oder leicht sind, ist aber nicht trivial und ändert sich auch gerne mal spontan.
Das Problem ist aber das gleiche oder zumindest sehr ähnlich, denn bei Intel gibt es ja mehr als einen Typ CPU Kern. Wenn der Thread Director also den falschen Prozess/Thread auf einen E-Kern legt, hat man nur noch die Performance von vor 5 Jahren.
Das stimmt wohl.
Ich denke mal langfristig wird Microsoft Entwicklern eine bessere Schnittstelle zum OS Scheduler bieten müssen, damit die Entwickler der Engine im Zweifel selbst entscheiden können welcher Thread auf welchem Kern/Tile landet.
Ist halt die Frage, ob das so viel bringt. Wenn mehrere Prozesse sich um die starken Kerne streiten, ist halt doch nicht trivial, ob es jetzt schneller wäre, da Wartezeiten inkauf oder mit einem schwächeren Kern vorlieb zu nehmen.
 
Zurück