News Intels CPU-Architektur: Einblicke der ehemaligen Chefentwicklerin - Temperatur als Problem

PCGH-Redaktion

Kommentar-System
Teammitglied
Debbie Marr, ehemalige CPU-Architektur-Chefin bei Intel, hat Details über die Probleme und Lösungen in der Entwicklung verraten. Besonders kritisch ist demnach die rasante Temperaturentwicklung.

Was sagt die PCGH-X-Community zu Intels CPU-Architektur: Einblicke der ehemaligen Chefentwicklerin - Temperatur als Problem

Bitte beachten: Thema dieses Kommentar-Threads ist der Inhalt der Meldung. Kritik und allgemeine Fragen zu Online-Artikeln von PC Games Hardware werden hier gemäß der Forenregeln ohne Nachfrage entfernt, sie sind im Feedback-Thread besser aufgehoben.
 
Die Aussage zu P- und E- kernen:
"Angeblich laufen die meisten Anwendungen nur auf einem (P-)Kern. Am zweithäufigsten kommen hingegen Anwendungen, die alle Kerne belasten. Dann kommen die vielen E-Kerne zum Tragen."

Wie sieht es denn bei Anwendungen aus, die viele Kerne benötigen, aber auch Near-Realtime Anforderungen haben, beispielsweise im Recording-Bereich?

Dort hat man einen bunten Mix von Tasks, die alle zeitkritisch sind und sowohl Multithread- als auch Single-Thread-Performance benötigen.

Muss ich da jetzt auf Intel-Xeon-Architekturen ausweichen, damit man eine CPU bekommt, die nur Power‑Cores hat, um zu verhindern, dass zeitkritische Tasks (DAW/Nuendo oder VSTi oder Audiotreiber) nicht doch versehentlich auf E-Cores landen oder dass generell die DPC Latenzen möglichst niedrig bleiben, um kleinere ASIO buffer sizes zu ermöglichen ohne dass es zu Audio Aussetzern kommt?

Besonders auch in Hinblick auf Windows 10. Soweit mir bekannt ist, wurde der Intel Thread Director, der steuert, welche Threads auf P- oder E‑Cores verteilt werden, nur in Windows 11 weiterentwickelt.

Wäre ja kein Problem, auf Xeon zu bleiben, wenn nicht die aktuellen Xeon-Mainboards/CPUen mit hohem Basistakt und einem guten (reichhaltigen) PCIe-Sockel-Layout im Vergleich zu vor 5–10 Jahren nicht so extrem teuer geworden wären.

Leider findet man wenig fundierte/informative Artikel zu dem Thema, welche Plattform einem möglichst geringe Latenzen beschert. AMD wäre prinzipiell nicht schlecht nur hier soll die Implementierung der Chipsets nicht so gut sein (hinsichtlich Kompatibilität zu USB3 transfer modes für audio/recording) und wenn man eine CPU mit mehr als 8 Cores hat, dann gibt es 2 Chiplets in der CPU und dann frage ich mich, wie sich solch ein Design auf die Latenzen auswirkt.

Recording und Gaming haben, so finde ich, eins gemeinsam: Bei beidem möchte man geringstmögliche Latenzen während der Runtime.

Irgendwie wird es scheinbar immer schwieriger mit der Plattformwahl. Kaum noch PCIe Sockel. Wenn man Thunderbolt haben möchte, verkompliziert sich das Ganze beliebig, bei AMD eher weniger vertreten.

Ich hoffe, dass Intel sich erholt und wieder eine echte Alternative zu AMD wird und dass die PC-Plattform durch mehr PCIe Sockel wieder die alte Flexibilität zurückerlangt. Gerade jetzt, wo sich alles so eklatant verteuert, ist es umso wichtiger, Geräte aufrüsten zu können. Hier könnte Intel sich auch mal ein Beispiel an AMD nehmen, die scheinbar länger an einem Sockel festhalten, im Gegensatz zu Intel.
 
Zuletzt bearbeitet:
Muss ich da jetzt auf Intel-Xeon-Architekturen ausweichen, damit man eine CPU bekommt, die nur Power Cores hat, um zu verhindern, dass zeitkritische Tasks (DAW/Nuendo oder VSTi oder Audiotreiber) nicht doch versehentlich auf E-Cores landen?
Nein musst Du eigentlich nicht. Es gibt auch OS welchen Du sagen kannst welche Task auf welchen Kern laufen sollen. Ich bin mir ziemlich sicher, dass selbst Windows das beherrscht. E-Kerne kann man meines Wissens jedoch auch ggf über das Bios deaktivieren. Alternativ gibt es auch CPU Hersteller welche so eine Unterteilung in P und E Kernen nicht bieten, könnte eine Alternative sein.
 
Irgendwie wird es scheinbar immer schwieriger mit der Plattformwahl. Kaum noch PCIe Sockel. Wenn man Thunderbolt haben möchte, verkompliziert sich das Ganze beliebig, bei AMD eher weniger vertreten.
Du könntest das Problem umgehen mit einer Thunderbot PCIe Karte für ein AMD System.
Die Interconnect Latenzen von CPU Dies sind um Faktoren 1000x oder mehr kleiner als deine Latenz zwischen einzelnen aufgenommenen Frames. Daher sollte das nicht ins gewicht Fallen.
Aber auch bei Intel sollte das kein Problem sein. Moderne Aufnahmesoftware lässt den Codec ja auch über die GPU laufen für die RealTime komprimierung. Da dürfte die Latenz massgeblich grösser sein aus auf einer CPU.
 
Du könntest das Problem umgehen mit einer Thunderbot PCIe Karte für ein AMD System.
Ein separater Thunderbolt-Controller hängt bei AMD nicht direkt am CPU-I/O, sondern hinter zusätzlicher PCIe-Logik. Stabilität und Verhalten hängen stärker von Board-BIOS, Controller-Firmware und Treibern ab, wodurch Audio-Interfaces nicht immer so konsistent laufen wie an nativ integrierten Intel-TB-Hosts.
Für professionelles Recording mag das kein KO-Kriterium sein, aber native Thunderbolt-Implementierungen sind m.E. robuster, homogener und berechenbarer.
Die Interconnect Latenzen von CPU Dies sind um Faktoren 1000x oder mehr kleiner als deine Latenz zwischen einzelnen aufgenommenen Frames. Daher sollte das nicht ins gewicht Fallen.
Ja, das mag sein.
Aber auch bei Intel sollte das kein Problem sein. Moderne Aufnahmesoftware lässt den Codec ja auch über die GPU laufen für die RealTime komprimierung. Da dürfte die Latenz massgeblich grösser sein aus auf einer CPU.
Vielleicht im Videobereich, aber im Recordingbereich wird immer noch mit PCM gearbeitet, da geht nichts über die GPU.
 
Das Thema hat unser geliebter @der8auer doch auch schon einmal in einem Video mit einem Ingenieur behandelt:
Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.

Geiles Video btw :hail: ! Leider ist die Zeit wohl mittlerweile viel zu knapp für solche Videos geworden.
 
Temperatur ist das Problem an dem Intel mit der 13ten und 14ten Generation schließlich an seine Grenzen gekommen ist bzw überschritten hat, wenn man an das Microcode Update Problem denkt. Kein noch so ausgeklügeltes Design von ihnen konnte kompensieren, dass die 10nm Node am Ende war.

Jetzt mit Intels TSMC N3B Chips (Core 9 285K z.B.) werden die plötzlich mit AMDs Prozessoren im Effizienz-Index vergleichbar. Thermisch ist der Unterschied im realen Betrieb selbstverständlich geringer - was nützt denn die kühlere CPU, man reizt das Potential dennoch aus.
 
Ich denke da gibt es noch viele Stellschrauben. Ich hab mir damals nen 12900Kf geholt, wohlwissend das man mit vielen Stellschrauben wirbt, die man als Nutzer dann nie erreichen wird. Die Zeit in denen die Hersteller FTP - Seiten die Lösung waren sind vorbei. Wenn ich mir allein ansehe das man die Turbogruppen aus direkt nebeneinander liegenden Kernen erstellt, ist das ganz einfach unfassbar dumm.

Ich hab mal einen Die- Shot Photogeshoppt um zu zeigen wie eine 4- Core Group aussehen MUSS. Warum legt man hoch taktende Kerne im Standard direkt nebeneinander?! Das spricht doch so vieles dagegen. Interferenzen, Hitze etc.. Ich glaube kaum das man langsamer Unterwegs ist weil die Leiterbahnlänge nach oben geht. So ist ein inaktiver oder niedrig taktender Kern der Nachbar und keiner der gerade zieht was geht.

Bei den E- Core Clustern könnte man konsequenterweise auch so vorgehen. Simples Checkerboard.´Und man kommt ja auf die "kühlen" Kerne wenn man die bei Vollast monitored, so kann man das auch noch in Betracht ziehen.

Macht das so wenn ihr einen Prozessor der Serie habt- das funkt richtig gut. Und es wäre wohl kaum ein Problem das zu patchen. Zumindest im groben. Ist die Latenz gut genug und man rennt nicht in einen Waitstate, kann man das doch im Wechsel machen, vielleicht sogar mit Temp Tresholds für die Kerne. So werden die tatsächlich gleichmäßig belastet.


Ah und zu "welcher Kern für welchen Task". Ich suche lange nach einem Tool mit dem man das permanent zuordnen kann.

Vielleicht ginge der Spaß so auch verloren.

P.S.: Kern drei- warum 7 Grad mehr als der Rest XD

4 core turbo group.jpg
 
Zuletzt bearbeitet:
Zurück