7800X3D überhitzt - Temp.-Limit funktioniert nicht zuverlässig

ZedUp

ZedUp Staff
Hallo liebe PCGHX-Community!

Bei unseren letzten Tests für ein neues Miet-PC-System ist ein sehr kurioses Verhalten eines 7800X3D aufgefallen. Es gab dazu auch einen längeren Livestream, in dem man das Problem und sein erstmaliges Auftreten nachvollziehen kann (ab 3h:20m):

Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Twitch. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.

Das System:
Ryzen 7 7800X3D
Manli RTX 4070
Asus ROG Strix B650E-I-Gaming
2x 32 GB G.Skill Vengeance DDR5-5200
2 TB WD SN750
Win 11 Pro

Zu dem Zeitpunkt war ein Dynatron A45 montiert (kanpp 10k RPM). Könnte also laut werden. War ein just for fun Kühler. Also nicht ernstnehmen. ;)

Das Problem:
Im Benchmark von Shadow of the Tomb Raider geht die CPU über 90°C hinaus und schaltet sich bei rund 97°C ab. Das kuriose, im CB23 tut sie das nicht und hält sich an jedes Temp-Limit. Das gilt auch für manuell gesetzte Temp.-Limits. von 70 bis 90 °C. Im CB23 wird das Limit übernommen und die CPU taktet sich runter. Im Benchmark nicht!

Richtig merkwürdig wird es, weil ein Temp.-Limit von 70 °C mal übernommen wurde und die CPU sich ordnungsgemäß im Spiele-Benchmark heruntergetaktet hat (ab 3h:30m). Danach aber nicht mehr wieder.

Was noch nicht ausprobiert wurde:
Älteres BIOS
Gegentest mit anderem Board und anderer CPU

Habt ihr eine Erklärung für dieses Verhalten?
 
Klingt für mich erstmal nach einem singlecore Lastszenario und dadurch wird ein kern sehr heiß.

Da sich die CPU aber eigentlich bei maximal 89°C Heruntertakten sollte, könnte es ein Problem an der Schicht zwischen HS und CCD liegen.

Welche BIOS Version ist denn aktuell drauf?
Es könnte auch schon helfen, wenn das BIOS resettet wird, einige Einträge gibt es ja mehrfach in verschiedenen Menüs und dort würde ich dann überall die gleichen Werte eintragen (Suchfunktion nutzen hilft hier, da einiges sehr versteckt ist und man sich sonst durch alle Menüs wuseln muss).
 
Es ist das aktuelle BIOS 2611 installiert.

Wie man im Stream sehen kann, ist die Temperatur gleichmäßig ansteigend - zumindest softwareseitig ausgelesen - und spätestens bei einem Temp.-Limit von 70°C dürfte es eigentlich keinen Hotspot geben, weil sich das ja selbst regulieren müsste.

Default-Settings wurden geladen, keine Änderung.

Aber ein CMOS-Reset wäre noch eine Idee!
 
Ich spule einen Stream nicht am Handy bis zu besagter stelle vor (abgesehen davon, dass ich das am Handy eh geblockt habe), daher war alles was ich schrieb aus den Beschreibungen der Geschehnisse..

Für das Brett gibt es bereits ein AGESA Update (1.1.8.0) Bios Version wird auf 2801 gesetzt, allerdings ist dies ein Beta Bios (ich habe mit meinem B650E-E damit aber keine Probleme).


Quelle:
 
und spätestens bei einem Temp.-Limit von 70°C dürfte es eigentlich keinen Hotspot geben, weil sich das ja selbst regulieren müsste.
Wenn die Last nur auf einem oder zwei Kernen anliegt wie soll sich das von selbst regulieren? Interessant wäre ob es bei dem 145w TDP Cooler einen ordentlichen Abdruck gibt. Dadurch das es ein extrem flacher 1HU Cooler ist und der Lüfter ja auch "Höhe einnimmt" befindet sich da ja quasi nur ein Kupferstreifen drunter.

Interessant wäre ob sich die CPU auf anderen Boards genau so verhält. Sprich ob man hier ASUS und das UEFI als Fehlerursache eingrenzen kann.
 
Wenn die Last nur auf einem oder zwei Kernen anliegt wie soll sich das von selbst regulieren?
Wenn du das Temp-Limit so setzt wird es normalerweise bei jeder Situation und Lastart hart eingehalten - und wenn dafür der Lastkern auf 2 GHz runter muss.
Was hier beschrieben wird ist definitiv eine Fehlfunktion, alle modernen CPUs haben keinerlei Problem damit 70°C einzuhalten wenn man das von ihnen verlangt, notfalls halt mit strammem Throtteling.

Wenn ich das Limit so einstelle, woran sollte es sich sonst regulieren? Package-Temp evtl.?
Die Temperaturlimits die man bei AMD im Bios bzw. im PBO einstellt sind Kerntemperaturlimits.

Interessant wäre ob sich die CPU auf anderen Boards genau so verhält.
Das wäre, sofern das BETA-Bios das problem nicht behebt, auch meine nächste Option gewesen, vor allem da man als PC-Laden vermutlich ja ausreichen Hardware zum test da hat. :-)
 
Das wäre, sofern das BETA-Bios das problem nicht behebt, auch meine nächste Option gewesen, vor allem da man als PC-Laden vermutlich ja ausreichen Hardware zum test da hat. :-)

Da wäre ich mir mal gar nicht so sicher. So kurz vor Ryzen 9000 legt man sich als Vermieter ungerne den alten Kram auf Lager. :ugly:

EDIT

Naja wir werden sehen. Ich starte gleich mal den Stream und dann gehen wir Dir Sache mal auf die Spur. Hier liegt noch ein 8500G, den man nutzen kann. Ansonsten gibt es halt BIOS-Installationen bis zum geht nicht mehr.
 
Zuletzt bearbeitet:
Dann muss zur Not die Kaffeekasse geplündert werden. :D So ein ASrock B650M-HDV/M.2 kostet ja inzwischen kaum noch was.
 
Hab mir die besagten Stellen nun gerade mal angesehen.

Die Backplate braucht leider etwas "Luft" da sonst ein leichter Hitzestau entsteht, das nur erstmal vorweg.

Was die Settings angeht:

Wenn du PBO auf Enabled stellst, werden die Boardlimits gesetzt (max) und auch wenn du es auf manuell setzt ohne die Limits einzustellen, werden die maximalen Werte genommen.

Standardwerte wäre 162W PPT - 120A TDC und 180A EDC (120w TDP)
ASUS stellt das auf 1000 (jeweils) bzw. eben das maximal Mögliche.

Jegliche Einstellungen die du vornimmst würde ich nicht auf der "Hauptseite" / "AITweaker" sondern im AMD Menü unter "Advanced" einstellen, denn diese Settings müssen übernommen werden (AMD Vorgabe -> AMD CBS / PBS Menüs).

Nachtrag:
Ich werde mir das bei mir nun Mal anschauen, eventuell ist es ein Asus Bug, möglich wäre es ja.

Nachtrag 2:

Nach eigenen Tests ist mir aufgefallen, dass nur SotTR das eingestellte Limit nicht einhält.
Selbst bei Horizon Forbidden West wird beim shader kompilieren das Limit eingehalten.

Single Core Last wird ebenfalls das Temp Limit eingehalten, also scheinbar ein Bug von SotTR (wenn es bei allen anderen denn eingehalten wird).
 
Zuletzt bearbeitet:
Nachtrag 2:

Nach eigenen Tests ist mir aufgefallen, dass nur SotTR das eingestellte Limit nicht einhält.
Selbst bei Horizon Forbidden West wird beim shader kompilieren das Limit eingehalten.

Single Core Last wird ebenfalls das Temp Limit eingehalten, also scheinbar ein Bug von SotTR (wenn es bei allen anderen denn eingehalten wird).

Das ist das Problem. Haben wir eben auch im Stream herausgefunden. Kurioserweise ist im Game selbst alles OK. Nur im Benchmark nicht.

Es ist nicht Asus-spezifisch. Zuschauer im Stream konnten das Problem nachstellen und ich bei mir parallel noch einmal auf einem MSI-Board mit einem 7900X3D, der zu einem imaginären 7600X3D gestutzt wurde.

Ein Schelm, der denkt, dass so etwas ausgerechnet in einem beliebten Benchmark passiert...
 
Deswegen halte ich persönlich nichts von integrierten benchmarks ;)

Da sieht man einmal mehr, warum (auch wenn es nur ein Bug sein sollte)
 
Wie kann ein Software-Benchmark bitte Einfluss auf eine im Mainboard-BIOS verankerte Funktion haben, und diese einfach außer Kraft setzen? Vor allem, warum fällt das erst jetzt auf? Ich kann das beizeiten mal gegenprüfen, möchte aber ungern unseren 7800X3D dafür opfern. Die Frage wäre auch, ob das auch bei anderen CPUs passiert.
 
Dank Custom Loop war es bei mir noch 7 Grad weg von der Notabschaltung, aber dennoch weit über dem, für den Test eingestellten, 70°C Temp-Limit (waren 85°C in der Spitze).

Wie es dazu kommen kann, frag mich nicht, jedenfalls ist es das einzige Game (ingame Benchmark) der die Limits ignorierte.

Habe Horizon Forbidden West, Cinebench (single und multicore) und auch The First Descendant getestet, während des kompilierens wurde das Temp-Limit immer eingehalten, nur bei SotTR eben nicht.
 
Zuletzt bearbeitet:
jedenfalls ist es das einzige Game (ingame Benchmark) der die Limits ignorierte.
Ja, aber ein Spiel weiß doch im Grunde doch gar nicht, auf welcher Hardware es läuft. Wie kann ein Spiel, das wesentlich älter als sogar noch ein 5800X3D ist (2018 gab es ja nicht einmal Ryzen 3000!), dafür sorgen, dass vom Mainboard konfigurierte Limits nicht eingehalten werden? Das macht hinten und vorn für mich keinen Sinn.

Und wenn es bei einem 7900X3D auch der Fall ist, dann scheint die ganze Plattform dieses Problem zu haben. Im Büro baue ich heute mal eine Ryzen-CPU auf, einen 7600, oder 7500F, etwas in der Art, und stelle 70 °C als Ziel ein. Das ist perfekte Abwechslung vom 14900KS-RAM-Tuning, welches nebenher läuft :daumen:
 
Bei mir sieht es so aus (ohne manuelles Templimit):

sotr7800x3d.jpg


Ich installiere das Spiel gerade auf einem Rechner mit einem 5800X3D, ebenfalls mit MSI-Board, mal schauen, was dabei rauskommt.

Scheint mir aber eher ein Asus-Problem zu sein.
Ja, aber ein Spiel weiß doch im Grunde doch gar nicht, auf welcher Hardware es läuft. Wie kann ein Spiel, das wesentlich älter als sogar noch ein 5800X3D ist (2018 gab es ja nicht einmal Ryzen 3000!), dafür sorgen, dass vom Mainboard konfigurierte Limits nicht eingehalten werden? Das macht hinten und vorn für mich keinen Sinn.

Und wenn es bei einem 7900X3D auch der Fall ist, dann scheint die ganze Plattform dieses Problem zu haben. Im Büro baue ich heute mal eine Ryzen-CPU auf, einen 7600, oder 7500F, etwas in der Art, und stelle 70 °C als Ziel ein. Das ist perfekte Abwechslung vom 14900KS-RAM-Tuning, welches nebenher läuft :daumen:
Na ja, das Spiel wird aller Wahrscheinlichkeit nach trotzdem die CPU-ID anfordern, ich kann mir allerdings nicht vorstellen, das es ein grundsätzliches Problem SoTR vs AMD-CPUs ist, denn dann hätte mein Rechner es ja auch.
 
Das einzige Szenario das ich mir vorstellen kann wäre das, dass der Speichercontroller übermäßig stark belastet wird und dadurch die Temperatur in dem Benchmark nach oben schießt.

Da der Controller scheinbar kein Templimit hat, wäre das zumindest eine Erklärung, ob und wie das zutrifft kann ich nicht belegen.
 
Zurück