7800X3D überhitzt - Temp.-Limit funktioniert nicht zuverlässig

Ich halte die von @Darkearth27 geäußerte Theorie bezüglich dem RAM-Controller durchaus für plausibel. Im zweiten run waren es jetzt schon 84 °C auf dem Tctl, während der Rest knapp unter 70°C blieb.

Ich nutze auf dem System 2x32 GB DDR5-6000 CL30 und einer SoC von 1,3v. @PCGH_Dave dürfte das nach wie vor mit 5200 testen, oder? Ich stelle mal XMP aus...
 
Für diesen Test hier nutze ich praxisnahe -6000, EXPO. Klassisches Profil, welches Nutzer mit so einer CPU laden würden, weil es ja der "Sweet Spot" :schief: ist.
 
7950X3D CCD0 only, Rest identisch zum Setup vorher, nur, dass ich die Lüfterdrehzahl dieses Mal nicht reduziert habe.

Tjmax: 70 °C
Erst der Abgleich mit CineBench R24:

5.png


Und jetzt Tomb Raider:

6.png


Tatsächlich liegt Tctl/Tdie deutlich über dem angegebenen Limit, während alle anderen Temperaturen im Rahmen bleiben. Wenn ich den prozentualen Anstieg ggü. dem Tjmax auf die eigentliche Tjmax von 89 °C übertrage, kämen am Ende ziemlich genau 100 °C Tctl/Tdie heraus. Ich vermute, dass sich die X3Ds schon vorher abschalten, getestet habe ich es bis jetzt nicht.

@Darkearth27
Hast du dein RAM-OC mal zurückgefahren, um deine RAM-Controller-Theorie zu überprüfen?
 
Ich habe den 7900X3D aka 7600X3D eben noch einmal freidrehen lassen. Der heißeste Kern liegt bei 77,9°C während Tctl bei 88,9°C lag. Aber die Lüfter vom Noctua sind auch hart gedrosselt.

Das Szenario mit der Notabschaltung wird man wohl nur erreichen, wenn man echt den letzten Boxed-Kühler verwendet. Ich hatte den Dynatron A45 ja auch fix auf 2200 U/Min laufen. Dafür ist der gar nicht ausgelegt. Der will ja eigentlich mit knapp 10K U/min laufen. :ugly:
 
@Darkearth27
Hast du dein RAM-OC mal zurückgefahren, um deine RAM-Controller-Theorie zu überprüfen?
Nein, bis jetzt noch nicht, werde ich im Laufe des Nachmittags dann aber testen.

Nachtrag:

Bin jetzt schon dazu gekommen.

Anstelle von 6600 nun nur noch 4800 und mit viel weniger SoC Spannung (anstelle von 1.3v nun nur noch 0.975v) bleibt die Temperatur fast gleich.
1717152286568.png


Auffällig dabei bleibt weiterhin, die Hohe Package Temperatur, während das CCD1 sogar unter 50°C ist, die IOD Temperaturen (Hotspot und AVG) sind unter 40°C und der Cache nur bei 30°C..

Also schon sehr merkwürdiges Verhalten was der Benchmark an den Tag legt.

RAM OC / SoC Spannung kann also als Ursache ebenfalls ausgeschlossen werden..
 
Zuletzt bearbeitet:
Ich halte die von @Darkearth27 geäußerte Theorie bezüglich dem RAM-Controller durchaus für plausibel. Im zweiten run waren es jetzt schon 84 °C auf dem Tctl, während der Rest knapp unter 70°C blieb.

Ich nutze auf dem System 2x32 GB DDR5-6000 CL30 und einer SoC von 1,3v. @PCGH_Dave dürfte das nach wie vor mit 5200 testen, oder? Ich stelle mal XMP aus...

Der gegen die IMC-Theorie vorgebrachte Einwand "anderer Chip" ist durchaus valide.^^
In sämtlichen hier geposteten Screenshots sehnt sich der IOD nach einem sonnigen Strandurlaub oder wenigstens einem dicken Pelzmantel. Zwar würde ich nicht darauf wetten, dass AMDs "Hotspot"-Temperatursensor unter Garantie den absolut heißesten Punkt ermittelt, aber im Gegensatz zu vielen anderen Bereichen aktueller CPUs ist ein Speichercontroller ein ziemlich großes und zwangsläufig gleichmäßig ausgelastetes Bauteil. Wenn da in der näheren Umgebung 4x °C gemessen werden, dann sind 9x °C oder gar stabilitätskritische 1xx °C ausgeschlossen.

Wenn die Symptome eine temperaturbedingte Ursache haben, wenn also nicht z.B. ein reiner Bug in der CPU-Ansteuerung vorliegt, dann sollte die Überhitzung irgendwo auf den CCDs stattfinden. Einschlägigen News zu Folge soll da gerade Shader-Compiling für konzentrierte Aktivität an ungewohnter Stelle sorgen. Da AMD gegenüber PCGH regelmäßig Antworten zu technischen Details verweigert, fehlen mir aber die nötigen Informationen, um potenzielle Lücken zwischen den Temperatursensoren ausmachen. Respektive ich weiß schlicht nicht, wie aus den gemessenen Werten angezeigte Angaben werden und ob es z.B. möglich ist, dass eine nicht angezeigte Überhitzung eine Notabschaltung veranlasst.

Falls es jemandem gelingt, ein System behutsam an die kritische Grenze heranzuführen, könnte derjenige mal klassische Stabilitätstests durchprobieren. (Mein erster Ansatz wäre LinX mit Problemstellungen, die in die verschiedenen Cache-Stufen passen.) Wenn das System immer sauber ausgeht, springt wohl eine wenig subtile Schutzfunktion an. Wenn man es wenigstens ab und zu hinbekommt, dass Fehler auftreten, aber Windows "an" bleibt, wird es eher eine echte Überhitzung sein. Technische naheliegende Kandidaten sind für mich die Step-Down-Wandler und Power-Gating-Mechanismen sowie der Ring-Bus. Aber auch einzelne Bestandteile innerhalb der Kerne (SIMD? Decoder?) könnte ich nur nach der Logik "so blöd, da nicht zu messen, kann AMD doch nicht sein" ausschließen.
 
Zurück