[Erledigt] RTX 2060 (S) hängt sich direkt nach Boot unter Last auf

throws

Schraubenverwechsler(in)
Guten Tag,
nach längerem hin und her habe ich mich dazu gerungen doch, um Hilfe zu bitten.

Seit vielen Monaten plagt mich meine NVIDIA RTX 2060 SUPER mit Einfrieren unter starker Last.
Dies tritt jedoch nur bis einige Minuten nach dem Boot auf. Wenn ich also den Rechner kalt starte und ohne große Wartezeit eine grafische Last starte friert das Bild ein und die Lüfter der Grafikkarte gehen auf 100 %. Es verbleibt dann nur noch der Hard-Reset.
Um das Einfrieren zu vermeiden war es grundsätzlich immer hilfreich den PC einfach im Idle zu lassen. Nach eine Wartezeit von 10 bis 20 Minuten im Idle kann ich dann problemlos jede Art von grafischer Last starten (primär hier Counter-Strike 2, aber auch Unity oder andere Spiele sorgen für entsprechendes Einfrieren).

Die CPU bzw. CPU-intensive Aufgaben sind hiervon nicht betroffen - es handelt sich zumindest von der Last her rein um ein Problem der Grafikkarte. Jedoch scheint das allgemeine Aufwärmen des PCs (z.B. auch durch CPU-Benchmarks) mehr Stabilität zu bringen.

Die Grafikkarte habe ich bereits aus- und eingesteckt, leicht gesäubert und garantiert, dass die Stromversorgung stimmt. Ebenso habe ich garantiert, das die CPU vollständigen Kontakt mit dem Sockel hat.

CPU-Z konnte leider keine interessanten Informationen ausspucken. Im Falle des Crashes gibt es keine besonderen Schwankungen, Ausfälle oder ähnliches auf den Sensorwerten zu erkennen. Gerne kann ich hier noch die Log-Datei nachliefern.

Treiber befinden sich auf dem Stand ca. zwei Monaten, die ich schlechte Erfahrung bezüglich der Leistung der brandneuen Treiber gemacht. In der Vergangenheit hatte ich aber auch als Lösungsansatz die neusten Treiber installiert - ohne Erfolg.

Windows 11 befindet sich ebenfalls auf dem neusten Stand.

Das BIOS müsste ca. 4 Monate alt sein. Ein entsprechendes Update auf ein neues BIOS hatte ich bereits als Problemlösung versucht - ohne Erfolg.

Folgende Hardware ist verbaut:
Grafikkarte: NVIDIA RTX 2060 SUPER (OEM Hersteller PNY)
CPU: AMD Ryzen 5 5600X
Mainboard: MSI MAG B550 Tomahawk
Netzteil: be quiet! Pure Power 12M 750W
RAM: Corsair Vengeance RGB Pro 2x 8 GB 3600MHz CL16


Ich halte es für sehr unwahrscheinlich, dass es für meine Situation eine direkte Lösung gibt, daher suche ich aktuell primär nach Ansätzen, um den Hintergrund des Problems zu erkunden. Die eingesetzten Analyse-Werkzeuge haben mir bisher jedoch nicht viel gebracht.

Ich bin sehr gespannt, was ihr von der Situation haltet und freue mich auf mögliche Hilfestellungen.

Viele Grüße

throws aka Finn

---
Edit: Habe unter Last (Furmark) einen Screenshot von HWInfo angehängt.

Bildschirmfoto 2025-04-21 um 22.50.37.png
 
Zuletzt bearbeitet:
Hallo, was steht in der Windows Ereignisanzeige unter Windows-Protokoll > System, zum Zeitpunkt des Einfrierens?
Wenn dein PC läuft und du zocken kannst, könntest du nach dem du so eine halbe Stunde gespielt hast, ein Screenshot von HWiNFO (Im Hintergrund laufen lassen) machen? Bitte mit den Standard Sensoren und allen Werten, du kannst dazu das Spiel beenden. Bitte so:
HWiNFO.jpg
 
Moin, danke für die schnelle Antwort.

Ich werde gleich noch ein Spiel starten und laufen lassen, sodass HWInfo ein bisschen mehr Futter bekommt, als nur zwei oder drei Minuten.

In der Zwischenzeit der Auszug aus dem Windows-Protokoll. Blau markiert ist hier die letzte Nachricht vor dem Crash:

1745269669619.png

Später kommen noch ein Fehler und ein kritischer Fehler, beziehen sich aber auf den Hard-Reset. Blau hinterlegt ist übrigens das Starten von CPU-Z. Danach habe ich dann die eigentliche Last gestartet und der Crash passierte.
 
Zuletzt bearbeitet:
Hast du seit dem du das Verhalten hast das OS mal neu installiert?

Ach noch was, bei der GPU stehen bei dir im Bild 8GBs an, bei PCI3 wäre das eine x8 Verbindung.
Auf welchen Slot befindet sich deine GPU?
 
Zuletzt bearbeitet:
Negativ. Das habe ich bisher noch nicht versucht. Da es sich nicht um mein primäres Gerät handelt, sollte eine Neuinstallation auch nicht allzu aufwendig sein - gerne würde ich das trotzdem als letzte Möglichkeit verwenden.
 
Evtl. hast du eine SSD rumliegen die dafür zum testen verwenden kannst, einmal frisches OS und kannst die alte ja erstmal links liegen lassen.
Du musst ja nicht gleich das Windows aktivieren.
 
Leider hat uns die Ereignisanzeige o. HWiNFO keine Daten geliefert die uns zur Fehlerquelle führt.
Im HWiNFO sehen alle Werte soweit gut aus.
Da dein Problem schon so lange auftritt, denke ich nicht das es an ein Treiber und/oder Windows liegt.
Ich kann mir mit deiner Fehlerbeschreiben eine kalte Lötstelle als Quelle gut vorstellen. Die durch die Wärme eine bessere Leitfähigkeit bekommt und so das System Stabil bleibt.
Leider Hilft hier nur die Hardware durch alternativen wechseln und Ausprobieren und so die Fehlerquelle zu finden.

Um sicher zu gehen, wäre noch möglich alle Treiber und Co zu Aktualisieren oder wie KarrdeT gleich Windows mit einer minimalen Installation einrichten (NUR OS, Treiber und ein Spiel zum testen).
 
Zuletzt bearbeitet:
Alles klar. Das ist natürlich sehr schade. Ich hänge unten nochmal einen Screenshot HWiNFO mit ca. einer halben Stunde Volllast.

Ein RAM-Upgrade ist unterwegs, auch wenn mit der Situation nichts zutun hat, mir aber gerade nochmal aufgefallen ist. Was mich ein wenig wundert ist, dass die Grafikkarte doch relativ warm wird und offensichtlich head-throttling betreibt.

Ansonsten ist die gute Nachricht, dass ich das Problem zumindest auf lange Sicht mit Geld gelöst bekomme :-D
Eine Grafikkarte als Upgrade bzw. Austausch (RTX 4080) ist bereits unterwegs und sollte Freitag ankommen.

Ich würde daher erstmal keine Änderung an der Software durchführen und die Grafikkarte erstmal eins zu eins ersetzen. Dann sollte sich ja zeigen, ob es an der Grafikkarte bzw. Software+Grafikkarte gelegen hat oder ob was am restlichen System kaputt ist.

In Bezug auf die kalte Lötstelle: Gibt es da irgendwas, was man als Amateur machen kann (hatte von im Ofen backen gehört, aber keine Ahnung, ob das so sinnvoll ist). Der geschätzte Wiederverkaufswert der Grafikkarte ist sowieso im Keller und eine Verwendung für eine instabile Grafikkarte hab ich jetzt nicht unbedingt, daher wäre ich irgendwelcher Experimente nicht abgeneigt.

Ansonsten berichte ich mal am kommenden Wochenende, was die neue Grafikkarte sagt.

Schonmal vielen Dank für die Unterstützung. :daumen:

---
Bildschirmfoto 2025-04-21 um 23.34.40.png
 
Auch bei den zweiten Screenshot ist alles wie es sein sollte. Die 90°C von der CPU ist so von AMD vorgesehen und kein Problem. Du könntest die Wärmeleitmittel des CPU-Kühler erneuern. Das könnte paar Grad rausholen, aber an der Instabilität nichts ändern. Die Grafikkarte ist im Hot-Spot mit 93°C auch noch OK, ab >100°C haben wir ein Problem.

Warte auf den RAM und der neuen Grafikkarte und dann kann man weiter sehen.
Du müsstest die Grafikkarte im Ofen über längeren Zeit sehr Heiß machen, das macht mehr kaputt als hilft (Lötzinn Schmelzpunkt ~190°C).
 
Eine GPU "backen" würde ich nicht wirklich empfehlen. Das Problem dabei sind idR die Caps und FETs in der VRM der GPU. Die Caps sind üblicher Weise 105°C rated. Kriegen die ne Zeit lang zu viel Wärme ab können die entweder direkt im Ofen ***. Oder mit viel Pech im laufen Betrieb im Rechner. Der daraus resultierende shorted to ground bei der GPU VRM kann dann ggf. noch mehr als nur die GPU ins Jenseits befördern.
 
Ich melde mich zurück. Dank flinker Zustellung konnte ich bereits heute die Hardware verbauen.

Zuerst die gute Nachricht: Die neue Grafikkarte (RTX 4080) läuft wunderbar - auch im Kaltstart. Es scheint also vollständig an der alten Grafikkarte gelegen haben. Ich musste für das Upgrade keine softwareseitige Veränderung vornehmen.

Die schlechte Nachricht: Ich habe aus Versehen RAM mit den falschen Timings bestellt und daher geht der wieder zurück. Na ja, kann ja nicht alles im ersten Anlauf funktionieren.

Ansonsten läuft alles so weit super und ich werde mal gucken, was ich mit der alten Grafikkarte anfange. Verkaufen hallte ich für eine schlechte Idee, aber ich finde mit Sicherheit Verwendung.

Ich danke euch für die wertvolle Hilfe und guten Tipps! :-D
 
Zurück