Suche Fehlerquelle meiner Crashs

MaxMonument

Schraubenverwechsler(in)
Hallo zusammen,

seit einiger Zeit habe ich immer wieder Abstürze meines Systems, welche anschließend in einen Neustart münden. Die Abstürze kommen eigentlich immer beim Zocken, wobei hier kein klares Muster erkennbar ist. So sind so manche grafisch anspruchsvolle Titel gar nicht betroffen und auch die Dauer bis zum Crash ist höchst unterschiedlich (mal 2 Wochen gar keinen Crash, manchmal 3 an einem Abend). Ich habe den Rechner im August letzten Jahres zusammengebaut und die Probleme haben etwa im Dez. angefangen. Manchmal hatte ich auch ein paar grafische Artefakte, welche jedoch seit dem umstellen des GPU Bios (Kippschalter an der GPU) auf Silent nicht mehr vorgekommen sind. Die Abstürze hat das leider nicht behoben.

Andere Sachen die ich getestet habe:

- MemTest hat keine Probleme aufgezeigt
- Durchlaufen verschiedener BenchMarks (FurMark; 3D Mark; Valley Benchmark) haben keinen Absturz hervorgerufen
- Temperaturen habe ich mit HWInfo überwacht (CPU maximal 65 -70°C; GPU zwischen 70-90°C; System maximal 45°C)

Mein Setup sieht wie folgt aus:

- Mainboard: MSI B450 Tomahawk Max, ATX, So.AM4, (7C02-020R)
- CPU: AMD Ryzen 5 3600 6x 3.60GHz So.AM4
- GPU: 8GB PowerColor Radeon RX 5700 XT Red Devil, GDDR6 (derzeit im SILENT-Bios betrieben, Probleme gab es aber auch im "Werks" OC-Bios
- RAM: 32GB (2x 16384MB) G.Skill RipJaws DDR4-3200 DIMM CL16-18-18-38 Dual Kit
- PSU: 650 Watt be quiet! Straight Power 11 Modular 80+ Gold
- Festplatten: 1x 1000GB Crucial P1 NVMe M.2 ; 1x 1 TB Crucial SSD ; 1x 250 GB Samsung EVO
- Lüfter: Arctic Freezer Esports Duo 34 (CPU); 2x 140mm Intake; 3x 120mm Exhaust
- Bildschirme: Samsung LC27JG 1440p 144Hz (DP); BenQ GL2460 1080p 60Hz (DVI)

Treiber-Status:
- GPU: aktuell Radeon 21.4.1
- Chipset: aktuell
- Windows 10 64bit: aktuell
- BIOS: 3.A1 (12/03/2020)

Jetzt ist mir noch aufgefallen das im Eventlogger folgende Fehlermeldung notiert ist nach dem gestrigen Absturz:

Ereignis 18; WHEA Logger
Schwerwiegender Hardwarefehler.

Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Machine Check Exception
Fehlertyp: Cache Hierarchy Error
Prozessor-APIC-ID: 0


Habe jetzt nicht nachvollziehen können, ob das nach jedem Absturz der Fall war aber habe ein paar solcher Einträge gefunden. Dabei hat die APIC-ID folgende Zahlen gehabt: 0,1,3,4,5,9,10,12,13
Kenn mich mit Log-Dateien absolut nicht aus und googlen hat mich da nicht wirklich schlauer gemacht.

Daher meine Frage: Wie sollte ich jetzt weiter vorgehen, um die Fehlerquelle zu finden?

Besten Dank für die Antworten.
 
... mmm ... bin auch kein Experte, und im Rahmen der Ferndiagnose würde ich den Weg über die Dörfer vorschlagen: Fehlerausschlußverfahren ...
- Wechsel zuerst einfach mal die Aus-/Eingänge von GPU und Monitor, von DVI auf HDMI etc. oder umgekehrt, wenn das nichts hilft, kannst Du den Monitor schon mal abhaken ... und das hilft manchmal ohne viel Aufwand ... (ich hatte letztes Jahr ebenfalls kaum reproduzierbare Abstürze ... Bios neu, Netzteil neu, neue Backup-GPU, neue CPU ... es war dann doch nur der neue Monitor!!)
 
Jetzt ist mir noch aufgefallen das im Eventlogger folgende Fehlermeldung notiert ist nach dem gestrigen Absturz:

Ereignis 18; WHEA Logger
Schwerwiegender Hardwarefehler.

Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Machine Check Exception
Fehlertyp: Cache Hierarchy Error
Prozessor-APIC-ID: 0
Ist nichts neues und ein BIOS Update sollte da Abhilfe schaffen

Siehe z. B. Auch hier

Beitrag im Thema 'WHEA-Crashes bei Ryzen 3900XT' https://extreme.pcgameshardware.de/threads/whea-crashes-bei-ryzen-3900xt.599860/post-10660967

Oder einfach mal in der Forumsuche WHEA eingeben
 
Danke schon einmal für die Rückmeldungen. Mein BIOS habe ich jetzt geupdatet und danke auch für die Revision Nummer des Chipset Treibers. MSI hatte auf ihrer Seite nämlich nicht die aktuellsten und das wäre mir sonst gar nicht aufgefallen. Ich beobachte mal, ob das das Problem beheben kann und melde mich wieder.
 
WHEA-Logger Problematik ist doch öfters bei AMD CPUs hier in Foren auftaucht. Wenn das Problem mit den ganzen updates nicht behoben wird, dann würde ich auf defekten CPU tippen.
 
WHEA-Logger Problematik ist doch öfters bei AMD CPUs hier in Foren auftaucht. Wenn das Problem mit den ganzen updates nicht behoben wird, dann würde ich auf defekten CPU tippen.
Das stimmt schon nur da war dann auch häufig die Rede von einer defekten GPU was mir Sorgen gemacht hat. Die CPU auszuwechseln wäre ja ein kleines Übel aber bei der aktuellen Preislage ist eine neue GPU nicht drin. Ich bin nicht allzu bewandert im Troubleshooting daher hatte ich einen neuen Thread aufgemacht.

Aber bisher scheint das BIOS Update zu helfen. Schauen wir mal wie sich das die nächsten Tage verhält.
 
Zurück