PC stürzt ständig ab / Blackscreen. Ideen für weitere Vorgehensweise gesucht

Schweinchen_Dick

Schraubenverwechsler(in)
Hallo,

ich habe hier einen relativ neuen PC (04/20) welcher selbst zusammengebaut wurde.
Der PC stürtz zu ca. 95% beim Windowslogin-Bildschirm ab. Ganz selten startet Windows komplett bis zum Desktop durch und stürzt dann irgendwann ab.
Der PC bootet jedes Mal von selbst neu / Strom ist nie ganz weg -> Kein Relais-klicken vom Netzteil, Lüfter laufen ohne Unterbrechung weiter.
Das Problem trat vor wenigen Tagen das erste Mal auf und ist jetzt bei jedem Start vorhanden.

Gestern konnte ich kurz im Windows den Eventmanager starten und habe folgenden Eintrag gefunden:

Protokollname: System
Quelle: Microsoft-Windows-Kernel-Power
Datum: 03.01.2022 22:15:39
Ereignis-ID: 41
Aufgabenkategorie:(63)
Ebene: Kritisch
Schlüsselwörter:(70368744177664),(2)
Benutzer: SYSTEM
Computer: DESKTOP-0M5O4OU
Beschreibung:
Das System wurde neu gestartet, ohne dass es zuvor ordnungsgemäß heruntergefahren wurde. Dieser Fehler kann auftreten, wenn das System nicht mehr reagiert hat oder abgestürzt ist oder die Stromzufuhr unerwartet unterbrochen wurde.
Ereignis-XML:
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
<System>
<Provider Name="Microsoft-Windows-Kernel-Power" Guid="{331c3b3a-2005-44c2-ac5e-77220c37d6b4}" />
<EventID>41</EventID>
<Version>8</Version>
<Level>1</Level>
<Task>63</Task>
<Opcode>0</Opcode>
<Keywords>0x8000400000000002</Keywords>
<TimeCreated SystemTime="2022-01-03T21:15:39.9438796Z" />
<EventRecordID>70994</EventRecordID>
<Correlation />
<Execution ProcessID="4" ThreadID="8" />
<Channel>System</Channel>
<Computer>DESKTOP-0M5O4OU</Computer>
<Security UserID="S-1-5-18" />
</System>
<EventData>
<Data Name="BugcheckCode">0</Data>
<Data Name="BugcheckParameter1">0x0</Data>
<Data Name="BugcheckParameter2">0x0</Data>
<Data Name="BugcheckParameter3">0x0</Data>
<Data Name="BugcheckParameter4">0x0</Data>
<Data Name="SleepInProgress">0</Data>
<Data Name="PowerButtonTimestamp">0</Data>
<Data Name="BootAppStatus">0</Data>
<Data Name="Checkpoint">0</Data>
<Data Name="ConnectedStandbyInProgress">false</Data>
<Data Name="SystemSleepTransitionsToOn">0</Data>
<Data Name="CsEntryScenarioInstanceId">0</Data>
<Data Name="BugcheckInfoFromEFI">false</Data>
<Data Name="CheckpointStatus">0</Data>
<Data Name="CsEntryScenarioInstanceIdV2">0</Data>
<Data Name="LongPowerButtonPressDetected">false</Data>
</EventData>
</Event>

Anschließend konnte ich sogar ca. 3 Minuten ein Spiel starten und dann wieder Blackscreen und reboot.


Im BIOS läuft der PC stabil.
Memtest86 läuft stabil
Ultimate Boot CD läuft stabil
Linux Mint 20, Tails und Hirens stürzen ebenfalls sofort nach dem Start ab.

PC Konfig:

CPU: Ryzen 2600 mit boxed Kühler
Motherboard: MSI B450A Pro Max
RAM: 16 GB DDR4 Aegis 3000 dual
Grafik: XFX Radeon 590
Netzteil: BeQuiet 11 400W
SSD: M2 512GB
HDD: 2TB

Was ich schon gemacht habe:

Betriebssystem: Linux Mint, Tails und Hirens vom USB-Stick -> stürzt nach start auch ab
Netzteil: Getauscht durch ein neues 650W und ein weiteres BeQuiet 400w -> Fehler vorhanden
RAM: Memtest86 3,5 Stunden ohne Fehler / Speicher Quergetauscht und auch einzeln versucht / XMP deaktiviert -> alles ohne Ergebnis, Fehler vorhanden
PC gereinigt -> Fehler weiterhin vorhanden (Laut BIOS wird auch nichts heiß)
HDD abgesteckt -> Fehler weiterhin vorhanden
Mothterboard getauscht -> Fehler vorhanden
Grafikkarte getauscht -> Fehler vorhanden
Kompletten PC auf Tisch in Minimalkonfiguration aufgebaut -> Fehler vorhanden
CPU: Ultimate Boot CD BurnIn-Test und Stresstest -> keine Fehler

Eigentlich bleibt aber meiner Meinung nach nur noch die CPU übrig.
Kann es sein, dass die CPU einen Fehler hat, welcher nur in Betriebssystemem zum Ausfall führt, nicht aber im Memtest und in CPU BurnIn & Stresstests?

Und warum lief er gestern kurzzeitig stabil im Windows und sogar in einem Spiel?

Kann mir das alles nicht erklären und bin wirklich am Ende meines Lateins. :(

Fällt euch noch etwas ein?
 
Kann es sein, dass die CPU einen Fehler hat, welcher nur in Betriebssystemem zum Ausfall führt, nicht aber im Memtest und in CPU BurnIn & Stresstests?
Stresstests sind synthetisch, die Last, Lastspitzen und die Dynamik ist in der "Realität" anders als es Programme erzeugen können. Vor allem wenn man übertaktet, merkt man irgendwann das es trotzdem zu Probleme kommen kann obwohl Benchmarks und Stresstest sagen das alles stabil läuft, dennoch kann zu wenig Volt anliegen um es wirklich stabil zu bekommen. Gib im BIOS mal etwas mehr Volt auf die CPU, schaden wirds nicht.
Aktuellste BIOS Version installiert? Dies kann Fehler beseitigen.
Was sagt CrystalDiskInfo über die SSD? Füge ein Bild hier ein.
So hoch getaktete RAM bei der CPU zu verwenden wird wohl nicht klappen, die Ryzen2000 CPUs sind da extrem empfindlich, auch wenn du irgendwo anders von einigen wenigen gelesen hast das sie etwas mehr anliegen haben, du solltest nicht über 2933MHz gehen.
 
Könnte es eher sein, daß hier der Monitor das Problem darstellt? ... immer wieder gerne auch gepaart mit irgendwie nicht wirklich hilfreichen WIN-Fehlermeldungen ... manche Mainboards mögen es garnicht, wenn da ein Wackelkontakt ist!
 
Danke für die schnellen Antworten.

Dann mal los:

Aktuellste BIOS Version installiert? Dies kann Fehler beseitigen.
Ist drauf, ja

Was sagt CrystalDiskInfo über die SSD? Füge ein Bild hier ein.
2022-01-04 16_19_16-Unbenannt.png


Fehler ist aber auch ohne SSD und nur Linux-Live-System vorhanden

So hoch getaktete RAM bei der CPU zu verwenden wird wohl nicht klappen
Hat jetzt 1,5 Jahre funktioniert und zeigt im Memtest auch keine Fehler.
Der Fehler ist aber auch ohne XMP da und da taktet der Ram nur auf 2133


önnte es eher sein, daß hier der Monitor das Problem darstellt?

Leider auch nicht... Auch an einem anderen Monitor ist das Problem da.
 
Der PC stürtz zu ca. 95% beim Windowslogin-Bildschirm ab. Ganz selten startet Windows komplett bis zum Desktop durch und stürzt dann irgendwann ab.
PS: So etwas in der Art hatte ich in den vergangenen 3 Jahren 3 mal. Jedesmal war letztlich der Monitor Schuld ...
a) Mein geliebter FHD von LG gab auf, weil beim Wechsel der GPU die Anschlußleiste im Monitor einen abbekam ...
b) Der neue Monitor von LC zeigte vergleichbare Erscheinungen mit meinem PC, nur über HDMI -> Garantie, umgetauscht.
c) Mein 20 Jahre alter WIN98 Rechner fing auch mit sowas an, nur Monitoreingang gewechselt, klappt wieder nebenan am Bildschirm ...
Aus diesen Aktionen habe ich noch eine Backup-GPU im Schrank (Wertsteigerung!!!), ein überflüssiges Netzteil, eine CPU diverse Kabel ...
Leider auch nicht... Auch an einem anderen Monitor ist das Problem da
... puh, schade ... dann muß ich nochmal in mich gehen ...
 
Gib im BIOS mal etwas mehr Volt auf die CPU, schaden wirds nicht.

Das gibts nicht... :wow:

Er läuft jetzt seit 10 Minuten in einem Game und stürzt bis jetzt nicht ab.
Ich habe nur Quick´n´dirty im BIOS das OC von MSI aktiviert (erhöht auch die Spannung)

Also liegt die Problematik definitiv mit der CPU zusammen.

Soll ich jetzt die CPU tauschen, weil normal ist das Verhalten ja eher nicht, oder?
Hat ja 1,5 Jahre mit der normalen Einstellung funktioniert und noch ist Gewährleistung drauf.

Was tun?
 
Schön das der Fehler gefunden wurde, wenn es wirklich daran liegt, du solltest dies mindestens noch einige Tage testen bevor man über eine andere CPU nachdenkt.
Soll ich jetzt die CPU tauschen, weil normal ist das Verhalten ja eher nicht, oder?
Hat ja 1,5 Jahre mit der normalen Einstellung funktioniert und noch ist Gewährleistung drauf.
Tja, bei den CPUs gibt es qualitativ ein ziemlich großes Spektrum, manche benötigen von Haus aus viel Volt für denselben Takt und andere sehr wenig, auch bei den selben Volt kann der Verbrauch und die Temperaturen der CPU relativ stark schwanken, manche lassen sich leicht übertakten und andere schwer bis kaum.
Es kann natürlich sein das deine CPU von Anfang an relativ nahe an der Kante war, wo die Spezifikationen noch sauber funktionierten, da Hardware auch einem verschleiß unterliegen, Stichwort Elektromigration, kann es durchaus sein das die CPU mittlerweile den Punkt überschritten hat die eine normale Funktion gewährleisten.
Das ist reine Glückssache, manche CPUs halten Jahrzehnte ohne Probleme durch, auch mit OC, andere wiederum sind nahe an der Kante genäht, AMD hat wohl geglaubt das die CPU die Garantiezeit erreichen kann - denn nur auf das kommt es AMD und all die anderen Hersteller an, denn so kann man mehr Profit herausschlagen.
Du kannst natürlich wechseln, ist deine Entscheidung...
 
Zurück