Kurioses BSOD-Problem

Dave2525

Kabelverknoter(in)
Guten Tag verehrte Foren-Mitglieder,

ich habe da ein ziemlich ärgerliches Problem, seit etwa 6 Wochen - und weiß nun nicht mehr weiter.
Ich erhalte völlig Random BSDOs mit folgenden Strings: DRIVER_IRQL_NOT_LESS_OR_EQUAL | APC-INDEX-MISSMATCH | UNEXPECTED_KERNEL_MODE_TRAP -
Im Jeden dieser Fälle ist es immer: ntoskrnl.exe
Ab und zu (Heute) war es dann: win32kbase.sys. der (DRIVER String ^^)

Dieser kam jedenfalls vom neusten Intel Gigabit Netzwerk-Treiber, weshalb ich den älteren von der Asus-Page genommen habe, damit ist das Thema beseitigt gewesen. Immer dann wenn Windows dann den neusten aufspielt, wie vorhin, folgt dann dieser BSOD gefolgt von weiteren 3-4 Stück hintereinander. Was ich jetzt habe.

Zunächst mal die System-Daten:

Win10 Pro Version 1909 (Build: 18363.720)
Windows wurde mehrfach komplett neu aufgesetzt.
Board: Asus C6H x370 mit Bios: 7704 letzte Aktuelle von Asus. mit 1.0.0.4b
16GB RAM DDR4 G.Skill F4-3200C14-8GTZ
Ryzen 3700X +PBO ist Aktiv Rest AUTO
980 TI mit 442.59 Treiber
Netzteil: BQ Straight Power E10 600W
Bis auf Speicher OC und Timings ist sonst nichts gravierendes gemacht.
Komponenten werden via Wasser gekühlt und die Temperaturen sind alle völlig in Ordnung. Während Prime ist die CPU bei maximal 68°c die GPU bei 42°c der Speicher bei 40°c

Zu Beginn war mir klar, diese BSODs liegen am Speicher, der OC ist halt nicht stabil genug. Habe also viele Wochen weiter Probiert und auch Belastungstest durchgeführt, als auch Memtest im Boot (riegel einzeln) als auch 7 Tage Prime am Stück, als auch HCI Memtest 3 Tage am Stück - in keinem tauchten BSODs oder Fehler auf, alles lief erwartend unproblematisch.

Sobald der Rechner aber im Idle ist, wo maximal nur gesurft wird, mit ca 20 TABs mit 4-7GB Speicherbelegung, schließt sich gern mal der Browser vollständig. Einfach so. Öffne ich ihn wieder, besteht zu 50% das danach ein BSOD folgt, oder in ganz seltenen Fällen, die Windows-Oberfläche absolut nicht mehr reagiert. Maus, Anwendungen im Hintergrund laufen (Music/Video etc) aber es passiert nichts, reagiert auf nichts.

Meine Vermutung war dann: Muss irgendwas mit den niederen pStates etwas nicht stimmen, Voltage zu hoch/niedrig... habe dann den pState vom Internen SoC auf p0 gefixt. Brachte keine Änderung, außer, dass die Kiste ein wenig Zackiger reagierte unter Windows (Fenster öffnen etc pp)
Nach 3 Tägiger dauerhafter Laufzeit, folgt BSOD (ntoskrnl.exe)
Ich habe selbstverständlich via Bios die Defaults geladen und den Speicher auf 2133 betrieben. Auch dort folgten dann BSODs...
Kann also nur noch ein Defekter Speicher sein. Ab da hab ich Memtext86 via Boot 30 Stunden (2x 15 Stunden den Speicher jeweils einzeln) testen lassen: Kein Fehler.
Den Internen von Windows 15 (max durchläufe+erweitert +Cache test) kein Fehler.

Ich habe jedes OC am Speicher (Timings) mindestens 4 Tage am Stück getestet, und alles mögliche angestellt. Zuletzt bei der Folding-Aktion hier, habe ich von Beginn an ohne Pause den Rechner durchrechnen lassen und nebenher noch gearbeitet, da gab es keine Probleme. Kaum ist der Rechner im Idle oder muss nicht sonderlich viel tun, folgen die BSODs.
Aktuell habe ich nun Prime seit 12 Stunden am laufen (FFT) also mit Speicher-test... bis jetzt kein BSOD und ausstieg/Fehler.

Ich habe sämtliche Treiber im Abgesicherten Modus gelöscht und die neusten installiert (bis auf den Intel)

Ich weiß nicht mehr weiter... hat jemand von euch noch irgendeinen Tipp, was ich probieren könnte?
Die DUMPs habe ich in den Debugger geknallt, dort erhalte ich aber keine Spezifischen Angaben, außer bei dem Intel Gigabit, das habe ich allerdings gelöst.
Aber bisher war es nun immer so, nachdem die ganzen BSODs aufgetreten sind, dauert es 3-7 Tage bis ich wieder welche erhalte. Bis auf das, läuft die Kiste völlig unproblematisch.
Solange ich etwas zocke, oder im Hintergrund laufen habe, was etwas mehr Rechenleistung benötigt, gibt es keine BSODs, Fehler o.Ä.
 
Zuletzt bearbeitet:
TE
TE
D

Dave2525

Kabelverknoter(in)
Japp Slot#2 und #4 die hinteren (natürlich nicht A2 und B2) den Reflexionen wegen natürlich kein A1 und B1
2133 hatte ich ja laufen gehabt und auch einzeln getestet, keine Fehler festzustellen. Jeweils mit Memtest86 via Boot auch den eigenen von Windows mit den Max 15 Durchläufen und auch mit HCI-Memtest - beides über mehrere Tage laufen gelassen.
Aktuell läuft nun seit 13 Stunden, der Prime FFT Test mit max Speicher Usage - kein Ausstieg. Temperaturen des Speichers nun bei 41°c ...
PBO ist derzeit nur auf AUTO = Deaktiviert, seit dem neuen Bios muss man es explizit Enablen, wenn man es will.
Chipsatztreiber ist der Aktuelle angebotene ja.
RMT ist nicht installiert.

Wie lange als 4x 15 Stunden (einzeln) als auch 7 Tage am Stück unter Dauerlast (full Memory Usage) wäre noch Zielführender?
Auch den Rechner einfach mal gar nicht aus machen, sondern mehrere Tage idle brachten keinen Absturz zur Folge.
Defektes Browser-Profil der da vielleicht mit zutun haben könnte, habe ich ja auch überprüft, indem ich ein neues Profil verwendete als auch Browser.

Was ich bisher Technisch ausschließen kann, ist das Netzteil, Grafikkarte, CPU.
Speicher selbst mit den Tools kann ich das nicht 100% feststellen, da reicht womöglich in meinem Fall schon die Errorcorretion, sodass es bei den Tests Fehlerfrei läuft, in der Wilden Umgebung aber dann nicht mehr... ich verstehe dann aber nicht, wieso das mindestens 3 Tage und mehr benötigt bis erst wieder ein BSOD erfolgt...
SMU/Bios defekt als auch Board selbst kann ich auch nicht feststellen.
 
Zuletzt bearbeitet:
TE
TE
D

Dave2525

Kabelverknoter(in)
BQ Straight Power E10 600W
Ganz vergessen oben zu erwähnen, habs gleich mal editiert. Danke ^^
 
Zuletzt bearbeitet:
TE
TE
D

Dave2525

Kabelverknoter(in)
Weil ich es getauscht habe.
Genauer gesagt, lief das NT in einem Rechner mit gleicher Ausstattung, allerdings anstelle der 980 TI mit einer 2080 TI - dort lief es ne Woche ohne Probleme.
Mit dem getauschten blieben die Probleme allerdings bei meinem.
Ich wollte diese Woche nun noch den Speicher tauschen, aber kann ich leider nicht mehr, Quarantäne beim Kumpel....
 
Zuletzt bearbeitet:
TE
TE
D

Dave2525

Kabelverknoter(in)
Hat sich nun herausgestellt, dass der Memory Controller in der CPU defekt ist.
In den niederen Stages hat er Fehler produziert, error correction hat dazu geführt, dass es eine Zeit lang läuft.
Bekomme nun eine neue von AMD.
 
Oben Unten