BSOD vermutlich durch VRAM von RX 6700 XT

Discocoonnect

BIOS-Overclocker(in)
Danke schonmal in Vorhinein für eure Hilfe.

Nach dem ich meinen PC lange nicht laufen hatte und in meine neue Wohnung transportiere habe ich unter Last oft abstürzte. Dabei vermute ich stark den VRAM der GPU.


Hardware:
RX 6700 XT Red Devil
AMD Ryzen 5 5600
G.Skill Aeigs 4x8GB 3000MHz Cl16
MSI B550 Pro-A
be quiet! Pure Power 10 500W CM
Crucial MX100 120GB + Kingston A400 240GB + Patriot P200 512GB + Crucial P5 1TB
Gigabyte G27Q1440p (DP) + Samsung BB2230 (HDMI)


Problembeschreibung:
Hauptsächlich unter Last beim Spielen stürzt der PC mit einem verzerrten BSOD ab. Unter ganz geringer Last finden die Abstürzte nicht statt. (Das Bild dazu ist aus einem Reddit-Beitrag, sieht aber bei mir genauso aus.) Dann startet der PC neu. Am schnellsten und konsistentesten stürzt der PC bei Apex Legends oder bei VRAM-Tests ab. Dabei ist es egal, was an Programmen noch direkt offen ist.
  • BG3: meistens nach 0.5-1.5h
  • Helldivers: komplett zufällig
  • World of Warships: alle paar Stunden, aber meist gar nicht
  • Apex Legends: Meistens schon beim Spielstart im Homescreen oder davor.
Was ich bisher versucht habe:
  • RAM-Riegel in versch. slots und auf stock
  • GPU auf 2000MHz, -6% max Leistung und Undervolting auf 1.1V in der AMD Treiber SW in versch. Kombinationen
  • Hardwarebeschleunigung überall deaktivieren
  • Windows Ereignisanzeige: nur unerwarteter Neustart
  • Treiber 25.3.1 zu 24.20.11.01 und 24.5.1
  • Furmark GPU + CPU für ca. 10min (kein Problem)
  • Grafikkarte neu einsetzen
  • GPU Bios von OC auf Silent bzw. umgekehrt
  • MSI Kombustor:
    • schneller crash teilweise bei 6.5GB VRAM-Test
    • zuverlässiger crash bei 2x 6.5GB oder 2x 5.2GB o.ä
  • Nur ein Monitor per DP
  • DDU im abgesicherten Modus ohne Internet und dann Treiber neu installieren
  • OCCT
    • Lief für wenige Minuten bei 10GB VRAM Auslastung, der PC ist aber beim manuellen Beenden des Tests dann abgestürzt.
  • Chipsatz-Treiber aktualisieren
Nächste Schritte wären einmal meine RX 5700 und ein anderes Netzteil zu testen. Das ist mir aber erst nächste Woche möglich.
So langsam verzweifele ich und ungern würde ich den PC platt machen. Ich vermute weiterhin stark, dass die Grafikkarte den Geist aufgibt.

Sagt mir gerne, was ihr braucht für weitere Fehlerdiagnostik.
 

Anhänge

Zuletzt bearbeitet:
Hey (🤥), lese mal mit BlueScreenView* den BSOD aus und was steht in der Ereignisanzeige** unter Windows-Protokoll > System direkt VOR den Zeitpunkt des "Unerwarteten Neustart"? Und wenn es geht ein Screenshot von HWiNFO*** nach last, von den Standard Sensoren mit allen Werten****.
*
**
Ereignisanzeige.jpg
***
****
HWiNFO.jpg

Es schaut stark nach ein Temperatur-Problem oder teil defekten VRAM der Grafikkarte aus.
 
Zuletzt bearbeitet:
Und wenn es geht ein Screenshot von HWiNFO*** nach last, von den Standard Sensoren mit allen Werten****.

Es schaut stark nach ein Temperatur-Problem oder teil defekten VRAM der Grafikkarte aus.
Mag sein!

Aber nach so langer Zeit, Temp Problem?
Das dürfte nach 5min Furmark GPU stress test 1440p 8x MSAA + CPU reichen, um Temperaturprobleme auszuschließen. Ich kann ja einen Crash auch mit dem MSI Kombuster direkt nach dem Hochfahren erzeugen.
Um die Auslese vom BSOD versuche ich mich heute auch noch zu kümmern.
Screenshot 2025-05-07 180003.png
 
Du könntest die Datenträger (S.M.A.R.T & Driver) ausblenden und dafür bitte besser die System: MSI MS... , CPU [0#] & [1#] , Speicher-Timings einblenden!

Aber ein Temperatur Problem scheint es nicht zu sein. Das haben wir jetzt abgehakt.

Um den Hauptspeicher als Übeltäter auszuschließen, lass über paar Stunden ein Stresstest mit MemTest86 laufen.
 
Hey (🤥), lese mal mit BlueScreenView* den BSOD aus und was steht in der Ereignisanzeige** unter Windows-Protokoll > System direkt VOR den Zeitpunkt des "Unerwarteten Neustart"?
**
Anhang anzeigen 1493948
***
Das steht beim Crash:
1746634465724.png

Und das ist das letzte Ereignis direkt davor. Das scheint mir aber nicht hilfreich zu sein:
1746634556055.png


Vlt. eine doofe Frage, was soll ich mit dem BlueScreenView auslesen? Die letzte angezeigte Dump-File ist aus Mitte 2024.

Du könntest die Datenträger (S.M.A.R.T & Driver) ausblenden und dafür bitte besser die System: MSI MS... , CPU [0#] & [1#] , Speicher-Timings einblenden!

Aber ein Temperatur Problem scheint es nicht zu sein. Das haben wir jetzt abgehakt.

Um den Hauptspeicher als Übeltäter auszuschließen, lass über paar Stunden ein Stresstest mit MemTest86 laufen.
Ich gehe mal stark davon, dass du nicht meine System-SSD meinst, sondern den RAM, das es sich ja um Memtest86 handelt.
Wundern würde mich defekter RAM, da ich die Fehler mit jeweils vier Sticks in unterschiedlichster Kombination und Position erzeugen konnte.
 
Wenn du es hinbekommst das er wieder in ein BSOD endet, wäre die Minidump von dieser Hilfreiche.
Wenn er keine angelegt hat, ist hier eine Anleitung wie es klappen könnte:

Bei den Memtest geht es mit darum, ziemlich sicher den Haupt-RAM auszuschließen.

In HWiNFO meine ich diese Sensoren einblenden:
Einblenden.jpg
 
Ich nehme an das die Grafikkarte nur mit einem Stromkabel mit Y-Adapter betrieben wird.
Da sich die Karte ohne OC schon fast 300 Watt genehmigen darf ist es angebracht diese mit 2 separaten Stromkabeln am unterdimensionierten Netzteil zu testen.
 
Ich nehme an das die Grafikkarte nur mit einem Stromkabel mit Y-Adapter betrieben wird.
Genau, zwei getrennte Pcie Stecker sollte man schon verwenden, vor allem wenn Pcie 1 und 2 am Netzteil vorhanden sind.
Die Karte braucht 230 Watt, die Cpu hat 65 Watt. Mit seinen SSDs und den Lüftern wird er so um die 400 Watt Verbrauch liegen. Das 500 Watt Netzteil reicht locker.
 
Erst Montag kann ich mich vor Ort wieder kümmern. Danke schonmal für eure Hilfe.

Die Grafikkarte wird mit 2x einzelnen 8-pin betrieben, kein Y-Adapter. Das Netzteil reicht hierfür eigentlich völlig aus. Und 400W, wie genannt, wäre ja alles unter Volllast und die 6700 XT war lange undervoltet (vergessen zu erwähnen), dass sie nominal bei unter 200W lag.

Jup, vor dem Umzug hat sie soweit weitgehend funktioniert. Dieser Fehler ist so nur sehr selten aufgetreten (Wochen/Monate) und der PC wurde meist mehrere Stunden am Tag aktiv genutzt.

Eine wage Idee, könnte es mit recht vollen SSDs zusammenhängen?

Nunja, am Montag habe ich eine Ersatz-GPU mit ähnlicher Leistungaufnahme (RX 5700) da und werde diese mal testen. Funktioniert sie problemlos, kann ich von einer defekten RX 6700 XT ausgehen. Oder spricht etwas dagegen?
 
Man könnte eine Windows Reparatur mit den Terminal versuchen. Halte das aber auch als unwahrscheinlicher als ein Defekt in den VRAM.

  • Um schnell Platz zu schaffen, könntest du die Datenträgerreinigung von Windows anstoßen.

  • Terminal mit Adminrechte starten und folgendes Tippen:
  1. Dism /Online/Cleanup-Image/RestoreHealth
  2. sfc /scannow
 
Man könnte eine Windows Reparatur mit den Terminal versuchen. Halte das aber auch als unwahrscheinlicher als ein Defekt in den VRAM.

  • Um schnell Platz zu schaffen, könntest du die Datenträgerreinigung von Windows anstoßen.

  • Terminal mit Adminrechte starten und folgendes Tippen:
  1. Dism /Online/Cleanup-Image/RestoreHealth
  2. sfc /scannow
Das habe ich bereits gemacht.

Auch habe ich noch weiter Dinge herausgefunden:
  • selbige Abstürze auch mit der RX 5700; Im anderen PC läuft sie problemlos.
  • Fehler: Memory_Management (also doch RAM?)
  • MSI Kombustor läd auch in den RAM. Läuft dieser fast voll, stürzt der Rechner ab.
  • Mit wieder 32GB RAM installiert habe ich weniger abstürze.
  • Nochmal verschiedene Slots mit 3 unterschiedlichen Riegeln mit je 8GB getestet (auch aus anderem PC) und immer Absturz bei Test; Teilweise auch Tests mit 16GB RAM im Dualchannel. Bei 8GB ist der PC sehr viel schneller abgestürzt. Nun sollten Spiele wie BG3 oder Helldivers aber nicht an die 32GB RAM vollbekommen.
Es ist also ggf. doch nicht die Grafikkarte, puh. Auf eine Korrelation mit der RAM-Auslastung hätte ich aber echt mal selbst achten können.

Nächste Schritte sind dann Memetest86 (muss erstmal nen Stick finden -.-) und eine Minidump-File erstellen. Das hoffe ich morgen zu schaffen.
 
Bios ist aktuell nehme ich an. Ram hast du auf Standard Einstellungen getestet, ohne XMP an. Die Ram aus einem anderen Pc sind "baugleich" mit deinem Ram?

memtest86 ist mal eine gute Idee. 2x16 GB DDR4 Ram kostet so umd die 60 Euro.
 
Fang bei den RAM mit ZWEI Riegel an, mit 4 kommt es schneller zu Probleme.
Achte bei den RAM drauf das beide Riegel aus ein Kit bestehen und den selben Takt und Timing haben. Teste den RAM ohne EXPO mit 3000 MT/s.
Mach mal von ZenTimings ein Screenshot:

Lass auch mal die "Automatische Erkennung und Installation von Treiber-Updates für AMD" laufen, nach den UEFI update!

 
Zuletzt bearbeitet:
Bios ist aktuell nehme ich an. Ram hast du auf Standard Einstellungen getestet, ohne XMP an. Die Ram aus einem anderen Pc sind "baugleich" mit deinem Ram?

memtest86 ist mal eine gute Idee. 2x16 GB DDR4 Ram kostet so umd die 60 Euro.
BIOS ist nicht aktuell. Getestet wurde ohne XMP.

Der RAM aus dem anderen PC wurde komplett alleine getestet: 1x8GB davon https://geizhals.de/kingston-fury-renegade-dimm-kit-16gb-kf432c16rbk2-16-a2564457.html

Bevor ich da Geld ausgebe, mache ich den lieber erstmal platt. Und wie wahrscheinlich ist es bitte, dass alle 4 Riegel defekt sind.
Fang bei den RAM mit ZWEI Riegel an, mit 4 kommt es schneller zu Probleme.
Achte bei den RAM drauf das beide Riegel aus ein Kit bestehen und den selben Takt und Timing haben. Teste den RAM ohne EXPO mit 3000 MT/s.
Mit einem Riegel, 2, 4 in verschiedenen Slots habe ich alles getestet. Die Abstürze sind schon bei stock und mehr bei weniger Riegeln bzw. Kapazität, was bringt da ein Test mit manuellem "OC"?
Mach mal von ZenTimings ein Screenshot:
Ich habe übrigens wieder alle vier Riegel verbaut. Zwischendurch habe ich nur 2x8GB genutzt, da ich ursprünglich auch annahm, dass es die Fehlerquote verringern würde und nicht erhöhen.
1746996304896.png

Auch dafür brauche ich erstmal einen Stick.
 
Probleme können vom RAM Controller kommen. Der ist in der CPU mit drin. AMD hat schwächen mit 4 Riegel, diese sind instabiler als 2 Riegel. Der von AMD angebende maximal Takt bei deiner CPU ist 3200 MT/s. Dein RAM kann maximal 3000 MT/s, darum sollte er ohne Probleme mit 1500 MHz mit der CPU funktionieren. Darum solltest du im UEFI den RAM so einstellen. Jetzt läuft er mit 1067 MHz (2100 MT/s) und der Controller (UCLK) mit 1067 MHz.

Was mir aufgefallen ist, das das Timing nicht stimmt.
Dann sollte das Timing CL 16-18-18-38 sein, bei dir läuft er mit 15-15-15-36!

"Automatische Erkennung und Installation von Treiber-Updates für AMD"
Das kannst du direkt Downloaden und von der SSD/M.2 aus starten. Dafür brauchst du kein USB-Stick.

P.S.
Du nutzt zwei Unterschiedliche RAM Kits. Das macht dein System Instabil!
Nicht nur das Timing ist unterschiedlich, auch der Takt.
Wenn du hier keine manuelle Einstellung vom Takt und Timing vornehmst, wird das System nie Stabil werden!

ODER

Besser du besorgst dir 1 Kit mit 2*16 GB mit 3200 MT/s.
 
Zuletzt bearbeitet:
Zurück