PC fällt sukzessive auseinander

Sefyu_TR

PC-Selbstbauer(in)
Mainboard
MSI MPG B550 Gaming Plus
CPU
AMD Ryzen 9 3900XT
CPU Kühler
be quiet! Pure Loop 240mm All-in-One
RAM
4x 8192MB G.Skill Trident Z RGB DDR4-3200 (testweise Corsair Vengeance RGB Pro)
GPU
XFX 6900 XT Merc 319 (vorher das selbe mit 6800 XT)
Netzteil
be quiet! Straight Power 11 Platinum 750W
Datenträger
Samsung 970 EVO Plus M.2 500GB
SANDISK SSD 1 TB
Samsung 870 QVO 1 TB
Monitor
ASUS ProArt PA278QV
Asus TUF Gaming VG27AQL1A
Gehäuse
Be quiet! Silent Base 802
Anzahl Gehäuselüfter
5
Betriebssystem
Windows 11
Ich schaffe es ja mich immer mit den kuriosesten Fällen im Forum zu melden...
TLDR: KLICK

In Vergangenheit (Ende 2024, Anfang 2025) hatte ich das Problem, dass mein PC irgendwann nur bei jedem zweiten Mal bootete. Sprich es kam nicht Mal bis zum BIOS. Leider war ich damals nicht schlau genug, die Fehlerquelle mittels Status LEDs auf dem Mainboard (BIOS aktuell) einzugrenzen und irgendwann war der Fehler weg. Ergo machte ich mir keine weiteren Gedanken. Läuft ja.

Zeitsprung. Vor 4 Monaten habe ich meine 6800 XT gegen die 6900 XT meines Schwagers getauscht. Direkt raus aus dem funktionierenden System und rein bei mir. Alles gut, bis das Boot-Problem vor kurzem erneut begann. Und nach weiterer Zeit heftiger wurde. Jeder 5. Bootvorgang, teilweise mit Netzteil ausschalten. Meine vernachlässigbare Intelligenz kam diesmal auf die Status LEDs: RAM. AHA!

Alle 4 Riegel einzeln getestet, anschließend paarweise getestet und es war klar einzugrenzen, dass der PC mit einem bestimmten Riegel jedes Mal nicht bootete und die Status LED RAM leuchtete. Defekten Riegel entsorgt, einen weiteren entfernt und mit den übrigen 2 laufen lassen.

Weil ich aber 4 Riegel für die Optik wollte, besorgte ich mir das Pendant von Corsair (Vengeance RGB Pro). Erster Tag unauffällig, ab dem dritten Tag mehrere Systemabstürze, Programme hingen auf, Spiele starteten nicht. Jeden Riegel einzeln getestet - unauffällig. Die Status LEDs sagten interessanterweise VGA :hmm: Wieder 2 der vorherigen G.Skill eingesetzt und es läuft. Die 4 Corsair bei meinem Schwager eingesetzt, RAM Stresstest, keine Probleme. Ratlosigkeit. Ich blieb bei den G.Skill. Der Fehler mit VGA blieb und reduzierte sich wieder auf jeden 2. Bootvorgang. Hinzu kam plötzlich, dass er mir manchmal beim Booten sagt "Laufwerk wird überprüft und repariert (C:/)".

Erst RAM, dann VGA, jetzt das Laufwerk... eindeutiger Fall von Mainboard für uns.

Joa, gerade das selbe Mainboard gekauft und siehe da: Das Problem bleibt. VGA-Leuchte, jeder 2. Bootvorgang, BIOS aktuell, Laufwerk wid überprüft, blabla...


Also: 2 Jahre kein Probleme. Plötzlich bootet der PC mit 2 unterschiedlichen GPUs und großem Zeitabstand sporadisch nur bei jedem zweiten Mal. Dann starb einer von vier RAM-Riegeln mit Status-LED RAM, was zu jedem fünften Bootversuch führte. Komplett neue vier Riegel einer anderen Marke führten sogar zu Totalausfällen. Beim Schwager laufen sie. Mit 2 der alten intakten Riegel bleibt es bei jedem zweiten Bootversuch mit VGA Status LED. Ein neues (identisches) Mainboard hat das Problem nicht beseitigt. Jetzt kommt auch noch gelegentlich "Laufwerk wird überprüft und repariert (C:/)". beim booten. Ich bin ratlos. Netzteil, CPU, Kühlung, M2, SSDs und Peripherie sind gleichgeblieben. BIOS stets aktuell. Nun sehe ich nur 3 Optionen:

A - Die Graka direkt ans MB einbauen ohne die PCIe-Verlängerung. Wobei ich die bei der vorherigen Graka nicht hatte, also unwahrscheinlich.
B - Nochmal mit meiner alten 6800er gegentesten. Wobei es das Problem damals auch schon sporadisch gab.
C - Ein neues Netzteil als Akt der Verzweiflung.

Und was das mit dem Laufwerk zu tun hat kann ich mir nicht erklären. Jemand noch ne Idee? :|
 
Zuletzt bearbeitet:
Wie laufen die 4 Riegel? XMP an, Geschwindigkeit? Bios und Chipsatztreiber aktuell? Ich hab hier einen 3800X auf einem Msi B550 A-Pro, der mag auch keine 4 Riegel. Mit zwei läuft der problemlos mit XMP auf 3600 MT/s. Ist ein Kingston Ram. 4 Riegel auf Standard (3200 MT/s) geht nicht ob mit oder ohne XMP, auch nicht langsamer. Der frisst einfach die 4 Riegel nicht.
 
Ich glaube der Kaffee hat um 07:31 noch nicht gewirkt :D

Hatte 2 unterschiedliche RAM-Hersteller und laufe aktuell auf 2 Riegel. Aber unabhängig davon lief das System 2 Jahre stabil mit 4 Riegeln und XMP auf den "vorgesehenen" 3200 MHz. Immer und in jeder Zusammenstellung. Bios (wie mehrmals geschrieben) immer aktuell. Treiber natürlich ebenfalls. Leider. Sonst wäre das Problem schon aus der Welt ohne VGA Status-LED (hint) :wall:
 
Zuletzt bearbeitet:
Interessant ist der Verlauf über die Jahre:

- Alles stabil mit 4 RAM Riegeln. Neues NT und neue 6800 XT. Läuft lange Zeit stabil.
- Dann beginnt es. VGA-LED, jeder 2. Bootvorgang funktioniert. Dann wieder ein halbes Jahr stabil.
- Dann taucht es wieder auf.
- Graka-Wechsel, Problem geht und kommt wieder.
- RAM-LED komt hinzu, jeder 5. Bootvorgang funktioniert.
- Defekten Riegel entfernt, runter auf 2 Riegel, wieder VGA-LED und jeder 2. Bootvorgang.
- Setze ich neue 4 Riegel ein, stürzt alles ab. Also bleib ich bei 2 alten Riegeln.
- Laufwerk-Problem kommt hinzu.
- Alle Treiber aktuell inkl. BIOS.

Seit dieser Fehler besteht, hatte ich zusammengefasst (auch inklusive Upgrades in den stabilen Zeiten) 2 MBs, 2 CPUs, 2 GPUs, 8 RAM Riegel. Nur das Netzteil ist konstant geblieben (be quiet! Straight Power 11 Platinum 750W) und kam mit der 6800 XT ins Haus. Später begannen die Probleme.

Bleibt für mich nur noch das NT. Dann bin ich am Ende meines Latein. Irgendwat mit 850W und 3x 8-PIN mit separaten Schienen.
 
Neues NT, selber Fehler.
Neues Mainboard, selber Fehler.
Morgen teste ich es ohne die NT Extensions und ohne die PCIe-Verlängerung. Wobei der Fehler auch ohne die schon da war.
Donnerstag kommt eine andere 6800 XT und neuer RAM zum Testen.

Das wars dann. Dann hab ich alles schon Mal getauscht. Das komplette verfickte System :wall:
 
Moin, ich hab die Lösung bzw. die Ursachen.

Zunächst war einer von vier RAM Riegeln defekt. Das hat vermutlich bereits in der Vergangenheit zu den gelegentlichen Macken geführt. Zudem haben die G.Skill keine Kompatibilitätsfreigabe für 4 besetzte Bänke und die Corsair überhaupt keine.

Nach MB und NT war die zweite Fehlerursache das Riserkabel, das den VGA-Fehler produzierte. Lustigerweise hab ich das circa zu der Zeit getestet, zu der du es kommentiert hast. Telepathie pur.

Das ganze An-Aus-An-Aus-An hat vermutlich meiner M.2 geschadet. Dass er mir bei jedem Booten das Laufwerk überprüfen und reparieren will ist nämlich geblieben, allerdings spüre ich sonst keine Auswirkungen. Nach CrystalDisk ist auch alles in Ordnung. Sicherheitshalber habe ich ein Backup angelegt und eine neue M.2 bestellt. Nach dem Klonen werde ich den alten M.2 auf Herz und Nieren testen und habe künftig ggf. eine vierte externe Backup-Platte :>
 
Zudem haben die G.Skill keine Kompatibilitätsfreigabe für 4 besetzte Bänke und die Corsair überhaupt keine.
Das ist aber mal egal. Du sagst doch es ist jahrelang gelaufen... Wenn die Rams nicht exakt baugleich sind kanns natürlich Probleme geben. Bei der Platte kannst auch mal chkdsk und dism laufen lassen.

Wenns wirklich am Riserkabel liegt wärs gut. Nicht verwenden, fertig. Hättest es am Anfang erwähnt.
Ein Riserkabel soll auch nicht länger als max. 20 cm sein. Vermeintlich günstige Kabel sind da eher betroffen. Je länger desto fehleranfälliger, weil zb. Drahtquerschnitt nicht passt, störanfällig wegen anderen elektrischen Teilen, Leitungsdämpfung.
Leiterbahnen am Board werden ja auch so kurz wie möglich gehalten, da sonst die Signalqualität leidet.

Das beste Riserkabel ist kein Riserkabel....

Aber super wenns nun läuft wie es soll.
 
Danke für den Software-Hinweis. Die Kiste läuft seit gestern morgen einwandfrei (bis auf die Festplatte). Bestimmt schon 10 Mal gebootet ohne Probleme. Das Kabel ist exakt 20cm, aber tut auch nichts mehr zur Sache.

Kann die fehlende Kompatibilität nicht nach Jahren zum Defekt eines RAM Riegels geführt haben?
Ansonsten sind eh 2 identische G.Skill neu zu mir unterwegs, kann ich dann wieder im 4er Bündel testen :)
 
Zuletzt bearbeitet:
Kann die fehlende Kompatibilität nicht nach Jahren zum Defekt eines RAM Riegels geführt haben?
Nein. Entweder die laufen oder eben nicht. Stabil auf Stock. Wären die Ram übertaktet testet man die sowieso auf Stabilität, da können die zb. in einem Spiel schon normal laufen, in einer Anwendung allerdings schmiert die Kiste dann ab. Beim Ram übertakten muss man sich hintasten, immer wieder testen, solang bis die richtig stabil sind.

Und diese QVL Listen sind nie vollständig. Jetzt ist zb. der Kingston Ram drin, aber der Corsair nicht obwohl der haargenau die selbe Geschwindigkeit hat und die gleichen Latenzen. Warum soll der Corsair dann nicht laufen? Ist doch gleich. Der läuft genauso.
Der Grund ist dieser: es werden eben nicht alle Ram getestet. Warum? Wenn jeder Boardhersteller jedes Board mit jeder Ramkombination (1-4 Riegel) mit jeder Größe (von 4-128 GB), jeder Geschwindigkeit und den verschiedenen Latenzen testet dann sind das x Kombinationen - die werden doch mit dem testen nie fertig.
 
Klingt nach defekten imc dank amd agesa updates 1,2,0,5 ist kein ram mehr stabil über jedec
Das kommt daher das nach diesen update die soc spannung angehoben wurde was schleichend zum degradieren führt die folge kein stabiler ram mehr möglich auch wenn memtest86 keine Fehler ausspuckt.
Lösung ist hier aktuelles agesa drauf 1.2.0.f
Dann 5900xt rein ram nur 2 sticks verbauen mit jedes ddr4 2133 oder ddr4 2666 je nach kit. Kein pbo
Die Ursache liegt an den fixes für am4 cpu seit der sidechannel attacke wurde die spannung angehoben und teile der cpu deaktiviert.
Im Grunde fixed man das nur mit der aktuellsten cpu auf am4 und das sind die 5900xt 5800xt 5600xt
Die degradierung kann man prüfen mit ppt auf 95w und multi auf 38 (3,8ghz)
Dann dürfte es stabil werden
 
Aha, jetzt wo das Problem gelöst ist kommen alle rausgekrochen :D

imc, agesa, jedec, soc, pbo, sidechannel und ppt also. Dass ich darauf nicht gekommen bin.
 
ja hab ich aber das problem ist nicht weg sondern verschleiert weil die spannung nochmal erhöht wurde
Es ist eben so das pbo und docp bei am4 instabil ist.
Die norm spannung für die nb ist 1,0v für den chipsatz 1,1v und kein Millimeter mehr
agesa 1,2,0.f macht daraus 1,1v und 1,15v-1,175v
Das ist nur bei aktiven docp pbo so das grillt den imc auf lange Sicht zwischen 2-3 Jahre ist der durch im besten fall wie bei mir geht nur der ram defekt auch dank 1,37v
Warum das so geworden ist ist unklar aber amd agesa ist daran schuld mit agesa 1.2.0.3 war alles noch ok
Da war der imc in standard und hatte kein problem mit docp bei 1,35v ddr4 3600 Vollbestückung 4 sticks
Danach also mit 1.2.0.5 an kamen ram defekte 3 kits brauchte ich um festzustellen das es am docp pbo liegt
Die Lösung ist echt jedec und norm Takt. Das hielt dann bis heute zum Wechsel auf den 5700x3d der pbo generell gesperrt hat docp geht aber das spare ich mir, kein nutzen da mehr ramtakt ins leere läuft dank x3d
 
Ich zweifle nicht an seinem Wissen, aber schreibt er immer so kryptisch, dass keiner was versteht? Ist das Absicht für eine versuchte Erhabenheit oder ist er nach 13.000 Beiträgen einfach effizient beim Schreiben? Bin ich doch nach 20 Jahren des Schraubens doch ein kackn00b? Fragen über Fragen..
 
Gewohnheit und ich setze etwas wissen voraus ist natürlich für noobs unverständlich
kurz
amd agesa biosupdate mitt Sicherheitslücken gestopft wurden sorgten für Degradierung wenn man oc das gilt für ram und den cpu internen pbo Modus
Dram ist immer ne glücksfrage ob es stabil ist .Sicher ist man nur mit jedec den standard für dram seit 2003 als man ddr eingeführt hat ddr 66
ich hatte mit am4 Vollbestückung 4 Riegel bei xmp 3600 laufen bis 2023 agesa combo 1,2,0.3b war bis f13 von 2022
Natürlich nutzte ich f15 zu der zeit bis 2024 dann begannen die ramfehler ram ersetzt und bei f17 1,2.0,7 das zweite kit defekt dann habe ich geforscht und klar festgestellt das docp und pbo zu den Änderungen geführt haben seitdem läuft es mit den letzten ramkit aktuell patriod viper ddr4 2666 kit ist für 3200 spezifiziert
Seitdem keine Probleme mehr trotz lahmen 15ns zuvor war ich bei 12ns was man anhand des 3800xt auch merkte
+15% an fps in cpu limits war vs ddr4 3600 feststellbar. Mit dem 5700x3d ist das auch quasi weg
Das sagt mir das ramtakt nur dann wichtig ist wenn die cpu es nicht ganz an ipc schafft.
am4 ist am ende mehr perf. bekommt man aktuell nur bei amd am5 mit dem 9800x3d auch jedec ddr5 5600 norm
Den ram muss man aber ecc nehmen da es sich anbietet ist zudem sicherer nur das kaufen solche schwer und teuer
Dank ai Krise aktuell


Wenn ich drei kits zweimal der ram mit Fehlern nach zwei und etwa ein Jahr habe muss es an agesa liegen weil abseits xmp habe ich nix oc
bei amd am4 an ist OC Sinnlos und ich habe früher mit am3 oc und da bringen nb clock und ramtakt syncron ordentlich perf. bis zu 25% allerdings noch ddr3 1600 nb 2400 standard ist ddr3 1066 nb 1800
hatte auch mal intel so2011-3 x99 dort habe ich auf oc verzichtet war unnötig aber die cpu haben potenzial bis 4,2ghz standard ist 3,6ghz nb /ringbus bei 1,3ghz geht bis 2,0ghz und auch hier bringt das syncron mit ringbus etwa +20% auch dank quadchannel
Es machte mit x99 aber kein Sinn zumal die gpu immer limitierte gtx1060

heute wenn ich neu kaufen müsste wäre es am5 mit ddr5 5600 cl46 ecc ram dual rank + 9800x3d mit nen artic freezer 36
kein pbo kein expo
Die kombo ist aktuell bei grob 1000€ dank rampreise (350€ 64gb)
Und ja am5 unterstützt ecc ist nur vom mainboard abhängig

achja ipc Differenz anno 117 cpu test 5700x3d vs 9800x3d +60%
faktisch limitiert meine cpu ab der rtx4080 auf 1080p und ja das bleibt die Auflösung bis irgendwann pholed auf meine tisch kommt.

Dein problem kenne ich wenn Desktop einfriert und sporadisch der pc Neustartet oder mal Programme hängen ist alles ram(HDD SSD) bezogen gpu Fehler zeigen sich eher bei treiberabstürzen oder Bild aus Bildfehler sowie installfehler in spielen.
Bildfehler sind am deutlichsten meist vram defekt oder sehr selten gpu Absturz wegen zu schwachen Netzteil
meist geht nur der monitor aus und das system hängt
 
Zurück