Ryzen 5600X: Schwerwiegender Hardwarefehler, Bus/Interconnect Error (WHEA-18) und Restarts

Ich konnte die Abstürze und damit die WHEA-18 Fehler zwischenzeitlich mehr oder minder eindeutig auf die CPU zurückführen.

So banal es klingt, aber nach Deaktivieren des Core Performance Boost läuft der Rechner, wie er laufen soll. Idle ohne Probleme, 30 Min Unigine Benchmark auf High/Extreme butterweich ohne Probleme, alle Temperaturen im grünen Bereich. Die Global C-States, Typical Current Idle und Power-Down-Mode Einstellungen haben die Abstürze lediglich verzögert, passiert sind sie trotzdem. CPB eingeschaltet -> Restarts zurück. Warum es nur daran zu liegen scheint? Keine Ahnung.

Die Rücksendung der CPU bei MF ist beantragt, mit Hinweis auf mögliche, eindeutige Reproduzierbarkeit des Fehlers. Die neue wird gnadenlos auf diesen Fehler untersucht werden, wenn das Ding auffällig wird geht es von mir aus so oft zurück, bis ich eine funktionierende CPU bekomme. Kann mich da dem Ratschlag von @DevilTwist nur anschließen:

Mein Rat, parallel zu vielen anderen hier im Forum, die mit WHEA-Logger Fehlern zu kämpfen hatten. Ab in die Reklamation.

Seitens AMD finde ich es gelinde gesagt einfach frech, dass es dazu nicht mal irgendwo einen FAQ-Eintrag gibt, aus dem hervorgeht, dass der Fehler zumindest 'wahrscheinlich' von der CPU kommt. Nein, die Produkte sind perfekt. Und so selten ist der Fehler nicht, als dass man ihn einfach ignorieren könnte.

Produktionsdaten der CPUs liefere ich nach, da der Bekannte, bei dem der Rechner steht, an dem Tag keine Zeit mehr für den Ausbau hatte.
 
Produktionsdaten der CPUs liefere ich nach, da der Bekannte, bei dem der Rechner steht, an dem Tag keine Zeit mehr für den Ausbau hatte.

Kleiner Tipp... Mach dir im Vorfeld noch ein Bild von der CPU eingebaut im Sockel, auf dem die eingelaserte Schrift auf dem Heatspreader lesbar ist. Erspart dir unter Umständen Arbeit.

Sollte es nämlich dazu kommen, dass du die CPU zu AMD einschicken musst, verlangen die ein eingebautes Bild. Dazu ein Zettel, auf dem die Vorgangsnummer notiert ist. Der sollte sich jedoch per Bildbearbeitung einfügen lassen können. So ersparst du dir eventuell Arbeit.

Ich habe nämlich die CPU vorgestern schon ausgebaut und in die OVP verpackt und AMD will das jetzt noch. *facepalm

Aber ja... Ich verstehe auch nicht, wie die CPU allgemein noch verkauft werden kann unter diesen Bedingungen. Es ist eine Frechheit, dass eine (mutmaßlich) serienfehlerbehaftete CPU immer noch im Handel verkauft wird. Die Leute legen massig Moneten hin um dann mit massivsten Problemen zu kämpfen haben. Gerade in Zeiten in denen mehr Leute denn je im Homeoffice sind eine absolute Katastrophe. Vor allem wenn sie dann noch wie ich regelmäßig Datenverluste haben (inkl. zig Festplattenüberprüfungen von Windows nach den Restarts).
 
Sollte es nämlich dazu kommen, dass du die CPU zu AMD einschicken musst, verlangen die ein eingebautes Bild. Dazu ein Zettel, auf dem die Vorgangsnummer notiert ist.
Oh man, ich danke dir für die Vorwarnung. Hast du Informationen darüber bekommen, wann AMD eigentlich einen Ersatz losschickt? Erst nach Einsendung und Tests von deren Seite? Ich bin mal auf die Reaktion von MF gespannt, die ich kommende Woche erwarte.

Die Leute legen massig Moneten hin um dann mit massivsten Problemen zu kämpfen haben.
Jap, und wie du schon geschrieben hast mag man in der Chiplotterie bei einem 5600X meinetwegen mal verlieren, aber a) ist der Fehler hier bei deutlich mehr Leuten anzufinden als die übliche "Lotteriepech"-Menge und b) ist das Problem bei einem 5800X noch mal eine ganz andere Liga.
 
Nein, leider gar keine. Ich muss auf jeden Fall jetzt erstmal Fotos, Originalrechnung und weitere Details zu verwendetem Mainboard (genaue Bezeichnung inkl. Modellname) zukommen lassen. Dazu wollen sie noch genau die getesteten Bios-Versionen wissen und welche Lösungsansätze unternommen wurden um das Problem zu beheben (hier lasse ich mal das testweise unternommene UC/OC vorsichtshalber weg).
Danach wird er eingeschickt, sollte die RMA bewilligt werden und laut anderer Meldungen hier im Forum sollte dann ein Ersatz in ca einer guten Woche da sein, eher etwas mehr als weniger.

Wäre es nur ein 5600X bei mir, hätte ich mir vermutlich einfach ein neues Board inkl. CPU gekauft und hätte versucht die alte Kombi anderweitig loszuwerden. Bei einem 5900X inkl. Aorus Ultra liegen die Kosten jedoch bei knapp 900 Euro. Das ist mir zuviel Geld um das vorzustrecken, bzw. das auf Pech / Lotteriecpu zu schieben.
 
@DevilTwist @Biligeco_DE
Das meinte ich ja damit, dass es mich wundert bei den bekannten Medien absolut nichts darüber zu lesen (bis auf das oben Erwähnte)... Die ersten Meldungen im Netz darüber sind ja bereits ein halbes Jahr zurück, selbst wenn es mit den ersten Chargen Probleme gab, sollte das ja inzwischen behoben sein. Selbst für die etwas trägeren Bios-Zyklen ist genug Zeit vergangen, um auf etwaige Probleme einzuwirken.

In meinem Fall hatte z.B. Core Performance Boost und Co. nicht merklich was verändert. Gefühlt ging es besser, wenn im Browser Hardware-Unterstützung ausgeschaltet war; viel besser wurde es noch mit den Stromwerten.
Könnte z.B. auch eine Produktionsschwankung sein, verbunden mit falschen Parametern gesteuert durch das Bios.

Zu Glück hatte Amaz*n hier keinerlei Stress gemacht, das Ding zurückzunehmen (auch wenn ich versuche dort weniger zu bestellen; hier ist das ein Mehrwert).
 
Mich wundert es tatsächlich auch ein wenig. Selbst im großen Thread hier im Forum, in dem ich heute auch noch was geschrieben habe, war bis dato der letzte Beitrag vor knapp 2 Monaten. Ist dort auf einmal alles fine?

Bei mir hat gar nichts geholfen. Ich glaube ich habe da wirklich ein mega schlechtes Exemplar erwischt. Sobald ich auch nur ansatzweise an den Spannungen was verändert habe, startete der Pc nicht mehr. 3 Mal Restart -> Bios-Reset
 
Noch ein kleiner Tipp... Macht ausreichend Fotos...
Ich habe den Prozessor dreimal ein- und ausbauen, weil immer irgendwas nicht gepasst hat.
Zudem noch 2x die Original Rechnung schicken, etc. :D

---

Dafür ist der Prozessor jetzt verpackt und geht heute noch in den Express-Versand. :)
 
Zuletzt bearbeitet:
weil immer irgendwas nicht gepasst hat.
Hat AMD der Sonnenuntergang im Hintergrund gefehlt? :D

Dafür ist der Prozessor jetzt verpackt und geht heute noch in den Express-Versand.
Super, freu mich auf deinen Bericht von der neuen CPU bzw. AMDs Reaktion. Unser 5600X sollte diese Woche noch bei MF ankommen, ich hoffe, die fackeln nicht lange. Und ich hoffe, dass ich im Fall der Fälle genug Fotos habe ...
 
Keine Ahnung, auf jeden Fall haben se sich blöd angestellt. :D

Mein 5900X ist direkt am nächsten Tag angekommen. Jetzt mal schauen, wie es weitergeht. Ich bin auf jeden Fall gespannt. Das System wird dann aber auf jeden Fall erstmal nicht in normalen Gaming-Betrieb genommen, sondern erstmal auf Herz und Nieren überprüft. Allein das hoch- und runterwuchten vom Schreibtisch will ich nicht nochmal umsonst machen. Wiegt ja doch einiges :D
 
Neuer 5600X von MF ist zwischenzeitlich angekommen und wurde eingebaut, der Austausch wurde direkt versendet, keine weiteren Fragen von MF. Entweder sind die mit den Jahren sehr kulant geworden, oder AMD hat da angeordnet, WHEA-CPUs sofort zu tauschen, weil der Fehler bekannt ist und man sich die Finger daran nicht verbrennen will ... aber den Aluhut lassen wir besser im Schrank :D

Jedenfalls funktioniert die neue CPU jetzt out of the box, erste Last- und Gamingtests zeigen keine Auffälligkeiten mehr, der WHEA-18 taucht nicht mehr auf. Der Kernel-Power 41er taucht seltsamerweise manchmal auf, obwohl der PC nicht aus geht oder restarted, das behalte ich noch im Auge, aber sofern es keine tatsächlichen Restarts verursacht, vorerst kein Problem ... Die Produktionsdaten der CPUs packe ich hier mal als Bild anbei.

@DevilTwist Wie läuft deine neue CPU?
 

Anhänge

  • CPU_Defekt.jpg
    CPU_Defekt.jpg
    956,2 KB · Aufrufe: 205
  • CPU_Neu.jpg
    CPU_Neu.jpg
    798,6 KB · Aufrufe: 266
@Bilgeco_DE

Mein 5900X ist gestern angekommen. Direkt eingebaut, Bios auf Stock resettet und nur XMP aktiviert sowie die Pumpe auf Silent-Mode geschalten. Ich habe das System komplett so gelassen wie vorher, also alte Win-Installation, etc.

Prime95 mit Small FFTs habe ich ca 1,5h laufen lassen -> keine Probleme, max Temp bei ca 80°, durchsch. bei 55°
Prime95 im Blend für 2,5h -> keine Probleme, max Temp bei ca 75°, durchsch. bei 55°

Dann mal ca ne halbe Stunde Pause

CB + Timespy für 24h im Dauerloop laufen lassen -> keine Probleme, max Temp bei ca 80°, durchschn. bei 65°

Jetzt läuft gerade nochmal der Blend für weitere 24h um da mal alles abzuchecken, vor allem das Zusammenspiel mit dem RAM. Danach gehts in einen abgespeckten Produktivtest. Ich werde vor allem anspruchsvolle Games bisschen zocken, ausmachen und direkt in Office/Browser-Betrieb wechseln.
Da habe ich die meisten WHEAs bekommen. Zwar nicht reproduzierbar, aber in 7-8/10 WHEAs war es das Phänomen.

Habe kein Foto meiner CPU ausgebaut gemacht, ist aber aus der KW 19 von 2021. Also noch eine sehr frische Produktion. :D

Ich bin gespannt und wage langsam zu hoffen. Trotzdem bleibt immer die Erwartungshaltung, dass der Pc jedem Moment abschmiert. Man verlässt sich da nicht mehr so drauf und das ist schade.
 
@DevilTwist

Das klingt doch schon mal gut, hoffentlich bleibt es so. :)

Ich finde es am wichtigsten, dass man einfach die Gewissheit hat, dass falls wieder etwas in diese Richtung passiert, es sehr wahrscheinlich an der CPU liegt, darauf zu kommen hat die meiste Zeit gedauert, bei mir zumindest, denn ausgetauscht ist das Teil im Zweifel schnell.

Ich bin auch mal gespannt, ob unserer stabil bleibt. Zukünftig werde ich beim CPU-Kauf jedenfalls genauer hinschauen bzw. mich vorher besser informieren ... auch wenn man immer mal Pech haben kann :/
 
Wobei die WHEA-Thematik nichts mit Pech zu tun hat, sondern einer Serien-Pleite seitens AMD, die auch noch totgeschwiegen wird. Schnell die CPUs austauschen, aber ja kein Wort darüber verlieren. Könnte ja am Image kratzen.
Absolute Katastrophe in Preisbereichen und Komponenten, in denen man sich keine Fehler erlauben sollte.

Und eine Gewissheit ist ja auch noch nirgends da. Eine Folge des Totschweigens des Problems. Es weiß ja niemand zu 100% woran es liegt. Das weiß (vermutlich) nur AMD selbst und die schreiben nichts dazu. Es könnten sich etliche Personen 100e h an Arbeit sparen, wenn irgendwo in einem FAQ stehen würde:
Haste dieses und jenes Problem -> Meld RMA an

Da verbaut sich AMD bei genau diesen Personen direkt wieder ihr halbwegs gutes Image, welches sie sich in den letzten Jahren aufgebaut haben. So kann man es PR-technisch natürlich auch machen. *shrug
 
Lustigerweise hatte ich heute im Event-Viewer einen neuen alten Bekannten:
WHEA-Logger, ID 1.
Die im Event angegebene PID verweist auf den Diagnoserichtliniendienst.

Allerdings ohne Reboot, hab den Eintrag auch nur zufällig gesehen - die Reboots sind seit dem Tausch ausgeblieben.
Ich bin mal gespannt, wie sich das entwickelt...
 
Lustigerweise hatte ich heute im Event-Viewer einen neuen alten Bekannten:
WHEA-Logger, ID 1.
Die im Event angegebene PID verweist auf den Diagnoserichtliniendienst.

Allerdings ohne Reboot, hab den Eintrag auch nur zufällig gesehen - die Reboots sind seit dem Tausch ausgeblieben.
Ich bin mal gespannt, wie sich das entwickelt...
Oh no, mach keine Jokes. :klatsch:
Welches Board und BIOS hast du @Gwandlaus ?

Ich habe gerade vorhin auch mal die Eventlogs durchgesehen.
Soweit ohne Indiz, da auch ein nochmaliger Blend-Test im Prime über etliche Stunden durchlief (den habe ich mittlerweile beendet, da mir die Temps auf Dauer zu hoch sind und ich das nicht 24h durchziehen möchte). Allerdings wollte ich einfach mal durchsehen und habe dabei bemerkt, dass sowohl das Dateisystem vom StoreMI-Verbund, wie auch der Spiele-SSD ne ordentliche Macke weghaben durch die ganzen WHEA-Reboots.

Dementsprechend ist die Kiste jetzt mal runtergefahren und wird morgen nach Datensicherung komplett neu aufgesetzt. Bringt mir nichts da weiter zu testen, wenn bei mind zwei von vier Platten größere Fehler im Dateisystem sind.

Sobald das neu aufgesetzt ist wird es auch direkt in den Produktivtest gehen. Ich denke ich bau dann doch schon direkt um, werde jedoch den alten Rechner griffbereit da lassen.
 
Welches Board und BIOS
Das ist ein Asus B550 E-Gaming mit dem letzten "stable" Bios 2006 (Agesa 1.2.0.1 Patch A). Es würde bereits zwei neuere Betaversionen geben, aber das ist mir zu unsicher. Die neueste Beta 2401 gibt sogar improve system stability mit an. Mal schauen wann diese finalisiert wird.
Chipsatztreiber vom 2.6 werde ich demnächst mal installieren, wobei die Patchnotes unspektakulär sind.

Ich hatte zu dem Zeitpunkt diverse virtuelle Maschinen am Laufen, vielleicht läuft hier noch irgendwas unrund.
Der Eintrag von heute ist auch der erste WHEA seit dem 16.5, wie gesagt mit anderer ID 1 statt 18, und ohne Reboot.

Datenverluste hatte ich glücklicherweise keine nennenswerten, auch wenn die Power-Cycles ein wenig zugelegt haben...
 
Power Cycles interessieren mich zum Glück noch rein gar nicht. Ist alles neu. Da machen 2-3 Cycles mehr den Bock auch nicht fett. Dafür spare ich Cycles im Vergleich zu anderen ein, da meine Systeme meist 24/7 laufen.

Hatte nach Board/Bios gefragt, weil es original zum neuen Bios von Gigabyte gepasst hätte. Da ist heute die stable F33 released worden, wobei diese anscheinend innert der letzten Stunden wieder offline genommen wurde. Die testen anscheinend auch nen Scheiss vorher.

Naja. Morgen mal Daten sichern, dann direkt Neuinstallation inkl. neuester Treiber. Dann mal weitersehen. Mir ist mittlerweile echt die Freude am neuen System vergangen.
 
Wobei die WHEA-Thematik nichts mit Pech zu tun hat, sondern einer Serien-Pleite seitens AMD, die auch noch totgeschwiegen wird. Schnell die CPUs austauschen, aber ja kein Wort darüber verlieren. Könnte ja am Image kratzen.
Ja, du hast natürlich recht. Aber gerade weil man so wenig darüber liest, ordne ich das schneller dem Pech zu, als der eigentlichen Tatsache. Schon klug von AMD, und ne absolute ***-Aktion ...

Da verbaut sich AMD bei genau diesen Personen direkt wieder ihr halbwegs gutes Image, welches sie sich in den letzten Jahren aufgebaut haben.
Fahre auch seit je her mit AMD und stelle PCs auch immer gerne mit deren Teilen zusammen für Freunde etc., wenn besondere Ansprüche nicht dagegen sprechen. Bisher ging das 'blind' echt lange gut, aber die Zeit ist für mich vorerst jetzt vorbei. In Zukunft wird sich wieder mehr informiert und Erfahrungen vergisst man ja nicht :-P

Allerdings wollte ich einfach mal durchsehen und habe dabei bemerkt, dass sowohl das Dateisystem vom StoreMI-Verbund, wie auch der Spiele-SSD ne ordentliche Macke weghaben durch die ganzen WHEA-Reboots.
Hat sich das durch Fehlermeldungen bzw. einen Laufwerkscan geäußert? Würde meinen PC ggf. auch gern mal auf sowas prüfen.
 
Hat sich das durch Fehlermeldungen bzw. einen Laufwerkscan geäußert?
Ich schieb hier mal kurz meine Erfahrungen damit zwischen:
Die normale Windows-Installation kannst du mittels admin-Kommandozeile und "sfc /scannow" prüfen lassen, diese hatte bei mir 2x was korrigiert.

Laufwerksscans / SMART waren alle unverdächtig, keine der NVMe, SSD und HDD zeigten etwas an (ausser einen Neustart-Zähler der normalerweise erst später in diesem Jahr erreicht gewesen wäre).
Wenn bei NTFS-Partitionen nicht zufällig einer der Journal-Bereiche im NTFS beschädigt ist, bekommt man mit normalen Mitteln das wohl nicht heraus; erst wenn die Anwendung schreit. Mit StoreMI mag das eventuell anders aussehen.

Ich hatte bspw. in den Eigenen Dateien diverse Daten mit gleicher Größe und Änderungsdatum wie früher, aber der Inhalt war mit 0x00 gefüllt und damit nicht mehr so brauchbar.
 
Hat sich das durch Fehlermeldungen bzw. einen Laufwerkscan geäußert? Würde meinen PC ggf. auch gern mal auf sowas prüfen.

In erster Linie dadurch, dass Windows etliche Reparaturen hat laufen lassen bei den Boots und im Infobereich stands, etc.
Zudem waren wirklich Installationen nicht mehr zu gebrauchen, ähnlich wie Gwandlaus es geschrieben hat. Spiele haben nicht mehr funktioniert und auch die Steam-Bibliotheken hat es komplett zerschossen.
Da weiter mit dem zerschossenen System zu testen / arbeiten hat keinen Sinn gehabt. Dementsprechend jetzt ne cleane Neuinstallation. Mittlerweile ist auch wieder alles installiert und eingerichtet und das System ist wieder produktiv. Bisher keinerlei Probleme gehabt. Ich drück mir selbst die Daumen. :D
 
Zurück