Neuer Pc startet sporadisch neu - WHEA Logger ID 18

DevilTwist

Kabelverknoter(in)
Hey zusammen, ich hoffe ihr könnt mir helfen.
Ich weiß, selbige und ähnliche Probleme werden zuhauf in Foren diskutiert. Jedoch bin ich aus keinen Beiträgen wirklich schlauer geworden, geschweige denn hätten mir diese geholfen.

Folgendes (nahezu niegelnagelneu) System:
CPU: Ryzen 9 5900X
Mainboard: Gigabyte X570 Aorus Ultra
Arbeitsspeicher: G.Skill TridentZ - 2x 32 GB @ 3600 MHz (XMP aktiviert) @ CL 16
Grafikkarte: Gigabyte RTX 2070 Super Gaming OC White 8G
Netzteil: Corsair HX850
System-SSD: Corsair MP600 @ 1TB
Spiele-SSD: Corsair MP600 @ 1TB
Programm-Platte: 2TB Seagate Barracuda & 120GB Sandisk SSD @ StoreMI
Datengrad: 4TB WD Red Pro
Kühlung CPU: EKWB Custom Loop @ 360mm Radiator mit 3x Noctua Lüftern (saugend von Seite)
Kühlung Case: 3x Enermax SquaRGB @ Bottom saugend; 3x SquaRGB @ Top nach außen pustend
Case: Lian Li O11Dynamic XL

Obiges System ist Mitte März komplett neu gekauft und zusammgebaut, einzig die Grafikkarte ist von meiner Frau gemopst, jedoch auch nicht allzu alt. Es war schweineteuer, sorry für die Ausdrucksweise und macht mich langsam fertig.
Seit ungefähr 3 Wochen treten sporadisch Neustarts auf, ohne jeglichen Zusammenhang, Auslastung oder bemerkbare Temperaturen.
Dabei immer mit der gleichen Ereignismeldung:

Protokollname: System
Quelle: Microsoft-Windows-WHEA-Logger
Datum: 03.05.2021 18:17:40
Ereignis-ID: 18
Aufgabenkategorie:Keine
Ebene: Fehler
Schlüsselwörter:
Benutzer: Lokaler Dienst
Computer: DESKTOP-I12ITQR
Beschreibung:
Schwerwiegender Hardwarefehler.

Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Machine Check Exception
Fehlertyp: Cache Hierarchy Error
Prozessor-APIC-ID: 0

Die Detailansicht dieses Eintrags beinhaltet weitere Informationen.
Ereignis-XML:
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
<System>
<Provider Name="Microsoft-Windows-WHEA-Logger" Guid="{c26c4f3c-3f66-4e99-8f8a-39405cfed220}" />
<EventID>18</EventID>
<Version>0</Version>
<Level>2</Level>
<Task>0</Task>
<Opcode>0</Opcode>
<Keywords>0x8000000000000000</Keywords>
<TimeCreated SystemTime="2021-05-03T16:17:40.5673441Z" />
<EventRecordID>12343</EventRecordID>
<Correlation ActivityID="{d4533602-a28c-4d29-b5f0-9d370f2af183}" />
<Execution ProcessID="5676" ThreadID="6376" />
<Channel>System</Channel>
<Computer>DESKTOP-I12ITQR</Computer>
<Security UserID="S-1-5-19" />
</System>
<EventData>
<Data Name="ErrorSource">3</Data>
<Data Name="ApicId">0</Data>
<Data Name="MCABank">5</Data>
<Data Name="MciStat">0xbaa0000000030150</Data>
<Data Name="MciAddr">0x0</Data>
<Data Name="MciMisc">0xd01a0ffe00000000</Data>
<Data Name="ErrorType">9</Data>
<Data Name="TransactionType">0</Data>
<Data Name="Participation">256</Data>
<Data Name="RequestType">5</Data>
<Data Name="MemorIO">256</Data>
<Data Name="MemHierarchyLvl">0</Data>
<Data Name="Timeout">256</Data>
<Data Name="OperationType">256</Data>
<Data Name="Channel">256</Data>
<Data Name="Length">936</Data>
<Data Name="RawData">435045521002FFFFFFFF03000100000002000000A80300001E111000030515140000000000000000000000000000000000000000000000000000000000000000BDC407CF89B7184EB3C41F732CB57131FE6FF5E89C91C54CBA8865ABE14913BB424EA0CC3740D70102000000000000000000000000000000000000000000000058010000C00000000003000001000000ADCC7698B447DB4BB65E16F193C4F3DB0000000000000000000000000000000001000000000000000000000000000000000000000000000018020000800000000003000000000000B0A03EDC44A19747B95B53FA242B6E1D0000000000000000000000000000000001000000000000000000000000000000000000000000000098020000100100000003000000000000011D1E8AF94257459C33565E5CC3F7E8000000000000000000000000000000000100000000000000000000000000000000000000000000007F010000000000000002010300000000100FA2000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000007000000000000000000000000000000100FA200000818000B32D87EFFFB8B170000000000000000000000000000000000000000000000000000000000000000F50157A5EFE3DE43AC72249B573FAD2C01000000000000009F0014060000000000000000000000000000000000000000000000000000000000000000000000000200000002000000D1292ED13740D701000000000000000000000000000000000000000005000000500103000000A0BA000000000000000000000000FE0F1AD0000000000000000000000000B00005000100004D00000000F9010000230000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000003B00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000</Data>
</EventData>
</Event>

Dabei spielt es keinerlei Rolle ob ich gerade spiele, einen Benchmark laufen lasse oder er im IDLE direkt nach dem Neustart vor sich hin gammelt.
Die Abstürze sind nicht reproduzierbar. Letztens ist er nach 3 Sekunden Cinebench abgestürzt, danach lief er zig mal ohne Fehler durch. Auf den angesprochenen Absturz
hin vermutete ich einen Fehler mit der Grafikkarte, habe hier mittels MSI Afterburner geschraubt, Powertarget erhöht und dachte, dass der Fehler behoben sei. Nach 2 Tagen wieder selbes Problem.
Auffällig ist dabei, dass die "Prozessor-APIC-ID: 0" immer die Ziffer 0 hat. In anderen Threads habe ich gelesen, dass dort immer eine andere Zahl stünde nach dem Neustarten.

System ist komplett ohne OC (auch versuchtes OC zur Fehlerbehebung hats nicht gebracht ^^) es wurde XMP versuchsweise deaktiviert, Temperaturen sind nie über 60 Grad (an keinem Sensor), Bios auf aktuellem Stand....
Joa, ich verzweifel hier ein bisschen...
Was er auch schon gemacht hat (ich weiß allerdings nicht ob das mit den Abstürzen zusammenhängt)... Er hat mir das BIOS schon 2 - 3 Mal resettet. Lüfterkurven waren resettet, XMP deaktiviert, etc.f
Also Stock-Bios komplett.

Vielleicht hat ja jemand eine Idee, was ich noch versuchen könnte. Nächster einfacher Schritt von mir wäre die Grafikkarte gegen meine alte 1080 auszutauschen und am Netzteil den Rail-Switch umzulegen
(fragt mich grad nur nicht ob das Netzteil auf Single- oder Dual-Rail gestellt ist).

Fällt euch noch was ein, woran es liegen könnte?
Gruß und danke o/

Ps: Bitte keine Diskussionen über Sinnhaftigkeit, Preis oder sonstiges des Systems.
 
Bluetooth deaktivieren und testen. Wenn das in Ordnung ist also kein Error dann passenden Treiber suchen.
 
Ich habe jetzt mal komplett das Bluetooth Gerät im Geräte Manager deaktiviert. Jetzt mal schaun, ob sich was verbessert / ändert. Wie kommst du drauf, dass es mit dem Bluetooth-Treiber zusammenhängen könnte?
 
Goolge.https://www.dell.com/community/Laptops-General-Read-Only/Whea-logger-corrected-error-17/td-p/5043494 ist nur eine Ide.. hatte auch auf meinem alten Intel Bord mit dem Bluetooth Probleme.
 
schmeiss die cpu in den müll und mach nicht den gleichen fehler wie ich und ärgere die dich en halbes jahr rum. Rma und gut is
Ich denke nicht, dass das Sinn und Zweck meiner Fragestellung war. Dementsprechend ignorier ich deine Antwort einfach mal, es sei denn du hättest hierfür irgendwelche konkreteren Angaben parat, die sich nicht nur auf einen Fall / ein Setup beziehen. Danke. :-)
 
Ganz einfach.
WHEA Error Cache Proccessor ID.
Wird vermutlich der Speichercontroller auf der CPU sein wie bei mir und bei vielen anderen auch.
Melde eine RMA an lass die CPU tauschen und ärgere dich nicht weiter damit rum.
 
Zuletzt bearbeitet:
Bluetooth deaktivieren und testen. Wenn das in Ordnung ist also kein Error dann passenden Treiber suchen.
Ich möchte es ja nicht verschreien. Aber zumindest bisher habe ich keine weiteren Abstürze gehabt. Ich drücke die Daumen, dass es so bleibt, dann kann mir das Bluetooth auch gern gestohlen bleiben. :-)

Ganz einfach.
WHEA Error Cache Proccessor ID.
Wird vermutlich der Speichercontroller auf der CPU sein wie bei mir und bei vielen anderen auch.
Melde eine RMA an lass die CPU tauschen und ärgere dich nicht weiter damit rum.
Ich habe mir mittlerweile einmal den ganzen Thread durchgelesen, indem auch du mit deiner CPU mitgeschrieben hast. Tatsächlich war es dort aber der Fall, dass bei mind einer Person der worst case eingetreten ist und dieser wieder eine CPU (aus einem viel späteren Batch) erhalten hat, welche die gleichen WHEA Fehler ausspuckte. Zudem liegt es einfach zu nahe, dass das BIOS hier eine größere Rolle spielt, als die CPU.
Zumindest bisher habe ich keine weiteren Fehler mit deaktiviertem Bluetooth-Gerät gehabt. Ich beobachte weiter und ergänze eventuell, falls sich was ändert. :-)
 
So, neuer Nachtrag...
Vor kurzem nen Absturz gehabt, woraufhin ich zusätzlich noch PCIe 4.0 deaktiviert habe. Mit dieser Änderung waren aber meine Spiele unspielbar (zumindest die, welche auf der zweiten 4.0 SSD lagen).

Daraufhin noch etliches probiert, etc. Jetzt lief er knapp ne gute Woche woraufhin er sich gestern mitten in einer Runde CoD verabschiedete (ich war Tabellenführer! >.<). Noch einige OC/UC Versuche unternommen, welche alle die Problematik schlimmer machten. Ich kann nichtmal den Ram mit aktivertem XMP auf 3200 MHz runtertakten, dann bekomme ich (wenn er überhaupt hochfährt und mir nicht das BIOS resettet) nach ein paar Minuten sofort wieder nen WHEA 18 Absturz.

Lange Rede, kurzer Sinn...
Ich habe heute RMA bei MF angemeldet und hoffe, dass ich (schnell) an eine Austausch-CPU gelange, da ich für nen 5er das Service Level Gold dazugenommen hatte bei Bestellung.

Ich berichte weiter, sobald es da Neuigkeiten gibt.
 
Neuer 5900X ist eingebaut, diesmal aus der KW 19 - 2021.
Bios ist soweit @ Stock, außer dass ich XMP aktiviert habe und die Pumpe im Silent-Mode habe. Jetzt installieren gerade Updates und dann gehts für ein paar Tage in unterschiedliche Stresstests. Ich hoffe ich kann nächste Woche den Pc wieder in den Normalbetrieb nehmen. :(
 
Wäre nett wenn du deine ergebnisse weiter mit uns teilst. Ich hab seit letzter woche einen neuen rechner zusammen gebaut mit dem ryzen 5950, einem dark hero board und 32gb trident neo z. Egal mit welchen einstellungen und bios versionen, egal welchem speicherriegel, ich bekomm die kiste nicht stabil.
 
Ich kann mich cloudconnected nur anschließen. Ich hatte vor ca. zwei Monaten das gleiche Problem wie DevilTwist.

Mein System

- AMD Ryzen 7 5800X, 8C/16T, 3.80-4.70GHz
- be quiet! Dark Rock Pro 4 Tower-Kühler, CPULüfter
- Gigabyte Aorus NVMe Gen4 SSD
- DDR4RAM 2x 16GB DDR4-3600 G.Skill Trident Z Neo DIMM
- ASUS TUF Gaming X570-Plus [WI-FI]
- 850W be quiet! Straight Power 11 Platinum
- Gigabyte GeForce RTX 2080 Gaming OC
- Win10Pro

lief ca. ein Jahr fehlerfrei. Plötzlich kam es zu spontanen Neustarts. Egal ob im Idle oder beim Spielen. Später zu verschiedenen BSOD's. Einige wichtige Windows Updates konnten nicht mehr abgeschlossen werden (und ja, meine Lizenz ist einwandfrei). Ich habe das System mehrmals formatiert und Windows neu installiert. Diverse BIOS Einstellungen probiert bzw ein BIOS-Update durchgeführt. Grafikkarte und Festplatte wurden zwecks Ausschlussverfahren von mir getauscht.
Alles OHNE ERFOLG.

Also ging der PC zum Fachhändler. Dieser führte diverse Tests durch (darunter auch RAM- und CPU Tausch und folgte schlussendlich meiner Einschätzung, dass es sich um ein CPU Problem handelte. CPU wurde reklamiert und nach dem Einbau der neuen läuft alles einwandfrei und stabil.

Keine Ahnung was AMD da fabriziert hat, aber ne defekte CPU nach etwas über einem Jahr finde ich schon sehr enttäuschend.
Hoffe ich konnte dem einen oder anderen mit diesem Beitrag helfen Zeit und Nerven zu sparen.
RMA und gut ist!
 
Zurück