WHEA_UNCORRECTABLE_ERROR & hal.dll Bluescreen

atcon

Komplett-PC-Käufer(in)
Nachdem ich das letzte Problem mit dem Ruhemodus dank euch erfolgreich lösen konnte, habe ich nun die nächste Baustelle. Seit einiger Zeit stürzt der Computer unregelmäßig ab. Fehlercode: whea_uncorrectable_error
Nach einigen Foren-und Websiterecherchen, habe ich folgendes schon gemacht.
1. Clean Install
2. BIOS Update
3. BIOS zurückgesetzt ( was ich änderte war das XMP-Profil)
4. chkdsk Festplatte überprüft
5. Chipsatz Treiber von Intel, sowie SSD Treiber manuell installiert

Meine Hardware ist folgende:
Intel i7 6700k
Asus Maximus Gene VIII
Corsair Vengeance DDR4 3000
AMD Radeon RX580
Bequiet PurePower 9 500w
Samsung NVME SSD 960 EVO
nichts wurde übertaktet etc.

Die Dumpfiles findet ihr im Anhang: Damit kann ich leider nicht viel anfangen

Ich hoffe ihr könnt mir helfen, so langsam ist meine Geduld am Ende :D
 

Anhänge

  • Dumpfiles.zip
    938,3 KB · Aufrufe: 24
Das einzige was uncorrectable error auslösen kann ist ein defekter oder inkompatibler treiber.
Da du bereits neu installiert hast, schließ ich mal defekt aus, blieb nur inkompatibel. Hast du Treiber manuell installiert, also z.B. ohne Installer vom Hersteller direkt über die .inf Datei? Unwahrscheinlich, aber ich frag lieber.

Wenn die Antwort auch hier nein ist, dann hast du einen Hardware defekt.

Bug Check 0x124 WHEA_UNCORRECTABLE_ERROR - Windows drivers | Microsoft Docs

Da kannst nachlesen was die Bug-Check Codes in der Ereignisanzeige aussagen und auf welche Komponente sich rückschließen lässt. (Sry, dein Minidump hab ich mir jetzt nicht angeschaut.)

Hal.dll ist das Hardware Abstraction Layer, also sozusagen der Kernel von Windows der mit der Hardware spricht. Der ist Zuständig für so ziemlich alles vom PCI Bus bis zu I/O Ports.
Da kommst mit dem Bugcheck Code sicher weiter.
Mal abgesehen von der Verhärtung der Schlussfolgerung: "Hardwarefehler."
 
Der Bugcheck 0x124 ist eigentlich immer entweder ein Problem mit dem Prozessortakt (overclocking/undervolting) oder ein Problem mit dem Arbeitsspeicher.

Nachfolgend einer deiner Bugchecks, im CPER Section2 wird ein Fehler in der 1.Bank des Cachespeichers des 2.Prozessorkerns ausgewiesen.


Microsoft (R) Windows Debugger Version 6.12.0002.633 AMD64
Copyright (c) Microsoft Corporation. All rights reserved.


Loading Dump File [E:\HELP\atcon\102219-5265-01.dmp]
Mini Kernel Dump File: Only registers and stack trace are available

Symbol search path is: SRV*C:\Symbols*
Executable search path is:
Windows 7 Kernel Version 18362 MP (8 procs) Free x64
Product: WinNt, suite: TerminalServer SingleUserTS
Built by: 18362.1.amd64fre.19h1_release.190318-1202
Machine Name:
Kernel base = 0xfffff806`08400000 PsLoadedModuleList = 0xfffff806`08848210
Debug session time: Tue Oct 22 13:31:39.456 2019 (UTC + 2:00)
System Uptime: 0 days 0:03:30.165
Loading Kernel Symbols
...............................................................
................................................................
.............................................................
Loading User Symbols
Loading unloaded module list
.......
*******************************************************************************
* *
* Bugcheck Analysis *
* *
*******************************************************************************

Use !analyze -v to get detailed debugging information.

BugCheck 124, {0, ffff8987a9acc028, f61ae780, 40150}

Probably caused by : hardware

Followup: MachineOwner
---------

1: kd> !analyze -v
*******************************************************************************
* *
* Bugcheck Analysis *
* *
*******************************************************************************

WHEA_UNCORRECTABLE_ERROR (124)
A fatal hardware error has occurred. Parameter 1 identifies the type of error
source that reported the error. Parameter 2 holds the address of the
WHEA_ERROR_RECORD structure that describes the error conditon.
Arguments:
Arg1: 0000000000000000, Machine Check Exception
Arg2: ffff8987a9acc028, Address of the WHEA_ERROR_RECORD structure.
Arg3: 00000000f61ae780, High order 32-bits of the MCi_STATUS value.
Arg4: 0000000000040150, Low order 32-bits of the MCi_STATUS value.

Debugging Details:
------------------


BUGCHECK_STR: 0x124_GenuineIntel

CUSTOMER_CRASH_COUNT: 1

DEFAULT_BUCKET_ID: VISTA_DRIVER_FAULT

PROCESS_NAME: System

CURRENT_IRQL: f

STACK_TEXT:
ffff9c01`dc46cb58 fffff806`08efdfe8 : 00000000`00000124 00000000`00000000 ffff8987`a9acc028 00000000`f61ae780 : nt!KeBugCheckEx
ffff9c01`dc46cb60 fffff806`09b81920 : ffff8987`a47eccf0 00000000`00000000 ffff8987`a9acc028 00000000`00000000 : hal!HalBugCheckSystem+0xd8
ffff9c01`dc46cba0 fffff806`08740852 : ffff8987`a47eccf0 ffff9c01`dc46cc29 00000000`00000000 ffff8987`a9acc028 : PSHED!PshedBugCheckSystem+0x10
ffff9c01`dc46cbd0 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!WheaReportHwError+0x382


STACK_COMMAND: kb

FOLLOWUP_NAME: MachineOwner

MODULE_NAME: hardware

IMAGE_NAME: hardware

DEBUG_FLR_IMAGE_TIMESTAMP: 0

FAILURE_BUCKET_ID: X64_0x124_GenuineIntel_PROCESSOR_CACHE

BUCKET_ID: X64_0x124_GenuineIntel_PROCESSOR_CACHE

Followup: MachineOwner
---------

1: kd> ! errrec ffff8987a9acc028
===============================================================================
Common Platform Error Record @ ffff8987a9acc028
-------------------------------------------------------------------------------
Record Id : 01d588cbc8622a99
Severity : Fatal (1)
Length : 936
Creator : Microsoft
Notify Type : Machine Check Exception
Timestamp : 10/22/2019 11:31:39
Flags : 0x00000000

===============================================================================
Section 0 : Processor Generic
-------------------------------------------------------------------------------
Descriptor @ ffff8987a9acc0a8
Section @ ffff8987a9acc180
Offset : 344
Length : 192
Flags : 0x00000001 Primary
Severity : Fatal

Proc. Type : x86/x64
Instr. Set : x64
Error Type : Cache error
Operation : Instruction Execute
Flags : 0x00
Level : 0
CPU Version : 0x00000000000506e3
Processor ID : 0x0000000000000001

===============================================================================
Section 1 : x86/x64 Processor Specific
-------------------------------------------------------------------------------
Descriptor @ ffff8987a9acc0f0
Section @ ffff8987a9acc240
Offset : 536
Length : 128
Flags : 0x00000000
Severity : Fatal

Local APIC Id : 0x0000000000000001
CPU Id : e3 06 05 00 00 08 10 01 - bf fb fa 7f ff fb eb bf
00 00 00 00 00 00 00 00 - 00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00 - 00 00 00 00 00 00 00 00

Proc. Info 0 @ ffff8987a9acc240

===============================================================================
Section 2 : x86/x64 MCA
-------------------------------------------------------------------------------
Descriptor @ ffff8987a9acc138
Section @ ffff8987a9acc2c0
Offset : 664
Length : 272
Flags : 0x00000000
Severity : Fatal

Error : ICACHEL0_IRD_ERR (Proc 1 Bank 0)
Status : 0xf61ae78000040150
Address : 0x00007ffb199a62d0
Misc. : 0x0000000000000000
 
Zuletzt bearbeitet:
Vielen Dank schon mal für die Antworten!
Was bedeutet das denn nun für mich? Arbeitsspeicher mit Memtest prüfen. Wenn dort alles in Ordnung ist, die CPU tauschen?
 
Wenn der Prozessor tatsächlich auf default Takt/Spannung läuft den RAM mit memtest86+ via boot-CD oder USB Stick mindestens 7 Durchgänge prüfen, werden Fehler angezeigt kann abgebrochen werden, dann die RAM Module einzeln testen, gegebenenfalls dann auch ein als defekt erkanntes Modul in einem anderen Slot prüfen um einen defekten RAM-Slot ausschließen zu können.

Memtest86+ - Advanced Memory Diagnostic Tool
 
Memtest ist durchgelaufen - ohne Fehler oder Errors. Also gehe ich jetzt davon aus, dass der Prozessor getauscht werden müsste?
 
IMHO stimmt mit dem CPU Takt oder der Spannung hier etwas nicht, das kann durchaus vorkommen wenn der betroffene Prozessor neu die Taktraten nur gerade noch einhalten konnte. Versuchsweise könnte der Takt etwas reduziert werden.

Eigentlich sollte die Controllerspannung QPI/VTT oder alternativ die Vcore angepasst werden, das sollten aber nur erfahrene User durchführen.
 
IMHO stimmt mit dem CPU Takt oder der Spannung hier etwas nicht, das kann durchaus vorkommen wenn der betroffene Prozessor neu die Taktraten nur gerade noch einhalten konnte. Versuchsweise könnte der Takt etwas reduziert werden.

Eigentlich sollte die Controllerspannung QPI/VTT oder alternativ die Vcore angepasst werden, das sollten aber nur erfahrene User durchführen.

Evtl. liegts auch an einem alternden Netzteil. Wenn plötzliche Lastwechsel vorkommen dann Produziert die CPU unerklärliche Fehler, je nachdem welche Komponente gerade unterversorgt war.

Vielleicht auch mal einen Auslastungstest machen, Temperaturen beobachten dabei und Spannungen beobachten dabei.

Wenn die CPU bei 100% Auslastung ohne Murren durchläuft, dann liegts wahrscheinlich an einem Lastwechsel Problem. In dem Fall ist entweder das Netzteil schrott oder zu alt, oder man muss mal LLC im Bios anschalten oder einen offset Wert leicht erhöhen. (Max 0.1-0.25). Betonung liegt hier auf ODER, beides zusammen könnte die CPU beschädigen wenn Spannungspitzen entstehen.
 
Zurück