Asus Z690-i Chipsatz Probleme

kaisper

Software-Overclocker(in)
Moin zusammen,

habe seit einigen Wochen ein Alder Lake im Einsatz und bin grundsätzlich auch ganz happy damit. So ganz rund läuft die Kiste allerdings noch nicht. Vorab die Konfiguration:
- 12700K Stock
- Asus Z690-i Strix Bios 1003
- Gskill Trident z 5 2x16GB 6000 CL36
- Corsair MP600 Pro
- Samsung 970 evo
- OCZ Vertex 2 (nicht lachen!)
- 3080 FE Undervolted
- Win11 Pro

Die Fehler äußern sich wie folgt:
- Gelegentlich BlueScreens mit Verweis auf WHEA Fehler
- HWInfo meldet PCIe Bus Fehler
- eine angeschlossene Sata SSD verschwindet gerne mal
- Die NVME am Chipsatz war auch schon mal weg, ist aber eher die Ausnahme
- In der Ereignisanzeige sind vielfach folgender Eintrag zu finden :
Protokollname: System
Quelle: Microsoft-Windows-WHEA-Logger
Datum: 27.02.2022 19:18:50
Ereignis-ID: 17
Aufgabenkategorie:Keine
Ebene: Warnung
Schlüsselwörter:
Benutzer: Lokaler Dienst
Computer: XXXX
Beschreibung:
Es ist ein korrigierter Hardwarefehler aufgetreten.

Komponente: PCI Express Root Port
Fehlerquelle: Advanced Error Reporting (PCI Express)

Primär Bus:Gerät:Funktion: 0x0:0x6:0x0
Sekundär Bus:Gerät:Funktion: 0x0:0x0:0x0
Primärer Gerätename: PCI\VEN_8086&DEV_464D&SUBSYS_86941043&REV_02
Sekundärer Gerätename:
Ereignis-XML:
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
<System>
<Provider Name="Microsoft-Windows-WHEA-Logger" Guid="{c26c4f3c-3f66-4e99-8f8a-39405cfed220}" />
<EventID>17</EventID>
<Version>1</Version>
<Level>3</Level>
<Task>0</Task>
<Opcode>0</Opcode>
<Keywords>0x8000000000000000</Keywords>
<TimeCreated SystemTime="2022-02-27T18:18:50.0596291Z" />
<EventRecordID>1120629</EventRecordID>
<Correlation ActivityID="{e1be8fa7-d524-45fd-98e8-1ed46715ffee}" />
<Execution ProcessID="4580" ThreadID="2804" />
<Channel>System</Channel>
<Computer>Renes-PC</Computer>
<Security UserID="S-1-5-19" />
</System>
<EventData>
<Data Name="ErrorSource">4</Data>
<Data Name="FRUId">{00000000-0000-0000-0000-000000000000}</Data>
<Data Name="FRUText">
</Data>
<Data Name="ValidBits">0xdf</Data>
<Data Name="PortType">4</Data>
<Data Name="Version">0x101</Data>
<Data Name="Command">0x10</Data>
<Data Name="Status">0x406</Data>
<Data Name="Bus">0x0</Data>
<Data Name="Device">0x6</Data>
<Data Name="Function">0x0</Data>
<Data Name="Segment">0x0</Data>
<Data Name="SecondaryBus">0x0</Data>
<Data Name="SecondaryDevice">0x0</Data>
<Data Name="SecondaryFunction">0x0</Data>
<Data Name="VendorID">0x8086</Data>
<Data Name="DeviceID">0x464d</Data>
<Data Name="ClassCode">0x30400</Data>
<Data Name="DeviceSerialNumber">0x0</Data>
<Data Name="BridgeControl">0x0</Data>
<Data Name="BridgeStatus">0x0</Data>
<Data Name="UncorrectableErrorStatus">0x0</Data>
<Data Name="CorrectableErrorStatus">0x1000</Data>
<Data Name="HeaderLog">00000000000000000000000000000000</Data>
<Data Name="PrimaryDeviceName">PCI\VEN_8086&amp;DEV_464D&amp;SUBSYS_86941043&amp;REV_02</Data>
<Data Name="SecondaryDeviceName">
</Data>
</EventData>
</Event>

Soweit ich das im Internet identifizieren konnte, ist hier ein Intel Gerät gemeint --> Chipsatz ? Bevor ihr fragt, die Vertex und die Samsung habe ich noch nicht ausgebaut. Frage erstmal ob jemand das weiter identifizieren kann oder den Fehler sogar schon eingrenzen kann.

VG und Danke im Vorraus
 
Hi zusammen,

die Vertex 2 ist abgeklemmt. UEFI ist mit 1003 auf dem neusten Stand. Trotzdem besteht der Fehler. Hier sind die gewünschten Daten der anderen Festplatten:
MP600Pro.jpg

970evo.png


In beiden Fällen macht mir die geringe Leserate in HDTune etwas Sorge. Direkt nach Anfertigen der Screens begrüßte mich auch wieder ein blues Bild.
ChrystalDiskMark liefert nach dem BSOD halbwegs normale Lese- und Schreibraten:
MP600Pro_CDmark.jpg

970Evo_CDmark.jpg


Im nächsten Zug fliegt die Evo trotzdem erstmal raus. Ist nur nervig bei der Sandwich-Bauweise des Mainboards.
Im Netz konnte ich einen nahezu identisch beschriebenen Fehler finden, auch mit einem Verweis auf eine Lösung:
win11forum

Allerdings ist die Lösung in ihrer Idee unkommentiert.
 
Zuletzt bearbeitet:
idR läuft der Rechner nach dem ersten BSOD ohne Absturz weiter durch und produziert dann auch weniger WHEA-Fehler. Ein Zweiter Durchlauf zeigt jetzt auch einen deutlich besseren Verlauf.
MP600Pro_zweiterLauf.jpg


Chipsatz-Treiber ist selbstverständlich akutell. Alles andere auch. Firmware-Update gibt es für die NVME nicht und falsch Einbauen ist auf den Daughterboards nicht wirklich möglich, da diese sonst nicht korrekt stapelbar wären. Und ja das Ding ist arschteuer aber die Auswahl im itx-Bereich ist begrenzt.
 
Laß mal die SSD optimieren:
Rechtsklick auf die Partition im Explorer - Eigenschaften - Tools - Optimieren.

Man könnte eventuell die RAM-Frequenz noch mal ein bißchen niedriger stellen.
 
Das stinkt eher nach Ram. Lass den bitte mal stock, also maximal mit 4800MHz, laufen. Dazu einfach normal das XMP Profil laden und den Takt händisch runterstellen.
 
Folgende weitere Erkenntnisse:
1. 970Evo raus --> Fehler bleibt bestehen
2. MP600 Pro in den 2. Slot --> wird vom Mainboard nicht erkannt
3. Selftest der NVMEs per Mainboard --> Haben beide bestanden
4. Windows gebootet (vorerst keine Fehler) dann nochmal HDTune Benchmark gestartet auf der MP600 --> Generiert wieder WHEA Fehler, verlauf identisch zum zweiten hier hochgeladenen Verlauf

Nächste Schritte:
1. RAM Takt runtersetzen, wobei das meine Meinung nach nicht zum Fehlerbild passt.
2. Fehlerbild hier mal im Corsair-Bereich darstellen
 
1. RAM Takt runtersetzen, wobei das meine Meinung nach nicht zum Fehlerbild passt.
Fehler durch Ram sind extrem vielfältig weil bei Instabilität die Datenintegrität nicht gewahrt werden kann.
Sobald der Ram Takt runtergestellt wurde unbedingt CMD als Admin starten und einmal sfc /scannow ausführen. Damit wird Windows auf Fehler überprüft.
 
Im Asus Forum bin ich auf einen ebenfalls nahezu identischen Fehler gestolpert. Asus Forum WHEA 17. Dort wird von ASUS empfohlen das PCIE Native Power Management zu deaktiveren. Bei MSI ist dieses wohl per default deaktiviert. Ich habe das jetzt ebenfalls deaktiviert und die Fehler scheinen verschwunden zu sein. Grob verstanden ist das wohl eine Art Energiesparfunktion. @blautemple Kannst du mal mitteilen, welches Mainboard du hast und wie diese Einstellung bei dir ist ?
 
Zuletzt bearbeitet:
@blautemple Kannst du mal mitteilen, welches Mainboard du hast und wie diese Einstellung bei dir ist ?
Aktuell habe ich ein MSI Z690 Tomahawk weil das Apex in RMA ist...

Ich kann heute Abend aber mal gucken wie da die Einstellung gesetzt ist, aber da ich da händisch nichts geändert habe gehe ich mal davon aus das es aktiv ist.
 
Zurück