BSOD bei Stresstests (neues Sys mit 4770k)

Tscherny

Kabelverknoter(in)
Hi allerseits

Ich hoffe die Länge des Beitrags schreckt nicht gleich zu Beginn mögliche Helfer ab :D Ich habe versucht so viele Informationen wie möglich gleich zu Beginn mitzuliefern.

Mein neuer Computer macht leider etwas Probleme...

Erstmal zur Konfiguration:

Intel Core i7 4770K BOX, 3.5GHz, LGA 1150, 4C/8T, unlocked
Asus Z87 Plus, LGA1150, SLI/CFX (90MB0E00-M0EAY5)
Inno3D GeForce GTX 780 iChill HerculeZ X3 Ultra - 3GB
2x Kingston HyperX, 2x8GB, DDR3-1600, CL9-9-9 @1.5V (KHX16C9P1K2/16)
Samsung SSD 840 Pro
Seagate Desktop 3TB, 7200rpm, 64MB, 3TB, SATA-3
be quiet! DARK POWER PRO P10 650W, 80plus Gold
be quiet! Dark Rock Pro 2

Die Vorgeschichte:
Nach erfolgreichem Zusammenbau und Installation habe ich aus Neugier versucht die CPU leicht zu Übertakten - ohne Erfolg. Die Details zu meinem Versuch und die damaligen Lösungsvorschläge kopier ich gleich mal aus diesem Thread hier rein (Wichtiges fett).

Ich habe bereits einiges an Settings ausprobiert und fahre im Moment anscheinend mit alles auf Auto ausser VCore und Multi am Besten/Stabilsten. Die RAM Timings sind soweit ich das sehe richtig erkannt worden.

VCore auf 1.15V und Multi auf 42 gab mir nach ca. 4.5h prime95 mit in-place large FFTs (max Temperaturen von 72, 73, 70 und 65; laut CoreTemp log) einen Bluescreen.
Nächster Versuch mit VCore auf 1.175V und Multi auf 41 gab mir ebenfalls nach ca. 4.5h prime95 einen Bluescreen (max Temperaturen von 74, 74, 71, 65).


Habe ich einfach eine eher OCuntaugliche CPU erwischt oder was mache ich falsch?

Liebe Grüsse
Tscherny

Hi, lade dir mal AIDA64 herunter, mach den Stability Test und entferne alle Häkchen außer bei "Stress Cache".
Du kannst dafür auch die Vcore höher stellen(1.250 oder so) , um das auszuschließen. Die Kerne werden bei dem Test nicht besonders heiß. Falls das nicht stabil läuft, musst du mal mit der Cache Voltage rumspielen.

Vielen Dank, Art! Das scheint ein guter Ansatz zu sein.

Ich habs gerade ausprobiert und tatsächlich gabs nach knapp 20min einen BSOD. Ich erhöhe VRing nun probeweise mal auf 1.125V während ich VCore auf 1.175V und den Multi auf 41 lasse.

Selbes Resultat bei 1.125V VRing, diesmal aber sogar noch schneller (ca. 15min)...

Viel höher sollte ich mit dem VRing laut Tabelle für den Dauerbetrieb ja nicht gehen. Was meint ihr?

Edit

Fun Fact: Beim Cache Stress Test krieg ich sogar mit den Default Einstellungen einen Bluescreen...

Einfach Pech oder CPU defekt?

Das sollte eigentlich nicht passieren. Lade mal Optimized Defaults, bzw. mach ein CMOS Reset. Falls es dann nicht läuft, ist irgendwas defekt.

Erneut Danke, Art!

Ich habs ausprobiert und nach 5h wieder einen Blueescren. Die Maximaltemperaturen aller Cores blieben unter 60°.

Zur exakten Problemfindung macht es wohl mehr Sinn einen eigenen Thread im Praxisprobleme Unterforum aufzumachen...

Und hier wäre ich nun also...

Ich habe mittlerweile die Stresstests nochmals wiederholt um sicherzugehen, dass der Fehler auch jedes Mal auftritt. Resultat:

Aida64 Cache Stress Test führte nach rund 1.5 Studen (Max Coretemps 54, 56, 55, 52) zu einem Bluescreen.

Problemdetails schrieb:
Problemsignatur:
Problemereignisname: BlueScreen
Betriebsystemversion: 6.1.7601.2.1.0.256.48
Gebietsschema-ID: 2055

Zusatzinformationen zum Problem:
BCCode: 124
BCP1: 0000000000000000
BCP2: FFFFFA8019AE4028
BCP3: 00000000BE000000
BCP4: 000000000100110A
OS Version: 6_1_7601
Service Pack: 1_0
Product: 256_1

Dateien, die bei der Beschreibung des Problems hilfreich sind:
C:\Windows\Minidump\091213-9141-01.dmp[...]

Prime95 (large FFTs) führte nach 16 Stunden (Max Coretemps 65, 67, 64,62) zu einem Bluescreen.

Problemdetails schrieb:
Problemsignatur:
Problemereignisname: BlueScreen
Betriebsystemversion: 6.1.7601.2.1.0.256.48
Gebietsschema-ID: 2055

Zusatzinformationen zum Problem:
BCCode: 124
BCP1: 0000000000000000
BCP2: FFFFFA8019B06028
BCP3: 00000000BE000000
BCP4: 000000000100110A
OS Version: 6_1_7601
Service Pack: 1_0
Product: 256_1

Dateien, die bei der Beschreibung des Problems hilfreich sind:
C:\Windows\Minidump\091413-8736-01.dmp[...]

Man beachte den (fett markierten) Unterschied bei den beiden Problembeschreibungen. Falls die .dmp Dateien helfen kann ich die gerne hochladen.

Wie man vielleicht merkt, bin ich mit meinem Latein so ziemlich am Ende... :) Was soll ich noch testen und was für ein weiteres Vorgehen schlagt ihr vor?

Anmerken möchte ich noch, dass der Rechner im Alltagsbetrieb (inkl. BF3) problemlos läuft.

Vielen Dank fürs Durchlesen und die Hilfe!

Tscherny
 
Ich würde mal das Augenmerk auf den RAM legen. Kannst du mal anderen, bzw jedes Modul mal einzeln testen? oder sogar MEMTEST rennen lassen?
 
Vielen Dank für Deine schnelle Antwort, the.hai :)

Klar, Memtest kann ich laufen lassen. Ich nehme an, dass ich bei einem ersten Test noch alle 4 Riegel drin lassen sollte?
 
Ach das sind sogar 4 Riegel:wow: ich hatte nur 2 gelesen^^ vlt hat dein board auch nen Problem mit der vollbestückung und du musst die controllerspannung anheben.

das musste ich bei meinen 8x4gb auch machen.

Zum testen aber dann lieber jeden Ram einzeln testen mit memtest. bzw einfach mal deine bisherigen tests mit nur einem/zwei rams machen. vlt isses ja "nur" die vollbestückung.
 
Hehe, ja sind 4x8Gb.

Bezüglich Memtest: Welche Version hast Du da genau gemeint? Das MemTest von HCI Design oder MemTest86?

Von kurz nach 12 Uhr bis eben habe ich MemTest von HCI Design (hab erst nachher gemerkt, dass es da verschieden gibt) laufen lassen. Da die Meldung kam, dass ein Programm nicht mehr als soundsoviel RAM beanspruchen kann, habe ich mehrere (13) Instanzen à 2Gb rennen lassen. Fehler wurden keine gefunden.

Ich werde jetzt zwei Blöcke entfernen und nochmal den Cache Stress von AIDA laufen lassen. Bin ja gespannt :)
 
Du bist ja echt schnell - super! :)

Wieder was gelernt :D

Hab grad mal in den Rechner geschaut:
Wenns noch andere Möglichkeiten gibt, würde ich vorerst gerne alle Blöcke drin lassen. Denn um die RAMs zu entfernen muss ich den CPU Kühler ausbauen und um diesen ausbauen zu können muss ich das MB ausbauen und um dieses... Wäre also eine ziemlich grosse Operation.

Was hältst Du von folgendem Vorgehen:
MemTest86 (4.3.3 oder 5.0 Beta?) laufen lassen mit allen RAM Riegeln
Falls kein Fehler -> Folgerung?
Falls Fehler -> Controllerspannung anheben (wie das geht müsst ich dann noch fragen) und nochmals laufen lassen

Wenns dann keinen Fehler mehr geben sollte, dann nochmals den AIDA Cache Stress laufen lassen und schauen was passiert.
 
Ich hab jetzt mal MemTest86 5.0 versucht laufen zu lassen übers UEFI. Dabei kommt jedoch immer folgende Meldung:

"The System found unauthorized changes on the firmware, operatiung system or UEFI drivers.

Press [N] to run next [...]"

Habe dann mal die neuste BIOS Version (1405) draufgeladen, das Problem besteht aber weiterhin.
 
Vielen Dank euch beiden!

Den Memorystick hatte ich mit dem "Image for creating boot-able USB Drive" von PassMark MemTest86 - Memory Diagnostic Tool erstellt.
Ich habe nun die .iso von MemTest86+ auf eine CD gebrannt und das läuft. Fehler gabs im ersten Pass keine: IMAG0272.jpg

Kann ich MemTest nun stoppen oder soll ichs (wie im Guide angetönt) noch einige Stunden laufen lassen? Die Minidumps lade ich dann nachher gleich hoch.
 
Ok, vielen Dank!

Nach gut 16h immer noch kein Fehler: IMAG0273.jpg

Defekt scheint der RAM also nicht zu sein, korrekt?

Wie ists zu deuten, dass gewisse Angaben (MHz, DDR3-0 etc.) nicht erkannt wurden?

Die Minidumps findet ihr [hier]https://www.dropbox.com/sh/oqy3lladxqxf47f/b27ET5_cJd[/url]. Sofern das mit der Freigabe denn geklappt hat...

Nochmals die Problemdetails zur Übersicht

AIDA Cache Stress
Problemsignatur:
Problemereignisname: BlueScreen
Betriebsystemversion: 6.1.7601.2.1.0.256.48
Gebietsschema-ID: 2055

Zusatzinformationen zum Problem:
BCCode: 124
BCP1: 0000000000000000
BCP2: FFFFFA8019AE4028
BCP3: 00000000BE000000
BCP4: 000000000100110A
OS Version: 6_1_7601
Service Pack: 1_0
Product: 256_1

Dateien, die bei der Beschreibung des Problems hilfreich sind:
C:\Windows\Minidump\091213-9141-01.dmp

-------------------------------------------------------------

Problemsignatur:
Problemereignisname: BlueScreen
Betriebsystemversion: 6.1.7601.2.1.0.256.48
Gebietsschema-ID: 2055

Zusatzinformationen zum Problem:
BCCode: 124
BCP1: 0000000000000000
BCP2: FFFFFA8019AC1028
BCP3: 00000000BE000000
BCP4: 000000000100110A
OS Version: 6_1_7601
Service Pack: 1_0
Product: 256_1

Dateien, die bei der Beschreibung des Problems hilfreich sind:
C:\Windows\Minidump\091513-8158-01.dmp

Interessanterweise gabs hier auch zwei mal nicht genau den selben Fehlercode...


prime95
Problemsignatur:
Problemereignisname: BlueScreen
Betriebsystemversion: 6.1.7601.2.1.0.256.48
Gebietsschema-ID: 2055

Zusatzinformationen zum Problem:
BCCode: 124
BCP1: 0000000000000000
BCP2: FFFFFA8019B06028
BCP3: 00000000BE000000
BCP4: 000000000100110A
OS Version: 6_1_7601
Service Pack: 1_0
Product: 256_1

Dateien, die bei der Beschreibung des Problems hilfreich sind:
C:\Windows\Minidump\091413-8736-01.dmp
 
Zuletzt bearbeitet:
Was mir Spontan einfallen würde wäre die Frage nach den Bios einstellungen....
Hast du einfach auf Auto alles laden lassen oder sind Teiler Timings Frequenzen ect.
von Hand eingestellt ?
 
Defekt scheint der RAM also nicht zu sein, korrekt?

Wie ists zu deuten, dass gewisse Angaben (MHz, DDR3-0 etc.) nicht erkannt wurden?

Der RAM scheint nicht defekt zu sein. Leider gibt es aber immer wieder Fälle, wo Memtest den Defekt nicht erkennt. Bei 16 Std. Laufzeit sollte die Wahrscheinlichkeit aber gegen Null gehen.

Dass gewisse Angaben nicht erkannt wurden liegt schlicht daran, dass die 4.2 Version deinen Chipsatz und die CPU noch nicht kennt. Hier dürfte allerdings kein Zusammenhang bestehen, dass keine Fehler gefunden werden.
Eine Überprüfung könntest du mit der RC1 Version versuchen. Lade dir allerdings die USB Installer Version runter und lass das Programm selbst den USB Stick bootfähig einrichten: NEW !! Memtest86+ 5.00 RC1 available ! Need betatesters !-!

Laut den Dumps tritt das Problem aufgrund eines CPU-Cache Fehlers auf. Hierfür kämen erst mal mehrere mögliche Ursachen in Betracht:
- CPU / System ist übertaktet
- Bios Fehler
- RAM Einstellungen fehlerhaft
- Memory Controller (CPU) Probleme mit Vollbestückung (vier RAM Riegel)
- Temperaturproblem

Sofern das System übertaktet ist, wäre erst mal das Einfachste die Übertaktung heraus zu nehmen. Aber aufgrund der anderen Threads, gehe ich mal davon aus, dass kein OC vorliegt (und die Setup Defaults geladen wurden).

Bezüglich des Bios Fehlers, hast du ja bereits das aktuellste Bios geflasht (stimmts?). Sowohl mit der ursprünglichen als auch mit der aktuellen Bios Version treten die Probleme auf.

RAM Einstellungen...poste hierzu bitte ein paar Screenshots von CPU-Z (Reiter Mainboard, CPU, Memory und SPD).

Ob es am Memory Controller liegen könnte, wäre am sichersten herauszufinden, in dem die Vollbestückung aufgelöst wird (nur ein bzw. zwei RAM Riegel einbauen). Da dies aber aufgrund des CPU Kühlers einen rießigen Aufwand darstellt, lassen wird das zunächst mal hinten anstehen.

Eine weitere Ursache für die Stop 0x124 Fehler kann auch ein defektes Motherboard oder Grafikkarte darstellen.
Die Grafikkarte wäre schnell überprüft, in dem du diese ausbaust und das Sytem über die CPU Grafik laufen lassen würdest.
Die Wahrscheinlichkeit, dass es an der Grafikkarte liegt, ist zwar eher gering, da diese in Prime-Stresstest außen vorbleibt, einen Gegentest würde ich dennoch machen.

Die Temperatur der CPU hast du ja bereits mehrfach überprüft (unter Last).
 
Vielen Dank JackOnell und insbesondere simpel1970 für die detailierte Antwort!

Der RAM scheint nicht defekt zu sein. Leider gibt es aber immer wieder Fälle, wo Memtest den Defekt nicht erkennt. Bei 16 Std. Laufzeit sollte die Wahrscheinlichkeit aber gegen Null gehen.
Das freut mich schon mal zu hören.

Dass gewisse Angaben nicht erkannt wurden liegt schlicht daran, dass die 4.2 Version deinen Chipsatz und die CPU noch nicht kennt. Hier dürfte allerdings kein Zusammenhang bestehen, dass keine Fehler gefunden werden.
Eine Überprüfung könntest du mit der RC1 Version versuchen. Lade dir allerdings die USB Installer Version runter und lass das Programm selbst den USB Stick bootfähig einrichten: NEW !! Memtest86+ 5.00 RC1 available ! Need betatesters !-!
Werd ich runterladen und über Nacht laufen lassen - soferns jetzt mit dem USB Stick klappt... Die anderen Sticks habe ich jeweils auch direkt von den Programmen einrichten lassen.

Laut den Dumps tritt das Problem aufgrund eines CPU-Cache Fehlers auf. Hierfür kämen erst mal mehrere mögliche Ursachen in Betracht:
- CPU / System ist übertaktet
- Bios Fehler
- RAM Einstellungen fehlerhaft
- Memory Controller (CPU) Probleme mit Vollbestückung (vier RAM Riegel)
- Temperaturproblem

Sofern das System übertaktet ist, wäre erst mal das Einfachste die Übertaktung heraus zu nehmen. Aber aufgrund der anderen Threads, gehe ich mal davon aus, dass kein OC vorliegt (und die Setup Defaults geladen wurden).

Bezüglich des Bios Fehlers, hast du ja bereits das aktuellste Bios geflasht (stimmts?). Sowohl mit der ursprünglichen als auch mit der aktuellen Bios Version treten die Probleme auf.
Korrekt, das System ist nicht übertaktet und das neuste Bios habe ich ebenfalls geflasht.

Was mir Spontan einfallen würde wäre die Frage nach den Bios einstellungen....
Hast du einfach auf Auto alles laden lassen oder sind Teiler Timings Frequenzen ect.
von Hand eingestellt ?
Das Bios habe ich mittels CMOS Reset in den Ursprungszustand versetzt (dies geschah aber noch vor dem Flashen der neuen Bios Version). Seither habe ich - abgesehen von den minimalen CPU RPM bevors den CPU Fan Error gibt - nichts verändert. Es sollte also alles auf Auto sein.

RAM Einstellungen...poste hierzu bitte ein paar Screenshots von CPU-Z (Reiter Mainboard, CPU, Memory und SPD).
Gerne:
CPU-Z.JPG

Ob es am Memory Controller liegen könnte, wäre am sichersten herauszufinden, in dem die Vollbestückung aufgelöst wird (nur ein bzw. zwei RAM Riegel einbauen). Da dies aber aufgrund des CPU Kühlers einen rießigen Aufwand darstellt, lassen wird das zunächst mal hinten anstehen.
Die Befestigung des Kühlers ist leider tatsächlich ziemlich suboptimal gelöst...

Eine weitere Ursache für die Stop 0x124 Fehler kann auch ein defektes Motherboard oder Grafikkarte darstellen.
Die Grafikkarte wäre schnell überprüft, in dem du diese ausbaust und das Sytem über die CPU Grafik laufen lassen würdest.
Die Wahrscheinlichkeit, dass es an der Grafikkarte liegt, ist zwar eher gering, da diese in Prime-Stresstest außen vorbleibt, einen Gegentest würde ich dennoch machen.
Werd ich versuchen. Gengügt das Ausbauen der GPU oder muss ich auch noch Treiber deinstallieren etc?

Die Temperatur der CPU hast du ja bereits mehrfach überprüft (unter Last).
Genau, die schien mir nie ein Problem gewesen zu sein. Ich hab jeweils Core Temp einen Temperaturlog erstellen lassen und auch direkt vor dem Bluescreen waren sie nicht besonders hoch.

[...] vlt hat dein board auch nen Problem mit der vollbestückung und du musst die controllerspannung anheben.
das musste ich bei meinen 8x4gb auch machen.
[...]
Was ist mit dem Vorschlag von the.hai? Das hört sich für mich an, als obs einen Versuch wert wäre. Leider weiss ich aber nicht, welchen Wert ich dabei im Bios verändern und wieviel Volt ich einstellen muss.
 
Ok wenn das Board auf Auto steht würde ich erstmal alles von Hand fixen.
Dazu gehören zb Spannungen der CPU und Ram dann müsstest du die Teiler und Frequenzen fest einstellen.
Es liegt im Bereich des möglichen das dein Bord Probleme hat die Hw richtig zu erkennen und setzt manches falsch.
Allerdings kenne ich micht nicht wirklich mit Haswell bzw dem neuen Bios aus um dir genau zu sagen was du einstellen
musst. Hier müsste ich mich selbst erst per google schlau machen.
Aber mit sicherheit findet sich hier eiener mit dem du durch das Bios gehen kannst
MFG
 
Danke, JackOnell.
Falls mir hier also jemand weiterhelfen könnte wäre das super :)

Den MemTest86+ 5.0 RC1 USB Stick habe ich mittels des verlinken Tools erstellt, jedoch erscheint lediglich kurz die Meldung "Missing Operating System" und dann startet Windows...
 
Den MemTest86+ 5.0 RC1 USB Stick habe ich mittels des verlinken Tools erstellt, jedoch erscheint lediglich kurz die Meldung "Missing Operating System" und dann startet Windows...

Dies liegt vermutlich daran, dass im Bios "Secure Boot" aktiviert ist. In diesem Fall erlaubt das Board nur das Booten auf vorher signierten Bootloadern. Im Bios Menü "Boot" kannst du das unter der Einstellung "Secure Boot" ändern. Eingestellt ist hier sicherlich "Windows UEFI Mode". Wenn ja, ändere das auf "Other OS" und die Memtest Prüfung sollte dann funktionieren.
Nach Abschluss der Prüfung kannst du das wieder auf die vorherige Einstellung umstellen.

Bezüglich der RAM Einstellungen kannst du -nach fehlerloser Memtest 5 Prüfung- kannst du im Bios folgende Werte manuell einstellen:

Im AI Tweaker Menü...
- RAM Frequenz auf 1333mhz
--> Menüpunkt: "Memory Frequency"). Je nach Bios kann hier entweder die effektive RAM Frequenz (wären 1333mhz) oder der I/O Takt der RAM (wären 666mhz) eingestellt werden.
- RAM Timings fest auf 9-9-9-27
--> Menüpunkt: "DRAM Timing Control"
"DRAM CAS" [9]
"DRAM RAS to CAS" [9]
"DRAM RAS PRE TIME" [9]
"DRAM RAS ACT TIME" [27]
"DRAM Command Mode" [2]

RAM Spannung auf 1,50V einstellen ("DRAM Voltage").

Änderungen abspeichern (F10) und nach einem Neustart aktuelle Screenshots von CPU-Z posten (Reiter Memory).
 
Zuletzt bearbeitet:
Zurück