Letzten Donnerstag habe ich neue PC-Komponenten[1] erhalten und auch zusammengebaut. In der folgenden Nacht lies ich dann einen routinemäßigen Speichertest mit memtest86+ 4.20 laufen, welcher zu meiner unangenehmen Überraschung im vierten Test beim sechsten Durchgang einen einzigen Bitfehler anzeigte.
Im Folgenden erwies es sich aber als unglaublich schwer, den Fehler verlässlich zu reproduzieren. Zum Beispiel ergab ein weiterer Testlauf mit 12 Durchgängen keinerlei Fehler. Auch ein Test mit MPrime, der Linux-Version von Prime95, zeigte nichts an. Hierbei wurde das UEFI zwischenzeitlich auf die BETA-Version F6e aus dem Tweaktown-Forum geupdated.
Erst in der Nacht von Sonntag auf Montag ergab ein weiterer Memtest, dieses Mal eingeschränkt auf den vierten Test und ein paar hundert Megabyte um den beim ersten Mal identifizierten Speicherbereich, einen weiteren Fehler. Ein daran angeschlossener längerer Durchlauf, bei dem ich, wenn ich mich richtig erinnere, das XMP-Profil des Speichers aktivierte, ergab ein paar mehr Fehler, bei denen ich mir leider die Details nicht notierte. Nachdem der Rechner dann eine Weile ausgeschaltet war und nach dem Einschalten wieder ein Test gestartet wurde, ergab sich wieder keinerlei Fehler.
Darauf tauschte ich den Speicher dieses Rechners mit dem eines anderen[2] und lies auf beiden Rechnern Speichertests laufen. Dies ergab jedoch auch bei längeren Durchläufen keinerlei Befund auf beiden Rechnern.
Nachdem ich die Speicher dann wieder zurücktauschte, erhielt ich erneut einen Bitfehler beim ersten Rechner. Dieses Mal beim 20. Durchgang, wobei die Durchgänge wieder auf den vierten Test eingeschränkt wurden. Vorher wurde auch noch über einen längeren Zeitraum die Intel-Version des Linpack-Benchmarks, welcher den Unterbau für die grafische Oberfläche LinX unter Windows bietet, fehlerfrei durchlaufen.
Danach aktivierte ich erneut das XMP-Profil im UEFI und startete einen weiteren Speichertest, welcher jetzt beim 45. Durchgang des vierten Testes immer noch fehlerfrei ist.
Das UEFI war, wenn ich das XMP-Profil nicht aktiviert hatte, was die Speicher- und Spannungseinstellungen betrifft, immer auf den "Optimized Defaults".
Ich bin nun etwas verzweifelt und weiß nicht wirklich, wie ich weiter vorgehen soll, da mir auch nicht ganz klar ist, was genau defekt ist. Auch das systematische Ausschließen erscheint mir sehr schwierig, da der Fehler nur so selten und schwierig zur reproduzieren ist und ich somit dann nie wissen kann, ob das Problem isoliert wurde, oder der Fehler sich nur einmal mehr nicht gezeigt hat.
Das einzig erkennbare Muster ist, dass, wenn ein Fehler angezeigt wird, immer das gleiche Bit kippt. Die betroffenen Adressen sind leicht verschieden, was mit dem Interleaving zusammenhängen mag. Auch das Testmuster ist nicht immer identisch, wobei das betroffene Bit natürlich immer den gleichen Zustand vor und nach dem Kippen hat.
Ich habe mehr Tests gemacht, als aufgelistet wurden, zum Teil auch mit ein paar Experimenten bezüglich der Einstellungen im UEFI, welche aber alle ohne Befund blieben. Auch eine Manipulation des memtest-Quellcodes, sodass nur das als defekt erkannte Muster, bzw. der Teil davon, der das Problem hervorrief, vewendet wurde, erwies sich nicht als hilfreich.
Ich möchte für die sehr lange Ausführung um Verzeihung bitten und mich für jede Hilfe im Voraus bedanken.
[1]
Neu gekauft:
Mainboard: Gigabyte GA-Z87X-D3H
Prozessor: Intel i7-4770K
Kühler: Thermalright Macho
Speicher: 16GB Crucial Ballistix Sport DDR3-1600 DIMM CL9 Dual Kit
Von altem Rechner übernommen:
Grafikkarte: Asus GTX660-DC2O-2GD5
Netzteil: be quiet! Straight Power E9-CM 580W
+Gehäuse und Laufwerke
[2]
Mainboard: Gigabyte GA-H77-D3H
Prozessor: Intel Xeon E3-1230V2
Kühler: Alpenföhn Sella
Speicher: 2*8GB Corsair Vengeance Low Profile DDR3-1600 DIMM CL9 Dual Kit (davon wurde nur ein Kit zum Test in den ersten Rechner verbaut)
Netzteil: Irgendein be quiet! Straight Power
Im Folgenden erwies es sich aber als unglaublich schwer, den Fehler verlässlich zu reproduzieren. Zum Beispiel ergab ein weiterer Testlauf mit 12 Durchgängen keinerlei Fehler. Auch ein Test mit MPrime, der Linux-Version von Prime95, zeigte nichts an. Hierbei wurde das UEFI zwischenzeitlich auf die BETA-Version F6e aus dem Tweaktown-Forum geupdated.
Erst in der Nacht von Sonntag auf Montag ergab ein weiterer Memtest, dieses Mal eingeschränkt auf den vierten Test und ein paar hundert Megabyte um den beim ersten Mal identifizierten Speicherbereich, einen weiteren Fehler. Ein daran angeschlossener längerer Durchlauf, bei dem ich, wenn ich mich richtig erinnere, das XMP-Profil des Speichers aktivierte, ergab ein paar mehr Fehler, bei denen ich mir leider die Details nicht notierte. Nachdem der Rechner dann eine Weile ausgeschaltet war und nach dem Einschalten wieder ein Test gestartet wurde, ergab sich wieder keinerlei Fehler.
Darauf tauschte ich den Speicher dieses Rechners mit dem eines anderen[2] und lies auf beiden Rechnern Speichertests laufen. Dies ergab jedoch auch bei längeren Durchläufen keinerlei Befund auf beiden Rechnern.
Nachdem ich die Speicher dann wieder zurücktauschte, erhielt ich erneut einen Bitfehler beim ersten Rechner. Dieses Mal beim 20. Durchgang, wobei die Durchgänge wieder auf den vierten Test eingeschränkt wurden. Vorher wurde auch noch über einen längeren Zeitraum die Intel-Version des Linpack-Benchmarks, welcher den Unterbau für die grafische Oberfläche LinX unter Windows bietet, fehlerfrei durchlaufen.
Danach aktivierte ich erneut das XMP-Profil im UEFI und startete einen weiteren Speichertest, welcher jetzt beim 45. Durchgang des vierten Testes immer noch fehlerfrei ist.
Das UEFI war, wenn ich das XMP-Profil nicht aktiviert hatte, was die Speicher- und Spannungseinstellungen betrifft, immer auf den "Optimized Defaults".
Ich bin nun etwas verzweifelt und weiß nicht wirklich, wie ich weiter vorgehen soll, da mir auch nicht ganz klar ist, was genau defekt ist. Auch das systematische Ausschließen erscheint mir sehr schwierig, da der Fehler nur so selten und schwierig zur reproduzieren ist und ich somit dann nie wissen kann, ob das Problem isoliert wurde, oder der Fehler sich nur einmal mehr nicht gezeigt hat.
Das einzig erkennbare Muster ist, dass, wenn ein Fehler angezeigt wird, immer das gleiche Bit kippt. Die betroffenen Adressen sind leicht verschieden, was mit dem Interleaving zusammenhängen mag. Auch das Testmuster ist nicht immer identisch, wobei das betroffene Bit natürlich immer den gleichen Zustand vor und nach dem Kippen hat.
Ich habe mehr Tests gemacht, als aufgelistet wurden, zum Teil auch mit ein paar Experimenten bezüglich der Einstellungen im UEFI, welche aber alle ohne Befund blieben. Auch eine Manipulation des memtest-Quellcodes, sodass nur das als defekt erkannte Muster, bzw. der Teil davon, der das Problem hervorrief, vewendet wurde, erwies sich nicht als hilfreich.
Ich möchte für die sehr lange Ausführung um Verzeihung bitten und mich für jede Hilfe im Voraus bedanken.
[1]
Neu gekauft:
Mainboard: Gigabyte GA-Z87X-D3H
Prozessor: Intel i7-4770K
Kühler: Thermalright Macho
Speicher: 16GB Crucial Ballistix Sport DDR3-1600 DIMM CL9 Dual Kit
Von altem Rechner übernommen:
Grafikkarte: Asus GTX660-DC2O-2GD5
Netzteil: be quiet! Straight Power E9-CM 580W
+Gehäuse und Laufwerke
[2]
Mainboard: Gigabyte GA-H77-D3H
Prozessor: Intel Xeon E3-1230V2
Kühler: Alpenföhn Sella
Speicher: 2*8GB Corsair Vengeance Low Profile DDR3-1600 DIMM CL9 Dual Kit (davon wurde nur ein Kit zum Test in den ersten Rechner verbaut)
Netzteil: Irgendein be quiet! Straight Power
Zuletzt bearbeitet: