Ram defekt - aber warum?

Ernie12345

Komplett-PC-Aufrüster(in)
Hallo,


von vorgestern auf gestern war es dunkel auf dem Bildschirm.
Bildschirme schwarz, PC bootet nicht, geht nur an, alles dreht.
RAM LED auf dem Board leuchtet orange
Ram: CMH32GX5M2D6000C36W mit XMP (6000mhz) lief 1jahr OHNE Probleme.
BEIDE Riegel gehen nicht, ja auch der richtige SingleSLOT wurde genutzt.
-> Clear CMOS - nix
-> BIOS aktuell geflashed (und somit Einstellung im bios stock) - nix
RAM (RGB) leuchtet
(Am Abend ODER noch ein Tag davor gab es ein Windowsupdate)

Ich hab gemacht was man so macht, wenn nix mehr geht. (auf minimum gebaut, alles gecheckt, alle steck-variante probiert, monitore, igpu/gpu, hdmi/dp ...)
Der Austausch-RAM (ohne RGB?!) hat dann bestätigt, dass es der Ram ist.
Das System geht ohne Problem mit dem Austausch RAM.


ABER BEIDE Riegel sind defekt?
Selbst mit bios stock? ICH KANN ES NICHT GLAUBEN


Den Ram an einem anderen PC testen, wird etwas dauern.


Meine Frage:
Wie können beide Riegel sofort defekt sein?
Was geht bei RAM Kaputt?
Welche Einstellungen könnten den RAM überreden doch zu funktionieren?
 
Zuletzt bearbeitet:
Kann vieles sein.
Meist ist nur der Anpressdruck vom Kühler falsch oder ein Kontakt der zu den RAM Slots verläuft ist defekt.
Oder ein RAM Modul ist nicht richtig drin...
Ersteres Kühler neu anziehen, gleichmäßig und über Kreuz und nur Handfest, nicht mit Gewalt.
Bei Letzterem hilft es manchmal die RAM Slots zu wechslen, von 1-3 zu 2-4...

Am einfachsten einmal den RAM raus und nur mit einem Stick im zweiten Slot starten.
Fährt der PC hoch oder nicht, teste den anderen Stick.
Dann testest du wieder beide. In Slot 2 und 4
Geht der PC mit beiden nicht an, nutzt du die anderen beiden Slots 1 und 3.
Manchmal sind nur die Leiterbahnen zu einem Slot platt oder ein RAM Stick.

Sollte der Fehler auch bei beiden einzelnen Sticks da sein ist es meist die CPU.
Dann würde ich die CPU rausnehmen und begutachten ob alles im Sockel gleich und die CPU von unten sauber sind.
Dann wieder rein mit der CPU und kurz den PC ohne Kühler starten, wenn das Bios auftaucht SOFORT den PC wieder abschalten (4 sek power knopf halten) oder Stecker ziehen.
Manchmal hat eine CPU Kontaktprobleme bei zu fest oder schräg angezogenen Kühlern.
Sollte der PC ohne Kühler hochfahren, dann wieder Kühler drauf und nochmal testen.
Fährt er nicht hoch, so ist dann die CPU oder das Board im Arsch.
Fährt er normal nach allem wieder hoch, dann Glückwunsch du hast möglicherweise den Kühler nicht richtig angezogen... :D

Erklärung:
Von der CPU gehen viele Kontakte über den Sockel und Leiterbahnen zu den RAM Slots.
Es kann die CPU defekt sein, indem IN der CPU ne Leiderbahn oder einer der Kontakte einen weg hat.
Es kann das Board defekt sein, indem einer der Kontakte im Sockel, die Leiderbahnen oder die RAM Slots einen weg haben.
Und es kann der RAM selbst sein.
Warum sowas passiert? Wenn z.b. eine CPU sich ständig erwärmt und abkühlt, dehnen sich die Materialen aus und ziehen sich wieder zusammen. Irgendwann kann es passieren das eine CPU z.b. nicht 100%ig in Ordnung ist, man es aber vorher nicht feststellen kann. Und nach viele solcher Dehnzyklen bricht dann eine Leiterbahn in der CPU oder ein Lötkontakt auf dem Board, etc.

Edit: Das hier ist ne Standard Hilfe Antwort von mir :D
 
Zuletzt bearbeitet:
Es könnten ja auch die Rambänke an dem Board defekt sein?

Der AustauschRAM geht ohne Probleme
Kann vieles sein.
Meist ist nur der Anpressdruck vom Kühler falsch oder ein Kontakt der zu den RAM Slots verläuft ist defekt.
Oder ein RAM Modul ist nicht richtig drin...
Ersteres Kühler neu anziehen, gleichmäßig und über Kreuz und nur Handfest, nicht mit Gewalt.
Bei Letzterem hilft es manchmal die RAM Slots zu wechslen, von 1-3 zu 2-4...

Am einfachsten einmal den RAM raus und nur mit einem Stick im zweiten Slot starten.
Fährt der PC hoch oder nicht, teste den anderen Stick.
Dann testest du wieder beide. In Slot 2 und 4
Geht der PC mit beiden nicht an, nutzt du die anderen beiden Slots 1 und 3.
Manchmal sind nur die Leiterbahnen zu einem Slot platt oder ein RAM Stick.

Sollte der Fehler auch bei beiden einzelnen Sticks da sein ist es meist die CPU.
Dann würde ich die CPU rausnehmen und begutachten ob alles im Sockel gleich und die CPU von unten sauber sind.
Dann wieder rein mit der CPU und kurz den PC ohne Kühler starten, wenn das Bios auftaucht SOFORT den PC wieder abschalten (4 sek power knopf halten) oder Stecker ziehen.
Manchmal hat eine CPU Kontaktprobleme bei zu fest oder schräg angezogenen Kühlern.
Sollte der PC ohne Kühler hochfahren, dann wieder Kühler drauf und nochmal testen.
Fährt er nicht hoch, so ist dann die CPU oder das Board im Arsch.
Fährt er normal nach allem wieder hoch, dann Glückwunsch du hast möglicherweise den Kühler nicht richtig angezogen... :D

Erklärung:
Von der CPU gehen viele Kontakte über den Sockel und Leiterbahnen zu den RAM Slots.
Es kann die CPU defekt sein, indem IN der CPU ne Leiderbahn oder einer der Kontakte einen weg hat.
Es kann das Board defekt sein, indem einer der Kontakte im Sockel, die Leiderbahnen oder die RAM Slots einen weg haben.
Und es kann der RAM selbst sein.
Warum sowas passiert? Wenn z.b. eine CPU sich ständig erwärmt und abkühlt, dehnen sich die Materialen aus und ziehen sich wieder zusammen. Irgendwann kann es passieren das eine CPU z.b. nicht 100%ig in Ordnung ist, man es aber vorher nicht feststellen kann. Und nach viele solcher Dehnzyklen bricht dann eine Leiterbahn in der CPU oder ein Lötkontakt auf dem Board, etc.

Edit: Das hier ist ne Standard Hilfe Antwort von mir :D


Ja die Standart Hilfe Antwort geht hier am Thema leider vorbei.
 
Ok dann ist das Problem ja gelöst oder?
Leider nein.

Das Problem hab ich ja bereits lokalisiert.
Meine Fragen lauteten:
"Meine Frage:
Wie können beide Riegel sofort defekt sein?
Was geht bei RAM Kaputt?
Welche Einstellungen könnten den RAM überreden doch zu funktionieren?"

Es gehen ja nicht einfach 2riegel über nacht "kaputt" (muss sie erst noch auf einem weiteren Board testen)
 
Zuletzt bearbeitet:
Es gehen ja nicht einfach 2riegel über nacht "kaputt"
Genau das ist mir vor 3 Jahren auch passiert. Von heute auf morgen Abstürze und Freezes. Mit Memtest beide Sticks einzeln getestet und beide haben Fehler geworfen. Kit war 1,5 Jahre in Betrieb und wurde anstandslos getauscht.

Hatte kurz vorher auf die 6900XT gewechselt und die lief für 2 Tage mit LuKü bevor der Wasserblock drauf kam. Entsprechend hoch war die Temperatur im Gehäuse durch die Abluft der GPU, vorallem viel höher als vorher (als auch ne wassergekühlte GPU verbaut war).

Keine Ahnung was tatsächlich die Ursache war, habs mir bildlich so vorgestellt das der Abluftstrahl der Graka die RAMs gegrillt hat :haha:

Aber ja, Defekte an Elektronik können tatsächlich von heute auf morgen einfach auftreten.
 
Beide sofort kaputt:
  • Memorycontroller im Eimer.
  • Daisychain bei Singlechannel-Konfiguration(da sieht der ganze Kanal defekt aus, wenn man nicht die Chips einzeln prüft)
  • Mainboard stark gebogen durch schraubzwingenartige Kühlerbefestigungen bei dünnen Boards ohne Backplate und dadurch Leiterbahnen gebrochen. Das gibt einen Wackelkontakt oder Totalausfall

Was geht kaputt:
  • Die Chips an sich
  • Die Lötverbindung der Chips
  • Der Controller(bei Registered-Ram im Serverbereich)
  • Rest siehe oben

Wie kann es trotzdem gehen:
  • Sehr niedriger oder Standardtakt->damit der Memorycontroller mitkommt und die Chips zuverlässig schalten können
  • Hohe Timings->wie oben
  • Andere Speicherbänke testen->um defekte Leiterbahnen zu umgehen
  • Einzeln im Singlechannel testen->Memorycontroller kommt damit immer zurecht, einzelne defekte Leiterbahnen kann man so ebenfalls ausschließen
  • Neu einsetzten->Kratzt eventuelle Korrosion von den Anschlüssen.

Im Worst-Case hat es halt den Memorycontroller der CPU komplett erwischt, aber das ist ja glücklicherweise nicht der Fall gewesen.
 
Heute kam das ErsatzKIT, bin gespannt!
Leider ist es (bis auf die Timings) der gleiche RAM (weiß, Corsair, niedrige Bauhöhe waren Vorraussetzungen)

Ich werde berichten.


Board gebogen, kann ich nicht bestätigen, Slots sowie die defekten Riegel sehen aus wie neu.

Denkt ihr es ist gefährlich, den defekten Ram und den neuen gemeisam zu probieren?
(habe dies bereits mit dem Austauschriegel vom Kollegen probiert -> wurde nicht erkannt (der defekte).
 
Die neuste Erkenntnisse:

Es kam der neue RAM an:
Was ich nicht gecheckt habe ist die Kompatipilität - er steht nicht mit auf der Liste.
Was ich auch nicht berücksichtigt habe ist die Voltage, hab nur auf Timing geschaut, das die nicht so straff sind - :/


"Original" RAM:
CMH32GX5M2D6000C36W 1,35V, kompatibel, RGB
- LÄUFT NICHT MEHR
CPU Diagnose LED leuchtet kurz rot, dann RAM LED orange)

AustauschRAM (Kollege)
CMK32GX5M2B5600C36 1,25V, kompatibel, non RGB
- LÄUFT

ErsatzRAM (neu bestellt)
CMH32GX5M2E600036W 1.40V, nicht kompatibel, RGB
- LÄUFT NICHT
(CPU Diagnose LED leuchtet kurz rot, dann RAM LED orange)


Leider bin ich nicht in der Lage die RAM Voltage hoch zustellen.
Ich hab versucht mit verschiedenen Profilen oder AI Funktionen zu starten - keine Verbesserung.
(Asus z690 A-gaming DDR5)

I.
Mein Gedanke ist nun,dass das Board oder der Speichercontroller betroffen ist.
Auffällig ist das der LOW Voltage RAM (non RGB) funktioniert -> heisst das, dass er nicht genug V liefert oder heisst das, dass der Controller auf der CPU was weg hat - aber (bei Beiden) das beide Dinge nur eingeschränkt gehen wirkt seltsam.

II.
Ich werde jetzt nochmal das Bios resetten schauen und dann eine nicht ganz aktuelle Version probieren und schauen.
-> Hat nix gebracht - tatsächlich hat der reset gar nicht funktioniert (clear cmos Taste am Board) aber das downgrade (was ja auch alle Werte resettet) ging durch.

III.
Kann RGB was ausmachen?

Würde jetzt nochmal RAM bestellen, natürlich kompatibel, werde mit der Spannung bei 1,25V bleiben, aber RGB.


IV.
Da ich (noch) keinen kompatiblen RAM da habe, ist der defekt noch nicht ausgemacht.
Aber es wird doch jeder MainstreamRAM auf dem Board gehen, da haben viele identische Werte und stehen drauf, bin fest davon überzeugt, dass es keine ABSOLUTES muss ist - "kompatiblen RAM" bzw, "save getesteten RAM" zu nutzen.

V.
Es kann also immer noch Board / CPU / RAM sein.
Oder kann ich, weil der AustauschRAM (vom Kollegen geht) CPU ausschließen?

Ich kann Board und CPU nur schwer kontrollieren, einen CPU bekomm ich vom Kollegen evtl. (auch 13700k) - ich könnte evtl. auch meinen Original RAM bei ihm einsetzen und so aufs Mainboard schließen (wenn Ram bei ihm geht und CPU wechsel bei mir nix bringt = Mainboard defekt?)
 
Zuletzt bearbeitet:
Also falls möglich würde ich wie folgt vorgehen.
1. bios resseten über jumper oder schalter auf dem Board.
2. einen der neunen RAM Riegel Testen im Richtigen Slot ( siehe handbuch) in der Regel A2
3. Geht, das mit dem anderen Riegel das selbe machen.
4Geht der auch, beide zusammen wieder in A2 und B2 bauen und ohne XMP testen.
5.Geht das, XMP an und Testen.
 
soso:

habe mir meinen defekten RAM noch mal bestellt -
CMH32GX5M2D6000C36W 1,35V, kompatibel, RGB - also wirklich identisch.

Ging -> XMP -> ging -> memtest keine Fehler

ok alles easy, hab bei dem Händler die Rückabwicklung eingeleitet und den alten Ram (nochmal getestet - nix) eingesendet.

Sooo:

seither wurde der PC vll. 10 hochgefahren und 2x erkennt er nur einen Riegel (seltsamerweise den auf dem 2. Slot), nach RR startet er normal mit 2Riegeln, also - sehr seltsam wieder.

Sollte es wieder auftauchen, würde ich ihn ohne xmp laufen lassen und schauen, ob das mittelfristig Änderung bringt.
 
Zurück