Ryzen 5 1600 defekt?

meeven

Komplett-PC-Aufrüster(in)
Hi,
ich habe seit längerem das Problem, das mein Rechner gelegentlich einfriert.
Die wichtigsten Dinge, wie aktuelles BIOS, aktuelle Treiber und Updates sowie RAM Test (Test OK) habe ich schon gemacht.

Der Rechner friert seltsamerweise dann ein, wenn eher weniger Last anliegt.
Ich habe das die ganze Zeit auf Windows 10 geschoben und mir halt keine weiteren Gedanken hierzu gemacht.
Vor einiger Zeit bin ich aber auf Linux (Manjaro) umgestiegen, habe also ein Dualboot System mit Linux und Windows.

Jetzt friert der Rechner aber auch unter Linux ein, was zeigt das es nicht an Windows liegt.
Der Vorteil von Linux ist, dass es eine "lesbare" Fehlermeldung ausgibt, nach dem Neustart:

Code:
ryzen kernel: mce: [Hardware Error]: Machine check events logged
ryzen kernel: mce: [Hardware Error]: CPU 5: Machine Check: 0 Bank 5:

Nach ein wenig Recherche habe ich herausgefunden, dass es sich um einen defekten OpCache der CPU handeln soll.
Also habe ich diesen kurzerhand im UEFI abgeschaltet. Leider tritt das Problem immer noch auf.

Hat jemand das gleiche Problem oder ggf. eine Lösung?

Meine aktuelle Hardware:
CPU: Ryzen 5-1600
Board: Asus Prime X370 Pro
RAM: 32GB DDR4-3000MHz (4x8GB) @3000MHz
GPU: Sapphire Nitro+ RX580 8GB
PSU: Corsair RM650x
SSD: Samsung 970 Evo 500GB
 
Bitte nach den Ausschlusprinzip vor gehen un die Hardware aus schließen.

Unter last oder in idel?
Temperaturlimit? Temperaturen?

Wenn du last auf den cpu gibst bitte mit prime95 bis v26.6 und custom 1344k / 1344k
(Falls AVX bitte mit ca.. 2-3 in bios ein stellen. AVX offset, Um cpu zu schohnen wenn AVX angewand wird. Danke)

Wenn ne bluescreen kommt ist es so wohl als auch an anderen hardware teilen liegen könnte. Aber bluescreen sagt dann zu midnestens eins aus dass was nicht so rund läuft.

Vielleicht kann man es ein grenzen.
 
Also Temperaturen sind in Ordnung, unter Vollast nicht über 62°C
Fehler tritt nur im Idle oder sehr wenig Last auf. Unter Last läuft der Rechner stabil.

Mir ist eben der Rechner wieder eingefroren, hatte eigentlich nur einen Webbrowser offen und über VLC Webradio gehört (unter Linux).

Dabei ist folgendes Verhalten aufgetreten:
- Bild eingefroren
- Webradio läuft problemlos weiter
- der Rechner lässt sich übers Netzwerk anpingen und antwortet auch auf die Pings

Ich habe mir jetzt mal die Systemlogs angeschaut, der Rechner hat mein mehrmaliges Drücken des Power Knopfes im Log aufgezeichnet.
Selbst das kurzzeitige Trennen der Netzwerkverbindung wurde geloggt. Was ja eigentlich aussagt, dass der Rechner trotz eingefrohrenem Bild eigentlich weiter gelaufen ist.

Was mich stutzig macht, sind mit dem Zeitpunkt des einfrierens auftretenden pcie port errors, sowie die Fehlermeldungen des AMD Grafiktreibers, dass die powerplay Nachrichten fehlschlagen. Außerdem hat der Grafikteriber ein timeout bei der Kommunikation mit der Grafikkarte und versucht diese neu zu starten lt. dem Eintrag GPU reset begin.

Sieht für mich so aus, als wäre hier eher die Grafikkarte der Übeltäter und die CPU Meldung nur rein Zufällig gewesen.
Ich werde man unter Windows schauen ob ich dort weitere Infos rausbekomme. Schließlich friert der Rechner unter Windows und Linux ein.
 
Versuche es mal mit nur zwei Module, vier Module können manchmal zu Probleme führen.
 
dass wass die vorretner gesagt haben schliße ich mich an.

gut möglich dass du da von amd ne treiber nachträglich installieren musst.

Ich sage jetzt in vorfeld gleich, Einfach ist so was nicht und ist ne bisschen gefrikel. Es funktioniert aber es ist halt nicht sofort so einfach. Daher gebe ich dir den tipp mach dinge die du später brauchst schon mal in terminal da wird ehe alles geloggt und dann kannst du ohne grafik-oberfläche es geschwind ein geben und kommst ein ganzes stück weiter.

Ich sprech aus erfahrung habe ne GTX karte die treiber installiert bevor die in die quelle aufgenommen worden ist. Da habe ich das ein oder andere mal gefummelt.

Reinstalliere an besten mit Aptitude nochmal den kernel, Grub und den Grafikarten-Treiber. Wiso. Damit du auf den entsprechenden kernel ne bild hast das mache ich grundsätzlich weil mit einen neuen kernel das problem sein könnte das die standart vga treiber nicht so ganz funktionieren etc....

Aber bevor es hier zu viel mit Linux ist mach ich auch wieder schluss blos wenn die Grafikarten Treiber installiert werden sollte solltest du das bedenken. Ach übrigens mach doch in zweifel fall ne Thera unter linux einfach auf. Glaub ist dann passender.
 
Sorry, das ich mich jetzt erst melde, bin leider nicht früher dazu gekommen.

@IICARUS und Eol_Ruin
Das werde ich mal testen und beobachten.

@drstoecker
Das BIOS ist die aktuellste Version 5220 vom 2019/09/24. Ich habe jedes BIOS Update mitgemacht mit der Hoffnung das Problem zu beheben.
Das Problem tritt unter Windows und Linux auf, eine Neuinstallation brachte leider keine Abhilfe.

@Ellina
Das Problem besteht unter Linux und Windows, daher kann ich ausschließen das es nur an Linux liegt.
 
Das sind die aktuelles RAM Einstellungen:

16-18-18-38 3000MHz bei 1,35V entsprechen genau den Spezifikationen des RAM Herstellers:
F4-3000C16D-16GISB-G.SKILL International Enterprise Co., Ltd.

EDIT:
Mein Rechner hat sich gerade eben wieder verabschiedet, diesmal unter Windows. Ich habe mal mit Bluescreenview den Fehler abgefragt:
BSOD.PNG

Kann jemand damit was anfangen?
 
Zuletzt bearbeitet:
Das sind die aktuelles RAM Einstellungen:

16-18-18-38 3000MHz bei 1,35V entsprechen genau den Spezifikationen des RAM Herstellers:
F4-3000C16D-16GISB-G.SKILL International Enterprise Co., Ltd.

EDIT:
Mein Rechner hat sich gerade eben wieder verabschiedet, diesmal unter Windows. Ich habe mal mit Bluescreenview den Fehler abgefragt:
Anhang anzeigen 1066773

Kann jemand damit was anfangen?

Betrifft den Speicher. Bzw. den Speichercontroller.
Ich würd aber als erstes die SSD oder HDD tauschen weil ja die Ebene nicht ersichtlich ist.
 
Takte mal den Ram auf 2400 oder 2600 und Teste mal ne wenig.

Und dass ein Ram kit mit 2 Riegeln und das andere. Dass mit den Ram und den Controller in CPU könnte auch die probleme machen.
 
Ich würd aber als erstes die SSD oder HDD tauschen weil ja die Ebene nicht ersichtlich ist.
Diese Aussage kapier ich nicht wirklich!

An den TE:
Stell mal den Ram auf 2133 und schau obs dann läuft!
Wenn ja dann schau bis wieviel MHz der RAM problemlos läuft!

Denn wie gesagt:
Ryzen 1xxx hatte Probleme mit Vollbestückung und hohem RAM Takt!

Auch sollte man versuchen ob die 3000 mit nur zwei Modulen laufen!
 
Diese Aussage kapier ich nicht wirklich!

An den TE:
Stell mal den Ram auf 2133 und schau obs dann läuft!
Wenn ja dann schau bis wieviel MHz der RAM problemlos läuft!

Denn wie gesagt:
Ryzen 1xxx hatte Probleme mit Vollbestückung und hohem RAM Takt!

Auch sollte man versuchen ob die 3000 mit nur zwei Modulen laufen!

Der Crashreport bezieht sich nicht auf eine bestimmte Ebene des Speichers. Es kann von Cache < RAM < HDD alles sein.
 
Um den Ram auschließen zu können sollte ne memtest 86 gemacht werden.

Damit wäre Der Ram ausen vor. Aber wie gesagt lieber mit 2 Riegeln als mit 4 Riegeln das system befeuern. Und dann auch nicht so hoch getaktet.
 
Ok, dann werde ich jetzt mal memtest86 durchlaufen lassen.
Reicht ein durchlauf oder sollte ich mehrere laufen lassen?
Erstmal mit den aktuellen Einstellungen und dann mit 2133MHz?

UPDATE:
Ich habe nun memtest86 durchlaufen lassen:

1. Ich konnte den Test nur mit einem Kern also Single Core durchführen:
Mem1.jpg

2. Ergebnis bei 2933MHz RAM Takt:
Mem2.jpg

3. Ergebnis bei 2133MHz RAM Takt:
Mem3.jpg

D.h. heißt für mich nun, das ich den RAM mit 2133MHz betreiben muss?
Habe ich dadurch nicht zu hohen Leistungsverlust?
 
Zuletzt bearbeitet:
Nein dass der wohl 2.400 kann und du ihn auf 3.200 gebrügelt hast. Dass ist klar dass es fehleranfällig ist. (Nehm ich an ohne zu wissen wie was auf der verpackung steht etc...)

Lass ihn mal stück für stück laufen. Takte mal bisschen höher und schau einfach mal.

Wie gesagt mehr als 2.600 kannst du ehe nicht machen also mach das kit raus was fehleranfällig ist und takte langsam dich heran.

Dass habe ich aber schon in den anderen post in Thera erwähnt und andere haben da auch ähnliches gesagt.
 
@Ellina
Der RAM ist für 3000MHz spezifiziert, das Herstellerdatenblatt habe ich weiter vorne verlinkt.
Des Weiteren habe ich geschrieben das ich diesen nur mit 2933 MHz betrieben habe, also innerhalb der Spezifikation.

@Alle
Da der RAM bei 2133 MHz keinerlei Fehler in memtest verursacht hat, habe ich nun folgendes gemacht:
- Das XMP Profil aktiviert, aber die Taktfrequenz erstmal auf 2133MHz gesenkt = keine Fehler
- mich langsam an die maximale Taktfrequenz herangetastet, läuft nun mit allen Modulen auf 2866MHz ohne Fehler in memtest.

Werde nun weiter beobachten ob das System nun stabil läuft. Ein Downloads auf 2 Module und damit 16GB kommt aktuell nicht in Frage, da die 32GB auf Grund von Virtuellen Maschinen benötigt werden.

Ich bedanke mich erstmal für eure Hilfe und halte euch auf dem laufenden, falls sich was ergibt
 
Absturz der ntoskrnl.exe spricht für Instabilität von CPU oder RAM.
Den Bluescreen bekam ich immer bei zu krassem OC.
Denke es liegt nach wie vor am RAM-Takt.

Gib doch einfach mal mehr Spannung auf CPU und RAM und lass die Hardware nicht verdursten. :D
Ansonsten hilft nur Takt senken. Ryzen1000 ist beim RAM immer schon sehr störrisch gewesen.
 
Zurück