PC bootet nicht mehr,

sereksim

Komplett-PC-Aufrüster(in)
Hey,
vor kurzem hat mein PC leider seinen Dienst eingestellt und ich versuche grad herauszufinden, weshalb.

Folgende Situation: Ich habe ein Dual-Boot System mit Manjaro Linux und Windows 11 auf einer nvme-SSD. Wenn ich den Rechner starte, komme ich bis ins GRUB. Wenn ich dann eine der beiden Bootoptionen auswähle kommt ein schwarzer Bildschirm, bis der Rechner irgendwann neu startet. Windows bootet manchmal in einen Datenträgerreparaturmodus, der aber erfolglos abschließt. Meistens kommt auch bei Windows aber nur ein schwarzer Bildschirm.
Bei Linux kommen vor dem Blackscreen noch ein paar Meldungen:
Code:
[    2.813234] mce: [Hardware Error]: CPU 11: Machine Check: 0 Bank 5: bea000000
0000108
[    2.813240] mce: [Hardware Error]: TSC 0 ADDR 1ffffc0e17554 MISC d01200010000
0000 SYND 4d000000 IPID 500b000000000
[    2.813244] mce: [Hardware Error]: PROCESSOR 2:870f10 TIME 1677087635 SOCKET
0 APIC d microcode 8701021
/dev/nvme0n1p5: recovering journal
/dev/nvme0n1pm: clean, 624394/19202048 files, 19788836/76800000 blocks

Ein Wechsel der Festplatte hat auf den ersten Blick auch nichts gebracht. Habt ihr eine Idee, was das Problem ist, oder wie ich es näher eingrenzen/identifizieren kann? Den RAM habe ich bereits mit Memtest überprüft, an dem liegt es nicht.

Ich habe außerdem versucht, ein Linux vom USB-Stick zu booten und damit die Datenrettung und Fehlerbehandlung zu erleichtern. Das hat so halb funktionert: Ich konnte aus irgendwelchen Gründen nur Fedora Linux im "basic graphics mode" zum laufen bringen. Im normalen Modus geht es nicht, andere Linux-Distributionen haben irgendwie auch nicht funktioniert, mit Fedora in diesem Modus geht es aber. Ich konnte dann so auch alle Daten von der SSD ziehen, sie scheint also noch zu funktionieren. Bleibt die Frage, was dann die eigentliche Fehlerquelle ist...

Meine Hardware:
CPU: Ryzen 5 3600
Mainboard: Gigabyte B550 Aorus Elite V2
GPU: AMD Radeon R9 390

Danke schonmal :)
Gruß
sereksim
 
Zuletzt bearbeitet:
Was hast du denn "vor kurzem" gemacht?
Neue Treiber?
Neue Hardware?
etc. pp.

Oder kam das Problem einfach so von einem auf den anderen Tag?
Weder neue Hardware noch neue Treiber für BIOS oder Chipset oder so. Nichts, was mir das Problem erklären könnte...

Ich hab jetzt mal hier geschaut und würde dann einfach die neuste Version des BIOS neu installieren (welche Version ich momentan habe, weiß ich nicht, aber garantiert nicht die neuste von vor wenigen Wochen).
Kann ich die heruntergeladene zip-Datei einfach auf nen USB-Stick ziehen, oder muss ich sie vorher noch entpacken oder ggf mit Rufus oder so den Stick "bootable" machen?

Edit: Was für eine Checksum kann denn "Checksum : 1250" bedeuten? Ich kenne nur MD5 und SHA und so und die sind doch in der Regel deutlich länger als nur 4 Stellen.
 
Bei der Suche nach "Checksum : 1250" gibt die Suchmaschine mir Ergebnisse für Agesa Updates für das B550 Aorus Elite V2. Anders kann ich gerade nicht helfen.
 
Bei der Suche nach "Checksum : 1250" gibt die Suchmaschine mir Ergebnisse für Agesa Updates für das B550 Aorus Elite V2
Habs jetzt selbst herausgefunden, die Checksum wird im BIOS angezeigt, bevor man das Update endgültig startet.

Das Update hat das Problem nicht gelöst. Der PC bootet jetzt nur noch ins Windows. Da wird dann erfolglos die "automatische Reparatur" gestartet, man kann den PC neu starten und das wars. Im Rahmen dieser Fehlerbehandlung konnte ich aber eine Konsole öffnen und könnte also Befehle eingeben um das Problem ggf genauer zu identifizieren.

In GRUB (den Linux-Bootloader) komme ich gar nicht mehr rein. Egal welche Bootoption ich im BIOS wähle (Partition oder ganze Platte), es wird Windows gebootet.
 
So, nachdem der PC jetzt ein halbes Jahr ungenutzt rumstand, möchte ich mich nochmal mit der Reparatur befassen.
Danke für das nachtragen!:daumen: Und ja ich würde mal nach einem BIOS Update schauen. Der Teil lässt darauf schließen:
2.813244] mce: [Hardware Error]: PROCESSOR 2:870f10 TIME 1677087635 SOCKET
0 APIC d microcode 8701021
@Shinna , wie kommst du darauf, dass diese Fehlermeldung einen BIOS-Fehler nahelegt?

Um die Fehlermeldung besser zu verstehen, hab ich sie mal in ChatGPT geschmissen:
The error message indicates a hardware issue. Machine Check Errors (MCE) often relate to problems with the CPU, memory, or other hardware components. I can explain the error messages you provided line by line:
  1. [2.813234] mce: [Hardware Error]: CPU 11: Machine Check: 0 Bank 5: bea0000000000108
    • [2.813234] - This is a timestamp indicating when the error occurred.
    • mce: [Hardware Error] - This indicates a hardware error.
    • CPU 11 - Refers to the CPU core where the error occurred. In this case, it's CPU core 11.
    • Machine Check: 0 - Indicates that a machine check exception (MCE) occurred, and "0" is the MCE bank number.
    • Bank 5 - Points to the specific bank where the error was detected.
    • bea0000000000108 - This is the error code. It's a hexadecimal code that provides detailed information about the type and source of the error. It varies based on the specific error and its cause.
  2. [2.813240] mce: [Hardware Error]: TSC 0 ADDR 1ffffc0e17554 MISC d012000100000000 SYND 4d000000 IPID 500b000000000
    • This line provides more detailed information about the MCE error:
      • TSC - Timestamp Counter (TSC) value at the time of the error.
      • ADDR - The memory address or register associated with the error.
      • MISC - Miscellaneous data related to the error.
      • SYND - The error syndrome, which can provide additional details about the nature of the error.
      • IPID - Instruction Pointer Identifier.
      • 500b000000000 - Additional data specific to the error.
  3. [2.813244] mce: [Hardware Error]: PROCESSOR 2:870f10 TIME 1677087635 SOCKET 0 APIC d microcode 8701021
    • PROCESSOR 2 - Refers to the processor or CPU in question. In this case, it's processor 2.
    • 870f10 - The CPU's identifier or microarchitecture.
    • TIME 1677087635 - Indicates the timestamp at which the error occurred.
    • SOCKET 0 - Refers to the CPU socket (if applicable). "Socket 0" typically indicates the first CPU socket.
    • APIC d - APIC (Advanced Programmable Interrupt Controller) information, which is relevant to interrupt handling.
    • microcode 8701021 - The microcode version running on the CPU. Microcode updates can address certain CPU-related issues.
In summary, the error messages primarily indicate that a hardware error occurred on CPU core 11, with detailed information about the error code, related data, and processor details.

Was denkt ihr, ist eine defekte CPU als Ursache des Problems realistisch? Falls ja, ist es möglich das zu testen/zu verifizieren, bevor ich ggf eine neue CPU kaufen muss?
 
In GRUB (den Linux-Bootloader) komme ich gar nicht mehr rein. Egal welche Bootoption ich im BIOS wähle (Partition oder ganze Platte), es wird Windows gebootet.
Weil der wenn er in den Master Boot Record an anfang der Systemplatte legt windows eine seperate platte an. Wenn es auf der Windows Padition wo windows liegt, Liegen würde. Hat eine Reperatur Grub überschrieben.
Da würde ne Live system helfen und eine Grub-Reperatur mittels Live CD/DVD/USB Stick. Das habe ich einiege male gemacht und das funktioniert wunderbar wenn man sich strickt an die anleitung hält.

Du wirst das so nicht hin bekommen, Wenn ud linux hast, Wenn du ne neues Linux aufsetzt dann wird er dir Grub wieder in diese Padition wo der windows Bootloader liegt hinein schreiben und du hast Grub.

Das kann ich aus erfahrung sagen, zum rest halte ich mich bedeckt.
Was denkt ihr, ist eine defekte CPU als Ursache des Problems realistisch?
Ausschlussverfahren. Alles andere wirst du nicht drum herum kommen.
 
Zurück