Cokicoke
Komplett-PC-Aufrüster(in)
Hallo liebe Community,
ich hab ein kleines Stabilitätsproblem mit einem Setup von mehreren Rechnern und weiß langsam nicht weiter.
Also, ich habe insgesamt 3 Workstations (für specs siehe unten) die relativ viel Watt ziehen, einen NAS (Synology DS1821+ mit 8 HDDs), einen Switch und einen Raspberry Pi die zusammen in einer Ecke stehen.
Die Stabilität der drei Workstations ist leider schon seit Beginn nicht optimal. Immer mal wieder werden sie einfach unerreichbar und müssen neu gestartet werden. Am schlimmsten ist die WS mit 2 Grafikkarten die regelmäßig abstürzt.
Letzte Woche ist dann eine Sicherung rausgeflogen, während große Last auf allen Systemen lag.
Allerdings sind die Systeme aufgeteilt auf 2 Stromkreise, weshalb nur das NAS und eine WS abgestürzt sind.
In den Logs der Systeme ist nach jedem Absturz überhaupt keine Meldung zu finden (sudo journalctl --boot=-1 --reverse). Deshalb vermute ich das es irgendwie wirklich ein Problem entweder mit der Stromversorgung oder der Kühlung gibt.
Ich habe mal einige Vermutungen aufgestellt:
1) Die PSUs für die WS reichen nicht aus. Allerdings hatte ich vor jedem Kauf mit dem BeQuiet Netzteil Kalkulator ausgerechnet welche Leistung ich brauchen. Eigentlich würde ich auch gern redundante Netzteile anschließen, allerdings schafft das einzige ATX Netzteil was ich dazu finde maximal 900W was dann doch ein bisschen knapp ist.
2) Die Verteilersteckdosen können nicht ausreichend Leistung verteilen. (SALI 680BA000006)
3) Die Kühlung ist zu schwach, auch wenn ich hier eigentlich erwarten würde das die Systeme automatisch runtertakten und das selbst regeln können.
Hat jemand von euch vielleicht Erfahrungen mit solchem Verhalten und kann mir einen Tip geben was ich als nächstes machen soll?
==================== Die Systeme ==================
CPU: AMD Threadripper 2990WX
Kühler: be quiet! Dark Rock Pro TR4
GPU: 2 * Nvidia titan rtx
MB: MSI X399 SLI PLUS Mainboard
SSD: 2TB Samsung 970 Evo Plus
PSU: 1200 Watt be quiet! Dark Power Pro 11
RAM: 128GB (8x 16GB) G.Skill RipJaws V schwarz DDR4-3200
Gehäuse: be quiet! Pure Base 600
CPU: AMD Threadripper 3990X
Kühler: be quiet! Dark Rock Pro TR4
GPU: 1 * Nvidia rtx 3090
MB: ASRock TRX40 CREATOR
SSD: 2TB Samsung 970 Evo Plus
RAM: 256GB (8x 32GB) Samsung ECC RAM
PSU: 1500 Watt be quiet! Dark Power Pro 12
Gehäuse: Fractal Design Define 7 XL
CPU: AMD Threadripper PRO 3995WX
Kühler: be quiet! Dark Rock Pro TR4
GPU: 1 * Nvidia rtx 3090
MB: Gigabyte WRX80-SU8-IPMI
SSD: 2TB Samsung 980 Pro M.2
RAM: 256GB (8x 32GB) Samsung ECC RAM
PSU: 1200 Watt be quiet! Straight Power 11
Gehäuse: be quiet! Pure Base 600
Alle Systeme laufen unter Ubuntu Server und wurden von Mindfactory zusammengebaut.
ich hab ein kleines Stabilitätsproblem mit einem Setup von mehreren Rechnern und weiß langsam nicht weiter.
Also, ich habe insgesamt 3 Workstations (für specs siehe unten) die relativ viel Watt ziehen, einen NAS (Synology DS1821+ mit 8 HDDs), einen Switch und einen Raspberry Pi die zusammen in einer Ecke stehen.
Die Stabilität der drei Workstations ist leider schon seit Beginn nicht optimal. Immer mal wieder werden sie einfach unerreichbar und müssen neu gestartet werden. Am schlimmsten ist die WS mit 2 Grafikkarten die regelmäßig abstürzt.
Letzte Woche ist dann eine Sicherung rausgeflogen, während große Last auf allen Systemen lag.
Allerdings sind die Systeme aufgeteilt auf 2 Stromkreise, weshalb nur das NAS und eine WS abgestürzt sind.
In den Logs der Systeme ist nach jedem Absturz überhaupt keine Meldung zu finden (sudo journalctl --boot=-1 --reverse). Deshalb vermute ich das es irgendwie wirklich ein Problem entweder mit der Stromversorgung oder der Kühlung gibt.
Ich habe mal einige Vermutungen aufgestellt:
1) Die PSUs für die WS reichen nicht aus. Allerdings hatte ich vor jedem Kauf mit dem BeQuiet Netzteil Kalkulator ausgerechnet welche Leistung ich brauchen. Eigentlich würde ich auch gern redundante Netzteile anschließen, allerdings schafft das einzige ATX Netzteil was ich dazu finde maximal 900W was dann doch ein bisschen knapp ist.
2) Die Verteilersteckdosen können nicht ausreichend Leistung verteilen. (SALI 680BA000006)
3) Die Kühlung ist zu schwach, auch wenn ich hier eigentlich erwarten würde das die Systeme automatisch runtertakten und das selbst regeln können.
Hat jemand von euch vielleicht Erfahrungen mit solchem Verhalten und kann mir einen Tip geben was ich als nächstes machen soll?
==================== Die Systeme ==================
CPU: AMD Threadripper 2990WX
Kühler: be quiet! Dark Rock Pro TR4
GPU: 2 * Nvidia titan rtx
MB: MSI X399 SLI PLUS Mainboard
SSD: 2TB Samsung 970 Evo Plus
PSU: 1200 Watt be quiet! Dark Power Pro 11
RAM: 128GB (8x 16GB) G.Skill RipJaws V schwarz DDR4-3200
Gehäuse: be quiet! Pure Base 600
CPU: AMD Threadripper 3990X
Kühler: be quiet! Dark Rock Pro TR4
GPU: 1 * Nvidia rtx 3090
MB: ASRock TRX40 CREATOR
SSD: 2TB Samsung 970 Evo Plus
RAM: 256GB (8x 32GB) Samsung ECC RAM
PSU: 1500 Watt be quiet! Dark Power Pro 12
Gehäuse: Fractal Design Define 7 XL
CPU: AMD Threadripper PRO 3995WX
Kühler: be quiet! Dark Rock Pro TR4
GPU: 1 * Nvidia rtx 3090
MB: Gigabyte WRX80-SU8-IPMI
SSD: 2TB Samsung 980 Pro M.2
RAM: 256GB (8x 32GB) Samsung ECC RAM
PSU: 1200 Watt be quiet! Straight Power 11
Gehäuse: be quiet! Pure Base 600
Alle Systeme laufen unter Ubuntu Server und wurden von Mindfactory zusammengebaut.
Zuletzt bearbeitet: