Moin! Bin durch die Faltwoche mal wieder motiviert worden, und falte nun seit einem Tag!
Lasse auf zwei Rechnern falten. Eine Windows Kiste (CPU+GPU) und ein Linux Rechner (CPU only).
Bei Windows läuft alles glatt.
Habe beim Falten auf meinem Linux Rechner aber bereits 9x Probleme der folgenden Art bekommen (und das innerhalb von weniger als 24 Stunden):
Die Variationen in den Error Meldungen liegen hier:
System:
Anbei Logs (im fah_logs.zip):
Außerdem kam es einmal zu Folgender Situation (/var/lib/fahclient/logs/log-20190923-015403.txt):
Letzteres (exception: std::bad_cast) ist wohl ein Programmierfehler im FahCore?
Ersteres - habt ihr so etwas schon mal bei euch gesehen? Insb. bei Linux?
Grüße aus der Oktoberfest Hauptstadt!
edit: Code Stellen mit Tags versehen
Lasse auf zwei Rechnern falten. Eine Windows Kiste (CPU+GPU) und ein Linux Rechner (CPU only).
Bei Windows läuft alles glatt.
Habe beim Falten auf meinem Linux Rechner aber bereits 9x Probleme der folgenden Art bekommen (und das innerhalb von weniger als 24 Stunden):
Code:
05:30:39:WU00:FS00:0xa7:ERROR:-------------------------------------------------------05:30:39:WU00:FS00:0xa7:ERROR:Program GROMACS, VERSION 5.0.4-20161122-4846b12ba-unknown
05:30:39:WU00:FS00:0xa7:ERROR:Source code file: /host/debian-stable-64bit-core-a7-sse-release/gromacs-core/build/gromacs/src/gromacs/mdlib/pme.c, line: 754
05:30:39:WU00:FS00:0xa7:ERROR:
05:30:39:WU00:FS00:0xa7:ERROR:Fatal error:
05:30:39:WU00:FS00:0xa7:ERROR:857 particles communicated to PME rank 3 are more than 2/3 times the cut-off out of the domain decomposition cell of their charge group in dimension x.
05:30:39:WU00:FS00:0xa7:ERROR:This usually means that your system is not well equilibrated.
05:30:39:WU00:FS00:0xa7:ERROR:For more information and tips for troubleshooting, please check the GROMACS
05:30:39:WU00:FS00:0xa7:ERROR:website at http://www.gromacs.org/Documentation/Errors
05:30:39:WU00:FS00:0xa7:ERROR:-------------------------------------------------------
05:30:44:WU00:FS00:FahCore returned: INTERRUPTED (102 = 0x66)
05:30:44:WU00:FS00:Starting
05:30:44:WU00:FS00:Removing old file './work/00/logfile_01-20190922-201147.txt'
05:30:44:WU00:FS00:Running FahCore: /usr/bin/FAHCoreWrapper /var/lib/fahclient/cores/cores.foldingathome.org/Linux/AMD64/Core_a7.fah/FahCore_a7 -dir 00 -suffix 01 -version 705 -lifeline 1207 -checkpoint 15 -np 8
05:30:44:WU00:FS00:Started FahCore on PID 1804
05:30:44:WU00:FS00:Core PID:1808
05:30:44:WU00:FS00:FahCore 0xa7 started
05:30:45:WU00:FS00:0xa7:*********************** Log Started 2019-09-23T05:30:44Z ***********************
Die Variationen in den Error Meldungen liegen hier:
ERROR:<ZAHL> particles communicated to PME rank <ZAHL> are more than 2/3 times the cut-off out of the domain decomposition cell of their charge group in dimension x.
System:
- CPU: Intel Xeon E3-1260L v5, 4x 2.90GHz
- Mainboard: ASRock Rack E3C236D4U
- RAM: 4x 16 GB ECC DDR4 (Chips: Micron 18ASF2G72AZ-2G3B1)
- alles @stock
- Host: Proxmox 6 (5.0.21-1-pve #1 SMP PVE 5.0.21-2 (Wed, 28 Aug 2019 15:12:18 +0200) x86_64 GNU/Linux)
- VM: Ubuntu 18.04.3 LTS (4.15.0-64-generic #73-Ubuntu SMP Thu Sep 12 13:16:13 UTC 2019 x86_64 x86_64 x86_64 GNU/Linux)
Anbei Logs (im fah_logs.zip):
- /var/lib/fahclient/log.txt
- /var/lib/fahclient/logs/log-20190923-015403.txt
Außerdem kam es einmal zu Folgender Situation (/var/lib/fahclient/logs/log-20190923-015403.txt):
Code:
01:30:46:WU00:FS00:0xa7:ERROR:std::exception: std::bad_cast01:32:15:WU00:FS00:0xa7:ERROR:std::exception: std::bad_cast
01:33:19:WU00:FS00:0xa7:ERROR:std::exception: std::bad_cast
01:33:26:WU00:FS00:0xa7:ERROR:std::exception: std::bad_cast
01:35:45:WU00:FS00:0xa7:ERROR:std::exception: std::bad_cast
01:36:06:WU00:FS00:0xa7:ERROR:std::exception: std::bad_cast
01:37:46:WU00:FS00:0xa7:ERROR:std::exception: std::bad_cast
01:37:49:WU00:FS00:0xa7:ERROR:std::exception: std::bad_cast
01:39:47:WU00:FS00:0xa7:ERROR:std::exception: std::bad_cast
01:39:59:WU00:FS00:0xa7:ERROR:std::exception: std::bad_cast
01:40:11:WU00:FS00:0xa7:ERROR:std::exception: std::bad_cast
[93m01:40:32:WARNING:WU00:FS00:FahCore returned: WU_STALLED (127 = 0x7f)[0m
01:40:32:WU00:FS00:Starting
01:40:32:WU00:FS00:Removing old file './work/00/logfile_01-20190922-185734.txt'
01:40:32:WU00:FS00:Running FahCore: /usr/bin/FAHCoreWrapper /var/lib/fahclient/cores/cores.foldingathome.org/Linux/AMD64/Core_a7.fah/FahCore_a7 -dir 00 -suffix 01 -version 705 -lifeline 1787 -checkpoint 15 -np 8
01:40:32:WU00:FS00:Started FahCore on PID 2902
01:40:32:WU00:FS00:Core PID:2906
01:40:32:WU00:FS00:FahCore 0xa7 started
01:40:33:WU00:FS00:0xa7:*********************** Log Started 2019-09-23T01:40:32Z ***********************
Letzteres (exception: std::bad_cast) ist wohl ein Programmierfehler im FahCore?
Ersteres - habt ihr so etwas schon mal bei euch gesehen? Insb. bei Linux?
Grüße aus der Oktoberfest Hauptstadt!
edit: Code Stellen mit Tags versehen