Rumpelkammer: PCGH Folding@Home-Thread II

@mattinator
SSH läuft dann erstaunlicherweise noch, aber ich kann weder neustarten noch herunterfahren.
Bei den nouveau Treibern bin ich mir nicht sicher. Wo muss ich schauen?
Ich schau auch mal ins log von apt...

EDIT: hier noch das log von apt, Probleme fingen am 21.12. an:

Start-Date: 2016-12-19 11:09:02
Commandline: apt-get -y upgrade
Requested-By: msadmin (1000)
Upgrade: libavutil-ffmpeg54:amd64 (7:2.8.8-0ubuntu0.16.04.1, 7:2.8.10-0ubuntu0.16.04.1), libavfilter-ffmpeg5:amd64 (7:2.8.8-0ubuntu0.16.04.1, 7:2.8.10-0ubuntu0.16.04.1), libswresample-ffmpeg1:amd64 (7:2.8.8-0ubuntu0.16.04.1, 7:2.8.10-0ubuntu0.16.04.1), libpostproc-ffmpeg53:amd64 (7:2.8.8-0ubuntu0.16.04.1, 7:2.8.10-0ubuntu0.16.04.1), libavcodec-extra:amd64 (7:2.8.8-0ubuntu0.16.04.1, 7:2.8.10-0ubuntu0.16.04.1), libswscale-ffmpeg3:amd64 (7:2.8.8-0ubuntu0.16.04.1, 7:2.8.10-0ubuntu0.16.04.1), libavresample-ffmpeg2:amd64 (7:2.8.8-0ubuntu0.16.04.1, 7:2.8.10-0ubuntu0.16.04.1), libavformat-ffmpeg56:amd64 (7:2.8.8-0ubuntu0.16.04.1, 7:2.8.10-0ubuntu0.16.04.1), libavcodec-ffmpeg-extra56:amd64 (7:2.8.8-0ubuntu0.16.04.1, 7:2.8.10-0ubuntu0.16.04.1)
End-Date: 2016-12-19 11:09:06

Start-Date: 2016-12-19 21:46:54
Commandline: apt-get -y upgrade
Requested-By: msadmin (1000)
Upgrade: python-samba:amd64 (2:4.3.11+dfsg-0ubuntu0.16.04.1, 2:4.3.11+dfsg-0ubuntu0.16.04.3), ifupdown:amd64 (0.8.10ubuntu1.1, 0.8.10ubuntu1.2), libwbclient0:amd64 (2:4.3.11+dfsg-0ubuntu0.16.04.1, 2:4.3.11+dfsg-0ubuntu0.16.04.3), samba:amd64 (2:4.3.11+dfsg-0ubuntu0.16.04.1, 2:4.3.11+dfsg-0ubuntu0.16.04.3), samba-dsdb-modules:amd64 (2:4.3.11+dfsg-0ubuntu0.16.04.1, 2:4.3.11+dfsg-0ubuntu0.16.04.3), isc-dhcp-common:amd64 (4.3.3-5ubuntu12.4, 4.3.3-5ubuntu12.6), initramfs-tools-bin:amd64 (0.122ubuntu8.5, 0.122ubuntu8.7), samba-libs:amd64 (2:4.3.11+dfsg-0ubuntu0.16.04.1, 2:4.3.11+dfsg-0ubuntu0.16.04.3), chromium-browser:amd64 (53.0.2785.143-0ubuntu0.16.04.1.1257, 55.0.2883.87-0ubuntu0.16.04.1263), samba-common:amd64 (2:4.3.11+dfsg-0ubuntu0.16.04.1, 2:4.3.11+dfsg-0ubuntu0.16.04.3), chromium-codecs-ffmpeg-extra:amd64 (53.0.2785.143-0ubuntu0.16.04.1.1257, 55.0.2883.87-0ubuntu0.16.04.1263), samba-vfs-modules:amd64 (2:4.3.11+dfsg-0ubuntu0.16.04.1, 2:4.3.11+dfsg-0ubuntu0.16.04.3), libsmbclient:amd64 (2:4.3.11+dfsg-0ubuntu0.16.04.1, 2:4.3.11+dfsg-0ubuntu0.16.04.3), smbclient:amd64 (2:4.3.11+dfsg-0ubuntu0.16.04.1, 2:4.3.11+dfsg-0ubuntu0.16.04.3), samba-common-bin:amd64 (2:4.3.11+dfsg-0ubuntu0.16.04.1, 2:4.3.11+dfsg-0ubuntu0.16.04.3), chromium-browser-l10n:amd64 (53.0.2785.143-0ubuntu0.16.04.1.1257, 55.0.2883.87-0ubuntu0.16.04.1263), isc-dhcp-client:amd64 (4.3.3-5ubuntu12.4, 4.3.3-5ubuntu12.6), initramfs-tools-core:amd64 (0.122ubuntu8.5, 0.122ubuntu8.7), initramfs-tools:amd64 (0.122ubuntu8.5, 0.122ubuntu8.7)
End-Date: 2016-12-19 21:47:23

Start-Date: 2016-12-21 13:23:55
Commandline: apt-get -y upgrade
Requested-By: msadmin (1000)
Upgrade: linux-libc-dev:amd64 (4.4.0-53.74, 4.4.0-57.78)
End-Date: 2016-12-21 13:23:57
 
Zuletzt bearbeitet:
In den Updates bzgl. der Probleme nichts Auffälliges. Kannst Du Dich mit PuTTY noch Anmelden, wenn das Problem auftritt ? Die nouveau-Treiber solltest Du in der lsmod- oder auch im dmesg-Ausgabe sehen (Eingabe im Terminal). Vllt. im Paket-Manager (synaptic) nachschauen, ob sich irgendwelche nvidia-Pakete aus dem zusätzlichen und Standard-Repository "im Wege" sind. Allerdings vermute ich den lightdm als "Übeltäter". Im Fehlerfall mal per PuTTY in die Prozessliste schauen (ps -efwl) und den ligthdm-Prozess mit kill -1 <lightdm-pid> oder ggf. kill -9 <lightdm-pid> beenden (<lightdm-pid> ist die Prozess-ID des lightdm aus dem ps-Befehl. Mit htop kann man das auch etwas einfacher ausführen. Evtl. liefern dann die Folding- und System-Protokolle noch weitere Anhaltspunkte.
 
@mattinator
Also nach dem Blackscreen hab ich mal nachgeschaut:

Code:
:ps -efwl | grep light
4 S root      1993     1  0  80   0 - 87595 -      18:05 ?        00:00:00 /usr/sbin/lightdm
4 R root      2050  1993  9  80   0 - 65541 -      18:05 tty7     00:02:44 /usr/lib/xorg/Xorg -core :0 -seat seat0 -auth /var/run/lightdm/root/:0 -nolisten tcp vt7 -novtswitch
4 S root      2240  1993  0  80   0 - 60391 -      18:05 ?        00:00:00 lightdm --session-child 12 15
0 S msadmin   4047  3516  0  80   0 - 101145 poll_s 18:05 ?       00:00:00 light-locker --lock-after-screensaver=0 --no-lock-on-suspend --no-late-locking
0 S msadmin   8787  8327  0  80   0 -  2821 pipe_w 18:35 pts/2    00:00:00 grep --color=auto light

Wenn ich die tasks beende tut sich aber trotzdem nichts. Neustart des Dienstes bringt auch nix... :( Ich komm nich klar...
 
Verletzungsbedingt war ich die letzten vier, fünf Wochen nicht in der Lage, meinen PC sauber zu halten. Nachdem ich dies heute nachgeholt habe und den flauschigen Staubteppich am Radiator weggesaugt habe, kann ich mich über ein deltaT von mindestens 5K bei der GPU-Temperatur freuen! :D

Bezüglich der Faltaktion: ich werde wieder früher einsteigen, damit die PPD in der Woche von Anfang an gleich schön hoch sind! :daumen:
 
Mal ne Frage, meine CPU bekommt auf Linux öfter mal keine WUs. Die GPU Ackert derweil weiter.
NaCl scheint es aber immer zu geben.
Kann man dem Ding sagen das es, nach dem 2. Fehlversuch statt Stunden vergeblich zu warten, stundenlang NaCl's faltet?
 
@JT: ... ich hoffe es ist nun wieder alles gut!?

Zum Thema Folding-Aktion: aktuell suchen wir noch nach einem kurzen, knackig markigen Slogan fürn YT-Trailer. Aktuell haben wir...

Um den Krebs aufzuhalten, komm falten! "Gamer folden gegen den Krebs!"

Was meint Ihr, was habt Ihr noch für Ideen?
 
Mal ne Frage, meine CPU bekommt auf Linux öfter mal keine WUs. Die GPU Ackert derweil weiter.
NaCl scheint es aber immer zu geben.
Kann man dem Ding sagen das es, nach dem 2. Fehlversuch statt Stunden vergeblich zu warten, stundenlang NaCl's faltet?

Das wäre ein guter Ansatz. Über entsprechende Scripte und Logs sicher machbar. Ich frage mal nach.
 
Hmm,

was ich im Log gesehen habe, ist das das Teil anfängt vorgegebene IPs abzuklappern.
In immer längeren Abständen.

Was also zu tun wäre:
Server WU Request,
Check for failed assignemt, if fail, Counter +1
Check for Servers, Server = X
If X =Counter, get NaCl, else
Set time for Server WU Request = 1Sec.,
Server WU Request,
Check for failed assignemt, if fail, Counter +1

Die Idee ist das er nachschaut wie viele Server (IPs zu prüfen sind). Das kann auch die erste Aufgabe sein. Macht das Schleifenbauen einfacher. While?
Dann sollen in kurzer Zeit alle Server befragt werden. ALso die mit "großen" WUs.
Wenn das alles scheitert soll er mit einer NaCl beginnen. Oder anderen "Von-der-Stange-WUs".
Es gibt auch eine Serverstatus Seite, eventuell kann man das später verknüpfen.
Beim ersten Fail, soll das Script den Server befragen, wo es sich lohnt nach WUs zu fragen.
 
Also der Dialog des Folding-Clients mit den Assignment- und Workservern ist meines Wissen closed. Maximal könnte man das Ergebnis der Anfrage aus dem Protokoll filtern und bei einer als Konfigurations-Option angebbaren maximalen Anzahl von fehlerhaften Anfragen am Workserver den Slot pausieren sowie den NaCl starten.
 
... das hört sich doch nach einer brauchbaren Lösung an. Sagen wir, zweimal nicht geklappt, sprich nach gut 5 min geht's zum NaCl.
Dann ein Loop, nach 5h NaCl beenden und nochmal beim Fah versuchen.
 
neujahr-smilie-12.gif
Kommt gut ins neue Jahr !
 
Zurück