Rumpelkammer: PCGH Folding@Home-Thread II

@brooker nutze die Tage und atme mal durch. Respekt von mir, dass du neben deinen Zwillingen, Frau und Job noch Zeit findest für die vielen Projekte.

Du kannst Dir sicher vorstellen, wir es mir unter den Nägeln brennt einige abzuschliesen und bei YT richtig loszulegen. Ersteres muss erstmal erfolgen. Das passt aber, denn für YT brauchen wir für Sie Skripts und Standards noch Zeit.
Bitte auch nicht übersehen, YT wird vom YT-TEAM getrieben und da bin ich aktuell höchstens Berater. FlyingPC und D3x84 stemmen dort die Balken sehr respektable für uns :daumen:

Und wenn ich an 2017 denke lacht das Herz. Ich habe aktuell schon richtig viele Spenden in Form von Hardware bekommen und einiges wurde mir bereits in Aussicht gestellt. Das bedeutet, dass das von Loebstraus und mir erdachte Folding-Cluster-Brandenburg tatsächlich realisiert werden kann. Aber dazu später mehr. Ich sage jetzt nur soviel, dass wir die Hardware mit Leuten hier aus dem Team bei Loebi zusammenschrauben und zum Laufen bringen wollen. Ich freue mich drauf. ;) :daumen:
 
Zuletzt bearbeitet:
Auch von mir an dieser Stelle Frohe Weihnachten. Mögen Eure Hardware-Träume unterm Christbaum in Erfüllung gehen !

nikolaus_8.gif
 
@Brooker

Argh...:motz:Mein Linux-Fopasa-Server macht grad mächtig Probleme beim Falten. Nach kurzter Zeit wird der Bildschirm scharz und lässt sich nicht reaktivieren. Das System und die Dienste laufen aber noch im Hintergrund.
Leider schmeißt mir FaH eine Bad WU nach der anderen und hört irgendwann komplett auf. Was läuft hier falsch? Ich hab nichts geändert... :(
Selbst mit Standardtakt tritt das Problem auf. Kann was mit der Grafikkarte sein? Ich brauch mal Hilfe und Lösungsvorschläge. Treiber hab ich schon neu installiert....

11:44:45:WU01:FS01:Download 95.02%
11:44:51:WU01:FS01:Download 97.67%
11:44:57:WU01:FS01:Download 99.69%
11:44:58:WU01:FS01:Download complete
11:44:58:WU01:FS01:Received Unit: id:01 state:DOWNLOAD error:NO_ERROR project:9209 run:49 clone:34 gen:48 core:0x21 unit:0x0000005aab436c685796c0e8227933a6
11:44:58:WU01:FS01:Starting
11:44:58:WU01:FS01:Running FahCore: /usr/bin/FAHCoreWrapper /var/lib/fahclient/cores/web.stanford.edu/~pande/Linux/AMD64/NVIDIA/Fermi/Core_21.fah/FahCore_21 -dir 01 -suffix 01 -version 704 -lifeline 2136 -checkpoint 30 -gpu 0 -gpu-vendor nvidia
11:44:58:WU01:FS01:Started FahCore on PID 7455
11:44:58:WU01:FS01:Core PID:7459
11:44:58:WU01:FS01:FahCore 0x21 started
11:44:58:WU01:FS01:0x21:*********************** Log Started 2016-12-24T11:44:58Z ***********************
11:44:58:WU01:FS01:0x21:Project: 9209 (Run 49, Clone 34, Gen 48)
11:44:58:WU01:FS01:0x21:Unit: 0x0000005aab436c685796c0e8227933a6
11:44:58:WU01:FS01:0x21:CPU: 0x00000000000000000000000000000000
11:44:58:WU01:FS01:0x21:Machine: 1
11:44:58:WU01:FS01:0x21:Reading tar file core.xml
11:44:58:WU01:FS01:0x21:Reading tar file integrator.xml
11:44:58:WU01:FS01:0x21:Reading tar file state.xml
11:44:58:WU01:FS01:0x21:Reading tar file system.xml
11:44:58:WU01:FS01:0x21:Digital signatures verified
11:44:58:WU01:FS01:0x21:Folding@home GPU Core21 Folding@home Core
11:44:58:WU01:FS01:0x21:Version 0.0.17
11:44:58:WU01:FS01:0x21:ERROR:Bad platformId size.
11:44:58:WU01:FS01:0x21:Saving result file logfile_01.txt
11:44:58:WU01:FS01:0x21:Saving result file log.txt
11:44:58:WU01:FS01:0x21:Folding@home Core Shutdown: BAD_WORK_UNIT
11:44:59:WARNING:WU01:FS01:FahCore returned: BAD_WORK_UNIT (114 = 0x72)
11:44:59:WU01:FS01:Sending unit results: id:01 state:SEND error:FAULTY project:9209 run:49 clone:34 gen:48 core:0x21 unit:0x0000005aab436c685796c0e8227933a6
11:44:59:WU01:FS01:Uploading 5.50KiB to 171.67.108.104
11:44:59:WU01:FS01:Connecting to 171.67.108.104:8080
11:44:59:WU00:FS01:Connecting to 171.67.108.45:80
11:44:59:WU01:FS01:Upload complete
11:44:59:WU01:FS01:Server responded WORK_ACK (400)
11:44:59:WU01:FS01:Cleaning up
11:45:00:WU00:FS01:Assigned to work server 171.67.108.102
11:45:00:WU00:FS01:Requesting new work unit for slot 01: READY gpu:0:GM200 [GeForce GTX 980 Ti] from 171.67.108.102
11:45:00:WU00:FS01:Connecting to 171.67.108.102:8080
 
Zuletzt bearbeitet:
@KillercornyX:
Ich würde sämtliche Steckverbindungen (Stecker, Grakas, RAM, NT) kontrollieren.
Hast du Stromadapter verbaut? Wenn ja kontrollieren ob diese nicht zu warm geworden sind.
 
@Corny: ... ERROR:Bad platformId size habe ich bisher nicht gesehen und aktuell auch keine Idee :( ... kennt wer diesen Fehler, ggfs ist es auch was spezielles von Linux?
 
Das eigenartige ist auch, dass es ja schon seit jeher funktioniert hat. Und seit 2-3 Tagen spackt FaH rum... :wall:
Am Treiber hat sich soweit ich weiß auch nix geändert, es ist der 367.57 für Linux. Neuere Treiber funktionieren glaub nicht mit der GTX 900er Reihe, auch wenn NVidia selbst höhere Treiber anbietet. Vielleicht wage ich den Versuch. Als ich die Karte eingebaut hatte und den neusten Treiber installierte, hab ich mir damit den X-Server zerschossen und konnte nur noch die Console nutzen.
Also werd ich mal ein Backup machen und dann experimentieren....
 
... warte bitte noch damit bis Mattinator sich zum Thema gemeldet hat. Könnte mir vorstellen das er evtl ne Idee dazu hat.

Meine 970-er ist bis zum Schluss mit den aktuellen Linux-Treibern gelaufen. Die 375-er mal ausgenommen, also war der letzte die 378.20.
Wenn an der Hardware und den NVIDIA-Treibern nichts geändert wurde, habe ich auch keine konkrete Idee. Neu gebootet wurde das System sicher schon. Habt Ihr mal die Sensordaten ausgelesen, passt das so ? Die Distro ist doch ein Ubuntu mit Lightdm ? Was als mögliche Fehlerursachen softwareseitig noch in Frage kommt, sind der Linux-Kernel, die Xorg-Komponenten und eben dieser Lightdm. Wobei der nach meiner Meinung besser "heavydm";) heißen sollte. Da hatten wir beim Server von A.Meier-PS3 auch so unsere Probleme. Ist die Software der Installation "eingefroren" oder werden regelmäßig Updates gemacht ? Die älteren Kernel werden ja nicht automatisch deinstalliert, da kann man auch manuell mal eine ältere Kernel-Version booten und ggf. als Default fixieren.
 
Also Updates mach ich manuell aber regelmäßig, so alle 2-3 Tage. Ich hab grad mal nen älteren Kernel versucht, hat aber nichts geändert. Also anderen Treiber versuchen....
Nen 378er hab ich nicht finden können, weder auf der Seite von Nvidia, noch im PPA-Repo. Grad läuft eine 0x18 WU mit dem 375.26. Mal schauen ob die 0x21 auch laufen.

EDIT:

Hab jetzt den 370.28 installiert und die erste 0x21 ist schon bei 16%, es sieht also gut aus.
 
Zuletzt bearbeitet:
Jetzt gibt es einen neuen Nvidia Treiber und nun ist entweder mein Board oder die CPU tot. Das war 1 Tag vor Weihnachten passiert.
Wird die nächsten Wochen leider nichts mit falten ...
 
Board zeigt mir qcode 00 an und die CPU LED leuchtet rot. Selbst wenn nur die CPU drin sitzt und sonst nichts angeschlossen ist, kommt das selbe. Der meckert nicht Mal rum das kein RAM installiert ist.
Hab an den Tag ne GT 8800 eingebaut. Die Funktionierte und hab dann wieder meine reingesetzt. Seitdem geht gar nichts mehr.
Hab bis März noch Garantie Mal sehen wie lange Alternate dafür braucht.
 
@Hansi: erstmal ruhig Blut. Sag sich in so eiber Situation einfach, ich weiss, muss aber sein. Bitte prüfe ob das Board irgendwo Kontakt hat (Kurzschluss - Platibenhalter, Schraube reingefallen usw.)
Dann bitte alle Stecker inkl. I.O. Anzeigen entfernen und nur das Nötigste anschließen - Lautsprecher wäre hilfreich.

Gab es beim Umbau irgendwas Auffälliges? Hat was geknackt, ging irgendwas schwer?
 
Hab schon alles ausgebaut gehabt und CPU Mal rausgenommen. Half auch nicht. Atx und CPU stromstecker sind die einzigen die noch drin sind.
Ohne RAM und 4 verschiedene Riegel probiert. Hilft alles leider nicht und mir ist auch nichts aufgefallen beim Umbau. Ich denke eher das vielleicht doch die alte Karte mein Board zerschossen hat. Wie auch immer das passieren konnte.
 
Ich hab mich zu früh gefreut.... Nur eine WU konnte erfolgreich gefaltet werden, dann wieder die alten Symptome: kein Bild und irgendwann keine Reaktion mehr... :nene:
 
Hast Du einen anderen Rechner im Netz, mit dem Du die Verbindung testen kannst ? ping und ssh (PuTTY) auf die TPC/IP-Adresse des Linux-Systems. Für ssh muss auf dem Linux-System der openssh-server installiert und gestartet sein. Wenn die ssh-Verbindung noch funktioniert, mal den lightdm neu starten. Die Nouveau-Treiber sind sicher deaktiviert ? Ich würde anhand der Protokolle in /var/log/apt suchen, was kurz vor dem ersten Auftreten der Probleme an Pakete aktualisiert wurde.
 
Zurück