Rumpelkammer: PCGH Folding@Home-Thread II

also meine Linux Vm will wieder anscheinend nicht laufen :-!
und hab auch keine Zeit mich darum wirklich zu kümmern...

edit: habs anscheinend zum laufen gebracht, ma schaun wie lange ...
 
Zuletzt bearbeitet:
Moin @ all.
Weil ich gerade bei mir wieder gesehen habe, das WUs mit "Run 0" die "schlechten" sein sollen (bei Diskussion wg. den 76er WUs) stimmt m.E. nicht. Denn ich habe schon einige davon gehabt mit eben dieser Null und die liefen "normal", zumind. auf meinem System.
 
Wie steuerst Du das, wenn die Clients durchlaufen ?

Indem ich zu Beginn die Clienten zeitversetzt starte und, falls notwendig, einen von ihnen auch mal anhalte wenn sie sich (was sehr selten vorkommt) mal zu nahe kommen

Moin @ all.
Weil ich gerade bei mir wieder gesehen habe, das WUs mit "Run 0" die "schlechten" sein sollen (bei Diskussion wg. den 76er WUs) stimmt m.E. nicht. Denn ich habe schon einige davon gehabt mit eben dieser Null und die liefen "normal", zumind. auf meinem System.

Ja, da hast du wohl recht - siehe auch hier http://extreme.pcgameshardware.de/f...-folding-home-thread-ii-1691.html#post3106770
 
Ich habe momentan wieder Probleme mit den GPU-WU-Upload: Gestern und heute Morgen war eine der 460 und die 450 nicht im Stande ihre WU's hochzuladen > dadurch gingen wiedereinmal rund 5h-Faltzeit durch Untätigkeit den Bach runter. :(
Da ich heute Morgen keine Zeit hatte weiter nach dem Problem zu schauen hab ich ne zweite Falthalde in auf dem Grossen in Betrieb genommen um das zu kompensieren, beim Faltserver kann ich nur hoffen.
 
Du könntest ja mal testweise auf den 7er client umsteigen für die GPUs. Der faltet munter weiter eine neue WU, auch wenn die alte WU noch nicht gesendet werden konnte.
 
Du könntest ja mal testweise auf den 7er client umsteigen für die GPUs. Der faltet munter weiter eine neue WU, auch wenn die alte WU noch nicht gesendet werden konnte.
Vom V7 lass ich momentan die Finger, sehe momentan für mich keinen wirklichen Grund zu wechseln.

Hab ihn mal auf dem Faltserver ausprobiert, aber aber das Ergebnis war alles andere als berauschend.

Falls das mit dem Upload ausartet werd ich wohl ganz einfach permanet mit 2-3 Clienten zeitlich versetzt auf den GPU's fallten > falls einer Probleme kriegt falten immer noch die anderen Clienten und wen das auch nicht hinhaut kann ich immernoch auf Halde falten.


So wie es momentan aussieht funktioniert der Upload wieder ganz normal.
 
Indem ich zu Beginn die Clienten zeitversetzt starte und, falls notwendig, einen von ihnen auch mal anhalte wenn sie sich (was sehr selten vorkommt) mal zu nahe kommen

Also regelmäßig nachschauen, die Zeit finde ich tagsüber nicht wirklich.:schief:

dadurch gingen wiedereinmal rund 5h-Faltzeit durch Untätigkeit den Bach runter.

Verstehe ich nicht, bei mir hat er nach ein paar Minuten die Upload-Versuche erstmal aufgegeben und neue Projekte geladen (wenn die Server verfügbar waren). Danach versucht es der 6-er Client dann in größeren Abständen immer wieder.
 
So wie ihr das beschreibt sollte es auch sein, ist es aber leider nicht. :(
Für mich sieht das Ganze so aus als ob der Client hängen bleibt und nicht weitermacht. Hier ein kleiner Auszug aus der Fahlog der GTX460 von heute morgen:
[02:18:03] Completed 49999999 out of 50000000 steps (100%).
[02:18:03] Finished fah_main
[02:18:03]
[02:18:03] Successful run
[02:18:03] DynamicWrapper: Finished Work Unit: sleep=10000
[02:18:13] Reserved 2464904 bytes for xtc file; Cosm status=0
[02:18:13] Allocated 2464904 bytes for xtc file
[02:18:13] - Reading up to 2464904 from "work/wudata_03.xtc": Read 2464904
[02:18:13] Read 2464904 bytes from xtc file; available packet space=783965560
[02:18:13] xtc file hash check passed.
[02:18:13] Reserved 76680 76680 783965560 bytes for arc file=<work/wudata_03.trr> Cosm status=0
[02:18:13] Allocated 76680 bytes for arc file
[02:18:13] - Reading up to 76680 from "work/wudata_03.trr": Read 76680
[02:18:13] Read 76680 bytes from arc file; available packet space=783888880
[02:18:13] trr file hash check passed.
[02:18:13] Allocated 544 bytes for edr file
[02:18:13] Read bedfile
[02:18:13] edr file hash check passed.
[02:18:13] Allocated 120111 bytes for logfile
[02:18:13] Read logfile
[02:18:13] GuardedRun: success in DynamicWrapper
[02:18:13] GuardedRun: done
[02:18:13] Run: GuardedRun completed.
[02:18:16] + Opened results file
[02:18:16] - Writing 2662751 bytes of core data to disk...
[02:18:16] Done: 2662239 -> 2502687 (compressed to 94.0 percent)
[02:18:16] ... Done.
[02:18:16] DeleteFrameFiles: successfully deleted file=work/wudata_03.ckp
[02:18:17] Shutting down core
[02:18:17]
[02:18:17] Folding@home Core Shutdown: FINISHED_UNIT
[02:18:20] CoreStatus = 64 (100)
[02:18:20] Sending work to server
[02:18:20] Project: 6806 (Run 3608, Clone 1, Gen 44)

[02:18:20] + Attempting to send results [June 21 02:18:20 UTC]
[02:18:20] Gpu type=3 species=21.
[02:18:21] - Couldn't send HTTP request to server
[02:18:21] + Could not connect to Work Server (results)
[02:18:21] (171.64.65.64:8080)
[02:18:21] + Retrying using alternative port
[02:18:23] - Couldn't send HTTP request to server
[02:18:23] + Could not connect to Work Server (results)
[02:18:23] (171.64.65.64:80)
[02:18:23] - Error: Could not transmit unit 03 (completed June 21) to work server.
[02:18:23] Keeping unit 03 in queue.
[02:18:23] Project: 6806 (Run 3608, Clone 1, Gen 44)

[02:18:23] + Attempting to send results [June 21 02:18:23 UTC]
[02:18:23] Gpu type=3 species=21.
[02:18:25] - Couldn't send HTTP request to server
[02:18:25] + Could not connect to Work Server (results)
[02:18:25] (171.64.65.64:8080)
[02:18:25] + Retrying using alternative port
[02:18:27] - Couldn't send HTTP request to server
[02:18:27] + Could not connect to Work Server (results)
[02:18:27] (171.64.65.64:80)
[02:18:27] - Error: Could not transmit unit 03 (completed June 21) to work server.

[02:18:27] + Attempting to send results [June 21 02:18:27 UTC]
[02:18:27] Gpu type=3 species=21.
Folding@Home Client Shutdown.

--- Opening Log file [June 21 03:27:34 UTC]

# Windows GPU Console Edition #################################################
###############################################################################
Folding@Home Client Version 6.41r2
Folding@home - Main
###############################################################################
###############################################################################
Launch directory: C:\FAH-GPU 3
Executable: C:\FAH-GPU 3\Folding@home.exe
Arguments: -gpu 1 -local -advmethods
[03:27:34] - Ask before connecting: No
[03:27:34] - User name: A.Meier-PS3 (Team 70335)
[03:27:34] - User ID: 11BA1B4606178186
[03:27:34] - Machine ID: 3
[03:27:34]
[03:27:34] Gpu type=3 species=21.
[03:27:34] Loaded queue successfully.
[03:27:34] - Preparing to get new work unit...
[03:27:34] Project: 6806 (Run 3608, Clone 1, Gen 44)
[03:27:34] Cleaning up work directory

[03:27:34] + Attempting to get work packet
[03:27:34] + Attempting to send results [June 21 03:27:34 UTC]
[03:27:34] Passkey found
[03:27:34] Gpu type=3 species=21.
[03:27:34] - Connecting to assignment server
[03:27:34] Gpu type=3 species=21.
[03:27:35] - Successful: assigned to (171.67.108.32).
[03:27:35] + News From Folding@Home: Welcome to Folding@Home
[03:27:35] Loaded queue successfully.
[03:27:35] Gpu type=3 species=21.
[03:27:37] + Closed connections
[03:27:37]
[03:27:37] + Processing work unit
[03:27:37] Core required: FahCore_15.exe
[03:27:37] Core found.
[03:27:37] Working on queue slot 04 [June 21 03:27:37 UTC]
[03:27:37] + Working ...
[03:27:37]
[03:27:37] *------------------------------*
[03:27:37] Folding@Home GPU Core
[03:27:37] Version 2.15 (Tue Nov 16 09:05:18 PST 2010)
[03:27:37]
[03:27:37] Build host: SimbiosNvdWin7
[03:27:37] Board Type: NVIDIA/CUDA
[03:27:37] Core : x=15
[03:27:37] Window's signal control handler registered.
[03:27:37] Preparing to commence simulation
[03:27:37] - Looking at optimizations...
[03:27:37] DeleteFrameFiles: successfully deleted file=work/wudata_04.ckp
[03:27:37] - Created dyn
[03:27:37] - Files status OK
[03:27:37] sizeof(CORE_PACKET_HDR) = 512 file=<>
[03:27:37] - Expanded 20406 -> 77539 (decompressed 379.9 percent)
[03:27:37] Called DecompressByteArray: compressed_data_size=20406 data_size=77539, decompressed_data_size=77539 diff=0
[03:27:37] - Digital signature verified
[03:27:37]
[03:27:37] Project: 10945 (Run 2, Clone 79, Gen 7)
[03:27:37]
[03:27:37] Assembly optimizations on if available.
[03:27:37] Entering M.D.
[03:27:39] Tpr hash work/wudata_04.tpr: 2997716328 2130168276 3897275213 1154115385 4223792720
[03:27:40] Working on 247 ProG_hpin
[03:27:40] Client config found, loading data.
[03:27:40] Starting GUI Server
[03:27:40] Setting checkpoint frequency: 500000
[03:27:40] Setting checkpoint frequency: 500000
[03:28:14] + Results successfully sent
[03:28:14] Thank you for your contribution to Folding@Home.
[03:28:14] + Number of Units Completed: 1275
[03:28:36] Completed 500000 out of 50000000 steps (1%).
Den Client Shutdown hab ich mit Ctrl+C ausgelöst und den Clienten sofort wieder gestartet.

Die GTS450 war diese Nacht von 0:55 bis 3:32 nicht am falten. Gestern das gleiche Spiel: GTX460 16:50-17:57, GTS450 16:51-17:57


Wie bereits erwähnd, die zweite 460 ist davon nicht betroffen.
 
An Deinem Log-Auszug ist das Problem aber nicht erkennbar. Die Unit war ca. 02:18 Uhr UTC fertig:
[02:18:17] Folding@home Core Shutdown: FINISHED_UNIT
[02:18:20] CoreStatus = 64 (100)
[02:18:20] Sending work to server
[02:18:20] Project: 6806 (Run 3608, Clone 1, Gen 44)

[02:18:20] + Attempting to send results [June 21 02:18:20 UTC]
[02:18:20] Gpu type=3 species=21.
[02:18:21] - Couldn't send HTTP request to server
[02:18:21] + Could not connect to Work Server (results)
[02:18:21] (171.64.65.64:8080)

Du hast nach ca. 6 Sekunden (!?) erfolglosen Upload-Versuchen den Client unterbrochen und lt. Log erst ca. 1 Stunde 9 Minuten später wieder gestartet. Bist Du sicher, dass alle Clients in einem eigenen Work-Directory laufen ?
Launch directory: C:\FAH-GPU 3
Executable: C:\FAH-GPU 3\Folding@home.exe
Arguments: -gpu 1 -local -advmethods
Das sieht fast so aus, als ob das Protokoll von mehreren Clients "gemixt" wird. Prüf mal das Startverzeichnis in Deinen Client-Verknüpfungen.
 
An Deinem Log-Auszug ist das Problem aber nicht erkennbar. Die Unit war ca. 02:18 Uhr UTC fertig:


Du hast nach ca. 6 Sekunden (!?) erfolglosen Upload-Versuchen den Client unterbrochen und lt. Log erst ca. 1 Stunde 9 Minuten später wieder gestartet. Bist Du sicher, dass alle Clients in einem eigenen Work-Directory laufen ?
Nene, der ist schon beim ersten Versuch da hängen geblieben und ich hab ihn neugestartet kaum hatte ich es gemerkt > Unterbruch durch mein Eingreifen sind allerhöchstens 10 Sekunden. Er hat wärend dieser guten Stunde auch keine Einträge mehr gemacht in die Fahlog.

Bei den anderen Hängern sind je nach dem erst nach dem 4 Versuch.

Das sieht fast so aus, als ob das Protokoll von mehreren Clients "gemixt" wird. Prüf mal das Startverzeichnis in Deinen Client-Verknüpfungen.
Was meinst du mit "gemixt"?
Fallst du irritiert bist von der "3", ich habe im Namen der GPU-Clienten ihre Maschiene-ID-Nummer drin, in unserem Fall eben die 3 > so halte ich die beiden GPU-Clienten auseinander.
 
An was kann es liegen das mein PC nach Bluescreen nicht neu startet ? in win7 ist es eingestellt das er nach 30sec neu starten soll, macht er aber nicht... dann hätte ich wenigstens die möglichkeit die clients von daheim aus neu zu starten
 
Ich hab das gleiche Problem wie A.Meier-PS3 :(

@ Beide (A.Meier-PS3 und PCGHGS)
Ich verstehe den Fehler gerade noch nicht

Hier ein Bild von meinem letzten "Upload-Hickup" - so sollte es eigentlich aussehen

Code:
[SIZE=2][21:10:58] Folding@home Core Shutdown: FINISHED_UNIT[/SIZE]
[SIZE=2][21:11:01] CoreStatus = 64 (100)[/SIZE]
[SIZE=2][21:11:01] Sending work to server[/SIZE]
[SIZE=2][21:11:01] Project: 6800 (Run 18339, Clone 0, Gen 29)[/SIZE]
 
 
[SIZE=2][21:11:01] + Attempting to send results [June 17 21:11:01 UTC][/SIZE]
[SIZE=2][21:11:01] Gpu type=3 species=21.[/SIZE]
[SIZE=2][21:11:02] - Couldn't send HTTP request to server[/SIZE]
[SIZE=2][21:11:02] + Could not connect to Work Server (results)[/SIZE]
[SIZE=2][21:11:02]     (171.64.65.64:8080)[/SIZE]
[SIZE=2][21:11:02] + Retrying using alternative port[/SIZE]
[SIZE=2][21:11:04] - Couldn't send HTTP request to server[/SIZE]
[SIZE=2][21:11:04] + Could not connect to Work Server (results)[/SIZE]
[SIZE=2][21:11:04]     (171.64.65.64:80)[/SIZE]
[SIZE=2][21:11:04] - Error: Could not transmit unit 08 (completed June 17) to work server.[/SIZE]
[SIZE=2][21:11:04]   Keeping unit 08 in queue.[/SIZE]
[SIZE=2][21:11:04] Project: 6800 (Run 18339, Clone 0, Gen 29)[/SIZE]
 
 
[SIZE=2][21:11:04] + Attempting to send results [June 17 21:11:04 UTC][/SIZE]
[SIZE=2][21:11:04] Gpu type=3 species=21.[/SIZE]
[SIZE=2][21:11:06] - Couldn't send HTTP request to server[/SIZE]
[SIZE=2][21:11:06] + Could not connect to Work Server (results)[/SIZE]
[SIZE=2][21:11:06]     (171.64.65.64:8080)[/SIZE]
[SIZE=2][21:11:06] + Retrying using alternative port[/SIZE]
[SIZE=2][21:11:08] - Couldn't send HTTP request to server[/SIZE]
[SIZE=2][21:11:08] + Could not connect to Work Server (results)[/SIZE]
[SIZE=2][21:11:08]     (171.64.65.64:80)[/SIZE]
[SIZE=2][21:11:08] - Error: Could not transmit unit 08 (completed June 17) to work server.[/SIZE]
 
 
[SIZE=2][21:11:08] + Attempting to send results [June 17 21:11:08 UTC][/SIZE]
[SIZE=2][21:11:08] Gpu type=3 species=21.[/SIZE]
[SIZE=2][21:21:10] - Couldn't send HTTP request to server[/SIZE]
[SIZE=2][21:21:10] + Could not connect to Work Server (results)[/SIZE]
[SIZE=2][21:21:10]     (171.67.108.26:8080)[/SIZE]
[SIZE=2][21:21:10] + Retrying using alternative port[/SIZE]
[SIZE=2][21:21:12] - Couldn't send HTTP request to server[/SIZE]
[SIZE=2][21:21:12] + Could not connect to Work Server (results)[/SIZE]
[SIZE=2][21:21:12]     (171.67.108.26:80)[/SIZE]
[SIZE=2][21:21:12]   Could not transmit unit 08 to Collection server; keeping in queue.[/SIZE]
[SIZE=2][21:21:12] - Preparing to get new work unit...[/SIZE]
[SIZE=2][21:21:12] Cleaning up work directory[/SIZE]
[SIZE=2][21:21:12] + Attempting to get work packet[/SIZE]
[SIZE=2][21:21:12] Gpu type=3 species=21.[/SIZE]
[SIZE=2][21:21:12] - Connecting to assignment server[/SIZE]
[SIZE=2][21:21:13] - Successful: assigned to (171.67.108.32).[/SIZE]
[SIZE=2][21:21:13] + News From Folding@Home: Welcome to Folding@Home[/SIZE]
[SIZE=2][21:21:13] Loaded queue successfully.[/SIZE]
[SIZE=2][21:21:13] Gpu type=3 species=21.[/SIZE]
[SIZE=2][21:21:14] Project: 6800 (Run 18339, Clone 0, Gen 29)[/SIZE]
 
 
[SIZE=2][21:21:14] + Attempting to send results [June 17 21:21:14 UTC][/SIZE]
[SIZE=2][21:21:14] Gpu type=3 species=21.[/SIZE]
[SIZE=2][21:21:16] - Couldn't send HTTP request to server[/SIZE]
[SIZE=2][21:21:16] + Could not connect to Work Server (results)[/SIZE]
[SIZE=2][21:21:16]     (171.64.65.64:8080)[/SIZE]
[SIZE=2][21:21:16] + Retrying using alternative port[/SIZE]
[SIZE=2][21:21:17] - Couldn't send HTTP request to server[/SIZE]
[SIZE=2][21:21:17] + Could not connect to Work Server (results)[/SIZE]
[SIZE=2][21:21:17]     (171.64.65.64:80)[/SIZE]
[SIZE=2][21:21:17] - Error: Could not transmit unit 08 (completed June 17) to work server.[/SIZE]
 
 
[SIZE=2][21:21:17] + Attempting to send results [June 17 21:21:17 UTC][/SIZE]
[SIZE=2][21:21:17] Gpu type=3 species=21.[/SIZE]
[SIZE=2][21:23:56] - Couldn't send HTTP request to server[/SIZE]
[SIZE=2][21:23:56] + Could not connect to Work Server (results)[/SIZE]
[SIZE=2][21:23:56]     (171.67.108.26:8080)[/SIZE]
[SIZE=2][21:23:56] + Retrying using alternative port[/SIZE]
[SIZE=2][21:23:57] - Couldn't send HTTP request to server[/SIZE]
[SIZE=2][21:23:57] + Could not connect to Work Server (results)[/SIZE]
[SIZE=2][21:23:57]     (171.67.108.26:80)[/SIZE]
[SIZE=2][21:23:57]   Could not transmit unit 08 to Collection server; keeping in queue.[/SIZE]
[SIZE=2][21:23:57] + Closed connections[/SIZE]
[SIZE=2][21:23:57] [/SIZE]
[SIZE=2][21:23:57] + Processing work unit[/SIZE]
[SIZE=2][21:23:57] Core required: FahCore_15.exe[/SIZE]
[SIZE=2][21:23:57] Core found.[/SIZE]
[SIZE=2][21:23:57] Working on queue slot 09 [June 17 21:23:57 UTC][/SIZE]
[SIZE=2][21:23:57] + Working ...[/SIZE]
[SIZE=2][21:23:58] [/SIZE]
[SIZE=2][21:23:58] *------------------------------*[/SIZE]
[SIZE=2][21:23:58] Folding@Home GPU Core[/SIZE]
[SIZE=2][21:23:58] Version 2.15 (Tue Nov 16 09:05:18 PST 2010)[/SIZE]
[SIZE=2][21:23:58] [/SIZE]
[SIZE=2][21:23:58] Build host: SimbiosNvdWin7[/SIZE]
[SIZE=2][21:23:58] Board Type: NVIDIA/CUDA[/SIZE]
[SIZE=2][21:23:58] Core      : x=15[/SIZE]
[SIZE=2][21:23:58]  Window's signal control handler registered.[/SIZE]
[SIZE=2][21:23:58] Preparing to commence simulation[/SIZE]
[SIZE=2][21:23:58] - Looking at optimizations...[/SIZE]
[SIZE=2][21:23:58] DeleteFrameFiles: successfully deleted file=work/wudata_09.ckp[/SIZE]
[SIZE=2][21:23:58] - Created dyn[/SIZE]
[SIZE=2][21:23:58] - Files status OK[/SIZE]
[SIZE=2][21:23:58] sizeof(CORE_PACKET_HDR) = 512 file=<>[/SIZE]
[SIZE=2][21:23:58] - Expanded 18944 -> 76495 (decompressed 403.7 percent)[/SIZE]
[SIZE=2][21:23:58] Called DecompressByteArray: compressed_data_size=18944 data_size=76495, decompressed_data_size=76495 diff=0[/SIZE]
[SIZE=2][21:23:58] - Digital signature verified[/SIZE]
[SIZE=2][21:23:58] [/SIZE]
[SIZE=2][21:23:58] Project: 11228 (Run 2, Clone 71, Gen 34)[/SIZE]
[SIZE=2][21:23:58] [/SIZE]
[SIZE=2][21:23:58] Assembly optimizations on if available.[/SIZE]
[SIZE=2][21:23:58] Entering M.D.[/SIZE]
[SIZE=2][21:24:00] Tpr hash work/wudata_09.tpr:  469755777 3199319680 3535063980 3203382003 637914983[/SIZE]
[SIZE=2][21:24:00] Working on 264 Fs_coil[/SIZE]
[SIZE=2][21:24:00] Client config found, loading data.[/SIZE]
[SIZE=2][21:24:00] Starting GUI Server[/SIZE]
[SIZE=2][21:24:00] Setting checkpoint frequency: 500000[/SIZE]
[SIZE=2][21:24:00] Setting checkpoint frequency: 500000[/SIZE]
[SIZE=2][21:24:44] Completed    500000 out of 50000000 steps (1%).[/SIZE]

Wie man sehen kann hat der Client nach rund 12 Minuten von sich aus weitergemacht
 
Ich grüße aus dem Krankenhaus! Ich hoffe meine PPD brechen nicht zu sehr ein derweil ich nicht da bin. zum Glück gibts den Teamviewer jetzt auch für android... vielleicht kann ich morgen wieder heeme.
 
@Bumblebee: Das Problem ist eben das er hängen bleibt und nicht selbständig sich eine neue WU holt und folglich auch nicht weiter versucht die Fertige hochzuladen > um das zu machen, muss ich den Clienten beenden und neustarten.

Ich weiss, in der Fahlog sieht es danach aus als hätte ich den Clienten um 2:18 beendet und erst um 3:27 wieder gestartet, aber dem ist eben leider nicht so. :(

@Knutowskie: Gute Besserung.
 
Zurück