[Sammelthread] Der Serverwahn

Mein Server hat jetzt zwei von diesen sogenannten "BigSMP" gefaltet und um ganz ehrlich zu sein, das was Standfort uns an Punkten gutschreibt empfinde ich als Beleidigung. :daumen2:

Rechenaufwand und Hardwareanforderungen sind praktisch 1:1 mit den ausgelaufenen BigWU's vergleichbar, aber bekomme 10-15% weniger Punkte als wenn ich die normale SMP's falte. :stupid:


Bevor mir einer ne Moralpredigt halten will:
Wen ich nicht an die gute Sache dahinter glauben würde, hätte ich sicher nicht seit bald 7 Jahren gefaltet, aber irgendwo hab auch ich meinen Falterstolz und für das was uns Standfort da an "Lohn" anbietet ist in meinen Augen ne Beleidigung. :kotz:

Ich bin Realist genug mich nicht der Wunschvorstellung hinzugeben das die BigSMP's Punktemässig den alten BigWU's gleichkommen, aber wenn nicht Minimum 10% mehr als bei den regulären SMP's drin sind, sehe ich nicht ein wieso ich diese WU's falten soll. :nene:

Darum sag ich jetzt: Jede WU ist wichtig > auch die normalen SMP's die mein Server nun falten wird. :schief:
Ja, sehe ich auch so....von wegen großen SMPs....das sind BIGs, nur halt mit SMP-Punkten....oder sogar etwas weniger. Einfach eine Frechheit, diese so zu verkaufen. :daumen2:
 
Ich hab gerade den Eindruck Standfort will mich gerade zu diesen BigSMP's nötigen :-_-::
Vor guten 2,5h ist die zweite BigSMP (P8108) fertig geworden und ich hatte wieder auf advanced umgestellt > der Server bekommt einfach keine neue WU. :wall:

Da ich wie bereits erwähnt kein Lust habe, ne weitere BigSMP's falten zu lassen, war ich jetzt mal so frech und habe mir einen 2. SMP-Clienten eingerichtet (pro Client 16 Threads):
Ging keine 5s da hatte beide Clienten je eine WU zum falten und es kommt PPD-mässig ziemlich genau das Gleiche raus wie bei einer BigSMP. :nene:
 
Das "Problem" bei vielen "neuen" CoreA4-WU´s:
Die Ausgabe ist auf maximal 8 Kerne limitiert, d. h. Rechner mit mehr CPU-Kernen bekommen diese nicht mehr zugewiesen . . . :wall:
 
Das "Problem" bei vielen "neuen" CoreA4-WU´s:
Die Ausgabe ist auf maximal 8 Kerne limitiert, d. h. Rechner mit mehr CPU-Kernen bekommen diese nicht mehr zugewiesen . . . :wall:

Fakt ist, dass die "Multi-Falter" nun "das dreckige Ende vom Knüppel" in der Hand haben
Pande sieht es einfach als die sinnvollste Lösung an "die Masse" zu befriedigen; kann man so sehen - muss man aber nicht
Es wäre durchaus möglich den Multi-Cores weiteres "Futter" zu geben
 
Ich für meinen Teil werde mal vorläufig mit zwei SMP-Clienten falten.

Was mich stutzig macht, ist der Umstand das der Server der unter anderem die P7520 verteilt hat (128.143.199.97) schon seit 2,5 Tagen auf "Reject" steht. :huh:
 
... ich glaube die Kollegen kommen gerade mit der Bereitstellung der WUs nicht hinterher. Nur noch 0x15 WUs für Nvidias , der NaCl hat auch kein Futter mehr :(
 
Istdoch bei mir genau das gleiche :(
Vorgestern noch das Glück gehabt einen ganzen Tag nur 17er zu bekommen, gestern waren dafür ausschließlich Core_15 angesagt. Und das merkt man auch brutal bei den Punkten: vorgestern 227.595, gestern nur sehr magere 91.416 Punkte.
 
Ich für meinen Teil werde mal vorläufig mit zwei SMP-Clienten falten.
Die Idee kam mir dann gestern auch noch, damit sollte der Client dann wieder für "normale" SMP-Projekte qualifiziert / limitiert sein und wie die anderen auch mit neuen Projekten versorgt werden. Ist evtl. nicht so effizient, könnte jedoch auch einen Vorteil bringen, da die normalen SMP-Projekte sicher nicht für so viele Kerne optimiert sind.
 
Wie schon weiter vorne geschrieben hatte ich eine 8108er, abgerechnet bekam ich etwas über 85,6k Punkte. Akt. lass ich gerade mal mein 6300er FX und die 770 falten. Zwar mit ca. 25W mehr aber dafür bei >120k an Punkten. Wozu sollte ich also den 32-Core noch anwerfen ?!? Will zufällig wer den ?
Ernüchternd und traurig ... :daumen2: ... zumal ich mir die Maschine nur wg.´s Falten gebaut habe ... !
 
Zuletzt bearbeitet:
Ich bin gerade am RAM-Timings-Tuning des Server dran und ich hoffe was ich sehe stimmt gerade gar nicht, ist aber allerdings schon die 2. WU mit diesen Werten:
2 SMP-Clienten à 16 Threads = zusammen ~132kPPD
1 SMP-Client alle 32 Threads = ~97kPPD :what:

Ich falte gerade mit nur einem Clienten weil dies vermutlich besser ist um die Stabilität der Timings auszutesten, ausserdem ist der Fahlog mit 2 Clienten sehr unübersichtlich.
 
Ich würde sogar mal 4 SMP-Clienten à 8 Threads testen.
Ich hab es mal aus Neugierde gestartet > ~87kPPD

Wird also ineffizient mit vieren und der Log was die Übersichtlichkeit anbelangt .... seht selber :ugly:
08:09:19:WU00:FS00:Starting
08:09:19:WU00:FS00:Running FahCore: /usr/bin/FAHCoreWrapper /var/lib/fahclient/cores/web.stanford.edu/~pande/Linux/AMD64/Core_a4.fah/FahCore_a4 -dir 00 -suffix 01 -version 703 -lifeline 1532 -checkpoint 3 -np 8
08:09:19:WU00:FS00:Started FahCore on PID 2873
08:09:19:WU00:FS00:Core PID:2877
08:09:19:WU00:FS00:FahCore 0xa4 started
08:09:19:WU02:FS01:Starting
08:09:19:WU02:FS01:Running FahCore: /usr/bin/FAHCoreWrapper /var/lib/fahclient/cores/web.stanford.edu/~pande/Linux/AMD64/Core_a4.fah/FahCore_a4 -dir 02 -suffix 01 -version 703 -lifeline 1532 -checkpoint 3 -np 8
08:09:19:WU02:FS01:Started FahCore on PID 2878
08:09:19:WU02:FS01:Core PID:2882
08:09:19:WU02:FS01:FahCore 0xa4 started
08:09:19:WU03:FS02:Starting
08:09:19:WU03:FS02:Running FahCore: /usr/bin/FAHCoreWrapper /var/lib/fahclient/cores/web.stanford.edu/~pande/Linux/AMD64/Core_a4.fah/FahCore_a4 -dir 03 -suffix 01 -version 703 -lifeline 1532 -checkpoint 3 -np 8
08:09:19:WU03:FS02:Started FahCore on PID 2883
08:09:19:WU03:FS02:Core PID:2887
08:09:19:WU03:FS02:FahCore 0xa4 started
08:09:19:WU04:FS03:0xa4:
08:09:19:WU04:FS03:0xa4:*------------------------------*
08:09:19:WU04:FS03:0xa4:Folding@Home Gromacs GB Core
08:09:19:WU04:FS03:0xa4:Version 2.27 (Dec. 15, 2010)
08:09:19:WU04:FS03:0xa4:
08:09:19:WU04:FS03:0xa4:Preparing to commence simulation
08:09:19:WU04:FS03:0xa4:- Looking at optimizations...
08:09:19:WU04:FS03:0xa4:- Created dyn
08:09:19:WU04:FS03:0xa4:- Files status OK
08:09:19:WU04:FS03:0xa4:- Expanded 827128 -> 1400900 (decompressed 169.3 percent)
08:09:19:WU04:FS03:0xa4:Called DecompressByteArray: compressed_data_size=827128 data_size=1400900, decompressed_data_size=1400900 diff=0
08:09:19:WU04:FS03:0xa4:- Digital signature verified
08:09:19:WU04:FS03:0xa4:
08:09:19:WU04:FS03:0xa4:Project: 9007 (Run 1278, Clone 1, Gen 59)
08:09:19:WU04:FS03:0xa4:
08:09:19:WU04:FS03:0xa4:Assembly optimizations on if available.
08:09:19:WU04:FS03:0xa4:Entering M.D.
08:09:19:WU00:FS00:0xa4:
08:09:19:WU00:FS00:0xa4:*------------------------------*
08:09:19:WU00:FS00:0xa4:Folding@Home Gromacs GB Core
08:09:19:WU00:FS00:0xa4:Version 2.27 (Dec. 15, 2010)
08:09:19:WU00:FS00:0xa4:
08:09:19:WU00:FS00:0xa4:Preparing to commence simulation
08:09:19:WU00:FS00:0xa4:- Looking at optimizations...
08:09:19:WU00:FS00:0xa4:- Files status OK
08:09:19:WU00:FS00:0xa4:- Expanded 204754 -> 431956 (decompressed 210.9 percent)
08:09:19:WU00:FS00:0xa4:Called DecompressByteArray: compressed_data_size=204754 data_size=431956, decompressed_data_size=431956 diff=0
08:09:19:WU00:FS00:0xa4:- Digital signature verified
08:09:19:WU00:FS00:0xa4:
08:09:19:WU00:FS00:0xa4:Project: 6390 (Run 34, Clone 0, Gen 293)
08:09:19:WU00:FS00:0xa4:
08:09:19:WU00:FS00:0xa4:Assembly optimizations on if available.
08:09:19:WU00:FS00:0xa4:Entering M.D.
08:09:19:WU02:FS01:0xa4:
08:09:19:WU02:FS01:0xa4:*------------------------------*
08:09:19:WU02:FS01:0xa4:Folding@Home Gromacs GB Core
08:09:19:WU02:FS01:0xa4:Version 2.27 (Dec. 15, 2010)
08:09:19:WU02:FS01:0xa4:
08:09:19:WU02:FS01:0xa4:Preparing to commence simulation
08:09:19:WU02:FS01:0xa4:- Looking at optimizations...
08:09:19:WU02:FS01:0xa4:- Files status OK
08:09:19:WU02:FS01:0xa4:- Expanded 827608 -> 1400900 (decompressed 169.2 percent)
08:09:19:WU02:FS01:0xa4:Called DecompressByteArray: compressed_data_size=827608 data_size=1400900, decompressed_data_size=1400900 diff=0
08:09:19:WU02:FS01:0xa4:- Digital signature verified
08:09:19:WU02:FS01:0xa4:
08:09:19:WU02:FS01:0xa4:Project: 9007 (Run 509, Clone 1, Gen 170)
08:09:19:WU02:FS01:0xa4:
08:09:19:WU02:FS01:0xa4:Assembly optimizations on if available.
08:09:19:WU02:FS01:0xa4:Entering M.D.
08:09:19:WU03:FS02:0xa4:
08:09:19:WU03:FS02:0xa4:*------------------------------*
08:09:19:WU03:FS02:0xa4:Folding@Home Gromacs GB Core
08:09:19:WU03:FS02:0xa4:Version 2.27 (Dec. 15, 2010)
08:09:19:WU03:FS02:0xa4:
08:09:19:WU03:FS02:0xa4:Preparing to commence simulation
08:09:19:WU03:FS02:0xa4:- Looking at optimizations...
08:09:19:WU03:FS02:0xa4:- Files status OK
08:09:19:WU03:FS02:0xa4:- Expanded 918654 -> 1523092 (decompressed 165.7 percent)
08:09:19:WU03:FS02:0xa4:Called DecompressByteArray: compressed_data_size=918654 data_size=1523092, decompressed_data_size=1523092 diff=0
08:09:19:WU03:FS02:0xa4:- Digital signature verified
08:09:19:WU03:FS02:0xa4:
08:09:19:WU03:FS02:0xa4:Project: 9010 (Run 852, Clone 2, Gen 143)
08:09:19:WU03:FS02:0xa4:
08:09:19:WU03:FS02:0xa4:Assembly optimizations on if available.
08:09:19:WU03:FS02:0xa4:Entering M.D.
08:09:25:WU04:FS03:0xa4:Completed 0 out of 250000 steps (0%)
08:09:25:WU00:FS00:0xa4:Completed 0 out of 2500000 steps (0%)
08:09:25:WU02:FS01:0xa4:Completed 0 out of 250000 steps (0%)
08:09:25:WU03:FS02:0xa4:Completed 0 out of 250000 steps (0%)
08:10:36:WU04:FS03:0xa4:Completed 2500 out of 250000 steps (1%)
08:10:38:WU02:FS01:0xa4:Completed 2500 out of 250000 steps (1%)
08:10:43:WU03:FS02:0xa4:Completed 2500 out of 250000 steps (1%)
08:10:54:WU00:FS00:0xa4:Completed 25000 out of 2500000 steps (1%)
08:11:46:WU04:FS03:0xa4:Completed 5000 out of 250000 steps (2%)
08:11:50:WU02:FS01:0xa4:Completed 5000 out of 250000 steps (2%)
08:12:01:WU03:FS02:0xa4:Completed 5000 out of 250000 steps (2%)
08:12:24:WU00:FS00:0xa4:Completed 50000 out of 2500000 steps (2%)
08:12:57:WU04:FS03:0xa4:Completed 7500 out of 250000 steps (3%)
08:13:03:WU02:FS01:0xa4:Completed 7500 out of 250000 steps (3%)
08:13:19:WU03:FS02:0xa4:Completed 7500 out of 250000 steps (3%)
08:13:53:WU00:FS00:0xa4:Completed 75000 out of 2500000 steps (3%)
08:14:07:WU04:FS03:0xa4:Completed 10000 out of 250000 steps (4%)
08:14:15:WU02:FS01:0xa4:Completed 10000 out of 250000 steps (4%)
08:14:36:WU03:FS02:0xa4:Completed 10000 out of 250000 steps (4%)
08:14:55:WU01:Sending unit results: id:01 state:SEND error:NO_ERROR project:7520 run:50 clone:2 gen:457 core:0xa4 unit:0x000001f5fbcb017d51229ad37dc10b69
08:14:55:WU01:Uploading 13.48MiB to 128.143.199.97
08:14:55:WU01:Connecting to 128.143.199.97:8080
\x1b[93m08:14:55:WARNING:WU01:WorkServer connection failed on port 8080 trying 80\x1b[0m
08:14:55:WU01:Connecting to 128.143.199.97:80
\x1b[93m08:14:55:WARNING:WU01:Exception: Failed to send results to work server: Failed to connect to 128.143.199.97:80: Connection refused\x1b[0m
08:15:17:WU04:FS03:0xa4:Completed 12500 out of 250000 steps (5%)
08:15:22:WU00:FS00:0xa4:Completed 100000 out of 2500000 steps (4%)
08:15:28:WU02:FS01:0xa4:Completed 12500 out of 250000 steps (5%)
08:15:54:WU03:FS02:0xa4:Completed 12500 out of 250000 steps (5%)
08:16:28:WU04:FS03:0xa4:Completed 15000 out of 250000 steps (6%)
08:16:40:WU02:FS01:0xa4:Completed 15000 out of 250000 steps (6%)
08:16:52:WU00:FS00:0xa4:Completed 125000 out of 2500000 steps (5%)
08:17:13:WU03:FS02:0xa4:Completed 15000 out of 250000 steps (6%)
08:17:38:WU04:FS03:0xa4:Completed 17500 out of 250000 steps (7%)
08:17:53:WU02:FS01:0xa4:Completed 17500 out of 250000 steps (7%)
 
Ich falte mit meinem Server die "großen SMPs", auch wenn die PPD fast weniger sind als mit SMP.
Ich denke so:
Meine zwei Systeme brauchen insgesamt 860W.
Ich schaffe momentan ca. 740K PPD.
Also mit 860W schaffe ich 740K PPD. Das ist doch nicht schlecht, wenn man es als gesamtes betrachtet.:daumen:
Früher war es umgekehrt, da musste mein Server das gutmachen, was die Grafikkarten nicht schafften.....:devil:
 
Ich habe 2 gute und 1 schlechte Nachrichten:
1. Gute Nachricht: OC des Server ist abgeschlossen > bei den BigSMP's ~15kPPD mehr durch RAM-Timings-Optimierung und ~30W weniger Verbrauch durch Undervolting :devil:

Schlechte Nachricht: In der Nacht auf heute hat es mir das BIOS bzw. den Chip komplett zerschossen :wall: > sprich entweder einen neuen Bios-Chip oder ein Mod-Bios (versuchen gerade die 2. Möglichkeit)

2. Gute Nachricht: beim aktuellsten BIOS (5701) kann ich den PCI-E Support auf 2.0 fixieren so das ich den Server wenigsten mit einem Xeon betreiben kann > statt den 145kPPD sind es halt nur 65kPPD :rollen:
 
Zuletzt bearbeitet:
Zurück