[Sammelthread] Der Serverwahn

Nach 4 Wochen hab ich endlich meinen Ersatz-RAM-Kit bekommen:
Hab ihn eingebaut, allerdings musste ich wieder so einen seltsamen Kampf führen das alle 8 Riegel sauber erkannt wurden :what: > unter 1333MHz alle erkannt aber unter 1600MHz wurde einer wieder nur mit 0MB angegeben. Damit alle 8 erkannt wurden musste ich beide Kit's mischen. :what:

Was auffälig am neuen Kit war, das eine andere Revisionsnummer draufstand > der bereits verbaute Kit 2.18 und der neue 3.19.

Jetzt läuft die Sache, aber so ganz beruhigt bin ich noch nicht. :hmm:
Mal schauen wie sie die TPF entwickeln.
 
Mein Server hat in den letzten paar Stunden ein paar Frames der angefangenen P8101 gefaltet und die RAMs liefen mit den gleichen Einstellungen (1600MHz und 8-8-8-24):
Dual-Channel TPF 17:10min ~243kPPD
Quad-Channel TPF 16:35min ~256kPPD
ergibt ein Leistungsplus von 3,4% bei den TPF und 5,3% bei den PPD. :devil:

Hoffen wir dass das Ganze stabil läuft. :hail:
 
Mein Server hat in den letzten paar Stunden ein paar Frames der angefangenen P8101 gefaltet und die RAMs liefen mit den gleichen Einstellungen (1600MHz und 8-8-8-24):
Dual-Channel TPF 17:10min ~243kPPD
Quad-Channel TPF 16:35min ~256kPPD
ergibt ein Leistungsplus von 3,4% bei den TPF und 5,3% bei den PPD. :devil:

Hoffen wir dass das Ganze stabil läuft. :hail:
Ja, ich drück Dir alle Daumen!:daumen:
Schöne TPFs hast Du jetzt mit Quadchannel:daumen:
 
mihapiha SuperMicro H8QGi+-F ohne OC| 4x AMD Opteron 6180 SE @ 2,5 GHz (48/48) .../370.000 (P6901) /375.000 (P8101) 650W Ubuntu 10.1

Bitte hinzufügen. Ich werde mich selber noch in die SMP Seite eintragen, wenn meine Werte nach ein paar WUs dann wirklich genau stimmen ;)
 
Zuletzt bearbeitet:
Extrem nette Maschinen sind hier mittlerw. zusammen gekommen. :daumen:
Wie weit kann man das nun weiter "treiben" / "spinnen" ?? Ab wieviel CPUs/Kernen ist denn nun Schluss mit der Falterei ? Was "erträgt" der Client u. Betriebs-Sys nun max. ?
 
Extrem nette Maschinen sind hier mittlerw. zusammen gekommen. :daumen:
Wie weit kann man das nun weiter "treiben" / "spinnen" ?? Ab wieviel CPUs/Kernen ist denn nun Schluss mit der Falterei ? Was "erträgt" der Client u. Betriebs-Sys nun max. ?
Linux ist quasi unlimited , 512 Kerne gehen ohne Probleme , Kernelseitig.

Beim Client gibt es ab 64Kernen keine wirklichen Daten mehr , da dann nur noch Intels Socket 1567 in Frage kommt den kaum jemand verwendet weil 4P 2011 schneller ist als 4P 1567.8P 1567 ist derart teuer und selten dass es da keine zuverlässigen Daten gibt da bei dem einen Fall der mir bekannt ist leider Windows Server verwendet wurde. Man darf also gespannt auf IB-EP mit über 10 Kernen auf Socket 2011 warten ;)
 
Ich fürchte mein Server läuft doch nicht stabil: heute Morgen um ca. 9Uhr hätte die aktuelle P8101 fertig werden sollen, aber bis jetzt wurde sie nicht gezählt.
 
Ich fürchte mein Server läuft doch nicht stabil: heute Morgen um ca. 9Uhr hätte die aktuelle P8101 fertig werden sollen, aber bis jetzt wurde sie nicht gezählt.

:( Das ist aber sehr bedauerlich. Da investiert man soviel Geld und am Ende geht nicht alles wie erwünscht.

Mein Server scheint wunderbar zu funktionieren - zwar noch ohne OC, aber immerhin ... Seit Mitternacht wird eine P8101 WU gefaltet. Die sollte heute am späten Abend fertig sein..
 
Ich fürchte mein Server läuft doch nicht stabil: heute Morgen um ca. 9Uhr hätte die aktuelle P8101 fertig werden sollen, aber bis jetzt wurde sie nicht gezählt.
Wurde sie abgegeben?

Ich würde wirklich die Timings vom Ram entschärfen, also CL9 draus machen mit 1600MHZ. Mit wieviel Spannung hast Du die RAMs betrieben? Mein 2687W-RAM läuft auch mit 1600MHZ/CL9/1,5V.:daumen:
 
Wurde sie abgegeben?

Ich würde wirklich die Timings vom Ram entschärfen, also CL9 draus machen mit 1600MHZ. Mit wieviel Spannung hast Du die RAMs betrieben? Mein 2687W-RAM läuft auch mit 1600MHZ/CL9/1,5V.:daumen:
Server war abgestürzt. :(

Wahrscheinlich ist auch die WU hin, aber mit Sicherheit sagen kann ich es noch nicht, da ich die FAHlog bis jetzt noch nicht gefunden habe.

Hab jetzt die RAM-Timings entschärft, also jetzt auch 1600MHZ/CL9/1,5V.
Gemäss Bios werden die RAMs mit 1.490V betrieben.
 
.......
Gemäss Bios werden die RAMs mit 1.490V betrieben.
Stell doch lieber die Spannung manual auf 1,5V. Auch wenn die richtige angezeigt wird.....ich trau dem Board nicht, dass die Spannung automatisch evtl. verändert wird bei Belastung.....ich weiß, ist sehr unwahrscheinlich, aber alles ist relativ....:daumen:

Fr.Edit: Die Timings machen viel aus. hatte mal kurzzeitig den Server statt mit CL9 mit CL11 am laufen, da ich komischerweise die Einstellung im Bios für die Timings nicht gefunden hatte. Da stürzte er nach ein paar WUs ab.....obwohl die CL11 ja eigentlich lockerer sind als CL9......wird aber dadurch auch instabil......
 
Zuletzt bearbeitet:
Damit die Spannung auch wirklich 1,5V hat musste ich leicht erhöhen > 1,515V bzw. 1,520V.
Hab die CL9 jetzt auch manuell eingestellt.


Edit:
Hab die Log gefunden: wen ich sie richtig verstanden habe, ist mir der Server genau abgestürzt nachdem er die P8101 fertig gefaltet und komprimiert hatte und bevor er sie hochladen wollte. :wall::motz::nene: :heul:

06:18:54] Completed 247500 out of 250000 steps (99%)
[06:35:30] Completed 250000 out of 250000 steps (100%)
[06:35:42] DynamicWrapper: Finished Work Unit: sleep=10000
[06:35:52]
[06:35:52] Finished Work Unit:
[06:35:52] - Reading up to 64340496 from "work/wudata_02.trr": Read 64340496
[06:35:52] trr file hash check passed.
[06:35:53] - Reading up to 31556864 from "work/wudata_02.xtc": Read 31556864
[06:35:53] xtc file hash check passed.
[06:35:53] edr file hash check passed.
[06:35:53] logfile size: 223632
[06:35:53] Leaving Run
[06:35:53] - Writing 96281868 bytes of core data to disk...
[06:36:08] Done: 96281356 -> 91521040 (compressed to 5.8 percent)
[06:36:08] ... Done.

--- Opening Log file
[October 24 16:02:18 UTC]

# Linux SMP Console Edition ###################################################
###############################################################################
Folding@Home Client Version 6.34
Folding@home - HomePage
###############################################################################
###############################################################################

Launch directory: /var/lib/folding
Executable: /var/lib/folding/fah6
Arguments: -bigadv -verbosity 9 -smp 32

[16:02:18] - Ask before connecting: No
[16:02:18] - User name: A.Meier-PS3 (Team 70335)
 
Zuletzt bearbeitet:
Damit die Spannung auch wirklich 1,5V hat musste ich leicht erhöhen > 1,515V bzw. 1,520V.
Hab die CL9 jetzt auch manuell eingestellt.


Edit:
Hab die Log gefunden: wen ich sie richtig verstanden habe, ist mir der Server genau abgestürzt nachdem er die P8101 fertig gefaltet und komprimiert hatte und bevor er sie hochladen wollte. :wall::motz::nene: :heul:

06:18:54] Completed 247500 out of 250000 steps (99%)
[06:35:30] Completed 250000 out of 250000 steps (100%)
[06:35:42] DynamicWrapper: Finished Work Unit: sleep=10000
[06:35:52]
[06:35:52] Finished Work Unit:
[06:35:52] - Reading up to 64340496 from "work/wudata_02.trr": Read 64340496
[06:35:52] trr file hash check passed.
[06:35:53] - Reading up to 31556864 from "work/wudata_02.xtc": Read 31556864
[06:35:53] xtc file hash check passed.
[06:35:53] edr file hash check passed.
[06:35:53] logfile size: 223632
[06:35:53] Leaving Run
[06:35:53] - Writing 96281868 bytes of core data to disk...
[06:36:08] Done: 96281356 -> 91521040 (compressed to 5.8 percent)
[06:36:08] ... Done.

--- Opening Log file
[October 24 16:02:18 UTC]

# Linux SMP Console Edition ###################################################
###############################################################################
Folding@Home Client Version 6.34
Folding@home - HomePage
###############################################################################
###############################################################################

Launch directory: /var/lib/folding
Executable: /var/lib/folding/fah6
Arguments: -bigadv -verbosity 9 -smp 32

[16:02:18] - Ask before connecting: No
[16:02:18] - User name: A.Meier-PS3 (Team 70335)

Ich habe den gleichen Fehler... Aber ich hatte das Problem schon mal... Und da lag es an dem Clienten. Vielleicht neu installieren... :(
Ich habe auf SMP WUs umgeschaltet und lasse den Server nicht BIG WUs falten, solange nicht's upgeloaded wird... Außerdem bin ich noch am OC testen...
Leider erwiesen sich 15% als auch 12.5% OC als zuviel... Ich teste gerade mit 10% OC...
 
Schlecht Nachrichten: Ich bekomme den Server einfach nicht stabil hin mit mehr als zwei RAM-Riegel pro CPU > weder mit vier noch drei RAM-Riegel pro CPU. :(

Den Server betreibe ich nun wieder im Dual-Channel, da ist er wenigstens faltstabil.

Langsam hege ich den Verdacht das ich beim Montieren der CPU-Kühler mit den langen Schrauben ne Leiterbahn der RAM-Bänke beschädigt habe > ich hatte ja eine mal von Hand lose eingeschraubt um zu schauen ob es so gehen würde und dabei gemerkt das die Schraube am Mainboard anstösst > da reicht ne scharfe Kante und schon hätte man den Salat. :-_-:

Andere Möglichkeit wäre das ich einfach Pech gehabt habe mit den ES, was ich allerdings eher weniger glaube.


@mihapiha: Liegt defintiv nicht am Client > der Server ist auch abgestürzt ohne das der Client lief.

Ich hab für heute genug >
 
mihapiha SuperMicro H8QGi+-F mit OC | 4x AMD Opteron 6180 SE @ 2,75 GHz (48/48) 200.000/450.000 (P6901) /.... 700W Ubuntu 10.1

OC scheint erfolgreich gewesen zu sein. Um 10% konnte ich übertakten, und der Unterschied ist schon massiv, meiner Meinung nach. Ich kann mich mit den PPD Angaben noch etwas irren, da nach und nach die WUs nun fertig gestellt werden, und ich dann erst ganz genaue Ergebnisse angeben kann. Mit OC habe ich auch noch keine P8101 WU bekommen, die ich hätte bewerten können, aber immerhin sind ja die Ergebnisse mal gut. Ich erwarte aber bei der P8101 zwischen 11:40 vielleicht 11:30 TPF was in rund 420k PPD resultieren könnte.

Sobald ich mehr weiß, lasse ich es euch wissen. Wenn aber so weiter gefaltet wird, sind meine PPD mit nur einem System gewaltig gut. Außerdem ist der Verbrauch mit der Übertaktung etwas gestiegen, obwohl die Spannung nicht verändert werden kann. Aber es ist möglich, dass das WU bezogen ist, und dass die P8101 WU "nur" 650W braucht. Die jetzigen Angaben beziehen sich hauptsächlich auf eine P6901 WU...

Siehe Bild unten
 

Anhänge

  • Bildschirmfoto.png
    Bildschirmfoto.png
    187,4 KB · Aufrufe: 56
................

Andere Möglichkeit wäre das ich einfach Pech gehabt habe mit den ES, was ich allerdings eher weniger glaube.


@mihapiha: Liegt defintiv nicht am Client > der Server ist auch abgestürzt ohne das der Client lief.

Ich hab für heute genug >

Nein, das glaub ich auch nicht, dass es die CPUs sind. Dann bleib doch bei Dualchannel.....wenn er so stabil läuft, dann verzichte auf die max. 15K PPD....:daumen:
Denn das ganze Board deswegen auszutauschen ist auch wieder mit viel Aufwand verbunden, oder?
 
Aufwand ginge ja noch, aber das wäre dann ja kein Garantiefall und noch mal ein Mainboard (~420Euro) zu kaufen zu wäre defintiv zu teuer für 13kPPD. :daumen2:

wenn selbst du nicht genau die beschädigte Leiterbahn sehen kannst, wie soll das dann der Mainboardhersteller? nen defekter Ram slot ist jetzt nicht so ungewöhnlich. von daher... obwohl man doch nur durch reinschrauben einer Schraube keine Leiterbahnen beschädigen können sollte. (so lange man die nicht fallen lässt)
 
Zurück