UNSTABLE_MASHINE - 27WU´s ohne Probleme?!

  • Ersteller Ersteller CheGuarana
  • Erstellt am Erstellt am
C

CheGuarana

Guest
UNSTABLE_MASHINE - 27WU´s ohne Probleme?!

So, der Titel sagt ja alles!-.-

Code:
[19:50:37] Loaded queue successfully.
[19:50:37] - Preparing to get new work unit...
[19:50:37] + Attempting to get work packet
[19:50:37] - Connecting to assignment server
[19:50:38] - Successful: assigned to (171.67.108.11).
[19:50:38] + News From Folding@Home: Welcome to Folding@Home
[19:50:38] Loaded queue successfully.
[19:50:40] + Closed connections
[19:50:40] 
[19:50:40] + Processing work unit
[19:50:40] Core required: FahCore_11.exe
[19:50:40] Core found.
[19:50:40] Working on queue slot 02 [June 29 19:50:40 UTC]
[19:50:40] + Working ...
[19:50:40] 
[19:50:40] *------------------------------*
[19:50:40] Folding@Home GPU Core - Beta
[19:50:40] Version 1.19 (Mon Nov 3 09:34:13 PST 2008)
[19:50:40] 
[19:50:40] Compiler  : Microsoft (R) 32-bit C/C++ Optimizing Compiler Version 14.00.50727.762 for 80x86 
[19:50:40] Build host: amoeba
[19:50:40] Board Type: Nvidia
[19:50:40] Core      : 
[19:50:40] Preparing to commence simulation
[19:50:40] - Looking at optimizations...
[19:50:40] - Created dyn
[19:50:40] - Files status OK
[19:50:40] - Expanded 46634 -> 252912 (decompressed 542.3 percent)
[19:50:40] Called DecompressByteArray: compressed_data_size=46634 data_size=252912, decompressed_data_size=252912 diff=0
[19:50:40] - Digital signature verified
[19:50:40] 
[19:50:40] Project: 5766 (Run 5, Clone 140, Gen 809)
[19:50:40] 
[19:50:40] Assembly optimizations on if available.
[19:50:40] Entering M.D.
[19:50:46] Working on Protein
[19:50:47] Run: exception thrown during GuardedRun
[19:50:47] Run: exception thrown in GuardedRun -- Gromacs cannot continue further.
[19:50:47] Going to send back what have done -- stepsTotalG=0
[19:50:47] Work fraction=0.0000 steps=0.
[19:50:51] logfile size=0 infoLength=0 edr=0 trr=23
[19:50:51] - Writing 635 bytes of core data to disk...
[19:50:51] Done: 123 -> 124 (compressed to 100.8 percent)
[19:50:51]   ... Done.
[19:50:51] 
[19:50:51] Folding@home Core Shutdown: UNSTABLE_MACHINE
[19:50:54] CoreStatus = 7A (122)
[19:50:54] Sending work to server
[19:50:54] Project: 5766 (Run 5, Clone 140, Gen 809)


[19:50:54] + Attempting to send results [June 29 19:50:54 UTC]
[19:50:55] + Results successfully sent
[19:50:55] Thank you for your contribution to Folding@Home.
[19:50:59] - Preparing to get new work unit...
[19:50:59] + Attempting to get work packet
[19:50:59] - Connecting to assignment server
[19:51:00] - Successful: assigned to (171.67.108.11).
[19:51:00] + News From Folding@Home: Welcome to Folding@Home
[19:51:00] Loaded queue successfully.
[19:51:02] + Closed connections
[19:51:07] 
[19:51:07] + Processing work unit
[19:51:07] Core required: FahCore_11.exe
[19:51:07] Core found.
[19:51:07] Working on queue slot 03 [June 29 19:51:07 UTC]
[19:51:07] + Working ...
[19:51:07] 
[19:51:07] *------------------------------*
[19:51:07] Folding@Home GPU Core - Beta
[19:51:07] Version 1.19 (Mon Nov 3 09:34:13 PST 2008)
[19:51:07] 
[19:51:07] Compiler  : Microsoft (R) 32-bit C/C++ Optimizing Compiler Version 14.00.50727.762 for 80x86 
[19:51:07] Build host: amoeba
[19:51:07] Board Type: Nvidia
[19:51:07] Core      : 
[19:51:07] Preparing to commence simulation
[19:51:07] - Looking at optimizations...
[19:51:07] - Created dyn
[19:51:07] - Files status OK
[19:51:07] - Expanded 45406 -> 251112 (decompressed 553.0 percent)
[19:51:07] Called DecompressByteArray: compressed_data_size=45406 data_size=251112, decompressed_data_size=251112 diff=0
[19:51:07] - Digital signature verified
[19:51:07] 
[19:51:07] Project: 5771 (Run 4, Clone 24, Gen 825)
[19:51:07] 
[19:51:07] Assembly optimizations on if available.
[19:51:07] Entering M.D.
[19:51:14] Working on Protein
[19:51:14] Client config found, loading data.
[19:51:14] Starting GUI Server
[19:52:28] Completed 1%
[19:53:41] Completed 2%
[19:54:54] Completed 3%
 
AW: UNSTABLE_MASHINE - 27WU´s ohne Probleme?!

Ich habe das auch ab und zu gehabt, sogar bei meiner unübertakteten 4870. Manchmal ist es einfach Pech ;P

Nichts schlimmes, sofern es nicht mehrfach/häufiger auftritt.


EDIT: Notfalls lösche einmal die Cores und die Workunits, sodass die Cores geupdatet werden. Das sollte vielleicht helfen.
Meine 4870 hatte auch nur bei einer bestimmten FahCore-Version gelegentlich diesen Fehler.
 
AW: UNSTABLE_MASHINE - 27WU´s ohne Probleme?!

Also dieser fehler tritt immer auf, wenbn ein WU fertig ist und der nächste gestartet wird.

Nun ist es so, dass ich wenn das so weiter geht immer den Client neu starten müsste -.-
 
AW: UNSTABLE_MASHINE - 27WU´s ohne Probleme?!

Kann auch generell mit den momentanen Temp. zusammenhängen

Da wird so manche GPU "unstabile"
 
AW: UNSTABLE_MASHINE - 27WU´s ohne Probleme?!

Nun also das ist GPU 1 also eigentlich 2. Graka.

Die ist zwischen 77°C und 80°C, was normalität ist.
 
AW: UNSTABLE_MASHINE - 27WU´s ohne Probleme?!

bei mir ist der fehler jetzt auch aufgetreten. egal was ich tue (core + work unit löschen) der fehler kommt immer wieder. ich muss aber dazu sagen, das ich 2 gpu clients laufen habe und dass, bevor ich den client das erste mal beendet habe die meldung kam EUE limit erreicht - 24 h pause. Was hat das zu bedeuten?

[06:48:41] Project: 5905 (Run 2, Clone 817, Gen 7)
[06:48:41]
[06:48:41] Assembly optimizations on if available.
[06:48:41] Entering M.D.
[06:48:47] Tpr hash work/wudata_05.tpr: 3624433472 3192101820 1698196572 3598896556 1441773086
[06:48:48] mdrun_gpu returned
[06:48:48] Going to send back what have done -- stepsTotalG=0
[06:48:49] Work fraction=0.0000 steps=0.
[06:48:54] logfile size=4919 infoLength=4919 edr=0 trr=25
[06:48:56] - Writing 5457 bytes of core data to disk...
[06:48:57] Done: 4945 -> 1838 (compressed to 37.1 percent)
[06:48:59] ... Done.
[06:49:13]
[06:49:13] Folding@home Core Shutdown: UNSTABLE_MACHINE
[06:49:17] CoreStatus = 7A (122)
[06:49:17] Sending work to server
[06:49:17] Project: 5905 (Run 2, Clone 817, Gen 7)


[06:49:17] + Attempting to send results [July 8 06:49:17 UTC]
[06:49:18] + Results successfully sent
[06:49:18] Thank you for your contribution to Folding@Home.
[06:49:22] EUE limit exceeded. Pausing 24 hours.
 
Zuletzt bearbeitet:
AW: UNSTABLE_MASHINE - 27WU´s ohne Probleme?!

wenn ich 2 clients pro gpu laufen habe, tritt das prob nur auf wenn 2 clients mit fahcore14 laufen(1888 und 472 units)
um das prob zu beheben kenne ich keine mögl. außer nur einenn client laufen zu lassen, ich gehe davon aus das der vram ausgeht
 
AW: UNSTABLE_MASHINE - 27WU´s ohne Probleme?!

bei mir ist der fehler jetzt auch aufgetreten. egal was ich tue (core + work unit löschen) der fehler kommt immer wieder. ich muss aber dazu sagen, das ich 2 gpu clients laufen habe und dass, bevor ich den client das erste mal beendet habe die meldung kam EUE limit erreicht - 24 h pause. Was hat das zu bedeuten?

EUE Limit = Early-Unit-End Limit, Die Grenze an Abrüchen (glaub 10) einer WU ist erreicht und der Client geht von Fehlerhafter Hard- oder Software aus und fährt vorsichtshalber herunter um Schäden vorzubeugen um dann 24 Stunden Später seine Arbeit wieder aufzunehmen.

wenn ich 2 clients pro gpu laufen habe, tritt das prob nur auf wenn 2 clients mit fahcore14 laufen(1888 und 472 units)
um das prob zu beheben kenne ich keine mögl. außer nur einenn client laufen zu lassen, ich gehe davon aus das der vram ausgeht

Ich bin dabei mit mehreren Clienten auf meinen 2 9800 GTs zu experimentieren um sie auch nachts rechnen zu lassen, denn mein Vater baut um 22:00 Uhr den Router ab :schief::ugly::schief:, jedenfalls taucht das Problem auch bei 2 1888ern auf, mit Angabe des EUE Problems.
Die Clienten können halt einfach (noch) nicht das genaue Problem erkennen, bzw. dass es einfach am VRam mangelt.
 
AW: UNSTABLE_MASHINE - 27WU´s ohne Probleme?!

Unstabile's und EUE's entstehen zum Beispiel auch, wenn beim GPU der Speicher ausgeht
... also zum Beispiel auf einer 512er Karte 2 1888er (zB. WU 5911 und 5905) laufen
 
AW: UNSTABLE_MASHINE - 27WU´s ohne Probleme?!

Das würde mein Problem erklären. Ein Temp. problem wars mit Sicherheit nicht.Hm dann werden ich wohl demnächst Speicher aufrüsten müssen (neue graka) ;-).
 
Zurück