Rumpelkammer: PCGH Folding@Home-Thread II

sind sporadische BSODs nicht normal für ne AMD Karte? Meine R9 280x kann das auch:ugly:. Hab manchmal das Gefühl, dass das ganz von der Wetterlage abhängt... Mein letzter BSOD war am 14.06. und der letzte explizite Grafikkartenfehler am 09.06. (davor traten allerdings Graka Fehler fast jeden zweiten Tag auf, hab aber nix großartig verändert) Übertaktet ist sie auch schon lange nicht mehr.
 
sind sporadische BSODs nicht normal für ne AMD Karte? Meine R9 280x kann das auch:ugly:. Hab manchmal das Gefühl, dass das ganz von der Wetterlage abhängt... Mein letzter BSOD war am 14.06. und der letzte explizite Grafikkartenfehler am 09.06. (davor traten allerdings Graka Fehler fast jeden zweiten Tag auf, hab aber nix großartig verändert) Übertaktet ist sie auch schon lange nicht mehr.

Nö.
Wenn ich solche Probleme hätte, hätte ich nicht seit mehr als 3 Jahren eine HD5870 laufen - und im selben System eine HD7870@1200MHz, die seit fast einem Jahr übertaktet vor sich hinfaltet - selbstverständlich ohne Probleme.
Und das, obwohl diese Win7-Installation problemlos das Mobo (und die "Startfestplatte" - jetzt SSD) gewechselt hat - natürlich ohne Neuinstallation . . .

Und den letzten Bluescreen auf der R9 290X hatte ich nur, weil das Mobo (ASUS P5Q Pro) schon ziemlich "ausgelutscht" ist (GPU steckt im zweiten PCIE 2.0-8-Slot, weil der erste mit 16 Lanes bereits den "Geist aufgegeben" hat) :D und als offenes System manchmal auf "zu rauhen Umgang" reagiert. :schief:

Was aber mit Vorsicht (bei mir) "zu genießen ist" - der neue Cat 14.6 Beta:
Er faltet sowohl auf HD5870 als auch auf HD7870 stabil (bis jetzt) - aber zum Spielen taugt er noch nicht (produziert z. B. bei WoT Treiberresets, welche ein Spielen unmöglich macht - Cat 14.4 WHQL läuft problemlos).

Wer also behauptet, Bluescreens seien "normal", der ist nicht "Herr im Hause" ;) (ich hab meine Systeme "im Griff" - nicht umgekehrt :devil:) :D


Edit:
Vielleicht liegt das auch daran, dass ich seit "Anbeginn" alle meine Systeme selbst baue (beginnend mit einem Amiga2000 im Jahr 1988) . . .
 
Zuletzt bearbeitet:
Mein V7.4.4 GPU-Client hängt schon seit einigen Minuten mit einer Projekt 13001 WU bei 99,99% fest und wird nicht fertig. Was kann ich da tun?

Edit: Hat sich erledigt, er hat es inzwischen doch geschafft.
 
Zuletzt bearbeitet:
sind sporadische BSODs nicht normal für ne AMD Karte? Meine R9 280x kann das auch:ugly:. Hab manchmal das Gefühl, dass das ganz von der Wetterlage abhängt... Mein letzter BSOD war am 14.06. und der letzte explizite Grafikkartenfehler am 09.06. (davor traten allerdings Graka Fehler fast jeden zweiten Tag auf, hab aber nix großartig verändert) Übertaktet ist sie auch schon lange nicht mehr.
Ja bei Radeon Chips sind sie sporadisch und bei Geforce sind sie rekonstruierbar und bis man die letzten 15 Treiber probiert um den 1 nutzbaren zu finden.
So viel zu einseitigen Erfahrungswerten ;o)

Redet ihr von 24/7 F@h only abstürzen oder beim normalen Nutzen des PC?
Bei hat es geholfen die Hardware-Beschleunigung im Flash Plugin (rechtsklick->Einstellungen) zu deaktiveren.
1080p Videos/Streams erzeugen dann zwar gut CPU Last aber wie gesagt dafür ist mein Rechner wieder problemfrei.
 
Bei hat es geholfen die Hardware-Beschleunigung im Flash Plugin (rechtsklick->Einstellungen) zu deaktiveren.
1080p Videos/Streams erzeugen dann zwar gut CPU Last aber wie gesagt dafür ist mein Rechner wieder problemfrei.
Hatte seit Catalyst 14.4 auch Probleme mit Flash (mit Catalyst 14.2 ging's komischerweise) und Abschalten der Hardwarebeschleunigung in Flash und im IE hat bei mir ebenfalls alle Probleme beseitigt.


Nun aber zu einem anderen Thema:
ich habe eine kleine aber dafür in meinen Augen nützliche Batch geschrieben, die ich euch vorstellen / zur Verfügung stellen will.

Ausgangslage: Ich falte GPU-only 24/7 auf einem Windows-Rechner, an dem parallel auch gearbeitet wird. Da ich das Gefühl habe, dass Windows mit längerer Laufzeit träge wird und insbesondere da der Rechner an sich schon eine lahme Gurke ist, hatte ich einfach einen automatischen Neustart alle zwei Tage eingerichtet. Über den Verlust der geleisteten Arbeit machte ich mir keine Sorgen - schließlich hatte ich ja den Checkpoint-Schieberegler in den Einstellungen auf 10 Minuten gesetzt.
Doch neulich habe ich mal genauer nachgeforscht: Dateiänderungen und GPU-Lastverläufe legen nahe, dass bei mir (hauptsächlich Projekte 13000, 13001) etwa eine Stunde zwischen den Checkpoints liegt. Das bedeutet, bei einem Neustart zu einem zufälligen Zeitpunkt geht durchscnittlich eine halbe Stunde Faltarbeit verloren. Das ist zwar nicht extrem viel, aber es geht noch weniger :P
Deshalb habe ich folgende Batch geschrieben, um festzustellen, wann der letzte Checkpoint erstellt wurde und das System danach neuzustarten. Die Batch fragt alle 24 Sekunden Datum / Zeit der letzten Änderung der Datei \work\*\*\checkpointState.xml ab, um zu erkennen, wann der letzte Checkpoint gesetzt wurde.
Code:
@echo off
 
REM Erfassung des Pfades der Checkpoint-Datei
if exist pfad.txt (
for /f %%a in (pfad.txt) do set "pfad=%%a"
goto start
)
set pfad=%cd%
if not exist "%pfad%\work\client.*" (
echo ################## CHECKPOINT ##################
echo #   Checkpoint konnte nicht gefunden werden.   #
echo #   Starten Sie dieses Programm entweder im    #
echo #  Verzeichnis des FAHClient, oder legen Sie   #
echo # im Verzeichnis, aus dem das Programm gestar- #
echo # tet werden soll, eine Datei namens pfad.txt  #
echo #  mit dem Pfad des FAHClient als Inhalt an.   #
echo ################################################
echo.
echo --STRG-C druecken, um das Programm zu beenden.--
pause>NUL
)
 
:start
REM Erfassung der Zeit zum Startzeitpunkt
for /f "tokens=1 delims=." %%b in ("%date%") do set "datum11=%%b"
for /f "tokens=2 delims=." %%c in ("%date%") do set "datum12=%%c"
for /f %%l in ('time /t') do set "zeit1=%%l"
for /f "tokens=1 delims=:" %%d in ("%zeit1%") do set "zeit11=%%d"
for /f "tokens=2 delims=:" %%e in ("%zeit1%") do set "zeit12=%%e"
 
 
:schleife
REM Erfassung des Änderungsdatums der Checkpoint-Datei
for /f "delims=|"  %%k in ('dir %pfad%\work /s /t:w^|findstr /i /l "checkpointstate"') do set "dir=%%k"
for /f "tokens=1 delims=." %%f in ("%dir%") do set "datum21=%%f"
for /f "tokens=2 delims=." %%g in ("%dir%") do set "datum22=%%g"
for /f "tokens=4 delims=.: " %%h in ("%dir%") do set "zeit21=%%h"
for /f "tokens=5 delims=.: " %%j in ("%dir%") do set "zeit22=%%j"
for /f "tokens=2" %%m in ("%dir%") do set "zeit2=%%m"
 
REM Tageswechsel-Erfassung
if %datum21% EQU %datum11% (
set zeit222=%zeit2%
goto vergleich
) 
set /a zeit21=%zeit21%+24
set dp=:
set zeit222=%zeit21%%dp%%zeit22%
 
:vergleich
REM Überprüfung, ob Datei nach Programmstart geändert wurde
cls
if %zeit1% LEQ %zeit222% (
echo ################## CHECKPOINT ##################
echo #                                              #
echo #                                              #
echo #    Die Checkpoint-Datei wurde modifiziert    #
echo #                                              #
echo #                                              #
echo #                                              #
echo ################################################
echo %date%, %time%; Die Checkpoint-Datei wurde modifiziert. >>log.log
timeout /t 2 /nobreak>NUL
goto neustart
)
 
set /a count=1
set m1=----
set m2=----
:ausgabe
REM Ausgabe des Start- und Änderungsdatums
if %count% LEQ 12 (
cls
echo ################## CHECKPOINT ##################
echo #                                              #
echo #     Startdatum: %datum11%.%datum12%;  Startzeit: %zeit11%:%zeit12%     #
echo #                                              #
echo #     letzter Checkpoint am %datum21%.%datum22% um %zeit21%:%zeit22%     #
echo #                                              #
echo %m2%
set m2=%m2%%m1%
echo ################################################
set /a count=count+1
timeout /t 2 /nobreak>NUL
goto ausgabe
)
goto schleife
 
 
:neustart
set /a count=1
set m1=--
set m2=--
:ausgabe2
if %count% LEQ 24 (
cls
echo ################## CHECKPOINT ##################
echo #                                              #
echo #                                              #
echo #                   Neustart                   #
echo #              Abbruch mit STRG-C              #
echo #                                              #
echo %m2%
set m2=%m2%%m1%
echo ################################################
set /a count=count+1
timeout /t 2 /nobreak>NUL
goto ausgabe2
)
REM hier Aktion angeben, bspw shutdown
REM shutdown /r /t 5
 
 
:ende
 
 
REM hbf878 -- Team 70335 PCGH
REM Variablen:
REM %pfad% : FAHClient-Pfad
REM %datum11% : Startdatum Tag
REM %datum12% : Startdatum Monat
REM %zeit1% : Startzeit HH:MM
REM %zeit11% : Startzeit HH
REM %zeit12% : Startzeit MM
REM %dir% : Ausgabe dir \work /s /t:w | findstr /i /l "checkpointstate"
REM %datum21% : Tag letzte Änderung
REM %datum22% : Monat letzte Änderung
REM %zeit21% : HH letzte Änderung
REM %zeit22% : MM letzte Änderung
REM %zeit2% : HH:MM letzte Änderung
REM %zeit222% : ggf. modifizierte HH:MM letzte Änderung
REM m1, m2 : Bindestriche für Fortschrittsbalken
REM dp : Doppelpunkt
REM count : Zähler für Aktualisierung / Fortschrittsbalken


Hinweise:
-läuft womöglich nur auf Rechnern mit Datumsformat DD-MM-YYYY, da Windows je nach Landeseinstellungen verschiedene Werte für %date% ausgibt :daumen2:
-läuft mit Client V 7.3.6 (neuere Versionen habe ich nicht ausprobiert)
-keine Ahnung, wie sich das Programm beim CPU-Falten oder beim Falten mit mehreren Slots verhält, wahrscheinlich wird nur der letzte Slot (bzw. die letzte Datei, die beim dir in Zeile 39 gefunden wird) abgefragt
-läuft nur, wenn das Arbeitsverzeichnis des FAHClients (nicht das Programmverzeichnis in C:\Program Files) ein Pfad ohne Leerzeichen ist (siehe Zeile 39)
-zum "Installieren" einfach die batch ins FAHClient-Verzeichnis (bei mir ist das C:\ProgramData\FAHClient) kopieren und dort starten
-kann zu einem Checkpoint-Logger umfunktioniert werden, indem Zeile 71 und 72 geändert werden zu
Code:
timeout /t 120 /nobreak>NUL
goto start
-um Ressourcen zu schonen (der dir-Befehl ist offenbar rechenintensiv) werden Änderungen an der Checkpoint-Datei nur alle 24 Sekunden abgefragt
-ab Zeile 128 kann eingetragen werden, was die Batch machen soll, wenn ein Checkpoint gesesetzt wurde (den Neustart-Befehl habe ich sicherheitshalber auskommentiert)
-wenn noch irgendwelche Programme geöffnet sind, die beim Schließen ein Dialogfenster öffnen (bspw MS Word), dann funktioniert das Herunterfahren nicht. Man könnte die Option /f anfügen, aber das mag offenbar FAH nicht so gerne ("unhandled exception"-Fehlermeldung beim nächsten Start).


Ich setze die Batch seit einiger Zeit erfolgreich ein, um mein System mittels Aufgabenplanung jeden zweiten Tag um 2 Uhr nachts nach Erstellung eines Checkpoints neustarten zu lassen.

Die Variablen sind übrigens unten in der Batch "erklärt", falls euer Basteltrieb geweckt sein sollte ;)

LG
 

Anhänge

Zuletzt bearbeitet:
Wenn ich sehe wie das Team Team MacOS X gerade Gas gibt wird mir etwas schwummerig :crazy:

Lasst nicht nach im Bemühen den 15. Platz zu halten (btw. - im Hintergrund spielt patriotische Musik dazu ;))
 
Ein Bild von meinem stabilem OC der XFX R9-290X mit knappem 400W Verbrauch Gesamtsystem: 290x.jpg
 
Ich würde 2 x Radeon HD 6870 um 120€ bekommen ;)
Ist das noch rentabel?

Dann habe ich auch noch einen alten PC mit PCIe 1 und Athlon 64, kann ich da eine Karte einbauen und damit noch halbwegs GPU Folden :ugly:

:)
 
Dann schau lieber nach HD7xxx oder R2xx Modellen.
Meine HD7770 mit leichtem Werks-OC hat 30k PPD gemacht.
Für 120€ bekommt man sicher auch schon gebrauchte HD7870 mit doppelt so viel Shadern.
Stromverbrauch auf jeden Fall auch deutlich unter zwei HD6870ern.

Die 6xxx Serie hat noch die alte VLIW Architektur.
Ich kann mich noch an schlechte PPD und hohe CPU Lasten der früheren Generationen erinnern.
7xxx und r2xx sind außerdem in 28nm gefertigt.
Modelllisten gibt es bei Wikipedia:
AMD-Radeon-HD-7000-Serie
AMD-Radeon-R200-Serie
 
Zur HD 6870:

Diese ist zwar eine Generation "jünger" als meine HD 5870, die HD 5870 ist aber die bessere "Faltkarte" - mit bis zu 18K PPD bei Core_17-WU´s und 930MHz GPU-Takt.
Ich schätze eine HD 6870 auf etwa 15K PPD maximal - beim Stromverbrauch von über 150W nicht gerade effektiv. :schief:

Da ist der Vorschlag, eine (gebrauchte) HD 7870 zu kaufen, wesentlich besser.
Ich erreiche mit meiner Sapphire HD 7870 GE OC (GPU: 1050MHz) bei 1200MHz GPU-Takt bis zu 100K PPD (Lüfter manuell auf 55%, der "Rest" der GPU-Einstellungen ist: Standard).
Diese läuft seit nunmehr fast einem Jahr ohne Probleme falt-stabil, ohne etwa die TDP oder die GPU-Spannung zu erhöhen . . .

Habe vielleicht ein gutes Exemplar erwischt, obwohl die ASIC-Qualität nur 76,2% anzeigt . . . :D
 
kurzer Status und Fragen von mir:
hab jetzt den ganzen Abend meine Frau alleine im Wohnzimmer sitzen lassen um zu basteln, und dann auch noch erfolglos :daumen2:

Infos:
Radeon 7870 von MSI ohne OC auf nem Ga-p35-ds4, Board ist mit 2 GB DDR2 und nem E5400 Dualcore bestückt.
Hardware ist alles gebraucht aber es gibt keinen Grund zur Annahme daß was kaputt ist bist jetzt.
es läuft Win7 64bit ohne updates und erstmal ohne aktivierung (mach ich erst wenn es funzt) und cathalyst 14.4.

Der V7 saugt sich eine core17 WU nach der nächsten und bricht die quasi noch im CPU-Vorbereitungs-Teil ab mit BAD WORK UNIT und "the forces are blown away" oder so, gaaanz komisch :what:
Er fängt lastet die Graka kurz mal ein paarmal aus, aber die bekannte Dauerlast wenn er faltet macht er garnicht...

Was mir aufgefallen ist: die Graka läuft nur mit PCIe x1 statt x16 im ersten PCIe Slot, hat das was zu bedeuten?!
Im zweiten Slot hängt sie immerhin mit x4 :)
RAM hab ich schonmal getauscht...

Hau mich jetzt ins Bett, morgen klingelt wieder der Wecker...
bin für Tips dankbar!

ciao,
mallkuss
 
Hallo mallkuss

Ich meine mich zu erinnern, dass mir so etwas ähnliches auch mal untergekommen ist

Ein neuer Clean-Update des Treibers hatte geholfen
Es ist wohl auch sinnvoll wenn du dich durch die Updates vom Win 7 "quälst"

Als (vorläufig) letztes - wenn gar nix hilft - wäre dann noch der Einsatz eines älteren Treibers
 
kurzer Status und Fragen von mir:
hab jetzt den ganzen Abend meine Frau alleine im Wohnzimmer sitzen lassen um zu basteln, und dann auch noch erfolglos :daumen2:

................

ciao,
mallkuss
Das kenne ich! Meine Frau sitzt dann auch immer ganz alleine rum....:(

Habt ihr auch momentan fast keine 13000er Projekte? Und heute morgen habe ich eins bekommen, das endete dann so:
03:15:59:WU00:FS01:Cleaning up
03:21:30:WU01:FS01:0x17:Completed 50000 out of 5000000 steps (1%)
03:26:49:WU01:FS01:0x17:Completed 100000 out of 5000000 steps (2%)
03:32:22:WU01:FS01:0x17:Completed 150000 out of 5000000 steps (3%)
03:37:40:WU01:FS01:0x17:Completed 200000 out of 5000000 steps (4%)
03:42:59:WU01:FS01:0x17:Completed 250000 out of 5000000 steps (5%)
03:48:33:WU01:FS01:0x17:Completed 300000 out of 5000000 steps (6%)
03:53:52:WU01:FS01:0x17:Completed 350000 out of 5000000 steps (7%)
******************************* Date: 2014-07-03 *******************************
03:59:25:WU01:FS01:0x17:Completed 400000 out of 5000000 steps (8%)
04:04:43:WU01:FS01:0x17:Completed 450000 out of 5000000 steps (9%)
04:10:01:WU01:FS01:0x17:Completed 500000 out of 5000000 steps (10%)
04:15:35:WU01:FS01:0x17:Completed 550000 out of 5000000 steps (11%)
04:20:53:WU01:FS01:0x17:Completed 600000 out of 5000000 steps (12%)
04:40:06:WU01:FS01:0x17:Completed 650000 out of 5000000 steps (13%)
05:33:42:WU01:FS01:0x17:Completed 700000 out of 5000000 steps (14%)
06:27:11:WU01:FS01:0x17:Completed 750000 out of 5000000 steps (15%)
06:27:11:WU01:FS01:0x17:Bad State detected... attempting to resume from last good checkpoint
06:29:50:WU01:FS01:0x17:Completed 650000 out of 5000000 steps (13%)
06:35:09:WU01:FS01:0x17:Completed 700000 out of 5000000 steps (14%)
07:22:17:WU01:FS01:0x17:Completed 750000 out of 5000000 steps (15%)
07:22:18:WU01:FS01:0x17:Bad State detected... attempting to resume from last good checkpoint
07:24:57:WU01:FS01:0x17:Completed 650000 out of 5000000 steps (13%)
07:34:27:WU01:FS01:0x17:Completed 700000 out of 5000000 steps (14%)
08:28:02:WU01:FS01:0x17:Completed 750000 out of 5000000 steps (15%)
08:28:02:WU01:FS01:0x17:Bad State detected... attempting to resume from last good checkpoint
08:28:02:WU01:FS01:0x17:Max number of retries reached. Aborting.
08:28:02:WU01:FS01:0x17:ERROR:exception: Max Retries Reached
08:28:02:WU01:FS01:0x17:Saving result file logfile_01.txt
08:28:02:WU01:FS01:0x17:Saving result file log.txt
08:28:02:WU01:FS01:0x17:Folding@home Core Shutdown: BAD_WORK_UNIT
08:28:02:WARNING:WU01:FS01:FahCore returned: BAD_WORK_UNIT (114 = 0x72)
08:28:02:WU01:FS01:Sending unit results: id:01 state:SEND error:FAULTY project:13000 run:1722 clone:3 gen:47 core:0x17 unit:0x0000005f538b3db7531182a801d06711
08:28:02:WU01:FS01:Uploading 2.73KiB to 140.163.4.231
08:28:02:WU01:FS01:Connecting to 140.163.4.231:8080
08:28:02:WU01:FS01:Upload complete
Aber die 9101er laufen seit 2 Tagen problemlos bei mir. Und er hing immer wieder an derselben Stelle, also eine defekte WU, oder? Habt ihr ähnliche Erfahrungen?
Jetzt läuft wieder eine 9101er, hat er automatisch sich geholt und läuft einwandfrei.
 
Zurück