Rumpelkammer: PCGH Folding@Home-Thread II

Endlich . . .

Endlich habe ich meine beiden GTX560Ti 448 unter WinXP dazu "überreden" können, sich einmal den Core17 zu "schnappen" und die 7662er zu falten.

Was mir dabei auffällt:
Der Core17 skaliert besser mit der Anzahl der Shader als mit höherer Taktung, denn: :nicken:
Mit der "Allerwelts-WU" 807x erfalten meine Grakas zwischen 23200 (824 MHz) und 24500 PPD (865 MHz), mit Core17 und der 7662 zwischen 25600 und gut 27000 PPD - und das mit suboptimaler Treiberunterstützung seitens nVidia

Wenn nVidia erst einmal OPENCL in der Version 1.2 unterstützt, dürfte ein weiteres PPD-Plus zu Buche stehen . . . :daumen:
 
@Bumblebee
Du hast doch bestimmt ein System mit Sandy- oder Ivy-Bridge und HT-CPU sowie zwei NVIDIA-Karten am Falten. Lässt Du die CPU mit allen 8 Threads laufen ? Ich hatte ja hier schon mal geschrieben, dass die CPU-SMP-PPD's irgendwie sehr ungleichmäßig ausfallen, teilweise absinken und nach Pause und Restart des Clients wieder "normal" sind. Nach ein paar aktuellen Tests ergab sich ein auf den ersten Block etwas seltsames Bild. Im Moment habe ich folgende Projekte laufen: 2 x 8071, - 8082. Beim Falten des i7-3770K@4.4 GHz Turbo auf allen Kernen mit 7 Kernen bekomme ich eine Frametime von ca. 02:30 min.:daumen: Die CPU-Last des gesamten Systems liegt bei ca. 94%, 7 virt. CPU's fast durchgängig auf 100%, die 8-te leicht schwankend. Nach dem Zurückschalten des CPU-Clients auf 8 Kerne geht die Frame-Time auf über 05:00 min:daumen2: hoch. Ich habe die zwei Varianten jeweils über mehrere Frames laufen lassen, die Werte sind jeweils relativ konstant. D.h. in meiner Konfiguration kommt scheinbar in Summe mehr heraus, wenn der CPU-SMP-Client nur mit 7 Kernen faltet. Zumindest in der genannten Kombination der Projekte (die 807x-er GPU-Projekte nehmen pro Client ca. 4% CPU-Last). Hat jemand ähnliche Erfahrungen oder kann das als generelle Lösung für 2 x NVIDIA und CPU-SMP mit HT-CPU bestätigen ? Irgendwie scheint der CPU-SMP-Core (a4 ?) Synchronisations-Probleme zu haben, wenn nicht alle Threads "volle Pulle" bekommen. Irgendjemand hatte schon mal empfohlen, einen CPU-Kern für die GPU zu reservieren. Ich dachte jedoch, das bringt nur bei den AMD-Karten mit der relativ hohen CPU-Last beim Folden etwas.
 
Wie früher geschrieben - ich habe 2 Systeme mit je 2 GTX570 am laufen
Das "kleinere" ist ein AMD x6 (1090er); dort falten momentan nur die beiden GraKa's
Die CPU hat dort nur noch "grottige" PPD abgeliefert

Das "grössere" ist ein Core i7 860, OC @ 3630 MHz; dort faltet die CPU SMP mit allen "8 Cores"
Momentan erfaltet sie (mit einer 8553) rund 11'500 PPD
Die beiden 570er liefern dabei (2 x 7662) zusammen rund 60 KPPD

Ich habe jetzt mal probehalber die CPU auf -smp 7 umgestellt und werde die Veränderungen hier posten
 
Danke schon mal für die Info, mal schauen, was Deine Tests bringen. Bei mir stabilisiert sich die CPU-PPD auf ca. 25.5 K PPD (Frametime knapp unter 02:30 min). Insgesamt (8070/8071/8083) sind es im Moment knapp über 81 K PPD (mit den 7 Kernen). Ich vermute, bei den 762x-er GPU-Projekten werden 8 Kerne wieder mehr bringen, da die GPU-Projekte die CPU fast gar nicht belasten.
 
Vielleicht kann ich zur Klärung ebenfalls beitragen:

Bis vor zwei Tagen lief mein System, bestehend aus i7 875K@3808 MHz und Core A3 zusammen mit 2x GTX560Ti 448 mit Cpore A15 und "Standart-WU" 807x (alles unter WinXP Pro).
Die CPU lief mit -smp 7, sie erfaltete je nach WU zwischen 13,5 bis zu 15K PPD ( 1 Kern "freigehalten" für BS und "Graka-Unterstützung").
Nachdem eine der Grakas auf Core17 "umgestiegen" war, sank die PPD der CPU auf etwa 12K, obwohl die CPU im Schnitt nur zu 94% ausgelastet war.
Mittlerweile faltet auch die zweite Graka unter Core17, die CPU faltet mit -smp 6 mit durchschnittlicher Auslastung von etwa 82%, aber die PPD der CPU sind wieder über 13K gestiegen (WU 6946).

Das Problem besteht darin, dass die Graka bei Nutzung des Core17 kurzfristig ainen Core der CPU auslasten - bei 2 Grakas bis zu 2 Cores.
Dadurch wird das SMP-Falten extrem ausgebremst, weil die Arbeit gemäß smp-Flag auf entsprechend viele "Anteile" aufgeteilt wird und der "langsamste Kern" die Berechnungsgeschwindigkeit der gesamten WU bestimmt.
Also ist zur Zeiot angeraten, entsprechend der faltenden Grakas mit Core17 pro Graka einen CPU-Kern "freizuhalten" - die Situation wird sich wohl erst bessern, wenn nVidia OPENCL 1.2 unterstützt . . .

Man kann das Ganze auch "beobachten":
Als der Core15 faltete, wurde der Memory Controller Load mit etwa 11% beziffert (GPZ-Z), jetzt - mit Core17 - sind es 22%!
 
So, nun erstmal das aktuelle "finding"

Die Reduktion auf -smp 7 brachte bei der CPU (und der WU 8553) eine Steigerung der PPD auf rund 12'500
Die beiden GTX570 erfalten (mit 7662) immer noch die rund 60 KPPD - tendenziell eher sogar etwas mehr

Ich werde nun mal noch auf - smp6 runtergehen und schauen was geschieht...
 
So, und nun das nächste Resultat meiner "Forschung"

Unter -smp 6 fallen die PPD (immer noch WU 8553) auf rund 11650 Punkte
Die PPD der beiden GraKa sind auf 647xx PPD gestiegen (2 x 7662)

.. Ich lasse es erst mal so ..

Btw. die CPU-Auslastung ist immer noch bei konstant 100%
 
Hier noch ein paar Werte von meinen Tests, alles über mehrere Frames gemessen:
CPU-SMP-Projekt | Cores | Frametime | GPU1-Projekt | GPU2-Projekt
8082|7|02:14-02:15|-|-
8082|8|02:09-02:15|-|-
8082|7|02:30-02:31|8070|8071
8082|8|02:35-02:38|8070|8071
8082 | 6 | 02:38-02:39 | 8070 | 8071
Die 7 Cores habe ich erstmal so gelassen und die Frametimes habe sich bei den genannten Werten eingepegelt. Auf 6 Cores bin ich noch nicht runtergegangen, denke jedoch, dass bei diesen Projekten bei 7 Cores das Optimum liegt, da der i7-3770K@4.4GHz doch einiges wegschleppt. Werde es dann noch mal kurz testen.

EDIT: Nachtrag mit 6 Cores, Vermutung bestätigt und wieder zurück zu 7 Cores. Mal sehen, was dann die anderen Projekte bringen.
 
Zuletzt bearbeitet:
@mattinator

Dein Test bestätigt meinen Vermutung, um ein optimales Ergebnis mit 2 Grakas zu erreichen (ich war zu faul, es auszutesten :devil: :schief:)- daher faltete bei mir seit geraumer Zeit der i7 875 nur mit -smp7 . . . :D



@Bumblebee

Welchen Treiber benutzt Du für die GTX 570?

Mich wundert nämlich (nicht nur bei Dir, sondern auch im "offizioellen F@H-Forum") die starke Belastung der CPU durch die Grkas mit Core17 - selbiges kann ich aber bei mir überhaupt nicht feststellen.
Wie bereits oben erwähnt, wird meine CPU nur zu etwa 82% (außer Initialisierungsphase) ausgelastet - davon aber 75% durch SMP-Falten . . .



BTW:


Vor einem Jahr zu dieser Zeit,
meint man: Der Bumble ist soweit -
was vorher niemals war gewesen:
Man konnte Reime von Ihm lesen!

Denn dieser Tag ist heut gekommen,
nur - keiner hat ihn wahrgenommen.
Der große Tag der Phantasie,
man nennt ihn: Tag der Poesie . . .


21.3.2013 by M. O.
 
@Hawky1980 wie kriegst du die 66000PPD hin?
ich nutze den 13.3 beta 2 mit dem SDK. aber wie geht das ohne SDK?? da ist doch der Opencl Treiber drin oder?
 
@PAUI

Hawky1980 hatte mir emfohlen den catalyst 13.2 beta7 zu nehmen. Habs so intalliert ohne SDK. ( da ist bereits alles vorhanden )
Und das mit 66.000 PPD k.a. vielleicht mit 1,2Ghz oder so :huh:
Meine 7950 @950Mhz bringt mir ~7250 Bonuspunkte pro WU ( 35.492 PPD ) seine über 8.8xx ( 66.xxx PPD )
 
@Bumblebee

Das könnte bereits ein Teil des Problems sein.
Es wird ausdrücklich darauf hingewiesen (im F@H-Forum), dass bei der Verwendung des Core17 der letzte offizielle Treiber unbedingt zu nutzen sei . . .
Das ist bei mir unter WinXP der 314.07.
Daher rate ich Dir dringend, nach Abschluß der Graka-WU´s ein Treiber-Update zu machen . . .


@PAUI

Du solltest aber unbedingt den Catalyst 13.2 Beta7 nutzen (das hatte ich Dir bereits angeraten - vor ein paar Tagen!)- die vorherigen Treiber sind nicht mit dem Core17 getestet worden . . .
Und zwar eine vollständige Installation (incl!!!! SDK)
 
Zuletzt bearbeitet:
@Hawky1980 wie kriegst du die 66000PPD hin?
Da gibs beim Afterburner ein Regler den man nach rechts schieben kann. :D

ich nutze den 13.3 beta 2 mit dem SDK. aber wie geht das ohne SDK?? da ist doch der Opencl Treiber drin oder?
Falscher Treiber wie auch Amigafan dich drauf hingewiesen hat. Die SDKs zicken bei mir nur rum und drücken die CPU PPD in den Keller, daher verwende ich nur die Basic SDK vom 13,2beta7.

Hier mal ein aktueller Run extra für dich. ;)
Folding@Home  PC0 .JPG

Und einmal ne frische Wu mit GPU 1100mhz.
Folding@Home  HD7970 1100mhz.JPG
 
Zuletzt bearbeitet:
Bin ich der einzige, der keine GPU-WUs mehr bekommt?

Erna:
Da ich seit gestern Abend keine bekam, dachte ich ich frage mal...
Heute gab es dann fünf Minuten nach dem Post eine neue.
 
Zuletzt bearbeitet:
@Bumblebee

Das könnte bereits ein Teil des Problems sein.
Es wird ausdrücklich darauf hingewiesen (im F@H-Forum), dass bei der Verwendung des Core17 der letzte offizielle Treiber unbedingt zu nutzen sei . . .
Das ist bei mir unter WinXP der 314.07.
Daher rate ich Dir dringend, nach Abschluß der Graka-WU´s ein Treiber-Update zu machen . . .
Ich habe unter Win7 den aktuellen Beta-Treiber von NVIDIA (314.21), die CPU-Last betrug beim 7662-Projekt trotzdem 12%. Und dass ist beim Takt meines i7-3770K schon ganz schön viel. Heute habe ich noch einen (vorerst letzten) Versuch mit Beta-Modus und dem Core17 gemacht, folgende neuen Erkenntnisse:
CPU-SMP-Projekt | Cores | Frametime | GPU1-Projekt | GPU2-Projekt | Hinweis
8082|5|03:04-03:05|8070|7662|12% CPU, 03:45-03:48
8082|6|02:46-02:47|8070|7662|12% CPU, 03:46-03:49
8082|7|02:43-02:50|8070|7662|12% CPU, 03:47-03:50
Bei 6 Cores war das Optimum der Gesamt-Leistung in dieser Konstellation. Damit verbessert sich zwar die Ausbeute des Core17 um einiges, bleibt aber insgesamt trotzem hinter den anderen Projekten. Auffällig waren geringer Verbrauch und Temperatur der GPU mit dem Core17 und eine relativ geringe VRAM- sowie hohe RAM-Auslastung. Es sieht so aus, als ob dort mit dem aktuellen OpenCL-Treiber die Berechnung zwischen GPU und CPU geteilt wird. Also besteht Hoffnung auf weitere Besserung. Solange kein besserer (OpenCL-)Treiber von NVIDIA und neue Version des Core17 verfügbar sind, bleibt der Beta-Modus bei den GPU-Clients deaktiviert.

BTW: Beim Umschalten der Cores (mit zwischenzeitlichem Stop und Start des Clients) ist mir ein 8080-er CPU-SMP-Projekt weggeflogen:
14:22:56:WU03:FS01:0xa4:mdrun returned 255
14:22:56:WU03:FS01:0xa4:Going to send back what have done -- stepsTotalG=500000
14:22:56:WU03:FS01:0xa4:Work fraction=0.0000 steps=500000.
14:23:00:WU03:FS01:0xa4:logfile size=14076 infoLength=14076 edr=0 trr=25
14:23:00:WU03:FS01:0xa4:logfile size: 14076 info=14076 bed=0 hdr=25
14:23:00:WU03:FS01:0xa4:- Writing 14614 bytes of core data to disk...
14:23:00:WU03:FS01:0xa4:Done: 14102 -> 4859 (compressed to 34.4 percent)
14:23:00:WU03:FS01:0xa4: ... Done.
14:23:00:WU03:FS01:0xa4:
14:23:00:WU03:FS01:0xa4:Folding@home Core Shutdown: EARLY_UNIT_END
14:23:01:WARNING:WU03:FS01:FahCore returned: BAD_WORK_UNIT (114 = 0x72)
Zum Glück war es erst ca. "eine halbe Stunde alt".;)
 
@Bumblebee

Das könnte bereits ein Teil des Problems sein.
Das ist bei mir unter WinXP der 314.07.
Daher rate ich Dir dringend, nach Abschluß der Graka-WU´s ein Treiber-Update zu machen . . .

Das war ein Satz mit X - denn...

Ich habe unter Win7 den aktuellen Beta-Treiber von NVIDIA (314.21), die CPU-Last betrug beim 7662-Projekt trotzdem 12%.

... das kann ich bestätigen
Die beiden GTX570 laufen nun mit 314.07 und generieren genau gleich viel CPU-Last wie vorher (unter 310.90)
 
Wie gesagt - ich habe dererlei "Auslastungsprobleme" unter WinXP nicht - und gehöre wohl zur absoluten Minderheit . . . :hmm: :ka: :D

Ich kann die Auslastung nur zum Beginn einer neuen 7662er WU feststellen und ab und an mal während der Berechnung (ich schätze, die CPU verifiziert zu dem Zeitpunkt das Berechnete), aber im Schnitt liegt die Belastung bei unter 2,5% pro Graka (ProzessLasso läuft die ganze Zeit im Hintergrund und protokolliert mit).
Und das, obwohl bei mir der Core17 eine "höhere Priorität als Normal" zugewiesen bekommen hat - ProzessLasso sei Dank. :daumen:
Vielleicht sollte ich mal über einen längeren Zeitraum hinweg eine Logaufzeichnung über die Auslastung der CPU machen - und dabei besonderes Augenmerk auf den Core17 legen . . .


Edit:
Hier mal ein aktueller Screenshot von ProLasso - die rote Kurve zeigt die CPU-Auslastung.
Der Peak wurde durch die Graka verursacht - kurzzeitige Auslastung eines Cores, entspricht 12% der CPU . . .

ProLasso.JPG
 
Zuletzt bearbeitet:
Zurück