Rumpelkammer: PCGH Folding@Home-Thread II

Ein bis'chen von mir: gibt es momentan Grakas die Quad-SLI-tauglich sind? :huh:
Aus reiner Neugierde suche ich gerade nach solchen. :ugly:
Grundsätzlich ist jede Graka, welche 2 SLI-Anschlüsse ihr eigen nennt, Quad-SLI-fähig, aber:

Für Grakas, die ein sog. 2-Slot-Design aufweisen, gibt es auch entsprechende Mobos, für Grakas mit einem 3-Slot-Design fehlen diese, sodass praktisch maximal nur ein Tripple-SLI möglich ist (Platzmangel!).
Ausnahme: Doppel-GPU-Karten sind auch bei einem 3-Slot-Design Quad-SLI-fähig.

Wichtig auf Mobo-Seite: 4 PCIE-16-Slots (als Hardware) - mit obiger Ausnahme . . . :D
 
Grundsätzlich ist jede Graka, welche 2 SLI-Anschlüsse ihr eigen nennt, Quad-SLI-fähig, aber:
Sicher ? Ich habe bei meiner kurzen Recherche nur Sachen gefunden über die High End Modelle und selbst da soll 4 Way SLi angeblich zwar funktionieren aber nicht offiziell ausgewiesen sein. Ansonsten nur Tripple Sli Tests, was ja mit 2 Ports offiziell beworben wird.

Davon abgesehen ist 4 Way SLi natürlich Geldverschwendung , für Spiele bringt es nichts ( in einem Test der GTX680 war es z.T. langsamer als 2 Way SLi) und fürs falten braucht man kein SLi ;)
 
Apropos SLI. Wenn ich so darüber nachdenke, wäre es doch die Lösung für GPU-WUs. Wenn die neuen Beta-WUs beispielsweise zweimal oder dreimal so groß wären und eine knappe "Deadline" hätten, wäre SLI die Lösung sich die extra Punkte zu hohlen. Wenn es Stanford geschafft hat die Arbeit auf mehr CPU Kerne aufzuteilen, warum auch nicht auf GPUs. Weil dann wäre es meiner Meinung nach fair...

Ohne SLI keine beta-WUs, und mit SLI eine PPD Verdoppelung verglichen mit normalen WUs...

Eine GTX 670 schafft beispielsweise 25k PPD, 2x GTX 670 würde mit Beta-WUs 100k PPD schaffen, und 3x GTX 670 würde 175k PPD schaffen, usw.

Dann würde es sich auch wirklich auszahlen eine GPU Falt-farm zu bauen...

Das wäre wirklich eine faire und interessante Lösung. Denn meiner Meinung nach gibt es mit den Beta-WUs zu viele Punkte für einen zu kleinen Arbeitsaufwand. Was meint ihr?
 
In der Hoffnung das Stanford die Parallelisierung in den Client mit aufnimmt könnte sich unsere Xeon E5-xxxx Gang:D
mit den Co-prozessor Karten Xeon Phi auch einen weiteren Vorteil verschaffen.
Sollte man im Auge behalten.
 
Apropos SLI. Wenn ich so darüber nachdenke, wäre es doch die Lösung für GPU-WUs. Wenn die neuen Beta-WUs beispielsweise zweimal oder dreimal so groß wären und eine knappe "Deadline" hätten, wäre SLI die Lösung sich die extra Punkte zu hohlen. Wenn es Stanford geschafft hat die Arbeit auf mehr CPU Kerne aufzuteilen, warum auch nicht auf GPUs. Weil dann wäre es meiner Meinung nach fair...

Ohne SLI keine beta-WUs, und mit SLI eine PPD Verdoppelung verglichen mit normalen WUs...

Eine GTX 670 schafft beispielsweise 25k PPD, 2x GTX 670 würde mit Beta-WUs 100k PPD schaffen, und 3x GTX 670 würde 175k PPD schaffen, usw.

Dann würde es sich auch wirklich auszahlen eine GPU Falt-farm zu bauen...

Das wäre wirklich eine faire und interessante Lösung. Denn meiner Meinung nach gibt es mit den Beta-WUs zu viele Punkte für einen zu kleinen Arbeitsaufwand. Was meint ihr?
Rein von der Rechenleistung her klingen die neuen PPD Werte recht vernünftig , denn GPUs haben viel mehr SP Leistung als aktuelle x86 Prozessoren.

z.B. Haben 4 Sandy Bridge 8 Kerner (aktuelle Xeon E Serie) mit z.B. 3 Ghz : 3*8*8*4= 768 GFLOPS Single-Precision Leistung, da ist HT noch nicht dabei also runden wir mal auf 1 TFLOP auf.

Eine GTX680 hat laut Wikipedia schon 3090.4 GFLOPS also 3 TFLOPS! Natürlich ist das ein theoretischer Wert, denn GPUs kann man bauartbedingt nicht 100%ig Auslasten. 85-90% sollten realistisch sein, also landen wir bei ca 2,6 TFLOPs.

Man sieht also klar wenn man es schafft die GPUs richtig auszulasten dürfte der Output viel größer sein als bei konventionellen CPUs, wenn nun auch der Wissenschaftliche Output größer ist ist es meiner Meinung nach absolut gerechtfertigt dass man den GPUs auch die entsprechenden Punkte vergütet.
Ich denke gerade der Vergleich von Wissenschaftlichem Output zwischen CPU und GPU ist das was gerade in Stanford passiert mit anschließendem anpassen der Punkte.

Bezüglich "SLi", ich glaube kaum dass das jemals passieren wird, denn bei der Implementierung würde es dann darauf hinauslaufen dass man die eine WU in 2 spaltet und am Ende wieder zusammenfügt , Stanford wird sich denken warum nicht die Arbeit sparen und einfach 2 WUs laufen lassen ;)
Davon abgesehen würde man auch nicht "SLi" verwenden , das kommt ja nur bei Bildberechnungen zum Einsatz , sondern die GPUs wie gehabt ansprechen.

Ein Mitgrund warum ich glaube dass die Implementierung auf 2 getrennte WUs hinauslaufen würde ist weil die Bandbreite zwischen den GPUs recht gering ist im Vergleich zur Bandbreite zum eigenen Speicher. Bei CPUs ist der Unterschied nicht so groß aber , wie man wegen dem Kraken weiß, rechnet sich auch hier die Vermeidung von Zugriffen auf andere CPUs.

In der Hoffnung das Stanford die Parallelisierung in den Client mit aufnimmt könnte sich unsere Xeon E5-xxxx Gang:D
mit den Co-prozessor Karten Xeon Phi auch einen weiteren Vorteil verschaffen.
Sollte man im Auge behalten.

Xeon Phi wäre kein Co-Prozessor im eigentlichen Sinne, dank eigenem RAM und PCIe Limitierung würde er sich bei FAH wie eine Grafikkarte verhalten, also mit dem Host System nur wenig zu tun haben. Es könnte sich also jeder so ein Ding einbauen und darauf hoffen dass Stanford einen entsprechenden Client/Core schreibt ;)



Da es sich wieder um Glaubensfragen handelt möchte ich anfügen dass das meine Meinung ist ;)!
 
Zuletzt bearbeitet:
Wenn ich´s richtig verstanden habe aus den Info´s die ich gelesen habe,
kann Xeon phi mit den E5 CPU doch komunizieren. Das müsste halt in der Client Software implementiert werden.
Ebenso kann Phi durch ein eigenständiges Linux ROM das auf der "Karte" direkt implementiert ist auch als einzelne/"r" Prozessor laufen sollen.

Ach egal, abwarten Tee trinken, befor wir hier uns den Kopf zerbrechen,
über Sachen die es vieleicht so wie ich es mir vorstelle, nie geben wird.
Nebei ich habe ein Italien Protein:ugly::lol::ugly::wow::wow:
Italien Protein.JPG
 
z.B. Haben 4 Sandy Bridge 8 Kerner (aktuelle Xeon E Serie) mit z.B. 3 Ghz : 3*8*8*4= 768 GFLOPS Single-Precision Leistung, da ist HT noch nicht dabei also runden wir mal auf 1 TFLOP auf.

Frage dazu: Kannst du mir sagen wo ich die GFLOPS Leistung meines Rechners testen könnte.
Mit 4x Opteron 6180 SE denke ich habe ich momentan den schnellsten CPU basierten Computer, wäre also interessant. Ich habe 48 Kerne bei 2.5 GHz (bzw. 2.75 in Linux dank OC)...

Laut Google sind es bei mir rund 400.

Ich habe immer gedacht das Grafikkarten nicht so belastbar sind wie CPUs, und dass die WUs dementsprechend kleiner sein müssten, da GPUs Fehleranfälliger bei großer Last seinen...
 
Frage dazu: Kannst du mir sagen wo ich die GFLOPS Leistung meines Rechners testen könnte.
Mit 4x Opteron 6180 SE denke ich habe ich momentan den schnellsten CPU basierten Computer, wäre also interessant. Ich habe 48 Kerne bei 2.5 GHz (bzw. 2.75 in Linux dank OC)...

Laut Google sind es bei mir rund 400.

Ich habe immer gedacht das Grafikkarten nicht so belastbar sind wie CPUs, und dass die WUs dementsprechend kleiner sein müssten, da GPUs Fehleranfälliger bei großer Last seinen...

Das sollte eigentlich mit Linpack funktionieren, wird auch für die TOP 500 Liste verwendet ;)

Habe auf die schnelle einen Wert von 4 FLOPS pro core gefunden für MC

Für die Formel heißt das :

2,75*4*12*4 für deinen Rechner =528 GFLOPS (Wert von 4 habe ich aus einer Uni Vorlesung aus dem Netz)

GPUs sind genauso belastbar wie CPUs, sonst müsste ständig etwas abstürzen oder Bildfehler auftreten wenn man fordernde Spiele spielt (Auslastung > 90%).
Der einzige große Unterschied ist dass man bei GPUs viel mehr auf die Auslastung der Recheneinheiten Acht geben muss, d.h. Man wird bei GPUs nur Workloads verwenden die man gut auf sehr kleine Teile spalten kann damit man die kleinen L1 und L2 Caches möglichst nicht überfüllt (VRam-Zugriff tötet Performance).

Man wird also bei GPUs andere Probleme bearbeiten als mit CPUs, die auch größere Probleme fressen.

Sry für Tippfehler, bin am Smartphone unterwegs ;)
 
Zwei kurze Anmerkungen zum Thema:

... GPUs haben viel mehr SP Leistung als aktuelle x86 Prozessoren

Die DP-Leistung ist aber - je nach Generation - unterirdisch(er)

Braucht man überhaupt SLI für eine GPU-Farm?
Die werden über den Client doch eh alle einzeln angesprochen.

Das ist korrekt
Ein Erfolg würde also voraussetzen, dass - bei mehreren gleichen GraKa's - die vom Clienten dann als einzelne Kerne einer GraKa angesprochen würden
Davon sind wir - denke ich - noch weeeeeit entfernt
 
Zwei kurze Anmerkungen zum Thema:



Die DP-Leistung ist aber - je nach Generation - unterirdisch(er)



Das ist korrekt
Ein Erfolg würde also voraussetzen, dass - bei mehreren gleichen GraKa's - die vom Clienten dann als einzelne Kerne einer GraKa angesprochen würden
Davon sind wir - denke ich - noch weeeeeit entfernt
DP Leistung ist abgesehen von ein paar CPU WUs/Cores für fah nicht relevant ;)
 
@ Austausch GTX 560Ti mit GTX 6xx oder wie

eine solche (GTX 570) habe ich drin (EVGA GTX 570 SC). Ohne OC sind damit derzeit (V7, ohne Beta) so 16-18k PPD drin, mit OC an die 20 (würde ich aber nicht empfehlen, die Fermis ziehen schon recht viel Strom und arbeiten entsprechend ineffizient). Dann lieber undervolten/clocken um mit ~120W noch 13kPPD zu fahren.

Also meine sind (für Fermi-Verhältnisse) relativ sparsam
 
Ich verstehe das Ganze nicht. Wenn die GPU so viel schneller ist, warum wird überhaupt eine CPU-basierte Faltung angeboten anstatt einer AMD/ATI-Unterstützung...

Auch verstehe ich nicht warum meine Faltfarm dann überhaupt so viele Punkte abwirft. Ich dachte anhand der Punkte kann man den Beitrag für F@H gut ablesen...
 
Ich verstehe das Ganze nicht. Wenn die GPU so viel schneller ist, warum wird überhaupt eine CPU-basierte Faltung angeboten anstatt einer AMD/ATI-Unterstützung...

Auch verstehe ich nicht warum meine Faltfarm dann überhaupt so viele Punkte abwirft. Ich dachte anhand der Punkte kann man den Beitrag für F@H gut ablesen...
Weil es eben auch Probleme gibt die man nicht so klein und so gut parallelisierbar machen kann dass sie auf GPUs effizient bearbeitbar sind, dort eigenen sich CPUs die alles bearbeiten können.

Warum man keinen AMD Support anbietet weiß ich leider auch nicht.

Was mich interessieren würde ist wieviel Wert an wissenschaftlicher Arbeit GPUs und CPUs pro Punkt abliefern bzw wie das Verhältnis bisher berechnet wurde.
Denn eigentlich sollten die Punkte genau das widerspiegeln.
 
Das CPU Falten wird eigentlich nur interessant durch die Bonus punkte, die es ja bei den GPU´s bis jetzt noch nicht gibt.
Lasst mal bei euren servern die Bonus punkte weg dan ist im Verhältnis gesehen eine Grafikkarte schneller.

Das Bonus system funzt doch bis jetzt eigentlich ganz gut (ausnahmen bestätigen die Regel) wen man bei Normaler Hardware bleibt z.b. i7 2600K mit Bonus zwischen 20-30K PPD und eine GTX560ti 14-17kPPD den erst die Bonus punkte machen ja das CPU falten interessant. (mal nicht vom Strom verbrauch ausgehend)

Das der Bonus nicht noch mehr in die Höhe getrieben wird sieht man schön daran das seit längren das Falten von big-wu´s nicht mehr mit 8Kernen Möglich ist, so wurde wieder etwas reguliert, das sich jetzt alle ein server bauen um trotzdem wieder Big-wu´s und den sehr Lukrativen Bonus zu kassieren, hat sicher stanford auch etwas überrascht^^
Deshalb wird es jetzt sicher zeit solche Wu´s wie die 8057er zu verbreiten das die Lücke zwischen CPU und GPU nicht mehr ganz so groß ist. (vom Strom verbrauch mal abgesehen)
 
Zuletzt bearbeitet:
Ich trau meinen Augen nicht, ich hab seit 10tagen endliche eine 8057er Wu für meine GTX560ti bekommen und muss sagen die ist EXTREM schnell 123544PPD und ein credit von 18129 punkten ;)

Unbenannt.JPG


EDIT: hab gerade noch eine Hinterher bekommen, heute regnet es seit lange mal wieder Punkte bei mir, so kan es weiter gehen.
 
Zuletzt bearbeitet:
heißt das, dass ein Vorteil für GPU oder CPU zu erwarten ist?

Natürlich für die GPU - und - wenn Stanford und AMD aufhören, sich wie kleine, bockige Kinder zu benehmen und endlich gemeinsam "an einem Strang ziehen" - vor allem für AMD-GPU´s. Diese besitzen nämlich die größte Rechenleistung . . .

Dann wird meine HD5870 - aufgrund ihrer Rechenleistung von 2.740 GFlops - zur "Punkteschleuder" :ugly: :P :D
 
Da hab ich ja wieder mal ne Diskussion losgetreten. :ugly:

Meine SLI-Frage war eigentlich eher für den Spielbetrieb gedacht > meine Frage wurde beantwortet > Danke Mastermaisi777 :daumen:
Das aktivierte SLI ist beim falten eh hinderlich wen man den Rechner noch anderweitig wie zum surfen braucht, allerdings würde es mich nicht wundern wen irgendwan mal SLI/Crossfire benutz wird da Grakas ja immer mehr Cores zu Verfügung stellen > zum Beispiel GTX680 sind es 1536. :schief:
 
Zuletzt bearbeitet:
Zurück