Apropos SLI. Wenn ich so darüber nachdenke, wäre es doch die Lösung für GPU-WUs. Wenn die neuen Beta-WUs beispielsweise zweimal oder dreimal so groß wären und eine knappe "Deadline" hätten, wäre SLI die Lösung sich die extra Punkte zu hohlen. Wenn es Stanford geschafft hat die Arbeit auf mehr CPU Kerne aufzuteilen, warum auch nicht auf GPUs. Weil dann wäre es meiner Meinung nach fair...
Ohne SLI keine beta-WUs, und mit SLI eine PPD Verdoppelung verglichen mit normalen WUs...
Eine GTX 670 schafft beispielsweise 25k PPD, 2x GTX 670 würde mit Beta-WUs 100k PPD schaffen, und 3x GTX 670 würde 175k PPD schaffen, usw.
Dann würde es sich auch wirklich auszahlen eine GPU Falt-farm zu bauen...
Das wäre wirklich eine faire und interessante Lösung. Denn meiner Meinung nach gibt es mit den Beta-WUs zu viele Punkte für einen zu kleinen Arbeitsaufwand. Was meint ihr?
Rein von der Rechenleistung her klingen die neuen PPD Werte recht vernünftig , denn GPUs haben viel mehr SP Leistung als aktuelle x86 Prozessoren.
z.B. Haben 4 Sandy Bridge 8 Kerner (aktuelle Xeon E Serie) mit z.B. 3 Ghz : 3*8*8*4= 768 GFLOPS Single-Precision Leistung, da ist HT noch nicht dabei also runden wir mal auf 1 TFLOP auf.
Eine GTX680 hat laut Wikipedia schon 3090.4 GFLOPS also 3 TFLOPS! Natürlich ist das ein theoretischer Wert, denn GPUs kann man bauartbedingt nicht 100%ig Auslasten. 85-90% sollten realistisch sein, also landen wir bei ca 2,6 TFLOPs.
Man sieht also klar wenn man es schafft die GPUs richtig auszulasten dürfte der Output viel größer sein als bei konventionellen CPUs, wenn nun auch der Wissenschaftliche Output größer ist ist es meiner Meinung nach absolut gerechtfertigt dass man den GPUs auch die entsprechenden Punkte vergütet.
Ich denke gerade der Vergleich von Wissenschaftlichem Output zwischen CPU und GPU ist das was gerade in Stanford passiert mit anschließendem anpassen der Punkte.
Bezüglich "SLi", ich glaube kaum dass das jemals passieren wird, denn bei der Implementierung würde es dann darauf hinauslaufen dass man die eine WU in 2 spaltet und am Ende wieder zusammenfügt , Stanford wird sich denken warum nicht die Arbeit sparen und einfach 2 WUs laufen lassen

Davon abgesehen würde man auch nicht "SLi" verwenden , das kommt ja nur bei Bildberechnungen zum Einsatz , sondern die GPUs wie gehabt ansprechen.
Ein Mitgrund warum ich glaube dass die Implementierung auf 2 getrennte WUs hinauslaufen würde ist weil die Bandbreite zwischen den GPUs recht gering ist im Vergleich zur Bandbreite zum eigenen Speicher. Bei CPUs ist der Unterschied nicht so groß aber , wie man wegen dem Kraken weiß, rechnet sich auch hier die Vermeidung von Zugriffen auf andere CPUs.
In der Hoffnung das Stanford die Parallelisierung in den Client mit aufnimmt könnte sich unsere Xeon E5-xxxx Gang

mit den Co-prozessor Karten Xeon Phi auch einen weiteren Vorteil verschaffen.
Sollte man im Auge behalten.
Xeon Phi wäre kein Co-Prozessor im eigentlichen Sinne, dank eigenem RAM und PCIe Limitierung würde er sich bei FAH wie eine Grafikkarte verhalten, also mit dem Host System nur wenig zu tun haben. Es könnte sich also jeder so ein Ding einbauen und darauf hoffen dass Stanford einen entsprechenden Client/Core schreibt
Da es sich wieder um Glaubensfragen handelt möchte ich anfügen dass das meine Meinung ist

!