FAHBench - sinnvoll oder nicht

ad 1) Woher hast du das mit der Hälfte der CUs? Da würd ich gern mal eine verlässliche Quelle sehen.
Ach Carsten, wenn eine Graifikkarte bei einem Bench wie dem FH Bench nur 90% Auslastung erzeugt, und dabei noch nichtmal warm wird, sagt das mir, dass der Interne Code des Benchs ( Code zur Simulation von Proteinen und Atomen) noch nicht richtig auf die Architektur der Karte einschliesslich der OpenCL API angepasst/abgestimmt ist.
ad 2) Ich glaube, du hast falsche Vorstellungen davon, wie schnell GPUs intern arbeiten. Mehrere SEKUNDEN braucht sicher kein Workload der in den Speicher passt, um sich auf die CUs zu verteilen.
Mir ist bewusst wie schnell die GPUs intern arbeiten, aber was nützt es mir wenn die Software darauf noch nicht richtig ausgerichtet ist?!
Nach was sieht das hier für dich aus? Software oder Hardwarelimtierung? Und jetzt sag nicht die 7970 wurde hier in der GPGPU Leistung beschnitten. ;)
BenchmarkOpenMMDHRF - openmm
Hier sieht das Ergebnis schon deutlich besser aus, ist aber noch lange nicht das maximal mögliche, was man aus der HD7970 rausholen kann.
Folding@home: Sneak peak at OpenMM 5.1: about 2x increase in PPD for GPU core 17
Und genau darum geht es hier bei dem FH Bench. Dieser soll aufzeigen was derzeit möglich ist, wenn gewisse Cores mit OpenMM 5.0 oder 5.1 zum Einsatz kommen.
Nicht mehr und nicht weniger sag er für mich aus, und erst recht nichts über die Leistungsfähigkeit einer Grafikkarte. Daher halte ich es auch nicht für sinnvoll diesen Bench als Leistungsindikator in euren Benchparkur mit aufzunehmen, solange es noch Baustellen in diesem Bereich gibt.

Ja, wenn und hätte und wäre. Es ist aber meist so, dass reale Programme mit ganz anderen Dingen zu kämpfen haben, als es in reinen Synthies wie Sandra zu berechnen gilt.
Was macht den der FH Bench?
The version used for explicit solvent simulations included 7023 TIP3P water molecules, giving a total of 23,558 atoms. All simulations used the AMBER99SB force field and a Langevin integrator, and were run with OpenMM 5.0.
Und was macht die Finanzanalyse von Sandrasoft?
The financial analysis benchmarks use IEEE float/FP32 (32-bit single-precision) format, the standard floating-point format used in computing that is supported by all GP(GPU)s. For most algorithms it provides "enough" precision - except where the data is repeatedly processed thus causing errors to mount up.

Beide Benchs Simulieren Aufgaben im mathematischen Bereich über ein und die selbe API, nur mit dem Unterschied, dass beim Code von Sandra die Fehler während der Berechnung durch mehrfache Überarbeitung ausgegrenzt werden, und somit die volle Rechenleistung der GPU abgerufen wird . Wo hingegen der Code vom FH Bench so geschrieben wurde, dass die GPU so eingebremst wird um Fehler in der Berechnung zu vermeiden, um eine möglichst hohe Genaugikeit zu gewährleisten. Letzeres ist zwar besser für die Forschung, aber auf Kosten der Effizienz, die wiederum nicht jeder bereit ist in Form von Stromkosten zu zahlen. Daher bin ich zuversichtlich, dass es in Sachen Core17 für GPUs voran gehen wird, damit endlich mal meine 7970 wieder zum Einsatz kommt.

Uha... und was hat das damit zu tun, ob sich der FAH-Bench eignet? Spräche eher dafür, dass die Ergebnisse der SP-Rechenleistung angemessen erscheinen.
Das tut er ja eben nicht, weil der Code noch nicht richtig auf die neuen Karten angepasst ist. Stattdessen wird da ein einheitlicher Code verwendet der mit beiden Architekturen zwar was anfangen kann, aber noch ziemlich in den Kinderschuhen steckt. Die Zeit wird zeigen, was aus den Karten noch rauszuholen ist, denn derzeit sind die Ergebnisse zwar nicht schlecht aber noch ziemlich mau.
 
Zuletzt bearbeitet:
Ach Hawky1980...
Um mir mal den Quote-War etwas abzukürzen: Synthies wie Sandra sind i.d.R. nicht auf Real-World-Workload ausgelegt sondern darauf, mit synthetischem Code möglichst reproduzierbare Ergebnisse zu erzeugen, siehe 3DMark. FAH nutzt real verteilten Code des Projekts - wenn auch wohl keine (eingestellte) Beta-Software.

GPU-Test sind immer nur eine Momentaufnahme - mit dem zur gegebenen Zeit verfügbaren Code.
Wer hätte gedacht, dass AMD nach >10 Monaten in Battlefield 3 noch die Handbremse finde und löst? Übrigens ist die Auslastung, die GPU-z ausliest nicht besonders aussagekräftig. Zwischen OpenCL-Pfad und Cuda-Pfad liegen bei einer Geforce keine Unterschiede, trotzdem ist Cuda teils deutlich schneller.

--
Wie gesagt, danke für eure Teilnahme und die Diskussion. Ich nehme ergo vorerst mit: Zwei oder drei Hardcore-Faltern genügt FAHBench nicht, da er Beta-Cores nicht verwendet und keine vollkommene Auslastung aller Einheiten gewährleistet. 9 Forennutzer würden solche Benchmarks gerne sehen.
 
Zurück