650ti: OpenCL zu schwach...

dragdrop

Schraubenverwechsler(in)
Habe die Cuda/OpenCL Performance von Zotac GTX 650ti 2GB gemessen.
Ich bin dann doch etwas enttäuscht...

Die "vergleichsweise gute" Game-Performance + techn. Daten der Grafikkarte sieht man bei OpenCL nicht wieder...

Während Cuda noch akzeptabel ist und etwa in Blender-Rendertests den i7-3770 Prozessor schlägt.
i7-3770: 3m48s
GTX650ti: 2m18s
(zum Vergleich: Quadro 4000: 2m:07s)

Sieht es bei OpenCL LuxMark schlecht aus und liegt weit unter Intel HD4000!!! Also UNTERIRDISCH!!!
i7-3770: Test1=256 / Test2=404 / Test3=2462
GTX650ti: Test1=126 / Test2=269 / 3=1740
(zum Vergleich Quadro 4000: Test1 = 229 / Test2 = 454 / Test3 = 3271)


Man sieht deutlich, dass die Karte bei Cuda sich fast mit Quadro messen kann,
aber bei OpenCL fast halb so schnell ist.

Ich habe die Vermutung, dass Nvidia hier absichtlich die Karte per Treiber einschränkt.
310.90 ist installiert (ganz neue Version ist zu fehlerhaft).



Hier ist ein Beispiel wie stark OpenCL-Performance schwanken kann:
GPU-acceleration (OpenCL) performance at NVIDIA video adapters (Page 1) - Using SVP - SmoothVideo Project


We kann ich die OpenCL-Performance beschleunigen?
Gibt es evtl. bessere Treiber?
Quadro statt Geforce-Treiber installieren?
Versteckte RegKeys oder Einstellungen?
 
Liegt einfach daran, dass alle Grafikkarten aus der 600er Serie beim gpu-computing (künstlich?) ausgebremst werden. Machen kannste daran eigentlich nix. Aber mal davon ab ist die 650ti ohnehin nur midrange.

Was hast du denn so schönes mit opencl vor, dass es dich so sehr ärgert das die 650ti darin so schlecht abschneided? -Nur um der Punkte im Benchmark Willen kann's einem doch vollkommen egal sein. Und wenn du tatsächlich opencl nutzen willst (was ich bei dem Mangel von consumer-software bezweifle) solltest du dich auf jeden Fall eher nach einer 6990, 7950 oder 7970 umschauen.
 
Die 650 Ti wird nicht künstlich ausgebremst. nVidia hat die 600er Serie explizit auf den Gaming-Markt ausgerichtet und deshalb bei der Entwicklung den Großteil an Transistoren für GPGPU weggelassen, da man als Gamer in der Regel kein GPGPU benötigt. Wenn du eine hohe OpenCL Leistung brauchst, führt kein Weg an AMDs 7000er Serie vorbei.
 
Die GPGPU Leistung wurde auch gestrichen, damit die Karten effizienter werden. Denn kein Gamer braucht GPGPU. AMD Karten haben ja einen etwas höheren Stromverbrauch. Wenn die ihre GPGPU Power auch kappen werden sie arg effizient werden :daumen:
 
Zunächst mal Vergleich der techn. Daten zw. GTX 650 ti und Quadro 4000

memory: 128 (gtx) vs 256 (quadro) bit
cuda cores: 768 (gtx) vs 256 (quadro)
memory bandwidth: 86,4 (gtx) vs 89,6 (quadro) gb/s
memory clock: 1350 (gtx) vs 700 (quadro) mhz
core clock: 941 (gtx) vs 475 (quadro) mhz
gflops: 1420 (gtx) vs 486 (quadro) single precision



sogesehn gibt es nur 128bit, aber 2x höheren Speichertakt = somit fast gleich
Die Bandbreite ist auch fast gleich.

Interessant: Anzahl Cores UND gflops sind 3x höher als bei Quadro.

In der Summe müsste GPGPU min so schnell sein wie bei quadro.
Mit dem Render-Test hat es auch gezeigt, dass die fast gleich schnell sind.

NICHT jedoch bei OpenCL, hier gibt es doch viel zu große Unterschiede.




Die Karte musste auf jeden Fall Cuda haben,
OpenCL haben die sowieso (natürlich etwas langsamer als bei AMD)
 
Die GPGPU Leistung wurde auch gestrichen, damit die Karten effizienter werden. Denn kein Gamer braucht GPGPU. AMD Karten haben ja einen etwas höheren Stromverbrauch. Wenn die ihre GPGPU Power auch kappen werden sie arg effizient werden :daumen:

der metro2033 und civ 5 gamer profitieren von gpgpu. die neue unreal engine soll wohl auch massiv von gpgpu gebrauch machen.
zum rendern von videos würde ich übrigens nicht auf cuda setzen, die qualität verschlechtert sich sichtbar. da kann man genauso niedrigere qualitätslever im softwarerendering wählen.
 
der metro2033 und civ 5 gamer profitieren von gpgpu. die neue unreal engine soll wohl auch massiv von gpgpu gebrauch machen.
zum rendern von videos würde ich übrigens nicht auf cuda setzen, die qualität verschlechtert sich sichtbar. da kann man genauso niedrigere qualitätslever im softwarerendering wählen.

Bloß das es mit der CPU manchmal deutlich länger braucht aber wenn man wert auf Quali legt würde ich auch mit der CPU encoden.
Und das die 600er Serie von Nvidia zum encoden nicht das gelbe vom Ei ist wurde ja schon mehrmals gesagt.:daumen:
 
Zurück