OpenCL (CPU + GPU) Benchmark

Status
Für weitere Antworten geschlossen.

thysol

BIOS-Overclocker(in)
Hallo,
Ich habe einen CPU und GPU Benchmark geschrieben. Der CPU Benchmark wurde in C# geschrieben und ist "vorerst" Single-threaded. Der GPU Benchmark wurde in OpenCL geschrieben und nutzt 10000000 threads. Eine GUI ist auch in dem Benchmark.

Die Aufgabe in dem Benchmark die die GPU und CPU zu erledigen haben ist folgende:

Es wird eine Datenbank erstellt mit 10000000 verschiedenen Zahlen. Die Zahlen gehen von 0 bis 10000000. Die CPU/GPU muss dann jede Zahl in der Datenbank verdoppeln. Dies ist in einer Schleife und muss 1000 mal passieren. Die verschiedenen Zahlen werden als ints gespeichert und nach 1000 verdopplungen laeuft der Speicher eines ints ueber. Dass macht aber nichts weil dann schreibt der Kompiler einfach "Infinity" in jeden Datenbank eintrag und dass macht die Datenbank unbrauchbar. Dass ist aber egal weil es ja ein Benchmark ist.

Ihr koennt die .exe als Anhang in diesem Post finden.

Mein Core i5-750 braucht 10.678 Sekunden um die Aufgabe zu loesen. Meine Radeon HD 5870 braucht nur 1.48 Sekunden beim ersten Durchlauf und 0.61 Sekunden beim zweiten Durchlauf. Die Berechnung geht beim zweiten Durchlauf schneller weil dann muss OpenCL nicht mehr initialisiert werden. Wie deutlich zu sehen ist rechnet die GPU "parallel" deutlich schneller. Ich habe den Benchmark hier reingestellt weil mich interessiert welche Resultate ihr mit anderen CPUs/GPUs kriegt.

Uebrigens waehrend die Benchmarks laufen zeigt der Task Manager oft an dass die Programme abgestuerzt sind weil sie keine Rueckmeldung mehr geben. Keine Angst, dass ist nicht der Fall, ihr muesst einfach warten bis der Benchmark die Zeit anzeigt.

Postive und Negative Kritik ist erwuenscht.;)

Edit: Ich habe uebrigens den Thread hier aufgemacht statt im Benchmark Unterforum weil es hier mehr um den Vergleich CPU/GPU geht und nicht um die Geschwindigkeit von CPUs/GPUs zu vergleichen. Es geht hier eher um den Vergleich GPU vs. CPU daher habe ich den Thread hier aufgemacht.;)

Wenn es Probleme gibt dann wendet euch an diese Troubleshooting Liste: (Danke an Skysnake fuer die Liste:daumen:)


Schritt 1: Stelle fest ob du eine Ati oder nVidia Karte besitzt, wenn Ati, fahre mit Schritt 2 fort

Schritt 2: Lade unter Drivers & Support | GAME.AMD.COM den CCC-Displaydriver runter (komplett in EN oder in zwei teilen mit dem DE-Sprachpacket)

Schritt 3: installiere den/die geladenen treiber

Schritt 4: Lade dir unter ATI Stream SDK v2.2 with OpenCL? 1.1 Support | AMD Developer Central das für dein Betriebssystem gedachte SDK (2.2) herunter

Schritt 5: installiere das soeben heruntergeladene SDK komplett auf deinem Rechner

Schritt 6: führe den Benchmark aus und freue dich ;)


User Highscore Liste: (CPU Benchmark v1.0) (Letztes Update = 05/09/10)


Intel = Blau
AMD = Gruen


User Highscore Liste: (GPU Benchmark v1.0)
(Letztes Update = 05/09/10)
Nvidia = Gruen
ATI = Rot
User Highscore Liste: (GPU Benchmark v1.2) (Letztes Update = 05/09/10)
Nvidia = Gruen
ATI = Rot



User Highscore Liste: (CPU Benchmark Multi-Core) (Letztes Update = 12/09/10)

Intel = Blau
AMD = Gruen


1.|scbiz|Core i7-920@4GHz|GTX 480 (OC)|?|2,6616223
2.|Tight86|Core i7-920@4,4GHz|GTX285(OC)|DDR3-1600|2,8985048
3.|0Martin21|Core 2 Quard Q9400 (2,66GHz)|GTX 285|DDR2-800|3,233857
4.|FloW^^|Phenom2 x4 940@3,4Ghz|Radeon HD5770(OC)|DDR2-800|3,4154231

5.|sch8mid|Core 2 Quad Q9550@3,1GHz|HD 5770|DDR3-1066|3,4284328

6.|Joker4Life|Core i5-750(4GHz)|HD 5850(OC)|DDR3-1600|4,1482943
7.|KlawWarYoshi |
Core i7-920@2,8GHz|GTX260(SLI)|DDR3-1600|4,994041
8.|Chimera|Core i5-750@2,67GHz|Geforce GTX 460|DDR3-1333|5,0110393
9.|DerPate26|Phenom 2 X4 955 @3,744GHz|GTX 480 (OC)|DDR3-1600|5,3331971

10.|KingofKingzZ|Phenom 2 955@3,5GHz|Geforce GTX 260 (OC)|DDR3-1666|5,902197
11.|thysol|Core i5-750(2,8GHz)|HD 5870|DDR3-1066|5,9173362
12.|0Martin21|
Phenom 2 X6 1090T(3,2GHz)|HD 5970|DDR3-1333|5,9809628
13.|Sheeep|
Athlon X2 6400+(3,2GHz)|Geforce 8600GT|?|12,7897218
14.|Rayman|
Phenom 2 X4 9500(2,2GHz)|Radeon HD 5670|DDR2-667|14,4688577

User Highscore Liste: (GPU Benchmark v1.3) (Letztes Update = 21/09/10)

1.|DerPate26|Phenom 2 X4 955 @4GHz|GTX 480 (OC)|DDR3-1600|1,3562478
2.|scbiz|Core i7-920@4GHz|GTX 480 (OC)|?|1,4012175
3.|KingofKingzZ|Phenom 2 X4 955@3,8GHz|GTX 470 (OC)|DDR3-1600|1,8631807
4.|mattinator|Xeon X3380@3.16GHz|GTX 275 (OC)|?|3,0242301
5.|0Martin21|Core 2 Quard Q9400 (2,66GHz)|GTX 285|DDR2-800|3,233857
6.|Chimera|Core i5-750@2,67GHz|Geforce GTX 460|DDR3-1333|3,2972364
7.|FloW^^|Phenom2 x4 940@3,4Ghz|Radeon HD5770(OC)|DDR2-800|3,4154231
8.|sch8mid|Core 2 Quad Q9550@3,1GHz|HD 5770|DDR3-1066|3,4284328


PS: Danke an KlawWarYoshi fuer die Idee mit der Highscore Liste.:daumen:

Update 15/08/10:

GPU Benchmark (v1.1) hinzugefuegt. Der Benchmark ist 100 mal komplexer zu berechnen als der alte. Eine Highscore Liste fuer v1.1 ist geplant. Wie immer ist ein Screenshot als Beweis die Mindest Vorraussetzung.;)

Update (2) 15/08/10:

GPU Benchmark (v1.2) hinzugefuegt. Der Geforce Bug wurde behoben und wie bei v1.1 ist die Berechnung 100 mal komplexer also regt euch nicht auf dass die Berechnung diesmal laenger dauert.^^ Ich entschuldige mich auch an alle Geforce User.

Update 19/08/10:

CPU Benchmark mit Multi-Core Optimierung wurde hinzugefuegt. Danke an Sheeep fuer die Programmierung.:daumen:

Update 28/08/10:

GPU Benchmark (v1.3) wurde hinzugefuegt. Dieser Benchmark nimmt die Zeit deutlich genauer ab und es gibt kaum noch Zeit Schwankungen. Dass heisst meine Radeon HD 5870 hat immer ein 1.95 Resultat egal wie oft ich den Knopf druecke.
 
Zuletzt bearbeitet:
werd den Benchmark gleich mal ziehen :devil:

aber eine Frage hätte ich doch...
wieso haste den GPU-Benchmark so oft gethreaded und den für CPU nur 1x :ugly:
willst wohl das die gut abschneiden :P

naja werde gleich mal Ergebnise posten ;)

________________________________
EDIT:
GPU: 0,415 s (war schneller :P)
CPU: 12,1831 s

und als Beweis noch n Screenshot im Anhang^^
 
Zuletzt bearbeitet:
Hier mal meine Resultate:
@kress
Funktioniert bei dir der Folding@Home GPU Client?;)

Edit: KlawWarYoshi hatte die geniale Idee eine Hichscore Liste der Resultate zu machen. Wenn genug Leute mitmachen kann ich eine Highscore Liste machen.^^
 
Ihr benötigt .NET Framework 4. :D

Downloadseite von Microsoft: Klick mich an!

Ab Windows XP SP3/Server 2003 SP2 und aufwärts. Auch 64bit OS wird unterstützt.

EDIT: meine Ergebnisse kommen erst in ein paar Minuten...
 
@Thysol: Du hast aber ne komische 5870: ich komme mit meiner 5850 auf 0,48xxxx. Leider weggeklickt.^^
Hier mal ein 0,49 Ergebnis mit einer 5850@725/1000.
 
@Thysol: Du hast aber ne komische 5870: ich komme mit meiner 5850 auf 0,48xxxx. Leider weggeklickt.^^
Hier mal ein 0,49 Ergebnis mit einer 5850@725/1000.

Ja, ich wunder mich auch wieso meine 5870 schlechter ist als eine 5850.:(

@DerPate26
0,19 Sekunden. Hammer.:sabber: Fermi ist einfach der Hammer im GPGPU Bereich.;)
 
Habs auch mal getestet, CPU eher schlecht, GPU eher gut :D

GPU: 0,2854...
CPU: 15,613...

Im GPGPU Bereich ist Fermi anscheinend Hammer. 0,285 Sekunden, respekt.:daumen: Dagegen kann ja meine Radeon HD 5870 einpacken. Hoffentlich optimiert AMD/ATI endlich mal die GPGPU Performance ihrer GPUs.;)

Naja als Hammer würde ich Fermi jetzt nicht bezeichnen, eher enttäuschend. Wenn man sich mal mein Ergebnis mit ner GTX285 ankuckt. Wo ist denn da der Fortschritt?
Noch schlimmer die HD5000er. Als ich mir das durchgelesen hab, wollte ich schon gar nich erst die Benches ausprobieren, hab damit gerechnet das die um die 0,9 liegen wird. Jetzt bin ich bisschen verwundert?!

Mich würden noch die Ergebnisse anderer GTX285 Besitzer interessieren.

I7-920@4GHZ : 8,0512935 sek.
GTX285@ 705 / 1590 / 1390 Mhz: 0,1892181 sek.

Bei gefühlten 1.000000 durchläufen, liegen meine Ergebnisse zwischen ca. 0,175... und etwa 0,205....
 
Zuletzt bearbeitet:
Naja als Hammer würde ich Fermi jetzt nicht bezeichnen, eher enttäuschend. Wenn man sich mal mein Ergebnis mit ner GTX285 ankuckt. Wo ist denn da der Fortschritt?
Noch schlimmer die HD5000er. Als ich mir das durchgelesen hab, wollte ich schon gar nich erst die Benches ausprobieren, hab damit gerechnet das die um die 0,9 liegen wird. Jetzt bin ich bisschen verwundert?!

Mich würden noch die Ergebnisse anderer GTX285 Besitzer interessieren.

I7-920@4GHZ : 8,0512935 sek.
GTX285@ 705 / 1590 / 1390 Mhz: 0,1892181 sek.

Anscheinend ist es so dass generell im GPGPU Bereich Geforces deutlich schneller sind als Radeons.;)
 
Eigentlich seltsam, ist die rohe Rechenkraft eigentlich bei ATI deutlich höher. Egal ob bei einfacher oder doppelter Genauigkeit.
 
Eigentlich seltsam, ist die rohe Rechenkraft eigentlich bei ATI deutlich höher. Egal ob bei einfacher oder doppelter Genauigkeit.

Ich habe 1D Vektoren zur Berechnung benutzt. Ich habe mal irgendwo gelesen dass mann bei ATI lieber Multi-dimensionale Vektoren benutzen soll. Ich werde dann wohl dass noch versuchen dass so umzuprogrammieren dass ATI Karten besser abschneiden und der CPU eine Mehr-Kern Unterstuetzung goennen.;)
 
Das war jetzt keine Kritik an dich, allgemein schneiden die nVidia Karten bei solchen Tests sehr gut ab. Ich bin nur allgemein verwundert das hier ATI meist, egal bei welchem Test, zurück liegt.

Aber wenn die bei Multivektoren stärker sein sollen, wäre es sicherlich auch mal interessant zu sehen. Liegt wohl an dem Shaderaufbau, der ja im Grunde aus einem Shader gleich 5 macht (blöd gesagt)
 
Aber wenn die bei Multivektoren stärker sein sollen, wäre es sicherlich auch mal interessant zu sehen. Liegt wohl an dem Shaderaufbau, der ja im Grunde aus einem Shader gleich 5 macht (blöd gesagt)

Dann sind wohl 5D-Vektoren optimal fuer Radeons. Wenn ich Zeit habe werde ich mal versuchen dass umzuprogrammieren.;)
 
CPU: 13,7497723 sec. (AMD P II X4 945 @ 3,0GHz)
GPU: 0,5525294 sec. (Asus EN8800GT @ C600/S1500/M900 MHz)
GPU: 0,3288585 sec. (oc. @ C700/S1750/M1030 MHz)

Das sind mal meine Werte.
Schön, das mal ein User sowas schreibt und hier rein stellt :daumen:.
THX @ thysol

MfG type_o
 
Status
Für weitere Antworten geschlossen.
Zurück