Hallo,
bei einem Performance-Test haben wir (gaussmath, ich) unerwartete Unterschiede zwischen Intel/AMD und Windows/Linux festgestellt.
Daher suchen wir weitere Ergebnisse zu diesem Benchmark.
Würdest Du zwecks Benchmark folgenden Algo bei Dir laufen lassen?
Für den Test möglichst alle anderen Programme schließen.
Wir haben zwei Varianten: Python Script für CPython >=3.5 sowie C#.
Interessant sind die Ergebnisse beider Varianten.
Für das Python-Script ist es unter Windows erforderlich, CPython zu installieren: Download Python | Python.org
Anschließend das Script mit Python öffnen und, falls sie nicht automatisch startet, mit F5 starten.
SC_bench_memPy3x.py (CPython >=3.5)
lars lrs, i3 7100 stock, DDR4@2400, CL10-12-12-28, Ubuntu 16.04 (alle patches installiert): 38s
HisN, i7 5960X@4.5Ghz, DDR4@2600, CL15-15-15-35, Windows10: 45.6s
Krolgosh, Xeon E5 2687W@3.10Ghz (stock), 64 GB DDR3@800, CL11-11-11-28, Windows 7: 80.9s
gaussmath, Ryzen 1950X@4Ghz + Game Mode (16MB Level 3 Cache aktiv, Dual Channel), DDR4@3446, CL14-14-14-30, Windows10: 54.8s
Olstyle, i5 5675c stock, Windows: 77.6s
SC_bench_memcs.cs:
lars lrs, i3 7100 stock, DDR4@2400, CL10-12-12-28, Ubuntu 16.04 (alle patches installiert): 9.3s
HisN, i7 5960X@4.5Ghz, DDR4@2600, CL15-15-15-35, Windows10: 9.0s
HisN, i7 5960X@4.5Ghz, DDR4@2600, CL15-15-15-35, Ubuntu16.04 Live-USB-Stick: 9.5s
Krolgosh, Xeon E5 2687W@3.10Ghz (stock), 64 GB DDR3@800, CL11-11-11-28, Windows 7: 12.2s
gaussmath, Ryzen 1950X@4Ghz + Game Mode (16MB Level 3 Cache aktiv, Dual Channel), DDR4@3446, CL14-14-14-30, Windows10: 13.3s
gaussmath, i7 3630QM@3.4Ghz, DDR3@1333, CL9-9-9-24, Windows10: 10.5s
Olstyle, i5 5675c stock, Windows: 8.6s
SC_bench_memcs16mb.cs
lars lrs, i3 7100 stock, DDR4@2400, CL10-12-12-28, Ubuntu 16.04 (alle patches installiert): 3.1s
gaussmath, i7 3630QM@3.4Ghz, DDR3@1333, CL9-9-9-24, Windows10: 3.9s
gaussmath, Ryzen 1950X@4Ghz + Game Mode (16MB Level 3 Cache aktiv, Dual Channel), DDR4@3446, CL14-14-14-30, Windows10: 2.1s
Olstyle, i5 5675c stock, Windows: 3.2s
_LS_ , i7 6700k@4,3GHz(Allcore), Cache@4,2GHz, DDR4@2400MHz CL14-14-14-36-1T Windows 10: 2.6s
Spectre und Meltdown-Patch
Olstyle, i5 5675c stock, Windows: Jeweils (fast) keine Unterschiede
Je mehr mitmachen, umso besser.
Vielen Dank,
Lars
Funktionsweise:
Es wird ein Array mit 16M Zufallszahlen (1...255) angelegt. Anschließend wird 2048 mal über das Array iteriert (äußere for-Schleife).
Pro Iteration wird in Abhängigkeit von der Zufallszahl im aktuellen Element das nächste Element ausgewählt (innere While-Schleife). Dh, die Schrittgröße ist abhängig von der gerade ausgewählten Zufallszahl. Wird 16M überschritten, so beginnt die nächste Iteration.
Hier und da wird etwas addiert, damit es auch etwas zu rechnen gibt: In der inneren while-Schleife ist dies der "Elemente-Index", der in Abhängigkeit von der gerade betrachteten Zufallszahl erhöht (+) oder verkleinert (-) wird. Letztlich wird insgesamt mehr addiert als subtrahiert.
In der äußeren for-Schleife werden alle Überläufe der inneren Schleife >16M modulo 2048 aufsummiert.
Jede der 2048 Iterationen startet mit einem anderen Wert, so dass sich die ausgewählten Werte pro Iteration teilweise voneinander unterscheiden.
bei einem Performance-Test haben wir (gaussmath, ich) unerwartete Unterschiede zwischen Intel/AMD und Windows/Linux festgestellt.
Daher suchen wir weitere Ergebnisse zu diesem Benchmark.
Würdest Du zwecks Benchmark folgenden Algo bei Dir laufen lassen?
Für den Test möglichst alle anderen Programme schließen.
Wir haben zwei Varianten: Python Script für CPython >=3.5 sowie C#.
Interessant sind die Ergebnisse beider Varianten.
Für das Python-Script ist es unter Windows erforderlich, CPython zu installieren: Download Python | Python.org
Anschließend das Script mit Python öffnen und, falls sie nicht automatisch startet, mit F5 starten.
SC_bench_memPy3x.py (CPython >=3.5)
lars lrs, i3 7100 stock, DDR4@2400, CL10-12-12-28, Ubuntu 16.04 (alle patches installiert): 38s
HisN, i7 5960X@4.5Ghz, DDR4@2600, CL15-15-15-35, Windows10: 45.6s
Krolgosh, Xeon E5 2687W@3.10Ghz (stock), 64 GB DDR3@800, CL11-11-11-28, Windows 7: 80.9s
gaussmath, Ryzen 1950X@4Ghz + Game Mode (16MB Level 3 Cache aktiv, Dual Channel), DDR4@3446, CL14-14-14-30, Windows10: 54.8s
Olstyle, i5 5675c stock, Windows: 77.6s
SC_bench_memcs.cs:
lars lrs, i3 7100 stock, DDR4@2400, CL10-12-12-28, Ubuntu 16.04 (alle patches installiert): 9.3s
HisN, i7 5960X@4.5Ghz, DDR4@2600, CL15-15-15-35, Windows10: 9.0s
HisN, i7 5960X@4.5Ghz, DDR4@2600, CL15-15-15-35, Ubuntu16.04 Live-USB-Stick: 9.5s
Krolgosh, Xeon E5 2687W@3.10Ghz (stock), 64 GB DDR3@800, CL11-11-11-28, Windows 7: 12.2s
gaussmath, Ryzen 1950X@4Ghz + Game Mode (16MB Level 3 Cache aktiv, Dual Channel), DDR4@3446, CL14-14-14-30, Windows10: 13.3s
gaussmath, i7 3630QM@3.4Ghz, DDR3@1333, CL9-9-9-24, Windows10: 10.5s
Olstyle, i5 5675c stock, Windows: 8.6s
SC_bench_memcs16mb.cs
lars lrs, i3 7100 stock, DDR4@2400, CL10-12-12-28, Ubuntu 16.04 (alle patches installiert): 3.1s
gaussmath, i7 3630QM@3.4Ghz, DDR3@1333, CL9-9-9-24, Windows10: 3.9s
gaussmath, Ryzen 1950X@4Ghz + Game Mode (16MB Level 3 Cache aktiv, Dual Channel), DDR4@3446, CL14-14-14-30, Windows10: 2.1s
Olstyle, i5 5675c stock, Windows: 3.2s
_LS_ , i7 6700k@4,3GHz(Allcore), Cache@4,2GHz, DDR4@2400MHz CL14-14-14-36-1T Windows 10: 2.6s
Spectre und Meltdown-Patch
Olstyle, i5 5675c stock, Windows: Jeweils (fast) keine Unterschiede
Je mehr mitmachen, umso besser.
Vielen Dank,
Lars
Funktionsweise:
Es wird ein Array mit 16M Zufallszahlen (1...255) angelegt. Anschließend wird 2048 mal über das Array iteriert (äußere for-Schleife).
Pro Iteration wird in Abhängigkeit von der Zufallszahl im aktuellen Element das nächste Element ausgewählt (innere While-Schleife). Dh, die Schrittgröße ist abhängig von der gerade ausgewählten Zufallszahl. Wird 16M überschritten, so beginnt die nächste Iteration.
Hier und da wird etwas addiert, damit es auch etwas zu rechnen gibt: In der inneren while-Schleife ist dies der "Elemente-Index", der in Abhängigkeit von der gerade betrachteten Zufallszahl erhöht (+) oder verkleinert (-) wird. Letztlich wird insgesamt mehr addiert als subtrahiert.
In der äußeren for-Schleife werden alle Überläufe der inneren Schleife >16M modulo 2048 aufsummiert.
Jede der 2048 Iterationen startet mit einem anderen Wert, so dass sich die ausgewählten Werte pro Iteration teilweise voneinander unterscheiden.
Anhänge
Zuletzt bearbeitet: