gesucht sind alle leute mit 16 oder gar 18 kerner mit ht

Ja, aber:
Cache, Speicherinterface, Kontextwechsel, ...

Meine CPU Last lag bei 1-2%, also "Hintergrundrauschen". Ich verwende die Runtime "Python 3.6.2 (v3.6.2:5fd33b5, Jul 8 2017, 04:57:36) [MSC v.1900 64 bit (AMD64)] on win32". Liegt da das Problem?
 
Meine CPU Last lag bei 1-2%, also "Hintergrundrauschen". Ich verwende die Runtime "Python 3.6.2 (v3.6.2:5fd33b5, Jul 8 2017, 04:57:36) [MSC v.1900 64 bit (AMD64)] on win32". Liegt da das Problem?

Beim Hintegrundrauschen sehe ich kein Problem. "on win32" könnte ein Problem sein. Ich habe 64bit python auf 64bit System.
 
Beim Hintegrundrauschen sehe ich kein Problem. "on win32" könnte ein Problem sein. Ich habe 64bit python auf 64bit System.

Ich ändere das Setup und teste nochmal.

Edit: Sieht besser aus.
Code:
C:\Users\marcf\Downloads\SC_bench_memPy3x.py>SC_bench_memPy3x.py
Generate test data of size 16777216
Checking, if test data is correct
Running the test
Runtime in seconds: 54.83596205711365

Ich habe die CPU Settings noch auf auto geändert, so dass sich der Boost frei entfalten konnte. Ging teilweise rauf auf über 4.1GHz.
 
Zuletzt bearbeitet von einem Moderator:
Hab's gerade über meinen i3 7100 all stock laufen lassen: 38.4

Edit: Sieht besser aus.

Ja, wobei ich auf einen besseren Wert gehofft habe. 40% langsamer als ein i3 7100 ist nicht gerade toll.
Auf jeden Fall danke für den Test. Derartige Performance wird sonst leider nicht/kaum getestet.

Man muss aber auch sagen, es kann auch noch am Betriebssystem oder/und am Python executable liegen. Vielleicht finden sich ja noch andere Tester...
 
Hast du Windows und kannst C# Code testen? Ich habe äquivalenten Code geschrieben, der bei mir in ca. 17 Sekunden ausgeführt ist. Das wäre mal interessant zu wissen, denn es kann sein, dass die Pre-Kompilate der Python Runtime auf Intel optimiert sind oder eben noch nicht auf Ryzen.

https://1drv.ms/u/s!As_jnW8h38YpgbN8207274U53uUX_A
 
Es gibt von Intel ein optimiertes Linux samt Python. Das habe ich aber nicht. Ich habe das "Normale", dh. Lubuntu repositories.

Dh, ich habe Linux und kann aber C# ausführen.
Mono Basics | Mono

Stellst Du bitte den Source-Code zur Verfügung?
 
Dh, ich habe Linux und kann aber C# ausführen.
Mono Basics | Mono

Ja, .NET Core. Ich hab's aber in .NET 4.7 erstellt. Es sind übrigens 13 Sekunden bei mir, wenn ich den Thread auf einen Die fixiere. Dass das aber auch immer so über die NUMA Grenzen hinweg spazieren gehen muss! Schlimm...

Edit: Ich musste den Seed anpassen, da der Konstruktor kein long akzeptiert, daher habe ich weiter unten auch eine andere Prüfsumme.
Code:
[COLOR=blue]using System;
[COLOR=blue]using System.Diagnostics;
 
[COLOR=blue]namespace TestPythonBenchmark
{
    [COLOR=blue]class [COLOR=#2b91af]Program    {
        // Kein long für den Seed, frisst der ctor nicht
        [COLOR=blue]private [COLOR=blue]static [COLOR=#2b91af]Random _random = [COLOR=blue]new [COLOR=#2b91af]Random(241500528);
 
        [COLOR=blue]static [COLOR=blue]void Main([COLOR=blue]string[] args)
        {
            [COLOR=blue]const [COLOR=blue]int cycles = 2048;
            [COLOR=blue]int testsize = ([COLOR=blue]int)[COLOR=#2b91af]Math.Pow(2, 24);
 
            [COLOR=blue]int[] testdata = [COLOR=blue]new [COLOR=blue]int[testsize];
 
            [COLOR=blue]for ([COLOR=blue]int i = 0; i < testsize; i++)
            {
                testdata[i] = _random.Next(1, 255);
            }
 
            [COLOR=blue]int the_sum = 0;
 
            [COLOR=#2b91af]Stopwatch stopwatch = [COLOR=blue]new [COLOR=#2b91af]Stopwatch();
            stopwatch.Start();
 
            [COLOR=blue]for ([COLOR=blue]int k = 0; k < cycles; k++)
            {
                [COLOR=blue]int value = k;
                [COLOR=blue]while (value < testsize)
                {
                    [COLOR=blue]if (testdata[value] > 128)
                    {
                        value += testdata[value];
                    }
                    [COLOR=blue]else                    {
                        value--;
                    }
                }
                the_sum += (value % cycles);
            }
 
            stopwatch.Stop();
 
            // Natürlich dann andere Prüfsumme als du
            [COLOR=blue]if (the_sum != 200704)
            {
                [COLOR=blue]throw [COLOR=blue]new [COLOR=#2b91af]Exception([COLOR=#a31515]"wrong test result");
            }
            [COLOR=blue]else            {
                [COLOR=#2b91af]Console.WriteLine([COLOR=#a31515]"Runtime in seconds:" + stopwatch.Elapsed);
            }
 
            [COLOR=#2b91af]Console.ReadKey();
        }
    }
}
 
Zuletzt bearbeitet von einem Moderator:
Code ist da. Und verwende die neuste Version von Mono. Ist die schon äquivalent zu Core 2.1? Da sind nämlich Ryzen Optimierungen enthalten.

Ich glaube wir sind total off-topic!

@DBGTKING: Mein Angebot steht noch. Lade Material hoch und ich teste das gerne.
 
Zuletzt bearbeitet von einem Moderator:
Denn ich habe im Moment keinen Ryzen.

Macht auch wenig Sinn, wenn du ein Skript-Mensch bist. Ich mache zwar auch viel Octave, aber eigentlich fast nur C#. Da glänzt Ryzen einfach. Die Performance in Octave ist mir latte, da ich es nur als Validierungsreferenz verwende.
 
Mono Jit Compiler 4.2.1

i3 7100: 9.8 bis 9.9 Sekunden. Ohne thread-pinning.

Auch dazu muss man ergänzen, dass mono unter Linux eventuell schneller läuft, als .net unter Windows. Aber 9.9 vs 17 ist dennoch viel...

Ich hatte gehofft, dass wir hier etwas von den 32MByte Cache des Threadripper 16 sehen...

Auch dachte ich, dass das branching im Script eher meltdown-patch-ungünstig ist...
 
13 Sekunden ohne Fixierung auf einen Kern, aber NUMA im BIOS aktviert. Man müsste halt auf den gleichen Plattformen testen, sonst ist der Vergleich schwierig.
 
achso. Ich habe unter Linux den Thread auf einen Core gepinnt. Das bringt nichts.
Allerdings: Firefox zumachen hat etwas gebracht: 9.3s

Ich denke, insofern man das weiter verfolgt, sollte man den Unsicherheitsfaktor Linux<->Windows heraus nehmen.

Edit: ...ich habe relativ geringe RAM-Latenzen: DDR4-2400, CL10-12-12-28
 
Lass uns im Benchmarkforum einen Thread aufmachen und beide Varianten zur Verfügung stellen. Am besten dein Python Skript auch mit Anleitung. Meine Exe muss man ja einfach nur ausführen.
 
wow hätte ich nicht gedacht das so viele leute auf einmal schreiben.Hier nun das hochgeladenen

Zuerst mal die Quell daetien,Habe da nur zwei herrausgepickt

File-Upload.net - 188.DerkleineDieb_20120819_0555.rar

File-Upload.net - 369.WirbelumdieBlauePerle_Perfekt_20150210_1435.rar



So nun kommen die einstellungen von xmedia recode.Die wo ich ausgelassen habe,sind unberührt geblieben.Oder sind auf null gestellt

http://fs1.directupload.net/images/180715/oz3saa9d.png
http://fs5.directupload.net/images/180715/bwhexdoo.png
http://fs1.directupload.net/images/180715/c6qtdgxp.png
http://fs1.directupload.net/images/180715/nwv63v2u.png
http://fs1.directupload.net/images/180715/ij25yrrg.png
http://fs1.directupload.net/images/180715/egv4p2lb.png
http://fs5.directupload.net/images/180715/9kqxu4hc.png
http://fs5.directupload.net/images/180715/7zis2c2d.png
http://fs1.directupload.net/images/180715/8ifox2sx.png
http://fs5.directupload.net/images/180715/v2t355ff.png
http://fs5.directupload.net/images/180715/36zct4h6.png


habe noch zwei einstellungen von xmdeia recode vergessen kappt,sorry


So nun die Hybrid einstellungen

http://fs5.directupload.net/images/180715/52cfw72r.png
http://fs5.directupload.net/images/180715/w27yvgkj.png
http://fs1.directupload.net/images/180715/iwkh5qgf.png
http://fs1.directupload.net/images/180715/4s2t48wi.png
http://fs1.directupload.net/images/180715/7x6a2fe9.png
http://fs5.directupload.net/images/180715/dmfx5xrx.png
http://fs5.directupload.net/images/180715/za2cbdhh.png
http://fs5.directupload.net/images/180715/dxpzs7zc.png

Ps wundert euch nicht das ich so viele taps offen habe,habe es nur vergessen zu schließen die ordner
 
Zuletzt bearbeitet:
Zwar nur ein 8700k, aber:

Video 1 "DerkleineDieb" - XMediaRecode - 2min 36s

AVX und AVX2 an CPU@ 4,3GHz.
 
Zurück