Rollora
Kokü-Junkie (m/w)
gute Noten haben noch nie was mit wirklichem Können zu tun gehabtAuch ich mit meinem 1er im Mittlere Reife-Zeugnis kann kein perfektes Englisch.![]()

Aber "perfekt" verlangts ja auch keiner, es muss ja nur "gut" sein
gute Noten haben noch nie was mit wirklichem Können zu tun gehabtAuch ich mit meinem 1er im Mittlere Reife-Zeugnis kann kein perfektes Englisch.![]()

Eben, deswegen ist das Argument mit der Schule nicht immer wirklich treffend.gute Noten haben noch nie was mit wirklichem Können zu tun gehabt
Aber "perfekt" verlangts ja auch keiner, es muss ja nur "gut" sein

Nun, der Artikel deckt sehr schön die reine PR-Vermarktung von PhysX seitens Nvidia auf. PhysX auf einer GPU ist murks und nur gepusht von NV, leider.
Mit einer einfachen Threading- und SSE-Optimierung für CPUs, würde ein x86-Prozessor PhysX wahrscheinlich ca. 960-1920 mal schneller ausführen, als ein Singlethreaded-basierter Code, auf einer GPU .
Selbst ein winziger Intel Atom würde 100x schneller als ein Singlethreaded PhysX-Code sein. Wenn man dann noch die Vektorisierung wegnimmt, sinkt die GPU-Performance noch weiter ins Bodenlose.
Den Rest bitte selber lesen,...
MfG,
Explosiv
In der von mir verlinkten Original-Quelle wirst Du das auch nicht finden, sry.
Beide Artikel sind mit einander verknüpft, wusste ned mehr, wo ich was gelesen hatte.
Hier, ich reiche gerne nach, aber erschlage mich nicht immer gleich:
MfG,
Explosiv
by Charlie Demerjian




Den 4x-Boost hält sogar die Originalquelle für unereichbar.On a modern 4 core CPU, you would get 4x speed increase from SSE, and a 4x increase from threading. Math says that would get you a 16x increase in speed,
Wie gesagt sind 1x bis 2x wahrscheinlich, also wie ich bereits zuvor sagte die 8x Leistung bei Quadcores und nicht, wie Charlie so schön rausposaunt, die 16x Leistung.Alle GPUs ab der GTX200 sind 64bit tauglich (außer die umbenannten GF9erAs Real World Tech pointed out, the Ageia PhysX chip used 32 bit math, and the now Nvidia PhysX programs likely do as well. The code runs on G80 based GPUs, and they did not have DP FP capabilities.
). Da Nvidia mit Sicherheit jede Möglichkeit zur Optimierung auf GPUs wahrnimmt, wird PhysX also vermutlich auf den entsprechenden GPUs auch mit 64bit laufen.Es ist kein Geheimnis, dass ein einzelner GPU-Shader-Prozessor einem CPU-Kern nicht das Wasser reichen kann, aber die Masse macht es halt. Man braucht sich ja nur mal einen Via C7 mit 200 Kernen Vorstellen. Der würde bei entsprechendem Code jeden Intel EE-CPU in der Luft zerpflücken wie eine alte lederige Weihnachtsgans, aber ein einzelner Kern ist nach wie vor kriechend langsam.With the simple threading and SSE optimizations above, the CPU would run it 960-1920x faster than single threaded GPU code. Even a lowly Atom CPU would probably be 100x faster than single threaded GPU PhysX code. If you take away vectorization as well, the GPU performance drops yet farther.

Und der Schritt auf 8 Kerne? Nochmal 3 Jahre und dabei gibt es Octacores bisher nur für Server.der artikel bzw. das fazit ist murks. singlethread auf der gpu wird gegen multithread auf einer modernen cpu verglichen, das da die gpu verliert, hätte ich dir auch vorher sagen können. gpu sind mittlerweile auf extremes multithreading ausgelegt und daraus beziehen die ihre rechenpower, dagegen haben aktuelle cpus keine chance. ausser wenn man dummfug macht und massiv parallelisierbares wie physikberechnungen auf singelthread beschränkt.
Nein, das ist er nicht. Es wird auch nicht "singlethread auf der gpu [...] gegen multithread auf einer modernen cpu verglichen", sondern es wurd Single-Threaded auf der CPU mit Multi-Threaded auf der CPU verglichen.
Artikel schrieb:With the simple threading and SSE optimizations above, the CPU would run it 960-1920x faster than single threaded GPU code.
muss ich die entscheidenden details noch rot markieren?
Den 4x-Boost hält sogar die Originalquelle für unereichbar.Wie gesagt sind 1x bis 2x wahrscheinlich, also wie ich bereits zuvor sagte die 8x Leistung bei Quadcores und nicht, wie Charlie so schön rausposaunt, die 16x Leistung.
Einen Boost von 75 auf 500 Punkte im Fluid-Mark alleine durch Multithreading und Steigerung der Emitter-Anzahl würde ich schon als Faktor 7 bezeichnen wollen.
http://physxinfo.com/news/wp-content/uploads/2010/03/fluidmark_graph.jpg
Und da sind keinerlei SSE-Optimierungen im Einsatz.
cu
Thomas
Windows hat von sich aus den einen Thread auf vier Kerne verteilt. Man müssste den Test wiederholen, indem man im Taskmanager dem Prozess nur einen einzelnen Kern zuweist. Sonst ist das Ergebnis nicht so recht verwertbar aus meiner Sicht.While SPH fluid simulation is running on CPU with “Multi-core PhysX” set to off, load is destributed through several cores (probably due to internal Windows threads management), but in sum that’s 26% – full one core.
Zu beachten:
Windows hat von sich aus den einen Thread auf vier Kerne verteilt. Man müssste den Test wiederholen, indem man im Taskmanager dem Prozess nur einen einzelnen Kern zuweist. Sonst ist das Ergebnis nicht so recht verwertbar aus meiner Sicht.
Haben Sie denn auch mit mehreren Emittern gearbeitet oder nur MultiCore-PhysX on? Davon ab ist 3x immerhin schon 3x -- ohne jede SSE-Magie.Edit: Ich habs mal mit meinem Quad getestet. Es macht doch KEINEN Unterschied, ob ich dem Prozess alle 4 oder nur 1 Kern zuweise bei Single Thread. Allerdings habe ich beim Multi Thread Test gerade mal die dreifache Punktezahl. (104 vs 306)
Nein, was soll das bringen -- das ist irrelevant, das Verhalten des Core-Hopping ist ja wohlbekannt. Es ist und bleibt ein einzelner Thread.
Edit: Gerade den Edit gesehen -- genau das meine ich, ja:
Haben Sie denn auch mit mehreren Emittern gearbeitet oder nur MultiCore-PhysX on? Davon ab ist 3x immerhin schon 3x -- ohne jede SSE-Magie.
Sie haben es nicht verstanden, was Sie gelesen haben, nicht? GPU-PhysX ist immer erst einmal Single-Threaded -- nur mit Workarounds kriegt man das PhysX-SDK offensichtlich dazu, mittels mehrerer Threads zu arbeiten. Die parallele Abarbeitung in den SPs hat nichts mit einer Programmierung in mehreren Threads zu tun, das sind unterschiedliche Ebenen.
[...] und genau deswegen ist der erwähnte speedup-faktor von 9xx bis sagenhaften 19xx mal schneller einfach nur dummes gequatsche.
warum nicht? wenn man in der Schule mehr gelernt hätte, könnte man besser Englisch? Mit den Noten hat das trotzdem noch nichts zu tun...Eben, deswegen ist das Argument mit der Schule nicht immer wirklich treffend.![]()
wenn du es schon rot schreibst, dann wenigstens richtig: das Wort Standart gib es nicht!!! Man schreibt es mit d, warum ist das so schwierig?Ich find es ist der richtige Weg in die Zukunft, endlich einen einheitlichen Standart zu etablieren!!
Weiter so AMD!!!!

aber in ein paar Jahren völlig unwichtig ist: bei Nvidia sinds halt alle DX10 und später Karten, bei AMD halt alle DX11. Da der letztere Standard sowieso für viele JETZT schon der wichtigere ist (bzw den besseren Start hat, obwohl der Start der HARDWARE nicht so reibungslos verläuft, angesichts der immer noch nicht wirklich gut verfügbaren Radeons und Geforces). Und da der Physikkampf nicht schnell sondern allmählich entschieden wird, ist es eigentlich nicht wichtig ob ATI das erst aber DX11 Generation unterstützt oder nicht. Liegt wohl an OpenCL/Compute ShaderDas hatte ich geschrieben.
http://extreme.pcgameshardware.de/user-news/107844-ati-open-physics-noch-2010-a-4.html#post1984390
Ich beschäftige mich schon eine ganze weile mit PhysX ,was man in mein Thread erkennen kann. In vielen Benchmarks, erkennt man wie gut PhysX von nVidia ist, ganz abgesehen von der Kompatibilität. Bei AMD ist lt. Internet eine DX11-graka Pflicht, was bei nVidia nicht so ist , denn da reiche eine billige 8600gt oder 9500gt aus. Das Spektrum an Grafikkarten was PhysX kann ist bei nVidia besser gestaltet als bei ATI, was bei mir keine gute Zustimmung findet.
Das hatte ich geschrieben.
http://extreme.pcgameshardware.de/user-news/107844-ati-open-physics-noch-2010-a-4.html#post1984390
Ich beschäftige mich schon eine ganze weile mit PhysX ,was man in mein Thread erkennen kann. In vielen Benchmarks, erkennt man wie gut PhysX von nVidia ist, ganz abgesehen von der Kompatibilität. Bei AMD ist lt. Internet eine DX11-graka Pflicht, was bei nVidia nicht so ist , denn da reiche eine billige 8600gt oder 9500gt aus. Das Spektrum an Grafikkarten was PhysX kann ist bei nVidia besser gestaltet als bei ATI, was bei mir keine gute Zustimmung findet.