Physik-Schlacht: AMD wirft Nvidia zu wenig Optimierung bei CPUs vor - Nvidia kontert

edit: aus der grafik werde ich trotzdem nicht schlau.
Gerade warum die steigerung bei der graka auch so groß zu sein scheint (im vergleich mit und ohne multicore unterstützung)
 
Weil sich der Score aus Fps und dem PhysX-Score zusammensetzt, letzteren pusht die CPU bei Multicore mit.

dann müßte aber doch bei multicore + graka das schneller sein, als bei multicore und nur cpu. Oder die Graka bremst es. Wenn ihr jetzt aber sagt, die CPU berechnet da nicht mit, dann müßte der wert genau so hoch sein, wie bei nicht multicore + graka
 
dann müßte aber doch bei multicore + graka das schneller sein, als bei multicore und nur cpu. Oder die Graka bremst es. Wenn ihr jetzt aber sagt, die CPU berechnet da nicht mit, dann müßte der wert genau so hoch sein, wie bei nicht multicore + graka

Sie gehen in die richtige Richtung, jedenfalls sofern ich sie richtig verstehe, aber glauben Sie mir, da fehlen Informationen. In sich ist das nicht logisch, was wir da sehen -- jedenfalls meiner Meinung nach. Und glauben sie mir, wenn ich das jetzt in _wenigen_ Worten erläutern könnte, würde ich es tun. Die wenigsten Mitleser hätten m.E. eine Chance, das zu verstehen, mich selbst eingeschlossen -- vielleicht ist das der Grund.:lol:

Die Informationslage gibt im Moment zu wenig her, auch wenn ich da schon mehr zu gelesen habe, was ich hier leider nicht verlinken kann.
 
Naja, ich bin trotzdem dafür das nVidia einfach die Treiber wida für den Coop-Betrieb mit Ati freigibt ohne, dass ich extra Treiberpatchen muss etc.

@Marc:
Streichel meine 8800gts mit wk im tauschgeschäft erworben XD
 
Das mag 1,2 sachen erklären, aber die Grafik ergibt trotzdem noch immer starke rätsel.
Es kann nicht allein am Multicore liegen. Die haben da noch mehr gemacht, sonst wäre der unterschied von gtx260+gtx275 gegenüber gtx275 nicht so unterschiedlich mit und ohne multicore.
Die haben da also auf jeden fall einiges rumgebastelt...
 
Das mag 1,2 sachen erklären, aber die Grafik ergibt trotzdem noch immer starke rätsel.
Es kann nicht allein am Multicore liegen. Die haben da noch mehr gemacht, sonst wäre der unterschied von gtx260+gtx275 gegenüber gtx275 nicht so unterschiedlich mit und ohne multicore.
Die haben da also auf jeden fall einiges rumgebastelt...

Das ist in etwa das, was ich oben darlegte -- wobei ich den Fokus auf den Gewinn des Setups mit dezidierter Karte legte. Auch stimmen im Artikel dort -- nicht hier -- einige Aussagen, die sich auf die Grafik bzw. das Ergebnis beziehen, nicht mit den Werten in der Grafik überein -- weder in der Tendenz noch in den konkreten Werten. Fishy. Viele Grüße Thomas


Neuer Tag, kurzes Nachdenken -- es ist eigentlich ganz einfach: Nur den Text lesen. Die Grafik ist schlicht falsch.

Ergänzung: Dem hat der Autor, Zorgim, zunächst unter Rückfrage widersprochen. Ich habe ihm das kurz erläutert, bald sollte sich Feedback finden.
 
Zuletzt bearbeitet:
[...] Dem hat der Autor, Zorgim, zunächst unter Rückfrage widersprochen. Ich habe ihm das kurz erläutert, bald sollte sich Feedback finden.

Zogrim, wie der Autor des Artikels sich korrekt schreibt, hat mittlerweile geantwortet und eine mir sehr schlüssige Erklärung gegeben. Wer des Englischen mächtig ist, mag vielleicht seine Antwort im Artikelforum bei PhysXinfo lesen:
New PhysX FluidMark 1.2: First Tests | PhysXInfo.com - PhysX News

Ich übersetze sie mal (leicht gekürzt) nach bestem Wissen und Gewissen:

>>
Zunächst einmal hat die "Multi-Core-PhysX"-Option weniger mit der Anzahl der Emitter zu tun -- sie ermöglicht lediglich Applikationsthreading und packt PhysX und Rendering in einzelne Threads -- daher gibt es einen derart grossen Gewinn sowohl für CPU- als auch GPU-Berechnungen gegenüber dem Single-Thread-Modus. In der Grafik haben sowohl sowohl die "ON" als auch die "OFF"-Seite dieselbe Anzahl Emitter.
[...]
Die "Anzahl der CPU-Kerne"-Option ist ein wenig kniffelig: Im PhysX-SDK [also nvidias Entwicklungsumgebung für PhysX -- das, was ich gestern Framework nannte; cesimbra] kann man zwar zehn Emitter auf einem CPU-Kern (oder einer GPU) laufen lassen, es ist aber nicht möglich, einen Emitter dazu zu bringen, zehn Kerne zu nutzen, und um alle Kerne auszulasten, werden weitere Emitter hinzugefügt.

Daher, um Gleichberechtigung herzustellen, wurden drei Emitter sowohl für CPU- als auch für GPU-Berechnungen genutzt, sowohl mit der Multi-Core-Option ON als auch OFF -- ein Emitter läuft auf der GPU zwar schneller als drei Emitter (bei gleicher Anzahl von 15.000 Partikeln), aber es wäre nicht fair, einen Emitter auf der CPU mit einem Emitter auf der GPU zu vergleichen, denn auch wenn Multithreading aktiviert ist, nutzt ein Emitter maximal zwei CPU-Kerne. [an dieser Stelle ist mir lediglich eine kleine Unklarheit geblieben -- nämlich ob ein Emitter auf der CPU maximal zwei Kerne nutzt oder maximal zwei Kerne auslastet; cesimbra]
<<

Ich hoffe, das hilft jedem, der da genauso irritiert war wie ich, etwas weiter -- auch wenn ich das zumindest für mich selbst sagen kann, wird das allerdings vermutlich nicht gerade für jeden der Fall sein, da müsste man dann doch wohl tiefer einsteigen.

Man kann aber meines Erachtens (wenn man Zogrims Aussagen folgt) festhalten, daß das Skalieren der GPUs beim Multithreading nicht damit zu tun hat, daß die CPU bei aktiviertem Multithreading der GPU in Sachen PhysX zusätzlich hilft (da hatte ich Marc gestern nicht zugestimmt, auch wenn es naheliegend schien), sondern wirklich mit dem Multithreading zu tun hat, daß also Rendering und PhysX in getrennte Threads gepackt werden -- aber eben unter der Prämisse, daß dort drei Emitter am Werke sind, was für die GPU nicht der Optimalfall ist.

Wünschenswert an der Stelle wäre m.E. daher vor allem auch noch ein Vergleichswert für die GPU ohne Multithreading und mit genau einem Emitter, aber gleicher Partikelanzahl gewesen -- dann wäre die Verständnisproblematik wohl zumindest so nicht aufgekommen. Solche Vergleiche werden wir aber sicher alsbald sehen.
 
@Marc, falls es noch interessiert:

Die unten verlinkte war eine der Primär(?)-Quellen, die zusammen mit den selektiven Zitaten aus dem englischen PCGH-Interview in dem nicht findbaren Forum diskutiert wurde -- deshalb kam ich auch mit Englisch und Französisch durcheinander, das war gemischt. Google hat das erst heute an der erwarteten Stelle (news) indirekt indexiert (Quelle eines anderen, dort gefundenen, ebenfalls älteren Artikels), obwohl das schon etliche Tage alt ist:
PhysX supporte bel et bien le Multi-CPU : FluidMark le prouve - PC INpact

Gruß
Thomas
 
danke cesimbra

Also wäre vermutlich eine GPU doch schneller, wenn man auch die für sie passenden settings nimmt.

Die Frage mit den 1 emitter 2 cpus finde ich auch interessant, denn dann wären für einen quadcore 2 emitter ausreichend und vermutlich würde dann das ergebnis anders aussehen. Aber man wollte ja zeigen, dass die CPUs doch besser sind ;)
Glaube keienr Statistik die du nicht selber gefälscht hast :)
 
danke cesimbra
Also wäre vermutlich eine GPU doch schneller, wenn man auch die für sie passenden settings nimmt.
Kommt darauf an, wie groß der Gewinn für die GPU wäre, aber ja -- gut möglich.
Die Frage mit den 1 emitter 2 cpus finde ich auch interessant, denn dann wären für einen quadcore 2 emitter ausreichend und vermutlich würde dann das ergebnis anders aussehen. Aber man wollte ja zeigen, dass die CPUs doch besser sind ;)
Glaube keienr Statistik die du nicht selber gefälscht hast :)
Die Aussage, daß bei einem Emitter und multithreaded maximal zwei Kerne benutzt werden, ist meinem Eindruck nach keineswegs gleichbedeutend damit, daß das ein Emitter zwei Kerne auslastet -- darauf habe ich ja schon oben hingewiesen -- sondern das sagt erstmal nur, daß ein Kern für den Renderthread und ein Kern für den PhysXthread genutzt werden statt daß beides in einem Thread läuft, schauen Sie sich das auf der Seite noch einmal an. Ob es so ist, daß genau n-1 Emitter bei einem n-Kern-Prozessor optimal für das Ergebnis multithreaded wären, muss ebenfalls vorläufig fraglich bleiben -- hat aber IMHO eine nicht so niedrige Wahrscheinlichkeit -- wobei man auch hier wegen Hyperthreading, also virtuellen Cores, vorsichtig bleiben muss. Ich wage mich aber mal so weit vor zu behaupten, daß zwei Emitter eben nicht optimal den Prozessor ausgelastet hätten, das sagt jedenfalls meines Erachtens Zogrim (versteckt, aber implizit) auf meine Rückfragen. Viele Grüße Thomas
 
Zurück