Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit GeForce

AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit Georce

Seit escheinen von ZEN kann man durchweg mit einiger Sicherheit sagen, dass die Radeons besser mit ZEN zusammenarbeiten als die Nvidias, von DX12 ganz zu schweigen.

Nvidia hat kein gesteigertes Interesse an erfolgreichen AMD CPUs, da mit jedem guten Quartalsergebnis, AMD seine Forschungsgelder im GPU Bereich steigern kann, was man tunlichst unterbinden möchte!
 
AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit Georce

Nvidia ist immer Schuld, wenn es Threading Probleme gibt, weil die ihr eigenes Scheduler Süppchen kochen, was nur in einem ganz kleinen Umfeld Vorteile bringt (DX11 Mainthread Limit) und in vielen anderen (DX12, schon optimal performende DX11 Titel, das Herumpfuschen in der CPU internen Kommunikation etc.) ein riesiger Problemherd ist.

Schon Ryzen hatte mit dem Nvidia Treiber Performanceprobleme.

Der Treiber soll sich schlicht nicht in die Workload Verteilung der API und der Hardware einmischen. Dann passiert sowas nicht. Stattdessen könnte Nvidia mal anfangen DX12/Vulkan zu promoten, dann können sie ihren Rotzscheduler auch endlich einstampfen, weil sie ihn nichtmehr brauchen. Aber das könnte ja Marktanteile kosten, weil AMD plötzlich konkurrenzfähig wird...

Das Ding ist halt das sich NV im ganzen letzten Jahrzehnt nicht mehr an DX Standarts hält - aber die Leute feiern das und meinen auch noch NV tut ihnen was gutes :ugly::lol:

Um so moderner das OS und die Spiele werden um so mehr fliegt ihnen das alles um die Ohren. Unter 10 ( 1803 ) hast du unter bestimmten Vorraussetzungen echt wenig Spaß mit der Hardware :>
 
AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit Georce

Vermutlich weil der Treiber diverse Dinge parallelisiert, mehr als der AMD Treiber (genau deswegen ist Nvidia fixer in DX11), und je nach parallelen Aufgaben mit starken Abh. zu Latenzen wirds bei TR massiv langsamer. Rendern mit fixen Woekingset sau schnell, aber mehrere auf 4 Die verteilte stark abhängige und latenzkritische Threads... Kann nach hinten los gehen.

Da werden vermutlich viele Threads hin und her geschoben, was wiederrum die lahmen latenzen verursacht.
 
AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit GeForce

Sollte doch per Treiberupdate einfach zu beheben sein.
 
AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit Georce

Schon vor bekanntwerden und Veröffentlichung des Golem-Tests hat ein User im 3DCenter auf diesen Umstand (Leistungseinbrüche mit Nvidia bei 64 Threads) hingewiesen - wohlgemerkt mit einem Intel-System.


3DCenter Forum - Einzelnen Beitrag anzeigen - AMD - Threadripper 2000: Review-Thread

Also nix mit "lahme IF vom TR ist Schuld". ;) Wenn man es auch bei Intel mit entsprechend vielen Threads provozieren kann und die Auffälligkeit mit einer AMD GPU verschwindet, liegt das eindeutig am NV-Treiber.

(Edit: Der Post ist übrigens auch im Artikel verlinkt, aber zur Sicherheit nochmal hier. Du scheinst ihn ja überlesen zu haben, sonst wäre dir der Teil mit demselben Problem bei Intel nicht entgangen. ;) )

CPU Benchmarks sollte man imo sowieso immer mit einer nVidia- und AMD-Karte machen. Da ergibt sich dann auch öfters mal ein ganz anderes Bild, was das spieleigene Multithreading angeht.
 
AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit Georce

Nvidia ist immer Schuld, wenn es Threading Probleme gibt, weil die ihr eigenes Scheduler Süppchen kochen, was nur in einem ganz kleinen Umfeld Vorteile bringt (DX11 Mainthread Limit) und in vielen anderen (DX12, schon optimal performende DX11 Titel, das Herumpfuschen in der CPU internen Kommunikation etc.) ein riesiger Problemherd ist.

Schon Ryzen hatte mit dem Nvidia Treiber Performanceprobleme.

Der Treiber soll sich schlicht nicht in die Workload Verteilung der API und der Hardware einmischen. Dann passiert sowas nicht. Stattdessen könnte Nvidia mal anfangen DX12/Vulkan zu promoten, dann können sie ihren Rotzscheduler auch endlich einstampfen, weil sie ihn nichtmehr brauchen. Aber das könnte ja Marktanteile kosten, weil AMD plötzlich konkurrenzfähig wird...
lol@ riesiger Problemherd bei DX12, wo die Application sich um die Command-Buffer kümmert und praktische Beispiele auf keine generellen Probleme oder Auffälligkeiten bei Nvidia hinweisen.
Du findest sogar gegenteilige Befunde, Deus Ex: Mankind Divided, ein AMD Kooperationsspiel, lief mit DX12 richtig schlecht im CPU-Limit, Nvidia in dem Fall sogar besser:
Deus Ex Benchmark: DirectX 12 legt in Mankind Divided massiv zu - ComputerBase

Weiß der Teufel was da schief gelaufen ist, es soll deiner Propaganda-Schallplatte nur mal etwas Wind aus dem Segel nehmen.
Aber du stellst dich ja sowieso nie einer Diskussion.

Und dank RTX, was DX12 voraussetzt, wird Nvidia in der Zukunft genügend explicit API Promotion leisten müssen.

Das Ding ist halt das sich NV im ganzen letzten Jahrzehnt nicht mehr an DX Standarts hält - aber die Leute feiern das und meinen auch noch NV tut ihnen was gutes :ugly::lol:

Um so moderner das OS und die Spiele werden um so mehr fliegt ihnen das alles um die Ohren. Unter 10 ( 1803 ) hast du unter bestimmten Vorraussetzungen echt wenig Spaß mit der Hardware :>
Wo hält sich denn Nvidia nicht an den DX-Standard? Ich habe noch nirgendwo gelesen, dass der Treiber nur einen Treiberthread spawnen dürfte und Multithreadind Command-Lists bzw. Deferred Contextes sind ein offizieller Bestandteil von DX11, welchen nur Nvidia bis Heute unterstützt.
Nvidia tut da richtig schreckliche Dinge durch Treiberaufwand bessere Performance rausquetschen zu wollen. :ugly:

Man kann gerne das Gegenteil beweisen, vor allem legitime Resultate und Sachbefunde, wo die Probleme genauer erörtert werden und ob Nvidia bei ihrer Lösung Kompromisse eingeht, welche im Schnitt dann auch noch schlechter für die Kunden ist.
The stage is yours.
 
AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit Georce

OH JA, jezz sind Nvidia Treiber daran Schuld das Threadrippers lahme IF Gift für Gaming is

Jay hat sein 8700K gegen nen 7980XE (18Kerne) gewechselt und die FpS sind eher besser geworden

YouTube

Wenn man sich richtig informieren würde wüsste man, dass diese Probleme mit den Nvidia Karten erst AB 64 Threads auftreten.
Deshalb schneidet der 32 Kerne auch so viel schlechter ab in Games als der 16 Kerner.

Deaktivierst du einen Kern läuft es wieder normal, nutzt du alle 64 Kerne gibts wieder Probleme unter NV.

Bei AMD tauchen diese Probleme NICHT auf.

Warum sollte also deiner Meinung nach die CPU hier das Problem sein?:wall:

Seit escheinen von ZEN kann man durchweg mit einiger Sicherheit sagen, dass die Radeons besser mit ZEN zusammenarbeiten als die Nvidias, von DX12 ganz zu schweigen.

Nvidia hat kein gesteigertes Interesse an erfolgreichen AMD CPUs, da mit jedem guten Quartalsergebnis, AMD seine Forschungsgelder im GPU Bereich steigern kann, was man tunlichst unterbinden möchte!

........einfach nein.

Hätte Intel einen 32 Kerner + HT würde das gleiche Problem auftreten.
Haben Sie aber nicht (komm mir jetzt nicht mit Xeon Phi)

Schau hier:

Die selben Erfahrungen hat OC_Burner im 3DCenter mit einem Intel und 64 Threads geschildter.
Scheint ein Problem mit dem nv-Treiber zu sein.

Da steckt keine böse Absicht dahinter denn beide Hersteller sind betroffen. (AMD und Intel)
Man hatte es scheinbar nicht auf dem Schirm, dass gaming kisten bald 64 Threads haben könnten.
 
Zuletzt bearbeitet:
AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit GeForce

Merke: In Zukunft nur noch AMD/AMD oder Intel/nVidia Systeme zusammen stellen :ugly:
 
AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit GeForce

@Locuza: Du sagst immer "bitte beweisen" und lehnst dich entspannt zurück. Gib' mir den Code und ich beweise es dir. Jetzt lehne ich mich entspannt zurück... ;)
 
AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit GeForce

Hat @Locuza den Stuss erzählt?
Fordere mal von den Trommlern Beweise, die behaubten AMD/AMD wäre schneller als AMD/Nvidia, oder Intel/nvidia.
Von denen warte ich schon lange auf Beweise. Und nicht bloß in einem Spiel.
Und bei solchen Sprüchen stellen sich einem die Haare auf.
Um so moderner das OS und die Spiele werden um so mehr fliegt ihnen das alles um die Ohren. Unter 10 ( 1803 ) hast du unter bestimmten Vorraussetzungen echt wenig Spaß mit der Hardware :>

Der Threadripper 2990WX ist nun mal keine Spiele CPU.
 
AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit GeForce

@Locuza: Du sagst immer "bitte beweisen" und lehnst dich entspannt zurück. Gib' mir den Code und ich beweise es dir. Jetzt lehne ich mich entspannt zurück... ;)
Generell folge ich keiner festen Regel was die Beweislage angeht und wer sich darum zu kümmern hat, aber ich selber führe meine Standpunkte häufig aus, genauso wie ich häufig Quellen oder Ergebnisse für meine Behauptungen verlinke und ab und zu möchte ich mir den Luxus leisten, wo jemand seine aufgestellten Behauptungen untermauern soll und nicht ich das Gegenteil beweisen muss und den Aufwand betreiben die Sachlage zu erörtern und entsprechendes Material herzurichten.
 
AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit GeForce

Hier ein Link aus der Nvidia Doku: D3D11 Deferred Contexts Sample

"Direct3D11 introduced the concept of a deferred context (DC). DCs allow an application to issue D3D calls on multiple threads simultaneously by recording those calls in a driver level command list which is later executed on the main render thread against the Immediate Context (IC)."

Das heißt aber letztlich, dass Rendern (CPU Part) in DirectX 11 doch wieder nur auf einem Thread staffindet gemäß Standard, oder?
 
AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit GeForce

Gemäß der Beschreibung ja.
Die Erstellung von Befehlen kostet CPU-Rechenleistung und die Ausführung bzw. das Abschicken von Befehlen kostet CPU-Rechenleistung.
Mit Worker-Threads (DCs) kann man wenigstens den ersten Teil parallelisieren und mehrere DCs verwenden, um die Befehle (Command-Lists) zu generieren.
Aber nach wie vor führt nur ein Mainthread (IC) die Befehle (Command-Lists) aus bzw. schickt den Command-Buffer ab.

Die Spiele müssen DCs aber auch verwenden.


Allgemein muss man aber betonen, dass DX11 eine implizite API ist, welche an sehr vielen Stellen keine festen Regeln aufstellt, wie eine Implementierung auszusehen hat, sondern nur welches logische Arbeitsmodell unterstützt werden muss.
Egal ob der Treiber DCs unterstützt oder nicht und ob die Anwendung so etwas verwendet, jeder Treiber unterscheidet sich bezüglich der Implementierung und wie er die Befehle intern umsetzt.
Deswegen gibt es auch soviele Treiberupdates von den IHVs, weil die Treiber die Befehle intern unterschiedlich umsetzen können, um eine bessere Performance zu erreichen.
Ein einfaches Beispiel sind Draw-Befehle, schickt man viele einzelne Draw-Befehle ab und würde der Treiber dann jedes mal einen Command-Buffer an die GPU schicken, wäre der Overhead massiv, der dann dank der Validierung und Synchronisation mit der Runtime anfallen würde, deswegen sollte man darauf achten wie man seine Draw-Befehle gestaltet.
Der Treiber hat aber die Möglichkeit einen Draw-Befehl aufzunehmen und damit erst einmal nichts zu machen, er kann soviele Draw-Befehle sammeln, bis er eine gewisse Grenze erreicht hat, wo er dann ein ganzes Bündel abschickt.
Als Entwickler hat man da eine gewisse A-Karte, weil es eine Black-Box ist und man nicht weiß was der Treiber mit den Befehlen macht und wann er sie wirklich ausführt.

Deswegen sind die Vorwürfe so pauschal auch nicht plausibel, dass Nvidia sich nicht an den DX11-Standard halten würde und herumpfuscht, weil letztendlich muss die API nur funktionieren, die Ergebnisse korrekt sein und die Implementierung ist Herstellersache.
Und Intern mischt sich jeder Treiber bezüglich der Befehle einer Anwendung ein.
 
Zuletzt bearbeitet:
AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit GeForce

Gemäß der Beschreibung ja.
Die Erstellung von Befehlen kostet CPU-Rechenleistung und die Ausführung bzw. das Abschicken von Befehlen kostet CPU-Rechenleistung.
Mit Worker-Threads (DCs) kann man wenigstens den ersten Teil parallelisieren und mehrere DCs verwenden, um die Befehle (Command-Lists) zu generieren.
Aber nach wie vor führt nur ein Mainthread (IC) die Befehle (Command-Lists) aus bzw. schickt den Command-Buffer ab.

Die Spiele müssen DCs aber auch verwenden.

Genau, die Spiele müssen es nutzen. Es findet innerhalb der Applikation noch vor der API statt. Dann erkläre mir bitte, wie Nvidia es schafft, die Last treiberseitig besser zu verteilen als AMD das tut. Das kann doch nur mit einem Custom Kontext funktionieren?!
 
AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit Georce

Seit escheinen von ZEN kann man durchweg mit einiger Sicherheit sagen, dass die Radeons besser mit ZEN zusammenarbeiten als die Nvidias, von DX12 ganz zu schweigen.

Genau andersherum ist es richtig, wie die PCGH in 5 Spielen Ende letzten Jahres gezeigt hatte.

Das hier ist ein Sonderfall.
Als ob jemand mit dem Ding spielen würde.
Zudem gibts den Game Mode.

Wieder nur Propaganda in dem Thread, aber gut dass wir Locuza haben. :D
 
AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit Georce

Genau, die Spiele müssen es nutzen. Es findet innerhalb der Applikation noch vor der API statt. Dann erkläre mir bitte, wie Nvidia es schafft, die Last treiberseitig besser zu verteilen als AMD das tut. Das kann doch nur mit einem Custom Kontext funktionieren?!
Vermutlich mit dem entsprechenden Aufwand die API-Befehle auf mehrere Threads zu splitten, während die API Konformität eingehalten wird.
Nvidia hat an der Stelle wahrscheinlich viel Arbeit betreiben müssen, um zu schauen welche Befehle und Zusammenhänge (State-Control, Buffer-Updates etc.) getrennt werden können, ohne das es synchronisiert werden muss bzw. die Synchronisationskosten teurer sind, als die Vorteile dank mehrerer Threads.

Und ich sehe keine Vorschrift von MS oder der DX11-API, die solch interne Umsetzung verbieten würde und bei entsprechenden Ressourcen gehe ich stark davon aus, dass AMD und Intel ein ähnliches Arbeitsmodell für ihre Treiber umsetzen würden.

[...]
Wieder nur Propaganda in dem Thread, aber gut dass wir Locuza haben. :D
Außer man verbreitet selber Propaganda, dann ist das A-loch schon nervig, richtig? :ugly:
 
Zuletzt bearbeitet:
AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit Georce

Vermutlich mit dem entsprechenden Aufwand die API-Befehle auf mehrere Threads zu splitten, während die API Konformität eingehalten wird.
Nvidia hat an der Stelle wahrscheinlich viel Arbeit betreiben müssen, um zu schauen welche Befehle und Zusammenhänge (State-Control, Buffer-Updates etc.) getrennt werden können, ohne das es synchronisiert werden muss bzw. die Synchronisationskosten teurer sind, als die Vorteile dank mehrerer Threads.

Ja, Nvidia hat sehr viel investieren müssen dafür und es hat sich ja auch gelohnt. Aber hier gehen unsere Einschätzungen auseinander. Ich denke eben nicht, dass es dann noch mit dem Standard konform ist. Du solltest auch den massiven Einsatz von Intrinsic Functions in den Gameworks Libs nicht vergessen.

Es ist halt sehr schwierig nachzuweisen, wenn man den Code nicht hat.
 
AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit Georce

Das gilt auch für eigene Propaganda.
Ich ernenne dich hiermit zum Propaganda-Polizisten.^^

Was denkst du denn, wie viele Leute man ruhig stellen kann, wenn man detaillierte Beweise fordert. Das ist nun wirklich keine Kunst. ;)
 
AW: Threadripper 2990WX: AMDs 32-Kerne-CPU läuft mit Radeon besser als mit Georce

Ja, Nvidia hat sehr viel investieren müssen dafür und es hat sich ja auch gelohnt. Aber hier gehen unsere Einschätzungen auseinander. Ich denke eben nicht, dass es dann noch mit dem Standard konform ist. Du solltest auch den massiven Einsatz von Intrinsic Functions in den Gameworks Libs nicht vergessen.

Es ist halt sehr schwierig nachzuweisen, wenn man den Code nicht hat.
Aber warum denkst du so? Und nehmen wir an Nvidias Implementierung ist nicht standardkonform, auf welche Art und Weise wäre das ein Problem?

Bezüglich der GameWork-Libs verstehe ich nicht wie das zusammenpasst, aber ich habe nicht mitbekommen das dort ein massiver Einsatz von intrinsischen Funktionen stattfindet, wobei sich das natürlich anbieten würde.
In der Hinsicht müsste wirklich jemand Zugang zum Quellcode haben und nachschauen, ob Nvidia für die eigenen GPUs exklusive Optimierungen eingebaut hat.

Das gilt auch für eigene Propaganda.
Ich ernenne dich hiermit zum Propaganda-Polizisten.^^
Was ist wenn der Propaganda-Polizist selber Propaganda verbreitet? :wow:
 
Zurück