DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

Doch, sehr wohl bei AMD können die Daten unabhängig aus dem Speicher geholt werden

Total falsch. Durch bringst zwei unterschiedliche Prozesse durcheinander. Wenn du Speicher schreibst, dann solltest du auch schreiben welchen Speicher du genau meinst!

Wenn ich draußen im Garten die Wiese gieße mit einem Schlauch dann bin ich bzw. der Schlauch auch 100 % ausgelastet, was passiert wenn ich 10 Leute hinstelle brauche ich nur 10%
Das Beispiel hat nichts mit dem Thema zu tun ^^

edit es it unmöglich 100% zu erreichen von der Performance einer GPU aufgrund der Latenzen für Speicherzugriffszeiten
*

Vollkommen falsch und wieder ist die Frage, von welchem Speicher sprichst du denn? ^^
 
AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

Total falsch. Durch bringst zwei unterschiedliche Prozesse durcheinander. Wenn du Speicher schreibst, dann solltest du auch schreiben welchen Speicher du genau meinst!
Register und Cache Streamingprozessoren bzw. der

Das Beispiel hat nichts mit dem Thema zu tun ^^

sowie deines, zeige es uns mal wo ein GPU wirklich alle Register benutzt und somit 100% ausgelastet wird

Vollkommen falsch und wieder ist die Frage, von welchem Speicher sprichst du denn? ^^
Es ist egal welcher Speicher, die Zeiten um ein Berechnung auszuführen wie c=a+b für Register sind bei weiten geringer als diese eine Stufe höher im nächsten Cache ausführen, Register sind der schnellster Speicher, dann kommt für jede weitere Hierarchie ein Faktor 10 bis 100 dazu für die Latenzen

So ziemlich alle Probleme die man in der Informatik berechnet sind Memory Bounded sprich die Bandbreite und die Zugriffszeiten spielen ein weit größere Rolle als die eigentlich Ausführung der Operation, Compute Bounded sind Probleme wo man zu wenige Register hat um eine Operation ausführen zu können

Nicht umsonst gibt es geblockte Algorithmen, weil sonst würde man die Matrix * Matrix Multiplikation mit 3 schleifen schreiben können, was nicht der Fall ist damit erreicht man gerade mal 5 % der Peak Performance mit geblockten Algorithmen (wo das Caching erhöht wird und somit die Daten länger in den Register gehalten werden anstatt jedes mal auf den Hauptspeicher zuzugreifen ) kommt auf 20 bis 40 %

zuerst einmal erkundige dich

Zugriffszeit – Wikipedia

https://graphics.stanford.edu/papers/gpumatrixmult/gpumatrixmult.pdf und warum wird hier nicht 100% erreicht bei einen so einfachen Algorithmus ?

hier zum Anfang

wenn die Zeiten keine Rollen spielen, warum bitte führt den Nvidia dann NLink ein ? weil kopieren von GPU zu GPU im Moment zu effektiv ist beim kopieren wird auch auf den Speicher zugegriffen mit den dazugehörigen Zeiten
 
Zuletzt bearbeitet:
AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

Die "Zeiten" des Context Switch werden weder erhöht noch verringert. Die Anzahl der Context Switche die durchgefüht werden müssen, werden im Optimalfall durch AC verringert.
Richtig. Denn durch ACEs muss kein Context Switch vollzogen werden, sondern andere Rechenoperationen können on the Fly zwischengeschoben werden.
 
AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

ist das nicht egal?? wenn solche titel kommen, und damit meine ich richtige AAA Titel gibt es e schon die nächste generation. und ausserdem beim heavy batch hat eine ti nur 4fps weniger als ne fury x und das ist nicht die welt wenn man bedengt das der titel für das entwickelt wurde
Ist das nächste Deus Ex etwa kein AAA-Titel? Das kommt schon im August. Und noch mal: AoS zeigt nur wohin die Reise geht. Oxide ist ein winziges Studio, das gerade mal aus 6 Man besteht. Lass da mal große Studios ran ...
 
AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

Register und Cache

Genau, sowas sollte man dazu schreiben wenn man auf diesem Detaillevel argumentieren möchte.

So ziemlich alle Probleme die man in der Informatik berechnet sind Memory Bounded sprich die Bandbreite und die Zugriffszeiten spielen ein weit größere Rolle als die eigentlich Ausführung der Operation, Compute Bounded sind Probleme wo man zu wenige Register hat um eine Operation ausführen zu können

Nein das stimmt nicht und hat auch nichts mit dem Thema in diesem Thread zu tun. ^^
Hochkomplexe Probleme sind sowohl beim Computing als auch für den Speicher problematisch.

https://graphics.stanford.edu/papers/gpumatrixmult/gpumatrixmult.pdf und warum wird hier nicht 100% erreicht bei einen so einfachen Algorithmus ?

Danke für das Paper in dem die Speicher-Zugrifszeiten von GPUs aus dem Jahre 2003 und 2004 als zu langsam evaluiert wurden. Hat aber wenig mit dem Thema hier zu tun ^^

wenn die Zeiten keine Rollen spielen, warum bitte führt den Nvidia dann NLink ein ? weil kopieren von GPU zu GPU im Moment zu effektiv ist beim kopieren wird auch auf den Speicher zugegriffen mit den dazugehörigen Zeiten

NVlink hat absolut nichts mit Async Compute zu tun oder mit Zugriffszeiten auf Register/Cache.
Du bist sehr konfus unterwegs, vielelicht solltest du mal lieber schlafen gehen ^^
 
AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

Oder Hitman am 11. März, dass ist auch ein AAA Titel.
Wirkt wegen dem Release in Episoden aber leider eher wie ein Indietitel :(

Für den PC Port ist dieses Mal auch nicht Nixxes zuständig, zumindest schreiben sie davon nichts auf ihrer Website. Bin gespannt was das am Freitag gibt, den DX12 Modus halten sie trotz Beta bis zum Release unter Verschluss :D
 
AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

Richtig. Denn durch ACEs muss kein Context Switch vollzogen werden, sondern andere Rechenoperationen können on the Fly zwischengeschoben werden.

Sofern aktuell genügend Shader und Speicher zur Verfügung steht, kann man das machen. Und auch nur dann ;)
Sonst bringt Async Compute anwendungsabhängig nichts.
 
Zuletzt bearbeitet:
AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

Nein das stimmt nicht und hat auch nichts mit dem Thema in diesem Thread zu tun. ^^
Hochkomplexe Probleme sind sowohl beim Computing als auch für den Speicher problematisch.

und wie kann mandann behaupten eine GPU erreicht immer 100% ? wenn beides ein Problem ist

die Auslastung misst man in Flops oder auch in % der Peak Flops, 100 % würden dann bedeuten man erreicht auch die Peak Flops was selten der Fall ist und da spielt die Architektur sehr wohl eine Rolle wie man diese erreicht oder erhöht durch ACs z.B.
 
AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

Ich weiß nicht auf welchem Planeten du gerade bist, es macht keinen Sinn mit dir zu diskutieren... :ugly:

Stell dir vor deine GPU ist 100% damit ausgelastet, ein aufwändiges Spiel wie Tomb Raider in 1440p zu rendern. Was machst du jetzt wenn du aber gleichzeitig auch Compute Berechnungen ausführen möchtest?

dein Fehler wenn du es nicht richtig formulieren kannst , 100% bedeuten bei einer GPU die 2TFlops erreichen kann auch das diese erreicht werden, viel anders kann man es nicht verstehen oder lesen gerade bei einem Theama wo es um Performance geht oder wie war es gemeint ?
 
AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

dein Fehler wenn du es nicht richtig formulieren kannst , 100% bedeuten bei einer GPU die 2TFlops erreichen kann auch das diese erreicht werden, viel anders kann man es nicht verstehen oder lesen gerade bei einem Theama wo es um Performance geht oder wie war es gemeint ?

Die Auslastung ist kein fest definierter Begriff, besonders nicht der Unsinn den du geschrieben hast. Sobald die GPU aktuell nicht mehr Ressourcen zur verfügen stellen kann für Compute Berechnungen, ist sie Ausgelastet und Async Compute bringt dann wenig. Eine GPU und ihre Speicherhierarchien ist bei hohen Auflösungen durch das Rendering sehr schnell Ausgelastet.
 
AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

Die Auslastung ist kein fest definierter Begriff, besonders nicht der Unsinn den du geschrieben hast. Sobald die GPU aktuell nicht mehr Ressourcen zur verfügen stellen kann für Compute Berechnungen, ist sie Ausgelastet und Async Compute bringt dann wenig. Eine GPU und ihre Speicherhierarchien ist bei hohen Auflösungen durch das Rendering sehr schnell Ausgelastet.


Doch ist sie, dein Logo ist Computer Science und du hast hier schon soviel Posts geschrieben und dann schreibst so einen Schwachsinn

Wenn eine GPU 2 TFlops leisten kann, was die maximale Leistungsfähigkeit darstellt welche eine GPU xy zu leisten vermag dann ist die maximal mögliche Auslastung sehr wohl definiert, mehr geht nicht hauptsächlich abhängig von der Anzahl der Register. Die maximal theoretischen Flops kann man auch berechnen und sind unabhängig vom Speicherzugriff deswegen Peak Performance weil es sich nur um die Register bzw. Compute Einheiten handelt.

Floating Point Operations Per Second – Wikipedia

How to calculate peak theoretical performance of a CPU-based HPC system

wenn du z.b a+b=c rechnest dann sind ist das ein Flop und wenn du das 100 mal machst sind das 100 Flops aufgrund der Addition , Ist gleich kann als Flop gezählt werden oder nicht, wenn du 100 Flop machst und das pro Sekunde sind das 100 Flop / s = 100 Flops (die schreib weise ist hier nicht eindeutig)

nur hat man halt nicht nur Register vor sich in einem CPU oder GPU, sondern auch Speicherzugriffe oder eben die Architektur selbst daher ist es relativ unwahrscheinlich dass du 100 Flop/s erreichst sondern eben nur eine Bruchteil davon auch die Kontrolllogik um diese Operationen zu steuern kostet Ressourcen aber vor allem auch Speicherzugriffe, daher ist es unwahrscheinlich dass man die 100 Flop/s erreicht

statt dessen führt man eben die relativen Flop/s ein = erreichte Flop/s / maximale erreichbare Flop / s in % die man mit verschieden Benchmarks und Programmen misst und von Programm zu Programm abhängt aber der Zähler bleibt halt einfach fix pro GPU bzw. CPU, mehr als 100 % geht nicht, daher kann man nicht sagen es gibt einen bestimmte Zahl für eine GPU

unter anderem werden die Flop/s durch ungünstige Speichzugriffe heruntergesetzt weil die GPU einfach nicht rechnen kann wenn die Latenzen zu hoch sind für einen Speicherzugriff (die Register sind einfach blockiert weil die Daten noch nicht zur Verfügung stehen)

ein Auto kann ja auch nicht mehr als 100 PS leisten und das verhält auch ähnlich zu maximale erreichbare Flop / s


für die Matrix * Matrix Multiplikation erreicht man zwischen 90 bis 95 % der Peak Performance auf einer GPU und das für einen Algorithmus der sehr einfach ist und wo sich schon sehr viele Techniker und Wissenschaftler damit beschäftigt haben und du sagst einfach mal so übers Knie man erreicht die eine 100% Auslastung sehr schnell -> einfach Blödsinn


bei Spielen ist man sehr weit weg von den 100 % ist auch sehr schwer an zugegeben wie viel wirklich erreicht wird aber der Code meistens zu komplex
 
AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

Doch ist sie, dein Logo ist Computer Science

Mein "Computer Science" Avatar ist nicht ohne Grund gewählt ;)
Wenn du nichts mehr zu Async Compute beizutragen hast, dann hat die Diskussion keinen weiteren Sinn.

Ich hab dir bereits Erklärt, dass Async Compute nur unter bestimmten Bedingen zu einem Mehrwert führen kann. Auf deinen konfusen Offtopic gehe ich nicht ein.
 
AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

Mein "Computer Science" Avatar ist nicht ohne Grund gewählt ;)
Wenn du nichts mehr zu Async Compute beizutragen hast, dann hat die Diskussion keinen weiteren Sinn.

weil ja ein Scheduler sowie man es es in jeder Hardware bzw. Software zu finden ist einfach unnötig ist -> lol, ACs ist nichts anderes was Hilft für Multiprocessor System (GPU ) die Performance zu erhöhen

bei Nvidia macht man es halt mit Software

Ich hab dir bereits Erklärt, dass Async Compute nur unter bestimmten Bedingen zu einem Mehrwert führen kann. Auf deinen konfusen Offtopic gehe ich nicht ein.

Nichts ist konfuse du hast nur keine Ahnung über Performancebetrachtungen an der Stelle nimm dir ein Buch über HPC anstatt es einfach "Auslastung" zu nehmen, das ist auch nicht böse gemeint aber es ist Informatik und auch eine Wissenschaft daher kann man nicht so unpräzise sein vor allem bei einen Begriff der doch "gut" definiert ist.
 
Zuletzt bearbeitet:
AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

Nichts ist konfuse du hast nur keine Ahnung über Performancebetrachtungen an der Stelle nimm dir ein Buch über HPC anstatt es einfach "Auslastung" zu nehmen

Ich musste diesen Satz 3 mal lesen aufgrund der schlechten Grammatik... Daran solltest du wirklich arbeiten, da das Lesen deiner Texte einfach anstrengend ist.
Deine Verständnisvolle bezogen auf Async Compute sind wohl heute nicht mehr zu beheben...
 
AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

Ich musste diesen Satz 3 mal lesen aufgrund der schlechten Grammatik... Daran solltest du wirklich arbeiten, da das Lesen deiner Texte einfach anstrengend ist.
Deine Verständnisvolle bezogen auf Async Compute sind wohl heute nicht mehr zu beheben...

allgemeine Performancebetrachtungen haben auch nichts mit ACs zu tun, man kann es auch nicht einfach über die Kamm scheren und sage es ist "Auslastung" es gibt nun mal verschieden Begriffe dazu und das Thema ist durchaus definiert
 
AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

egal jetzt was und wie ac funktioniert, die zeiten mit dx11 sind für nv ausgelutscht und vorbei :devil:

dx12+vulkan sind jetzt dran für die zukunft, den dank ps4 und xbox one usw, werden wir ab sofort nur noch solche performance tittels wie ashes of the singularity sehen ! :daumen:

auserdem ist das mir immernoch ein rätsel, wie nv die dx11 spiele durch treibern troz weniger shaders als amds gpus, so eine hohe performance liefern können ?

ah stimmt die treiber sind ja bis zum abwinken tot optimiert, das ich nicht lache :lol:

den ich bin fest davon überzeugt das nv mit dx11 treibern nicht mit rechten dingen zugehen, die stinken und das gewaltig, nur meine persöhnliche meinung.
 
Zuletzt bearbeitet von einem Moderator:
AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

allgemeine Performancebetrachtungen haben auch nichts mit ACs zu tun, man kann es auch nicht einfach über die Kamm scheren und sage es ist "Auslastung" es gibt nun mal verschieden Begriffe dazu und das Thema ist durchaus definiert

Der Zusammenhang in dem ich den Begriff Auslastung verwendet habe ich vollkommen ok ;)
 
AW: DirectX 12: Nvidia-Treiber mit Async Compute & Steam Overlay funktioniert

Der Zusammenhang in dem ich den Begriff Auslastung verwendet habe ich vollkommen ok ;)

Nein,

weil nur weil ein Gerät eingeschaltet ist und sich was dreht ist es nicht 100% ausgelastet.

Wenn ein Auto nur die halbe Leistung(Flops) auf die Straße bekommt aber den gleichen Krafstroffverbrauch (Watt) hat ist das doch auch nicht ok gegenüber einem Auto was 100 % der Leistung(Flops) bringt um Sinnhaftigkeit kann man jetzt streiten ob man ein Auto mit 100 PS oder 200 PS braucht wo beide den gleiche Kraftstoffverbrauch haben, beide Autos sind ausgelastet.

Man will nun mal die Rechenleistung umsetzen, erstens weil die Transistoren da sind und jeder Transistor Geld kostet und weil jedes ungenutzte Watt die GPU verbraucht wiederum Geld kostet.

Einen sinnhaften Vergleich kann man nur machen anhand eines Referenzwerts machen alles andere macht keine Sinn, selbst Absolutzahlen bringen nichts an was soll man sich orientieren, man muss eine Skala festlegen erst dann kann man entscheiden ob wie stark etwas ausgelastet wird.
 
Zurück