Mensch, das liegt aber nicht an Turing, sondern am Umstand, wie ICH priorisiere oder welche Auslastung ICH zu welchem Zeitpunkt auf die Einheiten lege.Eben, das Problem ist inhärent du bekommt mit Turing KEINE wesentlich besser Ausalstung als das gesehen hin.
Und so könnte ich natürlich einen künstlichen Workload erzeugen, der so wie Du es der Hardware absprichst zu gleichen Anteilen RT als auch FP und Int berechnet.
Nur wer sollte das tun und welcher Renderpipeline würde so eine "unsinnige" Rechen- und Powerbudgetverteilung nützen?
?? Wie denkst Du denn, dass Optimierungsmaßnahmen in den Produktionen durchgeführt werden, wenn der Programmierer nichts bestimmt?Der Programmiere, wenn er bei klarem Verstand ist, bestimmt hier schlicht nichts.
Wie erklärst Du es Dir, dass ein Battlefield 5 mit RT Reflections deutlich weniger performant arbeitet als ein Wolfenstein Youngblood?
Weil der Programmierer "wenn er bei klarem Verstand ist" hier nichts bestimmt?
Wieso sollte ich das BVH- Traversal auch nicht in einem Rutsch durchführen? Da die Verarbeitung async/parallel stattfinden kann, ist ja dadurch nichts verloren (obwohl Du es immer so darstellst),Was soll er denn machen? Die RT Core Arbeiten stückeln? Geht schlicht nicht. wenn du die RT Cores nutzt, dann in einem rutsch sonnst stimmt mit deinem Algorithmus etwas nicht und es wird zu teuer.
OK- Du bestätigst Deine Sehschäche offensichtlich.1/10 Framtime machen ~90% der Shader schlicht nichts oder anderst rum, 9/10 FrameTime machen die RT Cores schlicht nichts.
Lass mal nsight bei diversen Titeln mitlaufen und schau Dir die Messchriebe an. Vorher brauchen wir hier denke ich nicht mehr weiterdiskutieren.
Ja- Also genau das, was nvidia auch immer offen kommuniziert hat. Du kannst immer alle fixed- function- Einheiten auch Softwareemulieren oder auf komplexen, universellen Einheiten abbilden.Und das man DXR auch ohne dezidierte FF beschleunigen kann sieht man ja selbst an Pascal VS Turing (ohne RT). Selbst das geschönte DLSS+RT Farme hilft da nicht.
Nur sind die halt dann langsamer. Spezialisierte, fest verdrahtete Schaltungen für immer wiederkehrende Berechnungen sind nunmal einfach schneller, effizienter.
Sonst würde man sie nicht verbauen.
Nach Deiner Theorie sind dann auch GPUs überflüssig, da man alles auch über den CISC- Prozessor problemfrei berechnen kann?
Zuletzt bearbeitet:

