Nvidia: Neue Raytracing-Methode ermöglicht Millionen dynamischer Lichtquellen mit Echtzeitberechnung

Warum sollte ich mit 7GB/s und 0.1ms Latenz im Idealfall zufriedengeben, wenn ich 59GB/s 65ns Latenz RAM im System habe?
Btw der RAM ist trotzdem extrem viel zu lahm :)

Stell dir mal vor man hätte ein Multiplayergame ähnlich wie Portal. Ein anderer Spieler baut ein Portal in eine andere Welt und lässt dich dort hineinfallen. Die PS5 kann bis zu 22 GB/s in den Ram laden, dass heißt, der Ram an veränderlichen Daten nehmen wir mal an 11 Gb könnten so in 0,5 Sek in Ram geladen werden. Die 22Gb habe ich schon öfter gehört. Selbst 9GB pro Sekunde würden da helfen. Nehmen wir an, es gibt 5 dieser "Welten", dann müsste deine Graka 55 GB an Daten bereit halten.
Es ist ein Extrembeispiel, klar. Aber genauso reicht auch eine Umdrehung des Charakters aus, um Assets zu laden... Klingt alles extrem, aber das ist die Zukunft in meinen Augen.
 
Zuletzt bearbeitet:
Kann sich jeder anmelden:
Minecraft NVIDIA RTX FAQ – Home


Die Zukunft für RT steht fest. Das wird sich genauso entwickeln wie HW T&L und wie Unified Shader.

In 5 Jahren Bestandteil jeder Grafikkarte.


Ich denke wer sich ne TitanV für die richtige Anwendung geholt hat, der hat immer noch eine sehr potente Hardware in Händen. Solange es den A100 nicht als Einsteckkarte gibt, ist die TitanV immer noch der TopDog.


Zum xten Mal: Der offene Standard ist DXR bzw. DX12U.
Du suchst natürlich einen Haufen "subjektive Ausreden", ohne direkt auf Argumente einzugehen.:D

T&L wo, und was war am Phongmodell schlecht? Gibt es als "dedizierte" Einheit zudem nicht mehr. War ja dazu gedacht die CPU zu entlasten, wenn Nv soweit ist es mit RT gleichzutun, in 5 oder 10 Jahren, gerne.

Klar bleibt sie ein TopDog, aber Prosumer spielen nicht? Ich fand es schon frech, dass sie treiberabhängig RT anfänglich nicht durfte, weil man dafür ja einen Monsterchip braucht ohne RT Core, PIX aber auf einer 970 lief. Blah blah...wenig später stellte man fest, oh sie kannst doch ganz ohne RT Core. Holzauge sei wachsam!

Edit sagt:...Minecraft, was heißt denn bei dir freier Entwickler, jedermann oder nicht? In solchen Phasen kann man gut abschätzen wohin die Entwicklung gehen soll, was die Ansprüche sind und wie man diese umsetzt. Man wartet dann auf dein Feedback um nicht wirr in der Gegend umherzuforschen. Es geht also um anwendergerechte Lösungen.
 
Ich finde es immer erfeulich, wenn die Forschung in technischen Bereichen Fortschritte erziehlt. Natürlich geht es bei der Forschung zunächst um die prinzipielle Machbarkeit, dennoch ist es wahrscheinlich, dass die Spiele in einigen Jahren durch solche Fortschritte profitieren werden.
.

Eine GTX480 oder sogar schon eine GTX280 konnte RT ohne Probleme.

Wo ist da bitte technischer Fortschritt wenn in 12 Jahren 3 Spiele es können? Sehe ich nicht.

Der ganze Ansatz ist Uralt und nichts Neues und wird sich genauso wenig durchsetzen wie das lächerliche PhysX damals.
 
Was nützt es, wenn es etwas kann, aber bisher keines meiner Spiele das verwenden kann.
Wenn Du keinen Nutzen mit RT hast, als kein einziges Spiel, dann nützt Dir eine RTX Karte natürlich nichts. Aber dein Use Case ist keine Begründung um allgemein zu sagen es lohne sich nicht eine RTX Karte zu kaufen. Die Karten sind doch auch in normalen Spielen verdammt schnell.
Da finde ich die Begründung......Ich mag Nvidia nicht viel ehrlicher. Am Ende ist es ja auch jedem seine eigene Sache was er kauft.

Warum hast du dann eine GTX1080?
Als kleiner Surf Rechner mit dem ab und zu gespielt wird reichts doch noch :D.
Ansonsten wird eben der i9 7920X/GTX 1080Ti, oder der R9 3900X/RTX 2070 super benutzt.
Eigentlich wollte ich ja selber die erste RTX Generation auslassen, obwohl ich ein Fan von RTX bin. Aber um meine Frau von Ihrem uralten aber heiß geliebten 1200p Bildschirm wegzubringen mußte eine neue Karte ohne HDMI her. Da lag es dann nahe doch eher auf den RTX Zug aufzuspringen.
 
RT auf der TitanV macht eben ähnlich wenig Sinn wie auf Pascal, weil es schlicht zu langsam ist.
Ja, Nv's Methode und BVH braucht keinen RT Core, weil das Traversal ein Hierachienmodell ist. Nur weil Nv's Structuretiefe dabei eine Beschleunigung benötig, heißt das nicht das es jeder so beschleunigen muss. Das ist eine strikte Ray Classifikation Methode (tree), wie sie mit RTX einhergeht.

Also wo war'n wir noch?
 
Bin halt schon gespannt, ob AMD bei RDNA2 den BVH auf dem Texturcore berechnen lässt, wie von CB vermutet.

https://www.computerbase.de/2020-04/raytracing-in-spielen-gpu-beschleunigung/3/#abschnitt_wie_koennte_amds_ansatz_aussehen schrieb:
Der BVH-Algorithmus benötigt einen guten Zugriff auf Cache und VRAM bei hoher Bandbreite. Als ausgegliedertes Element, wie es der RT-Kern bei Nvidia ist, bedeutet dies Flächenverbrauch durch eine zusätzliche Speicheranbindung. AMD beschreibt, dass der Texturprozessor, der für das Abrufen der Texturen beim Shading zuständig ist, bereits eine optimale Anbindung an den Speicher besitzt. Er ist dadurch prädestiniert, den BVH-Algorithmus speichereffizient auszuführen. Der zweite Schritt für Raytracing, die Schnittstellenbestimmung, wird im Anschluss durch eine neue Recheneinheit, die sogenannte „Ray Intersection Engine“, durchgeführt. Diese ist eine Fixed-Function-Einheit, also wie bei Nvidia ein ASIC, der in den Texturprozessor integriert wird. Diese Einheit könnte diejenige sein, die vom Xbox-Entwickler als dedizierte Recheneinheit für Raytracing bezeichnet wurde.
 
Mich haut die Demo jetzt nicht vom Hocker. Wirkt sehr Textur arm. Vermutlich mussten sie sehr Speicherorientiert arbeiten und haben dort gespart.
Die Grafik sieht aus wie aus dem Jahr 2012. Nur Licht reicht eben auch nicht.
 
Bin halt schon gespannt, ob AMD bei RDNA2 den BVH auf dem Texturcore berechnen lässt, wie von CB vermutet.
Ehrlich, ich habe immer Bauchschmerzen wenn etwas in HLSL Code ausgeführt wird von Fixed Function zu schreiben, da gabs hier ja schon ellenlange Diskurse. Es kommt/käme wenn, dann auf den Compiler bzw. Treiber an.

Für mich sieht das eher so aus, als halte sich AMD an die Vorgaben und geht Nv wieder eigene Wege. Was jetzt schneller oder langsamer wird (vor allem mit dem Fortschreiten in der Entwicklung) muss man sehen, zumal später Nv dann wieder gleiche Wege gehen könnte, wie mit GSync Compatible.

"Eigene Wege gehen" als Oberbegriff, bedeutet aber auch langfristige Treiberpflege (und das Modell ist schlichtweg bekannt). Sie wollen dem Anwender jedenfalls für ihre (festgelegte) Definition einer/der Anwendungszeit immer das beste Ergebnis liefern, ob immer sinnvoll weil kostepielig(er) ist da nicht relevant. Das war schon immer so. Abheben kostet nun mal.
 
Mich haut die Demo jetzt nicht vom Hocker. Wirkt sehr Textur arm. (..) Nur Licht reicht eben auch nicht.

Thema verfehlt. Die Demo handelt von Lichtberechnungen, warum sollte dabei eine 16k Tiefentextur zum Einsatz kommen, welche die Leute ablenkt?
Wenn ein 100 PS 4-Takter mit einem 500 PS V8 verglichen wird, ist doch egal welche Karosserie zu sehen ist. Beides kann ein Audi sein der optisch nicht zu unterscheiden ist.
 
Thema verfehlt. Die Demo handelt von Lichtberechnungen, warum sollte dabei eine 16k Tiefentextur zum Einsatz kommen, welche die Leute ablenkt?
Wenn ein 100 PS 4-Takter mit einem 500 PS V8 verglichen wird, ist doch egal welche Karosserie zu sehen ist. Beides kann ein Audi sein der optisch nicht zu unterscheiden ist.

Ich zitiere mich mal selbst:

Das stimmt wohl. Die Szenen sind schon arm an Details. Von daher eventuell sogar peinlich sowas nach Epic aufzutischen. Die Unreal Engine 5 Demo strotzt ja nur so an Detail mit ihren Billionen Dreiecken trotz global Illumination. Die Nvidia Demo kommt mit sehr wenig Details daher, weshalb die Frage berechtigt ist, ob die Lichter die Leistung der Graka gefressen haben und nicht mehr genügend Reserven für Details da waren. Von daher rudere ich gerne etwas zurück... :-)
 
Ehrlich, ich habe immer Bauchschmerzen wenn etwas in HLSL Code ausgeführt wird von Fixed Function zu schreiben, da gabs hier ja schon ellenlange Diskurse. Es kommt/käme wenn, dann auf den Compiler bzw. Treiber an. [...]

So tief unten in der Hardware spielen Compiler keine Rolle mehr. Das sind reine, festverdrahtete HW-Einheiten am Werk. Compiler und Shader Languages spielen auf der Höhe der SPs eine Rolle, aber nicht da unten. Der wesentliche Unterschied der Implementation ist, dass AMDs Ansatz nach jeder einzelnen Berechnung zum SP zurückkehrt und diesem überlässt, wie mit dem vorläufigen Ergebnis zu verfahren ist, während nVidia, soweit ich das zur Hand habe, hier komplett durchrechnet bis ein Primitive getroffen wurde (oder möglicherweise eine maximale Rekursionstiefe erreicht wird). AMDs Ansatz verspricht etwas mehr Flexibilität, nVidias bisheriger dagegen ist absehbar der schellere. Was am Ende wie performt und im Detail welche Vor- und/oder Nachteile mit sich bringt, wird man abwarten müssen, bis konkrete Implementationen zum Vergleich vorliegen.

AMD: A fixed function BVH intersection testing and traversal (a common and expensive operation in ray tracers) logic is implemented on texture processors. This enables the performance and power efficiency of the ray tracing to be substantially improved without expanding high area and effort costs. High bandwidth paths within the texture processor and shader units that are used for texture processing are reused for BVH intersection texting and traversal. In general, a texture processor receives an instruction from the shader unit that includes ray data and BVH node pointer information. The texture processor fetches the BVH node data from memory using, for example, 16 double word (DW) block loads. The texture processor performs four ray-box intersections and children sorting for box nodes and 1 ray-triangle intersection for triangle nodes. The intersection results are returned to the shader unit.


Allgemein zum Thema Qualität und Vergleich zu Unreal: Das ist die Äpfel/Birnen-Geschichte. Das eine ist eine technische Demonstration, ein Proof-of-Concept, dagegen die PS5/Unreal-Demo ist zwar auch eine Demonstration aber im Wesentlichen Werbematerial zur bevorstehenden Unreal 5 Engine, denn hierbei geht es immer darum Entwickler und Publisher davon zu überzeugen, diese Engine zu verwenden und nicht etwa Unity oder bspw. eine aufwändig gepflegte hauseigene Engine.
Hätte man dem Doktorandenteam noch ein paar Digital Artists zur Seite gestellt, hätte man die zweifelsfrei "schöner" und "beeindruckender" machen können, aber das hätte in dem Falle auch vom wesentlichen Aspekt abgelenkt. Das Zielpublikum sind hier Grafikingenieure und keine Gamer; beide Adressaten reagieren hier auf komplett unterschiedliche "Reize".
 
Zuletzt bearbeitet:
Eine GTX480 oder sogar schon eine GTX280 konnte RT ohne Probleme.

Wo ist da bitte technischer Fortschritt wenn in 12 Jahren 3 Spiele es können? Sehe ich nicht.

Der ganze Ansatz ist Uralt und nichts Neues und wird sich genauso wenig durchsetzen wie das lächerliche PhysX damals.

bei solchen comments weiß man nicht mehr was man schreiben soll.

das es RT schon lange gibt hat ja keiner dementiert, die technische umsetzung die teile davon in echtzeit ermöglichen SIND neue techniken und ein enormer technischer fortschritt.

aber klar, rohrkrepierer wie physx (welches als phsyic datenbank eine rießige verbreitung hat...nur nicht mehr als auf nvidia gpu limitierte schnittstelle)... bitte weniger geistigen durchfall verfassen
 
Das stimmt wohl, aber dennoch bleibt die Frage, ob die Menge an Lichtquellen so auch mit mehr Details hätten realisiert werden können.

Das ist derzeit sekundär, wenn überhaupt. Dabei handelte es sich um eine Doktorandenarbeit, d. h. eine wissenschaftliche Arbeit zur Entwicklung der notwendigen Grundlagen. Das ist noch weit entfernt von einer konkreten technischen Implementation und erst recht von der Verwendung in regulären Triple-A-Massenmarktspielen. ... :wall:

Zum Vergleich: Beispielsweise die CryEngine bietet ihren voxelbasierten GI-Ansatz (konkret SVOTI) seit 2015 an, wissenschaftliche Arbeiten hierzu und zu verwandten, voxelbasierten Techniken reichen jedoch min. 10 Jahre zurück.
Ein derartiger Zeitraum muss für die aktuelle Arbeit nicht repräsentativ sein, aber es sollte klar sein, dass das nichts ist, was man am Ende des Jahres im Markt antreffen wird.
 
Zuletzt bearbeitet:
Das ist derzeit sekundär, wenn überhaupt. Dabei handelte es sich um eine Doktorandenarbeit, d. h. eine wissenschaftliche Arbeit zur Entwicklung der notwendigen Grundlagen. Das ist noch weit entfernt von einer konkreten technischen Implementation und erst recht von der Verwendung in regulären Triple-A-Massenmarktspielen. ... :wall:

Ja, meinetwegen sekundär, aber ich finde die Frage nicht unberechtigt. Den Wandsmily kannst du dir klemmen.
 
Mit deiner Antwort zeigst du eigentlich eher, dass hinter den Smiley gar noch zusätzlich ein Ausrufezeichen gehört.
Da du von Entwicklung und Productdevelopment (und dabei spielt es noch nicht einmal so sehr eine Rolle um welche Kategorie Produkt es im Konkreten geht) offensichtlich keine Ahnung hast ... frag dich vielleicht mal, wie dich Henry Ford angeschaut hätte, wenn du ihm zu Beginn seiner Karriere nach Dingen gefragt hättest wie vollautomatische 8-Gang-Schaltung die in Sekundenbruchteilen schaltet, voll automatisch einstellbaren Sitzen, die wohl im damaligen Vergleich komfortabler und robuster waren als jedes Sofa, ein Dutzend Airbags und einem CW-Wert < 0,25? Der hätte sich wohl auch einen solchen Smiley gewünscht, hätte abgewunken und sich dran gemacht, überhaupt erst einmal seine Fabrikation ans Laufen zu bekommen.
 
Zurück