Ich oute mich mal, und gebe zu nicht zu verstehen, was genau du meinst.
Die Grundidee von Polygonen gegenüber Voxeln war und ist es, ein Objekt über aufgespannte Oberflächen zu beschreiben, statt es aus einzelnen, immer gleich großen Elementen zusammenzusetzen, von denen letztlich für jedes anzuzeigende Detail, bei hochauflösender Grafik also für jedes Pixel, eins existieren muss: Genau wie für eine 2D-Bitmap jedes Pixel einzeln abgespeichert werden muss, muss für ein 3D-Objekt aus Voxeln jeder einzelne Punkt der Oberfläche einzeln mit X-, Y- und Z-Koordinate gerendert werden. Eine Polygon-Engine ist dagegen das 3D-Äquivalent zu einer Vektorgrafik: Man speichert nur die Eckpunkte einer Dreiecksfläche, welche beliebige Größen abdecken kann. Statt drei Koordinaten pro Pixel zu berechnen, hat man also dreimal drei Koordinaten pro Fläche – eine extrem Einsparung von Rechenlast, wenn sich ein flaches Objekt über tausende von Pixeln erstreckt, also tausende von Voxeln für eine pixelgenaue Darstellung statt weiterhin nur ein Polygon erfordert. (Respektive zwei, wenn ein Viereck dargestellt werden soll.)
Diese Logik gilt aber auch in Gegenrichtung: Die Lage eines Polygons im Raum erfordert immer die Berechnung aller seiner drei Eckpunkte zu je drei Koordinaten. Auch wenn das Polygon kleiner als ein Pixel ist, mit seinen insgesamt neun Koordinaten also nicht mehr zum ausgegebenen Bild beitragen kann, als es ein Voxel mit nur drei Koordinaten machen würde. Deswegen nutzt man für, relativ zur Ausgabeauflösung, hochdetaillierte 3D-Modelle eigentlich keine Polygone, das wird einfach ineffizient. Auch hier bietet sich ein 2D-Vergleich an: Niemand käme auf die Idee, eine Foto, bei dem jedes Pixel anders aussieht, als Vektorgrafik speichern zu wollen. Diese sind empfehlen sich für Cliparts und Symbole, die relativ wenig Details enthalten und so auf beliebige Größe skaliert werden können.
Was Nvidia hier beansprucht, schlägt dem Fass dabei meilenweit den Boden aus: 500 Millionen gerenderte Polygone? Also 1.500 Millionen berechnete Eckpunkte? Für ein Resultat, dass in UHD ausgegeben maximal 8,3 Millionen Pixel füllt? In FHD, was immer noch weit über der nativen Rendering-Leistung einer RTX 5090 liegen wird, sogar nur 2 Millionen Pixel? Sorry, aber das wäre grandiose Verschwendung und würde selbst bei nur einer homogenen Farbe je Dreieck bedeuten, dass 25 berechnete Farbwerte zu einem einzigen Ausgabewert vermischt werden müssen. Wenn man eine Mini-Texturauflösung von 32 × 32 ansetzt, wären es schon 25.600 zu ver-/berechnende Farbwerte je schlussendlich sichtbaren. Damit würde man statt technischem Können grandiose Verschwendung und Ineffizienz demonstrieren.
Real wird Nvidia natürlich nur einen Bruchteil der beanspruchten Detailtiefe tatsächlich auch Rendern und den Rest per KI raten. Aber dann sollen sie halt auch nicht solche Zahlen beanspruchen, wenn das eigentliche Know-How im Interpoliermodell liegt und auch auf Grundlage von 5 Millionen Polygonen das gleiche, mehr oder minder fehlerarme Ergebnis geliefert hätte.