News Geforce RTX 4060 Ti: Modell mit 16 statt 8 GiB VRAM soll später kommen

Nun, da immer mehr Games, so schlecht optimiert werden das man eben immer mehr VRAM braucht, wäre dann die 16GB Variante das deutlich bessere Angebot und Zukunftssicherer als eine 4070 und 4070ti. Die 70ziger sind ja jetzt schon rausgeschmissen Geld, da wird es ja noch krasser werden, wenn die 16GB Variante raus kommt. Wer kauft denn da noch eine 70ziger? OK für 300 Okken...... :fresse:
 
Zuletzt bearbeitet:
Sollte eine 4060ti zu einem Anständigen Kurs und mit 16GB erhältlich sein, werde ich
diese auch als Kaufoption erwägen. #abererstmalabwartenunteetrinken
Kommen ja noch durchaus Interessante Chips, Battlemage z.b.
 
Es werden einfach doppelt soviele Speichermodule im Camshell Verfahren aufs PCB gebracht.

So wie bei den Pro Karten.

Glaube ich persönlich nicht, da das die Karten deutlich verteuern würde. Die Leistungsaufnahme würde auch anders ausfallen und die ganze Karte müsste anders aufgebaut werden. Glaube nicht, dass ein Gamer bereit ist für eine 4060Ti 16GB deutlich mehr zu bezahlen. Ich denke doch eher, dass es bald einfach 4GB Speichersteine gibt. Warten ja schon Jahre darauf.

Edit: Gerade gesehen, dass Clamshell mit angegeben ist. Da lasse ich mich mal überraschen ob das wirklich so kommt.
 
Zuletzt bearbeitet:
Man könnte auch einfach sagen: attraktives Produkt. ;) 16 GiByte auf so einer Karte sind das, was 8 GiByte im Jahr 2016 waren - in der in der Regel "zu viel", aber perspektivisch optimal.

MfG
Raff
mehr die 12GB der 3060, vermeidet die Bottleneck von 6/8GB, aber die Rohleistung wird dadurch nicht mehr.
 
Tatsächlich spielt die reine Auflösung von Texturen keine große Rolle, da die Menge der pro Pixel geladenen Daten sich dadurch nicht ändert. Allerdings kann es aufgrund von größerem Datenaufkommen sein, dass die Caches nicht mehr so gut greifen. Weiterhin ist die Bandbreite das Produkt aus Busbreite und Transferrate. Dadurch sollte je nachdem, welcher Speicher letztendlich auf der 4060Ti verbaut wird, die Bandbreite trotz nur halb so breitem Bus "nur" um 25-35% einbrechen. Dafür hat sie 32 statt 4MB L2-Cache, was die effektive Bandbreite wiederum deutlich erhöhen dürfte. Wichtig ist immer das Verhältnis von Rechenleistung zur (effektiven) Speicherbandbreite und das ist meist innerhalb einer Reihe recht ähnlich. Dadurch, dass die Speicherbandbreite aber nur sehr bedingt durch den Speichertyp bestimmt werden kann und die Speichergröße immer eine Zweierpotenz der Busbreite ist, gibt es auch oft gerade in der Mittelklasse die Situation, dass die kleinere mögliche Speichermenge manchmal etwas zu wenig sein könnte und die größere aber oft zu viel ist. Die offensichtliche Lösung wäre natürlich einfach beide Varianten anzubieten und den Kunden entscheiden zu lassen.

Ob man eine große oder viele kleine Texturen hat, macht keinen großen Unterschied. Aber wenn eine gegebene Zahl Low-Res-Texturen durch ebenso viele High-Res-Texturen ersetzt werden, steigt der Speicherbedarf deutlich an. Es haben dann eben mehr Pixel unterschiedliche Farben, während sich bislang viele Pixel eine Information geteilt haben. Bei händisch bearbeiteten Mods kann noch hinzukommen, dass verschiedene Detailtexturen für zuvor identisch texturierte Objekte genutzt werden.

Rein von den Eckdaten her scheint mir eine 4060-16 aber auch auf Kante gebaut. Rechnerisch könnte sie mit den gemunkelten 288 GB/s ihren gesamten VRAM-Inhalt nur 18 mal pro Sekunde in die GPU schieben. (Zum Vergleich: 4090 und 4070 42 mal, 4080 45 mal, 4060-8 logischerweise 36 mal.) Nehmen wir mal 36 Fps als Minimum an, unterhalb dessen man sich über zusätzlich Ruckler durch Speichermangel auch nicht mehr zu beklagen braucht, dann wären das 8 GiB pro Sekunde nutzbarer VRAM, wenn sich die Szene innerhalb dieses Zeitraums nicht verändert. Und wenn die Karte gar nichts in den Speicher schreibt, nie wartet, etc.. Realisitischer ist vermutlich, dass ein Spiel spätestens bei einer Nutzung von 6 GiB RAM in einer gegebenen Sekunde ins VRAM-Transferraten-Limit läuft.

Alles darüber hinaus ist als Caching-Reserve zu betrachten, um auch aktuell nicht genutzte Texturen außerhalb des Sichtfelds vorrätig zu halten. Bei 30 Fps würde ich mal erwarten, dass via PCI-E 4.0 ×8 immerhin 200 MiB von einem Frame zum nächsten ausgetauscht werden können respektive zum Beispiel binnen einer Viertelsekunde beim Durchschreiten einer Tür schon die Hälfte so einer 6-GiB-Szene ausgetauscht werden könnte. Funfact: 288 GB/s und 6 GiB Gesamt-VRAM-Größe waren die Eckdaten der ersten Titan. Die 1070 hatte 8 GiB an 256 GB/s, die 2080 Ti schon mehr als die doppelte Transferrate für 11 GiB. Dank Caching kann die 4060 zwar deutlich mehr Shaderleistung an einem schmalen Interface sinnvoll nutzen, als diese älteren Karten – aber eben keine größeren Texturen, denn die würden ja nicht mehr in den Cache passen. Eine 192-Bit-12-GiB-Ausführung wäre also vermutlich sinnvoller gewesen. Aber so ein Interface verkauft man ja als 4070. Bei der 4060-12 könnte RAM-OC sehr interessant werden.
 
Glaube NVidia wird durch den ganzen Shitstorm auch die Speicher an anderen Modellen anpassen...Finde es zwar gut das die mit 16GB kommt aber eigentlich auch verarsche für die die sich ne 4070 geholt haben...Gibt bestimmt wieder so super Modelle oder sowas die dann mehr RAM haben...Bin mal gespannt..
 
Bei den was da für ein wirware ist braucht man sich echt net wundern wiso das so katastophal ist.

Kein konzept zu sehen oder wir sehen es nicht aber nvidia schon.

wenn es eine 12gb version gäbe dann darf die zwischen 400-500 euro kosten klar unter 500. 499 euro wäre mal was aber wie wir nividia kennen wird das ehe irgend wo abgehoben sein.

Der von der PR macht ja auch nur sein job aber manchmal kann man sich fragen was die da, "Geraucht" haben. (joke)
 
Bis inklusive zur 4080 kommt das Lineup, insbesondere in Anbetracht der aufgerufenen Preise, schlichtweg mit 4GiB zu wenig VRAM bzw. entsprechend mit beschnittenem Speicherinterface. Die 192-Bit/12GiB hätten der 4060 gut gestanden, so dann die 256-Bit/16GiB der 4070 und ff.
 
Ob man eine große oder viele kleine Texturen hat, macht keinen großen Unterschied. Aber wenn eine gegebene Zahl Low-Res-Texturen durch ebenso viele High-Res-Texturen ersetzt werden, steigt der Speicherbedarf deutlich an. Es haben dann eben mehr Pixel unterschiedliche Farben, während sich bislang viele Pixel eine Information geteilt haben. Bei händisch bearbeiteten Mods kann noch hinzukommen, dass verschiedene Detailtexturen für zuvor identisch texturierte Objekte genutzt werden.
Der Speicherbedarf steigt logischerweise an, aber nicht der Bandbreitenbedarf. Ich glaube nicht, dass sich mehrere Pixel so einfach dann die Daten teilen können, immerhin muss ja für jedes Pixel festgestellt werden, wo in der Textur es sich befindet und daraus wird dann errechnet, welche Texturdaten gebraucht werden. Wenn es oft die selben sind, spielt das natürlich wie gesagt für die Effektivität der Caches und damit die effektive Bandbreite eine Rolle, von daher gilt seit der stärkeren Nutzung von Caches schon nur noch eingeschränkt, dass größere Texturen keine Leistung kosten. Wie viel das dann wirklich ist, wäre mal ein interessanter Test.
Rein von den Eckdaten her scheint mir eine 4060-16 aber auch auf Kante gebaut. Rechnerisch könnte sie mit den gemunkelten 288 GB/s ihren gesamten VRAM-Inhalt nur 18 mal pro Sekunde in die GPU schieben. (Zum Vergleich: 4090 und 4070 42 mal, 4080 45 mal, 4060-8 logischerweise 36 mal.) Nehmen wir mal 36 Fps als Minimum an, unterhalb dessen man sich über zusätzlich Ruckler durch Speichermangel auch nicht mehr zu beklagen braucht, dann wären das 8 GiB pro Sekunde nutzbarer VRAM, wenn sich die Szene innerhalb dieses Zeitraums nicht verändert. Und wenn die Karte gar nichts in den Speicher schreibt, nie wartet, etc.. Realisitischer ist vermutlich, dass ein Spiel spätestens bei einer Nutzung von 6 GiB RAM in einer gegebenen Sekunde ins VRAM-Transferraten-Limit läuft.
Es werden ja nicht alle Daten im Speicher in jedem Frame gebraucht, durchaus aber bestimmte Daten mehrmals, sonst wären Caches ja wirkungslos. Von daher weiß ich nicht, wie sehr die Metrik "komplette Übertragung des VRAMs zur GPU pro Sekunde" greift. Wenn man hingegen Speicherbandbreite pro Rechenleistung betrachtet, kommt man bei der 4060Ti fast auf das gleiche Ergebnis wie bei der 4090.
Alles darüber hinaus ist als Caching-Reserve zu betrachten, um auch aktuell nicht genutzte Texturen außerhalb des Sichtfelds vorrätig zu halten. Bei 30 Fps würde ich mal erwarten, dass via PCI-E 4.0 ×8 immerhin 200 MiB von einem Frame zum nächsten ausgetauscht werden können respektive zum Beispiel binnen einer Viertelsekunde beim Durchschreiten einer Tür schon die Hälfte so einer 6-GiB-Szene ausgetauscht werden könnte.
Ich denke, dass deutlich weniger Daten geschaufelt werden, wenn der Speicher nicht viel zu knapp ist. Außerdem dürfte alles, was in Sicht_weite_ ist im Speicher liegen müssen, weil sich das Sichtfeld oder Verdeckungen ja sehr schnell ändern können und gerade letztere auch nicht ohne weiteres vor dem Rendervorgang klar ersichtlich sind.
Funfact: 288 GB/s und 6 GiB Gesamt-VRAM-Größe waren die Eckdaten der ersten Titan. Die 1070 hatte 8 GiB an 256 GB/s, die 2080 Ti schon mehr als die doppelte Transferrate für 11 GiB. Dank Caching kann die 4060 zwar deutlich mehr Shaderleistung an einem schmalen Interface sinnvoll nutzen, als diese älteren Karten – aber eben keine größeren Texturen, denn die würden ja nicht mehr in den Cache passen. Eine 192-Bit-12-GiB-Ausführung wäre also vermutlich sinnvoller gewesen. Aber so ein Interface verkauft man ja als 4070. Bei der 4060-12 könnte RAM-OC sehr interessant werden.
Naja, eine 4060Ti hat zwar weniger Cache als eine 4090, aber nicht weniger pro Recheneinheit oder Speichercontroller. Die absolute Größe muss nicht zwingend viel ausmachen, es müssen ja nicht die gesamten Texturen, sondern nur jeweils die Teile davon, die gerade verwendet werden, darin vorgehalten werden, was ja durchaus mehr sein könnten, wenn mehr Recheneinheiten gleichzeitig arbeiten.
 
Für meinen Teil freue ich mich bereits jetzt sehr auf eine RTX5090Ti mit 2GB-VRam :D
Ganz ehrlich, was soll der Mist denn?
Schwache Karten mit mehr RAM als die leistungsstärkeren Modelle?
Derselbe Murks wie bei den 30ern. Die lernen es einfach nicht.
Egal, die kommende Karte wird eh ne AMD (außer im Wohnzimmerkistchen, da kommt wohl ne 3060 (12! GB) rein,
derweil max. Platz für 2-Slot und 200mm Länge - gibt es bei AMD m.W. leider nicht mit vollen 16 Lanes).
 
Ach das mit mehr Speicher... ich mein es muss doch alles passen was nützen 16 GB wenn ich sie nicht ordentlich befeuern kann...
hatte 2 Jahre ne RX 6800 mit 16 GB, hab den Speicher in WQHD nicht gebraucht und mittlerweile ist sie nur noch im Zweitrechner weil ich mehr FPS wollte...
hab auch noch nie 5 Jahre mit ner Karte gezockt sondern immer alle 2 Jahre im Schnitt auf/umgerüstet..
Hab jetzt ne RTX 4070 ti und freu mich in WQHD ... und in 2 Jahren wird es wieder was anderes und wenn AMD bis dahin auch noch mehr Argumente außer "SPEICHER" bringen kann wird´s vielleicht auch wieder ne Radeon
 
RTX 3060 mit 12GB
RTX 3070 mit 8GB
RTX 4060 ti mit 16GB
RTX 4070 ti mit 12GB
Nvidia bleibt ihrer wirren Speicherstrategie treu. :rollen: Vielleicht kommt so eine 4060 ti mit 16 GB auch erst viel später 2024. Zumindest erwarte ich immer noch dass nächstes Jahr eine Neuauflage einiger Karten mit doppeltem Speicher kommt.
Das geht noch viel weiter zurück: gtx970 4gb = 3,5 schnelle vram + 0,5gb super langsam. Rtx 2060 erst 6gb dann später 8gb.
Ich verstehe gar nicht was NV mit ihrem VRam da immer für einen Eiertanz aufführen! Die tun so als wäre Vram die teuerste Komponente der Karte dabei gibts bei AMD immer mehr Vram für weniger Geld ohne dieses rumgeier.
Für mich riecht dieses VRam Geschummel bei NV nach geplanter Obsoleszenz. So nach dem Motto alles irgendwie am Limit bauen so dass es sich gerade noch gut verkauft aber die Kunden schon recht schnell wieder am Limit sind und gezwungen werden neue Produkte zu kaufen.
 
Nvidia bleibt ihrer wirren Speicherstrategie treu. :rollen:
Da ist gar nichts wirr. Die Speichergröße passt zu den Interfaces.
Die Vram Paniker haben jetzt außer bei der 4070 Ti zu jedem Modell genügend Speicher.
Zumindest erwarte ich immer noch dass nächstes Jahr eine Neuauflage einiger Karten mit doppeltem Speicher kommt.
Was tut man eigentlich mit mehr als 12 GB Speicher? Meine Spiele brauchen nur 4 bis 6.
Die 16GB mit dem 128 Bit Interface werden sicher HAMMER laufen.
Was veranlasst dich so einen Unsinn zu verfassen? Relevant ist die Bandbreite/ Caches und davon hat die 3070 auch nicht mehr.


Man hätte die Karte einfach gleich mit 12GB ausstatten können, aber dafür ist Nvidia halt zu geizig.
Sind jetzt 12 GB wieder genug?

Nun, da immer mehr Games, so schlecht optimiert werden das man eben immer mehr VRAM braucht, wäre dann die 16GB Variante das deutlich bessere Angebot und Zukunftssicherer als eine 4070 und 4070ti.
Du weißt aber... Vram kann man nicht essen und eine 8GB 4070 wäre in fast allen Vram lastigen Fällen mit ein paar Qualitätseinstellungen die deutlich schnellere Karte wäre?

Zukunftfähiger in sehr seltenen Fällen vielleicht in 5 Jahren, wenn paar Einstellungen nicht mehr greifen.

Die meisten Menschen leben in der Gegenwart, nicht in der Zukunft.
Die 70ziger sind ja jetzt schon rausgeschmissen Geld,
Rausgeschmissenes Geld ist der 7950X3D. Die 4070 hat eine vernünftige Speichermenge in Relation zur Leistung. Die 4070 Ti nicht unbedingt, aber dafür gibt es irgendwann Qualitätseinstellungen.

Und der, der das nicht will, greift zur 7900XT.
 
Der Speicherbedarf steigt logischerweise an, aber nicht der Bandbreitenbedarf. Ich glaube nicht, dass sich mehrere Pixel so einfach dann die Daten teilen können, immerhin muss ja für jedes Pixel festgestellt werden, wo in der Textur es sich befindet und daraus wird dann errechnet, welche Texturdaten gebraucht werden. Wenn es oft die selben sind, spielt das natürlich wie gesagt für die Effektivität der Caches und damit die effektive Bandbreite eine Rolle, von daher gilt seit der stärkeren Nutzung von Caches schon nur noch eingeschränkt, dass größere Texturen keine Leistung kosten. Wie viel das dann wirklich ist, wäre mal ein interessanter Test.

Es werden ja nicht alle Daten im Speicher in jedem Frame gebraucht, durchaus aber bestimmte Daten mehrmals, sonst wären Caches ja wirkungslos. Von daher weiß ich nicht, wie sehr die Metrik "komplette Übertragung des VRAMs zur GPU pro Sekunde" greift. Wenn man hingegen Speicherbandbreite pro Rechenleistung betrachtet, kommt man bei der 4060Ti fast auf das gleiche Ergebnis wie bei der 4090.

Ich denke, dass deutlich weniger Daten geschaufelt werden, wenn der Speicher nicht viel zu knapp ist. Außerdem dürfte alles, was in Sicht_weite_ ist im Speicher liegen müssen, weil sich das Sichtfeld oder Verdeckungen ja sehr schnell ändern können und gerade letztere auch nicht ohne weiteres vor dem Rendervorgang klar ersichtlich sind.

Naja, eine 4060Ti hat zwar weniger Cache als eine 4090, aber nicht weniger pro Recheneinheit oder Speichercontroller. Die absolute Größe muss nicht zwingend viel ausmachen, es müssen ja nicht die gesamten Texturen, sondern nur jeweils die Teile davon, die gerade verwendet werden, darin vorgehalten werden, was ja durchaus mehr sein könnten, wenn mehr Recheneinheiten gleichzeitig arbeiten.

Es werden nicht einfach alle Daten, die in einer bestimmten Entfernung zum Spieler vorkommen könnten, in den VRAM geladen. Zum Teil weiß die Engine nicht einmal, was sich z.B. hinter einer Tür befindet, bis diese erreicht wird, weil die Tür in Spiellogik ein Portal in einen ganz anderen Bereich der Map ist. Aber selbst in Spielernähe offenliegende, nicht sichtbare Texturen werden bei knappem Speicher nicht vorrätig gehalten. Das ist einer der Gründe, warum Raytraycing, den Speicherbedarf steigert: Auf einmal muss auch geprüft werden können, was sich hinter der Spielfigur befindet. Ohne RT- oder Planar-Reflections dagegen hätte die Engine 10, 20, 30 Frames Zeit, um nur hinter dem Spieler befindliche Informationen nachzuladen, denn niemand spielt auf Einstellungen bei denen er nur 1, 2, 3 Frames während einer 180°-Drehung angezeigt bekommt.

Dein Hinweis, dass bestimmte Daten auch mehrmals pro Frame geladen werden müssen und deswegen die Transferrate passend zur Rechenleistung passen sollte, stimmt natürlich trotzdem. Ich habe bewusst einen Extremfall konstruiert, in dem jedes Mal ander Informationen geladen werden, also im Umkehrschluss entweder jedes Pixel komplett andere Texturen/Texturabschnitte nutzt und sich gar nichts wiederholt oder aber Wiederholungen in der Rechenlogik so dicht beieinander liegen, dass sie komplett vom Cache abgedeckt werden. Wenn man in Novigrad steht und die gleiche Holztextur an dutzenden Häusern, Ständen, etc. auftaucht, kann es auch gut sein, dass hinter 6 GiB ladbaren Daten pro Frame nur 2 oder 3 GiB genutzter VRAM stehen. Zuuuufällig nutzt die Originalversion von Witcher 3 mehr VRAM überhaupt nicht. Dafür sind dann aber eben selbst 8 GiB VRAM schon großzügig dimensioniert und 16 GiB erst recht überflüssig.

Zusätzlich zu "Rechenleistung pro Transferrate" und "Transferrate pro Speichergröße" kann man da als dritten Faktor also Rechenleistung pro Speichergröße ableiten. Mit 2,75 kFlop/s pro Byte steht die RTX 4060 Ti 8 GiB hier deutlich schlechter im Futter als die RTX 4090 mit 3,44 kFlop/s pro Byte. Sie muss also allgemein viel kleinere Brötchen backen und könnte in gut zur RTX4090 passenden Spielen nicht mehr Speichertransferrate ausreizen, aber erst recht nicht mehr Speicher. Eigentlich müsste man sie nach dieser Metrik maximal mit 6 GiB anbieten.

Aber: Während sinnvolle Speichergröße und Speichertransferrate für eine gegebene Framerate in einem recht festen Verhältnis zu einander stehen, ist Rechenleistung ein abgekoppeltes Thema, unter anderem nur durch Caching. Komplexe Shader oder gar Raytraycing verschlingen sehr viel Rechenleistung, bewegen aber überwiegend Daten auf der GPU. Große Texturen dagegen brauchen viel Platz und Transferrate, aber kaum Rechenleistung. Wie @PCGH_Raff nicht müde wird zu betonen, sind gute Texturen daher ein verdammt gutes Mittel, um ohne großartige zusätzliche GPU-Last ein viel schöneres Bild zu zaubern – wenn man genug Speicher und Speichertransferrate hat.* Umgekehrt kann man ein Bild mit Raytraycing in hoher Qualität aufwerten, wenn man nur noch überschaubare Reserven beim Speicher hat oder das Spiel halt schlichtweg keine detaillierteren Daten bereitstellen kann. Genau das wird einer RXT 4060 Ti aber eben viel seltener passieren als einer RTX 4090 mit einer viermal so hohen Rechenleistung.

Das Nvidia hier das gleiche Verhältnis aus Rechenleistung und Speichertransferrate gewählt hat, bedeutet, dass sie im Prinzip eine Raytraycing-Karte für ein Viertel der Rechenlast eines RTX-4090-RT-Setups bauen. Also für 60 Fps bei Nutzung von DLSS-Performace mit 720p Ausgabe- gleich 360p-Renderauflösung. Ich kann dir versichern: So wird niemand die Karte nutzen wollen. Stattdessen würde man normalerweise bei so einer Einsteiger(-zum-Oberklasse-Preis)-Karte die Rechenlast durch Reduktion von Einstellungen senken, aber die Texturqualität nach Möglichkeit beibehalten. Insbesondere wenn es eine Ausführung mit 16 GiB gibt! Nur rennt man halt knallhart ins Transferratenlimit, weil man z.B. ein Viertel der für RTX-4090-Spieler typischen GPU-Last mit der Hälfte von deren Speichertransferbedarf kombinieren müsste, um näherungsweise die zwei Drittel VRAM auszunutzen. Und das geht nicht, wenn man nur ein Viertel der Speichertransferrate hat. Dann müsste man auch auf ein Viertel VRAM-Nutzung runter, also 6 GiB statt 16 GiB.



*: Früher gingen beide Speichertransferrate und -größe wegen kleiner Chips und relativ hoher Taktraten automatisch Hand in Hand. Eine Geforce 4600 hat beispielsweise 80 GiB/s pro GB VRAM, eine Geforce 460 deren 86 bis 116, eine Radeon 460 (2GB) genauso wie eine Geforce 2080 Ti immerhin noch 56 GiB/s pro GB VRAM. Mittlerweile läuft die Schere wegen immer schmalerer Interfaces aber deutlich auseinander. Eine 4090 ist auf 42 GiB/s pro GB runter, eine 4060 Ti mit 8 GiB hätte 36 GiB/s*GB, eine 16-GiB-Version 18 GiB/s*GB. Das ist man bald auf dem Niveau von so legendär-ausgewogenen Karten wie der Geforce 430 mit 2 GiB (12,8 GiB/s*GB).
 
Zuletzt bearbeitet:
Es werden nicht einfach alle Daten, die in einer bestimmten Entfernung zum Spieler vorkommen könnten, in den VRAM geladen. Zum Teil weiß die Engine nicht einmal, was sich z.B. hinter einer Tür befindet, bis diese erreicht wird, weil die Tür in Spiellogik ein Portal in einen ganz anderen Bereich der Map ist. Aber selbst in Spielernähe offenliegende, nicht sichtbare Texturen werden bei knappem Speicher nicht vorrätig gehalten. Das ist einer der Gründe, warum Raytraycing, den Speicherbedarf steigert: Auf einmal muss auch geprüft werden können, was sich hinter der Spielfigur befindet. Ohne RT- oder Planar-Reflections dagegen hätte die Engine 10, 20, 30 Frames Zeit, um nur hinter dem Spieler befindliche Informationen nachzuladen, denn niemand spielt auf Einstellungen bei denen er nur 1, 2, 3 Frames während einer 180°-Drehung angezeigt bekommt.
Gut, es gibt da sicher Abstufungen. Weitläufige Open-World-Spiele funktionieren da anders als eher abschnittbasierte Spiele und ich kann da natürlich auch völlig falsch liegen, aber für mich klingt es nicht wahrscheinlich, dass jedes Mal, wenn sich der Spieler dreht, ein Großteil des Inhalts des VRAMs ausgetauscht wird. Würde dann nicht auch die Bandbreite zum Hauptspeicher eine viel größere Rolle spielen? In vielen Spielen ist auch die VRAM-Belegung höher als die des RAMs. Ich würde den Mehrverbrauch durch Raytracing eher darauf schieben, dass da allerhand Daten anfallen, die auch vorgehalten werden müssen. Im Endeffekt bildet sich ja über die Zeit so was wie eine zusätzliche statistische Textur auf alle Objekte.
Dein Hinweis, dass bestimmte Daten auch mehrmals pro Frame geladen werden müssen und deswegen die Transferrate passend zur Rechenleistung passen sollte, stimmt natürlich trotzdem. Ich habe bewusst einen Extremfall konstruiert, in dem jedes Mal ander Informationen geladen werden, also im Umkehrschluss entweder jedes Pixel komplett andere Texturen/Texturabschnitte nutzt und sich gar nichts wiederholt oder aber Wiederholungen in der Rechenlogik so dicht beieinander liegen, dass sie komplett vom Cache abgedeckt werden. Wenn man in Novigrad steht und die gleiche Holztextur an dutzenden Häusern, Ständen, etc. auftaucht, kann es auch gut sein, dass hinter 6 GiB ladbaren Daten pro Frame nur 2 oder 3 GiB genutzter VRAM stehen. Zuuuufällig nutzt die Originalversion von Witcher 3 mehr VRAM überhaupt nicht. Dafür sind dann aber eben selbst 8 GiB VRAM schon großzügig dimensioniert und 16 GiB erst recht überflüssig.
Und dann ist da noch die Frage, wie viel vom zugewiesenen Speicher wirklich aktuell verwendet wird und was da an die Tools zurückgegeben wird. Ist der belegte Wert eher vergleichbar mit dem zugesicherten RAM vom z.B. Taskmanager oder ist der RAM, der auch abseits von Caching noch frei ist. Wird überhaupt VRAM für Caching in einer ähnlichen Form verwendet und wenn ja, ist dafür der Treiber oder die Anwendung zuständig?
Zusätzlich zu "Rechenleistung pro Transferrate" und "Transferrate pro Speichergröße" kann man da als dritten Faktor also Rechenleistung pro Speichergröße ableiten. Mit 22 kFlop/s pro Byte steht die RTX 4060 Ti 8 GiB hier deutlich schlechter im Futter als die RTX 4090 mit 3,44 kFlop/s pro Byte. Sie muss also allgemein viel kleinere Brötchen backen und könnte in gut zur RTX4090 passenden Spielen nicht mehr Speichertransferrate ausreizen, aber erst recht nicht mehr Speicher. Eigentlich müsste man sie nach dieser Metrik maximal mit 6 GiB anbieten.
Dir ist da ein Komma verrutscht, nehme ich an, aber auch so komme ich auf 2,75 gegen 3,44. Sind zwar auch noch 25%, aber insgesamt bleibt die 4060Ti, wie sie jetzt angenommen wird, eine mehr oder weniger genau gedrittelte 4090 und ich finde die 8GB da persönlich auch absolut angemessen und bin da prinzipiell auch deiner Meinung, was die Bestückung im Verhältnis zur Leistung angeht. Ich denke, dass mehr Speicher bei irgendwelchen ausufernden High-Res-Mods oder den letzten zwei bis drei Schritten der Texturqualität bei beispielsweise einem aktuellen Resident Evil helfen kann, die schon absurd große Mengen Speicher belegen, aber in den meisten Anwendungsfällen einfach leer bleiben wird, weil die meisten Einstellungen in den meisten Spielen eben doch zusätzlich zum Speicher auch Rechenleistung brauchen.
Aber: Während sinnvolle Speichergröße und Speichertransferrate für eine gegebene Framerate in einem recht festen Verhältnis zu einander stehen, ist Rechenleistung ein abgekoppeltes Thema, unter anderem nur durch Caching. Komplexe Shader oder gar Raytraycing verschlingen sehr viel Rechenleistung, bewegen aber überwiegend Daten auf der GPU. Große Texturen dagegen brauchen viel Platz und Transferrate, aber kaum Rechenleistung. Wie @PCGH_Raff nicht müde wird zu betonen, sind gute Texturen daher ein verdammt gutes Mittel, um ohne großartige zusätzliche GPU-Last ein viel schöneres Bild zu zaubern – wenn man genug Speicher und Speichertransferrate hat.* Umgekehrt kann man ein Bild mit Raytraycing in hoher Qualität aufwerten, wenn man nur noch überschaubare Reserven beim Speicher hat oder das Spiel halt schlichtweg keine detaillierteren Daten bereitstellen kann. Genau das wird einer RXT 4060 Ti aber eben viel seltener passieren als einer RTX 4090 mit einer viermal so hohen Rechenleistung.

Das Nvidia hier das gleiche Verhältnis aus Rechenleistung und Speichertransferrate gewählt hat, bedeutet, dass sie im Prinzip eine Raytraycing-Karte für ein Viertel der Rechenlast eines RTX-4090-RT-Setups bauen. Also für 60 Fps bei Nutzung von DLSS-Performace mit 720p Ausgabe- gleich 360p-Renderauflösung. Ich kann dir versichern: So wird niemand die Karte nutzen wollen. Stattdessen würde man normalerweise bei so einer Einsteiger(-zum-Oberklasse-Preis)-Karte die Rechenlast durch Reduktion von Einstellungen senken, aber die Texturqualität nach Möglichkeit beibehalten. Insbesondere wenn es eine Ausführung mit 16 GiB gibt! Nur rennt man halt knallhart ins Transferratenlimit, weil man z.B. ein Viertel der für RTX-4090-Spieler typischen GPU-Last mit der Hälfte von deren Speichertransferbedarf kombinieren müsste, um näherungsweise die zwei Drittel VRAM auszunutzen. Und das geht nicht, wenn man nur ein Viertel der Speichertransferrate hat. Dann müsste man auch auf ein Viertel VRAM-Nutzung runter, also 6 GiB statt 16 GiB.

*: Früher gingen beide Speichertransferrate und -größe wegen kleiner Chips und relativ hoher Taktraten automatisch Hand in Hand. Eine Geforce 4600 hat beispielsweise 80 GiB/s pro GB VRAM, eine Geforce 460 deren 86 bis 116, eine Radeon 460 (2GB) genauso wie eine Geforce 2080 Ti immerhin noch 56 GiB/s pro GB VRAM. Mittlerweile läuft die Schere wegen immer schmalerer Interfaces aber deutlich auseinander. Eine 4090 ist auf 42 GiB/s pro GB runter, eine 4060 Ti mit 8 GiB hätte 36 GiB/s*GB, eine 16-GiB-Version 18 GiB/s*GB. Das ist man bald auf dem Niveau von so legendär-ausgewogenen Karten wie der Geforce 430 mit 2 GiB (12,8 GiB/s*GB).
Ja, solange die Anzahl der Pixel, die sich einen Satz Texel teilen, größer als eins ist, stimmt das mit der Bandbreite. Aber ab dem Punkt, wo eine Textur höher auflöst, sollte es egal sein, weil immer aus den passenden Mipmapstufen gelesen wird. Texturen werden ja nur in dem sinnvollen Bruchteil ihrer Auflösung angezeigt, schon weil es sonst fieses Aliasing gäbe. Aber ob dem jetzt so ist oder nicht, ich finde, dass man mit besseren Texturen die Grafik auch nur bis zu einer bestimmten Grenze aufbessern kann und der Gewinn pro Speichermenge nimmt da auch ab. Es ist ja in dem Fall nicht so, dass man ohne eine Verdopplung totalem Texturmatsch ausgesetzt wäre. Die geringere Bandbreite pro Rechenleistung sollte durch die Caches abgefangen werden. Muss natürlich nicht klappen. Aber da kann man lange rechnen und schätzen, am Ende hilft nur testen, was das Ding wirklich kann und wenn man genau wissen will, die knapp die Bandbreite ist, kann man ja einfach mal etwas davon wegnehmen und gucken, was passiert.
 
Raff wird sich dem Thema sicherlich (be)gierig annehmen. :-)
Aber ich erwarte, wie gesagt, keine großen Vorteile für die 16-GiB-Ausführung. Vielleicht mit RAM-OC, gegenüber den aktuellen Werten wären ja durchaus noch 25 Prozent mehr Speichertransferrate bei gleicher Bus-Breite machbar. Zusätzlich/alternativ 50 Prozent mehr Breite draufzupacken wären aber meiner Meinung nach sinnvoller gewesen.

Ob es einem den optischen Mehrwert wert ist, wenn jeder Pixel ein andersfarbiges Texel erhält, ist ein ganz anderes Thema. (!= ein anderes Texel. Eine detailarme Textur kann durchaus viele Texel haben und immer die gleiche Textur zu wiederholen, spart auch Speicherressourcen zulasten der Optik.) Es gibt auch Spiele, die machen in EGA-Qualität Spaß. Aber mir will einfach kein Szenario einfallen, in dem es elementar wichtig wäre, >8 GiB lokal auf der Karte vorrätig zu halten und in dem es gleichzeitig vollkommen ausreicht, 72 mal in der Sekunden <3 GiB lesen zu können. Entweder niedrigere Texturqualität reicht, dann reicht die 8-GiB-Version, oder aber man will 16 GiB Texturen, dann dürften die 288 GB/s knapp werden. Zwar ist es sicherlich ganz nett, z.B. auch Texturen von hinter der Spielfigur und aus dem vorletzten Level cachen zu können. Aber selbst auf PCI-E-3.0-Plattformen dürfte das in den meisten Fällen nicht den Unterschied zwischen spielbar und unspielbar ausmachen.
 
Zurück