AW: Geforce RTX 3000: Ampere-Vorstellung angeblich im März
Bei dem Größenlimit von 400mm² kann Ampere ja nicht mehr Shader als Turing haben [...]
Wie kommst du auf so eine Beschränkung? Aktuell ist ausnahmlos alles zu Ampere Gerüchteküche und es gibt ebensowenig bekannte Die-Größen zu den bevorstehenden Chips (man beachte den Plural). Die für das Xbox-SoC aufgrund der Fotos abgeschätzten 400 mm2 haben nichts mit nVidia zu tun.
TSMC selbst legt seinen Kunden jedenfalls keine derartigen Beschränkungen auf. Beispielsweise der in 7 nm bei TSMC gefertigte
Tomahawk 4 ist ein riesiges, monolithisches Design mit rd. 31 Mrd. Transistoren *). Die tatsächlich verwendete, gemittelte Logikdichte dieses Chips ist unbekannt (wie auch der genau verwendete 7 nm-Prozess), aber geht man von Werten im Bereich von 35 - 60 MTr/mm2 aus, ist das ein Chip mit 886 - 517 mm2.
Abgesehen davon, überträgt man die aktuell mit TSMCs N7 genutzte Logikdichte für Vega 20 und Navi 10 auf den TU102 (RTX 2080 Ti/Titan/Quadro 6000/8000), dann kommt man bereits für einen einfachen Shrink auf min. 454 mm2 und nVidia wird zweifelsfrei nicht nur einfach Turing "recyclen". (Mit dem N7+ könnte man eine leicht gesteigerte Dichte von vielleicht 45 MTr/mm2 annehmen, käme aber auch damit für einen Shrink bereits auf min. 413 mm2.)
*) Das sind mal eben +66 % mehr Transistoren im Vergleich zum große TU102 und immer noch +47 % im Vergleich zu Volta.
Trotzdem passt bei der Reduzierung der Fertigungsgröße von 12 auf 7 nm fast dreimal so viel auf die gleiche Fläche. Man kann definitiv von einem Leistungsgewinn ausgehen.
TU102 ~ 24,7 MTr/mm2 12 nm
TU104 ~ 25,0 MTr/mm2 12 nm
TU106 ~ 24,3 MTr/mm2 12 nm
Vega 20 ~ 40,0 MTr/mm2 7 nm
Navi 10 ~ 41,0 MTr/mm2 7 nm
Zen2 ~ 52,7 MTr/mm2 7 nm *)
Wie man sieht, ist man hier von einer Verdreifachung weit entfernt.
Während AMDs aktuelle Designs TSMCs N7 verwenden, könnte nVidia den N7+ mit vier EUV-Schichten nutzen. Für die AMD-GPU-Designs könnte man damit eine Dichte von etwa 45 MTr/mm2 annehmen. (Dieser Wert muss aber nicht zwingend auf nVidia übertragbar sein, aufgrund architektonischer Unterschiede.)
*) Zum Vergleich das Zen2-Chiplet, dass ebenfalls den N7 verwendet. Man beachte jedoch, dass dessen Logikdichte sich nicht auf ein GPU-Design übertragen lässt, was den deutlich niedrigeren Wert bei AMDs GPUs erklärt. Darüber hinaus zur Vollständigkeit der Hinweis, dass TSMCs N7 in seiner höchsten Dichte etwa bis zu 100 MTr/mm2 realisieren kann. Eine entsprechende High Density-Lib kann jedoch nicht für derartige HighPerformance-Designs verwendet werden.
[...] Für mich spannend bleibt, ob Ampere evntl. doch nur ein eingeschobener Turing Refresh (also < +10%) wird. Da AMD nicht liefert, ist Nvidia nicht unter Druck... kennen wir ja. Ich sehe da große Gefahr, dass Ampere nur zur Außenwirkung gegenüber den Investoren genutzt wird.
Durchaus eine valide Überlegung, aber das kann sich nVidia auch nicht wirklich leisten und an einem neuen Design entwickelt man eingie Jahre, d. h. nVidia wird nicht mal eben Ende des Jahres was Neues nachschieben können, wenn die Konkurrenz mehr Druck aufbaut.
In Anlehnung an DKK007 kann man hier durchaus schon von einer relevant überarbeiteten Architektur ausgehen. Für AMD ist ein Update (auch bei den Profi-Karten) überfällig und nun kommt auch noch Intel in den Markt. Gerade letztere kann man aufgrund der noch unzureichenden Informationen nur schwer einschätzen, aber von
Ponte Vecchio weiß man bereits, dass es ein massiv-paralleles Design ist, das 16 eigenständige Chips auf einer Karte zusammenfasst und deren
Xe-Architektur scheint grundsätzlich auf ein MCM-Design ausgelegt zu sein, sodass man hier (zumindest vorerst theoretisch) deutlich einfacher skalieren können wird, als in der Vergangenheit mit monolithischen Dies. Hier wird man abwarten müssen.
Darüber hinaus hat nVidia zumindest bei den HighEnd-Consumer-Karten durchaus einige Kritik aufgrund des Preises wegzustecken (gehabt) und hier kann man es sich nun vertriebstechnisch zudem nicht noch ein weiteres Mal leisten, bspw. den Preis beizubehalten, aber nur magere +10 % mehr Leistung zu bieten. Ich würde hier auch einen deutlichen Zugewinn erwarten, wenn auch möglicherweise der Großteil davon sich nur auf die Raytracing-Funktionalität beschränkt. Selbst mit einer nur mäßigen, architektonischen Aufwertung in Verbindung mit dem beträchtlichen Fertigungssprung darf man hier durchaus einiges erwarten.
Ich freue mich auf jeden Fall. Die RTX 2000er wollte ich als Early-Adopter nicht mitnehmen, aber mit dem was nun im 2HJ20 erscheinen wird, erscheint dann doch mal wieder ein Upgrade fällig, entweder von nVidia oder AMD und bis dahin wird sich hoffentlich auch schon Intels Roadmap bzgl. der GPUs verdichtet haben, sodass man auch abschätzen können sollte, ob es sich ggf. lohnt noch ein paar Monate länger zu warten? Rosige Zeiten.
Im dümmsten Fall gibts dann zweierlei RT in den Games.
1x light für AMD und 1x heavy für NV.
Das gibt es jetzt schon, einmal für nVidia und einmal für ... nVidia

Nichts anderes bieten die Raytracing-Optionen in den aktuellen Games, die die verfolgten Strahlen reduzieren und ggf. einige Strahlarten bei Bedarf deaktivieren, denn irgendwie muss ja die Spanne von der RTX 2060 bis zur RTX 2080 Ti abgedeckt werden.
Schlussendlich wird aufgrund der beschränkten Leistung grundsätzlich mit zu wenig Strahlen gearbeitet *), sodass eine nachträgliche Filterstufe erst einen ansehnlichen Mehrwert schafft. Auch das heutige Echtzeitraytracing ist weiterhin viel Trickserei, schafft es aber bei korrekter Anwendung durchaus, einen beträchtlichen Mehrwert und in Einzelfällen gar einen Wow-Effekt zu schaffen. (
Schlussendlich zu beachten bleibt aber auch, dass es am Ende nur ein grafischer Effekt ist, i. d. R. spieltechnisch irrelevant und auch (zumindest für mich) niemals in der Lage ist, eine dünne Story, dumme Dialoge oder halbgare Game-Mechanik zu kompensieren.)
*) Im Vergleich zu echtem Raytracing, bekannt aus 3D-Applikationen, prominent z. B. in Form des mit
really Real-World-Workloads wenig zu tun habenden Cinebench.

Wenn eine vielkernige CPU im R20 hier die Testszene in der vorgegebenen Qualität in vielleicht 30 s zu rendern schafft, könnte man dass auf einer Quadro RTX 6000 vielleicht im besten Fall auf 3 s reduzieren, was aber immer noch einer Bildrate von 0,3 Fps entsprechen würde mit "vollständigem, hochqualitativem Raytracing".