News Nvidia Geforce RTX 5000: Hinweise auf den Fertigungsprozess von "Ada Lovelace Next"

Darf man erst etwas 3nm nennen, wenn es 3,0nm sind, oder sind nicht auch schon 3,9nm technische gesehen 3nm. Selten ist der Chip auch über die ganze Fläche identisch in seiner Dichte. Wieviel Prozent des Chips müssen jetzt 3nm haben und wieviel Prozent können auch nur 5nm haben? Solche Schummeleien sind halt leider an der Tagesordnung.

Wenn man sich ansieht mit welcher Dichte an Transistoren TSMC wirbt, ist es oft so, dass die großen Nvidia Chips tendentiell 20% weniger Transistordichte haben, als das was TSMC für den Prozess als normale ausgibt. Das ist letztlich auch die große Fläche der Chips und die damit einhergehende Hitzethematik. Dem Ergebnis tut das keinen Abbruch bei Nvidia.

Es sieht aus, dass man gegenüber RTX40 locker +30% für alle Serien (90, 80, 70, 60) bieten kann und dabei durch die Bank kleinere Chips haben wird, die trotz höheren TSMC Preisen unter dem Strich billiger sein werden. Wenn es sich bewahrheitet, dass bei gleicher Chipgröße bis zu 60% an Mehrleistung anfallen, dann kann Nvidia das ganz locker angehen. 5090 mit +30% gegenüber der 4090 und später einer 5090Ti mit +60% gegenüber der 4090 trau ich Nvidia locker zu als Strategie.

4070Ti wird zur 5070, die 4080 wird zur 5070Ti, auch das würde in diese 30% und 60% Skalierung passen. Die 5080 geht Richtung 4090 und alle Serien haben bereits jetzt eingeführte Preispunkte von denen sich Nvidia nicht wegbewegen muss und es sieht auch nicht danach aus, dass von AMD und Intel besonders viel Druck auf 5070 und größer kommt. Wenn man sich nicht für die Leistung der 5090 begeistern kann, dann erwartet wohl gepflegte Langeweile und Nvidia wird es nicht eilig haben die Preise der jetzigen Karten mit einer neuen Generation zu unterbieten.
 
Darf man erst etwas 3nm nennen, wenn es 3,0nm sind, oder sind nicht auch schon 3,9nm technische gesehen 3nm. Selten ist der Chip auch über die ganze Fläche identisch in seiner Dichte. Wieviel Prozent des Chips müssen jetzt 3nm haben und wieviel Prozent können auch nur 5nm haben? Solche Schummeleien sind halt leider an der Tagesordnung.

Man darf es nennen wie man möchte, da es dort keine Normal gibt. Du kannst 10nm auch 2nm nennen oder 50nm. Es ist auch schon länger so, dass die Namen bzw. nm Angaben nichts mehr mit der Realität zu tun haben. Am Ende muss man einfach die aktuellen Technologien von TSMC, Intel und Samsung vergleichen und dann schauen wie dieses hinsichtlich Performance und Effizienz abschneiden. Was die Hersteller da auf das Verfahren drauf schreiben, ist eigentlich egal.

Intel ist ja quasi immer noch in seinem 10nm Verfahren...
 
es sind leider weiterhin 5nm, trotz des Namens
In dem Falle sind es 4nm, keine 5nm. *) Genaugenommen hat man immer noch keine gesicherte Aussage zu nVidias 4N bei Lovelace/Hopper. Hier gab es selbst bis vor wenigen Monaten immer noch ein Hin-und-Her ob 5nm oder 4nm und immer wieder widersprüchliche Aussagen.
Schlussendlich werden sie aber absehbar eine sinnvolle Wahl getroffen haben. Die Hopper-NextGen verbraucht nur überschaubar mehr, legt leistungstechnisch überproportional zu und ist damit abermals deutlich effizienter und das bei einem überschaubaren Mehraufwand bei TSMC, indem man vermutlich mit einem 4nm-Äquivalent auskommt ohne auf die deutlich teueren 3nm wechseln zu müssen.
Geht man davon aus, dass ein marignaler Wechsel von damals einer N4-Basis (bei Lovelace) auf nun etwas wie einen N4P (bei Blackwell) eher zu geringe Zugewinne geliefert hätte, kann man mit einer vorsichtigen Vermutung unterstellen, dass der damalige 4N tatsächlich eine N5-Basis hat(te) und der nun genutzte 4NP eine N4(xy)-Basis, vermutlich mindestens den N4P. Denkbar wäre gar auch ein N4X-Derivat, aber letzten Endes ... man weiß es schlicht nicht! Bisher alles nur Spekulatius, da man nicht sagen kann, ob nVidia das "P" in seinem Custom-Namen zum Spaß, zur Verwirrung oder aus sonst welchen Gründen trägt und man damit bestenfalls vermuten kann, dass dieser Buchstabe auf den N4P verweisen soll. Vielleicht heißt auch einfach der verantwortliche Lead-Prozessdesigner bei Nvidia Petersen mit Namen?

*) Der N4P ggü. dem ursprünglichen N5 bietet -22 % Power Savings, +11 % mehr Performance, bis zu -6 % Flächenverkleinerung beim Logikdesing.
Wie nVidia den konkret nutzt beeinflusst aber bspw. in weitem Rahmen was am Ende herauskommt. Beispielsweise i. V. z. Hopper nimmt die Logikdichte des Designs von grob gemittelten 97 MTr/mm auf etwa 125 MTr/mm zu, d. h. es kann mit dem Prozess im Mittel beträchtlich dichter gepackt werden (trotz des vergleichsweise hohen SRAM-.Anteils).
Und deutlich effizienter ist das Design offensichtlich auch noch. Zudem bleibt unklar, wie viel Anteil hieran die ML-basierte Entwicklung mittels cuLitho trägt, denn auch deren erstmalige, vollumfängliche Nutzung könnte zu einem deutlich effizienteren Design geführt haben.

Bezüglich dem Consumer-Desing muss man einfach abwarten. Selbst mit dem gleichen Prozess 4NP könnte das Design beträchtlich zulegen. Darüber hinaus sind die 3nm aber hier für die (oder auch nur das) Top-Die(s) immer noch nicht zwingend vom Tisch, denn aktuell weiß es schlicht niemand und es gibt keine belastbaren Aussagen dazu.
Beim B100 brauchte nVidia so viel Fläche, dass ein 2-Die-Design anscheinend zwingend erforderlich war und das wäre in 3nm noch einmal beträchtlich teuerer geworden (und dann ist da noch die Frage nach den 3nm-Kapazitäten).
Wenn nVidia sich im Consumer-Space nun aber für ein effizientes monolithisches Design (anstatt eines MCMs; zur Vermeidung von Packaging-Engpässen) entschieden hat, ist bisher weiterhin nicht ausgeschlossen, dass die oberen ein oder zwei Dies ggf. einen 3nm-Node nutzen. Die Frage ist halt wie viel Leistungszugewinn nVidia für das Design für nötig hält und ob sich das sinnvoll mit dem 4NP und der Anwendung von cuLitho abbilden lässt. Wenn nicht, dann werden sie möglicherweise doch 3nm nutzen. Da Blackwell aber angeblich einen deutlichen architektonsichen Umbau erfahren soll, kann man schwer einschätzen, was der bereits an Leistungszugewinnen beisteuern kann. Vielleicht kann nVidia auch hier die teueren 3nm vorerst vermeiden?

Aktuell ist es schlicht das übliche Spiel ... Leaker, die sich produzieren wollen und Medien, die selbst aus kleinsten Informationsschnipseln klick- und bewerbbare "News" generieren ...


**) Ergänzend, den letzten diesbezüglichen Meldungen zufolge hat nVidia signifikante Kapazitäten bei TSMC in 4nm und auch 3nm gebucht. Wenn jetzt das HPC/AI-Topdesign ein 4nm-Derivat nutzt, darf man erst mal weiterspekulieren, wofür nVidia diese 3nm-Kapazitäten benötigen wird. Möglicherweise ist mir etwas in der Keynote entgangen, jedoch kann ich mich nicht erinnern, dass einer der zusätzlichen Chipdesigns der Blackwell-Plattform, so bspw. BlueField oder NVLink, mit 3nm in Verbindung gebracht wurden ...
(Wobei zu beachten ist, dass das keinesfalls irgendwas belegt aber zumindest Fragen aufwirft, so auch bzgl. der nun vermeintlichen Feststellungen (ohne eine Aussage von nVidia dazu), dass sich auch das Consumer-Design ausschließlich auf den 4NP stützen muss.)
 
Zuletzt bearbeitet:
Erwartet jemand eine 5080, die eine 4090 ersetzt?

Ich bin gespannt, welche weißen Karnickel und mathematischen- sowie ekonomischen Zauberformeln Nvidia diesmal wieder vorführen wird.

"2.5x more performance than predecessor"
"The more you buy, the more you save"
 
Erwartet jemand eine 5080, die eine 4090 ersetzt?

Ich bin gespannt, welche weißen Karnickel und mathematischen- sowie ekonomischen Zauberformeln Nvidia diesmal wieder vorführen wird.

"2.5x more performance than predecessor"
"The more you buy, the more you save"

Ja, warum auch nicht?

1710882749552.png


Die 4080 hat die 3090ti schon stark übertroffen.

1710882817006.png


Und davor hat die 3080 die 2080ti übertroffen.

Ich vermute weiterhin dass die "80er" Karte das vorherige Topmodell überflügelt. Die Evidenz spricht dafür.
 
Ja, warum auch nicht?

Anhang anzeigen 1455767

Die 4080 hat die 3090ti schon stark übertroffen.

Anhang anzeigen 1455768

Und davor hat die 3080 die 2080ti übertroffen.

Ich vermute weiterhin dass die "80er" Karte das vorherige Topmodell überflügelt. Die Evidenz spricht dafür.
? Du meinst die Evidenz, dass die 5080 48 SMs und 128 bit Memory-bus weniger hat als die 4090?


Diese Evidenz?
 
? Du meinst die Evidenz, dass die 5080 48 SMs und 128 bit Memory-bus weniger hat als die 4090?


Diese Evidenz?

Bei Gerüchten sprichst Du von Evidenz? Alternative Fakten oder wie? Die 5080 hat noch garnichts...

Die bisherigen Daten aus mehreren Generationen sprechen dafür dass die 5080 die 4090 schlagen wird. Sollten die Gerüchte stimmen, dann wäre z.B. auch eine 5080 mit teildefektem GB202 möglich.
 
Das müssten halt ziemlich deutliche Verbesserungen an der Architektur sein, der Prozess gibt das halt nicht her, wenn AMD auf N3P setzt sind sie wieder so nahe dran wie damals zu RDNA2 vs Ampere Zeiten, wo AMD auch einen Node vorne war.

N5
vs
N7
N5P
vs
N5​
N5HPC
vs
N5​

N4
vs
N5​

N4P
vs
N5​
N4P
vs
N4​
N4X
vs
N5​
N4X
vs
N4P​
N3
vs
N5
Power
-30%​
-10%​
?​
lower​
-22%​
-​
?​
?​
-25-30%​
Performance
+15%​
+5%​
+7%​
higher​
+11%​
+6%​
+15%
or
more​
+4%
or more​
+10-15%​
Logic Area

Reduction %

(Density)
0.55x

-45%

(1.8x)​


-​


-​
0.94x

-6%

1.06x​
0.94x

-6%

1.06x​


-​


?​


?​
0.58x

-42%

(1.7x)​
Volume
Manufacturing
Q2 2020​
2021​
Q2 2022​
2022​
2023​
H2 2022​
H1
2024?​
H1 2024?​
H2 2022​

Quelle: https://www.anandtech.com/show/18875/tsmc-details-n4x-extreme-performance-at-minimum-leakage


Nicht wirklich.
Von der anderen "größte Performance-Sprung der Geschichte" News zu "wir bleiben beim gleichen Prozess" ist es eigentlich ziemlich ernüchternd.
Betrachtet man N4 vs N4P wird die Änderung ähnlich groß ausfallen wie bei Nvidias Spezialversionen, also 6% mehr Takt, über Transistordichte und Co ist nicht wirklich was klar. Man kann natürlich mehr als 6% draus machen, weil man den Prozess nun gut kennt. Und weil man die Architektur ändern wird. Aber wirklich große Sprünge würde ich nicht erwarten, das kommt dann mit N3P oder falls man das überspringt mit dem Blackwell-Nachfolger mit N2P (oder evtl einer Intel Produktion?)
Ich weiß, das habe ich tatsächlich unterstellt ( relativ deutliche architektonische Verbesserungen )
 
In dem Falle sind es 4nm, keine 5nm.
AFAIR nutzt TSMC keine komplett neuen Transistoren sondern ein verbessertes "Design" des 5nm Nodes (deshalb nennen sie es ja 5nm class, sowohl N4P als auch N4X), kann mich aber natürlich irren.
Dann ist halt die Frage was ist
N4
4N
N4P
4NP bzw. die konkreten Unterschiede.
Mein ursprünglicher Gedanke ist: rein von der Fertigung wird man nicht besonders viel rausholen, da muss schon mehr kommen.
Siehe meine Tabelle hier https://extreme.pcgameshardware.de/...s-von-ada-lovelace-next.647184/#post-11568159

Es ist ja nicht klar wie viel Unterschied der 4N zum 4NP wirklich hat. Selbst wenn der Unterschied ebensogroß wäre wie N5 zu N4P sind spürbare, aber immer noch überschaubare Unterschiede, ist der vorige Prozess von Nvidia dem N4 ähnlicher als dem N5 sind die +6% eh irrelevant. Das meiste wird vom Design kommen müssen, falls sich der Prozess bestätigt (wär für mich egal, dann warte ich halt auf AMD oder die Geforce RTX 6xxx)
 
Bei Gerüchten sprichst Du von Evidenz? Alternative Fakten oder wie? Die 5080 hat noch garnichts...

Die bisherigen Daten aus mehreren Generationen sprechen dafür dass die 5080 die 4090 schlagen wird. Sollten die Gerüchte stimmen, dann wäre z.B. auch eine 5080 mit teildefektem GB202 möglich.
Abwarten.

Wenn die Gerüchte sich annährend bewahrheiten, dann wird das aber sehr unwahrscheinlich.

OK, Videocardz vergleicht ja den Graphik-Chip und nicht den verbauten Chip auf der GraKa später. Daher kommen die auch auf noch höhere SM counts und L2 caches, als sie nachher auf den entsprechenden Karten zu finden sind.


5080, 4 nm process? (TSMC 4NP), ??? GHz, (96)? SMs, 256-bit memory bus
4090, 5 nm process (TSMC 4N), 2,74 GHz, 128 SMs, 384-bit memory bus

4080, 5 nm process (TSMC 4N), 2,78 GHz, 76 SMs, 256-bit memory bus
3090 Ti, 8 nm process (Samsung 8N), 1,98 Ghz, 84 SMs, 384-bit memory bus

3080, 8 nm process (Samsung 8N), 1,89 GHz, 68 SMs, 320-bit memory bus
2080 Ti, 12 nm FinFET (TSMC), 1,78 GHz, 68 SMs, 352-bit memory bus
(müsste man dann hier nicht richtiger Weise die Titan RTX zum Vergleich als Vollausbau Top-Modell nehmen?)
Titan RTX, 12 nm FinFET (TSMC), 1,97 GHz, 72 SMs, 384-bit memory bus

Wie man erahnt, soll der SM-Unterschied diesmal signifikant ausfallen, bei moderatem Node-jump.
Der bus-Unterschied wurde bisher entweder mit einem ordentlichen Mehr an Takt kompensiert, oder war so gering, dass ein kleines Taktplus im Zusammenspiel mit Node-shrink ausreichte.

Das würde jetzt aber bei den 50ern mit dieser Konfiguration sportlich. So einen großen SM-Unterschied, zusammen mit der ordentlichen Bus-Differenz ... was will man machen? 3,6 Ghz rauskitzeln?
 
Zuletzt bearbeitet:
Je größer die Lücke zwischen 5090 vs 5080 um so besser.

Weil die 5080 dann billiger wird, was die Sparfüchse gefällen wird und sich gleichzeitig die Enthusiasten klar auf die Seite der 5090 schlagen können, und sich dort dann auch ohne Zweifel mit voller $,€-Kraft austoben können, worüber sich Nvidia auch freuen wird.
Ne ne, billicher wird nüschte. Der 5090 Preis wird angepasst (und zwar nach oben) damit der Abstand wieder passt,
und mehr Scheinchen auf dem Tisch landen.
Oder die nennen das Ding 5090 16GB und wollen 1600 für hamm.
Dann wird dat Dingens doch eher 32 wenn nicht sogar 48 GB haben (bzgl. 3200 / 4800 €).
 
Zuletzt bearbeitet von einem Moderator:
Ich vermute weiterhin dass die "80er" Karte das vorherige Topmodell überflügelt. Die Evidenz spricht dafür.
Möglich ist es natürlich, aber man sollte auch beachten, dass wir hier nur von Erfahrungswerten sprechen. Einstmals bewegte sich eine RTX 3070 auch auf RTX 2080 Ti-Niveau und das hatte durchaus Tradition, schon eine GTX 1070 bot grob GTX 980 Ti-Leistung. Die RTX 4070 hat es aber trotzdem nicht mehr auf das Level des Spitzenmodells der Vorgängergeneration geschafft.
Je größer die Lücke zwischen 5090 vs 5080 um so besser.

Weil die 5080 dann billiger wird, was die Sparfüchse gefällen wird und sich gleichzeitig die Enthusiasten klar auf die Seite der 5090 schlagen können, und sich dort dann auch ohne Zweifel mit voller $,€-Kraft austoben können, worüber sich Nvidia auch freuen wird.
Dass die Lücke zwischen 4080 und 4090 so groß ist, hat den Preisen der 4080-Karten ja auch total geholfen. Ist ja nicht so, dass sie nicht trotzdem weit im vierstelligen Bereich rangieren, je nach Modell.

Grundsätzlich bedeutet eine große Lücke mitnichten, dass der Preis der kleineren Karte attraktiv sein wird, nicht umsonst galt die RTX 4080 zum Launch als reiner Preisleistungsunfall. Und für "Sparfüchse" ist keine dieser Karten geeignet, so oder so :D

Das ist schon so oft von so vielen Leuten gebracht worden: 4N ist NICHT N4, sondern N5.
TSMC selbst hat klargestellt, dass 4N auf N5 basiert, nicht auf N4.
4N -> customisierter N5
4NP -> customisierter N4P
Wie dem auch im Detail sei, mehr als ein Half-Node-Schritt kommt diesmal nicht. Ein spektakulärer Fertigungsschritt sieht anders aus. Allerdings hat Nvidia durchaus schon früher gezeigt, dass sie auch auf demselben Node eine sehr viel stärkere und effizientere Architektur aufsetzen können - man denke etwa an den Schritt von Kepler auf Maxwell, die beide in 28nm gefertigt wurden.
 
Abwarten.

Wenn die Gerüchte sich annährend bewahrheiten, dann wird das aber sehr unwahrscheinlich.

OK, Videocardz vergleicht ja den Graphik-Chip und nicht den verbauten Chip auf der GraKa später. Daher kommen die auch auf noch höhere SM counts und L2 caches, als sie nachher auf den entsprechenden Karten zu finden sind.


5080, 4 nm process? (TSMC 4NP), ??? GHz, (96)? SMs, 256-bit memory bus
4090, 5 nm process (TSMC 4N), 2,74 GHz, 128 SMs, 384-bit memory bus

4080, 5 nm process (TSMC 4N), 2,78 GHz, 76 SMs, 256-bit memory bus
3090 Ti, 8 nm process (Samsung 8N), 1,98 Ghz, 84 SMs, 384-bit memory bus

3080, 8 nm process (Samsung 8N), 1,89 GHz, 68 SMs, 320-bit memory bus
2080 Ti, 12 nm FinFET (TSMC), 1,78 GHz, 68 SMs, 352-bit memory bus
(müsste man dann hier nicht richtiger Weise die Titan RTX zum Vergleich als Vollausbau Top-Modell nehmen?)
Titan RTX, 12 nm FinFET (TSMC), 1,97 GHz, 72 SMs, 384-bit memory bus

Wie man erahnt, soll der SM-Unterschied diesmal signifikant ausfallen, bei moderatem Node-jump.
Der bus-Unterschied wurde bisher entweder mit einem ordentlichen Mehr an Takt kompensiert, oder war so gering, dass ein kleines Taktplus im Zusammenspiel mit Node-shrink ausreichte.

Das würde jetzt aber bei den 50ern mit dieser Konfiguration sportlich. So einen großen SM-Unterschied, zusammen mit der ordentlichen Bus-Differenz ... was will man machen? 3,6 Ghz rauskitzeln?

Und jetzt sagst Du "Abwarten"? Schon witzig, vorher waren die Gerüchte noch Fakten und ICH war derjenige der auf "ungelegte Eier" hingewiesen hat...

Samsung 8N ist übrigens ein 10nm Prozess, kein 8nm Prozess.

Warum gehst Du von einer 5080 mit GB203 aus? Gibt es dazu Leaks? Eine 80er mit "202" Chip gab es bei Ampere, bei Ada war es der "203". Beides ist also möglich.

Der Speicher Bus ist dieses Mal nicht so einfach vergleichbar sollte sich GDDR7 bewahrheiten.
 
Ich bin mal gespannt in welchen Games der größere L1 hilft, ... may be auch breitere Register, um das Bottleneck in Starfield in den Griff zu bekommen?

bei den kleineren Modellen wirds sicher wieder ne Geschmacksfrage, ob man sich mit 256/192bit ...
ne "zukunftssichere" Hardware für teure Euros zulegt
(könnte mit 3GB-Modulen nicer ausssehen als bisher)
 

Anhänge

  • CitiesSkyline@4k.JPG
    CitiesSkyline@4k.JPG
    62,1 KB · Aufrufe: 20
Zuletzt bearbeitet:
Zurück