Nun was sollte ne 80er karte kosten also angefangen bei nen kommenden gb104 chip (+- 216$) kommt da mit gddr7 28gbps an einen 256bit si auf 999€
Das währen dann ne sku mit 6 gpc je 18 sm die zu je 148 fp32 agiert (gb104) davon aktiv 96sm = bei 2,6ghz +-73tf vs rtx4080 +97% das wäre sicherlich ne rtx5090 +15% vs rtx4090, aber ich kenne nvidia und die werden sicherlich den gb106 nutzen mit nur 4 gpc =72sm chipkosten um die 136$ mit gleicher Sorgfalt aber deutlich billigeren Komponenten dann sku möglich ab 849€ und etwa 66 bis 70sm aktiv = 50,8tf vs rtx4080 dann + 35%.
Derzeit ad102 kostet etwa 183$ und leistet etwa reale 63tf cut und Vollausbau mit 142sm etwa 69tf
ja der Mittelklassen chip wir den high end schlagen aber sehr teuer sein.
Der gb102 vermutlich um die 789mm² kostet min 400$ und wird mit Sicherheit nur als quadro kommen
In der rtx4080 werkelt die Ausnahme ad103 mit chipkostem um die 108$ Sku umsetzbar bei etwa 789€
Das dies nicht so ist liegt allein am Mining Erbe.
Daher kann nvidia nicht anders als die nächste gen die sku noch weiter die chips herunterstufen da hat nvidia Zwei Möglichkeiten die arch anpassen wie ich angenommen habe und mehr alu pro sm möglich sind oder den Takt auf etwa 3,2-3,4ghz drücken letztere wäre ineffizienter aber auch als ada design refresh einzige option.
das würde die rtx50 Serie maximal auf + 10% bringen je sku bei gesteigerten kosten für den Entabhnehmer pro sku ab 50$ mehr.
Die Alternative wäre das nvidia ada neu auflegt (rebrand neue Platinen) in n4 mit mehr Takt. +5% Takt und dann folgende sku neu
ad102 auf 48gb gddr6 24gbps 10$ pro 16gbit 16chips 24 chips 142sm aktiv 1152gb/s maxed 72tf 1999€
ad103 auf 32gb gddr6 24gbps 2,9ghz si unverändert 768gb/s maxed 90sm 45tf 1399€
ad104 auf 24gb gddr6 24gbps 12 chips 2,9ghz 576gb/s maxed 68sm 34,7tf 849€
ad106 auf 16gb gddr6 24gbps 8 chips 2,9ghz 384gb/s maxed 36sm 18,5tf 449€
ad107 auf 12gb gddr6 20gbps 6 chips 2,9ghz 240gb/s maxed 24sm 12,5tf 299€
jeweils die vollausbau chips sku akä ti oder nur super genannt
auch wichtig man kann am pcb die Platine per clampchell ramchips binden (vor und rückseite) dann ist das SI pro chip geteilt aus 32bit wird 16bit davon hat man kein nachteil weil immer das gesamte IMC zählt siehe rtx3090
nicht verwechseln mit dem chipkapazität die 16gbit ist= 2gb
Zur info der L2 cache auf ada bewirkt nicht das die Bandbreite sich vergrößert dieser ist nur da um den rt core bei dxr und sar die Arbeit zu erleichtern. In raster macht das gar nix
So viele Wege hat nvidia derzeit und wie das ausgeht hängt primär von amd Reaktion auf rtx4070 und rtx4060 ab.
Amd wird sicherlich n31 neu auflegen mit gefixten mcd und der takt kann auf min 3,2ghz gehen
Was die gpu auf etwa 37tf zu 46tf bringt
kann sein das nvidia dannauf den rebrand der rtx4090 verzichtet
Und nur dann super 80er 70er und 60er bringt
rein bwl würde ich den günstigste Weg gehen der n3 node ist teuer und vor q2 2025 für die kleine sku nicht anwendbar.
Da kann nvidia nur mit nen super refresh reagieren und weil n4 schon parat ist kann das dann die rtx 50er gen werden als high end gb102 data center only, gb103 only quadro.
Und dann gb104 als high end in n3 der Rest ada auf n4 mit ad203 an als 70er ad204 als 60er ad206 als 50er
amd rdna4 Spekulation wäre gefixte mcd Verbindung mehr alu können mehr fp32 pro Takt ausgeben also min 2,6 statt 2,34 dann wäre allein auf 3,6ghz wegen n3 das die maxed sku bei 57tf wäre nicht gefährlich für ada refresh mit dem ad102 derzeit aber auch nicht weit weg.
Wenn amd dazu die alu pro gcd vergrößern kann wenn das gcx Prinzip geht also ohne Latenz problem dazwischen wären das ein gcx bsp 3072 davon min 3 = 9216 bei 3,0ghz ergeben dann min 71tf
das zwingt nvidia den blackwell gb103 auf 8 gpc 144sm maxed 142 aktiv min 109tf 1499€ 32gb gddr7 28gbps
Das bedingt nvidias ego das zutun