Die ada chips sind bei ad102 195$ ad103 120$ und ad104 bei 90$
Wir wissend s weil wir den waferpreis kennen 18k$
Die chipgröße und den vram preis zwischen 14-20$ pro 2gbit chip 24gbps.
Folgende uvp machbar 1250$ 999$ 589$
Warum tut das nvidia nicht nun es liegt am überbestand an ga102 und ga104 chips
Die Lager von nvidia sind voll.
Das muss immense sein damit nvidia wirklich denkt man können 2 gen gleichzeituig vermarkten weil man ad102 103 104 einlagern muss.
Man bedenkt das nvidia vorhatte die bestellungen der wafer zu stornieren und tsmc sagte Nein.
Das ist ein Ergebnis falscher Planung
dazu kommt das ada wirklich eine Weiterentwicklung von turing ist, nicht ampere
Was den Schluss naheliegt das es parallel entwickelt wurde insbesondere wegen quadro linie und Datacenter.
Das eine Firma zwei oder drei design gleichzeitigt entwickelt ist klar.
Im Prinzip ist das egal aber kann in Realität zu problem werden wenn das ältere design zwangsweise eher dem data center näher ist mit 64fp32 64int32 32fp64 4 tensor 1 rt 1sfu
und jetzt 64 fp32, 64int32/fp32 hybrid, 4 tensor, 1 rt, 1 sfu
Es mag sein das die Rt cores Weiterentwickelt wurden was klar war die tensor kerne allerdings sind reine software und können nur durch cache beschleunigt werden was bei ada der fall ist
Das hilft extrem bei quadros und für post processing Thema denoising
Das geht derzeit noch immer nicht in Echtzeit.
Stattdessen wird mit einen Bildgenerator den es auch als tv Lösung gibt fps generiert. (dlls3)
Das bedingt eine Latenz mag kein schlechtes feature sein aber nur in Anwendung nicht kritischer latenzanfälliger spiele sprich adv klick and point Simulation sowie Rundenstrategie
Alles was ne schnelle Reaktion bedingt wird zwar flüssiges Spiel haben aber ne Latenz.
Race sowie action getriebene shooter sowie Geschicklichkeitsspiele.
Sprich es ist Sinnfrei fürn gamer der auf action setzt oder man kommt locker über 200fps wo der Sinn des feature infrage gestellt werden muss.
Zurück zum design quasi skaliert ada nur über die sm Anzahl.
ad102 128sm somit gut 90% über ga102 84sm
ad103 76sm somit gut 26% über ga102 80sm
ad104 60sm somit gut 65% über ga104 48sm
kommend
ad106 36sm somit gut 68% über ga106
ad107 20sm somit gut 40% über ga107
Und jetzt der schock ampere hat 88 fp32 pro sm das ändert die Lage extrem
aus +90% vom 128 sm werden dann nur noch +40%
76sm +-0%
60sm + 27%
kommend
36sm +41%
20sm +14%
Das ist mehr als vernichtend
nvidia kann nur über software Anpassungen mehr fps machen warum auch die Vorstellung von dlss3 Sinn macht
Die ganze Planung von ada war mit mining im Fokus
Das sieht man auch am SI und vram Bestückung aus 24gbps ram hätte es nicht sein müssen.
Zumal man nicht ansatzweise an die nötigen tf kommt
Einzig der ad102 wäre für 21gbps durchaus Sinn drin. Alle anderen sku wären mit gddr6 18gbps völlig ausreichen gewesen.
ich hoffe das diese Folien nicht echt sind
NVIDIA has detailed its Ada Lovelace GPUs along with DLSS 3, Overclocking & Founders Edition designs for GeForce RTX 40 graphics cards.
wccftech.com
Aber ich ahne das sie stimmen werden
bei turing /rtx20 hatte man auch versucht über software die int32 auf fp32 zu schalten das scheiterte anhand von Treiberanpassungen in games und wehe ein spiel hatte int32 befehlsätze drin dann schaltet man stur auf 64fp32 pro sm
Sprich abseits nvidia exklusiv spiele wird es da keine Beschleunigung geben.
Auch spricht dafür das bei spielen mit int32 der Takt deutlich höher geht also
letzte angaben von 2,8ghz
was Sinn macht wen der halbe sm ohne Funktion ist
Es kann sich also doch nochmal +10% geben wegen Takt.
Und das schön versteckt mit dlss3.

Das wird ein grauen bei Tests am 11.10.2022