Die performance prognose passt nicht zum sm count und der takt ist auch zu gering
also muss es von 96sm die vorhanden sind 76 aktiv sein das man nur 60 aktiv hat ist unwahrscheinlich
Zumal der n4 prozess nicht so ne gurke wie bei samsung 8nm ist
bei vermutlich einer chuipgröße von 400mm² sollte etwa 69% yield geben eher sogar 82%
drin
Womit dann aus eine 12 inch wafer dann 93 oder 113 gute dies gibt und 24 defekte
Dieser hat 96sm also sind die 76sm aufgrund von wärmedichte bzw Taktraten Erhöhung bis 2,5ghz machbar
nehme ich es optimistisch wären bei 205w im sweetspot was 1,8ghz entspräche bei 96sm dann maximal 25% höheren Takt dann bei so ner einschätzung optimistisch
205*0,9 aufgrund von chipfläche mehr wärme aufnehmen kann.
205*0,9*1,1 (auf 2,2ghz=1,04v) udn ab dan zum qadrat zum ziel was vermutlich 2,5ghz sein wird.
Ddas wären dann 76sm bei 2,5ghz und 96fp32 pro sm =36,4tf
Da aber die 34tf angegeben werden ist eher von 275w tbp auszugehen und nur 2,3ghz bedeuten würde.
Angenommen die perf angaben sind realistisch
Somit ist die rtx4080 genau 40% schneller als die rtx3080 (reale 23tf)
m,an könnte auch die nvidia fp16 werte nehmen kommt das gleiche raus wobei ampere sogar tendenziell nochn tick langsamer wäre
Die Formel wie ich auf 88fp32 komme liegt am ga100 Dokument das ga102 Dokument kann nicht stimmen weil da die Leistung der fp32 zu gering ausfallen würde.
und die sfu kann fp64 also woher komt die fehlende fp32 Leistung von den fp64 Einheiten die dessen fp64 funktion beraubt worden sind die fehlende 32fp32 Leistung sein wovon nur 24fp64=24 fp32 aktiv sind
Das liegt an samsung schlechter yield
Das würde auch die fp32 Leistung der ampere vs anderen gen genau erklären
ada schätze ich so ein das nvidia die fp64 diesmal wieder exklusiv schaltet und es 96fp32 von den 128 alu rechnen
Das nvidia dies wieder als 128 fp32 ausgibt ist wieder typisch
Und auch logisch man müsste sonst zugeben das man bei ampere ga102 gelogen hat.
ich hoffe es sehr das die 128fp32 stimmen und es zusätzlich noch 32fp64 vorhanden sind aber das ist zu bezweifeln und die sfu wurde schon auf fp64 berechnungen zurechtgestutzt ab kepler (gtx6xx)
Das nvidia ihre gpu arch so flexibel ist ist genau der Vorteil. Die sfu kann fp64 mit 4 Operationen pro Takt
Wenn letztere zutrifft kann es sogar sein das nvidia den sm shader für consumer die 96fp32 und die sfu für fp64 laufen lässt und am profi markt dann 96fp32+32fp64 in fp32 sowie 32fp64+sfu laufen
wobei der größte chip also ad102 (quadro rtx vermutlich 8000 AL)
128sm =1*128*4*Takt + 32*128*2*Takt=10,1tf fp64 und dann real 72tf fp32
Das die consumer gpu deutliche fp32 Einbußen haben wird ist klar. Wie sonst könnte nvidia die fp64 Leistung beschneiden.
Das wärn option wie man 2,5ghz erreichen kann bei 340w tbp allerdings ist die Performance bei 36tf (ad103) letztere wert ist eher anzunehmen als das 34tf und die tbp bei 275w sein wird.
Aber wie bei allen der ad103 ist noch in test bei der yield Auswertung und wird erst im sept finalisiert sein.
Was jetzt final ist, ist der ad102 in drei skus
128sm (quadro Ableger optional titan)
116sm rtx4090/ti
104sm rtx4080ti 90
Was zutrifft ist unklar es kommt also darauf an was nvidia wann vorstellt amd wird am 30 august ryzen 7000 und ne teaser zu rx7000 geben. mit dem Hinweis einer Vorstellung im nov 2022
Die amd Gerüchte sind relativ neu, und die von nvidia unklar weil die sku nicht festgelegt sind abseits des ad102 und eine Verschiebung auf q1 2023 sehr wahrscheinlich wird.
Aber ich glaube schon das nvidia in nov eine rtx4090 vorstellen wird.
Die chips sind fertig und die auslese der yield auch im gang
ad102 war juli
ad103 ist august
ad104 sept
ad106 okt
hier kommt es auf die Fehlerrate bei tsmc an und da n4 vermutlich 0,05% haben wird glaube ich nicht dran das man den ad103 aufn drittel kürzen wird
Eher sehe ich 76sm oder 72sm als ziel an, die 60sm könnten aber eine sku darunter sein
Es hängt wie oft von mir angenommen vom amd Leistung und sku Planung ab. Und zum welchen preis
Das ist aber erst bei der Vorstellung der rx7800xt zu erwarten und diese ist im nov
ich tippe auf 799€ mit 16gb vram 42wgp und realen 48tf Leistung. Annahme 3ghz 75% load wegen Latenz des mcm. ansonsten 64tf
letztere hoffe ich sehr dann aber wird amd dies für 999€ festlegen.
Es spricht alles dafür das die nächste gen keine Unsummen bei den uvp haben werden da die Wirtschaftsleistung generell abnimmt und somit für Luxusgüter kaum Absatz zu erwarten ist. Auch wegen der gpu overstock derzeit.
Weil man nicht die ganzen neuen chips die da sind verschrotten kann müssen die uvp aller gpu drastisch herunter die situation ist viel schlimmer als nach dem 2018 mining crash
Damals konnte nvidia durch die unverschämte uvp der rtx20 Serie den Abverkauf vom pascal ankurbeln.
Das wird mit ampere nicht gehen, da die einkommen derzeit tendenziell sinken.
Dank inflation
ich bin versorgt liebäugle aber bei ner rtx4060ti bei 180w tbp 2,2ghz 20tf
Das wäre ne Verdoppelung meiner gpu Leistung (rtx3060)
Einziges manko nur 10gb gddr6 18 oder 20gbits
mein Fokus wäre dann dxr spiele vergleich da die raster vergleiche mich gnadenlos ins cpu limit befördern würde. (1080p)
Ein Grund für 1440p zu wechseln. was etwa 33% an Leistung kostet Im schlimmsten fall
Nun was zu erwarten ist ist bestimmt nicht nur 60sm bei der rtx4080 das war bisher die Annahme der rtx4070
wie aber gesagt Die chips sind noch nicht final