Die angaben von nvidia sind falsch
Der ad104 chip hat 60sm mit je 64 fp32 nativ und 16 int32 die dediziert fp32 rechnen mit 4 sfu die 4 Operationen pro sm fp32 ausführen =88 fp32 pro sm
60*88*2,8*2/1000=29,5tf 900/29,5=30,50€
nebenbei ampere hat dieselbe konfig der sm
nachzulesen in nvidia whitepaper von ga102 und ad102
Warum ist fp32 so wichtig nahezu alle spiel seit dx10 Einführung sind in shader berechnet statt in puren raster
wie man bis dx9 üblicherweise spiele berechnete
dabei hat sich seit 2012 die menge an rop und tmu kaum geändert und werden auch nur mehr für größere Auflösungen benötigt. Da tmu und rop nach festen Größen in Auflösungen richtet.
Sprich die 96dpi sind standard.
Da machen mehr als 4096-2160p mit mehr als 200tmu keinen Sinn
genau lässt sich die Notwendigkeit von tmu nicht bestimmen die rop sind klar an die Auflösung gerichtet was zwischen 48-96 für 720p-2160p reicht
Die min menge sind 16 rop für 720p
hat man weniger als man für die Auflösung braucht limitiert die gpu bzw die fps brechen komplett weg.
ist ähnlich wenn man zu wenig bandbreite beim vram hat
Was mich zu den shadern bringt
Spiele rechnen das Bild in 3d und es wird auf 2d projektziert darum sind die rop wichtig
rop ist bspw bei ner rtx3080 96 rop 96*1,88*2=360,96 gigapixel pro Takt
Ein 1080p Bild hat 2073600 pixel zu je 8bit bzw 10bit( 2 gigapixel)
also sind 360 960 000 pixel (360 gigapixel)
theoretisch wären also maxed 180 fps drin sofern die shader das auch schaffen
Das bedingt aber das das spiel genau 2 gigapixel rendert sind es weniger wird es mehr.
den spiel rendern ihr Bild nie in nativer Auflösung eher ist das ein Gemisch aus 600p bis 1440p das ist primär engine abhängig.
Das ist ein limitierender Faktor bei gpu neben den 2 anderen die wären shader Leistung flops oder genau floating point per second und die texeldichte wenn man will die polygon menge.
Und das geschieht in einfacher Genauigkeit (32bit = fp32)
Es ist möglich in dx12 das in halber Genauigkeit auszuführen bedingt aber ein directx Befehl vrs und muss in der game engine explizit angewendet werden in spielen nen sich das asyncron Berechnung
das muss die gpu nativ unterstützen bei amd ab gcn bei nvidia ab turing (rtx20)
Die int32 befehle die in spiele auch vorkommen sind legacy da Ganzzahl Berechnungen klar für prä dx10 spiele genutzt werden.
Darum sind nur 32-64 int32 cores pro sm in ada bzw ampere dediziert am werk dafür.
Deshalb kann eine gpu ab ampere auch nicht in dx9 sofern noch traditionell gerendert voll auslasten.
Den schon dx9 waren einige spiel eher shader berechnet als stur texel und pixel.
Shader wurden seit dx8 angerwendet zuvor wurden Effekte noch mit dedizierten Einheiten realisiert.
Erinnere an T&L und co
Eine gpu aus dem Jahr 2000 ist nicht zu vergleichen mit 2006
Ähnlich ist das mit 2006 und 2022
Geändert hat sich die shader Struktur hin zu eine hybrid aus dx9 legacy support int32, shader und dxr
DXR braucht Speicher und besonders schnellen Speicher und da brilliert ada mit dem deutlich vergrößertem L2 cache.
60 Rt sind so schnell wie bei ampere mit 84 Rt
Ich vage zu behaupten das mit gddr7 vram die dxr Leistung nochmal um gut 22,5% ansteigt
Inwiefern der Takt ne rolle Spielt ist unklar Logisch würde ich sagen das dies nicht zutrifft weil dann der vergrößerte cache nix bringt.
Zurück zu P/L
Aktuell ist die situation so, wer muss sollte sich sein Budget orientieren und passende gpu für folgende Auflösungen ordnen
720p= rx6400 gtx1630 rx6500xt gtx1650 (~1,9tf-5,0tf) von 140-200€
1080p = rx6600, rtx3060, rx6600xt, rtx3050, rtx2060, rtx3070, rtx3060ti (7tf-15tf) von 250-800€
1440p = rx6700xt rx6800 rx6800xt rtx3080 10gb rtx3080 12gb, rtx4070ti, rx6900xt rx6950xt (18tf-25tf) von 500-1300€
2160p = rtx3090 rtx3090ti rtx4080 rtx4090 rx7900xtx rx7900xt rtx3080ti (27tf-63tf) von 1400-2000€
günstigster preis pro tf etwa 29,50 bei ner rx6600
teuerste rtx3080 12gb 45€ pro tf eol daher keine option mehr
und ja rechnet man die TF auf einen Nenner sind amd sowie nvidia gpu vergleichbar.
amd rdna3 ist speziell da aktuell 2,34 Operationen pro cu rechnen das kann sich ändern per Treiber bis auf 2,5 wann das eintrifft weiß noch keiner. Die option das es geht ist aber da.
Die these des feinen Wein bei amd Treibern ist wieder da, dabei war rdna1 und 2 so simpel 1-1 alu mal Takt mal 2.
Nur eben der Takt schwankt von 2,4-2,8ghz bei rdna2 ist chipgüte abhängig.
Üblich sind 2,5ghz bei allen sku von rx6400 bis rx69xx
Die rdna 3 erreichen etwa 2,5ghz bis 2,7ghz und schwankende Auslastung von 2,0=3,0ghz - 2,34 = 2,5ghz Operationen je höher der Takt desto geringer die Auslastung.
macht also bei ner rx7900xt 2,5*2,34*5376=31,4tf also 30€ pro tf
es ist echt blöd das amd releases immer mit nen haken verbunden sind. Und das bei dieser Marktsituation wo eigentlich endlich ein Durchbruch bei P/L angebracht wäre. Insbesondere im low end.
Die Orientierung sollte die Konsole sein
ps5 preis bei etwa 500€ für 10tf (ohne disk) mit 600€
ps5 pro erwartet etwa q4 2023 etwa 18,4tf für 600€
chip ist n33 3 Operationen pro cu etwa 3,0ghz gpu Takt = 27€ pro tf aber als komplettes system
ein vergleichbarer pc wäre bei 1100€ also etwa 60€ vs 27€
gegen ner ps5 wäre es 60€ vs 50€
Da merkt man was nvidia Plant man will die Konsolen P/L nicht unterbieten.
Also gehe ich davon aus das bei Einführung der ps5 pro der preis auf maxed 27€ pro tf fällt.
vs heute wo üblich 60€ pro tf sind deutlich
ergeben dann für ne rtx4060ti die etwa 15tf erreicht 405€ da ich aber nvidia kenne eher 15*30=450€
Stellt sich die frage Wann nun?
Das hängt jetzt davon ab ob amd kontert oder nicht vorerst erwarte ich nur die rtx4070 mit 46sm 2,8ghz etwa 22tf das ist knapp an der rtx3080 für 699€ =31€ pro tf
nvidia Plan geht auf