Nur blöd das dies nicht möglich ist
Es sind nativ 2434 fp32 alu/shader
Und 2434 fp16 alu/shader
Die fp16 können fp32 50% Operationen oder fp16 100% Operationen ausführen lediglich die zeit also Latenz entscheidet wie gut diese ausgelastet werden derzeitige test gehen von max 40% aus
allerdings nur mit einer high end cpu idem fall den r9 5900x bzw massiv oc ci9 11900k (ab 5,2ghz) 1080p
ideal sind machbar 50% somit ist die Rechnung so
4868shader *2 Operationen*1,9ghz/2/1000*1,4fach (40%)=12,94tf
Was etwa einer gtx1080ti FE entspricht 3584*2*1,8=12,9tf oder rtx2080s
3072*2*2=12,2tf
Zu release also dez waren es max 20-30%
genauer ermittele ich bei meinen test mit hoffentlich bald kommende bezahlbaren rtx 3060 unter 400€
Hab heute wieder den Zeitpunkt bei media markt verpasst. (asus 379€)
Die bisherigen werte sind grobe vergleiche aus techpowerup
vs meiner gpu das sind max. 88% zur FE edition der gtx1060 meine ist gut 11% schneller
somit dürfte um die 77% bis 83% schneller sein da bei den test die grundtaktrate von nur 1,77ghz zählt da aber alle bis zu 1,85ghz laufen
ist da mehr drin.
Sinnvoller wäre die rtx3060ti fe wenn diese den auch kaufbar wäre.
Einzig eins treibt mich zur rx3060 die 12GB vram
Das könnte sich durchaus in 2 Jahren als vorteilhaft erweisen.
Die große unbekannte ist direct storage und fsr
beides könnte den vram verkleinern und Leistung steigern.
offen ist nur eins wird dlss dxr auf rtx3060 retten. Bisher sieht das schlecht aus.
Amd Gegenpart ist da nicht besser
Generell ist die fp32 Leistung relativ zu sehen den die ipc ist seit 2006 am sinken
Allerdings sind es mehr shader die höher Takten
Wren anfänglich die unified shader deutlich in der ipc gestigen vs der alten getrennten shader technik von vertex und pixel
Somit wurden die beiden rechenwege kombiniert so das diese eine hohe ipc hatten.
Infolgedessen wurde das sehr warm. merke die fermi architektur gtx480 mit deren 32 alu pro sm 15sm
und dessen shader takt bei 1,4ghz und 700mhz coreclock
ipc etwa 0,41fps pro shader
kepler also gtx780ti liegt die shader ipc bei 0,034fps
somit sind es
0,41/0,034=1/12 dessen an ipc pro shader aber eben mehr
struktur 192alu pro sm vs 32 alu pro sm
Sin dahinter wärme ruktion da auch der takt von 1,4ghz auf 900mhz gesenkt wurde.
Dadurch wurden die gpu sparsamer und kühler.
diese techni ist bis heute so geblieben einzig die fp16 einheiten können zusärzlioch fp32 ausführen. un die shader struktur ist bei 96 fp32 einheiten effektiv
Nvidia rechnet aber 64 fp32 und 64shader fp16 Einheiten mit zu 32shader fp32 operationen möglich sind
ipc derzeit
100/7872=0,012fps pro shader sofern auch 50% fp16 funktionieren eher sind es weniger.
siehe 0,034/0,012=1/3 der ipc seit 2013
also insgesamt seit fermi 0,41/0,012=1/34
aber eben mehr shader mit mehr takt.
das ist ein parade bsp für Parallelisierung.
natürlich nehme ich 100% als fps an den ein so altes spiel mit festen fps würde sofort in ein cpu limit rennen und die alte gpu könnte es nicht mal starten. daher die Annahme von 100fps als bsp relativ zu gpu Leistung.
Einzig metro 2033 könnte nicht in eine cpu limit rennen in 4k
meine gtx1060 erreicht da nur 17,4fps
relativ wäre dann 17,4/1280*7872=107fps mit eine kleines Risiko von einen cpu limit.
zur rtx3060 wären es 35fps