nvidia gibt 26tf fp16/fp32 an davon ist man weit weg.
Da nur 64 fp32 +16 fp32 und zusätzliche durch Treiber garantierte 8 fp32 macht 88 fp32 von 128 fp16
Es gibt meiner Meinung keinen benchmark mit fp32 Durchfluss der nicht gpgpu ist.
Das aber ist kein directx oder andere api benchmark diese hat den Vorteil das alle floatingpoint Einheiten in einen Modus laufen. Das aber ist nicht die norm.
Woher ich das weiß der vergleich gtx10 Serie vs rtx30, gtx700, gtx400 und 9000 Serie (2008) alle da
nehme ich alle gen zum vergleich stets steigende Bandbreite und alu Leistung kommt das hin
Dabei an Generationen ist
2008 geforce 9000 Serie Formel 0alu mal 3 mal shadertakt in tesla
2010 gtx400 =sm mal 32 mal 2 mal shadertakt + sm mal fpu mal 4 mal shadertakt in fermi
2013 gtx700 =alu mal 2 mal Takt +sm mal fpu mal 4 mal Takt in kepler
2016 gtx10 =alu mal 2 mal Takt in pascal
2021 rtx30 = sm mal 88 mal2 mal Takt in ampere
Und zusätzlich weis ich
2023 rtx40 = sm mal 88 mal 2 mal Takt in ada lovelace (identisch zu ampere)
2025 rtx50 = sm mal 88 mal 2 mal Takt in ada refresh (identisch zu ada) meine nächste gpu
Dafür spricht der n3 node.
Die chips werden um 25% kleiner auch wegen Verkleinerung des SI
GDDR7 Speicher 32gbps stehen so gut wie sicher
Die aktuellen preise vom vram sehr billig sind und die sku sich dann besser aufteilen lassen
ad202 150$ vs 195$ maxed 32gb einstieg bei 1500$
ad203 90$ vs 108$ 24gb einstieg bei 1000$
ad204 60$ vs 90$ 16gb einstieg bei 450$
ad206 40$ vs 50$ 12gb einstieg bei 350$
ad207 30$ vs 40$ 8gb einstieg bei 200$
gddr7 +- 8$ 16gbit 32gbps derzeit vermutlich 10$
release bis q3 2025
2024 wird blackwell kommen als quadro und hpc chip
Das design sehen wir erst bei n2p 2027 mit dann ebenfalls 3,2ghz
Das design in n3 wird vermutlich nur bei 2,4ghz Takten und nvidia ego vermeidet es geringere Taktraten bei einer neuen gen zu vermarkten.
ich weiß ist spekulativ aber alles spricht dafür und macht bwl Sicht Sinn
Die Ursache ist nvidia Software Entwicklung mit gpgpu die ab fermi 2010 begann
Und man sich eine neues Standbein aufbaute mit cuda software.
Die erste dx11 fähige gpu war von nvidia gtx400 Serie mit den ersten gpgpu = cuda Treibern.
Mit der gtx600 Serie wurde der shadertakt dem coreclock angeglichen primär wegen Fertigung von 45nm auf 28nm.
maxwell hat dann die fpu deaktiviert aber Takt stieg dadurch um 500mhz von 1,1 auf 1,6ghz.
pascal stieg der Takt auf nahe 2,0ghz dir Regel waren 1,9ghz
turing hat neben dxr keine Neuerungen gehabt Takt blieb identisch.
ampere ist quasi bei gleichen Takt geblieben skaliert über die sm und die zugesicherten zusätzlichen fp32 wurden in hardware fundiert wo turing es eine software Lösung brauchte.
ada ist lediglich ne Fertigungsvorteil also höherer Takt. aktuell 2,8ghz
cuda skaliert mit dem Takt und kann die tensor kerne nutzen ab volta.
Es gab nur einen gaming Ableger von volta den gv100 Name Titan V damals 3500€
Zu Volta 2017 wurden tensor cores hinzugefügt die alleine wegen gpgpu genutzt werden können
In raster machen die nix, aktuell werden diese für denoising genutzt mehr oder minder.
Das dlss auf rtx20 rtx30 rtx40 läuft aktuell auf den shadern mit den bvh strahlen des rt core
Die tensor cores können beitragen aber die Regel ist, sie liegen brach und werden erst bei einen implementation von denoising endlich genutzt.
Der Grund liegt bei der Latenz derzeit ist es nicht möglich zu denoisen ohne Latenz darum wurde auch dlss derzeit nur fürs upscaling genutzt. Was rein auf software basiert.
Das könnte auch auf nicht rtx Karten laufen wird aber derzeit verhindert.
Die tensor cores reichen aus aber sind nutzlos bei Echtzeit dafür aber sinnvoll bei video denoising darum erwarte ich auch das bei ada refresh die tensor kerne halbiert werden Statt 4 nur noch 2 per sm
Der Rt core erfährt durch n3 38% shrink die alu ebenfalls das spart etwa 15% chipfläche ein wenn dazu das Si noch um 25% kleiner wird ist man bei -25% chipfläche
Es ist nur logisch das bei steigenden kosten das Si und sram weniger werden den das sind teile des chips die nicht skalieren.
Erst n2p soll nochmal den sram um 10% kleiner werden können primär wegen 3d chip das gibt es aber erst 2026 in n2P, in gpu's dann 2028
Aktuell sehe ich kein Bedürfnis meine gpu zu wechseln bei 1080p bis die ps5 pro kommt q4 2024
da ein Wechsel des monitors nicht ohne upgrade auf die 70er klasse geht Verzichte ich darauf.
ich benche gerne und habe auch die Spiele dafür um die 800 das fängt von 1996 bis 2023 das ne kleine Auswahl was seitdem erschienen ist. benches ab 2004
Derzeit im Testparcour +- 400 Spiele die kein fps cap haben
Wen man die genaue zahl an erschienen games seit 1996 wissen will dafür gibs es ne Webseite
https://www.pcgamesdatabase.de/ die alle test von games seit 1996 drin hat bedingt aber das einer die spiele getestet hat und online bzw per print herausgebracht hatte.
Ab 2012 sind dlc mit drin was die zahlen leicht verfälscht
Es sollten um die 3000 games sein, davon noch nutzbar 2500
Und jedes Jahr kommen um die 150-200 dazu derzeit mehr als je zuvor und PC gaming soll tot sein?