nun meine posting sidn was Wirr Konstruriert mir klar.
Am ebsten man denkt in tabellen.
Und ja ich muss bei fasst jeden artikel über ada lovelace wie schon bei ampere und früher was als nächste gen kommt 2017 ming senf dazugeben
Das aber bei ada so viel bekannt wurde vom mnvidia hack ud es handfeste daten zur Fertigung gibt kann man Rechnen.
Ganz im Gegensatz zu früher wo nix bekannt war bis etwas vorgestellt wurde.
mal übersichtlicher
bitte
GPU sku | Shader pro sm | sm count
vram | takt | operarion pro takt | fp32 tf leistung | strombedarf nach sweetspot ~2,2ghz zum quadrat | release | preis | chip |
RTX4090/ti | 96/128 | 116
24gb | 2,4ghz | 2 | 53 oder 71tf | 500-700w tbp derzeit noch in test | 12/2022 | 1299-1999€ | ad102/144sm |
RTX4080ti/90 | 96/128 | 104 12gb | 2,5ghz | 2 | 49tf oder 66,5tf | 420w tbp | q1 2023 | 999€-1299€ | ad102 |
RTX4080 | 96/128 | 76/72/60
16gb | 2,2-2,5ghz | 2 | 76sm 32tf-37,5tf oder 36tf48tf
60s, spare ich mir weil unrealistisch siehe eins tiefer | 275-340w tbp | q1 2023 | 799-899€ | ad103/96sm |
RTX4070 | 96/128 | 60/56/52
12gb | 2,2-2,6ghz | 2 | 25tf-29tf 60sm
23-27tf 56sm
21tf*25tf 52sm
128alu pro sm 1/4 mehr | 225-250w tbp | q2 2023 | 549€ | ad104/72sm |
RTX4060ti | 96/128 | 46
10gb | 2,2-2,4ghz | 2 | 19tf-22tf | 180-215w tbp | q2 2023 | 479€ | ad104 |
RTX4060 | 96/128 | 28/32/36
8gb | 2,2-2,6ghz | 2 | 11,8-13,9tf 28sm
13,5tf-15,9tf 32sm
15,2-17,9tf 36sm | 135w-190w tbp | q2 2023 | 299€ | ad106/48sm |
Siehe den ganzen text mal vereinfacht
ich hab nur erwähnt wie ich darauf komme
Daten
sm bestätigte chip Ausbaustufen vom hack märz 2022
TBP anhand von hopper n4 Fertigung
hopper ist deutlich dichter als ada aber hat keine rt cores daher wird der chip kleiner und die wärmedichte bleibt in etwa gleich 832mm² vs 600mm²
Die sm bleiben gleich lediglich die fp64 Einheiten könnten rausfallen oder in die 128 intrigiert sein was wahrscheinlich ist.
Die Größe der fp64 vom hopper könnte der rt core einnehmen ergo gleiche Wärmeverlustleistung und somit Takt und tbp
Der Rest ist vom Sweetspot womit die gh100 gpu laufen an rechnen wobei bis 1,04v und 2,2ghz am desktop der sweetspot sein wird.
Von da an zum Quadrat ineffizienter und da kommen halt die tbp angaben her.
Die sku werden aber erst 3 Monate vor release festgelegt
ad102 war juli und ist somit zementfest ab okt zum release bereit
Das hat man verschoben auf nov bis dez laut letzten Gerücht wegen der übervollen lager von ampere gpu
Die preise stammen von den letzten leak der waferkosten bei tsmc aus dem hack war ersichtlich das nvidia dafür zwischen 17000$ bis 18000$ pro wafer zahlt.
ich nahm die höhere kosten an.
Vram preise sind in alibaba ersichtlich zumindest sind die Steigerungen der vram chips in % bekannt was bei etwa 20% sind von derzeit 8gbits chip (1gb 16gt) bei 4$ und bei 18gt 5$ ist = 4,80$ bei gddr6 20gt samsung und 6$ bei 24gt gddr6x von micron
16gbits chips (2gb) sind bei etwa 8-10$ gddr6 und 10-12$ bei gddr6x
Anfang 2022 war das noch doppelt so teuer
Und das mit 16 und 18gt chips in 8gbit
marge nvidia sowie amd 70% mit vram als bundle
marge aib 20% seit jeher
marge großhändler 10%
transport pro sku 10$
marge Einzelhändler 10%
Die kosten sind trotz teurer Fertigung der wafer geringer besonders bei amd
Der vram preis ist endlich raus zur Verteuerung von ampere war das 50% der preise ausmachte die über die uvp gingen.
Jetzt macht man kein Verlust pro sku es ist eher so das die Händler sich Übernommen haben
Darum sinken die preise nur zögerlich
Insbesondere im low end ist das zu spüren die gtx1650 ist Überproportional verfügbar über 50 Modelle und dennoch bleibt der Preis stur bei 199€ dieser müsste bei 140€ sein.
Da aber der release der rtx4050 erst q3 2023 ist hoffen die Händler das bis dahin die ware weg ist
Dringender ist der Überbestand an ga102 gpu
Rtx3090ti | Rtx3090 | rtx3080ti | rtx3080 |
derzeit 1200€ kommend 1050€~dez | derzeit 1150€ kommend 1000€ | Derzeit 950€ kommend 800€ | derzeit 850€ kommend 650€ |
Das einzige was diesen trend aufhalten könnte wäre China überfällt taiwan (es grüßt der Atomkrieg).
Es tritt ein mining revival auf (tritt sicher nicht auf bevor inflation nicht beendet ist) .
Die inflation wird weniger aggressiv das aber ist sehr unwahrscheinlich ich geh von bis zu 12% aus bis dez
Dagegen hilft derzeit nur das die politik endlich den Unsinn Sanktionen aufhört und auf Friedensverhandlungen pocht.
Zwar Unwahrscheinlich das die us of an a auf die Weltleitwährung verzichten aber das ist bestand des Krieges daher unwahrscheinlich das dies eintritt.
Teraflop Formel ampere (rtx30)
64fp32+ 24fp64/32 (vom ga100 Dokument entnommen das später im ga102 Dokument gelöscht wurde da wird nirgends ein native fp64 Funktion beschrieben warum ich das Dokument als marketing ansehe)
Der Ursprung war unter dem sm Schaubild den Einwand 24fp64 die nicht dargestellt werden
Die sfu berechnet 4 fp64 Operationen pro Takt und in jeden sm ist eine sfu
Die fp64 sind beim consumerchip deaktiviert und rechnen nur in fp32 was die 88fp32 Opertioenn pro sm bestätigen.
Die int32 core berechnen nix außer halb und Ganzzahlen
AMD rdna3 ist da was anders weil die wgp 256 alu haben und der chip mit 2,5d verbunden wird also passiv entsteht eine Latenz zwischen gcd und mcd 1 cycle mehr, das entspricht dem bottleneck was vega hatte alias gcn generell (gcn 64bit arch hat eine Auslastung von maxed 70% der fp32 shader)
Womit ich von 75% fp32 Auslastung ausgehe und das ist optimistisch
ich hoffe aber das amd dies gelöst hat und es keinen bottleneck gibt und die fp32 voll auslasten kann dann gewinnt amd auf ganzer linie und nvidia muss im preis kontern.
Den ada wird das nicht beim größten chip schaffen können den kleinsten rdna3 n31 zu schlagen.
Aber ich ahne schon das meine Vermutung der Latenz zwischen mcd und gcd stimmen könnte.
Hätte amd schon die 3d packaging Methode sähe es anders aus.
Das aber ist bei tsmc erst bei n3 drin.
RDNA 4 wird nochmal um 75% schneller sein als rdna3
Solche Leistungssprünge gab es zuletzt 2006 mit tesla Architektur von nvidia ( 8800gtx /g80) und nein 2016 gtx10 alias pascal war zwar schon beachtlich für eine gen Differenz aber man nahm ja mehr Strom auf für mehr Leistung.
Das trifft auch für rdna3 sowie ada zu. tsmc n3 Prozess könnte das ändern.
Aber die designs für blackwell (rtx50) sowie rdna4 (rx8000) sind noch völlig offen da in Planungsphase
erste info erwarte ich ende 2023.
Dann ist klar welche Fertigung es wird bei amd ist n3 sicher
nvidia unklar das hängt vom poker ab bei den Verhandlungen
zumal unklar ist ob nvidia auch mcm einsetzen wird. Derzeit spricht alles fürn Monolithen
Das sind aber alles leise Gerüchte über die Planung nix konkretes
Schön ist das nvidia hier wirklich sehr effiziente gpu bringen könnte wenn amd schwäche zutrifft, wird das auch so kommen.
Die Vernunft dgpu akä rtx4060 mit 135w tbp bei 2,2ghz wäre ideal etwa 11,8-15,2tf für 299€ aber leider nur 8gb gddr6 18gt.
Daher sehe ich eher die rtx4060ti als ziel an mit 2,2ghz und 180w tbp 10gb 20gt und 19tf
Das aber passiert nur dann wenn amd bei n32 als mitelklasse und n33 teurer verkauft als viele denken
Möglich
Rx7950xt 48wgp 16gb q1 2023 | 1799€ ~55,3tf n31 |
rx7900xt 46wgp 16gb q1 223 | 1499€ ~52,9tf n31 |
rx7800xt 42wgp ist bestätigt 16gb q4 2022 | 899€ ~48tf n31 |
rx7700xt 30wgp 12gb q2 2023 | 599€ ~33tf n32 |
rx7700 24wgp 12gb q2 2023 | 499€ ~26,4tf n32 |
rx7600xt 16wgp 8gb q2 2023 | 399€ ~22,9tf n33 |
rx7600 14 wgp 8gb q2 2023 | 349€ ~20tf n33 |
rx7500xt 12 wgp 4gb q4 2023 | 279€ ~17,2tf |
ihr seht die Problematik von nvidia selbst bei pessimistischer Annahme kann nvidia die low end Bereich nicht so hoch ansetzen wie oben.
Daher wird nvidia kurz nach release des n33 lineups die preise oben anpassen müssen oder amd wird die preise solange hochhalten wie es nur geht das ist offen aber diese preise sind realistisch bei derzeitiger chipgrößen annahmen.
amd n33 soll 200mm² für 4096 shader haben daran zweifle ich aber, da der n6 node kaum kleiner ist als n7.
Eher sind es 350mm² und selbst dann macht amd immer noch satten gewinn pro chip gehe von 80-100% marge aus.
Ich bin echt gespannt was zutreffen wird oder alles falsch ist.
Da aber die leaks selbst des sm Aufbau von ada kaum erfunden sein können diese stammen aus dem hack im März
Ist nur offen wie die Architekturen arbeiten, amd wird sicherlich beim mcm die fp32 Leistung nicht ganz auf die Straße bekommen, nicht mit passiven interposer.
Die frage die sich stellt welche Taktraten erreicht amd und welche nvidia.
Optimistisch sind 2,5-2,7ghz nvidia und 3,0 bis 3,3ghz amd.
Pessimistisch eher 2,2-2,4ghz nvidia und 2,8-3,0ghz amd
Achja ich werde wenn letzteres zutrifft dann benchen mit den alten daten meines test in raster rtx4060ti/rtx5060 vs rtx3060 vs gtx1060 mit dem r7 3800xt und ci7 5820k
Die daten sind nicht konstant da ich kaum die rtx3060 in dem ci7 build setzen will die cpu würde die gpu massivste ausbremsen in 1080p
Ich erwarte sogar das die vermutliche 19tf bis 22tf der rtx4060ti den r7 3800xt nicht in 1080p stemmen kann. abseits dxr. (siehe rtx3080)
Die Testszenen hab ich gesichert mehr oder minder mal reingezappt in den spielen
offen ist nur ob ich feste Szenen auswähle
Bei meinen test der rtx3060 kamen 47 games zum tragen mit den legacy spielen waren es sogar 76 spiele
Spiel von 2005 bis 2015 etwa 20
Der Rest ab 2016 bis 2020 war weniger standardisiert (test hatte ich im august - sept 2021 gemacht)
Das werde ich anpassen aber das dauert und solange keine interessante neue gpu kommt alias rtx4060ti 180w tbp oder rtx5060 mit maxed 120w tbp ideal wären 100w tbp mit 12gb vram mache ich nix.
So eine sku ist leider bei ada nicht drin. Und blackwell ist völlig offen.
(Werkzeug capframex und general logviewer für vram und power was leider neue Messungen erfordert)
DXR Leistung geht das Gerücht um das dxr keine Einbußen mehr hat und als Leckerbissen dlss3 sogar noch die fps steigern wird. Und es eher dann ein dlaa wird
Das aber ist höchst spekulativ. ich hoffe darauf das dlss3 kompatibel zu ampere wird.
Das ist aber software, unklar wie weit das mit hardware verzahnt wird.
Allgemein ist mein derzeitiger Pc ideal zum wirken (arbeiten) gut genug zum daddeln habe ich immer über 60fps selbst mit dxr abseits ausnahmen wie wd legion und cyberpunk 2077.
Meine settings sind immer maxed außer msaa aus und blur aus auf 1080p.
Bei legacy spielen nehme ich msaa nur dann rein wenn älter als 10 Jahre ist.
Ob ich das jemals als video hinbekomme ist offen aber die Tabellen stelle ich her.