Aha du kennst also auch schon den chip und die Architektur....interessant...Ada Lovelace ist wie Pascal ein fertigungstechnisch optimierter Refresh des Vorgängers. Kleinere Node gibt einen ordentlichen Taktboost, die TDP wird leicht erhöht damit man die Kotzgrenze des möglichen erreicht. Dazu ein paar recheneinheiten mehr und voila RTX4000 ist geboren. Ja, es wird mehrleistung geben, aber eher dank Taktfrequenz und weniger wegen der Architektur.
Und wieder nur Lügen und falsche berechnungen....Worauf stütze ich mich
als erstes Hopper Architektur
144sm und 450w bei 1,5ghz
Da nvidia kaum bei ada die Fertigung verbessert haben wird, es wird dieselbe sein.
Erwarte ich maximal 2,4ghz bei absurden 1,2v-1,25v und 600w tbp
und da ada definitiv dichter wird (etwa 600mm²) als hopper (832mm²) kann das nur in hitzestau enden
Also muss wen mehr als 2,0ghz sind die sm drastisch gesenkt werden oder nvidia hat es geschafft deutlich effizienter Daten zu verwalten und viel auf cache gesetzt.
Das bezweifle ich aber da schon jetzt die shader so primitiv sind das man da nix mehr an Leistung herausholen kann.
Hier hilft nur mehr shader und mehr Takt und da kommt es primär auf die Fertigung an
Wäre ad102 144sm 900mm² groß würde ich klar sagen das wird gehen mit 600w und 3,0ghz
ist es aber nicht
wie komme ich auf 600mm² nu das liegt an tsmc Angabe zu schrink vs 7nm und samsung Differenz zu 8nm etwa 10% größer als amd
-50% dichte bei maximal 30% energieeffizient oder 15% mehr takt siehe 2,5ghz als maximum
Und da 50% ziel sind bei nvidia braucht man nicht mathe studiert zu haben.
zum vergleich hooper ist nur 20% dichter als ampere
ich gehe fasst davon aus das man sogar bei 2,0ghz de sweetspot hat.
Der Grund warum nvidia die Taktraten so anhebt liegt allein daran das 5nm pro wafer 17k kosten
Und nvidia sicherlich kleinere chips pro sku haben will
Sprich ad106 für die ,ow end und ad104 für mid class und ad103 hig end. aber dagegen spricht amd Konkurrenz.
Nvidia weis nicht wie amd rdna3 perfomt
Es geistern +50-150% rum
Den es ist nicht klar wie amd die shader Struktur geändert hat.
Wir wissen nur n33 3584 4096
n32 8192 10240
n31 12128 16128
Und das man ab 3,0ghz Taktraten erwarten kann
Die reine tf Leistung kann sich per shader nicht mehr ipc geben weil dazu müsste sich die directx Berechnung ändern und genau das passiert nicht, es ist schon am kleinsten punkt bei einfacher Berechnung einzig halbe Genauigkeit könnte Leistung fördern (vrs) das aber ist software und kann nicht vom Treiber aus genutzt werden.
meiner Rechnungen basieren auf die whitepaper von nvidia seit tesla
jede gen hat so ein Papier
da sind die sm/gpc Struktur und cache Struktur erklärt der Rest ist skaliert auf die gpc
in einen chip
tesla 2 fp32 zu 1 fp64 formel sm *3*takt 1-1
tesla2 2 fp32 zu 1 fp64 formel da Treiber geändert sm menge *2* takt 1-2
fermi 8 fp32 zu 1 fp64 formel identisch 1-4
kepler 32fp32 zu 2fp64 formel identisch 1- 8
maxwell 64fp32 zu 2 fp64 formel identisch 1-16
pascal 128fp32 zu 2fp64 exklusiv 1-16
turing erste Änderung 64fp32 zu 2 fp64 1-32
ampere erste gravierende Änderung seit tesla 64fp32+ 24fp64 die auch 24fp32 rechnen können =88 fp32 pro takt 1-32
kommend ada 96 fp32 und exklusiv 2 fp64 1-48
Da nirgends vom die fp64 im geleaktten diagramm erwähnt wird 128fp32 wären drin würden aber eine dichte erzeugen vs ampere die über 60% gehen würde. vs ampere das ist unwahrscheinlich.
insgesamt nach alter Rechnung von nvidia bei ampere 64fp32 +64 int32
vs 128fp32 +64int32 =192 kerne pro sm+ 8 tensor kerne
200 vs 136 das kann nicht sein 47% und zugleich mal 50% mehr sm pro chip klar doch (ad102 vs ga102)
Bleibt mal realistisch das wären 100% mehr dichte vs ampere (etwa 942mm²) und das geht definitiv nicht.
Wie betont tsmc Angabe sind 50% mehr dichte 5nm vs 7nm bei gleichen Takt dann 30% effektiver oder 15% mehr Takt.
Da samsung 8nm etwa 10% größer als tsmc 7nm ist und nvidia aufgrund des cache auf 15% verzichtet bleiben etwa 45-50% dichte über.
Darauf basieren meine Rechnungen und das ist noch optimistisch bei den Taktraten die ich zuletzt angenommen habe ich würde sogar sagen das man die 2,0ghz marke nicht übertreffen wird.
Aber alles steht und fällt von amd n33 release ab und welche sku das wird.
warum nun die wärmedichte steigt und das wird den Takt begrenzen.
Die einzige unbekannt ist wie viel volt braucht man für 2,0ghz sind es 1,01v dann wird es zum quadrat ineffizienter maximal 2,4ghz oder erst bei 2,3ghz sind dann 2,7ghz
Das hängt davon ab wie gut der angepasste 4nm Prozess ist und nach hopper hat das eher schlechte Aussichten wo etwa 1,5ghz für 128sm 450w brauchen was dann quasi 1,01v wären. Und maximal dann etwa 2,0ghz drin
Gib es doch endlich auf....
Du bist kein Experte darin...Check es doch endlich mal
1. Wer sagt das es keine Architektur Verbesserungen gibt....
2. Kennst du die Leistung des chips....
3. Kennst du die tdp des chips....
Alles beruht nur auf Gerüchten und mehr eben...deshalb stimmen diese eben auch nie....
Es kann zur Leistung absolut nicht gesagt werden da dieser noch niemand hat...
Checkst du das auch mal....
Deine berechnungen stützen sich auf Whitepaper....
Ja ne is klar XD
Damit disqualifizierst du dich jeglicher Diskussion....
Denn nirgends steht davon was kommt also bitte das is nahezu an Lächerlichkeit nicht zu überbieten
Zuletzt bearbeitet:

