RTX 30xx-Karten: Neue Schätzungen zu Chipfläche und Verbrauchswerten

Nur scheint Nv 7nm absolut nicht so effizient zu sein wie sie angekündigt haben, was mich schon beim A100 wunderte.

Dann nimm dir noch einen Taschenrechner zur Hand. In voller Auslastung ist der GA100 (als A100) im Vergleich zum GV100 knapp über 75 % effizienter auf Basis einer Perf/Watt-Betrachtung.

Und "7nm+" ist der GA100 ebenso wenig, da explizit der N7 als Fertigungsprozess benannt wird (und nicht etwa der N7P oder der N7+).

Und nein, ich muss nichts über den internen Aufbau wissen, denn auch ich habe mir da durchaus ein "Hintertürchen" offen gehalten und bewusst nur von der Transistorenzahl gesprochen. nVidia wird den oder einen anderen modernen Fertigungsprozess zweifelsfrei nicht nutzen, um weiterhin mit um die 25 MTr/mm2 zu implementieren, d. h. mit 627 mm2 wird der Chip deutlich komplexer sowohl rein flächentechnisch als auch bezüglich der Transistorzahlen und damit ist es per se kein schlichter Turing-Shrink. ;-)

Wie es am Ende bzgl. der konkreten Implementation aussehen wird, wird sicherlich interessant, jedoch kann man aktuell nur spekulieren. Als gesichert annehmen kann man zumindest, dass sich die Tensor Cores v3 auch in den kleineren Ampere-Versionen wiederfinden werden und die scheinen schon deutlich mehr Transistorfläche zu benötigen. Darüber hinaus wird es Anpassungen beim L2 geben, FP64-Einheiten werden zusammengestrichen und es kommen RT Cores hinzu. Bei letzteren wird interessant sein, ob es mehr als einer pro SM werden wird und/oder ob nVidia diese architektonisch nennenswert optimieren konnte. Man wird sehen, aber unterm Strich gibt es keinen Grund anzunehmen, dass es "schlecht" wird und auf der anderen Seite muss AMD erst mal unter Beweis stellen, dass sie überhaupt in der Lage sind auf den Marktführer aufzuschließen.
P/L-technisch kann man die Diskussion natürlich immer drehen, da man durch Preissenkungen immer irgendwie am Ball bleiben kann, aber i. d. R. werden hier derartige Diskussionen ja eher unter dem Gesichtspunkt absoluter Leistung geführt, was eigentlich schon per se unlogisch ist, da für den Markt allgemein nachweislich eine P/L-Betrachtung weitaus relevanter ist. Auch dahingehend kann man sich direkt die nächste Frage stellen und spekulieren, wie viel absolute Leistung man im Herbst bei nVidia oder AMD zu Preispunkt X erhalten wird. Was man schon gesichert beantworten kann: Bei AMD wird man mehr erhalten, schlicht weil es markttechnisch erforderlich ist. Darüber hinaus bleibt die Frage wie weit nach oben hin AMD im absoluten Leistungsspektrum mithalten kann (oder gar überbieten kann?).
 
Zuletzt bearbeitet:
Dann nimm dir noch einen Taschenrechner zur Hand. In voller Auslastung ist der GA100 (als A100) im Vergleich zum GV100 knapp über 75 % effizienter auf Basis einer Perf/Watt-Betrachtung.

Und "7nm+" ist der GA100 ebenso wenig, da explizit der N7 als Fertigungsprozess benannt wird (und nicht etwa der N7P oder der N7+).

Und nein, ich muss nichts über den internen Aufbau wissen, denn auch ich habe mir da durchaus ein "Hintertürchen" offen gehalten und bewusst nur von der Transistorenzahl gesprochen. nVidia wird den oder einen anderen modernen Fertigungsprozess zweifelsfrei nicht nutzen, um weiterhin mit um die 25 MTr/mm2 zu implementieren, d. h. mit 627 mm2 wird der Chip deutlich komplexer sowohl rein flächentechnisch als auch bezüglich der Transistorzahlen und damit ist es per se kein schlichter Turing-Shrink. ;-)
Mach du das mal und ziehe die deaktivierten Cluster ab, Effizienz errechnet sich nicht nur an dem Verbrauch einer theoretischen Transistoranzahl. Und dann bitte Takt bereinigen! So war schon immer.:D

Die größte Steigerung bringt wohl FP32 mixed-precision DL mit, was vorerst ziemlich speziell ist und das war's auch schon. Also Holzauge sei wachsam.
 
Warum wohl wurde der GA104 mittlerweile für die FE auf "Hold" gesetzt? Man wird wohl erst mal abwarten, was AMD unterhalb welcher Karte wie schnell und teuer einsortiert.
Dann wird man ggf. schnell reagieren, denn man sollte in der Stufe vor dem PVT sein. Guter Moment, um mal innenzuhalten und ggf auch die Turing Armada noch abzuverkaufen.
NVIDIA treibt doch nichts, die sind in einer wirklich komfortablen Lage. Mit der aktuellen Auslegung wird man AMD sicher auch provozieren können, was nie gut ist.
 
Zumindest peilt man mir RDNA2 vorerst das obere Segment an, dass sich Nvidia dort anders aufstellt ist sicher nicht nur nur deren "lange Weile" geschuldet. Navi 10 lebt ja lt. Gerüchten in einem Refresh weiter, dass es der gleiche 7nm Node wird ist unglaubhaft.:D
 
Mach du das mal und ziehe die deaktivierten Cluster ab, Effizienz errechnet sich nicht nur an dem Verbrauch einer theoretischen Transistoranzahl. Und dann bitte Takt bereinigen! So war schon immer.:D

Die größte Steigerung bringt wohl FP32 mixed-precision DL mit, was vorerst ziemlich speziell ist und das war's auch schon. Also Holzauge sei wachsam.

Habe ich schon in einem anderen Thread, +77% bzw. +79 % Perf/Watt, wenn der Chip hochgradig ausgelastet wird. Und nein, hier irgendwas mit FP64 oder FP32 zu berechnen ist nicht zielführend, da das den Chip nicht hochgradig auslastet.
Ich erwähne solche Zahlenwerte nicht auf blauen Dunst hin. ;-) Und ja, korrekt, die Tensor Cores v3 lasten mit ihrem deutlich gewachsenen Funktionsumfang und dem größeren Flächenbedarf den Chip weitaus umfangreicher aus und mit denen lassen sich die Effizienzgewinne auch sehr gut demonstrieren. Und entsprechend hat nVidia hier tatsächlich mit der neuen Architektur in Verbindung mit dem modernen Fertigungsprozess beträchtliche Effizienzzugewinne realisieren können.

Zumindest peilt man mir RDNA2 vorerst das obere Segment an, dass sich Nvidia dort anders aufstellt ist sicher nicht nur nur deren "lange Weile" geschuldet. Navi 10 lebt ja lt. Gerüchten in einem Refresh weiter, dass es der gleiche 7nm Node wird ist unglaubhaft.
biggrin1.gif

Begrüßenswert ist das allemal, denn eine Quasimonopolstellung ist immer negativ zu bewerten.
Bezüglich dem vermeintlichen Refresh bleibt AMD nur der N7P oder ab Anfang 2021 der N6, mehr nicht. Den N7+ werden sie zweifelsfrei nicht verwenden, weil das in jeder nur erdenklichen Sicht ineffizient wäre. Anzunehmen ist, dass der Refresh um ein paar kleinere Features gepimpt wird (bspw. ein paar Anpassungen in der Cachestruktur für ein paar Prozent mehr Performance) und zumindest intern zu RDNA1.2 wird und es bleibt beim N7P.
Der Refresh würde zudem auch gut zu dem Gerücht passen, dass es bei AMD vorerst kein Raytracing im Midrange-Segment geben wird, aber das wird man vorerst abwarten müssen.
 
Zuletzt bearbeitet:
Auf jeden Fall kleiner als angekündigt (weil man da noch von noch nie dagewesen sprach) und vor allem auf PG132 zugeschnitten, wegen dem Platzbedarf. Ob die wirklich kommt und nicht doch einfach Fopperei von Nv ist, weiß kein Mensch. Irgendeine Designstudie...

Edit sagt: ... du siehst wo der Lüfter hinkommt.

Ich habe geglaubt, gestern auf Reddit auch ein Bild von der Unterseite des Kühlers gesehen zu haben, während hier bei pcgh nur die Oberseite gezeigt wurde. Da ich das Bild aber jetzt nicht mehr finde, entschuldige ich mich für die vermutlich falsche Aussage.
 
jhawrkr3k6451.jpg 2eycj8jnpo351.jpg
weis jetzt nicht ob ihr die Bilder schon kennt.


ZITAT:
(RTX 3080 PCB recreation with HBM2E)
The new Ampere-based GeForce RTX 3000 series cards will reportedly offer more VRAM on all cards, so we could see:
NVIDIA GeForce RTX 3070 - 12GB
NVIDIA GeForce RTX 3080 - 12GB
NVIDIA GeForce RTX 3080 Ti - 16GB
 
Habe ich schon in einem anderen Thread, +77% bzw. +79 % Perf/Watt, wenn der Chip hochgradig ausgelastet wird. Und nein, hier irgendwas mit FP64 oder FP32 zu berechnen ist nicht zielführend, da das den Chip nicht hochgradig auslastet.
Ich erwähne solche Zahlenwerte nicht auf blauen Dunst hin. ;-) Und ja, korrekt, die Tensor Cores v3 lasten mit ihrem deutlich gewachsenen Funktionsumfang und dem größeren Flächenbedarf den Chip weitaus umfangreicher aus und mit denen lassen sich die Effizienzgewinne auch sehr gut demonstrieren. Und entsprechend hat nVidia hier tatsächlich mit der neuen Architektur in Verbindung mit dem modernen Fertigungsprozess beträchtliche Effizienzzugewinne realisieren können.
O.k., darüber zu diskutieren bringt an der Stelle sicher nichts, weil man die AI Workloads nicht auf Ampere Gamer übernehmen kann. Zumal GA100 (A100) niedriger taktet. Ein Teil des Durchsatzes ist auch dem SI zuzuschreiben (6 Stack statt 4) und der L-Cache ist gewachsen, weil auf erstgenannte WL optimiert.

Ich vermute zumindest, dass dies nicht unbedingt für Amperegamer gilt, wobei Volta eben doch schon zwei Gens alt ist, wenn man es richtig nimmt. Die Tensorkerne sind in ihrer schieren Anzahl pro SM gesunken (von 8 auf 4), können aber eben mehr FMA Operationen durchführen (ich glaube das ist fast zu belangslos fürs Gaming), spart aber immens.

Ob das fürs Gamingssegment releavant ist werden wir sehen...wenn dann eher aus der Cloud heraus, zeigt aber das die Effizienz von GA100 hier kaum restlos zu übernehmen ist, zumal wir nicht wissen wie's um die RT Cores steht.

Ich habe geglaubt, gestern auf Reddit auch ein Bild von der Unterseite des Kühlers gesehen zu haben, während hier bei pcgh nur die Oberseite gezeigt wurde. Da ich das Bild aber jetzt nicht mehr finde, entschuldige ich mich für die vermutlich falsche Aussage.
Musst du bei mir sicher nicht. Wie groß viel denn aus was du gesehen hast?

weis jetzt nicht ob ihr die Bilder schon kennt.
:D interessant oder? Igor meinte GDDR6 (X) sei so gut wie sicher. Die Jedec Specs darf er so nicht veröffentlichen (hatte ich so verstanden).
 
Zuletzt bearbeitet von einem Moderator:
So laut Igor. Ist die TDP also alles, die NVidia bei der derzeitigen Titan selbst angibt.

Dann müsste die Karte doppelt so schnell werden wie die jetzige Titan, also 100 Prozent. Wer glaubt das? Sieht eher so aus als wenn sie 30 Prozent schneller wird und mehr verbraucht.

Nope, genau hinsehen, da steht TBP also Board Power, da ist dann alles mit drin und wenn man sich den fetten Chip, den vermutlichen Takt,
den neuen GDDR6X Speicher und so ansieht, der pro Block wohl alleine so 2.5Watt zieht, dann kommt ebnen einiges zusammen, erst recht, wenn es auch ordentlich was leisten soll.

Bei der TDP wird meist nur der GPU Chip angegeben, da dieser der mit Abstand grösste Heizer und Fresser ist.
 
Anhang anzeigen 1092556 Anhang anzeigen 1092555
weis jetzt nicht ob ihr die Bilder schon kennt.


ZITAT:
(RTX 3080 PCB recreation with HBM2E)
[FONT=&]The new Ampere-based GeForce RTX 3000 series cards will reportedly offer more VRAM on all cards, so we could see: [/FONT]
[FONT=&]NVIDIA GeForce RTX 3070 - 12GB[/FONT]
[FONT=&]NVIDIA GeForce RTX 3080 - 12GB[/FONT]
[FONT=&]NVIDIA GeForce RTX 3080 Ti - 16GB[/FONT]

Und die ganzen HBM und Interposer Heater würden auf einmal verstummen. Einen Tag später wäre es dann die genialste Erfindung von NVidia und kaum zu toppen.

Wenn das hier geht warum eigentlich nicht und GDDR6 kann trotzdem dabei sein. Alles unter der 3070/3080. Bring das bitte NVidia ich will hier lesen wie toll das dann ist.
 
Nope, genau hinsehen, da steht TBP also Board Power, da ist dann alles mit drin und wenn man sich den fetten Chip, den vermutlichen Takt,
den neuen GDDR6X Speicher und so ansieht, der pro Block wohl alleine so 2.5Watt zieht, dann kommt ebnen einiges zusammen, erst recht, wenn es auch ordentlich was leisten soll.

Bei der TDP wird meist nur der GPU Chip angegeben, da dieser der mit Abstand grösste Heizer und Fresser ist.

Das ist doch völlig egal ich meinte alles oder verbraucht bei dir beim Spielen nur der Chip was? NVidia gibt TDP an. Kannst du gerne nachlesen auf der Titan Seite. Dann schummeln die da schon wenn TBP mehr ist.
 
NVidia gibt TDP an. Dann schummeln die da schon wenn TBP mehr ist.

TDP ist Spielelast Nv beschreibt es so:
Nvidia schrieb:
TDP ist das Maß der maximalen Leistungsaufnahme über die Zeit in realen Anwendungen. TDP repräsentiert nicht die maximale Leistungsaufnahme in pathologischen Fällen wie Furmark

Sie verweisen dabei auf wikipedia.

Man könnte es also als average ansehen, wenn du GPUZ mitlaufen lässt, max Peaks current können dabei höher ausfallen.

Typical Bordpower ist der reale Verbrauch unter Anwendungen und Spielen, also das gleiche. Unter Powerviren ziehen die Karten alle mehr. Die TDP der RTX Titan, also reale Leistungsaufnahme über die Zeit ist 280w. Peakpower sind 303w (hab ich hier schon oft angesprochen aber man meint das sei nicht so).

Wenn Igor also die TDP hat wäre das realer Spieleverbrauch, wenn er max Load (Peak) hat oder wofür eine Platine ausgelegt werden muss, dann nicht.
 
Zuletzt bearbeitet von einem Moderator:
RTX 3060->599€
RTX 3070->699€
RTX 3080->899€
RTX 3080ti->1.399€

man rechtfertigt die erhöhten Preise mit mehr VRAM, Lieferschwierigkeiten der Zulieferer, neue 7nm Fertigung, und Fachkräftemangel der Entwicklungsabteilung da die halbe Belegschaft ein halbes Jahr lang Corona hatte.

Jeder der sich eine GTX 1080ti für 1440p gekauft hat, freut sich dass die Kohle sau gut investiert ist.
 
RTX 3060->599€
RTX 3070->699€
RTX 3080->899€
RTX 3080ti->1.399€

man rechtfertigt die erhöhten Preise mit mehr VRAM, Lieferschwierigkeiten der Zulieferer, neue 7nm Fertigung, und Fachkräftemangel der Entwicklungsabteilung da die halbe Belegschaft ein halbes Jahr lang Corona hatte.

Jeder der sich eine GTX 1080ti für 1440p gekauft hat, freut sich dass die Kohle sau gut investiert war.

Ich bin von einer 2080 auf einer 5700XT umgestiegen, der Unterschied ist minimal. Worauf ich hinaus will: Wer das letzte an FPS haben möchte, kauft sich ne Nvidia, wer nicht immer den längsten haben muss, kauft AMD.
 
RTX 3060->599€
RTX 3070->699€
RTX 3080->899€
RTX 3080ti->1.399€

man rechtfertigt die erhöhten Preise mit mehr VRAM, Lieferschwierigkeiten der Zulieferer, neue 7nm Fertigung, und Fachkräftemangel der Entwicklungsabteilung da die halbe Belegschaft ein halbes Jahr lang Corona hatte.

Jeder der sich eine GTX 1080ti für 1440p gekauft hat, freut sich dass die Kohle sau gut investiert ist.
Dann scheint der Kühler real zu sein und für Custom darfst du 100 bis 150 draufrechnen. 3060 und 3070 sind viel zu teuer. AMD wird's freuen.
 
TGP, Total Graphics Power heißt es bei NV. Das sind alle Werte von 12 V drin. Alle. Maximum. ��
 
Hm, das ist aber auch ein Stück. Soweit ich weiß hat die 2080 eine Aufnahme von 225 Watt (was für die Leistung eigentlich gut ist, anbei), daß da der Nachfolger 350 Watt schlucken soll, das hört sich nun viel an.
 
Zurück