Man könnte ja mit der Bandbreite spielen und PCIe 4.0 mal unterstützen. Hat wohl den Anschein das der Großteil der Fläche für RT draufgeht, wie schon unter Turing.
Die Ampere-GPUs werden mit hoher Wahrscheinlichkeit durchgehend PCIe 4 unterstützen; die Frage dürfte sich gar nicht stellen. Einzig bei den Entry-Level-Modellen könnte es aus Kostengründen (wie auch bei AMD) Einschränkungen geben, entweder bzgl. des unterstützten Standards oder aber bzgl. der verfügbaren Lanes.
Die Flächenabschätzung bzgl. Ampere ist noch ungewiss, schlicht weil hier unklar ist, wie nVidia RT auf Ampere ausgebaut hat, jedoch bzgl. Turing ist die Aussage falsch. Der flächentechnische RT-Anteil bei Turing ist vergleichsweise klein, wie bei einem Vergleich mit dem TU116 abgeglichen werden kann (bei Turing liegt der zus. Flächenbedarf für RT Cores UND Tensor Cores bei +5 % bis +10 %, mehr nicht).
Ich vermute AMD hat da Nv einen Strich durch die Rechnung gemacht, wenn es so kommt. Das man gleich mit dem 102 kommt und eine 3080 auf GA102 Level verschiebt, deutet schon irgendwie darauf hin.
Dass nVidia hier überrascht wurde, erscheint eher wenig wahrscheinlich, schlicht weil schon lange absehbar ist, wo die Reise für AMD hingehen muss, wenn man bei GPUs wieder mehr Präsenz zeigen möchte. Darüber hinaus ist die Zuweisung RTX 3080 auf GA102 vorerst nur ein Gerücht, aber selbst wenn die stimmen sollte, sagt das noch nichts über etwaige "Notstände" bei nVidia aus

. Hierbei kann es sich einfach nur um eine kosteneffiziente Fertigungsmaßnahme handeln, denn bspw. den TU104 für über ein Jahr nur für die RTX 2080 und die Quadro RTX 5000 zu verwenden, war möglicherweise nicht die effizienteste Wahl. Man musste einen dedizierten Chip fertigen lassen für ein Produkt, das selbst im Consumer-Segment problematisch platziert war, da hier Interessenten vielfach zwischen der Entscheidung standen: nur etwas weniger Leistung aber dafür auch deutlich sparen mit einer RTX 2070 oder aber auf der anderen Seite ein ordentliches Leistungsplus und noch mehr zahlen mit einer RTX 2080 Ti.
Vielleicht will Nvidia das Ti ja auch einfach endgültig loswerden.[...]
Das wäre nicht unwahrscheinlich, insbesondere, wenn man sich für 2021 erneut eine Art Super-Refresh vorbehalten möchte. Ein mögliches
RTX 3080 Ti Super wird dann schon arg sperrig.
Die haben aber 16GiB HBM2 wie jeder weiß, ala RVII [...]
Für mich sieht das aus wie Turing, in kleiner bei höherer Density in 7nm (irgendetwas Nv angepasstes), daher auch GA102 in voller Bandbreite um überhaupt deutlichere Leistungsteigerungen in Einzelsegmenten zu suggerieren. [...]
Also aktuell "weiß" keiner was von HBM2 bei AMD; es ist nach wie vor nur ein Gerücht, sogar eher wahrscheinlich, aber das ist damit dennoch kein Wissen bzw. Fakt.
Darüber hinaus fehlen für die weiteren Abschätzungen konkrete Zahlen, da der schlichte Name GA102 nichts aussagt. Annehmen kann man lediglich, dass es sich um den größten Ampere-Chip handelt, der für die Segmente
Gaming und
Professional Visualization genutzt werden wird und bspw. wenn der tatsächlich für eine RTX 3080 mitverwendet werden wird, dann werden dort wohl etliche SMs deaktiviert werden (analog der RTX 2070 Super).
Darüber hinaus würde ich in einer konservativen Schätzung davon ausgehen, dass der GA102 etwa um die doppelte Anzahl Transistoren haben wird im Vergleich zum TU102 und das sieht dann doch eher nicht nach einem einfachen Turing-Shrink aus.

Mit wesentlich weniger kann nVidia auch gar nicht ums Eck kommen, da sie die Leistung schon alleine für ihre neuen Quadro's brauchen und die geteilte Chip-Basis benötigen sie für eine effiziente Fertigungskostenteilung.
Darüber hinaus ist aber zudem meines Wissens nach auch immer noch nicht gesichert wie und wo gefertigt werden wird. Auch zu Samsung gab es umfangreiche Spekulationen und so wird man abwarten müssen, was am Ende konkret abgeliefert werden wird. Unterm Strich gibt es aber bisher keinen Grund anzunehmen, dass nVidia hier sowohl als Marktführer als auch als Leistungsführer "überrannt" werden wird. Im besten Fall wird AMD wieder im HighEnd mitspielen können, vielleicht sogar ein paar wenige Prozentpunkte vorne liegen können, jedoch mehr erscheint mit Blick auf ihren bisherigen Rückstand vorerst reine Spekulation.
[...]Warum Nvidia am Vram geizt (v.a. solange sie DDR verbauen und kein HBM) versteh ich nicht.[...]
100% sicher sein kann man nicht, aber gemeinhin geht man davon aus, dass die kleineren Karten (<= GA102) über kein HBM-Interface verfügen werden (so zumin. dieses Jahr/in dieser Generation bei nVidia).
Der Grund ist relativ einfach: Die Fertigung wird teuerer, die Marge sinkt und die Speichermenge wird im Mainstream schlicht auch nicht benötigt. Hierbei darf man nicht vergessen, dass es sich um ein Massenprodukt handelt. Wenn da einzelnen bspw. in Foren lautstark mehr VRAM verlagen, dann interessiert das wenig in Bezug auf das Design eines solchen Produktes und darüber hinaus ist es ja auch nicht so als wenn nVidia darüber nichts mehr anzubieten hätte. Das ist letzten Endes nur eine Frage des Geldes.
Und bei AMD darf man die Marktsituation nicht fehlinterpretieren. Die müssen als Underdog schlicht für einen relativ vergleichbaren Preispunkt mehr bieten, denn andernfalls gehen ihre Umsatzzahlen zurück und damit wird ein Hinzugewinnen von Marktanteilen umso schwieriger und ein umso langwierigerer Prozess und beides kann sich AMD nicht leisten; bei den GPUs noch weniger, denn bald wird Intel auch noch in den Markt eintreten und kleinere Marktanteile "abknapsen", so oder so, völlig unabhängig davon wie konkret deren Produkte performen werden und das wird AMD zweifelsfrei schmerzen, sodass man hier die eigene Position schon schnell wie möglich ausbauen sollte, solange man "nur" nVidia gegenübersteht.
16 GiB via GDDR6 sind in jeder Hinsicht unschön, weil man da nicht sinnvoll um einen 512 Bit breiten Bus herum kommt, was in vielfältiger Hinsicht teuer wird. Mehr Speicherbausteine, mehr PHY/Controller (d. h. mehr Fläche und mehr Strom), mehr Lanes, die auf dem Board unterzubrignen sind, etc. HBM ist zwar mittlerweile günstiger geworden, aber immer noch teuerer. Hier schlägt das Pendel erst bei hohen Speichermengen eindeutig zugunsten von HBM aus. Mit einem Wert von um die 16 GiB bewegt man sich derzeit gerade am problematischen Grenzpunkt. Schlecht für/mittels GDDR6 zu implementieren, aber noch realtiv gesehen etwas zu teuer um es via HBM zu implementieren. (Die Radeon VII verschwand nicht ohne Grund wieder so schnell vom Markt.) Dagegen AMD wird hier wahrscheinlich wohl oder übel in den saueren Apfel beißen müssen und etwas weniger Marge in Kauf nehmen müssen, möglicherweise, weil man auf die Leistung angewiesen ist, ggf. schlicht als Vermarktungskriterium und u. U. gar, weil man sich (vertraglich) von den Konsolen weiter absetzen muss. *) So manchem Konsumente kann das aber nur recht sein.
Beispielsweise auf Steam spielen zurzeit 71,5 - 74,5 % mit <= 6 GiB VRAM und weitere 20,9 % sind mit 8 GiB VRAM unterwegs, d. h. bestenfalls 7,6 % nutzen über 8 GiB VRAM, ein für den Massenmarkt sehr geringer Anteil. Und da bereits weitere 4,1 % auf die nVidia-typischen 11 GiB entfallen, bleibt eine relativ irrelevante Zahl an Systemen mit mehr VRAM (so bspw. die Radeon VII's und die diversen Titan's, etc.).
Vor dem Hintergrund fällt es leicht eine denkbare Kalkulation von nVidia nachzuvollziehen, die zu dem Schluss gekommen sein könnte, dass 384 Bit mit vollen 12 GiB GDDR6 das derzeit sinnvolle Maximum darstellen. Das mag dem Einzelnen nicht immer passen, jedoch fertigt nVidia keine Individualprodukte und von daher ist das auch wenig relevant für sie.
Hinzu kommt, dass sie mit 384 Bit und 18 Gbps-Bausteinen immer noch einigen Puffer haben, der ihnen ermöglicht leistungsfähigere Chips zu bauen. Spätestens jedoch bei der nächsten Generation (2022?) würde ich dann auch bei nVidia im Consumer-HighEnd HBM2 erwarten, aber wer weiß ... vielleicht überraschen die ja im Herbst, auch wenn ich das nicht für übermäßig wahrscheinlich halte.