Geforce RTX 4000: Lovelace angeblich ohne größere Architektur-Änderungen

@gerX7a

Zu deinem letzten Absatz "Auch wenn RDNA3 haushoch überlegen wäre...."

Nein das kann ratzfatz passieren, es müsste nur z.B. Samsung einen auf Intel machen und seinen GDDR7 Speicher erst mit deutlicher Verzögerung auf den Markt bringen, oder größere Lieferprobleme treten auf und es kann nicht die benötigte Menge geliefert werden, was in der gegenwärtigen Situation gar nicht so unwahrscheinlich scheint.
Nvidia ist da auf Gedeih und Verderb den Speicherherstellern wie z.B.: Samsung, Micron, Hynix etc. ausgeliefert und benötigt zwanghaft immer das neuste vom neusten, um überhaupt oben mithalten zu können.

AMD ist da hingegen, grössten Teils, zumindest was den GDDR Speicher anbelangt, autark und benötigt Dank IF-Cache lediglich stinknormalen in großem Volumina gefertigten GDDR6 Speicher.

Deshalb falls sich die Gerüchte bewahrheiten sollten, das RDNA3 den größten Leistungssprung seit langem bringt, kann das wie gesagt sehr schnell wieder in Richtung 30% gehen und bei der kleinsten, wie bereits erwähnten zusätzlichen Schwäche kann sich der Marktanteil auch schnell in Richtung 30-40% bewegen.
Nein, kann es definitiv nicht. Es gibt die feuchten Träume einiger Fans und auf der anderen Seite gibt es schlichte, nüchterne wirtschaftliche Realität; das sind zwei komplett unterschiedliche Welten ... was übrigens AMD in den letzten Jahren immer wieder aufs Neue bestätigt hat.

Btw, was bitteschön soll Samsung hiermit zu tun haben? Nach bisherigem Kenntnisstand kooperiert nVidia weiterhin mit Micron im HighEnd.
Und dann noch gleich der nächste Fehlgriff bei dir, denn nVidia ist hier nicht mehr oder weniger irgendwem ausgeliefert als AMD. *) Der IF-Cache ist schlicht ein L3$, eine zusätzliche Cache-Stufe in der Hierarchie und damit etwas, was jeder, wenn er denn wollte, implementieren könnte. Daran ist nichts neu (außer vielleicht der Name ;-) **) und du scheinst auch komplett AMDs Grund für dessen Implementation zu verpeilen, denn hier geht es im Wesentlichen um eine günstige Fertigung und weniger um zusätzliche Performance, denn die liefert der Cache nicht, sondern der soll lediglich, das herunterskalierte SI kompensieren.

Wie gesagt, einen übermäßigen Vorsprung von AMD wird es zweifellos nicht geben, was schlicht daran liegt, dass der Martkkführer das nicht zulassen würde. Und auch wenn es in deiner Welt als AMD-Fan unbegreiflich erscheint, aber nVidia hat ganz offensichtlich noch längst nicht sein GPU-Repertoire ausgeschöpft, wenn das, was bei Consumer-Lovelace bisher durchgesickert ist, zutreffen sollte, d. h. die könnten noch viel mehr, wollen es aus Kosten-/Margen-Gründen jedoch anscheinend nicht und das, weil sie es offensichtlich auch noch nicht nötig haben (ihrer Einschätzung der Konkurrenzsituation zufolge).

Dein einziger Hoffnungsschimmer hier ist, dass das "nicht nötig haben" weitaus mehr eine wirtschaftliche als rein leistungstechnische Komponente ist, denn nVidia wie auch AMD geht es primär darum möglichst viel mit möglichst guter Marge zu verkaufen und da könnte es auch in die Kalkulation passen dem Konkurrenten das obere 3 %-Segment zu überlassen, dafür aber mit den eigenen Produkten die effizientere Entwicklung/Fertigung zu haben. (Den größeren Absatzmarkt hat nVidia so oder so, daran würde selbst ein sehr gutes RDNA3 nichts ändern.)

Einfach mal zurücklehnen und abwarten ob sich nVidia hier verschätzt hat oder nicht. Es bleibt auf jeden Fall spannend. Was du und einige andere hier jedoch versuchen, ist schon wieder Vorschusslorbeeren zu verteilen und das ging bereits in 2020 schief ... ja, ja, gleich werden wieder selektierte Benchmarks zitiert, ist für die beiden Firmen aber vollkommen irrelevant, da die nur die Gesamtsicht des Marktes auf deren Produkte interessiert und der Martk kauf hier weiterhin mit erschlagender Mehrheit nVidia-Produkte. Entsprechend ist AMD mit RDNA3 erst mal in der Bringschuld.


*) Bzw. konkret ist nVidia eigentlich gar ein wenig weniger abhängig, denn die kaufen den Speicher gleich mit ein und als Großabnehmer (vermutlich auch direkt von der Quelle) haben die einen ganz anderen Hebel bei den Herstellern als die vielen, einzelnen Boardhersteller, die sich für die im Vergleich dazu wenigen zu fertigenden AMD-Karten den Speicher selbst kaufen müssen. (Noch mal zur Erinnerung, von fünf verkauften GPUs handelt es sich bei vier GPUs um nVidia-Produkte.)

**) Besonders ist bestenfalls, dass AMDs Marketing sich berufen fühlte einem simplen Cache einen eigenen Namen zu geben. Das lag voraussichtlich daran, weil man dem etwas technisch spezielles, magisches andichten musste, weil man sonst befürchtete, dass trotz der messbaren Kompensation des Leistungsverlustes des SI einige Anwender vielleicht ob der im Raum stehenden Zahl von nur einem 256 oder gar 192 Bit-Interface kategorisch abgeschreckt worden wären. (Ist in etwa das gleiche psychologische Thema, wie dass es bei einigen unbedingt HBM sein muss/soll, egal welche Bandbreite, hauptsache HBM ;-)) Am Ende ist das ein simples Beispiel wie das Marketing tickt und wie man das Konsumentenverhalten einschätzt, nicht mehr und nicht weniger.
Aber man möge den witzigen Gedanken mal fortsetzen und sich ausmalen, wenn Intel bei Sapphire Rapids SP mit vier neuen spektakulär klingenden Namen für den L1$ bis L4$ ums Eck käme und hier vollmundig das Schlangenöl heraufbeschwört. ;-)

Intel dominiert die nächsten jahre.
Sieht man an nVidia und AMD in Panik bringen die nur noch Luftschlösser und Concept Bling Bling Blend.
Intel hat einen Plan und AMD-nVidia stehen nur noch mit offenen Mund da.
War das versuchte Satire? Die werden sicherlich Marktanteile gewinnen, aber auch bei denen wird das Zeit brauchen, selbst mit guten Produkten. Ein regelrechtes, explosionsartiges Gewinnen von Anteilen wäre nur möglich, indem man dort sehr viel Geld in die Hand nehmen würde, bspw. indem Battlemage auch als Desktop-MCM im N3 gefertigt werden würde, aber das halte ich für recht unwahrscheinlich, schlicht weil Intel solche Schritte nicht nötig hat. Die verdienen Milliarden und werden hier in diesem Segment eher die goldene Mitte zwischen dem Gewinnen von Marktanteilen und den damit verbundenen, notwendigen Kosten wählen um trotz des Markteintritts dennoch etwas zu verdienen. Mit Xe planen die langfristig ... entsprechend haben die hier auch Zeit (und die Ressourcen sowieso), d. h. hier muss man nicht auf Kosten des Umsatzes was überstürzen.
 
Zuletzt bearbeitet:
Intel dominiert die nächsten jahre.
Sieht man an nVidia und AMD in Panik bringen die nur noch Luftschlösser und Concept Bling Bling Blend.
Intel hat einen Plan und AMD-nVidia stehen nur noch mit offenen Mund da.
Ja genau... hat man ja gesehen wieviel Plan Intel hat und wieviel Pläne in der ominösen Schublade gelegen haben ;)
Das Konzept von Intel hat was, das sieht sogar alles sehr gut aus, aber da sind noch zuviele Fragezeichen dahinter.
Nvidia und AMD haben bereits was erreicht im GPU Markt... Intel noch so gut wie gar nix.
 
240 Ray Accelerators heißt für mich 3-fache RT Leistung von Navi 31 im Falle dass da wirklich so viel RA's kommen! Und Faktor 2,5 als Rasterleistung gilt ja fast gesetzt! Wenn das so zutrifft reichts nicht für Nvidia!
ssagtmal wann kapiert ihr das endlich mal.....
mcm ist im gpu segment komplett neu ergo muss diese neue technik erstmal in spiele tests zeigen das die ps auch auf die straße ankommt.....
man hat hat ja bei ryzen 1 gesehen welche probleme es gegeben hat erst mit ryzen 3 waren se dann ordentlich vorbei
das gleiche kann jetzt im gpu segment passieren

es wird hier so abgetan als wüsste nvidia nicht was se tun....nur komisch das se jetzt seit jahren an der spitze stehen...
die wissen schon was se tun
wenn die der meinung sind das geringfügige änderungen aus reichen plus die shader erhöhen, plus wesentlich höhrer takt und powerlimit dann ist das so die können das wesentlich besser beurteilen analysieren und haben das wesentlich bessere know how als solche hobby forum user die meinen alles besser deuten zu können.....

und zu der 2,5 fachen leistung das die gesetzt sein soll zeig mir doch mal verlässliche quellen und fakten wenn dass ja gesetzt ist....
bleiben wir mal bei der realität
sollte alles gut laufen können wir so 80 bi 100% erwarten
mehr wirds nicht gibt auch der fertigungsprozess nicht her
 
amd ist wo weit vorne mit rdna3 da versucht es nwieder einfach erst gar nicht
7900xt-7600xt nimmt den high end markt ein und dahinter können sich nwieder n intel streiten
na dann erleuchte uns doch mal mit fakten und quellen die das verifizieren das mad ja soweit vorne is.....
das ist mit rdna 2 schon mächtig in die hose gegangen
ja rdna 2 ist gut und auf nvidia niveau aber von überholen keine spur wurde ja damals ja auch prophezeit das rdna2 ampere nur dich rücklichter zeigt und was wurde daraus alles nur heiße luft und ampere bleibt trz vorne

nochmal vllt kaperen es auch die letzten
1. nvidia weiß ganz genau was sie tun nicht umsonst is deren unternehmen an der börse soviel wert und haben so hohen finaziellen erfolg und so einen enormen marktanteil
2. die großen gewinne macht man in der low und mittelklasse und nicht im high end markt
die käufer der high end gpus liegt im sehr kleinen einstelligen prozent bereich
der mainstream kauft eben nur die kleinen karten und da wird nun mal der gewinn gemacht.....
 
BB.jpg


Ich versteh den ganzen Hate gegen DLSS nicht ....es ist keiner gezwungen DLSS zu nutzen, aber es ist nun mal unbestreitbar, daß dieses Feature über spielbar und unspielbar entscheiden kann. Besonders die kleineren RTX Karten profitieren gut davon. Und das Ergebnis ist weit davon entfernt super gruselig zu sein.

CP PCGH.jpg

Und jetzt ne RTX 2070 super mit DLSS



 
Gefühlt macht Nvidia schon "seit 1000 Jahren" - einmal grundlegende Architekturverbesserung und bei der Generation darauf kommt dann hauptsächlich ein kleinerer Fertigungsprozess und da und dort vielleicht ein paar Kernchen und ein paar Shaderchen mehr.
Jain!
Die Fertigungsprozessverkleinerungen wurden meist für Refreshes verwendet um die Effizienz zu steigern.

Die Architektur selbst wurde bei jeder neuen Iteration im großem Umfang geändert. Die Sprünge von Kepler - Maxwell - Pascal waren gigantisch. Ab Turing hat Nvidia das Konstrukt mehr in Richtung Software + Hardware aufgeteilt. Fortan gab es hardwarebasierte Tensor- und RT-Kerne und deren Anwendungen DLSS und Raytraycing/Denoising.
-Das ist mehr als ein paar Shaderchen und nimmt viel Platz auf dem GPU-Die weg.

Aktuell sind wir bei Ampere, der im Prinzip ein aufgebohrter Turing-Nachfahre geworden ist. Trotz der lausigen Verfügbarkeit und abartiger Preise würde man technisch Ampere vorziehen. Jetzt kommt Lovelace und wird höchstwahrscheinlich Ampere auf Steroiden.

Viel ändern muss man da auch nicht unbedingt. Vielmehr gilt es die Flaschenhälse und experimentellen Teilebereiche auszumerzen. Am Besten wird sogar alles noch einmal perfektioniert, was am Ende viel Performance freilegen könnte - abseits von der Fertigungstechnik.

Abgesehen von der abartigen TDP, sieht das bisher gut aus. Aber das ist auch bei AMD kaum anders. Scheint ein Generationsproblem zu werden.
 
Ein monolithischer Chip benötigt weniger Energie.
Wie oft willst du noch diese halbgare Weisheit runterbeten???

Scheinbar hast du irgendwo mal was gehört und dachtest dir dann, "Toll! Das brauche ich!!!!", oder wie soll man sich das vorstellen? Ein monolithischer Chip wird erfahrungsgemäß weniger Transistoren (und vermutlich damit Shader) aufweisen, als zwei MCM Module und daher wird dieser mehr Takt benötigen als das MCM Modul und damit muss der monolotischische Ansatz aus der Komfortzone, was in ineffizienter macht. Wenn du dieses einfache Rechenexempel nicht endlich verstehst, disqualifizierst du dich hier für jede weitere Antwort!

Sieht man im übrigen auch an der Tabelle von Greymoon, AMD wird wohl seit ganz langer Zeit erstmals größer, da dann auch deutlich, als Nvidia ausfallen, bisher hatte AMD sehr oft einen Vorteil was die Größe des Chips anging, der GA102 ist mit 628mm2 riesig, der A102 wird ebenfalls in dieser Größenordnung geschätzt (trotz Shrink auf 5nm), AMD hingegen wächst von 520mm² auf wahnsinnige 800mm² und wird damit soviel mehr Schaltungen unterbringen. Meine These lautet nun, dass man damit die GPU mit Shadern zukleistert, die vorhandenen Shader dafür im Takt zügelt, was widerum ein Effizienzgewinn bringen würde.
Jetzt die große Frage, an den Experten, warum ist MCM denn eine grds. Lösung vieler Probleme? (bevor du auf die schlaue Idee kommst, zu behaupten MCM ist keine Lösung, NV arbeitet auch dran!)

Aber noch einmal zur Erklärung, deine faktische Auslegung der Tatsache, dass ein monolithischer Chip effizienter ist, ist so komplett falsch und basiert auf sehr vielen weiteren Annahmen, die du nicht nennst. "Ein monolithischer Chip kann effizienter sein, weil er eben keinen Interposer oder ähnliches benötigt" wäre eine zutreffende Aussage, genau so wie, ein MCM Design kann effizienter werden, da mehr Shader und weniger Takt in der Regel effizienter zu Werke gehen, als weniger Shader und viel Takt! Daher vermutet man auch, dass AMD den MCM Ansatz nur beim Flagschiff bringen wird, evtl. noch beim kleinen Bruder, aber bei allen Chips die drunter lagern, eher nicht!
Aktuell sind wir bei Ampere, der im Prinzip ein aufgebohrter Turing-Nachfahre geworden ist. Trotz der lausigen Verfügbarkeit und abartiger Preise würde man technisch Ampere vorziehen. Jetzt kommt Lovelace und wird höchstwahrscheinlich Ampere auf Steroiden.
Ist dem so?
Hat Ampere nicht doch durchaus tiefgreifende Änderungen durchlebt? Kam nicht bei Ampere die Verdoppelung der FP32 Einheiten?
 
Zuletzt bearbeitet:
@BigBoymann du argumentierst gerade nicht ernsthaft auf Basis von Gerüchten?
Es sollte doch selbst dir auffallen, wie unsinnig das ist.

Hier mal ein rein theoretisches Beispiel:
Du hast einen monolithischen Chip mit 1000 Transistoren und 500W Verbrauch.
Den teilst du nun in zwei Module à 500 Transistoren mit 250W Verbrauch auf. Jetzt fehlt dir trotzdem noch die Schaltung für die Kommunikation der beiden Chips, die auf die 2x250W noch on top kommt. Du benötigst am Ende also mehr Energie.

Jetzt kannst du natürlich mehr Transistoren unterbringen, aber damit steigt ebenfalls dein Verbrauch.
Ein und das selbe Chipdesign verbraucht als monolithische Variante weniger Energie.
Ich kann auch eine 3080 TI mit 500W+ laufen lassen und bin damit schneller als eine 3090, aber was hat das damit zutun, ob es ein monolithischer Chip ist oder mehrere Module?

Glaubst du der IO Die auf dem 5900/5950X benötigt keine Energie?
Im HWLuxx hat sich mal jemand die Mühe gemacht und den 12900K mit weniger als 50W laufen lassen. Das selbe hat er mit einem Ryzen mit meheren Modulen versucht und ab einem gewissen Punkt lief Windows nicht mehr sauber, weil nicht genug Energie zur Verfügung stand, um alle 3 Chips zu versorgen.
Mit dem 12900K konnte er noch problemlos Battlefield zocken. Merkste was?

Wenn MCM so viel besser und effizienter ist, wieso haben haben Intel, AMD und Nvidia nicht schon viel früher damit angefangen?
 
Zuletzt bearbeitet:
Das stimmt. Und so weit ich weiß gilt das immer noch (DLSS ist RTX exklusiv). Ob das technische oder marketing Gründe hat... wer weiß.

Doch, die GTX1660 hat schon Tensor Kerne, aber vlt. zu wenige?
Ich hatte noch keine GTX 1660...aber laut PCGH gehört sie zwar zur Turing Familie muß aber ohne Raytracing/Tensor Kerne auskommen.
 

Anhänge

  • GTX 1660.jpg
    GTX 1660.jpg
    73,9 KB · Aufrufe: 11
@BigBoymann du argumentierst gerade nicht ernsthaft auf Basis von Gerüchten?
???

Du argumentierst aber nicht wirklich, weil du diese Gerüchte für voll nimmst??
Sorry, aber du scheinst nicht Willens (ich spreche mal nicht die Frage aus, ob du nicht in der Lage bist) auch nur im Ansatz eine Diskussion mit fachlichem Inhalt zu füllen. Genau dein Beispiel
Hier mal ein rein theoretisches Beispiel:
Ein monolithischer Chip kann effizienter sein, weil er eben keinen Interposer oder ähnliches benötigt"
habe ich beschrieben!

Aber ich habe eben zu deiner Aussage, die faktisch war und keinerlei Spielraum ließ, eine andere Wahrheit geschrieben, nämlich das (auch im CPU Bereich gesehen, bspw. am extremsten im EPCY Sektor), viele Kerne mit wenig Takt um ein vielfaches effizienter zu Werke gehen können, als wenig Kerne mit viel Takt. Das holt jeglichen Interposer wieder ein!

Im HWLuxx hat sich mal jemand die Mühe gemacht und den 12900K mit weniger als 50W laufen lassen.
Wo ist jetzt das Problem??? Der 5900X läuft ganz problemlos mit weniger als 50W (unter Vollast) wenn man ihn gescheit einstellt. Es gibt halt Intel Spezialsisten die man besser nicht an AMD lassen sollte. Aber ganz im Ernst, das führt zu nichts. Denn deine Aussage ist Quatsch, weil Infos und Bedingungen fehlen. Ein Epyc 64 Core mit einem Intel 28 Core zu vergleichen macht eben auch keinen Sinn, weil entweder ist der Epyc mehr als doppelt so schnell, oder gleich schnell und wesentlich, also wirklich wesentlich effizienter unterwegs.
Wenn MCM so viel besser und effizienter ist, wieso haben haben Intel, AMD und Nvidia nicht schon viel früher damit angefangen?
Kosten!!!
Ein monolithischer Ansatz verbraucht weniger Chipfläche, der Interposer muss nicht konstruiert werden udn es gibt auch abseits der reinen Belichtung eine Menge Probleme. Daher schreibe ich ja auch recht konsequent davon, dass aus hardwaretechnischer Sicht AMDs RDNA3 (zumindest nach den Gerüchten) vermutlich überlegen sein wird. Das muss aber eben in der Praxis nicht so aussehen, denn es gab schon oft einen nicht gerade geringen Vorteil der Hardware bei AMD/ATI und man konnte nur zu selten Kapital draus schlagen.
 
Zurück