News Neuer GDDR7-Grafikspeicher: Deutlich mehr Fps sowohl bei Raytracing als auch Rasterizing

"Aber ob die kolportierten 30 Prozent mehr FPS in Raytracing- und Rasterizing-Spielen auch so erreicht werden, ist noch fraglich."

Ist es nicht. Sie werden nicht [durch GDDR7 alleine] erreicht werden. Das hier sind nur wieder extreme cherrypicked bestcases vom Hersteller, der seinen GDDR7 bestmöglich dastehen lassen will.
Ist das am Ende nicht irgendwo egal?
Meine Nvidia wird mehr Bandbreite beim Speicher doch sowieso wieder nur sehr wahrscheinlich dafür nutzen um so wenig VRAM wie nur irgend möglich auf seinen Karten zu verbauen. :fresse:
 
@scootiewolff22
Ja.
Natürlich nicht überall. Aber manchmal ist selbst der schnelle VRAM der 4090 nicht schnell genug und wenn die 5090 noch schneller wird, muss der Speicher eine ordentlich Schippe drauf schlagen.
 
Ich könnte mir sogar vorstellen, dass man GDDR7 nutzt und entsprechend einfach den Speicherbus weiter reduziert. Dann hat man GDDR7 und am Ende trotzdem nicht mehr Bandbreite.
Das war auch mein erster Gedanke beim Artikel. Endlich kann man wieder am Speicherbus sparen, höhere Bandbreiten mit GDDR7 verkaufen und hat am Ende eine leicht höhere Speicherbandbreite.
 
"Aber ob die kolportierten 30 Prozent mehr FPS in Raytracing- und Rasterizing-Spielen auch so erreicht werden, ist noch fraglich."

Ist es nicht. Sie werden nicht [durch GDDR7 alleine] erreicht werden. Das hier sind nur wieder extreme cherrypicked bestcases vom Hersteller, der seinen GDDR7 bestmöglich dastehen lassen will.
Vermute daher auch es wurde keine (virtuelle?) RTX 4090 sondern eher eine RX 6400 genommen haben.
Schön wenig Speicher mit kleiner Anbindung (64Bit) und als Benchmark irgendwas extrem speicherlastiges.
Wenn man dann den Speicherdurchsatz stark erhöt sollten die 30% locker zu ereichen sein.
 
Nvidia großer L2 kann gar nicht die Bandbreite erhöhen da es hinter dem Si sitzt.
Das ist typisch für gpu bevor man im vram nachlädt ist die order immer L1 lädt daten vom SI und lagert daten im L2 aus.
Der große L2 hilft bei frame generation und dem SER daher vergrößert da nix an Bandbreite im Gegensatz zu cpu wo der LLC (l3) daten vorladen kann aber cpu sind out of order, gpu in order und das wird sich nie ändern.

Amd Ansatz mit dem inf cache sitz vor dem Si und quasi direkt zum vram also kann das Si die Daten vorladen bevor diese in den L1 laden.
Darum steigert dies effektiv die Bandbreite aber das ist ne frage von dem spekulativen vorladen amd gibt an 48% der vram Anbindung aus 256bit werden also effektiv 122bit treffsicher mehr Bandbreite erzeugt bsp 2,2ghz dann 33,5gb/s +18gbps =609,5gb/s bei ner rx7900gre
Ne rx7800xt schafft durch 19,5gbps dann 660gb/s
Und ja die rx7900gre ist massiv Bandbreiten limitiert sowie auch die rtx4060ti 16gb 288gb/s
Das sieht man meistens aber nicht da viele spiele gar nicht diese Bandbreite benötigen. Das wird es erst wenn ein spiel mehr als 3,5gb per frame nutzt (11-14gb vram Belegung)
amd lädt gut 10-15% mehr daten als nvidia

gut ausgeglichene Sku also chips sind aktuell

n32 660gb/s 22,5tf 500€
ad104 504gb/s 22,5tf 540€
ad103 66sm 676gb/s 33tf 860€
ad103 80sm 736gb/s 39tf 1000€

Hätte man dies anders planen können definitiv ja insbesondere die kleine chips hätte gddr6x gut getan

Die norm bei games sind aktuell zwischen 3gb - 4,5gb bei einen frame letztere aber nur in Verbindung mit dxr und größeren Auflösungen ab 1440p
Die meisten spiele laden grob 2,5 bis 3,5 frames vor je nach Treiber und gpu sku.
Amd hat tendenziell immer +15% mehr daten im vram vorliegen.
Sprich ne 10gb gpu von nvidiia entspricht einer amd 12gb sku
reicht der Speicher nicht wird folgendes reduziert je game engine LOD und Sichtweite manchmal die Texturauflösung sehr aggressiv (unscharfes Bild)

zum Thema am Schluss die rtx5090 wird definitiv der halbe gb202 werden akä gb203 96sm und das sind eben 256bit mit grob 60tf perf die echten teraflops
nvidia wird daraus 256 alu per sm machen und ne Fantasie zahl angeben von 24576 alu mit 137tf,
Daher rühren die grob +50% -65% her
real wird as ein stilstand die frage die sich stellt macht das nvidia dieses Jahr oder wartet nvidia ab bis amd rdna5 kommt und kontert mit dem gb202 160smn chip
Das der gb203 mit 96sm kommt steht sicher als was ist offen , amd rdna4 pricing wird es entscheiden ist es aggressiv passend zur ps5 pro 500€ dürfte der n48 64cu bei 559€ kommen.
Dann sind die grob 30tf die der chip kann ein Zeichen das amd mit rdna5 2025 dann 2 chips anstrebt
n61 216cu 134tf
n62 144cu 89tf
Sku daraus
n61 216cu (116tf) und 192cu (103tf)
n62 144cu (80tf) und 128cu (71tf)

amd so fp17
strix halo
igp 40cu 4,3 ghz (n3p node) 256bit si ddr5 8533 272gb/s 27,9tf (ne rx7900gre in der cpu)
Nachfolger möglicher desktop Ableger am6 mit cam2 module 256bit
igp 2026 60cu 4,5ghz ddr6 13000 416gb/s 43tf
darauf
a16 node gaa shrink 2027 120cu ddr6 16000 512gb/s 86tf

Am desktop fangen dann n71 n72 mit 4 gcd die und3 gcd also dann
n71 288cu 152tf
n72 216cu 134tf
und dann mit a16 node 2028 nochmal verdoppelte alu per gcd also dann
n81 576cu 304tf
n82 432cu 268tf

nvidia hat darauf keine Antwort bzw ich vermute nenn mcm Ansatz per auf Die gedruckt Monolithen. maxed 420mm² ab a16 node 800mm² n3 node
maxed sm möglich 216
Daher muss nvidia auf Takt gehen.
tsmc n4 kein Takt aktuelle kommende gen -22% Strom
+15% Takt n3
+15% n2
+25% a16
= 4,62ghz bei 216sm gleiche design grob 219tf

Daher erwarte ich eine design Änderung spätestens mit n2 node hohe Wahrscheinlichkeit 2 dual chips in mcm afaik dann 432sm
Taktsenkung auf 3,5ghz also grob 299tf bei 506w tbp und mit a16 Verdoppelung der alu = 598tf
Das würde nvidia vorweg laufen lassen aber starke verbrauch um die 600w sicher sein und somit kein desktop release

node Zeitpläne
tsmc
2025 n4p (läuft schon mit gb202/gb203 dual chip) +11% oder -22% Strom
2026 n3x +15% oder -30% Strom
2027 n2p +15% oder -30% Strom
2028 a16 +25% oder minus 50% Strom
samsung
2025 sf4x (sicher amd rdna4 und nvidia gb205/gb206 dual chip) +26% vs 8sf/8n
2026 sf3 (gaa) +18% oder minus 36% Strom

Was ist die Konsequenz daraus technisch hat amd sowie nvidia zwei Wege vor sich mcm oder Takt
mcm steht sicher Takt bringt hier nix mehr.
am desktop ist die rtx60 und amd rdna4 letzte entry und mid class gpu gen
AMD wird definitiv auf apu only gehen und dann nur high end dgpu anbieten ab 2027 zu rdna6
Nvidia wird definitiv alle sku bis gb206 bis 2027 anbieten dann aus dem entry markt ganz raus gehen und nur noch high end ab gr203 verbleiben dann zuerst 108sm und später doppelte also 216sm mit a16 node
Sprich amd ab 2027 mit am6 und cam2 module Vorteile flexibel ram nutzbar da 48gb und 64gb ram vram
Nachteil gpu Wechsel nur mit cpu
Alternativ intel nvidia bzw amd high end desktop mit am5
Das wird aber nicht über 2027 laufen daher eol sicher
intels so1851 unklar wohin das laufen wird sogar in die Sackgasse unklare Zukunft. sicher auch ne xe intel igp sicher mit cam2 Modul ab Nachfolger Sockel. Auch 256bit xe grafics gen3 min 64xe =8192 alu grob zwischen 30tf und 39tf
Es läuft darauf hinaus das nvidia die cpu's fehlen wird und nur noch high end sku verkaufen kann also alles über 1000€ dgpu und ab 2028 keine cpu only mehr gibt. Daher machen die Gerüchte für Arm nvidia pc Sinn.

Das passiert eben wenn man schlecht spekuliert wohin die cpu sich entwickeln.
amd wird sicher den Weg mit cam2 Modulen gehen bei am6 und voll auf die apu Linie gehen und bei den hepc mit 32 core ab 1400€ cpu server Sockel aktuell bei 4844 pins lga als cpu Eventuell str6
Das ist zu Nische selbst für nvidia
Bliebe nvidia nur intel desktop cpu und das ist unklar

Cpu Taktaussicht aktuell 5,5ghz= zen 5 2024
n3 refresh zen6 +15% 6,3ghz 2025
n2 refresh zen7 7,5ghz (noch am5 2026)
a16 node zen8 unklar ob am5 oder nicht Tendenz ja 9,0ghz 2027

Intel voll unklar
kommend 2024 arrow lake +10% 5,5ghz intel 3
patheon lake 2025 unklar mögliche 20% Takt wegen intel 20a (6,6ghz)
Das wars mit so1851 mit glück
2026 und darauf unklar geplant intel 18a +10%
 
("bei Star Citizen 575fps)

Du hast da wohl ein komma vergessen zu setzten nach der zweiten Zahl: -)
Ich tippe auf 1999$ bzw 2249€. Das wären 25% mehr als die 4090.

Zu Release niemals!

Eher nach 6 Monaten

Die 4090 hatte ja schon das Preisschild dran zum Start.

Screenshot_20240702_194251_Chrome.jpg
 
Zuletzt bearbeitet:
Ich würde erwarten, dass die 5000er Modelle von Nvidia erstmal so kommen und der neue Speicher dann etwas für sie SUPER Modelle wird.
So kann man Enthusiasten 2 Mal abkassieren :)
 
Ich würde erwarten, dass die 5000er Modelle von Nvidia erstmal so kommen und der neue Speicher dann etwas für sie SUPER Modelle wird.
So kann man Enthusiasten 2 Mal abkassieren :)
Mindestens bei den großen Modellen wird GDDR7 mit sehr hoher Wahrscheinlichkeit unmittelbar eingeführt werden, weil die Zugewinne in der Speicherbandbreite ein eingeplanter Bestandteil der Leistungssteigerung der NextGen sind, bzw. anders herum ausgedrückt, wenn die Rechenleistung der GPUs weiter steigt und noch mehr Daten umhergeschoben werden müssen, muss auch der Speicherdurchsatz steigen.

Lezten Endes sollte man Micron's Seite in erster Linie als Werbung verstehen, möglicherweise gar in Kooperation mit nVidia, denn dem bisherigen Vernehmen nach wird vorerst ausschließlich nVidia bei Blackwell GDDR7 nutzen. Intel wird sich weiterhin gesichert auf GDDR6 beschränken und von den RDNA4-Chips, die übrig geblieben sind, hört man bisher ebenfalls, dass die sich auf GDDR6 beschränken sollen, was voraussichtlich primär dem Kostendruck geschuldet sein wird. (Ob AMD hier überhaupt GDDR7-fähige IP lizensiert hat, ist aktuell unbekannt.)
 
Zuletzt bearbeitet:
Du hast da wohl ein komma vergessen zu setzten nach der zweiten Zahl: -)
Nein, warum ?
Ist schließlich eine 4 Jahre alte Mittelklasse Radeon, und keine überteuerte Nvidia die nur laut ist und strom verschwendet und schlechte treiber hat.
 

Anhänge

  • 577 fps space.jpg
    577 fps space.jpg
    227,2 KB · Aufrufe: 43
  • average fps 572.jpg
    average fps 572.jpg
    168,6 KB · Aufrufe: 43
  • fps RX6800.jpg
    fps RX6800.jpg
    350,6 KB · Aufrufe: 51
Ich vermute, dass die Nvidia Top Modelle mit dem GDDR7 Speicher ausgestattet werden. Also die 5090 und 5080. Eventuell auch nur die 5090, da diese bestimmt noch einen größeren Performanceabstand zur 5080 haben wird, als die 4090 zur 4080 und auch sehr viel teurer sein wird. Die kleineren Karten werden weiterhin mit GDDR6(X) befeuert. 5070 und darunter, weil günstiger und da wird der Performancesprung nicht so groß zur vorherigen Generation sein.
Aber letztendlich werden wir das wohl erst am Ende des Jahres erfahren, oder sogar erst im kommenden Jahr. Also abwarten.
 
achja und wie soll das gehen von nenn L2 auf dem vram zuzugreifen und Daten vorzuladen
Das Si ist dahinter
Wie ich darauf komme nun amd eigene aussage beim Inf cache und wie dieser Die Bandbreite vergrößert wo nvidia irgendwas von magischen Optimierung durch mehr cache faselt.
Das eine ist technisch nachvollziehbar das andere pures ablenken vom eigentlichen punkt für den L2
GPU sind linear das ist von Natur aus nicht zu ändern da api's primär Singlethread sind.
Will was schneller werden braucht es mehr drawcalls und da hilft am einfachsten hoher singlecoretakt der cpu und den bekommen wir bis 2028 spätestens mit zen8 9,0ghz
 
Ach schön das Bild in Space ist etwas wie wenn ich sage ich habe 900 FPS bei Cyberpunk, wenn ich auf den Bodenstarre
Zeig doch mal deine fps in Star Citizen wenn du inspace bist.
Dass hier sind übrigens meine average fps in BF2042 nach 400h spielzeit. (1440p)
In Forza siehts genau so aus. In World of Tanks hab ich sogar noch mehr 500+.
Wenn deine RTX4090 dass nicht packt, was eine 4 Jahre alte 330€ Radeon packt, kann ich dir auch nicht weiterhelfen.
 

Anhänge

  • bf2042 fps.jpg
    bf2042 fps.jpg
    94 KB · Aufrufe: 44
  • BF2042 400h 400fps.jpg
    BF2042 400h 400fps.jpg
    8 KB · Aufrufe: 33
Nein, warum ?
Ist schließlich eine 4 Jahre alte Mittelklasse Radeon, und keine überteuerte Nvidia die nur laut ist und strom verschwendet und schlechte treiber hat.

Das hier von der AMD Software ein klarer Auslesefehler vorliegt sollte dir wohl bewusst sein 😅 oder möchtest du behaupten das 394FPS in BF2042 korrekt sein können wenn eine 7900XTX in 1080p 204FPS realisiert.

IMG_0996.jpeg


Und noch weniger FPS in 1440p

IMG_0997.jpeg
 
Zuletzt bearbeitet:
Zeig doch mal deine fps in Star Citizen wenn du inspace bist.
Dass hier sind übrigens meine average fps in BF2042 nach 400h spielzeit. (1440p)
In Forza siehts genau so aus. In World of Tanks hab ich sogar noch mehr 500+.
Wenn deine RTX4090 dass nicht packt, was eine 4 Jahre alte 330€ Radeon packt, kann ich dir auch nicht weiterhelfen.
Naja, immerhin was ich jetzt was ich von deiner Aussagen halten muss.
Viel Spass noch an deine GPU und deinen Spielen.
 
Du hast da wohl ein komma vergessen zu setzten nach der zweiten Zahl: -)


Zu Release niemals!

Eher nach 6 Monaten

Die 4090 hatte ja schon das Preisschild dran zum Start.
Du vergisst da was. Beim Release der 4090 war der Dollar auf ein allzeit Hoch. Damals war Dollar zu Euro 1:1 ohne Steuer.
Heute ist es 1$ pro 0,93€. Die 7% sind beim Währungsunterschied zu unseren Gunsten, da Nvidia global auf Dollarpreise festsetzt.
Damals 1599$=1599€ -> ~1900€ mit 19% Steuer
Heute 1599$ = 1488€ -> 1770€ mit 19% Steuer
Zudem hatte gab es durch die Verknappung auch noch gestiegene Preise, sowie die Gier der AIBs.
Z.b. Asus Strix für 2500€ zum Release, mind 300€ Aufschlag war bei allen Karten dabei.

Und Nvidia ist sehr lange preisstabil. Heißt auch als der Dollarkurs sank, haben die Händler die hohen Preise gehalten und zum Teil die 7% in die eigenen Taschen gesteckt.
Die aktuell günstigste 4090 gibt es für 1739€, was nur knapp unter UVP ist:

FYI: Beim Release der 3090 war es von der Umrechnung sogar 1499$=1499€ mit 19% Steuer, da war der Dollar im Keller.
Und beim Dollarpreis müssen die Amis auch noch Steuern obendrauf zahlen, bei uns ist das im Preis immer mit eingerechnet.
 
Zurück