Radeon RX 6000: Newegg mit technischen Eckdaten zu den RDNA-2-Chips

Also sagst du Speicherbandbreite hat großen Impact auf die FPS?
Schieb doch mal den Speichertaktregler im MSI Afterburner ganz nach links. Und mach vorher und nachher nen 3DMark. Dann siehste was Speicherbandbreite bringt.
Der Effekt ist wie sooft von den gegebenheiten abhängig, manche Spiele profitieren gar nicht von mehr Bandbreite, andere enorm.
 
usw.! :rollen:

Ganz neuer Leak aus einer echt extrem souveränen Quelle (=von mir :ugly:):
AMD hat jetzt schon das Baukasten-System für GPUs aktiviert, sprich:
Ein Chiplet mit 40 CUs (oder teilaktiviert für kleinere Karten), wo dann auf den großen Karten 2 von verbaut werden. Dazu dann ein wahlweise HBM2.drölf oder GDDR6(X) Speicher-Interface in beliebiger Größe. Alles irgendwie zusammen gelötet, fertig ist die neue Ryz... Radeon GPU :D
Hey...die grundsätzliche Idee finde ich reizvoll.
Warum nicht, wie früher bei einem Kosmos Baukasten alles selbst zusammen stecken. Wahlweise...( Mit einer universellen Platine) ein Nvidia oder AMD GPU Chip. (oder als mixed Dual Sockel LGA, vielleicht die dann schwächere GPU (in dem Fall sicher NVIDIA:D:D ) als Physics Unterstützung. Anbindung des Rams /Interposer / Cache usw... dann über Jumper, Schalter oder (für die mutigen), eine"Der 8auer Edition, mit zu überbrückende Shunts").

// freie Phantasie und Wunschvorstellung- Modus OFF.:ugly:
 
Schieb doch mal den Speichertaktregler im MSI Afterburner ganz nach links. Und mach vorher und nachher nen 3DMark. Dann siehste was Speicherbandbreite bringt.
Ja komm, das ist ja auch ein künstliches Limit, kann man so überhaupt nicht vergleichen. ^^
Ich meine eher, ob es einen Unterschied macht zwischen zB GDDR6X bei einer Ampere vs HBM2e bei einer möglichen BigNavi in Spielen.

Was ich meine ist doch:
Der GPU-Core wird wohl eher limitieren als der Speicher. Irgendwo wird ein Punkt erreicht sein, da bringt dir mehr Speicherbandbreite nicht mehr FPS, weil der Core einfach am Ende seiner Leistung arbeitet und da kann der Speicher schnell sein wie er will.
 
Viel Lärm um Nichts.
6 GiB VRAM mit 384 bit Interface? Seit wann gibts 512 MB Speicherchips bei GDDR6?? Hab ich da was verpasst?
Angeblich stammen die Specs von TechPowerUp, aber wie man da falsch abschreiben kann, ist mir ein jetzt Rätsel. Denn da steht:

Product NameGPU ChipReleasedBusMemoryGPU clockMemory clockShaders / TMUs / ROPs
Radeon RX 6500 XTNavi 23Oct 28th, 2020PCIe 4.0 x810 GB, GDDR6, 160 bit1489 MHz2000 MHz2048 / 128 / 64
Radeon RX 6700 XTNavi 22Oct 28th, 2020PCIe 4.0 x1612 GB, GDDR6, 192 bit1489 MHz2000 MHz2560 / 192 / 64
Radeon RX 6800 XTNavi 21Oct 28th, 2020PCIe 4.0 x1612 GB, GDDR6, 192 bit1489 MHz2000 MHz3840 / 240 / 64
Radeon RX 6900 XTNavi 21Oct 28th, 2020PCIe 4.0 x1616 GB, GDDR6, 256 bit1350 MHz2000 MHz5120 / 320 / 96

Aber ob die Specs stimmen, wage ich ebenfalls zu bezweifeln... 96 ROPs bei 80 CUs klingt komisch, müssten das nicht 128 ROPs dann sein? Könnte mir 96 ROPs bei der 6800XT vorstellen.. Zudem finde ich den Takt selbst für nen Baseclock doch recht niedrig, aber muss ja nichts heißen. Aber, ob die RX 6500 XT auf 5x2GB Samsung Speicher mit 16 Gpbs setzt und ganze 64 ROPs hat kann ich mir nicht vorstellen...
 
Zuletzt bearbeitet:
Was ich meine ist doch:
Der GPU-Core wird wohl eher limitieren als der Speicher. Irgendwo wird ein Punkt erreicht sein, da bringt dir mehr Speicherbandbreite nicht mehr FPS, weil der Core einfach am Ende seiner Leistung arbeitet und da kann der Speicher schnell sein wie er will.

Davon würde ich auch ausgehen, sicher sind andere da besser informiert. Aber wir sehen es ja beim normalen Ram, daß sich da die Performance meist in Grenzen hält und es da eher auf die Menge des verbauten Speichers ankommt. Mit Sicherheit lohnt sich da immer ein Sprung, aber ich würde sagen, wenn es geldwert sein soll, dann mußt da eine Generation überspringen oder Sparfüchse gar zwei. Das ist, wie Du sagst, bei der GPU anders, da kommt meist schon ein meßbarer Schub von einer Generation zur anderen, auch wenn sich hier das "Aussitzen" meist ebenfalls lohnt.

Das Problem wird denke ich mal nicht die Menge sondern die Geschwindigkeit des VRams darstellen.

Nvidia bei der 3080 dann mit G6X, AMD kontert nur mit G6.
Wie ich schon gesagt habe: Entweder sie kommen beim großen Chip mit HBM und deutlich mehr Power und evtl. sogar Softwarefeatures, die gut funktionieren, oder sie werden schon wieder hinterher hinken müssen.. Leider.

Ich würde AMD den Profit gönnen, muss allerdings auch einmal anmerken, dass das mit dem Treibereklat der letzten Jahre nicht wirklich einfach wird.

Glaub ich jetzt nicht, der GDDR6x wird so viel schneller als der GDDR6, das mag man jetzt schon sagen, mit Sicherheit nicht sein. Ich täusche mich hier gerne. Sodaß sich mehr GDDR6 wohl besser schlagen würden, als wenig GDDR6x. Aber man wird das in ein paar Monaten Praxis sehen (wie z.B. am PCIe 4.0 vs. 3.0 auch). Auch beim GDDR6 wurde von verdoppelter Geschwindigkeit zum GDDR5 gesprochen, was übrig blieb war ein Geruch, aus dem Poppo wohl, so daß es ein Gerücht wurde. Papier und Zahlen sind geduldig.
 
Zuletzt bearbeitet:
[...] Der GPU-Core wird wohl eher limitieren als der Speicher. Irgendwo wird ein Punkt erreicht sein, da bringt dir mehr Speicherbandbreite nicht mehr FPS, weil der Core einfach am Ende seiner Leistung arbeitet und da kann der Speicher schnell sein wie er will.

Das eine bedingt das andere. Sind die SPs zu schnell und liefert das Speicherinterface zu wenig Daten, müssen die SPs Wartezyklen einlegen und drehen Däumchen. Ist das Speicherinterface überproportional schnell, dann verpufft die Mehrbandbreite ungenutzt, da die SPs über ihr maximales Limit nicht hinauswachsen können. Was konkret die beste Kombination zwischen Chipgröße und dessen Taktung sowie der notwendigen Speicherbandbreite ist, wird größtenteils architekturabhängig und ebenso auch Workload-abhängig sein, d. h. man müsste konkrete Kartenmodelle im Detail ausmessen.
Und die Bandbreitenanforderungen nehmen offensichtlich zu, was nicht verwundern sollte, denn bei bspw. nVidia werden mittlerweile die SPs (grob "Rasterizer"), die Tensor Cores und die RT Cores parallel zur Bildgenerierung genutzt und alle Einheiten benötigen zum Teil eigenen Ressourcen, d. h. immer mehr Speicherbandbreite wird benötigt, damit diese EInheiten gut ausgelastet werden können (bis das thermische Limit des GPU/Kartendesigns deckelt). nVidia hätte entweder ein sehr breites Interface benötigt, bspw. bis zu maximal 512 Bit und dann hätten sie mit Std-GDDR6 arbeiten können, jedoch hätte ihnen das keinen Möglichkeit geboten sinnvoll mehr als 16 GiB bei einer hohen Bandbreite anzubieten. Also entschied man sich hier für den anderen Weg mit einem kleineren, aber dafür granularer aufteilbarem Interface/Speicherausbau, musste dafür aber deutlich schnelleren Speicher verwenden, da man auf die Bandbreite für die Performance der HighEnd-Modelle offensichtlich nicht verzichten konnte.
In einer ähnlichen Art zeichnet sich das gerade bei AMD ab, wenn es so eintreffen wird. Ein sehr breites Interface wird teuerer (in der GPU und auch auf dem PCB) und so spart AMD hier beim SI und versucht den Bandbreitenverlust mittels des InfinityCache zu kompensieren, denn da sich die Karten in einem ähnlich hohen Leistungsbereich wiederfinden sollen wie Ampere, werden auch die auf eine hohe Bandbreite angewiesen sein (umso mehr, da jetzt noch Raytracing hinzu kommt), d. h. man opfert Wafer-Flache (übergroßer L2) für Einsparungsmöglichkeiten bei den Controllern/dem PHY in der GPU und für ein etwas einfacheres PCB-Layout.
HBM dürfte bei AMD nach wie vor weiterhin sehr unwahrscheinlich sein, da es für sie gar noch teuerer wird als für nVidia, weil sie die deutlich kleineren Umsätze haben und damit wird ein so aufwändiges Design schnell unwirtschaftlich. Darüber hinaus scheint sich der große Schlagabtausch voraussichtlich unterhalb der 1000 € abzuspielen, d. h. da bleibt nicht viel Gelegenheit für Quersubventionierungen.
Darüber hinaus dürfte gar HBM2e noch unwahrscheinlicher sein, denn der war offensichtlich selbst für den (G)A100 nicht attraktiv. (Hier begnügt man sich mit gerade mal 2,4 Gbps.)
Aber am Ende heißen Wahrscheinlichkeiten > 0 nicht, dass etwas nicht eintreten kann. Wer weiß ... in ein paar Wochen werden wir mehr wissen. ;-)
 
Dieser Artikel soll wohl ein Witz sein. Oder?
Viel Lärm um Nichts.
6 GiB VRAM mit 384 bit Interface? Seit wann gibts 512 MB Speicherchips bei GDDR6?? Hab ich da was verpasst?
Angeblich stammen die Specs von TechPowerUp, aber wie man da falsch abschreiben kann, ist mir ein jetzt Rätsel. Denn da steht:

Product NameGPU ChipReleasedBusMemoryGPU clockMemory clockShaders / TMUs / ROPs
Radeon RX 6500 XTNavi 23Oct 28th, 2020PCIe 4.0 x810 GB, GDDR6, 160 bit1489 MHz2000 MHz2048 / 128 / 64
Radeon RX 6700 XTNavi 22Oct 28th, 2020PCIe 4.0 x1612 GB, GDDR6, 192 bit1489 MHz2000 MHz2560 / 192 / 64
Radeon RX 6800 XTNavi 21Oct 28th, 2020PCIe 4.0 x1612 GB, GDDR6, 192 bit1489 MHz2000 MHz3840 / 240 / 64
Radeon RX 6900 XTNavi 21Oct 28th, 2020PCIe 4.0 x1616 GB, GDDR6, 256 bit1350 MHz2000 MHz5120 / 320 / 96

Aber ob die Specs stimmen, wage ich ebenfalls zu bezweifeln... 96 ROPs bei 80 CUs klingt komisch, müssten das nicht 128 ROPs dann sein? Könnte mir 96 ROPs bei der 6800XT vorstellen.. Zudem finde ich den Takt selbst für nen Baseclock doch recht niedrig, aber muss ja nichts heißen. Aber, ob die RX 6500 XT auf 5x2GB Samsung Speicher mit 16 Gpbs setzt und ganze 64 ROPs hat kann ich mir nicht vorstellen...

Also wenn also dieser Artikel kommt der Sache schon was näher: https://wccftech.com/amd-navi-21-22-and-23-massive-technical-specification-leaked/

Was PCGH hier als Artikel reinstellt ist ja wohl ein Witz. Oder?
 
Der GPU-Core wird wohl eher limitieren als der Speicher. Irgendwo wird ein Punkt erreicht sein, da bringt dir mehr Speicherbandbreite nicht mehr FPS, weil der Core einfach am Ende seiner Leistung arbeitet und da kann der Speicher schnell sein wie er will.
Stimmt, der Punkt ist aber SEHR viel weiter oben als du glaubst. ;-)
AMD und NV machen nicht umsonst Kunstgriffe wie HBM2e, IF-Cache, GDDR6X usw. um Speicherbandbreite rauszuquetschen und das mit massivem Energiebudget (bei der RTX3080 gehen 60-80W nur für den vRAM drauf!). Die GPUs könnten deutlich schneller sein wenn sie nicht am RAM verhungern würden. Bis da ein "mehr bringt nix mehr" erreicht wäre kannste die aktuelle Bandbreite mindestens verdoppeln. Das macht nur in der Praxis im Consumerbereich keiner, weil Lösungen die das können (4+ Stacks HBM2 oder 512bit-Speicherinterfaces an GDDR6(X)) viel zu teuer sind.
 
Glaub ich jetzt nicht, der GDDR6x wird so viel schneller als der GDDR6, das mag man jetzt schon sagen, mit Sicherheit nicht sein. Ich täusche mich hier gerne. Sodaß sich mehr GDDR6 wohl besser schlagen würden, als wenig GDDR6x. Aber man wird das in ein paar Monaten Praxis sehen (wie z.B. am PCIe 4.0 vs. 3.0 auch). Auch beim GDDR6 wurde von verdoppelter Geschwindigkeit zum GDDR5 gesprochen, was übrig blieb war ein Geruch, aus dem Poppo wohl, so daß es ein Gerücht wurde. Papier und Zahlen sind geduldig.

Öh Ja is klar. RTX TITAN 672 GB/s Speicherbandbreite, RTX 3090 936 GB/s Bandbreite. Gut 30% mehr Bandbreite, wo ist das jetzt nicht schneller?
Oder GTX 980 224 GB/s, RTX 2080 448 GB/s? Bin jetzt nicht so der Rechenprofi, aber bei mir ist das doppelt so schnell...
 
Tja, nun können sie künftig Raytracing. Dumm nur das AMD nun bei DLSS hinterher hinkt. So wird es wieder keine AMD Karte. Eigentlich unnötiger massiver VRAM über 10 GByte hin oder her. :rolleyes:

Sexy ist hier nur das nVidia mit stärker VRAM bestückten Karten nachziehen wird. Einem geschenkten Gaul.....
 
Stimmt, der Punkt ist aber SEHR viel weiter oben als du glaubst. ;-)
AMD und NV machen nicht umsonst Kunstgriffe wie HBM2e, IF-Cache, GDDR6X usw. um Speicherbandbreite rauszuquetschen und das mit massivem Energiebudget (bei der RTX3080 gehen 60-80W nur für den vRAM drauf!). Die GPUs könnten deutlich schneller sein wenn sie nicht am RAM verhungern würden. Bis da ein "mehr bringt nix mehr" erreicht wäre kannste die aktuelle Bandbreite mindestens verdoppeln. Das macht nur in der Praxis im Consumerbereich keiner, weil Lösungen die das können (4+ Stacks HBM2 oder 512bit-Speicherinterfaces an GDDR6(X)) viel zu teuer sind.
Also wird versucht das mit den Ramtakt auszugleichen was u.a. auch den höheren Stromverbrauch verursacht?:hmm:
 
Also wird versucht das mit den Ramtakt auszugleichen was u.a. auch den höheren Stromverbrauch verursacht?:hmm:
Wenn die Speicherbandbreite nicht limitierend wäre bräuchte man keine zig Millionen in die Erforschung von GDDR6X zu setzen sondern könnte normalen (billigen) GDDR6 benutzen. Und man würde den nicht so am Anschlag takten dass er viel der Boardpower wegfrisst und 100+°C heiß wird.
NVidia macht das nicht aus Spaß, die haben ihre Mühe und Not, den GA102 schnell genug mit ausreichend Daten zu versorgen ohne dass es zu teuer wird.

Man hatte halt die Wahl: ENtweder erreicht man die nötige Bandbreite durch hochzüchten von GDDR6 und betreiben am Vollanschlag - das hat hohe temperaturen und leistungsaufnahmen zur Folge. Oder man verbreitert das Speicherinterface auf 512bit und nutzt normalen nicht so am Anschlag betriebenen GDDR6. Das ist kühler und sparsamer aber in der Herstellung von GPU und PCB wesentlich teurer.
Welchen Weg NV gewählt hat ist bekannt. Lieber 350W reinschieben als die Marge um 100$ zu senken.

AMD versucht offenbar das Problem statt mit hochgezüchtetem GDDR6 mit einem neuen Last-Level Cache ("IF-Cache") zu lösen - das erlaubt sowohl ein günstiges kleineres Speicherinterface als auch günstigen/kühlen/wenig verbrauchenden GDDR6. Wie gut das aber performanceseitig am ende klappt werden wir in Kürze erleben.
 
Zurück