AMD Radeon BigNavi & RDNA2 Laberthread

wenn das so wäre, würde amd erst garnicht den Infinity Cache aufwand geben, und weiter auf hbm2e setzen.

denn die monster daten mit 128 rops und 80 cu und dann si bandbreite limitiert bei amd gpu ? never !!!
 
das habe ich verstanden.

aber ich meine wenn jetzt nur bestimmte spiele auf Infinity Cache positiv reagieren, dann wäre dies kein aufwand wert für so ein monster architektur, der dann an si bandbreite krüppelt, das würde amd niemals tun und defenitive weiter an hbm2e setzen.

da rdna2 auf 4k performance ausgelegt ist und da muss die si bandbreite immer zur verfügung stehen.
 
Zuletzt bearbeitet von einem Moderator:
Morgen kommen die AMD-Grafikkarten im Referenzdesign, weiß man ungefähr schon wann die Custom Designs folgen werden?

Mein neuer Rechner ist fast komplett, nur CPU fehlt noch und Grafikkarte.
An den Ryzen 7 5800x komme ich momentan aber nicht ran und muss warten - vielleicht passt es dann genau zusammen mit einer RX 6800XT (Custom)?
 
Naja, 128 "gigantische" MB sind zwar sicher nicht verkehrt (bei 16 GB VRAM insgesamt), aber ob sie in allen Fällen die mangelnde Speicherbandbreite ersetzen können, muss sich zeigen.

Ich nehme an, dass es Spiele gibt, die da sehr positiv darauf reagieren und andere, denen das gar nicht schmeckt.

Morgen wissen wir mehr!
Denke man sollte hier bedenken, dass die gesamte Cache-Hierarchie überarbeitet wurde und mit die wichtigste Entwicklung vllt gar nicht der Infinity Cache (L2) ist, sondern eher der Shared L1 Cache entscheidend sein könnte.
Durch das Datensharing innerhalb des L1 können alle CU´s für Ihre Speicherabfragen auf alle L1 Datenbereiche zugreifen (auch auf die von anderen CU´s). Zeitgleich werden unnötige Datenreplikationen im L1 vermieden, was eine deutlich höhere Hitrate zur Folge hat und wodurch am Ende viel weniger Request-misses überhaupt erst im L2 (infinity Cache) beantwortet werden müssen.
Die 128MB schaffen es dann halt nur nochmal weniger Request-misses, wenn die Abfrage im L1 zuvor erfolglos war, abzufangen, bevor letztendlich auf den "langsamen" VRAM zugegriffen werden müsste und reduzieren somit eigentlich erst in zweiter Instanz nochmal die benötigte Bandbreite zum GDDR6.

Gab dazu ja dieses schöne Video was ganz gut aufzeigt wie das abläuft alá BackBacke Kuchen mit den und den Zutaten - also falls man sich nicht nen halben Tag Zeit nehmen möchte um sich durch die Patente durchzuarbeiten^^

Was ich nicht verstehe ist, warum viele Medien den Infinity Cache als L3 Cache ausweisen.
Im Abgleich mit AMD´s einsehbaren Patenten ist das meinem Verständnis nach schlicht falsch und ein L3 Cache in den BigNavis gar nicht vorhanden. Also nur
Abfrage
-> Antwort irgendwo im shared L1 ja/nein? bei nein -> auto-forwarded in Infinity Cache L2. Und bei erneutem missmatch hier dann letztendlich die Weitergabe der Abfrage in den GDDR6.

Gut ist halt, dass die Spiele hierfür nicht optimiert werden müssen und was unterm Strich dann bei rauskommt werden wir morgen sehen. Ob es dann wirklich äquivalent zu ~1,7TB/s ist, wie beworben, wird wohl leider nur schwer nachzuprüfen sein^^ Naja, hauptsache die Performance stimmt.
Persönlich hätte ich es mit HBM2 anstelle von GDDR6 im Rücken dann nochmal geiler gefunden - das muss ich definitiv sagen, aber vllt ist der echt nicht mehr notwendig mit diesem gefahrenen Ansatz.

Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.
 
Zuletzt bearbeitet:
@Edelhamster

Was mich irritiert, dass man erst jetzt auf diese Lösung kommt, wenn die solch gigantische Vorteile bringt. Speicherbandbreite ist richtig teuer, und wenn man sie so einsparen kann, ohne dass das irgendwelche Nachteile hat, dann wäre das ja geradezu genial.

Denn so genial ist ein solcher Cache nun auch wieder nicht, dass man nicht schon früher hätte darauf kommen können.

Ich kann es kaum noch erwarten, die Tests morgen zu lesen!
 
Kostet doch beides @Grestorn
Was ist nun teurer? Chipfläche in Form eines caches oder als Speicheranbindung? :ka:
Intel hatte ja auch schon mal einen L4 cache, der dann aber auch wieder ausgestorben ist.
In die Kosten/Nutzen-Rechnung haben wohl nur die wenigsten von uns Einblick.

Übrigens:

Wir müssen wirklich noch viel Arbeit leisten... :wall:

Jedoch war ich mir unsicher ob mein Intel Prozessor und das Z370 gut mit der rx6800 harmoniert bzw. überhaupt funktioniert.

:ugly:
 
@Grestorn
Jetzt nur auf GPU´s bezogen hat bei AMD eigentlich erst zum Ende von GCN ein Umdenken in die Richtung stattgefunden, dass anstatt der Speicherkapazität zukünftig die Speicherbandbreite immer relevanter werden würde.
Vor dem Vega-Release gab es da von RajaKoduri ein tolles Interview wo das meinem Wissen nach das erste mal so deutlich herausgestellt wurde. Klar, den Anfang hat eigentlich Fiji mit HBM1 an 4096bit gemacht, aber das waren nur die ersten Gehversuche unter extrem knappen finanziellen Voraussetzungen.
Bei Vega mit HBM2 und seinen HBCC-Auswüchsen hat man dann etwas mehr versucht, der Ansatz wurde mit HBM2, vergossenem Interposer etc. aber womöglich echt zu teuer für die Masse, wodurch eine Vega64 am Ende ja sogar eine geringere Bandbreite hatte als ein zwei Jahre ältere FuryX von 2015, weil Vega eben nur noch auf 2 anstatt 4 HBM-Stacks setzte. Da war AMD seiner Zeit auch nicht glücklich, dass der HBM2 nur auf 945MHz kam und nicht die anvisierten 1000MHz erreichte.
Im HPC-Bereich konnte man eineinhalb Jahre später mit der Radeon VII, 4 HBM -Stacks und 1TB/s dann mal einen raushauen. Dass diese dann als "limitierte" Gamingkarte kam hatte einen stark ungläubigen Jensen Huang zur Folge wenn ich mich nicht irre^^ Am Ende aber halt wohl definitiv zu teuer, dazu die ganzen GCN-Leichen im Schlepptau, nicht der Megadurchbruch.

Mit Navi konnte man sich dann neu aufstellen, mal so langsam alte Zöpfe abschneiden und am Ende ist es denke ich ein kluger Gedankengang den Bedarf nach höherer Bandbreite nicht ausschließlich durch breitere Interfaces oder schnellere Speichermodule zu erschlagen, sondern das Problem schon an den Wurzeln, oder eher schon im L1/L2 Cache, zu packen.
Schaut man sich die L1 Speicherinhalte der einzelnen Core´s in einer GPU an, sieht man, dass in unglaublich vielen die gleichen Informationen vorhanden sind.
Das meinte ich vorhin mit Verhinderung von Datenreplikationen in RDNA2 durch die neue shared-Funktion.
Entscheidend ist halt, dass eine Kommunikation zwischen allen einzelnen Core´s und allen L1 Speicherbereichen möglich ist. Dies war in den alten GPU-Designs meinem Verständnis nach nicht vorgesehen und jetzt erst durch die Implementierung eines entsprechenden Interconnect´s ermöglicht.
So kann zukünftig dann Core 529 auf den L1 Speicherbereich von Core 5119 zugreifen und andersherum, anstatt dass beide die gleich Daten vorhalten müssen.

Vllt etwas weit ausgeholt, schwafel schwafel, sorry dafür ;)
 
jemand Leaks?

 
jemand Leaks?

3080 30% schneller mit RT zumindest in BFV und das noch ohne DLSS!

Edit:

Screenshot_19.png


Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Twitter. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.


Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Twitter. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.

Warte wohl lieber auf die 3080Ti^^
 
Zuletzt bearbeitet:
RT-Vergleiche sind sinnlos, wenn man die genau gebenchte Szene nicht kennt. Gut, ist es sonst auch vorab, sofern es kein integrierter Benchmark ist. Aber gerade bei RT ist das noch mal extremer je nach Szene.
 
Eingebundener Inhalt
An dieser Stelle findest du externe Inhalte von Youtube. Zum Schutz deiner persönlichen Daten werden externe Einbindungen erst angezeigt, wenn du dies durch Klick auf "Alle externen Inhalte laden" bestätigst: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt.
Für mehr Informationen besuche die Datenschutz-Seite.
 
möhr leaks

14 Layer PCB krass

und wie beürchtet ein Graphit Pad ...
 
Zuletzt bearbeitet:
Zurück