AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

PCGH-Redaktion

Kommentar-System
Teammitglied
Jetzt ist Ihre Meinung gefragt zu AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

Die GCN-Architektur von AMD, auf der auch noch einmal der für Sommer erwartete Navi-Chip basieren wird, ist im Vergleich zu Nvidia weniger effizient. Das Problem soll bei Navi angegangen worden sein, womit die Karte näher an den Mitbewerber heranrücken soll. Die Rede ist von einem neuen Cluster-Zuschnitt.

Bitte beachten Sie: Der Kommentarbereich wird gemäß der Forenregeln moderiert. Allgemeine Fragen und Kritik zu Online-Artikeln von PC Games Hardware sind im Feedback-Unterforum zu veröffentlichen und nicht im Kommentarthread zu einer News. Dort werden sie ohne Nachfragen entfernt.

lastpost-right.png
Zurück zum Artikel: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz
 
AW: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

Hm, also vielleicht wäre Navi damit so eine Art GCN+-Architektur.
Interessant wird es erst mit Arcturus/Nex-Gen-Arch, da kann AMD beweisen, dass der Zen-Effekt nicht nur in der x86-Disziplin zu Hause ist :)
 
AW: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

Weiß jemand, wie im Vergleich die Cluster bei Pascal/Turing aufgeteilt sind?
 
AW: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

GCN könnte sehr effizient sein, wenn sie nicht so hohe Taktraten benötigen würden, um mit nV gleichzuziehen. Würde man den Sweet-Spot anheben können ohne zeitgleich die Taktraten wieder zu erhöhen, würde eine Radeon bei gleicher Shaderzahl nicht so viel mehr verbrauchen als nV. Nur wäre sie dann halt merklich langsamer. Wenn man sich an die gute, alte Fury Nano erinnert, die war sogar minimal sparsamer als die gleichschnelle Maxwell aber benötigte dafür leider (dank niedrigem Takt) viel mehr Shader, was sie in der Produktion bedeutend teurer machte (ganz abgesehen vom teuren HBM).
Polaris ist ein gutes Beispiel, was möglich ist und was durch die starke Konkurrenz nötig wurde: Polaris 10 konnte auch mit unter 100 Watt betrieben werden, erreichte dann aber nur maximal 1.100 MHz. Das war aber zu wenig im Vergleich zur 1060, deren potentielle Leistung man wohl schon ganz gut abschätzen konnte. Also benötigte man höhere Taktraten und steigerte damit den Verbrauch um 50 Watt um nicht einmal 20% Mehrleistung gegenüber dem Sweetspot zu erreichen.

Ich bezweifel auch, dass Navi wirklich gute Verbräuche schafft, es ist weiterhin ein relativ hoher Takt nötig gegen Turing oder deutlich mehr teure Shader. Klar wird sie noch einmal effizienter aber sie wird auch weiterhin mehr verbrauchen, als eine etwa gleichstarke Geforce...

Wirkliche Vorteile aus der Entwicklung werden sie erst für die Nachfolgegeneration ziehen können.
 
AW: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

Im 3dcenter gab es die Info schon gestern, mit entsprechender Auswertung:

Schließlich tritt die GeForce RTX 2070 auf Basis des TU106-Chips mit einer ähnlichen Anzahl an Shader-Einheiten (2304) an. Um jene nVidia-Grafikkarte mit 2560 Shader-Einheiten bei der Performance erreichen zu können, müsste AMD letztlich eine vergleichbare Recheneffizienz aufbieten – ein Thema, bei welchem AMD bis zuletzt klar zurücklag. Es wäre ergo ein regelrecht großer Schritt, wenn AMD in dieser Frage mit der Navi-Architektur ein (grobes) Gleichziehen mit nVidia gelingen könnte – gerade auch angesichts der viel geringeren R&D-Möglichkeit von AMD. Einen ersten Hinweis darauf, wie dies ermöglicht wurde, liefert dann die zweite dargebrachte Information, welche auch diejenige ist, welche derzeit noch bei Twitter zu sehen ist: Danach verändert AMD mit der Navi-Architektur den Aufbau der Shader-Cluster von 4x SIMD-16 Einheiten auf 2x SIMD-32 Einheiten. Die Anzahl der Shader-Einheiten bleibt dabei auf 64 pro Shader-Cluster gleich (mit "4x SIMD-16" sind keine 16 Bit gemeint, sondern 16 ALU-Lanes, mittels Multiplikation ergibt sich dann die Anzahl der Shader-Einheiten). Es werden von den zugrundeliegenden Hardware-Einheiten (Vektor-ALUs) somit schlicht weniger, dafür aber entsprechend breitere verbaut.

Laut einem diesbezüglich erhellenden Posting im 3DCenter-Forum liegt der Effekt der ganzen Aktion in einer geringeren Komplexität des Designs, was letztlich zu einer besseren Energieeffizienz führt. Dies wäre ein Grundstein zu höheren Taktraten, welche dann wiederum der Recheneffizienz zugute kommen – und AMD eventuell in die Lage versetzen, mit viel weniger Shader-Einheiten beachtbar mehr Performance zu erzeugen als bei den bisherigen AMD-Grafikchips. Logischerweise kann diese Veränderung des Aufbaus der Shader-Cluster nur ein einzelner Baustein auf dem Weg zu dieser Zielsetzung sein, zum guten Gelingen dürfte AMD noch einiges mehr an der Navi-Architektur herumschrauben müssen.


Und hier noch der Post von Gipsel, auf den sich Leo bezieht:

Nur hat Navi offenbar immer noch die gleiche ISA (mit ein paar neuen Befehlen, aber nichts Weltbewegendes [solche kleinen Änderungen gab es auch schon vorherigen GCN-Iterationen]).

==========================

Das sind keine Bits sondern die Anzahl der SIMD-Lanes in einer Vektor-ALU. GCN hat bisher pro CU vier Vektor ALUs verbaut, die physisch 16 Lanes breit sind (16 x 32bit = 512 bit), aber logisch 64 Lanes breite Vektoren verarbeiten (eine Wavefront, also 64x32bit = 2048bit). Eine Vektor-ALU arbeitet also über 4 Takte eine Instruktion ab (wenn es breiter als 32bit pro lane wird [double precision], dauert es länger).
Das Gerücht lautet also, daß es jetzt nur noch zwei physisch 32 Lanes (32 x 32bit = 1024bit) breite Vektor-ALUs geben soll.
Dies würde z.B. erklären, warum es jetzt (also ab Navi) Register-Bank-Konflikte geben kann (falls die Registerfiles identische Bandbreite behalten), da man nur noch 2 Takte (statt 4 Takte) Zeit hat, alle Operanden zu lesen. Selbst bei Hinzufügen eines in der Diskussion stehenden register file caches/result buffers (wie auch immer man das genau bezeichnet), um das zu kompensieren, steht dann bei einer im Prinzip halbierten Bandbreite der Registerfiles pro Flop (gleiche Bandbreite, doppelte Flops pro vALU) eine in der Summe geringere Komplexität und niedrigere Stromaufnahme zu Buche. Ich hatte ja schon mal eine Halbierung der Registerbandbreite (bei Beibehaltung der Größe der vALUs) in den Raum gestellt. Die Verdopplung der vALU-Breite bei Beibehaltung der Registerbandbreite hätte natürlich einen sehr ähnlichen Effekt.
Aber 32 Lanes breite vALUs würde auch bedeutet, daß man mindestens 2 Wavefronts pro vALU benötigt (bleiben aber 4 pro CU), um auch bei reinen vALU-Instruktionen keine Pipeline-Bubbles zu erzeugen, da back-to-back issue von abhängigen Instruktionen mit nur 2 Takten ALU-Latenz vielleicht etwas sportlich aussieht (nur für einfache Bit-Operationen oder Integer-Adds würde es vermutlich gehen), wenn man 1,5 - 2 GHz Takt anpeilt und geringer Stromverbrauch ein Ziel ist (was es bei GPUs immer ist). Bisher haben alle GCN-Varianten 4 Takte ALU-Latenz für die meisten Instruktionen, was dann logisch (da Ausführung einer Wavefront über 4 Takte) zu einem einzigen "issue-Takt" wird (erlaubt das Absetzen voneinander abhängiger vALU-Befehle direkt nacheinander ohne Erzeugung von Pipeline-Bubbles). Das geht dann nicht mehr ganz so. Ist aber vielleicht auch nicht der ganz große Verlust, wenn der Rest stimmt.
3DCenter Forum - Einzelnen Beitrag anzeigen - AMD/ATI - Navi (7nm, 2019)
 
AW: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

Salve,

nach und nach scheint ja jetzt an das Licht zu kommen, das Navi eine erhebliche Veränderung in der Architektur darstellt, die letzten Wochen tröteten ja viele Bewunderer des Grünen Teams, Navi ist nichts anderes als ein Shrink von Polaris, mit ein bischen Vega. Also totale Grütze.

Scheint anders zu kommen....
 
AW: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

Ja, bei Navi scheint es wirklich große Änderungen bein GCN zu geben.

Das passt dann auch zu den Gerüchten das Navi Gaming optimiert wurde.
Vom Design her ist es einfacher, was höheren Takt ermöglicht, und gleichzeitig auch effizienter ist.

Aber wie Leo schon schrieb sind das nicht alle Änderungen, sondern da fehlen uns noch viele Infos.
 
AW: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

Der Ansatz könne jedenfalls generell richtig sein, denn AMD muss versuchen, GCN näher an die Effizienz der Nvidia-Karten zu bringen, womit architektonische Änderungen durchaus in Frage kommen - wenn auch sicher keine Wunder ohne Neuentwurf zu erwarten sind.

Bitte, bitte, bitte hör endlich auf mit diesen dummen subjektiven Bewertungen.
Es ist unerträglich.
 
AW: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

, das Navi eine erhebliche Veränderung in der Architektur darstellt

Naja ob das wirklich enorme Veränderungen in der Architektur sind? Kenne mich mit dem genauen Aufbau von Gpu etc nicht aus, da ich nicht aus dem Fachgebiet stamme, aber nur diese eine Änderung von 4x16 auf 2x32 soll amd katapultartig effizienter machen? War da nicht noch massen an HPC Ballast den man entfernen könnte/müsste?
 
AW: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

Schätze wegen Ps5 usw aber AMD wird die Karte wieder prügeln meine 7 hate 120mv zu viel glatt 70 watt weniger bei höhrerem takt bis gleichem takt. Wenn das Radeon Overlay stimmt^^ sind es 70 Watt ersparnis.
 
AW: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

Naja ob das wirklich enorme Veränderungen in der Architektur sind? Kenne mich mit dem genauen Aufbau von Gpu etc nicht aus, da ich nicht aus dem Fachgebiet stamme, aber nur diese eine Änderung von 4x16 auf 2x32 soll amd katapultartig effizienter machen? War da nicht noch massen an HPC Ballast den man entfernen könnte/müsste?

Da mit Navi von Anfang an der Mainstream angepeilt wurde, kann es sein, dass Navi gar keinen HPC Ballast an Bord hat.
Und angsichts der Steam Charts könnte Navi bei entsprechendem Preis und Performance/Verbrauch die ganzen alten Nvidia Karten ablösen die in Umlauf sind (siehe Top Ten der Charts).
 
AW: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

Die Frage ist auch, wie die Architektur nach Navi aussehen soll.
 
AW: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

Da mit Navi von Anfang an der Mainstream angepeilt wurde, kann es sein, dass Navi gar keinen HPC Ballast an Bord hat.
Und angsichts der Steam Charts könnte Navi bei entsprechendem Preis und Performance/Verbrauch die ganzen alten Nvidia Karten ablösen die in Umlauf sind (siehe Top Ten der Charts).

Das kommt darauf an, was man als HPC oder Compute Ballast bezeichnet?!

In den meisten Neuerscheinungen 2018 und 2019 haben gerade Polaris und Vega erheblich besser abgeschnitten, als noch 2016 und 2017, gerade in letzter Zeit , von wenigen Ausnahmen im AAA Bereich abgesehen, kommen die AMD Grafikkarten bei den neuen Triple AAA Spielen richtig in Fahrt, was nach Spekulationen in verschiedenen Fachforen, durchaus daran liegen kann, das die neuen Spiele mehr auf Compute optimiert sind, und somit AMD seine Rohleistung besser auf die Straße bekommt, insoweit wird AMD bei Navi sicher auch einen Kompromiss suchen, aber wie schon angedeutet wurde, steht bei Navi eindeutig oder ausschließlich die Spieleleistung im Aufgabenheft.
 
AW: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

Nicht labern (und Gerüchte streuen)...releasen AMD :D.
 
AW: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

Wie viele Artikel über Gerüchte von Navi wird es noch geben bis zum Release? 20?
 
AW: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

Wenn du mehr echte Infos willst, wirst du noch warten müssen, bis kurz vor Release von Navi.
Intel, Nvidia, und AMD fahren seit einiger Zeit eine Null-Info-Politik, und sind an einer guten objektiven Berichterstattung nicht mehr interessiert.
Selbst die Anleger werden mit den Quartalsberichten absichtlich manipuliert und hinters Licht geführt.
Da wird maßlos übertrieben, und unangenehm wichtige Fakten einfach weg gelassen.

Schaue einfach eine Woche vor Release von Navi hier vorbei, und überlese alle News bis dahin hier.
 
Zuletzt bearbeitet:
AW: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

Bitte, bitte, bitte hör endlich auf mit diesen dummen subjektiven Bewertungen.
Es ist unerträglich.

Daran ist nicht wirklich was subjektiv... eher nochmal die aktuellen wirtschaftlichen Erfordernisse in Worte gefasst - unter der (zugegeben) absolut persönlichen Prämisse des Autors, dass AMD kunkurenzfähigere Produkte auf den Markt bringen will. Aber ich glaube, man darf auch genz objektiv annehmen, dass genau sowas zu den Zielen eines Unternehmens gehört.

Ich für meinen teil erwarte leider nicht mehr viel, bis ein wirklich neu entworfener Chip mal das Licht der Welt erblickt. Wenn von AMD jetzt doch eine Karte kommt, die sich für 350,00 $ zwischen 2070 und 2080 platziert, DANN gehts allerdings doch noch vorher rund für AMD.
 
AW: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

Ich freue mich schon auf den Release und die ersten Benchmarks. Ich hoffe auf gute Preise und angemessene Performance. NAVI 10 Auf RTX 2070 Niveau für 400€ wäre super. Wie die GPU aufgebaut ist, juckt mich keinen Meter.
 
AW: AMD Navi: Gerüchte um neuen Cluster-Zuschnitt für mehr Effizienz

Das kommt darauf an, was man als HPC oder Compute Ballast bezeichnet?!

In den meisten Neuerscheinungen 2018 und 2019 haben gerade Polaris und Vega erheblich besser abgeschnitten, als noch 2016 und 2017, gerade in letzter Zeit , von wenigen Ausnahmen im AAA Bereich abgesehen, kommen die AMD Grafikkarten bei den neuen Triple AAA Spielen richtig in Fahrt, was nach Spekulationen in verschiedenen Fachforen, durchaus daran liegen kann, das die neuen Spiele mehr auf Compute optimiert sind, und somit AMD seine Rohleistung besser auf die Straße bekommt, insoweit wird AMD bei Navi sicher auch einen Kompromiss suchen, aber wie schon angedeutet wurde, steht bei Navi eindeutig oder ausschließlich die Spieleleistung im Aufgabenheft.

Cool, danke für die Info. Das hatte ich so gar nicht auf dem Schirm. Weißt du welche Compute Anforderungen auf die GPU mehr und mehr ausgelagert werden?
AMD kann dann ja mal ihren AsyncCompute Vorteil mal auspielen. Soll das auf GCN nicht besser laufen als auf Pascal und Turing? Ganz so tief steck ich da nicht drin aber ich finde die Entwicklung der Architekturen super spannend. Ich lese auch gerne die ganzen Specs, die das erläutern. Damals bei Vega o.O das las sich ja wahnsinnig geil. Auf dem Papier schien Vega eine absolute Super Arch zu sein... und dann performten die zu Beginn so schlecht. Haben ja viele nicht verstanden.
 
Zurück