Seite 6 von 6 ... 23456
  1. #51
    Avatar von Locuza
    Mitglied seit
    30.10.2009
    Ort
    BW
    Beiträge
    10.357

    AW: AMD Navi: Der Vega-Nachfolger bleibt monolithisch im Desktop

    Zitat Zitat von matty2580 Beitrag anzeigen
    Wang hat das schon verworfen für einen möglichen Multi-GPU-Gamingeinsatz, und auch Nvidia davor.
    Einzig für den HPC-Bereich ist das für die beiden Anbieter eine mögliche Option.
    Dann aber auch nur wenn Aufwand und Nutzen im Verhältnis stehen.

    p.s. Ich sehe gerade das es sich bei dem Link um das PDF handelt, was Leo schon 2017 in seiner News ausgewertet hat.
    nVidia forscht an MCM-basierten Grafikchips | 3DCenter.org
    Welche neuen Infos liefert das PDF?
    Niemand hat direkt etwas verworfen, vor allem nicht für immer.
    Auch Nvidia nicht, im Gegenteil, dass Konzept ist ziemlich nah an dem dran was man für Gaming haben möchte:
    Zitat Zitat von Seite 11
    Finally, we propose to expose the MCM-GPU as a single logical GPU via hardware innovations and extensions to the driver software to provide programmer- and OS-transparent execution.
    While there have been studies that propose techniques to efficiently utilize multi-GPU systems , none of the proposals provide a fully transparent approach suitable for MCM-GPUs
    http://research.nvidia.com/sites/def...017_MCMGPU.pdf

    Nvidia baut mit der Titan V eine GPU mit 815mm² und verkauft das Ding noch an "normale" Leute für ein paar Tausend.
    Auch 400-600mm² große Chips in einer neuen Fertigungsnode könnten vielleicht in der Zukunft kostengünstiger, als ein Verbund aus 2x200/300mm² großen Chips umgesetzt werden.
    Es gibt keinen zwanghaften Grund wieso man bei GPUs das Ganze nur für Lösungen ausnutzen könnte, um über die mögliche Grenze eines Einzelchips zu kommen.
    AMD nutzt das Konzept bei ihren aktuellen CPUs von unten bis ganz nach oben.
    Unten gibt es ein 213mm² Chip der verkauft wird und oben 4x213mm², was insgesamt 852mm² Fläche sind, was AMD auch niemals als Einzelchip hätte bauen können und in der Mitte 2x213mm² = 426mm².

    Im Detail hat man bisher keine Informationen darüber, wo die Unternehmen sich zeitlich bei der Forschung und Entwicklung befinden, was aktuell das Hauptproblem darstellt und wann man entsprechende Lösungen erwarten könnte.
    Und ja, man könnte das Konzept nur für HPC-Clients umsetzen, dass heißt aber nicht zwangsläufig das es mit der Zeit nicht auch für Gaming-Lösungen umgesetzt werden kann.

    -----

    Die PDF von Nvidia stellt ihre Forschungsergebnisse relativ im Detail dar, Leo's Abschnitt ging oberflächlich nur auf die Schaubilder ein und führte noch allgemeine Überlegungen zum Thema aus.
    Geändert von Locuza (16.06.2018 um 03:59 Uhr)

    •   Alt

      Anzeige
      Bitte einloggen, um diese Anzeige auszublenden.
       

  2. #52
    Avatar von matty2580
    Mitglied seit
    09.09.2011
    Ort
    Potsdam
    Beiträge
    5.472

    AW: AMD Navi: Der Vega-Nachfolger bleibt monolithisch im Desktop

    CPUs und GPUs sind vom Aufbau her sehr unterschiedlich, so dass man das nicht einfach gleichsetzen kann.
    Torsten hat das noch einmal beschrieben, dass man beim 6000-fachen aktueller CPU-Implementationen sein müsste, um eine brauchbare Lösung zu bekommen.

    AMD und Nvidia haben das natürlich nicht direkt verworfen.
    Dafür gibt es auch keinen Grund, da die Idee dahinter durchaus interessant ist.
    Im Interview mit Wang, worum es auch in dieser News ging, machte er aber noch einmal deutlich dass aktuell ein MCM-Ansatz für einen Gaming-Chip nicht sinnvoll ist.
    Du hast doch das Interview selbst noch einmal im Original verlinkt, und bestimmt auch gelesen.

    Das PDF habe ich auch noch einmal gelesen, und finde Leos Summary schon passend. Deshalb habe ich nachgefragt.
    Geändert von matty2580 (16.06.2018 um 10:14 Uhr)
    "Zensur? Nicht mal im Traum, der Beitrag ist öffentlich einsehbar im Fischbecken, wo man Dein Meisterwerk bewundern kann...Nö, nix Zensur, man kann Deinen Beitrag immer noch lesen. Und wenn Dir das so wichtig ist: pinne es zusätzlich irgendwo an einen Laternenmast. Das kann Dir niemand verwehren...Und ja, Moderatoren beurteilen, ob ein Beitrag in einen Thread gehört oder nicht." rumpel01 (ComputerBase-Mod)

  3. #53
    Avatar von Locuza
    Mitglied seit
    30.10.2009
    Ort
    BW
    Beiträge
    10.357

    AW: AMD Navi: Der Vega-Nachfolger bleibt monolithisch im Desktop

    Die "6000"-fache Zahl kam von der Idee her, wenn man die gleichen Kommunikationsbandbreiten erreichen möchte, wie sie über den den ganzen Chip zwischen den Einheiten führen.
    Die Crossbar zum L2$, wo letztendlich der ganze Traffic aller Clients landet liegt bei Vega bei ~3,2 TB/s (vielleicht auch nur bei der Hälfte, ich weiß nicht genau wie viel Memory-Channel und Bytes AMD wirklich rüber schickt, aber früher waren es 64 Bytes pro L2$-Tile, Vega hat vermutlich 32 Tiles.) oder wenn AMD deutlich entschlankt hat nur 1,6 TB/s.

    Aber solche Bandbreiten benötigst du nicht für gute Performance.
    Bei Zen läuft der Traffic von 4 Kernen auf einen gemeinsamen L3$ mit 512 GB/s (4 Kerne x 32 Bytes pro Takt (4Ghz).
    Der interne IF leitet aber nur 32 Bytes pro CCX, also nur ein viertel und dabei beträgt der Takt nur die Hälfte vom Ramtakt, also 32 Bytes x 1,6 (DDR4 3200) = 51,2GB/s und etwas weniger pumpt AMD über das Package durch mit ~38-42GB/s.

    Und die Lösung hat Performancenachteile bei den sensitiven Aufgaben, aber Threadripper ist bei Games ja nicht total abgesoffen und ansonsten funktioniert das auch relativ gut.
    Im Nvidia Paper werden 768GB/s als Link für die Simulation verwendet, die Hälfte davon hat im Test die Performance um 15% reduziert, also kein Albtraum.
    Und ja, für die Performancewerte braucht es Architekturanpassungen, um die Datenlokalität zu verbessern und die nötige Kommunikation untereinander effektiv zu verringern, aber genau das führt dann auch dazu, dass man in der Praxis kein Faktor von 6000 gegenüber CPU-Verbindungen benötigt.
    EPYC verbindet die Chips mit ~40GB/s, mal x 6000 wären 240000 GB/s bzw. 240 TB/s.
    Die Crossbar welche alle Clients bei Vega verbindet, 64 CUs mit ihrem LDS, L1$ und K$ und I$ kommt maximal auf 20 TB/s, falls in der Praxis die Crossbar wirklich alle Client-Anfrage sättigen kann.
    Also 6000-fach braucht man auf jeden Fall nichts, selbst bei zukünftigen GPUs mit vierfacher interner Bandbreite im Vergleich zu Vega10, also 80TB/s, wäre es im Vergleich zu Zen's aktueller Package-Bandbreite von die-to-die maximal ein Faktor von 2000.
    Bei Vega10 "nur" Faktor 500 und wie gesagt, für die Praxis bist auch weit davon entfernt, so etwas auch nur im Ansatz zu benötigen.
    Anhand von Nvidias Beispiel kann man mit ganzer bzw. gar halber Bandbreite von der VRAM-Anbindung ganz vernünftig leben, bei 1TB/s wären wir nur bei Faktor 25, bzw. nur 12.

    -----

    Zum Interview, dass war alles was gesagt wurde:
    [1]It’s definitely something AMD’s engineering teams are investigating, but it still looks a long way from being workable for gaming GPUs, and definitely not in time for the AMD Navi release next year. “We are looking at the MCM type of approach,” says Wang, “but we’ve yet to conclude that this is something that can be used for traditional gaming graphics type of application.”

    [2] “To some extent you’re talking about doing CrossFire on a single package,” says Wang. “The challenge is that unless we make it invisible to the ISVs [independent software vendors] you’re going to see the same sort of reluctance.

    [3] “We’re going down that path on the CPU side, and I think on the GPU we’re always looking at new ideas. But the GPU has unique constraints with this type of NUMA [non-uniform memory access] architecture, and how you combine features... The multithreaded CPU is a bit easier to scale the workload. The NUMA is part of the OS support so it’s much easier to handle this multi-die thing relative to the graphics type of workload.”

    [4] So, is it possible to make an MCM design invisible to a game developer so they can address it as a single GPU without expensive recoding?
    “Anything’s possible…” says Wang.

    [5] It seems, however, that the MCM approach is only an issue in the gaming world, with the professional space more accepting of multi-GPU and potential MCM designs.
    “That’s gaming” AMD’s Scott Herkelman tells us. “In professional and Instinct workloads multi-GPU is considerably different, we are all in on that side. Even in blockchain applications we are all in on multi-GPU. Gaming on the other hand has to be enabled by the ISVs. And ISVs see it as a tremendous burden.”

    [6] Does that mean we might end up seeing diverging GPU architectures for the professional and consumer spaces to enable MCM on one side and not the other?
    “Yeah, I can definitely see that,” says Wang, “because of one reason we just talked about, one workload is a lot more scalable, and has different sensitivity on multi-GPU or multi-die communication. Versus the other workload or applications that are much less scalable on that standpoint. So yes, I can definitely see the possibility that architectures will start diverging.”
    1. Es ist etwas was AMDs Ingenieure definitiv untersuchen, aber es scheint noch lange weg von einer Praxislösung für Gaming zu sein und wird es zeitlich definitiv nicht für die Navi-Generation schaffen.
    Das ist etwas was PCGN selber schreibt, okay, nur damit es klar ist was News-Seiten schreiben und was die Leute bei AMD selber sagen.
    Weil Dinge, welche die Artikelschreiber verfassen werden gerne auch als Fakt oder Aussage von Herstellern aufgenommen.

    Also was sagt Wang wirklich an der Stelle? Sinngemäß Folgendes: " Wir schauen uns MCM-Lösungen an, aber wir müssen noch zum Schluss kommen, ob das etwas ist was für tradionelle Grafik Anwendungen verwendet werden kann".

    2. Wang: "Die Herausforderung ist, dass solange wir eine solche Lösung nicht als unsichtbar für Software-Entwickler umsetzen können, wir die selbe Zürückhaltung wie bei Crossfire/SLI sehen werden".

    3. Wang: "Wir verwenden das Konzept auf der CPU-Seite und bei den GPUs schauen wir immer nach neuen Möglichkeiten.
    Aber GPUs haben einzigartige Herausforderungen bei solch einer Umsetzung und es ist viel schwerer umzusetzen. "

    4. Ist es möglich eine MCM GPU unsichtbar für Spieleentwickler zu realisieren, sodass diese als einzige GPU angesehen werden kann ohne teure Reprogrammierung?
    Wang: "Alles is möglich..:".

    5. Hier kommt Scott Herkelman ins Gespräch, der davon redet das klassische Multi-GPU Lösungen ja schon gut adaptiert sind in anderen Anwendungsfällen und Bereichen und das Softwareentwickler für Spiele das allerdings als große Herausforderung ansehen.

    6. Könnte das heißen, dass wir in der Zukunft ausernanderweichende Architekturen für den profisionellen Bereich und für normale Konsumenten erleben werden, wo beim ersten MCM verwendet wird, aber nicht beim letzteren?
    Wang: "Ja, ich könnte mir das definitiv vorstellen, weil es für den profisionellen Bereich viel leichter umsetzbar ist und die Arbeitslast dort anderen Ansprüchen folgt."

    Ich habe mir jetzt nicht die Mühe gemacht alles und dabei noch 1:1 perfekt zu übersetzen, aber das ist im Kern alles was gesagt wurde und konkret lässt es vieles offen.

  4. #54
    Avatar von matty2580
    Mitglied seit
    09.09.2011
    Ort
    Potsdam
    Beiträge
    5.472

    AW: AMD Navi: Der Vega-Nachfolger bleibt monolithisch im Desktop

    Du brauchst das für mich nicht übersetzen.

    Aber Wang schreibt doch, dass es bei GPUs deutlich schwerer umzusetzen ist, und wenn dann nur wahrscheinlich für den HPC-Bereich, genau dass was ich schon mehrfach geschrieben hatte.
    Selbst der Nachfolger von Navi wird keine MCM-Lösung sein.

    Wenn überhaupt wird es erst HPC-GPUs damit geben, aber auch dass ist Zukunftsmusik und nicht gleich nächstes Jahr.
    Und irgendwann in sehr ferner Zukunft, wenn MCM-HPC-GPUs normal sind, die Fertigung an eine Grenze stößt wo es nicht mehr weitergeht, und man gar keine andere Wahl mehr hat als ein MCM-Ansatz, dann kommen bestimmt auch entsprechende Gaming-GPUs.
    "Zensur? Nicht mal im Traum, der Beitrag ist öffentlich einsehbar im Fischbecken, wo man Dein Meisterwerk bewundern kann...Nö, nix Zensur, man kann Deinen Beitrag immer noch lesen. Und wenn Dir das so wichtig ist: pinne es zusätzlich irgendwo an einen Laternenmast. Das kann Dir niemand verwehren...Und ja, Moderatoren beurteilen, ob ein Beitrag in einen Thread gehört oder nicht." rumpel01 (ComputerBase-Mod)

  5. #55
    Avatar von Locuza
    Mitglied seit
    30.10.2009
    Ort
    BW
    Beiträge
    10.357

    AW: AMD Navi: Der Vega-Nachfolger bleibt monolithisch im Desktop

    Und was sagt Wang ganz zu Beginn? Das es noch offen ist, ob so ein Ansatz für traditionelle Grafik verwendet werden kann.
    Und dann noch das im Prinzip alles möglich ist.

    Übrigens reiten wir schon wieder von einem Punkt zum Nächsten, wieder ohne konkreten Drehpunkt, denn ich habe keine Aussagen getätigt die konkret etwas behauptet haben, außer meine Sichtweise was eine größere Herausforderung bei der MCM-Umsetzung darstellt und welche Bandbreiten man in der Praxis ungefähr benötigen sollte, aufgrund von Nvidias Paper.

    Ganz zu Beginn ging es um Infinity Fabric und dessen technische Nichteignung, wo die Frage nach wie vor ungelöst ist, wieso das technisch nicht geeignet sein sollte?
    Um den MCM-Ansatz zum Erfolg zu bringen, auch für traditionelle Grafik, muss man ein Bild aus 1000 Stückchen zusammenstellen.
    Die Fabric-Architektur ist ein Stück, weitere Architekturanpassungen, Packaging-Methoden, Software Anpassungen beim Treiber und möglicherweise auch beim Betriebssystem und den APIs sind weitere.
    Aber woher willst du wissen, dass es die Infinity-Fabric auf jeden Fall schon unpassend ist?

    Und wenn AMD die Dinge offen lässt und nur grob von den Herausforderungen redet und das man sich das für sagen wir einfach HPC vorstellen kann, aber nicht für normale Konsumenten.
    Du zeichnest aber grob den worst case, wo alles Mögliche erst an seine Grenzen kommen muss, bevor das auch für den Gaming-Bereich umgesetzt wird.

  6. #56
    Avatar von matty2580
    Mitglied seit
    09.09.2011
    Ort
    Potsdam
    Beiträge
    5.472

    AW: AMD Navi: Der Vega-Nachfolger bleibt monolithisch im Desktop

    Auch Torsten hat das noch einmal beschrieben.
    Ich stimme ihm da eher zu das die IF aktuell ganze Größenordnungen zu schlecht ist, um aktuell für eine MCM-GPU-Lösung eigesetzt werden zu können.

    Technologien werden oft erst aus einer Notwendigkeit heraus entwickelt.
    In dem Fall wenn es wirtschaftlich günstiger ist auf MCM zu setzen, oder es technisch keine Alternative gibt.

    Das war also kein Worst Case Szenario von mir, sondern ist in dem Kontext zu sehen.

    Es ist auch nicht schlimm unterschiedliche Ansichten zu haben.
    Was mich eher stört ist das immer wieder in den Foren wiederholt wurde, dass Navi auf MCM setzt, und viele fest davon ausgegangen sind, obwohl dass von Anfang an unrealistisch war.
    Ich lese zum Bsp. gerade bei CB die Posts zur ähnlichen News mit, wo bei jedem 5. Post drin steht dass Navi auf MCM setzt.
    PlayStation 5: Mit AMD Zen+ und Navi zum Leidwesen von Vega - ComputerBase
    Jetzt kommen gleich wieder die nächsten Traumschlösser, dass Navi auf 1080ti Niveau sein wird.
    Und am Ende sind alle wieder furchtbar enttäuscht, wenn es ein Leistungsklasse niedriger werden könnte.
    Geändert von matty2580 (16.06.2018 um 12:51 Uhr)
    "Zensur? Nicht mal im Traum, der Beitrag ist öffentlich einsehbar im Fischbecken, wo man Dein Meisterwerk bewundern kann...Nö, nix Zensur, man kann Deinen Beitrag immer noch lesen. Und wenn Dir das so wichtig ist: pinne es zusätzlich irgendwo an einen Laternenmast. Das kann Dir niemand verwehren...Und ja, Moderatoren beurteilen, ob ein Beitrag in einen Thread gehört oder nicht." rumpel01 (ComputerBase-Mod)

  7. #57

    AW: AMD Navi: Der Vega-Nachfolger bleibt monolithisch im Desktop

    Zitat Zitat von Locuza Beitrag anzeigen
    Beim IF kann im Prinzip jede Topologie verwendet werden.
    Das Mesh von Intel führt durch jeden Kern durch, während bei Zen1 AMD jede Kommunikation außerhalb vom 4-Kern CCX über das IF SDF geregelt wird.
    Intels Lösung ist an der Stelle eben mit anderen Kompromissen verbunden, ein ganzes Mesh durchzuführen ist aufwendiger und gegenüber Intels alten "Ring-Bus" hat sich die Latenz bei wenigen Kernen auch verschlechtert.
    AMD Ryzen and the Windows 10 Scheduler - No Silver Bullet | PC Perspective
    The Intel Core i9-7900X 10-core Skylake-X Processor Review | Thread to Thread Latency and The X299 Platform


    Greenland hat aber 4x25GB/s durch das organische Substrat zur CPU vorgesehen, wie viel Platz und Energie könnte AMD für schnellere und/oder mehr Links investieren und auf welche Bandbreiten würde man kommen, wenn man beim MCM-Ansatz auf Silizium als Medium wechselt?
    Ebenso könnte man sich selber darauf beschränken nur zwei Chips miteinander zu verbinden und nicht 4.

    Nvidia hat in ihrem MCM Paper dargelegt, dass mit erweiterten Cache- und intelligente Steuerungsmechanismen die benötigte Bandbreite effektiv reduziert werden kann und praktisch gesehen definitiv nötig sind:
    http://research.nvidia.com/sites/def...017_MCMGPU.pdf

    Im Paper führt Nvidia auch beispielhaft 3TB/s (4x 768 GB/s) an, um praktisch keinen nennenswerten NUMA Effekt herbeizuführen und volle VRAM-Kommunikation zu gewährleisten.
    1,5 TB/s (4x384 GB/s) sollen bei speicherlastigen Simulationen zu 12% Leistungsverlust führen, dass ist jetzt nicht dramatisch bei 50% weniger Bandbreite.
    Die Nvidia-Studie beschäftigt sich ausschließlich mit Simulationen, nicht mit Grafikrendering. Bei massiv parallelisierten Berechnungen muss ein MCM-Konzept "nur" noch die Versorgung aller Recheneinheiten mit den jeweils benötigten Daten sicherstellen. Für Grafikberechnung müssen die Recheneinheiten aber auch untereinander Ergebnisse austauschen und jeder Die muss schnellen Zugriff auf alle Bildinhalte haben. Die von Nvivida angenommene 50 Prozent Cache-Hit-Rate zu erreichen, wenn bei der gezeigten 2×2-Konfiguration bereits rein statistisch 75 Prozent der Inhalte nie auf dem gleichen Chip wie der Cache waren, dürfte unmöglich sein. Im Gegensatz zu strukturieren Simulationen kann man bei GPU-Berechnung keine NUMA-resistenten Untergruppierungen für Teilbereiche bilden; beispielsweise Beleuchtungsberechnungen hängen potentiell von allen Lichtquellen im Bild ab.

    Der Vorschlag mit nur zwei Chips zu arbeiten reduziert die Komplextität schon eher – aber auch den Nutzen. Zeppelin ist so erfolgreich, weil drei Leistungsklassen abgedeckt werden, was nur dank Quad-Chip-MCM funktioniert. Im GPU-Bereich könnten zwar ein Duo aus leicht vergrößerten Polaris bei guter Verbindung Polaris 10 ersetzen, Vega hätte AMD dann aber dennoch zusätzlich entwickeln müssen. Entwicklungskosten für einen Chip eingespart, Entwicklungskosten für ein Spezial-Interface draufgezahlt – und nebenbei für jede Karte 10 bis 20 Prozent mehr Silizium verbraucht, zuzüglich Interposer/EMIB.

Seite 6 von 6 ... 23456

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •