Im Übrigen ist das Nvidia-Konzept, genau wie AMDs Infinity Fabric, ganz sicher keine Lösung für das Skalierungsproblem. Langfristig müssen sich die Hersteller einfach was anderes einfallen lassen und werden sie sicher auch tun. Das hier wäre nur ne Übergangslösung. Entweder geht man weg vom Silizium oder die Chips werden dreidimensional, oder... Möglichkeiten gibt es wohl einige, ist halt alles nur nicht marktreif.
Wenn 4x64 = 256 SMs gerade mal 46% schneller sind, als 128 SMs sieht es mit der Skalierung aber auch noch sehr schlecht aus.
Hust Hust
Infinity Fabric
Hust
Meines Wissens sind nicht mal Mikroruckler das Hauptproblem, sondern die Synchronisation der Frame-Times der beiden GPUs und damit oft zunichte machende Latenz. Oft bei meinem SLI erlebt, dass sich 60 FPS wie 30 FPS angefühlt haben.
...
Das dürfte am geringeren Takt und der steigenden benötigten Bandbreite liegen. Es gibt bei diesen ersten Prototypen / Konzeptmodellen sicher noch unendlich viele Flaschenhälse, weshalb die Leistung nicht linear ansteigen kann.
Es ist hierbei die Frage wie gut die Kommunikation innerhalb der Architektur arbeitet. Im Multiplexszenario steigen die Anforderungen mit jeder neu angeflanchten Teil-GPU massivst an.
Der Scheduler müsste wohl auch stark überarbeitet werden. Für das fertige Produkt müsse man die Verhältnisse sehr genau anpassen, was bei dieser Studie sicher nicht passiert ist. Sie is wohl nur ein absolutes Grobkonzept um das potential aufzuzeigen.
Ein monolitischer Chip würde auch nicht endlos skalieren. Das Ergebnis kommt sicher auf die individuelle Konfiguration an. Primär dürfte MCM eher eine Technik zur Kostenreduzierung und Umgehung von Fertigungslimits sein. Um die eigentliche Leistung müssen sich dann die Ingenieure in der Entwicklung kümmern.
n, weil der Fertigungsprozess nicht mehr verkleinert werden kann.
Laut NVIDIA hat Morres Law nur noch durch die Parallelisierung in den vergangenen Jahren bestand. Die Instruktion Pipelines wurden immer größer, um die Single-Threaded-Anwendungen zu beschleunigen. Weitere Optimierungen wie Caches-Hirarchien und Instruktionen wurden ebenfalls immer komplexer, um diese Bedürfnisse zu erfüllen.