[...] Ein objektives Bennenungschema [...]
... kann es schon per Definition nicht geben. *) Zum einen gibt es unterschiedliche Parameter/Eigenschaften eines Prozesses, die je nach Anwendungszweck unterschiedlich gewichtet sind. Zudem hängt es von den realisierbaren Peak-Werten des Nodes ab, dann was die unterschiedlichen Cell Libraries ermöglichen und für welche Designs und Funktionsblöcke sie sich einigen und dann am Ende davon, wie konkret ein Entwickler diese Möglichkeiten nutzt und implementiert.
Selbst wenn zwei Entwickler etwas in TSMCs N7 designen, kann das am Ende dabei herauskommende Produkt dennoch deutlich unterschiedliche Eigenschaften aufweisen, weil man andere Priöritäten setzte.
Beispiele:
Der Wechsel von Zen 14LPP auf Zen+ 12LP bei GloFo. AMD verzichtete hier auf die mögliche Flächenverkleinerung um die Performance zu erhöhen.
Der Vergleich Navi 10 (7FFP = N7P) zu Turing (12FFC/N, so bspw. der RTX 2070 Super). Die Chips und Leistungswerte sind in jeder Hinsicht vergleichbar und am Ende auch beim Verbrauch, nur zumindest das dürfte nicht der Fall sein, denn RDNA als Navi 10 verwendet den mit Abstand deutlich moderneren Fertigungsprozess, d. h. hier verschlechtern ein oder mehrere Teilaspekte **) die Effizienz bei Navi 10 deutlich.
Zudem hängt auch viel an den verwendeten Cell Libraries, bei denen Intel bspw. in der Vergangenheit deutlich effizienter war (
aktuell kann man das nur schwer einschätzen, da die zurzeit kaum Daten preisgeben). Beispielsweise Zen mit 8 Kernen und 16 MiB L3 im 14LPP benötigte 4,8 Mrd. Transistoren in AMDs Design. Dagegen Intel's Broadwell-EP benötigte gerade mal 4,7 Mrd. Transistoren ... für 15 Kerne, 35 MiB L3, vier Speichercontroller und 40 PCIe-Lanes.
Den verwendeten Prozess kann man als groben Indikator heranziehen, am Ende kommt man um konkrete Messungen finaler Produkte aber nicht herum, in die dann sämtliche Teilaspekte eines Designs einfließen. Beispielsweise das RNDA/Turing-Beispiel zeigt, dass man auch extrem danebengreifen kann, wenn man sich zu sehr auf den Prozess(namen) konzentriert.
*) Abgesehen davon, dass auch kein Hersteller (
außer Intel, aber auch die werden in ein paar Jahren einen Foundry-Anteil haben) daran ein Interesse hat, denn bei den Foundries dienen die Namen immer auch Marketingzwecken.
**) Absehbar dürfte der Großteil der schlechteren Effizienz der Architektur zuzuschrieben sein. Zudem kommt noch hinzu, dass dies ein Pilot von AMD unter der Nutzung des N7P war, der etwas effizienter oder aber performanter als der reguläre N7 implementieren kann.
AMD bewarb das Design dennoch als großen Wurf, was es ja auch war, aber halt eben nur innerhalb ihrer eigenen Produktpalette.
GA100 is bei 65.6MTr / mm²
Korrekt. Nvidia implementiert hier mit einer deutlich höheren Dichte im N7 als es bspw. AMD mit RDNA2 tut, die hier nur auf rd. 50 MTr/mm2 kommen.
In Anlehnung an vorherige Beispiele: Der GA102 in Samsungs 8LPP (8N, eine kleinere Customization für Nvidia) implementiert mit im Mittel 45 MTr/mm2, also höher als AMD zuvor mit Vega 20 und Navi 10 im N7(P) und nur geringfügig weniger als RDNA2. Der verwendete Prozess(name) ist offensichtlich nicht alles.