Hier fehlen nur ein paar Details und dann wird das Bild schnell klarer.
Einerseits waren die ARM-Designs historisch bedingt auf Low-Power-Systeme und damit auf Effizienz ausgelegt. Nachdem man den Mobilmarkt erfolgreich besetzt hatte, kam eine Expansion in andere Märke jedoch ins Stocken, da der Durchsatz und damit die abgelieferte Leistung zu gering war, auf dem Smartphone vorerst kein Problem, für den Desktop oder gar den Server "unbrauchbar". Über die Jahre wurden aber auch Smartphone-SoCs immer leistungsfähiger, einerseits durch mehr Kerne, andererseits aber auch durch eine stetig steigende IPC, für bspw. Server aber immer noch zu wenig, insbesondere für HPC und später auch AI. Bereits schon etwa Mitte des letzten Jahrzehnts versuchten sich hier einige Hersteller, aber noch relativ erfolglos. ARM hat die Architektur jedoch stringent auch in diese Richtung weiterentwickelt und Dritthersteller gaben nicht auf und erweiterten die Designs um notwendige Funktionseinheiten (teilw. in Kollaboration mit ARM) für bspw. eine höhere Fließkommaleistung. ARM hat mittlerweile spezielle Sub-Architekturen und Zertifizierungen, die auf den Servermarkt abzielen und Dritthersteller pimpen ihre Designs mit weiteren Spezialitäten.
Beispielsweise hier der von Ampere Computing entwickelte
Quicksilver alias Altra Q80-33. Hierbei handelt es sich um ein 80-Kern-ARM-Design mit 3,3 GHz Takt bei <= 250 W, das in 7 nm bei TSMC gefertigt wird. Wie auch Amazon's Graviton2 basiert das Design auf der ARM-v8.2-Neoverse N1-Architektur (modifizierte Cortex-A76), wobei der Hersteller eher von ARM-v8.2+ spricht, da man auch einige Erweiterung von v8.3 und v8.4 hat einfließen lassen. Die Kerne können nur einen Thread gleichzeitig verarbeiten, besitzen jedoch auch
zwei 128 Bit-SIMD-Einheiten und beherrschen zudem zusätzlich FP16 und INT8 für Inferencing-Workloads. Pro Kern stehen 64 KiB L1 (I/D), 1 MiB L2 und für das gesamte SoC 32 MiB L3-Cache zur Verfügung. Und I/O-technisch fehlt es den Designs auch an nichts: 8 x DDR4 mit ECC mit über 200 GiB/s, bis zu 4 TB pro Socket, 128 PCIe-4.0-Lanes, in Dual-Socket-Konfigurationen stehen gar 192 Lanes zur Verfügung und Untersützung für CCIX, den Cache Coherent Interconnect for Accelerators (ein ähnlicher Standard zu Intel's CXL). Und im Laufe dieses Jahres wird noch der größere Bruder Altra Max Q128-30 erscheinen, also 128 Kerne bei 3,0 GHz, weiterhin in 7 nm und für das nächste Jahr ist mit
Siryn bereits ein 5 nm-Nachfolger geplant, der seinen Tapeout schon in 2020 hatte.
Beispielsweise der derzeit schnellste Supercomputer Fugaku in Kobe, Japan basiert auf Fujitsu's A64FX, der als einer der ersten die ARMv8.2-A Scalable Vector Extension in einer 512 Bit-Variante verwendet.
Als weitere Stichworte:
en.wikipedia.org
en.wikipedia.org
Und auch im Nicht-Server-Umfeld setzen sich die Bemühungen der Hersteller fort um dem dominierenden x86 das Wasser abzugraben. Beispielsweise Qualcomm bereitet seinen Snapdragon SC8280XP vor, der nur aus großen Kernen (Gold + und Gold, keine kleinen Silver-Kerne mehr) besteht und primär auf Systeme für Windows on ARM abziehlt, was leicht nachvollziehbar ist, da bald die x86-64Bit-Emulation verfügbar werden soll, was zusätzliche Leistung benötigt.
Also laut dem obigen Benchmark von Andatech [...]
Es geht mir hier nicht um ein Fanboy-typisches "
aber mein Brand ist das One-and-only, wer was anderes kauft ist doof".

Die Designs sind mittlerweile extrem nah dran insbesondere dieses konkrete, allgemein verfügbare Beispiel (
und Ian schreibt ja auch, dass dieses in einigen Durchsatz-Workloads gar besser abschneidet) und bspw. Ampere Computing legt schon
dieses Jahr nach mit 128 Kernen für einen Socket und im nächsten Jahr folgt der 5 nm-Nachfolger während Epyc Genoa möglicherweise gar erst im 2HJ22 released wird.
Darüber hinaus ist der Preisunterschied schon sehr deutlich, denn AMD verlang hier fast 8000 US$, während der Altra nur um die 4000 US$ kostet, wobei das im Datacenter aber eher sekundär ist, aber dennoch ein weiterer Punkt, denn hier gehen die ARM-Hersteller ebenso vor wie AMD gegen Intel ... der Preis ist nun einmal ein zusätzliches Vertriebsargument.
Ob das für AMD wettbewerbstechnisch so gut ist, bleibt fraglich, denn wenn man sich schon überlegt von Intel-HW Abstand zu nehmen, steht dann vielfach nicht nur die Option AMD zur Verfügung, sondern eben halt auch ARM über diverse Hersteller, aber wie sich der Markt diesbezüglich entwickeln wird, wird man einfach abwarten müssen.