AW: iPhone Xs: Apple A12 Bionic legt sich mit Desktop-CPUs an und lässt Mobile-SoCs weit hinter sich
Sehr beeindruckend, vor allem im Vergleich zu Samsung.
Aber auch nur in Mobile Benchmarks würde ich behaupten. Die riesigen Caches und die breite Speicheranbindung haben Desktop CPUs ja nicht umsonst, können sie aber in den vergleichsweise winzigen Mobile Benchmarks nicht ausfahren. Das würde sich ändern, wenn man so Sachen wie Cinebench oder Video Kompression testen würde, die zwangsläufig nicht nur in den innersten Cache Ebenen laufen können. Da würde dann wahrscheinlich auch der "moderat getaktete Intel Skylake" den A12 in den Boden stampfen.
Da Apple aber wie immer keine genauen Spezifikationen veröffentlicht, ist das aber alles Spekulation
Es waren nicht die üblichen mobile Benchmarks wie Geekbench oder irgendwelche Browser-Scripts, es war SPEC2006 mit insgesamt 12 Integer lastigen Tests und 7 Floating-Point tests.
Und es ist der A12 der riesige Caches hat, 128KB groß ist der L1D$ (das konnte man messen) und der I$ ist entweder genauso groß oder zumindest 64KB dick.
Aktuelle Core CPUs von Intel besitzen gerade mal 32KB L1I/D$, Zen hat 32KB beim L1D$ und 64KB beim L1I$.
Der L2$ bei den großen Kernen ist mindestens 2MB groß, wird danach stufenweise geregelt und scheint bis zu 8MB hoch gehen zu können, wenn der Workload passend ausfällt, Intel verbaut gerade mal 256KB pro Kern, AMDs Zen 512KB.
Der LLC ist 8MB groß, Intel verbaut 2MB LLC pro Kern bzw. AMD 8MB pro 4-Kern CCX.
Ein A11/12 hat auch 6-Integer-Pipes gegenüber den 4 bei Intels CPUs oder AMDs Zen.
Sandy-Bridge/Ivy-Bridge hatten 3-Pipes, ab Haswell und bis Heute hat Intel 4 verbaut und AMDs Jaguar hat zwei, Bulldozer hatte zwei pro Integer-Kern, ein alter K10 3-Pipes und Zen wie gesagt 4.
Und das Out-of-Order-Window war bei Apple schon vor etlichen Jahren (A7 2013) so groß wie bei Intels Haswell/AMDs Zen mit 192 Einträgen, keine Ahnung welche Größe Apple jetzt verwendet.
Das Teil ist fett, sehr fett und wird sicherlich nicht von einem Skylake in den Boden gestampft.
Die Effizienz kommt auch eher von den erstmalig eingesetzten 7nm.
Teilweise, aber nicht ganz.
Ein anderer Faktor ist das das System sehr SRAM heavy ist und Apples Prozessoren so dadurch deutlich weniger über den DRAM schieben müssen und ein weiter Teil sicherlich auch davon, dass man allgemein bessere CPUs baut.
Man stelle sich nur vor, Apple würde PC Grafikkarten bauen.....
Die wuerden zwar genauso 1300€ kosten wie eine RTX2080ti, wären aber wohl 4x so schnell.
Wahnsinn!
Die GPU wäre jetzt nicht so ein super geiles Stück.
Es ist scheinbar die zweite größere custom Generation auf Basis von Imaginations Grafik-IP, auch wenn Apple von eigenem Design labert.
Dank 7nm, dem großen System Cache und vermutlich auch dem gelegen Metal-Backend kommt es gut weg, aber Apple ist normalisiert nicht soweit vorne im Vergleich zur Konkurrenz von Samsung, Qualcomm und ARM.
Turing ist da sicherlich besser.
Ist das real auch wirklich in Anwendungen abrufbar bzw. nicht nur in irgendwelchen Benchmarks zu sehen?
Jep, SPEC2006 stellt keine Leichtkost dar und das Design hat offensichtlich die Ressourcen um ordentlich Performance auf den Boden zu bringen.
Vergiss es. AMD und NVidia haben Jahrzehnte Know-How Vorsprung gegenüber allen anderen was diskrete GPUs angeht. Selbst Intel mit Milliardenbudget konnte da bisher nicht ansatzweise mithalten ("Larrabee") und musste nachdem sie nach vielen jahren eingesehen haben dass ihre iGPUs nicht mithalten können bei AMD die Technik einkaufen (i7-8809G). Apple weiß genau warum sie so ein Produkt nicht anbieten - wäre eine solche Karte nur 4x langsamer wäre das schon ein extremer Erfolg.
Larrabee war mit Out-of-Order und den x86-Kernen schon prinzipbedingt ineffizient balanciert.
Ich würde den Vorsprung von Nvidia nicht auf Dauer als unaufholbar betrachten, vor allem nicht im Vergleich zu AMD.
Eins muss man natürlich fairerweise bei der CPU und auch den GPUs sagen, die Teile haben keinen super fetten Interconnect oder Kompromisse wegen dem scaling wählen müssen, wie Intel, AMD und Nvidia, die für Server und Desktops CPUs mit 3-5Ghz verkaufen oder dutzenden Kernen oder bei den GPUs es auf über 10TF bringen, mit etlichen Fixed-Function-Engines und tausenden ALUs.
Das bekommt man nicht natürlich nicht kostenlos hin.