Ohne x86, aber mit AMD Radeon: Samsung arbeitet angeblich an Notebook-CPU

PCGH-Redaktion

Kommentar-System
Teammitglied
Jetzt ist Ihre Meinung gefragt zu Ohne x86, aber mit AMD Radeon: Samsung arbeitet angeblich an Notebook-CPU

Berichten nach stellt Samsung in der zweiten Jahreshälfte einen neuen 5-nm-Prozessor vor, der für Smartphones und Notebooks eingesetzt werden kann. Er würde die ARM-Architektur nutzen - und angeblich auch eine AMD-Grafikkarte.

Bitte beachten Sie: Der Kommentarbereich wird gemäß der Forenregeln moderiert. Allgemeine Fragen und Kritik zu Online-Artikeln von PC Games Hardware sind im Feedback-Unterforum zu veröffentlichen und nicht im Kommentarthread zu einer News. Dort werden sie ohne Nachfragen entfernt.

lastpost-right.png
Zurück zum Artikel: Ohne x86, aber mit AMD Radeon: Samsung arbeitet angeblich an Notebook-CPU
 
x86 müsste mMn mal überarbeitet werden. ARM ist so effizient weil es etwas aufbeglasene RISC ist (Reduced Instruction Set Computer, ARM: Advanced RISC Machines). Ein Abschneiden alter Zöpfe ist seit x64 überfällig.
 
Bin auch gespannt, ob x86 irgendwann mal ausgedient hat. Zeit wird´s glaub mal ...
Da ist halt leider nur die Geschichte mit dem "Rattenschwanz" und so. :crazy:

MfG Föhn.
 
Bei großen Aufgaben schlägt sich x86 weiterhin wacker. Die Echtzeitumwandlung von CISC in RISC bedeutet zwar etwas mehr Aufwand in Hardware, erlaubt aber auch hardwarenahe Optimierungen ohne spezielle Software-Unterstützung und das Frontend superskalarer OoO-Monster, wie wir sie heute haben, ist aus ganz anderen Gründen sowieso aufwendig. Im Backbone- und Supercomputer-Segment hat IA32-64 IA64 und damit indirekt Alpha platt gemacht und Power sowie Sparc in die Nische verdrängt, obwohl es da keine Kompatibilitäts-Fixierung bei der Software gab. Gleiches gilt für MIPS und PowerPC, die aus den Konsolen geflogen sind. Das waren Siege auf offener Strecke. Auch heute schlagen sich die Server-Arm-Entwürfe nicht gerade glamouröse gegen Zen 3, sondern können nur in Spezialfällen punkten. Spezialfälle, auf die Intel und AMD zum Teil bewusst nicht optimieren, weil sie aus Gegenrichtung kommend mit Altera, Xilinx, Phi und CDNA und schon etwas brauchbares im Angebot haben.

Wo ARM deutliche Vorteile hat: Kleine Kerne. Zwar kann man "x86" als solches auch sehr weit runterskalieren, wie Intel mit dem INT-Teil von Phi und den aktuellen IME-Einheiten bewiesen hat, aber wenn man die Kompatibilitätsvorteile erhalten, also unter anderem AMD64 und AVX2 bieten will, dann hat das Ergebnis eine gewisse Mindest-Komplexität und das macht es schwer, einen effizienten Ultra-Low-Power-Prozessor zu entwickeln. Aber in den Bereichen, für die x86 traditionell verwendet wird, spielt diese <1-W-pro-Kern-Klasse eben keine Rolle und bereits im 10-W-Quadcore-Segment ist x86 wieder konkurrenzfähig.

Man darf hierbei nicht die Architektur mit den Chips verwechseln – natürlich wird Cascade Lake SP in vielen Benchmarks von einem ThunderX3 geschlagen. Aber das ist halt Fertigungstechnologie von 2014 vs. Fertigungstechnologie von heute und wir wissen aus dem Desktop, dass das für Intel auch mit x86 auf beiden Seiten schlecht ausgeht. Gleiches gilt mit Fertigungstechnologie von morgen (aus PCler-Sicht): Apples M1 schlägt Ice Lake deutlich. Aber würde er das auch noch schaffen, wenn letzterer ebenfalls in 5nm statt in 10 nm vom Band rollen würde? Könnte er sich gegen Zen 4 durchsetzen, wenn Apple das gleiche Budget an AMD überwiesen hätte, statt es selbst in die Hand zu nehmen?
Im Markt für große CPUs hat ARM nur einen Vorteil: Es gibt mehr als zwei nennenswerte Hersteller und entsprechend größer ist die Wahrscheinlichkeit, dass ein Entwickler ein paar gute Ideen zusammen umsetzt. Aber im Schnitt nehmen sich ARM und x86 nicht viel.
 
Zuletzt bearbeitet:
Interessant wäre ARM gerade für Chrome OS.(reicht sicher für YT+Office+etwas Gaming)
Ein bisschen Konkurrenz kann W10 net schaden.
 
Interessant wäre ARM gerade für Chrome OS.(reicht sicher für YT+Office+etwas Gaming)
Ein bisschen Konkurrenz kann W10 net schaden.
Der Wahn ist:
AMD kommt schon bei einem 5950x-er Kern auf 6,5625 Watt.
3,4-4,9 GHz.
Nur mit Taktung, wie weit bekommt man den Runter?
2Watt für 2GHz oder weniger?
 
2Watt für 2GHz oder weniger?
Gibts eigentlich bei ARM auch solche Überlegungen mit big+small Cores wie bei Zen 5 bzw. Apple?
Dann gehts wirklich noch deutlich weiter runter.

Die big Cores evtl. ohne SMT, dafür die smallCores mit 4 fach SMT für light Threads wäre ideal.
 
Na wenn Dich von der x86 Architektur abwendest, hin zur einer komplett Neuen.
Da braucht es ja extra darauf angepasste Software (Betriebssystem, etc. etc. ...).
Und bis da das x86 "Universum" vollends verdrängt/ersetzt/von "allen" angenommen ist/wird, vergehen ein "paar" Tage.
Das meinte ich mit "Rattenschwanz" ...

MfG Föhn.
 
Gibts eigentlich bei ARM auch solche Überlegungen mit big+small Cores wie bei Zen 5 bzw. Apple?
Dann gehts wirklich noch deutlich weiter runter.

Die big Cores evtl. ohne SMT, dafür die smallCores mit 4 fach SMT für light Threads wäre ideal.
Da kommt es her. ARM hatte schon Recht Früh solche Produkte.


So 2012 waren die damit fertig. Ab da konnte Big.Little gebaut werden.
 
Wow!

Da haben Intel+AMD aber ganz schön Nachholebedarf.
Und den armen Gamern immer größere sinnlose Stromfresser verkaufen!?
Das wurde wegen Ultramobil, die CPU+GPU+Chipsatz... dürfen nur 2 Watt konsumieren, gemacht. Da wird dann ab+an- geschaltet. Und für ~90% der Tätigkeiten reichen die little-Kerne: Standby-Modus.

Bei X86 wird schon länger P und C states verwendet:

1620727765985.png


Da bei all meinen Kernen Hintergrundlast anliegt sind die alle ein bisschen am Takten.
 
big.Little lohnt sich vor allem im ultra-low-power-mobile-Bereich. Also da, wo x86 nicht und ARM regelmäßig zum Einsatz kommt. Im Desktop wird der Nutzen eher gering sein beziehungsweise in der Einsparung von ein paar mm² Silizium bestehen. Das Intel bei Alder Lake darauf setzt, ist eher eine Kosten-Nutzen-Abwägung mit 0 Kosten: Man hat die zweite Architekturlinie seit den Atoms sowie im Haus, um damit Many-Core-Server-, Tablet- und Low-Power-Märkte unterhalb des Leistungsniveaus von zwei "großen" Core-Kernen zu bedienen. Jetzt beide Architekturen in einen Chip zu packen ist also mit vertretbarem Aufwand möglich und bringt Akkulaufzeit-Vorteile bei den Subnotebooks und den Tablets, wo sich Intel weiterhin hart gegen ARM, vor allem auch in Form von Chromebooks und jetzt Apple, kämpft. Man braucht diese Technik also sowieso und übernimmt sie einfach in die Desktop-CPUs, aber nur für diese zu entwickeln hätte sich nicht gelohnt. AMDs offizielle Position vor einem halben Jahr war noch "lohnt sich nicht, man kann gegenüber Zen 3 nicht genug einsparen" – und diese Einstellung war für eine Firma, deren kleinste Entwicklungen aus der 30-W-Notebook-Klasse stammen, auch vollkommen richtig. Mit dem dort üblichen Energiebudget und für die dort geforderte Performance ist man mit zwei aktiven plus weiteren, zeitweilig schlafenden Zen-Kernen sehr gut aufgestellt. Erst wenn man unter 10 W konkkurenzfähig sein wollte, müsste AMD etwas neues entwickeln.

Anm.: Es gibt APUs auch mit kleineren TDP-Einstufungen, diese Modelle sind aber runtergetaktete Ableger eines Designs, das eigentlich für größeres geschaffen wurde.
 
Nein, eigentlich nicht oder nur in Ausnahmefällen. Meist ist es bei gemischten Workloads effektiver, mehrere kleine Threads auf einem big-Core zu bündeln und zusätzliche Kerne ganz wegzulassen. Nur wenn man fast ausschließlich little-Aufgaben hat und 1-2 Mainthreads zusätzlich bewältigen muss, könnte ein 2+16-Design sinnvoll sein. Aber das wäre eben sehr spezialisiert. Eigentlich glänzen Little-Designs eher in Szenarien, in denen die big-Kerne zeitweilig ganz abgeschaltet werden können. Aber da geht es dann um Effizienz, nicht Effektivität.

Nehmen wird die Zahlen aus dem PUBG-Test mal als abstraktes Beispiel und gehen pauschal davon aus, dass es sich um exakt 16 Threads handelt, von denen der heftigste im Broadwell-Fall einen Workload von "81 Punkten" verursacht:
Intel deutet in Folien einen 1:3 Leistungsunterschied an. Das heißt die Little-Cores erreichen maximal 1/3 der Leistung der Big-Cores (was bei 1/4 Platzverbrauch schon ganz gut ist) und könnten somit, wenn ein Big Core bei "81" limitiert, maximal Threads von Kaliber "27" bewältigen. Von unseren 16 Threads sind neben dem 81er auch der 59er und der 33er definitiv über dieser Grenze, der 27er bedenklich nah dran. Wir brauchen also mindestens vier Big-Cores, von denen drei aber etwas Luft haben. Genug Luft für sämtliche kleineren Threads – ich kommme bei gleichmäßiger Verteilung auf eine Kernbelastung von "81", "80", "80" und "71". Das heißt die optimale CPU für das gezeigte Anforderungsprofil ist ein 4+0-Design. 4+4 oder gar 8+x würden dagegen genauso durch den Mainthread limitiert, wie der getestete 8+0-Kerner, der Einsatz zusätzlichen Siliziums für weitere Kerne ist nicht effektiv.

Alternativ wäre es zwar möglich, den 27er und den 33er Thread auf einem gemeinsamen Big-Kern laufen zu lassen und denn entsprechend mehr verbleibende kleine Threads auch auf Little-Kerne zu verteilen. Ein 3+4-Design ist aber produktionstechnisch ungünstig und für eine 2+8-Big-Little-CPU müsste man sowohl den 27er als auch den 33er Thread aufteilen, denn beide passen weder in einen Little-Kern noch zusätzlich zum 59er in einen Big. Aber ehe man sich diese Mühe macht, sollte man lieber den 81er amgehen. Rechenbeispiel zwei: Eine optimierte Engine splittet den 81er in zwei Hälften und die größten Workloads wiegen 59, 41, 40, 33, 27 und in weiterer Folge 23 und 20 Punkte. Erstmal läuft das ganze Spiel dadurch bei gleicher Architektur und Takt jetzt bis zu 33 Prozent schneller, weil der 59er als Mainthread viel weniger limitiert. Das heißt aber auch, dass jetzt weniger Zeit für die Berechnung kleiner Threads zur Verfügung steht, ehe der nächste Frame ansteht – 1:3er Little-Cores kommen nur noch für Workloads mit 20 Punkten oder weniger in Frage, ehe sie zur Bremse werden. Um alle sieben genannten Mainthreads zu bearbeiten, brauchen wird also 5 Big-Cores (jeweils zwei kleinere passen zusammen auf einen), aber wiederum reichen deren sechs, um insgesamt ohne weitere Unterstützung auszukommen => Mit überarbeiteter Engine ist 4+8 zu lahm (zu wenig Big Cores), 5+1 ungünstig in der Herstellung, 6+0 genau passend und 6+x überflüssig. Also ist erneut eine all-Big-CPU die effektivste Wahl.
 
Zuletzt bearbeitet:
Top!
Finde Es klasse, das Du so gut auf das Forum eingehst.
Werde mal suchen, Was für Zen5 angedacht ist. Glaube 8+4 oder so.(x)
wait a minute

(x) Hat sicher Marketinggründe. Andersrum wäre evtl. auch gegangen.
 
Zurück