AW: Bulldozer: Ex-AMD-Ingenieur sieht automatische Designprozesse für mangelden Performance verantwortlich
Klar lieben wir alle AMD und natürlich ist man durch Intel´s verrückte Wissenschaftler auch Fan geworden. Bei Intel fühle ich mich als Normalverbraucher zurzeit wohler (und nicht wegen 9 koreanischen Girls, die singend für Intel Werbung machen). Es sind die Speicherbandbreiten und die Unerschütterlichkeit von Sandy Bridge.
Es war töricht von mir, zu hoffen, dass ein FX-8150 die gleiche Anzahl an FPS generieren kann in einem Spiel, das nur 2 Threads beansprucht, wie ein i3-21XX. Diese haben nämlich eine zu den größeren i5/i7 Sandy Bridge Prozessoren ähnliche Schlagkraft pro Kern und Takt. Dementsprechen dürfte in z.B. StarCraft 2 sogar ein Sandy Bridge Pentium unter einem i3 den größten Bulldozer aufrauchen. Warum ist das so?
Der Scheduler ist eine Sache klar, aber warum ist der L1-Daten-Cache im Integer-Cluster ("Kern") nur 16KB (4-fach assoziativ) groß? Warum ist er nicht um Faktor 3 schneller? Warum werden aus dem riesigen L3 Cache Daten gelöscht und im kleinen L1 Cache abgelegt?
ht4u sagt, dies erinnert stark an die Markteinführung vom Intel Pentium 4, deren Fehler aber schnell ausgebessert werden konnten. So richtig angefangen mich für Technik zu interessieren war zu Beginn der Nintendo GameCube Zeiten.
Der Arbeitsspeicher war klein, aber auch schnell. Ihm wurde nachgesagt, er sei der Flaschenhals, aber andere sagten dies sei die Stärke des Systems, denn der IBM-Prozessor "Gecko" oder die ATI-Grafikkarte "Flipper" waren ansehnlich, aber nicht verantwortlich für die schlechte Grafik in dem einen Spiel und der herausragend guten Grafik im anderen Spiel.
Intel legt seit Prozessor-Generationen Daten auch im jeweils nächsthöheren Cache ab, was die Bandbreite um was weiß ich 2-10% verringert, aber die Latenzen sowas von verbessert, weil man nicht nach Veränderungen im L2 Cache schnüffeln "schnoopen" muss.
In einem Abwasch werden die Daten verarbeitet ohne Risiko, sie nochmal zurückschicken zu müssen, was die Latenzen/Zugriffszeiten bei Sandy Bridge stark verbessert. Dass sich 2 Kerne die Daten teilen müssen, geht zugunsten des Stromverbrauchs in Ordnung, aber ich möchte eine Frage stellen:
Ist vom Bulldozer-Nachfolger mehr zu erwarten als die von der Fachpresse angesprochenen Flaschenhälse? Wenn ja, dann kann man von 2 Milliarden Transistoren nämlich noch viel mehr Dampf erwarten, weil bei Intel wird mit Speicher selbst dann noch gekleckert, wenn dieser z.B. beim Pentium oder i3 auf 3MB (L3) beschränkt wird. Bulldozer leidet an Kurzatmigkeit, allerdings können bei 8 genutzten Threads durchaus konkurrenzfähige Ergebnisse zustande kommen. Doch ist der Stromverbrauch/die Belastung des Mainboards auch da schlechter als bei Intel. Und bei wenigen genutzten Threads rennt Sandy Bridge dem Bully einfach davon
.
PCGH weist gerne da drauf hin, dass die Zukunft Multithreading ist, aber warum dann nur mit Mehrverbrauch? Ihr habt das von mir aus schon richtig erkannt und Bulldozer wäre mit sehr guter Schlagkraft pro Kern vergleichbar gut wie Sandy Bridge, selbst wenn es mehr Transistoren und mehr Strom benötigt. Man stelle sich das mal vor: Bully stemmt bei StarCraft oder anderen "lightly threaded applications" genauso viel wie Sandy Bridge und würde in x264 Anwendungen mit 8 Threads haste nicht gesehen 200% davonziehen...dann würde uns Verbrauchern Bulldozer genauso viel Spaß machen wie Sandy Bridge.
ht4u sagt, Anno 1404 macht Gebrauch von vielen Kernen, reagiert aber gleichzeitig sensibel auf IPC und Single Thread Performance. Die Anzahl der Kerne darf niedriger sein, wenn die Gesamtperformace stimmt. Egal wie ein Konzept aussieht: Es funktioniert immer dann, wenn das Ergebnis für den Verbraucher gut aussieht
In Zukunft erwarte ich Großes von AMD, doch der ausgeschiedene Mitarbeiter von AMD hat wahrscheinlich Recht und er tut AMD damit einen Gefallen, ihnen das zu sagen, nachdem er vorher bei Besprechungen durch die Überzahl an Mitarbeitern gescheitert ist, die Angst hatten und einfach einen groß und stark wirkenden Bulldozer auf die Verbraucher loslassen wollten. AMD kann selbst mit Core Multithreading statt Hyperthreading seine CPUs von Hand viel ähnlicher zu Sandy Bridge gestalten als bisher angenommen. Die Belohnung wird ein höherer Marktanteil sein und alle werden sich freuen über einen AMD "Piledriver", der nicht an Kurzatmigkeit leidet. Mag der L3 Cache z.B. beim i5-2300 kleiner sein...laut ht4u ist dieser Prozessor mit 4x2,8GHz im Schnitt 3% schneller als der FX-8150. Und trotztdem ist der Bulldozer vom Prinzip her eine äußerst interessante Architektur
Ich für meinen Teil nehme es Intel jedenfalls nicht übel, wenn sie so einen hevorragenden Job machen, selbst wenn das Gleichgewicht der x86-Chipriesen AMG gegen Intel damit zunächst zestört scheint. Sandy Bridge ist einfach besser als erwartet, vor allem auch was Preis/Leistung angeht.