Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Rollora

Kokü-Junkie (m/w)
Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Extremetech hat sich noch einmal mit dem Bulli auseinandergsetzt.
Inzwischen wissen wir alle: der Bulli enttäuscht auf ganzer Linie, es ist eigentlich kein Licht am Horizont, wenn es um den Midrange/Highendmarkt geht. Und dennoch, für das bisherige Scheitern gibts viele Gründe, denen in diesem Review auf den Zahn gefühlt wird.
Was von mir bislang eine Vermutung war, bestätigte dieses Review:
Die "Hauptcores" im Bulldozer scheinen gut zu funktionieren, aber die zusätzlichen Cores scheinen ihn zu bremsen, da am Ende des Arbeissschrittes die "Hauptcores" auf die "kleinen" warten müssen. Bzw kriegen die kleinen die Aufgaben mit gleicher Priorität, weil das Betriebssystem glaubt es sind "echte" Kerne. Für die zu bewältigenden Aufgaben brauchen sie jedoch länger als erwartet was zum Slowdown führt. Ein Hinweis, dass diese These stimmt, gibts hier: http://www.extremetech.com/wp-content/uploads/2011/10/DIEP-Scaling.png
bzw Page 2 - Analyzing Bulldozer: Why AMD’s chip is so disappointing | ExtremeTech
So etwa: wenn man den 4 Modul-Bulldozer nur 4 Threads (bzw cores) zuweist, ist er schneller (!) als wenn er 8 Threads verarbeiten soll. (bzw 8 Cores aktiv sind)
Nicht durchgehend, aber dennoch in manchen Benchmarks und zwar DEUTLICH. Zusätzlich hilft der Turbo:

There’s a 22% gap between running DIEP on four separate modules and running it on two modules. Refer up to our Cinebench and Maxwell Render tests, and you’ll see similar gaps; it takes the 2M/4C configuration 20% longer to render our benchmark scene in Maxwell, and it’s 16% slower than the 4M/4C configuration in Cinebench. This is precisely where AMD’s more aggressive Turbo Core is meant to kick in–but given Windows 7′s imperfect scheduling, performance still takes a hit in a 2M/4C configuration, even if Turbo Mode is on (we checked)
.

Es könnte also sein, dass man zu deutlich mehr Performance kommt, wenn man nur 4 Cores betreibt. Ich hoffe mal der Bulli ist so schlau und nimmt dann die 4 Main cores.

Natürlich gibt es auch andere Gründe, die in diversen Reviews ja schon genannt wurden. Mehr dazu im Review von Extremetech,
Abschließend meinen die Redakteure noch für die Zukunft von Bulldozer (das hier könnte besonders interessant sein für den User "Fuchs", der IPC für unwichtig hält):
If AMD wants to compete effectively with Intel, it has to push Bulldozer’s IPC in a positive direction. This is doubly important for mobile parts, where TDP limits won’t allow for the same degree of overclocking and Llano already operates at a significant performance disadvantage compared to Sandy Bridge. It may not be possible to improve much on the 20 percent scaling hit Bulldozer takes compared to Thuban, which makes single-thread IPC all the more vital.
 
Zuletzt bearbeitet:
AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

naja... die Sache ist ein Hexenwerk...

Nimmt man 4 Threads auf 4 Module hat man keinen Turbo (geht nur wenn zb 4 Threads auf 2 Modulen laufen)

Kein Turbo bedeutet idr weniger Leustung, bei dem krassen Turbo Takt mit unter recht viel wenn der Turbo sauber funktioniert (was er wohl nicht tut).

2 Threads auf einem Modul bedeuten wie du korrekt sagst auch weniger Leistung =/

Naja, und bei Dingen wie CineBench... was soll da noch zu verbessern sein, 8 Threads, 4 Moduel voll...
 
Hört sich für mich so an wie damals Hyperthreading unter XP und Vista mehr oder weniger Nutzlos und bei Normalen Anwendungen sogar bremst.Unter 7 wurde es dann optimiert
 
AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Hört sich für mich so an wie damals Hyperthreading unter XP und Vista mehr oder weniger Nutzlos und bei Normalen Anwendungen sogar bremst.Unter 7 wurde es dann optimiert
ja wobei das Konzept von HT doch in dem Fall überlegen ist, da (einfach gesagt) eine Einheit im Prozessor einfach doppelt angesteuert wird- es gibt also keine zusätzlichen Trainsistoren die Abwärme erzeugen oder ähnliches. Zumal aktiviertes SMT nur in wenigen Fällen ein (spürbarer) Nachteil war. Es handelte sich dabei immer um wenige Prozentpunkte, und stimmt schon Win 7 hat mit SP1 sogar das verbessert.
Ich hoffe es kommt in Win 7 so etwas wie das Threadhandling des W8, wo der Bulldozer etwas schneller ist, sowie von AMD eine überarbeitete Version des Konzepts, die 4 Module 4 Core Tests zeigen, dass die Leistung annähernd da wäre. Sonst bringt man meinetwegen einen mittelklasse Bulli ohne die zusätzlichen Integerkerne...
 
AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Hat einer Gamebenches gesehen die nur bis 4t nützen, mit dem FX8150 ~4c/8t vs 4c/4t ?
 
AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Blöd nur, dass das Umschalten zwischen den Integercores für deren parallele Nutzung ja das Kernfeature der Bulldozerarchitektur ist. Dass es ausgerechnet da hakt, ist dann natürlich maximal desaströs für die Leistung, wie man gesehen hat. Möglicherweise handelt es sich ja um ein lösbares Problem...
Für wenig parallelisierte Aufgaben sollte AMD dann jedenfalls dafür sorgen, dass nur ein Kern pro Modul arbeitet.
 
AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Ich könnte mir vorstellen, das es Bios-Updates oder AMD-Treiber für Windows, ja vielleicht sogar ein Windows-Update selbst geben könnte, das den Bulli richtig anspricht, wenn wirklich "nur" das oben genannte Problem den Prozessor ausbremst. Es gab ja schließlich auch mal den AMD Dual Core Optimizer, warum also nicht einen Bulli Optimizer, der dafür sorgt, das Windows die 4 zusätzlichen Integer-Einheiten nicht all vollwertige Cores erkennt und sie nur nutzt, wenn sich auch wirklich gebraucht werden?
 
AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

SemiAccurate hat sich über die schlechte Leistung des Bulldozers schon vor einer Woche ausgelassen. Teil 1 Teil 2

Am Ende kann man zusammenfassen das es überall im Bulldozer es feine und gröbere Schnitzer gibt die die CPU ausbremsen. Die Schnitzer werden wohl mit den nächsten Generationen ausgemerzt werden. Deswegen verwundert es mich nicht das AMD von 10%-15% Prozent mehr Leistung bei Piledriver spricht.

Die Architektur hat viel Potenzial was noch nicht ausgespielt wurde. Intel schläft auch nicht und hat bei ihren SB`s noch ein hohen Spielraum für den Takt. Ich glaube Tomshardware hat mal ein Vergleich Takt=Leistungsaufnahme gemacht. DIe stellten fest das die Leistungsaufnahme bis 4,4 Ghz nicht proportional ansteigt, sondern erst danach.
 
AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Ich denke AMD weiss jetzt besser über Ihre ehler bescheid als wie sie es vorher wussten.

Man ganz stark davon ausgehen das die "Fehler" bzw. "Bremsen" beim Bulldozer II behoben werden sein. Das ist das wonach ich nun richte. Warten, warten und nochmals warten...den Bulli I in der Vergessenheit drücken:daumen:
 
AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Ich könnte mir vorstellen, das es Bios-Updates oder AMD-Treiber für Windows, ja vielleicht sogar ein Windows-Update selbst geben könnte, das den Bulli richtig anspricht, wenn wirklich "nur" das oben genannte Problem den Prozessor ausbremst. Es gab ja schließlich auch mal den AMD Dual Core Optimizer, warum also nicht einen Bulli Optimizer, der dafür sorgt, das Windows die 4 zusätzlichen Integer-Einheiten nicht all vollwertige Cores erkennt und sie nur nutzt, wenn sich auch wirklich gebraucht werden?

Es wird halt nicht viel bringen.. so heftig wird die CPU durch das mangelnde Win 7 Threadhandling gar nicht ausgebremst.
Windows 8 soll dieses Problem beheben und es war ja die Rede von 2%-10% Performancezuwachs... das ist doch nichts.

Im overclock.net Forum gabs noch einen der Win 8 benches gepostet hat und der Leistungssprung hat sich mit 3-5% in etwa bestätigt. Scheint nicht viel zu ändern (wird wohl eher im low-thread Bereich was bringen wo der Turbo dann auch richtig einsetzen kann).

@OP:
Der Win 7 Scheduler ist das minderwertigere Problem und nicht das Hauptproblem des Bulldozers.
Laut dem Review ist das Hauptproblem der langsame Cache des Bulldozer und der zu kleine L1 Data cahce der ihn größtenteils ausbremst.
Dieser ist sogar weitaus schlechter als beim Thuban und selbst wenn man den FX auf 4,6 GHz taktet liegen die Latenzen 40-50% hinter Phenom und mehr als 100% hinter Sandy. (Page 3 - Analyzing Bulldozer: Why AMD’s chip is so disappointing | ExtremeTech)

Folgendes würde laut dem Reviewer zu einer drastischen Leitungssteigerung führen:
A lower latency L2 cache, possibly combined with a larger L1 data cache, would likely result in a significant speed increase, while cutting down on the total amount of L2 would save die space and reduce cost.
Schnellerer L2 cache mit größerem L1 data cache gepaart. Zudem würde man Kosten sparen da nicht mehr so viel L2 cache nötig wäre wenn dieser schneller wäre.
Wenn selbst ein Reviewer drauf kommt, finde ich lustig, dass AMD mit ihren Ingeneuren nach all den Jahren nicht drauf gekommen sind.

Na gut, heißt ja nicht, dass es unbedingt stimmen muss aber ich habe bereits in diversen Foren gelesen, dass der grottige Cache höchstwahrscheinlich das große Problem beim Bulldozer ist was zur mangelnden Leistung führt.
 
Zuletzt bearbeitet:
AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Naja eine Seite weiter ist ein Vergleich mit dem i7:
http://www.extremetech.com/wp-content/uploads/2011/10/DIEP-Performance1.png

Beeindruckend ist was anderes.

Das Problem ist, dass die Verbesserungen eben nur reichen um SandyBridge zu schlagen und die sind jetzt ein volles 3/4 Jahr erhältlich und IvyBridge kommt auch in weniger als 6 Monate. Und ich wage zu behaupten, dass Ivy mehr bringt als nur 10-15% mehr Leistung.
 
AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

So neu ist diese Erkenntnis nicht. Wird u.a. schon seit längerem hier diskutiert: AMD FX "Bulldozer" Review - (4) !exclusive! Excuse for 1-Threaded Perf.

Gab auch noch eine andere Seite, die 4C/4T getestet hat und ähnliche Beobachtungen gemacht hat.
BD reizt mich aus dem Grund noch immer; ist schon ein interessantes Stück Technik, bei dem imo noch nicht alles durchleuchtet ist.
 
AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Die Probleme waren ja alle irgendwo schon im Gespräch.
Das die Caches groß aber lahm sind ist im Clusterbetrieb nebensache, bzw. da kommt es auf die Größe und das zusammenspiel des ganzen an. Der BD ist ein reinrassiger Server Prozessor und auf etwas getrimmt das im Desktop keine oder kaum eine Rolle spielt.
Warum AMD diesen Schritt gemacht hat kann man nur vermuten. Ich vermute mal das man sich gedacht hat, es ist leichter eine Server CPU für den Desktop zu kastrieren oder zu optimieren, wie eine Desktop Architektur zum Servermonster aufzublasen.
Auch ist die Ferigung offenbar sehr unreif und eher schlecht als recht, was auch nicht gerade förderlich ist.
Man kann z.B. auch spekulieren das die Latenzen so hoch sind weil eben die Schaltungen von so mieser Qualität sind, das sie mit niedrigeren Latenzen nicht ordendlich laufen.
Natürlich könnte auch ein grundlegendes Design Problem vorliegen das sich nicht in kurzer Zeit lösen lässt, oder gar ein Bug der so lange unter den Tisch gekehrt wird, bis ihn jemand explizit ausmacht :D
Lange Rede kurzer Sinn.........
Ich glaube, selbst die größten Zweifler dachten nicht das der BD so ne Bauchlandung macht, denn auf dem Papier ist der ja gut, ist aber momentan ne Mischung aus P4 mit HT in den Anfängen und einem Itanium von AMD :D
Wenn ich meinen Experten vertrauen darf dann wird AMD in den nächsten 2-3 jahren aus dem Design etwas basteln, das zu Intel aufschließen kann :schief: na hoffen wir mal das sie Recht behalten.
Vorteil wenn man Aktien kauft die im Keller liegen, es ist fast unmöglich das der Wert noch weiter fällt :D
 
AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

da versteh mal einer den Bully :ugly: hoffe das er in Zukunft auch mit 8T vernünftig läuft ;)
 
AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Ach naja...Wenn ich so die Umsätze und Gewinne von AMD und INTEL betrachte, wundert mich gar nichts mehr...
AMD war eigentlich nur zweimal in der Geschichte schneller als Intel: Als sie den Athlon launchten und als der Athlon 64 rauskam. Damals war INTEL auf dem Netburst-Irrweg (P4), sah aber erst Veranlassung zu Änderungen, als AMD begann, sich die OEM Kunden zu angeln. Dann kam der Gegenschlag mit dem Core 2 Duo und seitdem ist AMD hinterher...
AMD hat aber schon mehrfach bewiesen, dass sie nach erfolglosem Start fähig sind, daraus zu lernen.
Bestes Beispiel: Aus dem verschrienen Phenom (TLB BUG und Stromfresser) wurde der wesentlich effizientere und gut übertaktbare Phenom II.
Ich bin da guter Hoffnung.
 
AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Wirklich enttäuschend ist doch die Tatsache, das Teil kann man für "teures" Geld kaufen. So als hätte Gott seinen Sohn Jesus als einbeinigen, schwachsinnigen und blinden Sohn zur Erde geschickt. Ich habe keine Ahnung unter welchen Zugzwang da das Marketing steckt. Lieber eine "Krücke" auf den Markt zu schmeissen, als den "hyperfrisierten" E-Rollstuhl, von mir aus noch einmal 5 Monate später. Irgendwo hakt es da doch gewaltig.
Ich halte auch nichts von Benchmarks irgendwelcher Programme in denen auf Grund einer "besseren" Skalierung der "Kerne" der Bulldozer vorne liegt. Intel schläft nicht, hat einen derzeitigen Vorsprung den AMD nicht einmal aufholen könnte, wenn der nächste Chefentwickler Zaphrine Cochrane heißen würde. Ich finde es schade, das somit der HighEnd und MidEnd Markt für AMD erst einmal erledigt ist. Ohne Llano/Fusion würde AMD in arge Bedrägnis geraten, was weiß Gott kein Vorteil für uns Kunde darstellen würde.
Im nächsten Jahr kommt dann "Piledriver" und muß sich gegen IvyBridge durchsetzen, darüber steht der SandyBridgeE...Quo vadis...AMD ???
 
AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Ich sehe auch Parallelen zum Phenom I vs. Phenom II - Phänomen^^: Erste Generation fehlerbehaftet und nicht wirklich schnell, die 2. Generation dann schön schnell und günstig.
Hätte es natürlich lieber gesehen, wenn der Bulldozer ein richtig schneller Rechenknecht geworden wäre. Vor allem, weil ich Rechenpower für Renderings brauche und mir die Intel-Plattform zu teuer ist.
Naja, ist vielleicht besser so: Wenn mit dem Bulldozer 2 auch ein neuer Sockel kommt, kann ich nach 4 Jahren endlich mal das Mainboard austauschen.

Was mich nur ärgert: Seit Februar liegen hier 6GB DDR3-RAM für den Bulldozer bereit, die nicht zum Einsatz kommen GRRRRR!

Edit: Wenn die Cache-Latenzen ein Problem sind, bringt ja vielleicht ein neues Stepping Abhilfe in dem Bereich. Alles Andere muss aber wohl mit einem Architektur-Update gemacht werden.
 
Zuletzt bearbeitet:
AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Im nächsten Jahr kommt dann "Piledriver" und muß sich gegen IvyBridge durchsetzen

Jetzt wo ich weiss wie "toll" der Bulldozer ist, habe ich große bedenken das die Piledriver APU überhaupt gut wird. Keine Frage die Grafik Einheit wird sicher wieder rocken, aber die Cpu? Ich bin jedenfalls gespannt drauf, wie gut der Ivi bridge wird, muss sich noch zeigen. Bekannt ist ja jedenfalls das Hauptaugenmerk liegt an der Verbesserung der Grafikeinheit. Cpu Technisch ist Intel doch garnicht im Zug zwang, daher schätze ich Ivi Bridge wird 10 % schneller als Sandy sein.
 
AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Intel war seinerzeit auf dem Holzweg mit Netburst beim P4 und schon der P(entium)1 wurde belächelt wegen seines Gleitkommafehlers.
AMD macht die Erfahrung nun mit dem BD, so wie sie auch schon belächelt wurden wegen ihres fehlerhaften P(henom)1.
Ich denke, AMD liefert im mittleren Peis/Leistungssegment ganz gute Arbeit.
Wer weiß, vielleicht sitzt man gerade in diesem Augenblick bei AMD zusammen am Tisch und überlegt sich etwas ähnlich innovatives wie Athlon/AthlonXP/Athlon64 und versucht gleichzeitig das Beste aus Phenom2, DB und Llano unter einen Hut zu packen. Ein Phenom X6 mit jeweils 2 Integereinheiten pro Kern und einigen anderen Neuerungen des BD und ner GPU auf HD7000-Basis - sowas in der Richtung :devil:
 
AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Intel war seinerzeit auf dem Holzweg mit Netburst beim P4 und schon der P(entium)1 wurde belächelt wegen seines Gleitkommafehlers.
AMD macht die Erfahrung nun mit dem BD, so wie sie auch schon belächelt wurden wegen ihres fehlerhaften P(henom)1.
Ich denke, AMD liefert im mittleren Peis/Leistungssegment ganz gute Arbeit.
Wer weiß, vielleicht sitzt man gerade in diesem Augenblick bei AMD zusammen am Tisch und überlegt sich etwas ähnlich innovatives wie Athlon/AthlonXP/Athlon64 und versucht gleichzeitig das Beste aus Phenom2, DB und Llano unter einen Hut zu packen. Ein Phenom X6 mit jeweils 2 Integereinheiten pro Kern und einigen anderen Neuerungen des BD und ner GPU auf HD7000-Basis - sowas in der Richtung :devil:

Und das ganze auf unter 350mm² Chipfläche :D

Ich hab mir den Artikel auf SemiAccurate mal durchgelesen und ich denke, da ist noch Hoffnung für den Bulldozer und den Nachfolger Piledriver.
Intel werden die nicht bashen können. Aber ich denke mal, dass der Piledriver dann zumindest den Phenom II abhängen wird.
Gibt es eigentlich schon Tests mit typischer Server-Software und dem Bulldozer? Wäre mal interessant zu sehen, wie sich die CPU in dem Bereich schlägt und ob das Teil da den Intels Paroli bieten kann.
 
Zurück