Die Bulldozer-Bibel: Zusammenfassung bekannter und weniger bekannter CPU-Details

Wie läuft das jetzt genau mit den Integercores bei Multithreadanwendungen?
Wenn ein Programm mit 4 Threads auf einem 4 Moduler läuft, sind dann pro Modul jeweils ein Kern aktiv und die anderen werden abgeschaltet,
oder arbeiten 2 Module mit beiden Int.cores und 2 Module "idlen".

Das wird vom BS Scheduler abhängig sein wie die Threads dann aufgeteilt werden. Hier könnte es ähnliche Probleme wie mit SMT zu beginn geben.

Performancetechnisch wäre natürlich Variante 1 interessanter da jedem Integerkern dann alle Ressourcen des ganzen Moduls zur Verfügung stehen würden.

Die integer Cores eines Moduls können nicht wie die FPU zusammen gefasst werden. Bei einem Thread auf einem Modul kann also trotzdem nur eine integer Einheit genutzt werden und nicht beide. Einzig der Cache würde dann komplett dem einen Thread zur Verfügung stehen.

mfg
 
Hab langsam das Gefühl dass erst der next Generation BD was wird ...
Werd´ das Gefühl nicht los, dass BD1 nix taugt.

Und bis der BD im Markt angekommen ist, wird der "next Generation BD Komodo" auch schon startklar sein.

Irgendwie kommt BD1 viel zu spät. Zum Jahreswechsel , wenn die Preise sich einigermassen eingepegelt haben werden ( für BD1 ) , ist der Komodo ja schon absehbar. Der soll ja 2012 rauskommen ..... und vielleicht schon mit PCIe 3.0.
 
Bei einem Thread auf einem Modul kann also trotzdem nur eine integer Einheit genutzt werden und nicht beide. Einzig der Cache würde dann komplett dem einen Thread zur Verfügung stehen.
So hätt ich das auch gemeint. Ein Int.Kern "schläft" und der andere kriegt dann den Cache vom kompletten Modul.
Danke für die Aufklärung mit dem Scheduler. :daumen:
 
Warum steht bei der Ramunterstützung "????"

Ich meine es ist schon hinlänglich bekannt, dass BD DDR3 1866 nativ unterstützen wird.

Ist das auch offiziell?
Gerüchte gibt es wie Sand am Meer und in dem Fall sagen sie auch alle das gleiche, aber die News will ja eben nicht die Gerüchteküche erneut umrühren, sondern direkt auf dem Aufbauen, was AMD selbst rausgegeben hat.
 
Jetzt sind ja schon beinah so viel Daten über Trinity und Komodo draußen wie vom Bulldozer1 ... AMD macht sehr schnell einen Sockelwechsel , der BD verschiebt sich immer weiter :schief:
Ich mein mal das der BD1 so ein Desaster wird wie damals der Phenom1 :ugly:
 
Jetzt sind ja schon beinah so viel Daten über Trinity und Komodo draußen wie vom Bulldozer1 ... AMD macht sehr schnell einen Sockelwechsel , der BD verschiebt sich immer weiter

So sehe ich das auch ...

Vielleicht verschieben die den Start vom BD1 ja nochmal um ein paar Monate und Komodo ( BD2 ) kommt dann früher als BD1 !? :D
 
AMD ist im Moment wohl ein bißchen angepisst, weil Global Foundries nicht wirklich vorran kommt (also ~so zuverlässig ist, wie die FABs, die AMD mal hatte :ugly: ) -> wenn sie Produkte verschieben müssen, weil es ihnen an Produktionskapazitäten fehlt, dann können sie nicht alternativ deren Nachfolger bringen.
 
Jo so siehts aus.

Eventuell hat sich AMD auch einfach zu wenig Kapazitäten gesichert und beißt sich jetzt so RICHTIG in den ARsch.

Mit dem Erfolg von Llano hat glaub ich aber nicht mal der wirklich optimistischte AMDler gerechnet. Also ich dachte mir auch, dass die recht gut einschlagen, aber so gut? Nääää....

Naja, ich hoffe für Trinity holen Sie sich die doppelten Kapazitäten, denn was da alles kommt ist schon sehr beeindrucken, und die min 50% Mehrleistung hören sich auch sehr lecker an. Dank PS3 und XBOX 360 könnte bald die dezidierte für vieles echt überflüssig werden, wenn es so weiter geht, denn mit 50% Mehrleistung lässt sich sicherlich so manches Spielchen sogar in High mit den Laptop-Auflösungen zocken
 
Naja, ich hoffe für Trinity holen Sie sich die doppelten Kapazitäten, denn was da alles kommt ist schon sehr beeindrucken, und die min 50% Mehrleistung hören sich auch sehr lecker an. Dank PS3 und XBOX 360 könnte bald die dezidierte für vieles echt überflüssig werden, wenn es so weiter geht, denn mit 50% Mehrleistung lässt sich sicherlich so manches Spielchen sogar in High mit den Laptop-Auflösungen zocken

Es ist wirklich beeindruckend , wie schnell es voran geht. Hätte nicht gedacht, dass die so schnell solch eine Leistung hinlegen ...

Wenn das so weiter geht, sind 2013 Extra-Grafikkarten für die Gamer überflüssig. Sobald die Leistung einer GTX 560 Ti erreicht wird, hat sich das Thema Extra-Grafikkarte eh erledigt. Dann werden die PCs alle gleichgeschaltet und zur nächsten Konsole. Könnte auch Vorteile haben. Vor allem Preistechnisch.
 
AMD ist afaik der einzige 32 nm Kunde bei GF, also sollten sie die maximal mögliche Produktion für sich haben und da GF FABweise umstellt, sollten sich fehlende Bestellungen auch nicht in einem zu geringen Ausbau niedergeschlagen haben.

Von einem riesen Erfolg Llanos würde ich bislang noch nicht sprechen. Sieht man in freier Wildbahn eher selten und die Tatsache, dass selbst große Hardwaremagazine ein Problem haben, Testnotebooks zu bekommen, deute ich ebenfalls als Hinweis darauf, dass nicht die Nachfrage unerwartet das Angebot überschritten hat, sondern dass das Angebot unerwarteterweise deutlich unter der Nachfrage liegt.
 
Naja, 5 Mio, ergo alle produzierten Llanos weg ist schon gut :D

Zudem will AMD ja bis Jahresende mehrere 10Millionen APUs verkauft haben und bis nächste Jahr um die Zeit 90% der gesamten! Chip-Produktion an APUs absetzen. Das klingt schon nach einem Erfolg :ugly:

Und bist du dir sicher, das nur AMD 32nm Kunde ist?

Wenn ja, dann sind die Fertigungsprobleme wohl wirklich noch groß :( Man erinnere sich ja an die Vertragsänderung, wo nach AMD nur für funktionsfähige Chips bezahlen muss, und nicht für produzierte Wafer.

Hoffen wir mal, dass die Produktionsprobleme inzwischen im Griff sind.
 
Mir wären, außer Intel-CPUs und RAM/Flash (was GF, wenn überhaupt, definitiv nicht in den ex-AMD-Werken herstellt und die ex-CSM-FABs können minimal 40 nm), gar keine 32 nm Produkte am Markt bekannt, die GF fertigen könnte.
Und 90% APU Anteil sind ehrlich gesagt eine verdammt trübe Aussicht, denn afaik konkurrieren die aktuellen APUs (neue werden frühestens kurz vor Ablauf dieser Frist erwartet) schon heute nur mit den Core i3. Im Winter dürften sie bei <90 € liegen - da möchte man als Hersteller doch etwas mehr als 10% in einer höheren Klasse absetzen, oder?
 
Naja, kommt drauf an. Wenn die Yeald-Raten stimmen, kann man dort noch immer massig Geld machen. Denn was einige hier vergessen, an jeder CPU verdienen die noch immer mehr als genug. Da machts dann halt schlicht die Masse.

Aber ja, AMD würde klar lieber CPU/Wafer für 150k€ verkaufen, statt für 100k€. Man sollte aber halt auch bedenken, das die Rekapitalisierung bei Llano halt perfekt ist :ugly: Auf produzierten BD sitzt man da eventuell schon etwas, und Geld das man nicht hat kostet Zinsen, und Geld das man hat bringt Zinsen. Man verdient also doppelt dran, wenn man schnell seine Ware absetzen kann.

Das mit den falleden Preisen muss man sich auch noch anschauen, denn 150€ für nen A8-3800 sind auch nicht so viel. Ich denke viel wird da nicht mehr gehen.

Auch muss man es etwas als Investition für die Zukunft sehen. AMD war überlegen, konnte aber nicht zu dem OEMs wegen Bestechung durchdringen. Dieses mal fällt der Punkt weg, und AMD will einen dicken fetten Fuß in die Tür bei den OEMs bekommen. Daher auch keine überzogenen Preise. Wenn Trinity kommt, würde ich aber mit deutlich angezogenen Preisen rechnen, wenn die Nachfrage ähnlich aussieht.
 
Anscheinend kommt es ja auch sehr stark auf die vorhandene Software an, wie die Performance der BD-CPUs ausfällt. Wenn die Software mit den zwei Threads pro Modul umgehen kann, dürfte die Performance hoch sein, falls nicht ist die Performance schlecht. Ich gehe mal stark davon aus, dass aktuelle Software wohl eher nicht damit umgehen kann, weshalb die BD ihre ganze Performance wohl nicht zeigen können. Für mich heißt das also, dass die BD in ihrem Aufbau der heutigen Zeit vorraus sind. Für die Zukunft könnte die BD-Architektur jedoch große Vorteile haben. Sehe Ich das richtig?
 
Welche Probleme sollen die denn haben, also die Software?

Was ungeschickt laufen kann ist, dass man einen Producer-Consumer Verbund hat, der auf einem Modul laufen könnte, dies aber nicht tut, oder eben leider minimal zu viel Cache brauch und damit aus dem L2/L3 raus fliegt, was ihn halt ausbremst wie noch was. Das ist dann aber eigentlich eh eher auf Server-Software zutreffend, und da werden die entsprechenden Updates wohl relativ schnell kommen.
 
Welche Probleme sollen die denn haben, also die Software?

Was ungeschickt laufen kann ist, dass man einen Producer-Consumer Verbund hat, der auf einem Modul laufen könnte, dies aber nicht tut, oder eben leider minimal zu viel Cache brauch und damit aus dem L2/L3 raus fliegt, was ihn halt ausbremst wie noch was. Das ist dann aber eigentlich eh eher auf Server-Software zutreffend, und da werden die entsprechenden Updates wohl relativ schnell kommen.

Im weitesten Sinne meine Ich folgenden Abschnitt:

"Bei all dieser Begeisterung schwingt jedoch auch Sorge mit. Fast alle Neuerungen stellen hohe Anforderungen an die Optimierung der Software. Die Integer-Leistung verlangt nach zwei unabhängigen Threads pro Modul. Generiert ein Spiel weniger oder wird die Performance durch einen besonders umfangreichen Hauptthread limitiert, könnte sich die feine Einteilung der Integer-Einheiten in "Cores" mit je zwei ALUs sogar als Rückschritt erweisen, denn bislang konnten drei ALUs gemeinsam angesprochen werden. Ohne FMA-Unterstützung kann die pro-Takt-Fließkomma-Leistung eines Moduls nur durch die Integer-unabhängige Ausführung über die Fähigkeiten eines K10-Kerns steigen.

Im Endkundenmarkt könnte sich so der technische Vorsprung gegenüber Intel zu einem klassischen Henne-Ei-Dilemma entwickeln: Solange Bulldozer-CPUs noch keine große Verbreitung haben, optimiert niemand seine Software für die neuen Fähigkeiten - und solange das niemand macht, gibt es einen Kaufanreiz weniger. Selbst bei hoher Akzeptanz durch die Programmierer stellt sich die Frage, wie schnell Produkte auf den Markt kommen, die die neuen Funktionen berücksichtigen."
 
Die "Optimierung" auf die ALUs übernimmt aber der Compiler, bzw. der Hardware/Software Sheduler. 99,9999999% der Programmierer werden nie Assembler schreiben. Das musst du nämlich um diese Änderungen direkt an zu gehen. Für alle anderen ist das schlicht weg Transparent.
 
Also ich muss schon sagen, völlig unabhängig davon was er leisten wird, finde ich die Bulldozer Architektur außerordentlich interessant. Von dem ganzen Fachzeugs verstehe ich zwar nahezu nichts, aber ich kann genug herauslesen, um mein Interesse zu wecken. Mich faszinieren einfach so technische innovationen. Vorallem bin ich froh, dass endlich die Zeit der urpsprünglichen Athlon Aufgüsse vorbei ist. Im Prinzip hat sich bei AMD ja Architektur seitig in über 10 Jahren wenig getan. Ein heutiger Phenom II ist dem ursprünglichen Athlon immernoch sehr ähnlich, nur hier und da ein paar Extras, HT, IMC und nun halt bis zu 6 Kerne.

Ich hoffe ja auf einen günstigen 2 Modul Bulldozer mit einer geringen TDP aber gleichzeitig mehr Leistung als mein 955BE. Schade nur, dass wohl zunächst nur die 4 Modul Modelle erscheinen sollen...
 
Naja, die heutigen X6 haben wahrscheinlich wenn man genau hinsieht mit dem Ur-Athlon genau so viel zu tun, wie ein Golf RS mit dem Ur-Golf. Die Entwicklung bleibt nicht stehen, nur weil man gewisse Grundlegenden Konzepte beibehält. Das meiste sieht man halt nur nicht, was sich ändert.
 
Wenn du deinen Vergleich Golf gegen Golf aufrechterhalten willst, ist der Bulldozer dagegen aber eine... - hmm: Planierraupe? :) Die konzeptionellen Unterschiede von K10 zu BD sind in der Tat größer, als die von K7 bis K10.
Die spannende Frage ist halt nur noch, in welcher Disziplin sich die Kontrahenten messen müssen: Kießberge bewegen oder Parkplatzsuche in der Innenstadt?
wobei letztere mit einem Bulldozer garantiert auch Spaß macht *devil*
 
Zurück