Bulldozer - 20 Fragen von AMD beantwortet: Module, Turbo und mehr

Zum besseren Verständnis:
Ein Bulldozer-Modul besteht aus zwei Integercores, welche sich einen gemeinsamen L2-Cache Teilen müssen, aber je einen L1-Cache haben, FPU ist flexibel ausgelegt.
Folglich kann ein Bulldozer-Modul 2 Threads gleichzeitig (paralell) abarbeiten.

Wenn jetzt, wie in deinem Beispiel, eine Anwendung, oder Spiel nur 3 reale Kerne auslasten kann, also nur 3 Threads hat, dann ist demnach 1 Bulldozer-Modul ganz "ausgelastet" und eines nur zur Hälfte. So weit so gut. :D
Wenn ich es jetzt richtig verstanden habe, ist die FPU-Einheit und andere Bestandteile des Modules flexibel ausgelegt, dass heißt, dass wenn 1 Bulldozer-Kern nicht ausgelastet ist (und damit sich im Idle befindet), kann der andere auf die Ausführungseinheiten des zweiten zugreifen, gleiches gilt natürlich auch für den gemeinsam genutzten L2-Cache. ;)

Zu dem gibt es noch eine andere Variante:
Der zweite Kern (des zu 50% ausgelasteten Bulldozer-Modules deien Beispiels) kann sich dafür "einsetzen", dass dieser einen Zusatzthread für die Anwendung/Spiel öffnet. Dieser zusätzliche Thread macht sich "auf die Suche" und lädt schon bald benötigte Daten in den Caches der Module. ;)

Ich hoffe ich habs noch richtig in Erinnerung (der Artikel auf Planet3DNow! war ganz schön anstrengend :ugly:).

-> Und wie gesagt, ein Bulldozer-Modul mag zwar nur 80% eines Dualcores erreichen (ich finde den Wert eigentlich in Ordnung), aber braucht auch weniger DIE-Fläche, was sehr entscheident ist, gerade in Punkto Effizienz! ;)


mir ging es um Spiele ;) nun ja klingt gut und verständlich aber einfach einen zusätzlichen Thread aufmachen wird die Software auch nicht immer mitmachen denk ich und dann wird bestimmt der neue Überarbeitete Turbocore einspringen mehr dynamische Übertaktung um das auszugleichen denk ich
 
aber einfach einen zusätzlichen Thread aufmachen wird die Software auch nicht immer mitmachen denk ich und dann wird bestimmt der neue Überarbeitete Turbocore einspringen mehr dynamische Übertaktung um das auszugleichen denk ich
Über den Turbocore kann man bisher leider noch gar nichts sagen, außer das AMD verlauten lassen hat, dass er besser sein wird als bei Thuban, was ich definituv glaube. ;)

Wie gesagt, ich weiß es alles nicht mehr 100%ig, aber dass der ungenutzte Kern ein extra Thread eröffnet, welcher sich um die Datenbeschaffung, bzw. das befüllen der Caches kümmern soll, da bin ich mir eigentlich sicher.

Und ich kann mir auch nicht vorstellen, dass AMD es übersehen haben soll, dass ihr Bulldozer bei krummer Anzahl an Threads schlechte Leistungen bringt. :lol: :ugly:
 
Zuletzt bearbeitet:
Versteh ich das richtig? Sollte Bulldozer wegen den zusätzlich Threads ( oder nicht mehr geteiltem Thread ) dann auch theoretisch bei älteren Titeln besser skalieren die nur zB. 2 Kerne nutzen?

Also das auch ein niedrig getakteter Quadcore ( Bulldozer ) schneller ist als ein hoch getakteter Dualcore?
Oder bleibt das nur theoretische Leistung? So wie Hyperthreading bei Intel?

*mirverdrehtsichdashirn*^^
 
Zuletzt bearbeitet:
Versteh ich das richtig? Sollte Bulldozer wegen den zusätzlich Threads ( oder nicht mehr geteiltem Thread ) dann auch theoretisch bei älteren Titeln besser skalieren die nur zB. 2 Kerne nutzen?

Also das auch ein niedrig getakteter Quadcore ( Bulldozer ) schneller ist als ein hoch getakteter Dualcore?
Oder bleibt das nur theoretische Leistung? So wie Hyperthreading bei Intel?

*mirverdrehtsichdashirn*^^

so wie ich das verstanden habe ist es eine alternative zu SMP (Hyptethreading)
angeblich allerdings effizienter
das wird aber erst die Zukunft zeigen :ugly:
 
CMT kann man aber nicht mit SMT vergleichen, ein 4Modul(8 Kern) BD wird "nur" 8Threads gleichzeitig bearbeiten können und nicht 16 wie ein 8Kern Sandy Bridge mit SMT

mit den 80% Leistungssteigerung meint AMD die Steigerung eines Moduls gegenüber einem Kern, sprich ein Modul ist 1,8mal so schnell wie ein Kern - im optimalfall natürlich, 2 Kerne wären 2mal so schnell

ein 4Modul BD soll also laut AMD die Performance eines 7,2 Kerners haben

mfg
 
nur wird Gulftown nicht unbedingt der primäre Gegner sein - hält intel sein Roadmap ein werden das wohl 6 und 8 Kern SB Modelle sein

Die So1366-Ablösung wird afaik erst für den Sommer erwartet, d.h. Bulldozer könnte fast ein halbes Jahr gegen Gulftown antreten.


Die AMDische Variante heißt CMT → Clustered Multithreading und es sieht verdammt danach aus, dass es wesentlich besser sein wird, als Intels Simultaneous Multithreading. ;)

Naja - nach aktuellem Stand der Dinge wird AMD aber deutlich weniger CMT-Module unterbringen, als Intel HT-Cores. Das ist eher Brute Force denn Effizienzsteigerung und imho kaum mit SMT zu vergleichen. Eine Bulldozermodul ähnelt imho eher einem ganz kleinen Core2 (E4 oder so), dem man die zweite FPU geklaut hat. Ein Bulldozer würde damit zu einem abgespeckten Dunnington mit IMC werden...
 
wenn ein Modul 80% der Leistung eines DC hat wie wird es dann mit Programmen die z.B nur bis zu 3 Kernen nutzen werden die dann 3 Module oder Kerne nutzen, bei Kernen würde das ein Leistungsminus bedeuten es sei den der neue Turbocore könnte das wieder auffangen ???

ich denke dass wird so wie aktuell bei intels smt und windows 7 sein, also dass das betriebssystem automatisch bei weniger als 4 threads nur jedem modul einen zuteilt, so hätte man mindestens 10% ipc mehr(bei 2 threads pro modul 180% leistung daher jeder core nur 90%)
 
Das halte ich für einen Fehler, da Intels Sandy Bridge CPUs bei gleicher Kernanzahl wohl immer schneller sein werden; vergleicht man jedoch etwa einen 4 Modul BD mit einem 4 Kern SB sieht die Welt meist wahrscheinlich schon anders aus

Könnte fürs Marketing allerdings eine echte Goldgrube sein. Erinnert euch nur mal an Pentium 4 Zeiten. Wer's nicht besser wusste, kaufte einen P4 weil er ja mehr MHz hat; ergo auf den ersten Blick durchaus mehr Leistung, obwohl der langsamer getaktete Athlon schneller war. Vielleicht hat AMD dabei nur seine lektion gelernt und dann nur noch die MHz durch multicores ersetzt. Von Vorteil wäre natürlich, wenn er auch ohne solche Tricks schneller wär als ein vergleichbares Intel-Pendant. Hoffen wir einfach das beste

ich denke dass wird so wie aktuell bei intels smt und windows 7 sein, also dass das betriebssystem automatisch bei weniger als 4 threads nur jedem modul einen zuteilt, so hätte man mindestens 10% ipc mehr(bei 2 threads pro modul 180% leistung daher jeder core nur 90%)

Das geht aber nur, weil man Windows beigebracht hat, zwischen reellen und virtuellen kernen zu unterscheiden. Hier sind jedoch alle kerne "echt", virtuelle kerne sind da nicht bei. Hoffen wir also, dass Windows auch demzufolge verbessert wird und zwischen (einzel)kernen, virtuellen kernen und modularen kernen immer korrekt unterscheiden unterscheiden kann und die richtige Wahl trifft.

P.S. Bin mal gespannt wie lang es dauert, bis beide techniken vereint werden und wir einen modularen Chip mit SMT haben. Dann kann das Gigatreads-rennen ja endlich beginnen :lol:
 
Zuletzt bearbeitet:
Zurück