Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Rambus ist der neue Knaller aber weil Bullldozer mit Rambus läuft sind die Benchmarks so schlecht .:D
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Ich verstehe trotzdem nicht die negative Grundeinstellung.Du warst immer für den Bulldozer ein paar China Böller und alles ist Mist.
Meinst du mich? Ich habe Bulldozer anhand dessen eingeschätzt, was mir über die Architektur bekannt ist und ich angesichts dieser für realistisch hielt - beim Core 2 war der Aufschrei damals ja nur so groß, weil fast alle den Pentium 4 auf dem Radar hatten und der Pentium M kaum beachtet wurde. Mit vollen vier ALUs wäre der Bulldozer sicher monströs, ist er aber scheint's nicht. Ich bin wie gehabt positiv eingestellt und habe ergo den Plan, einen Bulldozer in den kommenden Wochen zu verbauen, noch nicht gecancelt.


Und die AGUs können, wenn ich mich recht erinnere, tatsächlich nur 1-2 % der unterstützten Befehle im Alleingang auszführen. Ich hoffe mal, dass die wichtig sind, aber eine nette Steigerung erwarte ich trotzdem nicht, sondern eben ~Gleichstand.
Die AGLUs können laut SOG klassisch die "address generation" sowie "simple ALU operations" und letztere beschränken sich offenbar auf arithmetische plus logische Operationen - was genau AMD da nannte, muss ich nachschauen. Ich meine u.a. ADD und INC.

Das Problem ist doch aber, dass es kein fetteres Front-End gibt - deswegen reite ich ja auf dem Decoder rum. Ein K10 Dualcore kann 6 Befehle pro Takt dekodieren, ein Bulldozermodul nur vier. Zum Vergleich: Das ist genauso viel, wie ein! Intel-Kern seit Einführung der Core-Architektur decodiert. Und Intel hat die letzten beiden Generationen schon wieder genutzt, um Mechanismen zu integrieren, die die Zahl der Decodiervorgänge bei wiederholter Ausführung verringert. Ich bin ja ehrlich gesagt kein Experte für die Belastung einzelner CPU-Teile, aber wenn ein Hersteller der Meinung ist, für drei ALU/FPUs (und zwei AGUs) vier Decoder und ein Zwischenspeichersystem zu nutzen (sagen wir effektiv die Befehlsmenge 5-6 Decoderpipelines in drei Rechenpipelines durchsetzt?) und ein anderer Hersteller mit ebenfalls vier Decodern 4 ALUs, 4 AGUs und 4 SIMDs versorgen will (d.h. 4 auf 12), dann macht einer von beiden einen verdammt großen Fehler. Es kann nicht sein, effektiv 2:1 und 1:3 beides "gute" Verhältnisse sind. Allen SB-Testern zu Folge ist Intel nicht dieser Hersteller.
Es ist ja nicht mal mehr bekannt, ob der Bulldozer einen µOp-Cache (von mir aus auch L0 oder Trace genannt) besitzt. Die vier Decoder im Modul-Frontend haben 64 kB und können eventuell [u.a. Dresdenboy meint ja, David Kanters sagt nein und ich weiß es auch nicht] 4+4 Befehle simultan decodieren (µCode und Fastpath, was K10 nur im Wechsel kann iirc) - das wäre ein Drittel mehr als bei einem K10-Dualcore. Aber auch das ist noch nicht offiziell und ich würde nicht drauf wetten, dass es in den Dokumenten steht, die AMD der Presse schickt (es gibt ein Patent-Sheet). Würde aber zum Durchsatz-Design des Bulldozers passen, wenn er es denn kann.
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Finds aber immernoch komisch, wie es sein kann, dass eine Architektur die seit 5 Jahren entwickelt wird, letztlich langsamer als die alte ist. Ein Phenom II X8 wäre schneller gewesen, wenn man ihn mit ein paar Optimierungen + neue Befehle garniert hätte, er hätte Sandy Bridge geschllagen und man hätte sich viel Geld gespart. Und ich mein AMD ist doch nicht dumm...mal sehen, für mich das zwar seriös, aber sehr unwahrscheinlich.


Ich kann mich ja noch an Hot Chips 2010 erinnern wo AMD wirklich große Töne gespuckt hat. Der BD erreicht 80% eines fiktiven BD Dualcores (= Intel Dualcore, dachte man damals :) und das mit nur 12% mehr Fläche als ein Singlecore (man hatte natürlich unterschlagen, dass das Aufbohren von Frontend, FPU, Caches etc. extrem viel mehr Platz als die einfache ALU braucht ) und der Mythos Bulldozer war geboren. Das allerwitzigste damals war, es gab Leaks dass ein BD 50% schneller als ein Core i7-950 wäre und wisst ihr was - damals sagte man, dass sei UNTERTRIEBEN, letztendlich werden es wohl 60-80% sein. :lol:

Das ganze wurde dann bestätigt, als bekannt wurde, dass der BD 16MB Cache hat. Denn so viel Cache könne ja nur eine CPU haben die im realen 8 Kern Bereich agiert.

Ich möchte nur daran erinnern - und dann seht euch die Benches nochmal an und versucht nicht loszulachen :D

@Ruyvien

Was du schreibst stimmt nicht. Zwar stimmt es, dass der Decoder 4 Befehle decodieren kann, jedoch stand auf vielen Seiten (auch hier auf PCGH), dass es sehr wahrscheinich ist, dass er das zweimal pro Takt kann. Denn sonst könnte man ja nur die Hälfte der Einheiten auslasten, denn es gibt 4 ALUs und 4 AGUs, also 8 Einheiten. Wenn man nun aber nur 4 Befehle reinschieben kann, dann sind die 4 anderen Einheiten für die Katz, kann also nicht sein.
K10 hat 3 Befehle und 3 Einheiten, also realistisch (wenn auch nicht optimal).


PCGH_Marc schrieb:
Ich bin wie gehabt positiv eingestellt und habe ergo den Plan, einen Bulldozer in den kommenden Wochen zu verbauen, noch nicht gecancelt.

Ok die Benches sind Fake oder falsch, jetzt hast du dich verraten. Du weißt mehr :D
 
Zuletzt bearbeitet:
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

AH! Jetzt hab ich gefunden, was du meinst, da gibt es auch 16GB registerd Module. Die sind aber nur 1066er, und man kann damit wohl keine Vollbestückung betreiben. Ansonsten würde bei den 288 GB ja nicht ** dabei stehen.
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

wie ein Resumé, wenn man den bulldozer (1)? auf den pheniom 1 bezieht ^^

abwarten und tee trinken...!!


das Katz und maus spiel zwischen intel und amd tut uns Käufern zwecks preise eh am besten:)
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Das BD Topmodell wird auf Augenhöhe vom i7 2600 erwartet (cine 6,87)
Naja aber der 1100T schafft auch schon 5,9 im Cinebench. Das sind jetzt nicht gerade Welten, dafür dass BD zwei Kerne mehr hat UND noch deutlich mehr Takt. Ich meinte ja nur, dass nach diesen Tests nicht mehr von BD zu erwarten sein sollte als von den Phenom II X6, vor allem dann wenn im Gegensatz zum CB nicht alle Kerne ausgenutzt werden.

@ cuthbert

Bis die Singlethread-Performance im Consumer-Markt keine Rolle mehr spielt, vergehen noch ein paar Jahre. AMD ist so gesehen der Zeit voraus, was in diesem Fall aber nicht zwingend der bessere Ansatz ist. Allerdings war es das beste was AMD machen konnte: Den Deneb nehmen und weitere Kerne dranpappen, denn deren Logik ist nicht so wuchtig wie die von Intel. Daher kriegt AMD bei ähnlicher Die-Space mehr, aber langsamere Kerne unter und ist bei passender Software hinsichtlich der Performance gleich auf (Stromverbrauch halt schlechter). Bulldozer geht auch in die Richtung, viele Kerne auf wenig Platz und optimiert auf Perf/Watt - sei es CMT, Power Gating oder Clock Grid.
@Marc, ja klar wird das noch ne ganze Weile dauern bis Multi Threading auf Softwareebene komplett etabliert ist, hab ich ja auch gesagt. Aber es muss in diese Richtung gehen, denn mehr Kerne kann man, wie du auch schon gesagt hast, immer einfügen, aber mehr Single-Thread Performance ist schwierig(er). Ich hoffe für AMD mal, dass es zumindest beim wichtigen Spielemarkt hier bald richtig voran geht. Dass es geht, zeigen ja wie gesagt schon ein paar Musterbeispiele.

Was meint ihr wie die Wahrscheinlichkeiten stehen, dass noch ein optimiertes B3/C0 Stepping auf AM3+ raus kommt? Ich mein B2 ist ja offensichtlich jetzt nur die Notlösung, weil das Teil raus muss. Und wenn es nicht noch besser ginge (B3) hätten sie es ja gar nicht erst noch rauszögern und versuchen müssen, da noch was hin zu biegen.
Schon schade, dass AMD es schafft von einem Fettnäpfchen ins nächste zu treten (Phenom I, HD 2900.. Bulldozer I)
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Komisch, hier sagst du auf einmal nichts mehr von wegen es kommen keine 6 Kerner für 500 Euro usw. :ugly:

Zitat von Alex_89
So gesehen tendiere ich mittlerweile eher zum kleinen Sixcore des neuen SB-E, welcher ja für ca. 500€ über den Ladentisch gehen soll. Sollte der BD nicht annähernd diese Performance bringen, wovon ich nicht ausgehe, ist AMD für dieses Upgrade erstmal raus. Wie schätzt ihr das ganze ein?
Willkommen im PCGH Forum ...
Wenn du auf SB-E abziehst, dann ist es eh keine Frage zwecks Bulli ... weil der gegen SB gesetzt wird Aber mit einen 2600k hättest du auch die nächsten 3-4 Jahre ruhe (6 kerne ~ 12 threads werden eh kaum genützt)

PsychoQeeny: Willkommen im PCGH Forum ...
Wenn du auf SB-E abziehst, dann ist es eh keine Frage zwecks Bulli ... weil der gegen SB gesetzt wird ;) Aber mit einen 2600k hättest du auch die nächsten 3-4 Jahre ruhe (6 kerne ~ 12 threads werden eh kaum genützt)


Das war damals irgendwie noch anders gewesen: :D:D:D

majinvegeta20 schrieb:
Viele Meinungen und Schätzungen gehen aber von einer Staffelung von 300 Euro (4 Kerner) 500 Euro (6 Kerner) und 1000 Euro aus. Deine Schätzungen folgen ja auch nur deiner eigener Einschätzung. ;)

Zitat von quantenslipstream
Es gibt aber einen Quad, einen 6er mit "K" und einem 6er mit EE und da der EE logischer Weise den üblichen 1000er kosten wird, wird der kleinere 6er, der kaum langsamer ist, nicht für den halben Preis über den Tisch gehen, vor allem deswegen nicht, weil der ebenfalls über einen offenen Multiplikator verfügt.
Der Quad wird so um 300€ kosten, was logisch ist, da er kaum schneller ist als ein i7 2600.
So sieht es aus ... ich mein mal das da vieleicht 50-100€ dazwischen liegen werden .

PsychoQeeny: So sieht es aus ...:ugly: ich mein mal das da vieleicht 50-100€ dazwischen liegen werden .


Was nun? Hatte ich doch auf einmal nicht mehr so unrecht oder warum sagst du dagegen plötzlich nichts mehr? ;)
 
Zuletzt bearbeitet:
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

@ cuthbert

Lukrativer für AMD ist der massiv multithreaded ausgelegte Server-Markt, aber dennoch tritt Zambezi ebenfalls im mehr Singlethread-lastigen Consumer-Segment an. Sollte B2 tatsächlich das Release-Stepping sein, wird B3/C0 für Q4 arg end - also wohl eher Q1/2011 oder passend zum Start von Ivy Bridge, bevor dann im Sommer schon Bulldozer II kommt (und Wichita, Krishna sowie Trinity als Nachfolger der sehr beliebten aktuellen APUs).
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Ok, dann hoffen wir mal, dass wenn B2 net der Renner wird, B3 dann doch noch was retten kann. Muss ja net unendlich viel mehr Leistung sein, aber so dass ein Phenom II X6 deutlich geschlagen wird (auch Single Thread), dann wäre ich zufrieden und würde mir auch so einen holen.
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Die AGLUs können laut SOG klassisch die "address generation" sowie "simple ALU operations" und letztere beschränken sich offenbar auf arithmetische plus logische Operationen - was genau AMD da nannte, muss ich nachschauen. Ich meine u.a. ADD und INC.

Im Software Optimization Guide ist eine abschließende Liste. Und sie hat viele Seiten, aber quasi keine AGU einträge. Wie der Name schon sagt die Dinger halt quasi nur für ein paar Speicheroperationen zu gebrauchen, aber nicht um Dinge zu berechnen. Und im Vergleich zu Intel kann man auf die Art auch bestenfalls gleichziehen - die haben iirc seit Netburst getrennte AGUs (und damit eigentlich 5/6 Pipelines pro Kern, wenn man AMDs Sprache benutzen würde)

Es ist ja nicht mal mehr bekannt, ob der Bulldozer einen µOp-Cache (von mir aus auch L0 oder Trace genannt) besitzt.

Wäre schon merkwürdig, wenn AMD NIRGENDWO auf den hingewiesen hätte, oder?

Die vier Decoder im Modul-Frontend haben 64 kB und können eventuell [u.a. Dresdenboy meint ja, David Kanters sagt nein und ich weiß es auch nicht] 4+4 Befehle simultan decodieren (µCode und Fastpath, was K10 nur im Wechsel kann iirc) - das wäre ein Drittel mehr als bei einem K10-Dualcore. Aber auch das ist noch nicht offiziell und ich würde nicht drauf wetten, dass es in den Dokumenten steht, die AMD der Presse schickt (es gibt ein Patent-Sheet). Würde aber zum Durchsatz-Design des Bulldozers passen, wenn er es denn kann.

"While previous AMD64 processors had a single 32-byte fetch window, AMD Family 15h processors
have two 32-byte fetch windows, from which four μops can be selected. These fetch windows, when
combined with the 128-bit floating-point execution unit, allow the processor to sustain a
fetch/dispatch/retire sequence of four instructions per cycle."
"AMD Family 15h processors can theoretically fetch 32B of instructions per cycle and send these
instructions to the Decode Unit (DE) in 16B windows through the 16-entry (per-thread) Instruction
Byte Buffer (IBB). The Decode Unit can only scan two of these 16B windows in a given cycle for up
to four instructions. "

Also viel klarer kann AMD das imho gar nicht mehr sagen :ka:
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

die haben iirc seit Netburst getrennte AGUs (und damit eigentlich 5/6 Pipelines pro Kern, wenn man AMDs Sprache benutzen würde)

Tust du, Intel hat 3 ALUs + 2 Load/Store Units + 1 Store Data Unit, also insgesamt 6 Pipelines, wenn man es wie AMD sieht.

Der Bulldozer hat pro Kern 2 ALUs + 2 AGUs die AFAIK doch das selbe sind wie die Load/Store/Store Data Units bei Intel. Also hat Intel 50% mehr "Pipelines", beim Phenom II warns noch 100% (3 ALUs/AGUs, konnten alle beides). Guter Sprung :D
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Du darfst nicht vergessen, dass Intel im Gegenzug kombinierte FPU/ALU-Pipelines hat, die AMD wiederum trennt. Der K10 hat auch 6 Pipelines pro Kern, verteilt die Funktionen aber anders, als Intel.
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Achso hat der K10 auch schon getrennte FPU Pipes? Bei Intel läuft FPU und SSE über ALU, und bei AMD wird das schon immer getrennt??
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Zumindest den Diagramen von Wiki zu Folge.
Bislang wurden ALU und FPU Pipes zwar zusammen in einem Kern angesteuert, aber gleichberechtigt nebeneinander.
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Wenn Intel mit 4 Kernen + HT 8 Threads bearbeiten kann so darf man den BD auch als 4Kerner bezeichnen, das sind ja keine vollwertigen 8Kerne - genauso wie bei Intel. Wenn man sich das so zurecht biegt. Ist es ein Ordentliches Ergebnis :D
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

das sind ja keine vollwertigen 8Kerne

Richtig, mit SMT vergleichen kann man es dennoch nicht. Es sind beim BD nämlich im gegensatz zu intels SMT komplette zusätzliche Recheneinheiten vorhanen. Eine komplette 2. Int Einheit zB. Bei intel gibt es nur zusätzliche Register aber keine zusätzlichen Recheneinheiten.

mfg
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Bis keine CPU´s raus sind oder PCGH(andere Vertrauenswürdige Seite) echte Tests gemacht haben, glaube ich weder den einen noch den anderen Test.

Und wenn der FX8150 nur auf 2600K Leistung ist, ja und? Wo ist AMD jetzt? Bei mehr als 50% zum Teil wenn man den 990X mit dem 1100T vergleicht. Für mich mehr als zufriedenstellend. Man kann von einem Unternehmen wie AMD keine wunder erwarten, dass die auf einmal deutlich besser sind, dafür hat Intel seine Hausaufgaben in der Vergangenheit zu gut gemacht. Oder vergleicht ihr auch einen LADA/Dacia mit einem VW/Opel?
 
AW: Bulldozer: Benchmarks des FX-8150 mit vollem Turbo - Werte auf Höhe eines Core i7-2600K

Ich gehe mal stark davon aus, dass AMD den wirklichen Bulldozer Kracher nicht gezeigt hat, Anlaufschwierigkeiten hin oder her, vielleicht hätten sie sich lieben die Mühe machen sollen einen auf ihre Architekturen optimierten Compiler (Assembler :fresse::haha:) statt Ati zu schlucken...

Wir sollten uns alle damit abfinden, dass dies so ungefähr die Leistung des BD ist, und das das beste war, was sie in der langen Zeit haben hinkriegen können :fresse:.
Gehen wir mal davon aus, dass sie in der Vergangenheit irgendwo einen gravierenden Architektur bedingten Fehler gemacht bzw. eine falsche Entscheidung begangen, und jetzt haben sie nichts als die Locher zu stopfen, denn um alles über den Haufen zu werfen wäre jetzt zu spät.:slap: Respekt, dass sich AMD so lange halten konnte, jedenfalls hoffe ich noch darauf, dass BD(1) noch ein paar Steppings weiterentwickelt und so fehlerbereinigt ein paar Prozent mehr Leistung bringt. Auf die lange Entwicklungszeit kann ich mir keinen Reim machen, außer dass BD ein Problemkind ist das mittlerweile verkocht ist, vlt wirds mit dem nächsten Shrink (BD2) wie mit dem BD2, Anschluss oder gar Technologiespitze ist mit AMDs bescheidenen Mitteln wohl nicht machbar, bestenfalls wird der Abstend zwischen BD2 und Ivy Bridge geringer und da meine ich wohl > 6 Kerne... .

Mit 4 Modulen a 8 Kernen (effektiven 6,4 Kernen :lol:) einen Intel 6 Kerner SB-E zu schlagen wär doch mal was...
 
Zuletzt bearbeitet:
Zurück