Ist AMDs Zambezi-Bulldozer bis zu 50 Prozent schneller als ein X6 1100T oder i7-950?

Sogar ne verdammt coole Sache, mit der man verdammt viel Performance raus holen kann, auch bei Games wohl, da da auch viel mit FP gemacht wird.

Für Datenbanken etc völlig fürn Poppes, genau wie für Webserver etc., aber in Games und der Wissenschaft (wenn ich allein dran denk, wieviel bei mir in Programmen immer FP Berechnungen sind :ugly:) kann das schon recht gut abgehen.

Aber wie du schon gesagt hast, der richtige Knackpunkt wird wohl sein, wie groß die Latenz ist um die FP-Unit zu switchen. Wenn da mehr als 10-20 Takte vergehen, dann wird das nicht sooo der Knaller werden in vielen Situationen. Wenn es daggen in jedem Takt neu zuteilbar ist für den nächste, dann wäre das schon ziemlich pornös.
 
Danke. Genau das entspricht nämlich auch meinem Wissensstand.

Weiss nicht, warum die Unterschiede jetzt plötzlich von vielen hier so klein gemacht werden. Kommt ja fast so rüber, als seien es unbedeutende Unterschiede, die sich nirgendwo in der praktischen Ausführung niederschlagen.

Naja. Wahrscheinlich die neue Defensivhaltung der unbelehrbaren AMD Fanboys.


da kann ich dir leider nicht zustimmen, denn die tatsache dass AMD gerne auf native multicore-lösungen setzt ist seit dem ersten AMD DualCore bekannt. Intel hat sich damals schon den weg über HT erschlichen und hat es beim ersten 4kerner mit 2 Core2Duo und jetzt mit SMT nicht anders gemacht.

Ich würde aber beide Architekturen aufgrund der GRUNDLEGENDEN unterschiede nicht mehr anhand ihrer kerne sondern anhand ihrem output und preissegment vergleichen, vieleicht würde ich noch die TPD einebziehen, aber sicher würd ich nicht auf die idee kommen SMT oder CMT gegenüber der anderen technik zu verfluchen oder in den himmel zu loben...

Mit Bulldozer ist nahezu endgültig der zeitpunkt gekommen an dem beide firmen fürs gleiche ergebnis völlig andere wege gehen, und jetzt wirds wieder spannend...

Die "bessere" Plattform konnte ich persönlich noch nicht nachvollziehen: Ich habe eine Grafik- und eine Sound-Karte. Da reichen die Lanes dicke, selbst für eine PhysX-GPU wäre noch Luft. Wer braucht als Spieler denn noch mehr? Klar, mein neues Board mit BD oder SBe soll USB 3.0 können, aber ansonsten kA was ich mit den ganzen Lanes soll *Schulter zuck* Lieber schneller und sparsamer in Form von Lynnfield + P55, also langsamer und stromhungriger in Form von 890FX + Deneb.

naja also für 8 lanes hab ich mal fix verwendung in form eines (und da kann intels UND amds onboardlösung einpacken) schnellen RAID Controllers gefunden...
und ja, diese sekunden die verstreichen welche steam und COD zum starten bräuchte fehlen mir mittlerweile nicht mehr ;-)

daher: lieber die lahmere und stromhungrigere plattform UND massive HDD Performance als eine schnellere, "sparsamere" plattform die mir keine weitere steckkarte ermöglicht
 
da kann ich dir leider nicht zustimmen, denn die tatsache dass AMD gerne auf native multicore-lösungen setzt ist seit dem ersten AMD DualCore bekannt. Intel hat sich damals schon den weg über HT erschlichen und hat es beim ersten 4kerner mit 2 Core2Duo und jetzt mit SMT nicht anders gemacht.

Ich würde aber beide Architekturen aufgrund der GRUNDLEGENDEN unterschiede nicht mehr anhand ihrer kerne sondern anhand ihrem output und preissegment vergleichen, vieleicht würde ich noch die TPD einebziehen, aber sicher würd ich nicht auf die idee kommen SMT oder CMT gegenüber der anderen technik zu verfluchen oder in den himmel zu loben...

Mit Bulldozer ist nahezu endgültig der zeitpunkt gekommen an dem beide firmen fürs gleiche ergebnis völlig andere wege gehen, und jetzt wirds wieder spannend...



naja also für 8 lanes hab ich mal fix verwendung in form eines (und da kann intels UND amds onboardlösung einpacken) schnellen RAID Controllers gefunden...
und ja, diese sekunden die verstreichen welche steam und COD zum starten bräuchte fehlen mir mittlerweile nicht mehr ;-)

daher: lieber die lahmere und stromhungrigere plattform UND massive HDD Performance als eine schnellere, "sparsamere" plattform die mir keine weitere steckkarte ermöglicht

Mag ja Alles sein.

Aber die Mehrheit der AMD Fanbasis (mich zugegebenermaßen eingeschlossen) hat ja immer recht vollmundig von 8 Kernen bzw. einem Octa-Core geredet. Kaum kamen dann die ersten 2 Artikel zur ungefähren Performance des Zambezi, hieß es plötzlich "Naja. Also eigentlich ist es ja auch nur ein 4 Kerner. Insofern ist die Leistung garnicht so schlecht".
 
Die "bessere" Plattform konnte ich persönlich noch nicht nachvollziehen: Ich habe eine Grafik- und eine Sound-Karte. Da reichen die Lanes dicke, selbst für eine PhysX-GPU wäre noch Luft. Wer braucht als Spieler denn noch mehr? Klar, mein neues Board mit BD oder SBe soll USB 3.0 können, aber ansonsten kA was ich mit den ganzen Lanes soll *Schulter zuck* Lieber schneller und sparsamer in Form von Lynnfield + P55, also langsamer und stromhungriger in Form von 890FX + Deneb.

Tjo. Und mit dem Wunsch USB3, Sound, PhysX und GPU kannst du dann schon mal gezielt nach einem SB-Board ohne PCI suchen oder hoffen, dass der Boardhersteller einen Switch verbaut hat (von wegen "2-Chip-Lösung"...)
Denn von 8 Lanes der Southbridge gehen im Regelfall eine für LAN und eine eben für USB drauf. Will der Boardhersteller Abwärtskompatibilität via PCI bieten, ist die dritte weg. Zeitgemäße Ausstattung mit wenigstens 4 SATA3 Ports? Die vierte. eSATA? No.5 ist unterwegs. Da bleiben dreimal x1 für Soundkarte und PhysX. I.d.R. positioniert der Mainboardhersteller noch eine davon so, dass sie von Dual-Slot-Grakas verdeckt wird. Deine Pläne klappen nur noch, wenn dir x8 für die primäre Graka reichen.
Und selbst wenn man jetzt sagt "den ganzen Zusatzkram brauch ich nicht": Es ist z.T. gar nicht so leicht, ein Board mit Oberklasse-Stromversorgung und OC-Fähigkeiten zu finden, dass es nicht hat. Wenn dann noch irgend ein extra Wunsch dazu kommt, ist man de facto beim Maßgeschneiderten Board - das es in 90% der Fälle nicht gibt. (ich mit meinen Legacy-Bedürfnissen und Aufrüstwünschen kann quasi direkt einpacken)

Bei AMD dagegen entfällt die Lane für PCI und SATA3 gibts im Chipsatz mehr als genug - und dafür braucht man auch keinen 890FX, dafür reicht der billigste 870. Aller vorraussicht nach kommen mit den neuen Southbridges dieses Jahr sogar noch 2 Lanes extra dazu, was nach Abzug der Grundversorgung (USB3, LAN, PCI, ) dann 8 Lanes bei AMD gegenüber 5 Lanes (4, wenn man nur 2 SATA3 als nicht zeitgemäß ansieht) bei Intel ergibt. Imho ein ziemlich hartes Argument, wenn man auf Endkundenfang geht - bzw. in der Oberklasse: Ein Kostenfaktor.
Dual-LAN und eSATA mit ins Paket, zwei x1 aufs Board und die Intel-Plattform hat noch eine Lane übrig, AMD 4. Wer als Hersteller standesgemäß x8/x8/x4 verkaufen will, muss bei Intel nen Switch integrieren - bei AMD nicht. Entsprechende Boards machen in der Praxis oft 20-30€ Unterschied beim Endkunden.


Was btw. hier auch relativ oft vergessen wird in der Diskussion zu berücksichtigen, ist das Bulldozer zwar die ganzen Integer Teile etc doppelt ausführt und damit recht viel Platz braucht, aber die FP Unit variabel gemach hat, und sogar exklusiv nutzbar machen kann für einen Kern des Moduls.

DAS ist schon teils ein sehr starkes Argument, denn die FP Leistung ist soweit ich das überblicken kann in den letzten Generationen nur gering gestiegen im Vergleich zur Int. Leistung, oder meines Wissens nach sogar teils sogar leicht gefallen pro Kern. (Wenn man sich die Auswertungen auf BOINC anschaut)
Das Switchen der FPU ist eine interessante Sache. Wenn FP dran ist, nutzt ein Int-Core die volle FPU, der andere Int-Core rechnet sein Zeug ab und immer im Wechsel. Wenn das ohne große Latenz klappt, eine coole Geschichte.

Sagt mal: Verstehe ich was falsch oder ihr? :huh:
Meines Verständnisses nach sind die FPUs nicht ausgelagert, nur die SIMDs. Konventionelle 64-Bit-FP-Befehle, wie sie z.B. Spiele gern nutzen, sollten weiterhin von jedem Kern getrennt berechnet werden - aber können bei Teillast nicht von seinem Bruder mit genutzt werden. Nur wenn die Berechnungen komplett über SSE/AVX abgewickelt werden, springt die gemeinsam genutzte Einheit in die Bresche.
Deren Leistungsfähigkeit ist für mich aber noch immer ein Buch mit sieben Siegeln: Ja, sie kann FMA und nicht nur MAD. Aber sie wird i.d.R. zweigeteil präsentiert. Das ergibt 1xFMA pro Kern. Intel (und K10) dagegen hat 3 Einheiten pro Kern, die SSE-Befehle verarbeiten können, zweimal MAD, einmal MUL. Das gibt einem Bulldozerkern zwar den Vorteil, das Ergebniss einer kombinierten MUL&MAD bereits nach einem Takt abzuliefern, wärend alle anderen zwei brauchen - aber dafür wärend Bulldozer nach zwei Takten nur je zwei MAD und MUL geschafft hat, haben K10 und Core zwei MUL und 4 MAD geliefert. Je nachdem, was die Software will, ein zweischneidiges Schwert. Erst wenn der zweite Kern idelt kann Bulldozer mit 4 FMA in zwei Takten auftrumpfen, wärend der Rest bei 2+4 hängt.
Wiederum die Frage: Wie oft tritt dieses Szenario ein?

*auf Praxis wart*
 
:D

Der i7-950 nutzt aber SMT.
Inwiefern ist das mit AMD's CMT vergleichbar?

AFAIK kann man sie eher als Octacores ansehen, da hier auch tatsächlich 8 reale Kerne anliegen, auch wenn diese nicht die volle Leistung eines reinen 8 Kerners erreichen.

Bulldozer 4 Module=8 Modulkerne(1 Modulkern=80%Leistung von 1 Kern)
(8 Modulkerne x 80% = 6,4 Kerne

Bulldozer 6,4 Kerne vs i7 950 4 Kerne+4Threads
Bulldozer mit 50% Mehrleistung
 
Und ich schliesse es hier mit mal ab und behaupte mal .... selbst wenn AMD 1000 % schneller wäre als ein Intel ...bei Blödmarkt und Venus stehen dann zu 95% Intel-PCs und Lieschen Müller kauft halt das was da ist ;)
 
Bulldozer 4 Module=8 Modulkerne(1 Modulkern=80%Leistung von 1 Kern)
(8 Modulkerne x 80% = 6,4 Kerne

Bulldozer 6,4 Kerne vs i7 950 4 Kerne+4Threads
Bulldozer mit 50% Mehrleistung

zwar eine milchmädchenrechnung, aber von der seite hab ich es auch schon betrachtet.
interessant wirds in einem monat, wenn in fernost die ersten richtigen leaks aufkommen.

@ruyven
da diese 50% mehrperformance aus nicht gerade auf 8 kerne optimierten (unter anderem) spiele kommen soll, kann die fpu schon recht gut sein.
 
Mag ja Alles sein.

Aber die Mehrheit der AMD Fanbasis (mich zugegebenermaßen eingeschlossen) hat ja immer recht vollmundig von 8 Kernen bzw. einem Octa-Core geredet. Kaum kamen dann die ersten 2 Artikel zur ungefähren Performance des Zambezi, hieß es plötzlich "Naja. Also eigentlich ist es ja auch nur ein 4 Kerner. Insofern ist die Leistung garnicht so schlecht".

naja für leute die vorab vollmundig plappern ohne zu wissen was genau abgeht ist dieses ergebnis selbstverständlich enttäuschend...
Mir als objektiven betrachter hingegen sind keine illusionen zerstört worden und das ergebnis enttäuscht mich keines falls...
 
Bulldozer 4 Module=8 Modulkerne(1 Modulkern=80%Leistung von 1 Kern)
(8 Modulkerne x 80% = 6,4 Kerne

Bulldozer 6,4 Kerne vs i7 950 4 Kerne+4Threads
Bulldozer mit 50% Mehrleistung

Die ultimative Milchmädchenrechnung, die aber dennoch gar nicht soooo verkehrt wäre:

Ausgehend davon, dass Multithreading im Alltag, sagen wir, 25% Mehrleistung bringt (jaja, ist anwendungsabhängig, ich meine durchschnittlich!), hätten wir ergo einen Intel "5"-Kerner gegen einen AMD "6,4"-Modulkerner.

Und der AMD leistet 50% mehr.
So.

Heisst: Um AMD´s Modulkerner zu schlagen, müsste Intel theoretisch 50% mehr Kerne haben, also 5+50% = 7,5 Kerne.
6,4 AMD-Modulkerne, die ja nur 80% eines Vollkerns bringen, leisten also das gleiche wie 7,5 Intel-Vollkerne!

So, und jetzt schicke ich meine Bewerbung ans AMD-Marketing :devil::lol:...
 
Die ultimative Milchmädchenrechnung, die aber dennoch gar nicht soooo verkehrt wäre:

Ausgehend davon, dass Multithreading im Alltag, sagen wir, 25% Mehrleistung bringt (jaja, ist anwendungsabhängig, ich meine durchschnittlich!), hätten wir ergo einen Intel "5"-Kerner gegen einen AMD "6,4"-Modulkerner.

Und der AMD leistet 50% mehr.
So.

Heisst: Um AMD´s Modulkerner zu schlagen, müsste Intel theoretisch 50% mehr Kerne haben, also 5+50% = 7,5 Kerne.
6,4 AMD-Modulkerne, die ja nur 80% eines Vollkerns bringen, leisten also das gleiche wie 7,5 Intel-Vollkerne!

So, und jetzt schicke ich meine Bewerbung ans AMD-Marketing :devil::lol:...

ich würde dich wählen :lol:

aber wenn man den infogehalt dieser enthüllung anschaut, könnte die rechnung ja sogar richtig sein ;)
 
nette Rechnung ! hehe :)
Naja Was die neue Technik angeht sehe ich denn Vorteil immer noch an der besser Skalierbarkeit der Leistung auf Programme die auch weniger Kerne ausnutzen , das ist die Staerke die Bulldozer haben wird und da wohl noch eine weile und am meisten Sowieso Spiele "nur" 4 Kerne Ausnutzen wird BD sicher ne verdammt Geile Zocker CPU werden, wie sie der Athlon XP schon war ;)
Die meisten die hier geistreiche Kommentare ablassen sollten sich nochmal die CMT Folie von AMD genau angucken ...
Dazu war das Modul Design ja um deutlich Chip Flaeche Einzusparen und einige Knobbeln jetzt aus das Bulldozer eine grossen Die haben soll , Sorry aber das warte ich ab , dazu sehen wir mal wie gross der DIE eines 8 Kern Intel Chips sein wird ...

mfg F-4
 
nette Rechnung ! hehe :)
Naja Was die neue Technik angeht sehe ich denn Vorteil immer noch an der besser Skalierbarkeit der Leistung auf Programme die auch weniger Kerne ausnutzen , das ist die Staerke die Bulldozer haben wird und da wohl noch eine weile und am meisten Sowieso Spiele "nur" 4 Kerne Ausnutzen wird BD sicher ne verdammt Geile Zocker CPU werden, wie sie der Athlon XP schon war ;)
Die meisten die hier geistreiche Kommentare ablassen sollten sich nochmal die CMT Folie von AMD genau angucken ...
Dazu war das Modul Design ja um deutlich Chip Flaeche Einzusparen und einige Knobbeln jetzt aus das Bulldozer eine grossen Die haben soll , Sorry aber das warte ich ab , dazu sehen wir mal wie gross der DIE eines 8 Kern Intel Chips sein wird ...

mfg F-4

Davon gibt es glaube ich schon Bilder.
Das Package eines 2011 ist jedenfalls ziemlich groß, im Vergleich zu den Sockel 1155 Prozessoren.
 
mal so eine Frage am Rande, wegen der FPU-Tauglichkeit des BD kann man das mit F@H über 24 ober 48h testen was die durchschnittliche Leistung in einem Bereich wo das stark gefordert wird? Heißt benötigt F@H viel FP-Leistung? Und kann man das in einem Test mal zum Vergleichen machen, P2X4 965BE,P2X6 1090T, i5 XXX, i7 980? Wenn ja, dann könnte man doch mal solch ein Test machen um das Konzept der geteilten FP-Einheit, die auch an einem einzelnden Kern zu gewiesen werden kann, einen Nutzen hat und wie gut der BD in solchen Berechnungen ist. Natürlich kann man das erst machen wenn der BD erhältlich ist oder vorab zum Testen bei euch in der Redaktion eintrifft.
 
Bulldozer 4 Module=8 Modulkerne(1 Modulkern=80%Leistung von 1 Kern)
(8 Modulkerne x 80% = 6,4 Kerne

Bulldozer 6,4 Kerne vs i7 950 4 Kerne+4Threads
Bulldozer mit 50% Mehrleistung
Super Rechnung. So ähnlich habe ich das gestern Abend mit einem Freund von mir auch durchgerechnet. Vom Grundsatz her sind wir zu dem Schluss gekommen, dass AMD mit der Leistung auch auf Augenhöhe mit den SB´s konkurrieren könnte. Jetzt bleibt nur noch zu hoffen das sich jene Spekulation der News auch bewahrheitet. :daumen:

MfG
 
Die Rechnung hat aber einen Haken, man muss einen Kern des BD-Moduls mit 100% rechnen und den anderen mit 80% - so schreibt es jedenfalls John Fruehe

Edit:

die korrekte Rechnung lautet also:

4x100% + 4x80% = 720% - ein echter Octa Core wären 800%, folglich ist ein 4Modul BD ein virtueller 7,2 Kerner

bei einem SMT Quad Core wäre die Rechnung:

4x100% + 4x20% = 480% - folglich ein virtueller 4,8 Kerner

mfg
 
Zuletzt bearbeitet:
So mithalten? AMD schafft mit 100% mehr Kernen einen Vorsprung von 50% vor Intels altem Core i7-950 :ugly: Und von Multithreading auf Singlethreading zu schließen, ist nicht möglich.


Hör ich da ein leises "Ich mag AMD nicht"?
AMD hat keine 100% mehr Kerne. Sonst wäre es ja CMT. Nehalems (mit SMT) gaukeln dem System auch nur vor mehr Kerne zu haben und ungefähr so wird es bei Bulldozer auch sein, nur das AMD hier sein eigenes Süppchen gekocht hat.

Ich verstehe gar nicht warum alle hier von 8 Kernen sprechen, wenn es nur 4 Kerne sind, die insgesamt 8 Threads vearbeiten können. Das ist genau wie bei IBM, der Power 7 hat 8 Kerne, wobei jeder Kern 4 Threads verarbeiten kann. Trotzdem sind es nur 8 Kerne und nicht 32!

Und das AMD nie ein neues Design hatte liegt bzw. lag wohl an den roten Zahlen, also das würde ich mal behaupten. Eine komplette Neuentwicklung kostet mehr Geld, als neue Features in ein altes Design zu pflanzen
 
Hör ich da ein leises "Ich mag AMD nicht"?
AMD hat keine 100% mehr Kerne. Sonst wäre es ja CMT. Nehalems (mit SMT) gaukeln dem System auch nur vor mehr Kerne zu haben und ungefähr so wird es bei Bulldozer auch sein, nur das AMD hier sein eigenes Süppchen gekocht hat.

Ich verstehe gar nicht warum alle hier von 8 Kernen sprechen, wenn es nur 4 Kerne sind, die insgesamt 8 Threads vearbeiten können. Das ist genau wie bei IBM, der Power 7 hat 8 Kerne, wobei jeder Kern 4 Threads verarbeiten kann. Trotzdem sind es nur 8 Kerne und nicht 32!

Und das AMD nie ein neues Design hatte liegt bzw. lag wohl an den roten Zahlen, also das würde ich mal behaupten. Eine komplette Neuentwicklung kostet mehr Geld, als neue Features in ein altes Design zu pflanzen

Umm.

Es ist CMT (Cluster-Based Multithreading). Ein Cluster/Modul besteht aus 2 Integer Kernen (im Fall von AMD sind diese allerdings beschnitten, deswegen die 80% Leistung, statt 100%*)

Und natürlich sind es 8 Kerne. Selbst ein Sandybridge hat 8 Kerne. Nur dass man im Falle von Intel's SB eben nur von logischen Kernen sprechen kann.

AMD's BD würde ich jedenfalls definitiv als realen 8 Kerner beschreiben. Auch, wenn jeder zweite integer Kern nicht vollständig ist.
Siamesische Zwillinge sind doch auch zwei Individuen, nicht nur einer, oder?


*Wobei IMHO genaue 100%ige Skalierung sowieso so eine Sache ist. Man muss bedenken, dass alle Kerne ja auch über ein Interface miteinander kommunizieren müssen. Fällt dies zu kompliziert oder abtrus aus, kann hier auch schon einmal Leistung verloren gehen.
 
AMD hat keine 100% mehr Kerne. Sonst wäre es ja CMT. Nehalems (mit SMT) gaukeln dem System auch nur vor mehr Kerne zu haben und ungefähr so wird es bei Bulldozer auch sein, nur das AMD hier sein eigenes Süppchen gekocht hat.

da wird nichts vorgekaukelt, ein BD ist 50% schneller als ein intel Quad Core mit SMT (auf Nehalem Basis) bei (rein rechnerisch) 50% mehr Kernen. Jetzt kommt es also auf den Takt, den wir nicht kennen, an ob die Pro "Kern" Leistung genau auf, über oder unter einem Nehalem liegt.


Ich verstehe gar nicht warum alle hier von 8 Kernen sprechen, wenn es nur 4 Kerne sind, die insgesamt 8 Threads vearbeiten können.

Weil es nunmal nicht 4 Kerne sind. Wie schon öfter erklärt sind 80% der Recheneinheiten 2x pro Modul vorhanden, bei SMT gibt es überhaupt keine Zusätzlichen Recheneinheiten. D.h. die 8 Threads werden weitgehend auf jeweils einer Recheneinheit berechnet. Hier kann man also sehr wohl von einem 8 Kerner sprechen. Jedenfalls ist das immer noch reeller als von einem Quad Core zu sprechen. Auch AMD selbst spriht bei einer 4 Modul CPU von einem 8 Kerner.

mfg
 
Zuletzt bearbeitet:
Zurück