Ist AMDs Zambezi-Bulldozer bis zu 50 Prozent schneller als ein X6 1100T oder i7-950?

Sandy Bridge hat 4 Kerne und Bulldozer 4 Module, bestehend aus 2 Integer-Cores.

Intel macht beim i7 aus dem 4 Kernen dank SMT 8 Threads und AMD hat so weit ich es verstanden habe auch 2 (native) Threads pro Modul, was sich CMT nennt.

Was jetzt die bessere Methode ist und ob die Modul-Bauweise wirklich vorteilhaft ist, wird sich zeigen, wenn die CPUs rauskommen. Das macht ja eigentlich auch nur Sinn, wenn so ein Modul nicht mehr Die-Fläche einnimmt als ein normaler Kern.

Die Folie, die heute dem Artikel zugefügt wurde ist eh Fake, bzw die Aussagekraft geht gegen Null, wie ja auch schon im Update geschrieben wurde (i7-950 auf 1156 Sockel? Nur Schätzungen..).
Mal schauen wie es endgültig aussieht, wenn Bulldozer rauskommt.
 
vorallem is das Problem für AMD sie kommen nen bissl Spät raus und wenn dann Intel mit ivy kommt die eventuell auch noch nette Preise haben sehe ich da nicht so Licht für AMD
Ivy kommt nicht vor 2012, und da sicherlich auch nicht gleich im Januar. Eher mitte des Jahres wohl. Da ist also absolut genug Zeit.

@8 Threads mit 4 vs 8 Kernen. Es ist doch absolut SCHEIS egal, ob es jetzt echte oder logische Kerne sind. Fürs OS verhalten Sie sich recht ähnlich. klar haben die echten Kerne den Vorzug, und wenn man nur 4 Threads hat, ist der Leistungsabfall geringer als wenn man 8 echte getrennte Kerne hat. Bei AMD ist es aber auch nicht mehr so einfach. Wenn viele FP Berechnungen kommen, die es in Games durchaus viele gibt, dann sinkt die Leistung bei BD wahrscheinlich nicht sehr stark, da der einzelne Kern eines Moduls die FP Unit exklusiv nutzen kann.

So whot..... Das gezanke und gezeder ist echt kindisch....

Was ich allerdings nicht ganz versteh ist die Aussage von PCGH mit dem 3DMark hätte man so extrem das Verhältnis gepusht.

Seh ich überhaupt nicht so. In Multimedia sieht man kaum nen Unterschied, weils einfach zu wenig Ressourcen erfordert. Beim 3DMark hat man grad mal so ne Skalierung von 25% etwa. Das reist den Wert also auch nicht wirklich knallig nach oben. Aber was will man auch? In Games sind die CPUs eh alle verdammt nah beieinander, wenn man in Alltagssettings sich die ganze Sache anschaut. Da sind CPUs eigentlich nie der limitierende Faktor.

Was dagegen wirklich ne Hausnummer ist, ist die Cinebanch Leistung. Da sind se mehr als doppelt so schnell. Ich hab jetzt nicht die Werte von nem i7-980X im Kopf, aber der dürfte nicht doppelt so schnell sein wie der X6-1100T.

Dazu kommt noch, das hier wohl keine Version genutzt wurde, die die AVX Befehlssatzerweiterung nutzt, welche einen ordentlichen Performance Schub bringen kann. Von Intel gabs doch das mal wenn ich mich recht erinnere, wo sie einiges dadurch gewonnen haben AVX statt SSE einzusetzen.

Wenn man sich jetzt auch die Leistung in Cinebanch anschaut und durch 9 Teilt, dann sieht man das die LEistung eines Cores doch verdammt angestiegen sein muss. Man muss ja immer beachten, das man nie eine 100% Skalierung hat, bzw. eigentlich nie laut Theorie (Superskalarität etc mal ausgenommen). Ein Kern ist also nochmal etwas stärker, als der Wert, den man so ermittelt.

Bedenkt man jetzt noch das Konzept mit der geteilten FPU, dann kann die Leistung hier sogar noch weit weniger abfallen als dies der Fall ist, da die FPU von einem Kern exklusiv genutzt werden kann.

Ich würd AMD hier also wirklich nicht Hochstapelei vorwerfen, sondern eher das Gegenteil. Sie hätten nämlich auch nur den Cinebanch nehmen können und sagen der BD ist >100% schneller als die beiden anderen CPUs.

DAS wäre dann wirklich cherry picking.
 
Doppelt so schnell im CB 11.5? Das sind +33% Kerne, dann fehlen aber immer noch +66%. Nimmt man pro Core (durch Takt oder IPC) +50%, dann passt's. Ziemlich fett.

EDIT
X6 1100T auf 980X sind +44% bei gleicher Kernzahl. Der Zambezi müsste rechnerisch bei knapp 11 Punkten landen :wow:
 
Zuletzt bearbeitet:
Sag ich doch, wobei die "Skalierung" von einem zu 8 Kernen ja durchaus relativ "schlecht" aussehen kann, da ja keine zweite FPU dazu kommt, sondern sich diese geteilt werden muss. Sprich im Singelcore Bereich fällt BD wahrscheinlich weniger stark zurück als dies normal der Fall ist.

Je nachdem kann ein einzelner Kern ja wenn er die FPU für sich hat eventuell gleichzeitig 2 FP Operationen berechnen. So wie ich die Folien verstanden habe müsste dies sogar so sein. AMD hat sich aber leider bisher nicht expliziet dazu ausgelassen.

Man sollte aber bedenken, das es 4 x86 Decoder gibt, welche geteilt werden und damit laut Aussage von AMD auch komplett einem Core zuordbar sind, als auch die 2 MB L2 Cache, welcher sich ein Kern auch komplett einverleiben kann. Beides Punkte, welche die Singelcore-Leistung wohl nicht so stark abfallen lassen wird.

PS: Vielleicht seh ich ja nächste Woche nen BD in Aktion :P

EDIT:@MarcsEDIT:

Ja und das sind ja "nur" die Desktop BD. Da kommt also noch was größeres für die Server, wobei wenn man sich den DIE Shot anschaut, dies leider etwas unglücklich gelöst ist, da man durch kopieren und spiegeln keine Verdoppelung der CPU erreicht. Da ist also ein zumindest teilweise neues Design fällig.

PS: Marc warum berichtet ihr eigentlich nicht über die Integrierung von PCI-E in die CPU laut der einen Folie die du mal gepostet hast. AMD steuert ja im Moment den Chipsatz per HT an, wo dann erst die Lanes zur Verfügung gestellt werden. Wäre doch mal eine News wert eigentlich. (ist wahrscheinlich PCI-E 3.0 in der CPU)
 
Zuletzt bearbeitet:
Interlagos sind anscheinend "nur" zwei Orochi-Dies (2x Valencia bzw. Zambezi). Du meinst den Die-Shot von Hans de Vries? Da ist ein Fragezeichen dran :D
 
Ja da ist ein Fragezeichen da, aber mein Prof meinte jaja die machen da was mit (also wohl wirklich PCI-E) und hat dann noch so zwei drei kryptische nicht ganz verständliche Sachen gebrabbelt.

Ist immer ganz lustig mit ihm zu reden und dann immer die Aussagenh: Och das kann ich dir jetzt nicht sagen und dieses da auch nicht und ach da muss ich jetzt nochmal ins NDA schauen, aber vielleicht find ich ja was, was nicht mehr drunter fällt etc. pp :ugly:

@Interlagos:

Ja ich vermute auch das es einfach zwei DIEs wieder auf einem Substrat werden.

1. Lässt der Aufbau des Chips nicht mehr zu ohne einen kompletten Neuentwurf
2. Hat AMD damit zuletzt sehr gute Erfahrungen gemacht
 
Was willste denn 500%? :ugly: Man sollte doch irgendwo realistisch bleiben....

Klar kann man ne mega super duper Idee haben, die etwas extrem beschleunigt, aber 1. sind wir im x86 Korsett gefangen und zweitens sind Intel und AMD nicht grad kleine Firmen mit nicht grad kleinen Forschugsabteilungen. Das denen so ein Bursche bisher entgangen ist, ist eher unwahrscheinlich, bzw. war bisher einfach technisch nicht machbar.

Z.B. werden wir in den nächsten Jahren sicherlich gestapelte Chips sehen. Das werden aber alle mehr oder weniger gleichzeitig auf den Markt bringen.
 
Ich hoffe AMD lässt 1 Modul für je einen Thread arbeiten, sollten bei Zambezi beispielsweise nur 4 Threads genutzt werden können.
Weiß man dazu schon genaueres?
cuthbert schrieb:
Was jetzt die bessere Methode ist und ob die Modul-Bauweise wirklich vorteilhaft ist, wird sich zeigen, wenn die CPUs rauskommen.

Allein was den Aufwand/NutzenFaktor brträgt bringt CMT nach aktuellen Informationen sicher deutlich mehr Performance als CMT.
Intel braucht für die zusätlichen Register 5% mehr Fläche, bei einer Merhperformance von 10 bis 25%.
AMD, soviel ich gelesen hab 12% mehr Fläche für den zusätzlichen Integer Core, bei angeblichen bis 80% Mehrperformance.
 
Wie die Ansteuerung der Modulbestandteile erfolgt, versteckt AMD bislang in großen, undetaillierten Kästen.
I.d.R. ist da nur ein Befehsldecoder pro Modul gelistet, was weder zum Bedarf der Kerne (es sei denn, es werden sehr enttäuschende) passt noch ihre direkte Ansteuerung durch das Betriebssystem ermöglichen würde. Man könnte natürlich SMT im Frontend des Moduls implementieren, so dass ein Modul dem Betriebssystem zwei virtuelle Kerne vorgaukelt, dann alles gemeinsam sortiert, um es wieder auf zwei reale zu verteilen :ugly: - aber ich würde einfach sagen: AMD hat noch nicht verraten, was da eigentlich abläuft.



es ist nicht das gleiche aber die Intel-Fanboys haben zu erst immer gesagt Intel hat 8 Kerne und AMD nur 4 oder 6 Kerne, und jetzt anders rum? ne, das geht nicht!

Nee, das geht wirklich nicht.
Wenn wir jetzt schon Fanboys als Diskussionsgrundlage und Argument nehmen, dann müssen wir diesen Kindergarten endgültig dicht machen.

mal so und mal so, die sollen sich endlich einigen, was die Intel mit SMT sind, 4Kerne mit 8 Threads oder 8 Kerne mit 8 Threads! Zudem war es doch ein verkaufsagumet von Intel das die 8 Kerne haben?!

Wir wäre es, wenn man einfach eine XXX € oder ZZZ Watt Intel mit einer XXX € bzw. ZZZ Watt AMD CPU vergleicht und es den Herstellern überlässt, mit welcher Methode sie die meiste Leistung aus einer gegebenen Menge Silizium herauskitzeln?

SMT und CMT gegeneinander aufzurechnen ist jedenfalls bescheuert, da beide Technologien ihre Stärke in unterschiedlichen Szenarien und nur im Vergleich mit unterschiedlichen Rahmenbedingungen entfalten. Da gibt es keine allgemein Formel für a la "CMT ist 1,257568 mal soviel wert, wie SMT".
(und, um ein Bißchen beim Thema dieser Seite zu bleiben: Beide dürften für die Leistung in aktuellen Spielen ziemlich wurscht sein. Da wäre die FP-Leistung und die Fähigkeiten der SIMD-Einheit viel interessanter)
 
50 % oben auf den i7 950 sind doch schon mal ziemlich gut! Jetzt noch ein guter Preis dafür und AMD kann zumindest Intel mal wieder unter Druck setzten.
 
50 % oben auf den i7 950 sind doch schon mal ziemlich gut! Jetzt noch ein guter Preis dafür und AMD kann zumindest Intel mal wieder unter Druck setzten.

Der i7 950 ist ein >2 Jahre altes Design. Aktuelle Intel-CPUs dieser Leistungsklasse kosten 160€. Als Vergleichsobjekt ist er somit für eine High-End-CPu eher ungeeignet und "50%" ist auch unbrauchbar, denn in den meisten Benchmarks können sich selbst die besten verfügbaren um kaum mehr als 20% absetzen. Von der Rohleistung/in gut skalierenden Benchmarks hat Intel jedenfalls vor fast einem Jahr "+50%" CPUs vorgestellt, die aber in Spielen mitlerweile nur noch zweite Wahl sind.

Fazit: "ziemlich gut" ist das nicht, sondern "ziemlich informationslos".
 
ruyven_macaran: eigentlich wollt ich darauf hinaus das unter Win 8 Treads angezeigt werden. Und das man das als Maßstab nehmen soll, weil man sonst nichts hat, um zu vergleichen, nur nervt es mich das jetzt Leute anfange zu meckern das AMD 8 reale Kerne hat und Intel nur 4, aber durch SMT doch 8 Traeds hat, als Intel schon 8 Traeds hatte und AMD nur 4 da haben die auch gesagt stellt euch nicht so an, aber jetzt wo beide 8 Treads haben soll der BD nur mit 2 Modulen und 4 Kernen gegen Intel sntreten, Hallo??? Das ist ja wohl nicht OK, Ich bin dfür das man ab jetzt, nur noch nach der TDP und den Treads schauen kann um zu vergleichen. was will man sonst machen? Höchstens noch nach Takt, aber wenn der BD mit min. 3,0GHz läuft? <-das hoffe ich mal das wir bis 4,0 GHz kommen.:hail:
 
Marc, 0Martin21 hat aber schon recht mit seiner Ausführung.

Nach Kernen zu unterscheiden wird einfach immer schwieriger und auch immer zweifelhafter, da die Konzepte einfach zu weit auseinander gehen inzwischen.

Es wäre wirklich wünschenswert mehr auf Threads zu gehen und danach wie es mit 1, 2, 4, 8 Threads skaliert. Da hat man dann für jedes Programm eigentlich was dabei.

Dabei sollte man dann natürlich auch den Speicher sich genauer anschauen, genau wie die FP und die Integer Leistung.

Es wird einfach nicht einfach da einen qualitativ hochwertigen Überblick zu bilden.

Ich fänds daher gut, wenn ihr euch den neuen Architekturen in mehreren Ausgaben annehmt. Grad im Vergleich zu den alten Architekturen. Diese haben ja teils auch ihre Vorteile bei Singelcore-Anwendungen, da sie oft höher getaktet waren (Core2Duo vs. Core2Quad).

Wäre daher wirklich wünschenswert, wenn ihr mehr Sachen wie Cinebanch nutzt und das halt über ein paar Generationen hinweg betrachtet, damit der Käufer mehr Überblick hat. Das wäre gleichzeitig auch ein Kaufargument für eure Print, da man solche aufwendigen Sachen im Netz nicht findet. Ich finde ihr solltet euch durch sowas herausstellen aus der Masse.

Am liebsten wäre mir allerdings wenn ihr euren eigenen Benches schreiben würdet, um so die Unterschiede zwischen Integer lastigen und FP lastigen Anwendungen zu differenzieren. Dazu noch ein paar echte Anwendungen wie 6 Games und Anwendungen und ihr habt ne schöne Sache über die man sich auslassen kann und auch begründen kann warum hier was besser funktioniert als dort, und auch prognostizieren kann wie sich die Leistung in Zukunft entwickelt.

PS: Ich wart noch immer auf einen Test zum doppelten DMA Controller auf der 69x0 :(
 
Ich sagte bisher.

Mit BD werden wir eine pro-Thread/Modul-Skalierung machen, keine Sorge. Allerdings bin ich nach wie vor der Ansicht, dass man (noch) Integer-Kerne samt FPU vergleichen sollte und nicht stur nach Threads. Wir haben btw derzeit ein CPU-Premium am Start und wir hatten letztes Jahr 50 CPUs im Test bis runter zum Pentium 4 und Athlon 64 (X2) - also alles, was PCIe hat(te). Sollte AMD mit detaillierten Infos zu BD rausrücken, machen wir vll ein Feature wie bei Fermi.
Skysnake schrieb:
PS: Ich wart noch immer auf einen Test zum doppelten DMA Controller auf der 69x0
In welcher Form?
 
AMD, soviel ich gelesen hab 12% mehr Fläche für den zusätzlichen Integer Core, bei angeblichen bis 80% Mehrperformance.

Das mag alleine für die Module stimmen, allerdings muss man wenn es um Fläche geht den ganzen Chip betrachten, den der ist für die Fertigung relevant - und da ist BD mit seinen 320mm2 deutlich größer als zB ein SB Quad mit SMT (225mm2) - klar der BD hat 16MB LLC, dafür hat der SB eine GPU, die in etwa so viel beansprucht wie die fehlenden 8MB Cache.

mfg
 
Das mag alleine für die Module stimmen, allerdings muss man wenn es um Fläche geht den ganzen Chip betrachten, den der ist für die Fertigung relevant - und da ist BD mit seinen 320mm2 deutlich größer als zB ein SB Quad mit SMT (225mm2) - klar der BD hat 16MB LLC, dafür hat der SB eine GPU, die in etwa so viel beansprucht wie die fehlenden 8MB Cache.

mfg

BD hat "nur" 8 MB L3/LLC dafür aber 8 MB L2

Ich sagte bisher.

Mit BD werden wir eine pro-Thread/Modul-Skalierung machen, keine Sorge. Allerdings bin ich nach wie vor der Ansicht, dass man (noch) Integer-Kerne samt FPU vergleichen sollte und nicht stur nach Threads. Wir haben btw derzeit ein CPU-Premium am Start und wir hatten letztes Jahr 50 CPUs im Test bis runter zum Pentium 4 und Athlon 64 (X2) - also alles, was PCIe hat(te). Sollte AMD mit detaillierten Infos zu BD rausrücken, machen wir vll ein Feature wie bei Fermi.

Ich hab da auch keine Sorge Marc ;)

Und ja die zwei von dir angesprochenen Ausgaben hab ich auch gekauft. Btw die vom letzten Jahr hat mich nach ein paar Jahren abstinenz wieder zu nem Käufer gemacht ;) Find die Ausgabe übrigends mit einer der informativsten und besten Ausgaben des ganzen Jahres. Die hol ich heute noch öfter mal raus um einige CPUs gegeneinander ab zu schätzen etc :ugly: Ist zwar teils inzwischen veraltet, aber bietet dennoch ne Übersicht die man sonst nirgends hat!


Na in wieweit sich damit der Zugriff auf den RAM beschleunigt etc. dazu halt im gleichen Atemzug welche Auswirkung der neue Aufbau für die Dvicequeue hat. Sprich werden dadurch Anwendungen beschleunigt, oder wie siehts aus, wenn ich z.B. zwei Games gleichzeitig laufen lasse, bzw zwei beliebige Anwendungen die die GPU nicht zu 100% Auslasten. Grad in Anbetracht zu Fällen wenn man mal auf nen I/O warten muss.

Dazu müsste man aber eventuell nen eigenes kleines Programm schreiben. OpenCL ist aber jetzt nicht wirklich schwer. Sollte machbar sein :daumen:

Gerade was die parallele Ausführung von Programmen angeht ist die Sache auf jedenfall sehr interessant. Bisher macht das ja doch Probleme, wiel man Ressourcen verschwendet. Grad wenn man an die Beschleunigung von Browser etc denkt, ist das durchaus interessant.
 
Zumindest wenn es um Multithreading geht, sollte sich der "Zambezi"-Bulldozer problemlos vor Intels vierkernigen Sandy-Bridge-Modellen platzieren.
Wäre auch ein Armutszeugnis für die AMD-Entwickler, wenn sie selbst mit doppelt so vielen Kernen nicht dagegen ankämen...
...alles andere wäre inakzeptabel und ein gravierendes Argument gegen den Kauf ihrer CPUs.
 
Hust und warum ist dann z.B. Larrabee so ne Gurke geworden? Der hat doch auch viele Kerne :rolleyes:

Also die Sichtweise find ich ähmm.. JA etwas oberflächlich. Man sollte sich nie einen Wert raussuchen und dann sagen etwas ist gut weil, oder etwas ist ein fail weil. Man muss sich immer das Gesamtpaket anschauen und dann betrachten wies performant.

Von mir aus können se auch nen 20 Kerner bringen, der grad so nen 4 Kerner schlägt, wenn der aber nur die hälfte an DIE Fläche braucht und 0 Nachteile bei Singelcore Anwendungen hat, dann immer her damit.
 
Zurück