Ist AMDs Zambezi-Bulldozer bis zu 50 Prozent schneller als ein X6 1100T oder i7-950?

Mal so ne Frage:
Warum ist es euch eigentlich so extrem wichtig, wie man die Kerne zählt?
Macht es irgend einen Unterschied, ob es ein 100W-200€-16-Kerner oder ein 100W-200€-2-Kerner ist, der einen 95W-200€-4-Kerner um 20% in relevanten Anwendungen schlägt?

Falls ja: Wie wärs, wenn noch die Untereinheiten berücksichtigt, damit ihr richtig was zu diskutieren habt? Macht garantiert noch viel mehr Spaß.
Ein Core-Kern wird vierfach skalar angesprochen und besitzt drei Rechen&SIMD- und 3 Load/Store-Einheiten.
Ein K10-Kern wird dreifach skalar angesprochen und hat drei Rechen und eine Triple-SIMD-Einheit, muss Speicheropperationen aber auch über die abwickeln
Ein BD-Modul wird laut Folien 4fach skalar angesprochen, hat zwei SIMD-Einheiten und, je nach Folie, 4 universelle oder 2+2 Einheiten pro Kern.
Einigt euch doch mal bitte drauf, ob ein BD mit 16 Integer und 8 SIMD-Einheiten gut oder schlecht ist, wenn er einen SB mit mit 12 Integer&SIMD-Einheiten schlägt :ugly:
 
CMT gaukelt keine Kerne vor, es sind Integer-Kerne. Ich habe btw vor SB zu überspringen und einen BD zu kaufen ...
Aha... und wieso? Weisst mehr als wir, he?;) Na egal, wirst schon wissen was du tust...

Also nochmal für schwerfällige (z.B. mich)...
Bulldozer hat 8 reale Kerne, die in einem Modul zusammgefasst sind. Aber wieso?:huh:
Bearbeitet jeder Kern eine Aufgabe oder Jedes Modul und die kerne teilen sich den Rechenaufwand?
Warum hat man dann dieses Moduldesign eingeführt und nicht 1 Modul mit 8 Kernen?
Ich dachte schonmal, dass verstanden zu haben, aber irgendwie waren das jetzt zu viele Ansätze und visionen hier und jetzt bin ich gar:ugly:
 
Mal so ne Frage:
Warum ist es euch eigentlich so extrem wichtig, wie man die Kerne zählt?

Macht es irgend einen Unterschied, ob es ein 100W-200€-16-Kerner oder ein 100W-200€-2-Kerner ist, der einen 95W-200€-4-Kerner um 20% in relevanten Anwendungen schlägt?

Falls ja: Wie wärs, wenn noch die Untereinheiten berücksichtigt, damit ihr richtig was zu diskutieren habt? Macht garantiert noch viel mehr Spaß.
Ein Core-Kern wird vierfach skalar angesprochen und besitzt drei Rechen&SIMD- und 3 Load/Store-Einheiten.
Ein K10-Kern wird dreifach skalar angesprochen und hat drei Rechen und eine Triple-SIMD-Einheit, muss Speicheropperationen aber auch über die abwickeln
Ein BD-Modul wird laut Folien 4fach skalar angesprochen, hat zwei SIMD-Einheiten und, je nach Folie, 4 universelle oder 2+2 Einheiten pro Kern.
Einigt euch doch mal bitte drauf, ob ein BD mit 16 Integer und 8 SIMD-Einheiten gut oder schlecht ist, wenn er einen SB mit mit 12 Integer&SIMD-Einheiten schlägt :ugly:

Einfache Antwort: Weil es eine Rolle spielt.

Man kann davon einfach auf Skalierbarkeit und Leistung (gesamt und in einzelnen Anwendungen) zurückschliessen.

Wenn ein Programm, welches enorm von multi-threading profitiert, auf einem Intel Quad-Core besser laufen sollte als auf einem Octa-Core AMD, gibt dies schon einmal Zeugnis zur (fehlenden) Leistung des AMD (hypothetisches Beispiel).
 
Imho falsch. Die Skalierbarkeit der Leistung ist erstmal unabhängig von der Kernzahl. Wie weit man eine Architetkur sklarien kann, hängt nicht von der Zahl der Kerne ab (jedenfalls nicht auf dem Informationssstand, den wir über Bulldozer haben - irgendwann werden natürlich Interconnects&Co interessant und limitierend), sondern entweder vom Transistoren- oder/und vom Flächen- oder/und vom Leistungs-Budget. Um dein hypothetisches Beispiel genauso hypthetisch zu erweitern: Wieso ist das ein Zeugniss "fehlender Leistung" von AMD allgemein, wenn dank der kompakten Architektur der Octacore halb soviel verbraucht wie der Quadcore und ein Drittel kostet? Wenn es im weiteren Verlauf einen Hexadecacore geben wird, der genausoviel kostet und verbraucht, wie der Quadcore, aber 40% schneller ist?
Vergleicht ihr auch eine GTX560 mit einer HD6970, weil beide 384 Shaderprozessoren haben? Hat Nvidia demnach ein Leistungsdefizit?


@Cleriker:
Die Module eines Kerns teilen sich eine Reihe von Einheiten die sonst für jeden Kern getrennt vorhanden sind (L2-Cache, SIMD, Komplettes Front-End). Dadurch spart AMD massiv DIE-Fläche ein.
Umgekehrt könnte man sagen: AMD hat einen Quadcore genommen und die Zahl der Kerne verdoppelt, ohne dass das Ergebniss wesentlich aufwendiger oder teurer (zu fertigen) wäre, als der ursprüngliche Quadcore. (unklar ist derzeit aber noch, ob sich zusammen mit den Kernen auch die Rechenleistung verdoppelt, oder ob AMD im Gegenzug die Leistung pro Kern verringern musste.)
 
Zuletzt bearbeitet:
Aha... und wieso? Weisst mehr als wir, he?;) Na egal, wirst schon wissen was du tust...

Also nochmal für schwerfällige (z.B. mich)...
Bulldozer hat 8 reale Kerne, die in einem Modul zusammgefasst sind. Aber wieso?:huh:
Bearbeitet jeder Kern eine Aufgabe oder Jedes Modul und die kerne teilen sich den Rechenaufwand?
Warum hat man dann dieses Moduldesign eingeführt und nicht 1 Modul mit 8 Kernen?
Ich dachte schonmal, dass verstanden zu haben, aber irgendwie waren das jetzt zu viele Ansätze und visionen hier und jetzt bin ich gar:ugly:

Denke mal, der Hauptgrund dafür ist einfach, dass es sich leichter und resourcensparender anbinden lässt und außerdem der Skalierbarkeit zuträglich ist.

Ein Interlink zwischen 8 einzelnen Integer Kernen wäre wohl etwas aufwändiger.
 
Umm.

Es ist CMT (Cluster-Based Multithreading). Ein Cluster/Modul besteht aus 2 Integer Kernen (im Fall von AMD sind diese allerdings beschnitten, deswegen die 80% Leistung, statt 100%*)

Und natürlich sind es 8 Kerne. Selbst ein Sandybridge hat 8 Kerne. Nur dass man im Falle von Intel's SB eben nur von logischen Kernen sprechen kann.

AMD's BD würde ich jedenfalls definitiv als realen 8 Kerner beschreiben. Auch, wenn jeder zweite integer Kern nicht vollständig ist.
Siamesische Zwillinge sind doch auch zwei Individuen, nicht nur einer, oder?


*Wobei IMHO genaue 100%ige Skalierung sowieso so eine Sache ist. Man muss bedenken, dass alle Kerne ja auch über ein Interface miteinander kommunizieren müssen. Fällt dies zu kompliziert oder abtrus aus, kann hier auch schon einmal Leistung verloren gehen.


Das passiert wenn man so viele Begriffe durcheinander wirft. Mein Fehler, ich meinte CMP. :D
Bild AMDs ?Bulldozer?-Präsentation bei ?Hot Chips 22? (5/37) - ComputerBase

Und siamesische Zwillinge hier mit einem Prozessor zu vergleichen ist auch schwer :schief:.

Naja, jedenfalls ist es mir wurscht ich werde mir genau wie du nen Bully kaufen. Mein 5000+ hat lange genug gedient :-).
[Offtopic=1]

8GB RAM stehen schon bereit und warten nur darauf in ein AM3+ Board gesteckt zu werden. Wenn die Preise noch weiter fallen, werden es weitere 8GB.

[Offtopic=0]

Schönen Abend noch :D
 
Das passiert wenn man so viele Begriffe durcheinander wirft. Mein Fehler, ich meinte CMP. :D
Bild AMDs ?Bulldozer?-Präsentation bei ?Hot Chips 22? (5/37) - ComputerBase

Und siamesische Zwillinge hier mit einem Prozessor zu vergleichen ist auch schwer :schief:.

Naja, jedenfalls ist es mir wurscht ich werde mir genau wie du nen Bully kaufen. Mein 5000+ hat lange genug gedient :-).
[Offtopic=1]

8GB RAM stehen schon bereit und warten nur darauf in ein AM3+ Board gesteckt zu werden. Wenn die Preise noch weiter fallen, werden es weitere 8GB.

[Offtopic=0]

Schönen Abend noch :D

Ok. CMP ist wirklich etwas Anderes. Ist mir persönlich mit am liebsten (wobei mein absoluter Liebling aber SMP ist).

Siamesische Zwillinge eignen sich eben als guter Vergleich. Da kann es auch vorkommen, dass sie sich einige Organe miteinander teilen, trotzdem spricht man da von 2 Individuen, nicht von einem oder eineinhalb.

Naja. Ich weiss noch nicht, ob ich mir einen Bulldozer kaufe.
Derzeit tendiere ich deutlich Richtung Intel, weil das ganze mir doch wieder zu sehr nach "Preis über Leistung" klingt, und ich nur zu Gunsten des Preises ungern Abstriche in der Leistung hinnehmen möchte.

RAM kommen bei mir diesmal mindestens 16GB zum Einsatz. Besser wären natürlich 32GB, wobei die Frage ist, ob dies vom internen Speichercontroller auch unterstützt wird.
 
Nein, siamesische Zwillinge sind Menschen und ein Prozessor ist im Grunde genommen ein großer Haufen Sand!

Lassen wir diesen Vergleich!

Was willst du denn mit einem SMP-System? oO Oder meinst du jetzt SMT?

Naja, da in nächster Zeit kein Game 8GB verwenden wird. Werde ich 6GB als RAM nutzen und aus 10GB Ram, eine Ram-Disk machen.
 
Nein, siamesische Zwillinge sind Menschen und ein Prozessor ist im Grunde genommen ein großer Haufen Sand!

Lassen wir diesen Vergleich!

Was willst du denn mit einem SMP-System? oO Oder meinst du jetzt SMT?

Naja, da in nächster Zeit kein Game 8GB verwenden wird. Werde ich 6GB als RAM nutzen und aus 10GB Ram, eine Ram-Disk machen.

Intern ist ein Prozessor ja kein riesiger Haufen Sand, sondern eben eine Mikroarchitektur. Im Falle von AMD's Bulldozer stecken da nun einmal Module drin, die miteinander gekoppelt sind. Und da in jedem Modul nunmal 2 Kerne zusammen operieren und sich gewisse Einheiten (quasi ihre Organe) teilen (aber immer noch 2 Kerne sind, und nicht einer), finde ich der Vergleich passt.

Weiss jetzt also nicht, was die Überempfindlichkeit zu diesem Thema soll, aber nun gut. Lassen wir es eben.
Wobei Menschen nach einer gewissen Zeit auch nicht mehr als ein Haufen Sand/Staub sind ;)


Du hast übrigens schon richtig gehört. SMP.
Finde ich eben rein architektonisch ganz interessant. Vorallem dann, wenn sich die Prozessoren keine Speichercontroller teilen müssen.

Ich werde wahrscheinlich 8GB nutzen und den Rest (8-24GB) als Ramdisk anlegen. Ist einfach noch einmal einen Hauch fixer, als eine SSD.
 
Intern ist ein Prozessor ja kein riesiger Haufen Sand, sondern eben eine Mikroarchitektur. Im Falle von AMD's Bulldozer stecken da nun einmal Module drin, die miteinander gekoppelt sind. Und da in jedem Modul nunmal 2 Kerne zusammen operieren und sich gewisse Einheiten (quasi ihre Organe) teilen (aber immer noch 2 Kerne sind, und nicht einer), finde ich der Vergleich passt.

Weiss jetzt also nicht, was die Überempfindlichkeit zu diesem Thema soll, aber nun gut. Lassen wir es eben.
GUT =)



Du hast übrigens schon richtig gehört. SMP.
Finde ich eben rein architektonisch ganz interessant. Vorallem dann, wenn sich die Prozessoren keine Speichercontroller teilen müssen.
Joa, SMP ist echt interessant. Gehört auch zu meinem täglichen Brot :D.

Ich werde wahrscheinlich 8GB nutzen und den Rest (8-24GB) als Ramdisk anlegen. Ist einfach noch einmal einen Hauch fixer, als eine SSD.
Uff... das ist ja noch mal ne ganze Ecke mehr als ich mir in meinem Kopf ausgemalt habe. Wofür wirst du es denn nutzen?

Ich habe mir gedacht es für den Temp Ordner zu nutzen.

BTW: Bulldozer ist doch ein Bagger. Mal schauen, ob er schaffen kann Intels Fundament ein wenig aufzureißen ^^.
 
Hallo zusammen!

Entschuldigt bitte, daß ich mich hier so einmische. Gelandet bin ich hier nach einer Google Suche "Phenom vs. Sandy Brigde" oder so, weil ich momentan auf der Suche nach neuer Hardware bin.

Ich war wirklich bereit, nach langer Zeit im Intel-Lager mal wieder auf AMD zu setzen - Aber ich denke, ich werde meinen Core 2 Duo 6320 OC @ 2,9 GHz noch eine Weile behalten, zumindest bis von AMD akzeptable Konkurrenz zum Intel-Angebot kommt (im Sommer?) Danke, DANKE für dieses tolle Forum :hail:! Und Respekt, ihr habt's wirklich drauf. Ok. genug geschleimt ;-)

Ich war wirklich drauf und dran, mein Weihnachtsgeld für ein Phenom II X6-System zu verbraten (ok, zugegeben: inklusive SSD, DDR3-RAM, 6980er Radeon usw.).

So ein Fehlkauf soll mir aber nicht nochmal passieren. Denn den selben Fehler habe ich vor einigen Jahren schon mal gemacht: Kaum hatte ich mein A8N-SLI Platinum mit Athlon X2, wurde der Sockel 939 gefühlte 2 Tage später abgeschafft. Never again!! Ok, die SSD werd ich vielleicht schon mal kaufen... denn wenn wir mal ehrlich sind, bringt die für den Ottonormalanwender wie mich wahrscheinlich das größte Leistungs-Plus.
 
Hallo zusammen!

Entschuldigt bitte, daß ich mich hier so einmische. Gelandet bin ich hier nach einer Google Suche "Phenom vs. Sandy Brigde" oder so, weil ich momentan auf der Suche nach neuer Hardware bin.

Ich war wirklich bereit, nach langer Zeit im Intel-Lager mal wieder auf AMD zu setzen - Aber ich denke, ich werde meinen Core 2 Duo 6320 OC @ 2,9 GHz noch eine Weile behalten, zumindest bis von AMD akzeptable Konkurrenz zum Intel-Angebot kommt (im Sommer?) Danke, DANKE für dieses tolle Forum :hail:! Und Respekt, ihr habt's wirklich drauf. Ok. genug geschleimt ;-)

Ich war wirklich drauf und dran, mein Weihnachtsgeld für ein Phenom II X6-System zu verbraten (ok, zugegeben: inklusive SSD, DDR3-RAM, 6980er Radeon usw.).

So ein Fehlkauf soll mir aber nicht nochmal passieren. Denn den selben Fehler habe ich vor einigen Jahren schon mal gemacht: Kaum hatte ich mein A8N-SLI Platinum mit Athlon X2, wurde der Sockel 939 gefühlte 2 Tage später abgeschafft. Never again!! Ok, die SSD werd ich vielleicht schon mal kaufen... denn wenn wir mal ehrlich sind, bringt die für den Ottonormalanwender wie mich wahrscheinlich das größte Leistungs-Plus.


das hängt aber von dem ab was du damit machen willst, SSDs helfen dir nur wenn du viele Daten auf der Platte hast und damit arbeiten willst, SSD-Vorteil ist das WQin schneller startet, die Anwendungen meist schneller sind, mehr an sich nichts, wenn du damit leben kannst das du statt 10 Sek., 1 min zum Starten von Win brauchst oder das das Spiel 5 sek. statt 30 Sekunden braucht zum Starten oder der Ladebildschirm fast nicht mehr da ist. dann nein, nutzt dir nichts, aber wenn du denn noch eine haben willst, dann kaufe dir ersdt eine wenn du ein neues System aufbaust ob Intel oder AMD, denn dann sollten wieder neue SSDs da sein und allgemein sollten die dann billiger sein.



so nun zum BD noch mal, hatte zwar schon mal gefragt, aber keine Antwort zu bekommen. der BD soll ja die FP-Einheit mit zwei Kernen in einem Modul teilen und kann auch die FP-Einheit nur einem Kern zuweisen, heißt das die FPU-Leistung stark zunehmen könnte, nicht nur durch die bessere CPU? Kann man diese Leistung mit F@H testen? Natürlich in einem 24h oder 48h Test. oder gebt es das bessere Tests.
 
Lynx wäre wohl ein besserer Test. Ebenso Prime etc.

Wenn sich ein Vorteil ergibt, muss dieser ja in "alltäglichen" Anwendungen da sein und nicht nur in hoch optimierten Anwendungen
 
Kannst ja selektiv die Skalierung nur auf AMD vs. AMD testen. Der Praxis vergleich zwischen Modellen muss eh mit realen Spielen und Anwendungen erfolgen. Aber die Grundsatzfrage nach dem Potential vom CMT kann man besser mit einzelnen Tools testen.
 
Kannst ja selektiv die Skalierung nur auf AMD vs. AMD testen. Der Praxis vergleich zwischen Modellen muss eh mit realen Spielen und Anwendungen erfolgen. Aber die Grundsatzfrage nach dem Potential vom CMT kann man besser mit einzelnen Tools testen.

Also theoretisch muss er ja in beiden Fällen effizienter sein:
Wenn nur ein Kern belastet wird, kann er ja alle Einheiten eines Moduls nutzen und wenn x Kerne belastet werden, würde er auch effizienter arbeiten.
 
Zuletzt bearbeitet:
Naja, wird aber sicher noch kommen, genau wie mit HT und SMT.

Was mir aber noch aufgefallen ist bei dem neuen Bild, das ja Marc gepostet hat ist, das Bulldozser 2 MB L2 Cache haben wird je Modul. Also insgesamt 8 MB L2 und 8 MB L3. Intel hat ja "nur" bis zu 20 MB L3 und jeweils 512kB L2, wobei ja der L3 ja direkt ne Kopie des L2 hält. Also zumindest wenn sie nichts zu dem Konzept der Core ix Prozessoren ändern.

Damit hätten beide Effektiv 16MB L2+L3 zur Verfügung, denn AMD hält meines Wissens nach keine Kopie des L2 im L3 vor.

Da der L2 aber schneller ist als der L3 könnte AMD in einigen Anwendungen eventuell sogar schneller sein als Intel. Also ich find das nicht uninteressant!
 
Nein, da nicht alle einheiten gekoppelt werden können.

mfg

Er hats wohl richtig gemeint aber Falsch gesagt ...
Da wird nichts gekoppelt aber bei bis max 4 Treads kann jeder Cluster Pro Thread Voll Leistung bringen und nicht nur 100 und 80% pro Modul , dazu Wird der Turbo bestimmt deftig Ausfallen , wenn praktisch fast das halbe Modul inaktiv ist ...
Also von daher erwarte ich das der Bulldozer auch in und Gerade dabei eine gute Leistung bringt und nicht nur bei 8 Thread Anwendungen ...
Dazu denke ich das dank CMT der Bulldozer jedem Intel 8 Kerner deutlich Voraus sein wird solange Programme eben nur 4 Kerne ausnutzen , da hilft dann auch kein SMT.
Wenn man dann noch bedenkt das AMD das Modul Konzept Haupsaechlich deshalb nutzt um DIE Flaeche einzusparen , bin ich schonmal gespannt wie gross die 8 Kern Intel sein werden .
wenn der 80 % Leistende 2te CPU CLuster gerade mal 25 % mehr DIE braucht , wird zwar ein weiterer Kern 100% Leistung bringen beim Intel OCta Core und so schneller sein aber wohl mehr verbrauchen und deutlich mehr DIE belegen !

mfg F-4
 
Da der L2 aber schneller ist als der L3 könnte AMD in einigen Anwendungen eventuell sogar schneller sein als Intel. Also ich find das nicht uninteressant!

intel lässt den LLC allerdings beim SB mit CPU Takt laufen - dieser wurde also gegenüber Nehalem deutlich beschleunigt. Bis jetzt wurde BD leider nur mit Nehalem/Westmere vergleichen.

dazu Wird der Turbo bestimmt deftig Ausfallen , wenn praktisch fast das halbe Modul inaktiv ist ...

aktuell spricht AMD nur von +500MHz beim Turbo - auch wenn das halbe Modul inaktiv ist und die TDP einen extrem hohen Takt zulassen würde, kommt dann immer noch die Stabilität ins Spiel. Es bringt nichts wenn der Turbo ein Modul dann um 1000MHz übertaktet, dieser Takt aber in der Selektion nur bei 1nem von 10 stabil läuft.

Also von daher erwarte ich das der Bulldozer auch in und Gerade dabei eine gute Leistung bringt und nicht nur bei 8 Thread Anwendungen ...
Dazu denke ich das dank CMT der Bulldozer jedem Intel 8 Kerner deutlich Voraus sein wird solange Programme eben nur 4 Kerne ausnutzen , da hilft dann auch kein SMT.

Da wird es sehr drauf an kommen wie die 4 Threads auf dem BD verteilt werden - wenn das BS die Threads auf 2 Modulen laufen lässt wird es eher sogar zu einem Einbruch kommen, ähnlich wie es bei SMT anfangs der Fall war. Hier gilt es abzuwarten. Da ersten Tests deuten eher nicht darauf hin das BD bei 4 Threads auf einem 4MD BD besonders schnell ist. In dem Fall hätte er den i7-950 wesentlich deutlicher schlagen müssen.

mfg
 
Zurück