Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

flankendiskriminator · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Kreisverkehr schrieb:
Du kannst bei einem derart anderen Konzept nicht die Definitionskeule auspacken mit einer Methode, die hierbei nicht greift. Intel bastelt hier einen Vierkerner und rüstet den mit ein paar kleinen Transistoren so aus, dass diese dann pro Kern zwei Treads anzeigen. Hier spricht man dann von logischen + virtuellen Kernen. Hier ist nichts doppelt vorhanden oder sonstwas. Man versuächt nur bei zwei Threads die Auslastung ein kleines Stück zu erhöhen. AMD baut hier die Multi-Thread-Leistung deutlich aus, indem sie einen kompletten Integer-Kern reinsetzen.

Ich habe eine ziemlich eindeutige Definition. Und die war so auch immer gültig, bis AMD mit ihrem Marketing angefangen hat den Begriff "Kern" auszuhöhlen.

Und natürlich hat auch Intel mit SMT gewisse Einheiten doppelt vorhanden. Keine Alus/Ausführungseinheiten, aber eben Backend. Eine ALU macht aber nunmal noch lange keinen Kern und auch kein Backend. Nur die Kombination des ganzen. Eben die 100%. Und die 100% sind ein Kern. Und 100% sind nur 4 Kerne des Bulldozers, ergo ein Quadcore.

Kreisverkehr schrieb:
Somit kann man mit mehr Transistorbudget als Intel die Leistung eines Kerns im Vergleich bei zwei Threads drastisch steigern.

Das ist allgemein vollkommener Quatsch. In gewissen Nutzungsszenarien vielleicht, grundsätzlich aber eben auch nicht.

Oder warum wird der Bulldozer denn in gewissen Benchmarks schneller, wenn ich die zusätzlichen Cores deaktivieren und nur 4 vollwertige Rechnen lasse?

Kreisverkehr schrieb:
Du machst dich lustig, dass ein solcher 8-Kerner einen 4-Kerner nicht schlägt? Ernsthaft? Vergisst du nicht, dass Intel eine deutlich höhere IPC hat? Dass viele Programme keine 8 Integerkerne ansteuern? Dass somit pro Thread Intel deutlich schneller ist?

Wir nähern uns dem Problem des Bulldozers und warum dieser Konzept in seiner jetzigen Form ein totaler Flop ist

Kreisverkehr schrieb:
Du hast auch vergessen, dass der Titel des Threads hier die Bremsen des Designs ansprechen soll, wo es hakt und wo Verbesserungspotenzial herrscht. Dass der Bulldozer - warum AMD es so gemacht hat, keine Ahnung - eine geringere IPC als der Vorgänger aufweist, warum der L1-Daten-Cache so gering ist, warum so viel Fläche in großen/langsamen Cache gesteckt wurde, DAS ist das Verbesserungspotential.
Warum AMD hier so auf Multithread setzt, aber dann getätigten Verbesserungen der Einheiten durch deren geringere Zahl mehr als nur auffressen lässt, weiß ich nicht.

Verbesserungspotential ist eben auch die Mehrleistung durch das Deaktivieren der Pseudo-Kerne. Ergo funktioniert sogar ein ziemlich elementarer Teil der Architektur nicht. Was es noch blödsinniger macht von einem 8-Kerner zu reden, wenn die 4 Zusatzkerne mehr Problem als Lösung sind.

Kreisverkehr schrieb:
Nein, kann man nicht. Intel hat bei 4 Kernen nur 4 Kerne. Es werden nur doppelt so viele angezeigt, wegen SMT. Nichts verdoppelt, keine Ausführugnseinheiten, nichts. Bei AMD eben schon. Und bezieht man sich auf die Integerkerne sind es derer 8. Und es sind wesentliche Ausführungseinheiten. Du kannst SMT und CMT keinesfalls vergleichen. Ich spreche auch lieber von Modulen als von Kernen, aber da AMD deutlich an die 8 Kerne rankommt, so kann man es durchgehen lassen, von 8 Kernern zu sprechen.

Das ist doch Quatsch. Wenn du ein Auto ohne Motor und Achsen da steht hast würde auch keiner mehr von einem Auto sprechen. Sondern von einer Karosserie. Und erst Recht würde man dsa ganze nicht in ein Autorennen schicken.

Das man mit den Zusatzeinheiten einem zweiten vollwertigen Kern bei AMD näher kommt als Intel mag sein, man hat aber eben immer noch keinen Kern. Daher kann man einfach nicht von 8-Kerner sprechen. Es hätte auch von sich aus niemand den BUlldozer als 8-Kerner bezeichnet, wenn das AMD nicht per Marketingkampagne versucht durch zu drücken.

Nach der Logik die hier angewendet werden, wäre ja bereits ein 486 ein Dualcore - denn der hatte einen mathematischen Coprozessor, der ja auch eine zweite Ausführungseinheit besessen hat. Und eine zweite Ausführungseinheit reicht ja scheinbar um ein "Kern" darzustellen :ugly:

Kreisverkehr schrieb:
Und den Kommentar von dem Haufen ******* hättest stecken lassen können. Du redest davon, dass man bei Intel 8-Kerner sagen müsste, obwohl das Quatsch ist. Wäre der neue Prozessor das, was er vllt mal hätte werden sollen, dann würde es diesn Thread nicht geben.

Wo tue ich das?

Mastermaisi777 · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Qaridarium schrieb:
Falsch ist nur das du nachwievor nicht verstehst wie "Out-Off-order" funktioniert.
Out of order bedeutet das bei intel 4 gleichwertige rechen units spekulativ die selbe aufgabe auf verschiedenen wegen rechnen und das ergebniss was dann am schnellsten korrekt ist und vorliegt wird als ergebniss des fake cores an das OS ausgegeben.

"Out-Off-order" bedeutet also das bei intel 4 cores ein virtualisierten core emulieren und das OS denkt so dumm wie es ist es sei nur 1 core.

Das stimmt doch hinten und vorne nicht o.O
Da wird gar nichts spekulativ auf verschiedenen Wegen berechnet,das würde ja bedeuten dass die CPU keine eindeutigen Befehle erhält sondern raten muss was sie eigentlich machen soll , wenn dann zufällig das erste Ergebnis auch korrekt ist funktioniert das Programm weiter ? Die Effizienz wäre absolut grottig ?

Für verschiedene Befehle gibt es verschiedene Einheiten, die mit definierten Befehlen angesteuert werden um korrekte Ergebnisse zu liefern.
Das hat mit der Out-of-Order Idee aber wenig zu tun, die besagt nur dass Befehle umsortiert werden können wenn man so die CPU besser auslasten kann.
Wichtig ist auch noch die Superskalarität, bei der Befehle parallel bearbeitet werden um wieder die CPU besser auszulasten.(nicht verwechseln mit SMT!)

Das einzige was spekulativ ist die Sprungvorhersage , die sehr wichtig ist um Pipeline-Stalls möglichst zu vermeiden.

dochurt · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Das man mit den Zusatzeinheiten einem zweiten vollwertigen Kern bei AMD näher kommt als Intel mag sein, man hat aber eben immer noch keinen Kern. Daher kann man einfach nicht von 8-Kerner sprechen. Es hätte auch von sich aus niemand den BUlldozer als 8-Kerner bezeichnet, wenn das AMD nicht per Marketingkampagne versucht durch zu drücken.

Einerseits richtig, aber jetzt wieder die Marketingabteillug von AMD den schwarzen Peter zu zuschieben ist auch nicht korrekt :

Definitionsfrage – Was ist eigentlich ein Kern?

Allerdings wird wohl auch AMD in Zukunft seine Worte mit mehr Bedacht wählen müssen, denn auch die Bulldozer-Module beinhalten nicht zwei komplette Kerne. Stattdessen teilen sie sich gewisse Einheiten, die man normalerweise pro Kern erwarten würde. Dazu gehören die Fetch- und Decode-Einheiten, die Gleitkomma-Einheiten und der L2-Cache.

Laut Mike Butler, dem Chefarchitekten der Bulldozer-Architektur, ist dies aber vertretbar, weil traditionelle Kerne in Umgebungen, wo Leistungsaufnahme eine Rolle spielt, ihren thermischen Spielraum nicht optimal ausnutzen. Das ist tatsächlich nachvollziehbar: Wenn man versucht, in einem Server so viele Kerne wie möglich unterzubringen, wird man beim Design diejenigen Ressourcen und Einheiten bevorzugen, die am häufigsten genutzt werden. Die anderen stellt man eben nur ein Mal bereit, so dass von mehreren Kernen genutzt werden. So spart man Chipfläche und kann die Leistungsaufnahme reduzieren, ohne dabei allzu große Abstriche bei der Performance hinnehmen zu müssen.

Hinzufügen möchte ich noch, es sagt keiner das der Bulli 8 Vollwertige Kerne hat, es sind aber 8logisch vorhanden .

dazu passend dieses:

Das bedeutet allerdings auch, dass AMD seine Definition von „Kern“ umschreiben muss, was man unter dem Begriff „Kern“ versteht. Um den Bulldozer nicht ins falsche Licht zu rücken, gilt nun laut AMD (wenig überraschend) alles als Kern, was eigene Integer-Ausführungs-Pipelines besitzt. Das ist ein Stück weit nachvollziehbar, denn die meisten Aufgaben, die Prozessor abarbeitet, bestehen größtenteils aus Ganzzahl-Berechnungen. Prinzipiell haben wir an dieser Definition nicht mehr oder weniger auszusetzen, als an anderen Definitionen. Doch wenn das Teilen von Ressourcen sich negativ auf die Pro-Takt-Performance auswirken wird, muss sich AMD wohl oder übel wieder auf höhere Taktraten oder deutlich stärkeres Threading stützen müssen, um das zu kompensieren.

Auch plausibel:

Für das Betriebssystem sehen die so entstandenen Module wie zwei Kerne aus, dabei nicht unähnlich einem Intel-Kern mit Hyper-Threading. AMD betont natürlich eifrig, dass Bulldozer sich ganz und gar nicht wie eine CPU mit Hyper-Threading benehmen wird, weil das Design bessere Skalierbarkeit erlaubt als zwei Threads, die sich einen Kern teilen müssen. Auch das ergibt wieder Sinn, denn man kann ein Bulldozer-Modul nicht wirklich als einen einzelnen Kern beschreiben, weil viele der Einheiten eben doch doppelt vorhanden sind.

Ergo spricht nicht zwangsweise die Marketigabteillung von einen 8Kerner, sondern ein Architekt vom Bulldozer .

Jetzt bist Du wieder dran

P.S. Quelle: THG !

X-CosmicBlue · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Qaridarium schrieb:
du sagst also die sprungvorhersage ist spekulativ bei einem out of order cpu und die integer units rechnen niemals etwas spekulativ?
da liegst du aber wirklich sowas von falsch! denn wenn die sprungvorersage versagt da nunmal spekulativ kommt das vor sind auch alle berechnungen der ingenger units null und nichtig und daher rechnen die integer units sehr wohl spekulativ.

zusammen gefasst bei einem in-order-design wird nichts spekulativ berechnet bei einem out of order design ist die spungvorhersage immer spekulativ und darauf aufbauend können auch berechnungen der integer units berechnungen anstellen die dann verworfen werden das nennt sich nunmal trial and error spekulative berechnung!

Qaridarium, bitte mach Dich erstmal schlau, bevor Du soetwas schreibst.
Die Sprungvorhersage gibt es nicht nur bei out-of-order-CPUs. Die Sprungvorhersage berechnet nichts, braucht daher auch nicht die Integereinheiten. Die Sprungvorhersage versucht nur zu erraten, welcher Befehl wohl als nächstes kommt. Das heißt aber nicht, das die Integereinheiten auf Grund dieser Spekulation anfangen zu rechnen.

flankendiskriminator · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

dochurt schrieb:
Einerseits richtig, aber jetzt wieder die Marketingabteillug von AMD den schwarzen Peter zu zuschieben ist auch nicht korrekt :

Warum zitierst du dann nur Aussagen von AMD? :ugly:

dochurt schrieb:
Hinzufügen möchte ich noch, es sagt keiner das der Bulli 8 Vollwertige Kerne hat, es sind aber 8logisch vorhanden .

Das ist kein Unterschied zu SandyBridge. Und ja, das ist auch ein 4-Kerner und kein 8-Kerner, auch wenn es logische 8 Kerne sind für das OS.

dochurt schrieb:
Auch plausibel:

Naja:
"dass Bulldozer sich ganz und gar nicht wie eine CPU mit Hyper-Threading benehmen wird, weil das Design bessere Skalierbarkeit erlaubt als zwei Threads, die sich einen Kern teilen müssen."

Gerade hier im Thread geht es doch darum, dass das Gegenteil der Fall ist: Mit abgeschalteten Zusatzkernen wird der Bulldozer schneller. Ergo ist da nichts mit schnellerer Skalierbarkeit gegeben. Also auch wieder nur pures Werbeblabla.

dochurt schrieb:
Ergo spricht nicht zwangsweise die Marketigabteillung von einen 8Kerner, sondern ein Architekt vom Bulldozer .

Das ist natürlich was ganz anderes, ob man bei AMD mit dem Architekten oder der Marketingabteilung redet :lol:

btw: Was glaubst du wohl, wer so ein Interview vor Veröffentlichung autorisieren muss? Fängt mit "M" an und hört mit "abteilung" auf

PsychoQeeny · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

flankendiskriminator schrieb:
Was ich nicht verstehe:

Warum hat man nicht einfach ein natives 6-Core Design gebaut? Anstelle 4x(1+0,75) an Cores zu verbauen, hätte man bei ähnlich viel Die-Fläche auch direkt 6 vollwertige Cores verbauen können. Dann wäre kein Win7-Patch nötig gewesen, keine Probleme wo welcher Core jetzt genutzt wird etc.

Dafür hätte man die Entwicklungszeit auch einfach in die Optimierung des IPCs stecken können und wäre hinterher bei einer DEUTLICH besseren CPU gelandet als das was man heute hat. Auch für Server.

So sieht Bulldozer eher aus wie halb durchdacht und dann noch schlecht ausgeführt.

AMD wollte einen CPU Backen, der aus Modulen besteht... wo 2 Kerne sich die Arbeit teilen, und Games oder (vorangig) Aplikationen ein Modul als Kern betrachten. Die Idee war nicht schlecht(sondern ganz gut), aber das was Bulldozer jetzt ist ...ist dabei rausgekommen :ugly:

Von AMD garantiert nicht so gewollt(oder erdacht), aber was soll man machen ...erstmal auf den Markt damit und weiterschauen .

Kreisverkehr · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

flankendiskriminator schrieb:
Und natürlich hat auch Intel mit SMT gewisse Einheiten doppelt vorhanden. Keine Alus/Ausführungseinheiten, aber eben Backend. Eine ALU macht aber nunmal noch lange keinen Kern und auch kein Backend. Nur die Kombination des ganzen. Eben die 100%. Und die 100% sind ein Kern. Und 100% sind nur 4 Kerne des Bulldozers, ergo ein Quadcore.

Intel baut aber für einen Kern 105% der notwendigen Schaltungen ein, um eben zwei Kerne vorzugaukeln. Es sind keine Recheneinheiten verdoppelt worden. AMD baut geschätzt 130% des für einen Kern um damit die Leistung eines echten 2-Kerners annähernd zu erreichen. Somit sind die angezeigten 2 Kerne unter Windows wesentlich näher an der Realität als wenn man von einem 1-Kerner (je modulbezogen) spricht. Ich sehe also eine gewisse Logik, es als 8-Kerner zu vermarkten, denn die "wichtigste" Einheit liegt ja doppelt vor. Es ist kein 8-Kerner, sondern 4-Moduler und dadurch auch kein 4-Kerner.
Intel baut Vierkerner, keine Acht-Kerner (Desktop). Beide bauen auch Sechs-Kerner.
Bei Intel ist es überhaupt kein Problem, einem Acht-Threader zu sagen, dass er ein Vierkerner ist. Bei AMD geht das nicht mehr.

flankendiskriminator schrieb:
Das ist allgemein vollkommener Quatsch. In gewissen Nutzungsszenarien vielleicht, grundsätzlich aber eben auch nicht.
Oder warum wird der Bulldozer denn in gewissen Benchmarks schneller, wenn ich die zusätzlichen Cores deaktivieren und nur 4 vollwertige Rechnen lasse?

Wenn es um den Einfluss des Turbo und der Threadverteilung von Windows geht, kann es greifen, wenn man die Module voll belastet, bzw. die Integerkerne. Je nach Programm allerdings wird der nicht verdoppelte Rest zur Bremse. Später meine Einschätzung.

flankendiskriminator schrieb:
Wir nähern uns dem Problem des Bulldozers und warum dieser Konzept in seiner jetzigen Form ein totaler Flop ist

Die Idee dahinter ist genial. Mit - sagen wir - 30% Aufwand 80% Mehrleistung zu generieren bei 2 Threads pro Modul ist im Vergleich zu einem fiktiven Zweikerner effizient und platzsparend. Allerdings ist das Design in den wichtigen Komponenten anscheinend verbugt. Die Gerüchte wegen den Caches und da da die Leistung flöten geht, und den anderen Dingen, die verbessert gehören, die geben nen Hinweis darauf.
In planet3Dnow soll ja auch Dresdenboy dem Bulli nen Artikel widmen und versuchen zu ergründen, warum der Bulldozer so ein Schuss in den Ofen geworden ist.

flankendiskriminator schrieb:
Verbesserungspotential ist eben auch die Mehrleistung durch das Deaktivieren der Pseudo-Kerne. Ergo funktioniert sogar ein ziemlich elementarer Teil der Architektur nicht. Was es noch blödsinniger macht von einem 8-Kerner zu reden, wenn die 4 Zusatzkerne mehr Problem als Lösung sind.

Hier ist nicht die Idee, sondern die Umsetzung derselben die Krux. Eine mittlerweile miese IPC noch weiter gesenkt, damit dann auf massives Multithreading + hohen Takt gesetzt um dann letzlich an den Bugs(?) der Architektur zu scheitern.

flankendiskriminator schrieb:
Das ist doch Quatsch. Wenn du ein Auto ohne Motor und Achsen da steht hast würde auch keiner mehr von einem Auto sprechen. Sondern von einer Karosserie. Und erst Recht würde man dsa ganze nicht in ein Autorennen schicken.

Das man mit den Zusatzeinheiten einem zweiten vollwertigen Kern bei AMD näher kommt als Intel mag sein, man hat aber eben immer noch keinen Kern. Daher kann man einfach nicht von 8-Kerner sprechen. Es hätte auch von sich aus niemand den BUlldozer als 8-Kerner bezeichnet, wenn das AMD nicht per Marketingkampagne versucht durch zu drücken.

Nach der Logik die hier angewendet werden, wäre ja bereits ein 486 ein Dualcore - denn der hatte einen mathematischen Coprozessor, der ja auch eine zweite Ausführungseinheit besessen hat. Und eine zweite Ausführungseinheit reicht ja scheinbar um ein "Kern" darzustellen

Zum einen ist das Beispiel von dem Auto Mist, denn es kann dann nicht mehr fahren. Der Bulldozer kann aber so noch genutzt werden, auch wenn er dabei zuviel säuft. Eher kannst du es mit einem LKW vergleichen, der verlängert wurde, mehr Achsen hat und dann mit nem verbesserten, aber insgesamt schwächeren Motor mehr Ladefläche hat. Bei leichten Materialien (vgl. Dämmmaterial und Integerkerne) ist das vllt effizienter, wenn er aber den Berg bei schwererer Fracht nicht mehr hochkommt, dann bringt der Rest auch nichts mehr.

Bei den Co-Prozessoren hat man das integriert, aber nicht vorhandenes verdoppelt. Hier nen ganzen Integerkern und den Rest daraufhin angepasst. Versteh mich nicht falsch, ich würde es gern einfach nur 4-Moduler nennen, da es weder ein Vier-Kerner, noch ein richtiger Acht-Kerner ist, auch wenn er dem Acht-Kerner verdammt nahe kommt im Vergleich zum Vorgänger.

flankendiskriminator schrieb:
Wo tue ich das?

flankendiskriminator schrieb:
Nach der Definition, die man bisher immer für 4-Kerner im allgemeinen und Kerne im speziellen hatten ist es kein 8-Kerner. Das ist völliger Quatsch. Er hat nur 4 vollwertige Kerne + 4 unvollständige Kerne. Ob diese unvollständigen KErne dann 5% eines vollwertigen Kernes oder 99% haben spielt doch gar keine Rolle. Es ist eben KEIN vollwertiger Kern. Wenn überhaupt könnte man von 4+4 sprechen, aber das könnte Intel mit identischer Logik genauso.

Hier. Die Logik greift bei Intel nicht, wegen der Technik, die verwendet wurde. Intel kann nur 2 Threads durch den einen, einzelnen Kern quetschen, wo nichts verdoppelt wurde. Klar, dass der Kern dafür angepasst wurde und Logik verbaut werden musste, aber es ist nicht möglich, den genauso zu behandeln.
AMD steht aktuell eh schlechter da durch deren Marketing. Hier herrscht aktuell vor, dass ein Acht-Kerner nen Vier-Kerner nicht schlagen kann trotz revolutionärer Architektur. Und das bei höherem Stromverbrauch.

Wenn du allerdings meintest, dass man auch bei Intel von 4+4 hätte sprechen müssen, dann gilt obiges immer noch: Nein, denn Intel gaukelt nur Kerne vor, die es nicht gibt. Mikrosoft musste erst damit umgehen können, bis SMT die Leistung nicht mehr senkte in manchen Fällen. Und AMD bietet hier wenigstens noch die Möglichkeit, wenn man ein Auge zu drückt, es als "echten" Acht-Kerner zu betiteln, da er im Vergleich zu 80% ein solcher ist/sein will.

e:/

flankendiskriminator schrieb:
Das ist kein Unterschied zu SandyBridge. Und ja, das ist auch ein 4-Kerner und kein 8-Kerner, auch wenn es logische 8 Kerne sind für das OS.

Da ist ein gewaltiger Unterschied. Nochmals: SB hat nichts doppelt, gaukelt pro Kern noch einen zweiten, virtuellen Kern vor. Bulldozer hingegen hat noch wirklich was verbaut an Schaltungen (Integerkern) und das kann theoretisch dann voll genutzt werden ohne Verluste. Theoretisch.

Hier nochmal das Bild dazu:
http://pics.computerbase.de/3/1/6/8/1/2.png

Deutlich zu sehen, dass in der Theorie die nicht verdoppelten Einheiten alles derartig managen, dass die Integerkerne voll ausgefahren werden können, ohne Geschwindigkeitsverlust. Bei SMT gilt das nicht, denn dort werden bei zwei Threads jeder der Threads verlangsamt in der Berechnung, aber insgesamt dadurch, dass man in nicht der doppelten Zeit (aber dennoch länger) die doppelte Arbeit leistet.
Bei AMD gilt hier noch, dass zwei Threads so beschleunigt laufen können.
Bei einem Thread liegt hier etwas brach. In der Theorie sollte nun allerdings das so geregelt werden, dass bei zwei Threads, die über ein Modul jagen, damit der Rest sich schlafen legen kann und der Turbo eingreift.

flankendiskriminator · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Kreisverkehr schrieb:
Intel baut aber für einen Kern 105% der notwendigen Schaltungen ein, um eben zwei Kerne vorzugaukeln. Es sind keine Recheneinheiten verdoppelt worden. AMD baut geschätzt 130% des für einen Kern um damit die Leistung eines echten 2-Kerners annähernd zu erreichen. Somit sind die angezeigten 2 Kerne unter Windows wesentlich näher an der Realität als wenn man von einem 1-Kerner (je modulbezogen) spricht. Ich sehe also eine gewisse Logik, es als 8-Kerner zu vermarkten, denn die "wichtigste" Einheit liegt ja doppelt vor. Es ist kein 8-Kerner, sondern 4-Moduler und dadurch auch kein 4-Kerner.

Also ist ein 100%+5% Kern nur ein Kern, ein 100%+30% Kern aber zwei Kerne. Wo ist die Grenze? Irgendwo zwischen +5 und +30%, aber wo genau?

Entscheidend ist doch der Vergleich. Und wenn ich einen Intel-Kern als einen Kern bezeichne (trotz SMT) während ich einen AMD-Kern mit CMT als zwei Kerne bezeichne, dann ist das schlichtweg Äpfel mit Birnen verglichen. Denn die 4 Kerne des Intel sind zu 100% autark und können auch zu 100% ausgenutzt werden - die 8 Kerne des AMD stören sich aber immer gegenseitig an vielen Ecken und Enden. Im Extremfall nutzt ein Programm nur die FPU und schon wird aus dem theoretischen Dualcore des AMD ein Singlecore.

Und genau das ist es, was man bei Bulldozer im Vergleich zur Intel und hauseigenen Konkurrenz beachten muss. Wenn man sich die Benchmarks anschaut, findet man nirgends die 80% eines Dualcore pro Modul. Es sind (auch bei Multithreading-Anwendungen DEUTLICH weniger).

Kreisverkehr schrieb:
Intel baut Vierkerner, keine Acht-Kerner (Desktop). Beide bauen auch Sechs-Kerner.
Bei Intel ist es überhaupt kein Problem, einem Acht-Threader zu sagen, dass er ein Vierkerner ist. Bei AMD geht das nicht mehr.

Auch bei AMD kann man die Zusatzkerne deaktivieren.

Kreisverkehr schrieb:
Wenn es um den Einfluss des Turbo und der Threadverteilung von Windows geht, kann es greifen, wenn man die Module voll belastet, bzw. die Integerkerne. Je nach Programm allerdings wird der nicht verdoppelte Rest zur Bremse. Später meine Einschätzung.

Eben genau das ist das Entscheidende. Die 80% eines Dualcore ist der OPTIMALFALL, nicht der Regelfall!

Kreisverkehr schrieb:
Die Idee dahinter ist genial. Mit - sagen wir - 30% Aufwand 80% Mehrleistung zu generieren bei 2 Threads pro Modul ist im Vergleich zu einem fiktiven Zweikerner effizient und platzsparend. Allerdings ist das Design in den wichtigen Komponenten anscheinend verbugt. Die Gerüchte wegen den Caches und da da die Leistung flöten geht, und den anderen Dingen, die verbessert gehören, die geben nen Hinweis darauf.
In planet3Dnow soll ja auch Dresdenboy dem Bulli nen Artikel widmen und versuchen zu ergründen, warum der Bulldozer so ein Schuss in den Ofen geworden ist.

Du generierst aber keine 80% Mehrleistung. Zumindest nicht immer. Das sagte ich ja schon oben: Aus den 4 Kernen des SandyBridge kann ich mit 4 Threads fast immer 100% Leistung aus jedem Kern holen. Bei AMD wenn ich die FPU nutze eben nur 50% (bezogen auf die angeblich zwei Kerne).

Die Geschichte mit den Caches klingt mir persönlich einfach zu unwirklich, das hätte man schon in den Projektionen sehen müssen, dass es da Problem gibt. Das dann sogar noch der Windows-Sheduler angepasst werden muss, obwohl das bei dieser Konstruktion fast zwangsläufig sein muss und das niemand vorher für nötig erachtet - no comment.

Auch AMD sieht die Sache längst nicht so optimistisch wie du, wo sie mit Bulldozer2 ja nur 10-15% mehr erwarten. Das ist nicht viel.

Kreisverkehr schrieb:
Hier ist nicht die Idee, sondern die Umsetzung derselben die Krux. Eine mittlerweile miese IPC noch weiter gesenkt, damit dann auf massives Multithreading + hohen Takt gesetzt um dann letzlich an den Bugs(?) der Architektur zu scheitern.

Eine Idee deren Umsetzung nicht möglich ist taugt eben nichts. Man hätte bei AMD eher an der IPC arbeiten müssen, statt so eine unfertige Krücke auf den Markt zu werfen. Das CMT-Konzept funktioniert schlicht weg nicht. Ob sie es jemals zum laufen kriegen werden ist reinste Spekulation. Mich würde es nicht wundern, wenn man ala Pentium4 inzwischen intern doch wieder bei K8-Optimierung anfängt....

Kreisverkehr schrieb:
Zum einen ist das Beispiel von dem Auto Mist, denn es kann dann nicht mehr fahren. Der Bulldozer kann aber so noch genutzt werden, auch wenn er dabei zuviel säuft. Eher kannst du es mit einem LKW vergleichen, der verlängert wurde, mehr Achsen hat und dann mit nem verbesserten, aber insgesamt schwächeren Motor mehr Ladefläche hat. Bei leichten Materialien (vgl. Dämmmaterial und Integerkerne) ist das vllt effizienter, wenn er aber den Berg bei schwererer Fracht nicht mehr hochkommt, dann bringt der Rest auch nichts mehr.

Das ist doch eben der entscheidende Punkt: Die doppelt im Bulldozer vorhandenen "Kerne" können auch alleine nicht funktioneren, ergo kann man es doch net Kern nennen - anders als beim Sandy. Und du sagst es ja selbst: EIN Lkw. Nicht zwei

Kreisverkehr schrieb:
Bei den Co-Prozessoren hat man das integriert, aber nicht vorhandenes verdoppelt. Hier nen ganzen Integerkern und den Rest daraufhin angepasst. Versteh mich nicht falsch, ich würde es gern einfach nur 4-Moduler nennen, da es weder ein Vier-Kerner, noch ein richtiger Acht-Kerner ist, auch wenn er dem Acht-Kerner verdammt nahe kommt im Vergleich zum Vorgänger.

Verdammt nahe ist aber nunmal nicht da. Ergo stimmst du mir jetzt indirekt zu, dass der Bulldozer ein 4-Kerner ist und kein 8-Kerner.

Kreisverkehr schrieb:
Hier. Die Logik greift bei Intel nicht, wegen der Technik, die verwendet wurde. Intel kann nur 2 Threads durch den einen, einzelnen Kern quetschen, wo nichts verdoppelt wurde. Klar, dass der Kern dafür angepasst wurde und Logik verbaut werden musste, aber es ist nicht möglich, den genauso zu behandeln.

Dreh mir meine Wort nicht herum! Ich schrieb explizit 4+4 und eben NICHT 8. Der SandyBridge ist genauso wie der Bulldozer ein Quadcore. Wenn AMD es 8-Kerner nennen will, dann sollen sie 8 echte Kerne einbauen.

Kreisverkehr schrieb:
AMD steht aktuell eh schlechter da durch deren Marketing. Hier herrscht aktuell vor, dass ein Acht-Kerner nen Vier-Kerner nicht schlagen kann trotz revolutionärer Architektur. Und das bei höherem Stromverbrauch.

So man die Benchmarks kennt. Für Unbedachte also 8 > 4.

Kreisverkehr schrieb:
Wenn du allerdings meintest, dass man auch bei Intel von 4+4 hätte sprechen müssen, dann gilt obiges immer noch: Nein, denn Intel gaukelt nur Kerne vor, die es nicht gibt. Mikrosoft musste erst damit umgehen können, bis SMT die Leistung nicht mehr senkte in manchen Fällen. Und AMD bietet hier wenigstens noch die Möglichkeit, wenn man ein Auge zu drückt, es als "echten" Acht-Kerner zu betiteln, da er im Vergleich zu 80% ein solcher ist/sein will.

Jetzt sind es also 80% eines Kerns. Im Post vorher waren es 75%, weiter oben 30%.

Kurz: Was denn nun?

Kreisverkehr schrieb:
Da ist ein gewaltiger Unterschied. Nochmals: SB hat nichts doppelt, gaukelt pro Kern noch einen zweiten, virtuellen Kern vor. Bulldozer hingegen hat noch wirklich was verbaut an Schaltungen (Integerkern) und das kann theoretisch dann voll genutzt werden ohne Verluste. Theoretisch.

Natürlich hat der SandyBridge doppelte Transistoren vorhanden um den zusätzlichen Thread zu erlauben. Keine ALUs, aber eben doch Schaltungen. Ihr seid diejenigen, für die jetzt urplötzlich 30% eines Kernes ausreichend sind um von Kern zu sprechen - mal sind es auch 30 oder 75, ihr werft da eh alles in einen Topf, mischt kräftig rum und plötzlich beginnt die "Kern"-Definition dann da, wo sie AMD gerne hätte.

Kreisverkehr · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

@ flankendiskriminator

Willst du mir die Worte im Munde umdrehen und einfach etwas unterstellen, was so nicht da steht?
Oder willst du mich nicht verstehen?
Ich gehe davon aus, was AMD geplant hatte durch ca. 30% mehr Transistoren im Vergleich zum Einkerner hierbei ca. 80% Leistung eines Zweikerners zu erreichen. Das stand auch bei mir so. Du verstehst also, dass 30% sich auf die Transistoren beziehen, die 80% auf die Mehrleistung?

Hier geht es darum, dass es eben kein Vierkerner ist, sondern viel mehr ein Achtkerner, trotz dass die Anzahl der Transistoren nicht verdoppelt wurde.

Und wenn du behauptest, dass man aus SB-Kern 100% Leistung rausquetschen kann, dann hast du die Art nicht verstanden, wieso SMT und CMT implementiert werden. Der Gedanke ist, dass zwei Threads pro Kern abgearbeitet werden können, bzw. schneller als wenn man das sequentiell abarbeitet. SMT versucht, wie man im Bild erkennen kann, nen Thread in die Abarbeitung des anderen reinzuquetschn. Darum hat man ja ursprünglich zwei Kerne verwendet, weil man damit zwei Threads parallel abarbeiten kann.
Ein Modul soll also bei viel weniger Fläche als ein Zweikerner fast die Leistung des Zweikerners erreichen. Soweit klar?

Somit kann doch ein Modul fast als Zweikerner gesehen werden, ein Intel mit SMT eben nicht. Intel hat aber vier gute Kerne, mit hoher IPC und leistet sehr viel bei Single-Thread, wo AMD bei Multi-Thread punkten wollte, aber Single-Thread "irgendwie" vergessen hatte. Ein Modul hat auch 100% Leistung eines Einkerners, bei zwei Threads 80% Mehrleistung als der fiktive Einkerner bei sequentieller Abarbeitung.

Es bestreitet keiner, dass es kein echter Achtkerner sei, aber dass diese Bezeichnung durch die komplett neuartige Architektur einfach nicht als Einkerner gehandelt werden kann.

Zum LKW: Dann beschreibe es als LKW mit nem Hänger und nem umgebauten Motor. Mehr Fläche, mehr Platz und dennoch schlecht umgesetzt bzgl. AMDs Prozessor.

Und bevor du urteilst, ob die Architektur einfach fürn Mülleimer ist, solltest du mal schauen, ob hier noch die Flaschenhälse beseitigt werden können, ebenso der Energiebedarf.
Ich kenne die Folien, die AMD hier propagiert, aber hier wird auch versucht, die vorhandenen Flaschenhälse aufzuzeigen. Man kann auch nur spekulieren, ob es AMD gelingen mag und ob Piledriver irgendwas reißen kann. Ich bin da jetzt nicht so pessimistisch wie du, nur weil ich die Architektur nicht gleich auf den Müll werfen möchte. AMD muss da eh an der IPC schrauben und den Energiebedarf senken. Ich will hoffen, dass die den Anschluss nicht noch weiter verlieren.

flankendiskriminator · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Kreisverkehr schrieb:
Willst du mir die Worte im Munde umdrehen und einfach etwas unterstellen, was so nicht da steht?
Oder willst du mich nicht verstehen?
Ich gehe davon aus, was AMD geplant hatte durch ca. 30% mehr Transistoren im Vergleich zum Einkerner hierbei ca. 80% Leistung eines Zweikerners zu erreichen. Das stand auch bei mir so. Du verstehst also, dass 30% sich auf die Transistoren beziehen, die 80% auf die Mehrleistung?

Warum beantwortest du denn jetzt meine Frage nicht eindeutig? Wenn also 100%+30% als Dualcore gilt, gilt dann auch 100+20%? Und warum gilt dann genau 100+5% nicht? Was ist das denn für eine Logik außer reiner Willkür, jetzt urplötzlich da wo AMD mit dem Bulldozer zu landen aus Singlecore plötzlich Dualcore werden zu lassen, ohne das wir einen wirklichen Dualcore haben?

Erklär mir das doch einfach mal. Ich sehe keine Erklärung für dich, woher jetzt auf einmal diese 30% als Schwarz/Weiß-Grenze zwischen Dual- und Singlecore kommen, während meine eindeutige Definition im Sinne von vollwertiger Kern?

Kreisverkehr schrieb:
Hier geht es darum, dass es eben kein Vierkerner ist, sondern viel mehr ein Achtkerner, trotz dass die Anzahl der Transistoren nicht verdoppelt wurde.

Das heißt also, dass sämtlich acht Kerne des Bulldozers vollkommen autark von einander arbeiten können? Das ist doch genau die Definition eines "Kernes".

Kreisverkehr schrieb:
Und wenn du behauptest, dass man aus SB-Kern 100% Leistung rausquetschen kann, dann hast du die Art nicht verstanden, wieso SMT und CMT implementiert werden. Der Gedanke ist, dass zwei Threads pro Kern abgearbeitet werden können, bzw. schneller als wenn man das sequentiell abarbeitet. SMT versucht, wie man im Bild erkennen kann, nen Thread in die Abarbeitung des anderen reinzuquetschn. Darum hat man ja ursprünglich zwei Kerne verwendet, weil man damit zwei Threads parallel abarbeiten kann.

Du verstehst überhaupt nicht was ich sagen will.

Nochmal langsam für dich zum Mitschreiben:

Ich hab ein Programm, dass einen SandyBridge-Kern zu 100% ausnutzen kann. Es nutzt 4 Threads. Wenn ich das laufen lassen, dann habe ich durch die 4 Kerne die 4-fache Leistung eines Kerns.

Verstanden?

So, jetzt habe ich ein ähnliches Programm für den Bulldozer. Das nutzt aber (dooferweise) gerne die FPU. Das Programm nutzt 8 Threads. Weil aber die FPU geshared ist, nützt mir die 8 Threads gar nicht, weil ja nur 4 FPUs da sind.

Auch verstanden?

Und genau DAS ist der Knackpunkt. Der Bulldozer hat KEINE 8 VOLLWERTIGEN Kerne. Wenn ich Glück habe nutzt mein Programm nur Integer (wobei das schon ne ziemliche Seltenheit wäre) und ich erlebe tatsächlich die 80% Mehrperformance durch die Zusatzkerne. Das ist aber utopisch, wie fast ALLE Benchmarks zeigen. Wie man ja auch hier im Thread sieht ist sogar gern das Gegenteil der Fall: Die Zusatzkerne bremsen das System statt es schneller zu machen.

Wie man das jetzt (verglichen mit einem SandyBridge) als 8-Kerner bezeichnen kann, während man Sandy voller Berechtigung als 4-Kerner bezeichnet, ist vollkommen schleierhaft. Das ist einfache nur eine Tatsachenverdrehung.

Kreisverkehr schrieb:
Ein Modul soll also bei viel weniger Fläche als ein Zweikerner fast die Leistung des Zweikerners erreichen. Soweit klar?

Tut er aber nicht. Darum geht es genau in diesem Thread, das man durch Abschalten des Zusatzcores Leistung gewinnt.

Der 4-Kerner also schneller ist als der angebliche "8"-Kerner.

Is there more to say?

Kreisverkehr schrieb:
Somit kann doch ein Modul fast als Zweikerner gesehen werden, ein Intel mit SMT eben nicht. Intel hat aber vier gute Kerne, mit hoher IPC und leistet sehr viel bei Single-Thread, wo AMD bei Multi-Thread punkten wollte, aber Single-Thread "irgendwie" vergessen hatte. Ein Modul hat auch 100% Leistung eines Einkerners, bei zwei Threads 80% Mehrleistung als der fiktive Einkerner bei sequentieller Abarbeitung.

80% THEORETISCHE (!) Mehrleistung. Das ist ein riesen Unterschied. Wenn ich beispielswiese ein Programm mit zwei identischen Threads habe und einen Sandy-Chip vom Single zum Dualcore mache habe ich 100% Mehrleistung. Bei einem Bulldozer in dem ich einen Zusatzcore freischalte irgendwas zwischen 80% Mehrleistung (theoretischer Idealfall, den man in KEINEM Benchmark sieht) und 20-30% Minderleistung.

Sowas hat einfach die Bezeichnung 8-Kerner nicht verdient, ganz einfach. Weil ein Intel 8-Kerner den Bulldozer sowas von in den Boden stampfen würde, als würdest du mit deinem Tretroller neben nem Formel1-Wagen starten.

Und genau deswegen ist die Bezeichnung 8-Kerner absolut fehlleitend.

Kreisverkehr schrieb:
Es bestreitet keiner, dass es kein echter Achtkerner sei, aber dass diese Bezeichnung durch die komplett neuartige Architektur einfach nicht als Einkerner gehandelt werden kann.

ja, es ist kein echter Achtkerner und damit ein Quadcore. Ganz einfach. Also warum diskutieren wir hier noch?

Kreisverkehr schrieb:
Zum LKW: Dann beschreibe es als LKW mit nem Hänger und nem umgebauten Motor. Mehr Fläche, mehr Platz und dennoch schlecht umgesetzt bzgl. AMDs Prozessor.

Auch der Lkw mit Hänger ist ein super Beispiel, denn weder sind das 2 LKWs, noch bewegt sihc der Händer ohne Lkw.

Ergo der Bulldozer doch ein Quadcore.

Danke das du mir dnan doch immer unbewusst zustimmst :lol:

Kreisverkehr schrieb:
Und bevor du urteilst, ob die Architektur einfach fürn Mülleimer ist, solltest du mal schauen, ob hier noch die Flaschenhälse beseitigt werden können, ebenso der Energiebedarf.

Jaja, die angeblihcen Flaschenhälse. AMD selbst geht doch nur von 10-15% Mehrleistung durch den Nachfolger aus. Das ist eine wohl eher optimistische als pessimistische Abschätzung. Wenn ich das im Hinterkopf haben und mir die Cachegeschichte anschaue, weiß ich was ich von der Mär über die Caches halten muss: Nicht viel.

Um mit Intel auch nur ansatzweise mithaltne zu können, ist eine Mehrleistung von über 30% vonnöten. 10-15% deckt doch wahrscheinlich nichtmal die Optimierungen von Ivy ab. Und der kriegt noch einen Shrink...

Kreisverkehr schrieb:
Ich kenne die Folien, die AMD hier propagiert, aber hier wird auch versucht, die vorhandenen Flaschenhälse aufzuzeigen. Man kann auch nur spekulieren, ob es AMD gelingen mag und ob Piledriver irgendwas reißen kann. Ich bin da jetzt nicht so pessimistisch wie du, nur weil ich die Architektur nicht gleich auf den Müll werfen möchte. AMD muss da eh an der IPC schrauben und den Energiebedarf senken. Ich will hoffen, dass die den Anschluss nicht noch weiter verlieren.

Bulldozer2 ist schon lange in der Pipeline, AMD ist mit dieser Architektur jetzt mitgefangen und mitgehangen. Das man da jetzt mit etwas Tweaking hier und da plötzlich den heiligen Gral findet ist reichlich unrealistisch. Ich hab schon lange vor Bulldozer gesagt, dass das so nix wird. Aber man muss sich ja immer am Strohhalm festhalten - so wie jetzt am vermeitlichen 8-Kerner.

dochurt · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Jetzt mal ganz im ernst "Flanke", was willst Du jetzt auf Teufel komm raus ausdiskutieren ??

Dynamitarde · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Ich kann euch jetzt schon schreiben, was bei dieser Diskussion raus kommt.
Und zwar jeder bleibt bei seiner Meinung.

flankendiskriminator · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

dochurt schrieb:
Jetzt mal ganz im ernst "Flanke", was willst Du jetzt auf Teufel komm raus ausdiskutieren ??

Warum fragst du das nicht Kreisverkehr?

Im Grunde gibt es nichts zu diskutieren, da er mir ja auch zustimmt, indirekt. Trotzdem schreibt er einen Satz weiter, dass ich Unrecht hätte und Bulldozer ein 8-Kerner ist :ugly:

Weiß nicht was da jetzt bei ihm an dermaßen penetranter kognitiver Dissonanz herrscht....

dochurt · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Mein Resümee, AMD hat eine miserable Architektur heraus gebracht ohne genau zu Wissen wie man die selbige zu Bezeichnen hat - Hat was

Bei etwaigen Nebenwirkungen fragen Sie ihren Arzt oder Apotheker, in besonderen Fällen darf es auch mal der gemeine Forenuser sein

Incredible Alk · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Qaridarium schrieb:
der bulldozer ist ein 4core und B jeder der was anderes sagt definiert das rein willkürlich ohne "supstanz"

Zum Beispiel auch der Hersteller AMD. So lange die drauf rumreiten dass sie 8 Kerner verkaufen müssen sie auch damit leben dass ich behaupte Intel ist mit halber Kernzahl schneller.

Incredible Alk · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Qaridarium schrieb:
Die beim "Marketing" dürfen alles auch Lügen

Ich weiß, klar dass sichn 8-Kerner unterm Mob besser verkauft alsn 4rer wenn keiner weiß dass der 4rer schneller is / der 8er an sich nurn 4rer is (wies beliebt) :-D

flankendiskriminator · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Qaridarium schrieb:
ich warte nur darauf das intel nun auch 4core cpus als 8cores verkauft weil werden ja 8 cores im task manager von windows durch hyperthreating angezeigt...

Ich glaube nicht, dass sich Intel die blöße gibt. Wozu sollten sie?

Vorallem kommt dieser Pseudo 8-Kerner genau von den Leuten, die vor 3 Jahren noch was von "nativer Quadcore" gefaselt haben :daumen2:

Kreisverkehr · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

flankendiskriminator schrieb:
Warum beantwortest du denn jetzt meine Frage nicht eindeutig? Wenn also 100%+30% als Dualcore gilt, gilt dann auch 100+20%? Und warum gilt dann genau 100+5% nicht? Was ist das denn für eine Logik außer reiner Willkür, jetzt urplötzlich da wo AMD mit dem Bulldozer zu landen aus Singlecore plötzlich Dualcore werden zu lassen, ohne das wir einen wirklichen Dualcore haben?

Erklär mir das doch einfach mal. Ich sehe keine Erklärung für dich, woher jetzt auf einmal diese 30% als Schwarz/Weiß-Grenze zwischen Dual- und Singlecore kommen, während meine eindeutige Definition im Sinne von vollwertiger Kern?

Ich hab mir das nicht aus den Fingern gesaugt oder willkürlich geschätzt, sondern hab mich auf die folgende Quelle berufen (wobei hier 20% mehr Transistoren für den zweiten "Kern" die Rede ist): HT4U.net
Da gibts auch ne nette Grafik, warum man hier von "Kern" redet. Die Haupteinheit wurde verdoppelt.

flankendiskriminator schrieb:
Das heißt also, dass sämtlich acht Kerne des Bulldozers vollkommen autark von einander arbeiten können? Das ist doch genau die Definition eines "Kernes".

Du verstehst überhaupt nicht was ich sagen will.

Nochmal langsam für dich zum Mitschreiben:

Ich hab ein Programm, dass einen SandyBridge-Kern zu 100% ausnutzen kann. Es nutzt 4 Threads. Wenn ich das laufen lassen, dann habe ich durch die 4 Kerne die 4-fache Leistung eines Kerns.

Verstanden?

So, jetzt habe ich ein ähnliches Programm für den Bulldozer. Das nutzt aber (dooferweise) gerne die FPU. Das Programm nutzt 8 Threads. Weil aber die FPU geshared ist, nützt mir die 8 Threads gar nicht, weil ja nur 4 FPUs da sind.

Auch verstanden?

Und genau DAS ist der Knackpunkt. Der Bulldozer hat KEINE 8 VOLLWERTIGEN Kerne. Wenn ich Glück habe nutzt mein Programm nur Integer (wobei das schon ne ziemliche Seltenheit wäre) und ich erlebe tatsächlich die 80% Mehrperformance durch die Zusatzkerne. Das ist aber utopisch, wie fast ALLE Benchmarks zeigen. Wie man ja auch hier im Thread sieht ist sogar gern das Gegenteil der Fall: Die Zusatzkerne bremsen das System statt es schneller zu machen.

Ich habe nie gesagt, er wäre ein vollwertiger Acht-Kerner, sondern deutlich näher an acht Kernen dran als an den vier. Wenn ich ein Programm habe, dass 4 Threads nutzt, das läuft perfekt auf einem Sandy Bridge. Das gleiche Programm auf einem Bulldozer SOLLTE in der Theorie auch gut laufen, da es - so war es VLLT früher gedacht - je nach besserer Auslastung/Turbo läuft es auf 4 Modulen besser als auf 2 Modulen mit Turbo.

Dazu bei ht4u.net:
"Weiterhin gibt es einen Floating-Point-Cluster für Gleitkomma-Befehle. Dieser kann wahlweise zwischen den zwei Threads geteilt oder von einem Thread allein genutzt werden.

Wie bei Intels Hyperthreading-Technologie erscheint somit ein Bulldozer-Modul, das inkl. dem L2-Cache gerade einmal 213 Millionen Transistoren beinhaltet gegenüber dem Betriebssystem als ein Zweikern-Prozessor und kann mit zwei Threads versorgt werden. Diese können im Idealfall dann vollkommen parallel innerhalb des Moduls abgearbeitet werden und reservieren sich ihre Ressourcen dynamisch. Ist hingegen nur ein Thread aktiv, hat dieser Zugriff auf alle Ressourcen."

Die FPU kann geteilt werden oder in obigen Szenario komplett mit einem einzelnen Int-Kern genutzt werden. Sollte auch der Grund sein, warum es bei vier Threads in vier Modulen teils schneller geht als bei vier Threads in zwei Modulen. Eine Software, die nun 8 Threads (warum sollte ein Programm mit vier Threads nun plötzlich beim Bulldozer vier weitere Threads generieren?) und bevorzugt die Int-Kerne nutzt, könnte hier ggü. einem Vierkerner, der nur vier Integer-Kerne hat, im Vorteil sein. Außen vor gelassen natürlich die IPC und Effizienz.

Ein Intel-Acht-Kerner würde vor allem wegen der IPC einen Bulldozer gegen die Wand fahren, was ja schon jetzt als Vierkerner gelingt. AMD hat einfach einen extrem wichtigen Parameter sogar noch unter den Vorgänger gesenkt und hoffte, alles auf Multi-Threaded zu setzen. Nur weils jetzt in der Realität nicht klappt, ist der Prozessor schlecht.
Nutzt ein Programm nun acht Threads, so kann es beim Bulldozer deutlich geschmeidiger durch die Pipelines gejagt werden (FPU geteilt, zwei Integerkerne pro Modul) als bei einem Sandy Bridge, der zwar auch acht Threads annimmt, aber dann jeden einzelnen Thread verlangsamt durch das durchquetschen durch die gleiche Pipeline. Dass Intel hier dennoch sehr gut dasteht, liegt halt an deren guten Architektur. Auch AMDs Sechs-Kerner sind hier von den ALUs und AGUs nicht so abgespeckt wie der Bulldozer.

flankendiskriminator schrieb:
Wie man das jetzt (verglichen mit einem SandyBridge) als 8-Kerner bezeichnen kann, während man Sandy voller Berechtigung als 4-Kerner bezeichnet, ist vollkommen schleierhaft. Das ist einfache nur eine Tatsachenverdrehung.

Tut er aber nicht. Darum geht es genau in diesem Thread, das man durch Abschalten des Zusatzcores Leistung gewinnt.

Der 4-Kerner also schneller ist als der angebliche "8"-Kerner.

Is there more to say?

Nur ist er einfach kein Vier-Kerner, weil hier wesentliche, sehr wichtige Einheiten doppelt/getrennt vorkommen. Intel musste nur 5% "überflüssige" Transistoren zusätzlich einbauen, um vier weitere Kerne vorzugaukeln (Register, blablub), ohne aber irgendwas "wichtiges" zu verdoppeln. AMD geht den Mittelweg zwischen 4 und 8 Kernen, wobei diese den 8 näher kommen u.a. durch die Möglichkeit die FPU zu teilen. Und dass ein Vierkerner der Konkurrezn schneller ist, beweist NULL dass Bulli ein Vierkerner wäre.

flankendiskriminator schrieb:
80% THEORETISCHE (!) Mehrleistung. Das ist ein riesen Unterschied. Wenn ich beispielswiese ein Programm mit zwei identischen Threads habe und einen Sandy-Chip vom Single zum Dualcore mache habe ich 100% Mehrleistung. Bei einem Bulldozer in dem ich einen Zusatzcore freischalte irgendwas zwischen 80% Mehrleistung (theoretischer Idealfall, den man in KEINEM Benchmark sieht) und 20-30% Minderleistung.

Sowas hat einfach die Bezeichnung 8-Kerner nicht verdient, ganz einfach. Weil ein Intel 8-Kerner den Bulldozer sowas von in den Boden stampfen würde, als würdest du mit deinem Tretroller neben nem Formel1-Wagen starten.

Und genau deswegen ist die Bezeichnung 8-Kerner absolut fehlleitend.
ja, es ist kein echter Achtkerner und damit ein Quadcore. Ganz einfach. Also warum diskutieren wir hier noch?

Vierkerner wäre absolut fehlleitend, weil es einfach keiner ist. Nur weil es kein reinrassiger Achtkerner ist, kannst du ihn unzutreffend als Vierkerner bezeichnen. Korrekterweise müsste man ihn 4-Moduler nennen oder einfach hier Acht-Threader nennen. Wobei noch zwischen CMT und SMT zu unterscheiden wäre.
Und am einfachsten ist es, ihn Acht-Kerner zu nennen, weil er dem einfach näher kommt.

flankendiskriminator schrieb:
Jaja, die angeblihcen Flaschenhälse. AMD selbst geht doch nur von 10-15% Mehrleistung durch den Nachfolger aus. Das ist eine wohl eher optimistische als pessimistische Abschätzung. Wenn ich das im Hinterkopf haben und mir die Cachegeschichte anschaue, weiß ich was ich von der Mär über die Caches halten muss: Nicht viel.

Um mit Intel auch nur ansatzweise mithaltne zu können, ist eine Mehrleistung von über 30% vonnöten. 10-15% deckt doch wahrscheinlich nichtmal die Optimierungen von Ivy ab. Und der kriegt noch einen Shrink...

Nja, mehr als diese 15% wäre wirklich "toll" aber sicher nicht erreichbar. Dass Intel bei der IPC deutlich weiter ist, und daher auch den Bulldozer locker einsackt, sollte u.a. auch mim Takt egalisiert werden. Leider klappte das nicht, denn wer braucht für weniger Leistung mehr Strom? Ivy wird - wenn nicht was entscheidendes schief geht, wovon ich allerdings ncihts gehört habe - ordentlich was vorlegen in der Effizienz und daher außerhalb der Schlagdistanz sein.

flankendiskriminator schrieb:
Bulldozer2 ist schon lange in der Pipeline, AMD ist mit dieser Architektur jetzt mitgefangen und mitgehangen. Das man da jetzt mit etwas Tweaking hier und da plötzlich den heiligen Gral findet ist reichlich unrealistisch. Ich hab schon lange vor Bulldozer gesagt, dass das so nix wird. Aber man muss sich ja immer am Strohhalm festhalten - so wie jetzt am vermeitlichen 8-Kerner.

Wenn es wie beim K8 aussieht, und man sich die Baustellen anschaut, dann wird AMD noch alles mögliche an Flaschenhälsen beseitigen (müssen), oder auch wieder diese Grundarchitektur anpassen müssen. Wie lange das dann dauert, keine Ahnung. Dass Piledriver 10-15% effizienter (nicht unbedingt schneller) werden soll, sollte im Rahmen des Möglichen sein. Durch diese nächste Stufe wird der heilige Gral niemals möglich sein, dazu ist die Vorlaufzeit zu lange und die nächsten Stufen des Designs werden schon erarbeitet.

AMDs Strohalm war anscheinend das Multi-Threading (und John Fruehe hat ja gesagt [was sich als unwahr herausstellte], dass die IPC dennoch etwas steigt, verglichen zum Vorgänger) und mit einer erhöhten IPC + deutlich mehr Takt klang es ncihtmal so schlecht.
Da ist ein Intel in der Klasse einfach besser. Wie Piledriver dann auch noch in der neuen APU (da MUSS der Stromverbrauch deutlich runter) abschneiden wird (und ob hier hauptsächlich mit einem schnelleren Grafikteil geworben wird), ist auch eine interessante Sache.

e:/

flankendiskriminator schrieb:
Vorallem kommt dieser Pseudo 8-Kerner genau von den Leuten, die vor 3 Jahren noch was von "nativer Quadcore" gefaselt haben

Ja Moment, klar hatte AMD nen nativen Vierkerner, der rein von der Anbindung her dem FSB deutlich überlegen war. Allerdings - wie man an den Zweikerner sah - war die IPC deutlich geringer und auch der maximale Takt war unterhalb der Taktaten der Konkurrenz. Rein von der Skalierung her hat der Phenom schon profitiert. Allerdings war Intels Lösung schnell, einfach, billig und durch die gute und sparsame Architektur überlegen. Theoretische Überlegenheit im [theoretischen] Konzept bringt auf der Straße auch nicht unbedingt was, wenn die zugrundeliegende Architektur unterlegen ist und dazu noch mehr säuft bei weniger Leistung und die geworbenen 3 GHz niemals(!) erreichte. Erst der Nachfolger konnte das ursprüngliche Taktziel erreichen und generell gleichziehen oder durch den Takt den alten Yorki überholen.

flankendiskriminator · 27. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Kreisverkehr schrieb:
Ich hab mir das nicht aus den Fingern gesaugt oder willkürlich geschätzt, sondern hab mich auf die folgende Quelle berufen (wobei hier 20% mehr Transistoren für den zweiten "Kern" die Rede ist): HT4U.net

Ergo ist es einfach nur ein "Kern", weil das AMD sagt?

Kreisverkehr schrieb:
Da gibts auch ne nette Grafik, warum man hier von "Kern" redet. Die Haupteinheit wurde verdoppelt.

Eine Haupteinheit macht noch lange keinen Kern. Genauso wie ein Motor noch lange nicht ein Auto macht.

Wären es nämlich WIRKLICH zwei VOLLWERTIGE Kerne, müsste das AMD auch nicht CMT nennen, sondern es wären einfach 8 Kerne :ugly:

Ziemlich einfache Logik, oder?

Ich hab den Rest mal ignoriert, weil das nur noch pure Spekulation ala hätte, wäre, könnte, sollte ist und nichts mehr mit den Fakten zu tun hat. Klar, HÄTTE der Bulldozer wirklich 8 richtige Kerne, könnte er richtig fix sein. So wird er im Singlethreading vernichtet und sobald es Multithreading wird, ist sein 6-Kern Vorgänger (mit wirklichen 6 Kernen!) direkt mit dabei.

Freuen können sich die Leute, die so einen 6-Kern Phenom haben. Denn a) ist der sehr preiswert b) schon lange erhältlich und c) hat wirklich, echte KERNE und nicht so ein Pseudo-Kern-Gedöns, das sich AMD gerne in die Powerpoints haut, aber sonst zu nichts viel taugt. :ugly:

Kreisverkehr · 28. Oktober 2011

AW: Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Tja, es ist nunmal kein reiner Vierkerner, sondern ähnelt [pro Modul]einem Zweikern-Prozessor, was bei vier Modulen eher einem Acht-Kerner gleicht, auch wenn es keiner ist.
Intel hat allerdings was anderes und das ist dann wiederum ein Vierkerner mit HT.

Dass der Bulldozer abkackt durch irgendwelche Flaschenhälse/Designfehlentscheidungen, wenn es um die wirklich wichtige Single-Thread-Leistung geht, ist offensichtlich. Und AMD wollte keine vollwertigen Kerne aus nem Modul schnitzen, denn sonst wäre der rießige Bulldozer noch größer geworden. Der Plan war halt, Multi-Thread extrem kostengünstig umzusetzen. Das haben sie in der Idee gut gemeistert, in der Praxis ... nicht. Gut, tradtionelles Design vorrausgesetzt, wäre er sicherlich besser, aber das wiederum kannst ja ignorieren, weil Spekulatius.

Der Sechskerner (Bulldozer SOLLTE ja umgerechnet 6,4-Kerner sein "irgendwie") hat ne höhere Single-Thread-Leistung und bei Multi-Thread-Applikationen steht er auch gut da. Trotz 45nm Strukturbreite hat der Thuban mit seinen 346mm² kaum mehr Fläche, bei 32nm wären es "etwas" weniger Fläche. Es ist wohl keine Überaschung, wenn ich jetzt sage, dass ein reiner, geshrinkter Thuban im Moment noch eine bessere Wahl gewesen wäre, was die Ausbeute und die Marge betrifft. Wenn man sich Llano anschaut, sind zwar die Spannungen werksseitig extrem hoch, aber beim Bulli rel. niedrig im Vergleich, somit könnt ein 32nm Thuban dann doch was reißen. Aber das wiederum wirst du ignorieren, weil Spekulatius.

Ja, der Bulldozer - der kein Vierkerner ist, sondern ein Viermoduler - reißt aktuell wenig und da meine Anwendungen, die wirklich Leistung brauchen, keine acht Threads benötigen, teilweise nichtmal vier Kerne (Spiele, ab und an Filme umwandeln), wäre ich -sofern ein Sandy Bridge nicht gekauft wird - mit nem Phenom II aktuell (weit) besser dran. AMD wollte ja sehr schnell die Produktpalette komplett auf 32nm umstellen, mal schauen, was draus wird.

Und ich persönlich gönne es AMD, es als Acht-Kerner zu vermarkten, schließlich lautet die Botschaft: Acht sehr schwache "Kerne" verlieren gegen vier sehr starke (echte) Kerne. Und technisch sind die Module bei Single-Thread halt schlecht, weil die FPU, welche bei zwei Threads halbiert wird (und so jeder Kern aus FPU, Int-Kern, Scheduler, etc. besteht) dann wenig Leistung hat, wenn man zwei Threads durch ein Modul jagt, um den Turbo abzugreifen und die anderen Module schlafen zu legen.

Warum der Bulldozer enttäuscht - und warum es trotzdem Hoffnung gibt

Freizeitschrauber(in)

PCGHX-HWbot-Member (m/w)

PC-Selbstbauer(in)

PCGH-Community-Veteran(in)

Freizeitschrauber(in)

Software-Overclocker(in)

BIOS-Overclocker(in)

Freizeitschrauber(in)

BIOS-Overclocker(in)

Freizeitschrauber(in)

PC-Selbstbauer(in)

PCGH-Community-Veteran(in)

Freizeitschrauber(in)

PC-Selbstbauer(in)

Moderator

Moderator

Freizeitschrauber(in)

BIOS-Overclocker(in)

Freizeitschrauber(in)

BIOS-Overclocker(in)

Ähnliche Themen