Bulldozer zu spät? Gerüchte mehren sich

AW: Bulldozer zu spät? Gerüchte mehren sich

Nee, das reicht als Begründung wie gesagt nicht aus.

Was willst du den noch haben? Einen Test der das Bestätigt? Kann ich gerne Verlinken.

Fakt ist, AMD liegt bei Multithreading alles andere als zurück.

Kannst du das auch belegen? Denn die Benchmarks die ich kenne belegen klar das gegenteil.

Und Fakt ist auch, dass AMD bezüglich Multithreading mit dem CMT Design ein verdammt heisses Eisen im Feuer für die zukünftigen Jahre hat.

Das wird sich dann zeigen wenn die ersten unabhängigen Bechmarks da sind

Wenn es so viel bringt, wie AMD sagt, dann kann man eher darüber diskutieren, ob die Konkurrenz Nachholbedarf hat.

Auch das wird sich nach den ersten Benchmarks zeigen. Nach dem was bis jetzt bekannt ist sieht es allrdings nicht danach aus als hätte die konkurrenz Nachholbedarf.

mfg
 
Zuletzt bearbeitet:
AW: Bulldozer zu spät? Gerüchte mehren sich

Was willst du den noch haben? Einen Test der das Bestätigt? Kann ich gerne Verlinken.
Einen Test für was? Magny Cours vs Westmere-EX? Nee, den kannst du dir schenken. Das ist gar nicht das Thema. Dass Westmere-EX schneller als Magny-Cours ist, bestreitet doch gar keiner. Du solltest langsam mal kapieren, dass Magny-Cours ein 2010er Opteron und damit nicht wirklich vergleichbar ist. Der 2011er Opteron heisst Interlagos und ist die Konkurrenz zu den Westmere-EX / SB-E Xeons. Und anhand dieser Prozessoren darfst du uns gerne mal erklären, warum AMD bei Multithreading meilenweit zurückliegen soll.

Kannst du das auch belegen? Denn die Benchmarks die ich kenne belegen klar das gegenteil.
Es geht um Technologie, nicht um Benchmarks. Du verwechselst schlichtweg "Prozessor A ist schneller als Prozessor B" mit "die Technologie von Firma A hinkt meilenweit hinter der Technologie von Firma B her". Du darfst aber gerne Cray fragen, wenn du Benchmarks willst. Die werden sicherlich ausreichend Material haben, warum sie "AMD's leading multi-core scalar processors" im KX6 einsetzen. ;)

Nach dem was bis jetzt bekannt ist sieht es allrdings nicht danach aus als hätte die konkurrenz Nachholbedarf.
Und was soll das sein? SMT = 20% Speedup, CMT = 80% Speedup, Sandy Bridge: SSE = 128bit / AVX = 256-bit, Bulldozer: SSE = 2x 128-bit / AVX = 256-bit, Sandy Bridge: kein FMA, Bulldozer: FMA4. ... Nach dem, was bisher bekannt ist, sieht es sehr wohl danach aus, als ob die Konkurrenz Nachholbedarf hat.
 
AW: Bulldozer zu spät? Gerüchte mehren sich

Endlich mal einer der Ahnung hat:D

Denke nicht das der später rauskommen wird ;)
 
AW: Bulldozer zu spät? Gerüchte mehren sich

Später als was?
Momentan sieht es ja wirklich eher so aus als käme nun erstmal Llano und Bulldozer dann in Q3 oder so.
 
AW: Bulldozer zu spät? Gerüchte mehren sich

Du solltest langsam mal kapieren, dass Magny-Cours ein 2010er Opteron und damit nicht wirklich vergleichbar ist. .

Ist Magny Cours aktuell am Markt: ja Ist Magny Cours aktuell der schnellste Opteron: ja - also muss er auch als vergleich herhalten solange keine neueren Produkte von AMD am Markt sind. Nach Interlagos kommt SB-EX, danach wieder BD2 - da könnte wird das spielchen "Ist eine 20xy Architektur, bald kommt was neues" immer weiter fortsetzen.

SMT = 20% Speedup, CMT = 80% Speedup

Und schon wieder wird CMT 1 zu 1 mit SMT verglichen obwohl es 2 Grundlegend verschiedene Ansätze sind, wann hört das endlich mal auf :schief:

Davon abgesehn erreicht SMT aktuell ein Speedup von bis zu 50%, was dafür das es keine zusätzlichen Recheneinheiten gibt sehr beachtlich ist.

mfg
 
AW: Bulldozer zu spät? Gerüchte mehren sich

Ist Magny Cours aktuell am Markt: ja
Es bleibt trotzdem ein 2010er Opteron und entspringt damit einem anderen Entwicklungszyklus als Westmere-EX. Magny Cours war/ist der Gegner von Nehalem EX und Westmere EP.

Und schon wieder wird CMT 1 zu 1 mit SMT verglichen
Nö, wurde nicht. Ich habe lediglich verglichen, was beides für einen Speedup bringt / bringen soll. Und das wird nun mal auch im Praxiseinsatz entscheidend sein. Wenn dir das nicht passt, dann solltest du das auch plausibel begründen.

Davon abgesehn erreicht SMT aktuell ein Speedup von bis zu 50%
Bis zu, irrelevant. SMT kann auch mal die Performance verringern. Es sollte klar gewesen sein, dass das Durchschnittsangaben waren. Intel selbst bezeichnet den SMT Speedup mit 5-30% oder so. Also weit entfernt von dem, was CMT bringen soll.
 
AW: Bulldozer zu spät? Gerüchte mehren sich

Und SMT ist abhängig von der Auslastung der physikalischen Kerne. Laufen die komplett auf Maximum, ist nichts mehr frei für SMT.
 
AW: Bulldozer zu spät? Gerüchte mehren sich

Moin zusammen

ich verfolge die Informationen zur neuen AMD Bulldozer Architektur nun schon eine ganze weile, da ich bei mir den nun schon über 3 Jahre laufenden Intel Q6600 adäquat aufrüsten möchte. Grundsätzlich sehe ich es dabei so, dass die Designidee die AMD mit dem BD verfolgt ein logischer Schritt ist um die Performance einer Desktop oder Server CPU zu beschleunigen und dabei die Kosten und den Stromverbrauch unter heutigen Gesichtspunkten im erträglichen Maß zu halten. Um zu erklären, warum ich das so sehe, möchte ich ein wenig in die Vergangenheit abschweifen.
Bis Ende der 80´er Anfang der 90´er Jahre war der reine Kernvergleich einer CPU noch vollkommen in Ordnung, da der Aufbau einer CPU klassischen Struktur aus Befehlsregister, Steuerwerk und "Integer"-Rechenwerk entsprach. In einigen Fällen gesellte sich dazu ein Co-Prozessor für die Floating-Point-Arithmetik, was die Berechnung von nicht Ganzzahligen Werten erheblich beschleunigte. Die Performance einer CPU ließ sich in der Regel dadurch ableiten, wie viele Takte für eine Berechnung benötigt wurde und wie schnell die CPU getaktet war. Hierbei war zu der Zeit der CPU-Takt auch noch gleich dem BUS-Takt auf dem ganzen Rechnersystem, abgesehen von externen Schnittstellen. Frühzeitig gesellten sich zu der CPU noch diverse Caches um CPU-Externe zugriffe, z.B. auf den Arbeitsspeicher oder auf den Co-Prozessor, zu beschleunigen. Die Gleichheit des CPU-Taktes zum BUS-Takt wurde im weiteren Verlauf der Geschichte aufgehoben , wobei sich dich dann das BUS-System beim Zugriff auf bestimmte Caches und den Co-Prozessor als Flaschenhals erwies. Die logische Konsequenz war, das der Co-Prozessor als Floating-Point-Unit und der L2-Cache mit auf den Die der CPU integriert wurde und somit für alle Systeme auf dem Die untereinander mit dem CPU-Takt kommunizieren und im CPU-Takt die Berechnungen verarbeiten konnten. Selbst mit weiteren danach eingeführten Verbesserungen wie zusätzlichen "Spezial-Einheiten" wie MMX und deren Nachfolgern sowie die Einführung einer Pipeline bei der Berechnung konnte man die Performance einer CPU immer noch an dem CPU-Takt und Anzahl der Takte pro Berechnung fest machen. Dies galt jedoch immer mehr nur für die reine Single-Thread-Verarbeitung. Bei der seit Mitte der 90´er immer mehr aufkommenden Multi-Thread-Verarbeitung erwiesen sich bestimmte Verbesserungen, da sich unter anderem der CPU-Takt sich nicht wie gewünscht steigern ließ, als hinderlich. Im Fall des Pentium 4 war es die zu lange unflexible Pipeline, die ihn bei Multi-Thread-Anwendungen deutlich hinter die damaligen AMD Prozessoren mit den kürzeren flexibleren Pipelines und effizienteren Befehlen zurückfallen ließ. Der Pentium 4 war dabei für ganz andere Taktfrequenzen designt worden und sollte ursprünglich Richtung Mitte 2000 einen Takt von 10 GHz erreichen. Schnell war jedoch im Verlauf der Geschichte klar, dass Intel sich hier verzettelt hatte und Taktraten über 4 GHz bei preislich vertretbaren Kühlungen nicht möglich war und der Stromverbrauch ins unermessliche stieg. AMD war zu der Zeit mit seiner Architektur besser aufgestellt, da ihnen ähnliche Taktraten möglich waren und die AMD-Architektur bei Multi-Threading- Verarbeitung flexibler und effizienter, oder einfach besser, war. Den "Makel" konnte Intel nur mit einer "Rolle Rückwärts" zur für Notebooks entwickelten Core-Architektur lösen, was dann aber die Marketing-Leute von Intel vor Probleme stellte, die gerade die Taktzahlen als Index für die Geschwindigkeit eines Prozessors beworben hatten. Ein "Centrino"-Prozessor (Centrino stand für einem Gesamtsystem eines Notebooks aus Prozessor, Chipsatz, Grafikeinheit und WLAN-Karte. Daher der Begriff Centrino in Hochkommatas) mit 1,6 GHz war nun ähnlich schnell im Multi-Threading Bereich wie ein 3 GHz Pentium 4.
Da sich nun ca. 4 GHz als Grenze für die Taktrate bei einer einfachen Luftkühlung und vertretbaren Stromverbrauch darstellte und die einzelnen "Prozessoren" schon recht effizient und flexibel bei Multithreading waren, war der nächste Verbesserungsschritt, neben der Einführung der 64Bit-Architektur, das man in ein System mehrere Prozessoren verbaute, wie es schon frühzeitig in der PC-Geschichte bei Servern und später bei Workstations üblich war. Des weiteren wurden dabei dann auch eingebracht, die einem Physischen Prozessor-Kern einen "Virtuellen" Prozessorkern zur Seite stellen um sich Latenzzeiten zunutze zu machen und auf einen Kern zwei Threads "gleichzeitig" verarbeiten zu können. Bei der Vermehrfachung der Prozessoren wurden jedoch immer ganze Systeme aus Befehlsregister, Steuerwerk, Rechenwerk, Co-Prozessor, Zusatzeinheiten wie MMX, SSE 1-4 und so weiter mehrfach geklont und auf ein Prozessor-Die oder Tray verbaut.
AMD geht hier nun mit der Bulldozer-Architektur nun wie bereits einleitend gesagt einen neuen Weg, den ich bei vielen zukünftigen Designs sogar noch verstärkt erwarte. Es werden nicht mehr vollständige "Kerne" wie wir sie bisher kannten verbaut , sondern es werden nur Teilbereiche mehrfach verbaut und andere Komponenten und Funktionen werden geteilt. Der gedankliche Ansatz für ein solches Design besteht darin, dass ein Thread nicht oder selten alle Funktionen einer bis daher bekannten CPU benötigen. Es werden daher nicht alle Bereiche im gleichen Maße vermehrfacht, sondern in unterschiedlichen Mengen auf ein "Modul" zusammengefasst, auf dem dann jede einzelne bisher aus einer CPU bekannten Komponente mindestens einmal vorhanden ist. Das ganze muss dabei in der Balance sein und sich an der Typischerweise genutzten Software und deren Ressourcenverbrauch orientieren um eine Leistungssteigerung zu erreichen.
Argumentativ bekommt man bei diesem Ansatz natürlich bei dem Begriff "Prozessorkern" wie wir ihn bisher gebraucht haben ein Problem. Ein Bulldozer-Modul ist mehr als ein Kern, jedoch weniger als 2 Kerne nach heutiger Sicht. Er kann jedoch 2 Threads echt parallel verarbeiten und nicht nur virtuell wie z.B. bei HyperThreading. Er verhält sich quasi wie ein echter 2 Kern-Prozessor, ist es jedoch zum Teil auch nicht, weil sich Komponenten geteilt werden müssen. AMD spricht daher bei der Angabe der Performance eines Bulldozer-Moduls auf den mir bekannten Veröffentlichungen daher davon, dass ein Bulldozer-Modul 80% der Performance eines virtuellen 2 Kern Bulldozer erreicht, bei dem alle Komponenten einmal vorhanden sind. man erreicht somit bei kleinerer Fläche und weniger Stromverbrauch annähernd die gleiche Leistung eines "echten" 2-Kern Prozessors. Wobei dieser Vergleich von AMD auch hinkt. Bei Paraellelen Threads die von allen Komponenten Gebrauch machen annähernd nur die Geschwindigkeit von einem Vergleichbaren Kern übrig bleibt, und in anderen Fällen wo nur ein Thread eventuell alles benötigt sogar annähernd eine Verdoppelung der Geschwindigkeit gegenüber einem Kern zu erwarten ist und man sich somit auf dem Niveau eines 2-Kern Prozessors bewegt. Es kommt hiermit sehr stark auf die eingesetzte Software an und welche Art man von Software man parallel nutzt. Es bleibt dabei dann auch abzuwarten, in wie weit sich die verlängerten Pipelines bei der dieser Architektur negativ bemerkbar machen, die bei höheren Frequenzen sicherer bei der Verarbeitung der Befehle sind, oder ob dieser Nachteil der P4-Architektur durch die massive Parallel-Verarbeitung kompensiert wird.
Der Ansatz den AMD hier betreibt ist daher aus meiner Sicht genau der Richtige und Zukunftsweisende Ansatz, wenn man dann auch ein wenig über den Tellerrand einer CPU hinwegsieht und GPGPU-Recheneinheiten bei bestimmten Server mit in die Gedanken mit einbezieht. Die Performance einer Heutigen CPU kann daher nicht mehr rein damit angegeben werden, wie viel Berechnungen man pro Takt erzielt und Takte für einen Rechenschritt nötig sind, sondern wie viel Takte für ein Ergebnis nötig sind und wie viele Ergebnisse parallel zur Verfügung stehen. Das ganze muss dabei dann jedoch auch noch in Relation zu der genutzten Die-Fläche und dem Stromverbrauch gesetzt werden. Klar könnte man nun auch die Strukturen verkleinern, was natürlich auch die Die-Fläche Verkleinert und den Stromverbrauch reduziert. Aber eine Strukturverkleinerung wird zunehmend immer komplizierter und hat auch irgendwann ein Ende. Somit steht AMD mit Bulldozer aus meiner Sicht recht gut da und hat aus meiner Sicht den zukunftsweisenden Architekturansatz erstellt, den auch Intel über kurz oder lang gehen muss. Wobei es dabei auch Zukünftig auf die Software ankommen wird und wie ein Rechner genutzt wird. Ein einzelner Thread wird bei der Bearbeitung kaum noch an Geschwindigkeit zulegen können nur sehr viele parallel laufende Threads erfahren einen Geschwindigkeitsschub mit solchen Prozessor "Monstern" wie Bulldozer oder Sandy-Bridge. Vielleicht gibt es jedoch zukünftig immer mehr Software auf den heimischen PC, die nur sehr wenige Threads benötigen (siehe z.B. IPhone 1 das nur einen User-Thread ausführen kann). Vielleicht sieht die Zukunft auch so aus, das alles nur noch extern auf Servern berechnet wird und man Zuhause nur noch ein "Anzeigegerät" ("dummen" Terminal) stehen hat.
Aus heutiger Sicht sehe ich es jedoch so, dass der Zambezi mit seiner AMD-Bulldozer Architektur das System ist, was meinen Intel Q6600 ersetzen wird, da er aus meiner Sicht unter den heutigen Ansprüchen durchdachter ist. Klar brennt es dabei einen eingefleischten Bastler wie mich unter den Nägeln und man möchte ein System so früh wie Möglich neu zusammenstellen. Aber auch halt die Kosten und den Nutzen sollte man dabei nie außer Acht lassen. Klar bekommt man heute schon Systeme die schneller als der Q6600 sind und wenn man sich heute einen Prozessor kauft gibt es Morgen schon einen schnelleren. Ich hoffe das der Zambezi noch im Juni kommen wird, jedoch kann ich auch noch mit einem späteren Release leben. Man kann niemals über einen längeren Zeitraum das Beste haben, sondern es kommt immer einer mit einem noch besseren System daher. Der Zeitpunkt wann man sich entscheidet und wie man sich entscheidet ist der wichtige.
Ich habe mich dazu entschieden, das ich dies Jahr meinen Rechner mit AMD-Zambezi aufrüsten werde und da bin ich voll noch im Zeitraum, selbst wenn sich der Release-Termin noch verschieben sollte. Wobei dies aus meiner Sicht noch nicht einmal so klar ist, da bei den ganzen "Gerüchten" zur Verschiebung auch immer von anderen Bezeichnungen für die Prozessoren gesprochen werden, als die die ursprünglich für den Release im Juni genannt waren.
Es bleibt daher nur abzuwarten was kommt und für den einen oder anderen auch wann er kommt. Eine Entscheidung wird jeder treffen müssen. Bleibe ich bei meinem System was ich habe, hol ich mir ein Intel oder AMD Prozessor und so weiter. Keiner wird dabei die falsche Entscheidung treffen, außer er lässt sich die Entscheidung von anderen abnehmen. Jeder entscheidet sich aus dem Moment unter bestimmten Voraussetzungen heraus. Daher ist es erst einmal zum Glück egal, da es eine Kongruenz gibt, ob man sich für Intel oder AMD entscheidet. Es kommt nur darauf an, welcher der Richtige Prozessor für einen selbst ist und da zählt nicht immer die reine Marketing oder in einem Synthetischen Benchmark errechnete Performance, sondern auch immer der Preis den man ausgeben möchte und wie viel Performance man bei der täglichen Nutzung unter seinen Anwendungen erreichen kann.
Also warten wir einfach ab, welche neuen Gerüchte bis zum Offiziellen Statement zum Release von AMD noch erscheinen und wann Release-Termin nun endlich sein wird.

Gruß
Napo
 
AW: Bulldozer zu spät? Gerüchte mehren sich

Ein sehr schöner Text, würdest du ihn in ein paar Abschnitte gliedern tun sich die anderen User bestimmt nicht so schwer beim Lesen.

Vielleicht sieht die Zukunft auch so aus, das alles nur noch extern auf Servern berechnet wird und man Zuhause nur noch ein "Anzeigegerät" ("dummen" Terminal) stehen hat.

Hier sprichst du übrigens von der allseits erwähnten "Cloud" falls dir das noch kein Begriff ist.

Ich sehe bei deinen Schlussfolgerungen 3 Probleme:
1) Beim Multirodesign konnte Intel keine extremen Leistungserfolge durch Hyperthreading erringen, teilweise arbeitenen Anwendungen oder Spiele sogar langsamer damit.
2) Die Pipeline ist wie gesagt beim Bulldozer länger geworden, müssten da nicht Staus entstehen wenn bei jeder Berechnung die FPU benötigt wird. Sie dürfte doch am Ende den Flaschenhals darstellen, also im Ernstfall.
3) Bei den Fertigungsgrößen ist AMD noch etwas im Hintertrefffen. Intel hat vor schon 2011/2012 auf 22nm umzustellen und dabei das TriGate zu nutzen. Es gibt also auch noch andere Wege um Stromsparende Leistung zu erbringen. AMD könnte sich hier mit Bulldozer genauso verrennen wenn nicht exellente Werte vorliegen. Und aktuelle Leaks zeigen eher das Gegenteil. Der Bulldozer soll teilweise wieder mit einer recht hohen Spannung laufen, was meiner Meinung nach auch wieder auf einen höheren Verbrauch schließen lässt. Ich glaueb Intel wird sparsamer als AMD bleiben.
 
AW: Bulldozer zu spät? Gerüchte mehren sich

Und SMT ist abhängig von der Auslastung der physikalischen Kerne. Laufen die komplett auf Maximum, ist nichts mehr frei für SMT.

Eigentlich ist es genau anders herum. Deswegen schneiden SMT-fähige Prozessoren in synthetischen Benchmarks auch so viel besser ab als vergleichbare Modelle ohne SMT. Ist die Auslastung geringer wie in Spielen zB. ist die Mehrleistung nur noch messbar, aber nicht unbedingt spürbar.
 
AW: Bulldozer zu spät? Gerüchte mehren sich

MÖB.

Nein Quanti hat schon recht. Es kommt halt drauf an wie gut das Programm programmiert ist, und wie unabhängig die einzelnen Threads voneinander sind.

Wenn du ein Hochgradig optimiertes Programm hast, in dem immer alle Daten zum rechnen vorhanden sein, bringt dir SMT genau 0. Du hast ja schon alles mit Aufgaben ausgelastet. Mehr als 100% REALE! Auslastung (nicht das was man im Taskmanager angezeigt bekommt..) geht einfach nicht.

Hast du jetzt dagegen ein Programm, das zwar absolut unabhängige Threads aber eben nicht immer den einzelnen Thread ausführen kann, weil es irgendwelche Probleme gibt mit anderen Threads, dann bringt dir SMT einen Leistungsvorteil. Du kannst ja jetzt die Recheneinheiten mit etwas anderem füttern, während du warten musst. Das steigert wieder die Auslastung.

Daher ist es auch nicht möglich zu sagen, was SMT bringt. Angefangen von 0% bis 100% ist theoretisch alles möglich.
 
AW: Bulldozer zu spät? Gerüchte mehren sich

MÖB.

Nein Quanti hat schon recht. Es kommt halt drauf an wie gut das Programm programmiert ist, und wie unabhängig die einzelnen Threads voneinander sind.

Wenn du ein Hochgradig optimiertes Programm hast, in dem immer alle Daten zum rechnen vorhanden sein, bringt dir SMT genau 0. Du hast ja schon alles mit Aufgaben ausgelastet. Mehr als 100% REALE! Auslastung (nicht das was man im Taskmanager angezeigt bekommt..) geht einfach nicht.

Hast du jetzt dagegen ein Programm, das zwar absolut unabhängige Threads aber eben nicht immer den einzelnen Thread ausführen kann, weil es irgendwelche Probleme gibt mit anderen Threads, dann bringt dir SMT einen Leistungsvorteil. Du kannst ja jetzt die Recheneinheiten mit etwas anderem füttern, während du warten musst. Das steigert wieder die Auslastung.

Daher ist es auch nicht möglich zu sagen, was SMT bringt. Angefangen von 0% bis 100% ist theoretisch alles möglich.

Ich weiß auch, dass SMT nur Lücken füllen soll, aber die sind doch in der Realität eher die Regel als die Ausnahme. Sobald Daten zB aus dem Ram oder von Platte gelesen werden müssen, eine Sprungvorhersage falsch spekuliert wurde oder auf ein anderes Ergebnis gewartet werden muss sind die da. 100% reale Auslastung über alle Kerne und längere Zeit kriegt man doch eh nur unter Laborbedingungen hin.
 
AW: Bulldozer zu spät? Gerüchte mehren sich

Kommt drauf an, wie stark man sich mit der Optimierung beschäftigt. Gerade bei Anwendungen, bei der es absolut auf das letzte Quäntchen Performance ankommt, wird auch mit Asembler gearbeitet, und da kann man die Sachen dann schon so hin drehen, das man eine extrem hohe Auslastung erreicht.

SMT macht halt die Arbeit für 0815 Anwender/Programmierer deutlich einfacher. Sowohl am oberen als auch am unteren Ende vom Leistungsspektrum das Anwendungen benötigen hat es aber doch eher einen kleineren Einfluss.

Wie gesagt kommt halt immer auf die Software drauf an, was er bringt.
 
AW: Bulldozer zu spät? Gerüchte mehren sich

Ich bin wirklich gespannt welche Architektur sich behaupten wird. CMT oder SMT...

Das ist etwas Grundverschiedenes und muss sich nicht ausschließen; prinzipiell wäre es ohne Weiteres möglich einen Bulldozer mit HT zu bauen, der pro Modul vier Threads abarbeiten kann...
 
Zuletzt bearbeitet:
AW: Bulldozer zu spät? Gerüchte mehren sich

Eigentlich ist es genau anders herum. Deswegen schneiden SMT-fähige Prozessoren in synthetischen Benchmarks auch so viel besser ab als vergleichbare Modelle ohne SMT. Ist die Auslastung geringer wie in Spielen zB. ist die Mehrleistung nur noch messbar, aber nicht unbedingt spürbar.

Dann lass mal Core Damage laufen und schaue, wie ausgelastet die virtuellen Cores sind, die liegen tot in der Ecke, weil der physikalische Kern einfach nichts über hat zum Abzweigen.

Das Dilemma ist, dass praktisch alle Programme eben die CPU nicht voll auslasten, gerade Benchmarks machen das nicht, daher kann SMT hier eine Menge reißen.
Es gibt CPU Benchmarks, die die CPU gerade mal zu 40% auslasten, logisch, dass dann noch Luft für SMT da ist.
 
AW: Bulldozer zu spät? Gerüchte mehren sich

Dann lass mal Core Damage laufen und schaue, wie ausgelastet die virtuellen Cores sind, die liegen tot in der Ecke, weil der physikalische Kern einfach nichts über hat zum Abzweigen.

Das Dilemma ist, dass praktisch alle Programme eben die CPU nicht voll auslasten, gerade Benchmarks machen das nicht, daher kann SMT hier eine Menge reißen.
Es gibt CPU Benchmarks, die die CPU gerade mal zu 40% auslasten, logisch, dass dann noch Luft für SMT da ist.

Dann dürfte das bei FPU lastigen Sachen doch nicht anders sein beim Bulli oder?
 
Superwip schrieb:
Das ist etwas Grundverschiedenes und muss sich nicht ausschließen; prinzipiell wäre es ohne Weiteresmöglich einen Bulldozer mit HT zu bauen, der pro Modul vier Threads abarbeiten kann...

Dennoch hat AMD es scheinbar als nicht sinnvoll erachtet und es nicht nachgemacht.
 
AW: Bulldozer zu spät? Gerüchte mehren sich

Der Bulldozer zieht ja nicht nur den Vorteil aus seiner flexiblen Belastbarjeit der Architektur, sondern auch davon, dass er eben, wenn alle 8 Threads voll laufen, theoretisch mehr leisten kann als 4 physikalische und 4 virtuelle Kerne.
Aber das muss sich halt zeigen, was das jetzt vereinzelnd bringt. Ob das Game von den Modulen profitiert oder eher die Multi Core Anwendungen.
Mein Tipp ist halt, dass Bulldozer eben beides recht gut hinbekommt.
 
Zurück