Heißt:
Bei SMT wird der eigentliche Kern vor allem um ein paar Register erweitert, was es ermöglicht Prozesse schon vorzubereiten während ein anderer Prozess noch in der Pipeline ist.
Bei AMD hingegen teilen sich zwei Integer Kerne eine FPU sowie auch einen Decoder.
Was ist nun großer? Ein paar Register oder ein Integer Kern?
Jedenfalls wenn man grob gesagt von dem Standpunkt ausgeht, das ein Kern aus Integer Kern, FPU und Decoder besteht.
Nach allem was ich bisher mitbekommen habe hat CMT vor allem den Vorteil, das man den DIE kleiner macht als wenn es zwei eigentlich Kerne wären(wie noch beim Phenom) und dabei aber ähnliche Leistung erreicht. Klingt eben zunächst etwas blöd weil Bulldozer/Vishera von der Die-Size dennoch ziemlich riesig sind, gemessen an der Leistung gegenüber den winzigen Die's der Konkurrenz.
Bei Intel bringt SMT vor allem dann etwas, wenn die Software schlecht optimiert ist. Heißt wenn ein Prozess einen Kern voll auslastet bringt SMT quasi gar nichts. Kommt SMT voll zum Zuge können es gern mal 20-30% Mehrleistung sein. Meiner Ansicht nach ziemlich viel, dafür das man den Kern vor allem um ein paar Register erweitert hat.
Ohne mich jetzt direkt auf Dich zu beziehen, Dir zu widersprechn oder zuzustimmen, nehm ich Deinen Beitrag einfach mal aus Anlaß, meine bescheidene Sicht auf die Diskussion "was ist besser" zu werfen
Ich finde, spätestens bei diesem Test wird deutlich, das man viel zu fahrlässig das Worter "Kerne" nutzt:
da wird der amd 6 "kerner" mit nur 3 kernen seine schwäche zeigen
Intel setzt auf 4 vollwertige Kerne und sorgt mit SMT für eine weiterhin vollständige Auslastung, auch wenn ein Thread mal nicht alle Integereinheiten eines Kernes nutzt. Darum entspricht die durch den virtuelle Kern, der durch SMT verfügbar wird, bereitgestellte Leistung nicht zu 100% der des Host-Kerns. Der 4-Kerner ist zwar in der Lage, 8-Threads gleichzeitig abzuarbeiten, aber eigentlich sind es "nur" 4 Threads + maximal 4 weitere Threads die "nur" die gerade nicht genutzten Integereinheiten nutzen können.
AMD setzt ebenfalls auf 4 vollwertige Kerne, nennt diese aber Module, weil sie 2 Integercluster pro Modul bieten. Das heißt, solange ein Thread nur auf Integer-Rechenleistung setzt, können 8 Threads vollwertig nebeneinader und gleichzeitg abgearbeitet werden. Sobald es aber um Gleitkommarechnung/FPU/Decoder oder anderes geht, können nur 4 Threads bearbeitet werden.
Wirklich vergleichbar wäre es also nur dann, wenn man bei Intel SMT abschaltet und bei AMD den zweiten Integercluster in jedem Modul. CMT und SMT sind dann quasi "Bonus", ein "nice to have" und beides hat seine Vor- aber auch seine Nachteile. So garantiert AMDs Herangehensweise nahezu immer 8 Threads (es sei denn, es geht um FPU-Berechnung etc), wobei Rechenleistung ungenutzt bleiben kann, während Intel dafür sorgt, das die vorhandenen Integereinheiten immer möglichst vollständig ausgelastet sind (was eben zu einer hohen/höheren IPC führt), im Idealfall teilen sich 2 Threads die Integereinheiten eines Kerns zu je 50%, im schlechtesten Fall nutzt ein Thread einen Kern zu 100% aus, dann können halt nur 4 Threads abgearbeitet werden. Meist laufen 4 Threads mit 70 bis 80% Prozent (weil sie einfach nicht mehr Integerleistung brauchen) und 4 weitere Threads mit den restlichen 20 bis 30% der ungenutzten Integerlesitung, was eben einem Leistungsplus von 20-30% mit SMT gegenüber ohne SMT entspricht.
Rein theoretisch können bei AMD wie gesagt Integereinheiten ungenutzt bleiben, obwohl 8 Threads bearbeitet werden. Würde AMD hier entweder den Modulen (was zu 8+4 Threads führen würde) oder aber den Integereinheiten selbst (was zu 8+8 Threads führen würde) die Fähigkeit zu SMT zugestehen, würde wohl auch bei AMD die IPC deutlich steigen, allerdings sind das Front- und Backend eines Moduls (also Gleitkommarechnung/FPU/Decoder etc) ja schon jetzt ab und an zu schwach/zu klein/zu (unter)dimensioniert, um 2 Intergercluster immer ausreichend mit Daten zu füttern.
8+4 Threads dürfte außerdem schwerlich umsetzbar sein, denn dann müßte man ungenutzte Integereinheiten beider Cluster eines Moduls zusammenfassen können, was wohl nicht geht, es würde also auf 8+8Threads hinauslaufen und ich frage mich, warum AMD diesen Weg zur Steigerung der IPC noch nicht gewählt hat.
Allerdings erklärt das natürlich auch, warum Intel bei Spielen so gut abschneidet: Noch immer sind die wenigstens Spiele wirklich Multithread-optimiert.
Wenn ein Spiel als beispielsweise nur 2 Threads bereitstellt, werden bei Intel 2 Kerne voll ausgelastet, die anderen beiden abgeschaltet und die genutzten übertaktet.
Bei AMD hingegen ergeben sich jetzt schon Entscheidungsschwierigkeiten: Packt man jeden Thread auf ein Modul? Danm hätte jeder Thread zumindest auch die volle Leistung der Gleitkommarechnung/FPU/Decoder etc. Allerdings lägen dann auch in beiden Modulen je ein Integercluster brach, das Modul "langweilt" sich . Packt man beide Threads hingegen in ein Modul, wird dieser voll ausgelastet, man könnte die anderen 3 Module zum Stromsparen abschalten. Allerdings müßten sich nun die beiden Threads Gleitkommarechnung/FPU/Decoder etc teilen, die Leistung bricht in dem Fall ein.
Darum langweilen sich AMD-CPUs im Prinzip beim Spielen und können trotzdem Intel-CPU nicht das Wasser reichen.
Erst wenn es um Arbeiten geht, also Komprimieren oder Konvertieren von Daten etcpp, zeigt sich wie in diesem Test das volle Potential der AMD-CPUs und da muß man bei Intel halt weit tiefer in die Tasche greifen, um im Professionellen Bereich die gleiche Leistung zu bekommen.
Darum bin ich dafür, das man mehr auch die Bezeichnung achtet.
Intel: 4K/4+4T
AMD: 4M/8T
Gerade ein Satz wie dieser
da wird der amd 6 "kerner" mit nur 3 kernen seine schwäche zeigen
beweißt das

Und spätestens nun wird klar, das man Birnen und Äpfel vergleicht.
Wie ich bereits schrieb, wollte man wirklich die Leistungsfähigkeit bewerten, müßte man SMT bei Intel, und den jeweils zweiten Integercluster bei AMD deaktivieren, am besten sogar nur jeweils 1 Kern bzw 1 Modul nutzen, bei gleichem Takt (1 oder 2GHz) und dann gibt man die IPC allein oder pro Watt oder pro Euro an. Die Ergebnisse wäre aber extrem langweilig.
