Ge0rgy schrieb:
In dem Fall stünden 4 SB-Cores mit HT gegen einen 4-Modul Zambezi. 8 Threads gegen 8 Threads. Hier kann das clusterdesign dann beweisen dass es besser skaliert als SMT.
Die Meisten leute verstehen den unterschied zwischen CMT und SMT ohnehin nicht, die gucken nur wie viele CPU-Diagramme ihnen der Taskmanager unter Windows anzeigt....
Diese Argumention, also gleiche Threadanzahl bzw. 4SB-Cores mit HT vs. 4 BD-Module kann man aber ausschließtlich nur zum Vergleich von SMT vs CMT bzw. HT vs. Modulkonzept heranziehen. Dies ist aus technischer Sicht zwar nicht unintereressant, aber genau so wenig geeigent, um zwei architektonisch sich stark unterscheidende Designs, wie SB und BD zu vergleichen.
Zumindest in diesem Forum sind wir uns wohl einigermaßen einig, dass ein Vergleich von SB-Kernen mit BD-Kernen (also ein Modul = 2 Kerne) auf technischer Ebene nicht zielführend ist. So ist es in geringern Maße auch schon heute bei z.B. Thuban vs. Nehalem.
Aus Kundensicht bleibt als Vergleichsbasis nur der Anschaffungspreis und Leistung/Watt übrig, wobei dies je nach Workload stark variieren kann.
Kerne, Module, Threads -
keines davon eigent sich (mehr) als Vergleichsbasis
Auf technischer Ebene ist zwar auch der schon genannte CMT vs. SMT Vergleich nicht uninteressant, aber auch nur in geringen Maße zielführend, da z.B. ein SB-QC (inkl. GPU!) voraussichtlich deutlich kleiner sein wird, als ein Zambezi/Valencia.
Deshalb
muss für einen technischen Vergleich auch die benötigte DIE-Fläche berücksichtigt werden, was dann auf folgendes hinausläuft:
Leistung pro DIE-Fläche
Leistung pro Watt
Leistung pro DIE-Fläche und Watt
(jeweils abhängig vom Workload)
Diese Vergleichsmöglichkeiten scheinen noch sinnvoll. Ein Vergleich bei gleicher Threadanzahl ist es mMn im Allgemeinen
nicht!
Was noch interessant wäre ist, dass man nicht die DIE-Fläche als Vergleichsfaktor heranzieht, sondern die Kosten für die benötigte DIE-Fläche, was aber für uns nicht möglich sein wird.
LG
Zusatz um zu verdeutlichen, warum der Vergleich über die Threadanzahl sich beißt:
Vergleicht man einen i7-SB-QC mit also 8 Threads, mit einem 4-Modul-Zambezi mit ebenfalls 8 Threads, siehts es vermutlich für den Zambezi in hoch parallelisierter Software ziemlich gut aus. Dabei ignoriert man aber, wie gesagt, dass dieser Zambezi (wahrscheinlich) ein deutlich größeres DIE hat.
Dies Sache kann man auch umdrehen:
Nun nehme ich einfach einen i5-SB-QC, welcher jetzt nur noch 4 Threads hat. D.h. dieser müsste gegen einen 2-Modul-Zambezi antreten, welcher ebenfalls 4 Threads gleichezeitig abarbeiten kann. Nun hat (angenommen) der Zambezi das kleinere DIE. Vermutlich wird er aber in diesem Szenario den kürzeren ziehen.
Ich hoffe, es ist nun vollständig klar, weshalb der Vergleich über die Threadanzahl nicht funktioniert!
LG