ruyven_macaran
Trockeneisprofi (m/w)
Woah, 16 KERNE !!!
Ich hatte es noch im Hinterkopf, dass AMD bei der schrittweisen Kern-Skalierung in Zukunft
besser wegzukommen schien, aber derartig haben wohl nicht mal die kühnsten AMD-Fanboys vermutet.
Intel - zieh' dich warm an ^^ ...
Bin da irgendwie n bissl misstrauisch - Vervierfachung innerhalb von 24 Monaten?
AMD aktuell keine Reserven in Sachen Verlustleistung, viel Platz aufm Substrat ist auch nicht und die hohen Produktionskosten für große DIEs sind ein nicht unwichtiger Faktor.
Auf der Desktoproadmap stand zudem für 2011 die erste 32nm Generation - vielleicht kann Globalfoundries n bissl zulegen, aber ich glaube nicht, dass sie Moores Law derart überbieten können und bis dahin die vierfache Anzahl von Transistoren zur Verfügung stellen können. (und eine Gleichziehen mit Intel auf 4-fach skalare Architektur steht eigentlich auch noch aus)
Erst recht nicht zu den Produktionskosten und innerhalb der heutigen Verbrauchsspezifikationen.
Bleiben aus meiner Sicht nur zwei Möglichkeiten:
- vollmundige Pläne, die man aber nicht wird halten können
- AMD hat ne neue, deutlich einfachere Architektur in Planung.
Gerade für Server und ihre typischerweise stark multithread-optimierte Software könnte es durchaus Sinn machen, z.B. auf ein 2-fach skalares Design zurückzuwechseln und dann mit einer nur wenig gestiegenden Zahl von Recheneinheiten deutlich mehr Kerne anbieten zu können, die sich effektiver auslasten können.
Aber AMD hat eigentlich nicht die Reserven, um eine getrennte Serverarchitektur zu entwickeln...
Intel setzt ja zurzeit sehr auf "gefälschte Kerne". Auch beim Nehalem EX (soweit ich weiß).
Ich hab mal so eine allg. Frage: Was sind denn jetzt besser echte oder "gefälschte Kerne"?
Hängt von der Anwendung, der Architektur und der Gesamtzahl der Kerne ab. Wenn deine Software die Pipelines oft warten lässt, du aber noch genug weitere Threads hast, die unabhängig davon abgearbeitet werden können, dann bringt dir SMT bei sehr geringem Transistoraufwand sehr viel Leistung. (afaik wurden auf nem P4 schon über 40% gemessen, wenn man zwei Single-Thread-Anwendungen mit z.B. vielen Speicherzugriffen verwendet hat. In-Orderarchitekturen wie Atom oder UltraSparc sollten noch mehr profitieren können).
Wenn die Software gut optimiert ist und die Recheneinheiten selbst optimal auslastest, dann kann SMT auch keine Aufgaben anderer Threads mehr zwischenschieben und bringt dementsprechend gar nichts, wogegen ein weiterer Kern (der natürlich ungleich mehr Transistoren erfordert) immer zusätzlich nutzbare Leistung anbieten kann.