AMD Kaveri: Erste Leistungswerte der Steamroller-Architektur aufgetaucht

Es vergleicht doch auch niemand nen Twingo mit einem 911

Es nennt auch niemand einen Golf GTI "das schnellste Auto", weil diverse Supersportwagen ja aufgrund ihres Preise "nicht zählen".
Und damit jetzt bitte mal langsam zurück zum Thema CPUs und weg vom Thema "ich mag die Diskussionskultur meines Gegenübers nicht". Für letzteres wären PNs wohl das bessere Medium ;)
 
Aber da es nur eine der was-soll-denn-der-scheiß-Integer-Pipes ist, sollte das keine großen Auswirkungen auf die reale Leistung haben.
Wie schon gesagt, die Performance in richtigen Anwendungen ist sowieso nochmal was anderes als solche reinen Durchsatztests. Dennoch, auch gängige SSE oder AVX Instruktionen für Integer oder FP laufen teilweise über diese MMX Pipes. Man denke nur an logische Verknüpfungen wie ANDPS/ANDPD oder ORPS/ORPD. Also man sollte nicht glauben, die MMX Pipes kommen nur zum Einsatz, wenn man die AMD spezifische Erweiterung für Integer XOP nutzt.

Im Moment ist das aber sowieso noch alles etwas unklar. Die Infos zur Änderung der FPU galten scheinbar für den ursprünglichen Steamroller. Und das ist schon ein Weilchen her. Inwiefern sich Steamroller B davon unterscheidet, bleibt abzuwarten.


und die theoretische (!) FP-Rohleistung von nem FX-83xx ist pro Takt immer noch nicht höher als die eines Phenom II X4.
Doch, sie ist doppelt so hoch. Allerdings braucht's dafür halt auch FMA Unterstützung. Das bieten bisher nur sehr wenige Anwendungen. C-Ray ist zB eines, wo der FX8 selbst gegenüber einem X6 etwa doppelt so schnell ist (pro Takt natürlich etwas weniger). Ob sich AMD einen Gefallen tut, eine FPU Pipe wegfallen zu lassen, kann man im Moment schlecht beurteilen. Wenn es der Effizienz hilft, warum nicht. Man kann sicherlich problemlos auf ein paar Prozent Performance verzichten, wenn der Energiebedarf dafür umso deutlicher sinkt. K10 hatte auch nur 3 FPU Pipes. Allerdings für lediglich einen Thread und nicht für zwei. Entscheidender als die reine Pipeanzahl sehe ich im Moment aber zwei andere Sachen. Erstens, AMD wird die FPU in Zukunft verbreitern. Spätestens mit Excavator sollten die µOps mit vollen 256-bit laufen. Dann werden natürlich auch mehr Rechenkapazitäten benötigt, was den theoretischen Durchsatz auch wieder deutlich erhöht. Im Moment werden die 256-bit x86 Instruktionen jedenfalls noch in zwei 128-bit µOps aufgeteilt. Halt noch ein Erbe von SSE5, was auf 128-bit ausgelegt war. Und zweitens, das Zugpferd für hohen FP Durchsatz heisst sowieso iGPU und nicht CPU. Hier muss AMD die richtige Infrastruktur hard- und softwareseitig bereitstellen, Stichwort OpenCL, HSAIL, hUMA, hQ usw.
 
Zurück