Jeder Prozessor besteht aus mehreren sogenannten Modulen. Ein Modul enthält jeweils – neben Cache und allem was sonst zu einem typischen Prozessorkern gehört –
zwei Integer-Cluster, aber nur eine Gleitkomma-Einheit. Letztere kann entweder einen Thread mit 256-Bit-Befehlen oder zwei Threads mit 128-Bit-Befehlen abarbeiten. Auf den Integer-Clustern kann jeweils nur ein Thread ausgeführt werden. Alle anderen Einheiten des Prozessors wie etwa Fetch und Decode teilen sich alle Ausführungseinheiten. AMD nennt diesen Ansatz
Core-Multithreading. Bei dieser Methode verfolgt man einen ähnlichen Ansatz wie mit
Simultaneous Multithreading, geht jedoch einen Schritt weiter. Während man bei Simultaneous Multithreading im Wesentlichen nur die Register verdoppelt, um so zwei Threads auf einem Kern auszuführen, werden bei der Bulldozer-Architektur mehrere Integer-Cluster in einem Modul verbaut.
Link