Fotos eines angeblichen Bulldozer 'Version 2' enthüllt - Zwischenstufe zu Piledriver?

AW: Fotos eines angeblichen Bulldozer 'Version 2' enthüllt - Zwischenstufe zu Piledriver?

Keine Ahnung was das ist, aber ich hoffe das dann dieser Decoder was bringen wird. Es muss wieder Schwung in den CPU Markt rein.
Kleines Beispiel:

Du hast eine Firma und musst Aufträge fertig stellen. Jetzt brauchst du eine Struktur, um einen effizienten Arbeitsablauf zu haben.
Du brauchst einen Manager der Aufgaben vergibt und darauf achtet das jeder sein Zeug bekommt, du brauchst genug Arbeiter, welche die Aufgaben bearbeiten usw.
Was bringen dir 20 Manager, wenn du nur 5 Arbeiter hast? Die Arbeiter kommen mit der Arbeit nicht hinterher und somit musst du warten. Was bringen dir 100 Arbeiter, wenn du nur 1 Manager hast? Der ist gnadenlos überfordert und somit musst du wieder warten.
Ziel einer Architektur ist es eine Balance zu finden, die am besten abgestimmt ist.

Ein Decoder übersetzt die X86-Instruktionen in kleine Micro-Befehle, die von den Integer-Kernen dann abgearbeitet werden.
Ein Integer-Kern von einem Phenom hat z.B. 3 Ausführungseinheiten und einen Decoder der 3 Befehle decodieren kann.
Beim Bulldozer ist ein Integer-Kern leicht abgespeckt, er hat nur 2 Ausführungseinheiten und wie wir wissen hat ein Bulldozer Modul 2 Integer-Kerne. Beim Bulldozer teilen sich beide Kerne einen Decoder, der allerdings 4 Befehle auf einmal decodieren kann.
Waren es damals 3 Befehle für 3 Ausführungseinheiten sind es jetzt 4 Befehle für 2x2 Ausführungseinheiten.
Das Problem ist wohl, wenn das ganze nicht genau abgestimmt ist, die Latenzen zu hoch sind, dass sich das ganze eher behindert, als reibungslos zu funktionieren und man möglicherweise die Integer-Kerne nicht mit genug Befehlen füttern kann.
Deswegen wird wohl ab Steamroller jeder Integer-Kern seinen eigenen Decoder spendiert bekommen.
Damit sollte die Versorgung reibungsloser funktionieren.
 
AW: Fotos eines angeblichen Bulldozer 'Version 2' enthüllt - Zwischenstufe zu Piledriver?

Besagte "Runderneuerung der Modellpalette mit höheren Taktfrequenzen" wären ein paar Speedbumps von Zambezi ... und die stehen auf keiner mir bekannten Roadmap.

Ich kenn keine Roadmaps, ich kann nur sagen, was ich so alles als nicht-überraschend empfinden würde ;)

Ich sagte doch bereits, C0 ist Piledriver/Vishera ... der News-Schreiber ist kein CPU-Fachredakteur.

"C0 IST Vishera" oder "Vishera kommt als C0"?

Ersteres würde suggerieren, dass Vishera prozesstechnisch als minimale Weiterentwicklung von Zambezi umgesetzt wird (sehr ähnlicher Grundaufbau, die leicht veränderten Masken gehen ohne Respin zwecks Fehlerkorrektur/Optimierung in Serie), letzteres dass Vishera als eigenständig konzipiertes Layout sorgfältig durchgestestet wurde und erst in der min. dritten Optimierungsstufe auf den Markt kommt.


Von den unterschiedlichen Befehlssätzen hat der Bulldozer mal mehr, mal weniger Durchsatz als der Phenom.
Und Beta Bulldozer hat noch viele weitere Krankheiten.

Mit Ausnahme des eigentlichen x86-64 Kernbefehlssatzes, hat Bulldozer entweder weniger Durchsatz oder Phenom schlichtweg gar keinen. Die genannten Befehlssatzerweiterungen beziehen sich durch die Bank auf die SIMD-Einheiten und von denen hat Bulldozer spürbar weniger - die aber eben einige Befehle beherrschen, die der Phenom gar nicht konnte.


Waren es damals 3 Befehle für 3 Ausführungseinheiten sind es jetzt 4 Befehle für 2x2 Ausführungseinheiten.
Das Problem ist wohl, wenn das ganze nicht genau abgestimmt ist, die Latenzen zu hoch sind, dass sich das ganze eher behindert, als reibungslos zu funktionieren und man möglicherweise die Integer-Kerne nicht mit genug Befehlen füttern kann.

"Möglicherweise" ist gut. Mal so zum Vergleich: Intel hat seit dem Core2 einen vierfachen Decoder (der afaik in einigen Fällen sogar 6 Befehle ausspucken kann) für drei Ausführungseinheiten und kombiniert den mit stetig weiterentwickelten Zwischenspeichern, die es erlauben, erneut genutzte Befehle zusätzlich und ohne Decodierung wieder in die Pipeline zu schmeißen. Es ist nunmal so, dass auch primitive Load/Store&Co-Befehle umgesetzt werden müssen (für die Intel drei weitere Einheiten pro Kern und AMD 4 weitere pro Modul vorsieht) und iirc auch so, dass komplexe Befehle mal mehr als einen Takt benötigen, bis sie bearbeitet sind. Dummerweise sind Decoder halt nicht so ganz die einfachste Einheit - weswegen AMD ja mit den Modulen soviel Platz einspart.
 
AW: Fotos eines angeblichen Bulldozer 'Version 2' enthüllt - Zwischenstufe zu Piledriver?

"C0 IST Vishera" oder "Vishera kommt als C0"?

[...]

Mit Ausnahme des eigentlichen x86-64 Kernbefehlssatzes, hat Bulldozer entweder weniger Durchsatz oder Phenom schlichtweg gar keinen. Die genannten Befehlssatzerweiterungen beziehen sich durch die Bank auf die SIMD-Einheiten und von denen hat Bulldozer spürbar weniger - die aber eben einige Befehle beherrschen, die der Phenom gar nicht konnte.


"Möglicherweise" ist gut. Mal so zum Vergleich: Intel hat seit dem Core2 einen vierfachen Decoder (der afaik in einigen Fällen sogar 6 Befehle ausspucken kann) für drei Ausführungseinheiten und kombiniert den mit stetig weiterentwickelten Zwischenspeichern, die es erlauben, erneut genutzte Befehle zusätzlich und ohne Decodierung wieder in die Pipeline zu schmeißen. Es ist nunmal so, dass auch primitive Load/Store&Co-Befehle umgesetzt werden müssen (für die Intel drei weitere Einheiten pro Kern und AMD 4 weitere pro Modul vorsieht) und iirc auch so, dass komplexe Befehle mal mehr als einen Takt benötigen, bis sie bearbeitet sind. Dummerweise sind Decoder halt nicht so ganz die einfachste Einheit - weswegen AMD ja mit den Modulen soviel Platz einspart.

1. C0 ist Vishera.
2. AMD FX - Top oder Flop? (Teil 1) - Prozessoren - Planet 3DNow! Forum
Hilf mir mal auf Sprünge, ist der Test nicht für das ganze Design?
3. AMD betont aber gerne, dass es zu keinen Engpässen kommt :P
 
Zuletzt bearbeitet:
Zurück