AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

plusminus · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

Cross-Flow schrieb:
Klar, wenn man 24/7 Furmark und Risen spielt ist das schon ********. Aber wenn man das tut hat man eh ganz anderen Probleme.

Jede Hardware hat ihren Einsatzzweck. Mit meinem M3 fahre ich auch nicht einkaufen, dafür habe ich nen 316i.

Wie gesagt Ausgabe 10/2015 ab Seite 10. 19 von 20 und da sind noch ein paar mit mehr als 300 Watt !? und welche die daran kratzen

Elkinator · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

genau auf den fokus servermarkt wurde Zen entwickelt.
der mobilemarkt ist für Zen am anfang total egal, weil man das mit den XV-APUs, also Carrizo + einer wahrscheinlich kommenden 14nm APU abdecken wird.
erst 2017 wird Excavator bei den APUs abgelöst werden.

Atent123 · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

plusminus schrieb:
Wie gesagt Ausgabe 10/2015 ab Seite 10. 19 von 20 und da sind noch ein paar mit mehr als 300 Watt !? und welche die daran kratzen

Wie gesagt Thomshardware.
Mit weitem abstand bestes Messverfahren getestet in vielen Spielen.
Tiefenanalyse der AMD Radeon R9 Fury X: Detaillierte Leistungsaufnahme & Pumpengeräusch - Leistungsaufnahme: Wir messen detailliert nach!

Cross-Flow · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

plusminus schrieb:
Wie gesagt Ausgabe 10/2015 ab Seite 10. 19 von 20 und da sind noch ein paar mit mehr als 300 Watt !? und welche die daran kratzen

Joa hab ich grade nachgelesen, und nu? Was ist an den 300 Watt denn so schlimm? Die Zahl 300? Ob die Fury X jetzt 306 Watt zieht oder die GTX 980 Ti in diesem Fall 273 Watt ist doch ( mir ) total egal. 20 - 30 Watt sehe ich jetzt nicht als den krassen Verbrauchsvorteil. Sicher RIsen ist mit 100 Watt differenz schon ne ecke größer aber das ist ja auch nen Sonderfall.

Pu244 · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

Cross-Flow schrieb:
#1
AMD ist bewusst das der Markt der High - End CPUs verlangt deutlich kleiner wird. Nur mit High - End CPUs verdienst du kein Geld. AMD Kopiert ( was in diesem Fall genau das richtige ist ) Intel bei deren Weg, ein Core für jeden Einsatzzweck ( von 5 Watt bis 130 Watt ). Schluss und Ende mit den ganzen Katzen und BD Cores, ZEN für alles. Somit endet auch das Sockelchaos und das spart undglaublich Geld für R&D.

Naja,
das gab es früher auch, um genau zu sein hat Intel erst 2008 mit dem Atom damit begonnen ein eigenes Süppchen zu kochen. Gut, AMD hat den So 754 einige Zeit noch für seine Semprons weiterverwendet. Von daher ist das eher ein zurück zu den Wurzeln.

Cross-Flow schrieb:
#2
Bei GCN haben sie es schon geschafft, vom kleinsten AM1 Core bis zur Fury können sie x-beliebig skalieren. Darauf sind andere neidisch

Und was daran kann Nvidia nicht? Abgesehen davon das ihre Tegras auf ARM Techik setzen können die genauso gut skalieren. Grakas sind schon seit ewigkeiten modular aufgebaut.

Cross-Flow schrieb:
Die Mannschaft von AMD ist jetzt gar nicht dumm, auch wenn es hier gern mal so hingestellt wird. Ganz im Gegenteil, AMD hat erstaunliche Dinge für die Zukunft geschafft welche wir momentan als selbstverständlich hin nehmen:

Das was du genannt hast ist nunmal eine Selbstverständlichkeit, wie sie sie schon Jahrzehnte gibt.

Cross-Flow schrieb:
Joa hab ich grade nachgelesen, und nu? Was ist an den 300 Watt denn so schlimm? Die Zahl 300? Ob die Fury X jetzt 306 Watt zieht oder die GTX 980 Ti in diesem Fall 273 Watt ist doch ( mir ) total egal. 20 - 30 Watt sehe ich jetzt nicht als den krassen Verbrauchsvorteil. Sicher RIsen ist mit 100 Watt differenz schon ne ecke größer aber das ist ja auch nen Sonderfall.

Wir reden hier von 380W im FurMark gegen 250W, das sind 130W oder 52% Unterschied! Zum Vergleich: die GTX 480 wurde damals verrissen weil sie 70W, bzw. 39% mehr als die HD 5870 gebraucht hat. Das ist mehr als nur eine Stufe die man das Netzteil stärker auslegen muß. Desweitern klebt dann ein zusätzlicher Wärmetauscher im Gehäuse (dafür ist die Karte recht leise und kühl). Von daher: wenn man damals die GTX 480 verissen hat, dann sollte man das nun auch mit der Fury X machen, zumal die 33% weniger Videospeicher als die Konkurrenz hat, statt wie die GTX 480 50% mehr und der Leistungvorsprung der Fury X ist im Vergleich zu dem was die GTX 480 damals aufgefahren hat eher gering..

VikingGe · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

Artikel schrieb:
Ab Haswell unterstützt Intel überdies FMA3, womit eine weitere Verdoppelung des Durchsatzes erreicht werden konnte.

Kann Piledriver auch (sogar das an sich sinnvollere FMA4, was Intel aber nicht hinbekommen hat und stattdessen mit dreimal so vielen verschiedenen Befehlen arbeitet).

Falls das mit dem neuen FPU-Layout stimmen sollte, wird Zen FMA möglicherweise nur noch über zwei µOps mit entsprechendem Rounding-Modus emulieren, was den maximal möglichen Durchsatz natürlich halbieren würde. Was schade wäre, denn vollwertige FMA-Pipelines, die eben sowohl multiplizieren als auch addieren können, sind flexibler und eben durchsatzstärker als solche, die nur eins von beidem beherrschen.

4x128 Bit-FMA wären allerdings tatsächlich besser als die 2x256 Bit-FMA von Intel, weil a) kaum einer AVX nutzt und b) der Schritt von 128 Bit auf 256 Bit auch nicht immer einfach ist, wenn die zu verarbeitenden Vektoren nur 128 Bit groß sind. Geht zwar meist irgendwie (arbeitet man eben zwei Vektoren in einem Schritt ab statt nur einen), ist aber fummelig.

Ich habe keine Quelle, habe es nur gehört von Opteron von Planet3DNow!, dass eine dritte Integer-Pipe im Schnitt nur 5% mehr IPC bringen soll.

Was natürlich aufs Problem ankommt. Wenn man irgendwelche Hashfunktionen berechnet, zieht ein Phenom mit 6x3 Integer-Pipelines auch schonmal an Haswell mit 4x4 vorbei.

Auf der anderen Seite habe ich auch Code hier, der auf Steamroller im Schnitt mehr als drei Befehle pro Takt schafft, weil eben nicht nur die ALUs zur Integer-Leistung beitragen, sondern a) Register-to-Register-Moves im Frontend eliminiert werden und keine ALU-Ressourcen mehr brauchen, b) die beiden Load/Store+AGU-Einheiten auch noch etwas Arbeit erledigen, nämlich eben bei Speicherzugriffen, und c) bis zu vier Befehle pro Takt durchs Frontend kommen statt nur drei.

Bulldozers Integer-Schwäche rührt mE aber auch eher von ewig langen L2-Latenzen und langen Branch Misprediction Penalties her.
Beispiel: Compiler. Wenn ich ein Programm mit clang compiliere, kommen auf dem Phenom in der Regel IPC-Werte von ca. 0.75 ±0.05 heraus, auf meinem Kaveri-Notebook lediglich ~0.6. Bei solchen Zahlen sollte klar sein, dass es wohl nicht die drei Integer-Einheiten sind, die dem Phenom da zum Sieg verhelfen.

Die L1-Caches gelten auch als sehr klein, bleiben aber unverändert.

Intel hat auch nur 32kB für zwei Threads. Solange der von einem schnellen L2 mit niedrigen Latenzen und hoher Bandbreite gefüttert wird, ist das kein großes Problem - Zitat Anandtech anno 2009: L2: It's the new L1 - BDs L2 ist latenzmäßig aber kaum besser als Intels L3, da fehlt quasi eine ganze Abstufung.

Obwohl Kern 7,8 und 9 theoretisch 2,8 Ghz schaffen würden kann man den Gesamtprozessor nur mit der Taktrate des schlechtesten Kerns, also Kern eins, mit 1,9 Ghz ausliefern.

Zumindest bei AMDs K10 hat jeder Kern separate VID- und FID-Tabellen, das ginge theoretisch also auch jetzt schon. Es wäre nur a) marketingtechnisch schwer zu vermitteln, warum man so ein Konzept wählt, und b) softwaretechnisch schwierig, weil ein Task-Scheduler die Geschwindigkeit jedes einzelnen Kerns kennen und SMT-Aware sein müsste.

100001 · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

PCGH-Redaktion schrieb:
32 KByte großen L1- und einen 512 KByte großen L2-Cache, vier Decoder sowie jeweils vier Integer-Pipelines,

Vier Pipelines bedeuten eine Verdoppelung gegenüber Bulldozer und Jaguar.

1) 32 KByte gibt es bei Carrizo

2) 512KByte pro Integer gibts auch bei (BD, PL, SteamR.)

3) bei SteamR. wurden diese von 4 (Bulldozer, piledriver) auf 3 beschnitten

4) falsch wie können 4 Integer Pipelines, ggn. deren 4 von BD, PL pro Integer eine verdopplung sein?

BTT:
Amd sollte CMT beibehalten und die FPU aufbohren,
CMT ist Super wird aber durch die FPU Limitiert

Elkinator · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

Amd sollte CMT beibehalten und die FPU aufbohren,
CMT ist Super wird aber durch die FPU Limitiert

leider drehen dann die "experten" in den foren wieder durch:\

CMT + SMT wäre toll!

DKK007 · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

VikingGe schrieb:
4x128 Bit-FMA wären allerdings tatsächlich besser als die 2x256 Bit-FMA von Intel, weil a) kaum einer AVX nutzt und b) der Schritt von 128 Bit auf 256 Bit auch nicht immer einfach ist, wenn die zu verarbeitenden Vektoren nur 128 Bit groß sind. Geht zwar meist irgendwie (arbeitet man eben zwei Vektoren in einem Schritt ab statt nur einen), ist aber fummelig.

Das muss dann möglichst einfach vom Compiler optimiert werden.

Auch wenn man viele unabhängige Werte addiert oder Multipliziert, kann ein Compiler daraus einfach Vektoren bilden und das ganze in 1-2 Schritten berechnen.

Elkinator schrieb:
leider drehen dann die "experten" in den foren wieder durch:\

CMT + SMT wäre toll!

CMT scheitert nicht nur an den FPUs, sondern vor allem am gemeinsamen Fetch/Decode und den hohen Cache Latenzen, die einen riesigen Flaschenhals bilden. Es wird also ständig ein Thread vom anderen ausgebremst. Deshalb besser 4-8 echte Kerne + SMT.

100001 · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

Elkinator schrieb:
leider drehen dann die "experten" in den foren wieder durch:\

CMT + SMT wäre toll!

CMT ist geil, gut CMT + SMT wäre noch besser,
aber dafür müssten die FPU und die Decoder massiv aufgebohrt werden

CMT kann so schon eine Anwendung die nur 2 Integer vorsieht auf 4 schön aufsplitten,
hier kann man von einer "intelligenten" Cpu sprechen.

Unter CMT erhält der begriff KI in x86 eine neue Bedeutung,
aber keiner will es haben ...........
--------------------------------------

Aber gut das Amd davon ablässt und diese CMT Technik seh wahrscheinlich frei gibt,
dann kann man seine Custom Cpu fertigen lassen (z.b. unter VIA)

Elkinator · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

bei Excavator hat jeder kern seinen eigen decoder.
die hohen cache latenzen haben NICHTS mit CMT zutun.

Cross-Flow · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

Pu244 schrieb:
Naja,
das gab es früher auch, um genau zu sein hat Intel erst 2008 mit dem Atom damit begonnen ein eigenes Süppchen zu kochen. Gut, AMD hat den So 754 einige Zeit noch für seine Semprons weiterverwendet. Von daher ist das eher ein zurück zu den Wurzeln.

Und was daran kann Nvidia nicht? Abgesehen davon das ihre Tegras auf ARM Techik setzen können die genauso gut skalieren. Grakas sind schon seit ewigkeiten modular aufgebaut.

Das was du genannt hast ist nunmal eine Selbstverständlichkeit, wie sie sie schon Jahrzehnte gibt.

Wir reden hier von 380W im FurMark gegen 250W, das sind 130W oder 52% Unterschied! Zum Vergleich: die GTX 480 wurde damals verrissen weil sie 70W, bzw. 39% mehr als die HD 5870 gebraucht hat. Das ist mehr als nur eine Stufe die man das Netzteil stärker auslegen muß. Desweitern klebt dann ein zusätzlicher Wärmetauscher im Gehäuse (dafür ist die Karte recht leise und kühl). Von daher: wenn man damals die GTX 480 verissen hat, dann sollte man das nun auch mit der Fury X machen, zumal die 33% weniger Videospeicher als die Konkurrenz hat, statt wie die GTX 480 50% mehr und der Leistungvorsprung der Fury X ist im Vergleich zu dem was die GTX 480 damals aufgefahren hat eher gering..

#1
Sicherlich gab es dieses Konzept schon früher, für Sockel 462 gab es ja auch Athlon MP Prozessoren.

#2
Was NV daran nicht kann? Öhm ja, x86 CPUs APUs z.B. :schief:

#3
Furmark Vergleiche sind sowas von sinnlos. Oder "spielt" hier irgendwer den ganzen Tag Furmark? Okay Auto Vegleiche sind banane aber "Bencht" der ADAC den Energieverbrauch von Fahrzeugen bei Vollgas mit 250 KMh auf der Autobahn. Wer den Lastverbrauch mit Prime, Furmark o.Ä. misst und daraus schlüsse zum Alltagsverbrauch zieht hat ganz gewaltige Probleme mit der eigentlichen Realität.

100001 · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

Elkinator schrieb:
bei Excavator hat jeder kern seinen eigen decoder.

Dafür nurmehr eine 128er Fpu

MZ259 · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

100001 schrieb:
Unter CMT erhält der begriff KI in x86 eine neue Bedeutung,
aber keiner will es haben ...........

Ist es nicht so, dass viele nette Funktionen verworfen werden, weil Programmierer oder wer auch immer sie nicht nutzen?
Ich denke dabei auch an sowas wie Mantle, welche kompett platt gemacht wurde und somit quasi nur "Inspirationen" für Vulcan und DX12 geliefert hatte, anstatt eigenständig weiter zu leben (nur ein Beispiel) :ugly:

Das gleiche ist mit CMT passiert... eigentlich eine gute Idee nur an der Umsetzung hackt es.

100001 · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

Sicher wieso was neues machen wenn man vorhandenes nutzen kann,
hier spielt aber wiederum die Geld Gier rein.

Wieso echten Fortschritt, das könnte Geld kosten,
lieber auf "Offiziellen" beiben.

Spielt doch Piledriver(Vishera 8 Kerner) mit rein,
in parallelen Anwendung teils schneller als ein 3770K bzw. gleich schnell wie ein 3950K

Elkinator · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

100001 schrieb:
Dafür nurmehr eine 128er Fpu

was heißt da bitte "nur mehr"?
bei Bulldozer udn Piledriver war es auch so.

udn warum darf bei CMT die FPU nicht breiter werden?

100001 · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

Elkinator schrieb:
was heißt da bitte "nur mehr"?
bei Bulldozer udn Piledriver war es auch so.

udn warum darf bei CMT die FPU nicht breiter werden?

Was laberst für einen Müll?

Piledriver hatte 256er Fpu + 1 Decoder
Steamroller: hatte 128er FPU + 2 Decoder
-----------------------------------------------------

BTT:
Amd sollte einen Carrizo mit L3 und 256er FPU + 2 Decoder bringen

Gast20150401 · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

MZ259 schrieb:
Ist es nicht so, dass viele nette Funktionen verworfen werden, weil Programmierer oder wer auch immer sie nicht nutzen?
Ich denke dabei auch an sowas wie Mantle, welche kompett platt gemacht wurde und somit quasi nur "Inspirationen" für Vulcan und DX12 geliefert hatte, anstatt eigenständig weiter zu leben (nur ein Beispiel)
Das gleiche ist mit CMT passiert... eigentlich eine gute Idee nur an der Umsetzung hackt es.

04.03.2015 um 19:30 Uhr: Im offiziellen Blog hat sich AMD zum Thema Offenheit bei Mantle geäußert, nachdem man zuvor durch das Streichen des öffentlichen SDKs für Verwirrung sorgte. Demnach basiert Khronos' neue API Vulkan stark auf Mantle, wodurch Vulkan "eine von Mantles Zukünfte" darstelle.

Hier Link: PC GAMES HARDWARE ONLINE - Das Hardware-Magazin für PC-Spieler

Elkinator · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

100001 schrieb:
Was laberst für einen Müll?

Wahrheit = Müll?
es ging um die breite der FPU PRO Modul udn die betrug eben schon immer 265bit!

Piledriver hatte 256er Fpu + 1 Decoder

richtig

Steamroller: hatte 128er FPU + 2 Decoder

falsch, die FPU ist auch pro modul 256bit breit...

100001 · 3. Oktober 2015

AW: AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

Elkinator schrieb:
falsch, die FPU ist auch pro modul 256bit breit...

Die Steamroller hat 128bit pro Modul

AMDs Zen: Neue Architekturdetails sprechen für deutlich höhere Integer-Leistung

BIOS-Overclocker(in)

Freizeitschrauber(in)

Volt-Modder(in)

gesperrt

Kokü-Junkie (m/w)

Software-Overclocker(in)

Freizeitschrauber(in)

Freizeitschrauber(in)

PCGH-Community-Veteran(in)

Freizeitschrauber(in)

Freizeitschrauber(in)

gesperrt

Freizeitschrauber(in)

Komplett-PC-Aufrüster(in)

Freizeitschrauber(in)

Freizeitschrauber(in)

Freizeitschrauber(in)

Gast20150401

Guest

Freizeitschrauber(in)

Freizeitschrauber(in)

Ähnliche Themen