AMD verrät Fähigkeiten der Flex-FPU Update: HT Link mit deutlich mehr Bandbreite

Skysnake

Lötkolbengott/-göttin
AMD verrät Fähigkeiten der Flex-FPU Update: HT Link mit deutlich mehr Bandbreite

Update:
In dem unten genannten Dokument habe ich inzwischen noch eine interessante Angabe zum HT-Link (über den der Chipsatz angebunden wird) gefunden. Laut aktuellen AMD Dokumenten hat der Phenom II folgende HT-Spezifikation:

HyperTransport™ Technology to I/O Devices
• HyperTransport 1 and HyperTransport 3 technology supported
• One (1) link, 16-bits in each direction, supporting up to 2000 MT/s (4.0 GB/s) in each direction in
HyperTransport Generation 1.0 mode and 4400 MT/s (8.8 GB/s) in each direction in HyperTransport
Generation 3.0 mode.
Quelle: http://support.amd.com/us/Processor_TechDocs/46878.pdf

Kurz um, pro Richtung sind mit dem Phenom II maximal 8,8 GB/s möglich. Zu BD ist nun aber folgendes zu finden:

In addition to supporting previous HyperTransport interfaces, AMD Family 15h processors support a
newer version of the HyperTransport standard: HyperTransport3. HyperTransport3 increases the
aggregate link bandwidth to a maximum of 25.6 Gbyte/s (16-bit link). HyperTransport3 also adds
HyperTransport Retry which improves RAS by allowing detection and retransmission of packets
corrupted in transit.
Mit der gleichen Linkbreite von 16-bit sind somit nun 12,8 GB/s möglich, was einer Steigerung von 45% entspricht im Vergleich zu den Phenom II Prozessoren. Hiermit sollte es nochmals leichter fallen hohe Bandbreiten für die Gleichzeitige Nutzung von USB3.0 SataIII etc. bereit zu stellen.

Orginalnews:
Der User Camann XT hat mich auf einen Leitfaden für Software-Entwickler gestoßen, der die kommenden Bulldozer CPUs behandelt.

Nach kurzer Suche konnte ich mit diesem Dokument dann auch die schon seit langem ungeklärte Fragen lösen, wie viele Takte die Flex-FPU braucht, um die Zuteilung zu einem Integerkern zu wechseln. Laut Angaben AMDs kann in JEDEM! Takt die Zuteilung zu einem Integerkern neu erfolgen. Der prognostizierte Optimalfall ist damit eingetreten. Gerade die für Spieler wichtige Single Percision Leistung könnte damit einen deutlich Schub erhalten, da somit ein Kern immer gleich 4 SP-FP-Operationen gleichzeitig durchführen kann, wenn der andere Kern diese gerade nicht benötigt. Die Chancen einen deutlichen Leistungssprung bei Spielen im Vergleich zu den aktuellen Phenom II zu erreichen sind damit deutlich gestiegen.

FPU Features Summary and Specifications:
The FPU can receive up to four ops per cycle. These ops can only be from one thread, but the
thread may change every cycle
. Likewise the FPU is four wide, capable of issue, execution and
completion of four ops each cycle. Once received by the FPU, ops from multiple threads can be
executed.
• Within the FPU, up to two loads per cycle can be accepted, possibly from different threads.
• There are four logical pipes: two FMAC and two packed integer. For example, two 128-bit
FMAC and two 128-bit integer ALU ops can be issued and executed per cycle.
• Two 128-bit FMAC units. Each FMAC supports four single precision or two double-precision
ops.
• FADDs and FMULs are implemented within the FMAC’s.
• x87 FADDs and FMULs are also handled by the FMAC.
• Each FMAC contains a variable latency divide/square root machine.
• Only 1 256-bit operation can issue per cycle, however an extra cycle can be incurred as in the case
of a FastPath Double if both micro ops cannot issue together.
Den wichtigen Teil, auf den ich meine Aussage stütze habe ich farblich markiert.

In nächster Zeit werde ich mir wohl auch den Rest des Dokuments zu Gemühte führen. Falls es noch weitere spannende Informationen gibt, werde ich diese hier posten.

Quelle: http://support.amd.com/us/Processor_TechDocs/47414.pdf
 
Zuletzt bearbeitet:
AW: AMD verrät Fähigkeiten der Flex-FPU

Das klingt sehr interessant. Das bestärkt mich dann wieder zu denken, dass das Game sind nicht auf vier Kerne verteilt, sondern wirklich auf die vier Module verteilt wird, was einen beträchtlichen Schub mit sich bringen würde und dann hätte Sandy definitiv das Nachsehen, denn gegen 8 Kerne kann auch der i7 2600k mit SMT nicht konkurrieren.
Mal abwarten, wann es die ersten Tests vom Zambezi gibt.
 
AW: AMD verrät Fähigkeiten der Flex-FPU

Muss jetzt Fragen zum Verständnis stellen: Wenn ein Game für einen Quadcore optimiert ist, wird es also beim Bulldozer nicht auf die 4 Kerne (also 2 Module) verteilt sondern auf jedes Modul. Pro Modul ist dann ein Kern aktiv, der auf das gesamte Modul zugreifen kann. Oder habe ich das jetzt fundamental falsch verstanden?
 
AW: AMD verrät Fähigkeiten der Flex-FPU

Ich sehe das so, dass das Game, das auf 3-4 Kerne läuft, beim Bulldozer auf die vier Module verteilt wird und dann arbeiten alle 8 Kerne daran, dass das Teil vernünftig läuft. Und das wäre schon ein gewaltiger Leistungsschub gegenüber einem Phenom Quad, als Beispiel.
 
AW: AMD verrät Fähigkeiten der Flex-FPU

Na ganz so einfach ist das nicht...

AMD Spricht von 4 Compute Units (OpenCL Slang :schief:) Bei CPUs entspricht eine Compute Unit immer einem Kern, bei GPUs sind das immer die Verbünde von Stream-Prozessoren, die zusammen einen Instruktionssatz ausführen.

Windoof sollte daher wohl erst mal auf jedes Modul einen Thread verteilen, bevor ein zweiter dazu kommt, steht im Dokument aber sicherlich auch genau drin.

Wenn ein Game für 4 Kerner optimiert ist, und auf jedem Modul ein Thread läuft heißt das aber nicht, das der die xfache Leistung dadurch hat. Nur in den Fällen wo halt unabhängig voneinander Berechnungen durchgeführt werden können auf der FPU (btw die kann auch Integeroperationen :daumen:), erhält man eben ein Leistungsplus, wenn gleichzeitig die FPU komplett frei ist.

Ich denke in Spielen dürfte das durchaus öfters der Fall sein. Man hat dann aber nicht die volle Leistung eine 8 Kerner. Ich würde da realistisch eher im Bereich 5-7 einordnen, wobei 6 es wohl gut trifft.
 
AW: AMD verrät Fähigkeiten der Flex-FPU

Ich sag ja, abwarten, wie die Games mit den Modulen umgehen, entweder wird das der Durchbruch für die Modul Bauweise im CPU Bereich oder AMD feuert demnächst seine Entwicklungsabteilung. ;)
 
AW: AMD verrät Fähigkeiten der Flex-FPU

2. ;) zweiteres :P

Da Games (die meißten) eh GPU Limitiert sind ... erübgrigt sich eure (angefangende) Denkweise eigendlich ...
 
Zuletzt bearbeitet:
AW: AMD verrät Fähigkeiten der Flex-FPU

Die Kunst wird darin bestehen, den Anwendungen/Spiele vorzugauckeln das es nicht 8 Kerne sondern 4 Module mit 8 Kernen sind :P

Inwiefern die einzelnen Programme damit umgehen, wird sich zeigen ! Ob die Sandys dagegen halten können mit nur 4 Kernen, wird sich ebenfalls zeigen !

Wenn diese Technik einen Performance-Vorteil bietet stellt sich die Frage, ob Intel auch so was raus bringen wird ?! HT ist zwar eine nette Technik
von Intel, aber gegen 2 echten Kernen verliert diese - Abwarten, es wird spannend ;)
 
AW: AMD verrät Fähigkeiten der Flex-FPU

2. ;) zweiteres :P

Da Games (die meißten) eh GPU Limitiert sind ... erübgrigt sich eure (angefangende) Denkweise eigendlich ...

Eben nicht. Die CPU hat entscheidenden Einfluss auf die Min-FPS. Siehst du ja immer wieder in den unterschiedlichen Benches, das je nach CPU-Familie sich die Min-FPS stark unterscheiden. Beim E8400 sind z.B. die Max-FPS nicht ultimo, dafür aber der Unterschied zwischen Max und Min eigentlich immer kleiner als bei den meisten anderen CPUs, wobei es auch teilweise vorkommt, das die Min-FPS höher sind als bei stärkeren CPUs ;)
 
AW: AMD verrät Fähigkeiten der Flex-FPU

... Gerade die für Spieler wichtige Single Percision Leistung könnte damit einen deutlich Schub erhalten, da somit ein Kern immer gleich 4 SP-FP-Operationen gleichzeitig durchführen kann, wenn der andere Kern diese gerade nicht benötigt. ...

Ich denke da liegt der Hund begraben. ;) Da ein recht großer Teil der Datenbasis in einen modernen SG basierten System schon FP basiert ist, ist die Wahrscheinlichkeit doch schon recht groß das beide Cores in einen Modul diese Einheiten benötigen. Aber dennoch ist die Nachricht schon sehr viel versprechend.

Danke dafür! :daumen:
 
AW: AMD verrät Fähigkeiten der Flex-FPU

Eben nicht. Die CPU hat entscheidenden Einfluss auf die Min-FPS. Siehst du ja immer wieder in den unterschiedlichen Benches, das je nach CPU-Familie sich die Min-FPS stark unterscheiden. Beim E8400 sind z.B. die Max-FPS nicht ultimo, dafür aber der Unterschied zwischen Max und Min eigentlich immer kleiner als bei den meisten anderen CPUs, wobei es auch teilweise vorkommt, das die Min-FPS höher sind als bei stärkeren CPUs ;)

ich hab den Test selber gemacht , i7 2600k~4700mhz gegen Q9550~3400mhz ... mit der GPU limtierenden 8800gtx in Crysis ... "kein unterschied in der FPS" :P
ergo --> wo die GPU Limitert is da Nüscht ;)
Damit wollte ich eigendlich Beweisen das eine Schnelle CPU sich lohnt , aber (naja) man lernt nie aus ............
 
Zuletzt bearbeitet:
AW: AMD verrät Fähigkeiten der Flex-FPU

Ich denke da liegt der Hund begraben. ;) Da ein recht großer Teil der Datenbasis in einen modernen SG basierten System schon FP basiert ist, ist die Wahrscheinlichkeit doch schon recht groß das beide Cores in einen Modul diese Einheiten benötigen. Aber dennoch ist die Nachricht schon sehr viel versprechend.

Danke dafür! :daumen:

Ja, wobei es bei sehr vielen Dingen noch immer zwischen drin Integer-Berechnungen erforderlich sind. Denk nur mal an Schleifen, da haste für jeden Durchlauf mehrere Integer-Operationen im Normalfall.

ich hab den Test selber gemacht , i7 2600k~4700mhz gegen Q9550~3400mhz ... mit der GPU limtierenden 8800gtx in Crysis ... "kein unterschied in der FPS" :P
ergo --> wo die GPU Limitert is da Nüscht ;)
Damit wollte ich eigendlich Beweisen das eine Schnelle CPU sich lohnt , aber (naja) man lernt nie aus ............
Hast du die Min oder die Avg/Max FPS dir angeschaut?

Ich glaub nicht die Min.
 
AW: AMD verrät Fähigkeiten der Flex-FPU

Ja, wobei es bei sehr vielen Dingen noch immer zwischen drin Integer-Berechnungen erforderlich sind. Denk nur mal an Schleifen, da haste für jeden Durchlauf mehrere Integer-Operationen im Normalfall.
Schon richtig, und ich denke auch das es eigentlich sehr viel bringen sollte.
 
AW: AMD verrät Fähigkeiten der Flex-FPU

Danke für die User-News Skysnake :daumen:. Hast zwar meinen Namen falsch eingetippt, aber die neue Erkenntnis ist es wert :ugly:.

'XT
 
AW: AMD verrät Fähigkeiten der Flex-FPU

Die Kunst wird darin bestehen, den Anwendungen/Spiele vorzugauckeln das es nicht 8 Kerne sondern 4 Module mit 8 Kernen sind
Nun ja, so viel Kunst braucht es dafür eigentlich nicht. Man könnte einfach das CPUID Hyperthreading Bit nutzen. Wäre zwar nicht ganz richtig, würde aber den gleichen Effekt hervorrufen. Das Betriebssystem, zB Windows 7, verteilt Threads zuerst auf die physischen Kerne (-> AMD "Modul") und erst danach auf weitere logische Prozessoren innerhalb dieser physischen Kerne.


Dennoch würde ich in die Fähigkeiten der Flex-FPU nicht zu viel interpretieren. Wie hier schon angedeutet wurde, bei praxisnahen bzw hohen Settings werden Spiele in erster Linie immer noch von GPU und I/O limitiert. Da bringt auch eine schnelle CPU (FPU) nur überschaubare Gewinne. Interessanter wird es daher, was gerade der neue Cache und der neue Speichercontroller bewirken kann.
 
AW: AMD verrät Fähigkeiten der Flex-FPU

Wunderbar gefunden, das klingt super. Ich wünsche AMD, auch wenn ich aktuell einen Intel SB-Prozessor mein Eigen nenne, viel Erfolg und hoffe auf einen Durchbruch, weil das wirklich enorme Bewegung im CPU-Segment bedeuten würde.
 
AW: AMD verrät Fähigkeiten der Flex-FPU

Dennoch würde ich in die Fähigkeiten der Flex-FPU nicht zu viel interpretieren. Wie hier schon angedeutet wurde, bei praxisnahen bzw hohen Settings werden Spiele in erster Linie immer noch von GPU und I/O limitiert. Da bringt auch eine schnelle CPU (FPU) nur überschaubare Gewinne. Interessanter wird es daher, was gerade der neue Cache und der neue Speichercontroller bewirken kann.
Wenn CPU/FPU "nur überschaubare Gewinne" bringen, dann auch Cache und IMC. Wenn GPU und I/O limitieren - was allerdings nicht so extrem oft der Fall ist, wie viele meinen.
 
Zurück