AMD künftig mit auf 256 Bit verbreiteter Gleitkomma-Einheit?

PCGH-Redaktion

Kommentar-System
Teammitglied
Jetzt ist Ihre Meinung gefragt zu AMD künftig mit auf 256 Bit verbreiteter Gleitkomma-Einheit?

Geht es nach AMDs aktuellem Architecture Programmer's Manual, so sind künftig 256 statt 128 Bit breite Gleitkomma-Einheiten in kommenden Prozessoren denkbar - so könnte beispielsweise AVX in einem Rutsch berechnet werden und die theoretischen FLOPS verdoppeln sich.

[size=-2]Bitte beachten Sie: Der Kommentarbereich wird gemäß der Forenregeln moderiert. Allgemeine Fragen und Kritik zu Online-Artikeln von PC Games Hardware sind im Feedback-Unterforum zu veröffentlichen und NICHT im Kommentarthread zu einer News. Dort werden sie ohne Nachfragen entfernt. Sollten Sie Fehler in einer News finden, schicken Sie diese bitte an online@pcgameshardware.de mit einem aussagekräftigen Betreff.[/size]


lastpost-right.png
Zurück zum Artikel: AMD künftig mit auf 256 Bit verbreiteter Gleitkomma-Einheit?
 
AW: AMD künftig mit auf 256 Bit verbreiteter Gleitkomma-Einheit?

Für Laien heißt das also das die neuen Prozis schneller werden? xD :ugly:
 
AW: AMD künftig mit auf 256 Bit verbreiteter Gleitkomma-Einheit?

Für Laien heißt das also das die neuen Prozis schneller werden? xD :ugly:
Du brauchst halt weniger Takte um den angesprochenen AVX durchzuführen (oder andere Befehle die eben 256bit bei Floating Point brauchen) aber naja... wirklich stark bemerkbar wird sich das wohl nicht machen...
Man sieht ja wie viel Hashwell davon profitiert :schief:
 
AW: AMD künftig mit auf 256 Bit verbreiteter Gleitkomma-Einheit?

Für Laien heißt das also das die neuen Prozis schneller werden? xD :ugly:
Ja, dass heißt es. Es verdoppelt sich theoretisch der FP-Durchsatz, Floating-Point.
Das Programm muss aber auch die Erweiterung haben.
Wenn das Programm mit 128-Bit FP-Werten rechnet, dann bleiben 256-Bit herrlich nutzlos, da nur die Hälfte der Datenleitungen verwendet werden. Es ist nicht möglich 2x128-Bit oder 1x 256-Bit zu berechnen, sondern nur entweder oder.
Bei 256-Bit hast du natürlich den doppelten Durchsatz.

Bei dem Thema gibt es aber noch mehr dahinter. Jede FPU kann das auch anders lösen oder Verschaltungen benützen, um mehrere Datenpfade zu addieren, dann hat man zwar bei 256-Bit keinen höheren Durchsatz, aber auch keine ungenutzten Ressourcen.
Bulldozer kann z.B. 2x128-Bit berechnen oder 1x 256-Bit.*
Bulldozer erhält dadurch aber keinen höheren Durchsatz, Sandy-Bridge hat effektiv den doppelten AVX-Durchsatz, aber weswegen verstehe ich gerade auch nicht so richtig.

*
(Weil er zwei getrennte 128-Bit Pfade hat, wenn das jetzt auf 256-Bit aufgebohrt wird, kann dann keine 4x128-Bit Werte berechnen, sondern auch nur 2x128-Bit oder 2x256-Bit. Dann gibt es ja noch FMA4 bei Bulldozer, da verdoppelt sich der Durchsatz ja auch theoretisch, wenn das Programm dafür angepasst ist.)

Aber um es anders zu sagen, es verdoppeln sich die GFLOPs, der Name sollte ja geläufig sein. :)
Im Gegensatz zu GPUS aber auch nur wenn das Programm angepasst ist und Verwendung für 256-Bit Leitungen finden kann.
Erfahrungsgemäß dauert es immer mehrere Jahre, bis sich eine Erweiterung durchgesetzt hat und die Software-Landschaft durchgängig auf eine neuere Erweiterung setzt.

Man sieht ja wie viel Hashwell davon profitiert :schief:
Weil die ganze Welt auf 256-Bit Instruktionen umgestellt hat? ;)
AMD kommt halt paar Jahre später, da wird es sich wohl auch mehr lohnen.
 
Zuletzt bearbeitet:
AW: AMD künftig mit auf 256 Bit verbreiteter Gleitkomma-Einheit?

Ich habe davon zwar nicht viel Ahnung, aber hoffe das dann /irgendwann/ Anwendungen davon profitieren werden und nicht brach liegen...

Man sieht ja wie wenig bis keine Anwendungen die FMA4 Einheiten der Bulldozer benutzen :/
 
AW: AMD künftig mit auf 256 Bit verbreiteter Gleitkomma-Einheit?

Man sieht ja wie wenig bis keine Anwendungen die FMA4 Einheiten der Bulldozer benutzen :/
AMD hat im Server-Markt weniger als 5% Marktanteil, insgesamt glaube ich gerade 15% oder beim Consumer 15%.
Ich als Software-Entwickler hätte welchen Ansporn genau FMA4-Code in mein Programm einzubauen?
Solange es kaum Hardware gibt und es nutzbringend für einen großen Teil des Marktes wäre, wird das auch niemand machen.
 
AW: AMD künftig mit auf 256 Bit verbreiteter Gleitkomma-Einheit?

Ich verstehe es zwar nicht wirklich, aber solange es einen "brauchbaren" Vorteil in Anwendungen und beim allgemeinen Prozessor von AMD hat, finde ich es gut.
Wollte man sich bei Steamroller nicht sowieso ein wenig dem "richtigen" CPU Design nähern, indem irgendeine Komponente wieder hinzugefügt wird?
 
AW: AMD künftig mit auf 256 Bit verbreiteter Gleitkomma-Einheit?

Ich verstehe es zwar nicht wirklich, aber solange es einen "brauchbaren" Vorteil in Anwendungen und beim allgemeinen Prozessor von AMD hat, finde ich es gut.
Wollte man sich bei Steamroller nicht sowieso ein wenig dem "richtigen" CPU Design nähern, indem irgendeine Komponente wieder hinzugefügt wird?
Gut das "richtig" in Anführungszeichen steht, richtig oder falsch gibt es eig. auch nicht mehr. :D

Bei Steamroller werden die Decoder verdoppelt.
Bisher gab es einen Decoder der 4 Befehle ausspucken konnte für 4-Integer-Ausführungseinheiten (2 Pro Kern) + FPU und mit Steamroller wird es pro Kern einen Decoder geben, welcher ebenso 4 Befehle ausspucken kann.
Diese zwei Decoder sind aber an einen Integer-Core gekoppelt, bisher war ein Decoder ja für beide Kerne zuständig.
Das ändert sich mit Steamroller, wo jeder Kern seinen eigenen Decoder bekommt, allerdings können beide auch für die FPU benützt werden.
Insgesamt können mit Steamroller dank der 2 Decoder doppelt so viele Befehle weitergegeben werden.
Bloß je nach Szenario braucht man auch nicht 4 Befehle und es gibt noch einige Konfliktsituationen wo es pausen gibt usw.
AMD meinte aber das dank des zweiten Decoders 30% mehr Instruktionen heraus kommen, also wenn das 1 zu 1 praktisch ankommt, wären das bis zu 30% mehr IPC.
Aber die Angabe galt nur für das Front-End, also es können natürlich 30% mehr Instruktionen weiter geleitet werden, aber ob von den 30% auch alle genau so ankommen darf bisher bezweifelt werden.
Muss man halt abwarten, was praktisch übrig bleibt.
 
AW: AMD künftig mit auf 256 Bit verbreiteter Gleitkomma-Einheit?

Weil die ganze Welt auf 256-Bit Instruktionen umgestellt hat? ;)
AMD kommt halt paar Jahre später, da wird es sich wohl auch mehr lohnen.

Haha glaubst du ^^
Da wird sich in den nächsten Jahren rein garnix ändern. Zwar ein paar einzelne (sehr wenige Programme) die davon profitieren, aber die Breite Masse: Nie im Leben!
 
AW: AMD künftig mit auf 256 Bit verbreiteter Gleitkomma-Einheit?

Man sieht ja wie viel Hashwell davon profitiert :schief:
sieht man das, ja? Ja!
In Prgrammen die AVX in dem Ausmaß verwenden kann dies eine deutliche Leistungssteigerung bringen. In der Theorie um bis zu doppelt so schnell, in der Praxis wohl knapp darunter in diversen Szenarien.
Haha glaubst du ^^
Da wird sich in den nächsten Jahren rein garnix ändern. Zwar ein paar einzelne (sehr wenige Programme) die davon profitieren, aber die Breite Masse: Nie im Leben!
Was interessiert mich die breite Masse, solche Erweiterungen waren immer nur für spezielle Bereiche (Videoencoding etc) interessant. Das ist natürlich keine breite Masse, aber auch nicht wenige. Insgesamt profitieren davon mehr Leute als von Spieleoptimierungen, wenn man korrekterweise davon ausgeht, dass maximal 10% der PC User den PC zum Spielen verwenden (noch nicht mitgedacht, dass nur der Bruchteil davon wiederum, in ein CPU Limit laufen würde, sowie es auch wenig Spielespezifische Optimierungsmöglichkeiten gibt in einer CPU).

Aber ja, bis die masse von CPU Optimierungen profitiert wird es immer dauern: das ist ein Henne-Ei Problem: damit es sich für Softwarehersteller lohnt, für gewisse Hardware zu optimieren, muss diese Hardware schon weit verbreitet sein. Ein Hardwarehersteller wiederum wäre froh, wenn bei Release der Hardware möglichst viel Software vorhanden ist, die die Vorteile der neuen Hardware aufzeigt
Denk an 64 bit Desktop-CPUs (seit 2003) und seit wann werden sie intensiv genutzt (bis heute nicht), oder Quadcores? 90% der in einer CPU schlummernden Funktionen werden vom Ottonormalverbraucher sowieso nicht wirklich genutzt
 
Zuletzt bearbeitet:
AW: AMD künftig mit auf 256 Bit verbreiteter Gleitkomma-Einheit?

@ AMD

Auch ich habe nicht von der breiten Masse gesprochen, sondern das es sich mehr lohnen wird.
Bei den Einführungen kann man das meistens nur als Randnotiz wahrnehmen, aber nach 4-6 Jahren kann man schon Vorteile erwarten.
SB hat das ganze 2011 eingeführt, Bulldozer kam mit dazu Ende 2011.
Dann haben wir noch Ivy-Bridge, bald Haswell, Piledriver und irgendwann Steamroller.
Die Next-Gen Konsolen werden auch AVX unterstützen.
Wenn AMD das einführt in paar Jahren, sind schon insgesamt 4 Jahre und vielleicht mehr vergangen.
Blöd könnte es für AVX2 sein, dass wird AMD mit Steamroller wahrscheinlich nicht unterstützen.
 
AW: AMD künftig mit auf 256 Bit verbreiteter Gleitkomma-Einheit?

Warum nicht direkt 512bit?
 
AW: AMD künftig mit auf 256 Bit verbreiteter Gleitkomma-Einheit?

Warum nicht direkt 512bit?
Kosten/Nutzen.
512-Bit verbraucht mehr Platz und würde dir dann auch nur bei 512-Bit Instruktionen helfen, also bräuchtest du erst einmal eine Erweiterung von der ISA (Instruction Set).
Aber wenn man die Pipes auf 256-Bit erweitert, könnte man schon beide an einer 512-Bit Instruktion rechnen lassen.
Gerade halt wie es Bulldozer aktuell macht, 2x128-Bit Pipes berechnen eine 256-Bit AVX Instruktion.
 
AW: AMD künftig mit auf 256 Bit verbreiteter Gleitkomma-Einheit?

hoffentlich noch für AM3+ !? :banane::banane::banane:
 
AW: AMD künftig mit auf 256 Bit verbreiteter Gleitkomma-Einheit?

Gut das "richtig" in Anführungszeichen steht, richtig oder falsch gibt es eig. auch nicht mehr. :D

Bei Steamroller werden die Decoder verdoppelt.
Bisher gab es einen Decoder der 4 Befehle ausspucken konnte für 4-Integer-Ausführungseinheiten (2 Pro Kern) + FPU und mit Steamroller wird es pro Kern einen Decoder geben, welcher ebenso 4 Befehle ausspucken kann.
Diese zwei Decoder sind aber an einen Integer-Core gekoppelt, bisher war ein Decoder ja für beide Kerne zuständig.
Das ändert sich mit Steamroller, wo jeder Kern seinen eigenen Decoder bekommt, allerdings können beide auch für die FPU benützt werden.
Insgesamt können mit Steamroller dank der 2 Decoder doppelt so viele Befehle weitergegeben werden.
Bloß je nach Szenario braucht man auch nicht 4 Befehle und es gibt noch einige Konfliktsituationen wo es pausen gibt usw.
AMD meinte aber das dank des zweiten Decoders 30% mehr Instruktionen heraus kommen, also wenn das 1 zu 1 praktisch ankommt, wären das bis zu 30% mehr IPC.
Aber die Angabe galt nur für das Front-End, also es können natürlich 30% mehr Instruktionen weiter geleitet werden, aber ob von den 30% auch alle genau so ankommen darf bisher bezweifelt werden.
Muss man halt abwarten, was praktisch übrig bleibt.


Vielen Dank, genau das meinte ich :D
 
Zurück