AMD Vega 10: Linux-Patch nennt weitere technische Eckdaten

Einen Einbruch gab es ja nur so ab Faktor 15 , weil bei höheren und zu vielen Faktoren die Dreiecke die Pipeline mehr oder weniger verstopft haben.
Wenn jetzt mehr als doppelt so viele Dreiecke pro Takt "durchpassen" sollte das doch vor allem dann helfen wenn x32 oder höher tesseliert wird.
Aber lediglich mehr Bandbreite zur Verfügung zu stellen, wird ja alleine das Problem nicht lösen, der Takt selbst der jetzt massiv ansteigt, sollte da auch einiges verbessern.
Hat an den Tesselationseinheiten eigentlich selbst noch etwas getan? Oder belässt man es bei dem höheren Durchsatz? Denn wenn an letzterer nichts getan wurde, hat man nur einen Teil des Problems gelöst.:huh:

In der Geometry Engine müssten ja drei Assembler sitzen.
Einmal der Geometry Assembler, der Vertex Assembler und der Tesselator. Aber wenn dieser selbst nicht verbessert wurde, sondern nur mit dem Takt etwas schneller arbeitet, wird ja alleine das Problem nicht gelöst.
Oder gibt es mehrere Tesselatoren in einer Geometry Engine?

Nvidia kann soviel ich weiß auch nur 8 Dreiecke pro Takt verarbeiten, dürfte dann Vega hier seine Vorteile ausspielen?
Es gibt ein Grundprinzip, welches sowohl AMD, als auch Nvidia trifft und das ist der Raster-Durchsatz.
Der Rasterizer bearbeitet immer 4 Pixel bzw. Quads, wenn das Dreieck kleiner als dieser Faktor ausfällt dann führt das unweigerlich zur einem massiven Effizienzverlust, weil man niemals die Peakrate des Rasterizer erreichen kann.
Diesen Fall könnte man nur verbessern, wenn der Rasterizer grundlegend feiner arbeiten würde, nachdem Quad-Prinzip arbeitet aber soweit ich weiß jeder, ist vermutlich von der Hardwareimplementierung bisher am effizientesten.
(Das Schaubild zeigt nur 16 Pixel pro Schritt, es sind aber 4 x 4 in der Praxis)
https://storage.hw-lab.com/gpu/hd-6800/barts/7-tessellation.jpg

Der Worst-Case ist, wenn ein Dreieck berechnet werden muss, welches nicht einmal einen Pixel repräsentiert, also gar nicht sichtbar ist.
Ab Polaris filtert der Primitive Discard Accelerator in den Geometry-Engines so einen Fall, Nvidia kann so etwas schon seit längerem.

Nvidia kann theoretisch auch nur ein Dreieck pro GPC liefern, 4 bei einem GP104 (1080) oder 6 beim GP102 (1080 Ti).
Aber Dreiecke verwerfen kann Nvidia viel schneller und Hardware.fr beschreibt einen Vorteil, dass es einen Tessellator pro SM-Cluster gibt, was die Arbeiten besser verteilt, etwas was Vega verbessern sollte.
Performances théoriques : géométrie - AMD Radeon RX 480 8 Go : 14nm et Polaris en test - HardWare.fr*** GeForce GTX 1080 Ti graphics card reviewed - The Tech Report - Page 3[/url]

Ich selber kann mir keinen direkten Reim aus all den Ergebnissen machen, da jeder Tests etwas unterschiedlich testet.

Bei Vega wäre ich allerdings vorsichtig zu viel von den 11 Dreiecken pro Takt zu erwarten, weil es nur ein theoretischer Wert ist und möglicherweise auch nur unter bestimmten Umständen erreicht wird.
 
Naja LOD Anpassungen halt, das gabs schon immer, nur ist das heute schon sehr komplex.
Bei Quake 3 werden die Objekte auch erst rund, wenn man näher rangeht (und genug FPS hat)

in 99% würdest du selbst beim direkten Screenshotvergleich den Unterschied nicht feststellen können

Die PCGH hatte da wirklich mal einen sehr interessanten Artikel zu dem Thema. Ich weiß ja nicht, ob du ihn gelesen hattest. Ist schon ein paar Ausgaben her. Als Beispiel wurde dort z.B. ein Assassin's Creed gezeigt, wo es wirklich schon auffällig war, wie sehr die Engine runter regelte.
 
Die beiden großen Konsolen Deals (XBox und Playstation haben sogar extra mehr ACEs bestellt).
Sowie jetzt komplett mit Metal bei Apple drin zu sein.
ACEs stellen dabei nur eine Marketing Vereinfachungen dar.

GCN Gen 1 hatte nur zwei stupide Compute-Pipes, ab GCN Gen 2 wurden die zwei Pipes durch eine oder zwei Compute-Engines mit Microcode-Support ersetzt.
Eine MEC (Micro Engine Compute) besitzt immer 4 Compute-Pipes und jede kann bis zu 8 Compute-Queues managen.

Eine Sonderstellung besitzt die Xbox One und Bonaire, bei beiden werden 2 ACEs angegeben, was eine kleinere MEC darstellen müsste oder irgendein extra Design.
Das Thema hat sich bisher nicht auflösen lassen.

Was Metal mit den Konsolendeals zu tun hat oder AMD generell, weiß ich jetzt aber nicht.
Die API hat Apple spezifiziert, eine eigene Shader-Sprache dafür definiert und die ersten Chips welche den API-Support bekommen haben, waren eben die entsprechenden Imagination GPUs für die iPhones.
Die einzige Verbindung zu AMD sind möglicherweise ein paar ISVs die hinter der Kulisse ebenso bei Apple beraten und mitgeholfen haben.
 
Mooooment, also eine Zahl mit unbekannter Herkunft auf einer Bench Seite wird für bahre Münze genommen und das "haten" geht los, aber ein Artikel einer anderen Seite, der genauso Dinge "behauptet" ist nicht seriös? Ich mein klar, warum sollte er es sein, aber diese Doppelstandards sind einfach nur nervig hier...

Es ist aber schon ein Unterschied, ob ich ein Testergebnis habe das in der Datenbank jederzeit einsehbar ist, oder ob jemand seine persönliche Meinung (so wie es der Herr macht) wiedergibt.
Er hat doch auch nur, anhand der Daten die bis im Netz aufgetaucht sind, gemutmaßt.

Natürlich kann es auch so kommen wie er meint.

Auf einen Firestrikepost (1600MHz) ohne Datenbank gebe ich schon mal garnichts.

Ein paar Minuten mit Paint und ich habe eine super klasse GTX 980ti:devil:

Firestrike3.png
 
ACEs stellen dabei nur eine Marketing Vereinfachungen dar.

GCN Gen 1 hatte nur zwei stupide Compute-Pipes, ab GCN Gen 2 wurden die zwei Pipes durch eine oder zwei Compute-Engines mit Microcode-Support ersetzt.
Eine MEC (Micro Engine Compute) besitzt immer 4 Compute-Pipes und jede kann bis zu 8 Compute-Queues managen.

Eine Sonderstellung besitzt die Xbox One und Bonaire, bei beiden werden 2 ACEs angegeben, was eine kleinere MEC darstellen müsste oder irgendein extra Design.
Das Thema hat sich bisher nicht auflösen lassen.

Was Metal mit den Konsolendeals zu tun hat oder AMD generell, weiß ich jetzt aber nicht.
Die API hat Apple spezifiziert, eine eigene Shader-Sprache dafür definiert und die ersten Chips welche den API-Support bekommen haben, waren eben die entsprechenden Imagination GPUs für die iPhones.
Die einzige Verbindung zu AMD sind möglicherweise ein paar ISVs die hinter der Kulisse ebenso bei Apple beraten und mitgeholfen haben.

Metal wurde von AMD in einer Folie als Ableger von Mantel angegeben.
Ich such es mal raus.
 
Metal wurde von AMD in einer Folie als Ableger von Mantel angegeben.
Ich such es mal raus.
Weißt du wer die ersten GPUs veröffentlicht hat? Nvidia.
AMD produziert Ableger von Nvidia GPUs.
Klingt für dich nach Bullshit? Ist es auch.

Das selbe mit Mantle, DX12 und Metal.

Nur weil stellenweise gleiche Konzepte verwendet werden, wird nicht automatisch alles ein Mantle-Ableger, nur weil es zeitlich danach erschien.

Edit:

Du meinst vermutlich folgende Folie:
https://scr3.golem.de/screenshots/1505/AMD-FAD-2015-390X-Fiji/thumb620/FAD-2015-Fiji-05.png
 
Weißt du wer die ersten GPUs veröffentlicht hat? Nvidia.
AMD produziert Ableger von Nvidia GPUs.
Klingt für dich nach Bullshit? Ist es auch.

Das selbe mit Mantle, DX12 und Metal.

Nur weil stellenweise gleiche Konzepte verwendet werden, wird nicht automatisch alles ein Mantle-Ableger, nur weil es zeitlich danach erschien.
Crazy narrative.

Was hat das damit zu tun ?
Metal wurde als Mitglied der AMD API Familie genau wie LiquidVR und Mantel angegeben.

Edit : Finde die Folie leider nicht mehr D:
Allerdings könnte ich schwören sie existierte.
 
Zuletzt bearbeitet:
Was für ein Familienmitglied genau?
Metal is Apples IP.

Wenn du meinst welche API auf welcher GPU läuft, dann ist das auch alles ein Teil von Intels und Nvidias API-Familie.

Edit: Ich kann dir schwören das Metal kein Mantle-Ableger ist, aber ich habe nicht selten das Gefühl das logische Argumente nicht so vertrauenswürdig erscheinen, wie nichtssagende PR-Folien oder Fan-Mockups unter Reddit und WCCFTech.
 
Zuletzt bearbeitet:
Die PCGH hatte da wirklich mal einen sehr interessanten Artikel zu dem Thema. Ich weiß ja nicht, ob du ihn gelesen hattest. Ist schon ein paar Ausgaben her. Als Beispiel wurde dort z.B. ein Assassin's Creed gezeigt, wo es wirklich schon auffällig war, wie sehr die Engine runter regelte.
Ah danke. Na ich kauf das Magazin aus Gründen nicht mehr, aber vielleicht hab' ich mal Zeit den einzelnen Artikel zu lesen
 
Weißt du wer die ersten GPUs veröffentlicht hat? Nvidia.
AMD produziert Ableger von Nvidia GPUs.
Klingt für dich nach Bullshit? Ist es auch.

Das selbe mit Mantle, DX12 und Metal.

Nur weil stellenweise gleiche Konzepte verwendet werden, wird nicht automatisch alles ein Mantle-Ableger, nur weil es zeitlich danach erschien.

Edit:

Du meinst vermutlich folgende Folie:
https://scr3.golem.de/screenshots/1505/AMD-FAD-2015-390X-Fiji/thumb620/FAD-2015-Fiji-05.png
Finde auf der Folie nirgends Glide.
Fake News!
 
Eigentlich ist bei Tesselation alles jenseits von Faktor 16 nur dazu da um GPUs zu überlasten, wenn sie die Dreiecke nicht aussortieren, die kleiner als einen Pixel groß sind.
Nach Faktor 16 gehen 95% aller "Verbesserungen" der Optik in Dreiecke, die kleiner oder gleich einem Pixel sind.
Also vollkommene Verschwendung.
Man könnte jetzt spekulieren, weshalb sich x32 und x64 immer wieder durchsetzen, das spare ich mir hier allerdings...
 
Kommt ganz auf die tessellierte Fläche an, auch Faktor 16 kann zu viel sein, wenn die Flächen klein sind oder die Geometrie optisch nur geringfügig unterteilt wird.
Mass Effect: Andromeda verwendet nur Faktor 16, wobei auch 8 ohne sichtbare Einbußen möglich gewesen wären:
Mass Effect Andromeda im Benchmark-Test - ComputerBase

HairWorks dagegen benötigt mindestens Faktor 16, um nicht schlechter auszusehen, was natürlich verständlich ist, Haare stellen sehr feine Geometrie dar.
 
Kommt ganz auf die tessellierte Fläche an, auch Faktor 16 kann zu viel sein, wenn die Flächen klein sind oder die Geometrie optisch nur geringfügig unterteilt wird.
Mass Effect: Andromeda verwendet nur Faktor 16, wobei auch 8 ohne sichtbare Einbußen möglich gewesen wären:
Mass Effect Andromeda im Benchmark-Test - ComputerBase

HairWorks dagegen benötigt mindestens Faktor 16, um nicht schlechter auszusehen, was natürlich verständlich ist, Haare stellen sehr feine Geometrie dar.

Das stimmt schon.
Andere Teile (siehe Crysis 2) kommen mit noch deutlich kleineren Faktoren klar.
Alles in allem ist Faktor 16 ein guter Daumenwert um 99% aller Fälle abzudecken.
 
Wer sind die Kunden hierfür, nachdem seit dem Pascal-Release fast ein Jahr vergangen ist?
Hier, ich zum Beispiel, denn vom Preis-Leistungsverhältnis liebäugel ich zwar mit der 1070, aber ich möchte FreeSync...Fiji war mit mit 4GB als Flaschenhals zu beschränkt, eine 8GB-Version einer Radeon-Fury hätte ich hingegen schön längst gekauft. Scheint so, als würde AMD meine Wünsche erfüllen.
 
Hier, ich zum Beispiel, denn vom Preis-Leistungsverhältnis liebäugel ich zwar mit der 1070, aber ich möchte FreeSync...Fiji war mit mit 4GB als Flaschenhals zu beschränkt, eine 8GB-Version einer Radeon-Fury hätte ich hingegen schön längst gekauft. Scheint so, als würde AMD meine Wünsche erfüllen.

Mir geht es ähnlich, habe auch auf einen Freesync Monitor gesetzt. Ich hätte aber nichts gegen mehr Leistung, als eine 1070 bieten kann. Aber wenn es dir um diese Leistung geht, in der Bucht gibt es gebrauchte 1070er von Asus für 369€ vom Händler. Daher mit Widerrufsrecht und Gewährleistung. Für rund 350€ werden die 580er Karten von Asus bei MF gehandelt. Vega wird deutlich mehr kosten, daher bleibt nur zu hoffen, dass es sich um Gerüchte handelt und die Leistung von Vega deutlich besser ausfallen wird.
 
Das stimmt schon.
Andere Teile (siehe Crysis 2) kommen mit noch deutlich kleineren Faktoren klar.
Alles in allem ist Faktor 16 ein guter Daumenwert um 99% aller Fälle abzudecken.

Bei den meisten Objekten sicher, was aber wenn ich ganze Landschaften Tesseliere? Sobald du dann näher rangehst wirds bei zu geringer Tesselation blockig.
 
Man kann Objekte und Landschaft auch abhängig von der Distance tesselieren.
natürlich kann man das. Aber du hast trotzdem völlig andere Faktoren wenn du etwa einen Canyon samt Schluchten, Felsen usw tesselierst wie eine Spielfigur. Je näher du rangehst desto feiner müsste die Tesselierung im Vergleich zur Ausgangsbasis stattfinden.
 
Zurück