AMD Vega: Illustrativer Die-Shot und erste technische Daten von der WWDC

Die hohe Leistung in TeraFlops ist wirklich beeindruckend 11 TFlops (FP32) und 22 TFlops (FP16)
Der Unterschied zwischen den beiden Versionen [AMD Readeon Vega Pro 56/64 (8GB/16GB HBM2)] ist laut der Webseite lediglich die Speichergröße.
Somit ist die Rohleistung die die beiden Varianten auf den Desktop bringen höher als die von einer Tesla P100 was wiederum bedeuten dürfte das NVIDIA wohl doch baldmöglichst die Tesla V100 herausbringen muss um die Leistungskrone beizubehalten.
 
Somit ist die Rohleistung die die beiden Varianten auf den Desktop bringen höher als die von einer Tesla P100 was wiederum bedeuten dürfte das NVIDIA wohl doch baldmöglichst die Tesla V100 herausbringen muss um die Leistungskrone beizubehalten.

Ich frag mich sowieso, warum nvidia (und intel) momentan so derbe raushauen. Vielleicht werden die Vegas ja doch so gut, wie von manchem erwartet!?
 
Also die 8 Shader-Engines überraschen mich jetzt aber doch. :wow:
Das würde die recht lange Treiberarbeit erklären. Seit GCN 1.0 in Form von Tahiti (2 Shader-Engines) setzte AMD durchgehend auf 4 (Tonga, Hawaii / Grenada, Fiji, Polaris). Die Tessellationsperformance von Polaris war ja schon für AMD sehr gut. Damit dürften Tessellationsengpässe nochmals minimiert werden, außerdem hatte ich schon vor längerer Zeit auf mehr Shaderengines zur feineren Auslastung und Unterteilung gehofft, aber wahrscheinlich wurde es einfach höchste Zeit dafür.
Das ist schon seit Wochen bekannt.

Ach ja klär mich auf
 
Die hohe Leistung in TeraFlops ist wirklich beeindruckend 11 TFlops (FP32) und 22 TFlops (FP16)
Der Unterschied zwischen den beiden Versionen [AMD Readeon Vega Pro 56/64 (8GB/16GB HBM2)] ist laut der Webseite lediglich die Speichergröße.
Somit ist die Rohleistung die die beiden Varianten auf den Desktop bringen höher als die von einer Tesla P100 was wiederum bedeuten dürfte das NVIDIA wohl doch baldmöglichst die Tesla V100 herausbringen muss um die Leistungskrone beizubehalten.

Wobei die Vega FE ja sogar 12,5 bzw. 25 TFlops hat und bei höher getakteten Desktop Gamingmodellen sind es dann wohl 13-14 TFlops (FP32). Wäre interessant, wenn in den Vega Gaming Karten, auch FP16 verfügbar wäre, die bei Nvidia ja nur beim GP100 verfügbar sind.
 
Kann durchaus sein. Müsste man noch mal raussuchen. So tröpfchenweise wie die Infos kommen, hat man die Hälfte der Architekturdetails schon wieder vergessen, bis man die Karte in den Händen hält. :ugly:
 
Kann durchaus sein. Müsste man noch mal raussuchen. So tröpfchenweise wie die Infos kommen, hat man die Hälfte der Architekturdetails schon wieder vergessen, bis man die Karte in den Händen hält. :ugly:
Wurde im Bezug auf via FP16 berechnetes TressFX kund getan, meines Wissens. Vor allem wollte id Software in ihrer Engine viel auf FP16 umstellen, aufgrund der Partnerschaft mit AMD ;)
 
Die hohe Leistung in TeraFlops ist wirklich beeindruckend 11 TFlops (FP32) und 22 TFlops (FP16)
Der Unterschied zwischen den beiden Versionen [AMD Readeon Vega Pro 56/64 (8GB/16GB HBM2)] ist laut der Webseite lediglich die Speichergröße.
Somit ist die Rohleistung die die beiden Varianten auf den Desktop bringen höher als die von einer Tesla P100 was wiederum bedeuten dürfte das NVIDIA wohl doch baldmöglichst die Tesla V100 herausbringen muss um die Leistungskrone beizubehalten.
Was ist an der Rohleistung beeindruckend? Seit Anfang August 2016 bot die GTX Titan X 12GB GDDR5X mit real anliegendem Ø-Chiptakt von nur ~1580 MHz rund 11,325TFLOPs SP. Seit etwa Mitte März 2017 bietet die halb so teure GeForce GTX 1080 Ti 11GB GDDR5X mit Referenzsdesign Kühlung bei real anliegendem Ø-Chiptakt von nur ~1630 MHz schon 11,683TFLOPs SP. Die Partnerdesigns der 1080 Ti bleiben auch gern über 1900MHz Chiptakt, was dann über 13,619TFLOPs SP entspricht.

Schon Anfang April 2016 wurde die Tesla P100 16GB HBM2 mit ebenfalls 21,2 HP bzw. 10,6 SP TFlops angekündigt, die wiederum schon Anfang Mai 2017 einen Nachfolger in Form der Tesla V100 16GB HBM2 bekommen hat mit 14,9 TFLOPs SP, beide Tesla Beschleuniger sind aber kein Maßstab für Gamer. Bisher gibt es da nicht wirklich etwas 'beeindruckendes' von Vega was man nicht schon mitunter seit Monaten von anderer Hardware kennt.

Bleibt zu hoffen das obwohl es eine nahezu 'Totenstille' von Seiten AMDs ist - im krassen Kontrast zu dem Mitteilungsbedarf vor dem Ryzen Launch - das wenigstens die Gameleistung stimmen wird. Bei ab 680 Euro lieferbaren 11GB 484GB/s GTX 1080 Ti Karten würde AMD bei Kampfpreis sicherlich schnell der Gewinn ausgehen bei der ~500mm² großen Vega GPU samt teurer HBM2 + Interposer Technik.
 
Zuletzt bearbeitet:
Die ist aber nicht teurer als ein GDDR5X Design. Denke der Preis wirds machen, wobei der HBM AMD einen Strich durch die Rechnung machen kann. 800MHz und 930MHz bedeutet, dass die möglichen 1000MHz eben noch nicht stabil laufen.
Schon allein der Interposer macht das HBM2 Design teurer, weil dieser bei GDDR5X schlicht keine Verwendung findet. Ebenso fallen beim GDDR5X die aufwendigen Arbeitsschritte weg, die HBM2 Stacks und den GPU auf dem Interposer zu platzieren, welcher davor oder danach noch aufs Package muss. Dazu kommt noch das allein die HBM2 Stack Herstellung schon aufwendiger (Verfügbarkeit!) und damit teurer ist als bei der GDDR5 Weiterentwicklung mit dem X. Wurde auch schon drüber diskutiert.
 
Zuletzt bearbeitet:
Was denkst du was 11GB GDDR5X mit 11Gbps kosten? Das einzige was AMD ggf. gegenfinanzieren muss ist der HBM2. Man ist bei SK hynix aber Exklusivkunde. Was man dafür bezahlt ist nicht für die Öffentlichkeit bestimmt. Würde unter deinem Link mal genauer lesen, Fiji brachte fast 45% Marge und ist nicht viel teurer als ein Layout das den GDDR VRAM anbinden muss. Das fällt bei AMD alles weg, weil das bereits auf dem Interposer sitzt. Der kostet paar Dollar. Daher...
Ja 11GB GDDR5X kosten sicherlich auch Geld, aber auch hier wissen wir nicht was nVidia als Exklusivpartner bezahlt, ist ja nicht für die Öffentlichkeit bestimmt. Bisher dachte ich dies auch bei Margen Einkünften der GPU Entwickler. Woher weißt du das die Fiji Grafikkarten soviel Gewinn abgeworfen haben? Hatte sich das in den Quartalszahlen wieder gespiegelt?


Vielleicht mal ein anderer Link: AMD Interposer Strategie - Zen, Fiji, HBM und Logic ICs
100mm² Fiji Interposer kosten 1$, der ganze Wafer des Fiji Interposer 500-600$. Zudem hat AMD Patentabkommen, mit denen man die Montage bei/durch Drittfirmen gegenfinanzieren kann. Passive Interposer sind nicht so teuer wies es den Anschein hat, eher ist die Logistik eine riesen Herausforderung. Vor allem müssen alle Beteiligten immer zeitgerecht liefern können.
Ja so ein 1011mm² Fiji Interposer allein hat an Fertigungskosten dann auf nem 575 USD 300mm² Wafer rund 11 USD, plus die zusätzlichen Kosten für Aufwand welche die Weiterverarbeitung verursacht pro Fiji Grafikkarte, welche sich gar nicht so 'trivial und easy' liest, die Logistik nicht mal mit eingerechnet. Hört sich zumindest ein Stück weit schwieriger an als paar GDDR5X Chips auf die VGA Platine zu löten.

Aber was solls: wird sich ja in AMDs Quartalszahlen zeigen wenn RX Vega ein gutes Geschäft mit satter Marge wird :daumen:
 
Laut Apple ist die Vega über 3x schneller als die R9 395X im iMac war. Das ist irgendwo zwischen 1080 und 1080ti als MXM Version mit 250W TDP und 1300Mhz. Eine Desktopversion mit 1600+Mhz wird da noch gute 30% drauflegen und d+rfte damit vor Titan und 1080ti liegen. Good times are coming. :daumen:
 
Laut Apple ist die Vega über 3x schneller als die R9 395X im iMac war. Das ist irgendwo zwischen 1080 und 1080ti als MXM Version mit 250W TDP und 1300Mhz. Eine Desktopversion mit 1600+Mhz wird da noch gute 30% drauflegen und d+rfte damit vor Titan und 1080ti liegen. Good times are coming. :daumen:

Immer diese Optimisten xD Damit wäre die Karte immer noch langsamer als ne Custom 1080Ti und das so spät? AMD Vega wird wieder nicht OC-bar sein, wie alle anderen Karten der letzten Jahre.
Abgesehen davon, wenns AMD endlich mal schafft im August die Karte lieferbar zu haben schmeißt NV einfach Volta raus. Entweder zu Beginn des Jahres oder doch noch mit neuem GDDR5x Speicher statt GDDR6. Die Unterschiede sind mittlerweile sehr gering.
 
Was ist an der Rohleistung beeindruckend? Seit Anfang August 2016 bot die GTX Titan X 12GB GDDR5X mit real anliegendem Ø-Chiptakt von nur ~1580 MHz rund 11,325TFLOPs SP. Seit etwa Mitte März 2017 bietet die halb so teure GeForce GTX 1080 Ti 11GB GDDR5X mit Referenzsdesign Kühlung bei real anliegendem Ø-Chiptakt von nur ~1630 MHz schon 11,683TFLOPs SP. Die Partnerdesigns der 1080 Ti bleiben auch gern über 1900MHz Chiptakt, was dann über 13,619TFLOPs SP entspricht.

Schon Anfang April 2016 wurde die Tesla P100 16GB HBM2 mit ebenfalls 21,2 HP bzw. 10,6 SP TFlops angekündigt, die wiederum schon Anfang Mai 2017 einen Nachfolger in Form der Tesla V100 16GB HBM2 bekommen hat mit 14,9 TFLOPs SP, beide Tesla Beschleuniger sind aber kein Maßstab für Gamer. Bisher gibt es da nicht wirklich etwas 'beeindruckendes' von Vega was man nicht schon mitunter seit Monaten von anderer Hardware kennt.

Bleibt zu hoffen das obwohl es eine nahezu 'Totenstille' von Seiten AMDs ist - im krassen Kontrast zu dem Mitteilungsbedarf vor dem Ryzen Launch - das wenigstens die Gameleistung stimmen wird. Bei ab 680 Euro lieferbaren 11GB 484GB/s GTX 1080 Ti Karten würde AMD bei Kampfpreis sicherlich schnell der Gewinn ausgehen bei der ~500mm² großen Vega GPU samt teurer HBM2 + Interposer Technik.

Also denkst du nicht dass du hier Äpfel mit Birnen vergleichst? Die Titan X(p) und die GTX1080Ti kann man nicht mit der AMD Readeon Pro vergleichen, wenn dann muss man sie schon mit der Tesla P100 vergleichen (auf der ja sowohl die Titan X(p) als auch die GTX1080Ti basiert).
AMD wird auch mit der RX Vega Serie fürs Gaming optimierte Grafikkarten auf den Markt bringen.
Der AMD Radeon Pro Vega 11TFlops (FP32) / 22TFlops(FP16) stehen mit der Tesla P100 mit 9,30 TFlops Single-Precision X (FP32) 18,70 TFlops Half-Precision X (FP16) gegenüber.
Mir ist klar das NVIDIA mit Tesla V100 kontern wird, aber wann? AMD Vega steht immerhin kurz vor Release.
Und NVIDIA wird wohl das erste mal seit Jahren unter Zugzwang geraten, was uns zugute kommt, denn ohne AMD hätte sich NVIDIA mit Sicherheit noch Zeit gelassen, immerhin sind die Titan Xp und GTX1080Ti erst ein paar Monate jung.
 
Zuletzt bearbeitet:
Das ist schon seit Wochen bekannt.
Was ich vor Wochen gesehen hatte, waren eher Hoffnungen und Gerüchte, aber so wie die Infos hier hereintröpfeln, kann man schon mal was verwechseln... :ugly:
Was ist an der Rohleistung beeindruckend? Bot die GTX Titan X 12GB GDDR5X mit real anliegendem Ø-Chiptakt von nur ~1580 MHz rund 11,325TFLOPs SP. Seit etwa Mitte März 2017 bietet die halb so teure GeForce GTX 1080 Ti 11GB GDDR5X mit Referenzsdesign Kühlung bei real anliegendem Ø-Chiptakt von nur ~1630 MHz schon 11,683TFLOPs SP. Die Partnerdesigns der 1080 Ti bleiben auch gern über 1900MHz Chiptakt, was dann über 13,619TFLOPs SP entspricht. Schon Anfang April 2016 wurde die Tesla P100 16GB HBM2 mit ebenfalls 21,2 HP bzw. 10,6 SP TFlops angekündigt, die wiederum schon Anfang Mai 2017 einen Nachfolger in Form der Tesla V100 16GB HBM2 bekommen hat mit 14,9 TFLOPs SP, beide Tesla Beschleuniger sind aber kein Maßstab für Gamer.
Das heisst dann aber, wenn Games alternativ zu FP32 Berechnungen in FP16 ermöglichen, sieht man heute als Nvidia-Kunde selbst mit einer Titan (GP102) alt aus und eine Tesla werden die wenigsten Endkunden in unseren Reihen besitzen. Der Vorteil Nvidias mit speziellen Einheiten für FP16 (halbe Rechengenauigkeit) und FP64 (doppelte Rechengenauigkeit) könnte hier durch Deaktivierung bzw. durch fehlendes Vorhandensein zum Nachteil werden oder sehe ich das falsch?
Quellen:
FP16 Throughput on GP104: Good for Compatibility (and Not Much Else) - The NVIDIA GeForce GTX 1080 & GTX 1070 Founders Editions Review: Kicking Off the FinFET Generation

Weitere Details zur Titan X: 471 mm2 und keine schnelle FP64/FP16-Berechnungen - Hardwareluxx
 
So amd vega

8 shadercomplex mit je 8 cumpute units = 64 shader je cluster
mal 64 cluster =
4096 shader insgesamt
bei 1,35ghz

oder
shader 3584
und 1,55ghz

gehen wir von der shaderleistung von polaris aus ergibt das bei 1,35ghz bei big vega mit 4096 shadern etwa amd vega -10% als gtx1080
gehen wir von amd fiji aus sind das amd vega -20% als gtx 1080
Grundlage der Annahme 3dmark extreme
ich bin optimist ich gehe mal von der Effizienz von polaris aus
Die große frage ist also wieviel vom der neuordnung der shader beim treiber für eine cpu entlastung bei dx11 bringt.
bringt diese änderung von 4 zu 16 auf 8 zu 8 etwas?
und welcher chip wird es wohl sein mit 1,6ghz ich tippe auf den mit 3584 shadern.
das einzige was vega schneller machen kann ist ein höherer takt. und mehr als 1,4ghz sind nicht drin oder eben mit der brechstange und 1,6ghz und etwa 300w tdp

Warum die skepsis nun amd kann nicht zaubern
polaris mit 2304 shaderkommt maximal auf 1,5ghz und da sollen 1,6ghz bei 4096 shadern gehen
ich bitte euch allein das die 3584cversion 1,55ghz packt ist sensationell.
Die große unbekannte ist was die neuordnung bringt.Und das ist eine reine treiber angelegenheit.
 
Zuletzt bearbeitet:
Das heisst dann aber, wenn Games alternativ zu FP32 Berechnungen in FP16 ermöglichen, sieht man heute als Nvidia-Kunde selbst mit einer Titan (GP102) alt aus und eine Tesla werden die wenigsten Endkunden in unseren Reihen besitzen. Der Vorteil Nvidias mit speziellen Einheiten für FP16 (halbe Rechengenauigkeit) und FP64 (doppelte Rechengenauigkeit) könnte hier durch Deaktivierung bzw. durch fehlendes Vorhandensein zum Nachteil werden oder sehe ich das falsch?

Nein das stimmt schon so, aber dieses Feature wird Zeit brauchen um von den Entwicklern sinnvoll genutzt zu werden. Es wird einige sehr schnelle Implementierungen geben, aber ich fürchte ein Großteil der Berechnungen werden weiterhin in 32 Bit stattfinden müssen.

In Open-World Spielen mit gigantischem Ausblick muss man sogar schon tricksen, um mit 32 Bit Genauigkeit rumzukommen. Da wird niemand auf halbe Genauigkeit umstellen.

Mal abgesehen davon, bis sich das Feature durchsetzt wird Vega veraltet sein. Ähnlich wie die Tesselationperformance der HD 5870 vs. GTX 480: Zum Zeitpunkt als die ersten Spiele mit wirklich exzessiver Tesselationnutzung erschienen, waren beide Karten zu langsam für diese Detailstufen. Da kann die GTX 480 fünfmal so schnell beim tesselieren sein.
 
Zurück