nVidia launcht neues Produkt auf der GTC2013

Skysnake

Lötkolbengott/-göttin
nVidias CEO Jen-Hsun Huang begann seine Key-Note mit der Ankündigung, man wolle heute ein neues Produkt vorstellen. Nach einem Bericht über die Softwareentwicklung in Bereich einer Meer- und Gesichtsdarstellung/-simulation zeigte Huang die neue Chip-Roadmap, in der nun der Codename "Volta" für die Zeit nach 2014 geplant ist. Einen genauen Termin gibt man noch nicht an.

nvolta7tjdc.png
Quelle: http://www.abload.de/img/nvolta7tjdc.png

Betrachten wir nun die Folie etwas genauer.

Für Maxwell wird nun von "Unified Virtual Memory" gesprochen. Hiermit ist wahrscheinlich der Adressspace gemeint, den man sich mit dem Host teilen will. Genauers kann man hierzu allerdings nicht sagen. Sollte meine Vermutung richtig sein, würde sich dies mit den Entwicklungen bei AMD decken, was sehr zu begrüßen ist.

Mit "Volta" soll dann "stacked DRAM" eingeführt werden. Dieser soll Bandbreiten von 1 TByte/s ermöglichen an Bandbreite zur GPU ermöglichen. Dies ist jedoch keine 100% sichere Aussage, Huang war hier leider etwas undeutlich zu verstehen, und allgemein in seiner Formulierung nicht ganz leicht zu verstehen. Eventuell könnte es sich auch um eine TBit/s Angabe pro Chip handeln. Dies war ein Allgemein zu beobachtendes Phenomen dieser Key-Note. Huang wirkte etwas schlecht vorbereitet und konnte das Publikum auch nicht wirklich mit reisen. Es fehlte einfach das gewisse "Etwas" was man sonst von seinen Reden her kennt. Die öfters zu früh eingeblendeten Folien der Presentation trugen hierzu natürlich ihren Teil bei, während in anderen Momenten die nächste Folie erst auf Huangs bitten hin eingeblendet wurde. Man hatte den Eindruck, das Huang innerlich kochte...

screenshot2013-03-19a4oaej.png
Quelle: http://www.abload.de/img/screenshot2013-03-19a4oaej.png

Kommen wir nun aber zur Folie an sich. Diese soll darstellen, wieviel Platz man sich spart im Vergleich zur aktuellen Situation.

Huang sprach hierbei insbesondere auch von den Problemen, das man Signale über lange Wege treiben müsste, und eben auch über mehrere Kontaktstellen, was zu einem hohen Energieverbrauch führt. Leider war in seiner Ausführung zur Implementierung nicht ganz zu verstehen, ob es sich hierbei um ein MultiChipModule handeln wird, oder um eine Lösung mit Interposer. Soweit ich selbst ihn verstanden habe, wird es sich wohl um eine Interposer-Lösung handeln. Genaues kann man aber wohl erst zu einem späteren Zeitpunkt sagen.

Stay tuned :daumen:

Update 1:
Nach der Presentation der Roadmap zeigte Huang noch Kayla, und das sogar als echte Hardware.
Kayla.png
Die Ähnlichkeit zum Seco Development-Kit ist hierbei frappierend.
carma-kit.png

Im Anschluss wurde noch gezeigt, welche Leistung ein solches System hätte, indem man die Meer/Glas/Rauch Simulationen auf CUDA-Basis zeigte.
Kayla_run.png

Update 2:
Nachdem Huang dies gezeigt hatte, dachten die Meisten bereits, dass die Key-Note bereits zu ende wäre, dem war aber weit gefehlt! Huang musste erst noch darauf hinweisen, dass der 5. Topic der Key-Note noch ausstand.

Ohne viel Vorlauf von Huang wurde dann auch ein Server-gezeigt. Die Front erinnerte mich dabei sofort an ältere Presentationen.
nVidia-GRID (2).png

Im Anschluss spulte Huang recht schnell die Daten des Servers herunter.
nVidia-GRID (3).png

2x 12 DIMMs
nVidia-GRID (4).png

und 8 GPUs
nVidia-GRID (5).png

Hierbei handelt es sich um K10 GPUs, also Dual-GPUs auf Basis von GK104.
nVidia-GRID (6).png

Die Bilder machten mich sofort stuztig, und ein kleiner Blick in meine News von der CeBIT bestätigte es. Der nVidia server entspricht dem von PYN auf der CeBIT gezeigten TYAN Server
.
Anhang anzeigen 636285

Es handelt sich hier also nicht wirklich um neue Hardware, aber vor allem nicht um neue Hardware von nVidia, da die von nVidia stammenden GPUs (K10) bereits ein Jahr alt sind. Überraschend äußerte man sich auch zu den Preisen:
nVidia-GRID (1).png
Bedenkt man die aktuellen Preise bei PYN und Intel, stellt dies durchaus ein günstiges Angebot dar. Interessant dürfte vor allem aber sein, was die Software von nVidia alles kann, für die man extra jährlich zahlen muss.

Warum nVidia nicht die VGX K1 verbaut hat, siehe meine News zum meinem IBM besuch auf der CeBIT, bleibt wohl nVidias Geheimnis. Immerhin hatte man sich in der gesamten Präsentation um CAD und die Virtualisierung von Arbeitsplätzen gedreht. Gerade hier soll aber die VGX K1 punkten.

Insgesamt bleibt eine ziemliche Ernüchterung nach der Key-Note von Huang zurück. Bis auf die Aussichten auf Volta konnte mich nichts wirklich vom Hocker reisen. Gerade dieser Punkt, der wohl der spannendste der gesamten Presentation war, wurde aber nur kurz angerissen, was sehr schade ist.

Qulle:http://www.ustream.tv/nvidia
 
Zuletzt bearbeitet:
Schöne News! Konnte leider nur einen kleinen Ausschnitt des Streams sehen, deswegen schön, dass man nochmal eine grobe Zusammenfassung hat. :daumen:
Interessant, dass sie die Simulationen auf Ubuntu zeigen... Wo nVidia doch anscheinend so toll mit Linux kooperiert^^
 
Handelt es sich bei Volta um eine Desktop GPU?

Auf der Tabelle sieht das nach 2015/16 aus, aber es soll wohl nur bedeuten irgend wann ab 2014.
 
Volta soll wohl ne neue Chipgeneration sein, genau wie Tesla, Fermi, Kepler oder eben Maxwell. Also ne gesamte Produktfamilie
 
Super News mal wieder Skysnake :daumen:

Was ich sehr interessant finde sind Wave Works und Face Works, das mit einer Titan gezeigt wurde.
Und die neue Chipgeneration Volta mit ihren Stacked Ram. Bandbreite bis zu 1Tb/s ist schon sehr heftig.
 
Für Maxwell wird nun von "Unified Virtual Memory" gesprochen. Hiermit ist wahrscheinlich der Adressspace gemeint, den man sich mit dem Host teilen will. Genauers kann man hierzu allerdings nicht sagen. Sollte meine Vermutung richtig sein, würde sich dies mit den Entwicklungen bei AMD decken, was sehr zu begrüßen ist.

nVidias Lösung ist wohl zumindest aus Softwaresicht radikal anders...

AMD: APU Konzept; CPU und GPU auf einem Chip mit gemeinsamem Arbeitsspeicher und gemeinsamen Adressraum

nVidia: CPU und Grafikkarte komplett getrennt, auf der Grafikkarte sitzen jedoch mehrere 64Bit ARM Kerne, die Berechnungen übernehmen welche der GPU als solcher nicht oder nur sehr ineffizient durchführen könnte; so wird das Problem der Kommunikation zwischen CPU und GPU und deren Latenz weitgehend entschärft. ARM Kerne und GPU haben einen gemeinsamen Adressraum- nicht aber (x86-) CPU und GraKa.

ob es sich hierbei um ein MultiChipModule handeln wird, oder um eine Lösung mit Interposer. Soweit ich selbst ihn verstanden habe, wird es sich wohl um eine Interposer-Lösung handeln. Genaues kann man aber wohl erst zu einem späteren Zeitpunkt sagen.

Na ja... wenn man das Bild betrachtet kann man erkennen das es sich offenbar um ein Multi Chip Modul aus GPU und mehreren RAM Chips handelt, die RAM Chips selbst sind aber mehrere, die mit Interposern gestapelt sind.

Warum nVidia nicht die VGX K1 verbaut hat

Mehr Power!

Worauf soll es sonst laufen? Das ist ein ARM :D

RISC OS? :ugly:
 
nVidias Lösung ist wohl zumindest aus Softwaresicht radikal anders...
Jetzt nichts durcheinander werfen ;)

Ich rede nicht von den APUs bei AMD, wo du recht hättest, sondern von ihren dedizierten GPUs, die ja auch den unified x86-adressspace unterstützen sollen. Und genau in die Kerbe schlägt nVidia wohl auch. Das kann man auch relativ einfach implementieren, nämlich indem man ne TLB und ne MMU mit auf die GPU packt, was btw eh schon vorhanden ist. Also das lässt sich schon alles mehr oder weniger komfortabel erledingen. Da ich selbst an nem Linux-Kerneltreiber schreibe, weiß ich, dass das zwar einiges an Aufwand ist, um so etwas zu implementieren, aber es geht. Was halt wirklich! schwierig ist, ist, wie man Kohärenz herstellt, davon hat nVidia aber kein Wort gesagt ;)

Superwip, ich weiß schon von was ich da rede ;)

AMD: APU Konzept; CPU und GPU auf einem Chip mit gemeinsamem Arbeitsspeicher und gemeinsamen Adressraum

nVidia: CPU und Grafikkarte komplett getrennt, auf der Grafikkarte sitzen jedoch mehrere 64Bit ARM Kerne, die Berechnungen übernehmen welche der GPU als solcher nicht oder nur sehr ineffizient durchführen könnte; so wird das Problem der Kommunikation zwischen CPU und GPU und deren Latenz weitgehend entschärft. ARM Kerne und GPU haben einen gemeinsamen Adressraum- nicht aber (x86-) CPU und GraKa.
AMD hat 2 Konzepte, genau wie Intel btw auch mit ihrem XeonPhi. Auf der einen Seite die APUs von AMD/Intel mit iGPU, und auf der anderen Seite die dedizierten Produkte, die einen eigenen Speicher mit bringen, die eben nun auch in den x86 Addressraum gemapped werden sollen. Das ist btw. sogar ziemlich einfach bzgl physikalischen Adressen. Bzgl Virtuellen Adressen muss man halt noch schauen, das man die notwendigen Daten austauscht, aber jetzt auch kein Ding der Unmöglichkeit. Die haben ja mehr als nur einen Mitarbeiter ;). Was halt dann noch fehlt ist Kohärenz. DAS ist wirklich ein Problem, das man nicht so einfach löst. Daran arbeiter AMD ja aber, und verkündet freudig, dass das in absehbarer ZEit kommt, wobei ich da SEHR skeptisch bin... nVidia geht soweit ja aber gar nicht. Sie wollen nur nen unifiedvirtualmemory, und das ist eben wie gesagt schon recht ähnlich zu dem, was AMD und Intel mit ihren dedizierten Beschleunigern machen (wollen). Man geht halt nur nicht so weit wie die anderen.

Wie gesagt, es geht mir nicht um die APUs, sondern um die dedizierten GPUs bei AMD, und da läuft es wie gesagt aufs "Gleiche" raus.

Na ja... wenn man das Bild betrachtet kann man erkennen das es sich offenbar um ein Multi Chip Modul aus GPU und mehreren RAM Chips handelt, die RAM Chips selbst sind aber mehrere, die mit Interposern gestapelt sind.
Das ist nur ein Blockbild. Das sagt relativ wenig darüber aus, wie man das dann wirklich macht.

Und darauf wird wie in der Presentation hingewiesen? :ugly: Die zielte doch nur darauf ab, das man X User auf einem Server hat, und die dadurch SUPER geil sich austauschen können, und da hören sich meiner Meinung nach 32 besser an als 16 ;)

Ok, aber das ziehlt nen bischen an dem Vorbei, für was das Ding ja gedacht ist, oder meinste nicht? Linux kannste da einfach nicht ignorieren.
 
Zurück