Nvidia Volta oder doch Turing? GV102 und GV104 im Hwinfo-Tool

Meine Glaskugel sagt dazu:

GV102 -> GTX1180 mit 16GB GDDR6 - ganzer Chip
GV102 -> GTX1170 mit 16GB GDDR6 - teildeaktivierter Chip
GV104 -> GTX1160 mit 12GB GDDR6 - ganzer Chip
GV104 -> GTX1160 mit 6GB GDDR6 - teildeaktivierter Chip

Nie im Leben. Damit raubt man sich die Chance, den kleinen Chip für 700€ zu verkaufen und kann keine Ti für 1000 nachlegen.
Es gibt absolut keinen Grund, in einem völlig konkurrenzlosen Leistungsbereich jetzt den großen GV102 als "billige" 1180 zu verkaufen der viel schneller als ne 1080Ti ist.
 
Nie im Leben. Damit raubt man sich die Chance, den kleinen Chip für 700€ zu verkaufen und kann keine Ti für 1000 nachlegen.
Es gibt absolut keinen Grund, in einem völlig konkurrenzlosen Leistungsbereich jetzt den großen GV102 als "billige" 1180 zu verkaufen der viel schneller als ne 1080Ti ist.

Ohh, habe gar nicht gecheckt, dass das der "große" Chip war. Bin im Kopf irgendwie von 104 und 106 ausgegangen...
 
Wenn Nvidia für das 120 Watt (Kategorie der 1060?!) Modell 500$ nehmen wird, dann Prost Mahlzeit.

@Locuza: Du kannst ja auch mal richtig auf den Putz hauen. ;)



Ich hoffe, die Überraschung besteht nicht in irgendeiner ollen Bezeichnung, mit der keiner gerechnet hat. Igor bewegt sich ganz scharf an der Grenze der Nervensäge mit seinem "Ich weiß was, ich weiß was, aber ich sag es nicht."

Wenn Nvidia ein paar Tensor Cores auf den Consumer Karten lässt, das würde mich überraschen!

Na, die Hinweise sprechen doch sehr dafür, dass Nvidia Tensor Kerne auf die Consumer Karten packen will.
1) Hauptunterschied zwischen Pascal und Volta ist die Verwendung der Tensor Kerne.
2) Nvidias "neue" Erfindung zum Raytracing funktioniert erst auf GPUs ab Volta.


(Die DP Kerne bei Volta hab ich ignoriert, da Raytracing nicht mit DP arbeitet und der Trend eher zu 16 bit Berechnungen, als 64 bit geht.)
 
Wenn Nvidia konsequent bleibt, könnten die neuen Quadros auch auf GV 102 und GV 104 setzen, statt auf kastrierte GV 100, also faktisch Volta in kleiner. Schließlich kömmen die noch vor Turing, wenn auch haarscharf :)

also GV102 und GV104 für die kleineren Quadros zur Siggraph

den Gamer GX104 zur Gamescom

und den 7nm GV100 Nachfolger zur GDC Europe
 
Nie im Leben. Damit raubt man sich die Chance, den kleinen Chip für 700€ zu verkaufen und kann keine Ti für 1000 nachlegen.
Es gibt absolut keinen Grund, in einem völlig konkurrenzlosen Leistungsbereich jetzt den großen GV102 als "billige" 1180 zu verkaufen der viel schneller als ne 1080Ti ist.
Woher weißt du das es eine Ti Variante gibt oder geben wird? NVidia hat mit der Benennung Änderung angekündigt.

Gesendet von meinem G8141 mit Tapatalk
 
Nie im Leben. Damit raubt man sich die Chance, den kleinen Chip für 700€ zu verkaufen und kann keine Ti für 1000 nachlegen.
Es gibt absolut keinen Grund, in einem völlig konkurrenzlosen Leistungsbereich jetzt den großen GV102 als "billige" 1180 zu verkaufen der viel schneller als ne 1080Ti ist.

man muss doch nen Anreiz schaffen damit sich die Leute nen 5000€ (Fanatasiewert) 144HZ 4KBFGD kaufen (glaub damit knn man noch mehr Kohle scheffeln ^^)
 
Also in meinen Augen würde auch nichts dagegen sprechen die 1180 auch mit teildeaktiviertem GV102 Chip mit 11GB und eher langsamen GDDR6 zu bringen.
Eine 1180TI hätte bei dieser Rechnung einen kompletten Chip mit 12GB und schnellerem Ram (14 Gbps) .
Eine Titan würde dann mit 24GB / 16 Gbps Samsung Chips bestückt sein.
In dieser Konstellation würden die 1160 und 1170 (oder 1170/1170 TI) den GV104 bekommen beide mit 8GB Ram.
Hier könnte man dann sogar Rebrand Chips einsetzen.

Und wenn man dann auf 7nm shrinkt sind sie gar nicht mehr so groß.
 
Na, die Hinweise sprechen doch sehr dafür, dass Nvidia Tensor Kerne auf die Consumer Karten packen will.
1) Hauptunterschied zwischen Pascal und Volta ist die Verwendung der Tensor Kerne.
2) Nvidias "neue" Erfindung zum Raytracing funktioniert erst auf GPUs ab Volta.

Tensor Cores können doch nur 8bit. Wie soll denn Raytracing damit funktionieren? :huh:
 
Aber die Tensor-Cores sind nicht das gleiche was Google als TPUs verkauft.
Tensor-Cores bei Volta multiplizieren mit FP16-Genauigkeit mit einer FP16 oder FP32 Addition.

In Bezug auf die Raytracing Demos, dort scheinen die Tensor-Cores nur für das Entrauschen der Ergebnisse zum Einsatz gekommenen zu sein.
Und anscheinend hat Volta ein paar weitere Architekturänderungen, welche bei RTX und Raytracing zum Einsatz kommen, welche Nvidia noch nicht öffentlich machen wollte:
To help, Nvidia’s Volta architecture has some as-yet undisclosed features that accelerate raytracing, but they won’t say what those are. The Volta-exclusive Tensor cores do have an indirect impact on raytracing performance, because they can offer to help the clean up operation to de-noise a scene.
Raytracing won't render your old GPU obsolete, it could have a second life as an AI co-processor | PCGamesN

Wieso man häufig versucht Volta soweit wie möglich nur auf die Tensor-Cores zu reduzieren leuchtet mir nicht ein.
 
Aber die Tensor-Cores sind nicht das gleiche was Google als TPUs verkauft.
Tensor-Cores bei Volta multiplizieren mit FP16-Genauigkeit mit einer FP16 oder FP32 Addition.

In Bezug auf die Raytracing Demos, dort scheinen die Tensor-Cores nur für das Entrauschen der Ergebnisse zum Einsatz gekommenen zu sein.
Und anscheinend hat Volta ein paar weitere Architekturänderungen, welche bei RTX und Raytracing zum Einsatz kommen, welche Nvidia noch nicht öffentlich machen wollte:

Raytracing won't render your old GPU obsolete, it could have a second life as an AI co-processor | PCGamesN

Wieso man häufig versucht Volta soweit wie möglich nur auf die Tensor-Cores zu reduzieren leuchtet mir nicht ein.

Recht simpel:
Öffentlich einsehbar sind nur wenige Unterschiede - streicht man NVLink, die neue Aufteilung in 64er Cluster, anstelle von 128er Clustern und das HBM bleibt nahezu nur noch das Hinzufügen der Tensor Kerne.
Dass die GV100 noch DP Kerne hat ist geschenkt, da NV die immer bei den Profi GPUs verbaut und bei den Consumer GPUs weg lässt.

Edit: Allerdings ist die Info zur Rechengenauigkeit der Tensor Kerne eine interessante Neuigkeit.

Edit2: Man könnte jetzt noch die64er Cluster als große Neuerung verkaufen... aber sonderlich innovativ ist das nicht.
 
Recht simpel:
Öffentlich einsehbar sind nur wenige Unterschiede - streicht man NVLink, die neue Aufteilung in 64er Cluster, anstelle von 128er Clustern und das HBM bleibt nahezu nur noch das Hinzufügen der Tensor Kerne.
Dass die GV100 noch DP Kerne hat ist geschenkt, da NV die immer bei den Profi GPUs verbaut und bei den Consumer GPUs weg lässt.

Edit: Allerdings ist die Info zur Rechengenauigkeit der Tensor Kerne eine interessante Neuigkeit.

Edit2: Man könnte jetzt noch die64er Cluster als große Neuerung verkaufen... aber sonderlich innovativ ist das nicht.
Ich habe es aber schon mehrmals ausgeführt und ich erinnere mich das du in mindestens einem der Threads auch aktiv warst.
Dinge wie die neue ISA, dass die meisten Instruktionen nun in 4 Zyklen berechnet werden, anstatt in 6, dass neue Cache-System.
Daneben gibt es auch getrennte FP/INT-Ports und jeder Thread hat einen eigenen Progam Counter und nicht nur der ganze Warp bestehend aus 32 Threads, Volta kann bei Bedarf die Threads sehr granular verwalten und die Möglichkeit besitzt bisher keine AMD/Nvidia GPU.
Daneben hat Nvidia auch den Dual-Dispatcher entfernt.
All die Informationen hat Nvidia schon am Anfang vom Volta Reveal preisgegeben, man konnte viele Dinge im Blog lesen und etwas ausführlicher im White-Paper.
http://images.nvidia.com/content/volta-architecture/pdf/volta-architecture-whitepaper.pdf

Und wer Lust hat kann sich Voltas neues Instruction Encoding im Detail anschauen, Citadel hat dazu, zu der Cache-Hierarchy, dem Scheduling-Schema usw. mehrere Analysen und Micro-Benchmarks durchgeführt:
https://arxiv.org/pdf/1804.06826.pdf

Volta ist allgemein eine neue Architektur und setzt viele Dinge anders um, als Maxwell/Pascal.
 
Zuletzt bearbeitet:
Ich habe es aber schon mehrmals ausgeführt und ich erinnere mich das du in mindestens einem der Threads auch aktiv warst.
Dinge wie die neue ISA, dass die meisten Instruktionen nun in 4 Zyklen berechnet werden, anstatt in 6, dass neue Cache-System.
Daneben gibt es auch getrennte FP/INT-Ports und jeder Thread hat einen eigenen Progam Counter und nicht nur der ganze Warp bestehend aus 32 Threads, Volta kann bei Bedarf die Threads sehr granular verwalten und die Möglichkeit besitzt bisher keine AMD/Nvidia GPU.
Daneben hat Nvidia auch den Dual-Dispatcher entfernt.
All die Informationen hat Nvidia schon am Anfang vom Volta Reveal preisgegeben, man konnte viele Dinge im Blog lesen und etwas ausführlicher im White-Paper.
http://images.nvidia.com/content/volta-architecture/pdf/volta-architecture-whitepaper.pdf

Und wer Lust hat kann sich Voltas neues Instruction Encoding im Detail anschauen, Citadel hat dazu, zu der Cache-Hierarchy, dem Scheduling-Schema usw. mehrere Analysen und Micro-Benchmarks durchgeführt:
https://arxiv.org/pdf/1804.06826.pdf

Volta ist allgemein eine neue Architektur und setzt viele Dinge anders um, als Maxwell/Pascal.

Sorry, daran kann ich mich echt nicht mehr erinnern.
aber das whitepaper schaue ich mir bei Zeiten an.
 
Zurück